メインコンテンツに移動
ホーム

Translate this page by: Google Weblio

Main navigation

  • ホーム
  • CfCAについて
    • プロジェクトの概要
    • 研究紹介
    • 計算機紹介
    • メンバー
  • はじめての方へ
  • ニュースレター
  • 共同利用計算機
    • XD2000
    • GPUクラスタ
    • PCC (計算サーバ)
    • 接続方法
    • 解析サーバ
    • ファイルサーバ
    • 宅配等によるデータ輸送
  • 利用方法
    • 利用者の責務等
    • 計算機利用開始までの流れ
    • 申請時期と利用期間
    • 利用規則
    • 申請フォーム置き場
    • 申請書ファイル置き場
    • 安全保障輸出管理
    • 個人情報の管理
  • 採択課題・成果報告
    • 論文等リスト・利用成果報告
    • XD2000採択統計
    • 利用申請数と採択数
  • FAQ
  • 問い合わせ・情報交換
    • 各種問い合わせ
  • 論文出版費用補助
  • 講習会・イベント
    • ユーザーズミーティング
    • 流体学校
    • N体学校
    • GPU講習会
    • iSALE講習会
    • 旅費について
  • 交通アクセス
  • 委員会・審査委員
  • リンク
User account menu
  • ログイン

Main navigation

  • ホーム
  • CfCAについて
    • プロジェクトの概要
    • 研究紹介
    • 計算機紹介
    • メンバー
  • はじめての方へ
  • ニュースレター
  • 共同利用計算機
    • XD2000
    • GPUクラスタ
    • PCC (計算サーバ)
    • 接続方法
    • 解析サーバ
    • ファイルサーバ
    • 宅配等によるデータ輸送
  • 利用方法
    • 利用者の責務等
      • 利用者の責務
      • 注意事項
      • 研究成果のプレスリリースについて
      • 謝辞について
      • 論文出版費用補助
    • 計算機利用開始までの流れ
    • 申請時期と利用期間
    • 利用規則
    • 申請フォーム置き場
    • 申請書ファイル置き場
    • 安全保障輸出管理
    • 個人情報の管理
  • 採択課題・成果報告
    • 論文等リスト・利用成果報告
    • XD2000採択統計
    • 利用申請数と採択数
  • FAQ
  • 問い合わせ・情報交換
    • 各種問い合わせ
  • 論文出版費用補助
  • 講習会・イベント
    • ユーザーズミーティング
    • 流体学校
    • N体学校
    • GPU講習会
    • iSALE講習会
    • 旅費について
  • 交通アクセス
  • 委員会・審査委員
  • リンク

ログインはこちら

Enter your email address or username.
Enter the password that accompanies your email address.
  • アカウントの作成
  • パスワードを再設定

ページ送り

  • 前へ
  • 4月 2026
  • 次へ
日 月 火 水 木 金 土
29
 
30
 
31
 
1
 
2
 
3
 
4
 
5
 
6
 
7
 
8
 
9
 
10
 
11
 
12
 
13
 
14
 
15
 
16
 
17
 
18
 
19
 
20
 
21
 
22
 
23
 
24
 
25
 
26
 
27
 
28
 
29
 
30
 
1
 
2
 

ページ送り

  • 前へ
  • 次へ


ゲストさん、ようこそ。 ログインはこちら / Webアカウント作成手順はこちら。

計算サーバに関する質問

qdelを用いてジョブ削除しようとしましたが、消えません。

どのようにすれば良いでしょうか?

計算ノードとの通信状況が悪い時にこれが発生することがあります。
qdel コマンドにオプション -W force を付けて実行してみてください。

  qdel -W force ジョブID ...

オプション -W force の意味は "Deletes the job whether or not the job' execution host is reachable." です。
詳しくは man qdel を参照してください。
なお上記のオプションを付けてもジョブを qdel できない場合にはジョブに何らかの障害が発生している可能性があります。
その場合はこのページから報告をお願いします。
(最終更新日 2024年以前)

作業領域 /mwork{1,2}/ 下に置いたディレクトリはどう扱われますか?

ここに置いた通常ファイルが一定期間後に消えることは承知していますが、ディレクトリも同様に自動削除されるのでしょうか?

いいえ、ディレクトリは自動的には削除されません。
従って、ディレクトリ内にあるファイルは削除された後には空のディレクトリだけが残ることになります。
(最終更新日 2025年6月3日)

私のファイルが自動的には削除されないディレクトリはありませんか?

/home/自分/ の他にそういう領域があれば嬉しいです。
/mwork[1-2]上にファイルを置くと、気付いた時には消えていることが多いです。

上記の目的のためにはファイルサーバ系の領域が使えるでしょう。
必要な申請を行い、領域を確保してください。
(最終更新日 2025年6月3日)

サイズの大きなファイルの消し方が分かりません。

ひょんな事から非常に大きなサイズのファイルを作ってしまい、ディスク領域を圧迫し始めました。
これを rm コマンドで消そうとしても消えないのですが、どうすれば良いでしょうか?

以下の方法で時間が短縮されるとは限らないのですが、まずは当該ファイルをサイズ0のファイルで上書きしてみましょう。
たとえば以下のコマンドを実行してください。

  echo "" > 当該ファイル

または以下です。

  cat /dev/null > 当該ファイル

その後で当該ファイルを削除してみてください。

  rm 当該ファイル

(最終更新日 2025年6月3日)

PBSジョブ投入時にジョブの最大CPU時間や経過時間を指定する方法を教えてください。

qsubコマンドのオプション -l keyword=value で指定が可能です。
-l オプションはジョブのリソース要求を指定するもので、指定できる keyword の代表には以下があります。

  cput     ジョブによって使用されるCPU時間の最大値 (単位: time)
  file     ファイルを作成する際のサイズ制限 (単位: size)
  mem      最大物理メモリ容量 (単位: size)
  ncpus    要求されたプロセッサ(コア)数
  pcput    ジョブ内の一つのプロセスに割り当てられる最大CPU時間 (単位: time)
  pmem     ジョブ内の一つのプロセスで使用される最大物理メモリ容量 (単位: size)
  pvmem    ジョブ内のすべての同時プロセスで使用される最大仮想メモリ容量 (単位: size)
  vmem     ジョブ内のすべての同時プロセスで使用される最大仮想メモリ容量 (単位: size)
  walltime ジョブが実行状態にある場合の実際の時間(経過時間)の最大値 (単位: time)

cputなどを指定する場合、時間(上記のtime)は秒数(整数値)もしくは次の形式で指定します。

  [[hours:]minutes:]seconds[.milliseconds]

fileやmemを指定する場合、サイズ(上記のsize)は以下のsuffixを用いて指定してください。

  b またはw  : バイトまたはワード
  kbまたはkw : キロバイトまたはキロワード
  mbまたはmw : メガバイトまたはメガワード
  gbまたはgw : ギガバイトまたはギガワード

例えば以下のような指定が出来ます。

  qsub -q long -l cput=765:43:21 -l pmem=321mb スクリプト

ここで qstat -f コマンドを投入すると、
当該リソースが指定された値を持っていることが分かるでしょう。

  qstat -f 上記のジョブID
    Resource_List.cput = 765:43:21
    Resource_List.pmem = 321mb

更に詳しい情報についてはPBS関係のドキュメントをお読みください。
(最終更新日 2024年以前)

m000.cfca.nao.ac.jp で使える $HOME/.emacs の雛型はありますか?

はい、/etc/skel/.emacs があります。
但しご覧のようにこの中身はほぼ空と言えるものなので、ご自分で追記を頂く必要があります。
(最終更新日 2025年6月3日)

計算サーバでは共同利用者のファイルをバックアップしていないのでしょうか?

していません。
このことは計算サーバのみならず、CfCAのすべての共同利用計算機に於いて同様です。
ファイル(データ)の保全には利用者各位が御自身で責任をお持ち頂ください。
(最終更新日 2025年9月8日)

m000にssh接続すると以下のエラーが出て、ログインできません。

 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
  @    WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!     @
  @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
  IT IS POSSIBLE THAT SOMEONE IS DOING SOMETHING NASTY!
  Someone could be eavesdropping on you right now (man-in-the-middle attack)!
  It is also possible that the RSA host key has just been changed.
  The fingerprint for the RSA key sent by the remote host is
  XX:XX:XX:XX:XX:XX:XX:XX:XX:XX:XX:XX:XX:XX:XX:XX.
  Please contact your system administrator.
  Add correct host key in /home/****/.ssh/known_hosts to get rid of this message.
  Offending key in /home/****/.ssh/known_hosts:9
  RSA host key for m000.cfca.nao.ac.jp has changed and you have requested strict checking.
  Host key verification failed.

これはご自分のホームディクトリ下の ~/.ssh/known_hosts に記録された接続先機材の情報が実際の機材情報と異なることで発生する警告です。
この現象はしばしば見られ、接続先の機材でOSが再インストールされたり、接続先のIPアドレスやホスト名が変更されることにより生じます。
このような場合にはファイル ~/.ssh/known_hosts を編集します。
このファイルを開き、m000.cfca.nao.ac.jp あるいは m000 から始まる行を削除してください。
より適切な方法は以下のコマンドを使うことです。

% ssh-keygen -R m000.cfca.nao.ac.jp
/home/user/.ssh/known_hosts updated.
Original contents retained as /home/user/.ssh/known_hosts.old

上記を実施した後、次のコマンドを打ち込んでも良いでしょう。

% ssh-keyscan m000.cfca.nao.ac.jp >> ~/.ssh/known_hosts

ここで使うリダイレクトは上書き > ではなく、追記 >> であることに留意しましょう。
これにてご自分の ~/.ssh/known_hosts に相手先に最新情報が記録されます。
その後に再び m000.cfca.nao.ac.jp に ssh してください。
もしログイン前に何らかの質問をされたら yes と回答します。

この現象は m000 に限らずsshを用いる機器同士では頻繁に発生する現象です。
従ってGoogleなどで検索すれば多数の情報が得られますので、御自分でお調べください。
(最終更新日 2025年5月29日)

計算サーバで一遍に数千個のファイルを開こうとしたらエラーになりました。

これは何故でしょうか?

これは計算サーバが採用しているOS (Rocky Linux)による制限です。
以下のようにして確認できます。

  • /bin/csh, /bin/tcsh, /bin/zsh の場合
      $ limit descriptors
      descriptors 1024
    
  • /bin/sh, /bin/bash, /bin/zsh の場合
      $ ulimit -n
      1024
    

上記のような制限があるため、1024個以上のファイルを同時に開くことは出来ません。
(最終更新日 2025年5月29日)

PBSジョブ終了後に Post job file processing error と言われました。

具体的には、PBSジョブ終了後の通知メール内に以下が記されていました

Date: Thu, 1 Nov 2018 12:36:42 +0900
From: adm 
Subject: PBS JOB 374683.m000.cfca.nao.ac.jp
  
PBS Job Id: 374683.m000.cfca.nao.ac.jp
Job Name:   bcn0839
Post job file processing error; job 374683.m000.cfca.nao.ac.jp on host m097

これは何を意味しているでしょうか?
なお実行結果としての出力は正常なようです。

詳細を知るため、当該計算ノード上でこのジョブに関するログを探してみました。
以下が該当するようです。

20181024:10/24/2018 14:40:59;0008;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;Started, pid = 1516
20181101:11/01/2018 12:36:09;0080;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;task 00000001 terminated
20181101:11/01/2018 12:36:09;0008;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;Terminated
20181101:11/01/2018 12:36:09;0100;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;task 00000001 cput=186:34:43
20181101:11/01/2018 12:36:09;0008;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;kill_job
20181101:11/01/2018 12:36:09;0100;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;m097 cput=186:34:43 mem=14544kb
20181101:11/01/2018 12:36:09;0008;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;no active tasks
20181101:11/01/2018 12:36:09;0100;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;Obit sent
20181101:11/01/2018 12:36:09;0080;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;copy file request received
20181101:11/01/2018 12:36:09;0080;pbs_mom;Fil;sys_copy;command:
  /bin/cp -rp /var/spool/pbs/spool/374683.m000.cfca.nao.ac.jp.OU /mwork1/itootk/SWIFT.F0/bcn0839/Log.out status=1, try=1
20181101:11/01/2018 12:36:09;0080;pbs_mom;Fil;sys_copy;command:
  /bin/cp -rp /var/spool/pbs/spool/374683.m000.cfca.nao.ac.jp.OU /mwork1/itootk/SWIFT.F0/bcn0839/Log.out status=1, try=2
20181101:11/01/2018 12:36:20;0080;pbs_mom;Fil;sys_copy;command:
  /bin/cp -rp /var/spool/pbs/spool/374683.m000.cfca.nao.ac.jp.OU /mwork1/itootk/SWIFT.F0/bcn0839/Log.out status=1, try=3
20181101:11/01/2018 12:36:20;0080;pbs_mom;Fil;sys_copy;command:
  /bin/cp -rp /var/spool/pbs/spool/374683.m000.cfca.nao.ac.jp.OU /mwork1/itootk/SWIFT.F0/bcn0839/Log.out status=1, try=4
20181101:11/01/2018 12:36:41;0004;pbs_mom;Fil;374683.m000.cfca.nao.ac.jp.OU;
  Unable to copy file /var/spool/pbs/spool/374683.m000.cfca.nao.ac.jp.OU to m000:/mwork1/itootk/SWIFT.F0/bcn0839/Log.out
20181101:11/01/2018 12:36:41;0004;pbs_mom;Fil;374683.m000.cfca.nao.ac.jp.OU;
  /bin/cp: cannot create regular file '/mwork1/itootk/SWIFT.F0/bcn0839/Log.out': Permission denied
20181101:11/01/2018 12:36:42;0100;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;Job files not copied: 
20181101:Unable to copy file /var/spool/pbs/spool/374683.m000.cfca.nao.ac.jp.OU to m000:/mwork1/itootk/SWIFT.F0/bcn0839/Log.out
20181101:Output retained on that host in: /var/spool/pbs/undelivered/374683.m000.cfca.nao.ac.jp.OU
20181101:11/01/2018 12:36:42;0100;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;staged 2 items out over 0:00:33
20181101:11/01/2018 12:36:42;0008;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;no active tasks
20181101:11/01/2018 12:36:42;0100;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;Obit sent
20181101:11/01/2018 12:36:42;0080;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;delete job request received
20181101:11/01/2018 12:36:42;0008;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;kill_job
20181101:11/01/2018 12:36:42;0080;pbs_mom;Job;374683.m000.cfca.nao.ac.jp;delete job request received

これによれば、このPBSジョブは正常に終了したものの標準出力を利用者指定のファイル /mwork1/itootk/SWIFT.F0/bcn0839/Log.out に書き出そうとし、失敗しています。
失敗の理由は

/mwork1/itootk/SWIFT.F0/bcn0839/Log.out': Permission denied

とあります。
よって、おそらく Log.out というファイルが既に存在し、しかもそのパーミッションが 000 といったPBSのデーモンが書き込み不可の状況にあったと推定されます。
こうした既存のファイルを削除しておけば、今回のエラーは出なかったと思われます。
なお上記のログにあるように書き出しに失敗した標準出力の内容はファイル

/var/spool/pbs/undelivered/374683.m000.cfca.nao.ac.jp.OU

として計算ノード側に保持されています。
もしもこのファイルを御所望の場合には本プロジェクトにご連絡を頂ければ手動で発掘してお渡しすることは不可能ではありません。
(最終更新日 2025年5月29日)

ページ送り

  • 前ページ
  • 3
  • 次ページ
計算サーバに関する質問

GitHub

X

Youtube

RSS feed

OFFICIAL

© 2006 Center for Computational Astrophysics, NAOJ

Powered by Drupal