計算サーバ運用再開のお知らせ

国立天文台天文シミュレーションプロジェクト
計算サーバ利用者各位

長らくお待たせいたしましたが、先ほど計算サーバの運用を再開いたしました。
長時間の保守作業と運用停止にご協力を頂きまして誠に有り難うございます。
今回の保守作業開始時に実行・投入されていたPBSジョブの一覧は以下よりご覧になれます。
http://www.cfca.nao.ac.jp/node/1032
いくつかのジョブは自動的に再投入されておりますが、強制終了されたジョブもございますので
利用者各位による出力ファイルの検証をお願いいたします。

また、今回の保守作業では計算サーバの機器構成に中程度の変更が加えられています。

○ OSやアプリケーションの更新
OS (CentOS)や各種アプリケーションのバージョンがほぼ最新になりました。
PBSのバージョンも上がっています (14→18)。場合によっては
皆さまのお手持ちのコードも再コンパイルによるバイナリ再構築が必要かもしれません。
実行時にはご留意ください。

○ 計算ノードの追加
新たな計算ノードが追加され、システムの総コア数が増えました。
従来の896コアにこのたび256コアが追加され、合計で1152コアとなっています。
追加された256コア分はRyzen 1700X (16仮想コア) x 16台により実現されており、
これらのノードは各々32 GBのメモリを有しています。この変更に伴い
各利用者が使える資源量も変わっています。詳しい数値は計算サーバの使い方のページ
http://www.cfca.nao.ac.jp/node/165
の「4.1.3 キュー構成」をご覧ください。今回は試験的な運用として
4並列までのキューopenmpに割り当てられる資源量をやや増しています。
なお一連のキュー構成は今後の利用実態に依存して変更され得ます。あらかじめご了承ください。

○ 作業領域の追加
これまで運用していた作業領域 /mwork2, /mwork3 に加え、
新たな作業領域 /mwork0 の運用が開始されました。
この上でのファイル保持期間は他領域と同様に atime +120日です。
詳しくは上記した「使い方」のページ「2.2 ストレージ」をご覧ください。
各々の領域でquota制限値が異なりますので御注意ください。
新規に追加された /mwork0 では 24 TB/user となります。

○ [予告] 作業領域/mwork2の運用終了
上記の新しい領域 /mwork0 の運用開始に伴い、
従来の領域のうち /mwork2 の運用を平成31年3月末日にて終了いたします。
皆様が/mwork2/以下に置かれたファイルのうち重要なものは
上記期日までに各自で適切な場所に退避して頂きますよう、お願いいたします。
CfCA側で利用者ファイルの退避やバックアップは行いません。あらかじめご了承ください。

今回の保守作業では細かな機器設定が多数箇所にわたり変更されました。
利用者各位がご利用になる上で不具合や不明点を発見された場合には、
細かいことでも結構ですので以下のページからお寄せください。
http://www.cfca.nao.ac.jp/inquiry/