You are here

ゲストさん、ようこそ。 ログインはこちら / アカウント作成はこちら

Information

ファイルサーバの運用方法改定に関するアンケートへのご協力のお願い

国立天文台天文シミュレーションプロジェクト 
計算機共同利用者の皆様

2018年度に資源枯渇のため停止していましたファイルサーバの募集を,
現在再開しておりますが,これまでの運用方法では再度の募集停止が
避けられないと考えています。そのため本プロジェクトでは2020年度より,
運用方法の改定を検討しております。

そこでよりよい運用にするためにアンケートを実施することになりました。
頂いた意見を踏まえた上でファイルサーバ運用に反映させていきたいと考えております。
お忙しいところお手数をおかけしますが,ご協力よろしくお願いいたします。

締切は8月31日(土) 正午といたします。

以下のページにログインの上お進みください。
背景と新運用方法の説明とアンケートフォームになっております。

https://www.cfca.nao.ac.jp/form/questionnaire_fileserver

国立天文台 天文シミュレーションプロジェクト

XC50障害情報

国立天文台天文シミュレーションプロジェクト XC50利用者各位

本日7月29日の11:00から15:00ごろにかけて、Cray XC50のLustreファイルシステムのメタデータサーバが何回か再起動しました。現在、原因について調査中です。
再起動時(1回目11:52~12:10, 2回目14:24~14:39, 3回目14:44~14:50)に、それぞれ以下のファイルが影響を受けたおそれがあります。お手数をおかけしますが、ご確認のほどお願い申し上げます。
ユーザの皆様に大変ご迷惑をおかけしたことをお詫び申し上げます。

---

・11:52~12:10に影響を受けた可能性のあるファイル
/work/iwaskikz/new_chemi_periodic
/work/iwaskikz/new_chemi_periodic/log
/work/kanagwkz/work/twofluid2/MS01_standard_constNu_1024x2048/out.dat

ファイルの転送の仕方について

天文シミュレーションプロジェクト計算機共同利用者の皆様,

本日は,本プロジェクトが運用する共同利用計算機からのファイルの転送の仕方について注意を喚起させて頂きます.

スクリプト等でscp, rsyncを連続でなされている方も多いかと思いますが,
60秒間に20回以上のssh connectionを行いますと,
総当たり攻撃(Brute-force Attempt)として
転送元(e.g. 国立天文台)や転送先(e.g. 皆様の所属先)の監視サーバーに警告がでてしまいます.
これは利用者には特に警告がでないため,気づきにくいと思われます.

スクリプト等でファイルのコピーを行う時には,1回のコピーに3秒以上かかるように,
tarなどを用いて1回に転送するファイルサイズを大きくしてください.
それが不可能な場合,転送一回ごとに適切な時間(3秒間以上)のsleepをはさんでください.

ご不便をおかけしますが,このままではこの警告でサーバーのログが埋まってしまい,
本当に重要なエラーや警告を見逃してしまうことになりかねません.
みなさま,ご協力をよろしくお願いいたします.

6月29日のXC50での障害による影響

国立天文台天文シミュレーションプロジェクト XC50利用者各位

6月29日のCray XC50の障害について、先日のニュースレターで「6月28日 18:00以降に終了したジョブ」が影響を受けた可能性があるとご報告しましたが、
6月27日03:20にブートノードでファイバーチャネルパスの再接続が最初に起こったことがわかりました。
したがって下記のニュースレターでご報告したジョブリストに加え、6月29日03:00ごろ以降に実行中だったジョブについても、IO遅延等の影響を受けている可能性があります。
https://www.cfca.nao.ac.jp/node/1115

ジョブのリスト漏れについて、ご連絡が遅れて申し訳ありません。

本メールに関するご質問やご意見は以下のページからお寄せ下さい。
http://www.cfca.nao.ac.jp/inquiry/

2019年度 共同利用計算機システム追加募集開始のお知らせ

国立天文台天文シミュレーションプロジェクト 利用者各位

本日、2019年度向けのXC50共同利用申請の追加募集を開始いたしました。
利用を希望される方は、Webアカウントを用いてCfCAのWebシステムにログインし、
申請を行ってください。

利用開始時に学生である方からの申請に関しては、
カテゴリに関わらずすべて指導教員による確認が必要です。
申請を検討されている学生とその指導教員は募集要項を熟読いただきますようお願いします。

XC50の募集要領と利用申請に関しては以下をご覧ください。
https://www.cfca.nao.ac.jp/xc50
下記の随時募集カテゴリへの申請を除き、
利用申請書の受付締切は 2019年8月1日(木) 11:00 JST です。
申請の採否結果は2019年9月中旬に通知される予定です。

XC50稼働再開時にリランできなかったジョブ

国立天文台天文シミュレーションプロジェクト 利用者各位

7月3日 21:50よりXC50の本運用を開始しましたが、
定期保守作業前に実行されていたジョブのうち、以下のジョブはリラン後まもなくして終了いたしました。
お手数をおかけしますが、ジョブの状態をご確認ください。

6月29日にXC50で発生した障害について

国立天文台天文シミュレーションプロジェクト XC50利用者各位

先のニュースレターで報告しました通り、6月29日(土)未明にCray XC50ブートノードとの接続に障害が生じました。
7月1日の定期保守作業において、本件はブートノードのファイバーチャネルの不具合が原因であったことが明らかになり、現在は復旧しております。

今回の障害により、6月28日 18:00以降に終了した多数のジョブがIO遅延などの影響を受けた可能性があります。
影響を受けたおそれがあるジョブの一覧は、本メールの末尾に添付しております。
計算機の不具合により、利用者の皆様に大変ご迷惑をおかけしたことをお詫び申し上げます。

本メールに関するご質問やご意見は以下のページからお寄せ下さい。
http://www.cfca.nao.ac.jp/inquiry/

XC50障害情報

国立天文台天文シミュレーションプロジェクト XC50利用者各位

6月29日(土) 未明にCray XC50ブートノードとの接続にハードウェア的な問題が生じました。
このためXC50システムは停止され、利用できない状態にあります。PBSジョブも稼働していません。
保守人員および保守部品の入手に時間を要するため即時の復旧ができず、
7月1日(月)の定期保守作業にて抜本的な対応を行うこととなりました。
具体的な影響範囲や影響を受けたジョブの一覧および復旧予定についても
後日改めて広報させていただく予定です。
本件では利用者の皆様に大きなご迷惑をおかけいたしますが、
なにとぞご理解とご協力をよろしくお願い申し上げます。

本メールに関するご質問やご意見は以下のページからお寄せ下さい。
http://www.cfca.nao.ac.jp/inquiry/

2019年度 iSALE講習会のご案内

国立天文台シミュレーションプロジェクト(CfCA)では下記のようにiSALE講習会を開催いたします。
多くの方々のご参加をお待ちいたします。なお以下に記載されている日時はすべて日本標準時 (JST) です。

大規模実行開始直前におけるジョブ実行時間調整のお願い

国立天文台・天文シミュレーションプロジェクト
XC50システム利用者各位

いつも国立天文台・天文シミュレーションプロジェクトのXC50システムをご利用いただき、誠にありがとうございます。

以下の日程でXC-S採択課題によるXC50全系計算が予定されております。
・2019年5月27日(月)16:55 - 5月29日(水)17:05
・2019年6月17日(月)16:55 - 6月19日(水)17:05
終了時刻が大規模実行開始時刻を超えるジョブは実行されませんのでご注意下さい。
大規模実行開始日にはwall timeを短めに設定してジョブを投入して頂きますようご協力をお願いいたします。

ユーザの皆様にはご不便をおかけいたしますことを深くお詫び申し上げます。
今後とも天文シミュレーションプロジェクトXC50システムのご利用をよろしくお願いいたします。

本メールに関するご質問やご意見は以下のページからお寄せ下さい。
http://www.cfca.nao.ac.jp/inquiry/

Pages

Subscribe to RSS - Information