CfCA webサーバ復旧のお知らせ 天文シミュレーションプロジェクト 計算機共同利用者の皆様、 下記の日程で予定されていた、CfCA webサーバのバックアップ作業が 終了したことをお知らせします。 先程、下記の日程で予定されていたCfCA webサーバのバックアップ作業が終了し、webサーバの運用が再開されました。 CfCA webサーバ : 5月13日(月) 10:00 ~ 15:00 作業の遅れにより予定終了時刻を超過してしまい、利用者の皆様に御不便をお掛けしたことをお詫び致します。 現在は通常通り閲覧可能です。 本メールに関するご質問やご意見は以下のページからお寄せ下さい。 http://www.cfca.nao.ac.jp/inquiry/
XC30障害情報 XC30システム利用者各位、 5月5日15:04頃 計算ノードc3-0c2s3n2でハードウェアエラーが検出され、ノードがシステムから切り離されました。 本障害により以下のジョブが影響を受けた可能性があります。 お手数をお掛けしますが、ジョグの状況をご確認ください。 JobID=11861.sdb UserName=masadayh JobName=model90_132 Queue=large-a 本メールに関するご質問やご意見は以下のページからお寄せ下さい。 http://www.cfca.nao.ac.jp/inquiry/
XC30障害情報 XC30システム利用者各位、 5月4日9:45頃、XC30システムのキャビネットc6-0で電源の問題が発生し、システムが停止しました。 システムの再起動を伴う復旧作業を行い、同日13:05頃ユーザ解放しました。 現在はノードを縮退して稼働中です。 本障害発生時に実行中だった以下のジョブがリランされました。
XC30障害情報 XC30システム利用者各位、 4月30日0:54頃、XC30システムにおいて障害が発生しました。 計算ノードc1-0c1s13n1のHeartbeat faultが検出され、ノードがダウンしました。 復旧作業を行い、現在は当該ブレードを縮退して稼働しています。 本障害によって、以下のジョブが影響を受けた可能性があります。 お手数をお掛けして申し訳ありませんが、ジョブの状況をご確認ください。 jobID=10703.sdb user=kurodatk jobname=mul2 queue=large-a 本メールに関するご質問やご意見は以下のページからお寄せ下さい。 http://www.cfca.nao.ac.jp/inquiry/
XC30障害情報 XC30システム利用者各位、 4月16日の18:15頃にMac OS等では ssh -Y username@xc.cfca.nao.ac.jp ssh: Could not resolve hostname xc.cfca.nao.ac.jp: nodename nor servname provided, or not known と表示されXC30システムにログインできない事例が いくつか報告されていると広報させて頂きましたが、 VPNサーバの再設定を行い、現在はこの問題は 解決しております。ご迷惑おかけ致しました。 ssh -Y username@xc.cfca.nao.ac.jp ssh -Y username@xc 等でXC30システムにログインして頂きますようお願い申し上げます。
XC30障害情報 XC30システム利用者各位、 先程お知らせしたXC30システムの障害情報ですが、 影響を受けた可能性のあるジョブについて連絡させていただきます。 お手数をお掛けしますが、確認をお願いいたします。
XC30障害情報 XC30システム利用者各位、 本日、XC30システムの定期保守作業が終了し12:00頃にユーザーに解放されました。 システム停止時にPBSのシャットダウンが正常に終了しなかったため、異常終了したジョブがあります。 これにより、依存関係が解決できずにそのまま残ってしまったジョブがあります。 つきましては、ジョブの結果やジョブの依存関係の確認を行ない、その上でジョブの削除や再投入をお願いいたします。 ジョブが削除できないなどの問題がある場合はご連絡いただけますでしょうか。 影響を受けたジョブについては、別途連絡させていただきます。 ご迷惑をおかけして申し訳ありません。 本メールに関するご質問やご意見は以下のページからお寄せ下さい。 http://www.cfca.nao.ac.jp/inquiry/
XC30障害情報 XC30システム利用者各位、 XC30システムにおいて障害が発生しました。 c0-0キャビネットとc6-0キャビネットを接続している光ケーブルに問題があり、 XC30キャビネット#6,7が使用され始めた14:50頃からノードのSuspect/Admindownが発生し始めました。 18:20 計算ブレードc6-0c2s4, c6-0c2s5 を縮退し、ダウンしていた計算ノードを再起動しました。 現在は9ノードがダウンした状態で運用しております。
XC30障害情報 XC30システム利用者各位、 現在、VPN接続後にXC30システムにログインできない事例が いくつか報告されています。 ssh -Y username@xc.cfca.nao.ac.jp ssh: Could not resolve hostname xc.cfca.nao.ac.jp: nodename nor servname provided, or not known などと表示された場合は、 ssh -Y username@xc01.cfca.nao.ac.jp ssh -Y username@xc02.cfca.nao.ac.jp ssh -Y username@133.40.17.11 ssh -Y username@133.40.17.12
XC30障害情報 XC30システム利用者各位、 昨日 4/11 XC30システムにおいてログインノードでのコンパイルが非常に遅くなる現象が確認されました。 一時的な対処として、ログインノードを再起動いたしました。 事後連絡となってしまい、申し訳ありません。 現在、原因の究明を行なっております。 計算ノード上のジョブに関しては、再起動の影響はありません。 本メールに関するご質問やご意見は以下のページからお寄せ下さい。 http://www.cfca.nao.ac.jp/inquiry/