XC50ログインノードで生じたメモリ不足による障害情報

XC50システム利用者各位

12/2 19:30-21:15、21:40-21:45において、XC50ログインノードのxc01でメモリ不足が生じました。
あるユーザのgnuplotによる可視化の処理が予想外に極めて大きなメモリを要求したのが原因です。
この間、ユーザがログインノードxc01へログインできない等の障害が生じました。

また、メモリ不足に伴い、12/2 19:30-21:45にxc01で実行中であったジョブが影響を受けております。
本障害により影響を受けたと考えられるジョブは、以下の通りです。

Job ID Username Queue Jobname SessID NDS TSK Memory Time S Time
--------------- -------- -------- ---------- ------ --- --- ------ ----- - -----
6639486.sdb tsukmtys bulk-bp MHD4 14337 8 8 1gb 12:00 R 01:48
6667467.sdb wangln large-bp a2.3_rs93 24852 8 8 1gb 24:00 R 00:25
6669465.sdb tomidakn large-bp sinth0.05_ 25487 32 32 1gb 24:00 R 15:29
6677572.sdb fukushim large-b 6c1z1a2 16361 13 13 1gb 24:00 R 09:49
6678271.sdb takaishi bulk-md a04g006m3t 22106 1 1 1gb 12:00 R 06:27
6679106.sdb takasosn large-a b1e-4_027 9215 27 27 1gb 24:00 R 04:13
6679767.sdb inoueak large-md jobtest 7797 10 10 1gb 24:00 R 17:21
6680058.sdb fukushim bulk-b level13_0 28458 2 2 1gb 12:00 R 08:53
6680117.sdb tarumiyt bulk-b ArepoNSM 19488 2 2 1gb 12:00 R 03:59
6680134.sdb kurodatk bulk-bp Nx6Nene12 18153 6 6 1gb 12:00 R 00:34
6680740.sdb inouesg large-bp VG0LBox 28061 26 26 1gb 24:00 R 20:15
6681654.sdb shutoyr bulk-md ref_er3_3e 30999 1 1 1gb 12:00 R 10:00
6681767.sdb usudatm bulk-b GLE90_3_22 17112 1 1 1gb 04:00 R 01:19
6681815.sdb osatokn bulk-b C2_kmax12 19836 2 2 1gb 12:00 R 07:41
6681820.sdb osatokn bulk-b C2_kmax18 3034 2 2 1gb 12:00 R 07:25
6681875.sdb osatokn bulk-b C1_kmax27 15925 2 2 1gb 12:00 R 07:43
6682756.sdb tarumiyt bulk-b ArepoNSM 9823 2 2 1gb 12:00 R 04:13
6682823.sdb kitakitk bulk-b ohsgcode 32320 1 1 1gb 12:00 R 03:40
6682913.sdb ilesez large-b Pff100b_dV 32095 13 13 1gb 11:00 R 05:20
6683226.sdb okamtotk bulk-a subfind 17819 2 2 1gb 12:00 R 00:07
6683301.sdb fukushim bulk-b dm8_z-2 30164 2 2 1gb 12:00 R 00:59
6683386.sdb kanagwkz large-b migq14h5a3 34122 6 6 1gb 24:00 R 12:44
6683425.sdb okamtotk bulk-a subfind 15635 2 2 1gb 12:00 R 00:11
6683617.sdb usudatm bulk-b GLE60_3_20 1313 1 1 1gb 04:00 R 00:48
6683685.sdb shimzuik large-b Cal3 31152 13 13 1gb 24:00 R 08:51
6683725.sdb okamtotk bulk-a subfind 19497 2 2 1gb 12:00 R 00:31
6683794.sdb kanagwkz bulk-b migq14h5a3 36131 2 2 1gb 12:00 R 08:02
6683807.sdb tanakast bulk-bp post_0724 19007 4 4 1gb 04:00 R 02:34
6683896.sdb otaniak bulk-md sphere-col 22819 1 1 1gb 12:00 R 07:05
6683998.sdb kanagwkz bulk-b migq14h5a1 19277 2 2 1gb 12:00 R 05:40
6684008.sdb hozumisn large-b DISK_N64M2 35160 13 13 1gb 24:00 R 01:43
6684046.sdb nakamrko bulk-a s9.5-2d 10275 10 10 1gb 12:00 R 04:13
6684217.sdb hamidnhm bulk-b i+w0 32034 1 1 1gb 12:00 R 02:13
6684437.sdb sumimt bulk-b T2H1n.4200 1759 1 1 1gb 12:00 R 02:53
6684600.sdb kanagwkz bulk-b migq14h5a5 28890 2 2 1gb 12:00 R 02:20
6684612.sdb tomitasr large-b post34noub 6410 4 4 1gb 24:00 R 01:31
6684613.sdb suzukiak large-bp job_grb 26611 10 10 1gb 24:00 R 01:02
6684628.sdb suzukiak bulk-bp job_rhd 14850 1 1 1gb 02:00 R 00:39
6684635.sdb suzukiak bulk-bp job_rhd 21902 1 1 1gb 02:00 R 00:30
6684651.sdb kanagwkz bulk-b migq14h5a3 15058 2 2 1gb 12:00 R 00:39
6684663.sdb kawshmtm large-bp GRMHD_MAD_ -- 52 52 1gb 24:00 R --
6681677,usudatm,Tomonori Usuda,bulk-b,"GLE0_3_22"
6684650,kawshmtm,Tomohisa Kawashima,large-bp,"GRMHD_MAD_highres_test1_2_MMKS7"
6684008,hozumisn,Shunsuke Hozumi,large-b,"DISK_N64M28L16"
6684008,hozumisn,Shunsuke Hozumi,large-b,"DISK_N64M28L16"
6684986,sugimrkz,Kazuyuki Sugimura,large-bp,"STDIN"
6684987,sugimrkz,Kazuyuki Sugimura,large-bp,"STDIN"
6684989,sugimrkz,Kazuyuki Sugimura,large-bp,"STDIN"
6684991,sugimrkz,Kazuyuki Sugimura,large-bp,"STDIN"
6684992,sugimrkz,Kazuyuki Sugimura,large-bp,"STDIN"
6684995,sugimrkz,Kazuyuki Sugimura,large-bp,"STDIN"

ユーザの皆様には大変なご迷惑をおかけし、誠に申し訳ございませんでした。
今一度、該当するジョブの計算結果の確認をお願いいたします。

本メールに関するご質問やご意見は以下のページからお寄せ下さい。
http://www.cfca.nao.ac.jp/inquiry/