共同利用計算機利用者各位
2024(令和6)年12月から稼働予定(時期の変更の可能性あり)のXD2000でのキュー構成案をお知らせいたします。
キュー構成の基本方針およびキュー構成案に示した数値に対して,ご意見・ご要望がございましたら,
2024(令和6)年5月17日(金)までに問合せフォームからお寄せいただけましたら幸いです。「質問の対象」は「XD2000」をご選択ください。
キュー構成案の概要
- XC50でのカテゴリ構成(XC-A, XC-B+, XC-B, XC-MD, XC-Trial)をそのまま継承する。
- システムMにはXC50と同様にlargeキューとbulkキューを設定し,規模が小さいシステムPにはbulkキューを設定しない。
- 各キューに配分する計算資源量は,対応するXC50のキューでの値をコア換算でスケールする。
- 運用途中に計算資源量を下げることを避けるために,運用開始時のキュー構成は,計算資源を少なめに配分するように決める。
- システムMの場合はコア換算で0.58を,システムPの場合はコア換算で0.22を,XC50での配分資源量に乗じて算出した。XC50のユーザの全員がシステムMおよびPの両方を使うわけではないので,最も配分資源を少なめに見積もった場合に相当する。
- 換算例:XC50のカテゴリBのlargeキューでは単一ジョブで520コアが利用可能であったが,システムMでの同じキューの配分資源量は,換算因子0.58を掛けて,301.6コアとする。配分ノード数はこの値を超える最小のノード数とする。この場合は2ノード(224コア)と3ノード(336コア)の間なので,カテゴリBの単一ジョブ最大ノード数は3ノード(336コア)となる。
- 参考情報:旧システム(XC50)と新システム(XD2000)の構成比較
システム名 ノード数 ノード当たりのコア数 (総コア数) ノード当たりのメモリ量(コア当たりのメモリ量) XC50 1005 40 (40200) 384GB (9.6GB) XD2000 (システムM) 208 112 (23296) 128GB (1.14GB) XD2000 (システムP) 80 112 (8960) 512GB (4.57GB)
- システムMの場合はコア換算で0.58を,システムPの場合はコア換算で0.22を,XC50での配分資源量に乗じて算出した。XC50のユーザの全員がシステムMおよびPの両方を使うわけではないので,最も配分資源を少なめに見積もった場合に相当する。
- (検討中) 計算資源の有効利用のため,1ノード(112コア)以下の計算資源を使う計算は,コア単位で計算資源を配分し(異なるジョブがノードを共有する),2ノード以上の計算資源を使う計算は,XC50と同じくノード単位で計算資源を配分する。
- (検討中) システムMとPで合わせてジョブ実行数制限をおこなう。
- (検討中) カテゴリ分け (システムMとPでのカテゴリに差異を設けるなど)
- (検討中) カテゴリSの運用方法
キュー構成案
下記に示している数値は暫定的なものですので,変更の可能性があります。最大同時実行数は不確定性が大きいのでここには載せていません。
システムM
largeキュー
カテゴリ | XD-A | XD-B+ | XD-B | XD-MD | XD-Trial |
単一ジョブ最大ノード数(コア数) | 104 (11648) | 19 (2128) | 3 (336) | 2 (224) | 1 (112) |
同時利用可能最大ノード数 | 104 | 19 | 6 | 4 | 1 |
継続時間 | 24 hour | 24 hour | 24 hour | 24 hour | 4 hour |
bulkキュー
カテゴリ | XD-A | XD-B+ | XD-B | XD-MD |
単一ジョブ最大ノード数(コア数) | 3 (336) | 3 (336) | 2 (224) | 1 (112) |
同時利用可能最大ノード数 | 12 | 6 | 3 | 2 |
継続時間 | 12 hour | 12 hour | 12 hour | 12 hour |
システムP
カテゴリ | XD-A | XD-B+ | XD-B | XD-MD | XD-Trial |
単一ジョブ最大ノード数(コア数) | 40 (4480) | 23 (2576) | 4 (448) | 3 (336) | 1 (112) |
同時利用可能最大ノード数 | 40 | 23 | 8 | 6 | 1 |
継続時間 | 24 hour | 24 hour | 24 hour | 24 hour | 4 hour |