新天文学専用スーパーコンピュータ『アテルイⅡ』始動!

■概要

国立天文台天文シミュレーションプロジェクト(Center for Computational Astrophysics:CfCA)では,天文学専用スーパーコンピュータ「アテルイ」にかわる新たな大規模数値計算専用計算機として Cray XC50 システムを導入し,2018年6月1日より国立天文台水沢キャンパス(岩手県奥州市水沢)にて本格運用を開始します.新しいスーパーコンピュータシステムは,2013年のアテルイ導入時の約6倍,2014年のアップグレード以降の3倍の理論演算性能である3.087 Pflops(ペタフロップス) に向上しました.この性能によってアテルイではできなかったシミュレーションを行い,「理論天文学の望遠鏡」として新しい宇宙の姿を描き出すことが期待されます.この新システムの愛称は,前システムを引き継ぎ「アテルイⅡ(ツー)」と名付けられました.(2018年6月1日 プレスリリース)


画像1:天文学専用スーパーコンピュータ「アテルイⅡ」(クレジット:国立天文台)

■詳細

新型の天文学専用スーパーコンピュータCray XC50,NS-05「アテルイⅡ」が,2018年6月1日より本格稼働を始めます.アテルイIIは2018年3月まで運用されてきた「アテルイ」と同様に,スカラ型並列計算機と呼ばれるスーパーコンピュータです.計算機の頭脳である「コア」同士をネットワークで繋いで計算情報をやり取りすることにより,大量のコアを同時に使って計算を高速に行います.アテルイIIには約4万のコアが搭載され,理論演算性能 3.087 PFlops の性能を有します.つまり,1秒間に3000兆回の浮動小数点計算を行うことを表します.これは,2013年のアテルイ導入時の6倍,2014年10月のアテルイアップグレード後の3倍の演算性能になります.


画像2:アテルイⅡの計算ブレード.(a)Ariesネットワークルータ,(b)ノード,(c)CPU.1つのCPUには20コアが搭載されており,2つのCPUで1ノードを構成する.ブレード1枚あたり4つのノードとAriesネットワークルータで構成されている.(クレジット:国立天文台,飯島裕)
ダウンロード:[文字入り(.png)],[文字なし(.jpg)]

アテルイⅡは高速ネットワークで接続され,国内外の天文学者がアクセスし利用することができます.2018年度は約150名の研究者の利用が予定されています.アテルイⅡは,より大規模・現実的なシミュレーションによって,前システムのアテルイでは計算できなかった宇宙の姿を描き出すことが期待されます.例えば,これまでは実際よりも少ない星の数でしか行えなかった天の川銀河のシミュレーションが,銀河を構成する数千億個の星すべてについて運動を計算することができるようになります.利用者の一人で,シミュレーションによって星の誕生の研究をする法政大学の松本倫明教授は「前システムと比べて約半分の時間でモデルの計算できるようになりました.これにより,色々な実験的なシミュレーションをすばやくできるようになりました.これは我々のように,観測との比較を視野に入れた研究にとって重要なことです」 と述べています.

天文学は,宇宙を望遠鏡で直接見る「観測天文学」と,物理学と数学によって現象を記述し理解する「理論天文学」を両輪にながらく発展して来ました.しかし,コンピュータが発達した今,理論だけでは解くことができない方程式を数値的に解き,シミュレーションによってコンピュータの中に宇宙や天体を実験的に作り出し観察する「シミュレーション天文学」が,宇宙を理解するために欠かすことのできない第三の手法となっています.国立天文台天文シミュレーションプロジェクト長の小久保英一郎教授は,アテルイⅡへの期待を以下のように述べています.「現代天文学におけるシミュレーションの役割はますます大きくなってきています.観測される天体がなぜそのように見えるのか,また,観測できない宇宙や天体では何が起きているのか,など物理に基づいたシミュレーションによって描き出すことができます.新しい『理論天文学の望遠鏡』として,アテルイⅡが超新星爆発の機構や,銀河の形成と進化,恒星と惑星系の起源などの問題を解き明かすことを期待しています.」

■アテルイⅡの性能諸元

アテルイ
(2013.4-2014.9)
アテルイ
(2014.10-2018.3)
アテルイⅡ
(2018.6-)
理論演算性能 0.502 Pflops 1.058 Pflops 3.087 Pflops
総主記憶容量 94.25 TB 135.6 TB 385.9 TB
CPU Intel® Xeon®プロセッサ E5-2670 (2.6GHz, 8コア) Intel® Xeon®プロセッサ E5-2690 v3 (2.6GHz, 12コア) Intel® Xeon® Gold 6148 プロセッサ (2.4GHz, 20コア)
全コア数 24,192 25,440 40,200

【アテルイⅡデザインコンセプト】


画像3:「アテルイⅡ」筐体パネル正面(クレジット:国立天文台)

アテルイⅡの筐体デザインは,前システム・アテルイの筐体デザインも手掛けた,美術家の小阪淳氏が制作しました.アテルイⅡのデザインコンセプトについて小阪氏は以下のようにコメントを寄せます.
---------
新しいアテルイが纏うデザインにおける問題は,素地となる筐体そのもののデザインをいかに扱うかというものでした.新たに加えることができるのはプリント部分のみですので,どうしても黒いフレームが視覚的に大きな要素となってしまいます.このフレームはある規則性を持って並んでいますが,今回はさらに細かな分割をかけることによって全体を均質な縦割りのフレームとみなし,そのフレームに従ってデザインを行っています.
「阿弖流為 弐」の文字にあたる部分は,印章などで用いられる「篆書」とよばれる書体をベースにデザインしています.印章が石に刻まれるように,このデザインも石(チップ)を中心に据える物体に刻まれるわけです.(小阪淳)
----------

【素材集】

■画像及び動画の利用について
画像及び動画をご利用になる際には、必ず画像の近くにクレジットの表記をお願いします。
本サイトに掲載されている画像及び動画のご利用にあたっては「自然科学研究機構 国立天文台 ウェブサイト 利用規程」に従ってください。

■映像

動画:天文学専用スーパーコンピュータ「アテルイⅡ」
演出・製作:南口雄一,樋口喜昭 音楽:「Melt」吉岡亜由美
クレジット:国立天文台



■計算例
・連星系形成シミュレーション

連星系が形成される過程で,ガスが星に落下する様子をアテルイⅡによってシミュレーションしたものです.連星系の周囲にできたガスの円盤からさらにそれぞれの星に向かってガスが落下している様子が見て取れます.このような構造は,アルマ望遠鏡を使った観測によっても確かめられており,観測結果の解釈にシミュレーションが重要な役割を果たします(例:アルマ望遠鏡プレスリリース2014.12.04「双子の赤ちゃん星を育むガスの渦巻き」).同様のシミュレーションが前システムのアテルイでも行われましたが,アテルイⅡでは多くのコアを利用することで約半分の時間でシミュレーションをすることが可能になり,観測と比較するための実験的なシミュレーションがよりすばやく,多くできるようになりました.使用コア数は2048コア,計算時間は105.67時間です.(クレジット:法政大学/プリンストン大学 松本倫明)
ダウンロード:[動画(.mp4)],[静止画(.png)]



・大規模構造形成シミュレーション

このシミュレーションは,ダークマター粒子の重力を計算し,宇宙の大規模構造ができる様子を計算したものです.(a)(b)は,前システムのアテルイで行った結果です.1辺が約100億光年にもおよぶ広大な宇宙の,現在のダークマターの分布を表しています.このようなシミュレーションでは宇宙の大域的な構造をよく再現できるものの,拡大図(b)に見られるような細部の構造を見ることは困難でした.細かい構造を見るためには,シミュレーション空間を小さくする必要がありました.
(c)はアテルイⅡで行ったテスト計算で,(b)と同じサイズの空間をシミュレーションしています.銀河を宿すダークマターハロー(ダークマターの塊)の細部の構造まで分解できている様子が見られます.このように,高分解能かつ,(a)のような100億光年にわたる広大な空間のシミュレーションが,アテルイⅡの全コアを用いて計画されています. (c)の計算で用いたコア数は4000コア,計算時間は20時間です.(クレジット:千葉大学 石山智明)
ダウンロード:[(a) のみ],[(b) のみ],[(c) のみ],[(a)(b)(c)]



■画像集

/ / /
高解像度 JPG 高解像度 JPG 高解像度 JPG
/ / /
高解像度 JPG 高解像度 JPG 高解像度 JPG
/ / /
高解像度 JPG 高解像度 JPG 高解像度 JPG
/ 高解像度 JPG
/ 高解像度 JPG
/ 高解像度 JPG
/ 高解像度 JPG
撮影:長山省吾,清水上誠,福士比奈子
画像クレジット:国立天文台

【用語集】

1) CPU,コア
Central Processing Unit,中央演算処理装置.コンピュータを構成する部品のひとつで,プログラムに従って演算・計算を行う電子回路や演算ユニットのこと.コンピュータのまさしく頭脳にあたる部分である.この内部で実際に演算をしている回路をコアと呼び,2006年頃から1つのCPUの中に複数のコアをもつ「マルチコアCPU」が使われるようになってきた.アテルイⅡでは,1つのCPUに20コアが搭載されている.

2) 理論演算性能
コンピュータのシステムに実装されている演算器が,理想的な状況を仮定した場合に,単位時間あたり最大何回の演算をできるものかを表すもの.これに対して実際のプログラムを走らせた時の演算性能のことを「実効性能」と呼び,これは走らせるプログラムによって異なる値となる.

3) Pflops(ペタフロップス)
flops(フロップス)は,計算能力を表す単位.1flopsは,1秒間に1回の実数演算ができることを表す.1Pflops(=1015flops=1 000 000 000 000 000flops)は,1秒間に1000兆回の計算をすることができる.

4) スカラ型並列計算機
汎用のCPUを大規模に並列接続することによって構成されるスーパーコンピュータのこと.理化学研究所の「京」コンピュータもスカラ型並列計算機に分類される.これとは別に専用のCPUを搭載したベクトル型スーパーコンピュータというものもある(例:海洋研究開発機構の「地球シミュレータ」).

5) ブレード
抜き差し可能な細長い1枚の基板上にCPU,メモリ,ネットワーク機器などを実装したものをブレード(=刃)と呼ぶ.筐体に複数枚差し込んで用いる.

6) インターコネクト
CPU間,ノード間,筐体間など,ごく短い距離のデータのやりとりのための通信のこと.

7) ノード
ネットワークの接点に当たる部分.アテルイⅡでは,ひとつのノードに2つのCPUが載っており,このノードがインターコネクトによって連結されることで,各CPUがつながることができる.

8) 主記憶装置,メモリ
CPUなどの演算装置が直接情報の読み書きをする記憶装置.メインメモリともいう.計算するプログラムを一時的に保存する部分であり,この容量が大きいほど計算機上で多くの作業を素早く行うことができる.