天文学専用スーパーコンピュータ「アテルイ」,さらに2倍の計算速度へ

【概要】

国立天文台天文シミュレーションプロジェクト(Center for Computational Astrophysics,CfCA)では2014年9月11日から30日,数値計算専用スーパーコンピュータCray XC30システム「アテルイ」のアップグレードを行い,同10月1日より共同利用運用を開始しました.今回のアップグレードでは最新のCPU1への交換によって,理論演算性能2がこれまでの502Tflops3から約2倍の1.058Pflops3に向上し,アテルイはペタフロップスマシンへと飛躍しました.新しいアテルイではこの性能を活かし,シミュレーション天文学の観点からさらなる宇宙の理解を加速させることが期待されます.(2014年11月13日プレスリリース)



画像1:新しいアテルイの外観.筐体数が6に減り,コンパクトになった.(クレジット:国立天文台)

【背景】

 望遠鏡の観測で得られる宇宙の画像データは,天体現象や宇宙の姿のスナップショットです.これらの観測データがどのような天体現象の,どのような場面をとらえたものなのかを理解するためには,物理学に基づいた理論を組み立て,それにもとづいた実験による検証が必要です.しかしながら,天文学で扱う現象は地球上では実現できないものがほとんどです.また理論天文学では,天体現象を表した方程式を解くことで,その現象を理解しようとしますが,このような方程式の中には,単純に解くことができないものもあります.これに対し,コンピュータの中に宇宙や天体の状態を作り出して模擬実験(シミュレーション)をし,その結果を観測データと照らし合わせることで天体現象を理解するという方法が,コンピュータの発達とともに盛んにおこなわれるようになってきました.このような手法で行われるのが「シミュレーション天文学」です.観測天文学,理論天文学に並ぶ第三の天文学と位置づけられています.

 国立天文台天文シミュレーションプロジェクト(以下CfCA)では,このようなシミュレーション天文学のためのスーパーコンピュータの運用を行っています.2013年4月に国立天文台水沢キャンパスに設置されたスーパーコンピュータ Cray XC30 システム「アテルイ」は,国立天文台が運用する数値計算専用計算機としては第4世代にあたります.スカラ型並列計算機4に分類されるスーパーコンピュータで,理論演算性能502Tflopsという性能は,天文学専用スーパーコンピュータとして当時世界最速を誇りました.アテルイの導入により,天文学における様々な分野でのシミュレーションによる理解が加速しました.しかし,このアテルイ運用の間にも天文学のシミュレーション技術とそれに求められるコンピュータの性能は高くなってゆくのです.

【今回のアップグレードについて】

 2014年9月11日から30日にかけて,スーパーコンピュータ「アテルイ」のアップグレード作業が行われました.この作業では最新のCPUをのせたブレード5の取り替えが主なものとなりました.また,筐体は8から6へと数を減らし,それに伴いCPU同士をつなぐインターコネクト6のつなぎ替えを行いました.筐体の数は減りましたが,最新のCPUを搭載することでアテルイの計算能力はこれまでの502Tflopsから約2倍の1058Tflops(=1.058Pflops)へパワーアップしました.これは,1秒間に約1千兆回の足し算や掛け算のような計算をする能力をもつことを意味します.この性能は天文学専用スーパーコンピュータとしては世界最速のものとなります.アテルイは国立天文台が運用するスーパーコンピュータでは,はじめてのペタフロップスマシンへと進化を遂げました.



画像2:ブレードの交換作業をするクレイ・ジャパン・インク社のスタッフ.計算ノード用のブレード全266枚を交換した.
(クレジット:国立天文台)

 2014年10月1日から新システムで稼働を開始し,現在既に127名の共同利用研究者によって利用されています.利用者は国立天文台の天文学者に限らず,日本全国の大学・研究機関に所属する研究者や,天文学を専攻する大学院生,また海外にいる日本人研究者などです.国内外からアテルイに接続し計算をしています.現在行われている計算は,惑星の形成,星の誕生や死,太陽活動の解明,ブラックホールの進化,銀河や銀河団の形成,宇宙の構造の進化など多岐にわたります.たとえば,超新星爆発や中性子星合体のようなシミュレーションでは,複雑な高エネルギーの物理過程が絡んできますが,それらをすべて含めたシミュレーションには多大な計算能力を必要とします.新しいアテルイによって,そのような複雑な物理現象に対してより現実的な仮定の計算が可能となります.また,物理現象を計算する時間ステップを細かくすることで,より正確で詳細な天体現象の時間変化を捉えることにつながります.新しいアテルイではこれまでよりも星のような粒子や,星間ガスやプラズマのような流体の運動をより正確に追うことができるようになります.さらに,空間解像度を上げることで天体や宇宙の構造をより細かく知ることができます.たとえば,宇宙の大規模構造のような大きなスケールから,ひとつひとつの銀河のようなスケールまでを1つのシミュレーションの中で計算できるようになり,様々なスケールで宇宙の進化を捉えられるようになるでしょう.

 今回のアテルイアップグレードにあたり,CfCAプロジェクト長の小久保英一郎教授は次のように語ります.「天文学におけるスーパーコンピュータは,観測では見ることができない天体現象を計算によって描き出す『理論の望遠鏡』といえます.新生アテルイを用いたより現実的なシミュレーションによって,これまで見ることができなかった宇宙の姿が明らかになることが期待されます.」



画像3:新しいアテルイで用いられているブレードの内部.2つのCPUがセットになり,1つのノード7を構成している.このノードが1つのブレードの中に4つ搭載されている.メモリは各ノードに8枚ずつ積まれており,1ノードあたり64GBのメモリを有している.このブレードが1つの筐体に48枚差し込まれている.CPUは銅製の放熱器に覆われており,この写真では直接見ることはできない.
(クレジット:国立天文台)

【アップグレード後のアテルイ諸元(アップグレード前との比較)】

アップグレード前
(2013.4-2014.9)
アップグレード後
(2014.10-)
理論演算性能 502 Tflops 1058 Tflops (1.058 Pflops)
総主記憶容量8 94.25 TB 135.6 TB
CPU Intel® Xeon®プロセッサー E5-2670 (2.6GHz) Intel® Xeon®プロセッサー E5-2690 v3 (2.6GHz)
1CPUあたりのコア1 8 12
1ノード7あたりのCPU数 2 2
ノード理論演算性能 332 Gflops 998 Gflops
ノード主記憶容量8 64 GB 128 GB
ノード数 1512 (3024 CPU) 1060 (2120 CPU)
筐体数 8 6
全コア数 24,192 25,440

【アップグレード作業記録映像】

(クレジット:国立天文台)

【新しいアテルイのデザインコンセプト】



画像4:新アテルイの筐体デザイン(クレジット:国立天文台)

 今回のアップグレードで筐体の数が8から6へとかわり,それにともない筐体のデザインパネルもリニューアルしました.デザインを担当した美術家の小阪淳さんは次のように語ります.

「リニューアルされたアテルイのためにデザインも更新しました.基本的には前モデルのデザインを踏襲していますが,新しい要素として,ほんのりと虹色の光を加えています.ひだ状のオブジェクトから様々な光が放たれ,一つに結実して宇宙の姿を描き出しています.天体は可視光を含む電磁波を放ちます.天文学では,それらを望遠鏡によって捉え,様々なデータを蓄積してきました.そして,それらから驚くべき宇宙の姿を徐々に明らかにしました.そこにさらにコンピュータが加わったことによって,私たちが知ることのできる世界が大きく広がったのでしょう.演算によって,望遠鏡では見ることのできない宇宙からの光を,コンピュータが代わりに放ち出したのだと思います.そんな思いを,今回付け加えた七色の虹の光に込めました.パワーアップしたアテルイはどんな光を放つのでしょう.どんな宇宙の風景を描くのでしょう.今からとても楽しみにしています.」


【新アテルイギャラリー】

/ /
高解像度 JPG(13.7MB) 高解像度 JPG(14.4MB)
/ /
高解像度 JPG(18.2MB) 高解像度 JPG(20.2MB)
/ /
高解像度 JPG(25.9MB) 12/4追加 高解像度 JPG(27.1MB) 12/4追加
撮影:清水上誠(国立天文台水沢VLBI観測所/天文シミュレーションプロジェクト)
画像クレジット:国立天文台

【用語解説(本文注釈)】

1) CPU,コア
Central Processing Unit,中央演算処理装置.コンピュータを構成する部品のひとつで,プログラムに従って演算・計算を行う電子回路や演算ユニットのこと.コンピュータのまさしく頭脳にあたる部分である.この内部で実際に演算をしている回路をコアと呼び,2006年頃から1つのCPUの中に複数のコアをもつ「マルチコアCPU」が使われるようになってきた.新しいアテルイで用いられているCPUは12個のコアを有する.CPUとコアを同じ意味として用いることも多い.

2) 理論演算性能
コンピュータのシステムに実装されている演算器が,理想的な状況を仮定した場合に,単位時間あたり最大何回の演算をできるものかを表すもの.これに対して実際のプログラムを走らせた時の演算性能のことを「実効性能」と呼び,これは走らせるプログラムによって異なる値となる.

3) Tflops(テラフロップス), Pflops(ペタフロップス)
flops(フロップス)は,計算能力を表す単位.1flopsは,1秒間に1回の実数演算ができることを表す.1Tflops(=1012flops=1 000 000 000 000flops)であれば,1秒間に1兆回の計算を,1Pflops(=1015flops=1 000 000 000 000 000flops)であれば,1秒間に1000兆回の計算をすることができる.

4) スカラ型並列計算機
汎用のCPUを大規模に並列接続することによって構成されるスーパーコンピュータのこと.理化学研究所の「京」コンピュータもスカラ型並列計算機に分類される.これとは別に専用のCPUを搭載したベクトル型スーパーコンピュータというものもある(例:海洋研究開発機構の「地球シミュレータ」).

5) ブレード
抜き差し可能な細長い1枚の基板上にCPU,メモリ,ネットワーク機器などを実装したものをブレード(=刃)と呼ぶ.筐体に複数枚差し込んで用いる.アテルイでは,1つの筐体に24枚のブレードが差し込まれている.

6) インターコネクト
CPU間,ノード間,筐体間など,ごく短い距離のデータのやりとりのための通信のこと.アテルイではノード間,筐体間のインターコネクトに計720本の通信ケーブル(光・銅)を用いている.

7) ノード
ネットワークの接点に当たる部分.アテルイでは,ひとつのノードに2つのCPUが載っており,このノードがインターコネクトによって連結されることで,各CPUがつながることができる.アテルイでは1つのブレードに8つのノードが設置されている.

8) 主記憶装置,メモリ
CPUなどの演算装置が直接情報の読み書きをする記憶装置.メインメモリともいう.計算するプログラムを一時的に保存する部分であり,この容量が大きいほど計算機上で多くの作業を素早く行うことができる.


【画像及び動画の利用について】

画像及び動画をご利用になる際には、必ず画像の近くにクレジットの表記をお願いします。
本サイトに掲載されている画像及び動画のご利用にあたっては「自然科学研究機構 国立天文台 ウェブサイト 利用規程」に従ってください。

【お問い合わせ】

CfCA 広報担当
電話: 0422-34-3836
E-mail: hina_atmark_cfca.jp ( _atmark_→ @ )

【関連リンク】

世界最速の天文学専用スーパーコンピュータ始動!(2013年5月29日プレスリリース)