[目次] [質疑応答]

国立天文台VPPシステムの運用と
開発支援ツールの試用・評価


- はじめに
- 天文学と数値実験
- 並列スーパーコンピュータ導入のねらい
- システム概要
- 運用概略
- 開発支援ツール
- おわりに
- 参考文献
- 添付資料「VPP Workbenchご紹介」

国立天文台
天文学データ解析計算センター
伊藤 孝士
tito@cc.nao.ac.jp

photo はじめに

 無限に広がる宇宙とその歴史を対象とする天文学に於いては実時間実空間スケールでの実験が不可能であり、その意味で大型の計算機を使用した数値実 験の意義は極めて重い。本稿では、「理論天文学の望遠鏡」を目指して1996年初頭より国立天文台に導入されたスーパーコンピュータシステム VPP300/16R, VX/4R, VX/1Rおよびその周辺機器群の立ち上げ経緯、構成、運営方法と、導入が検討されている開発支援ツールVPP WorkBenchについて簡単に紹介する。なお、国立天文台計算機システムの概要については講演者によるFUJITSU記事[1]の要約となるので、そちらも参照していただきたい。


天文学と数値実験

 近年、科学技術の目覚ましい進歩により、天文学に於いても精度の高い観測データが大量に取得されるようになってきた。これはどこの分野でも同じで あろうが、無限に近い広がりを見せる大宇宙を相手にする天文学ではこのことの恩恵はとりわけ大きい。観測の精度が上がれば上がるほどいくらでも新しい現象 が見つかり、それを説明する理屈が考えられている間に更に新しい発見が相次ぐのである。既に測定精度が限界に近付いていて観測による定性的発見が底を付き つつあるような分野も多い中、天文学のこうした天井知らずの発展はまさに瞠目すべきものであると言える。大気のゆらぎを避けた立地条件をとことんまで突き 詰めて遂には宇宙空間に大型の光学望遠鏡を打ち上げてしまったHubbleSpace Telescopeの成功[2]、直径8mの一枚鏡の表面形状を10-6m単位で能動的に制御する補償光学手法の開発[3]、数kmの基線長にわたって直径10mのアンテナを50台以上連ね、分解能0.01秒角という驚くべき精度を狙う大型サブミリ波アレイ計画[4]、銀河系全域に分布するメーザー源を相対VLBIを使って測定し、10-5秒角の超高精度で星々の位置を確定しようという広域精測望遠鏡計画、ファブリペロ干渉計の基線を300mまで延長し、空間の歪みを10-21の相対精度で測定して超新星爆発などによる重力波の放出を検出しようとする重力波天文学の試み[5]、・・・ などなど、天文観測の限界精度は今もってまったく天井知らずの上昇を続けており、それに伴なって我々の目に見えて来る宇宙の姿は劇的に変化しつつある。つ い1970年代まではアナログデータの代名詞とも言える写真乾板を用いた定性的研究手法に支配されていた天文学も、こうした観測精度の圧倒的向上と共に、 文字通りの正確で定量的な先端的精密科学となって来たのである。
 このような精密観測の時代になって来ると、観測結果を物理的立場から理論的に説明することを目的とした数値実験についても、ますます大規模で高精度なも のが要求されるようになるのは必定である。PCのクロックが100MHzから200MHzになれば、天文学者は500MHzの仕様を要求する。Gbyte オーダのディスク容量が一般的になる頃、観測データの量はTbyteオーダに達している。計算機の処理能力に関して言えば、供給が需要に追い付く日は半永 久的に来ないと思われる。また一方、数値実験は観測事実を説明する手段のみとして用いられるものではない。観測精度が一方的に上昇するという状況の中で は、高精度の数値実験が茫漠とした宇宙空間の効率良い観測のための羅針盤にも成り得る。例えば、国立天文台がハワイ島山頂に建設中の大型光学赤外線望遠鏡 (通称「すばる」望遠鏡)の主鏡は8m以上もの直径を誇り、地球から遠ざかること150億光年の彼方の超高分解能観測を狙うものである。望遠鏡がこうした 深い宇宙の精密探査を狙ったものである場合、いくら有能だからと言って滅多やたらと望遠鏡を振り回したりしていては、あまりにも無駄が大きすぎる。実際の 観測を行う前に、宇宙のどこを見れば何が見え、どのような方法で見ればより効率が上がるのかをある程度予測して行くことが非常に重要になって来る。このた めの支援手段が計算機による数値実験であり、数値実験を効果的に活用することにより、大望遠鏡による観測の能率を飛躍的に高めることができると予想され る。
 我々はしばしば、数値実験やデータ解析を行うための計算機システムを実際の望遠鏡と比較して「理論天文学の望遠鏡」と呼ぶ。常に観測的研究が主導的立場 に立って来た天文学の現場、とりわけ現代のように高精度のデータが大量に蓄積されつつある状況に於いては、最先端の光学望遠鏡や電波望遠鏡に勝るとも劣ら ぬ能力を発揮することのできる理論の大望遠鏡が何としても必要なのである。本稿では、こうした事情を背景として今年から国立天文台に導入されたスーパーコ ンピュータVPP300/16Rとその周辺システム、運用方法などについて概観する。また、近い将来での導入が検討されている開発支援ツールVPP WorkBenchについても簡単に紹介したい(静岡エンジニアリング浅井登氏の資料を参照のこと)。


並列スーパーコンピュータ導入のねらい

 文部省国立天文台は東京大学東京天文台・名古屋大学空電研究所第三部門・緯度観測所を改組統合して発足した組織であり、日本の天文学研究に於いて中心的 な役割を果たすべく1988年に設立された研究機関である。1966年3月、東京天文台時代に初めて導入された計算機はOKITAC 5090Dであった。その後FACOM230-58, UNIVAC 1100-80B, FACOM 380Rを経て、昨年度まではFACOM M780/10Sが置かれていた。然るに、M780の1995年度の稼働率は平均30%を下回るものであった。このことはひとえに、当時のマシンの能力が 現代の天文学の要求を満たすものではなく、速度の面からも使い勝手の面からも普及型のワークステーションに及ばなくなってしまっていたという状況を如実に 指し示している。こうした事情、言ってみれば大型計算機の長期低落傾向が見え始めた数年前から、我々は大学共同利用研究機関としての国立天文台が保有する にふさわしい計算機システムについてについての検討を開始した。
 理論天文学の望遠鏡という役目を持つ計算機システムに要求される条件はいくつもあるが、その中で我々が最も重視したのは、計算速度よりもむしろ主記憶の 大きさである。天文学に於ける数値実験やデータ解析で最も重要になってくるのはとにかく大きな記憶領域であり、どこまで大きな配列を扱うことができるかに よって、その計算の能率や速度、更には結果の学術的意義までが決定されてしまう面すらある。小規模な計算ならば研究室のワークステーションを何箇月も連続 で動かしていれば良いし、その方が速いであろう。しかしながら、500×500×500個の格子数、あるいは200×200×200個の粒子数を擁する大 規模数値実験をたかだかο(100)Mbyteの主記憶しかないワークステーションで実行するのは現実的に不可能である。結果的にかなり主記憶に偏ったシ ステムを我々が要求するに及んだのは以上のような理由に因っている。平成6年7月20日に官報公示された我々の計算機調達招請には、国立天文台スーパーコ ンピュータシステムの満たすべき基本的要件が以下のように記載されている。(1)主記憶容量が8.5Gbyte以上、拡張記憶容量が12Gbyte以 上、(2)単一プロセッサの性能が1GFLOPS以上、システム全体の総合性能が10000×10000のLINPACKで15GFLOPS以上。日米貿 易摩擦の影響により、スーパーコンピュータという名称を冠した途端に計算機の買い物はややこしいものになる。けれども、天文学の健全な発展のためには何と しても理論天文学の大望遠鏡を作り上げることが必要であると判断し、我々は敢えてこうした「スーパー」な仕様を策定した。


システム概要

その後、1996年1月から富士通のスーパーコンピュータVPP300/16Rとその周辺システムが導入され、本年4月からは正式な共同利用が開始されることになった。現在の国立天文台の計算機システムの概要を紹介しておく(図1)。
 全体の中枢にはもちろん、スーパーコンピュータシステムVPP300/16R, VX/4R×3, VX/1Rが位置している。各PEに付帯する主記憶は2Gbyteずつなので、VX/4Rでは最大で8Gbyte、VPP300では最大32Gbyteの 主記憶領域を占有した数値実験が可能である。主記憶がこれだけ広大になって来ると磁気ディスクなどの補助記憶装置も大型化を余儀なくされ、総計で 200Gbyte以上の磁気ディスク装置と容量6TbyteのVHSテープライブラリ(ASAKA製)が備えられた。スーパーコンピュータシステム・磁気 ディスク・VHSテープライブラリは一般の研究室や居室とはまったく独立した電源系と空調系に包まれた地下計算機室に納められており、ユーザは 100MbpsのFDDIから構成されるネットワーク経由でこれら資産の恩恵に預かることになっている。
 国立天文台の以前のシステムや現在の他研究機関の大型計算機システムでは、夜間や週末になるとマシンを停止するサイトが多いようである。これは、ジョブ が少ない時間帯に計算機を動かすことによる電力の浪費を避け、同時に保守時間帯を限定するというふたつの目的を持っていると思われる。それに対して我々の 新しいシステムは24時間×365日の連続運転体制を取っており、ユーザは日没や週末や年末年始といった世間一般の慣習を気にせずに自分の仕事を走らせ続 けることができる。こうした連続運転は計算機を管理する側には大変な労力を要求するものであるが、利用者にしてみるといつでもどこでも思い立った時に計算 を開始することができることになるので、極めてユーザ思いの運用であると言えよう。
 スーパーコンピュータシステムでジョブを走らせるには、ジョブ管理用ソフトウェアNetwork Queuing System (NQS)を使用し、リモートのワークステーションからジョブをパイプキューに投入する方式を採っている。このための端末として富士通Sファミリのワーク ステーションが数十台用意されている。これらは主として天文台内の計算機端末室に配備され、スーパーコンピュータシステムと同様に24時間×365日の稼 働を続けており、ユーザは好きな時に立ち寄って好きなだけ仕事をこなすことができる。これに加え、入出力装置としての高速ネットワークプリンタ (RICOH LP7200×3台)、カラープリンタ(富士写真フィルム Pictrography 3000×2台)、8mmやDATなどの磁気テープ装置、CD-ROMドライブ、光磁気ディスクドライブなども多数整備され、考えられる限り大抵のI/O 要求には応じることができると考えられる。
 さて、今回我々が導入したシステムの目玉のひとつにSilicon Graphics社のハイエンドワークステーションPower ONYX (RealityEngine2) を中心とした画像処理・画像編集システムがある。我々は、このONYXに先端可視化システムAVS (Advanced Visualization System)をはじめとするメジャーな画像処理ソフトウェアをインストールし、また、Turbo CUBEなる高機能の画像編集装置をも導入し、通常の方法では可視化が困難な科学技術計算の結果を効率良くかつ美しくプレゼンテーションするためのシステ ムを整えた。これら各種の機器やソフトウェアについては折りを見て専門家を招聘し、少人数演習形式の講習会を開催することによりユーザに対する教育の一環 を形成している。後半で紹介する計算結果のうちのいくつかは、このPower ONYXとAVSの組み合わせで作成したものである。数値計算を手段とする研究に於いては、計算そのものの信頼性はもとより、いかに見やすく理解しやすい 形に計算結果を加工できるかが本質的に重要である。その意味で、これらの可視化システムはスーパーコンピュータ本体の存在価値を左右するものでさえあると 言うことができる。


運用概略

 国立大学の大型計算機センターなどとは異なり、国立天文台では伝統的に計算機システムの使用に関して課金を徴収していない。しかも従来は、利用申 請さえあれば誰でもがすべてのマシンを好きなだけ使用できる方式を取って来た。しかしながら、今回のスーパーコンピュータシステムの導入を契機に、本体で あるVPP300とVXの使用については利用申請→利用資格審査→利用時間枠決定という手続きを踏み、特定の研究グループに対して特定の利用時間枠を割り 振る方式を採用した。このような方法は、天文学とりわけ望遠鏡の利用時間割り当てに於いてまったく普遍的に行われているもので、申請書に記述された研究内 容の妥当性や意義、前年度までの実績などを鑑みて、管理者が任命した審査員が利用時間を割り振るのである。今年度前期は43課題の研究プロジェクトが採択 された(表1)。
 今回導入されたシステムのOSは、端末のワークステーションから本体のスーパーコンピュータに至るまですべてUNIX (UXP/V, Solaris, SunOS, IRIXなど)で統一されている。UNIXはもともと少人数の研究者が自分たちの内輪で使用することを前提として作られたOSであり、今回のような大人数 での資産共有に向いているものとは言い難い。そもそも、UNIXのデフォルトの機能ではユーザのジョブそれぞれに対してメモリやCPU時間の制限を加える ことができない。この問題については前述のNQSを導入することで解決した。ユーザがジョブを投入する場合には、そのジョブの大きさに見合ったジョブクラ スを利用することにより、メモリ量と最長実行時間の制御が行なわれるようになっている(表2,3,4)。 また、利用時間制に基づいた運用をする以上、各研究グループごとのPE既使用時間を定期的に検査するような機能は必須である。この点については、上述の NQSの内部にグループ毎のPE既使用時間総量を計算するルーチンを埋め込み、ユーザ毎のアカウンティング情報を一日一回検分することによって各研究グ ループごとのPE既使用時間の統計情報を産出し、利用時間制御の一助としている。以上のような機能は従来のメインフレームのOSであったMSPなどではデ フォルトで利用することができたのだが、ジョブ管理という概念に歴史的に馴染みの薄かったUNIXとしては元来あまり得意とする分野ではない。しかしなが ら、今後UNIXがますます普及するにつれてこのようなジョブ管理・グループ管理への需要はどんどん高まって行くはずであり、この方面での運用ツールの整 備が非常に望まれる状況にある。
 なお、システムがこれだけ大規模になると国立天文台の専任職員だけでサポートすることはまったく不可能であるため、富士通からのシステムエンジニア三人 が天文台に常駐し、トラブル対処やユーザ対応に当たっている。また、VPP Fortranでの並列化・ベクトル化プログラミングに関しては富士通HPC本部の専門技術員によるオンサイトサービスが毎週二回行われており、ユーザサ ポートの一環を形成している。


開発支援ツール

 本システムの売りは何と言ってもVPP Fortran/90を用いた大規模な並列プログラミングである。けれども、シリアルなスカラ計算に慣れてしまったユーザにとって並列プログラミングやそ のデバッグは非常に取り付きにくいものであらしく、ユーザの多くは従来のコードを並列化するのにかなりの労力を要しているようである。何よりも困難なのが 並列のデバッグであり、シリアルの場合とはまったく異るノウハウが要求されるため、最初は何をどうやったら良いのかがさっぱりわからず、途方に暮れるユー ザも数いるようである。また、ワークステーションで育った若い学生はベクトル計算の経験すらもなく、どこをどういじったらコードが高速化されるのかすら良 くわかっていない場合もある。このような状況のもとでは、どのようなユーザにも使えるわかりやすいインターフェイスを持った開発支援ツールが非常に望まれ ると言える。おそらく現在のユーザの中で最も便利に利用されている開発支援ツールは言わずと知れたwrite文であろう。便利に使えそうなツールは様々あ るものの、やはり最終的にはユーザ自らの手で write 文を挿入することによってコードの動きを実地で体験し、丁寧にデバッグとチューニングを行ってゆくのがもっとも確実だと思われるからである。
 そのような中で、富士通から提案されている統合開発環境VPP WorkBenchは、並列プログラム開発用としてはまだまだ機能が限定されているとは言うものの、往年のTURBO PascalやVisual Basicを彷彿とされる親しみ易さが漂っており、今後の展開次第ではユーザの需要を満たし得るツールとして期待できる。講演ではVPP WorkBenchの概要と特徴、できることとできないこと、今後の開発方針への要望などについて簡単に述べる。詳細については浅井登氏の資料を参照していただきたい。


おわりに

 世界認識の拡大を目指す自然科学の諸分野の中でも、天文学の目覚しい歩みの速度はまったく緩む気配がない。その中で、巨大な数値計算によって天文 学の新しい地平を切り拓こうとする我々の企ては、VPP300システムという強力な助っ人を得て何とか軌道に乗りつつある。けれども、スーパーコンピュー タを取り巻く今の状況は---おそらくはまだまだ上昇を続けるであろう計算機本体の能力の発達とはほとんど無関係に---明るい材料ばかりとは言えないで あろう。日本社会もようやく文化としての自然科学の重要性を認識したのか、ここ数年の科学研究費の伸びは昔に比べてかなり顕著になっており、研究者が高速 なマシンを自分の机の上でひとりじめにすることも容易になってきている。いくら 大型の数値実験が可能であると言っても、扱うデータ量が小さい場合にはワークステーションより遅く、ベクトル化ができない場合にもワークステーションより 遅く、並列計算しようと思ったらいやでもFORTRANに頼らなければならないスーパーコンピュータの現状を見れば、若い研究者や学生の多くは己の机上の マシンで閉じることのできる問題を数値計算のテーマに選ぶことであろう。自然科学業界のこうした状況を考えてみると、高額の導入予算を必要とするスーパー コンピュータが大型化・汎用化という現在の方向のままで21世紀を迎えた場合、劇的なコストダウンの戦略でも練らない限り非常に狭苦しい立場に追い込まれ ることは必至だと思われる。日米の貿易摩擦は簡単には解消せず、大型計算機導入の手続きは煩雑の一途を辿ることであろう。スカラ計算の分野では、広大で肥 沃な消費市場に支えられた量産廉価PCが次々とスーパーコンピュータを追い抜いて行くことであろう。当節、自然科学の発展に寄与し得る計算機が「スー パー」である必要が本当にあるのかどうかを真剣に考え直す時期が近づ いているのではなかろうか?しかしながら、計算機というものなしには自然科学の研究が一歩も進まないということもまた明白な事実だし、大型のベクトル並列 計算によってしか開拓することのできない分野が天文学には存在することも確かである。富士通をはじめとするメーカには、かつて一世を風靡した「スーパー」 という冠に拘らず、自然科学の展開に対して真に貢献できる計算機像について真摯に検討する姿勢を望みたい。
 1996年11月現在、様々なトラブルや予期せぬ事態を抱えながらも国立天文台のVPPシステム達は本格的な稼働を続けている。このシステムが輝かしい 学術的成果を次々と産み出す玉手箱となるのか、巨大な恐竜の如く絶滅の道を辿って終わるのか、我々(ユーザ・管理者・メーカ)の真剣勝負は今始まったばか りである。


参考文献

 [1] 伊藤孝士. 国立天文台VPP300システムの運用. FUJITSU, 47, 494-507, 1996.
[2]http://www.stsci.edu/public.html
[3]http://www.subaru.nao.ac.jp/
[4]http://www.nro.nao.ac.jp/LMSA/lmsa_j-euc.html
[5]http://tamago.mtk.nao.ac.jp/


「VPP Workbenchご紹介」 (株)富士通静岡エンジニアリング第二開発統括部 浅井 登

[目次] [質疑応答]