運用概略

国立大学の大型計算機センターなどとは異なり,国立天文台では伝統的に計算機システムの使用に関して課金を徴収していない。しかも従来は,利用申請さえあれば誰でもがすべてのマシンを好きなだけ使用できる方式を取って来た。しかしながら,今回のスーパーコンピュータシステムの導入を契機に,本体であるVPP300とVXの使用については利用申請→利用資格審査→利用時間枠決定という手続きを踏み,特定の研究グループに対して特定の利用時間枠を割り振る方式を採用した。

このような方法は,天文学とりわけ望遠鏡の利用時間割り当てにおいてまったく普遍的に行われているもので,申請書に記述された研究内容の妥当性や意義,前年度までの実績などを鑑みて,管理者が任命した審査員が利用時間を割り振るのである。今年度前期は 43課題の研究プロジェクトが採択された(表-1)

今回導入されたシステムの OSは,端末のワークステーションから本体のスーパーコンピュータに至るまですべてUNIX(UXP/V,Solaris,SunOS,IRIXなど)で統一されている。

UNIXはもともと少人数の研究者が自分たちの内輪で使用することを前提として作られたOSであり,今回のような大人数での資産共有に向いているものとは言い難い。そもそも,UNIXのデフォルトの機能ではユーザのジョブそれぞれに対してメモリやCPU時間の制限を加えることができない。この問題については前述のNQSを導入することで解決した。

ユーザがジョブを投入する場合には,そのジョブの大きさに見合ったジョブクラスを利用することにより,メモリ量と最長実行時間の制御が行なわれるようになっている(表-234)。また,利用時間制に基づいた運用をする以上,各研究グループごとのPE既使用時間を定期的に検査するような機能は必須である。

この点については,NQSの内部にグループ毎のPE既使用時間総量を計算するルーチンを埋め込み,ユーザ毎のアカウンティング情報を一日一回検分することによって各研究グループごとのPE既使用時間の統計情報を産出し,利用時間制御の一助としている。

以上のような機能は従来のメインフレームのOSであったMSPなどではデフォルトで利用することができたのだが,ジョブ管理という概念に歴史的に馴染みの薄かったUNIXとしては元来あまり得意とする分野ではない。

しかしながら,今後UNIXがますます普及するにつれてこのようなジョブ管理・グループ管理への需要はどんどん高まって行くはずであり,この方面での運用ツールの整備が非常に望まれる状況にある。

なお,システムがこれだけ大規模になると国立天文台の専任職員だけでサポートすることはまったく不可能であるため,富士通からのシステムエンジニア三人が天文台に常駐し,トラブル対処やユーザ対応に当たっている。

また,VPP Fortranでの並列化・ベクトル化プログラミングに関しては富士通HPC本部の専門技術員によるオンサイトサービスが毎週二回行われており,ユーザサポートの一環を形成している。


もくじ あらまし 戻る 次に