メインコンテンツに移動
ホーム

Translate this page by: Google Weblio

  • ホーム
  • CfCAについて
    • プロジェクトの概要
    • 研究紹介
    • 計算機紹介
    • メンバー
  • はじめての方へ
  • ニュースレター
  • 共同利用計算機
    • 接続方法
    • XD2000
    • GPUクラスタ
    • PCC (計算サーバ)
    • 解析サーバ
    • ファイルサーバ
    • 宅配等によるデータ輸送
  • 利用方法
    • 利用規則
    • 利用者の責務等
      • 利用者の責務
      • 注意事項
      • 研究成果のプレスリリースについて
      • 謝辞について
      • 論文出版費用補助
    • 計算機利用開始までの流れ
    • 申請時期と利用期間
    • 申請フォーム置き場
    • 申請書ファイル置き場
    • 安全保障輸出管理
    • 個人情報の管理
  • 採択課題・成果報告
    • XD2000採択統計
    • 利用申請数と採択数
  • FAQ
  • 各種問い合わせ
  • 論文出版費用補助
  • 講習会・イベント
  • 交通アクセス
  • 委員会・審査委員
  • リンク

Main navigation

  • ホーム
  • CfCAについて
    • プロジェクトの概要
    • 研究紹介
    • 計算機紹介
    • メンバー
  • はじめての方へ
  • ニュースレター
  • 共同利用計算機
    • 接続方法
    • XD2000
    • GPUクラスタ
    • PCC (計算サーバ)
    • 解析サーバ
    • ファイルサーバ
    • 宅配等によるデータ輸送
  • 利用方法
    • 利用規則
    • 利用者の責務等
    • 計算機利用開始までの流れ
    • 申請時期と利用期間
    • 申請フォーム置き場
    • 申請書ファイル置き場
    • 安全保障輸出管理
    • 個人情報の管理
  • 採択課題・成果報告
    • XD2000採択統計
    • 利用申請数と採択数
  • FAQ
  • 各種問い合わせ
  • 論文出版費用補助
  • 講習会・イベント
  • 交通アクセス
  • 委員会・審査委員
  • リンク

Main navigation

  • ホーム
  • CfCAについて
    • プロジェクトの概要
    • 研究紹介
    • 計算機紹介
    • メンバー
  • はじめての方へ
  • ニュースレター
  • 共同利用計算機
    • 接続方法
    • XD2000
    • GPUクラスタ
    • PCC (計算サーバ)
    • 解析サーバ
    • ファイルサーバ
    • 宅配等によるデータ輸送
  • 利用方法
    • 利用規則
    • 利用者の責務等
      • 利用者の責務
      • 注意事項
      • 研究成果のプレスリリースについて
      • 謝辞について
      • 論文出版費用補助
    • 計算機利用開始までの流れ
    • 申請時期と利用期間
    • 申請フォーム置き場
    • 申請書ファイル置き場
    • 安全保障輸出管理
    • 個人情報の管理
  • 採択課題・成果報告
    • XD2000採択統計
    • 利用申請数と採択数
  • FAQ
  • 各種問い合わせ
  • 論文出版費用補助
  • 講習会・イベント
  • 交通アクセス
  • 委員会・審査委員
  • リンク

ログインはこちら

Enter your email address or username.
Enter the password that accompanies your email address.
  • アカウントの作成
  • パスワードを再設定

ページ送り

  • 前へ
  • 8月 2025
  • 次へ
日 月 火 水 木 金 土
27
 
28
 
29
 
30
 
31
 
1
 
2
 
3
 
4
 
5
 
6
 
7
 
8
 
9
 
10
 
11
 
12
 
13
 
14
 
15
 
16
 
17
 
18
 
19
 
20
 
21
 
22
 
23
 
24
 
25
 
26
 
27
 
28
 
29
 
30
 
31
 
1
 
2
 
3
 
4
 
5
 
6
 

ページ送り

  • 前へ
  • 次へ


ゲストさん、ようこそ。 ログインはこちら / アカウント作成はこちら。

Intel VTuneプロファイラを使ったメモリ使用量の測定法

以下に示すのは,実行バイナリの名前を./a.outとした場合の例です。
適宜「./a.out」を自分の実行バイナリ名に置き換えてください。

ここではアプリケーションの性能概略を測定するapsコマンドを紹介します。

  • Intel oneAPI環境をロード
  • $ source /work/opt/local/bin/enable-oneapi.sh
  • ソースコードをコンパイル
  • 再コンパイルする際は最適化オプションを外すことが推奨されています。

    $ mpiicpx sample.cpp

    プログラムがC言語の場合は mpiipc,Fortranの場合はC言語の場合は mpiifxを使います。

  • ジョブを投入
  • ジョブスクリプトにおいて, srun ./a.outとするところを,以下のように書き換える。

    $ srun aps --result-dir=./results -- ./a.out

    上記は,プロファイル結果をカレントディレクトリ下の resultsに出力する場合の例です。適宜ディレクトリ名を変更してください。

  • プロファイリング結果を取得
  • $ aps-report --all ./results > profile.out

    上記は,プロファイル結果をカレントディレクトリ下の resultsに出力する場合の例です。適宜ディレクトリ名を変更してください。上記コマンドを実行するとプロファイル結果が標準出力されるので, report.outへリダイレクトしています。

  • 結果の確認
  • report.outから実メモリの使用状況を抜粋すると以下のようになります。以下の例は,格子数512^3のメッシュ法を使って64並列(1ノード)で計算して得たレポートです。レポートの末尾あたりに,メモリ使用量(全メモリ使用量およびランク当たりの最大値・最小値,ノード当たりの最大値・最小値)が記載されています。この計算では全プロセスでの合計のメモリ使用量がおよそ80GBであることがわかります。システムMのノードに搭載されたメモリ量(128GB)を下回りますので,システムMの1ノードでの計算が可能と判断できます。

    格子幅を半分にする場合は,メモリ使用量がおおよそ2^3倍(640GB)となり,システムMの1ノードでは計算を実行できなくなります。その場合は以下の選択肢をご検討ください。

    • システムMを8ノード利用する(1ノード当たり64並列の場合。カテゴリAへの申請が必要)。
    • システムPを2ノード利用する(1ノード当たり64並列の場合)。
        
    | Resident Memory Usage per Rank, MB
                Total:         80679.00  (all ranks)
                  MIN:          1247.00  (Rank 0)
                  MAX:          1268.00  (Rank 48)
                  AVG:          1260.61
    
    | Resident Memory Usage per Node, MB
                Total:         80679.00  (all nodes)
                  MIN:         80679.00  (Node cna091)
                  MAX:         80679.00  (Node cna091)
                  AVG:         80679.00
        
        

GitHub

X

Youtube

RSS feed

OFFICIAL

© 2006 Center for Computational Astrophysics, NAOJ

Powered by Drupal