|
2005年10月11日 |
|||||||||||||||||||||||||||||||
|
CPUのうちの1つを計算用,他を通信用に使用するモードをコプロセッサモード,2つとも計算兼通信に用いるモードを仮想ノードモードと呼びます。コプロセッサモードでは,理論上は 1つの CPU に対して 2重の FPU が作動する場合が最大性能で,2×2×700MHz = 2.8 GFLOPS,仮想ノードモードではこの倍の5.6 GFLOPSがピーク性能になります。1024ノードで,ピーク性能は5.6 TFLOPSです。70 TFLOPSを出した TOP500 のベンチマークでは 16筐体が結ばれたもの (ピーク性能 89.6 TFLOPS) が用いられました。2005 年 6月現在のパフォーマンスは,32 筐体のシステムによる 136 TFLOPS です。 当社では,1筐体からなる Blue Gene を用いて ADVENTURECluster のベンチマークを行いました。仮想ノードモードは,OS のバージョンの関係で用いませんでした。 ADVENTURECluster は非常に良くスケールし,小さな問題でも 1024ノード (1024CPU) で走ります。ここでは実用モデルとしては大きい,9000万自由度の機械部品の弾性解析の結果について述べます。 ADVENTUREClusterの解析アルゴリズムには CGCG 法と,これを強化した CGCG2 というオプションがあります。つぎはこれらのオプションを設定した結果です。9000万自由度という大きな問題がわずか 6〜7 分で解けたことになります。
本解析では,入力が計約 2GB,出力が合計約 11GB の入出力を行っています。出力は各ノードから同時に行っており (各MPIプロセス,つまり各 1024 プロセスが同時に出力命令を出す),ファイルシステムの安定性は高いです。本計算例では I/O の割合が大きいですが,単純な弾性解析で計算負荷が低いためで,CPU 数が多いことを考えると実用的な性能としては十分なものといえます。 並列コンピュータには,従来型の SMP マシン,普及が始まったPCクラスタ,地球シミュレータのようなベクトル型並列機などがありますが,Blue Gene のような専用マシンも出現し,すでに実用レベルになっています。 |
postmaster@alde.co.jp
までお願いします。 |
|||||||||||||||||||||||||||||
|
解析事例に戻る
(C) 2001-2012 Allied Engineering Corporation. All rights reserved. |
|||||||||||||||||||||||||||||||