November 10, 2004

AMD Opteron による大規模解析(その2

 

 以前アミュレット(株)殿より販売されているAMD Opteron機を借用して大規模解析を行いましたが、搭載メモリの関係から、目標とする1,000万要素の計算を行うことはできませんでした。今回メモリ搭載量を最大の12GBとして再び借用する機会を頂けましたので、ベンチマークテストを行いました。本機は、前回同様Linux上で64Bit アーキテクチュアを実現し、4Gbyte以上のメモリを使用することができます。

テスト機の仕様は以下のようになっています。


CPU             AMD Opteron Model 242( 1.6GHz) * 2 [2CPU]

メモリ     1 GB PC2700 (DDR333)Registord ECC DIMM 12Gbyte + Swap 20GB

OS               Turbolinux 8 for AMD64


* 搭載メモリは本機で搭載できる最大の12Gbyte、テストは全て 2CPU で行いました。


簡単な静磁場解析問題で、どの程度の大きさまでの解析が可能か調べてみました。今回はメモリが
12Gbyte搭載しているので、より大きなモデルの解析を行うことができました。その結果、最大1,0076面体要素の解析が可能であることを確認しました。解析モデルとして、前回使用した図1-1のモデルを、Z方向にアスペクト比10とした図1-2のような直方体に一様磁場を加えた場合の静磁場解析を、分割を変更して行いました。

 

1-1 Mesh Model100*100*100メッシュ)

アスペクト比1

 

1-2 Mesh Model100*100*100メッシュ)

アスペクト比10、緑矢印は一様磁場方向を表す

 

2に要素数とCPU時間の関係を,表1にその数値を示します。Pentium4 2.53GHz, Windows XP, 2Gbyte Memoryとの比較を示します。Pentium4 2.53 GHzとほぼ同速度でありますが、Pentiumではメモリが2GBであるため、使用するメモリが多くなるとOpteronの方が多少速いという結果になりました。これは、仮想メモリを使用している為だと思われます。

 

2 計算時間

 

 

1 計算時間

 

要素数

Pentium 4 2.53GHz

AMD Opteron 1.6Hz

time(min)

time(min)

time(hr)

125,000

1.72

 

 

216,000

3.09

 

 

512,000

7.36

6.69

0.111

1,000,000

19.95

13.86

0.231

1,331,000

26.08

 

 

2,744,000

 

46.91

0.782

5,451,776

 

114.64

1.911

6,859,000

 

157.53

2.625

8,000,000

 

189.47

3.158

10,077,696

 

255.84

4.264

 


使用メモリ量は図3のようになっています。同じ計算でPentium機より多くのメモリを要しているのは、プログラムの中でポインターが32Bitより64Bitに大きくなり、それを格納するメモリ量が増えたためです。1,000万要素で約16Gbyteのメモリを要します。

 

3 使用メモリ


本機の搭載メモリが2CPU12Gbyteですので、使用メモリが搭載メモリを超過しており、実行時にページングを起こします。この結果、実行実時間は図4のように長くなります。ただし、使用メモリが搭載メモリの1.5倍程度まではあまり速度の低下は見られませんでした。それ以上になると、急激に実行実時間が大きくなり、実用的では無くなります。しかし、Opteronでは最大12Gbyteのメモリを搭載すれば、1,000万要素の解析ができることを確認しました。

      

4 CPU時間と実行実時間

 

本機で 12Gbyteのメモリを搭載すれば、1,000万要素(6面体)の解析ができることを確認しました。ただ、このベンチマークは線形静磁場の最も簡単な場合です。また、前回の解析では、2CPU時ではメモリの競合が起きているように思われましたが、今回はその傾向はなく正常に動作しました。

 

これからさらに64Bit機のニーズが増えていくものと思われます。私共としてもフォローしていくためにもベンチマークテストを行っていきたいと考えておりますので,新規購入,64Bit機へのアップデートをお考えであれば,ぜひテストをさせて頂きたいと思っております。

 

さらに、32Bit機においても同様の調査を行いました。線形・非線形解析共に調べましたので、こちらをご参照ください。