RELION2のCentOSへの導入

提供: Eospedia
2017年3月4日 (土) 00:16時点におけるShinji (トーク | 投稿記録)による版

移動: 案内検索

テンプレート:Inuse

CentOSのセットアップ

CentOSは、世界的シェアの高い、Red Hat Enterprise Linux (RHEL)を販売するRedHat社により正式サポートされている、フリーのLinuxOSです。基本的な、機能などはRHELと大きな差はないため、サイエンス利用であれば、CentOSは安定したOSとして最適です。このほか、RHEL系の派生型としてScientific Linuxなどもあります。これは、フェルミ加速器研究所やCERNによって開発されています。詳しいインストールについては、「CentOS インストール」などで検索すると、たくさん見つけることができますので、ここでは割愛します。

以下、インストールモードは「デスクトップ」を指定してインストールした場合について解説します。

CUDAのインストール

OSのインストールの後、まずCUDAが利用できる環境を整えます。まず、OSがグラフィクスボードを認識しているかを確認しましょう。コンソールより、以下のコマンドを実行します。

bash-$ lspci | grep -i nvidia
02:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1080] (rev a1)
02:00.1 Audio device: NVIDIA Corporation GP104 High Definition Audio Controller (rev a1)
03:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1080] (rev a1)
03:00.1 Audio device: NVIDIA Corporation GP104 High Definition Audio Controller (rev a1)

上記のように、値が返ってきて、正しいグラフィクスボードを認識しているかを確認します。この計算機では、グラフィクスボードを二枚搭載しているので、二つ表示されます。ここで、グラフィクスボードが認識されない場合は、ソケットにボードが刺さっているか?補助電源ケーブルが刺さっているか?などを確認してください。

CentOS7.3 (RHEL系)へのRELION2.0インストール

現在,RELION2.0をCentOS7.3で利用する際に,CentOS7.3が持つパッケージのバグにより,MPIが正常に動作しない現象が発生する模様です.RELIONのベンチマークをコマンドラインで実行しようとすると,

localhost.localdomain.5517hfi_wait_for_device: The /dev/hfi1_0 device failed to appear after 15.0 seconds: Connection timed out

のエラーメッセージが出ます. https://bugzilla.redhat.com/show_bug.cgi?id=1408316

これは,libfabric1.3のバグによるものなので,libfabric1.4へアップグレードすることで回避できます. https://koji.fedoraproject.org/koji/buildinfo?buildID=814957 から,Fedora用のsrc.rpm(SRPM)を取得し,rpmbuildコマンドでリビルドすることで,インストール可能です.