「RELION2のCentOSへの導入」の版間の差分

提供: Eospedia
移動: 案内検索
(新規作成)
 
 
(同じ利用者による、間の1版が非表示)
行1: 行1:
 +
''' この項目は書きかけです! '''
 +
 +
 +
=== CentOSのセットアップ ===
 +
CentOSは、世界的シェアの高い、Red Hat Enterprise Linux (RHEL)を販売するRedHat社により正式サポートされている、フリーのLinuxOSです。基本的な、機能などはRHELと大きな差はないため、サイエンス利用であれば、CentOSは安定したOSとして最適です。このほか、RHEL系の派生型としてScientific Linuxなどもあります。これは、フェルミ加速器研究所やCERNによって開発されています。詳しいインストールについては、「CentOS インストール」などで検索すると、たくさん見つけることができますので、ここでは割愛します。
 +
 +
* CentOS: https://www.centos.org
 +
* Scientific Linux: https://www.scientificlinux.org
 +
 +
以下、インストールモードは「デスクトップ」を指定してインストールした場合について解説します。
 +
 +
=== CUDAのインストール ===
 +
OSのインストールの後、まずCUDAが利用できる環境を整えます。まず、OSがグラフィクスボードを認識しているかを確認しましょう。コンソールより、以下のコマンドを実行します。
 +
 +
bash-$ lspci | grep -i nvidia
 +
02:00.0 VGA compatible controller: '''NVIDIA''' Corporation GP104 [GeForce GTX 1080] (rev a1)
 +
02:00.1 Audio device: '''NVIDIA''' Corporation GP104 High Definition Audio Controller (rev a1)
 +
03:00.0 VGA compatible controller: '''NVIDIA''' Corporation GP104 [GeForce GTX 1080] (rev a1)
 +
03:00.1 Audio device: '''NVIDIA''' Corporation GP104 High Definition Audio Controller (rev a1)
 +
 +
上記のように、値が返ってきて、正しいグラフィクスボードを認識しているかを確認します。この計算機では、グラフィクスボードを二枚搭載しているので、二つ表示されます。ここで、グラフィクスボードが認識されない場合は、ソケットにボードが刺さっているか?補助電源ケーブルが刺さっているか?などを確認してください。
 +
 +
次に、GUIの無効化と、nouveauの無効化を行ないます。CUDAのインストールには、グラフィクスボードドライバ周りのインストールも含まれますので、GUIを起動したまま行うと思わぬトラブルが発生することがあります。また、noueveauとは、コミュニティで開発されている汎用のグラフィクスドライバです。これは、CUDAをインストールする際に入る、Nvidia製ドライバと競合するため、無効化する必要があります。
 +
 +
GUIを無効化するためには、
 +
 +
 
=== CentOS7.3 (RHEL系)へのRELION2.0インストール ===
 
=== CentOS7.3 (RHEL系)へのRELION2.0インストール ===
 
現在,RELION2.0をCentOS7.3で利用する際に,CentOS7.3が持つパッケージのバグにより,MPIが正常に動作しない現象が発生する模様です.RELIONのベンチマークをコマンドラインで実行しようとすると,
 
現在,RELION2.0をCentOS7.3で利用する際に,CentOS7.3が持つパッケージのバグにより,MPIが正常に動作しない現象が発生する模様です.RELIONのベンチマークをコマンドラインで実行しようとすると,

2017年3月4日 (土) 00:33時点における最新版

この項目は書きかけです!


CentOSのセットアップ

CentOSは、世界的シェアの高い、Red Hat Enterprise Linux (RHEL)を販売するRedHat社により正式サポートされている、フリーのLinuxOSです。基本的な、機能などはRHELと大きな差はないため、サイエンス利用であれば、CentOSは安定したOSとして最適です。このほか、RHEL系の派生型としてScientific Linuxなどもあります。これは、フェルミ加速器研究所やCERNによって開発されています。詳しいインストールについては、「CentOS インストール」などで検索すると、たくさん見つけることができますので、ここでは割愛します。

以下、インストールモードは「デスクトップ」を指定してインストールした場合について解説します。

CUDAのインストール

OSのインストールの後、まずCUDAが利用できる環境を整えます。まず、OSがグラフィクスボードを認識しているかを確認しましょう。コンソールより、以下のコマンドを実行します。

bash-$ lspci | grep -i nvidia
02:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1080] (rev a1)
02:00.1 Audio device: NVIDIA Corporation GP104 High Definition Audio Controller (rev a1)
03:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1080] (rev a1)
03:00.1 Audio device: NVIDIA Corporation GP104 High Definition Audio Controller (rev a1)

上記のように、値が返ってきて、正しいグラフィクスボードを認識しているかを確認します。この計算機では、グラフィクスボードを二枚搭載しているので、二つ表示されます。ここで、グラフィクスボードが認識されない場合は、ソケットにボードが刺さっているか?補助電源ケーブルが刺さっているか?などを確認してください。

次に、GUIの無効化と、nouveauの無効化を行ないます。CUDAのインストールには、グラフィクスボードドライバ周りのインストールも含まれますので、GUIを起動したまま行うと思わぬトラブルが発生することがあります。また、noueveauとは、コミュニティで開発されている汎用のグラフィクスドライバです。これは、CUDAをインストールする際に入る、Nvidia製ドライバと競合するため、無効化する必要があります。

GUIを無効化するためには、


CentOS7.3 (RHEL系)へのRELION2.0インストール

現在,RELION2.0をCentOS7.3で利用する際に,CentOS7.3が持つパッケージのバグにより,MPIが正常に動作しない現象が発生する模様です.RELIONのベンチマークをコマンドラインで実行しようとすると,

localhost.localdomain.5517hfi_wait_for_device: The /dev/hfi1_0 device failed to appear after 15.0 seconds: Connection timed out

のエラーメッセージが出ます. https://bugzilla.redhat.com/show_bug.cgi?id=1408316

これは,libfabric1.3のバグによるものなので,libfabric1.4へアップグレードすることで回避できます. https://koji.fedoraproject.org/koji/buildinfo?buildID=814957 から,Fedora用のsrc.rpm(SRPM)を取得し,rpmbuildコマンドでリビルドすることで,インストール可能です.