https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/api.php?action=feedcontributions&user=Nakamu&feedformat=atom
Eospedia - 利用者の投稿記録 [ja]
2024-03-28T23:20:12Z
利用者の投稿記録
MediaWiki 1.23.6
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION3%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELION3チュートリアル
2019-02-10T14:52:49Z
<p>Nakamu: /* High-resolution 3D refinement(三次元精密化) */</p>
<hr />
<div>'''RELION3'''<br />
<br />
==1 前処理==<br />
<br />
===1.1 解析の準備===<br />
私たちはプロジェクトごとに、すなわち構造解析したいものごとに一つのディレクトリを作成することをお勧めします。これをプロジェクトディレクトリと呼びます。'''プロジェクトディレクトリからRELION GUIを毎回起動することは重要です。'''プロジェクトディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式かTIFF形式で保存するための別のディレクトリを作成してください。もしすべての動画が一つのディレクトリにある場合には、このディレクトリをMovies/とした方が好ましいでしょう。また、異なるディレクトリにある場合(例えば、違う日に集めたもの)には、Movies/15jan16またはMovies/23jan16とするといいでしょう。もし何か理由があり、RELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成することができます。<br />
<br />
単一画像の顕微鏡写真にはmrc拡張子を、動画にはmrc、mrcs、tiff拡張子をつけることができます。チュートリアルのデータを解凍したとき、プロジェクトディレクトリ(Movies/)は作成されています。このディレクトリは、TIFF形式に圧縮された24つの動画、gain.mrc、実験の情報を含んだNOTESファイルが含まれています。<br />
<br />
RELIONを起動してみましょう。前述のように、RELIONは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。その為、新しいディレクトリで初めてRELIONを起動するときは、バックグラウンドで起動するための&の文字を使うべきではありません。プロジェクトディレクトリの中にいることを確認し、入力でRELIONを起動します。<br />
<br />
relion <br />
<br />
そして新しいRELIONプロジェクトを作動するために“y“と答えます。<br />
最初にすることとして、パイプラインの中に録画した顕微鏡動画の取り込みを行います。<br />
job-typeブラウザから”Import”を選択し、以下のパラメータを埋めます。<br />
<br />
●Input files: Movies/*.tiff <br />
●Node type: 2D micrograph movies <br />
<br />
これを行うことで、Current job: Give_alias_hereという空欄に効果的なaliasを規定すrことができます。[Run now!]ボタンをクリックし、job起動します。Import/job001というディレクトリが作成され、Import/moviesというこのディレクトリへのシンボリックリンクが一緒に作成されます。STARファイルとすべての動画が新しいディレクトリの中に作成されます。中を見てみましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし違うソフトウェアで粒子を抽出した場合は、後述の事前処理を行う代わりに、STARファイルや3次元レファレンス、3次元マスクなどを取り込むために“Import”job-typeを使用してください。これについてはRELIONを使用する際の責任は取りません。また、ユーザーは正しいSTARファイルの生成に責任を取ってください。<br />
<br />
===1.2 電子線により誘起される画像の動きの補正===<br />
Motion correction job-typeは便利な全体フレーム動画の調整のためのUCSF MOTIONCOR2[21]ラッパーを規定します。あるいは、バージョン3.0以降はMOTIONCOR2と同じアルゴリズムであるRELION独自の実装を使用することもできます。RELION独自の実装はCPU でのみの実行となるので注意してください。[I/O]タブで設定をします。<br />
<br />
●Input movies STAR file: Import/movies/movies.star<br />
([Browse]ボタンで参照できるファイルは、STAR形式の動画ファイ <br />
ルのみです。)<br />
●First frame for corrected sum: 1<br />
●Last frame for corrected sum: 0<br />
(これはすべての動画フレームに使用する際の結果です。)<br />
●Pixel size(A) 0.885<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
●Do dose-weighting? Yes<br />
●Save non-dose-weighted as well? No<br />
(いくつかの非用量加重顕微鏡写真にはCTF推定を行う方がよいで <br />
しょう。ディスク容量を節約するために、データが非常に良いの <br />
でこのオプションは使用しません。)<br />
<br />
[Motioncor2]タブは以下のように入力します。<br />
●Bfactor: 150<br />
(超高解像度動画ではより大きい価値を使用します。)<br />
●Number of patches X,Y 5 5<br />
●Group frames: 1<br />
●Binning factor: 1<br />
(超高解像度動画ではたいてい2を使用します。)<br />
●Gain-reference image: Movies/gain.mrc<br />
(これは、オンザフライでのgain-reference補正用のgain- <br />
referenceファイルを規定するために使用できます。これらの動 <br />
画はまだgain補正されていないので、この場合には必要です。)<br />
●Defect file:<br />
(これは検出器上の壊れたピクセルを隠すために使用することがで <br />
きます。)<br />
●Gain rotation: No rotation (0)<br />
●Gain flip: No flipping (0)<br />
(gain-reference画像はこのデータセットのために既に補正されて <br />
います。)<br />
●Use RELION’s own implementation? Yes<br />
(これによって、UCSF実装をインストールする必要性が少なくなり <br />
ます。どちらにせよ、UCSFプログラムをインストールしている場 <br />
合は、それを使用することもできます。その場合、以下のオプシ <br />
ョンも入力する必要があります。)<br />
<br />
[Running]タブは以下のように入力します。<br />
●Do dose-weighing? Yes<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
<br />
このプログラムの実行には手頃な12スレッドの最新機器を用いればおおよそ5分かかります。MOTIONCOR2アルゴリズムのRELION独自の実装はGPUでは使用しないことに注意してください。しかしそれはマルチスレッドです。各スレッドは独立して動画フレーム場で動作するので、動画フレームの数をスレッドの数で割った数が整数になるように、いくつかのスレッドを使用することが最適です。これらの動画は24フレームあるので、12スレッドを使用すると各スレッドで2フレームが処理されます。[Run now!]ボタンの下の[Display:]ボタンからout:logfile.pdfを選択することで、推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで、値が合計された顕微鏡写真を見ることができます。スクリーンサイズに依存して、見やすいように、顕微鏡写真(Scale:0.3)を縮小し、Sigma contrast:3を使い、見やすい数のコラム(例として、Number of columns:3)にするべきです。[Display:]ボタンから表示したときから顕微鏡写真は選択できないことに注意してください。もし、取り除きたい顕微鏡写真がある場合(今回はすべていい画像なので削除しないだろうが)は[Subset selection]job-typeが使用できます。<br />
<br />
===1.3 CTF推定===<br />
次に、それぞれ補正した顕微鏡写真からCTFの値を推定します。速度の為Kai ZhangのGCTFのためのラッパーとして[CTF estimation]job-typeにします。適切なGPUがない場合、Alexis RohouとNiko GrigoreffのCTFFIND4.1を使用することができます。[I/O]タブで、[Motion correction]jobのcorrected_micrographs.starファイルを選択するために[Browse]ボタンを使用します。また、他のタブは以下のように入力します。<br />
<br />
I/Oタブにおいて<br />
●Use micrograph without dose-weighting? No<br />
(これらは重み付けされたものよりも良いThon ringsを持っているが、書き出さないことを前のステップで決めました。)<br />
●Sperical aberration (mm): 1.4<br />
(顕微鏡メーカーがこの値を提供してくれています。)<br />
●Voltage (kV): 200<br />
●Amplitude contrast: 0.1<br />
(強度コントラストはほとんどないことが知られていますが、約10%の値を与えることで、多くの構造の結果がよくなることが示されています。これは低周波数の弱い散乱がモデル化されていないからです。)<br />
●Magnified pixel size (A): 0.885<br />
(これらはピクセルサイズ0.885Aのもとの動画です。)<br />
●Amount of astigmatism (A): 100<br />
(範囲が適切に調整されていれば、この値は多くのデータセットに適しています。)<br />
<br />
Searchesタブにおいて、CIFFINDの一般的な値を設定します(正確な意味については、Nikoのドキュメンテーションを参照してください)。これらの設定は、GCTFを使用する場合には無視してください(デフォルトで、これをオフに切り替えることができるが)。<br />
●FFT box size (pix): 512<br />
●Minimum resolution (A): 30<br />
●Maximum resolution (A): 7.1<br />
●Minimum defocus cvalue (A): 5000<br />
●Maximum defocus cvalue (A):50000<br />
●Defocus step size (A): 500<br />
●Amount of astigmatism (A): 100<br />
●Estimate phase shifts No<br />
(これはphase-plateデータだけに役に立つ)<br />
GCTFを使用する場合はCTFFIND-4.1タブを無視してください。逆にGCTFを使用しない場合はCTFFIND-4.1タブウィ使用してください。今回の例として、GCTFを使用し、Getfタブを設定します。<br />
●Use Gctf instead? Yes<br />
●Gctf executable: /wherever/it/is/Gctf<br />
(環境変数である$RELION_CTFFIND_EXECUTABLEと$RELION_GCTF_EXECUTABLEは対応するプログラムのGUIエントリのデフォルト値を制御するために使用されます。)<br />
●Ignore ‘Searches’ parameters? Yes<br />
(GCTFにSearchesタブのパラメーターを渡すにはこれを’No’に設定します。デフォルトでは、これらの値は無視され、GCTF独自のデフォルトが使用されます。)<br />
●Perform equi-phase averaging? Yes<br />
(これによりThon ringのSNRが向上します。)<br />
●Other Gctf options:<br />
●Which GPUs to use: 0<br />
(この小さいデータセットには1GPUで十分でしょう。)<br />
<br />
マシンに応じて、複数のMPI処理を使用してプログラムを実行することができます。1プロセッサーとGPUのみを使用すると、動作はGCTFを使用すると31秒かかります。いったん動作が終わると、出力のCtfFind/job003/Moviesという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFINDを使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
Display:ボタンを使用してout:micrographs_ctf.starを選択すると、すべてのThon ring画像を見ることができます。実験の画像のThon rings間の0はモデルの0と一致するはずです。デフォーカス、最高分解能や性能指数などの順番の表示を並べ替えることができます。log.pdfファイルにはすべての顕微鏡写真に対する、デフォーカス、非点収差、推定解像度などの有用なパラメータのプロットとデータセット全体のヒストグラムが含まれています。データ収集における問題点を見つけ出すのに役に立ちます。<br />
もしCTFモデルが実験のThon ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除して、Finished jobsリストからCtfFind/job003を選択し、parameter-panel の値を修正し、Continue nowボタンをクリックすることでjobを再実行することができます。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できないまたは、不十分なThon ringがあり顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
===1.4手動粒子抽出===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の「粒子座標」を手動で選択して使用します。自分たちのデータをより理解できるように少なくとも複数の顕微鏡写真を選択するのがよいでしょう。選択した粒子を使用して、参照なしの2Dクラス平均を計算し、その後、これらの粒子は全データセットの粒子を自動検出するためのテンプレートになります。しかしRELION3.0以降は、Laplacian-of-Gaussian(LoG)フィルターに基づく参照なしの自動抽出手順が含まれています。これまでにテストされたほとんどの場合、この手順は適切な開始座標を提供してくれるので、Manual pickingステップは飛ばすことができます。relion_it.pyスクリプトはこの機能を使用して、完全に自動化されたオンザフライ処理を実行します。このチュートリアルでは、説明のためにManual picking jobを起動し、その後LoGベースのAuto-pickingを継続して最初の粒子セットを細分化します。<br />
手動粒子検出は経験あるのみです!RELIONで手動で粒子の検出をするのが好きでなければ、Jude ShortのXIMDISP[17](任意の拡張子付きで)、XMIPP-2.4[16](任意の拡張子付きで)、Steven LudtkeのE2BOXER.PY[18](.boxの拡張子付きで)の座標形式ファイルもサポートしています。もしこれらを使用する場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存してください。そして、同じ顕微鏡写真のルートネームは異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMovies/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Input Files:の欄に整理されたファイルのsuffix拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例だと、それぞれMovies/*.boxやMovies/*_pick.starになります。<br />
Manual picking jobタイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBrowseボタンを使用して、Colorsタブは無視して、Displayタブは下のように入力します。<br />
●Prticle diameter (A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
●Scale for micrographs: 0.25<br />
(これは画面サイズによります。)<br />
●Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。黒が標準偏差の3倍低く、白が標準偏差の3倍高くなります。グレースケールは黒から白へ直線的に変化します。詳細はDisplayImages entry on the RELION wikiを参照してください。)<br />
●White value: 0<br />
(どの値を白にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Black value: 0<br />
(どの値を黒にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Lowpass filter (A):20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくするための動作です。)<br />
●Highpass filter (A): 0<br />
(これは顕微鏡写真上の濃淡のグラデーションを取り除くのに役立ちます。)<br />
●Pixel size: 0.885<br />
(これは粒子の直径や、low-pass filterとhigh-pass filterの計算に必要です。)<br />
●Scale for CTF image:1<br />
(これは単にそれぞれの顕微鏡写真のCTFボタンをクリックしたときにThon ring画像がどれくらい大きくなるのか調節します。)<br />
Run now!ボタンをクリックすることでjobが実行され、必要に応じていくつかの粒子をクリックしてください。しかし、次のセクションではLoGベースの自動抽出を使用するので、必要でなければ選ぶことはありません。最初の[2D classification] jobに手動抽出した粒子を使用する場合は、適切なクラス平均を計算するために約500~1000個の粒子が必要になります。左クリックで選択、中クリックで選択された粒子の削除、右クリックで座標を保存する必要があるポップアップメニューが表示されます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでもメニューから保存した座標のSTARファイルに戻ることができます(ポップアップメニューの座標を使用してSTARファイルを保存した場合)。<br />
<br />
===1.5 LoGベース自動選択===<br />
今回は、Laplacian-of-Gaussian(Log)フィルタに基づくテンプレートフリーの自動抽出の手順を使用して、最初の粒子セットを選択して下さい。その後、それらの粒子は[2D classification]jobで使用され、2番目の[Auto-picking]jobのテンプレートが生成されます。初期段階では多くの粒子を必要としないので、最初の3枚の顕微鏡写真に対してのみLoGべーすの自動抽出を実行します。一般的に、可能な限り良いテンプレートを得るために、おそらく使用可能なすべての顕微鏡写真に対してLoGベースの抽出を実行します。しかし、今回はこのチュートリアルの計算速度を上げるためにいくつかの顕微鏡写真のみを使用します。<br />
最初にいくつかの顕微鏡写真を選択するために、[Subset selection]jobに移動し、I/Oタブで下を除くすべての空欄をままにします。<br />
●OR select from picked cords: ManualPick/job004/cords_suffix_manualpick.star<br />
(手動抽出で座標を保存したときに生成されます。今回は座標を使用するつもりはなく、顕微鏡写真のサブセットセレクションを行うためにそのjobを使用しているだけです。)<br />
<br />
このjobにはalias 5micsを使用しました。Run!ボタンを押し、[Manual picking]jobと同じポップアップウィンドウを再び押すと、すべてのpickとCTFボタンが表示されます。‘File’メニューを使用して‘Invert selection’:最初の5枚の顕微鏡写真の前にあるチェックボックスをクリックして選択します。その後、‘File’メニューを再び使用して‘Save selection’を選択します。これで、ManualPick/job004/micrographs_selected.starというファイルができ、これを下記の[Auto-picking]jobに使用します。<br />
その後、[Auto-picking]jobを処理し、I/Oタブの設定を行います。<br />
<br />
●Input micrographs for autopick: Select/job005/micrographs_selected.star<br />
●Pixels size in micrographs (A) -1<br />
(ピクセルサイズは入力STARファイルの中の情報から自動的に設定されます。)<br />
●2D references:<br />
(テンプレートフリーのLoGベースの自動抽出では空欄のままにします。)<br />
●OR: provides a 3D reference? No<br />
●OR: use Laplacian-of-Gaussian? Yes<br />
<br />
Laplacianタブの設定をします。<br />
●Min. diameter for loG filter (A) 150<br />
●Max. diameter for loG filter (A) 180<br />
(これは粒子投影のオングストロームの最小最大のサイズに対応します。)<br />
●Are the particles white? No<br />
(黒です。)<br />
●Maximum resolution to consider 20<br />
(ここはデフォルト値のままでいいです。)<br />
●Adjust default threshold 0<br />
(正の値、すなわち閾値はより少ない粒子を選び、負の値もより少ない粒子を選んでください。有用な値は、おそらく[-1,1]の範囲ですが、多くの場合デフォルト値の0は正しい働きをします。)<br />
<br />
Referencesタブは無視して、autopickingタブの最初の四つのオプションは無視してください。下記のように設定してください。<br />
●Write FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Read FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Shrink factor: 0<br />
(縮小を0に設定すると、自動抽出プログラムは参照上のローパスフィルタの解像度に合わせて顕微鏡写真を縮小します。これはすごく早くなり、必要なメモリが少なくなるため、このチュートリアルを素早く実行するのに便利になります。0と1の間の値は顕微鏡写真のサイズの少数で表されるでしょう。これは縮小で1を使用するよりも正確な抽出が少なくなること、つまり縮小がないことに注意してください。この新しいパラメータの詳細は、次のサブセクションで説明します。)<br />
●Use GPU acceleration? No<br />
(計算速度がとても速いので、LoGベースの自動抽出はGPU加速されていません。)<br />
●Which GPUs to use:<br />
<br />
Helixタブを無視して、Running tabで単一MPIプロセッサを使用して実行します。もしかするとLoG_basedのようなaliasが有用かもしれません。単一プロセッサを使用すると、これらの計算は、私たちのコンピュータでは約40秒かかります。<br />
Display:ボタンのcoords_suffix_autopickオプションをクリックすることで結果をチェックすることができます。この段階で表示されるポップアップウィンドウで手動で粒子を追加/削除できます。さらに、autopickingタブのノイズの標準偏差と平均のパラメータやLaplacianタブのデフォルトの閾値の調節をしている間、新しいjobを実行して、より多くの、またはより少ない粒子を抽出することができます。しかし、この段階では、単に2回目のauto-picking jobのテンプレート作成のための最初の粒子セットなので、多くの場合これは必要ないでしょう。<br />
<br />
<br />
<br />
<br />
==2 Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。 <br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。 <br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
<br />
===2.1 Running the job(動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他のオプションは、前述の自動検出のテンプレートを作成した時と同じです。 <br />
●Input images STAR file: Select/after_sorting/particle.star<br />
【Optimisation(最適化)】タブを次の通りにセットします。 <br />
●Number of class: 100<br />
(今、たくさんの粒子を持っています。)<br />
After_sortingのようなエイリアスを用いると、20分ほどで終わります。<br />
動作が終了したら、_model.starファイルを選択して【Subset selection】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度のゴーストのように見える【Einstein-from-noise】クラスに気を付けてください。こうしたクラスの選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。 <br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている外れ画像を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。 <br />
す <br />
===2.2 Analysing the results in more detail(より詳細な結果の分析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。 2D クラス平均算出の最終反復時では、以下のファイルが作成されます。 <br />
● Class2D/after_sorting/run_it025_classes.mrcs <br />
これは、クラス平均結果をMRCスタックとして保存しています。これらはメインGUIのDisplay: ボタンから _model.star を選択したときに表示される画像です。RELION は GUIから選択した場合、(GUIを選択した場合)、クラス平均はおそらく黒い背景が白くなるだろう。そのためクラス平均はおそらく黒い背景に対して白いものになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。 2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶媒領域を期待したいところです。 <br />
溶媒領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で分解能に制限をかけてみて下さい。 <br />
●Class2D/after_sorting/run_it025_model.star <br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(クラス間の画像の分布、再構成された構造中のシグナル対ノイズ比の球面平均、全てのグループのノイズスペクトラム)を含んでいます。 <br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低分解能のクラスにある粒子はほとんどない一方で、高分解能のクラスに存在する粒子は多いと分かる。 <br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである) <br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。 <br />
<br />
●Class2D/after_sorting/run_it025_data.star<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。そのメタデータとは、particles.star fileに入力した情報の他に、最適な方向、最適なクラス同定、対数尤度への寄与、などに関する追加情報です。 <br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。 <br />
●Class2D/after_sorting/run_it025_optimiser.star <br />
これは終了しなかった場合の再起動に必要な精密化過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そのときに、Optimisationタブ上で <br />
Number of iterations:40 <br />
と設定して下さい。このジョブは、反復26から反復40名で繰り返されるだろう。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれません。optimiser.starファイルのもう1つの有用な特徴として、1行目に、これを動かすために与えられた正確なコマンドライン引数がコメントとして含まれています。 <br />
●Class2D/after_sorting/run_it025_sampling.star <br />
これはサンプリング間隔の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
===2.3 Making groups===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
<br />
RELIONは、粒子をグループ化する際に、以下のふたつのことを実行します。ひとつは、平均のノイズのスペクトラム強度(σij^2)の推定と単一数としての強度スケールファクター(τi^2)の推定です。後者は、そのデータの異なる部分の間での、全領域シグナル対ノイズ比(SNRi)の違いを表現しており、例えば、氷の厚さ、デフォーカスまたは汚染等によるものです。 <br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱っています。この動作は顕微鏡写真ごとに多くの粒子が存在する場合には良いです。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、強度スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしていますが、2D,3Dクラス化後、各グループの粒子の初期数はより少なくなるだろうということに注意しておいて下さい。 <br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真からの粒子をグループ化することをお薦めします。このことから、RELION 2.0での新しいGUIとして【Subset selection】の中に便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。 <br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正がされます。<br />
<br />
==3 De novo 3D model generation (3Dモデル形成)==<br />
RELIONは、2Dの粒子から| 3D initial model | (3Dの初めのモデル)を生成することからSGDアルゴリズムを用いる。RELION-3.0によると、実行はcryoSPARCプログラムの実行にとてもよく従う。見ている方向とデータの合理的な配分の生成は(2D classification)の詳細なクラス平均を産出するために十分いい。このアルゴリズムは、適切な産出にとてもふさわしく、それ以降の低解像度モデルは、3D classificationか3D auto-refunementで利用できる。ここで留意すべきは、リリースされた3.0の実行の改善は、もはや2D classification動作からクラスにつき選択されたランダムな分子とともに分子の部分集合を選択することをしないことである。代わりに、選択された分子の一式の全体のデータを用いた時、そのアルゴリズムはとてもたくましいものである。<br />
<br />
===3.1 Running the job (動作の実行)===<br />
3D initial model のジョブタイプのI/Oタブのselect/class2d_aftersort/particles.starファイルを選択する。すべては、すでにCTFで順番にしている。OptimisationタブのFillにより従う(角のある初期状態の放置とサンプリングの相殺)<br />
●Number of class : 1<br />
(時々、一つのクラスより大きいもの。0をつかうと、データセットにまだ存在するだろう至適な分子のシンクの生成を助けるだろう。追加された議論sgd_skip_annealはまだ有用だろう。この場合、私たちはスピードアップするための一つのクラスをつかうだろう。)<br />
●Mask diameter (A) : 200<br />
前と同じ<br />
●Flatten and enforce non-negative solvent : Yes<br />
●Symmetry C1<br />
(対称性がなにかもわからないとき、C1の再構築はおそらく、始めることにベストな選択であるだろう。いくつかの高い対称性の物体は正しい空間グループよりC1のSGDによる解法が簡単だろう。このデータセットはいいデータで、正しいポイントグループD2が動作できる。しかしながら、C1からC2にどのように進行するかを説明すると、C1のSGDを動かすだろう。)<br />
特に、実例の1つに、SGDタブのいくつかに変えることはできないことと、その初期状態はいくつかの場合に適している。しかしながら、このチュートリアルのスピードアップすることは、私たちは、反復のデフォルトの数の半分だけ行うだろう。<br />
したがって、このように変化する。:<br />
●Number of initial iterations : 25<br />
●Number of in-between iterations : 100<br />
●Number of final iterations : 25<br />
Gomputeタブで、システム上で最適化する。再度RAMの中で数千の分子がプレリードできる。GPUの加速は、スピードアップを実現でき、反復の間の複数の極大化のステップは、2Dか3Dの精密化か分類の基準の準備はゆっくりになるだろう。4CPUのカードと、5MPInoプロセス、6スレッドのMPIプロセスを使い、システムはおよそ15分で済む。<br />
<br />
===3.2 Analysis the result (結果の分析)===<br />
UCSFキメラのような3Dビューワーの吐出量(Initial Model/job017/run-it/50_class001.mrc)を見る。もし、このポイントにおける対照的なポイントグループの追加を認識することは、RELIONの習慣における協調的なシステムの中心的なX,Y,軸における対照的な軸を整列させることを必要とするだろう。リリースされた3.0は新しいプログラムを促進することを含む。<br />
この動作はコマンドラインから実行できる。<br />
●Relion_align_symmetry - - i InitialModel/job017/run_it150_class001.mrc - -o InitialModel/job017/run_it150_class001_alignD2.mrc - -sym D2<br />
それと、マップにおける対照的な軸のUCSFキメラかrelion_displayの確認はX,YとZ軸の実際の整列とする。私たちはD2の対称的なものを使うことを強要させるだろう。<br />
●Relion_image_handler –i InitialModel/job017/run_it150_class001_alignD2.mrc –o InitialModel/job017/run_it150_class001_symD2.mrc –sym D2<br />
後者のコマンドの出力マップは、入力マップに似ているだろう。<br />
これによって確認できる。<br />
●relion_display_ --i InitialModel / job017 / run_it150_class001_alignD2.mrc & relion_display –i InitialModel / job017 / run_it150_class001_symD2.mrc &<br />
<br />
==4 Unsupervised 3D classification (教師無3次元クラス分類)==<br />
すべてのデータは異性分からなっています。問題は、どのくらいの費用でいられるかです。RELIONの3Dマルチリファレンス精密化手順は、強力な教師なし3次元分類へのアプローチを提供しています。<br />
<br />
===4.1 Running the job (ジョブを開始)===<br />
教師なし3次元分類は、[3D classification] ジョブタイプから、実行可能です。<br />
[I/O]タブの設定:<br />
●Input images STAR file: Select/class2d_aftersort/particles.star<br />
●Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
このマップはパイプラインの部分のように、Brouseボタンで表れないように述べる。両方のタイプは空のフィールドの中に名付けられるか、importジョブタイプをつかうマップの移入が行われる。対照的なC1を動作させたり、非対称的なInitialModel / job017 / run_it150_class.mrcを使いことを選択する。しかしながら、すでに右の対称的なセッティングは、後々とても楽になるだろう。<br />
●Reference mask (optional):<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供するところです。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類へのバイアスを最小限にする働きがあります。)<br />
[Reference]タブの設定: <br />
●Ref. map is on absolute greyscale: No<br />
(このマップがデータセットから再構築されたとき、すでに正しいグレースケールであります。RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
●Initial low-pass filter (A): 50<br />
(精密化プロセスにバイアスが導入する可能性があるため、高解像度の初期参照モデルは使用してはいけません。[12]で説明したように、初期マップをできる限りフィルタリングする必要があります。リボソームでは大抵、70Åを使用し、小さい粒子では通常40〜60Åの値を使用します。)<br />
●Symmetry: C1<br />
(このサンプルはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。良くない粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
●Do CTF corection? Yes<br />
●Has reference been CTF-correced? Yes<br />
(このモデルは、SGDのCTFコレクションによって作られている。)<br />
●Have data been phase flipped? No<br />
●Ignore CTFs untill first peak? No<br />
(リファレンスを作成するために使用した[2D classification]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
【Optimisation】タブの設定: <br />
●Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。) <br />
●Number of iterations: 25<br />
(これは一般的には変更する必要はありません。) <br />
●Regularisation parameter T: 4<br />
(Tの定義については[13]を参照してください。クライオEMの、2次元分類では、通常、Tは1~2を設定し、3次元分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均にノイズが見える場合はTの値を低くし、逆にクラス平均の分解能が低すぎる場合はTの値を高くします。主に気をつけなければならない点は、高解像度のノイズの過学習です。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
●Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。) <br />
●Mask individual particles with zeros? Yes<br />
(Yes: 0 / No: 乱数) <br />
●Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過学習を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
【Helix】タブは無視して下さい。 <br />
以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。 <br />
ここでも、【Running】タブで、使用するNumber of MPI processors(MPIプロセッサの数)とthreads(スレッド数)を指定できます。[2D classification]のjobタイプで説明したように、3次元分類は2次元分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3次元分類を表示するためにfirst_exhaustiveのようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。 <br />
精密化された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を確認できます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。 <br />
UCSFキメラなどを使用し、表示されたマップを3Dで見ると、マップが精密化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。 <br />
2次元分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示ウィンドウには、4つの精密化されたモデルの中央スライスが表示されます。最適なクラスを選択し、右クリックメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
===4.2 Analysing the results in more detail (詳細な結果の解析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。<br />
<br />
出力ファイルは基本的に2次元分類の実行時と同じです。(実際に2次元,3次元精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2次元クラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。例えば、run_it025_class00?.mrcというMRCマップです。 <br />
今まで通り、小さいクラスは大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比(SNR)が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。 <br />
●relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnuplotがインストールされているのであれば、以下の通りに入力して下さい。 <br />
●relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。 <br />
●grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
==5 High-resolution 3D refinement(三次元精密化)==<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は分解能を推定するために、gold-standard Fourier Shell Correlation(FSC)(二つの群に分け、互いに独立して再構成した場合に、どの分解能まで相関があるかにより判断)と言われる判断基準を用います。これにより、過学習を避けることができます[15]。角度の割当の正確さを推定する新しい手順([14])と組み合わせ、精密化が収束するときに自動的に決定されます。そのため、この手順は使用者の入力をほとんど必要としません。すなわち、客観性をのこしたまま、多くのデータセットのための優れたマップが生成がされていると述べられています。もう一つの長所は、一般的にこの手順は必要な実行回数が一回のみであり、最適化のための引数はほとんどありません。<br />
しかしながら、前に高解像度の精密化を始めた時、スケール未満とともに選ばれた粒子の正しいセットを再度抽出して、それによりもしかすると高解像度になるかもしれない。これをすることで、GUIのParticle extraction のジョブタイプとI/Oタブを与える。<br />
●micrograph STAR file : CtfFind / job003 / micrographs – ctf.star<br />
(そのままでよい)<br />
●Coordinate – file suffix : <br />
(空でよい)<br />
●OR re – extract refined particles ? Yes<br />
●Refined particles STAR file : Select /class3d – first_exhausitive / particle.star<br />
(今、選択された粒子の微粒にされたサブセットだけをつかうだろう)<br />
●Re – center refined coodinates ? Yes<br />
(3D classificationの動作以上から整列させたオフセットに従ってすべての粒子は再度中央に置かれるだろう)<br />
●Recenter on – X , Y , Z (pix) 0.0.0<br />
(箱の真ん中の分子を中心にキープさせたい)<br />
●Manually set pixel size ? No<br />
(入力したマイクログラフstarファイルはCTFの情報に含まれていないことが必要である。)<br />
Extractタブはすべてキープする。<br />
●Particle box size (pix) 360<br />
(大きな箱をつかうだろう。それにより非局在化させたCTFシグナルはより良いモデルになるだろう。これはCTF精密化の後が大事である。)<br />
●Rescale particles ? yes<br />
(とても大きな画像が働くことを防ぐことで、360×0.885/256 = 1.244 Åのピクセルサイズを減少させ、採取しましょう。これは、おそらく十分に小さいデータ、2.5 Åの大きな達成可能な解像度に制限があるだろう。)<br />
この動作では、エイリアスbest3dclass_bigboxを使用する。<br />
加えて、256ピクセルのボックスサイズに従って一番いいマップを入手したことのいたずらは必要である。<br />
●relion_image_handler –i Class3D/job018/run_it025_class001.mrc –angpix 3.54 –rescale_angpix 1.244 –o Class3D/job018/run_it025_class001_box256.mrc –new_box256 <br />
<br />
===5.1 Running the auto-refine job (自動精錬動作の実行)===<br />
3D auto-refine のジョブタイプのI/Oタブ<br />
●Input images STAR file : Extract/best3dclass_fullsize/particles.star<br />
●Reference map : Class3D / job018 / run_it025_class001_box256.mrc<br />
●Reference mask (optional)<br />
(からのままでいい)<br />
Reference タブ<br />
●Ref. map is on absolute gryscale ? No<br />
スケール現象の画像の違う標準化によると、正しく絶対的なグレースケールはマップの中に確立しなかった。このオプションの“No”は大事で、精密化の最初の相互作用のグレースケールは正しくなるだろう。<br />
●Initial low-pass filter (A) 50<br />
マップの高い頻度の成分に向かってバイアスを防いだことは低いパスのフィルターから自動精密化され始める。それと解像度から完全に依存された粒子の“gold standard”の維持は、1頭文字より高かった。<br />
●Symmetry D2<br />
(高解像度の粒子の照準は、強要された対称性の粒子の4倍効率的にするだろう)<br />
CTFのパラメータで、OpimisationとAuto-samplingタブは、3D classificationと同じでとどまる<br />
【Sampling】タブでの配向性のサンプリング間隔は反復の最初の数回のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング間隔が自動的に細かくなっていきます。したがって、8面体または正20面体対称よりも小さい角度で、全ての精密化仮定でで、一般的に大域探索では、初期値の角度である7.5度のサンプルを使用し、局所探索では1.8度のサンプルから行います。より正確な対称の精密化を行う場合のみ、3.7度でのサンプリングを行い、局所探索では0.9度ごとにサンプリングを行います。<br />
MPIのノードは1つのマスター(他のスレーブを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用するもの)のセットで分かれているので、奇数のMPI処理装置を使用するのが最も効率が良いです。ナイキスト周波数までのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。従って、使っているクラスターノードのコアと同じ数のスレッドで動かしたいデータセットのボックスより大きいサイズで作られたボックスが必要です。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
===5.2 Analysing the results (結果の分析)===<br />
出力ファイルは3D classificationを実行したときのものと大部分が同じです。しかし、全てにおけるプログラムの反復では、2つのrun_it0??_half?_model.starと2つのrun_it0??_half?_class001.mrcファイルを書き出します。それぞれデータの半分が精密化されます。収束した場合にのみ、ひとつのrun_model.starとrun_class001.mrcファイルを書き出します(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。 <br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[14]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルからも抽出されるかもしれません。 <br />
例えば、以下のように試してみてください。 <br />
●grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
==11 まとめ==<br />
<br />
===11.1 フローチャートの作成===<br />
<br />
どのようにして最終的な再構築をするか気になるでしょう。'''''Finished job'''''リストから実行した最後の動作を選択し、'''''Job actions'''''ボタンから'''Make flowchart'''オプションを試してください。これを実行するためにはシステムに'''LATEX'''や'''TikZ'''パッケージが必要となります。最初の項は正確な作業名のないフローチャートの全体像です。これは、出版目的に役立つでしょう(おそらくお気に入りの'''vector-based design'''プログラムの編集後に)。フローチャートの全体像の後に、最初の詳細なフローチャートにどのようにして終了するかが示されています。10ステップ以上からなるフローチャートは複数の構成要素に分けられることに注意してください。作業中に複数枝分かれすることがあるでしょう。それ故に、最終作業のフローチャートに従って、それぞれの分岐についてフローチャートがあるでしょう。リンクをクリックすることでPDFファイルから合致する位置を得ることができます。<br />
<br />
===11.2 ディレクトリのクリーンアップ===<br />
<br />
ディスクの空間を確保するために、RELIONは作業ディレクトリをクリーンアップするオプションを持っています。これには2つのモードがあります。'''''gentle'''''クリーンは作業ディレクトリから中間ファイルのみを削除します。'''''harsh'''''クリーンは作業からのインプットを必要とする新たな作業を開始するのに必要なファイルを削除します。例えば、'''''harsh'''''クリーンは'''Motion Corr'''作業から平均化された、あるいは'''Particle extraction'''作業から少量のスタックを抽出された顕微鏡写真を削除します。一方、'''''gentle'''''クリーンは'''2D classification''', '''3D classification'''あるいは'''3D auto-refine'''作業の中間反復からすべてのファイルを削除します。'''Job actions'''ボタンから個別に作業をクリーンアップすることができます。あるいは、GUIのトップメニューから下がった、'''''Jobs'''''からすべての作業をクリーンアップすることができます。私たちは計算前の結果に頭を悩ませていたプロジェクトディレクトリの'''tarball'''を作る前にそのメニューから'''''Gently clean all jobs'''''オプションを使いました。長期間保存されていたデータを取る前にプロジェクトディレクトリをクリーンアップしたいでしょう。<br />
<br />
===11.3 質問や引用===<br />
<br />
以上です!このチュートリアルを楽しんで、そして役に立つことを願います。もしRELIONについて質問があれば、初めに'''RELION Wiki'''の'''FAQ'''と'''CCPEMメーリングリスト'''を確認してください。それが助けにならなければ、'''CCPEMリスト'''を利用して質問してください。お願いですから、決してSjorsに直接メールを送信しないでください。質問全てに返答できるわけではありません。もしRELIONが利用者の研究に有益であると思ったら私たちの[http://www2.mrc-lmb.cam.ac.uk/groups/scheres/publications.html 論文]を引用し、あなたの研究仲間たちに伝えてください。<br />
<br />
===11.4 参考文献===<br />
<br />
RELIONの手順の改善を支持した理論の詳細は以下の論文で述べられています。<br />
* S.H.W. Scheres (2012) “''RELION: Implementation of a Bayesian approach to cryo-EM structure determination''” J. Struc. Biol., 180, 519-530.<br />
<br />
*S.H.W. Scheres (2012) “''A Bayesian view on cryo-EM structure determination''” J. Mol. Biol., 415, 406-418.<br />
<br />
RELIONの使い方に関する包括的な概観は以下の論文に述べられています。<br />
<br />
*S.H.W. Scheres (2016) “''Processing of structurally heterogeneous cryo-EM data in RELION''” Meth. Enzym., 579, 125-157.<br />
<br />
<br />
==12 付録 A:インストールの注意==<br />
<br />
===12.1 MPIのインストール===<br />
<br />
'''MPI(message passing interface)'''がインストールされた計算機クラスター、もしくはNVIDIA GPU搭載のマルチコアデスクトップマシンが必要になることに注意してください。RELIONをコンパイルするには、'''mpi-devel'''パッケージが必要です。おそらく存在する種類'''(MPICH, LAM-MPI, etc)'''またはバージョンはそれほど重要ではありません。まだシステム内に'''mpi-devel'''をインストールしてなければ、'''openMPI'''をインストールすることをお勧めします。<br />
<br />
===12.2 CUDAのインストール===<br />
<br />
'''NVIDIA'''の比較的新しいGPU('''compute capability 3.5+'''以上)を持っている場合、オートピッキング、分類、精密化作業を高速に実行できます。'''GPU-accelerationサポート'''を含むRELIONをコンパイルするには、'''CUDA'''をインストールする必要があります。このチュートリアルの準備には'''CUDA-8.0'''を使用しました。[https://developer.nvidia.com/cuda-downloads NVIDIAのWebサイト]からダウンロードしてください。<br />
<br />
===12.3 RELIONのインストール===<br />
<br />
RELIONはオープンソースのソフトウェアです。[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Download_%26_install the RELION wiki]から無料でダウンロードして、手順に従ってインストールしてください。もし、'''job submission system(Sun Grid EngineやPBS/TORQUE etc)'''に詳しくない場合は、インストール手順の説明にあるように、'''qsub.cshスクリプト'''の設定に関して、システム管理者にお尋ねください。分散メモリ並列化のためのMPIと、共用メモリの並列化のための'''pthreads'''の両方を使用する、いわゆるハイブリッド並列計算を実行したいときは注意してください。ジョブキューイングシステムはこれを可能とするためにいくつかの調整が必要な場合があります。再度、システム管理者にお尋ねください。<br />
<br />
===12.4 モーション補正ソフトウェアのインストール===<br />
<br />
RELION-3.0は全フレーム顕微鏡写真ムービーアライメントに使用される、'''UCSFプログラムMOTIONCOR2'''へのラッパーを提供します。[http://www.msg.ucsf.edu/agard/protocols.html Dabid Agard]のページからプログラムをダウンロードし、インストールの手順に従ってください。また、RELIONの保有する、'''MOTIONCOR2'''の実行を使うかもしれません。なので、もし、UCSF実行をインストールするのに問題が発生しても心配しないでください。バージョン3.0において、'''''Nico grigorieff’s group'''''から'''UNBLUR'''へのラッパーはGUIから中止されていることに注意してください。<br />
<br />
===12.5 CTF推定ソフトウェアのインストール===<br />
<br />
CTF推定はRELIONに含まれていません。代わりに、RELIONは'''''Alexis RohouやNiko Grigorieff’s CTFFIND4'''''へのラッパーを提供します。[http://grigoriefflab.janelia.org/datadownload Niko’s CTFFIND website]からダウンロードし、手順に従ってインストールしてください。また、もし、パソコンに'''NVIDIA graphics card(GPU)'''が入っているなら'''''Kai Zhang’s GCTF'''''を使うこともできます。その際は、LMBに関する[https://www.mrc-lmb.cam.ac.uk/kzhang/ KaiのWebサイト]からダウンロードしてください。<br />
<br />
===12.6 RESMAPのインストール===<br />
<br />
局所分解能推定はRELIONが所有するポストプロセッシングプログラムの中、あるいは'''''Alp KucukelbirのRESMAP'''''へのラッパーを通して実行される。[http://www.proditus.com/software.html AlpのRESMAP Webサイト]からダウンロードし、手順に従ってインストールしてください。<br />
<br />
<br />
<br />
<br />
== 13 付録B:RELIONの利用 ==<br />
=== 13.1 GUIについて ===<br />
<br />
==== 13.1.1 pipeline approach ====<br />
RELION-3.0では、一つのプログラムの出力を次のプログラムの入力として順次繋いでいくような情報の受け渡し(パイプライン)を円滑に実現できるようなGUIを設計しました。詳細は2016 Proceedings of the CCP-EM Spring Symposium[3]で公開されています。<br />
RELION-3.0を使うにあたって、まずプロジェクト(すなわち構造決定したい分子)ごとにディレクトリを作成することを推奨します。ここではこのディレクトリの呼称をプロジェクトディレクトリとします。RELIONのGUIは「relion」とコマンドを打つことで起動させることができますが、この動作は常にプロジェクトディレクトリに移動してから行うことを念頭に置いてください。<br />
<br />
このソフトのGUIでは、すべてのジョブや、あるジョブによる出力がどのように他のジョブの入力に使われたのかといった履歴を保存することができ、この機能によってパイプラインが形成されます。各種ジョブにはそれぞれ独自の出力ディレクトリが与えられます。ここではたとえば あるジョブの出力のためにClass2D/ というディレクトリができるとします。こういったジョブディレクトリの中でさらに新しいジョブが実行されると、その新しいジョブには一連の番号が与えられます。たとえばClass2Dのもとで作られたとあるジョブにはClass2D/job010という番号が振り分けられます。さらに、ジョブディレクトリのもとでは、Class2D/job010/run といったように出力名が定められます。このソフトでは、各ジョブに意味のある名前が付けられるような仕組みを備えるために、ファイルシステム上の個々のジョブディレクトリへの記号リンクとして実装された"エイリアス"システムを使用しています。<br />
パイプラインに関するすべての情報はdefault_pipeline.starという名前のファイルに保存されていますが、基本的にはこのファイルを見る必要はありません。もしdefault_pipeline.starファイルが壊れてしまった場合は、最後に実行したジョブディレクトリで保存されたバックアップから復元することができます。<br />
<br />
==== 13.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
このソフトのGUIは上半分と下半分に分かれています。上半分の左側にはジョブの種類が縦リスト上に並べられており、行いたいジョブを選ぶことができます。たとえば2D classificationを行いたいときは、上半分の左側のブラウザで選択すればいいわけです。上半分の右側には複数のタブがあるパネルがあり、それぞれのジョブタイプへのパラメータを入力できます。GUIの左上には機能のおおよその概要が分かる3つのメニューが書かれています。<br />
【Schedule】ボタンでは、後でジョブを実行するときのスケジューリングを行うことができます。それに対して【Run now!】ボタンは今すぐに実行したいときに使います。【Schedule】ボタンは、繰り返し実行できるよう完全自動化された「パイプライン」を用意したいときに役立ちます。たとえば、データが収集されていくにつれてそれが瞬時に反映できるようなパイプラインを実現したいときに有効です。詳細は13.3を参照してください。<br />
GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 13.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中のジョブ(【Running jobs】)、すでに完了しているジョブ(【Finished jobs】)、または後で実行するようにスケジュールされたジョブ(【Scheduled jobs】)のリストがあります。これらのリスト内のジョブをクリックすると、そのジョブのパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリが作成されることはありませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】のジョブでは、_optimiser.starというファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。【モーション補正】、【CTF推定】、【自動ピッキング】、【粒子抽出】は、これまでに行われていなかった顕微鏡写真でのみ実行されます。【Input to this job】(このjobへの入力)と【Output from this job】(このjobからの出力)は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(stdout)と標準エラー出力(stderr)がそれぞれ黒と赤のテキストで表示されます。標準エラー出力は理想的には何もない状態でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、スクロールがしやすくなるようテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 13.1.4 The Display button(ディスプレイボタン) ====<br />
runボタンとscheduleボタンの下にある【Display:】ボタンでは、各ジョブにおける最重要たる入力ファイルと出力ファイルを視覚的に表示することができます。GUIの下半分にあるjobリストのうちのひとつのjobを選択した後に【Display:】ボタンをクリックすると、選択されたjobの入力と出力がすべて(例えば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。中間体のファイルを表示するといったような一般的な機能はGUI左上の3つのメニューのうちFile>Displayを選択することで使うことができます。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第11章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(13.1.6参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
ジョブを削除すると、ジョブディレクトリ全体がプロジェクトディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、ジョブを復元することができます。<br />
<br />
ディスク容量を節約するため、ジョブを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。これには2つのクリーニングオプションがあり、片方は【gentle clean】という方法です。この方法では、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は【harsh clean】という完全なクリーニング方法です。この方法では全てのファイルを消すことになるため、より多くの容量を確保できます。その中でも【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のジョブタイプから選択できる粒子スタック、または顕微鏡写真を含むディレクトリに関しては、とりわけ多くの容量を確保できます。<br />
<br />
また、RELIONの左上にある【job】メニューの対応するオプション(【Gently clean all jobs】あるいは、【Harshly clean all jobs】)を使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。 その際、特定のディレクトリを削除対象から除外したい場合には、NO_HARSH_CLEANというファイルをその中に置いてください。<br />
<br />
例えば、保護したい粒子データがjob098にある場合、次のコマンドを実行してください。<br />
<br />
$ touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
※ touchコマンドは、指定したファイルが存在しない場合には空のファイルを作成するプログラムです。存在している場合には、ファイルの修正時刻を変更します。</div>
Nakamu
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION3%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELION3チュートリアル
2019-02-10T14:52:03Z
<p>Nakamu: /* Unsupervised 3D classification (教師無3次元クラス分類) */</p>
<hr />
<div>'''RELION3'''<br />
<br />
==1 前処理==<br />
<br />
===1.1 解析の準備===<br />
私たちはプロジェクトごとに、すなわち構造解析したいものごとに一つのディレクトリを作成することをお勧めします。これをプロジェクトディレクトリと呼びます。'''プロジェクトディレクトリからRELION GUIを毎回起動することは重要です。'''プロジェクトディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式かTIFF形式で保存するための別のディレクトリを作成してください。もしすべての動画が一つのディレクトリにある場合には、このディレクトリをMovies/とした方が好ましいでしょう。また、異なるディレクトリにある場合(例えば、違う日に集めたもの)には、Movies/15jan16またはMovies/23jan16とするといいでしょう。もし何か理由があり、RELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成することができます。<br />
<br />
単一画像の顕微鏡写真にはmrc拡張子を、動画にはmrc、mrcs、tiff拡張子をつけることができます。チュートリアルのデータを解凍したとき、プロジェクトディレクトリ(Movies/)は作成されています。このディレクトリは、TIFF形式に圧縮された24つの動画、gain.mrc、実験の情報を含んだNOTESファイルが含まれています。<br />
<br />
RELIONを起動してみましょう。前述のように、RELIONは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。その為、新しいディレクトリで初めてRELIONを起動するときは、バックグラウンドで起動するための&の文字を使うべきではありません。プロジェクトディレクトリの中にいることを確認し、入力でRELIONを起動します。<br />
<br />
relion <br />
<br />
そして新しいRELIONプロジェクトを作動するために“y“と答えます。<br />
最初にすることとして、パイプラインの中に録画した顕微鏡動画の取り込みを行います。<br />
job-typeブラウザから”Import”を選択し、以下のパラメータを埋めます。<br />
<br />
●Input files: Movies/*.tiff <br />
●Node type: 2D micrograph movies <br />
<br />
これを行うことで、Current job: Give_alias_hereという空欄に効果的なaliasを規定すrことができます。[Run now!]ボタンをクリックし、job起動します。Import/job001というディレクトリが作成され、Import/moviesというこのディレクトリへのシンボリックリンクが一緒に作成されます。STARファイルとすべての動画が新しいディレクトリの中に作成されます。中を見てみましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし違うソフトウェアで粒子を抽出した場合は、後述の事前処理を行う代わりに、STARファイルや3次元レファレンス、3次元マスクなどを取り込むために“Import”job-typeを使用してください。これについてはRELIONを使用する際の責任は取りません。また、ユーザーは正しいSTARファイルの生成に責任を取ってください。<br />
<br />
===1.2 電子線により誘起される画像の動きの補正===<br />
Motion correction job-typeは便利な全体フレーム動画の調整のためのUCSF MOTIONCOR2[21]ラッパーを規定します。あるいは、バージョン3.0以降はMOTIONCOR2と同じアルゴリズムであるRELION独自の実装を使用することもできます。RELION独自の実装はCPU でのみの実行となるので注意してください。[I/O]タブで設定をします。<br />
<br />
●Input movies STAR file: Import/movies/movies.star<br />
([Browse]ボタンで参照できるファイルは、STAR形式の動画ファイ <br />
ルのみです。)<br />
●First frame for corrected sum: 1<br />
●Last frame for corrected sum: 0<br />
(これはすべての動画フレームに使用する際の結果です。)<br />
●Pixel size(A) 0.885<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
●Do dose-weighting? Yes<br />
●Save non-dose-weighted as well? No<br />
(いくつかの非用量加重顕微鏡写真にはCTF推定を行う方がよいで <br />
しょう。ディスク容量を節約するために、データが非常に良いの <br />
でこのオプションは使用しません。)<br />
<br />
[Motioncor2]タブは以下のように入力します。<br />
●Bfactor: 150<br />
(超高解像度動画ではより大きい価値を使用します。)<br />
●Number of patches X,Y 5 5<br />
●Group frames: 1<br />
●Binning factor: 1<br />
(超高解像度動画ではたいてい2を使用します。)<br />
●Gain-reference image: Movies/gain.mrc<br />
(これは、オンザフライでのgain-reference補正用のgain- <br />
referenceファイルを規定するために使用できます。これらの動 <br />
画はまだgain補正されていないので、この場合には必要です。)<br />
●Defect file:<br />
(これは検出器上の壊れたピクセルを隠すために使用することがで <br />
きます。)<br />
●Gain rotation: No rotation (0)<br />
●Gain flip: No flipping (0)<br />
(gain-reference画像はこのデータセットのために既に補正されて <br />
います。)<br />
●Use RELION’s own implementation? Yes<br />
(これによって、UCSF実装をインストールする必要性が少なくなり <br />
ます。どちらにせよ、UCSFプログラムをインストールしている場 <br />
合は、それを使用することもできます。その場合、以下のオプシ <br />
ョンも入力する必要があります。)<br />
<br />
[Running]タブは以下のように入力します。<br />
●Do dose-weighing? Yes<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
<br />
このプログラムの実行には手頃な12スレッドの最新機器を用いればおおよそ5分かかります。MOTIONCOR2アルゴリズムのRELION独自の実装はGPUでは使用しないことに注意してください。しかしそれはマルチスレッドです。各スレッドは独立して動画フレーム場で動作するので、動画フレームの数をスレッドの数で割った数が整数になるように、いくつかのスレッドを使用することが最適です。これらの動画は24フレームあるので、12スレッドを使用すると各スレッドで2フレームが処理されます。[Run now!]ボタンの下の[Display:]ボタンからout:logfile.pdfを選択することで、推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで、値が合計された顕微鏡写真を見ることができます。スクリーンサイズに依存して、見やすいように、顕微鏡写真(Scale:0.3)を縮小し、Sigma contrast:3を使い、見やすい数のコラム(例として、Number of columns:3)にするべきです。[Display:]ボタンから表示したときから顕微鏡写真は選択できないことに注意してください。もし、取り除きたい顕微鏡写真がある場合(今回はすべていい画像なので削除しないだろうが)は[Subset selection]job-typeが使用できます。<br />
<br />
===1.3 CTF推定===<br />
次に、それぞれ補正した顕微鏡写真からCTFの値を推定します。速度の為Kai ZhangのGCTFのためのラッパーとして[CTF estimation]job-typeにします。適切なGPUがない場合、Alexis RohouとNiko GrigoreffのCTFFIND4.1を使用することができます。[I/O]タブで、[Motion correction]jobのcorrected_micrographs.starファイルを選択するために[Browse]ボタンを使用します。また、他のタブは以下のように入力します。<br />
<br />
I/Oタブにおいて<br />
●Use micrograph without dose-weighting? No<br />
(これらは重み付けされたものよりも良いThon ringsを持っているが、書き出さないことを前のステップで決めました。)<br />
●Sperical aberration (mm): 1.4<br />
(顕微鏡メーカーがこの値を提供してくれています。)<br />
●Voltage (kV): 200<br />
●Amplitude contrast: 0.1<br />
(強度コントラストはほとんどないことが知られていますが、約10%の値を与えることで、多くの構造の結果がよくなることが示されています。これは低周波数の弱い散乱がモデル化されていないからです。)<br />
●Magnified pixel size (A): 0.885<br />
(これらはピクセルサイズ0.885Aのもとの動画です。)<br />
●Amount of astigmatism (A): 100<br />
(範囲が適切に調整されていれば、この値は多くのデータセットに適しています。)<br />
<br />
Searchesタブにおいて、CIFFINDの一般的な値を設定します(正確な意味については、Nikoのドキュメンテーションを参照してください)。これらの設定は、GCTFを使用する場合には無視してください(デフォルトで、これをオフに切り替えることができるが)。<br />
●FFT box size (pix): 512<br />
●Minimum resolution (A): 30<br />
●Maximum resolution (A): 7.1<br />
●Minimum defocus cvalue (A): 5000<br />
●Maximum defocus cvalue (A):50000<br />
●Defocus step size (A): 500<br />
●Amount of astigmatism (A): 100<br />
●Estimate phase shifts No<br />
(これはphase-plateデータだけに役に立つ)<br />
GCTFを使用する場合はCTFFIND-4.1タブを無視してください。逆にGCTFを使用しない場合はCTFFIND-4.1タブウィ使用してください。今回の例として、GCTFを使用し、Getfタブを設定します。<br />
●Use Gctf instead? Yes<br />
●Gctf executable: /wherever/it/is/Gctf<br />
(環境変数である$RELION_CTFFIND_EXECUTABLEと$RELION_GCTF_EXECUTABLEは対応するプログラムのGUIエントリのデフォルト値を制御するために使用されます。)<br />
●Ignore ‘Searches’ parameters? Yes<br />
(GCTFにSearchesタブのパラメーターを渡すにはこれを’No’に設定します。デフォルトでは、これらの値は無視され、GCTF独自のデフォルトが使用されます。)<br />
●Perform equi-phase averaging? Yes<br />
(これによりThon ringのSNRが向上します。)<br />
●Other Gctf options:<br />
●Which GPUs to use: 0<br />
(この小さいデータセットには1GPUで十分でしょう。)<br />
<br />
マシンに応じて、複数のMPI処理を使用してプログラムを実行することができます。1プロセッサーとGPUのみを使用すると、動作はGCTFを使用すると31秒かかります。いったん動作が終わると、出力のCtfFind/job003/Moviesという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFINDを使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
Display:ボタンを使用してout:micrographs_ctf.starを選択すると、すべてのThon ring画像を見ることができます。実験の画像のThon rings間の0はモデルの0と一致するはずです。デフォーカス、最高分解能や性能指数などの順番の表示を並べ替えることができます。log.pdfファイルにはすべての顕微鏡写真に対する、デフォーカス、非点収差、推定解像度などの有用なパラメータのプロットとデータセット全体のヒストグラムが含まれています。データ収集における問題点を見つけ出すのに役に立ちます。<br />
もしCTFモデルが実験のThon ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除して、Finished jobsリストからCtfFind/job003を選択し、parameter-panel の値を修正し、Continue nowボタンをクリックすることでjobを再実行することができます。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できないまたは、不十分なThon ringがあり顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
===1.4手動粒子抽出===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の「粒子座標」を手動で選択して使用します。自分たちのデータをより理解できるように少なくとも複数の顕微鏡写真を選択するのがよいでしょう。選択した粒子を使用して、参照なしの2Dクラス平均を計算し、その後、これらの粒子は全データセットの粒子を自動検出するためのテンプレートになります。しかしRELION3.0以降は、Laplacian-of-Gaussian(LoG)フィルターに基づく参照なしの自動抽出手順が含まれています。これまでにテストされたほとんどの場合、この手順は適切な開始座標を提供してくれるので、Manual pickingステップは飛ばすことができます。relion_it.pyスクリプトはこの機能を使用して、完全に自動化されたオンザフライ処理を実行します。このチュートリアルでは、説明のためにManual picking jobを起動し、その後LoGベースのAuto-pickingを継続して最初の粒子セットを細分化します。<br />
手動粒子検出は経験あるのみです!RELIONで手動で粒子の検出をするのが好きでなければ、Jude ShortのXIMDISP[17](任意の拡張子付きで)、XMIPP-2.4[16](任意の拡張子付きで)、Steven LudtkeのE2BOXER.PY[18](.boxの拡張子付きで)の座標形式ファイルもサポートしています。もしこれらを使用する場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存してください。そして、同じ顕微鏡写真のルートネームは異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMovies/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Input Files:の欄に整理されたファイルのsuffix拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例だと、それぞれMovies/*.boxやMovies/*_pick.starになります。<br />
Manual picking jobタイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBrowseボタンを使用して、Colorsタブは無視して、Displayタブは下のように入力します。<br />
●Prticle diameter (A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
●Scale for micrographs: 0.25<br />
(これは画面サイズによります。)<br />
●Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。黒が標準偏差の3倍低く、白が標準偏差の3倍高くなります。グレースケールは黒から白へ直線的に変化します。詳細はDisplayImages entry on the RELION wikiを参照してください。)<br />
●White value: 0<br />
(どの値を白にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Black value: 0<br />
(どの値を黒にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Lowpass filter (A):20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくするための動作です。)<br />
●Highpass filter (A): 0<br />
(これは顕微鏡写真上の濃淡のグラデーションを取り除くのに役立ちます。)<br />
●Pixel size: 0.885<br />
(これは粒子の直径や、low-pass filterとhigh-pass filterの計算に必要です。)<br />
●Scale for CTF image:1<br />
(これは単にそれぞれの顕微鏡写真のCTFボタンをクリックしたときにThon ring画像がどれくらい大きくなるのか調節します。)<br />
Run now!ボタンをクリックすることでjobが実行され、必要に応じていくつかの粒子をクリックしてください。しかし、次のセクションではLoGベースの自動抽出を使用するので、必要でなければ選ぶことはありません。最初の[2D classification] jobに手動抽出した粒子を使用する場合は、適切なクラス平均を計算するために約500~1000個の粒子が必要になります。左クリックで選択、中クリックで選択された粒子の削除、右クリックで座標を保存する必要があるポップアップメニューが表示されます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでもメニューから保存した座標のSTARファイルに戻ることができます(ポップアップメニューの座標を使用してSTARファイルを保存した場合)。<br />
<br />
===1.5 LoGベース自動選択===<br />
今回は、Laplacian-of-Gaussian(Log)フィルタに基づくテンプレートフリーの自動抽出の手順を使用して、最初の粒子セットを選択して下さい。その後、それらの粒子は[2D classification]jobで使用され、2番目の[Auto-picking]jobのテンプレートが生成されます。初期段階では多くの粒子を必要としないので、最初の3枚の顕微鏡写真に対してのみLoGべーすの自動抽出を実行します。一般的に、可能な限り良いテンプレートを得るために、おそらく使用可能なすべての顕微鏡写真に対してLoGベースの抽出を実行します。しかし、今回はこのチュートリアルの計算速度を上げるためにいくつかの顕微鏡写真のみを使用します。<br />
最初にいくつかの顕微鏡写真を選択するために、[Subset selection]jobに移動し、I/Oタブで下を除くすべての空欄をままにします。<br />
●OR select from picked cords: ManualPick/job004/cords_suffix_manualpick.star<br />
(手動抽出で座標を保存したときに生成されます。今回は座標を使用するつもりはなく、顕微鏡写真のサブセットセレクションを行うためにそのjobを使用しているだけです。)<br />
<br />
このjobにはalias 5micsを使用しました。Run!ボタンを押し、[Manual picking]jobと同じポップアップウィンドウを再び押すと、すべてのpickとCTFボタンが表示されます。‘File’メニューを使用して‘Invert selection’:最初の5枚の顕微鏡写真の前にあるチェックボックスをクリックして選択します。その後、‘File’メニューを再び使用して‘Save selection’を選択します。これで、ManualPick/job004/micrographs_selected.starというファイルができ、これを下記の[Auto-picking]jobに使用します。<br />
その後、[Auto-picking]jobを処理し、I/Oタブの設定を行います。<br />
<br />
●Input micrographs for autopick: Select/job005/micrographs_selected.star<br />
●Pixels size in micrographs (A) -1<br />
(ピクセルサイズは入力STARファイルの中の情報から自動的に設定されます。)<br />
●2D references:<br />
(テンプレートフリーのLoGベースの自動抽出では空欄のままにします。)<br />
●OR: provides a 3D reference? No<br />
●OR: use Laplacian-of-Gaussian? Yes<br />
<br />
Laplacianタブの設定をします。<br />
●Min. diameter for loG filter (A) 150<br />
●Max. diameter for loG filter (A) 180<br />
(これは粒子投影のオングストロームの最小最大のサイズに対応します。)<br />
●Are the particles white? No<br />
(黒です。)<br />
●Maximum resolution to consider 20<br />
(ここはデフォルト値のままでいいです。)<br />
●Adjust default threshold 0<br />
(正の値、すなわち閾値はより少ない粒子を選び、負の値もより少ない粒子を選んでください。有用な値は、おそらく[-1,1]の範囲ですが、多くの場合デフォルト値の0は正しい働きをします。)<br />
<br />
Referencesタブは無視して、autopickingタブの最初の四つのオプションは無視してください。下記のように設定してください。<br />
●Write FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Read FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Shrink factor: 0<br />
(縮小を0に設定すると、自動抽出プログラムは参照上のローパスフィルタの解像度に合わせて顕微鏡写真を縮小します。これはすごく早くなり、必要なメモリが少なくなるため、このチュートリアルを素早く実行するのに便利になります。0と1の間の値は顕微鏡写真のサイズの少数で表されるでしょう。これは縮小で1を使用するよりも正確な抽出が少なくなること、つまり縮小がないことに注意してください。この新しいパラメータの詳細は、次のサブセクションで説明します。)<br />
●Use GPU acceleration? No<br />
(計算速度がとても速いので、LoGベースの自動抽出はGPU加速されていません。)<br />
●Which GPUs to use:<br />
<br />
Helixタブを無視して、Running tabで単一MPIプロセッサを使用して実行します。もしかするとLoG_basedのようなaliasが有用かもしれません。単一プロセッサを使用すると、これらの計算は、私たちのコンピュータでは約40秒かかります。<br />
Display:ボタンのcoords_suffix_autopickオプションをクリックすることで結果をチェックすることができます。この段階で表示されるポップアップウィンドウで手動で粒子を追加/削除できます。さらに、autopickingタブのノイズの標準偏差と平均のパラメータやLaplacianタブのデフォルトの閾値の調節をしている間、新しいjobを実行して、より多くの、またはより少ない粒子を抽出することができます。しかし、この段階では、単に2回目のauto-picking jobのテンプレート作成のための最初の粒子セットなので、多くの場合これは必要ないでしょう。<br />
<br />
<br />
<br />
<br />
==2 Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。 <br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。 <br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
<br />
===2.1 Running the job(動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他のオプションは、前述の自動検出のテンプレートを作成した時と同じです。 <br />
●Input images STAR file: Select/after_sorting/particle.star<br />
【Optimisation(最適化)】タブを次の通りにセットします。 <br />
●Number of class: 100<br />
(今、たくさんの粒子を持っています。)<br />
After_sortingのようなエイリアスを用いると、20分ほどで終わります。<br />
動作が終了したら、_model.starファイルを選択して【Subset selection】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度のゴーストのように見える【Einstein-from-noise】クラスに気を付けてください。こうしたクラスの選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。 <br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている外れ画像を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。 <br />
す <br />
===2.2 Analysing the results in more detail(より詳細な結果の分析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。 2D クラス平均算出の最終反復時では、以下のファイルが作成されます。 <br />
● Class2D/after_sorting/run_it025_classes.mrcs <br />
これは、クラス平均結果をMRCスタックとして保存しています。これらはメインGUIのDisplay: ボタンから _model.star を選択したときに表示される画像です。RELION は GUIから選択した場合、(GUIを選択した場合)、クラス平均はおそらく黒い背景が白くなるだろう。そのためクラス平均はおそらく黒い背景に対して白いものになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。 2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶媒領域を期待したいところです。 <br />
溶媒領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で分解能に制限をかけてみて下さい。 <br />
●Class2D/after_sorting/run_it025_model.star <br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(クラス間の画像の分布、再構成された構造中のシグナル対ノイズ比の球面平均、全てのグループのノイズスペクトラム)を含んでいます。 <br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低分解能のクラスにある粒子はほとんどない一方で、高分解能のクラスに存在する粒子は多いと分かる。 <br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである) <br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。 <br />
<br />
●Class2D/after_sorting/run_it025_data.star<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。そのメタデータとは、particles.star fileに入力した情報の他に、最適な方向、最適なクラス同定、対数尤度への寄与、などに関する追加情報です。 <br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。 <br />
●Class2D/after_sorting/run_it025_optimiser.star <br />
これは終了しなかった場合の再起動に必要な精密化過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そのときに、Optimisationタブ上で <br />
Number of iterations:40 <br />
と設定して下さい。このジョブは、反復26から反復40名で繰り返されるだろう。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれません。optimiser.starファイルのもう1つの有用な特徴として、1行目に、これを動かすために与えられた正確なコマンドライン引数がコメントとして含まれています。 <br />
●Class2D/after_sorting/run_it025_sampling.star <br />
これはサンプリング間隔の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
===2.3 Making groups===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
<br />
RELIONは、粒子をグループ化する際に、以下のふたつのことを実行します。ひとつは、平均のノイズのスペクトラム強度(σij^2)の推定と単一数としての強度スケールファクター(τi^2)の推定です。後者は、そのデータの異なる部分の間での、全領域シグナル対ノイズ比(SNRi)の違いを表現しており、例えば、氷の厚さ、デフォーカスまたは汚染等によるものです。 <br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱っています。この動作は顕微鏡写真ごとに多くの粒子が存在する場合には良いです。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、強度スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしていますが、2D,3Dクラス化後、各グループの粒子の初期数はより少なくなるだろうということに注意しておいて下さい。 <br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真からの粒子をグループ化することをお薦めします。このことから、RELION 2.0での新しいGUIとして【Subset selection】の中に便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。 <br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正がされます。<br />
<br />
==3 De novo 3D model generation (3Dモデル形成)==<br />
RELIONは、2Dの粒子から| 3D initial model | (3Dの初めのモデル)を生成することからSGDアルゴリズムを用いる。RELION-3.0によると、実行はcryoSPARCプログラムの実行にとてもよく従う。見ている方向とデータの合理的な配分の生成は(2D classification)の詳細なクラス平均を産出するために十分いい。このアルゴリズムは、適切な産出にとてもふさわしく、それ以降の低解像度モデルは、3D classificationか3D auto-refunementで利用できる。ここで留意すべきは、リリースされた3.0の実行の改善は、もはや2D classification動作からクラスにつき選択されたランダムな分子とともに分子の部分集合を選択することをしないことである。代わりに、選択された分子の一式の全体のデータを用いた時、そのアルゴリズムはとてもたくましいものである。<br />
<br />
===3.1 Running the job (動作の実行)===<br />
3D initial model のジョブタイプのI/Oタブのselect/class2d_aftersort/particles.starファイルを選択する。すべては、すでにCTFで順番にしている。OptimisationタブのFillにより従う(角のある初期状態の放置とサンプリングの相殺)<br />
●Number of class : 1<br />
(時々、一つのクラスより大きいもの。0をつかうと、データセットにまだ存在するだろう至適な分子のシンクの生成を助けるだろう。追加された議論sgd_skip_annealはまだ有用だろう。この場合、私たちはスピードアップするための一つのクラスをつかうだろう。)<br />
●Mask diameter (A) : 200<br />
前と同じ<br />
●Flatten and enforce non-negative solvent : Yes<br />
●Symmetry C1<br />
(対称性がなにかもわからないとき、C1の再構築はおそらく、始めることにベストな選択であるだろう。いくつかの高い対称性の物体は正しい空間グループよりC1のSGDによる解法が簡単だろう。このデータセットはいいデータで、正しいポイントグループD2が動作できる。しかしながら、C1からC2にどのように進行するかを説明すると、C1のSGDを動かすだろう。)<br />
特に、実例の1つに、SGDタブのいくつかに変えることはできないことと、その初期状態はいくつかの場合に適している。しかしながら、このチュートリアルのスピードアップすることは、私たちは、反復のデフォルトの数の半分だけ行うだろう。<br />
したがって、このように変化する。:<br />
●Number of initial iterations : 25<br />
●Number of in-between iterations : 100<br />
●Number of final iterations : 25<br />
Gomputeタブで、システム上で最適化する。再度RAMの中で数千の分子がプレリードできる。GPUの加速は、スピードアップを実現でき、反復の間の複数の極大化のステップは、2Dか3Dの精密化か分類の基準の準備はゆっくりになるだろう。4CPUのカードと、5MPInoプロセス、6スレッドのMPIプロセスを使い、システムはおよそ15分で済む。<br />
<br />
===3.2 Analysis the result (結果の分析)===<br />
UCSFキメラのような3Dビューワーの吐出量(Initial Model/job017/run-it/50_class001.mrc)を見る。もし、このポイントにおける対照的なポイントグループの追加を認識することは、RELIONの習慣における協調的なシステムの中心的なX,Y,軸における対照的な軸を整列させることを必要とするだろう。リリースされた3.0は新しいプログラムを促進することを含む。<br />
この動作はコマンドラインから実行できる。<br />
●Relion_align_symmetry - - i InitialModel/job017/run_it150_class001.mrc - -o InitialModel/job017/run_it150_class001_alignD2.mrc - -sym D2<br />
それと、マップにおける対照的な軸のUCSFキメラかrelion_displayの確認はX,YとZ軸の実際の整列とする。私たちはD2の対称的なものを使うことを強要させるだろう。<br />
●Relion_image_handler –i InitialModel/job017/run_it150_class001_alignD2.mrc –o InitialModel/job017/run_it150_class001_symD2.mrc –sym D2<br />
後者のコマンドの出力マップは、入力マップに似ているだろう。<br />
これによって確認できる。<br />
●relion_display_ --i InitialModel / job017 / run_it150_class001_alignD2.mrc & relion_display –i InitialModel / job017 / run_it150_class001_symD2.mrc &<br />
<br />
==4 Unsupervised 3D classification (教師無3次元クラス分類)==<br />
すべてのデータは異性分からなっています。問題は、どのくらいの費用でいられるかです。RELIONの3Dマルチリファレンス精密化手順は、強力な教師なし3次元分類へのアプローチを提供しています。<br />
<br />
===4.1 Running the job (ジョブを開始)===<br />
教師なし3次元分類は、[3D classification] ジョブタイプから、実行可能です。<br />
[I/O]タブの設定:<br />
●Input images STAR file: Select/class2d_aftersort/particles.star<br />
●Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
このマップはパイプラインの部分のように、Brouseボタンで表れないように述べる。両方のタイプは空のフィールドの中に名付けられるか、importジョブタイプをつかうマップの移入が行われる。対照的なC1を動作させたり、非対称的なInitialModel / job017 / run_it150_class.mrcを使いことを選択する。しかしながら、すでに右の対称的なセッティングは、後々とても楽になるだろう。<br />
●Reference mask (optional):<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供するところです。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類へのバイアスを最小限にする働きがあります。)<br />
[Reference]タブの設定: <br />
●Ref. map is on absolute greyscale: No<br />
(このマップがデータセットから再構築されたとき、すでに正しいグレースケールであります。RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
●Initial low-pass filter (A): 50<br />
(精密化プロセスにバイアスが導入する可能性があるため、高解像度の初期参照モデルは使用してはいけません。[12]で説明したように、初期マップをできる限りフィルタリングする必要があります。リボソームでは大抵、70Åを使用し、小さい粒子では通常40〜60Åの値を使用します。)<br />
●Symmetry: C1<br />
(このサンプルはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。良くない粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
●Do CTF corection? Yes<br />
●Has reference been CTF-correced? Yes<br />
(このモデルは、SGDのCTFコレクションによって作られている。)<br />
●Have data been phase flipped? No<br />
●Ignore CTFs untill first peak? No<br />
(リファレンスを作成するために使用した[2D classification]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
【Optimisation】タブの設定: <br />
●Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。) <br />
●Number of iterations: 25<br />
(これは一般的には変更する必要はありません。) <br />
●Regularisation parameter T: 4<br />
(Tの定義については[13]を参照してください。クライオEMの、2次元分類では、通常、Tは1~2を設定し、3次元分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均にノイズが見える場合はTの値を低くし、逆にクラス平均の分解能が低すぎる場合はTの値を高くします。主に気をつけなければならない点は、高解像度のノイズの過学習です。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
●Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。) <br />
●Mask individual particles with zeros? Yes<br />
(Yes: 0 / No: 乱数) <br />
●Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過学習を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
【Helix】タブは無視して下さい。 <br />
以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。 <br />
ここでも、【Running】タブで、使用するNumber of MPI processors(MPIプロセッサの数)とthreads(スレッド数)を指定できます。[2D classification]のjobタイプで説明したように、3次元分類は2次元分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3次元分類を表示するためにfirst_exhaustiveのようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。 <br />
精密化された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を確認できます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。 <br />
UCSFキメラなどを使用し、表示されたマップを3Dで見ると、マップが精密化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。 <br />
2次元分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示ウィンドウには、4つの精密化されたモデルの中央スライスが表示されます。最適なクラスを選択し、右クリックメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
===4.2 Analysing the results in more detail (詳細な結果の解析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。<br />
<br />
出力ファイルは基本的に2次元分類の実行時と同じです。(実際に2次元,3次元精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2次元クラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。例えば、run_it025_class00?.mrcというMRCマップです。 <br />
今まで通り、小さいクラスは大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比(SNR)が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。 <br />
●relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnuplotがインストールされているのであれば、以下の通りに入力して下さい。 <br />
●relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。 <br />
●grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
==High-resolution 3D refinement(三次元精密化)==<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は分解能を推定するために、gold-standard Fourier Shell Correlation(FSC)(二つの群に分け、互いに独立して再構成した場合に、どの分解能まで相関があるかにより判断)と言われる判断基準を用います。これにより、過学習を避けることができます[15]。角度の割当の正確さを推定する新しい手順([14])と組み合わせ、精密化が収束するときに自動的に決定されます。そのため、この手順は使用者の入力をほとんど必要としません。すなわち、客観性をのこしたまま、多くのデータセットのための優れたマップが生成がされていると述べられています。もう一つの長所は、一般的にこの手順は必要な実行回数が一回のみであり、最適化のための引数はほとんどありません。<br />
しかしながら、前に高解像度の精密化を始めた時、スケール未満とともに選ばれた粒子の正しいセットを再度抽出して、それによりもしかすると高解像度になるかもしれない。これをすることで、GUIのParticle extraction のジョブタイプとI/Oタブを与える。<br />
●micrograph STAR file : CtfFind / job003 / micrographs – ctf.star<br />
(そのままでよい)<br />
●Coordinate – file suffix : <br />
(空でよい)<br />
●OR re – extract refined particles ? Yes<br />
●Refined particles STAR file : Select /class3d – first_exhausitive / particle.star<br />
(今、選択された粒子の微粒にされたサブセットだけをつかうだろう)<br />
●Re – center refined coodinates ? Yes<br />
(3D classificationの動作以上から整列させたオフセットに従ってすべての粒子は再度中央に置かれるだろう)<br />
●Recenter on – X , Y , Z (pix) 0.0.0<br />
(箱の真ん中の分子を中心にキープさせたい)<br />
●Manually set pixel size ? No<br />
(入力したマイクログラフstarファイルはCTFの情報に含まれていないことが必要である。)<br />
Extractタブはすべてキープする。<br />
●Particle box size (pix) 360<br />
(大きな箱をつかうだろう。それにより非局在化させたCTFシグナルはより良いモデルになるだろう。これはCTF精密化の後が大事である。)<br />
●Rescale particles ? yes<br />
(とても大きな画像が働くことを防ぐことで、360×0.885/256 = 1.244 Åのピクセルサイズを減少させ、採取しましょう。これは、おそらく十分に小さいデータ、2.5 Åの大きな達成可能な解像度に制限があるだろう。)<br />
この動作では、エイリアスbest3dclass_bigboxを使用する。<br />
加えて、256ピクセルのボックスサイズに従って一番いいマップを入手したことのいたずらは必要である。<br />
●relion_image_handler –i Class3D/job018/run_it025_class001.mrc –angpix 3.54 –rescale_angpix 1.244 –o Class3D/job018/run_it025_class001_box256.mrc –new_box256 <br />
<br />
===Running the auto-refine job (自動精錬動作の実行)===<br />
3D auto-refine のジョブタイプのI/Oタブ<br />
●Input images STAR file : Extract/best3dclass_fullsize/particles.star<br />
●Reference map : Class3D / job018 / run_it025_class001_box256.mrc<br />
●Reference mask (optional)<br />
(からのままでいい)<br />
Reference タブ<br />
●Ref. map is on absolute gryscale ? No<br />
スケール現象の画像の違う標準化によると、正しく絶対的なグレースケールはマップの中に確立しなかった。このオプションの“No”は大事で、精密化の最初の相互作用のグレースケールは正しくなるだろう。<br />
●Initial low-pass filter (A) 50<br />
マップの高い頻度の成分に向かってバイアスを防いだことは低いパスのフィルターから自動精密化され始める。それと解像度から完全に依存された粒子の“gold standard”の維持は、1頭文字より高かった。<br />
●Symmetry D2<br />
(高解像度の粒子の照準は、強要された対称性の粒子の4倍効率的にするだろう)<br />
CTFのパラメータで、OpimisationとAuto-samplingタブは、3D classificationと同じでとどまる<br />
【Sampling】タブでの配向性のサンプリング間隔は反復の最初の数回のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング間隔が自動的に細かくなっていきます。したがって、8面体または正20面体対称よりも小さい角度で、全ての精密化仮定でで、一般的に大域探索では、初期値の角度である7.5度のサンプルを使用し、局所探索では1.8度のサンプルから行います。より正確な対称の精密化を行う場合のみ、3.7度でのサンプリングを行い、局所探索では0.9度ごとにサンプリングを行います。<br />
MPIのノードは1つのマスター(他のスレーブを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用するもの)のセットで分かれているので、奇数のMPI処理装置を使用するのが最も効率が良いです。ナイキスト周波数までのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。従って、使っているクラスターノードのコアと同じ数のスレッドで動かしたいデータセットのボックスより大きいサイズで作られたボックスが必要です。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
===Analysing the results (結果の分析)===<br />
出力ファイルは3D classificationを実行したときのものと大部分が同じです。しかし、全てにおけるプログラムの反復では、2つのrun_it0??_half?_model.starと2つのrun_it0??_half?_class001.mrcファイルを書き出します。それぞれデータの半分が精密化されます。収束した場合にのみ、ひとつのrun_model.starとrun_class001.mrcファイルを書き出します(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。 <br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[14]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルからも抽出されるかもしれません。 <br />
例えば、以下のように試してみてください。 <br />
●grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
==11 まとめ==<br />
<br />
===11.1 フローチャートの作成===<br />
<br />
どのようにして最終的な再構築をするか気になるでしょう。'''''Finished job'''''リストから実行した最後の動作を選択し、'''''Job actions'''''ボタンから'''Make flowchart'''オプションを試してください。これを実行するためにはシステムに'''LATEX'''や'''TikZ'''パッケージが必要となります。最初の項は正確な作業名のないフローチャートの全体像です。これは、出版目的に役立つでしょう(おそらくお気に入りの'''vector-based design'''プログラムの編集後に)。フローチャートの全体像の後に、最初の詳細なフローチャートにどのようにして終了するかが示されています。10ステップ以上からなるフローチャートは複数の構成要素に分けられることに注意してください。作業中に複数枝分かれすることがあるでしょう。それ故に、最終作業のフローチャートに従って、それぞれの分岐についてフローチャートがあるでしょう。リンクをクリックすることでPDFファイルから合致する位置を得ることができます。<br />
<br />
===11.2 ディレクトリのクリーンアップ===<br />
<br />
ディスクの空間を確保するために、RELIONは作業ディレクトリをクリーンアップするオプションを持っています。これには2つのモードがあります。'''''gentle'''''クリーンは作業ディレクトリから中間ファイルのみを削除します。'''''harsh'''''クリーンは作業からのインプットを必要とする新たな作業を開始するのに必要なファイルを削除します。例えば、'''''harsh'''''クリーンは'''Motion Corr'''作業から平均化された、あるいは'''Particle extraction'''作業から少量のスタックを抽出された顕微鏡写真を削除します。一方、'''''gentle'''''クリーンは'''2D classification''', '''3D classification'''あるいは'''3D auto-refine'''作業の中間反復からすべてのファイルを削除します。'''Job actions'''ボタンから個別に作業をクリーンアップすることができます。あるいは、GUIのトップメニューから下がった、'''''Jobs'''''からすべての作業をクリーンアップすることができます。私たちは計算前の結果に頭を悩ませていたプロジェクトディレクトリの'''tarball'''を作る前にそのメニューから'''''Gently clean all jobs'''''オプションを使いました。長期間保存されていたデータを取る前にプロジェクトディレクトリをクリーンアップしたいでしょう。<br />
<br />
===11.3 質問や引用===<br />
<br />
以上です!このチュートリアルを楽しんで、そして役に立つことを願います。もしRELIONについて質問があれば、初めに'''RELION Wiki'''の'''FAQ'''と'''CCPEMメーリングリスト'''を確認してください。それが助けにならなければ、'''CCPEMリスト'''を利用して質問してください。お願いですから、決してSjorsに直接メールを送信しないでください。質問全てに返答できるわけではありません。もしRELIONが利用者の研究に有益であると思ったら私たちの[http://www2.mrc-lmb.cam.ac.uk/groups/scheres/publications.html 論文]を引用し、あなたの研究仲間たちに伝えてください。<br />
<br />
===11.4 参考文献===<br />
<br />
RELIONの手順の改善を支持した理論の詳細は以下の論文で述べられています。<br />
* S.H.W. Scheres (2012) “''RELION: Implementation of a Bayesian approach to cryo-EM structure determination''” J. Struc. Biol., 180, 519-530.<br />
<br />
*S.H.W. Scheres (2012) “''A Bayesian view on cryo-EM structure determination''” J. Mol. Biol., 415, 406-418.<br />
<br />
RELIONの使い方に関する包括的な概観は以下の論文に述べられています。<br />
<br />
*S.H.W. Scheres (2016) “''Processing of structurally heterogeneous cryo-EM data in RELION''” Meth. Enzym., 579, 125-157.<br />
<br />
<br />
==12 付録 A:インストールの注意==<br />
<br />
===12.1 MPIのインストール===<br />
<br />
'''MPI(message passing interface)'''がインストールされた計算機クラスター、もしくはNVIDIA GPU搭載のマルチコアデスクトップマシンが必要になることに注意してください。RELIONをコンパイルするには、'''mpi-devel'''パッケージが必要です。おそらく存在する種類'''(MPICH, LAM-MPI, etc)'''またはバージョンはそれほど重要ではありません。まだシステム内に'''mpi-devel'''をインストールしてなければ、'''openMPI'''をインストールすることをお勧めします。<br />
<br />
===12.2 CUDAのインストール===<br />
<br />
'''NVIDIA'''の比較的新しいGPU('''compute capability 3.5+'''以上)を持っている場合、オートピッキング、分類、精密化作業を高速に実行できます。'''GPU-accelerationサポート'''を含むRELIONをコンパイルするには、'''CUDA'''をインストールする必要があります。このチュートリアルの準備には'''CUDA-8.0'''を使用しました。[https://developer.nvidia.com/cuda-downloads NVIDIAのWebサイト]からダウンロードしてください。<br />
<br />
===12.3 RELIONのインストール===<br />
<br />
RELIONはオープンソースのソフトウェアです。[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Download_%26_install the RELION wiki]から無料でダウンロードして、手順に従ってインストールしてください。もし、'''job submission system(Sun Grid EngineやPBS/TORQUE etc)'''に詳しくない場合は、インストール手順の説明にあるように、'''qsub.cshスクリプト'''の設定に関して、システム管理者にお尋ねください。分散メモリ並列化のためのMPIと、共用メモリの並列化のための'''pthreads'''の両方を使用する、いわゆるハイブリッド並列計算を実行したいときは注意してください。ジョブキューイングシステムはこれを可能とするためにいくつかの調整が必要な場合があります。再度、システム管理者にお尋ねください。<br />
<br />
===12.4 モーション補正ソフトウェアのインストール===<br />
<br />
RELION-3.0は全フレーム顕微鏡写真ムービーアライメントに使用される、'''UCSFプログラムMOTIONCOR2'''へのラッパーを提供します。[http://www.msg.ucsf.edu/agard/protocols.html Dabid Agard]のページからプログラムをダウンロードし、インストールの手順に従ってください。また、RELIONの保有する、'''MOTIONCOR2'''の実行を使うかもしれません。なので、もし、UCSF実行をインストールするのに問題が発生しても心配しないでください。バージョン3.0において、'''''Nico grigorieff’s group'''''から'''UNBLUR'''へのラッパーはGUIから中止されていることに注意してください。<br />
<br />
===12.5 CTF推定ソフトウェアのインストール===<br />
<br />
CTF推定はRELIONに含まれていません。代わりに、RELIONは'''''Alexis RohouやNiko Grigorieff’s CTFFIND4'''''へのラッパーを提供します。[http://grigoriefflab.janelia.org/datadownload Niko’s CTFFIND website]からダウンロードし、手順に従ってインストールしてください。また、もし、パソコンに'''NVIDIA graphics card(GPU)'''が入っているなら'''''Kai Zhang’s GCTF'''''を使うこともできます。その際は、LMBに関する[https://www.mrc-lmb.cam.ac.uk/kzhang/ KaiのWebサイト]からダウンロードしてください。<br />
<br />
===12.6 RESMAPのインストール===<br />
<br />
局所分解能推定はRELIONが所有するポストプロセッシングプログラムの中、あるいは'''''Alp KucukelbirのRESMAP'''''へのラッパーを通して実行される。[http://www.proditus.com/software.html AlpのRESMAP Webサイト]からダウンロードし、手順に従ってインストールしてください。<br />
<br />
<br />
<br />
<br />
== 13 付録B:RELIONの利用 ==<br />
=== 13.1 GUIについて ===<br />
<br />
==== 13.1.1 pipeline approach ====<br />
RELION-3.0では、一つのプログラムの出力を次のプログラムの入力として順次繋いでいくような情報の受け渡し(パイプライン)を円滑に実現できるようなGUIを設計しました。詳細は2016 Proceedings of the CCP-EM Spring Symposium[3]で公開されています。<br />
RELION-3.0を使うにあたって、まずプロジェクト(すなわち構造決定したい分子)ごとにディレクトリを作成することを推奨します。ここではこのディレクトリの呼称をプロジェクトディレクトリとします。RELIONのGUIは「relion」とコマンドを打つことで起動させることができますが、この動作は常にプロジェクトディレクトリに移動してから行うことを念頭に置いてください。<br />
<br />
このソフトのGUIでは、すべてのジョブや、あるジョブによる出力がどのように他のジョブの入力に使われたのかといった履歴を保存することができ、この機能によってパイプラインが形成されます。各種ジョブにはそれぞれ独自の出力ディレクトリが与えられます。ここではたとえば あるジョブの出力のためにClass2D/ というディレクトリができるとします。こういったジョブディレクトリの中でさらに新しいジョブが実行されると、その新しいジョブには一連の番号が与えられます。たとえばClass2Dのもとで作られたとあるジョブにはClass2D/job010という番号が振り分けられます。さらに、ジョブディレクトリのもとでは、Class2D/job010/run といったように出力名が定められます。このソフトでは、各ジョブに意味のある名前が付けられるような仕組みを備えるために、ファイルシステム上の個々のジョブディレクトリへの記号リンクとして実装された"エイリアス"システムを使用しています。<br />
パイプラインに関するすべての情報はdefault_pipeline.starという名前のファイルに保存されていますが、基本的にはこのファイルを見る必要はありません。もしdefault_pipeline.starファイルが壊れてしまった場合は、最後に実行したジョブディレクトリで保存されたバックアップから復元することができます。<br />
<br />
==== 13.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
このソフトのGUIは上半分と下半分に分かれています。上半分の左側にはジョブの種類が縦リスト上に並べられており、行いたいジョブを選ぶことができます。たとえば2D classificationを行いたいときは、上半分の左側のブラウザで選択すればいいわけです。上半分の右側には複数のタブがあるパネルがあり、それぞれのジョブタイプへのパラメータを入力できます。GUIの左上には機能のおおよその概要が分かる3つのメニューが書かれています。<br />
【Schedule】ボタンでは、後でジョブを実行するときのスケジューリングを行うことができます。それに対して【Run now!】ボタンは今すぐに実行したいときに使います。【Schedule】ボタンは、繰り返し実行できるよう完全自動化された「パイプライン」を用意したいときに役立ちます。たとえば、データが収集されていくにつれてそれが瞬時に反映できるようなパイプラインを実現したいときに有効です。詳細は13.3を参照してください。<br />
GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 13.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中のジョブ(【Running jobs】)、すでに完了しているジョブ(【Finished jobs】)、または後で実行するようにスケジュールされたジョブ(【Scheduled jobs】)のリストがあります。これらのリスト内のジョブをクリックすると、そのジョブのパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリが作成されることはありませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】のジョブでは、_optimiser.starというファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。【モーション補正】、【CTF推定】、【自動ピッキング】、【粒子抽出】は、これまでに行われていなかった顕微鏡写真でのみ実行されます。【Input to this job】(このjobへの入力)と【Output from this job】(このjobからの出力)は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(stdout)と標準エラー出力(stderr)がそれぞれ黒と赤のテキストで表示されます。標準エラー出力は理想的には何もない状態でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、スクロールがしやすくなるようテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 13.1.4 The Display button(ディスプレイボタン) ====<br />
runボタンとscheduleボタンの下にある【Display:】ボタンでは、各ジョブにおける最重要たる入力ファイルと出力ファイルを視覚的に表示することができます。GUIの下半分にあるjobリストのうちのひとつのjobを選択した後に【Display:】ボタンをクリックすると、選択されたjobの入力と出力がすべて(例えば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。中間体のファイルを表示するといったような一般的な機能はGUI左上の3つのメニューのうちFile>Displayを選択することで使うことができます。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第11章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(13.1.6参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
ジョブを削除すると、ジョブディレクトリ全体がプロジェクトディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、ジョブを復元することができます。<br />
<br />
ディスク容量を節約するため、ジョブを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。これには2つのクリーニングオプションがあり、片方は【gentle clean】という方法です。この方法では、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は【harsh clean】という完全なクリーニング方法です。この方法では全てのファイルを消すことになるため、より多くの容量を確保できます。その中でも【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のジョブタイプから選択できる粒子スタック、または顕微鏡写真を含むディレクトリに関しては、とりわけ多くの容量を確保できます。<br />
<br />
また、RELIONの左上にある【job】メニューの対応するオプション(【Gently clean all jobs】あるいは、【Harshly clean all jobs】)を使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。 その際、特定のディレクトリを削除対象から除外したい場合には、NO_HARSH_CLEANというファイルをその中に置いてください。<br />
<br />
例えば、保護したい粒子データがjob098にある場合、次のコマンドを実行してください。<br />
<br />
$ touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
※ touchコマンドは、指定したファイルが存在しない場合には空のファイルを作成するプログラムです。存在している場合には、ファイルの修正時刻を変更します。</div>
Nakamu
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION3%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELION3チュートリアル
2019-02-10T14:51:10Z
<p>Nakamu: /* De novo 3D model generation (3Dモデル形成) */</p>
<hr />
<div>'''RELION3'''<br />
<br />
==1 前処理==<br />
<br />
===1.1 解析の準備===<br />
私たちはプロジェクトごとに、すなわち構造解析したいものごとに一つのディレクトリを作成することをお勧めします。これをプロジェクトディレクトリと呼びます。'''プロジェクトディレクトリからRELION GUIを毎回起動することは重要です。'''プロジェクトディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式かTIFF形式で保存するための別のディレクトリを作成してください。もしすべての動画が一つのディレクトリにある場合には、このディレクトリをMovies/とした方が好ましいでしょう。また、異なるディレクトリにある場合(例えば、違う日に集めたもの)には、Movies/15jan16またはMovies/23jan16とするといいでしょう。もし何か理由があり、RELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成することができます。<br />
<br />
単一画像の顕微鏡写真にはmrc拡張子を、動画にはmrc、mrcs、tiff拡張子をつけることができます。チュートリアルのデータを解凍したとき、プロジェクトディレクトリ(Movies/)は作成されています。このディレクトリは、TIFF形式に圧縮された24つの動画、gain.mrc、実験の情報を含んだNOTESファイルが含まれています。<br />
<br />
RELIONを起動してみましょう。前述のように、RELIONは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。その為、新しいディレクトリで初めてRELIONを起動するときは、バックグラウンドで起動するための&の文字を使うべきではありません。プロジェクトディレクトリの中にいることを確認し、入力でRELIONを起動します。<br />
<br />
relion <br />
<br />
そして新しいRELIONプロジェクトを作動するために“y“と答えます。<br />
最初にすることとして、パイプラインの中に録画した顕微鏡動画の取り込みを行います。<br />
job-typeブラウザから”Import”を選択し、以下のパラメータを埋めます。<br />
<br />
●Input files: Movies/*.tiff <br />
●Node type: 2D micrograph movies <br />
<br />
これを行うことで、Current job: Give_alias_hereという空欄に効果的なaliasを規定すrことができます。[Run now!]ボタンをクリックし、job起動します。Import/job001というディレクトリが作成され、Import/moviesというこのディレクトリへのシンボリックリンクが一緒に作成されます。STARファイルとすべての動画が新しいディレクトリの中に作成されます。中を見てみましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし違うソフトウェアで粒子を抽出した場合は、後述の事前処理を行う代わりに、STARファイルや3次元レファレンス、3次元マスクなどを取り込むために“Import”job-typeを使用してください。これについてはRELIONを使用する際の責任は取りません。また、ユーザーは正しいSTARファイルの生成に責任を取ってください。<br />
<br />
===1.2 電子線により誘起される画像の動きの補正===<br />
Motion correction job-typeは便利な全体フレーム動画の調整のためのUCSF MOTIONCOR2[21]ラッパーを規定します。あるいは、バージョン3.0以降はMOTIONCOR2と同じアルゴリズムであるRELION独自の実装を使用することもできます。RELION独自の実装はCPU でのみの実行となるので注意してください。[I/O]タブで設定をします。<br />
<br />
●Input movies STAR file: Import/movies/movies.star<br />
([Browse]ボタンで参照できるファイルは、STAR形式の動画ファイ <br />
ルのみです。)<br />
●First frame for corrected sum: 1<br />
●Last frame for corrected sum: 0<br />
(これはすべての動画フレームに使用する際の結果です。)<br />
●Pixel size(A) 0.885<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
●Do dose-weighting? Yes<br />
●Save non-dose-weighted as well? No<br />
(いくつかの非用量加重顕微鏡写真にはCTF推定を行う方がよいで <br />
しょう。ディスク容量を節約するために、データが非常に良いの <br />
でこのオプションは使用しません。)<br />
<br />
[Motioncor2]タブは以下のように入力します。<br />
●Bfactor: 150<br />
(超高解像度動画ではより大きい価値を使用します。)<br />
●Number of patches X,Y 5 5<br />
●Group frames: 1<br />
●Binning factor: 1<br />
(超高解像度動画ではたいてい2を使用します。)<br />
●Gain-reference image: Movies/gain.mrc<br />
(これは、オンザフライでのgain-reference補正用のgain- <br />
referenceファイルを規定するために使用できます。これらの動 <br />
画はまだgain補正されていないので、この場合には必要です。)<br />
●Defect file:<br />
(これは検出器上の壊れたピクセルを隠すために使用することがで <br />
きます。)<br />
●Gain rotation: No rotation (0)<br />
●Gain flip: No flipping (0)<br />
(gain-reference画像はこのデータセットのために既に補正されて <br />
います。)<br />
●Use RELION’s own implementation? Yes<br />
(これによって、UCSF実装をインストールする必要性が少なくなり <br />
ます。どちらにせよ、UCSFプログラムをインストールしている場 <br />
合は、それを使用することもできます。その場合、以下のオプシ <br />
ョンも入力する必要があります。)<br />
<br />
[Running]タブは以下のように入力します。<br />
●Do dose-weighing? Yes<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
<br />
このプログラムの実行には手頃な12スレッドの最新機器を用いればおおよそ5分かかります。MOTIONCOR2アルゴリズムのRELION独自の実装はGPUでは使用しないことに注意してください。しかしそれはマルチスレッドです。各スレッドは独立して動画フレーム場で動作するので、動画フレームの数をスレッドの数で割った数が整数になるように、いくつかのスレッドを使用することが最適です。これらの動画は24フレームあるので、12スレッドを使用すると各スレッドで2フレームが処理されます。[Run now!]ボタンの下の[Display:]ボタンからout:logfile.pdfを選択することで、推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで、値が合計された顕微鏡写真を見ることができます。スクリーンサイズに依存して、見やすいように、顕微鏡写真(Scale:0.3)を縮小し、Sigma contrast:3を使い、見やすい数のコラム(例として、Number of columns:3)にするべきです。[Display:]ボタンから表示したときから顕微鏡写真は選択できないことに注意してください。もし、取り除きたい顕微鏡写真がある場合(今回はすべていい画像なので削除しないだろうが)は[Subset selection]job-typeが使用できます。<br />
<br />
===1.3 CTF推定===<br />
次に、それぞれ補正した顕微鏡写真からCTFの値を推定します。速度の為Kai ZhangのGCTFのためのラッパーとして[CTF estimation]job-typeにします。適切なGPUがない場合、Alexis RohouとNiko GrigoreffのCTFFIND4.1を使用することができます。[I/O]タブで、[Motion correction]jobのcorrected_micrographs.starファイルを選択するために[Browse]ボタンを使用します。また、他のタブは以下のように入力します。<br />
<br />
I/Oタブにおいて<br />
●Use micrograph without dose-weighting? No<br />
(これらは重み付けされたものよりも良いThon ringsを持っているが、書き出さないことを前のステップで決めました。)<br />
●Sperical aberration (mm): 1.4<br />
(顕微鏡メーカーがこの値を提供してくれています。)<br />
●Voltage (kV): 200<br />
●Amplitude contrast: 0.1<br />
(強度コントラストはほとんどないことが知られていますが、約10%の値を与えることで、多くの構造の結果がよくなることが示されています。これは低周波数の弱い散乱がモデル化されていないからです。)<br />
●Magnified pixel size (A): 0.885<br />
(これらはピクセルサイズ0.885Aのもとの動画です。)<br />
●Amount of astigmatism (A): 100<br />
(範囲が適切に調整されていれば、この値は多くのデータセットに適しています。)<br />
<br />
Searchesタブにおいて、CIFFINDの一般的な値を設定します(正確な意味については、Nikoのドキュメンテーションを参照してください)。これらの設定は、GCTFを使用する場合には無視してください(デフォルトで、これをオフに切り替えることができるが)。<br />
●FFT box size (pix): 512<br />
●Minimum resolution (A): 30<br />
●Maximum resolution (A): 7.1<br />
●Minimum defocus cvalue (A): 5000<br />
●Maximum defocus cvalue (A):50000<br />
●Defocus step size (A): 500<br />
●Amount of astigmatism (A): 100<br />
●Estimate phase shifts No<br />
(これはphase-plateデータだけに役に立つ)<br />
GCTFを使用する場合はCTFFIND-4.1タブを無視してください。逆にGCTFを使用しない場合はCTFFIND-4.1タブウィ使用してください。今回の例として、GCTFを使用し、Getfタブを設定します。<br />
●Use Gctf instead? Yes<br />
●Gctf executable: /wherever/it/is/Gctf<br />
(環境変数である$RELION_CTFFIND_EXECUTABLEと$RELION_GCTF_EXECUTABLEは対応するプログラムのGUIエントリのデフォルト値を制御するために使用されます。)<br />
●Ignore ‘Searches’ parameters? Yes<br />
(GCTFにSearchesタブのパラメーターを渡すにはこれを’No’に設定します。デフォルトでは、これらの値は無視され、GCTF独自のデフォルトが使用されます。)<br />
●Perform equi-phase averaging? Yes<br />
(これによりThon ringのSNRが向上します。)<br />
●Other Gctf options:<br />
●Which GPUs to use: 0<br />
(この小さいデータセットには1GPUで十分でしょう。)<br />
<br />
マシンに応じて、複数のMPI処理を使用してプログラムを実行することができます。1プロセッサーとGPUのみを使用すると、動作はGCTFを使用すると31秒かかります。いったん動作が終わると、出力のCtfFind/job003/Moviesという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFINDを使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
Display:ボタンを使用してout:micrographs_ctf.starを選択すると、すべてのThon ring画像を見ることができます。実験の画像のThon rings間の0はモデルの0と一致するはずです。デフォーカス、最高分解能や性能指数などの順番の表示を並べ替えることができます。log.pdfファイルにはすべての顕微鏡写真に対する、デフォーカス、非点収差、推定解像度などの有用なパラメータのプロットとデータセット全体のヒストグラムが含まれています。データ収集における問題点を見つけ出すのに役に立ちます。<br />
もしCTFモデルが実験のThon ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除して、Finished jobsリストからCtfFind/job003を選択し、parameter-panel の値を修正し、Continue nowボタンをクリックすることでjobを再実行することができます。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できないまたは、不十分なThon ringがあり顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
===1.4手動粒子抽出===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の「粒子座標」を手動で選択して使用します。自分たちのデータをより理解できるように少なくとも複数の顕微鏡写真を選択するのがよいでしょう。選択した粒子を使用して、参照なしの2Dクラス平均を計算し、その後、これらの粒子は全データセットの粒子を自動検出するためのテンプレートになります。しかしRELION3.0以降は、Laplacian-of-Gaussian(LoG)フィルターに基づく参照なしの自動抽出手順が含まれています。これまでにテストされたほとんどの場合、この手順は適切な開始座標を提供してくれるので、Manual pickingステップは飛ばすことができます。relion_it.pyスクリプトはこの機能を使用して、完全に自動化されたオンザフライ処理を実行します。このチュートリアルでは、説明のためにManual picking jobを起動し、その後LoGベースのAuto-pickingを継続して最初の粒子セットを細分化します。<br />
手動粒子検出は経験あるのみです!RELIONで手動で粒子の検出をするのが好きでなければ、Jude ShortのXIMDISP[17](任意の拡張子付きで)、XMIPP-2.4[16](任意の拡張子付きで)、Steven LudtkeのE2BOXER.PY[18](.boxの拡張子付きで)の座標形式ファイルもサポートしています。もしこれらを使用する場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存してください。そして、同じ顕微鏡写真のルートネームは異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMovies/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Input Files:の欄に整理されたファイルのsuffix拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例だと、それぞれMovies/*.boxやMovies/*_pick.starになります。<br />
Manual picking jobタイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBrowseボタンを使用して、Colorsタブは無視して、Displayタブは下のように入力します。<br />
●Prticle diameter (A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
●Scale for micrographs: 0.25<br />
(これは画面サイズによります。)<br />
●Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。黒が標準偏差の3倍低く、白が標準偏差の3倍高くなります。グレースケールは黒から白へ直線的に変化します。詳細はDisplayImages entry on the RELION wikiを参照してください。)<br />
●White value: 0<br />
(どの値を白にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Black value: 0<br />
(どの値を黒にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Lowpass filter (A):20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくするための動作です。)<br />
●Highpass filter (A): 0<br />
(これは顕微鏡写真上の濃淡のグラデーションを取り除くのに役立ちます。)<br />
●Pixel size: 0.885<br />
(これは粒子の直径や、low-pass filterとhigh-pass filterの計算に必要です。)<br />
●Scale for CTF image:1<br />
(これは単にそれぞれの顕微鏡写真のCTFボタンをクリックしたときにThon ring画像がどれくらい大きくなるのか調節します。)<br />
Run now!ボタンをクリックすることでjobが実行され、必要に応じていくつかの粒子をクリックしてください。しかし、次のセクションではLoGベースの自動抽出を使用するので、必要でなければ選ぶことはありません。最初の[2D classification] jobに手動抽出した粒子を使用する場合は、適切なクラス平均を計算するために約500~1000個の粒子が必要になります。左クリックで選択、中クリックで選択された粒子の削除、右クリックで座標を保存する必要があるポップアップメニューが表示されます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでもメニューから保存した座標のSTARファイルに戻ることができます(ポップアップメニューの座標を使用してSTARファイルを保存した場合)。<br />
<br />
===1.5 LoGベース自動選択===<br />
今回は、Laplacian-of-Gaussian(Log)フィルタに基づくテンプレートフリーの自動抽出の手順を使用して、最初の粒子セットを選択して下さい。その後、それらの粒子は[2D classification]jobで使用され、2番目の[Auto-picking]jobのテンプレートが生成されます。初期段階では多くの粒子を必要としないので、最初の3枚の顕微鏡写真に対してのみLoGべーすの自動抽出を実行します。一般的に、可能な限り良いテンプレートを得るために、おそらく使用可能なすべての顕微鏡写真に対してLoGベースの抽出を実行します。しかし、今回はこのチュートリアルの計算速度を上げるためにいくつかの顕微鏡写真のみを使用します。<br />
最初にいくつかの顕微鏡写真を選択するために、[Subset selection]jobに移動し、I/Oタブで下を除くすべての空欄をままにします。<br />
●OR select from picked cords: ManualPick/job004/cords_suffix_manualpick.star<br />
(手動抽出で座標を保存したときに生成されます。今回は座標を使用するつもりはなく、顕微鏡写真のサブセットセレクションを行うためにそのjobを使用しているだけです。)<br />
<br />
このjobにはalias 5micsを使用しました。Run!ボタンを押し、[Manual picking]jobと同じポップアップウィンドウを再び押すと、すべてのpickとCTFボタンが表示されます。‘File’メニューを使用して‘Invert selection’:最初の5枚の顕微鏡写真の前にあるチェックボックスをクリックして選択します。その後、‘File’メニューを再び使用して‘Save selection’を選択します。これで、ManualPick/job004/micrographs_selected.starというファイルができ、これを下記の[Auto-picking]jobに使用します。<br />
その後、[Auto-picking]jobを処理し、I/Oタブの設定を行います。<br />
<br />
●Input micrographs for autopick: Select/job005/micrographs_selected.star<br />
●Pixels size in micrographs (A) -1<br />
(ピクセルサイズは入力STARファイルの中の情報から自動的に設定されます。)<br />
●2D references:<br />
(テンプレートフリーのLoGベースの自動抽出では空欄のままにします。)<br />
●OR: provides a 3D reference? No<br />
●OR: use Laplacian-of-Gaussian? Yes<br />
<br />
Laplacianタブの設定をします。<br />
●Min. diameter for loG filter (A) 150<br />
●Max. diameter for loG filter (A) 180<br />
(これは粒子投影のオングストロームの最小最大のサイズに対応します。)<br />
●Are the particles white? No<br />
(黒です。)<br />
●Maximum resolution to consider 20<br />
(ここはデフォルト値のままでいいです。)<br />
●Adjust default threshold 0<br />
(正の値、すなわち閾値はより少ない粒子を選び、負の値もより少ない粒子を選んでください。有用な値は、おそらく[-1,1]の範囲ですが、多くの場合デフォルト値の0は正しい働きをします。)<br />
<br />
Referencesタブは無視して、autopickingタブの最初の四つのオプションは無視してください。下記のように設定してください。<br />
●Write FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Read FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Shrink factor: 0<br />
(縮小を0に設定すると、自動抽出プログラムは参照上のローパスフィルタの解像度に合わせて顕微鏡写真を縮小します。これはすごく早くなり、必要なメモリが少なくなるため、このチュートリアルを素早く実行するのに便利になります。0と1の間の値は顕微鏡写真のサイズの少数で表されるでしょう。これは縮小で1を使用するよりも正確な抽出が少なくなること、つまり縮小がないことに注意してください。この新しいパラメータの詳細は、次のサブセクションで説明します。)<br />
●Use GPU acceleration? No<br />
(計算速度がとても速いので、LoGベースの自動抽出はGPU加速されていません。)<br />
●Which GPUs to use:<br />
<br />
Helixタブを無視して、Running tabで単一MPIプロセッサを使用して実行します。もしかするとLoG_basedのようなaliasが有用かもしれません。単一プロセッサを使用すると、これらの計算は、私たちのコンピュータでは約40秒かかります。<br />
Display:ボタンのcoords_suffix_autopickオプションをクリックすることで結果をチェックすることができます。この段階で表示されるポップアップウィンドウで手動で粒子を追加/削除できます。さらに、autopickingタブのノイズの標準偏差と平均のパラメータやLaplacianタブのデフォルトの閾値の調節をしている間、新しいjobを実行して、より多くの、またはより少ない粒子を抽出することができます。しかし、この段階では、単に2回目のauto-picking jobのテンプレート作成のための最初の粒子セットなので、多くの場合これは必要ないでしょう。<br />
<br />
<br />
<br />
<br />
==2 Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。 <br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。 <br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
<br />
===2.1 Running the job(動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他のオプションは、前述の自動検出のテンプレートを作成した時と同じです。 <br />
●Input images STAR file: Select/after_sorting/particle.star<br />
【Optimisation(最適化)】タブを次の通りにセットします。 <br />
●Number of class: 100<br />
(今、たくさんの粒子を持っています。)<br />
After_sortingのようなエイリアスを用いると、20分ほどで終わります。<br />
動作が終了したら、_model.starファイルを選択して【Subset selection】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度のゴーストのように見える【Einstein-from-noise】クラスに気を付けてください。こうしたクラスの選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。 <br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている外れ画像を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。 <br />
す <br />
===2.2 Analysing the results in more detail(より詳細な結果の分析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。 2D クラス平均算出の最終反復時では、以下のファイルが作成されます。 <br />
● Class2D/after_sorting/run_it025_classes.mrcs <br />
これは、クラス平均結果をMRCスタックとして保存しています。これらはメインGUIのDisplay: ボタンから _model.star を選択したときに表示される画像です。RELION は GUIから選択した場合、(GUIを選択した場合)、クラス平均はおそらく黒い背景が白くなるだろう。そのためクラス平均はおそらく黒い背景に対して白いものになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。 2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶媒領域を期待したいところです。 <br />
溶媒領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で分解能に制限をかけてみて下さい。 <br />
●Class2D/after_sorting/run_it025_model.star <br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(クラス間の画像の分布、再構成された構造中のシグナル対ノイズ比の球面平均、全てのグループのノイズスペクトラム)を含んでいます。 <br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低分解能のクラスにある粒子はほとんどない一方で、高分解能のクラスに存在する粒子は多いと分かる。 <br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである) <br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。 <br />
<br />
●Class2D/after_sorting/run_it025_data.star<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。そのメタデータとは、particles.star fileに入力した情報の他に、最適な方向、最適なクラス同定、対数尤度への寄与、などに関する追加情報です。 <br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。 <br />
●Class2D/after_sorting/run_it025_optimiser.star <br />
これは終了しなかった場合の再起動に必要な精密化過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そのときに、Optimisationタブ上で <br />
Number of iterations:40 <br />
と設定して下さい。このジョブは、反復26から反復40名で繰り返されるだろう。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれません。optimiser.starファイルのもう1つの有用な特徴として、1行目に、これを動かすために与えられた正確なコマンドライン引数がコメントとして含まれています。 <br />
●Class2D/after_sorting/run_it025_sampling.star <br />
これはサンプリング間隔の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
===2.3 Making groups===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
<br />
RELIONは、粒子をグループ化する際に、以下のふたつのことを実行します。ひとつは、平均のノイズのスペクトラム強度(σij^2)の推定と単一数としての強度スケールファクター(τi^2)の推定です。後者は、そのデータの異なる部分の間での、全領域シグナル対ノイズ比(SNRi)の違いを表現しており、例えば、氷の厚さ、デフォーカスまたは汚染等によるものです。 <br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱っています。この動作は顕微鏡写真ごとに多くの粒子が存在する場合には良いです。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、強度スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしていますが、2D,3Dクラス化後、各グループの粒子の初期数はより少なくなるだろうということに注意しておいて下さい。 <br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真からの粒子をグループ化することをお薦めします。このことから、RELION 2.0での新しいGUIとして【Subset selection】の中に便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。 <br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正がされます。<br />
<br />
==3 De novo 3D model generation (3Dモデル形成)==<br />
RELIONは、2Dの粒子から| 3D initial model | (3Dの初めのモデル)を生成することからSGDアルゴリズムを用いる。RELION-3.0によると、実行はcryoSPARCプログラムの実行にとてもよく従う。見ている方向とデータの合理的な配分の生成は(2D classification)の詳細なクラス平均を産出するために十分いい。このアルゴリズムは、適切な産出にとてもふさわしく、それ以降の低解像度モデルは、3D classificationか3D auto-refunementで利用できる。ここで留意すべきは、リリースされた3.0の実行の改善は、もはや2D classification動作からクラスにつき選択されたランダムな分子とともに分子の部分集合を選択することをしないことである。代わりに、選択された分子の一式の全体のデータを用いた時、そのアルゴリズムはとてもたくましいものである。<br />
<br />
===3.1 Running the job (動作の実行)===<br />
3D initial model のジョブタイプのI/Oタブのselect/class2d_aftersort/particles.starファイルを選択する。すべては、すでにCTFで順番にしている。OptimisationタブのFillにより従う(角のある初期状態の放置とサンプリングの相殺)<br />
●Number of class : 1<br />
(時々、一つのクラスより大きいもの。0をつかうと、データセットにまだ存在するだろう至適な分子のシンクの生成を助けるだろう。追加された議論sgd_skip_annealはまだ有用だろう。この場合、私たちはスピードアップするための一つのクラスをつかうだろう。)<br />
●Mask diameter (A) : 200<br />
前と同じ<br />
●Flatten and enforce non-negative solvent : Yes<br />
●Symmetry C1<br />
(対称性がなにかもわからないとき、C1の再構築はおそらく、始めることにベストな選択であるだろう。いくつかの高い対称性の物体は正しい空間グループよりC1のSGDによる解法が簡単だろう。このデータセットはいいデータで、正しいポイントグループD2が動作できる。しかしながら、C1からC2にどのように進行するかを説明すると、C1のSGDを動かすだろう。)<br />
特に、実例の1つに、SGDタブのいくつかに変えることはできないことと、その初期状態はいくつかの場合に適している。しかしながら、このチュートリアルのスピードアップすることは、私たちは、反復のデフォルトの数の半分だけ行うだろう。<br />
したがって、このように変化する。:<br />
●Number of initial iterations : 25<br />
●Number of in-between iterations : 100<br />
●Number of final iterations : 25<br />
Gomputeタブで、システム上で最適化する。再度RAMの中で数千の分子がプレリードできる。GPUの加速は、スピードアップを実現でき、反復の間の複数の極大化のステップは、2Dか3Dの精密化か分類の基準の準備はゆっくりになるだろう。4CPUのカードと、5MPInoプロセス、6スレッドのMPIプロセスを使い、システムはおよそ15分で済む。<br />
<br />
===3.2 Analysis the result (結果の分析)===<br />
UCSFキメラのような3Dビューワーの吐出量(Initial Model/job017/run-it/50_class001.mrc)を見る。もし、このポイントにおける対照的なポイントグループの追加を認識することは、RELIONの習慣における協調的なシステムの中心的なX,Y,軸における対照的な軸を整列させることを必要とするだろう。リリースされた3.0は新しいプログラムを促進することを含む。<br />
この動作はコマンドラインから実行できる。<br />
●Relion_align_symmetry - - i InitialModel/job017/run_it150_class001.mrc - -o InitialModel/job017/run_it150_class001_alignD2.mrc - -sym D2<br />
それと、マップにおける対照的な軸のUCSFキメラかrelion_displayの確認はX,YとZ軸の実際の整列とする。私たちはD2の対称的なものを使うことを強要させるだろう。<br />
●Relion_image_handler –i InitialModel/job017/run_it150_class001_alignD2.mrc –o InitialModel/job017/run_it150_class001_symD2.mrc –sym D2<br />
後者のコマンドの出力マップは、入力マップに似ているだろう。<br />
これによって確認できる。<br />
●relion_display_ --i InitialModel / job017 / run_it150_class001_alignD2.mrc & relion_display –i InitialModel / job017 / run_it150_class001_symD2.mrc &<br />
<br />
==Unsupervised 3D classification (教師無3次元クラス分類)==<br />
すべてのデータは異性分からなっています。問題は、どのくらいの費用でいられるかです。RELIONの3Dマルチリファレンス精密化手順は、強力な教師なし3次元分類へのアプローチを提供しています。<br />
<br />
===Running the job (ジョブを開始)===<br />
教師なし3次元分類は、[3D classification] ジョブタイプから、実行可能です。<br />
[I/O]タブの設定:<br />
●Input images STAR file: Select/class2d_aftersort/particles.star<br />
●Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
このマップはパイプラインの部分のように、Brouseボタンで表れないように述べる。両方のタイプは空のフィールドの中に名付けられるか、importジョブタイプをつかうマップの移入が行われる。対照的なC1を動作させたり、非対称的なInitialModel / job017 / run_it150_class.mrcを使いことを選択する。しかしながら、すでに右の対称的なセッティングは、後々とても楽になるだろう。<br />
●Reference mask (optional):<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供するところです。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類へのバイアスを最小限にする働きがあります。)<br />
[Reference]タブの設定: <br />
●Ref. map is on absolute greyscale: No<br />
(このマップがデータセットから再構築されたとき、すでに正しいグレースケールであります。RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
●Initial low-pass filter (A): 50<br />
(精密化プロセスにバイアスが導入する可能性があるため、高解像度の初期参照モデルは使用してはいけません。[12]で説明したように、初期マップをできる限りフィルタリングする必要があります。リボソームでは大抵、70Åを使用し、小さい粒子では通常40〜60Åの値を使用します。)<br />
●Symmetry: C1<br />
(このサンプルはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。良くない粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
●Do CTF corection? Yes<br />
●Has reference been CTF-correced? Yes<br />
(このモデルは、SGDのCTFコレクションによって作られている。)<br />
●Have data been phase flipped? No<br />
●Ignore CTFs untill first peak? No<br />
(リファレンスを作成するために使用した[2D classification]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
【Optimisation】タブの設定: <br />
●Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。) <br />
●Number of iterations: 25<br />
(これは一般的には変更する必要はありません。) <br />
●Regularisation parameter T: 4<br />
(Tの定義については[13]を参照してください。クライオEMの、2次元分類では、通常、Tは1~2を設定し、3次元分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均にノイズが見える場合はTの値を低くし、逆にクラス平均の分解能が低すぎる場合はTの値を高くします。主に気をつけなければならない点は、高解像度のノイズの過学習です。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
●Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。) <br />
●Mask individual particles with zeros? Yes<br />
(Yes: 0 / No: 乱数) <br />
●Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過学習を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
【Helix】タブは無視して下さい。 <br />
以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。 <br />
ここでも、【Running】タブで、使用するNumber of MPI processors(MPIプロセッサの数)とthreads(スレッド数)を指定できます。[2D classification]のjobタイプで説明したように、3次元分類は2次元分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3次元分類を表示するためにfirst_exhaustiveのようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。 <br />
精密化された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を確認できます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。 <br />
UCSFキメラなどを使用し、表示されたマップを3Dで見ると、マップが精密化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。 <br />
2次元分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示ウィンドウには、4つの精密化されたモデルの中央スライスが表示されます。最適なクラスを選択し、右クリックメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
===Analysing the results in more detail (詳細な結果の解析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
出力ファイルは基本的に2次元分類の実行時と同じです。(実際に2次元,3次元精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2次元クラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。例えば、run_it025_class00?.mrcというMRCマップです。 <br />
今まで通り、小さいクラスは大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比(SNR)が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。 <br />
●relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnuplotがインストールされているのであれば、以下の通りに入力して下さい。 <br />
●relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。 <br />
●grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
==High-resolution 3D refinement(三次元精密化)==<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は分解能を推定するために、gold-standard Fourier Shell Correlation(FSC)(二つの群に分け、互いに独立して再構成した場合に、どの分解能まで相関があるかにより判断)と言われる判断基準を用います。これにより、過学習を避けることができます[15]。角度の割当の正確さを推定する新しい手順([14])と組み合わせ、精密化が収束するときに自動的に決定されます。そのため、この手順は使用者の入力をほとんど必要としません。すなわち、客観性をのこしたまま、多くのデータセットのための優れたマップが生成がされていると述べられています。もう一つの長所は、一般的にこの手順は必要な実行回数が一回のみであり、最適化のための引数はほとんどありません。<br />
しかしながら、前に高解像度の精密化を始めた時、スケール未満とともに選ばれた粒子の正しいセットを再度抽出して、それによりもしかすると高解像度になるかもしれない。これをすることで、GUIのParticle extraction のジョブタイプとI/Oタブを与える。<br />
●micrograph STAR file : CtfFind / job003 / micrographs – ctf.star<br />
(そのままでよい)<br />
●Coordinate – file suffix : <br />
(空でよい)<br />
●OR re – extract refined particles ? Yes<br />
●Refined particles STAR file : Select /class3d – first_exhausitive / particle.star<br />
(今、選択された粒子の微粒にされたサブセットだけをつかうだろう)<br />
●Re – center refined coodinates ? Yes<br />
(3D classificationの動作以上から整列させたオフセットに従ってすべての粒子は再度中央に置かれるだろう)<br />
●Recenter on – X , Y , Z (pix) 0.0.0<br />
(箱の真ん中の分子を中心にキープさせたい)<br />
●Manually set pixel size ? No<br />
(入力したマイクログラフstarファイルはCTFの情報に含まれていないことが必要である。)<br />
Extractタブはすべてキープする。<br />
●Particle box size (pix) 360<br />
(大きな箱をつかうだろう。それにより非局在化させたCTFシグナルはより良いモデルになるだろう。これはCTF精密化の後が大事である。)<br />
●Rescale particles ? yes<br />
(とても大きな画像が働くことを防ぐことで、360×0.885/256 = 1.244 Åのピクセルサイズを減少させ、採取しましょう。これは、おそらく十分に小さいデータ、2.5 Åの大きな達成可能な解像度に制限があるだろう。)<br />
この動作では、エイリアスbest3dclass_bigboxを使用する。<br />
加えて、256ピクセルのボックスサイズに従って一番いいマップを入手したことのいたずらは必要である。<br />
●relion_image_handler –i Class3D/job018/run_it025_class001.mrc –angpix 3.54 –rescale_angpix 1.244 –o Class3D/job018/run_it025_class001_box256.mrc –new_box256 <br />
<br />
===Running the auto-refine job (自動精錬動作の実行)===<br />
3D auto-refine のジョブタイプのI/Oタブ<br />
●Input images STAR file : Extract/best3dclass_fullsize/particles.star<br />
●Reference map : Class3D / job018 / run_it025_class001_box256.mrc<br />
●Reference mask (optional)<br />
(からのままでいい)<br />
Reference タブ<br />
●Ref. map is on absolute gryscale ? No<br />
スケール現象の画像の違う標準化によると、正しく絶対的なグレースケールはマップの中に確立しなかった。このオプションの“No”は大事で、精密化の最初の相互作用のグレースケールは正しくなるだろう。<br />
●Initial low-pass filter (A) 50<br />
マップの高い頻度の成分に向かってバイアスを防いだことは低いパスのフィルターから自動精密化され始める。それと解像度から完全に依存された粒子の“gold standard”の維持は、1頭文字より高かった。<br />
●Symmetry D2<br />
(高解像度の粒子の照準は、強要された対称性の粒子の4倍効率的にするだろう)<br />
CTFのパラメータで、OpimisationとAuto-samplingタブは、3D classificationと同じでとどまる<br />
【Sampling】タブでの配向性のサンプリング間隔は反復の最初の数回のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング間隔が自動的に細かくなっていきます。したがって、8面体または正20面体対称よりも小さい角度で、全ての精密化仮定でで、一般的に大域探索では、初期値の角度である7.5度のサンプルを使用し、局所探索では1.8度のサンプルから行います。より正確な対称の精密化を行う場合のみ、3.7度でのサンプリングを行い、局所探索では0.9度ごとにサンプリングを行います。<br />
MPIのノードは1つのマスター(他のスレーブを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用するもの)のセットで分かれているので、奇数のMPI処理装置を使用するのが最も効率が良いです。ナイキスト周波数までのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。従って、使っているクラスターノードのコアと同じ数のスレッドで動かしたいデータセットのボックスより大きいサイズで作られたボックスが必要です。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
===Analysing the results (結果の分析)===<br />
出力ファイルは3D classificationを実行したときのものと大部分が同じです。しかし、全てにおけるプログラムの反復では、2つのrun_it0??_half?_model.starと2つのrun_it0??_half?_class001.mrcファイルを書き出します。それぞれデータの半分が精密化されます。収束した場合にのみ、ひとつのrun_model.starとrun_class001.mrcファイルを書き出します(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。 <br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[14]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルからも抽出されるかもしれません。 <br />
例えば、以下のように試してみてください。 <br />
●grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
==11 まとめ==<br />
<br />
===11.1 フローチャートの作成===<br />
<br />
どのようにして最終的な再構築をするか気になるでしょう。'''''Finished job'''''リストから実行した最後の動作を選択し、'''''Job actions'''''ボタンから'''Make flowchart'''オプションを試してください。これを実行するためにはシステムに'''LATEX'''や'''TikZ'''パッケージが必要となります。最初の項は正確な作業名のないフローチャートの全体像です。これは、出版目的に役立つでしょう(おそらくお気に入りの'''vector-based design'''プログラムの編集後に)。フローチャートの全体像の後に、最初の詳細なフローチャートにどのようにして終了するかが示されています。10ステップ以上からなるフローチャートは複数の構成要素に分けられることに注意してください。作業中に複数枝分かれすることがあるでしょう。それ故に、最終作業のフローチャートに従って、それぞれの分岐についてフローチャートがあるでしょう。リンクをクリックすることでPDFファイルから合致する位置を得ることができます。<br />
<br />
===11.2 ディレクトリのクリーンアップ===<br />
<br />
ディスクの空間を確保するために、RELIONは作業ディレクトリをクリーンアップするオプションを持っています。これには2つのモードがあります。'''''gentle'''''クリーンは作業ディレクトリから中間ファイルのみを削除します。'''''harsh'''''クリーンは作業からのインプットを必要とする新たな作業を開始するのに必要なファイルを削除します。例えば、'''''harsh'''''クリーンは'''Motion Corr'''作業から平均化された、あるいは'''Particle extraction'''作業から少量のスタックを抽出された顕微鏡写真を削除します。一方、'''''gentle'''''クリーンは'''2D classification''', '''3D classification'''あるいは'''3D auto-refine'''作業の中間反復からすべてのファイルを削除します。'''Job actions'''ボタンから個別に作業をクリーンアップすることができます。あるいは、GUIのトップメニューから下がった、'''''Jobs'''''からすべての作業をクリーンアップすることができます。私たちは計算前の結果に頭を悩ませていたプロジェクトディレクトリの'''tarball'''を作る前にそのメニューから'''''Gently clean all jobs'''''オプションを使いました。長期間保存されていたデータを取る前にプロジェクトディレクトリをクリーンアップしたいでしょう。<br />
<br />
===11.3 質問や引用===<br />
<br />
以上です!このチュートリアルを楽しんで、そして役に立つことを願います。もしRELIONについて質問があれば、初めに'''RELION Wiki'''の'''FAQ'''と'''CCPEMメーリングリスト'''を確認してください。それが助けにならなければ、'''CCPEMリスト'''を利用して質問してください。お願いですから、決してSjorsに直接メールを送信しないでください。質問全てに返答できるわけではありません。もしRELIONが利用者の研究に有益であると思ったら私たちの[http://www2.mrc-lmb.cam.ac.uk/groups/scheres/publications.html 論文]を引用し、あなたの研究仲間たちに伝えてください。<br />
<br />
===11.4 参考文献===<br />
<br />
RELIONの手順の改善を支持した理論の詳細は以下の論文で述べられています。<br />
* S.H.W. Scheres (2012) “''RELION: Implementation of a Bayesian approach to cryo-EM structure determination''” J. Struc. Biol., 180, 519-530.<br />
<br />
*S.H.W. Scheres (2012) “''A Bayesian view on cryo-EM structure determination''” J. Mol. Biol., 415, 406-418.<br />
<br />
RELIONの使い方に関する包括的な概観は以下の論文に述べられています。<br />
<br />
*S.H.W. Scheres (2016) “''Processing of structurally heterogeneous cryo-EM data in RELION''” Meth. Enzym., 579, 125-157.<br />
<br />
<br />
==12 付録 A:インストールの注意==<br />
<br />
===12.1 MPIのインストール===<br />
<br />
'''MPI(message passing interface)'''がインストールされた計算機クラスター、もしくはNVIDIA GPU搭載のマルチコアデスクトップマシンが必要になることに注意してください。RELIONをコンパイルするには、'''mpi-devel'''パッケージが必要です。おそらく存在する種類'''(MPICH, LAM-MPI, etc)'''またはバージョンはそれほど重要ではありません。まだシステム内に'''mpi-devel'''をインストールしてなければ、'''openMPI'''をインストールすることをお勧めします。<br />
<br />
===12.2 CUDAのインストール===<br />
<br />
'''NVIDIA'''の比較的新しいGPU('''compute capability 3.5+'''以上)を持っている場合、オートピッキング、分類、精密化作業を高速に実行できます。'''GPU-accelerationサポート'''を含むRELIONをコンパイルするには、'''CUDA'''をインストールする必要があります。このチュートリアルの準備には'''CUDA-8.0'''を使用しました。[https://developer.nvidia.com/cuda-downloads NVIDIAのWebサイト]からダウンロードしてください。<br />
<br />
===12.3 RELIONのインストール===<br />
<br />
RELIONはオープンソースのソフトウェアです。[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Download_%26_install the RELION wiki]から無料でダウンロードして、手順に従ってインストールしてください。もし、'''job submission system(Sun Grid EngineやPBS/TORQUE etc)'''に詳しくない場合は、インストール手順の説明にあるように、'''qsub.cshスクリプト'''の設定に関して、システム管理者にお尋ねください。分散メモリ並列化のためのMPIと、共用メモリの並列化のための'''pthreads'''の両方を使用する、いわゆるハイブリッド並列計算を実行したいときは注意してください。ジョブキューイングシステムはこれを可能とするためにいくつかの調整が必要な場合があります。再度、システム管理者にお尋ねください。<br />
<br />
===12.4 モーション補正ソフトウェアのインストール===<br />
<br />
RELION-3.0は全フレーム顕微鏡写真ムービーアライメントに使用される、'''UCSFプログラムMOTIONCOR2'''へのラッパーを提供します。[http://www.msg.ucsf.edu/agard/protocols.html Dabid Agard]のページからプログラムをダウンロードし、インストールの手順に従ってください。また、RELIONの保有する、'''MOTIONCOR2'''の実行を使うかもしれません。なので、もし、UCSF実行をインストールするのに問題が発生しても心配しないでください。バージョン3.0において、'''''Nico grigorieff’s group'''''から'''UNBLUR'''へのラッパーはGUIから中止されていることに注意してください。<br />
<br />
===12.5 CTF推定ソフトウェアのインストール===<br />
<br />
CTF推定はRELIONに含まれていません。代わりに、RELIONは'''''Alexis RohouやNiko Grigorieff’s CTFFIND4'''''へのラッパーを提供します。[http://grigoriefflab.janelia.org/datadownload Niko’s CTFFIND website]からダウンロードし、手順に従ってインストールしてください。また、もし、パソコンに'''NVIDIA graphics card(GPU)'''が入っているなら'''''Kai Zhang’s GCTF'''''を使うこともできます。その際は、LMBに関する[https://www.mrc-lmb.cam.ac.uk/kzhang/ KaiのWebサイト]からダウンロードしてください。<br />
<br />
===12.6 RESMAPのインストール===<br />
<br />
局所分解能推定はRELIONが所有するポストプロセッシングプログラムの中、あるいは'''''Alp KucukelbirのRESMAP'''''へのラッパーを通して実行される。[http://www.proditus.com/software.html AlpのRESMAP Webサイト]からダウンロードし、手順に従ってインストールしてください。<br />
<br />
<br />
<br />
<br />
== 13 付録B:RELIONの利用 ==<br />
=== 13.1 GUIについて ===<br />
<br />
==== 13.1.1 pipeline approach ====<br />
RELION-3.0では、一つのプログラムの出力を次のプログラムの入力として順次繋いでいくような情報の受け渡し(パイプライン)を円滑に実現できるようなGUIを設計しました。詳細は2016 Proceedings of the CCP-EM Spring Symposium[3]で公開されています。<br />
RELION-3.0を使うにあたって、まずプロジェクト(すなわち構造決定したい分子)ごとにディレクトリを作成することを推奨します。ここではこのディレクトリの呼称をプロジェクトディレクトリとします。RELIONのGUIは「relion」とコマンドを打つことで起動させることができますが、この動作は常にプロジェクトディレクトリに移動してから行うことを念頭に置いてください。<br />
<br />
このソフトのGUIでは、すべてのジョブや、あるジョブによる出力がどのように他のジョブの入力に使われたのかといった履歴を保存することができ、この機能によってパイプラインが形成されます。各種ジョブにはそれぞれ独自の出力ディレクトリが与えられます。ここではたとえば あるジョブの出力のためにClass2D/ というディレクトリができるとします。こういったジョブディレクトリの中でさらに新しいジョブが実行されると、その新しいジョブには一連の番号が与えられます。たとえばClass2Dのもとで作られたとあるジョブにはClass2D/job010という番号が振り分けられます。さらに、ジョブディレクトリのもとでは、Class2D/job010/run といったように出力名が定められます。このソフトでは、各ジョブに意味のある名前が付けられるような仕組みを備えるために、ファイルシステム上の個々のジョブディレクトリへの記号リンクとして実装された"エイリアス"システムを使用しています。<br />
パイプラインに関するすべての情報はdefault_pipeline.starという名前のファイルに保存されていますが、基本的にはこのファイルを見る必要はありません。もしdefault_pipeline.starファイルが壊れてしまった場合は、最後に実行したジョブディレクトリで保存されたバックアップから復元することができます。<br />
<br />
==== 13.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
このソフトのGUIは上半分と下半分に分かれています。上半分の左側にはジョブの種類が縦リスト上に並べられており、行いたいジョブを選ぶことができます。たとえば2D classificationを行いたいときは、上半分の左側のブラウザで選択すればいいわけです。上半分の右側には複数のタブがあるパネルがあり、それぞれのジョブタイプへのパラメータを入力できます。GUIの左上には機能のおおよその概要が分かる3つのメニューが書かれています。<br />
【Schedule】ボタンでは、後でジョブを実行するときのスケジューリングを行うことができます。それに対して【Run now!】ボタンは今すぐに実行したいときに使います。【Schedule】ボタンは、繰り返し実行できるよう完全自動化された「パイプライン」を用意したいときに役立ちます。たとえば、データが収集されていくにつれてそれが瞬時に反映できるようなパイプラインを実現したいときに有効です。詳細は13.3を参照してください。<br />
GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 13.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中のジョブ(【Running jobs】)、すでに完了しているジョブ(【Finished jobs】)、または後で実行するようにスケジュールされたジョブ(【Scheduled jobs】)のリストがあります。これらのリスト内のジョブをクリックすると、そのジョブのパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリが作成されることはありませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】のジョブでは、_optimiser.starというファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。【モーション補正】、【CTF推定】、【自動ピッキング】、【粒子抽出】は、これまでに行われていなかった顕微鏡写真でのみ実行されます。【Input to this job】(このjobへの入力)と【Output from this job】(このjobからの出力)は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(stdout)と標準エラー出力(stderr)がそれぞれ黒と赤のテキストで表示されます。標準エラー出力は理想的には何もない状態でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、スクロールがしやすくなるようテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 13.1.4 The Display button(ディスプレイボタン) ====<br />
runボタンとscheduleボタンの下にある【Display:】ボタンでは、各ジョブにおける最重要たる入力ファイルと出力ファイルを視覚的に表示することができます。GUIの下半分にあるjobリストのうちのひとつのjobを選択した後に【Display:】ボタンをクリックすると、選択されたjobの入力と出力がすべて(例えば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。中間体のファイルを表示するといったような一般的な機能はGUI左上の3つのメニューのうちFile>Displayを選択することで使うことができます。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第11章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(13.1.6参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
ジョブを削除すると、ジョブディレクトリ全体がプロジェクトディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、ジョブを復元することができます。<br />
<br />
ディスク容量を節約するため、ジョブを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。これには2つのクリーニングオプションがあり、片方は【gentle clean】という方法です。この方法では、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は【harsh clean】という完全なクリーニング方法です。この方法では全てのファイルを消すことになるため、より多くの容量を確保できます。その中でも【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のジョブタイプから選択できる粒子スタック、または顕微鏡写真を含むディレクトリに関しては、とりわけ多くの容量を確保できます。<br />
<br />
また、RELIONの左上にある【job】メニューの対応するオプション(【Gently clean all jobs】あるいは、【Harshly clean all jobs】)を使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。 その際、特定のディレクトリを削除対象から除外したい場合には、NO_HARSH_CLEANというファイルをその中に置いてください。<br />
<br />
例えば、保護したい粒子データがjob098にある場合、次のコマンドを実行してください。<br />
<br />
$ touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
※ touchコマンドは、指定したファイルが存在しない場合には空のファイルを作成するプログラムです。存在している場合には、ファイルの修正時刻を変更します。</div>
Nakamu
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION3%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELION3チュートリアル
2019-02-10T14:50:39Z
<p>Nakamu: /* 2.3 Making groups */</p>
<hr />
<div>'''RELION3'''<br />
<br />
==1 前処理==<br />
<br />
===1.1 解析の準備===<br />
私たちはプロジェクトごとに、すなわち構造解析したいものごとに一つのディレクトリを作成することをお勧めします。これをプロジェクトディレクトリと呼びます。'''プロジェクトディレクトリからRELION GUIを毎回起動することは重要です。'''プロジェクトディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式かTIFF形式で保存するための別のディレクトリを作成してください。もしすべての動画が一つのディレクトリにある場合には、このディレクトリをMovies/とした方が好ましいでしょう。また、異なるディレクトリにある場合(例えば、違う日に集めたもの)には、Movies/15jan16またはMovies/23jan16とするといいでしょう。もし何か理由があり、RELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成することができます。<br />
<br />
単一画像の顕微鏡写真にはmrc拡張子を、動画にはmrc、mrcs、tiff拡張子をつけることができます。チュートリアルのデータを解凍したとき、プロジェクトディレクトリ(Movies/)は作成されています。このディレクトリは、TIFF形式に圧縮された24つの動画、gain.mrc、実験の情報を含んだNOTESファイルが含まれています。<br />
<br />
RELIONを起動してみましょう。前述のように、RELIONは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。その為、新しいディレクトリで初めてRELIONを起動するときは、バックグラウンドで起動するための&の文字を使うべきではありません。プロジェクトディレクトリの中にいることを確認し、入力でRELIONを起動します。<br />
<br />
relion <br />
<br />
そして新しいRELIONプロジェクトを作動するために“y“と答えます。<br />
最初にすることとして、パイプラインの中に録画した顕微鏡動画の取り込みを行います。<br />
job-typeブラウザから”Import”を選択し、以下のパラメータを埋めます。<br />
<br />
●Input files: Movies/*.tiff <br />
●Node type: 2D micrograph movies <br />
<br />
これを行うことで、Current job: Give_alias_hereという空欄に効果的なaliasを規定すrことができます。[Run now!]ボタンをクリックし、job起動します。Import/job001というディレクトリが作成され、Import/moviesというこのディレクトリへのシンボリックリンクが一緒に作成されます。STARファイルとすべての動画が新しいディレクトリの中に作成されます。中を見てみましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし違うソフトウェアで粒子を抽出した場合は、後述の事前処理を行う代わりに、STARファイルや3次元レファレンス、3次元マスクなどを取り込むために“Import”job-typeを使用してください。これについてはRELIONを使用する際の責任は取りません。また、ユーザーは正しいSTARファイルの生成に責任を取ってください。<br />
<br />
===1.2 電子線により誘起される画像の動きの補正===<br />
Motion correction job-typeは便利な全体フレーム動画の調整のためのUCSF MOTIONCOR2[21]ラッパーを規定します。あるいは、バージョン3.0以降はMOTIONCOR2と同じアルゴリズムであるRELION独自の実装を使用することもできます。RELION独自の実装はCPU でのみの実行となるので注意してください。[I/O]タブで設定をします。<br />
<br />
●Input movies STAR file: Import/movies/movies.star<br />
([Browse]ボタンで参照できるファイルは、STAR形式の動画ファイ <br />
ルのみです。)<br />
●First frame for corrected sum: 1<br />
●Last frame for corrected sum: 0<br />
(これはすべての動画フレームに使用する際の結果です。)<br />
●Pixel size(A) 0.885<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
●Do dose-weighting? Yes<br />
●Save non-dose-weighted as well? No<br />
(いくつかの非用量加重顕微鏡写真にはCTF推定を行う方がよいで <br />
しょう。ディスク容量を節約するために、データが非常に良いの <br />
でこのオプションは使用しません。)<br />
<br />
[Motioncor2]タブは以下のように入力します。<br />
●Bfactor: 150<br />
(超高解像度動画ではより大きい価値を使用します。)<br />
●Number of patches X,Y 5 5<br />
●Group frames: 1<br />
●Binning factor: 1<br />
(超高解像度動画ではたいてい2を使用します。)<br />
●Gain-reference image: Movies/gain.mrc<br />
(これは、オンザフライでのgain-reference補正用のgain- <br />
referenceファイルを規定するために使用できます。これらの動 <br />
画はまだgain補正されていないので、この場合には必要です。)<br />
●Defect file:<br />
(これは検出器上の壊れたピクセルを隠すために使用することがで <br />
きます。)<br />
●Gain rotation: No rotation (0)<br />
●Gain flip: No flipping (0)<br />
(gain-reference画像はこのデータセットのために既に補正されて <br />
います。)<br />
●Use RELION’s own implementation? Yes<br />
(これによって、UCSF実装をインストールする必要性が少なくなり <br />
ます。どちらにせよ、UCSFプログラムをインストールしている場 <br />
合は、それを使用することもできます。その場合、以下のオプシ <br />
ョンも入力する必要があります。)<br />
<br />
[Running]タブは以下のように入力します。<br />
●Do dose-weighing? Yes<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
<br />
このプログラムの実行には手頃な12スレッドの最新機器を用いればおおよそ5分かかります。MOTIONCOR2アルゴリズムのRELION独自の実装はGPUでは使用しないことに注意してください。しかしそれはマルチスレッドです。各スレッドは独立して動画フレーム場で動作するので、動画フレームの数をスレッドの数で割った数が整数になるように、いくつかのスレッドを使用することが最適です。これらの動画は24フレームあるので、12スレッドを使用すると各スレッドで2フレームが処理されます。[Run now!]ボタンの下の[Display:]ボタンからout:logfile.pdfを選択することで、推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで、値が合計された顕微鏡写真を見ることができます。スクリーンサイズに依存して、見やすいように、顕微鏡写真(Scale:0.3)を縮小し、Sigma contrast:3を使い、見やすい数のコラム(例として、Number of columns:3)にするべきです。[Display:]ボタンから表示したときから顕微鏡写真は選択できないことに注意してください。もし、取り除きたい顕微鏡写真がある場合(今回はすべていい画像なので削除しないだろうが)は[Subset selection]job-typeが使用できます。<br />
<br />
===1.3 CTF推定===<br />
次に、それぞれ補正した顕微鏡写真からCTFの値を推定します。速度の為Kai ZhangのGCTFのためのラッパーとして[CTF estimation]job-typeにします。適切なGPUがない場合、Alexis RohouとNiko GrigoreffのCTFFIND4.1を使用することができます。[I/O]タブで、[Motion correction]jobのcorrected_micrographs.starファイルを選択するために[Browse]ボタンを使用します。また、他のタブは以下のように入力します。<br />
<br />
I/Oタブにおいて<br />
●Use micrograph without dose-weighting? No<br />
(これらは重み付けされたものよりも良いThon ringsを持っているが、書き出さないことを前のステップで決めました。)<br />
●Sperical aberration (mm): 1.4<br />
(顕微鏡メーカーがこの値を提供してくれています。)<br />
●Voltage (kV): 200<br />
●Amplitude contrast: 0.1<br />
(強度コントラストはほとんどないことが知られていますが、約10%の値を与えることで、多くの構造の結果がよくなることが示されています。これは低周波数の弱い散乱がモデル化されていないからです。)<br />
●Magnified pixel size (A): 0.885<br />
(これらはピクセルサイズ0.885Aのもとの動画です。)<br />
●Amount of astigmatism (A): 100<br />
(範囲が適切に調整されていれば、この値は多くのデータセットに適しています。)<br />
<br />
Searchesタブにおいて、CIFFINDの一般的な値を設定します(正確な意味については、Nikoのドキュメンテーションを参照してください)。これらの設定は、GCTFを使用する場合には無視してください(デフォルトで、これをオフに切り替えることができるが)。<br />
●FFT box size (pix): 512<br />
●Minimum resolution (A): 30<br />
●Maximum resolution (A): 7.1<br />
●Minimum defocus cvalue (A): 5000<br />
●Maximum defocus cvalue (A):50000<br />
●Defocus step size (A): 500<br />
●Amount of astigmatism (A): 100<br />
●Estimate phase shifts No<br />
(これはphase-plateデータだけに役に立つ)<br />
GCTFを使用する場合はCTFFIND-4.1タブを無視してください。逆にGCTFを使用しない場合はCTFFIND-4.1タブウィ使用してください。今回の例として、GCTFを使用し、Getfタブを設定します。<br />
●Use Gctf instead? Yes<br />
●Gctf executable: /wherever/it/is/Gctf<br />
(環境変数である$RELION_CTFFIND_EXECUTABLEと$RELION_GCTF_EXECUTABLEは対応するプログラムのGUIエントリのデフォルト値を制御するために使用されます。)<br />
●Ignore ‘Searches’ parameters? Yes<br />
(GCTFにSearchesタブのパラメーターを渡すにはこれを’No’に設定します。デフォルトでは、これらの値は無視され、GCTF独自のデフォルトが使用されます。)<br />
●Perform equi-phase averaging? Yes<br />
(これによりThon ringのSNRが向上します。)<br />
●Other Gctf options:<br />
●Which GPUs to use: 0<br />
(この小さいデータセットには1GPUで十分でしょう。)<br />
<br />
マシンに応じて、複数のMPI処理を使用してプログラムを実行することができます。1プロセッサーとGPUのみを使用すると、動作はGCTFを使用すると31秒かかります。いったん動作が終わると、出力のCtfFind/job003/Moviesという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFINDを使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
Display:ボタンを使用してout:micrographs_ctf.starを選択すると、すべてのThon ring画像を見ることができます。実験の画像のThon rings間の0はモデルの0と一致するはずです。デフォーカス、最高分解能や性能指数などの順番の表示を並べ替えることができます。log.pdfファイルにはすべての顕微鏡写真に対する、デフォーカス、非点収差、推定解像度などの有用なパラメータのプロットとデータセット全体のヒストグラムが含まれています。データ収集における問題点を見つけ出すのに役に立ちます。<br />
もしCTFモデルが実験のThon ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除して、Finished jobsリストからCtfFind/job003を選択し、parameter-panel の値を修正し、Continue nowボタンをクリックすることでjobを再実行することができます。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できないまたは、不十分なThon ringがあり顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
===1.4手動粒子抽出===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の「粒子座標」を手動で選択して使用します。自分たちのデータをより理解できるように少なくとも複数の顕微鏡写真を選択するのがよいでしょう。選択した粒子を使用して、参照なしの2Dクラス平均を計算し、その後、これらの粒子は全データセットの粒子を自動検出するためのテンプレートになります。しかしRELION3.0以降は、Laplacian-of-Gaussian(LoG)フィルターに基づく参照なしの自動抽出手順が含まれています。これまでにテストされたほとんどの場合、この手順は適切な開始座標を提供してくれるので、Manual pickingステップは飛ばすことができます。relion_it.pyスクリプトはこの機能を使用して、完全に自動化されたオンザフライ処理を実行します。このチュートリアルでは、説明のためにManual picking jobを起動し、その後LoGベースのAuto-pickingを継続して最初の粒子セットを細分化します。<br />
手動粒子検出は経験あるのみです!RELIONで手動で粒子の検出をするのが好きでなければ、Jude ShortのXIMDISP[17](任意の拡張子付きで)、XMIPP-2.4[16](任意の拡張子付きで)、Steven LudtkeのE2BOXER.PY[18](.boxの拡張子付きで)の座標形式ファイルもサポートしています。もしこれらを使用する場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存してください。そして、同じ顕微鏡写真のルートネームは異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMovies/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Input Files:の欄に整理されたファイルのsuffix拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例だと、それぞれMovies/*.boxやMovies/*_pick.starになります。<br />
Manual picking jobタイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBrowseボタンを使用して、Colorsタブは無視して、Displayタブは下のように入力します。<br />
●Prticle diameter (A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
●Scale for micrographs: 0.25<br />
(これは画面サイズによります。)<br />
●Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。黒が標準偏差の3倍低く、白が標準偏差の3倍高くなります。グレースケールは黒から白へ直線的に変化します。詳細はDisplayImages entry on the RELION wikiを参照してください。)<br />
●White value: 0<br />
(どの値を白にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Black value: 0<br />
(どの値を黒にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Lowpass filter (A):20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくするための動作です。)<br />
●Highpass filter (A): 0<br />
(これは顕微鏡写真上の濃淡のグラデーションを取り除くのに役立ちます。)<br />
●Pixel size: 0.885<br />
(これは粒子の直径や、low-pass filterとhigh-pass filterの計算に必要です。)<br />
●Scale for CTF image:1<br />
(これは単にそれぞれの顕微鏡写真のCTFボタンをクリックしたときにThon ring画像がどれくらい大きくなるのか調節します。)<br />
Run now!ボタンをクリックすることでjobが実行され、必要に応じていくつかの粒子をクリックしてください。しかし、次のセクションではLoGベースの自動抽出を使用するので、必要でなければ選ぶことはありません。最初の[2D classification] jobに手動抽出した粒子を使用する場合は、適切なクラス平均を計算するために約500~1000個の粒子が必要になります。左クリックで選択、中クリックで選択された粒子の削除、右クリックで座標を保存する必要があるポップアップメニューが表示されます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでもメニューから保存した座標のSTARファイルに戻ることができます(ポップアップメニューの座標を使用してSTARファイルを保存した場合)。<br />
<br />
===1.5 LoGベース自動選択===<br />
今回は、Laplacian-of-Gaussian(Log)フィルタに基づくテンプレートフリーの自動抽出の手順を使用して、最初の粒子セットを選択して下さい。その後、それらの粒子は[2D classification]jobで使用され、2番目の[Auto-picking]jobのテンプレートが生成されます。初期段階では多くの粒子を必要としないので、最初の3枚の顕微鏡写真に対してのみLoGべーすの自動抽出を実行します。一般的に、可能な限り良いテンプレートを得るために、おそらく使用可能なすべての顕微鏡写真に対してLoGベースの抽出を実行します。しかし、今回はこのチュートリアルの計算速度を上げるためにいくつかの顕微鏡写真のみを使用します。<br />
最初にいくつかの顕微鏡写真を選択するために、[Subset selection]jobに移動し、I/Oタブで下を除くすべての空欄をままにします。<br />
●OR select from picked cords: ManualPick/job004/cords_suffix_manualpick.star<br />
(手動抽出で座標を保存したときに生成されます。今回は座標を使用するつもりはなく、顕微鏡写真のサブセットセレクションを行うためにそのjobを使用しているだけです。)<br />
<br />
このjobにはalias 5micsを使用しました。Run!ボタンを押し、[Manual picking]jobと同じポップアップウィンドウを再び押すと、すべてのpickとCTFボタンが表示されます。‘File’メニューを使用して‘Invert selection’:最初の5枚の顕微鏡写真の前にあるチェックボックスをクリックして選択します。その後、‘File’メニューを再び使用して‘Save selection’を選択します。これで、ManualPick/job004/micrographs_selected.starというファイルができ、これを下記の[Auto-picking]jobに使用します。<br />
その後、[Auto-picking]jobを処理し、I/Oタブの設定を行います。<br />
<br />
●Input micrographs for autopick: Select/job005/micrographs_selected.star<br />
●Pixels size in micrographs (A) -1<br />
(ピクセルサイズは入力STARファイルの中の情報から自動的に設定されます。)<br />
●2D references:<br />
(テンプレートフリーのLoGベースの自動抽出では空欄のままにします。)<br />
●OR: provides a 3D reference? No<br />
●OR: use Laplacian-of-Gaussian? Yes<br />
<br />
Laplacianタブの設定をします。<br />
●Min. diameter for loG filter (A) 150<br />
●Max. diameter for loG filter (A) 180<br />
(これは粒子投影のオングストロームの最小最大のサイズに対応します。)<br />
●Are the particles white? No<br />
(黒です。)<br />
●Maximum resolution to consider 20<br />
(ここはデフォルト値のままでいいです。)<br />
●Adjust default threshold 0<br />
(正の値、すなわち閾値はより少ない粒子を選び、負の値もより少ない粒子を選んでください。有用な値は、おそらく[-1,1]の範囲ですが、多くの場合デフォルト値の0は正しい働きをします。)<br />
<br />
Referencesタブは無視して、autopickingタブの最初の四つのオプションは無視してください。下記のように設定してください。<br />
●Write FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Read FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Shrink factor: 0<br />
(縮小を0に設定すると、自動抽出プログラムは参照上のローパスフィルタの解像度に合わせて顕微鏡写真を縮小します。これはすごく早くなり、必要なメモリが少なくなるため、このチュートリアルを素早く実行するのに便利になります。0と1の間の値は顕微鏡写真のサイズの少数で表されるでしょう。これは縮小で1を使用するよりも正確な抽出が少なくなること、つまり縮小がないことに注意してください。この新しいパラメータの詳細は、次のサブセクションで説明します。)<br />
●Use GPU acceleration? No<br />
(計算速度がとても速いので、LoGベースの自動抽出はGPU加速されていません。)<br />
●Which GPUs to use:<br />
<br />
Helixタブを無視して、Running tabで単一MPIプロセッサを使用して実行します。もしかするとLoG_basedのようなaliasが有用かもしれません。単一プロセッサを使用すると、これらの計算は、私たちのコンピュータでは約40秒かかります。<br />
Display:ボタンのcoords_suffix_autopickオプションをクリックすることで結果をチェックすることができます。この段階で表示されるポップアップウィンドウで手動で粒子を追加/削除できます。さらに、autopickingタブのノイズの標準偏差と平均のパラメータやLaplacianタブのデフォルトの閾値の調節をしている間、新しいjobを実行して、より多くの、またはより少ない粒子を抽出することができます。しかし、この段階では、単に2回目のauto-picking jobのテンプレート作成のための最初の粒子セットなので、多くの場合これは必要ないでしょう。<br />
<br />
<br />
<br />
<br />
==2 Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。 <br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。 <br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
<br />
===2.1 Running the job(動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他のオプションは、前述の自動検出のテンプレートを作成した時と同じです。 <br />
●Input images STAR file: Select/after_sorting/particle.star<br />
【Optimisation(最適化)】タブを次の通りにセットします。 <br />
●Number of class: 100<br />
(今、たくさんの粒子を持っています。)<br />
After_sortingのようなエイリアスを用いると、20分ほどで終わります。<br />
動作が終了したら、_model.starファイルを選択して【Subset selection】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度のゴーストのように見える【Einstein-from-noise】クラスに気を付けてください。こうしたクラスの選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。 <br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている外れ画像を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。 <br />
す <br />
===2.2 Analysing the results in more detail(より詳細な結果の分析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。 2D クラス平均算出の最終反復時では、以下のファイルが作成されます。 <br />
● Class2D/after_sorting/run_it025_classes.mrcs <br />
これは、クラス平均結果をMRCスタックとして保存しています。これらはメインGUIのDisplay: ボタンから _model.star を選択したときに表示される画像です。RELION は GUIから選択した場合、(GUIを選択した場合)、クラス平均はおそらく黒い背景が白くなるだろう。そのためクラス平均はおそらく黒い背景に対して白いものになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。 2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶媒領域を期待したいところです。 <br />
溶媒領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で分解能に制限をかけてみて下さい。 <br />
●Class2D/after_sorting/run_it025_model.star <br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(クラス間の画像の分布、再構成された構造中のシグナル対ノイズ比の球面平均、全てのグループのノイズスペクトラム)を含んでいます。 <br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低分解能のクラスにある粒子はほとんどない一方で、高分解能のクラスに存在する粒子は多いと分かる。 <br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである) <br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。 <br />
<br />
●Class2D/after_sorting/run_it025_data.star<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。そのメタデータとは、particles.star fileに入力した情報の他に、最適な方向、最適なクラス同定、対数尤度への寄与、などに関する追加情報です。 <br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。 <br />
●Class2D/after_sorting/run_it025_optimiser.star <br />
これは終了しなかった場合の再起動に必要な精密化過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そのときに、Optimisationタブ上で <br />
Number of iterations:40 <br />
と設定して下さい。このジョブは、反復26から反復40名で繰り返されるだろう。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれません。optimiser.starファイルのもう1つの有用な特徴として、1行目に、これを動かすために与えられた正確なコマンドライン引数がコメントとして含まれています。 <br />
●Class2D/after_sorting/run_it025_sampling.star <br />
これはサンプリング間隔の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
===2.3 Making groups===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
<br />
RELIONは、粒子をグループ化する際に、以下のふたつのことを実行します。ひとつは、平均のノイズのスペクトラム強度(σij^2)の推定と単一数としての強度スケールファクター(τi^2)の推定です。後者は、そのデータの異なる部分の間での、全領域シグナル対ノイズ比(SNRi)の違いを表現しており、例えば、氷の厚さ、デフォーカスまたは汚染等によるものです。 <br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱っています。この動作は顕微鏡写真ごとに多くの粒子が存在する場合には良いです。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、強度スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしていますが、2D,3Dクラス化後、各グループの粒子の初期数はより少なくなるだろうということに注意しておいて下さい。 <br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真からの粒子をグループ化することをお薦めします。このことから、RELION 2.0での新しいGUIとして【Subset selection】の中に便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。 <br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正がされます。<br />
<br />
==De novo 3D model generation (3Dモデル形成)==<br />
RELIONは、2Dの粒子から| 3D initial model | (3Dの初めのモデル)を生成することからSGDアルゴリズムを用いる。RELION-3.0によると、実行はcryoSPARCプログラムの実行にとてもよく従う。見ている方向とデータの合理的な配分の生成は(2D classification)の詳細なクラス平均を産出するために十分いい。このアルゴリズムは、適切な産出にとてもふさわしく、それ以降の低解像度モデルは、3D classificationか3D auto-refunementで利用できる。ここで留意すべきは、リリースされた3.0の実行の改善は、もはや2D classification動作からクラスにつき選択されたランダムな分子とともに分子の部分集合を選択することをしないことである。代わりに、選択された分子の一式の全体のデータを用いた時、そのアルゴリズムはとてもたくましいものである。<br />
<br />
===Running the job (動作の実行)===<br />
3D initial model のジョブタイプのI/Oタブのselect/class2d_aftersort/particles.starファイルを選択する。すべては、すでにCTFで順番にしている。OptimisationタブのFillにより従う(角のある初期状態の放置とサンプリングの相殺)<br />
●Number of class : 1<br />
(時々、一つのクラスより大きいもの。0をつかうと、データセットにまだ存在するだろう至適な分子のシンクの生成を助けるだろう。追加された議論sgd_skip_annealはまだ有用だろう。この場合、私たちはスピードアップするための一つのクラスをつかうだろう。)<br />
●Mask diameter (A) : 200<br />
前と同じ<br />
●Flatten and enforce non-negative solvent : Yes<br />
●Symmetry C1<br />
(対称性がなにかもわからないとき、C1の再構築はおそらく、始めることにベストな選択であるだろう。いくつかの高い対称性の物体は正しい空間グループよりC1のSGDによる解法が簡単だろう。このデータセットはいいデータで、正しいポイントグループD2が動作できる。しかしながら、C1からC2にどのように進行するかを説明すると、C1のSGDを動かすだろう。)<br />
特に、実例の1つに、SGDタブのいくつかに変えることはできないことと、その初期状態はいくつかの場合に適している。しかしながら、このチュートリアルのスピードアップすることは、私たちは、反復のデフォルトの数の半分だけ行うだろう。<br />
したがって、このように変化する。:<br />
●Number of initial iterations : 25<br />
●Number of in-between iterations : 100<br />
●Number of final iterations : 25<br />
Gomputeタブで、システム上で最適化する。再度RAMの中で数千の分子がプレリードできる。GPUの加速は、スピードアップを実現でき、反復の間の複数の極大化のステップは、2Dか3Dの精密化か分類の基準の準備はゆっくりになるだろう。4CPUのカードと、5MPInoプロセス、6スレッドのMPIプロセスを使い、システムはおよそ15分で済む。<br />
<br />
===Analysis the result (結果の分析)===<br />
UCSFキメラのような3Dビューワーの吐出量(Initial Model/job017/run-it/50_class001.mrc)を見る。もし、このポイントにおける対照的なポイントグループの追加を認識することは、RELIONの習慣における協調的なシステムの中心的なX,Y,軸における対照的な軸を整列させることを必要とするだろう。リリースされた3.0は新しいプログラムを促進することを含む。<br />
この動作はコマンドラインから実行できる。<br />
●Relion_align_symmetry - - i InitialModel/job017/run_it150_class001.mrc - -o InitialModel/job017/run_it150_class001_alignD2.mrc - -sym D2<br />
それと、マップにおける対照的な軸のUCSFキメラかrelion_displayの確認はX,YとZ軸の実際の整列とする。私たちはD2の対称的なものを使うことを強要させるだろう。<br />
●Relion_image_handler –i InitialModel/job017/run_it150_class001_alignD2.mrc –o InitialModel/job017/run_it150_class001_symD2.mrc –sym D2<br />
後者のコマンドの出力マップは、入力マップに似ているだろう。<br />
これによって確認できる。<br />
●relion_display_ --i InitialModel / job017 / run_it150_class001_alignD2.mrc & relion_display –i InitialModel / job017 / run_it150_class001_symD2.mrc &<br />
<br />
<br />
<br />
<br />
<br />
==Unsupervised 3D classification (教師無3次元クラス分類)==<br />
すべてのデータは異性分からなっています。問題は、どのくらいの費用でいられるかです。RELIONの3Dマルチリファレンス精密化手順は、強力な教師なし3次元分類へのアプローチを提供しています。<br />
<br />
===Running the job (ジョブを開始)===<br />
教師なし3次元分類は、[3D classification] ジョブタイプから、実行可能です。<br />
[I/O]タブの設定:<br />
●Input images STAR file: Select/class2d_aftersort/particles.star<br />
●Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
このマップはパイプラインの部分のように、Brouseボタンで表れないように述べる。両方のタイプは空のフィールドの中に名付けられるか、importジョブタイプをつかうマップの移入が行われる。対照的なC1を動作させたり、非対称的なInitialModel / job017 / run_it150_class.mrcを使いことを選択する。しかしながら、すでに右の対称的なセッティングは、後々とても楽になるだろう。<br />
●Reference mask (optional):<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供するところです。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類へのバイアスを最小限にする働きがあります。)<br />
[Reference]タブの設定: <br />
●Ref. map is on absolute greyscale: No<br />
(このマップがデータセットから再構築されたとき、すでに正しいグレースケールであります。RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
●Initial low-pass filter (A): 50<br />
(精密化プロセスにバイアスが導入する可能性があるため、高解像度の初期参照モデルは使用してはいけません。[12]で説明したように、初期マップをできる限りフィルタリングする必要があります。リボソームでは大抵、70Åを使用し、小さい粒子では通常40〜60Åの値を使用します。)<br />
●Symmetry: C1<br />
(このサンプルはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。良くない粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
●Do CTF corection? Yes<br />
●Has reference been CTF-correced? Yes<br />
(このモデルは、SGDのCTFコレクションによって作られている。)<br />
●Have data been phase flipped? No<br />
●Ignore CTFs untill first peak? No<br />
(リファレンスを作成するために使用した[2D classification]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
【Optimisation】タブの設定: <br />
●Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。) <br />
●Number of iterations: 25<br />
(これは一般的には変更する必要はありません。) <br />
●Regularisation parameter T: 4<br />
(Tの定義については[13]を参照してください。クライオEMの、2次元分類では、通常、Tは1~2を設定し、3次元分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均にノイズが見える場合はTの値を低くし、逆にクラス平均の分解能が低すぎる場合はTの値を高くします。主に気をつけなければならない点は、高解像度のノイズの過学習です。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
●Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。) <br />
●Mask individual particles with zeros? Yes<br />
(Yes: 0 / No: 乱数) <br />
●Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過学習を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
【Helix】タブは無視して下さい。 <br />
以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。 <br />
ここでも、【Running】タブで、使用するNumber of MPI processors(MPIプロセッサの数)とthreads(スレッド数)を指定できます。[2D classification]のjobタイプで説明したように、3次元分類は2次元分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3次元分類を表示するためにfirst_exhaustiveのようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。 <br />
精密化された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を確認できます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。 <br />
UCSFキメラなどを使用し、表示されたマップを3Dで見ると、マップが精密化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。 <br />
2次元分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示ウィンドウには、4つの精密化されたモデルの中央スライスが表示されます。最適なクラスを選択し、右クリックメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
===Analysing the results in more detail (詳細な結果の解析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
出力ファイルは基本的に2次元分類の実行時と同じです。(実際に2次元,3次元精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2次元クラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。例えば、run_it025_class00?.mrcというMRCマップです。 <br />
今まで通り、小さいクラスは大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比(SNR)が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。 <br />
●relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnuplotがインストールされているのであれば、以下の通りに入力して下さい。 <br />
●relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。 <br />
●grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
==High-resolution 3D refinement(三次元精密化)==<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は分解能を推定するために、gold-standard Fourier Shell Correlation(FSC)(二つの群に分け、互いに独立して再構成した場合に、どの分解能まで相関があるかにより判断)と言われる判断基準を用います。これにより、過学習を避けることができます[15]。角度の割当の正確さを推定する新しい手順([14])と組み合わせ、精密化が収束するときに自動的に決定されます。そのため、この手順は使用者の入力をほとんど必要としません。すなわち、客観性をのこしたまま、多くのデータセットのための優れたマップが生成がされていると述べられています。もう一つの長所は、一般的にこの手順は必要な実行回数が一回のみであり、最適化のための引数はほとんどありません。<br />
しかしながら、前に高解像度の精密化を始めた時、スケール未満とともに選ばれた粒子の正しいセットを再度抽出して、それによりもしかすると高解像度になるかもしれない。これをすることで、GUIのParticle extraction のジョブタイプとI/Oタブを与える。<br />
●micrograph STAR file : CtfFind / job003 / micrographs – ctf.star<br />
(そのままでよい)<br />
●Coordinate – file suffix : <br />
(空でよい)<br />
●OR re – extract refined particles ? Yes<br />
●Refined particles STAR file : Select /class3d – first_exhausitive / particle.star<br />
(今、選択された粒子の微粒にされたサブセットだけをつかうだろう)<br />
●Re – center refined coodinates ? Yes<br />
(3D classificationの動作以上から整列させたオフセットに従ってすべての粒子は再度中央に置かれるだろう)<br />
●Recenter on – X , Y , Z (pix) 0.0.0<br />
(箱の真ん中の分子を中心にキープさせたい)<br />
●Manually set pixel size ? No<br />
(入力したマイクログラフstarファイルはCTFの情報に含まれていないことが必要である。)<br />
Extractタブはすべてキープする。<br />
●Particle box size (pix) 360<br />
(大きな箱をつかうだろう。それにより非局在化させたCTFシグナルはより良いモデルになるだろう。これはCTF精密化の後が大事である。)<br />
●Rescale particles ? yes<br />
(とても大きな画像が働くことを防ぐことで、360×0.885/256 = 1.244 Åのピクセルサイズを減少させ、採取しましょう。これは、おそらく十分に小さいデータ、2.5 Åの大きな達成可能な解像度に制限があるだろう。)<br />
この動作では、エイリアスbest3dclass_bigboxを使用する。<br />
加えて、256ピクセルのボックスサイズに従って一番いいマップを入手したことのいたずらは必要である。<br />
●relion_image_handler –i Class3D/job018/run_it025_class001.mrc –angpix 3.54 –rescale_angpix 1.244 –o Class3D/job018/run_it025_class001_box256.mrc –new_box256 <br />
<br />
===Running the auto-refine job (自動精錬動作の実行)===<br />
3D auto-refine のジョブタイプのI/Oタブ<br />
●Input images STAR file : Extract/best3dclass_fullsize/particles.star<br />
●Reference map : Class3D / job018 / run_it025_class001_box256.mrc<br />
●Reference mask (optional)<br />
(からのままでいい)<br />
Reference タブ<br />
●Ref. map is on absolute gryscale ? No<br />
スケール現象の画像の違う標準化によると、正しく絶対的なグレースケールはマップの中に確立しなかった。このオプションの“No”は大事で、精密化の最初の相互作用のグレースケールは正しくなるだろう。<br />
●Initial low-pass filter (A) 50<br />
マップの高い頻度の成分に向かってバイアスを防いだことは低いパスのフィルターから自動精密化され始める。それと解像度から完全に依存された粒子の“gold standard”の維持は、1頭文字より高かった。<br />
●Symmetry D2<br />
(高解像度の粒子の照準は、強要された対称性の粒子の4倍効率的にするだろう)<br />
CTFのパラメータで、OpimisationとAuto-samplingタブは、3D classificationと同じでとどまる<br />
【Sampling】タブでの配向性のサンプリング間隔は反復の最初の数回のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング間隔が自動的に細かくなっていきます。したがって、8面体または正20面体対称よりも小さい角度で、全ての精密化仮定でで、一般的に大域探索では、初期値の角度である7.5度のサンプルを使用し、局所探索では1.8度のサンプルから行います。より正確な対称の精密化を行う場合のみ、3.7度でのサンプリングを行い、局所探索では0.9度ごとにサンプリングを行います。<br />
MPIのノードは1つのマスター(他のスレーブを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用するもの)のセットで分かれているので、奇数のMPI処理装置を使用するのが最も効率が良いです。ナイキスト周波数までのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。従って、使っているクラスターノードのコアと同じ数のスレッドで動かしたいデータセットのボックスより大きいサイズで作られたボックスが必要です。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
===Analysing the results (結果の分析)===<br />
出力ファイルは3D classificationを実行したときのものと大部分が同じです。しかし、全てにおけるプログラムの反復では、2つのrun_it0??_half?_model.starと2つのrun_it0??_half?_class001.mrcファイルを書き出します。それぞれデータの半分が精密化されます。収束した場合にのみ、ひとつのrun_model.starとrun_class001.mrcファイルを書き出します(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。 <br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[14]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルからも抽出されるかもしれません。 <br />
例えば、以下のように試してみてください。 <br />
●grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
==11 まとめ==<br />
<br />
===11.1 フローチャートの作成===<br />
<br />
どのようにして最終的な再構築をするか気になるでしょう。'''''Finished job'''''リストから実行した最後の動作を選択し、'''''Job actions'''''ボタンから'''Make flowchart'''オプションを試してください。これを実行するためにはシステムに'''LATEX'''や'''TikZ'''パッケージが必要となります。最初の項は正確な作業名のないフローチャートの全体像です。これは、出版目的に役立つでしょう(おそらくお気に入りの'''vector-based design'''プログラムの編集後に)。フローチャートの全体像の後に、最初の詳細なフローチャートにどのようにして終了するかが示されています。10ステップ以上からなるフローチャートは複数の構成要素に分けられることに注意してください。作業中に複数枝分かれすることがあるでしょう。それ故に、最終作業のフローチャートに従って、それぞれの分岐についてフローチャートがあるでしょう。リンクをクリックすることでPDFファイルから合致する位置を得ることができます。<br />
<br />
===11.2 ディレクトリのクリーンアップ===<br />
<br />
ディスクの空間を確保するために、RELIONは作業ディレクトリをクリーンアップするオプションを持っています。これには2つのモードがあります。'''''gentle'''''クリーンは作業ディレクトリから中間ファイルのみを削除します。'''''harsh'''''クリーンは作業からのインプットを必要とする新たな作業を開始するのに必要なファイルを削除します。例えば、'''''harsh'''''クリーンは'''Motion Corr'''作業から平均化された、あるいは'''Particle extraction'''作業から少量のスタックを抽出された顕微鏡写真を削除します。一方、'''''gentle'''''クリーンは'''2D classification''', '''3D classification'''あるいは'''3D auto-refine'''作業の中間反復からすべてのファイルを削除します。'''Job actions'''ボタンから個別に作業をクリーンアップすることができます。あるいは、GUIのトップメニューから下がった、'''''Jobs'''''からすべての作業をクリーンアップすることができます。私たちは計算前の結果に頭を悩ませていたプロジェクトディレクトリの'''tarball'''を作る前にそのメニューから'''''Gently clean all jobs'''''オプションを使いました。長期間保存されていたデータを取る前にプロジェクトディレクトリをクリーンアップしたいでしょう。<br />
<br />
===11.3 質問や引用===<br />
<br />
以上です!このチュートリアルを楽しんで、そして役に立つことを願います。もしRELIONについて質問があれば、初めに'''RELION Wiki'''の'''FAQ'''と'''CCPEMメーリングリスト'''を確認してください。それが助けにならなければ、'''CCPEMリスト'''を利用して質問してください。お願いですから、決してSjorsに直接メールを送信しないでください。質問全てに返答できるわけではありません。もしRELIONが利用者の研究に有益であると思ったら私たちの[http://www2.mrc-lmb.cam.ac.uk/groups/scheres/publications.html 論文]を引用し、あなたの研究仲間たちに伝えてください。<br />
<br />
===11.4 参考文献===<br />
<br />
RELIONの手順の改善を支持した理論の詳細は以下の論文で述べられています。<br />
* S.H.W. Scheres (2012) “''RELION: Implementation of a Bayesian approach to cryo-EM structure determination''” J. Struc. Biol., 180, 519-530.<br />
<br />
*S.H.W. Scheres (2012) “''A Bayesian view on cryo-EM structure determination''” J. Mol. Biol., 415, 406-418.<br />
<br />
RELIONの使い方に関する包括的な概観は以下の論文に述べられています。<br />
<br />
*S.H.W. Scheres (2016) “''Processing of structurally heterogeneous cryo-EM data in RELION''” Meth. Enzym., 579, 125-157.<br />
<br />
<br />
==12 付録 A:インストールの注意==<br />
<br />
===12.1 MPIのインストール===<br />
<br />
'''MPI(message passing interface)'''がインストールされた計算機クラスター、もしくはNVIDIA GPU搭載のマルチコアデスクトップマシンが必要になることに注意してください。RELIONをコンパイルするには、'''mpi-devel'''パッケージが必要です。おそらく存在する種類'''(MPICH, LAM-MPI, etc)'''またはバージョンはそれほど重要ではありません。まだシステム内に'''mpi-devel'''をインストールしてなければ、'''openMPI'''をインストールすることをお勧めします。<br />
<br />
===12.2 CUDAのインストール===<br />
<br />
'''NVIDIA'''の比較的新しいGPU('''compute capability 3.5+'''以上)を持っている場合、オートピッキング、分類、精密化作業を高速に実行できます。'''GPU-accelerationサポート'''を含むRELIONをコンパイルするには、'''CUDA'''をインストールする必要があります。このチュートリアルの準備には'''CUDA-8.0'''を使用しました。[https://developer.nvidia.com/cuda-downloads NVIDIAのWebサイト]からダウンロードしてください。<br />
<br />
===12.3 RELIONのインストール===<br />
<br />
RELIONはオープンソースのソフトウェアです。[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Download_%26_install the RELION wiki]から無料でダウンロードして、手順に従ってインストールしてください。もし、'''job submission system(Sun Grid EngineやPBS/TORQUE etc)'''に詳しくない場合は、インストール手順の説明にあるように、'''qsub.cshスクリプト'''の設定に関して、システム管理者にお尋ねください。分散メモリ並列化のためのMPIと、共用メモリの並列化のための'''pthreads'''の両方を使用する、いわゆるハイブリッド並列計算を実行したいときは注意してください。ジョブキューイングシステムはこれを可能とするためにいくつかの調整が必要な場合があります。再度、システム管理者にお尋ねください。<br />
<br />
===12.4 モーション補正ソフトウェアのインストール===<br />
<br />
RELION-3.0は全フレーム顕微鏡写真ムービーアライメントに使用される、'''UCSFプログラムMOTIONCOR2'''へのラッパーを提供します。[http://www.msg.ucsf.edu/agard/protocols.html Dabid Agard]のページからプログラムをダウンロードし、インストールの手順に従ってください。また、RELIONの保有する、'''MOTIONCOR2'''の実行を使うかもしれません。なので、もし、UCSF実行をインストールするのに問題が発生しても心配しないでください。バージョン3.0において、'''''Nico grigorieff’s group'''''から'''UNBLUR'''へのラッパーはGUIから中止されていることに注意してください。<br />
<br />
===12.5 CTF推定ソフトウェアのインストール===<br />
<br />
CTF推定はRELIONに含まれていません。代わりに、RELIONは'''''Alexis RohouやNiko Grigorieff’s CTFFIND4'''''へのラッパーを提供します。[http://grigoriefflab.janelia.org/datadownload Niko’s CTFFIND website]からダウンロードし、手順に従ってインストールしてください。また、もし、パソコンに'''NVIDIA graphics card(GPU)'''が入っているなら'''''Kai Zhang’s GCTF'''''を使うこともできます。その際は、LMBに関する[https://www.mrc-lmb.cam.ac.uk/kzhang/ KaiのWebサイト]からダウンロードしてください。<br />
<br />
===12.6 RESMAPのインストール===<br />
<br />
局所分解能推定はRELIONが所有するポストプロセッシングプログラムの中、あるいは'''''Alp KucukelbirのRESMAP'''''へのラッパーを通して実行される。[http://www.proditus.com/software.html AlpのRESMAP Webサイト]からダウンロードし、手順に従ってインストールしてください。<br />
<br />
<br />
<br />
<br />
== 13 付録B:RELIONの利用 ==<br />
=== 13.1 GUIについて ===<br />
<br />
==== 13.1.1 pipeline approach ====<br />
RELION-3.0では、一つのプログラムの出力を次のプログラムの入力として順次繋いでいくような情報の受け渡し(パイプライン)を円滑に実現できるようなGUIを設計しました。詳細は2016 Proceedings of the CCP-EM Spring Symposium[3]で公開されています。<br />
RELION-3.0を使うにあたって、まずプロジェクト(すなわち構造決定したい分子)ごとにディレクトリを作成することを推奨します。ここではこのディレクトリの呼称をプロジェクトディレクトリとします。RELIONのGUIは「relion」とコマンドを打つことで起動させることができますが、この動作は常にプロジェクトディレクトリに移動してから行うことを念頭に置いてください。<br />
<br />
このソフトのGUIでは、すべてのジョブや、あるジョブによる出力がどのように他のジョブの入力に使われたのかといった履歴を保存することができ、この機能によってパイプラインが形成されます。各種ジョブにはそれぞれ独自の出力ディレクトリが与えられます。ここではたとえば あるジョブの出力のためにClass2D/ というディレクトリができるとします。こういったジョブディレクトリの中でさらに新しいジョブが実行されると、その新しいジョブには一連の番号が与えられます。たとえばClass2Dのもとで作られたとあるジョブにはClass2D/job010という番号が振り分けられます。さらに、ジョブディレクトリのもとでは、Class2D/job010/run といったように出力名が定められます。このソフトでは、各ジョブに意味のある名前が付けられるような仕組みを備えるために、ファイルシステム上の個々のジョブディレクトリへの記号リンクとして実装された"エイリアス"システムを使用しています。<br />
パイプラインに関するすべての情報はdefault_pipeline.starという名前のファイルに保存されていますが、基本的にはこのファイルを見る必要はありません。もしdefault_pipeline.starファイルが壊れてしまった場合は、最後に実行したジョブディレクトリで保存されたバックアップから復元することができます。<br />
<br />
==== 13.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
このソフトのGUIは上半分と下半分に分かれています。上半分の左側にはジョブの種類が縦リスト上に並べられており、行いたいジョブを選ぶことができます。たとえば2D classificationを行いたいときは、上半分の左側のブラウザで選択すればいいわけです。上半分の右側には複数のタブがあるパネルがあり、それぞれのジョブタイプへのパラメータを入力できます。GUIの左上には機能のおおよその概要が分かる3つのメニューが書かれています。<br />
【Schedule】ボタンでは、後でジョブを実行するときのスケジューリングを行うことができます。それに対して【Run now!】ボタンは今すぐに実行したいときに使います。【Schedule】ボタンは、繰り返し実行できるよう完全自動化された「パイプライン」を用意したいときに役立ちます。たとえば、データが収集されていくにつれてそれが瞬時に反映できるようなパイプラインを実現したいときに有効です。詳細は13.3を参照してください。<br />
GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 13.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中のジョブ(【Running jobs】)、すでに完了しているジョブ(【Finished jobs】)、または後で実行するようにスケジュールされたジョブ(【Scheduled jobs】)のリストがあります。これらのリスト内のジョブをクリックすると、そのジョブのパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリが作成されることはありませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】のジョブでは、_optimiser.starというファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。【モーション補正】、【CTF推定】、【自動ピッキング】、【粒子抽出】は、これまでに行われていなかった顕微鏡写真でのみ実行されます。【Input to this job】(このjobへの入力)と【Output from this job】(このjobからの出力)は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(stdout)と標準エラー出力(stderr)がそれぞれ黒と赤のテキストで表示されます。標準エラー出力は理想的には何もない状態でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、スクロールがしやすくなるようテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 13.1.4 The Display button(ディスプレイボタン) ====<br />
runボタンとscheduleボタンの下にある【Display:】ボタンでは、各ジョブにおける最重要たる入力ファイルと出力ファイルを視覚的に表示することができます。GUIの下半分にあるjobリストのうちのひとつのjobを選択した後に【Display:】ボタンをクリックすると、選択されたjobの入力と出力がすべて(例えば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。中間体のファイルを表示するといったような一般的な機能はGUI左上の3つのメニューのうちFile>Displayを選択することで使うことができます。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第11章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(13.1.6参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
ジョブを削除すると、ジョブディレクトリ全体がプロジェクトディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、ジョブを復元することができます。<br />
<br />
ディスク容量を節約するため、ジョブを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。これには2つのクリーニングオプションがあり、片方は【gentle clean】という方法です。この方法では、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は【harsh clean】という完全なクリーニング方法です。この方法では全てのファイルを消すことになるため、より多くの容量を確保できます。その中でも【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のジョブタイプから選択できる粒子スタック、または顕微鏡写真を含むディレクトリに関しては、とりわけ多くの容量を確保できます。<br />
<br />
また、RELIONの左上にある【job】メニューの対応するオプション(【Gently clean all jobs】あるいは、【Harshly clean all jobs】)を使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。 その際、特定のディレクトリを削除対象から除外したい場合には、NO_HARSH_CLEANというファイルをその中に置いてください。<br />
<br />
例えば、保護したい粒子データがjob098にある場合、次のコマンドを実行してください。<br />
<br />
$ touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
※ touchコマンドは、指定したファイルが存在しない場合には空のファイルを作成するプログラムです。存在している場合には、ファイルの修正時刻を変更します。</div>
Nakamu
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION3%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELION3チュートリアル
2019-02-10T14:50:21Z
<p>Nakamu: /* 2.3 Making groups */</p>
<hr />
<div>'''RELION3'''<br />
<br />
==1 前処理==<br />
<br />
===1.1 解析の準備===<br />
私たちはプロジェクトごとに、すなわち構造解析したいものごとに一つのディレクトリを作成することをお勧めします。これをプロジェクトディレクトリと呼びます。'''プロジェクトディレクトリからRELION GUIを毎回起動することは重要です。'''プロジェクトディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式かTIFF形式で保存するための別のディレクトリを作成してください。もしすべての動画が一つのディレクトリにある場合には、このディレクトリをMovies/とした方が好ましいでしょう。また、異なるディレクトリにある場合(例えば、違う日に集めたもの)には、Movies/15jan16またはMovies/23jan16とするといいでしょう。もし何か理由があり、RELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成することができます。<br />
<br />
単一画像の顕微鏡写真にはmrc拡張子を、動画にはmrc、mrcs、tiff拡張子をつけることができます。チュートリアルのデータを解凍したとき、プロジェクトディレクトリ(Movies/)は作成されています。このディレクトリは、TIFF形式に圧縮された24つの動画、gain.mrc、実験の情報を含んだNOTESファイルが含まれています。<br />
<br />
RELIONを起動してみましょう。前述のように、RELIONは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。その為、新しいディレクトリで初めてRELIONを起動するときは、バックグラウンドで起動するための&の文字を使うべきではありません。プロジェクトディレクトリの中にいることを確認し、入力でRELIONを起動します。<br />
<br />
relion <br />
<br />
そして新しいRELIONプロジェクトを作動するために“y“と答えます。<br />
最初にすることとして、パイプラインの中に録画した顕微鏡動画の取り込みを行います。<br />
job-typeブラウザから”Import”を選択し、以下のパラメータを埋めます。<br />
<br />
●Input files: Movies/*.tiff <br />
●Node type: 2D micrograph movies <br />
<br />
これを行うことで、Current job: Give_alias_hereという空欄に効果的なaliasを規定すrことができます。[Run now!]ボタンをクリックし、job起動します。Import/job001というディレクトリが作成され、Import/moviesというこのディレクトリへのシンボリックリンクが一緒に作成されます。STARファイルとすべての動画が新しいディレクトリの中に作成されます。中を見てみましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし違うソフトウェアで粒子を抽出した場合は、後述の事前処理を行う代わりに、STARファイルや3次元レファレンス、3次元マスクなどを取り込むために“Import”job-typeを使用してください。これについてはRELIONを使用する際の責任は取りません。また、ユーザーは正しいSTARファイルの生成に責任を取ってください。<br />
<br />
===1.2 電子線により誘起される画像の動きの補正===<br />
Motion correction job-typeは便利な全体フレーム動画の調整のためのUCSF MOTIONCOR2[21]ラッパーを規定します。あるいは、バージョン3.0以降はMOTIONCOR2と同じアルゴリズムであるRELION独自の実装を使用することもできます。RELION独自の実装はCPU でのみの実行となるので注意してください。[I/O]タブで設定をします。<br />
<br />
●Input movies STAR file: Import/movies/movies.star<br />
([Browse]ボタンで参照できるファイルは、STAR形式の動画ファイ <br />
ルのみです。)<br />
●First frame for corrected sum: 1<br />
●Last frame for corrected sum: 0<br />
(これはすべての動画フレームに使用する際の結果です。)<br />
●Pixel size(A) 0.885<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
●Do dose-weighting? Yes<br />
●Save non-dose-weighted as well? No<br />
(いくつかの非用量加重顕微鏡写真にはCTF推定を行う方がよいで <br />
しょう。ディスク容量を節約するために、データが非常に良いの <br />
でこのオプションは使用しません。)<br />
<br />
[Motioncor2]タブは以下のように入力します。<br />
●Bfactor: 150<br />
(超高解像度動画ではより大きい価値を使用します。)<br />
●Number of patches X,Y 5 5<br />
●Group frames: 1<br />
●Binning factor: 1<br />
(超高解像度動画ではたいてい2を使用します。)<br />
●Gain-reference image: Movies/gain.mrc<br />
(これは、オンザフライでのgain-reference補正用のgain- <br />
referenceファイルを規定するために使用できます。これらの動 <br />
画はまだgain補正されていないので、この場合には必要です。)<br />
●Defect file:<br />
(これは検出器上の壊れたピクセルを隠すために使用することがで <br />
きます。)<br />
●Gain rotation: No rotation (0)<br />
●Gain flip: No flipping (0)<br />
(gain-reference画像はこのデータセットのために既に補正されて <br />
います。)<br />
●Use RELION’s own implementation? Yes<br />
(これによって、UCSF実装をインストールする必要性が少なくなり <br />
ます。どちらにせよ、UCSFプログラムをインストールしている場 <br />
合は、それを使用することもできます。その場合、以下のオプシ <br />
ョンも入力する必要があります。)<br />
<br />
[Running]タブは以下のように入力します。<br />
●Do dose-weighing? Yes<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
<br />
このプログラムの実行には手頃な12スレッドの最新機器を用いればおおよそ5分かかります。MOTIONCOR2アルゴリズムのRELION独自の実装はGPUでは使用しないことに注意してください。しかしそれはマルチスレッドです。各スレッドは独立して動画フレーム場で動作するので、動画フレームの数をスレッドの数で割った数が整数になるように、いくつかのスレッドを使用することが最適です。これらの動画は24フレームあるので、12スレッドを使用すると各スレッドで2フレームが処理されます。[Run now!]ボタンの下の[Display:]ボタンからout:logfile.pdfを選択することで、推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで、値が合計された顕微鏡写真を見ることができます。スクリーンサイズに依存して、見やすいように、顕微鏡写真(Scale:0.3)を縮小し、Sigma contrast:3を使い、見やすい数のコラム(例として、Number of columns:3)にするべきです。[Display:]ボタンから表示したときから顕微鏡写真は選択できないことに注意してください。もし、取り除きたい顕微鏡写真がある場合(今回はすべていい画像なので削除しないだろうが)は[Subset selection]job-typeが使用できます。<br />
<br />
===1.3 CTF推定===<br />
次に、それぞれ補正した顕微鏡写真からCTFの値を推定します。速度の為Kai ZhangのGCTFのためのラッパーとして[CTF estimation]job-typeにします。適切なGPUがない場合、Alexis RohouとNiko GrigoreffのCTFFIND4.1を使用することができます。[I/O]タブで、[Motion correction]jobのcorrected_micrographs.starファイルを選択するために[Browse]ボタンを使用します。また、他のタブは以下のように入力します。<br />
<br />
I/Oタブにおいて<br />
●Use micrograph without dose-weighting? No<br />
(これらは重み付けされたものよりも良いThon ringsを持っているが、書き出さないことを前のステップで決めました。)<br />
●Sperical aberration (mm): 1.4<br />
(顕微鏡メーカーがこの値を提供してくれています。)<br />
●Voltage (kV): 200<br />
●Amplitude contrast: 0.1<br />
(強度コントラストはほとんどないことが知られていますが、約10%の値を与えることで、多くの構造の結果がよくなることが示されています。これは低周波数の弱い散乱がモデル化されていないからです。)<br />
●Magnified pixel size (A): 0.885<br />
(これらはピクセルサイズ0.885Aのもとの動画です。)<br />
●Amount of astigmatism (A): 100<br />
(範囲が適切に調整されていれば、この値は多くのデータセットに適しています。)<br />
<br />
Searchesタブにおいて、CIFFINDの一般的な値を設定します(正確な意味については、Nikoのドキュメンテーションを参照してください)。これらの設定は、GCTFを使用する場合には無視してください(デフォルトで、これをオフに切り替えることができるが)。<br />
●FFT box size (pix): 512<br />
●Minimum resolution (A): 30<br />
●Maximum resolution (A): 7.1<br />
●Minimum defocus cvalue (A): 5000<br />
●Maximum defocus cvalue (A):50000<br />
●Defocus step size (A): 500<br />
●Amount of astigmatism (A): 100<br />
●Estimate phase shifts No<br />
(これはphase-plateデータだけに役に立つ)<br />
GCTFを使用する場合はCTFFIND-4.1タブを無視してください。逆にGCTFを使用しない場合はCTFFIND-4.1タブウィ使用してください。今回の例として、GCTFを使用し、Getfタブを設定します。<br />
●Use Gctf instead? Yes<br />
●Gctf executable: /wherever/it/is/Gctf<br />
(環境変数である$RELION_CTFFIND_EXECUTABLEと$RELION_GCTF_EXECUTABLEは対応するプログラムのGUIエントリのデフォルト値を制御するために使用されます。)<br />
●Ignore ‘Searches’ parameters? Yes<br />
(GCTFにSearchesタブのパラメーターを渡すにはこれを’No’に設定します。デフォルトでは、これらの値は無視され、GCTF独自のデフォルトが使用されます。)<br />
●Perform equi-phase averaging? Yes<br />
(これによりThon ringのSNRが向上します。)<br />
●Other Gctf options:<br />
●Which GPUs to use: 0<br />
(この小さいデータセットには1GPUで十分でしょう。)<br />
<br />
マシンに応じて、複数のMPI処理を使用してプログラムを実行することができます。1プロセッサーとGPUのみを使用すると、動作はGCTFを使用すると31秒かかります。いったん動作が終わると、出力のCtfFind/job003/Moviesという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFINDを使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
Display:ボタンを使用してout:micrographs_ctf.starを選択すると、すべてのThon ring画像を見ることができます。実験の画像のThon rings間の0はモデルの0と一致するはずです。デフォーカス、最高分解能や性能指数などの順番の表示を並べ替えることができます。log.pdfファイルにはすべての顕微鏡写真に対する、デフォーカス、非点収差、推定解像度などの有用なパラメータのプロットとデータセット全体のヒストグラムが含まれています。データ収集における問題点を見つけ出すのに役に立ちます。<br />
もしCTFモデルが実験のThon ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除して、Finished jobsリストからCtfFind/job003を選択し、parameter-panel の値を修正し、Continue nowボタンをクリックすることでjobを再実行することができます。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できないまたは、不十分なThon ringがあり顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
===1.4手動粒子抽出===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の「粒子座標」を手動で選択して使用します。自分たちのデータをより理解できるように少なくとも複数の顕微鏡写真を選択するのがよいでしょう。選択した粒子を使用して、参照なしの2Dクラス平均を計算し、その後、これらの粒子は全データセットの粒子を自動検出するためのテンプレートになります。しかしRELION3.0以降は、Laplacian-of-Gaussian(LoG)フィルターに基づく参照なしの自動抽出手順が含まれています。これまでにテストされたほとんどの場合、この手順は適切な開始座標を提供してくれるので、Manual pickingステップは飛ばすことができます。relion_it.pyスクリプトはこの機能を使用して、完全に自動化されたオンザフライ処理を実行します。このチュートリアルでは、説明のためにManual picking jobを起動し、その後LoGベースのAuto-pickingを継続して最初の粒子セットを細分化します。<br />
手動粒子検出は経験あるのみです!RELIONで手動で粒子の検出をするのが好きでなければ、Jude ShortのXIMDISP[17](任意の拡張子付きで)、XMIPP-2.4[16](任意の拡張子付きで)、Steven LudtkeのE2BOXER.PY[18](.boxの拡張子付きで)の座標形式ファイルもサポートしています。もしこれらを使用する場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存してください。そして、同じ顕微鏡写真のルートネームは異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMovies/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Input Files:の欄に整理されたファイルのsuffix拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例だと、それぞれMovies/*.boxやMovies/*_pick.starになります。<br />
Manual picking jobタイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBrowseボタンを使用して、Colorsタブは無視して、Displayタブは下のように入力します。<br />
●Prticle diameter (A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
●Scale for micrographs: 0.25<br />
(これは画面サイズによります。)<br />
●Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。黒が標準偏差の3倍低く、白が標準偏差の3倍高くなります。グレースケールは黒から白へ直線的に変化します。詳細はDisplayImages entry on the RELION wikiを参照してください。)<br />
●White value: 0<br />
(どの値を白にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Black value: 0<br />
(どの値を黒にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Lowpass filter (A):20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくするための動作です。)<br />
●Highpass filter (A): 0<br />
(これは顕微鏡写真上の濃淡のグラデーションを取り除くのに役立ちます。)<br />
●Pixel size: 0.885<br />
(これは粒子の直径や、low-pass filterとhigh-pass filterの計算に必要です。)<br />
●Scale for CTF image:1<br />
(これは単にそれぞれの顕微鏡写真のCTFボタンをクリックしたときにThon ring画像がどれくらい大きくなるのか調節します。)<br />
Run now!ボタンをクリックすることでjobが実行され、必要に応じていくつかの粒子をクリックしてください。しかし、次のセクションではLoGベースの自動抽出を使用するので、必要でなければ選ぶことはありません。最初の[2D classification] jobに手動抽出した粒子を使用する場合は、適切なクラス平均を計算するために約500~1000個の粒子が必要になります。左クリックで選択、中クリックで選択された粒子の削除、右クリックで座標を保存する必要があるポップアップメニューが表示されます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでもメニューから保存した座標のSTARファイルに戻ることができます(ポップアップメニューの座標を使用してSTARファイルを保存した場合)。<br />
<br />
===1.5 LoGベース自動選択===<br />
今回は、Laplacian-of-Gaussian(Log)フィルタに基づくテンプレートフリーの自動抽出の手順を使用して、最初の粒子セットを選択して下さい。その後、それらの粒子は[2D classification]jobで使用され、2番目の[Auto-picking]jobのテンプレートが生成されます。初期段階では多くの粒子を必要としないので、最初の3枚の顕微鏡写真に対してのみLoGべーすの自動抽出を実行します。一般的に、可能な限り良いテンプレートを得るために、おそらく使用可能なすべての顕微鏡写真に対してLoGベースの抽出を実行します。しかし、今回はこのチュートリアルの計算速度を上げるためにいくつかの顕微鏡写真のみを使用します。<br />
最初にいくつかの顕微鏡写真を選択するために、[Subset selection]jobに移動し、I/Oタブで下を除くすべての空欄をままにします。<br />
●OR select from picked cords: ManualPick/job004/cords_suffix_manualpick.star<br />
(手動抽出で座標を保存したときに生成されます。今回は座標を使用するつもりはなく、顕微鏡写真のサブセットセレクションを行うためにそのjobを使用しているだけです。)<br />
<br />
このjobにはalias 5micsを使用しました。Run!ボタンを押し、[Manual picking]jobと同じポップアップウィンドウを再び押すと、すべてのpickとCTFボタンが表示されます。‘File’メニューを使用して‘Invert selection’:最初の5枚の顕微鏡写真の前にあるチェックボックスをクリックして選択します。その後、‘File’メニューを再び使用して‘Save selection’を選択します。これで、ManualPick/job004/micrographs_selected.starというファイルができ、これを下記の[Auto-picking]jobに使用します。<br />
その後、[Auto-picking]jobを処理し、I/Oタブの設定を行います。<br />
<br />
●Input micrographs for autopick: Select/job005/micrographs_selected.star<br />
●Pixels size in micrographs (A) -1<br />
(ピクセルサイズは入力STARファイルの中の情報から自動的に設定されます。)<br />
●2D references:<br />
(テンプレートフリーのLoGベースの自動抽出では空欄のままにします。)<br />
●OR: provides a 3D reference? No<br />
●OR: use Laplacian-of-Gaussian? Yes<br />
<br />
Laplacianタブの設定をします。<br />
●Min. diameter for loG filter (A) 150<br />
●Max. diameter for loG filter (A) 180<br />
(これは粒子投影のオングストロームの最小最大のサイズに対応します。)<br />
●Are the particles white? No<br />
(黒です。)<br />
●Maximum resolution to consider 20<br />
(ここはデフォルト値のままでいいです。)<br />
●Adjust default threshold 0<br />
(正の値、すなわち閾値はより少ない粒子を選び、負の値もより少ない粒子を選んでください。有用な値は、おそらく[-1,1]の範囲ですが、多くの場合デフォルト値の0は正しい働きをします。)<br />
<br />
Referencesタブは無視して、autopickingタブの最初の四つのオプションは無視してください。下記のように設定してください。<br />
●Write FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Read FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Shrink factor: 0<br />
(縮小を0に設定すると、自動抽出プログラムは参照上のローパスフィルタの解像度に合わせて顕微鏡写真を縮小します。これはすごく早くなり、必要なメモリが少なくなるため、このチュートリアルを素早く実行するのに便利になります。0と1の間の値は顕微鏡写真のサイズの少数で表されるでしょう。これは縮小で1を使用するよりも正確な抽出が少なくなること、つまり縮小がないことに注意してください。この新しいパラメータの詳細は、次のサブセクションで説明します。)<br />
●Use GPU acceleration? No<br />
(計算速度がとても速いので、LoGベースの自動抽出はGPU加速されていません。)<br />
●Which GPUs to use:<br />
<br />
Helixタブを無視して、Running tabで単一MPIプロセッサを使用して実行します。もしかするとLoG_basedのようなaliasが有用かもしれません。単一プロセッサを使用すると、これらの計算は、私たちのコンピュータでは約40秒かかります。<br />
Display:ボタンのcoords_suffix_autopickオプションをクリックすることで結果をチェックすることができます。この段階で表示されるポップアップウィンドウで手動で粒子を追加/削除できます。さらに、autopickingタブのノイズの標準偏差と平均のパラメータやLaplacianタブのデフォルトの閾値の調節をしている間、新しいjobを実行して、より多くの、またはより少ない粒子を抽出することができます。しかし、この段階では、単に2回目のauto-picking jobのテンプレート作成のための最初の粒子セットなので、多くの場合これは必要ないでしょう。<br />
<br />
<br />
<br />
<br />
==2 Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。 <br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。 <br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
<br />
===2.1 Running the job(動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他のオプションは、前述の自動検出のテンプレートを作成した時と同じです。 <br />
●Input images STAR file: Select/after_sorting/particle.star<br />
【Optimisation(最適化)】タブを次の通りにセットします。 <br />
●Number of class: 100<br />
(今、たくさんの粒子を持っています。)<br />
After_sortingのようなエイリアスを用いると、20分ほどで終わります。<br />
動作が終了したら、_model.starファイルを選択して【Subset selection】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度のゴーストのように見える【Einstein-from-noise】クラスに気を付けてください。こうしたクラスの選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。 <br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている外れ画像を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。 <br />
す <br />
===2.2 Analysing the results in more detail(より詳細な結果の分析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。 2D クラス平均算出の最終反復時では、以下のファイルが作成されます。 <br />
● Class2D/after_sorting/run_it025_classes.mrcs <br />
これは、クラス平均結果をMRCスタックとして保存しています。これらはメインGUIのDisplay: ボタンから _model.star を選択したときに表示される画像です。RELION は GUIから選択した場合、(GUIを選択した場合)、クラス平均はおそらく黒い背景が白くなるだろう。そのためクラス平均はおそらく黒い背景に対して白いものになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。 2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶媒領域を期待したいところです。 <br />
溶媒領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で分解能に制限をかけてみて下さい。 <br />
●Class2D/after_sorting/run_it025_model.star <br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(クラス間の画像の分布、再構成された構造中のシグナル対ノイズ比の球面平均、全てのグループのノイズスペクトラム)を含んでいます。 <br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低分解能のクラスにある粒子はほとんどない一方で、高分解能のクラスに存在する粒子は多いと分かる。 <br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである) <br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。 <br />
<br />
●Class2D/after_sorting/run_it025_data.star<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。そのメタデータとは、particles.star fileに入力した情報の他に、最適な方向、最適なクラス同定、対数尤度への寄与、などに関する追加情報です。 <br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。 <br />
●Class2D/after_sorting/run_it025_optimiser.star <br />
これは終了しなかった場合の再起動に必要な精密化過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そのときに、Optimisationタブ上で <br />
Number of iterations:40 <br />
と設定して下さい。このジョブは、反復26から反復40名で繰り返されるだろう。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれません。optimiser.starファイルのもう1つの有用な特徴として、1行目に、これを動かすために与えられた正確なコマンドライン引数がコメントとして含まれています。 <br />
●Class2D/after_sorting/run_it025_sampling.star <br />
これはサンプリング間隔の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
===2.3 Making groups===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
RELIONは、粒子をグループ化する際に、以下のふたつのことを実行します。ひとつは、平均のノイズのスペクトラム強度(σij^2)の推定と単一数としての強度スケールファクター(τi^2)の推定です。後者は、そのデータの異なる部分の間での、全領域シグナル対ノイズ比(SNRi)の違いを表現しており、例えば、氷の厚さ、デフォーカスまたは汚染等によるものです。 <br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱っています。この動作は顕微鏡写真ごとに多くの粒子が存在する場合には良いです。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、強度スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしていますが、2D,3Dクラス化後、各グループの粒子の初期数はより少なくなるだろうということに注意しておいて下さい。 <br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真からの粒子をグループ化することをお薦めします。このことから、RELION 2.0での新しいGUIとして【Subset selection】の中に便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。 <br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正がされます。<br />
<br />
==De novo 3D model generation (3Dモデル形成)==<br />
RELIONは、2Dの粒子から| 3D initial model | (3Dの初めのモデル)を生成することからSGDアルゴリズムを用いる。RELION-3.0によると、実行はcryoSPARCプログラムの実行にとてもよく従う。見ている方向とデータの合理的な配分の生成は(2D classification)の詳細なクラス平均を産出するために十分いい。このアルゴリズムは、適切な産出にとてもふさわしく、それ以降の低解像度モデルは、3D classificationか3D auto-refunementで利用できる。ここで留意すべきは、リリースされた3.0の実行の改善は、もはや2D classification動作からクラスにつき選択されたランダムな分子とともに分子の部分集合を選択することをしないことである。代わりに、選択された分子の一式の全体のデータを用いた時、そのアルゴリズムはとてもたくましいものである。<br />
<br />
===Running the job (動作の実行)===<br />
3D initial model のジョブタイプのI/Oタブのselect/class2d_aftersort/particles.starファイルを選択する。すべては、すでにCTFで順番にしている。OptimisationタブのFillにより従う(角のある初期状態の放置とサンプリングの相殺)<br />
●Number of class : 1<br />
(時々、一つのクラスより大きいもの。0をつかうと、データセットにまだ存在するだろう至適な分子のシンクの生成を助けるだろう。追加された議論sgd_skip_annealはまだ有用だろう。この場合、私たちはスピードアップするための一つのクラスをつかうだろう。)<br />
●Mask diameter (A) : 200<br />
前と同じ<br />
●Flatten and enforce non-negative solvent : Yes<br />
●Symmetry C1<br />
(対称性がなにかもわからないとき、C1の再構築はおそらく、始めることにベストな選択であるだろう。いくつかの高い対称性の物体は正しい空間グループよりC1のSGDによる解法が簡単だろう。このデータセットはいいデータで、正しいポイントグループD2が動作できる。しかしながら、C1からC2にどのように進行するかを説明すると、C1のSGDを動かすだろう。)<br />
特に、実例の1つに、SGDタブのいくつかに変えることはできないことと、その初期状態はいくつかの場合に適している。しかしながら、このチュートリアルのスピードアップすることは、私たちは、反復のデフォルトの数の半分だけ行うだろう。<br />
したがって、このように変化する。:<br />
●Number of initial iterations : 25<br />
●Number of in-between iterations : 100<br />
●Number of final iterations : 25<br />
Gomputeタブで、システム上で最適化する。再度RAMの中で数千の分子がプレリードできる。GPUの加速は、スピードアップを実現でき、反復の間の複数の極大化のステップは、2Dか3Dの精密化か分類の基準の準備はゆっくりになるだろう。4CPUのカードと、5MPInoプロセス、6スレッドのMPIプロセスを使い、システムはおよそ15分で済む。<br />
<br />
===Analysis the result (結果の分析)===<br />
UCSFキメラのような3Dビューワーの吐出量(Initial Model/job017/run-it/50_class001.mrc)を見る。もし、このポイントにおける対照的なポイントグループの追加を認識することは、RELIONの習慣における協調的なシステムの中心的なX,Y,軸における対照的な軸を整列させることを必要とするだろう。リリースされた3.0は新しいプログラムを促進することを含む。<br />
この動作はコマンドラインから実行できる。<br />
●Relion_align_symmetry - - i InitialModel/job017/run_it150_class001.mrc - -o InitialModel/job017/run_it150_class001_alignD2.mrc - -sym D2<br />
それと、マップにおける対照的な軸のUCSFキメラかrelion_displayの確認はX,YとZ軸の実際の整列とする。私たちはD2の対称的なものを使うことを強要させるだろう。<br />
●Relion_image_handler –i InitialModel/job017/run_it150_class001_alignD2.mrc –o InitialModel/job017/run_it150_class001_symD2.mrc –sym D2<br />
後者のコマンドの出力マップは、入力マップに似ているだろう。<br />
これによって確認できる。<br />
●relion_display_ --i InitialModel / job017 / run_it150_class001_alignD2.mrc & relion_display –i InitialModel / job017 / run_it150_class001_symD2.mrc &<br />
<br />
<br />
<br />
<br />
<br />
==Unsupervised 3D classification (教師無3次元クラス分類)==<br />
すべてのデータは異性分からなっています。問題は、どのくらいの費用でいられるかです。RELIONの3Dマルチリファレンス精密化手順は、強力な教師なし3次元分類へのアプローチを提供しています。<br />
<br />
===Running the job (ジョブを開始)===<br />
教師なし3次元分類は、[3D classification] ジョブタイプから、実行可能です。<br />
[I/O]タブの設定:<br />
●Input images STAR file: Select/class2d_aftersort/particles.star<br />
●Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
このマップはパイプラインの部分のように、Brouseボタンで表れないように述べる。両方のタイプは空のフィールドの中に名付けられるか、importジョブタイプをつかうマップの移入が行われる。対照的なC1を動作させたり、非対称的なInitialModel / job017 / run_it150_class.mrcを使いことを選択する。しかしながら、すでに右の対称的なセッティングは、後々とても楽になるだろう。<br />
●Reference mask (optional):<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供するところです。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類へのバイアスを最小限にする働きがあります。)<br />
[Reference]タブの設定: <br />
●Ref. map is on absolute greyscale: No<br />
(このマップがデータセットから再構築されたとき、すでに正しいグレースケールであります。RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
●Initial low-pass filter (A): 50<br />
(精密化プロセスにバイアスが導入する可能性があるため、高解像度の初期参照モデルは使用してはいけません。[12]で説明したように、初期マップをできる限りフィルタリングする必要があります。リボソームでは大抵、70Åを使用し、小さい粒子では通常40〜60Åの値を使用します。)<br />
●Symmetry: C1<br />
(このサンプルはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。良くない粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
●Do CTF corection? Yes<br />
●Has reference been CTF-correced? Yes<br />
(このモデルは、SGDのCTFコレクションによって作られている。)<br />
●Have data been phase flipped? No<br />
●Ignore CTFs untill first peak? No<br />
(リファレンスを作成するために使用した[2D classification]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
【Optimisation】タブの設定: <br />
●Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。) <br />
●Number of iterations: 25<br />
(これは一般的には変更する必要はありません。) <br />
●Regularisation parameter T: 4<br />
(Tの定義については[13]を参照してください。クライオEMの、2次元分類では、通常、Tは1~2を設定し、3次元分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均にノイズが見える場合はTの値を低くし、逆にクラス平均の分解能が低すぎる場合はTの値を高くします。主に気をつけなければならない点は、高解像度のノイズの過学習です。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
●Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。) <br />
●Mask individual particles with zeros? Yes<br />
(Yes: 0 / No: 乱数) <br />
●Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過学習を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
【Helix】タブは無視して下さい。 <br />
以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。 <br />
ここでも、【Running】タブで、使用するNumber of MPI processors(MPIプロセッサの数)とthreads(スレッド数)を指定できます。[2D classification]のjobタイプで説明したように、3次元分類は2次元分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3次元分類を表示するためにfirst_exhaustiveのようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。 <br />
精密化された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を確認できます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。 <br />
UCSFキメラなどを使用し、表示されたマップを3Dで見ると、マップが精密化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。 <br />
2次元分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示ウィンドウには、4つの精密化されたモデルの中央スライスが表示されます。最適なクラスを選択し、右クリックメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
===Analysing the results in more detail (詳細な結果の解析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
出力ファイルは基本的に2次元分類の実行時と同じです。(実際に2次元,3次元精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2次元クラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。例えば、run_it025_class00?.mrcというMRCマップです。 <br />
今まで通り、小さいクラスは大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比(SNR)が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。 <br />
●relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnuplotがインストールされているのであれば、以下の通りに入力して下さい。 <br />
●relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。 <br />
●grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
==High-resolution 3D refinement(三次元精密化)==<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は分解能を推定するために、gold-standard Fourier Shell Correlation(FSC)(二つの群に分け、互いに独立して再構成した場合に、どの分解能まで相関があるかにより判断)と言われる判断基準を用います。これにより、過学習を避けることができます[15]。角度の割当の正確さを推定する新しい手順([14])と組み合わせ、精密化が収束するときに自動的に決定されます。そのため、この手順は使用者の入力をほとんど必要としません。すなわち、客観性をのこしたまま、多くのデータセットのための優れたマップが生成がされていると述べられています。もう一つの長所は、一般的にこの手順は必要な実行回数が一回のみであり、最適化のための引数はほとんどありません。<br />
しかしながら、前に高解像度の精密化を始めた時、スケール未満とともに選ばれた粒子の正しいセットを再度抽出して、それによりもしかすると高解像度になるかもしれない。これをすることで、GUIのParticle extraction のジョブタイプとI/Oタブを与える。<br />
●micrograph STAR file : CtfFind / job003 / micrographs – ctf.star<br />
(そのままでよい)<br />
●Coordinate – file suffix : <br />
(空でよい)<br />
●OR re – extract refined particles ? Yes<br />
●Refined particles STAR file : Select /class3d – first_exhausitive / particle.star<br />
(今、選択された粒子の微粒にされたサブセットだけをつかうだろう)<br />
●Re – center refined coodinates ? Yes<br />
(3D classificationの動作以上から整列させたオフセットに従ってすべての粒子は再度中央に置かれるだろう)<br />
●Recenter on – X , Y , Z (pix) 0.0.0<br />
(箱の真ん中の分子を中心にキープさせたい)<br />
●Manually set pixel size ? No<br />
(入力したマイクログラフstarファイルはCTFの情報に含まれていないことが必要である。)<br />
Extractタブはすべてキープする。<br />
●Particle box size (pix) 360<br />
(大きな箱をつかうだろう。それにより非局在化させたCTFシグナルはより良いモデルになるだろう。これはCTF精密化の後が大事である。)<br />
●Rescale particles ? yes<br />
(とても大きな画像が働くことを防ぐことで、360×0.885/256 = 1.244 Åのピクセルサイズを減少させ、採取しましょう。これは、おそらく十分に小さいデータ、2.5 Åの大きな達成可能な解像度に制限があるだろう。)<br />
この動作では、エイリアスbest3dclass_bigboxを使用する。<br />
加えて、256ピクセルのボックスサイズに従って一番いいマップを入手したことのいたずらは必要である。<br />
●relion_image_handler –i Class3D/job018/run_it025_class001.mrc –angpix 3.54 –rescale_angpix 1.244 –o Class3D/job018/run_it025_class001_box256.mrc –new_box256 <br />
<br />
===Running the auto-refine job (自動精錬動作の実行)===<br />
3D auto-refine のジョブタイプのI/Oタブ<br />
●Input images STAR file : Extract/best3dclass_fullsize/particles.star<br />
●Reference map : Class3D / job018 / run_it025_class001_box256.mrc<br />
●Reference mask (optional)<br />
(からのままでいい)<br />
Reference タブ<br />
●Ref. map is on absolute gryscale ? No<br />
スケール現象の画像の違う標準化によると、正しく絶対的なグレースケールはマップの中に確立しなかった。このオプションの“No”は大事で、精密化の最初の相互作用のグレースケールは正しくなるだろう。<br />
●Initial low-pass filter (A) 50<br />
マップの高い頻度の成分に向かってバイアスを防いだことは低いパスのフィルターから自動精密化され始める。それと解像度から完全に依存された粒子の“gold standard”の維持は、1頭文字より高かった。<br />
●Symmetry D2<br />
(高解像度の粒子の照準は、強要された対称性の粒子の4倍効率的にするだろう)<br />
CTFのパラメータで、OpimisationとAuto-samplingタブは、3D classificationと同じでとどまる<br />
【Sampling】タブでの配向性のサンプリング間隔は反復の最初の数回のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング間隔が自動的に細かくなっていきます。したがって、8面体または正20面体対称よりも小さい角度で、全ての精密化仮定でで、一般的に大域探索では、初期値の角度である7.5度のサンプルを使用し、局所探索では1.8度のサンプルから行います。より正確な対称の精密化を行う場合のみ、3.7度でのサンプリングを行い、局所探索では0.9度ごとにサンプリングを行います。<br />
MPIのノードは1つのマスター(他のスレーブを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用するもの)のセットで分かれているので、奇数のMPI処理装置を使用するのが最も効率が良いです。ナイキスト周波数までのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。従って、使っているクラスターノードのコアと同じ数のスレッドで動かしたいデータセットのボックスより大きいサイズで作られたボックスが必要です。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
===Analysing the results (結果の分析)===<br />
出力ファイルは3D classificationを実行したときのものと大部分が同じです。しかし、全てにおけるプログラムの反復では、2つのrun_it0??_half?_model.starと2つのrun_it0??_half?_class001.mrcファイルを書き出します。それぞれデータの半分が精密化されます。収束した場合にのみ、ひとつのrun_model.starとrun_class001.mrcファイルを書き出します(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。 <br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[14]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルからも抽出されるかもしれません。 <br />
例えば、以下のように試してみてください。 <br />
●grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
==11 まとめ==<br />
<br />
===11.1 フローチャートの作成===<br />
<br />
どのようにして最終的な再構築をするか気になるでしょう。'''''Finished job'''''リストから実行した最後の動作を選択し、'''''Job actions'''''ボタンから'''Make flowchart'''オプションを試してください。これを実行するためにはシステムに'''LATEX'''や'''TikZ'''パッケージが必要となります。最初の項は正確な作業名のないフローチャートの全体像です。これは、出版目的に役立つでしょう(おそらくお気に入りの'''vector-based design'''プログラムの編集後に)。フローチャートの全体像の後に、最初の詳細なフローチャートにどのようにして終了するかが示されています。10ステップ以上からなるフローチャートは複数の構成要素に分けられることに注意してください。作業中に複数枝分かれすることがあるでしょう。それ故に、最終作業のフローチャートに従って、それぞれの分岐についてフローチャートがあるでしょう。リンクをクリックすることでPDFファイルから合致する位置を得ることができます。<br />
<br />
===11.2 ディレクトリのクリーンアップ===<br />
<br />
ディスクの空間を確保するために、RELIONは作業ディレクトリをクリーンアップするオプションを持っています。これには2つのモードがあります。'''''gentle'''''クリーンは作業ディレクトリから中間ファイルのみを削除します。'''''harsh'''''クリーンは作業からのインプットを必要とする新たな作業を開始するのに必要なファイルを削除します。例えば、'''''harsh'''''クリーンは'''Motion Corr'''作業から平均化された、あるいは'''Particle extraction'''作業から少量のスタックを抽出された顕微鏡写真を削除します。一方、'''''gentle'''''クリーンは'''2D classification''', '''3D classification'''あるいは'''3D auto-refine'''作業の中間反復からすべてのファイルを削除します。'''Job actions'''ボタンから個別に作業をクリーンアップすることができます。あるいは、GUIのトップメニューから下がった、'''''Jobs'''''からすべての作業をクリーンアップすることができます。私たちは計算前の結果に頭を悩ませていたプロジェクトディレクトリの'''tarball'''を作る前にそのメニューから'''''Gently clean all jobs'''''オプションを使いました。長期間保存されていたデータを取る前にプロジェクトディレクトリをクリーンアップしたいでしょう。<br />
<br />
===11.3 質問や引用===<br />
<br />
以上です!このチュートリアルを楽しんで、そして役に立つことを願います。もしRELIONについて質問があれば、初めに'''RELION Wiki'''の'''FAQ'''と'''CCPEMメーリングリスト'''を確認してください。それが助けにならなければ、'''CCPEMリスト'''を利用して質問してください。お願いですから、決してSjorsに直接メールを送信しないでください。質問全てに返答できるわけではありません。もしRELIONが利用者の研究に有益であると思ったら私たちの[http://www2.mrc-lmb.cam.ac.uk/groups/scheres/publications.html 論文]を引用し、あなたの研究仲間たちに伝えてください。<br />
<br />
===11.4 参考文献===<br />
<br />
RELIONの手順の改善を支持した理論の詳細は以下の論文で述べられています。<br />
* S.H.W. Scheres (2012) “''RELION: Implementation of a Bayesian approach to cryo-EM structure determination''” J. Struc. Biol., 180, 519-530.<br />
<br />
*S.H.W. Scheres (2012) “''A Bayesian view on cryo-EM structure determination''” J. Mol. Biol., 415, 406-418.<br />
<br />
RELIONの使い方に関する包括的な概観は以下の論文に述べられています。<br />
<br />
*S.H.W. Scheres (2016) “''Processing of structurally heterogeneous cryo-EM data in RELION''” Meth. Enzym., 579, 125-157.<br />
<br />
<br />
==12 付録 A:インストールの注意==<br />
<br />
===12.1 MPIのインストール===<br />
<br />
'''MPI(message passing interface)'''がインストールされた計算機クラスター、もしくはNVIDIA GPU搭載のマルチコアデスクトップマシンが必要になることに注意してください。RELIONをコンパイルするには、'''mpi-devel'''パッケージが必要です。おそらく存在する種類'''(MPICH, LAM-MPI, etc)'''またはバージョンはそれほど重要ではありません。まだシステム内に'''mpi-devel'''をインストールしてなければ、'''openMPI'''をインストールすることをお勧めします。<br />
<br />
===12.2 CUDAのインストール===<br />
<br />
'''NVIDIA'''の比較的新しいGPU('''compute capability 3.5+'''以上)を持っている場合、オートピッキング、分類、精密化作業を高速に実行できます。'''GPU-accelerationサポート'''を含むRELIONをコンパイルするには、'''CUDA'''をインストールする必要があります。このチュートリアルの準備には'''CUDA-8.0'''を使用しました。[https://developer.nvidia.com/cuda-downloads NVIDIAのWebサイト]からダウンロードしてください。<br />
<br />
===12.3 RELIONのインストール===<br />
<br />
RELIONはオープンソースのソフトウェアです。[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Download_%26_install the RELION wiki]から無料でダウンロードして、手順に従ってインストールしてください。もし、'''job submission system(Sun Grid EngineやPBS/TORQUE etc)'''に詳しくない場合は、インストール手順の説明にあるように、'''qsub.cshスクリプト'''の設定に関して、システム管理者にお尋ねください。分散メモリ並列化のためのMPIと、共用メモリの並列化のための'''pthreads'''の両方を使用する、いわゆるハイブリッド並列計算を実行したいときは注意してください。ジョブキューイングシステムはこれを可能とするためにいくつかの調整が必要な場合があります。再度、システム管理者にお尋ねください。<br />
<br />
===12.4 モーション補正ソフトウェアのインストール===<br />
<br />
RELION-3.0は全フレーム顕微鏡写真ムービーアライメントに使用される、'''UCSFプログラムMOTIONCOR2'''へのラッパーを提供します。[http://www.msg.ucsf.edu/agard/protocols.html Dabid Agard]のページからプログラムをダウンロードし、インストールの手順に従ってください。また、RELIONの保有する、'''MOTIONCOR2'''の実行を使うかもしれません。なので、もし、UCSF実行をインストールするのに問題が発生しても心配しないでください。バージョン3.0において、'''''Nico grigorieff’s group'''''から'''UNBLUR'''へのラッパーはGUIから中止されていることに注意してください。<br />
<br />
===12.5 CTF推定ソフトウェアのインストール===<br />
<br />
CTF推定はRELIONに含まれていません。代わりに、RELIONは'''''Alexis RohouやNiko Grigorieff’s CTFFIND4'''''へのラッパーを提供します。[http://grigoriefflab.janelia.org/datadownload Niko’s CTFFIND website]からダウンロードし、手順に従ってインストールしてください。また、もし、パソコンに'''NVIDIA graphics card(GPU)'''が入っているなら'''''Kai Zhang’s GCTF'''''を使うこともできます。その際は、LMBに関する[https://www.mrc-lmb.cam.ac.uk/kzhang/ KaiのWebサイト]からダウンロードしてください。<br />
<br />
===12.6 RESMAPのインストール===<br />
<br />
局所分解能推定はRELIONが所有するポストプロセッシングプログラムの中、あるいは'''''Alp KucukelbirのRESMAP'''''へのラッパーを通して実行される。[http://www.proditus.com/software.html AlpのRESMAP Webサイト]からダウンロードし、手順に従ってインストールしてください。<br />
<br />
<br />
<br />
<br />
== 13 付録B:RELIONの利用 ==<br />
=== 13.1 GUIについて ===<br />
<br />
==== 13.1.1 pipeline approach ====<br />
RELION-3.0では、一つのプログラムの出力を次のプログラムの入力として順次繋いでいくような情報の受け渡し(パイプライン)を円滑に実現できるようなGUIを設計しました。詳細は2016 Proceedings of the CCP-EM Spring Symposium[3]で公開されています。<br />
RELION-3.0を使うにあたって、まずプロジェクト(すなわち構造決定したい分子)ごとにディレクトリを作成することを推奨します。ここではこのディレクトリの呼称をプロジェクトディレクトリとします。RELIONのGUIは「relion」とコマンドを打つことで起動させることができますが、この動作は常にプロジェクトディレクトリに移動してから行うことを念頭に置いてください。<br />
<br />
このソフトのGUIでは、すべてのジョブや、あるジョブによる出力がどのように他のジョブの入力に使われたのかといった履歴を保存することができ、この機能によってパイプラインが形成されます。各種ジョブにはそれぞれ独自の出力ディレクトリが与えられます。ここではたとえば あるジョブの出力のためにClass2D/ というディレクトリができるとします。こういったジョブディレクトリの中でさらに新しいジョブが実行されると、その新しいジョブには一連の番号が与えられます。たとえばClass2Dのもとで作られたとあるジョブにはClass2D/job010という番号が振り分けられます。さらに、ジョブディレクトリのもとでは、Class2D/job010/run といったように出力名が定められます。このソフトでは、各ジョブに意味のある名前が付けられるような仕組みを備えるために、ファイルシステム上の個々のジョブディレクトリへの記号リンクとして実装された"エイリアス"システムを使用しています。<br />
パイプラインに関するすべての情報はdefault_pipeline.starという名前のファイルに保存されていますが、基本的にはこのファイルを見る必要はありません。もしdefault_pipeline.starファイルが壊れてしまった場合は、最後に実行したジョブディレクトリで保存されたバックアップから復元することができます。<br />
<br />
==== 13.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
このソフトのGUIは上半分と下半分に分かれています。上半分の左側にはジョブの種類が縦リスト上に並べられており、行いたいジョブを選ぶことができます。たとえば2D classificationを行いたいときは、上半分の左側のブラウザで選択すればいいわけです。上半分の右側には複数のタブがあるパネルがあり、それぞれのジョブタイプへのパラメータを入力できます。GUIの左上には機能のおおよその概要が分かる3つのメニューが書かれています。<br />
【Schedule】ボタンでは、後でジョブを実行するときのスケジューリングを行うことができます。それに対して【Run now!】ボタンは今すぐに実行したいときに使います。【Schedule】ボタンは、繰り返し実行できるよう完全自動化された「パイプライン」を用意したいときに役立ちます。たとえば、データが収集されていくにつれてそれが瞬時に反映できるようなパイプラインを実現したいときに有効です。詳細は13.3を参照してください。<br />
GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 13.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中のジョブ(【Running jobs】)、すでに完了しているジョブ(【Finished jobs】)、または後で実行するようにスケジュールされたジョブ(【Scheduled jobs】)のリストがあります。これらのリスト内のジョブをクリックすると、そのジョブのパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリが作成されることはありませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】のジョブでは、_optimiser.starというファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。【モーション補正】、【CTF推定】、【自動ピッキング】、【粒子抽出】は、これまでに行われていなかった顕微鏡写真でのみ実行されます。【Input to this job】(このjobへの入力)と【Output from this job】(このjobからの出力)は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(stdout)と標準エラー出力(stderr)がそれぞれ黒と赤のテキストで表示されます。標準エラー出力は理想的には何もない状態でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、スクロールがしやすくなるようテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 13.1.4 The Display button(ディスプレイボタン) ====<br />
runボタンとscheduleボタンの下にある【Display:】ボタンでは、各ジョブにおける最重要たる入力ファイルと出力ファイルを視覚的に表示することができます。GUIの下半分にあるjobリストのうちのひとつのjobを選択した後に【Display:】ボタンをクリックすると、選択されたjobの入力と出力がすべて(例えば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。中間体のファイルを表示するといったような一般的な機能はGUI左上の3つのメニューのうちFile>Displayを選択することで使うことができます。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第11章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(13.1.6参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
ジョブを削除すると、ジョブディレクトリ全体がプロジェクトディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、ジョブを復元することができます。<br />
<br />
ディスク容量を節約するため、ジョブを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。これには2つのクリーニングオプションがあり、片方は【gentle clean】という方法です。この方法では、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は【harsh clean】という完全なクリーニング方法です。この方法では全てのファイルを消すことになるため、より多くの容量を確保できます。その中でも【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のジョブタイプから選択できる粒子スタック、または顕微鏡写真を含むディレクトリに関しては、とりわけ多くの容量を確保できます。<br />
<br />
また、RELIONの左上にある【job】メニューの対応するオプション(【Gently clean all jobs】あるいは、【Harshly clean all jobs】)を使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。 その際、特定のディレクトリを削除対象から除外したい場合には、NO_HARSH_CLEANというファイルをその中に置いてください。<br />
<br />
例えば、保護したい粒子データがjob098にある場合、次のコマンドを実行してください。<br />
<br />
$ touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
※ touchコマンドは、指定したファイルが存在しない場合には空のファイルを作成するプログラムです。存在している場合には、ファイルの修正時刻を変更します。</div>
Nakamu
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION3%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELION3チュートリアル
2019-02-10T14:49:47Z
<p>Nakamu: /* 2.1 Running the job(動作の実行) */</p>
<hr />
<div>'''RELION3'''<br />
<br />
==1 前処理==<br />
<br />
===1.1 解析の準備===<br />
私たちはプロジェクトごとに、すなわち構造解析したいものごとに一つのディレクトリを作成することをお勧めします。これをプロジェクトディレクトリと呼びます。'''プロジェクトディレクトリからRELION GUIを毎回起動することは重要です。'''プロジェクトディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式かTIFF形式で保存するための別のディレクトリを作成してください。もしすべての動画が一つのディレクトリにある場合には、このディレクトリをMovies/とした方が好ましいでしょう。また、異なるディレクトリにある場合(例えば、違う日に集めたもの)には、Movies/15jan16またはMovies/23jan16とするといいでしょう。もし何か理由があり、RELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成することができます。<br />
<br />
単一画像の顕微鏡写真にはmrc拡張子を、動画にはmrc、mrcs、tiff拡張子をつけることができます。チュートリアルのデータを解凍したとき、プロジェクトディレクトリ(Movies/)は作成されています。このディレクトリは、TIFF形式に圧縮された24つの動画、gain.mrc、実験の情報を含んだNOTESファイルが含まれています。<br />
<br />
RELIONを起動してみましょう。前述のように、RELIONは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。その為、新しいディレクトリで初めてRELIONを起動するときは、バックグラウンドで起動するための&の文字を使うべきではありません。プロジェクトディレクトリの中にいることを確認し、入力でRELIONを起動します。<br />
<br />
relion <br />
<br />
そして新しいRELIONプロジェクトを作動するために“y“と答えます。<br />
最初にすることとして、パイプラインの中に録画した顕微鏡動画の取り込みを行います。<br />
job-typeブラウザから”Import”を選択し、以下のパラメータを埋めます。<br />
<br />
●Input files: Movies/*.tiff <br />
●Node type: 2D micrograph movies <br />
<br />
これを行うことで、Current job: Give_alias_hereという空欄に効果的なaliasを規定すrことができます。[Run now!]ボタンをクリックし、job起動します。Import/job001というディレクトリが作成され、Import/moviesというこのディレクトリへのシンボリックリンクが一緒に作成されます。STARファイルとすべての動画が新しいディレクトリの中に作成されます。中を見てみましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし違うソフトウェアで粒子を抽出した場合は、後述の事前処理を行う代わりに、STARファイルや3次元レファレンス、3次元マスクなどを取り込むために“Import”job-typeを使用してください。これについてはRELIONを使用する際の責任は取りません。また、ユーザーは正しいSTARファイルの生成に責任を取ってください。<br />
<br />
===1.2 電子線により誘起される画像の動きの補正===<br />
Motion correction job-typeは便利な全体フレーム動画の調整のためのUCSF MOTIONCOR2[21]ラッパーを規定します。あるいは、バージョン3.0以降はMOTIONCOR2と同じアルゴリズムであるRELION独自の実装を使用することもできます。RELION独自の実装はCPU でのみの実行となるので注意してください。[I/O]タブで設定をします。<br />
<br />
●Input movies STAR file: Import/movies/movies.star<br />
([Browse]ボタンで参照できるファイルは、STAR形式の動画ファイ <br />
ルのみです。)<br />
●First frame for corrected sum: 1<br />
●Last frame for corrected sum: 0<br />
(これはすべての動画フレームに使用する際の結果です。)<br />
●Pixel size(A) 0.885<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
●Do dose-weighting? Yes<br />
●Save non-dose-weighted as well? No<br />
(いくつかの非用量加重顕微鏡写真にはCTF推定を行う方がよいで <br />
しょう。ディスク容量を節約するために、データが非常に良いの <br />
でこのオプションは使用しません。)<br />
<br />
[Motioncor2]タブは以下のように入力します。<br />
●Bfactor: 150<br />
(超高解像度動画ではより大きい価値を使用します。)<br />
●Number of patches X,Y 5 5<br />
●Group frames: 1<br />
●Binning factor: 1<br />
(超高解像度動画ではたいてい2を使用します。)<br />
●Gain-reference image: Movies/gain.mrc<br />
(これは、オンザフライでのgain-reference補正用のgain- <br />
referenceファイルを規定するために使用できます。これらの動 <br />
画はまだgain補正されていないので、この場合には必要です。)<br />
●Defect file:<br />
(これは検出器上の壊れたピクセルを隠すために使用することがで <br />
きます。)<br />
●Gain rotation: No rotation (0)<br />
●Gain flip: No flipping (0)<br />
(gain-reference画像はこのデータセットのために既に補正されて <br />
います。)<br />
●Use RELION’s own implementation? Yes<br />
(これによって、UCSF実装をインストールする必要性が少なくなり <br />
ます。どちらにせよ、UCSFプログラムをインストールしている場 <br />
合は、それを使用することもできます。その場合、以下のオプシ <br />
ョンも入力する必要があります。)<br />
<br />
[Running]タブは以下のように入力します。<br />
●Do dose-weighing? Yes<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
<br />
このプログラムの実行には手頃な12スレッドの最新機器を用いればおおよそ5分かかります。MOTIONCOR2アルゴリズムのRELION独自の実装はGPUでは使用しないことに注意してください。しかしそれはマルチスレッドです。各スレッドは独立して動画フレーム場で動作するので、動画フレームの数をスレッドの数で割った数が整数になるように、いくつかのスレッドを使用することが最適です。これらの動画は24フレームあるので、12スレッドを使用すると各スレッドで2フレームが処理されます。[Run now!]ボタンの下の[Display:]ボタンからout:logfile.pdfを選択することで、推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで、値が合計された顕微鏡写真を見ることができます。スクリーンサイズに依存して、見やすいように、顕微鏡写真(Scale:0.3)を縮小し、Sigma contrast:3を使い、見やすい数のコラム(例として、Number of columns:3)にするべきです。[Display:]ボタンから表示したときから顕微鏡写真は選択できないことに注意してください。もし、取り除きたい顕微鏡写真がある場合(今回はすべていい画像なので削除しないだろうが)は[Subset selection]job-typeが使用できます。<br />
<br />
===1.3 CTF推定===<br />
次に、それぞれ補正した顕微鏡写真からCTFの値を推定します。速度の為Kai ZhangのGCTFのためのラッパーとして[CTF estimation]job-typeにします。適切なGPUがない場合、Alexis RohouとNiko GrigoreffのCTFFIND4.1を使用することができます。[I/O]タブで、[Motion correction]jobのcorrected_micrographs.starファイルを選択するために[Browse]ボタンを使用します。また、他のタブは以下のように入力します。<br />
<br />
I/Oタブにおいて<br />
●Use micrograph without dose-weighting? No<br />
(これらは重み付けされたものよりも良いThon ringsを持っているが、書き出さないことを前のステップで決めました。)<br />
●Sperical aberration (mm): 1.4<br />
(顕微鏡メーカーがこの値を提供してくれています。)<br />
●Voltage (kV): 200<br />
●Amplitude contrast: 0.1<br />
(強度コントラストはほとんどないことが知られていますが、約10%の値を与えることで、多くの構造の結果がよくなることが示されています。これは低周波数の弱い散乱がモデル化されていないからです。)<br />
●Magnified pixel size (A): 0.885<br />
(これらはピクセルサイズ0.885Aのもとの動画です。)<br />
●Amount of astigmatism (A): 100<br />
(範囲が適切に調整されていれば、この値は多くのデータセットに適しています。)<br />
<br />
Searchesタブにおいて、CIFFINDの一般的な値を設定します(正確な意味については、Nikoのドキュメンテーションを参照してください)。これらの設定は、GCTFを使用する場合には無視してください(デフォルトで、これをオフに切り替えることができるが)。<br />
●FFT box size (pix): 512<br />
●Minimum resolution (A): 30<br />
●Maximum resolution (A): 7.1<br />
●Minimum defocus cvalue (A): 5000<br />
●Maximum defocus cvalue (A):50000<br />
●Defocus step size (A): 500<br />
●Amount of astigmatism (A): 100<br />
●Estimate phase shifts No<br />
(これはphase-plateデータだけに役に立つ)<br />
GCTFを使用する場合はCTFFIND-4.1タブを無視してください。逆にGCTFを使用しない場合はCTFFIND-4.1タブウィ使用してください。今回の例として、GCTFを使用し、Getfタブを設定します。<br />
●Use Gctf instead? Yes<br />
●Gctf executable: /wherever/it/is/Gctf<br />
(環境変数である$RELION_CTFFIND_EXECUTABLEと$RELION_GCTF_EXECUTABLEは対応するプログラムのGUIエントリのデフォルト値を制御するために使用されます。)<br />
●Ignore ‘Searches’ parameters? Yes<br />
(GCTFにSearchesタブのパラメーターを渡すにはこれを’No’に設定します。デフォルトでは、これらの値は無視され、GCTF独自のデフォルトが使用されます。)<br />
●Perform equi-phase averaging? Yes<br />
(これによりThon ringのSNRが向上します。)<br />
●Other Gctf options:<br />
●Which GPUs to use: 0<br />
(この小さいデータセットには1GPUで十分でしょう。)<br />
<br />
マシンに応じて、複数のMPI処理を使用してプログラムを実行することができます。1プロセッサーとGPUのみを使用すると、動作はGCTFを使用すると31秒かかります。いったん動作が終わると、出力のCtfFind/job003/Moviesという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFINDを使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
Display:ボタンを使用してout:micrographs_ctf.starを選択すると、すべてのThon ring画像を見ることができます。実験の画像のThon rings間の0はモデルの0と一致するはずです。デフォーカス、最高分解能や性能指数などの順番の表示を並べ替えることができます。log.pdfファイルにはすべての顕微鏡写真に対する、デフォーカス、非点収差、推定解像度などの有用なパラメータのプロットとデータセット全体のヒストグラムが含まれています。データ収集における問題点を見つけ出すのに役に立ちます。<br />
もしCTFモデルが実験のThon ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除して、Finished jobsリストからCtfFind/job003を選択し、parameter-panel の値を修正し、Continue nowボタンをクリックすることでjobを再実行することができます。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できないまたは、不十分なThon ringがあり顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
===1.4手動粒子抽出===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の「粒子座標」を手動で選択して使用します。自分たちのデータをより理解できるように少なくとも複数の顕微鏡写真を選択するのがよいでしょう。選択した粒子を使用して、参照なしの2Dクラス平均を計算し、その後、これらの粒子は全データセットの粒子を自動検出するためのテンプレートになります。しかしRELION3.0以降は、Laplacian-of-Gaussian(LoG)フィルターに基づく参照なしの自動抽出手順が含まれています。これまでにテストされたほとんどの場合、この手順は適切な開始座標を提供してくれるので、Manual pickingステップは飛ばすことができます。relion_it.pyスクリプトはこの機能を使用して、完全に自動化されたオンザフライ処理を実行します。このチュートリアルでは、説明のためにManual picking jobを起動し、その後LoGベースのAuto-pickingを継続して最初の粒子セットを細分化します。<br />
手動粒子検出は経験あるのみです!RELIONで手動で粒子の検出をするのが好きでなければ、Jude ShortのXIMDISP[17](任意の拡張子付きで)、XMIPP-2.4[16](任意の拡張子付きで)、Steven LudtkeのE2BOXER.PY[18](.boxの拡張子付きで)の座標形式ファイルもサポートしています。もしこれらを使用する場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存してください。そして、同じ顕微鏡写真のルートネームは異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMovies/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Input Files:の欄に整理されたファイルのsuffix拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例だと、それぞれMovies/*.boxやMovies/*_pick.starになります。<br />
Manual picking jobタイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBrowseボタンを使用して、Colorsタブは無視して、Displayタブは下のように入力します。<br />
●Prticle diameter (A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
●Scale for micrographs: 0.25<br />
(これは画面サイズによります。)<br />
●Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。黒が標準偏差の3倍低く、白が標準偏差の3倍高くなります。グレースケールは黒から白へ直線的に変化します。詳細はDisplayImages entry on the RELION wikiを参照してください。)<br />
●White value: 0<br />
(どの値を白にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Black value: 0<br />
(どの値を黒にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Lowpass filter (A):20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくするための動作です。)<br />
●Highpass filter (A): 0<br />
(これは顕微鏡写真上の濃淡のグラデーションを取り除くのに役立ちます。)<br />
●Pixel size: 0.885<br />
(これは粒子の直径や、low-pass filterとhigh-pass filterの計算に必要です。)<br />
●Scale for CTF image:1<br />
(これは単にそれぞれの顕微鏡写真のCTFボタンをクリックしたときにThon ring画像がどれくらい大きくなるのか調節します。)<br />
Run now!ボタンをクリックすることでjobが実行され、必要に応じていくつかの粒子をクリックしてください。しかし、次のセクションではLoGベースの自動抽出を使用するので、必要でなければ選ぶことはありません。最初の[2D classification] jobに手動抽出した粒子を使用する場合は、適切なクラス平均を計算するために約500~1000個の粒子が必要になります。左クリックで選択、中クリックで選択された粒子の削除、右クリックで座標を保存する必要があるポップアップメニューが表示されます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでもメニューから保存した座標のSTARファイルに戻ることができます(ポップアップメニューの座標を使用してSTARファイルを保存した場合)。<br />
<br />
===1.5 LoGベース自動選択===<br />
今回は、Laplacian-of-Gaussian(Log)フィルタに基づくテンプレートフリーの自動抽出の手順を使用して、最初の粒子セットを選択して下さい。その後、それらの粒子は[2D classification]jobで使用され、2番目の[Auto-picking]jobのテンプレートが生成されます。初期段階では多くの粒子を必要としないので、最初の3枚の顕微鏡写真に対してのみLoGべーすの自動抽出を実行します。一般的に、可能な限り良いテンプレートを得るために、おそらく使用可能なすべての顕微鏡写真に対してLoGベースの抽出を実行します。しかし、今回はこのチュートリアルの計算速度を上げるためにいくつかの顕微鏡写真のみを使用します。<br />
最初にいくつかの顕微鏡写真を選択するために、[Subset selection]jobに移動し、I/Oタブで下を除くすべての空欄をままにします。<br />
●OR select from picked cords: ManualPick/job004/cords_suffix_manualpick.star<br />
(手動抽出で座標を保存したときに生成されます。今回は座標を使用するつもりはなく、顕微鏡写真のサブセットセレクションを行うためにそのjobを使用しているだけです。)<br />
<br />
このjobにはalias 5micsを使用しました。Run!ボタンを押し、[Manual picking]jobと同じポップアップウィンドウを再び押すと、すべてのpickとCTFボタンが表示されます。‘File’メニューを使用して‘Invert selection’:最初の5枚の顕微鏡写真の前にあるチェックボックスをクリックして選択します。その後、‘File’メニューを再び使用して‘Save selection’を選択します。これで、ManualPick/job004/micrographs_selected.starというファイルができ、これを下記の[Auto-picking]jobに使用します。<br />
その後、[Auto-picking]jobを処理し、I/Oタブの設定を行います。<br />
<br />
●Input micrographs for autopick: Select/job005/micrographs_selected.star<br />
●Pixels size in micrographs (A) -1<br />
(ピクセルサイズは入力STARファイルの中の情報から自動的に設定されます。)<br />
●2D references:<br />
(テンプレートフリーのLoGベースの自動抽出では空欄のままにします。)<br />
●OR: provides a 3D reference? No<br />
●OR: use Laplacian-of-Gaussian? Yes<br />
<br />
Laplacianタブの設定をします。<br />
●Min. diameter for loG filter (A) 150<br />
●Max. diameter for loG filter (A) 180<br />
(これは粒子投影のオングストロームの最小最大のサイズに対応します。)<br />
●Are the particles white? No<br />
(黒です。)<br />
●Maximum resolution to consider 20<br />
(ここはデフォルト値のままでいいです。)<br />
●Adjust default threshold 0<br />
(正の値、すなわち閾値はより少ない粒子を選び、負の値もより少ない粒子を選んでください。有用な値は、おそらく[-1,1]の範囲ですが、多くの場合デフォルト値の0は正しい働きをします。)<br />
<br />
Referencesタブは無視して、autopickingタブの最初の四つのオプションは無視してください。下記のように設定してください。<br />
●Write FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Read FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Shrink factor: 0<br />
(縮小を0に設定すると、自動抽出プログラムは参照上のローパスフィルタの解像度に合わせて顕微鏡写真を縮小します。これはすごく早くなり、必要なメモリが少なくなるため、このチュートリアルを素早く実行するのに便利になります。0と1の間の値は顕微鏡写真のサイズの少数で表されるでしょう。これは縮小で1を使用するよりも正確な抽出が少なくなること、つまり縮小がないことに注意してください。この新しいパラメータの詳細は、次のサブセクションで説明します。)<br />
●Use GPU acceleration? No<br />
(計算速度がとても速いので、LoGベースの自動抽出はGPU加速されていません。)<br />
●Which GPUs to use:<br />
<br />
Helixタブを無視して、Running tabで単一MPIプロセッサを使用して実行します。もしかするとLoG_basedのようなaliasが有用かもしれません。単一プロセッサを使用すると、これらの計算は、私たちのコンピュータでは約40秒かかります。<br />
Display:ボタンのcoords_suffix_autopickオプションをクリックすることで結果をチェックすることができます。この段階で表示されるポップアップウィンドウで手動で粒子を追加/削除できます。さらに、autopickingタブのノイズの標準偏差と平均のパラメータやLaplacianタブのデフォルトの閾値の調節をしている間、新しいjobを実行して、より多くの、またはより少ない粒子を抽出することができます。しかし、この段階では、単に2回目のauto-picking jobのテンプレート作成のための最初の粒子セットなので、多くの場合これは必要ないでしょう。<br />
<br />
<br />
<br />
<br />
==2 Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。 <br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。 <br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
<br />
===2.1 Running the job(動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他のオプションは、前述の自動検出のテンプレートを作成した時と同じです。 <br />
●Input images STAR file: Select/after_sorting/particle.star<br />
【Optimisation(最適化)】タブを次の通りにセットします。 <br />
●Number of class: 100<br />
(今、たくさんの粒子を持っています。)<br />
After_sortingのようなエイリアスを用いると、20分ほどで終わります。<br />
動作が終了したら、_model.starファイルを選択して【Subset selection】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度のゴーストのように見える【Einstein-from-noise】クラスに気を付けてください。こうしたクラスの選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。 <br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている外れ画像を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。 <br />
す <br />
===2.2 Analysing the results in more detail(より詳細な結果の分析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。 2D クラス平均算出の最終反復時では、以下のファイルが作成されます。 <br />
● Class2D/after_sorting/run_it025_classes.mrcs <br />
これは、クラス平均結果をMRCスタックとして保存しています。これらはメインGUIのDisplay: ボタンから _model.star を選択したときに表示される画像です。RELION は GUIから選択した場合、(GUIを選択した場合)、クラス平均はおそらく黒い背景が白くなるだろう。そのためクラス平均はおそらく黒い背景に対して白いものになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。 2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶媒領域を期待したいところです。 <br />
溶媒領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で分解能に制限をかけてみて下さい。 <br />
●Class2D/after_sorting/run_it025_model.star <br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(クラス間の画像の分布、再構成された構造中のシグナル対ノイズ比の球面平均、全てのグループのノイズスペクトラム)を含んでいます。 <br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低分解能のクラスにある粒子はほとんどない一方で、高分解能のクラスに存在する粒子は多いと分かる。 <br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである) <br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。 <br />
<br />
●Class2D/after_sorting/run_it025_data.star<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。そのメタデータとは、particles.star fileに入力した情報の他に、最適な方向、最適なクラス同定、対数尤度への寄与、などに関する追加情報です。 <br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。 <br />
●Class2D/after_sorting/run_it025_optimiser.star <br />
これは終了しなかった場合の再起動に必要な精密化過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そのときに、Optimisationタブ上で <br />
Number of iterations:40 <br />
と設定して下さい。このジョブは、反復26から反復40名で繰り返されるだろう。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれません。optimiser.starファイルのもう1つの有用な特徴として、1行目に、これを動かすために与えられた正確なコマンドライン引数がコメントとして含まれています。 <br />
●Class2D/after_sorting/run_it025_sampling.star <br />
これはサンプリング間隔の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
===2.3 Making groups===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
RELIONは、粒子をグループ化する際に、以下のふたつのことを実行します。ひとつは、平均のノイズのスペクトラム強度(σij^2)の推定と単一数としての強度スケールファクター(τi^2)の推定です。後者は、そのデータの異なる部分の間での、全領域シグナル対ノイズ比(SNRi)の違いを表現しており、例えば、氷の厚さ、デフォーカスまたは汚染等によるものです。 <br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱っています。この動作は顕微鏡写真ごとに多くの粒子が存在する場合には良いです。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、強度スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしていますが、2D,3Dクラス化後、各グループの粒子の初期数はより少なくなるだろうということに注意しておいて下さい。 <br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真からの粒子をグループ化することをお薦めします。このことから、RELION 2.0での新しいGUIとして【Subset selection】の中に便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。 <br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正がされます。<br />
<br />
==De novo 3D model generation (3Dモデル形成)==<br />
RELIONは、2Dの粒子から| 3D initial model | (3Dの初めのモデル)を生成することからSGDアルゴリズムを用いる。RELION-3.0によると、実行はcryoSPARCプログラムの実行にとてもよく従う。見ている方向とデータの合理的な配分の生成は(2D classification)の詳細なクラス平均を産出するために十分いい。このアルゴリズムは、適切な産出にとてもふさわしく、それ以降の低解像度モデルは、3D classificationか3D auto-refunementで利用できる。ここで留意すべきは、リリースされた3.0の実行の改善は、もはや2D classification動作からクラスにつき選択されたランダムな分子とともに分子の部分集合を選択することをしないことである。代わりに、選択された分子の一式の全体のデータを用いた時、そのアルゴリズムはとてもたくましいものである。<br />
<br />
===Running the job (動作の実行)===<br />
3D initial model のジョブタイプのI/Oタブのselect/class2d_aftersort/particles.starファイルを選択する。すべては、すでにCTFで順番にしている。OptimisationタブのFillにより従う(角のある初期状態の放置とサンプリングの相殺)<br />
●Number of class : 1<br />
(時々、一つのクラスより大きいもの。0をつかうと、データセットにまだ存在するだろう至適な分子のシンクの生成を助けるだろう。追加された議論sgd_skip_annealはまだ有用だろう。この場合、私たちはスピードアップするための一つのクラスをつかうだろう。)<br />
●Mask diameter (A) : 200<br />
前と同じ<br />
●Flatten and enforce non-negative solvent : Yes<br />
●Symmetry C1<br />
(対称性がなにかもわからないとき、C1の再構築はおそらく、始めることにベストな選択であるだろう。いくつかの高い対称性の物体は正しい空間グループよりC1のSGDによる解法が簡単だろう。このデータセットはいいデータで、正しいポイントグループD2が動作できる。しかしながら、C1からC2にどのように進行するかを説明すると、C1のSGDを動かすだろう。)<br />
特に、実例の1つに、SGDタブのいくつかに変えることはできないことと、その初期状態はいくつかの場合に適している。しかしながら、このチュートリアルのスピードアップすることは、私たちは、反復のデフォルトの数の半分だけ行うだろう。<br />
したがって、このように変化する。:<br />
●Number of initial iterations : 25<br />
●Number of in-between iterations : 100<br />
●Number of final iterations : 25<br />
Gomputeタブで、システム上で最適化する。再度RAMの中で数千の分子がプレリードできる。GPUの加速は、スピードアップを実現でき、反復の間の複数の極大化のステップは、2Dか3Dの精密化か分類の基準の準備はゆっくりになるだろう。4CPUのカードと、5MPInoプロセス、6スレッドのMPIプロセスを使い、システムはおよそ15分で済む。<br />
<br />
===Analysis the result (結果の分析)===<br />
UCSFキメラのような3Dビューワーの吐出量(Initial Model/job017/run-it/50_class001.mrc)を見る。もし、このポイントにおける対照的なポイントグループの追加を認識することは、RELIONの習慣における協調的なシステムの中心的なX,Y,軸における対照的な軸を整列させることを必要とするだろう。リリースされた3.0は新しいプログラムを促進することを含む。<br />
この動作はコマンドラインから実行できる。<br />
●Relion_align_symmetry - - i InitialModel/job017/run_it150_class001.mrc - -o InitialModel/job017/run_it150_class001_alignD2.mrc - -sym D2<br />
それと、マップにおける対照的な軸のUCSFキメラかrelion_displayの確認はX,YとZ軸の実際の整列とする。私たちはD2の対称的なものを使うことを強要させるだろう。<br />
●Relion_image_handler –i InitialModel/job017/run_it150_class001_alignD2.mrc –o InitialModel/job017/run_it150_class001_symD2.mrc –sym D2<br />
後者のコマンドの出力マップは、入力マップに似ているだろう。<br />
これによって確認できる。<br />
●relion_display_ --i InitialModel / job017 / run_it150_class001_alignD2.mrc & relion_display –i InitialModel / job017 / run_it150_class001_symD2.mrc &<br />
<br />
<br />
<br />
<br />
<br />
==Unsupervised 3D classification (教師無3次元クラス分類)==<br />
すべてのデータは異性分からなっています。問題は、どのくらいの費用でいられるかです。RELIONの3Dマルチリファレンス精密化手順は、強力な教師なし3次元分類へのアプローチを提供しています。<br />
<br />
===Running the job (ジョブを開始)===<br />
教師なし3次元分類は、[3D classification] ジョブタイプから、実行可能です。<br />
[I/O]タブの設定:<br />
●Input images STAR file: Select/class2d_aftersort/particles.star<br />
●Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
このマップはパイプラインの部分のように、Brouseボタンで表れないように述べる。両方のタイプは空のフィールドの中に名付けられるか、importジョブタイプをつかうマップの移入が行われる。対照的なC1を動作させたり、非対称的なInitialModel / job017 / run_it150_class.mrcを使いことを選択する。しかしながら、すでに右の対称的なセッティングは、後々とても楽になるだろう。<br />
●Reference mask (optional):<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供するところです。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類へのバイアスを最小限にする働きがあります。)<br />
[Reference]タブの設定: <br />
●Ref. map is on absolute greyscale: No<br />
(このマップがデータセットから再構築されたとき、すでに正しいグレースケールであります。RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
●Initial low-pass filter (A): 50<br />
(精密化プロセスにバイアスが導入する可能性があるため、高解像度の初期参照モデルは使用してはいけません。[12]で説明したように、初期マップをできる限りフィルタリングする必要があります。リボソームでは大抵、70Åを使用し、小さい粒子では通常40〜60Åの値を使用します。)<br />
●Symmetry: C1<br />
(このサンプルはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。良くない粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
●Do CTF corection? Yes<br />
●Has reference been CTF-correced? Yes<br />
(このモデルは、SGDのCTFコレクションによって作られている。)<br />
●Have data been phase flipped? No<br />
●Ignore CTFs untill first peak? No<br />
(リファレンスを作成するために使用した[2D classification]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
【Optimisation】タブの設定: <br />
●Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。) <br />
●Number of iterations: 25<br />
(これは一般的には変更する必要はありません。) <br />
●Regularisation parameter T: 4<br />
(Tの定義については[13]を参照してください。クライオEMの、2次元分類では、通常、Tは1~2を設定し、3次元分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均にノイズが見える場合はTの値を低くし、逆にクラス平均の分解能が低すぎる場合はTの値を高くします。主に気をつけなければならない点は、高解像度のノイズの過学習です。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
●Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。) <br />
●Mask individual particles with zeros? Yes<br />
(Yes: 0 / No: 乱数) <br />
●Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過学習を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
【Helix】タブは無視して下さい。 <br />
以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。 <br />
ここでも、【Running】タブで、使用するNumber of MPI processors(MPIプロセッサの数)とthreads(スレッド数)を指定できます。[2D classification]のjobタイプで説明したように、3次元分類は2次元分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3次元分類を表示するためにfirst_exhaustiveのようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。 <br />
精密化された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を確認できます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。 <br />
UCSFキメラなどを使用し、表示されたマップを3Dで見ると、マップが精密化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。 <br />
2次元分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示ウィンドウには、4つの精密化されたモデルの中央スライスが表示されます。最適なクラスを選択し、右クリックメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
===Analysing the results in more detail (詳細な結果の解析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
出力ファイルは基本的に2次元分類の実行時と同じです。(実際に2次元,3次元精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2次元クラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。例えば、run_it025_class00?.mrcというMRCマップです。 <br />
今まで通り、小さいクラスは大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比(SNR)が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。 <br />
●relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnuplotがインストールされているのであれば、以下の通りに入力して下さい。 <br />
●relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。 <br />
●grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
==High-resolution 3D refinement(三次元精密化)==<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は分解能を推定するために、gold-standard Fourier Shell Correlation(FSC)(二つの群に分け、互いに独立して再構成した場合に、どの分解能まで相関があるかにより判断)と言われる判断基準を用います。これにより、過学習を避けることができます[15]。角度の割当の正確さを推定する新しい手順([14])と組み合わせ、精密化が収束するときに自動的に決定されます。そのため、この手順は使用者の入力をほとんど必要としません。すなわち、客観性をのこしたまま、多くのデータセットのための優れたマップが生成がされていると述べられています。もう一つの長所は、一般的にこの手順は必要な実行回数が一回のみであり、最適化のための引数はほとんどありません。<br />
しかしながら、前に高解像度の精密化を始めた時、スケール未満とともに選ばれた粒子の正しいセットを再度抽出して、それによりもしかすると高解像度になるかもしれない。これをすることで、GUIのParticle extraction のジョブタイプとI/Oタブを与える。<br />
●micrograph STAR file : CtfFind / job003 / micrographs – ctf.star<br />
(そのままでよい)<br />
●Coordinate – file suffix : <br />
(空でよい)<br />
●OR re – extract refined particles ? Yes<br />
●Refined particles STAR file : Select /class3d – first_exhausitive / particle.star<br />
(今、選択された粒子の微粒にされたサブセットだけをつかうだろう)<br />
●Re – center refined coodinates ? Yes<br />
(3D classificationの動作以上から整列させたオフセットに従ってすべての粒子は再度中央に置かれるだろう)<br />
●Recenter on – X , Y , Z (pix) 0.0.0<br />
(箱の真ん中の分子を中心にキープさせたい)<br />
●Manually set pixel size ? No<br />
(入力したマイクログラフstarファイルはCTFの情報に含まれていないことが必要である。)<br />
Extractタブはすべてキープする。<br />
●Particle box size (pix) 360<br />
(大きな箱をつかうだろう。それにより非局在化させたCTFシグナルはより良いモデルになるだろう。これはCTF精密化の後が大事である。)<br />
●Rescale particles ? yes<br />
(とても大きな画像が働くことを防ぐことで、360×0.885/256 = 1.244 Åのピクセルサイズを減少させ、採取しましょう。これは、おそらく十分に小さいデータ、2.5 Åの大きな達成可能な解像度に制限があるだろう。)<br />
この動作では、エイリアスbest3dclass_bigboxを使用する。<br />
加えて、256ピクセルのボックスサイズに従って一番いいマップを入手したことのいたずらは必要である。<br />
●relion_image_handler –i Class3D/job018/run_it025_class001.mrc –angpix 3.54 –rescale_angpix 1.244 –o Class3D/job018/run_it025_class001_box256.mrc –new_box256 <br />
<br />
===Running the auto-refine job (自動精錬動作の実行)===<br />
3D auto-refine のジョブタイプのI/Oタブ<br />
●Input images STAR file : Extract/best3dclass_fullsize/particles.star<br />
●Reference map : Class3D / job018 / run_it025_class001_box256.mrc<br />
●Reference mask (optional)<br />
(からのままでいい)<br />
Reference タブ<br />
●Ref. map is on absolute gryscale ? No<br />
スケール現象の画像の違う標準化によると、正しく絶対的なグレースケールはマップの中に確立しなかった。このオプションの“No”は大事で、精密化の最初の相互作用のグレースケールは正しくなるだろう。<br />
●Initial low-pass filter (A) 50<br />
マップの高い頻度の成分に向かってバイアスを防いだことは低いパスのフィルターから自動精密化され始める。それと解像度から完全に依存された粒子の“gold standard”の維持は、1頭文字より高かった。<br />
●Symmetry D2<br />
(高解像度の粒子の照準は、強要された対称性の粒子の4倍効率的にするだろう)<br />
CTFのパラメータで、OpimisationとAuto-samplingタブは、3D classificationと同じでとどまる<br />
【Sampling】タブでの配向性のサンプリング間隔は反復の最初の数回のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング間隔が自動的に細かくなっていきます。したがって、8面体または正20面体対称よりも小さい角度で、全ての精密化仮定でで、一般的に大域探索では、初期値の角度である7.5度のサンプルを使用し、局所探索では1.8度のサンプルから行います。より正確な対称の精密化を行う場合のみ、3.7度でのサンプリングを行い、局所探索では0.9度ごとにサンプリングを行います。<br />
MPIのノードは1つのマスター(他のスレーブを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用するもの)のセットで分かれているので、奇数のMPI処理装置を使用するのが最も効率が良いです。ナイキスト周波数までのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。従って、使っているクラスターノードのコアと同じ数のスレッドで動かしたいデータセットのボックスより大きいサイズで作られたボックスが必要です。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
===Analysing the results (結果の分析)===<br />
出力ファイルは3D classificationを実行したときのものと大部分が同じです。しかし、全てにおけるプログラムの反復では、2つのrun_it0??_half?_model.starと2つのrun_it0??_half?_class001.mrcファイルを書き出します。それぞれデータの半分が精密化されます。収束した場合にのみ、ひとつのrun_model.starとrun_class001.mrcファイルを書き出します(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。 <br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[14]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルからも抽出されるかもしれません。 <br />
例えば、以下のように試してみてください。 <br />
●grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
==11 まとめ==<br />
<br />
===11.1 フローチャートの作成===<br />
<br />
どのようにして最終的な再構築をするか気になるでしょう。'''''Finished job'''''リストから実行した最後の動作を選択し、'''''Job actions'''''ボタンから'''Make flowchart'''オプションを試してください。これを実行するためにはシステムに'''LATEX'''や'''TikZ'''パッケージが必要となります。最初の項は正確な作業名のないフローチャートの全体像です。これは、出版目的に役立つでしょう(おそらくお気に入りの'''vector-based design'''プログラムの編集後に)。フローチャートの全体像の後に、最初の詳細なフローチャートにどのようにして終了するかが示されています。10ステップ以上からなるフローチャートは複数の構成要素に分けられることに注意してください。作業中に複数枝分かれすることがあるでしょう。それ故に、最終作業のフローチャートに従って、それぞれの分岐についてフローチャートがあるでしょう。リンクをクリックすることでPDFファイルから合致する位置を得ることができます。<br />
<br />
===11.2 ディレクトリのクリーンアップ===<br />
<br />
ディスクの空間を確保するために、RELIONは作業ディレクトリをクリーンアップするオプションを持っています。これには2つのモードがあります。'''''gentle'''''クリーンは作業ディレクトリから中間ファイルのみを削除します。'''''harsh'''''クリーンは作業からのインプットを必要とする新たな作業を開始するのに必要なファイルを削除します。例えば、'''''harsh'''''クリーンは'''Motion Corr'''作業から平均化された、あるいは'''Particle extraction'''作業から少量のスタックを抽出された顕微鏡写真を削除します。一方、'''''gentle'''''クリーンは'''2D classification''', '''3D classification'''あるいは'''3D auto-refine'''作業の中間反復からすべてのファイルを削除します。'''Job actions'''ボタンから個別に作業をクリーンアップすることができます。あるいは、GUIのトップメニューから下がった、'''''Jobs'''''からすべての作業をクリーンアップすることができます。私たちは計算前の結果に頭を悩ませていたプロジェクトディレクトリの'''tarball'''を作る前にそのメニューから'''''Gently clean all jobs'''''オプションを使いました。長期間保存されていたデータを取る前にプロジェクトディレクトリをクリーンアップしたいでしょう。<br />
<br />
===11.3 質問や引用===<br />
<br />
以上です!このチュートリアルを楽しんで、そして役に立つことを願います。もしRELIONについて質問があれば、初めに'''RELION Wiki'''の'''FAQ'''と'''CCPEMメーリングリスト'''を確認してください。それが助けにならなければ、'''CCPEMリスト'''を利用して質問してください。お願いですから、決してSjorsに直接メールを送信しないでください。質問全てに返答できるわけではありません。もしRELIONが利用者の研究に有益であると思ったら私たちの[http://www2.mrc-lmb.cam.ac.uk/groups/scheres/publications.html 論文]を引用し、あなたの研究仲間たちに伝えてください。<br />
<br />
===11.4 参考文献===<br />
<br />
RELIONの手順の改善を支持した理論の詳細は以下の論文で述べられています。<br />
* S.H.W. Scheres (2012) “''RELION: Implementation of a Bayesian approach to cryo-EM structure determination''” J. Struc. Biol., 180, 519-530.<br />
<br />
*S.H.W. Scheres (2012) “''A Bayesian view on cryo-EM structure determination''” J. Mol. Biol., 415, 406-418.<br />
<br />
RELIONの使い方に関する包括的な概観は以下の論文に述べられています。<br />
<br />
*S.H.W. Scheres (2016) “''Processing of structurally heterogeneous cryo-EM data in RELION''” Meth. Enzym., 579, 125-157.<br />
<br />
<br />
==12 付録 A:インストールの注意==<br />
<br />
===12.1 MPIのインストール===<br />
<br />
'''MPI(message passing interface)'''がインストールされた計算機クラスター、もしくはNVIDIA GPU搭載のマルチコアデスクトップマシンが必要になることに注意してください。RELIONをコンパイルするには、'''mpi-devel'''パッケージが必要です。おそらく存在する種類'''(MPICH, LAM-MPI, etc)'''またはバージョンはそれほど重要ではありません。まだシステム内に'''mpi-devel'''をインストールしてなければ、'''openMPI'''をインストールすることをお勧めします。<br />
<br />
===12.2 CUDAのインストール===<br />
<br />
'''NVIDIA'''の比較的新しいGPU('''compute capability 3.5+'''以上)を持っている場合、オートピッキング、分類、精密化作業を高速に実行できます。'''GPU-accelerationサポート'''を含むRELIONをコンパイルするには、'''CUDA'''をインストールする必要があります。このチュートリアルの準備には'''CUDA-8.0'''を使用しました。[https://developer.nvidia.com/cuda-downloads NVIDIAのWebサイト]からダウンロードしてください。<br />
<br />
===12.3 RELIONのインストール===<br />
<br />
RELIONはオープンソースのソフトウェアです。[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Download_%26_install the RELION wiki]から無料でダウンロードして、手順に従ってインストールしてください。もし、'''job submission system(Sun Grid EngineやPBS/TORQUE etc)'''に詳しくない場合は、インストール手順の説明にあるように、'''qsub.cshスクリプト'''の設定に関して、システム管理者にお尋ねください。分散メモリ並列化のためのMPIと、共用メモリの並列化のための'''pthreads'''の両方を使用する、いわゆるハイブリッド並列計算を実行したいときは注意してください。ジョブキューイングシステムはこれを可能とするためにいくつかの調整が必要な場合があります。再度、システム管理者にお尋ねください。<br />
<br />
===12.4 モーション補正ソフトウェアのインストール===<br />
<br />
RELION-3.0は全フレーム顕微鏡写真ムービーアライメントに使用される、'''UCSFプログラムMOTIONCOR2'''へのラッパーを提供します。[http://www.msg.ucsf.edu/agard/protocols.html Dabid Agard]のページからプログラムをダウンロードし、インストールの手順に従ってください。また、RELIONの保有する、'''MOTIONCOR2'''の実行を使うかもしれません。なので、もし、UCSF実行をインストールするのに問題が発生しても心配しないでください。バージョン3.0において、'''''Nico grigorieff’s group'''''から'''UNBLUR'''へのラッパーはGUIから中止されていることに注意してください。<br />
<br />
===12.5 CTF推定ソフトウェアのインストール===<br />
<br />
CTF推定はRELIONに含まれていません。代わりに、RELIONは'''''Alexis RohouやNiko Grigorieff’s CTFFIND4'''''へのラッパーを提供します。[http://grigoriefflab.janelia.org/datadownload Niko’s CTFFIND website]からダウンロードし、手順に従ってインストールしてください。また、もし、パソコンに'''NVIDIA graphics card(GPU)'''が入っているなら'''''Kai Zhang’s GCTF'''''を使うこともできます。その際は、LMBに関する[https://www.mrc-lmb.cam.ac.uk/kzhang/ KaiのWebサイト]からダウンロードしてください。<br />
<br />
===12.6 RESMAPのインストール===<br />
<br />
局所分解能推定はRELIONが所有するポストプロセッシングプログラムの中、あるいは'''''Alp KucukelbirのRESMAP'''''へのラッパーを通して実行される。[http://www.proditus.com/software.html AlpのRESMAP Webサイト]からダウンロードし、手順に従ってインストールしてください。<br />
<br />
<br />
<br />
<br />
== 13 付録B:RELIONの利用 ==<br />
=== 13.1 GUIについて ===<br />
<br />
==== 13.1.1 pipeline approach ====<br />
RELION-3.0では、一つのプログラムの出力を次のプログラムの入力として順次繋いでいくような情報の受け渡し(パイプライン)を円滑に実現できるようなGUIを設計しました。詳細は2016 Proceedings of the CCP-EM Spring Symposium[3]で公開されています。<br />
RELION-3.0を使うにあたって、まずプロジェクト(すなわち構造決定したい分子)ごとにディレクトリを作成することを推奨します。ここではこのディレクトリの呼称をプロジェクトディレクトリとします。RELIONのGUIは「relion」とコマンドを打つことで起動させることができますが、この動作は常にプロジェクトディレクトリに移動してから行うことを念頭に置いてください。<br />
<br />
このソフトのGUIでは、すべてのジョブや、あるジョブによる出力がどのように他のジョブの入力に使われたのかといった履歴を保存することができ、この機能によってパイプラインが形成されます。各種ジョブにはそれぞれ独自の出力ディレクトリが与えられます。ここではたとえば あるジョブの出力のためにClass2D/ というディレクトリができるとします。こういったジョブディレクトリの中でさらに新しいジョブが実行されると、その新しいジョブには一連の番号が与えられます。たとえばClass2Dのもとで作られたとあるジョブにはClass2D/job010という番号が振り分けられます。さらに、ジョブディレクトリのもとでは、Class2D/job010/run といったように出力名が定められます。このソフトでは、各ジョブに意味のある名前が付けられるような仕組みを備えるために、ファイルシステム上の個々のジョブディレクトリへの記号リンクとして実装された"エイリアス"システムを使用しています。<br />
パイプラインに関するすべての情報はdefault_pipeline.starという名前のファイルに保存されていますが、基本的にはこのファイルを見る必要はありません。もしdefault_pipeline.starファイルが壊れてしまった場合は、最後に実行したジョブディレクトリで保存されたバックアップから復元することができます。<br />
<br />
==== 13.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
このソフトのGUIは上半分と下半分に分かれています。上半分の左側にはジョブの種類が縦リスト上に並べられており、行いたいジョブを選ぶことができます。たとえば2D classificationを行いたいときは、上半分の左側のブラウザで選択すればいいわけです。上半分の右側には複数のタブがあるパネルがあり、それぞれのジョブタイプへのパラメータを入力できます。GUIの左上には機能のおおよその概要が分かる3つのメニューが書かれています。<br />
【Schedule】ボタンでは、後でジョブを実行するときのスケジューリングを行うことができます。それに対して【Run now!】ボタンは今すぐに実行したいときに使います。【Schedule】ボタンは、繰り返し実行できるよう完全自動化された「パイプライン」を用意したいときに役立ちます。たとえば、データが収集されていくにつれてそれが瞬時に反映できるようなパイプラインを実現したいときに有効です。詳細は13.3を参照してください。<br />
GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 13.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中のジョブ(【Running jobs】)、すでに完了しているジョブ(【Finished jobs】)、または後で実行するようにスケジュールされたジョブ(【Scheduled jobs】)のリストがあります。これらのリスト内のジョブをクリックすると、そのジョブのパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリが作成されることはありませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】のジョブでは、_optimiser.starというファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。【モーション補正】、【CTF推定】、【自動ピッキング】、【粒子抽出】は、これまでに行われていなかった顕微鏡写真でのみ実行されます。【Input to this job】(このjobへの入力)と【Output from this job】(このjobからの出力)は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(stdout)と標準エラー出力(stderr)がそれぞれ黒と赤のテキストで表示されます。標準エラー出力は理想的には何もない状態でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、スクロールがしやすくなるようテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 13.1.4 The Display button(ディスプレイボタン) ====<br />
runボタンとscheduleボタンの下にある【Display:】ボタンでは、各ジョブにおける最重要たる入力ファイルと出力ファイルを視覚的に表示することができます。GUIの下半分にあるjobリストのうちのひとつのjobを選択した後に【Display:】ボタンをクリックすると、選択されたjobの入力と出力がすべて(例えば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。中間体のファイルを表示するといったような一般的な機能はGUI左上の3つのメニューのうちFile>Displayを選択することで使うことができます。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第11章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(13.1.6参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
ジョブを削除すると、ジョブディレクトリ全体がプロジェクトディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、ジョブを復元することができます。<br />
<br />
ディスク容量を節約するため、ジョブを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。これには2つのクリーニングオプションがあり、片方は【gentle clean】という方法です。この方法では、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は【harsh clean】という完全なクリーニング方法です。この方法では全てのファイルを消すことになるため、より多くの容量を確保できます。その中でも【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のジョブタイプから選択できる粒子スタック、または顕微鏡写真を含むディレクトリに関しては、とりわけ多くの容量を確保できます。<br />
<br />
また、RELIONの左上にある【job】メニューの対応するオプション(【Gently clean all jobs】あるいは、【Harshly clean all jobs】)を使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。 その際、特定のディレクトリを削除対象から除外したい場合には、NO_HARSH_CLEANというファイルをその中に置いてください。<br />
<br />
例えば、保護したい粒子データがjob098にある場合、次のコマンドを実行してください。<br />
<br />
$ touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
※ touchコマンドは、指定したファイルが存在しない場合には空のファイルを作成するプログラムです。存在している場合には、ファイルの修正時刻を変更します。</div>
Nakamu
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION3%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELION3チュートリアル
2019-02-10T14:48:08Z
<p>Nakamu: /* Reference-free 2D class averaging (参照無2次元クラス平均) */</p>
<hr />
<div>'''RELION3'''<br />
<br />
==1 前処理==<br />
<br />
===1.1 解析の準備===<br />
私たちはプロジェクトごとに、すなわち構造解析したいものごとに一つのディレクトリを作成することをお勧めします。これをプロジェクトディレクトリと呼びます。'''プロジェクトディレクトリからRELION GUIを毎回起動することは重要です。'''プロジェクトディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式かTIFF形式で保存するための別のディレクトリを作成してください。もしすべての動画が一つのディレクトリにある場合には、このディレクトリをMovies/とした方が好ましいでしょう。また、異なるディレクトリにある場合(例えば、違う日に集めたもの)には、Movies/15jan16またはMovies/23jan16とするといいでしょう。もし何か理由があり、RELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成することができます。<br />
<br />
単一画像の顕微鏡写真にはmrc拡張子を、動画にはmrc、mrcs、tiff拡張子をつけることができます。チュートリアルのデータを解凍したとき、プロジェクトディレクトリ(Movies/)は作成されています。このディレクトリは、TIFF形式に圧縮された24つの動画、gain.mrc、実験の情報を含んだNOTESファイルが含まれています。<br />
<br />
RELIONを起動してみましょう。前述のように、RELIONは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。その為、新しいディレクトリで初めてRELIONを起動するときは、バックグラウンドで起動するための&の文字を使うべきではありません。プロジェクトディレクトリの中にいることを確認し、入力でRELIONを起動します。<br />
<br />
relion <br />
<br />
そして新しいRELIONプロジェクトを作動するために“y“と答えます。<br />
最初にすることとして、パイプラインの中に録画した顕微鏡動画の取り込みを行います。<br />
job-typeブラウザから”Import”を選択し、以下のパラメータを埋めます。<br />
<br />
●Input files: Movies/*.tiff <br />
●Node type: 2D micrograph movies <br />
<br />
これを行うことで、Current job: Give_alias_hereという空欄に効果的なaliasを規定すrことができます。[Run now!]ボタンをクリックし、job起動します。Import/job001というディレクトリが作成され、Import/moviesというこのディレクトリへのシンボリックリンクが一緒に作成されます。STARファイルとすべての動画が新しいディレクトリの中に作成されます。中を見てみましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし違うソフトウェアで粒子を抽出した場合は、後述の事前処理を行う代わりに、STARファイルや3次元レファレンス、3次元マスクなどを取り込むために“Import”job-typeを使用してください。これについてはRELIONを使用する際の責任は取りません。また、ユーザーは正しいSTARファイルの生成に責任を取ってください。<br />
<br />
===1.2 電子線により誘起される画像の動きの補正===<br />
Motion correction job-typeは便利な全体フレーム動画の調整のためのUCSF MOTIONCOR2[21]ラッパーを規定します。あるいは、バージョン3.0以降はMOTIONCOR2と同じアルゴリズムであるRELION独自の実装を使用することもできます。RELION独自の実装はCPU でのみの実行となるので注意してください。[I/O]タブで設定をします。<br />
<br />
●Input movies STAR file: Import/movies/movies.star<br />
([Browse]ボタンで参照できるファイルは、STAR形式の動画ファイ <br />
ルのみです。)<br />
●First frame for corrected sum: 1<br />
●Last frame for corrected sum: 0<br />
(これはすべての動画フレームに使用する際の結果です。)<br />
●Pixel size(A) 0.885<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
●Do dose-weighting? Yes<br />
●Save non-dose-weighted as well? No<br />
(いくつかの非用量加重顕微鏡写真にはCTF推定を行う方がよいで <br />
しょう。ディスク容量を節約するために、データが非常に良いの <br />
でこのオプションは使用しません。)<br />
<br />
[Motioncor2]タブは以下のように入力します。<br />
●Bfactor: 150<br />
(超高解像度動画ではより大きい価値を使用します。)<br />
●Number of patches X,Y 5 5<br />
●Group frames: 1<br />
●Binning factor: 1<br />
(超高解像度動画ではたいてい2を使用します。)<br />
●Gain-reference image: Movies/gain.mrc<br />
(これは、オンザフライでのgain-reference補正用のgain- <br />
referenceファイルを規定するために使用できます。これらの動 <br />
画はまだgain補正されていないので、この場合には必要です。)<br />
●Defect file:<br />
(これは検出器上の壊れたピクセルを隠すために使用することがで <br />
きます。)<br />
●Gain rotation: No rotation (0)<br />
●Gain flip: No flipping (0)<br />
(gain-reference画像はこのデータセットのために既に補正されて <br />
います。)<br />
●Use RELION’s own implementation? Yes<br />
(これによって、UCSF実装をインストールする必要性が少なくなり <br />
ます。どちらにせよ、UCSFプログラムをインストールしている場 <br />
合は、それを使用することもできます。その場合、以下のオプシ <br />
ョンも入力する必要があります。)<br />
<br />
[Running]タブは以下のように入力します。<br />
●Do dose-weighing? Yes<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
<br />
このプログラムの実行には手頃な12スレッドの最新機器を用いればおおよそ5分かかります。MOTIONCOR2アルゴリズムのRELION独自の実装はGPUでは使用しないことに注意してください。しかしそれはマルチスレッドです。各スレッドは独立して動画フレーム場で動作するので、動画フレームの数をスレッドの数で割った数が整数になるように、いくつかのスレッドを使用することが最適です。これらの動画は24フレームあるので、12スレッドを使用すると各スレッドで2フレームが処理されます。[Run now!]ボタンの下の[Display:]ボタンからout:logfile.pdfを選択することで、推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで、値が合計された顕微鏡写真を見ることができます。スクリーンサイズに依存して、見やすいように、顕微鏡写真(Scale:0.3)を縮小し、Sigma contrast:3を使い、見やすい数のコラム(例として、Number of columns:3)にするべきです。[Display:]ボタンから表示したときから顕微鏡写真は選択できないことに注意してください。もし、取り除きたい顕微鏡写真がある場合(今回はすべていい画像なので削除しないだろうが)は[Subset selection]job-typeが使用できます。<br />
<br />
===1.3 CTF推定===<br />
次に、それぞれ補正した顕微鏡写真からCTFの値を推定します。速度の為Kai ZhangのGCTFのためのラッパーとして[CTF estimation]job-typeにします。適切なGPUがない場合、Alexis RohouとNiko GrigoreffのCTFFIND4.1を使用することができます。[I/O]タブで、[Motion correction]jobのcorrected_micrographs.starファイルを選択するために[Browse]ボタンを使用します。また、他のタブは以下のように入力します。<br />
<br />
I/Oタブにおいて<br />
●Use micrograph without dose-weighting? No<br />
(これらは重み付けされたものよりも良いThon ringsを持っているが、書き出さないことを前のステップで決めました。)<br />
●Sperical aberration (mm): 1.4<br />
(顕微鏡メーカーがこの値を提供してくれています。)<br />
●Voltage (kV): 200<br />
●Amplitude contrast: 0.1<br />
(強度コントラストはほとんどないことが知られていますが、約10%の値を与えることで、多くの構造の結果がよくなることが示されています。これは低周波数の弱い散乱がモデル化されていないからです。)<br />
●Magnified pixel size (A): 0.885<br />
(これらはピクセルサイズ0.885Aのもとの動画です。)<br />
●Amount of astigmatism (A): 100<br />
(範囲が適切に調整されていれば、この値は多くのデータセットに適しています。)<br />
<br />
Searchesタブにおいて、CIFFINDの一般的な値を設定します(正確な意味については、Nikoのドキュメンテーションを参照してください)。これらの設定は、GCTFを使用する場合には無視してください(デフォルトで、これをオフに切り替えることができるが)。<br />
●FFT box size (pix): 512<br />
●Minimum resolution (A): 30<br />
●Maximum resolution (A): 7.1<br />
●Minimum defocus cvalue (A): 5000<br />
●Maximum defocus cvalue (A):50000<br />
●Defocus step size (A): 500<br />
●Amount of astigmatism (A): 100<br />
●Estimate phase shifts No<br />
(これはphase-plateデータだけに役に立つ)<br />
GCTFを使用する場合はCTFFIND-4.1タブを無視してください。逆にGCTFを使用しない場合はCTFFIND-4.1タブウィ使用してください。今回の例として、GCTFを使用し、Getfタブを設定します。<br />
●Use Gctf instead? Yes<br />
●Gctf executable: /wherever/it/is/Gctf<br />
(環境変数である$RELION_CTFFIND_EXECUTABLEと$RELION_GCTF_EXECUTABLEは対応するプログラムのGUIエントリのデフォルト値を制御するために使用されます。)<br />
●Ignore ‘Searches’ parameters? Yes<br />
(GCTFにSearchesタブのパラメーターを渡すにはこれを’No’に設定します。デフォルトでは、これらの値は無視され、GCTF独自のデフォルトが使用されます。)<br />
●Perform equi-phase averaging? Yes<br />
(これによりThon ringのSNRが向上します。)<br />
●Other Gctf options:<br />
●Which GPUs to use: 0<br />
(この小さいデータセットには1GPUで十分でしょう。)<br />
<br />
マシンに応じて、複数のMPI処理を使用してプログラムを実行することができます。1プロセッサーとGPUのみを使用すると、動作はGCTFを使用すると31秒かかります。いったん動作が終わると、出力のCtfFind/job003/Moviesという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFINDを使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
Display:ボタンを使用してout:micrographs_ctf.starを選択すると、すべてのThon ring画像を見ることができます。実験の画像のThon rings間の0はモデルの0と一致するはずです。デフォーカス、最高分解能や性能指数などの順番の表示を並べ替えることができます。log.pdfファイルにはすべての顕微鏡写真に対する、デフォーカス、非点収差、推定解像度などの有用なパラメータのプロットとデータセット全体のヒストグラムが含まれています。データ収集における問題点を見つけ出すのに役に立ちます。<br />
もしCTFモデルが実験のThon ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除して、Finished jobsリストからCtfFind/job003を選択し、parameter-panel の値を修正し、Continue nowボタンをクリックすることでjobを再実行することができます。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できないまたは、不十分なThon ringがあり顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
===1.4手動粒子抽出===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の「粒子座標」を手動で選択して使用します。自分たちのデータをより理解できるように少なくとも複数の顕微鏡写真を選択するのがよいでしょう。選択した粒子を使用して、参照なしの2Dクラス平均を計算し、その後、これらの粒子は全データセットの粒子を自動検出するためのテンプレートになります。しかしRELION3.0以降は、Laplacian-of-Gaussian(LoG)フィルターに基づく参照なしの自動抽出手順が含まれています。これまでにテストされたほとんどの場合、この手順は適切な開始座標を提供してくれるので、Manual pickingステップは飛ばすことができます。relion_it.pyスクリプトはこの機能を使用して、完全に自動化されたオンザフライ処理を実行します。このチュートリアルでは、説明のためにManual picking jobを起動し、その後LoGベースのAuto-pickingを継続して最初の粒子セットを細分化します。<br />
手動粒子検出は経験あるのみです!RELIONで手動で粒子の検出をするのが好きでなければ、Jude ShortのXIMDISP[17](任意の拡張子付きで)、XMIPP-2.4[16](任意の拡張子付きで)、Steven LudtkeのE2BOXER.PY[18](.boxの拡張子付きで)の座標形式ファイルもサポートしています。もしこれらを使用する場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存してください。そして、同じ顕微鏡写真のルートネームは異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMovies/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Input Files:の欄に整理されたファイルのsuffix拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例だと、それぞれMovies/*.boxやMovies/*_pick.starになります。<br />
Manual picking jobタイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBrowseボタンを使用して、Colorsタブは無視して、Displayタブは下のように入力します。<br />
●Prticle diameter (A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
●Scale for micrographs: 0.25<br />
(これは画面サイズによります。)<br />
●Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。黒が標準偏差の3倍低く、白が標準偏差の3倍高くなります。グレースケールは黒から白へ直線的に変化します。詳細はDisplayImages entry on the RELION wikiを参照してください。)<br />
●White value: 0<br />
(どの値を白にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Black value: 0<br />
(どの値を黒にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Lowpass filter (A):20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくするための動作です。)<br />
●Highpass filter (A): 0<br />
(これは顕微鏡写真上の濃淡のグラデーションを取り除くのに役立ちます。)<br />
●Pixel size: 0.885<br />
(これは粒子の直径や、low-pass filterとhigh-pass filterの計算に必要です。)<br />
●Scale for CTF image:1<br />
(これは単にそれぞれの顕微鏡写真のCTFボタンをクリックしたときにThon ring画像がどれくらい大きくなるのか調節します。)<br />
Run now!ボタンをクリックすることでjobが実行され、必要に応じていくつかの粒子をクリックしてください。しかし、次のセクションではLoGベースの自動抽出を使用するので、必要でなければ選ぶことはありません。最初の[2D classification] jobに手動抽出した粒子を使用する場合は、適切なクラス平均を計算するために約500~1000個の粒子が必要になります。左クリックで選択、中クリックで選択された粒子の削除、右クリックで座標を保存する必要があるポップアップメニューが表示されます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでもメニューから保存した座標のSTARファイルに戻ることができます(ポップアップメニューの座標を使用してSTARファイルを保存した場合)。<br />
<br />
===1.5 LoGベース自動選択===<br />
今回は、Laplacian-of-Gaussian(Log)フィルタに基づくテンプレートフリーの自動抽出の手順を使用して、最初の粒子セットを選択して下さい。その後、それらの粒子は[2D classification]jobで使用され、2番目の[Auto-picking]jobのテンプレートが生成されます。初期段階では多くの粒子を必要としないので、最初の3枚の顕微鏡写真に対してのみLoGべーすの自動抽出を実行します。一般的に、可能な限り良いテンプレートを得るために、おそらく使用可能なすべての顕微鏡写真に対してLoGベースの抽出を実行します。しかし、今回はこのチュートリアルの計算速度を上げるためにいくつかの顕微鏡写真のみを使用します。<br />
最初にいくつかの顕微鏡写真を選択するために、[Subset selection]jobに移動し、I/Oタブで下を除くすべての空欄をままにします。<br />
●OR select from picked cords: ManualPick/job004/cords_suffix_manualpick.star<br />
(手動抽出で座標を保存したときに生成されます。今回は座標を使用するつもりはなく、顕微鏡写真のサブセットセレクションを行うためにそのjobを使用しているだけです。)<br />
<br />
このjobにはalias 5micsを使用しました。Run!ボタンを押し、[Manual picking]jobと同じポップアップウィンドウを再び押すと、すべてのpickとCTFボタンが表示されます。‘File’メニューを使用して‘Invert selection’:最初の5枚の顕微鏡写真の前にあるチェックボックスをクリックして選択します。その後、‘File’メニューを再び使用して‘Save selection’を選択します。これで、ManualPick/job004/micrographs_selected.starというファイルができ、これを下記の[Auto-picking]jobに使用します。<br />
その後、[Auto-picking]jobを処理し、I/Oタブの設定を行います。<br />
<br />
●Input micrographs for autopick: Select/job005/micrographs_selected.star<br />
●Pixels size in micrographs (A) -1<br />
(ピクセルサイズは入力STARファイルの中の情報から自動的に設定されます。)<br />
●2D references:<br />
(テンプレートフリーのLoGベースの自動抽出では空欄のままにします。)<br />
●OR: provides a 3D reference? No<br />
●OR: use Laplacian-of-Gaussian? Yes<br />
<br />
Laplacianタブの設定をします。<br />
●Min. diameter for loG filter (A) 150<br />
●Max. diameter for loG filter (A) 180<br />
(これは粒子投影のオングストロームの最小最大のサイズに対応します。)<br />
●Are the particles white? No<br />
(黒です。)<br />
●Maximum resolution to consider 20<br />
(ここはデフォルト値のままでいいです。)<br />
●Adjust default threshold 0<br />
(正の値、すなわち閾値はより少ない粒子を選び、負の値もより少ない粒子を選んでください。有用な値は、おそらく[-1,1]の範囲ですが、多くの場合デフォルト値の0は正しい働きをします。)<br />
<br />
Referencesタブは無視して、autopickingタブの最初の四つのオプションは無視してください。下記のように設定してください。<br />
●Write FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Read FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Shrink factor: 0<br />
(縮小を0に設定すると、自動抽出プログラムは参照上のローパスフィルタの解像度に合わせて顕微鏡写真を縮小します。これはすごく早くなり、必要なメモリが少なくなるため、このチュートリアルを素早く実行するのに便利になります。0と1の間の値は顕微鏡写真のサイズの少数で表されるでしょう。これは縮小で1を使用するよりも正確な抽出が少なくなること、つまり縮小がないことに注意してください。この新しいパラメータの詳細は、次のサブセクションで説明します。)<br />
●Use GPU acceleration? No<br />
(計算速度がとても速いので、LoGベースの自動抽出はGPU加速されていません。)<br />
●Which GPUs to use:<br />
<br />
Helixタブを無視して、Running tabで単一MPIプロセッサを使用して実行します。もしかするとLoG_basedのようなaliasが有用かもしれません。単一プロセッサを使用すると、これらの計算は、私たちのコンピュータでは約40秒かかります。<br />
Display:ボタンのcoords_suffix_autopickオプションをクリックすることで結果をチェックすることができます。この段階で表示されるポップアップウィンドウで手動で粒子を追加/削除できます。さらに、autopickingタブのノイズの標準偏差と平均のパラメータやLaplacianタブのデフォルトの閾値の調節をしている間、新しいjobを実行して、より多くの、またはより少ない粒子を抽出することができます。しかし、この段階では、単に2回目のauto-picking jobのテンプレート作成のための最初の粒子セットなので、多くの場合これは必要ないでしょう。<br />
<br />
<br />
<br />
<br />
==2 Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。 <br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。 <br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
<br />
===2.1 Running the job(動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他のオプションは、前述の自動検出のテンプレートを作成した時と同じです。 <br />
Input images STAR file: Select/after_sorting/particle.star<br />
【Optimisation(最適化)】タブを次の通りにセットします。 <br />
Number of class: 100<br />
(今、たくさんの粒子を持っています。)<br />
After_sortingのようなエイリアスを用いると、20分ほどで終わります。<br />
動作が終了したら、_model.starファイルを選択して【Subset selection】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度のゴーストのように見える【Einstein-from-noise】クラスに気を付けてください。こうしたクラスの選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。 <br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている外れ画像を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。 <br />
す <br />
4.2 Analysing the results in more detail(より詳細な結果の分析)<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。 2D クラス平均算出の最終反復時では、以下のファイルが作成されます。 <br />
● Class2D/after_sorting/run_it025_classes.mrcs <br />
これは、クラス平均結果をMRCスタックとして保存しています。これらはメインGUIのDisplay: ボタンから _model.star を選択したときに表示される画像です。RELION は GUIから選択した場合、(GUIを選択した場合)、クラス平均はおそらく黒い背景が白くなるだろう。そのためクラス平均はおそらく黒い背景に対して白いものになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。 2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶媒領域を期待したいところです。 <br />
溶媒領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で分解能に制限をかけてみて下さい。 <br />
●Class2D/after_sorting/run_it025_model.star <br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(クラス間の画像の分布、再構成された構造中のシグナル対ノイズ比の球面平均、全てのグループのノイズスペクトラム)を含んでいます。 <br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低分解能のクラスにある粒子はほとんどない一方で、高分解能のクラスに存在する粒子は多いと分かる。 <br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである) <br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。 <br />
<br />
●Class2D/after_sorting/run_it025_data.star<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。そのメタデータとは、particles.star fileに入力した情報の他に、最適な方向、最適なクラス同定、対数尤度への寄与、などに関する追加情報です。 <br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。 <br />
●Class2D/after_sorting/run_it025_optimiser.star <br />
これは終了しなかった場合の再起動に必要な精密化過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そのときに、Optimisationタブ上で <br />
Number of iterations:40 <br />
と設定して下さい。このジョブは、反復26から反復40名で繰り返されるだろう。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれません。optimiser.starファイルのもう1つの有用な特徴として、1行目に、これを動かすために与えられた正確なコマンドライン引数がコメントとして含まれています。 <br />
●Class2D/after_sorting/run_it025_sampling.star <br />
これはサンプリング間隔の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
4.3 Making groups<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
RELIONは、粒子をグループ化する際に、以下のふたつのことを実行します。ひとつは、平均のノイズのスペクトラム強度(σij^2)の推定と単一数としての強度スケールファクター(τi^2)の推定です。後者は、そのデータの異なる部分の間での、全領域シグナル対ノイズ比(SNRi)の違いを表現しており、例えば、氷の厚さ、デフォーカスまたは汚染等によるものです。 <br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱っています。この動作は顕微鏡写真ごとに多くの粒子が存在する場合には良いです。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、強度スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしていますが、2D,3Dクラス化後、各グループの粒子の初期数はより少なくなるだろうということに注意しておいて下さい。 <br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真からの粒子をグループ化することをお薦めします。このことから、RELION 2.0での新しいGUIとして【Subset selection】の中に便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。 <br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正がされます。<br />
<br />
==De novo 3D model generation (3Dモデル形成)==<br />
RELIONは、2Dの粒子から| 3D initial model | (3Dの初めのモデル)を生成することからSGDアルゴリズムを用いる。RELION-3.0によると、実行はcryoSPARCプログラムの実行にとてもよく従う。見ている方向とデータの合理的な配分の生成は(2D classification)の詳細なクラス平均を産出するために十分いい。このアルゴリズムは、適切な産出にとてもふさわしく、それ以降の低解像度モデルは、3D classificationか3D auto-refunementで利用できる。ここで留意すべきは、リリースされた3.0の実行の改善は、もはや2D classification動作からクラスにつき選択されたランダムな分子とともに分子の部分集合を選択することをしないことである。代わりに、選択された分子の一式の全体のデータを用いた時、そのアルゴリズムはとてもたくましいものである。<br />
<br />
===Running the job (動作の実行)===<br />
3D initial model のジョブタイプのI/Oタブのselect/class2d_aftersort/particles.starファイルを選択する。すべては、すでにCTFで順番にしている。OptimisationタブのFillにより従う(角のある初期状態の放置とサンプリングの相殺)<br />
●Number of class : 1<br />
(時々、一つのクラスより大きいもの。0をつかうと、データセットにまだ存在するだろう至適な分子のシンクの生成を助けるだろう。追加された議論sgd_skip_annealはまだ有用だろう。この場合、私たちはスピードアップするための一つのクラスをつかうだろう。)<br />
●Mask diameter (A) : 200<br />
前と同じ<br />
●Flatten and enforce non-negative solvent : Yes<br />
●Symmetry C1<br />
(対称性がなにかもわからないとき、C1の再構築はおそらく、始めることにベストな選択であるだろう。いくつかの高い対称性の物体は正しい空間グループよりC1のSGDによる解法が簡単だろう。このデータセットはいいデータで、正しいポイントグループD2が動作できる。しかしながら、C1からC2にどのように進行するかを説明すると、C1のSGDを動かすだろう。)<br />
特に、実例の1つに、SGDタブのいくつかに変えることはできないことと、その初期状態はいくつかの場合に適している。しかしながら、このチュートリアルのスピードアップすることは、私たちは、反復のデフォルトの数の半分だけ行うだろう。<br />
したがって、このように変化する。:<br />
●Number of initial iterations : 25<br />
●Number of in-between iterations : 100<br />
●Number of final iterations : 25<br />
Gomputeタブで、システム上で最適化する。再度RAMの中で数千の分子がプレリードできる。GPUの加速は、スピードアップを実現でき、反復の間の複数の極大化のステップは、2Dか3Dの精密化か分類の基準の準備はゆっくりになるだろう。4CPUのカードと、5MPInoプロセス、6スレッドのMPIプロセスを使い、システムはおよそ15分で済む。<br />
<br />
===Analysis the result (結果の分析)===<br />
UCSFキメラのような3Dビューワーの吐出量(Initial Model/job017/run-it/50_class001.mrc)を見る。もし、このポイントにおける対照的なポイントグループの追加を認識することは、RELIONの習慣における協調的なシステムの中心的なX,Y,軸における対照的な軸を整列させることを必要とするだろう。リリースされた3.0は新しいプログラムを促進することを含む。<br />
この動作はコマンドラインから実行できる。<br />
●Relion_align_symmetry - - i InitialModel/job017/run_it150_class001.mrc - -o InitialModel/job017/run_it150_class001_alignD2.mrc - -sym D2<br />
それと、マップにおける対照的な軸のUCSFキメラかrelion_displayの確認はX,YとZ軸の実際の整列とする。私たちはD2の対称的なものを使うことを強要させるだろう。<br />
●Relion_image_handler –i InitialModel/job017/run_it150_class001_alignD2.mrc –o InitialModel/job017/run_it150_class001_symD2.mrc –sym D2<br />
後者のコマンドの出力マップは、入力マップに似ているだろう。<br />
これによって確認できる。<br />
●relion_display_ --i InitialModel / job017 / run_it150_class001_alignD2.mrc & relion_display –i InitialModel / job017 / run_it150_class001_symD2.mrc &<br />
<br />
<br />
<br />
<br />
<br />
==Unsupervised 3D classification (教師無3次元クラス分類)==<br />
すべてのデータは異性分からなっています。問題は、どのくらいの費用でいられるかです。RELIONの3Dマルチリファレンス精密化手順は、強力な教師なし3次元分類へのアプローチを提供しています。<br />
<br />
===Running the job (ジョブを開始)===<br />
教師なし3次元分類は、[3D classification] ジョブタイプから、実行可能です。<br />
[I/O]タブの設定:<br />
●Input images STAR file: Select/class2d_aftersort/particles.star<br />
●Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
このマップはパイプラインの部分のように、Brouseボタンで表れないように述べる。両方のタイプは空のフィールドの中に名付けられるか、importジョブタイプをつかうマップの移入が行われる。対照的なC1を動作させたり、非対称的なInitialModel / job017 / run_it150_class.mrcを使いことを選択する。しかしながら、すでに右の対称的なセッティングは、後々とても楽になるだろう。<br />
●Reference mask (optional):<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供するところです。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類へのバイアスを最小限にする働きがあります。)<br />
[Reference]タブの設定: <br />
●Ref. map is on absolute greyscale: No<br />
(このマップがデータセットから再構築されたとき、すでに正しいグレースケールであります。RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
●Initial low-pass filter (A): 50<br />
(精密化プロセスにバイアスが導入する可能性があるため、高解像度の初期参照モデルは使用してはいけません。[12]で説明したように、初期マップをできる限りフィルタリングする必要があります。リボソームでは大抵、70Åを使用し、小さい粒子では通常40〜60Åの値を使用します。)<br />
●Symmetry: C1<br />
(このサンプルはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。良くない粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
●Do CTF corection? Yes<br />
●Has reference been CTF-correced? Yes<br />
(このモデルは、SGDのCTFコレクションによって作られている。)<br />
●Have data been phase flipped? No<br />
●Ignore CTFs untill first peak? No<br />
(リファレンスを作成するために使用した[2D classification]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
【Optimisation】タブの設定: <br />
●Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。) <br />
●Number of iterations: 25<br />
(これは一般的には変更する必要はありません。) <br />
●Regularisation parameter T: 4<br />
(Tの定義については[13]を参照してください。クライオEMの、2次元分類では、通常、Tは1~2を設定し、3次元分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均にノイズが見える場合はTの値を低くし、逆にクラス平均の分解能が低すぎる場合はTの値を高くします。主に気をつけなければならない点は、高解像度のノイズの過学習です。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
●Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。) <br />
●Mask individual particles with zeros? Yes<br />
(Yes: 0 / No: 乱数) <br />
●Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過学習を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
【Helix】タブは無視して下さい。 <br />
以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。 <br />
ここでも、【Running】タブで、使用するNumber of MPI processors(MPIプロセッサの数)とthreads(スレッド数)を指定できます。[2D classification]のjobタイプで説明したように、3次元分類は2次元分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3次元分類を表示するためにfirst_exhaustiveのようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。 <br />
精密化された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を確認できます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。 <br />
UCSFキメラなどを使用し、表示されたマップを3Dで見ると、マップが精密化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。 <br />
2次元分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示ウィンドウには、4つの精密化されたモデルの中央スライスが表示されます。最適なクラスを選択し、右クリックメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
===Analysing the results in more detail (詳細な結果の解析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
出力ファイルは基本的に2次元分類の実行時と同じです。(実際に2次元,3次元精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2次元クラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。例えば、run_it025_class00?.mrcというMRCマップです。 <br />
今まで通り、小さいクラスは大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比(SNR)が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。 <br />
●relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnuplotがインストールされているのであれば、以下の通りに入力して下さい。 <br />
●relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。 <br />
●grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
==High-resolution 3D refinement(三次元精密化)==<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は分解能を推定するために、gold-standard Fourier Shell Correlation(FSC)(二つの群に分け、互いに独立して再構成した場合に、どの分解能まで相関があるかにより判断)と言われる判断基準を用います。これにより、過学習を避けることができます[15]。角度の割当の正確さを推定する新しい手順([14])と組み合わせ、精密化が収束するときに自動的に決定されます。そのため、この手順は使用者の入力をほとんど必要としません。すなわち、客観性をのこしたまま、多くのデータセットのための優れたマップが生成がされていると述べられています。もう一つの長所は、一般的にこの手順は必要な実行回数が一回のみであり、最適化のための引数はほとんどありません。<br />
しかしながら、前に高解像度の精密化を始めた時、スケール未満とともに選ばれた粒子の正しいセットを再度抽出して、それによりもしかすると高解像度になるかもしれない。これをすることで、GUIのParticle extraction のジョブタイプとI/Oタブを与える。<br />
●micrograph STAR file : CtfFind / job003 / micrographs – ctf.star<br />
(そのままでよい)<br />
●Coordinate – file suffix : <br />
(空でよい)<br />
●OR re – extract refined particles ? Yes<br />
●Refined particles STAR file : Select /class3d – first_exhausitive / particle.star<br />
(今、選択された粒子の微粒にされたサブセットだけをつかうだろう)<br />
●Re – center refined coodinates ? Yes<br />
(3D classificationの動作以上から整列させたオフセットに従ってすべての粒子は再度中央に置かれるだろう)<br />
●Recenter on – X , Y , Z (pix) 0.0.0<br />
(箱の真ん中の分子を中心にキープさせたい)<br />
●Manually set pixel size ? No<br />
(入力したマイクログラフstarファイルはCTFの情報に含まれていないことが必要である。)<br />
Extractタブはすべてキープする。<br />
●Particle box size (pix) 360<br />
(大きな箱をつかうだろう。それにより非局在化させたCTFシグナルはより良いモデルになるだろう。これはCTF精密化の後が大事である。)<br />
●Rescale particles ? yes<br />
(とても大きな画像が働くことを防ぐことで、360×0.885/256 = 1.244 Åのピクセルサイズを減少させ、採取しましょう。これは、おそらく十分に小さいデータ、2.5 Åの大きな達成可能な解像度に制限があるだろう。)<br />
この動作では、エイリアスbest3dclass_bigboxを使用する。<br />
加えて、256ピクセルのボックスサイズに従って一番いいマップを入手したことのいたずらは必要である。<br />
●relion_image_handler –i Class3D/job018/run_it025_class001.mrc –angpix 3.54 –rescale_angpix 1.244 –o Class3D/job018/run_it025_class001_box256.mrc –new_box256 <br />
<br />
===Running the auto-refine job (自動精錬動作の実行)===<br />
3D auto-refine のジョブタイプのI/Oタブ<br />
●Input images STAR file : Extract/best3dclass_fullsize/particles.star<br />
●Reference map : Class3D / job018 / run_it025_class001_box256.mrc<br />
●Reference mask (optional)<br />
(からのままでいい)<br />
Reference タブ<br />
●Ref. map is on absolute gryscale ? No<br />
スケール現象の画像の違う標準化によると、正しく絶対的なグレースケールはマップの中に確立しなかった。このオプションの“No”は大事で、精密化の最初の相互作用のグレースケールは正しくなるだろう。<br />
●Initial low-pass filter (A) 50<br />
マップの高い頻度の成分に向かってバイアスを防いだことは低いパスのフィルターから自動精密化され始める。それと解像度から完全に依存された粒子の“gold standard”の維持は、1頭文字より高かった。<br />
●Symmetry D2<br />
(高解像度の粒子の照準は、強要された対称性の粒子の4倍効率的にするだろう)<br />
CTFのパラメータで、OpimisationとAuto-samplingタブは、3D classificationと同じでとどまる<br />
【Sampling】タブでの配向性のサンプリング間隔は反復の最初の数回のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング間隔が自動的に細かくなっていきます。したがって、8面体または正20面体対称よりも小さい角度で、全ての精密化仮定でで、一般的に大域探索では、初期値の角度である7.5度のサンプルを使用し、局所探索では1.8度のサンプルから行います。より正確な対称の精密化を行う場合のみ、3.7度でのサンプリングを行い、局所探索では0.9度ごとにサンプリングを行います。<br />
MPIのノードは1つのマスター(他のスレーブを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用するもの)のセットで分かれているので、奇数のMPI処理装置を使用するのが最も効率が良いです。ナイキスト周波数までのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。従って、使っているクラスターノードのコアと同じ数のスレッドで動かしたいデータセットのボックスより大きいサイズで作られたボックスが必要です。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
===Analysing the results (結果の分析)===<br />
出力ファイルは3D classificationを実行したときのものと大部分が同じです。しかし、全てにおけるプログラムの反復では、2つのrun_it0??_half?_model.starと2つのrun_it0??_half?_class001.mrcファイルを書き出します。それぞれデータの半分が精密化されます。収束した場合にのみ、ひとつのrun_model.starとrun_class001.mrcファイルを書き出します(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。 <br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[14]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルからも抽出されるかもしれません。 <br />
例えば、以下のように試してみてください。 <br />
●grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
==11 まとめ==<br />
<br />
===11.1 フローチャートの作成===<br />
<br />
どのようにして最終的な再構築をするか気になるでしょう。'''''Finished job'''''リストから実行した最後の動作を選択し、'''''Job actions'''''ボタンから'''Make flowchart'''オプションを試してください。これを実行するためにはシステムに'''LATEX'''や'''TikZ'''パッケージが必要となります。最初の項は正確な作業名のないフローチャートの全体像です。これは、出版目的に役立つでしょう(おそらくお気に入りの'''vector-based design'''プログラムの編集後に)。フローチャートの全体像の後に、最初の詳細なフローチャートにどのようにして終了するかが示されています。10ステップ以上からなるフローチャートは複数の構成要素に分けられることに注意してください。作業中に複数枝分かれすることがあるでしょう。それ故に、最終作業のフローチャートに従って、それぞれの分岐についてフローチャートがあるでしょう。リンクをクリックすることでPDFファイルから合致する位置を得ることができます。<br />
<br />
===11.2 ディレクトリのクリーンアップ===<br />
<br />
ディスクの空間を確保するために、RELIONは作業ディレクトリをクリーンアップするオプションを持っています。これには2つのモードがあります。'''''gentle'''''クリーンは作業ディレクトリから中間ファイルのみを削除します。'''''harsh'''''クリーンは作業からのインプットを必要とする新たな作業を開始するのに必要なファイルを削除します。例えば、'''''harsh'''''クリーンは'''Motion Corr'''作業から平均化された、あるいは'''Particle extraction'''作業から少量のスタックを抽出された顕微鏡写真を削除します。一方、'''''gentle'''''クリーンは'''2D classification''', '''3D classification'''あるいは'''3D auto-refine'''作業の中間反復からすべてのファイルを削除します。'''Job actions'''ボタンから個別に作業をクリーンアップすることができます。あるいは、GUIのトップメニューから下がった、'''''Jobs'''''からすべての作業をクリーンアップすることができます。私たちは計算前の結果に頭を悩ませていたプロジェクトディレクトリの'''tarball'''を作る前にそのメニューから'''''Gently clean all jobs'''''オプションを使いました。長期間保存されていたデータを取る前にプロジェクトディレクトリをクリーンアップしたいでしょう。<br />
<br />
===11.3 質問や引用===<br />
<br />
以上です!このチュートリアルを楽しんで、そして役に立つことを願います。もしRELIONについて質問があれば、初めに'''RELION Wiki'''の'''FAQ'''と'''CCPEMメーリングリスト'''を確認してください。それが助けにならなければ、'''CCPEMリスト'''を利用して質問してください。お願いですから、決してSjorsに直接メールを送信しないでください。質問全てに返答できるわけではありません。もしRELIONが利用者の研究に有益であると思ったら私たちの[http://www2.mrc-lmb.cam.ac.uk/groups/scheres/publications.html 論文]を引用し、あなたの研究仲間たちに伝えてください。<br />
<br />
===11.4 参考文献===<br />
<br />
RELIONの手順の改善を支持した理論の詳細は以下の論文で述べられています。<br />
* S.H.W. Scheres (2012) “''RELION: Implementation of a Bayesian approach to cryo-EM structure determination''” J. Struc. Biol., 180, 519-530.<br />
<br />
*S.H.W. Scheres (2012) “''A Bayesian view on cryo-EM structure determination''” J. Mol. Biol., 415, 406-418.<br />
<br />
RELIONの使い方に関する包括的な概観は以下の論文に述べられています。<br />
<br />
*S.H.W. Scheres (2016) “''Processing of structurally heterogeneous cryo-EM data in RELION''” Meth. Enzym., 579, 125-157.<br />
<br />
<br />
==12 付録 A:インストールの注意==<br />
<br />
===12.1 MPIのインストール===<br />
<br />
'''MPI(message passing interface)'''がインストールされた計算機クラスター、もしくはNVIDIA GPU搭載のマルチコアデスクトップマシンが必要になることに注意してください。RELIONをコンパイルするには、'''mpi-devel'''パッケージが必要です。おそらく存在する種類'''(MPICH, LAM-MPI, etc)'''またはバージョンはそれほど重要ではありません。まだシステム内に'''mpi-devel'''をインストールしてなければ、'''openMPI'''をインストールすることをお勧めします。<br />
<br />
===12.2 CUDAのインストール===<br />
<br />
'''NVIDIA'''の比較的新しいGPU('''compute capability 3.5+'''以上)を持っている場合、オートピッキング、分類、精密化作業を高速に実行できます。'''GPU-accelerationサポート'''を含むRELIONをコンパイルするには、'''CUDA'''をインストールする必要があります。このチュートリアルの準備には'''CUDA-8.0'''を使用しました。[https://developer.nvidia.com/cuda-downloads NVIDIAのWebサイト]からダウンロードしてください。<br />
<br />
===12.3 RELIONのインストール===<br />
<br />
RELIONはオープンソースのソフトウェアです。[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Download_%26_install the RELION wiki]から無料でダウンロードして、手順に従ってインストールしてください。もし、'''job submission system(Sun Grid EngineやPBS/TORQUE etc)'''に詳しくない場合は、インストール手順の説明にあるように、'''qsub.cshスクリプト'''の設定に関して、システム管理者にお尋ねください。分散メモリ並列化のためのMPIと、共用メモリの並列化のための'''pthreads'''の両方を使用する、いわゆるハイブリッド並列計算を実行したいときは注意してください。ジョブキューイングシステムはこれを可能とするためにいくつかの調整が必要な場合があります。再度、システム管理者にお尋ねください。<br />
<br />
===12.4 モーション補正ソフトウェアのインストール===<br />
<br />
RELION-3.0は全フレーム顕微鏡写真ムービーアライメントに使用される、'''UCSFプログラムMOTIONCOR2'''へのラッパーを提供します。[http://www.msg.ucsf.edu/agard/protocols.html Dabid Agard]のページからプログラムをダウンロードし、インストールの手順に従ってください。また、RELIONの保有する、'''MOTIONCOR2'''の実行を使うかもしれません。なので、もし、UCSF実行をインストールするのに問題が発生しても心配しないでください。バージョン3.0において、'''''Nico grigorieff’s group'''''から'''UNBLUR'''へのラッパーはGUIから中止されていることに注意してください。<br />
<br />
===12.5 CTF推定ソフトウェアのインストール===<br />
<br />
CTF推定はRELIONに含まれていません。代わりに、RELIONは'''''Alexis RohouやNiko Grigorieff’s CTFFIND4'''''へのラッパーを提供します。[http://grigoriefflab.janelia.org/datadownload Niko’s CTFFIND website]からダウンロードし、手順に従ってインストールしてください。また、もし、パソコンに'''NVIDIA graphics card(GPU)'''が入っているなら'''''Kai Zhang’s GCTF'''''を使うこともできます。その際は、LMBに関する[https://www.mrc-lmb.cam.ac.uk/kzhang/ KaiのWebサイト]からダウンロードしてください。<br />
<br />
===12.6 RESMAPのインストール===<br />
<br />
局所分解能推定はRELIONが所有するポストプロセッシングプログラムの中、あるいは'''''Alp KucukelbirのRESMAP'''''へのラッパーを通して実行される。[http://www.proditus.com/software.html AlpのRESMAP Webサイト]からダウンロードし、手順に従ってインストールしてください。<br />
<br />
<br />
<br />
<br />
== 13 付録B:RELIONの利用 ==<br />
=== 13.1 GUIについて ===<br />
<br />
==== 13.1.1 pipeline approach ====<br />
RELION-3.0では、一つのプログラムの出力を次のプログラムの入力として順次繋いでいくような情報の受け渡し(パイプライン)を円滑に実現できるようなGUIを設計しました。詳細は2016 Proceedings of the CCP-EM Spring Symposium[3]で公開されています。<br />
RELION-3.0を使うにあたって、まずプロジェクト(すなわち構造決定したい分子)ごとにディレクトリを作成することを推奨します。ここではこのディレクトリの呼称をプロジェクトディレクトリとします。RELIONのGUIは「relion」とコマンドを打つことで起動させることができますが、この動作は常にプロジェクトディレクトリに移動してから行うことを念頭に置いてください。<br />
<br />
このソフトのGUIでは、すべてのジョブや、あるジョブによる出力がどのように他のジョブの入力に使われたのかといった履歴を保存することができ、この機能によってパイプラインが形成されます。各種ジョブにはそれぞれ独自の出力ディレクトリが与えられます。ここではたとえば あるジョブの出力のためにClass2D/ というディレクトリができるとします。こういったジョブディレクトリの中でさらに新しいジョブが実行されると、その新しいジョブには一連の番号が与えられます。たとえばClass2Dのもとで作られたとあるジョブにはClass2D/job010という番号が振り分けられます。さらに、ジョブディレクトリのもとでは、Class2D/job010/run といったように出力名が定められます。このソフトでは、各ジョブに意味のある名前が付けられるような仕組みを備えるために、ファイルシステム上の個々のジョブディレクトリへの記号リンクとして実装された"エイリアス"システムを使用しています。<br />
パイプラインに関するすべての情報はdefault_pipeline.starという名前のファイルに保存されていますが、基本的にはこのファイルを見る必要はありません。もしdefault_pipeline.starファイルが壊れてしまった場合は、最後に実行したジョブディレクトリで保存されたバックアップから復元することができます。<br />
<br />
==== 13.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
このソフトのGUIは上半分と下半分に分かれています。上半分の左側にはジョブの種類が縦リスト上に並べられており、行いたいジョブを選ぶことができます。たとえば2D classificationを行いたいときは、上半分の左側のブラウザで選択すればいいわけです。上半分の右側には複数のタブがあるパネルがあり、それぞれのジョブタイプへのパラメータを入力できます。GUIの左上には機能のおおよその概要が分かる3つのメニューが書かれています。<br />
【Schedule】ボタンでは、後でジョブを実行するときのスケジューリングを行うことができます。それに対して【Run now!】ボタンは今すぐに実行したいときに使います。【Schedule】ボタンは、繰り返し実行できるよう完全自動化された「パイプライン」を用意したいときに役立ちます。たとえば、データが収集されていくにつれてそれが瞬時に反映できるようなパイプラインを実現したいときに有効です。詳細は13.3を参照してください。<br />
GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 13.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中のジョブ(【Running jobs】)、すでに完了しているジョブ(【Finished jobs】)、または後で実行するようにスケジュールされたジョブ(【Scheduled jobs】)のリストがあります。これらのリスト内のジョブをクリックすると、そのジョブのパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリが作成されることはありませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】のジョブでは、_optimiser.starというファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。【モーション補正】、【CTF推定】、【自動ピッキング】、【粒子抽出】は、これまでに行われていなかった顕微鏡写真でのみ実行されます。【Input to this job】(このjobへの入力)と【Output from this job】(このjobからの出力)は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(stdout)と標準エラー出力(stderr)がそれぞれ黒と赤のテキストで表示されます。標準エラー出力は理想的には何もない状態でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、スクロールがしやすくなるようテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 13.1.4 The Display button(ディスプレイボタン) ====<br />
runボタンとscheduleボタンの下にある【Display:】ボタンでは、各ジョブにおける最重要たる入力ファイルと出力ファイルを視覚的に表示することができます。GUIの下半分にあるjobリストのうちのひとつのjobを選択した後に【Display:】ボタンをクリックすると、選択されたjobの入力と出力がすべて(例えば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。中間体のファイルを表示するといったような一般的な機能はGUI左上の3つのメニューのうちFile>Displayを選択することで使うことができます。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第11章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(13.1.6参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
ジョブを削除すると、ジョブディレクトリ全体がプロジェクトディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、ジョブを復元することができます。<br />
<br />
ディスク容量を節約するため、ジョブを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。これには2つのクリーニングオプションがあり、片方は【gentle clean】という方法です。この方法では、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は【harsh clean】という完全なクリーニング方法です。この方法では全てのファイルを消すことになるため、より多くの容量を確保できます。その中でも【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のジョブタイプから選択できる粒子スタック、または顕微鏡写真を含むディレクトリに関しては、とりわけ多くの容量を確保できます。<br />
<br />
また、RELIONの左上にある【job】メニューの対応するオプション(【Gently clean all jobs】あるいは、【Harshly clean all jobs】)を使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。 その際、特定のディレクトリを削除対象から除外したい場合には、NO_HARSH_CLEANというファイルをその中に置いてください。<br />
<br />
例えば、保護したい粒子データがjob098にある場合、次のコマンドを実行してください。<br />
<br />
$ touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
※ touchコマンドは、指定したファイルが存在しない場合には空のファイルを作成するプログラムです。存在している場合には、ファイルの修正時刻を変更します。</div>
Nakamu
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION3%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELION3チュートリアル
2019-02-10T13:17:02Z
<p>Nakamu: </p>
<hr />
<div>'''RELION3'''<br />
<br />
==1 前処理==<br />
<br />
===1.1 解析の準備===<br />
私たちはプロジェクトごとに、すなわち構造解析したいものごとに一つのディレクトリを作成することをお勧めします。これをプロジェクトディレクトリと呼びます。'''プロジェクトディレクトリからRELION GUIを毎回起動することは重要です。'''プロジェクトディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式かTIFF形式で保存するための別のディレクトリを作成してください。もしすべての動画が一つのディレクトリにある場合には、このディレクトリをMovies/とした方が好ましいでしょう。また、異なるディレクトリにある場合(例えば、違う日に集めたもの)には、Movies/15jan16またはMovies/23jan16とするといいでしょう。もし何か理由があり、RELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成することができます。<br />
<br />
単一画像の顕微鏡写真にはmrc拡張子を、動画にはmrc、mrcs、tiff拡張子をつけることができます。チュートリアルのデータを解凍したとき、プロジェクトディレクトリ(Movies/)は作成されています。このディレクトリは、TIFF形式に圧縮された24つの動画、gain.mrc、実験の情報を含んだNOTESファイルが含まれています。<br />
<br />
RELIONを起動してみましょう。前述のように、RELIONは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。その為、新しいディレクトリで初めてRELIONを起動するときは、バックグラウンドで起動するための&の文字を使うべきではありません。プロジェクトディレクトリの中にいることを確認し、入力でRELIONを起動します。<br />
<br />
relion <br />
<br />
そして新しいRELIONプロジェクトを作動するために“y“と答えます。<br />
最初にすることとして、パイプラインの中に録画した顕微鏡動画の取り込みを行います。<br />
job-typeブラウザから”Import”を選択し、以下のパラメータを埋めます。<br />
<br />
●Input files: Movies/*.tiff <br />
●Node type: 2D micrograph movies <br />
<br />
これを行うことで、Current job: Give_alias_hereという空欄に効果的なaliasを規定すrことができます。[Run now!]ボタンをクリックし、job起動します。Import/job001というディレクトリが作成され、Import/moviesというこのディレクトリへのシンボリックリンクが一緒に作成されます。STARファイルとすべての動画が新しいディレクトリの中に作成されます。中を見てみましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし違うソフトウェアで粒子を抽出した場合は、後述の事前処理を行う代わりに、STARファイルや3次元レファレンス、3次元マスクなどを取り込むために“Import”job-typeを使用してください。これについてはRELIONを使用する際の責任は取りません。また、ユーザーは正しいSTARファイルの生成に責任を取ってください。<br />
<br />
===1.2 電子線により誘起される画像の動きの補正===<br />
Motion correction job-typeは便利な全体フレーム動画の調整のためのUCSF MOTIONCOR2[21]ラッパーを規定します。あるいは、バージョン3.0以降はMOTIONCOR2と同じアルゴリズムであるRELION独自の実装を使用することもできます。RELION独自の実装はCPU でのみの実行となるので注意してください。[I/O]タブで設定をします。<br />
<br />
●Input movies STAR file: Import/movies/movies.star<br />
([Browse]ボタンで参照できるファイルは、STAR形式の動画ファイ <br />
ルのみです。)<br />
●First frame for corrected sum: 1<br />
●Last frame for corrected sum: 0<br />
(これはすべての動画フレームに使用する際の結果です。)<br />
●Pixel size(A) 0.885<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
●Do dose-weighting? Yes<br />
●Save non-dose-weighted as well? No<br />
(いくつかの非用量加重顕微鏡写真にはCTF推定を行う方がよいで <br />
しょう。ディスク容量を節約するために、データが非常に良いの <br />
でこのオプションは使用しません。)<br />
<br />
[Motioncor2]タブは以下のように入力します。<br />
●Bfactor: 150<br />
(超高解像度動画ではより大きい価値を使用します。)<br />
●Number of patches X,Y 5 5<br />
●Group frames: 1<br />
●Binning factor: 1<br />
(超高解像度動画ではたいてい2を使用します。)<br />
●Gain-reference image: Movies/gain.mrc<br />
(これは、オンザフライでのgain-reference補正用のgain- <br />
referenceファイルを規定するために使用できます。これらの動 <br />
画はまだgain補正されていないので、この場合には必要です。)<br />
●Defect file:<br />
(これは検出器上の壊れたピクセルを隠すために使用することがで <br />
きます。)<br />
●Gain rotation: No rotation (0)<br />
●Gain flip: No flipping (0)<br />
(gain-reference画像はこのデータセットのために既に補正されて <br />
います。)<br />
●Use RELION’s own implementation? Yes<br />
(これによって、UCSF実装をインストールする必要性が少なくなり <br />
ます。どちらにせよ、UCSFプログラムをインストールしている場 <br />
合は、それを使用することもできます。その場合、以下のオプシ <br />
ョンも入力する必要があります。)<br />
<br />
[Running]タブは以下のように入力します。<br />
●Do dose-weighing? Yes<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
<br />
このプログラムの実行には手頃な12スレッドの最新機器を用いればおおよそ5分かかります。MOTIONCOR2アルゴリズムのRELION独自の実装はGPUでは使用しないことに注意してください。しかしそれはマルチスレッドです。各スレッドは独立して動画フレーム場で動作するので、動画フレームの数をスレッドの数で割った数が整数になるように、いくつかのスレッドを使用することが最適です。これらの動画は24フレームあるので、12スレッドを使用すると各スレッドで2フレームが処理されます。[Run now!]ボタンの下の[Display:]ボタンからout:logfile.pdfを選択することで、推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで、値が合計された顕微鏡写真を見ることができます。スクリーンサイズに依存して、見やすいように、顕微鏡写真(Scale:0.3)を縮小し、Sigma contrast:3を使い、見やすい数のコラム(例として、Number of columns:3)にするべきです。[Display:]ボタンから表示したときから顕微鏡写真は選択できないことに注意してください。もし、取り除きたい顕微鏡写真がある場合(今回はすべていい画像なので削除しないだろうが)は[Subset selection]job-typeが使用できます。<br />
<br />
===1.3 CTF推定===<br />
次に、それぞれ補正した顕微鏡写真からCTFの値を推定します。速度の為Kai ZhangのGCTFのためのラッパーとして[CTF estimation]job-typeにします。適切なGPUがない場合、Alexis RohouとNiko GrigoreffのCTFFIND4.1を使用することができます。[I/O]タブで、[Motion correction]jobのcorrected_micrographs.starファイルを選択するために[Browse]ボタンを使用します。また、他のタブは以下のように入力します。<br />
<br />
I/Oタブにおいて<br />
●Use micrograph without dose-weighting? No<br />
(これらは重み付けされたものよりも良いThon ringsを持っているが、書き出さないことを前のステップで決めました。)<br />
●Sperical aberration (mm): 1.4<br />
(顕微鏡メーカーがこの値を提供してくれています。)<br />
●Voltage (kV): 200<br />
●Amplitude contrast: 0.1<br />
(強度コントラストはほとんどないことが知られていますが、約10%の値を与えることで、多くの構造の結果がよくなることが示されています。これは低周波数の弱い散乱がモデル化されていないからです。)<br />
●Magnified pixel size (A): 0.885<br />
(これらはピクセルサイズ0.885Aのもとの動画です。)<br />
●Amount of astigmatism (A): 100<br />
(範囲が適切に調整されていれば、この値は多くのデータセットに適しています。)<br />
<br />
Searchesタブにおいて、CIFFINDの一般的な値を設定します(正確な意味については、Nikoのドキュメンテーションを参照してください)。これらの設定は、GCTFを使用する場合には無視してください(デフォルトで、これをオフに切り替えることができるが)。<br />
●FFT box size (pix): 512<br />
●Minimum resolution (A): 30<br />
●Maximum resolution (A): 7.1<br />
●Minimum defocus cvalue (A): 5000<br />
●Maximum defocus cvalue (A):50000<br />
●Defocus step size (A): 500<br />
●Amount of astigmatism (A): 100<br />
●Estimate phase shifts No<br />
(これはphase-plateデータだけに役に立つ)<br />
GCTFを使用する場合はCTFFIND-4.1タブを無視してください。逆にGCTFを使用しない場合はCTFFIND-4.1タブウィ使用してください。今回の例として、GCTFを使用し、Getfタブを設定します。<br />
●Use Gctf instead? Yes<br />
●Gctf executable: /wherever/it/is/Gctf<br />
(環境変数である$RELION_CTFFIND_EXECUTABLEと$RELION_GCTF_EXECUTABLEは対応するプログラムのGUIエントリのデフォルト値を制御するために使用されます。)<br />
●Ignore ‘Searches’ parameters? Yes<br />
(GCTFにSearchesタブのパラメーターを渡すにはこれを’No’に設定します。デフォルトでは、これらの値は無視され、GCTF独自のデフォルトが使用されます。)<br />
●Perform equi-phase averaging? Yes<br />
(これによりThon ringのSNRが向上します。)<br />
●Other Gctf options:<br />
●Which GPUs to use: 0<br />
(この小さいデータセットには1GPUで十分でしょう。)<br />
<br />
マシンに応じて、複数のMPI処理を使用してプログラムを実行することができます。1プロセッサーとGPUのみを使用すると、動作はGCTFを使用すると31秒かかります。いったん動作が終わると、出力のCtfFind/job003/Moviesという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFINDを使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
Display:ボタンを使用してout:micrographs_ctf.starを選択すると、すべてのThon ring画像を見ることができます。実験の画像のThon rings間の0はモデルの0と一致するはずです。デフォーカス、最高分解能や性能指数などの順番の表示を並べ替えることができます。log.pdfファイルにはすべての顕微鏡写真に対する、デフォーカス、非点収差、推定解像度などの有用なパラメータのプロットとデータセット全体のヒストグラムが含まれています。データ収集における問題点を見つけ出すのに役に立ちます。<br />
もしCTFモデルが実験のThon ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除して、Finished jobsリストからCtfFind/job003を選択し、parameter-panel の値を修正し、Continue nowボタンをクリックすることでjobを再実行することができます。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できないまたは、不十分なThon ringがあり顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
===1.4手動粒子抽出===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の「粒子座標」を手動で選択して使用します。自分たちのデータをより理解できるように少なくとも複数の顕微鏡写真を選択するのがよいでしょう。選択した粒子を使用して、参照なしの2Dクラス平均を計算し、その後、これらの粒子は全データセットの粒子を自動検出するためのテンプレートになります。しかしRELION3.0以降は、Laplacian-of-Gaussian(LoG)フィルターに基づく参照なしの自動抽出手順が含まれています。これまでにテストされたほとんどの場合、この手順は適切な開始座標を提供してくれるので、Manual pickingステップは飛ばすことができます。relion_it.pyスクリプトはこの機能を使用して、完全に自動化されたオンザフライ処理を実行します。このチュートリアルでは、説明のためにManual picking jobを起動し、その後LoGベースのAuto-pickingを継続して最初の粒子セットを細分化します。<br />
手動粒子検出は経験あるのみです!RELIONで手動で粒子の検出をするのが好きでなければ、Jude ShortのXIMDISP[17](任意の拡張子付きで)、XMIPP-2.4[16](任意の拡張子付きで)、Steven LudtkeのE2BOXER.PY[18](.boxの拡張子付きで)の座標形式ファイルもサポートしています。もしこれらを使用する場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存してください。そして、同じ顕微鏡写真のルートネームは異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMovies/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Input Files:の欄に整理されたファイルのsuffix拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例だと、それぞれMovies/*.boxやMovies/*_pick.starになります。<br />
Manual picking jobタイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBrowseボタンを使用して、Colorsタブは無視して、Displayタブは下のように入力します。<br />
●Prticle diameter (A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
●Scale for micrographs: 0.25<br />
(これは画面サイズによります。)<br />
●Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。黒が標準偏差の3倍低く、白が標準偏差の3倍高くなります。グレースケールは黒から白へ直線的に変化します。詳細はDisplayImages entry on the RELION wikiを参照してください。)<br />
●White value: 0<br />
(どの値を白にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Black value: 0<br />
(どの値を黒にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Lowpass filter (A):20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくするための動作です。)<br />
●Highpass filter (A): 0<br />
(これは顕微鏡写真上の濃淡のグラデーションを取り除くのに役立ちます。)<br />
●Pixel size: 0.885<br />
(これは粒子の直径や、low-pass filterとhigh-pass filterの計算に必要です。)<br />
●Scale for CTF image:1<br />
(これは単にそれぞれの顕微鏡写真のCTFボタンをクリックしたときにThon ring画像がどれくらい大きくなるのか調節します。)<br />
Run now!ボタンをクリックすることでjobが実行され、必要に応じていくつかの粒子をクリックしてください。しかし、次のセクションではLoGベースの自動抽出を使用するので、必要でなければ選ぶことはありません。最初の[2D classification] jobに手動抽出した粒子を使用する場合は、適切なクラス平均を計算するために約500~1000個の粒子が必要になります。左クリックで選択、中クリックで選択された粒子の削除、右クリックで座標を保存する必要があるポップアップメニューが表示されます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでもメニューから保存した座標のSTARファイルに戻ることができます(ポップアップメニューの座標を使用してSTARファイルを保存した場合)。<br />
<br />
===1.5 LoGベース自動選択===<br />
今回は、Laplacian-of-Gaussian(Log)フィルタに基づくテンプレートフリーの自動抽出の手順を使用して、最初の粒子セットを選択して下さい。その後、それらの粒子は[2D classification]jobで使用され、2番目の[Auto-picking]jobのテンプレートが生成されます。初期段階では多くの粒子を必要としないので、最初の3枚の顕微鏡写真に対してのみLoGべーすの自動抽出を実行します。一般的に、可能な限り良いテンプレートを得るために、おそらく使用可能なすべての顕微鏡写真に対してLoGベースの抽出を実行します。しかし、今回はこのチュートリアルの計算速度を上げるためにいくつかの顕微鏡写真のみを使用します。<br />
最初にいくつかの顕微鏡写真を選択するために、[Subset selection]jobに移動し、I/Oタブで下を除くすべての空欄をままにします。<br />
●OR select from picked cords: ManualPick/job004/cords_suffix_manualpick.star<br />
(手動抽出で座標を保存したときに生成されます。今回は座標を使用するつもりはなく、顕微鏡写真のサブセットセレクションを行うためにそのjobを使用しているだけです。)<br />
<br />
このjobにはalias 5micsを使用しました。Run!ボタンを押し、[Manual picking]jobと同じポップアップウィンドウを再び押すと、すべてのpickとCTFボタンが表示されます。‘File’メニューを使用して‘Invert selection’:最初の5枚の顕微鏡写真の前にあるチェックボックスをクリックして選択します。その後、‘File’メニューを再び使用して‘Save selection’を選択します。これで、ManualPick/job004/micrographs_selected.starというファイルができ、これを下記の[Auto-picking]jobに使用します。<br />
その後、[Auto-picking]jobを処理し、I/Oタブの設定を行います。<br />
<br />
●Input micrographs for autopick: Select/job005/micrographs_selected.star<br />
●Pixels size in micrographs (A) -1<br />
(ピクセルサイズは入力STARファイルの中の情報から自動的に設定されます。)<br />
●2D references:<br />
(テンプレートフリーのLoGベースの自動抽出では空欄のままにします。)<br />
●OR: provides a 3D reference? No<br />
●OR: use Laplacian-of-Gaussian? Yes<br />
<br />
Laplacianタブの設定をします。<br />
●Min. diameter for loG filter (A) 150<br />
●Max. diameter for loG filter (A) 180<br />
(これは粒子投影のオングストロームの最小最大のサイズに対応します。)<br />
●Are the particles white? No<br />
(黒です。)<br />
●Maximum resolution to consider 20<br />
(ここはデフォルト値のままでいいです。)<br />
●Adjust default threshold 0<br />
(正の値、すなわち閾値はより少ない粒子を選び、負の値もより少ない粒子を選んでください。有用な値は、おそらく[-1,1]の範囲ですが、多くの場合デフォルト値の0は正しい働きをします。)<br />
<br />
Referencesタブは無視して、autopickingタブの最初の四つのオプションは無視してください。下記のように設定してください。<br />
●Write FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Read FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Shrink factor: 0<br />
(縮小を0に設定すると、自動抽出プログラムは参照上のローパスフィルタの解像度に合わせて顕微鏡写真を縮小します。これはすごく早くなり、必要なメモリが少なくなるため、このチュートリアルを素早く実行するのに便利になります。0と1の間の値は顕微鏡写真のサイズの少数で表されるでしょう。これは縮小で1を使用するよりも正確な抽出が少なくなること、つまり縮小がないことに注意してください。この新しいパラメータの詳細は、次のサブセクションで説明します。)<br />
●Use GPU acceleration? No<br />
(計算速度がとても速いので、LoGベースの自動抽出はGPU加速されていません。)<br />
●Which GPUs to use:<br />
<br />
Helixタブを無視して、Running tabで単一MPIプロセッサを使用して実行します。もしかするとLoG_basedのようなaliasが有用かもしれません。単一プロセッサを使用すると、これらの計算は、私たちのコンピュータでは約40秒かかります。<br />
Display:ボタンのcoords_suffix_autopickオプションをクリックすることで結果をチェックすることができます。この段階で表示されるポップアップウィンドウで手動で粒子を追加/削除できます。さらに、autopickingタブのノイズの標準偏差と平均のパラメータやLaplacianタブのデフォルトの閾値の調節をしている間、新しいjobを実行して、より多くの、またはより少ない粒子を抽出することができます。しかし、この段階では、単に2回目のauto-picking jobのテンプレート作成のための最初の粒子セットなので、多くの場合これは必要ないでしょう。<br />
<br />
<br />
<br />
<br />
==Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。 <br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。 <br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。 <br />
<br />
<br />
==De novo 3D model generation (3Dモデル形成)==<br />
RELIONは、2Dの粒子から| 3D initial model | (3Dの初めのモデル)を生成することからSGDアルゴリズムを用いる。RELION-3.0によると、実行はcryoSPARCプログラムの実行にとてもよく従う。見ている方向とデータの合理的な配分の生成は(2D classification)の詳細なクラス平均を産出するために十分いい。このアルゴリズムは、適切な産出にとてもふさわしく、それ以降の低解像度モデルは、3D classificationか3D auto-refunementで利用できる。ここで留意すべきは、リリースされた3.0の実行の改善は、もはや2D classification動作からクラスにつき選択されたランダムな分子とともに分子の部分集合を選択することをしないことである。代わりに、選択された分子の一式の全体のデータを用いた時、そのアルゴリズムはとてもたくましいものである。<br />
<br />
===Running the job (動作の実行)===<br />
3D initial model のジョブタイプのI/Oタブのselect/class2d_aftersort/particles.starファイルを選択する。すべては、すでにCTFで順番にしている。OptimisationタブのFillにより従う(角のある初期状態の放置とサンプリングの相殺)<br />
●Number of class : 1<br />
(時々、一つのクラスより大きいもの。0をつかうと、データセットにまだ存在するだろう至適な分子のシンクの生成を助けるだろう。追加された議論sgd_skip_annealはまだ有用だろう。この場合、私たちはスピードアップするための一つのクラスをつかうだろう。)<br />
●Mask diameter (A) : 200<br />
前と同じ<br />
●Flatten and enforce non-negative solvent : Yes<br />
●Symmetry C1<br />
(対称性がなにかもわからないとき、C1の再構築はおそらく、始めることにベストな選択であるだろう。いくつかの高い対称性の物体は正しい空間グループよりC1のSGDによる解法が簡単だろう。このデータセットはいいデータで、正しいポイントグループD2が動作できる。しかしながら、C1からC2にどのように進行するかを説明すると、C1のSGDを動かすだろう。)<br />
特に、実例の1つに、SGDタブのいくつかに変えることはできないことと、その初期状態はいくつかの場合に適している。しかしながら、このチュートリアルのスピードアップすることは、私たちは、反復のデフォルトの数の半分だけ行うだろう。<br />
したがって、このように変化する。:<br />
●Number of initial iterations : 25<br />
●Number of in-between iterations : 100<br />
●Number of final iterations : 25<br />
Gomputeタブで、システム上で最適化する。再度RAMの中で数千の分子がプレリードできる。GPUの加速は、スピードアップを実現でき、反復の間の複数の極大化のステップは、2Dか3Dの精密化か分類の基準の準備はゆっくりになるだろう。4CPUのカードと、5MPInoプロセス、6スレッドのMPIプロセスを使い、システムはおよそ15分で済む。<br />
<br />
===Analysis the result (結果の分析)===<br />
UCSFキメラのような3Dビューワーの吐出量(Initial Model/job017/run-it/50_class001.mrc)を見る。もし、このポイントにおける対照的なポイントグループの追加を認識することは、RELIONの習慣における協調的なシステムの中心的なX,Y,軸における対照的な軸を整列させることを必要とするだろう。リリースされた3.0は新しいプログラムを促進することを含む。<br />
この動作はコマンドラインから実行できる。<br />
●Relion_align_symmetry - - i InitialModel/job017/run_it150_class001.mrc - -o InitialModel/job017/run_it150_class001_alignD2.mrc - -sym D2<br />
それと、マップにおける対照的な軸のUCSFキメラかrelion_displayの確認はX,YとZ軸の実際の整列とする。私たちはD2の対称的なものを使うことを強要させるだろう。<br />
●Relion_image_handler –i InitialModel/job017/run_it150_class001_alignD2.mrc –o InitialModel/job017/run_it150_class001_symD2.mrc –sym D2<br />
後者のコマンドの出力マップは、入力マップに似ているだろう。<br />
これによって確認できる。<br />
●relion_display_ --i InitialModel / job017 / run_it150_class001_alignD2.mrc & relion_display –i InitialModel / job017 / run_it150_class001_symD2.mrc &<br />
<br />
<br />
<br />
<br />
<br />
==Unsupervised 3D classification (教師無3次元クラス分類)==<br />
すべてのデータは異性分からなっています。問題は、どのくらいの費用でいられるかです。RELIONの3Dマルチリファレンス精密化手順は、強力な教師なし3次元分類へのアプローチを提供しています。<br />
<br />
===Running the job (ジョブを開始)===<br />
教師なし3次元分類は、[3D classification] ジョブタイプから、実行可能です。<br />
[I/O]タブの設定:<br />
●Input images STAR file: Select/class2d_aftersort/particles.star<br />
●Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
このマップはパイプラインの部分のように、Brouseボタンで表れないように述べる。両方のタイプは空のフィールドの中に名付けられるか、importジョブタイプをつかうマップの移入が行われる。対照的なC1を動作させたり、非対称的なInitialModel / job017 / run_it150_class.mrcを使いことを選択する。しかしながら、すでに右の対称的なセッティングは、後々とても楽になるだろう。<br />
●Reference mask (optional):<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供するところです。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類へのバイアスを最小限にする働きがあります。)<br />
[Reference]タブの設定: <br />
●Ref. map is on absolute greyscale: No<br />
(このマップがデータセットから再構築されたとき、すでに正しいグレースケールであります。RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
●Initial low-pass filter (A): 50<br />
(精密化プロセスにバイアスが導入する可能性があるため、高解像度の初期参照モデルは使用してはいけません。[12]で説明したように、初期マップをできる限りフィルタリングする必要があります。リボソームでは大抵、70Åを使用し、小さい粒子では通常40〜60Åの値を使用します。)<br />
●Symmetry: C1<br />
(このサンプルはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。良くない粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
●Do CTF corection? Yes<br />
●Has reference been CTF-correced? Yes<br />
(このモデルは、SGDのCTFコレクションによって作られている。)<br />
●Have data been phase flipped? No<br />
●Ignore CTFs untill first peak? No<br />
(リファレンスを作成するために使用した[2D classification]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
【Optimisation】タブの設定: <br />
●Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。) <br />
●Number of iterations: 25<br />
(これは一般的には変更する必要はありません。) <br />
●Regularisation parameter T: 4<br />
(Tの定義については[13]を参照してください。クライオEMの、2次元分類では、通常、Tは1~2を設定し、3次元分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均にノイズが見える場合はTの値を低くし、逆にクラス平均の分解能が低すぎる場合はTの値を高くします。主に気をつけなければならない点は、高解像度のノイズの過学習です。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
●Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。) <br />
●Mask individual particles with zeros? Yes<br />
(Yes: 0 / No: 乱数) <br />
●Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過学習を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
【Helix】タブは無視して下さい。 <br />
以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。 <br />
ここでも、【Running】タブで、使用するNumber of MPI processors(MPIプロセッサの数)とthreads(スレッド数)を指定できます。[2D classification]のjobタイプで説明したように、3次元分類は2次元分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3次元分類を表示するためにfirst_exhaustiveのようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。 <br />
精密化された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を確認できます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。 <br />
UCSFキメラなどを使用し、表示されたマップを3Dで見ると、マップが精密化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。 <br />
2次元分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示ウィンドウには、4つの精密化されたモデルの中央スライスが表示されます。最適なクラスを選択し、右クリックメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
===Analysing the results in more detail (詳細な結果の解析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
出力ファイルは基本的に2次元分類の実行時と同じです。(実際に2次元,3次元精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2次元クラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。例えば、run_it025_class00?.mrcというMRCマップです。 <br />
今まで通り、小さいクラスは大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比(SNR)が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。 <br />
●relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnuplotがインストールされているのであれば、以下の通りに入力して下さい。 <br />
●relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。 <br />
●grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
==High-resolution 3D refinement(三次元精密化)==<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は分解能を推定するために、gold-standard Fourier Shell Correlation(FSC)(二つの群に分け、互いに独立して再構成した場合に、どの分解能まで相関があるかにより判断)と言われる判断基準を用います。これにより、過学習を避けることができます[15]。角度の割当の正確さを推定する新しい手順([14])と組み合わせ、精密化が収束するときに自動的に決定されます。そのため、この手順は使用者の入力をほとんど必要としません。すなわち、客観性をのこしたまま、多くのデータセットのための優れたマップが生成がされていると述べられています。もう一つの長所は、一般的にこの手順は必要な実行回数が一回のみであり、最適化のための引数はほとんどありません。<br />
しかしながら、前に高解像度の精密化を始めた時、スケール未満とともに選ばれた粒子の正しいセットを再度抽出して、それによりもしかすると高解像度になるかもしれない。これをすることで、GUIのParticle extraction のジョブタイプとI/Oタブを与える。<br />
●micrograph STAR file : CtfFind / job003 / micrographs – ctf.star<br />
(そのままでよい)<br />
●Coordinate – file suffix : <br />
(空でよい)<br />
●OR re – extract refined particles ? Yes<br />
●Refined particles STAR file : Select /class3d – first_exhausitive / particle.star<br />
(今、選択された粒子の微粒にされたサブセットだけをつかうだろう)<br />
●Re – center refined coodinates ? Yes<br />
(3D classificationの動作以上から整列させたオフセットに従ってすべての粒子は再度中央に置かれるだろう)<br />
●Recenter on – X , Y , Z (pix) 0.0.0<br />
(箱の真ん中の分子を中心にキープさせたい)<br />
●Manually set pixel size ? No<br />
(入力したマイクログラフstarファイルはCTFの情報に含まれていないことが必要である。)<br />
Extractタブはすべてキープする。<br />
●Particle box size (pix) 360<br />
(大きな箱をつかうだろう。それにより非局在化させたCTFシグナルはより良いモデルになるだろう。これはCTF精密化の後が大事である。)<br />
●Rescale particles ? yes<br />
(とても大きな画像が働くことを防ぐことで、360×0.885/256 = 1.244 Åのピクセルサイズを減少させ、採取しましょう。これは、おそらく十分に小さいデータ、2.5 Åの大きな達成可能な解像度に制限があるだろう。)<br />
この動作では、エイリアスbest3dclass_bigboxを使用する。<br />
加えて、256ピクセルのボックスサイズに従って一番いいマップを入手したことのいたずらは必要である。<br />
●relion_image_handler –i Class3D/job018/run_it025_class001.mrc –angpix 3.54 –rescale_angpix 1.244 –o Class3D/job018/run_it025_class001_box256.mrc –new_box256 <br />
<br />
===Running the auto-refine job (自動精錬動作の実行)===<br />
3D auto-refine のジョブタイプのI/Oタブ<br />
●Input images STAR file : Extract/best3dclass_fullsize/particles.star<br />
●Reference map : Class3D / job018 / run_it025_class001_box256.mrc<br />
●Reference mask (optional)<br />
(からのままでいい)<br />
Reference タブ<br />
●Ref. map is on absolute gryscale ? No<br />
スケール現象の画像の違う標準化によると、正しく絶対的なグレースケールはマップの中に確立しなかった。このオプションの“No”は大事で、精密化の最初の相互作用のグレースケールは正しくなるだろう。<br />
●Initial low-pass filter (A) 50<br />
マップの高い頻度の成分に向かってバイアスを防いだことは低いパスのフィルターから自動精密化され始める。それと解像度から完全に依存された粒子の“gold standard”の維持は、1頭文字より高かった。<br />
●Symmetry D2<br />
(高解像度の粒子の照準は、強要された対称性の粒子の4倍効率的にするだろう)<br />
CTFのパラメータで、OpimisationとAuto-samplingタブは、3D classificationと同じでとどまる<br />
【Sampling】タブでの配向性のサンプリング間隔は反復の最初の数回のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング間隔が自動的に細かくなっていきます。したがって、8面体または正20面体対称よりも小さい角度で、全ての精密化仮定でで、一般的に大域探索では、初期値の角度である7.5度のサンプルを使用し、局所探索では1.8度のサンプルから行います。より正確な対称の精密化を行う場合のみ、3.7度でのサンプリングを行い、局所探索では0.9度ごとにサンプリングを行います。<br />
MPIのノードは1つのマスター(他のスレーブを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用するもの)のセットで分かれているので、奇数のMPI処理装置を使用するのが最も効率が良いです。ナイキスト周波数までのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。従って、使っているクラスターノードのコアと同じ数のスレッドで動かしたいデータセットのボックスより大きいサイズで作られたボックスが必要です。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
===Analysing the results (結果の分析)===<br />
出力ファイルは3D classificationを実行したときのものと大部分が同じです。しかし、全てにおけるプログラムの反復では、2つのrun_it0??_half?_model.starと2つのrun_it0??_half?_class001.mrcファイルを書き出します。それぞれデータの半分が精密化されます。収束した場合にのみ、ひとつのrun_model.starとrun_class001.mrcファイルを書き出します(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。 <br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[14]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルからも抽出されるかもしれません。 <br />
例えば、以下のように試してみてください。 <br />
●grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
==11 まとめ==<br />
<br />
===11.1 フローチャートの作成===<br />
<br />
どのようにして最終的な再構築をするか気になるでしょう。'''''Finished job'''''リストから実行した最後の動作を選択し、'''''Job actions'''''ボタンから'''Make flowchart'''オプションを試してください。これを実行するためにはシステムに'''LATEX'''や'''TikZ'''パッケージが必要となります。最初の項は正確な作業名のないフローチャートの全体像です。これは、出版目的に役立つでしょう(おそらくお気に入りの'''vector-based design'''プログラムの編集後に)。フローチャートの全体像の後に、最初の詳細なフローチャートにどのようにして終了するかが示されています。10ステップ以上からなるフローチャートは複数の構成要素に分けられることに注意してください。作業中に複数枝分かれすることがあるでしょう。それ故に、最終作業のフローチャートに従って、それぞれの分岐についてフローチャートがあるでしょう。リンクをクリックすることでPDFファイルから合致する位置を得ることができます。<br />
<br />
===11.2 ディレクトリのクリーンアップ===<br />
<br />
ディスクの空間を確保するために、RELIONは作業ディレクトリをクリーンアップするオプションを持っています。これには2つのモードがあります。'''''gentle'''''クリーンは作業ディレクトリから中間ファイルのみを削除します。'''''harsh'''''クリーンは作業からのインプットを必要とする新たな作業を開始するのに必要なファイルを削除します。例えば、'''''harsh'''''クリーンは'''Motion Corr'''作業から平均化された、あるいは'''Particle extraction'''作業から少量のスタックを抽出された顕微鏡写真を削除します。一方、'''''gentle'''''クリーンは'''2D classification''', '''3D classification'''あるいは'''3D auto-refine'''作業の中間反復からすべてのファイルを削除します。'''Job actions'''ボタンから個別に作業をクリーンアップすることができます。あるいは、GUIのトップメニューから下がった、'''''Jobs'''''からすべての作業をクリーンアップすることができます。私たちは計算前の結果に頭を悩ませていたプロジェクトディレクトリの'''tarball'''を作る前にそのメニューから'''''Gently clean all jobs'''''オプションを使いました。長期間保存されていたデータを取る前にプロジェクトディレクトリをクリーンアップしたいでしょう。<br />
<br />
===11.3 質問や引用===<br />
<br />
以上です!このチュートリアルを楽しんで、そして役に立つことを願います。もしRELIONについて質問があれば、初めに'''RELION Wiki'''の'''FAQ'''と'''CCPEMメーリングリスト'''を確認してください。それが助けにならなければ、'''CCPEMリスト'''を利用して質問してください。お願いですから、決してSjorsに直接メールを送信しないでください。質問全てに返答できるわけではありません。もしRELIONが利用者の研究に有益であると思ったら私たちの[http://www2.mrc-lmb.cam.ac.uk/groups/scheres/publications.html 論文]を引用し、あなたの研究仲間たちに伝えてください。<br />
<br />
===11.4 参考文献===<br />
<br />
RELIONの手順の改善を支持した理論の詳細は以下の論文で述べられています。<br />
* S.H.W. Scheres (2012) “''RELION: Implementation of a Bayesian approach to cryo-EM structure determination''” J. Struc. Biol., 180, 519-530.<br />
<br />
*S.H.W. Scheres (2012) “''A Bayesian view on cryo-EM structure determination''” J. Mol. Biol., 415, 406-418.<br />
<br />
RELIONの使い方に関する包括的な概観は以下の論文に述べられています。<br />
<br />
*S.H.W. Scheres (2016) “''Processing of structurally heterogeneous cryo-EM data in RELION''” Meth. Enzym., 579, 125-157.<br />
<br />
<br />
==12 付録 A:インストールの注意==<br />
<br />
===12.1 MPIのインストール===<br />
<br />
'''MPI(message passing interface)'''がインストールされた計算機クラスター、もしくはNVIDIA GPU搭載のマルチコアデスクトップマシンが必要になることに注意してください。RELIONをコンパイルするには、'''mpi-devel'''パッケージが必要です。おそらく存在する種類'''(MPICH, LAM-MPI, etc)'''またはバージョンはそれほど重要ではありません。まだシステム内に'''mpi-devel'''をインストールしてなければ、'''openMPI'''をインストールすることをお勧めします。<br />
<br />
===12.2 CUDAのインストール===<br />
<br />
'''NVIDIA'''の比較的新しいGPU('''compute capability 3.5+'''以上)を持っている場合、オートピッキング、分類、精密化作業を高速に実行できます。'''GPU-accelerationサポート'''を含むRELIONをコンパイルするには、'''CUDA'''をインストールする必要があります。このチュートリアルの準備には'''CUDA-8.0'''を使用しました。[https://developer.nvidia.com/cuda-downloads NVIDIAのWebサイト]からダウンロードしてください。<br />
<br />
===12.3 RELIONのインストール===<br />
<br />
RELIONはオープンソースのソフトウェアです。[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Download_%26_install the RELION wiki]から無料でダウンロードして、手順に従ってインストールしてください。もし、'''job submission system(Sun Grid EngineやPBS/TORQUE etc)'''に詳しくない場合は、インストール手順の説明にあるように、'''qsub.cshスクリプト'''の設定に関して、システム管理者にお尋ねください。分散メモリ並列化のためのMPIと、共用メモリの並列化のための'''pthreads'''の両方を使用する、いわゆるハイブリッド並列計算を実行したいときは注意してください。ジョブキューイングシステムはこれを可能とするためにいくつかの調整が必要な場合があります。再度、システム管理者にお尋ねください。<br />
<br />
===12.4 モーション補正ソフトウェアのインストール===<br />
<br />
RELION-3.0は全フレーム顕微鏡写真ムービーアライメントに使用される、'''UCSFプログラムMOTIONCOR2'''へのラッパーを提供します。[http://www.msg.ucsf.edu/agard/protocols.html Dabid Agard]のページからプログラムをダウンロードし、インストールの手順に従ってください。また、RELIONの保有する、'''MOTIONCOR2'''の実行を使うかもしれません。なので、もし、UCSF実行をインストールするのに問題が発生しても心配しないでください。バージョン3.0において、'''''Nico grigorieff’s group'''''から'''UNBLUR'''へのラッパーはGUIから中止されていることに注意してください。<br />
<br />
===12.5 CTF推定ソフトウェアのインストール===<br />
<br />
CTF推定はRELIONに含まれていません。代わりに、RELIONは'''''Alexis RohouやNiko Grigorieff’s CTFFIND4'''''へのラッパーを提供します。[http://grigoriefflab.janelia.org/datadownload Niko’s CTFFIND website]からダウンロードし、手順に従ってインストールしてください。また、もし、パソコンに'''NVIDIA graphics card(GPU)'''が入っているなら'''''Kai Zhang’s GCTF'''''を使うこともできます。その際は、LMBに関する[https://www.mrc-lmb.cam.ac.uk/kzhang/ KaiのWebサイト]からダウンロードしてください。<br />
<br />
===12.6 RESMAPのインストール===<br />
<br />
局所分解能推定はRELIONが所有するポストプロセッシングプログラムの中、あるいは'''''Alp KucukelbirのRESMAP'''''へのラッパーを通して実行される。[http://www.proditus.com/software.html AlpのRESMAP Webサイト]からダウンロードし、手順に従ってインストールしてください。<br />
<br />
<br />
<br />
<br />
== 13 付録B:RELIONの利用 ==<br />
=== 13.1 GUIについて ===<br />
<br />
==== 13.1.1 pipeline approach ====<br />
RELION-3.0では、一つのプログラムの出力を次のプログラムの入力として順次繋いでいくような情報の受け渡し(パイプライン)を円滑に実現できるようなGUIを設計しました。詳細は2016 Proceedings of the CCP-EM Spring Symposium[3]で公開されています。<br />
RELION-3.0を使うにあたって、まずプロジェクト(すなわち構造決定したい分子)ごとにディレクトリを作成することを推奨します。ここではこのディレクトリの呼称をプロジェクトディレクトリとします。RELIONのGUIは「relion」とコマンドを打つことで起動させることができますが、この動作は常にプロジェクトディレクトリに移動してから行うことを念頭に置いてください。<br />
<br />
このソフトのGUIでは、すべてのジョブや、あるジョブによる出力がどのように他のジョブの入力に使われたのかといった履歴を保存することができ、この機能によってパイプラインが形成されます。各種ジョブにはそれぞれ独自の出力ディレクトリが与えられます。ここではたとえば あるジョブの出力のためにClass2D/ というディレクトリができるとします。こういったジョブディレクトリの中でさらに新しいジョブが実行されると、その新しいジョブには一連の番号が与えられます。たとえばClass2Dのもとで作られたとあるジョブにはClass2D/job010という番号が振り分けられます。さらに、ジョブディレクトリのもとでは、Class2D/job010/run といったように出力名が定められます。このソフトでは、各ジョブに意味のある名前が付けられるような仕組みを備えるために、ファイルシステム上の個々のジョブディレクトリへの記号リンクとして実装された"エイリアス"システムを使用しています。<br />
パイプラインに関するすべての情報はdefault_pipeline.starという名前のファイルに保存されていますが、基本的にはこのファイルを見る必要はありません。もしdefault_pipeline.starファイルが壊れてしまった場合は、最後に実行したジョブディレクトリで保存されたバックアップから復元することができます。<br />
<br />
==== 13.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
このソフトのGUIは上半分と下半分に分かれています。上半分の左側にはジョブの種類が縦リスト上に並べられており、行いたいジョブを選ぶことができます。たとえば2D classificationを行いたいときは、上半分の左側のブラウザで選択すればいいわけです。上半分の右側には複数のタブがあるパネルがあり、それぞれのジョブタイプへのパラメータを入力できます。GUIの左上には機能のおおよその概要が分かる3つのメニューが書かれています。<br />
【Schedule】ボタンでは、後でジョブを実行するときのスケジューリングを行うことができます。それに対して【Run now!】ボタンは今すぐに実行したいときに使います。【Schedule】ボタンは、繰り返し実行できるよう完全自動化された「パイプライン」を用意したいときに役立ちます。たとえば、データが収集されていくにつれてそれが瞬時に反映できるようなパイプラインを実現したいときに有効です。詳細は13.3を参照してください。<br />
GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 13.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中のジョブ(【Running jobs】)、すでに完了しているジョブ(【Finished jobs】)、または後で実行するようにスケジュールされたジョブ(【Scheduled jobs】)のリストがあります。これらのリスト内のジョブをクリックすると、そのジョブのパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリが作成されることはありませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】のジョブでは、_optimiser.starというファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。【モーション補正】、【CTF推定】、【自動ピッキング】、【粒子抽出】は、これまでに行われていなかった顕微鏡写真でのみ実行されます。【Input to this job】(このjobへの入力)と【Output from this job】(このjobからの出力)は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(stdout)と標準エラー出力(stderr)がそれぞれ黒と赤のテキストで表示されます。標準エラー出力は理想的には何もない状態でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、スクロールがしやすくなるようテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 13.1.4 The Display button(ディスプレイボタン) ====<br />
runボタンとscheduleボタンの下にある【Display:】ボタンでは、各ジョブにおける最重要たる入力ファイルと出力ファイルを視覚的に表示することができます。GUIの下半分にあるjobリストのうちのひとつのjobを選択した後に【Display:】ボタンをクリックすると、選択されたjobの入力と出力がすべて(例えば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。中間体のファイルを表示するといったような一般的な機能はGUI左上の3つのメニューのうちFile>Displayを選択することで使うことができます。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第11章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(13.1.6参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
ジョブを削除すると、ジョブディレクトリ全体がプロジェクトディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、ジョブを復元することができます。<br />
<br />
ディスク容量を節約するため、ジョブを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。これには2つのクリーニングオプションがあり、片方は【gentle clean】という方法です。この方法では、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は【harsh clean】という完全なクリーニング方法です。この方法では全てのファイルを消すことになるため、より多くの容量を確保できます。その中でも【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のジョブタイプから選択できる粒子スタック、または顕微鏡写真を含むディレクトリに関しては、とりわけ多くの容量を確保できます。<br />
<br />
また、RELIONの左上にある【job】メニューの対応するオプション(【Gently clean all jobs】あるいは、【Harshly clean all jobs】)を使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。 その際、特定のディレクトリを削除対象から除外したい場合には、NO_HARSH_CLEANというファイルをその中に置いてください。<br />
<br />
例えば、保護したい粒子データがjob098にある場合、次のコマンドを実行してください。<br />
<br />
$ touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
※ touchコマンドは、指定したファイルが存在しない場合には空のファイルを作成するプログラムです。存在している場合には、ファイルの修正時刻を変更します。</div>
Nakamu
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION3%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELION3チュートリアル
2019-02-10T13:14:16Z
<p>Nakamu: </p>
<hr />
<div>'''RELION3'''<br />
<br />
==1 前処理==<br />
<br />
===1.1 解析の準備===<br />
私たちはプロジェクトごとに、すなわち構造解析したいものごとに一つのディレクトリを作成することをお勧めします。これをプロジェクトディレクトリと呼びます。'''プロジェクトディレクトリからRELION GUIを毎回起動することは重要です。'''プロジェクトディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式かTIFF形式で保存するための別のディレクトリを作成してください。もしすべての動画が一つのディレクトリにある場合には、このディレクトリをMovies/とした方が好ましいでしょう。また、異なるディレクトリにある場合(例えば、違う日に集めたもの)には、Movies/15jan16またはMovies/23jan16とするといいでしょう。もし何か理由があり、RELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成することができます。<br />
<br />
単一画像の顕微鏡写真にはmrc拡張子を、動画にはmrc、mrcs、tiff拡張子をつけることができます。チュートリアルのデータを解凍したとき、プロジェクトディレクトリ(Movies/)は作成されています。このディレクトリは、TIFF形式に圧縮された24つの動画、gain.mrc、実験の情報を含んだNOTESファイルが含まれています。<br />
<br />
RELIONを起動してみましょう。前述のように、RELIONは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。その為、新しいディレクトリで初めてRELIONを起動するときは、バックグラウンドで起動するための&の文字を使うべきではありません。プロジェクトディレクトリの中にいることを確認し、入力でRELIONを起動します。<br />
<br />
relion <br />
<br />
そして新しいRELIONプロジェクトを作動するために“y“と答えます。<br />
最初にすることとして、パイプラインの中に録画した顕微鏡動画の取り込みを行います。<br />
job-typeブラウザから”Import”を選択し、以下のパラメータを埋めます。<br />
<br />
●Input files: Movies/*.tiff <br />
●Node type: 2D micrograph movies <br />
<br />
これを行うことで、Current job: Give_alias_hereという空欄に効果的なaliasを規定すrことができます。[Run now!]ボタンをクリックし、job起動します。Import/job001というディレクトリが作成され、Import/moviesというこのディレクトリへのシンボリックリンクが一緒に作成されます。STARファイルとすべての動画が新しいディレクトリの中に作成されます。中を見てみましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし違うソフトウェアで粒子を抽出した場合は、後述の事前処理を行う代わりに、STARファイルや3次元レファレンス、3次元マスクなどを取り込むために“Import”job-typeを使用してください。これについてはRELIONを使用する際の責任は取りません。また、ユーザーは正しいSTARファイルの生成に責任を取ってください。<br />
<br />
===1.2 電子線により誘起される画像の動きの補正===<br />
Motion correction job-typeは便利な全体フレーム動画の調整のためのUCSF MOTIONCOR2[21]ラッパーを規定します。あるいは、バージョン3.0以降はMOTIONCOR2と同じアルゴリズムであるRELION独自の実装を使用することもできます。RELION独自の実装はCPU でのみの実行となるので注意してください。[I/O]タブで設定をします。<br />
<br />
●Input movies STAR file: Import/movies/movies.star<br />
([Browse]ボタンで参照できるファイルは、STAR形式の動画ファイ <br />
ルのみです。)<br />
●First frame for corrected sum: 1<br />
●Last frame for corrected sum: 0<br />
(これはすべての動画フレームに使用する際の結果です。)<br />
●Pixel size(A) 0.885<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
●Do dose-weighting? Yes<br />
●Save non-dose-weighted as well? No<br />
(いくつかの非用量加重顕微鏡写真にはCTF推定を行う方がよいで <br />
しょう。ディスク容量を節約するために、データが非常に良いの <br />
でこのオプションは使用しません。)<br />
<br />
[Motioncor2]タブは以下のように入力します。<br />
●Bfactor: 150<br />
(超高解像度動画ではより大きい価値を使用します。)<br />
●Number of patches X,Y 5 5<br />
●Group frames: 1<br />
●Binning factor: 1<br />
(超高解像度動画ではたいてい2を使用します。)<br />
●Gain-reference image: Movies/gain.mrc<br />
(これは、オンザフライでのgain-reference補正用のgain- <br />
referenceファイルを規定するために使用できます。これらの動 <br />
画はまだgain補正されていないので、この場合には必要です。)<br />
●Defect file:<br />
(これは検出器上の壊れたピクセルを隠すために使用することがで <br />
きます。)<br />
●Gain rotation: No rotation (0)<br />
●Gain flip: No flipping (0)<br />
(gain-reference画像はこのデータセットのために既に補正されて <br />
います。)<br />
●Use RELION’s own implementation? Yes<br />
(これによって、UCSF実装をインストールする必要性が少なくなり <br />
ます。どちらにせよ、UCSFプログラムをインストールしている場 <br />
合は、それを使用することもできます。その場合、以下のオプシ <br />
ョンも入力する必要があります。)<br />
<br />
[Running]タブは以下のように入力します。<br />
●Do dose-weighing? Yes<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
<br />
このプログラムの実行には手頃な12スレッドの最新機器を用いればおおよそ5分かかります。MOTIONCOR2アルゴリズムのRELION独自の実装はGPUでは使用しないことに注意してください。しかしそれはマルチスレッドです。各スレッドは独立して動画フレーム場で動作するので、動画フレームの数をスレッドの数で割った数が整数になるように、いくつかのスレッドを使用することが最適です。これらの動画は24フレームあるので、12スレッドを使用すると各スレッドで2フレームが処理されます。[Run now!]ボタンの下の[Display:]ボタンからout:logfile.pdfを選択することで、推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで、値が合計された顕微鏡写真を見ることができます。スクリーンサイズに依存して、見やすいように、顕微鏡写真(Scale:0.3)を縮小し、Sigma contrast:3を使い、見やすい数のコラム(例として、Number of columns:3)にするべきです。[Display:]ボタンから表示したときから顕微鏡写真は選択できないことに注意してください。もし、取り除きたい顕微鏡写真がある場合(今回はすべていい画像なので削除しないだろうが)は[Subset selection]job-typeが使用できます。<br />
<br />
===1.3 CTF推定===<br />
次に、それぞれ補正した顕微鏡写真からCTFの値を推定します。速度の為Kai ZhangのGCTFのためのラッパーとして[CTF estimation]job-typeにします。適切なGPUがない場合、Alexis RohouとNiko GrigoreffのCTFFIND4.1を使用することができます。[I/O]タブで、[Motion correction]jobのcorrected_micrographs.starファイルを選択するために[Browse]ボタンを使用します。また、他のタブは以下のように入力します。<br />
<br />
I/Oタブにおいて<br />
●Use micrograph without dose-weighting? No<br />
(これらは重み付けされたものよりも良いThon ringsを持っているが、書き出さないことを前のステップで決めました。)<br />
●Sperical aberration (mm): 1.4<br />
(顕微鏡メーカーがこの値を提供してくれています。)<br />
●Voltage (kV): 200<br />
●Amplitude contrast: 0.1<br />
(強度コントラストはほとんどないことが知られていますが、約10%の値を与えることで、多くの構造の結果がよくなることが示されています。これは低周波数の弱い散乱がモデル化されていないからです。)<br />
●Magnified pixel size (A): 0.885<br />
(これらはピクセルサイズ0.885Aのもとの動画です。)<br />
●Amount of astigmatism (A): 100<br />
(範囲が適切に調整されていれば、この値は多くのデータセットに適しています。)<br />
<br />
Searchesタブにおいて、CIFFINDの一般的な値を設定します(正確な意味については、Nikoのドキュメンテーションを参照してください)。これらの設定は、GCTFを使用する場合には無視してください(デフォルトで、これをオフに切り替えることができるが)。<br />
●FFT box size (pix): 512<br />
●Minimum resolution (A): 30<br />
●Maximum resolution (A): 7.1<br />
●Minimum defocus cvalue (A): 5000<br />
●Maximum defocus cvalue (A):50000<br />
●Defocus step size (A): 500<br />
●Amount of astigmatism (A): 100<br />
●Estimate phase shifts No<br />
(これはphase-plateデータだけに役に立つ)<br />
GCTFを使用する場合はCTFFIND-4.1タブを無視してください。逆にGCTFを使用しない場合はCTFFIND-4.1タブウィ使用してください。今回の例として、GCTFを使用し、Getfタブを設定します。<br />
●Use Gctf instead? Yes<br />
●Gctf executable: /wherever/it/is/Gctf<br />
(環境変数である$RELION_CTFFIND_EXECUTABLEと$RELION_GCTF_EXECUTABLEは対応するプログラムのGUIエントリのデフォルト値を制御するために使用されます。)<br />
●Ignore ‘Searches’ parameters? Yes<br />
(GCTFにSearchesタブのパラメーターを渡すにはこれを’No’に設定します。デフォルトでは、これらの値は無視され、GCTF独自のデフォルトが使用されます。)<br />
●Perform equi-phase averaging? Yes<br />
(これによりThon ringのSNRが向上します。)<br />
●Other Gctf options:<br />
●Which GPUs to use: 0<br />
(この小さいデータセットには1GPUで十分でしょう。)<br />
<br />
マシンに応じて、複数のMPI処理を使用してプログラムを実行することができます。1プロセッサーとGPUのみを使用すると、動作はGCTFを使用すると31秒かかります。いったん動作が終わると、出力のCtfFind/job003/Moviesという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFINDを使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
Display:ボタンを使用してout:micrographs_ctf.starを選択すると、すべてのThon ring画像を見ることができます。実験の画像のThon rings間の0はモデルの0と一致するはずです。デフォーカス、最高分解能や性能指数などの順番の表示を並べ替えることができます。log.pdfファイルにはすべての顕微鏡写真に対する、デフォーカス、非点収差、推定解像度などの有用なパラメータのプロットとデータセット全体のヒストグラムが含まれています。データ収集における問題点を見つけ出すのに役に立ちます。<br />
もしCTFモデルが実験のThon ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除して、Finished jobsリストからCtfFind/job003を選択し、parameter-panel の値を修正し、Continue nowボタンをクリックすることでjobを再実行することができます。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できないまたは、不十分なThon ringがあり顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
===1.4手動粒子抽出===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の「粒子座標」を手動で選択して使用します。自分たちのデータをより理解できるように少なくとも複数の顕微鏡写真を選択するのがよいでしょう。選択した粒子を使用して、参照なしの2Dクラス平均を計算し、その後、これらの粒子は全データセットの粒子を自動検出するためのテンプレートになります。しかしRELION3.0以降は、Laplacian-of-Gaussian(LoG)フィルターに基づく参照なしの自動抽出手順が含まれています。これまでにテストされたほとんどの場合、この手順は適切な開始座標を提供してくれるので、Manual pickingステップは飛ばすことができます。relion_it.pyスクリプトはこの機能を使用して、完全に自動化されたオンザフライ処理を実行します。このチュートリアルでは、説明のためにManual picking jobを起動し、その後LoGベースのAuto-pickingを継続して最初の粒子セットを細分化します。<br />
手動粒子検出は経験あるのみです!RELIONで手動で粒子の検出をするのが好きでなければ、Jude ShortのXIMDISP[17](任意の拡張子付きで)、XMIPP-2.4[16](任意の拡張子付きで)、Steven LudtkeのE2BOXER.PY[18](.boxの拡張子付きで)の座標形式ファイルもサポートしています。もしこれらを使用する場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存してください。そして、同じ顕微鏡写真のルートネームは異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMovies/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Input Files:の欄に整理されたファイルのsuffix拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例だと、それぞれMovies/*.boxやMovies/*_pick.starになります。<br />
Manual picking jobタイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBrowseボタンを使用して、Colorsタブは無視して、Displayタブは下のように入力します。<br />
●Prticle diameter (A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
●Scale for micrographs: 0.25<br />
(これは画面サイズによります。)<br />
●Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。黒が標準偏差の3倍低く、白が標準偏差の3倍高くなります。グレースケールは黒から白へ直線的に変化します。詳細はDisplayImages entry on the RELION wikiを参照してください。)<br />
●White value: 0<br />
(どの値を白にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Black value: 0<br />
(どの値を黒にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Lowpass filter (A):20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくするための動作です。)<br />
●Highpass filter (A): 0<br />
(これは顕微鏡写真上の濃淡のグラデーションを取り除くのに役立ちます。)<br />
●Pixel size: 0.885<br />
(これは粒子の直径や、low-pass filterとhigh-pass filterの計算に必要です。)<br />
●Scale for CTF image:1<br />
(これは単にそれぞれの顕微鏡写真のCTFボタンをクリックしたときにThon ring画像がどれくらい大きくなるのか調節します。)<br />
Run now!ボタンをクリックすることでjobが実行され、必要に応じていくつかの粒子をクリックしてください。しかし、次のセクションではLoGベースの自動抽出を使用するので、必要でなければ選ぶことはありません。最初の[2D classification] jobに手動抽出した粒子を使用する場合は、適切なクラス平均を計算するために約500~1000個の粒子が必要になります。左クリックで選択、中クリックで選択された粒子の削除、右クリックで座標を保存する必要があるポップアップメニューが表示されます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでもメニューから保存した座標のSTARファイルに戻ることができます(ポップアップメニューの座標を使用してSTARファイルを保存した場合)。<br />
<br />
===1.5 LoGベース自動選択===<br />
今回は、Laplacian-of-Gaussian(Log)フィルタに基づくテンプレートフリーの自動抽出の手順を使用して、最初の粒子セットを選択して下さい。その後、それらの粒子は[2D classification]jobで使用され、2番目の[Auto-picking]jobのテンプレートが生成されます。初期段階では多くの粒子を必要としないので、最初の3枚の顕微鏡写真に対してのみLoGべーすの自動抽出を実行します。一般的に、可能な限り良いテンプレートを得るために、おそらく使用可能なすべての顕微鏡写真に対してLoGベースの抽出を実行します。しかし、今回はこのチュートリアルの計算速度を上げるためにいくつかの顕微鏡写真のみを使用します。<br />
最初にいくつかの顕微鏡写真を選択するために、[Subset selection]jobに移動し、I/Oタブで下を除くすべての空欄をままにします。<br />
●OR select from picked cords: ManualPick/job004/cords_suffix_manualpick.star<br />
(手動抽出で座標を保存したときに生成されます。今回は座標を使用するつもりはなく、顕微鏡写真のサブセットセレクションを行うためにそのjobを使用しているだけです。)<br />
<br />
このjobにはalias 5micsを使用しました。Run!ボタンを押し、[Manual picking]jobと同じポップアップウィンドウを再び押すと、すべてのpickとCTFボタンが表示されます。‘File’メニューを使用して‘Invert selection’:最初の5枚の顕微鏡写真の前にあるチェックボックスをクリックして選択します。その後、‘File’メニューを再び使用して‘Save selection’を選択します。これで、ManualPick/job004/micrographs_selected.starというファイルができ、これを下記の[Auto-picking]jobに使用します。<br />
その後、[Auto-picking]jobを処理し、I/Oタブの設定を行います。<br />
<br />
●Input micrographs for autopick: Select/job005/micrographs_selected.star<br />
●Pixels size in micrographs (A) -1<br />
(ピクセルサイズは入力STARファイルの中の情報から自動的に設定されます。)<br />
●2D references:<br />
(テンプレートフリーのLoGベースの自動抽出では空欄のままにします。)<br />
●OR: provides a 3D reference? No<br />
●OR: use Laplacian-of-Gaussian? Yes<br />
<br />
Laplacianタブの設定をします。<br />
●Min. diameter for loG filter (A) 150<br />
●Max. diameter for loG filter (A) 180<br />
(これは粒子投影のオングストロームの最小最大のサイズに対応します。)<br />
●Are the particles white? No<br />
(黒です。)<br />
●Maximum resolution to consider 20<br />
(ここはデフォルト値のままでいいです。)<br />
●Adjust default threshold 0<br />
(正の値、すなわち閾値はより少ない粒子を選び、負の値もより少ない粒子を選んでください。有用な値は、おそらく[-1,1]の範囲ですが、多くの場合デフォルト値の0は正しい働きをします。)<br />
<br />
Referencesタブは無視して、autopickingタブの最初の四つのオプションは無視してください。下記のように設定してください。<br />
●Write FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Read FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Shrink factor: 0<br />
(縮小を0に設定すると、自動抽出プログラムは参照上のローパスフィルタの解像度に合わせて顕微鏡写真を縮小します。これはすごく早くなり、必要なメモリが少なくなるため、このチュートリアルを素早く実行するのに便利になります。0と1の間の値は顕微鏡写真のサイズの少数で表されるでしょう。これは縮小で1を使用するよりも正確な抽出が少なくなること、つまり縮小がないことに注意してください。この新しいパラメータの詳細は、次のサブセクションで説明します。)<br />
●Use GPU acceleration? No<br />
(計算速度がとても速いので、LoGベースの自動抽出はGPU加速されていません。)<br />
●Which GPUs to use:<br />
<br />
Helixタブを無視して、Running tabで単一MPIプロセッサを使用して実行します。もしかするとLoG_basedのようなaliasが有用かもしれません。単一プロセッサを使用すると、これらの計算は、私たちのコンピュータでは約40秒かかります。<br />
Display:ボタンのcoords_suffix_autopickオプションをクリックすることで結果をチェックすることができます。この段階で表示されるポップアップウィンドウで手動で粒子を追加/削除できます。さらに、autopickingタブのノイズの標準偏差と平均のパラメータやLaplacianタブのデフォルトの閾値の調節をしている間、新しいjobを実行して、より多くの、またはより少ない粒子を抽出することができます。しかし、この段階では、単に2回目のauto-picking jobのテンプレート作成のための最初の粒子セットなので、多くの場合これは必要ないでしょう。<br />
<br />
<br />
<br />
<br />
==Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。 <br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。 <br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。 <br />
<br />
<br />
==De novo 3D model generation (3Dモデル形成)==<br />
RELIONは、2Dの粒子から| 3D initial model | (3Dの初めのモデル)を生成することからSGDアルゴリズムを用いる。RELION-3.0によると、実行はcryoSPARCプログラムの実行にとてもよく従う。見ている方向とデータの合理的な配分の生成は(2D classification)の詳細なクラス平均を産出するために十分いい。このアルゴリズムは、適切な産出にとてもふさわしく、それ以降の低解像度モデルは、3D classificationか3D auto-refunementで利用できる。ここで留意すべきは、リリースされた3.0の実行の改善は、もはや2D classification動作からクラスにつき選択されたランダムな分子とともに分子の部分集合を選択することをしないことである。代わりに、選択された分子の一式の全体のデータを用いた時、そのアルゴリズムはとてもたくましいものである。<br />
<br />
===Running the job (動作の実行)===<br />
3D initial model のジョブタイプのI/Oタブのselect/class2d_aftersort/particles.starファイルを選択する。すべては、すでにCTFで順番にしている。OptimisationタブのFillにより従う(角のある初期状態の放置とサンプリングの相殺)<br />
●Number of class : 1<br />
(時々、一つのクラスより大きいもの。0をつかうと、データセットにまだ存在するだろう至適な分子のシンクの生成を助けるだろう。追加された議論sgd_skip_annealはまだ有用だろう。この場合、私たちはスピードアップするための一つのクラスをつかうだろう。)<br />
●Mask diameter (A) : 200<br />
前と同じ<br />
●Flatten and enforce non-negative solvent : Yes<br />
●Symmetry C1<br />
(対称性がなにかもわからないとき、C1の再構築はおそらく、始めることにベストな選択であるだろう。いくつかの高い対称性の物体は正しい空間グループよりC1のSGDによる解法が簡単だろう。このデータセットはいいデータで、正しいポイントグループD2が動作できる。しかしながら、C1からC2にどのように進行するかを説明すると、C1のSGDを動かすだろう。)<br />
特に、実例の1つに、SGDタブのいくつかに変えることはできないことと、その初期状態はいくつかの場合に適している。しかしながら、このチュートリアルのスピードアップすることは、私たちは、反復のデフォルトの数の半分だけ行うだろう。<br />
したがって、このように変化する。:<br />
●Number of initial iterations : 25<br />
●Number of in-between iterations : 100<br />
●Number of final iterations : 25<br />
Gomputeタブで、システム上で最適化する。再度RAMの中で数千の分子がプレリードできる。GPUの加速は、スピードアップを実現でき、反復の間の複数の極大化のステップは、2Dか3Dの精密化か分類の基準の準備はゆっくりになるだろう。4CPUのカードと、5MPInoプロセス、6スレッドのMPIプロセスを使い、システムはおよそ15分で済む。<br />
<br />
===Analysis the result (結果の分析)===<br />
UCSFキメラのような3Dビューワーの吐出量(Initial Model/job017/run-it/50_class001.mrc)を見る。もし、このポイントにおける対照的なポイントグループの追加を認識することは、RELIONの習慣における協調的なシステムの中心的なX,Y,軸における対照的な軸を整列させることを必要とするだろう。リリースされた3.0は新しいプログラムを促進することを含む。<br />
この動作はコマンドラインから実行できる。<br />
●Relion_align_symmetry - - i InitialModel/job017/run_it150_class001.mrc - -o InitialModel/job017/run_it150_class001_alignD2.mrc - -sym D2<br />
それと、マップにおける対照的な軸のUCSFキメラかrelion_displayの確認はX,YとZ軸の実際の整列とする。私たちはD2の対称的なものを使うことを強要させるだろう。<br />
●Relion_image_handler –i InitialModel/job017/run_it150_class001_alignD2.mrc –o InitialModel/job017/run_it150_class001_symD2.mrc –sym D2<br />
後者のコマンドの出力マップは、入力マップに似ているだろう。<br />
これによって確認できる。<br />
●relion_display_ --i InitialModel / job017 / run_it150_class001_alignD2.mrc & relion_display –i InitialModel / job017 / run_it150_class001_symD2.mrc &<br />
<br />
<br />
<br />
<br />
<br />
==Unsupervised 3D classification (教師無3次元クラス分類)==<br />
すべてのデータは異性分からなっています。問題は、どのくらいの費用でいられるかです。RELIONの3Dマルチリファレンス精密化手順は、強力な教師なし3次元分類へのアプローチを提供しています。<br />
<br />
===Running the job (ジョブを開始)===<br />
教師なし3次元分類は、[3D classification] ジョブタイプから、実行可能です。<br />
[I/O]タブの設定:<br />
●Input images STAR file: Select/class2d_aftersort/particles.star<br />
●Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
このマップはパイプラインの部分のように、Brouseボタンで表れないように述べる。両方のタイプは空のフィールドの中に名付けられるか、importジョブタイプをつかうマップの移入が行われる。対照的なC1を動作させたり、非対称的なInitialModel / job017 / run_it150_class.mrcを使いことを選択する。しかしながら、すでに右の対称的なセッティングは、後々とても楽になるだろう。<br />
●Reference mask (optional):<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供するところです。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類へのバイアスを最小限にする働きがあります。)<br />
[Reference]タブの設定: <br />
●Ref. map is on absolute greyscale: No<br />
(このマップがデータセットから再構築されたとき、すでに正しいグレースケールであります。RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
●Initial low-pass filter (A): 50<br />
(精密化プロセスにバイアスが導入する可能性があるため、高解像度の初期参照モデルは使用してはいけません。[12]で説明したように、初期マップをできる限りフィルタリングする必要があります。リボソームでは大抵、70Åを使用し、小さい粒子では通常40〜60Åの値を使用します。)<br />
●Symmetry: C1<br />
(このサンプルはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。良くない粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
●Do CTF corection? Yes<br />
●Has reference been CTF-correced? Yes<br />
(このモデルは、SGDのCTFコレクションによって作られている。)<br />
●Have data been phase flipped? No<br />
●Ignore CTFs untill first peak? No<br />
(リファレンスを作成するために使用した[2D classification]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
【Optimisation】タブの設定: <br />
●Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。) <br />
●Number of iterations: 25<br />
(これは一般的には変更する必要はありません。) <br />
●Regularisation parameter T: 4<br />
(Tの定義については[13]を参照してください。クライオEMの、2次元分類では、通常、Tは1~2を設定し、3次元分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均にノイズが見える場合はTの値を低くし、逆にクラス平均の分解能が低すぎる場合はTの値を高くします。主に気をつけなければならない点は、高解像度のノイズの過学習です。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
●Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。) <br />
●Mask individual particles with zeros? Yes<br />
(Yes: 0 / No: 乱数) <br />
●Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過学習を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
【Helix】タブは無視して下さい。 <br />
以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。 <br />
ここでも、【Running】タブで、使用するNumber of MPI processors(MPIプロセッサの数)とthreads(スレッド数)を指定できます。[2D classification]のjobタイプで説明したように、3次元分類は2次元分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3次元分類を表示するためにfirst_exhaustiveのようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。 <br />
精密化された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を確認できます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。 <br />
UCSFキメラなどを使用し、表示されたマップを3Dで見ると、マップが精密化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。 <br />
2次元分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示ウィンドウには、4つの精密化されたモデルの中央スライスが表示されます。最適なクラスを選択し、右クリックメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
===Analysing the results in more detail (詳細な結果の解析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
出力ファイルは基本的に2次元分類の実行時と同じです。(実際に2次元,3次元精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2次元クラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。例えば、run_it025_class00?.mrcというMRCマップです。 <br />
今まで通り、小さいクラスは大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比(SNR)が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。 <br />
●relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnuplotがインストールされているのであれば、以下の通りに入力して下さい。 <br />
●relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。 <br />
●grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
==High-resolution 3D refinement(三次元精密化)==<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は分解能を推定するために、gold-standard Fourier Shell Correlation(FSC)(二つの群に分け、互いに独立して再構成した場合に、どの分解能まで相関があるかにより判断)と言われる判断基準を用います。これにより、過学習を避けることができます[15]。角度の割当の正確さを推定する新しい手順([14])と組み合わせ、精密化が収束するときに自動的に決定されます。そのため、この手順は使用者の入力をほとんど必要としません。すなわち、客観性をのこしたまま、多くのデータセットのための優れたマップが生成がされていると述べられています。もう一つの長所は、一般的にこの手順は必要な実行回数が一回のみであり、最適化のための引数はほとんどありません。<br />
しかしながら、前に高解像度の精密化を始めた時、スケール未満とともに選ばれた粒子の正しいセットを再度抽出して、それによりもしかすると高解像度になるかもしれない。これをすることで、GUIのParticle extraction のジョブタイプとI/Oタブを与える。<br />
●micrograph STAR file : CtfFind / job003 / micrographs – ctf.star<br />
(そのままでよい)<br />
●Coordinate – file suffix : <br />
(空でよい)<br />
●OR re – extract refined particles ? Yes<br />
●Refined particles STAR file : Select /class3d – first_exhausitive / ●particle.star<br />
(今、選択された粒子の微粒にされたサブセットだけをつかうだろう)<br />
●Re – center refined coodinates ? Yes<br />
(3D classificationの動作以上から整列させたオフセットに従ってすべての粒子は再度中央に置かれるだろう)<br />
●Recenter on – X , Y , Z (pix) 0.0.0<br />
(箱の真ん中の分子を中心にキープさせたい)<br />
●Manually set pixel size ? No<br />
(入力したマイクログラフstarファイルはCTFの情報に含まれていないことが必要である。)<br />
Extractタブはすべてキープする。<br />
●Particle box size (pix) 360<br />
(大きな箱をつかうだろう。それにより非局在化させたCTFシグナルはより良いモデルになるだろう。これはCTF精密化の後が大事である。)<br />
●Rescale particles ? yes<br />
(とても大きな画像が働くことを防ぐことで、360×0.885/256 = 1.244 Åのピクセルサイズを減少させ、採取しましょう。これは、おそらく十分に小さいデータ、2.5 Åの大きな達成可能な解像度に制限があるだろう。)<br />
この動作では、エイリアスbest3dclass_bigboxを使用する。<br />
加えて、256ピクセルのボックスサイズに従って一番いいマップを入手したことのいたずらは必要である。<br />
●relion_image_handler –i Class3D/job018/run_it025_class001.mrc –angpix 3.54 –rescale_angpix 1.244 –o Class3D/job018/run_it025_class001_box256.mrc –new_box256 <br />
<br />
===Running the auto-refine job (自動精錬動作の実行)===<br />
3D auto-refine のジョブタイプのI/Oタブ<br />
●Input images STAR file : Extract/best3dclass_fullsize/particles.star<br />
●Reference map : Class3D / job018 / run_it025_class001_box256.mrc<br />
●Reference mask (optional)<br />
(からのままでいい)<br />
Reference タブ<br />
●Ref. map is on absolute gryscale ? No<br />
スケール現象の画像の違う標準化によると、正しく絶対的なグレースケールはマップの中に確立しなかった。このオプションの“No”は大事で、精密化の最初の相互作用のグレースケールは正しくなるだろう。<br />
●Initial low-pass filter (A) 50<br />
マップの高い頻度の成分に向かってバイアスを防いだことは低いパスのフィルターから自動精密化され始める。それと解像度から完全に依存された粒子の“gold standard”の維持は、1頭文字より高かった。<br />
●Symmetry D2<br />
(高解像度の粒子の照準は、強要された対称性の粒子の4倍効率的にするだろう)<br />
CTFのパラメータで、OpimisationとAuto-samplingタブは、3D classificationと同じでとどまる<br />
【Sampling】タブでの配向性のサンプリング間隔は反復の最初の数回のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング間隔が自動的に細かくなっていきます。したがって、8面体または正20面体対称よりも小さい角度で、全ての精密化仮定でで、一般的に大域探索では、初期値の角度である7.5度のサンプルを使用し、局所探索では1.8度のサンプルから行います。より正確な対称の精密化を行う場合のみ、3.7度でのサンプリングを行い、局所探索では0.9度ごとにサンプリングを行います。<br />
MPIのノードは1つのマスター(他のスレーブを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用するもの)のセットで分かれているので、奇数のMPI処理装置を使用するのが最も効率が良いです。ナイキスト周波数までのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。従って、使っているクラスターノードのコアと同じ数のスレッドで動かしたいデータセットのボックスより大きいサイズで作られたボックスが必要です。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
===Analysing the results (結果の分析)===<br />
出力ファイルは3D classificationを実行したときのものと大部分が同じです。しかし、全てにおけるプログラムの反復では、2つのrun_it0??_half?_model.starと2つのrun_it0??_half?_class001.mrcファイルを書き出します。それぞれデータの半分が精密化されます。収束した場合にのみ、ひとつのrun_model.starとrun_class001.mrcファイルを書き出します(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。 <br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[14]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルからも抽出されるかもしれません。 <br />
例えば、以下のように試してみてください。 <br />
●grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
==11 まとめ==<br />
<br />
===11.1 フローチャートの作成===<br />
<br />
どのようにして最終的な再構築をするか気になるでしょう。'''''Finished job'''''リストから実行した最後の動作を選択し、'''''Job actions'''''ボタンから'''Make flowchart'''オプションを試してください。これを実行するためにはシステムに'''LATEX'''や'''TikZ'''パッケージが必要となります。最初の項は正確な作業名のないフローチャートの全体像です。これは、出版目的に役立つでしょう(おそらくお気に入りの'''vector-based design'''プログラムの編集後に)。フローチャートの全体像の後に、最初の詳細なフローチャートにどのようにして終了するかが示されています。10ステップ以上からなるフローチャートは複数の構成要素に分けられることに注意してください。作業中に複数枝分かれすることがあるでしょう。それ故に、最終作業のフローチャートに従って、それぞれの分岐についてフローチャートがあるでしょう。リンクをクリックすることでPDFファイルから合致する位置を得ることができます。<br />
<br />
===11.2 ディレクトリのクリーンアップ===<br />
<br />
ディスクの空間を確保するために、RELIONは作業ディレクトリをクリーンアップするオプションを持っています。これには2つのモードがあります。'''''gentle'''''クリーンは作業ディレクトリから中間ファイルのみを削除します。'''''harsh'''''クリーンは作業からのインプットを必要とする新たな作業を開始するのに必要なファイルを削除します。例えば、'''''harsh'''''クリーンは'''Motion Corr'''作業から平均化された、あるいは'''Particle extraction'''作業から少量のスタックを抽出された顕微鏡写真を削除します。一方、'''''gentle'''''クリーンは'''2D classification''', '''3D classification'''あるいは'''3D auto-refine'''作業の中間反復からすべてのファイルを削除します。'''Job actions'''ボタンから個別に作業をクリーンアップすることができます。あるいは、GUIのトップメニューから下がった、'''''Jobs'''''からすべての作業をクリーンアップすることができます。私たちは計算前の結果に頭を悩ませていたプロジェクトディレクトリの'''tarball'''を作る前にそのメニューから'''''Gently clean all jobs'''''オプションを使いました。長期間保存されていたデータを取る前にプロジェクトディレクトリをクリーンアップしたいでしょう。<br />
<br />
===11.3 質問や引用===<br />
<br />
以上です!このチュートリアルを楽しんで、そして役に立つことを願います。もしRELIONについて質問があれば、初めに'''RELION Wiki'''の'''FAQ'''と'''CCPEMメーリングリスト'''を確認してください。それが助けにならなければ、'''CCPEMリスト'''を利用して質問してください。お願いですから、決してSjorsに直接メールを送信しないでください。質問全てに返答できるわけではありません。もしRELIONが利用者の研究に有益であると思ったら私たちの[http://www2.mrc-lmb.cam.ac.uk/groups/scheres/publications.html 論文]を引用し、あなたの研究仲間たちに伝えてください。<br />
<br />
===11.4 参考文献===<br />
<br />
RELIONの手順の改善を支持した理論の詳細は以下の論文で述べられています。<br />
* S.H.W. Scheres (2012) “''RELION: Implementation of a Bayesian approach to cryo-EM structure determination''” J. Struc. Biol., 180, 519-530.<br />
<br />
*S.H.W. Scheres (2012) “''A Bayesian view on cryo-EM structure determination''” J. Mol. Biol., 415, 406-418.<br />
<br />
RELIONの使い方に関する包括的な概観は以下の論文に述べられています。<br />
<br />
*S.H.W. Scheres (2016) “''Processing of structurally heterogeneous cryo-EM data in RELION''” Meth. Enzym., 579, 125-157.<br />
<br />
<br />
==12 付録 A:インストールの注意==<br />
<br />
===12.1 MPIのインストール===<br />
<br />
'''MPI(message passing interface)'''がインストールされた計算機クラスター、もしくはNVIDIA GPU搭載のマルチコアデスクトップマシンが必要になることに注意してください。RELIONをコンパイルするには、'''mpi-devel'''パッケージが必要です。おそらく存在する種類'''(MPICH, LAM-MPI, etc)'''またはバージョンはそれほど重要ではありません。まだシステム内に'''mpi-devel'''をインストールしてなければ、'''openMPI'''をインストールすることをお勧めします。<br />
<br />
===12.2 CUDAのインストール===<br />
<br />
'''NVIDIA'''の比較的新しいGPU('''compute capability 3.5+'''以上)を持っている場合、オートピッキング、分類、精密化作業を高速に実行できます。'''GPU-accelerationサポート'''を含むRELIONをコンパイルするには、'''CUDA'''をインストールする必要があります。このチュートリアルの準備には'''CUDA-8.0'''を使用しました。[https://developer.nvidia.com/cuda-downloads NVIDIAのWebサイト]からダウンロードしてください。<br />
<br />
===12.3 RELIONのインストール===<br />
<br />
RELIONはオープンソースのソフトウェアです。[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Download_%26_install the RELION wiki]から無料でダウンロードして、手順に従ってインストールしてください。もし、'''job submission system(Sun Grid EngineやPBS/TORQUE etc)'''に詳しくない場合は、インストール手順の説明にあるように、'''qsub.cshスクリプト'''の設定に関して、システム管理者にお尋ねください。分散メモリ並列化のためのMPIと、共用メモリの並列化のための'''pthreads'''の両方を使用する、いわゆるハイブリッド並列計算を実行したいときは注意してください。ジョブキューイングシステムはこれを可能とするためにいくつかの調整が必要な場合があります。再度、システム管理者にお尋ねください。<br />
<br />
===12.4 モーション補正ソフトウェアのインストール===<br />
<br />
RELION-3.0は全フレーム顕微鏡写真ムービーアライメントに使用される、'''UCSFプログラムMOTIONCOR2'''へのラッパーを提供します。[http://www.msg.ucsf.edu/agard/protocols.html Dabid Agard]のページからプログラムをダウンロードし、インストールの手順に従ってください。また、RELIONの保有する、'''MOTIONCOR2'''の実行を使うかもしれません。なので、もし、UCSF実行をインストールするのに問題が発生しても心配しないでください。バージョン3.0において、'''''Nico grigorieff’s group'''''から'''UNBLUR'''へのラッパーはGUIから中止されていることに注意してください。<br />
<br />
===12.5 CTF推定ソフトウェアのインストール===<br />
<br />
CTF推定はRELIONに含まれていません。代わりに、RELIONは'''''Alexis RohouやNiko Grigorieff’s CTFFIND4'''''へのラッパーを提供します。[http://grigoriefflab.janelia.org/datadownload Niko’s CTFFIND website]からダウンロードし、手順に従ってインストールしてください。また、もし、パソコンに'''NVIDIA graphics card(GPU)'''が入っているなら'''''Kai Zhang’s GCTF'''''を使うこともできます。その際は、LMBに関する[https://www.mrc-lmb.cam.ac.uk/kzhang/ KaiのWebサイト]からダウンロードしてください。<br />
<br />
===12.6 RESMAPのインストール===<br />
<br />
局所分解能推定はRELIONが所有するポストプロセッシングプログラムの中、あるいは'''''Alp KucukelbirのRESMAP'''''へのラッパーを通して実行される。[http://www.proditus.com/software.html AlpのRESMAP Webサイト]からダウンロードし、手順に従ってインストールしてください。<br />
<br />
<br />
<br />
<br />
== 13 付録B:RELIONの利用 ==<br />
=== 13.1 GUIについて ===<br />
<br />
==== 13.1.1 pipeline approach ====<br />
RELION-3.0では、一つのプログラムの出力を次のプログラムの入力として順次繋いでいくような情報の受け渡し(パイプライン)を円滑に実現できるようなGUIを設計しました。詳細は2016 Proceedings of the CCP-EM Spring Symposium[3]で公開されています。<br />
RELION-3.0を使うにあたって、まずプロジェクト(すなわち構造決定したい分子)ごとにディレクトリを作成することを推奨します。ここではこのディレクトリの呼称をプロジェクトディレクトリとします。RELIONのGUIは「relion」とコマンドを打つことで起動させることができますが、この動作は常にプロジェクトディレクトリに移動してから行うことを念頭に置いてください。<br />
<br />
このソフトのGUIでは、すべてのジョブや、あるジョブによる出力がどのように他のジョブの入力に使われたのかといった履歴を保存することができ、この機能によってパイプラインが形成されます。各種ジョブにはそれぞれ独自の出力ディレクトリが与えられます。ここではたとえば あるジョブの出力のためにClass2D/ というディレクトリができるとします。こういったジョブディレクトリの中でさらに新しいジョブが実行されると、その新しいジョブには一連の番号が与えられます。たとえばClass2Dのもとで作られたとあるジョブにはClass2D/job010という番号が振り分けられます。さらに、ジョブディレクトリのもとでは、Class2D/job010/run といったように出力名が定められます。このソフトでは、各ジョブに意味のある名前が付けられるような仕組みを備えるために、ファイルシステム上の個々のジョブディレクトリへの記号リンクとして実装された"エイリアス"システムを使用しています。<br />
パイプラインに関するすべての情報はdefault_pipeline.starという名前のファイルに保存されていますが、基本的にはこのファイルを見る必要はありません。もしdefault_pipeline.starファイルが壊れてしまった場合は、最後に実行したジョブディレクトリで保存されたバックアップから復元することができます。<br />
<br />
==== 13.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
このソフトのGUIは上半分と下半分に分かれています。上半分の左側にはジョブの種類が縦リスト上に並べられており、行いたいジョブを選ぶことができます。たとえば2D classificationを行いたいときは、上半分の左側のブラウザで選択すればいいわけです。上半分の右側には複数のタブがあるパネルがあり、それぞれのジョブタイプへのパラメータを入力できます。GUIの左上には機能のおおよその概要が分かる3つのメニューが書かれています。<br />
【Schedule】ボタンでは、後でジョブを実行するときのスケジューリングを行うことができます。それに対して【Run now!】ボタンは今すぐに実行したいときに使います。【Schedule】ボタンは、繰り返し実行できるよう完全自動化された「パイプライン」を用意したいときに役立ちます。たとえば、データが収集されていくにつれてそれが瞬時に反映できるようなパイプラインを実現したいときに有効です。詳細は13.3を参照してください。<br />
GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 13.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中のジョブ(【Running jobs】)、すでに完了しているジョブ(【Finished jobs】)、または後で実行するようにスケジュールされたジョブ(【Scheduled jobs】)のリストがあります。これらのリスト内のジョブをクリックすると、そのジョブのパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリが作成されることはありませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】のジョブでは、_optimiser.starというファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。【モーション補正】、【CTF推定】、【自動ピッキング】、【粒子抽出】は、これまでに行われていなかった顕微鏡写真でのみ実行されます。【Input to this job】(このjobへの入力)と【Output from this job】(このjobからの出力)は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(stdout)と標準エラー出力(stderr)がそれぞれ黒と赤のテキストで表示されます。標準エラー出力は理想的には何もない状態でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、スクロールがしやすくなるようテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 13.1.4 The Display button(ディスプレイボタン) ====<br />
runボタンとscheduleボタンの下にある【Display:】ボタンでは、各ジョブにおける最重要たる入力ファイルと出力ファイルを視覚的に表示することができます。GUIの下半分にあるjobリストのうちのひとつのjobを選択した後に【Display:】ボタンをクリックすると、選択されたjobの入力と出力がすべて(例えば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。中間体のファイルを表示するといったような一般的な機能はGUI左上の3つのメニューのうちFile>Displayを選択することで使うことができます。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第11章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(13.1.6参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
ジョブを削除すると、ジョブディレクトリ全体がプロジェクトディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、ジョブを復元することができます。<br />
<br />
ディスク容量を節約するため、ジョブを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。これには2つのクリーニングオプションがあり、片方は【gentle clean】という方法です。この方法では、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は【harsh clean】という完全なクリーニング方法です。この方法では全てのファイルを消すことになるため、より多くの容量を確保できます。その中でも【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のジョブタイプから選択できる粒子スタック、または顕微鏡写真を含むディレクトリに関しては、とりわけ多くの容量を確保できます。<br />
<br />
また、RELIONの左上にある【job】メニューの対応するオプション(【Gently clean all jobs】あるいは、【Harshly clean all jobs】)を使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。 その際、特定のディレクトリを削除対象から除外したい場合には、NO_HARSH_CLEANというファイルをその中に置いてください。<br />
<br />
例えば、保護したい粒子データがjob098にある場合、次のコマンドを実行してください。<br />
<br />
$ touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
※ touchコマンドは、指定したファイルが存在しない場合には空のファイルを作成するプログラムです。存在している場合には、ファイルの修正時刻を変更します。</div>
Nakamu
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION3%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELION3チュートリアル
2019-02-09T16:23:02Z
<p>Nakamu: </p>
<hr />
<div>'''RELION3'''<br />
<br />
==1 前処理==<br />
<br />
===1.1 解析の準備===<br />
私たちはプロジェクトごとに、すなわち構造解析したいものごとに一つのディレクトリを作成することをお勧めします。これをプロジェクトディレクトリと呼びます。'''プロジェクトディレクトリからRELION GUIを毎回起動することは重要です。'''プロジェクトディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式かTIFF形式で保存するための別のディレクトリを作成してください。もしすべての動画が一つのディレクトリにある場合には、このディレクトリをMovies/とした方が好ましいでしょう。また、異なるディレクトリにある場合(例えば、違う日に集めたもの)には、Movies/15jan16またはMovies/23jan16とするといいでしょう。もし何か理由があり、RELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成することができます。<br />
<br />
単一画像の顕微鏡写真にはmrc拡張子を、動画にはmrc、mrcs、tiff拡張子をつけることができます。チュートリアルのデータを解凍したとき、プロジェクトディレクトリ(Movies/)は作成されています。このディレクトリは、TIFF形式に圧縮された24つの動画、gain.mrc、実験の情報を含んだNOTESファイルが含まれています。<br />
<br />
RELIONを起動してみましょう。前述のように、RELIONは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。その為、新しいディレクトリで初めてRELIONを起動するときは、バックグラウンドで起動するための&の文字を使うべきではありません。プロジェクトディレクトリの中にいることを確認し、入力でRELIONを起動します。<br />
<br />
relion <br />
<br />
そして新しいRELIONプロジェクトを作動するために“y“と答えます。<br />
最初にすることとして、パイプラインの中に録画した顕微鏡動画の取り込みを行います。<br />
job-typeブラウザから”Import”を選択し、以下のパラメータを埋めます。<br />
<br />
●Input files: Movies/*.tiff <br />
●Node type: 2D micrograph movies <br />
<br />
これを行うことで、Current job: Give_alias_hereという空欄に効果的なaliasを規定すrことができます。[Run now!]ボタンをクリックし、job起動します。Import/job001というディレクトリが作成され、Import/moviesというこのディレクトリへのシンボリックリンクが一緒に作成されます。STARファイルとすべての動画が新しいディレクトリの中に作成されます。中を見てみましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし違うソフトウェアで粒子を抽出した場合は、後述の事前処理を行う代わりに、STARファイルや3次元レファレンス、3次元マスクなどを取り込むために“Import”job-typeを使用してください。これについてはRELIONを使用する際の責任は取りません。また、ユーザーは正しいSTARファイルの生成に責任を取ってください。<br />
<br />
===1.2 電子線により誘起される画像の動きの補正===<br />
Motion correction job-typeは便利な全体フレーム動画の調整のためのUCSF MOTIONCOR2[21]ラッパーを規定します。あるいは、バージョン3.0以降はMOTIONCOR2と同じアルゴリズムであるRELION独自の実装を使用することもできます。RELION独自の実装はCPU でのみの実行となるので注意してください。[I/O]タブで設定をします。<br />
<br />
●Input movies STAR file: Import/movies/movies.star<br />
([Browse]ボタンで参照できるファイルは、STAR形式の動画ファイ <br />
ルのみです。)<br />
●First frame for corrected sum: 1<br />
●Last frame for corrected sum: 0<br />
(これはすべての動画フレームに使用する際の結果です。)<br />
●Pixel size(A) 0.885<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
●Do dose-weighting? Yes<br />
●Save non-dose-weighted as well? No<br />
(いくつかの非用量加重顕微鏡写真にはCTF推定を行う方がよいで <br />
しょう。ディスク容量を節約するために、データが非常に良いの <br />
でこのオプションは使用しません。)<br />
<br />
[Motioncor2]タブは以下のように入力します。<br />
●Bfactor: 150<br />
(超高解像度動画ではより大きい価値を使用します。)<br />
●Number of patches X,Y 5 5<br />
●Group frames: 1<br />
●Binning factor: 1<br />
(超高解像度動画ではたいてい2を使用します。)<br />
●Gain-reference image: Movies/gain.mrc<br />
(これは、オンザフライでのgain-reference補正用のgain- <br />
referenceファイルを規定するために使用できます。これらの動 <br />
画はまだgain補正されていないので、この場合には必要です。)<br />
●Defect file:<br />
(これは検出器上の壊れたピクセルを隠すために使用することがで <br />
きます。)<br />
●Gain rotation: No rotation (0)<br />
●Gain flip: No flipping (0)<br />
(gain-reference画像はこのデータセットのために既に補正されて <br />
います。)<br />
●Use RELION’s own implementation? Yes<br />
(これによって、UCSF実装をインストールする必要性が少なくなり <br />
ます。どちらにせよ、UCSFプログラムをインストールしている場 <br />
合は、それを使用することもできます。その場合、以下のオプシ <br />
ョンも入力する必要があります。)<br />
<br />
[Running]タブは以下のように入力します。<br />
●Do dose-weighing? Yes<br />
●Voltage (kV) 200<br />
●Dose per frame (e/A2) 1.277<br />
●Pre-exposure (e/A2) 0<br />
<br />
このプログラムの実行には手頃な12スレッドの最新機器を用いればおおよそ5分かかります。MOTIONCOR2アルゴリズムのRELION独自の実装はGPUでは使用しないことに注意してください。しかしそれはマルチスレッドです。各スレッドは独立して動画フレーム場で動作するので、動画フレームの数をスレッドの数で割った数が整数になるように、いくつかのスレッドを使用することが最適です。これらの動画は24フレームあるので、12スレッドを使用すると各スレッドで2フレームが処理されます。[Run now!]ボタンの下の[Display:]ボタンからout:logfile.pdfを選択することで、推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで、値が合計された顕微鏡写真を見ることができます。スクリーンサイズに依存して、見やすいように、顕微鏡写真(Scale:0.3)を縮小し、Sigma contrast:3を使い、見やすい数のコラム(例として、Number of columns:3)にするべきです。[Display:]ボタンから表示したときから顕微鏡写真は選択できないことに注意してください。もし、取り除きたい顕微鏡写真がある場合(今回はすべていい画像なので削除しないだろうが)は[Subset selection]job-typeが使用できます。<br />
<br />
===1.3 CTF推定===<br />
次に、それぞれ補正した顕微鏡写真からCTFの値を推定します。速度の為Kai ZhangのGCTFのためのラッパーとして[CTF estimation]job-typeにします。適切なGPUがない場合、Alexis RohouとNiko GrigoreffのCTFFIND4.1を使用することができます。[I/O]タブで、[Motion correction]jobのcorrected_micrographs.starファイルを選択するために[Browse]ボタンを使用します。また、他のタブは以下のように入力します。<br />
<br />
I/Oタブにおいて<br />
●Use micrograph without dose-weighting? No<br />
(これらは重み付けされたものよりも良いThon ringsを持っているが、書き出さないことを前のステップで決めました。)<br />
●Sperical aberration (mm): 1.4<br />
(顕微鏡メーカーがこの値を提供してくれています。)<br />
●Voltage (kV): 200<br />
●Amplitude contrast: 0.1<br />
(強度コントラストはほとんどないことが知られていますが、約10%の値を与えることで、多くの構造の結果がよくなることが示されています。これは低周波数の弱い散乱がモデル化されていないからです。)<br />
●Magnified pixel size (A): 0.885<br />
(これらはピクセルサイズ0.885Aのもとの動画です。)<br />
●Amount of astigmatism (A): 100<br />
(範囲が適切に調整されていれば、この値は多くのデータセットに適しています。)<br />
<br />
Searchesタブにおいて、CIFFINDの一般的な値を設定します(正確な意味については、Nikoのドキュメンテーションを参照してください)。これらの設定は、GCTFを使用する場合には無視してください(デフォルトで、これをオフに切り替えることができるが)。<br />
●FFT box size (pix): 512<br />
●Minimum resolution (A): 30<br />
●Maximum resolution (A): 7.1<br />
●Minimum defocus cvalue (A): 5000<br />
●Maximum defocus cvalue (A):50000<br />
●Defocus step size (A): 500<br />
●Amount of astigmatism (A): 100<br />
●Estimate phase shifts No<br />
(これはphase-plateデータだけに役に立つ)<br />
GCTFを使用する場合はCTFFIND-4.1タブを無視してください。逆にGCTFを使用しない場合はCTFFIND-4.1タブウィ使用してください。今回の例として、GCTFを使用し、Getfタブを設定します。<br />
●Use Gctf instead? Yes<br />
●Gctf executable: /wherever/it/is/Gctf<br />
(環境変数である$RELION_CTFFIND_EXECUTABLEと$RELION_GCTF_EXECUTABLEは対応するプログラムのGUIエントリのデフォルト値を制御するために使用されます。)<br />
●Ignore ‘Searches’ parameters? Yes<br />
(GCTFにSearchesタブのパラメーターを渡すにはこれを’No’に設定します。デフォルトでは、これらの値は無視され、GCTF独自のデフォルトが使用されます。)<br />
●Perform equi-phase averaging? Yes<br />
(これによりThon ringのSNRが向上します。)<br />
●Other Gctf options:<br />
●Which GPUs to use: 0<br />
(この小さいデータセットには1GPUで十分でしょう。)<br />
<br />
マシンに応じて、複数のMPI処理を使用してプログラムを実行することができます。1プロセッサーとGPUのみを使用すると、動作はGCTFを使用すると31秒かかります。いったん動作が終わると、出力のCtfFind/job003/Moviesという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFINDを使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
Display:ボタンを使用してout:micrographs_ctf.starを選択すると、すべてのThon ring画像を見ることができます。実験の画像のThon rings間の0はモデルの0と一致するはずです。デフォーカス、最高分解能や性能指数などの順番の表示を並べ替えることができます。log.pdfファイルにはすべての顕微鏡写真に対する、デフォーカス、非点収差、推定解像度などの有用なパラメータのプロットとデータセット全体のヒストグラムが含まれています。データ収集における問題点を見つけ出すのに役に立ちます。<br />
もしCTFモデルが実験のThon ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除して、Finished jobsリストからCtfFind/job003を選択し、parameter-panel の値を修正し、Continue nowボタンをクリックすることでjobを再実行することができます。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できないまたは、不十分なThon ringがあり顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
===1.4手動粒子抽出===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の「粒子座標」を手動で選択して使用します。自分たちのデータをより理解できるように少なくとも複数の顕微鏡写真を選択するのがよいでしょう。選択した粒子を使用して、参照なしの2Dクラス平均を計算し、その後、これらの粒子は全データセットの粒子を自動検出するためのテンプレートになります。しかしRELION3.0以降は、Laplacian-of-Gaussian(LoG)フィルターに基づく参照なしの自動抽出手順が含まれています。これまでにテストされたほとんどの場合、この手順は適切な開始座標を提供してくれるので、Manual pickingステップは飛ばすことができます。relion_it.pyスクリプトはこの機能を使用して、完全に自動化されたオンザフライ処理を実行します。このチュートリアルでは、説明のためにManual picking jobを起動し、その後LoGベースのAuto-pickingを継続して最初の粒子セットを細分化します。<br />
手動粒子検出は経験あるのみです!RELIONで手動で粒子の検出をするのが好きでなければ、Jude ShortのXIMDISP[17](任意の拡張子付きで)、XMIPP-2.4[16](任意の拡張子付きで)、Steven LudtkeのE2BOXER.PY[18](.boxの拡張子付きで)の座標形式ファイルもサポートしています。もしこれらを使用する場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存してください。そして、同じ顕微鏡写真のルートネームは異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMovies/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Input Files:の欄に整理されたファイルのsuffix拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例だと、それぞれMovies/*.boxやMovies/*_pick.starになります。<br />
Manual picking jobタイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBrowseボタンを使用して、Colorsタブは無視して、Displayタブは下のように入力します。<br />
●Prticle diameter (A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
●Scale for micrographs: 0.25<br />
(これは画面サイズによります。)<br />
●Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。黒が標準偏差の3倍低く、白が標準偏差の3倍高くなります。グレースケールは黒から白へ直線的に変化します。詳細はDisplayImages entry on the RELION wikiを参照してください。)<br />
●White value: 0<br />
(どの値を白にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Black value: 0<br />
(どの値を黒にするか手動で設定してください。これが動作するには、Sigma contrastは0に設定されるべきです。)<br />
●Lowpass filter (A):20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくするための動作です。)<br />
●Highpass filter (A): 0<br />
(これは顕微鏡写真上の濃淡のグラデーションを取り除くのに役立ちます。)<br />
●Pixel size: 0.885<br />
(これは粒子の直径や、low-pass filterとhigh-pass filterの計算に必要です。)<br />
●Scale for CTF image:1<br />
(これは単にそれぞれの顕微鏡写真のCTFボタンをクリックしたときにThon ring画像がどれくらい大きくなるのか調節します。)<br />
Run now!ボタンをクリックすることでjobが実行され、必要に応じていくつかの粒子をクリックしてください。しかし、次のセクションではLoGベースの自動抽出を使用するので、必要でなければ選ぶことはありません。最初の[2D classification] jobに手動抽出した粒子を使用する場合は、適切なクラス平均を計算するために約500~1000個の粒子が必要になります。左クリックで選択、中クリックで選択された粒子の削除、右クリックで座標を保存する必要があるポップアップメニューが表示されます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでもメニューから保存した座標のSTARファイルに戻ることができます(ポップアップメニューの座標を使用してSTARファイルを保存した場合)。<br />
<br />
===1.5 LoGベース自動選択===<br />
今回は、Laplacian-of-Gaussian(Log)フィルタに基づくテンプレートフリーの自動抽出の手順を使用して、最初の粒子セットを選択して下さい。その後、それらの粒子は[2D classification]jobで使用され、2番目の[Auto-picking]jobのテンプレートが生成されます。初期段階では多くの粒子を必要としないので、最初の3枚の顕微鏡写真に対してのみLoGべーすの自動抽出を実行します。一般的に、可能な限り良いテンプレートを得るために、おそらく使用可能なすべての顕微鏡写真に対してLoGベースの抽出を実行します。しかし、今回はこのチュートリアルの計算速度を上げるためにいくつかの顕微鏡写真のみを使用します。<br />
最初にいくつかの顕微鏡写真を選択するために、[Subset selection]jobに移動し、I/Oタブで下を除くすべての空欄をままにします。<br />
●OR select from picked cords: ManualPick/job004/cords_suffix_manualpick.star<br />
(手動抽出で座標を保存したときに生成されます。今回は座標を使用するつもりはなく、顕微鏡写真のサブセットセレクションを行うためにそのjobを使用しているだけです。)<br />
<br />
このjobにはalias 5micsを使用しました。Run!ボタンを押し、[Manual picking]jobと同じポップアップウィンドウを再び押すと、すべてのpickとCTFボタンが表示されます。‘File’メニューを使用して‘Invert selection’:最初の5枚の顕微鏡写真の前にあるチェックボックスをクリックして選択します。その後、‘File’メニューを再び使用して‘Save selection’を選択します。これで、ManualPick/job004/micrographs_selected.starというファイルができ、これを下記の[Auto-picking]jobに使用します。<br />
その後、[Auto-picking]jobを処理し、I/Oタブの設定を行います。<br />
<br />
●Input micrographs for autopick: Select/job005/micrographs_selected.star<br />
●Pixels size in micrographs (A) -1<br />
(ピクセルサイズは入力STARファイルの中の情報から自動的に設定されます。)<br />
●2D references:<br />
(テンプレートフリーのLoGベースの自動抽出では空欄のままにします。)<br />
●OR: provides a 3D reference? No<br />
●OR: use Laplacian-of-Gaussian? Yes<br />
<br />
Laplacianタブの設定をします。<br />
●Min. diameter for loG filter (A) 150<br />
●Max. diameter for loG filter (A) 180<br />
(これは粒子投影のオングストロームの最小最大のサイズに対応します。)<br />
●Are the particles white? No<br />
(黒です。)<br />
●Maximum resolution to consider 20<br />
(ここはデフォルト値のままでいいです。)<br />
●Adjust default threshold 0<br />
(正の値、すなわち閾値はより少ない粒子を選び、負の値もより少ない粒子を選んでください。有用な値は、おそらく[-1,1]の範囲ですが、多くの場合デフォルト値の0は正しい働きをします。)<br />
<br />
Referencesタブは無視して、autopickingタブの最初の四つのオプションは無視してください。下記のように設定してください。<br />
●Write FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Read FOM maps? No<br />
(これは下のテンプレートベースの抽出で使用されます。)<br />
●Shrink factor: 0<br />
(縮小を0に設定すると、自動抽出プログラムは参照上のローパスフィルタの解像度に合わせて顕微鏡写真を縮小します。これはすごく早くなり、必要なメモリが少なくなるため、このチュートリアルを素早く実行するのに便利になります。0と1の間の値は顕微鏡写真のサイズの少数で表されるでしょう。これは縮小で1を使用するよりも正確な抽出が少なくなること、つまり縮小がないことに注意してください。この新しいパラメータの詳細は、次のサブセクションで説明します。)<br />
●Use GPU acceleration? No<br />
(計算速度がとても速いので、LoGベースの自動抽出はGPU加速されていません。)<br />
●Which GPUs to use:<br />
<br />
Helixタブを無視して、Running tabで単一MPIプロセッサを使用して実行します。もしかするとLoG_basedのようなaliasが有用かもしれません。単一プロセッサを使用すると、これらの計算は、私たちのコンピュータでは約40秒かかります。<br />
Display:ボタンのcoords_suffix_autopickオプションをクリックすることで結果をチェックすることができます。この段階で表示されるポップアップウィンドウで手動で粒子を追加/削除できます。さらに、autopickingタブのノイズの標準偏差と平均のパラメータやLaplacianタブのデフォルトの閾値の調節をしている間、新しいjobを実行して、より多くの、またはより少ない粒子を抽出することができます。しかし、この段階では、単に2回目のauto-picking jobのテンプレート作成のための最初の粒子セットなので、多くの場合これは必要ないでしょう。<br />
<br />
<br />
<br />
<br />
==2 Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。 <br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。 <br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。 <br />
<br />
<br />
==3.0 De novo 3D model generation (3Dモデル形成)==<br />
RELIONは、2Dの粒子から| 3D initial model | (3Dの初めのモデル)を生成することからSGDアルゴリズムを用いる。RELION-3.0によると、実行はcryoSPARCプログラムの実行にとてもよく従う。見ている方向とデータの合理的な配分の生成は(2D classification)の詳細なクラス平均を産出するために十分いい。このアルゴリズムは、適切な産出にとてもふさわしく、それ以降の低解像度モデルは、3D classificationか3D auto-refunementで利用できる。ここで留意すべきは、リリースされた3.0の実行の改善は、もはや2D classification動作からクラスにつき選択されたランダムな分子とともに分子の部分集合を選択することをしないことである。代わりに、選択された分子の一式の全体のデータを用いた時、そのアルゴリズムはとてもたくましいものである。<br />
<br />
===3.1 Running the job (動作の実行)===<br />
3D initial model のジョブタイプのI/Oタブのselect/class2d_aftersort/particles.starファイルを選択する。すべては、すでにCTFで順番にしている。OptimisationタブのFillにより従う(角のある初期状態の放置とサンプリングの相殺)<br />
Number of class | 1<br />
(時々、一つのクラスより大きいもの。0をつかうと、データセットにまだ存在するだろう至適な分子のシンクの生成を助けるだろう。追加された議論sgd_skip_annealはまだ有用だろう。この場合、私たちはスピードアップするための一つのクラスをつかうだろう。)<br />
Mask diameter (A) | 200<br />
前と同じ<br />
Flatten and enforce non-negative solvent |Yes<br />
Symmetry C1<br />
(対称性がなにかもわからないとき、C1の再構築はおそらく、始めることにベストな選択であるだろう。いくつかの高い対称性の物体は正しい空間グループよりC1のSGDによる解法が簡単だろう。このデータセットはいいデータで、正しいポイントグループD2が動作できる。しかしながら、C1からC2にどのように進行するかを説明すると、C1のSGDを動かすだろう。)<br />
特に、実例の1つに、SGDタブのいくつかに変えることはできないことと、その初期状態はいくつかの場合に適している。しかしながら、このチュートリアルのスピードアップすることは、私たちは、反復のデフォルトの数の半分だけ行うだろう。<br />
したがって、このように変化する。:<br />
Number of initial iterations | 25<br />
Number of in-between iterations | 100<br />
Number of final iterations : 25<br />
Gomputeタブで、システム上で最適化する。再度RAMの中で数千の分子がプレリードできる。GPUの加速は、スピードアップを実現でき、反復の間の複数の極大化のステップは、2Dか3Dの精密化か分類の基準の準備はゆっくりになるだろう。4CPUのカードと、5MPInoプロセス、6スレッドのMPIプロセスを使い、システムはおよそ15分で済む。コーヒー―――<br />
<br />
===3.2 Analysis the result (結果の分析)===<br />
UCSFキメラのような3Dビューワーの吐出量(Initial Model/job017/run-it/50_class001.mrc)を見る。もし、このポイントにおける対照的なポイントグループの追加を認識することは、RELIONの習慣における協調的なシステムの中心的なX,Y,軸における対照的な軸を整列させることを必要とするだろう。リリースされた3.0は新しいプログラムを促進することを含む。<br />
この動作はコマンドラインから実行できる。<br />
Relion_align_symmetry - - i InitialModel/job017/run_it150_class001.mrc - -o InitialModel/job017/run_it150_class001_alignD2.mrc - -sym D2<br />
それと、マップにおける対照的な軸のUCSFキメラかrelion_displayの確認はX,YとZ軸の実際の整列とする。私たちはD2の対称的なものを使うことを強要させるだろう。<br />
Relion_image_handler –i InitialModel/job017/run_it150_class001_alignD2.mrc –o InitialModel/job017/run_it150_class001_symD2.mrc –sym D2<br />
後者のコマンドの出力マップは、入力マップに似ているだろう。<br />
これによって確認できる。<br />
relion_display_ --i InitialModel / job017 / run_it150_class001_alignD2.mrc & relion_display –i InitialModel / job017 / run_it150_class001_symD2.mrc &<br />
<br />
<br />
<br />
<br />
<br />
==4. Unsupervised 3D classification (教師無3次元クラス分類)==<br />
すべてのデータは異性分からなっています。問題は、どのくらいの費用でいられるかです。RELIONの3Dマルチリファレンス精密化手順は、強力な教師なし3次元分類へのアプローチを提供しています。<br />
<br />
===4.1 Running the job (ジョブを開始)===<br />
教師なし3次元分類は、[3D classification] ジョブタイプから、実行可能です。<br />
[I/O]タブの設定:<br />
Input images STAR file: Select/class2d_aftersort/particles.star<br />
Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
このマップはパイプラインの部分のように、Brouseボタンで表れないように述べる。両方のタイプは空のフィールドの中に名付けられるか、importジョブタイプをつかうマップの移入が行われる。対照的なC1を動作させたり、非対称的なInitialModel / job017 / run_it150_class.mrcを使いことを選択する。しかしながら、すでに右の対称的なセッティングは、後々とても楽になるだろう。Reference mask (optional):<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供するところです。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類へのバイアスを最小限にする働きがあります。)<br />
[Reference]タブの設定: <br />
Ref. map is on absolute greyscale: No<br />
(このマップがデータセットから再構築されたとき、すでに正しいグレースケールであります。RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
Initial low-pass filter (A): 50<br />
(精密化プロセスにバイアスが導入する可能性があるため、高解像度の初期参照モデルは使用してはいけません。[12]で説明したように、初期マップをできる限りフィルタリングする必要があります。リボソームでは大抵、70Åを使用し、小さい粒子では通常40〜60Åの値を使用します。)<br />
Symmetry: C1<br />
(このサンプルはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。良くない粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
Do CTF corection? Yes<br />
Has reference been CTF-correced? Yes<br />
(このモデルは、SGDのCTFコレクションによって作られている。)<br />
Have data been phase flipped? No<br />
Ignore CTFs untill first peak? No<br />
(リファレンスを作成するために使用した[2D classification]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
【Optimisation】タブの設定: <br />
Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。) <br />
Number of iterations: 25<br />
(これは一般的には変更する必要はありません。) <br />
Regularisation parameter T: 4<br />
(Tの定義については[13]を参照してください。クライオEMの、2次元分類では、通常、Tは1~2を設定し、3次元分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均にノイズが見える場合はTの値を低くし、逆にクラス平均の分解能が低すぎる場合はTの値を高くします。主に気をつけなければならない点は、高解像度のノイズの過学習です。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。) <br />
Mask individual particles with zeros? Yes<br />
(Yes: 0 / No: 乱数) <br />
Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過学習を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
【Helix】タブは無視して下さい。 <br />
以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。 <br />
ここでも、【Running】タブで、使用するNumber of MPI processors(MPIプロセッサの数)とthreads(スレッド数)を指定できます。[2D classification]のjobタイプで説明したように、3次元分類は2次元分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3次元分類を表示するためにfirst_exhaustiveのようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。 <br />
精密化された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を確認できます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。 <br />
UCSFキメラなどを使用し、表示されたマップを3Dで見ると、マップが精密化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。 <br />
2次元分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示ウィンドウには、4つの精密化されたモデルの中央スライスが表示されます。最適なクラスを選択し、右クリックメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
===4.2 Analysing the results in more detail (詳細な結果の解析)===<br />
ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。 <br />
出力ファイルは基本的に2次元分類の実行時と同じです。(実際に2次元,3次元精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2次元クラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。例えば、run_it025_class00?.mrcというMRCマップです。 <br />
今まで通り、小さいクラスは大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比(SNR)が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。 <br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnuplotがインストールされているのであれば、以下の通りに入力して下さい。 <br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。 <br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
==5 High-resolution 3D refinement(三次元精密化)==<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は分解能を推定するために、gold-standard Fourier Shell Correlation(FSC)(二つの群に分け、互いに独立して再構成した場合に、どの分解能まで相関があるかにより判断)と言われる判断基準を用います。これにより、過学習を避けることができます[15]。角度の割当の正確さを推定する新しい手順([14])と組み合わせ、精密化が収束するときに自動的に決定されます。そのため、この手順は使用者の入力をほとんど必要としません。すなわち、客観性をのこしたまま、多くのデータセットのための優れたマップが生成がされていると述べられています。もう一つの長所は、一般的にこの手順は必要な実行回数が一回のみであり、最適化のための引数はほとんどありません。<br />
しかしながら、前に高解像度の精密化を始めた時、スケール未満とともに選ばれた粒子の正しいセットを再度抽出して、それによりもしかすると高解像度になるかもしれない。これをすることで、GUIのParticle extraction のジョブタイプとI/Oタブを与える。<br />
micrograph STAR file : CtfFind / job003 / micrographs – ctf.star<br />
(そのままでよい)<br />
Coordinate – file suffix : <br />
(空でよい)<br />
OR re – extract refined particles ? Yes<br />
Refined particles STAR file : Select /class3d – first_exhausitive / particle.star<br />
(今、選択された粒子の微粒にされたサブセットだけをつかうだろう)<br />
Re – center refined coodinates ? Yes<br />
(3D classificationの動作以上から整列させたオフセットに従ってすべての粒子は再度中央に置かれるだろう)<br />
Recenter on – X , Y , Z (pix) 0.0.0<br />
(箱の真ん中の分子を中心にキープさせたい)<br />
Manually set pixel size ? No<br />
(入力したマイクログラフstarファイルはCTFの情報に含まれていないことが必要である。)<br />
Extractタブはすべてキープする。<br />
Particle box size (pix) 360<br />
(大きな箱をつかうだろう。それにより非局在化させたCTFシグナルはより良いモデルになるだろう。これはCTF精密化の後が大事である。)<br />
Rescale particles ? yes<br />
(とても大きな画像が働くことを防ぐことで、360×0.885/256 = 1.244 Åのピクセルサイズを減少させ、採取しましょう。これは、おそらく十分に小さいデータ、2.5 Åの大きな達成可能な解像度に制限があるだろう。)<br />
この動作では、エイリアスbest3dclass_bigboxを使用する。<br />
加えて、256ピクセルのボックスサイズに従って一番いいマップを入手したことのいたずらは必要である。<br />
relion_image_handler –i Class3D/job018/run_it025_class001.mrc –angpix 3.54 –rescale_angpix 1.244 –o Class3D/job018/run_it025_class001_box256.mrc –new_box256 ??????<br />
<br />
===5.1 Running the auto-refine job (自動精錬動作の実行)===<br />
3D auto-refine のジョブタイプのI/Oタブ<br />
Input images STAR file : Extract/best3dclass_fullsize/particles.star<br />
Reference map : Class3D / job018 / run_it025_class001_box256.mrc<br />
Reference mask (optional)<br />
(からのままでいい)<br />
Reference タブ<br />
Ref. map is on absolute gryscale ? No<br />
スケール現象の画像の違う標準化によると、正しく絶対的なグレースケールはマップの中に確立しなかった。このオプションの“No”は大事で、精密化の最初の相互作用のグレースケールは正しくなるだろう。<br />
Initial low-pass filter (A) 50<br />
マップの高い頻度の成分に向かってバイアスを防いだことは低いパスのフィルターから自動精密化され始める。それと解像度から完全に依存された粒子の“gold standard”の維持は、1頭文字より高かった。<br />
Symmetry D2<br />
(高解像度の粒子の照準は、強要された対称性の粒子の4倍効率的にするだろう)<br />
CTFのパラメータで、OpimisationとAuto-samplingタブは、3D classificationと同じでとどまる<br />
【Sampling】タブでの配向性のサンプリング間隔は反復の最初の数回のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング間隔が自動的に細かくなっていきます。したがって、8面体または正20面体対称よりも小さい角度で、全ての精密化仮定でで、一般的に大域探索では、初期値の角度である7.5度のサンプルを使用し、局所探索では1.8度のサンプルから行います。より正確な対称の精密化を行う場合のみ、3.7度でのサンプリングを行い、局所探索では0.9度ごとにサンプリングを行います。<br />
MPIのノードは1つのマスター(他のスレーブを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用するもの)のセットで分かれているので、奇数のMPI処理装置を使用するのが最も効率が良いです。ナイキスト周波数までのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。従って、使っているクラスターノードのコアと同じ数のスレッドで動かしたいデータセットのボックスより大きいサイズで作られたボックスが必要です。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
===5.2 Analysing the results (結果の分析)===<br />
出力ファイルは3D classificationを実行したときのものと大部分が同じです。しかし、全てにおけるプログラムの反復では、2つのrun_it0??_half?_model.starと2つのrun_it0??_half?_class001.mrcファイルを書き出します。それぞれデータの半分が精密化されます。収束した場合にのみ、ひとつのrun_model.starとrun_class001.mrcファイルを書き出します(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。 <br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[14]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルからも抽出されるかもしれません。 <br />
例えば、以下のように試してみてください。 <br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
==11 まとめ==<br />
<br />
===11.1 フローチャートの作成===<br />
<br />
どのようにして最終的な再構築をするか気になるでしょう。'''''Finished job'''''リストから実行した最後の動作を選択し、'''''Job actions'''''ボタンから'''Make flowchart'''オプションを試してください。これを実行するためにはシステムに'''LATEX'''や'''TikZ'''パッケージが必要となります。最初の項は正確な作業名のないフローチャートの全体像です。これは、出版目的に役立つでしょう(おそらくお気に入りの'''vector-based design'''プログラムの編集後に)。フローチャートの全体像の後に、最初の詳細なフローチャートにどのようにして終了するかが示されています。10ステップ以上からなるフローチャートは複数の構成要素に分けられることに注意してください。作業中に複数枝分かれすることがあるでしょう。それ故に、最終作業のフローチャートに従って、それぞれの分岐についてフローチャートがあるでしょう。リンクをクリックすることでPDFファイルから合致する位置を得ることができます。<br />
<br />
===11.2 ディレクトリのクリーンアップ===<br />
<br />
ディスクの空間を確保するために、RELIONは作業ディレクトリをクリーンアップするオプションを持っています。これには2つのモードがあります。'''''gentle'''''クリーンは作業ディレクトリから中間ファイルのみを削除します。'''''harsh'''''クリーンは作業からのインプットを必要とする新たな作業を開始するのに必要なファイルを削除します。例えば、'''''harsh'''''クリーンは'''Motion Corr'''作業から平均化された、あるいは'''Particle extraction'''作業から少量のスタックを抽出された顕微鏡写真を削除します。一方、'''''gentle'''''クリーンは'''2D classification''', '''3D classification'''あるいは'''3D auto-refine'''作業の中間反復からすべてのファイルを削除します。'''Job actions'''ボタンから個別に作業をクリーンアップすることができます。あるいは、GUIのトップメニューから下がった、'''''Jobs'''''からすべての作業をクリーンアップすることができます。私たちは計算前の結果に頭を悩ませていたプロジェクトディレクトリの'''tarball'''を作る前にそのメニューから'''''Gently clean all jobs'''''オプションを使いました。長期間保存されていたデータを取る前にプロジェクトディレクトリをクリーンアップしたいでしょう。<br />
<br />
===11.3 質問や引用===<br />
<br />
以上です!このチュートリアルを楽しんで、そして役に立つことを願います。もしRELIONについて質問があれば、初めに'''RELION Wiki'''の'''FAQ'''と'''CCPEMメーリングリスト'''を確認してください。それが助けにならなければ、'''CCPEMリスト'''を利用して質問してください。お願いですから、決してSjorsに直接メールを送信しないでください。質問全てに返答できるわけではありません。もしRELIONが利用者の研究に有益であると思ったら私たちの[http://www2.mrc-lmb.cam.ac.uk/groups/scheres/publications.html 論文]を引用し、あなたの研究仲間たちに伝えてください。<br />
<br />
===11.4 参考文献===<br />
<br />
RELIONの手順の改善を支持した理論の詳細は以下の論文で述べられています。<br />
* S.H.W. Scheres (2012) “''RELION: Implementation of a Bayesian approach to cryo-EM structure determination''” J. Struc. Biol., 180, 519-530.<br />
<br />
*S.H.W. Scheres (2012) “''A Bayesian view on cryo-EM structure determination''” J. Mol. Biol., 415, 406-418.<br />
<br />
RELIONの使い方に関する包括的な概観は以下の論文に述べられています。<br />
<br />
*S.H.W. Scheres (2016) “''Processing of structurally heterogeneous cryo-EM data in RELION''” Meth. Enzym., 579, 125-157.<br />
<br />
<br />
==12 付録 A:インストールの注意==<br />
<br />
===12.1 MPIのインストール===<br />
<br />
'''MPI(message passing interface)'''がインストールされた計算機クラスター、もしくはNVIDIA GPU搭載のマルチコアデスクトップマシンが必要になることに注意してください。RELIONをコンパイルするには、'''mpi-devel'''パッケージが必要です。おそらく存在する種類'''(MPICH, LAM-MPI, etc)'''またはバージョンはそれほど重要ではありません。まだシステム内に'''mpi-devel'''をインストールしてなければ、'''openMPI'''をインストールすることをお勧めします。<br />
<br />
===12.2 CUDAのインストール===<br />
<br />
'''NVIDIA'''の比較的新しいGPU('''compute capability 3.5+'''以上)を持っている場合、オートピッキング、分類、精密化作業を高速に実行できます。'''GPU-accelerationサポート'''を含むRELIONをコンパイルするには、'''CUDA'''をインストールする必要があります。このチュートリアルの準備には'''CUDA-8.0'''を使用しました。[https://developer.nvidia.com/cuda-downloads NVIDIAのWebサイト]からダウンロードしてください。<br />
<br />
===12.3 RELIONのインストール===<br />
<br />
RELIONはオープンソースのソフトウェアです。[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Download_%26_install the RELION wiki]から無料でダウンロードして、手順に従ってインストールしてください。もし、'''job submission system(Sun Grid EngineやPBS/TORQUE etc)'''に詳しくない場合は、インストール手順の説明にあるように、'''qsub.cshスクリプト'''の設定に関して、システム管理者にお尋ねください。分散メモリ並列化のためのMPIと、共用メモリの並列化のための'''pthreads'''の両方を使用する、いわゆるハイブリッド並列計算を実行したいときは注意してください。ジョブキューイングシステムはこれを可能とするためにいくつかの調整が必要な場合があります。再度、システム管理者にお尋ねください。<br />
<br />
===12.4 モーション補正ソフトウェアのインストール===<br />
<br />
RELION-3.0は全フレーム顕微鏡写真ムービーアライメントに使用される、'''UCSFプログラムMOTIONCOR2'''へのラッパーを提供します。[http://www.msg.ucsf.edu/agard/protocols.html Dabid Agard]のページからプログラムをダウンロードし、インストールの手順に従ってください。また、RELIONの保有する、'''MOTIONCOR2'''の実行を使うかもしれません。なので、もし、UCSF実行をインストールするのに問題が発生しても心配しないでください。バージョン3.0において、'''''Nico grigorieff’s group'''''から'''UNBLUR'''へのラッパーはGUIから中止されていることに注意してください。<br />
<br />
===12.5 CTF推定ソフトウェアのインストール===<br />
<br />
CTF推定はRELIONに含まれていません。代わりに、RELIONは'''''Alexis RohouやNiko Grigorieff’s CTFFIND4'''''へのラッパーを提供します。[http://grigoriefflab.janelia.org/datadownload Niko’s CTFFIND website]からダウンロードし、手順に従ってインストールしてください。また、もし、パソコンに'''NVIDIA graphics card(GPU)'''が入っているなら'''''Kai Zhang’s GCTF'''''を使うこともできます。その際は、LMBに関する[https://www.mrc-lmb.cam.ac.uk/kzhang/ KaiのWebサイト]からダウンロードしてください。<br />
<br />
===12.6 RESMAPのインストール===<br />
<br />
局所分解能推定はRELIONが所有するポストプロセッシングプログラムの中、あるいは'''''Alp KucukelbirのRESMAP'''''へのラッパーを通して実行される。[http://www.proditus.com/software.html AlpのRESMAP Webサイト]からダウンロードし、手順に従ってインストールしてください。<br />
<br />
<br />
<br />
<br />
== 13 付録B:RELIONの利用 ==<br />
=== 13.1 GUIについて ===<br />
<br />
==== 13.1.1 pipeline approach ====<br />
RELION-3.0では、一つのプログラムの出力を次のプログラムの入力として順次繋いでいくような情報の受け渡し(パイプライン)を円滑に実現できるようなGUIを設計しました。詳細は2016 Proceedings of the CCP-EM Spring Symposium[3]で公開されています。<br />
RELION-3.0を使うにあたって、まずプロジェクト(すなわち構造決定したい分子)ごとにディレクトリを作成することを推奨します。ここではこのディレクトリの呼称をプロジェクトディレクトリとします。RELIONのGUIは「relion」とコマンドを打つことで起動させることができますが、この動作は常にプロジェクトディレクトリに移動してから行うことを念頭に置いてください。<br />
<br />
このソフトのGUIでは、すべてのジョブや、あるジョブによる出力がどのように他のジョブの入力に使われたのかといった履歴を保存することができ、この機能によってパイプラインが形成されます。各種ジョブにはそれぞれ独自の出力ディレクトリが与えられます。ここではたとえば あるジョブの出力のためにClass2D/ というディレクトリができるとします。こういったジョブディレクトリの中でさらに新しいジョブが実行されると、その新しいジョブには一連の番号が与えられます。たとえばClass2Dのもとで作られたとあるジョブにはClass2D/job010という番号が振り分けられます。さらに、ジョブディレクトリのもとでは、Class2D/job010/run といったように出力名が定められます。このソフトでは、各ジョブに意味のある名前が付けられるような仕組みを備えるために、ファイルシステム上の個々のジョブディレクトリへの記号リンクとして実装された"エイリアス"システムを使用しています。<br />
パイプラインに関するすべての情報はdefault_pipeline.starという名前のファイルに保存されていますが、基本的にはこのファイルを見る必要はありません。もしdefault_pipeline.starファイルが壊れてしまった場合は、最後に実行したジョブディレクトリで保存されたバックアップから復元することができます。<br />
<br />
==== 13.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
このソフトのGUIは上半分と下半分に分かれています。上半分の左側にはジョブの種類が縦リスト上に並べられており、行いたいジョブを選ぶことができます。たとえば2D classificationを行いたいときは、上半分の左側のブラウザで選択すればいいわけです。上半分の右側には複数のタブがあるパネルがあり、それぞれのジョブタイプへのパラメータを入力できます。GUIの左上には機能のおおよその概要が分かる3つのメニューが書かれています。<br />
【Schedule】ボタンでは、後でジョブを実行するときのスケジューリングを行うことができます。それに対して【Run now!】ボタンは今すぐに実行したいときに使います。【Schedule】ボタンは、繰り返し実行できるよう完全自動化された「パイプライン」を用意したいときに役立ちます。たとえば、データが収集されていくにつれてそれが瞬時に反映できるようなパイプラインを実現したいときに有効です。詳細は13.3を参照してください。<br />
GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 13.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中のジョブ(【Running jobs】)、すでに完了しているジョブ(【Finished jobs】)、または後で実行するようにスケジュールされたジョブ(【Scheduled jobs】)のリストがあります。これらのリスト内のジョブをクリックすると、そのジョブのパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリが作成されることはありませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】のジョブでは、_optimiser.starというファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。【モーション補正】、【CTF推定】、【自動ピッキング】、【粒子抽出】は、これまでに行われていなかった顕微鏡写真でのみ実行されます。【Input to this job】(このjobへの入力)と【Output from this job】(このjobからの出力)は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(stdout)と標準エラー出力(stderr)がそれぞれ黒と赤のテキストで表示されます。標準エラー出力は理想的には何もない状態でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、スクロールがしやすくなるようテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 13.1.4 The Display button(ディスプレイボタン) ====<br />
runボタンとscheduleボタンの下にある【Display:】ボタンでは、各ジョブにおける最重要たる入力ファイルと出力ファイルを視覚的に表示することができます。GUIの下半分にあるjobリストのうちのひとつのjobを選択した後に【Display:】ボタンをクリックすると、選択されたjobの入力と出力がすべて(例えば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。中間体のファイルを表示するといったような一般的な機能はGUI左上の3つのメニューのうちFile>Displayを選択することで使うことができます。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第11章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(13.1.6参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
ジョブを削除すると、ジョブディレクトリ全体がプロジェクトディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、ジョブを復元することができます。<br />
<br />
ディスク容量を節約するため、ジョブを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。これには2つのクリーニングオプションがあり、片方は【gentle clean】という方法です。この方法では、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は【harsh clean】という完全なクリーニング方法です。この方法では全てのファイルを消すことになるため、より多くの容量を確保できます。その中でも【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のジョブタイプから選択できる粒子スタック、または顕微鏡写真を含むディレクトリに関しては、とりわけ多くの容量を確保できます。<br />
<br />
また、RELIONの左上にある【job】メニューの対応するオプション(【Gently clean all jobs】あるいは、【Harshly clean all jobs】)を使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。 その際、特定のディレクトリを削除対象から除外したい場合には、NO_HARSH_CLEANというファイルをその中に置いてください。<br />
<br />
例えば、保護したい粒子データがjob098にある場合、次のコマンドを実行してください。<br />
<br />
$ touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
※ touchコマンドは、指定したファイルが存在しない場合には空のファイルを作成するプログラムです。存在している場合には、ファイルの修正時刻を変更します。</div>
Nakamu