https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/api.php?action=feedcontributions&user=Fisherman1&feedformat=atom
Eospedia - 利用者の投稿記録 [ja]
2024-03-28T14:56:37Z
利用者の投稿記録
MediaWiki 1.23.6
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-28T11:51:16Z
<p>Fisherman1: /* 9.2 Movie refinement(動画修正) */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjobリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ「2D classification」を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違い、RELION-2.0では【Display:】ボタンで適切なクラスを選択することができません。これは[Subset selection]jobタイプ上で行われます。Select classes from model.starと書かれた行の横にある【Browse】ボタンを利用して、【I/O】タブ上のClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2次元クラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。センタリングされたテンプレートが自動検出中に必要となる一方で、2D classification実行時ではクラス平均はセンタリングされないかもしれないので、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
これは、スペクトルノイズ強度とスケールファクターの推定が不安定なことで、それぞれの電子顕微鏡写真にある粒子が非常に少ない場合に便利なオプションです。デフォルトでは、スケールファクターの推定は顕微鏡写真ごとにそれぞれ計算されます。このオプションは計算実行時、複数の顕微鏡写真の粒子を一緒に計算してグループ化することが可能です。RELIONはクラス分類や自動精密化実行の際にグループがとても小さくなっている場合に警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionカラムに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子のクラス平均を4〜6つ選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
[Auto-picking]jobタイプにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての顕微鏡写真で自動検出を実行する前に、【autopicking】タブ上でPicking threshold、Minimum inter-particle distance、Maximum stddev noise、3つのメインパラメーターを最適化する必要があります。これは時間節約のために、数枚の顕微鏡写真でのみ行われます。<br />
<br />
そのため、2〜3つの顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。[Subset selection]jobタイプで行うには2つの方法があります。OR select from picked coords: の行からManualPick/job004/coords_suffix_manualpick.starを選択、その後左の選択ボックスを使用して2枚の顕微鏡写真のみを選択できます。メニューオプションのInvert selectionでこの作業が便利になるかもしれないということを覚えておいてください。2〜4つの適切な顕微鏡写真を選択したとき、例えばデフォーカスの大きさや氷の厚さはメニューからSave selectionを選択することを忘れないでください。もう1つの方法は、[Subset selection]jobタイプの【I/O】タブからOR select from micrographs.star: の行からCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択し、右クリックメニューからSave STAR with selected imagesを選択して下さい。どんなオプションを選んでも、Select jobへの2mics4autopickのようなエイリアスは意味があるのでしょうか?<br />
<br />
[Auto-picking]jobタイプの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
("Einsteinfrom-noise"の結果を得るために、データから得ようとしている最終的な解像度よりも大幅に低いローパスフィルターを使用することは非常に重要です)<br />
● Highpass filter (A): -1<br />
(たとえば200などの正の値を渡した場合、リファレンスは顕微鏡写真はautopickingよりも高いハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(負の値を渡した場合、入力した顕微鏡写真と同じスケールであると認識します。そうでない場合、例えば粒子を抜き出す上でのリファレンスを作るために使用される粒子をリスケールしたため、正しいピクセルサイズの正の値をここのリファレンスに追加します。)<br />
● Mask diameter (A): 200<br />
([2D classification] jobタイプのときに使った値と同じ値が使えます)<br />
● Angular sampling (deg): 5<br />
(この値はどんな場合でもほとんど正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒いので、使用するリファレンスは白を利用します)<br />
● Are References CTF corrected? Yes<br />
(CTF補正で2Dクラス平均を行ったため)<br />
● Ignore CTFs until first peak: No<br />
([2D classification]jobでもリファレンス作製のために使用した場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeak-searchアルゴリズムのためのFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは、隣接する2つの粒子間の最大許容距離です。反復的クラスタリングアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素領域や非常に汚染されてる特徴が見て取れる領域のピッキングを防止するのに有効です。標準化された顕微鏡写真のバックグラウンド標準偏差がこの値より高い領域のピークは無視される。効果的な値は1.0から1.2の範囲であることが多いです。バックグラウンド標準偏差が高いため、ピークを除去するためにこの機能をオフにするには値を-1にして下さい。)<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動ピッキングアルゴリズムは顕微鏡写真をリファレンスにおいてのローパスフィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の間の値は顕微鏡写真のサイズの画分の結果になります。これはshrink=1(縮小しない)にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(適切なGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。複数のMPI-processorsを使う場合(そうでない場合も)は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して【Running】タブでひとつのMPI processorを使って動かして下さい。おそらくoptimise_paramsのようなエイリアスが有効かもしれません。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真とリファレンスごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環するリファレンスと全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を利用したより高速なpeak-detectionアルゴリズムに従っています。これらのパラメータは最適化する必要があるため、プログラムは【References】タブで指定されているようにいわゆるFOMマップを作成します。これらはリファレンスごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(従って上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より高速に検出するパラメータになるように最適化するために使用されます。最初に、動作させ終えたばかりのjobで【Display:】ボタンから coords_sufix_autopick オプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウは、最後に実行した[Manual picking]jobのパラメーター(サイズやシグマコントラストなど)を利用することに注意しておいて下さい。実際に[Manual picking]jobタイプでこれらのパラメーターを変更でき、左上の jobs メニューから Save job settings オプションで設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjobを実行すると、以前と同じように【pick】と【CTF】ボタンを持つ同様のGUIが生成されます。表示ウィンドウから両方の顕微鏡写真を開き、粒子をより多くか、少なく検出するか(すなわち、しきい値を小さくするか大きくするか)と、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)を決定します。それぞれの粒子は赤(低いFOM値)から青(高いFOM値)に色付けされることに注意して下さい。次のステップに進む間に、両方の顕微鏡写真の表示ウィンドウを開いたままにすることができます。<br />
<br />
[Finished jobs]から、AutoPick/optimise_params jobを選択して下さい。そして【autopicking】タブ上でパラメーターを変更して下さい。次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した時、全てのFOMの再計算の代わりに、以前書きだされたFOMマップをディスクから再読み込みします。新しい座標のその後の計算は、数秒で実行されます。以降は、新しい座標セットを読み込むために、顕微鏡写真の表示ウィンドウ上で右クリックメニューから Reload coordinates を選択して下さい。この方法は2つのパラメーターを手早く最適化できます。<br />
<br />
3つのパラメータをすべて使いこなして、検出結果をどのように変更するかを確認してください。すべての顕微鏡写真の自動検出に使用するパラメータがわかったら、GUIの左上にあるbrowser jobタイプの[Auto-picking]オプションをクリックして、【Run now!】ボタンで選択します。【I/O】タブ上で、入力した顕微鏡写真のSTARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初の[CTF estunatuib]jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは並列に(FOMマップが書き出せされてないのであれば)実行されるかもしれません。【Running】タブで、自動検出を実行するコアの数を指定します。MPIプロセッサの最大有効数は、入力したSTARファイルの顕微鏡写真の数となります。<br />
<br />
FOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあることに注意して下さい。FOMマップを読み込みまたは書き出し、【Continue now】ボタンをクリックすることで、プログラムは(一般的には少数の)全ての入力した顕微鏡写真を再度検出します。しかし、FOMマップの読み込みまたは書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これはスケジュール化されたjobの反復にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。また、詳細は2.3のセクションを見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけ動作させる代わりとして)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上で[Auto-picking]をクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopick オプションをクリックすることで、結果を再確認することができます。手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好む方もいます。たとえば、顕微鏡写真上の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使って粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい。<br />
<br />
ひとたび全部の結果を満たしたすと、ディスクスペースを確保するために、最初のステップで書き出したFOMマップを削除したくなるかもしれません。手軽に行うために【Job actions】ボタンから、Gentle clean オプションを使うことができます。<br />
<br />
ひとたび座標全体セットを満たしたら、以前のデータを全て保ちつつ、[Partcle extraction]jobを再実行する必要がありますが、Input coordinatesを自動検出で新しく生成されたものに変えて下さい。これは下記のよりよい精密のために使われる初期シングル粒子データセットを作成します。おそらく、allmics_autopicked のようなエイリアスが有意義です。<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために、RELIOM-2.0では、コマンドライン引数 --shrink を通して顕微鏡写真をフィルタリングするオプションを実装しています。最もシンプルな使い方は --shrink 0 と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrink の初期状態の値は1.0ですが、これは効果がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 では、顕微鏡写真をテンプレートリファレンスのローパスと同じように、--lowpass までpassさせる結果になります。これはシングル粒子解析(らせん状検出のためではないが)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 では、size= val ·micrograph size にした結果になります(valとは顕微鏡写真のオリジナルサイズを適用させたスケールファクターです)。<br />
<br />
● --shrink val > 1 では、size = val − (val mod 2)、すなわち、valより小さい最小の偶数の整数値になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、致命的ではありませんが警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズもFFT計算の大きな落とし穴を避けるために自動的に調整されるようになりました。これの注釈と上書きの仕方は、ユーザーが実行する各自動検出の最初の出力に表示されます。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには、各粒子とそれらの調節されたCTF修正リファレンスとの間の差異に基づいて粒子を素早く分類する機能もあります。ソートプログラムは[Particle sorting]jobタイプからアクセスすることができ、それぞれの粒子でリファレンスが利用できるときであれば、いつでも動かせます。たとえば、[Auto-picking]、[2D classification]、[3D classificationo]、[3D auto-refaine]の後などです。その使用方法を示すために、自動検出の後に実行します。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後に抽出プログラムによって生成されます。[2D classification]、[3D classification]または、[3D auto-refine]jobの場合は、最後の反復での_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が [2D classification]、[3D classification]、[3D auto-refine]job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(抽出された粒子のための座標を与える自動検出jobに使われたリファレンスを入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリに particles_sort.star と呼ばれる入力ファイルと同じファイルを生成しますが、rlnPartileSelectZScore と呼ばれるコラムの追加があります。[Subset selection]jobタイプの OR select from particles.star とある行で、このファイルを選択することが出来ます。ポップアップ表示ウィンドウ内にて、その新しいコラムに基づいて粒子を可視化できます。ディスプレイの上に良い粒子、下に良くない粒子をもつために強度の傾向が出てきます。下から上にスクロールして、下のすべての粒子を破棄する必要があるポイントを決定でき、右マウスメニューを使用して Select all above および、または1つずつ粒子を選択することができます。右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは異なる成分です。問題は どのくらい寛容でいられるかです。RELIONの3Dマルチリファレンス精密手順は強力な教師無し3次元分類へのアプローチを提供しています。しかし、まずは低解像度の単一コンセンサスモデルが必要です。初期の結晶構造(PDB-ID 3I3E)から生成された低分解能のベータガラクトシダーゼモデルを使用します。これはすでに projectディレクトリの中に 3i3e_lp50A.mrcという名前で入っています。典型的なプロジェクトでは、良い初期モデルがないかもしれません。その場合は違うプログラムから別のモデルを持ってくる必要があります。その場合は、RELIONと同じように別のプログラムで生成する必要がありますが、初期モデル生成は行いません。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handlerというプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使用)とボックスサイズ(--new_box)を変更してもかまいません。<br />
<br />
この場合、[Import]jobタイプを使用し、直接プロジェクトに初期モデルをインポート出来ます。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使います。<br />
<br />
=== 5.1 Running the job===<br />
<br />
教師無し3次元分類は、[3D classification]jobタイプから実行可能です。<br />
<br />
<br />
【I/O】タブの設定:<br />
● Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
● Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
● Reference mask (optional):<br />
<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供した場所だとします。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類へのバイアスを最小限にする働きがあります。)<br />
<br />
<br />
【Reference】タブの設定:<br />
● Ref. map is on absolute greyscale: No<br />
(RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
<br />
● Initial low-pass filter (A): 50<br />
(精密化プロセスにバイアスが導入する可能性があるため、高解像度の開始モデルは使用してはいけません。[9]で説明したように、初期マップをできる限りフィルタリングする必要があります。リボソームでは大抵、70Åを使用し、小さい粒子では通常40〜60Åの値を使用します。)<br />
<br />
● Symmetry: C1<br />
(このサンプルはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。良くない粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
<br />
【CTF】タブの設定:<br />
● Do CTF corection? Yes<br />
<br />
● Has reference been CTF-correced? Yes<br />
<br />
(このモデルはPDBファイルで作成されているため、振幅はCTFの影響を受けていません。これは"CTF修正済み"とみなすことができます。ほとんどの他のEMパッケージから作られたモデルは、適切な低周波振幅補正を実行するパッケージが多くないため、ほとんどの場合CTF補正されていないことが多いです。(いくつかは補正されているかもしれません:したがって、モデルを通ってスライスをチェックすることができます。もし白黒で見えるならば、モデルはおそらく適切にCTF修正されたものでしょう;また、ブラックハローとグレイアッシュに見えるのであればそのモデルはおそらくCTF補正されていないでしょう。)これまでRELIONでCTF補正を行ったモデルは、適切に補正されています。)<br />
<br />
● Have data been phase flipped? No<br />
<br />
● Ignore CTFs untill first peak? No<br />
(リファレンスを作成するために使用した[2D classification]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
<br />
<br />
【Optimisation】タブの設定:<br />
● Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。)<br />
<br />
● Number of iterations: 25<br />
(これは一般的には変更する必要はありません。)<br />
<br />
● Regularisation parameter T: 4<br />
(Tの定義については[10]を参照してください。低温EM2次元分類では、通常、Tは1~2を設定し、3次元分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均にノイズが見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズの過剰適合を認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
<br />
● Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。)<br />
<br />
● Mask individual particles with zeros? Yes<br />
<br />
● Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体ウイルスのような大型で高い対称性をもつ粒子の場合のみ、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブは無視し、以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用するNumber of MPI processors(MPIプロセッサの数)とthreads(スレッド数)を指定できます。[2D classification]のjobタイプで説明したように、3次元分類は2次元分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3次元分類を表示するためにfirst_exhaustiveのようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
精密化された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与えます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。<br />
<br />
UCSFキメラなどを使用し、表示されたマップを3Dで見ると、マップが精密化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2次元分類の場合と同様に、[Subset selection]を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示ウィンドウには、4つの精密化されたモデルの中央スライスが表示されます。最適なクラスを選択し、右クリックメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2次元分類の実行時と同じです。(実際に2次元,3次元精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2次元クラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。例えば、run_it025_class00?.mrcというMRCマップです。<br />
<br />
今まで通り、小さいクラスは大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnplotがインストールされているのであれば、以下の通りに入力して下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は解像度を推定するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己高揚による過剰適合を避けることができます[13]。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで[3D auto-refine]jobタイプを選択してください。GUIでの入力引数は大部分は[3D classification]jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプリング率は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング率が自動的に増加されます。したがって、8面体または正20面体対称よりも小さい全ての精密化では、一般的に初期値の角度である7.5度のサンプルを使用し、部分的な調査では1.8度のサンプルから行います。より正確な対称の精密化を行うためにのみ、3.7度でのサンプリングを行い、部分的な調査では0.9度ごとにサンプリングを行います。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精密化は、[Post-processing]jobタイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作では【I/O】タブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。他にも、伸長された分子や、マスクを使用し、小さい部分の精密化に注目した時などに役立ちます。このような場合、マスクが使用されていない代表的なFSCは精密化の際の解像度が低く見積もられます。精密化を行っている最中であるため、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、[3D classification]実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精密化されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらく違いがほとんどありません。さらに、マップ内で高周波の精密化へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精密な”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精密化で2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、奇数のMPI処理装置のを使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。一点に収束した場合にのみ、run_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。<br />
<br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。<br />
<br />
例えば、以下のように試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3D自動精密化の実行後、マップをシャープに必要があります。それも、自動精密化物の内部の至適基準FSCカーブはマスク化されていないマップのみ使います(Use solvent-flattened FSCsオプションを使っていない場合に限ります)。これは実際の精密化中に、実際の解像度は概算値を下回っているということを意味しています。なぜなら、溶媒領域のノイズがFSCカーブよりも低くなるからです。RELIONにおけるBファクターでの鮮明化と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、タンパク質の末端と溶媒領域の開始点を精密化するためのマスクを作る必要があります。これは[Mask Creation]ジョブタイプを使って行います。<br />
<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3D自動精密化が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。【Mask】タブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶媒マスクのために良い選択と思われます)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われます)<br />
● Initial binarisation threshold: 0.02<br />
(これは例としてタンパク質領域の外側にノイズスポットが完全になく表示するキメラのように、ローパスフィルターのかかったマップの描写でのしきい値となります。適切なスポットを見つけるために、しきい値を上げたり下げたりしてみて下さい。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54オプションを付与させてrelion_image_handlerと呼ばれるコマンドラインプログラムを使用できることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりです)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値は白黒画像マスクを生成するのに使われます。このマップ中のホワイト値は全方向の多くのピクセルで増加します。これを使用して、最初のバイナリマスクのサイズを小さくします。)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスクに余弦形状のソフトエッジを配置します。これは、とても鋭いマスクにかなり繊細である可能性があるFSCカーブに、マスクが及ぼす影響を計測する補正手順として重要です。マスクの生成は相対的に早いので、しばしば解像度の最も適した概算を得るためのマスクパラメーターと共に使います。)<br />
<br />
【Helix】タブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通した切片を見たり、UCSFキメラにマスクを読み込ませることができます。後者は、マスクが構造全体をカプセル化するが、マスク内に多くの溶媒を残さないことを確認するために、自動精密手順のマップと一緒に良いアイデアになるかもしれません。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing]jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%異なっていたということがわかることがあります。RELION内では、この時までになしたもの全ては、まだ一貫しています。そのためマップの再精密化や、データのクラスの再分類をする必要はありません。正確なマップと最終解像度の推定のために必要なことが、ここに正しいピクセルサイズを提供することです。)<br />
<br />
【Sharpen】タブで以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、自身のディテクターのために、プロジェクトディレクトリの中に保存されている mtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
● Estimate B-factor automatically: Yes<br />
この手順は本誌[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要があります。もしマップの解像度が10Åに満たない場合、独自の “ad-hoc” Bファクターを代わりに使う必要があるかもしれません。<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
● Use your own B-factor? No<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションはときに、全体のマップ解像度を超えるような解像度へと拡張するマップ範囲を解析するのに便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3dref のようなエイリアスを使用して下さい。【Display】ボタンを使って、後処理されるマップと、この構造のFSCカーブとGuinierプロットを含んだPDFを通して、スライズを表示します。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D自動精密化の手順となる収束したマップでの全てのα-へリックスの場所を簡単に見ることが出来ます。解像度の推定は、以前に発表された[2]のフェイズランダムの手順に基づいてます。フェイズランダムマップのFSC(赤いカーブ)が、多かれ少なかれ、推定していた後処理マップの解像度のゼロ点であることを確認してください。そうでない場合は、マスクが鮮明すぎるか、細部の描写が多すぎます。この場合は。強いローパスフィルターや、以前の[Mask creation]ステップでの、より広く、より薄いマスクを使用し、後処理を繰り返して下さい。実際に少し薄いマスクを作りたくなるかもしれないので、その場合はエッジがだいたい5ピクセルになるように試してみてください。このために【Continue now】ボタンを使った場合、以前の結果が上書きされます。左側にあるjobタイプブラウザをクリックし、【Run now!】ボタンで新しい出力ディレクトリが出来ます。<br />
<br />
== 8 Local-resolution estimate(ローカル解像度推定) ==<br />
定例処理プログラムから解像度の推定は広域的な推定となります。しかしながら、シングルナンバーは高分子複合体の再構築でしばしば観測される解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する効果的なプログラムを記述しています[4]。RELION は、[Local resolution]jobタイプを通してプログラムのラッパーを実装しています。【I/O】タブ上で以下のように設定してください。<br />
<br />
● One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size: 3.54<br />
<br />
(正しいピクセルサイズであると考えたモデルを構築し始めたときに、実際には数パーセントずれていたことがわかることがあります。RELION内では、この時点までの全てが一貫しています。そのため、再度、マップの精密化とデータの分類をする必要はありません。正確なマップと最終的な解像度推定のために正しいピクセルサイズをここで指定するだけで良いです。)<br />
<br />
【ResMap】タブ上で以下のように設定してください。<br />
<br />
● ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(RESMAP実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
● P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
● Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7Åです)<br />
<br />
● Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
● Resolution step size (A): 0.5<br />
<br />
(ステップ数を増やせば、より正確なローカル解像度マップの結果が導き出せますが、更に実行時間は長くなります。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAPのGUIからフィルターボタンを利用して下さい。しかしながら、RELION上で生成されたマップに変更を加える必要がないことにしばしば気がつくでしょう。RESMAPプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、volume data valueで選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズ(閲覧)するために使われます。特別な場合では、データが低解像度処理され、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル解像度の変化は見るために良いというわけではありません。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択して[Import]という機能を使って動画を取り込んでください。<br />
<br />
また、後で動画-粒子正規化において、元の顕微鏡写真のそれぞれが対応する動画の平均であると仮定されます。 これがあなた自身のデータではない場合、画像処理手順全体を開始する前に、プログラムrelion_image_handlerを使用して任意の数のムービーフレームからの平均顕微鏡写真を計算することができます。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
[Movie refinemen]という機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させる、この二つの処理を組み合わせて行います。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file: MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
(これらの映画のファイル名は_movie.mrcsで終わるためです。)<br />
<br />
• Continue 3D auto-refine from: Refine3D/after first class3d/run it020 optimiser.star<br />
<br />
([3D auto-refine]を実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。)<br />
<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
(少なくとも平均フレームで、約1 electron/Å2線量を持っているためこの値を調節します。各ムービーフレームで0.5-1 electron/Å2線量未満であれば1よりも高い値を使用します。)<br />
<br />
• Maximum number of MPI nodes: 8<br />
(このjobの第一ステップでは、動画粒子の抽出はI/Oディスク上で非常に集中します。<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。我々のクラスタでは、8がいいでしょう。)<br />
• Particle box suze (pix): 100<br />
([Particle extraction]jobで以前使用したサイズと同じか確認してください。)<br />
<br />
• Invert contrast? Yes <br />
([Particle extraction]jobの時と同じものを使用してください)<br />
<br />
• Rescale particles? No<br />
([Particle extraction]jobの時と同じものを使用してください)<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
([Particle extraction]jobの時と同じものを使用してください)<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
(最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。リボソームのような大きな分子では、実行するためには3-5 electron/Å2線量程あれば十分でしょう。)<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
(これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。)<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを【Runnning】タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
<br />
このjobから出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、【Continue now】ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing(粒子の洗練) ===<br />
粒子のpolishingアルゴリズムは、MovieRefine/first3dref/run_avg7_off1_data.star から(おそらく非常にノイズの多い)移動軌跡(movement tracks)を取得し、それを利用して直線になるように適合させます。これらのトラックのノイズを更に減らすために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観測も利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の(ピクセルの)標準偏差は、ユーザによって決まります。第2のステップでは、polishingアルゴリズムは、Bファクターおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線ダメージは、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対ノイズ比が増加するので、"polished"または"shiny"だと言われます。<br />
<br />
[Particle polishing]jobタイプの【I/O】タブにて以下のようにして下さい<br />
●Input STAR file with aligned movies: MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子がより大きければ、ムービーの精密化からの移動軌跡の騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセルくらいをよく使用します。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単にコンピューターリソースを節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、シングルフレームの再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 Bファクターの形状を信頼して推定するために適切な高解像度を得られない再構成があれば、このオプションを使用して3、5ムービーフレーム7つを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、[Particle extraction]jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
【Helix】タブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えるでしょう。このjobの最大使用MPIプロセッサ数は、データのムービーフレーム数の二倍です。粒子ボックスが比較的大きい場合、メモリの要求は重要ですが、通常は3D自動精密化最後の反復実行時よりは大きくありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線ダメージの計量のBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と共に、そして動作軌跡と線形フィットはすべて、【Display】ボタンから開けるPolish/first3dref/logfile.pdf という大きなPDFファイルにあります。<br />
<br />
私たちはサンプルが大きく動く最初の1-2フレームではしばしば比較的大きな負のBファクタを観測し、その後に放射線ダメージが入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
何らかの形で推定されたBファクタまたはスケールファクタが奇妙に見える場合、Guinierプロットを通じて線形フィットを調べることができます。時には、Guinierプロットは、【Damage】タブに入力された全周波数領域にわたって直線でよくフィットすることができません。その後、異なるパラメータでjobを再実行する価値があります。また、シングルフレームの再構成が上記の20Åの周波数を超えて拡張されない場合、ラインにフィットせず、(推定されたB因子についてNaNを与える)プログラムは動作しません。そのような場合、Bファクタの計量をスキップするか、または同じタブの Average frames B-factor estimation: 1 を使用して複数のフレームを平均することを選択します。【Display】ボタンから出力された研磨粒子(shiny.star)を使ってSTARファイルを視覚化して、すべてが正しく行われていることを確認することは、おそらく悪い考えではありません。<br />
<br />
何らかの形で研磨結果に満足していない場合は、【Continue run】ボタンを使用して計算の一部を繰り返すことができます。 それをクリックすると、プログラムは次のファイルを探し、そこにあればその計算ステップをスキップして次のステップに移ります:<br />
<br />
●frame0??_half?_class001_unfil.mrc (これらの地図のいずれかが欠落している場合は、再計算されます。それらが既に存在する場合、それらの再構成計算はスキップされる。Average frames B-factor estimation オプションを変更した場合は、すべての再構成を再計算すべきです。その場合は、古いものを続けるのではなく、新しいjobを開始する方が良いでしょう。あるいは、既存のフレームの再構築をすべて取り除く必要があります。)<br />
<br />
●bfactors.star (このファイルが見つからない場合、プログラムは既存のすべてのフレーム再構成を読み込み、BファクタとスケールファクタをGuinierプロットを通して線形フィットするかどうか決定します。 したがって、たとえば【Damage】タブでフィットした解像度範囲を変更したが、Average frames B-factor estimation を変更しなかった場合、既存のbfactors.starファイルを削除すると非常に便利なので、新しいBファクタとスケールファクタが計算されますが、すべてのマップをもう再構築する必要はありません。 これはとても高速に進むでしょう。)<br />
<br />
●shiny.star (このファイルがない場合、既存の bfactors.starファイルが読み込まれ、光沢のある粒子はこれらのパラメータに従って再計量されます。 たとえば、以前に決定されたBファクタとスケールファクタのプロットに滑らかな曲線をフィットさせることを決定し、既存の bfactors.starファイルを新しくフィットしたものに置き換えた場合など、これは非常に便利です。 この場合、プログラムは光沢のある粒子のみを再作成します。)<br />
<br />
=== 9.4 Re-refine the polished particles(磨かれた粒子の精密化) ===<br />
shiny.starの磨かれた粒子は、元のものと比べてシグナル対ノイズ比が向上しています。 これは、さらに分類分けするときに役立ちます。 この時点での異なる分類分けの戦略の詳細な説明については、Methods in Enzymology [12]の最新の章を参照してください。 この章はまだオンラインでは入手できないため、以下コマンドで初期の資料をダウンロードできます。<br />
<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relionreview2016.pdf<br />
<br />
自身の研磨からの再構成は、より高い解像度マップをもたらす「確率加重 angular assignment(角度の割り当て) 」の実行の代わりに、最も可能性の高い方向に各粒子を配置するので、少なくとも、研磨された粒子を使用して最終的な[3D auto-refine]を実行します。 したがって、shiny.star を入力として3D auto-refineを繰り返してください。 この精密化の後、後処理と局所分解の推定のやり直しをすることを忘れないでください。<br />
<br />
このテストケースでは、movie-refinement と particle polishing の前に、復元は既に(ダウンサンプリングされた)データのナイキスト周波数に達しました。 したがって、後者は地図にほとんど影響しませんでした。 このデモンストレーションは、動画処理の仕方を教える上でまだ役立つことを願っています。<br />
<br />
== 10 Wrapping up(まとめ) ==<br />
どうやって最終的な再構築を成すか気になるでしょう。[Finished jobs]リストから実行する最後の動作を選択し、【Job actions】ボタンからMake flowchartオプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に分けられることに注意してください。ワークフローにブランチがあるかもしれません。したがって、jobの終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られます。最後のページには、正確なjob名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけではありませんのでご了承下さい。<br />
<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-28T11:27:05Z
<p>Fisherman1: </p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjobリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ「2D classification」を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違い、RELION-2.0では【Display:】ボタンで適切なクラスを選択することができません。これは[Subset selection]jobタイプ上で行われます。Select classes from model.starと書かれた行の横にある【Browse】ボタンを利用して、【I/O】タブ上のClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2次元クラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。センタリングされたテンプレートが自動検出中に必要となる一方で、2D classification実行時ではクラス平均はセンタリングされないかもしれないので、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
これは、スペクトルノイズ強度とスケールファクターの推定が不安定なことで、それぞれの電子顕微鏡写真にある粒子が非常に少ない場合に便利なオプションです。デフォルトでは、スケールファクターの推定は顕微鏡写真ごとにそれぞれ計算されます。このオプションは計算実行時、複数の顕微鏡写真の粒子を一緒に計算してグループ化することが可能です。RELIONはクラス分類や自動精密化実行の際にグループがとても小さくなっている場合に警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionカラムに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子のクラス平均を4〜6つ選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
[Auto-picking]jobタイプにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての顕微鏡写真で自動検出を実行する前に、【autopicking】タブ上でPicking threshold、Minimum inter-particle distance、Maximum stddev noise、3つのメインパラメーターを最適化する必要があります。これは時間節約のために、数枚の顕微鏡写真でのみ行われます。<br />
<br />
そのため、2〜3つの顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。[Subset selection]jobタイプで行うには2つの方法があります。OR select from picked coords: の行からManualPick/job004/coords_suffix_manualpick.starを選択、その後左の選択ボックスを使用して2枚の顕微鏡写真のみを選択できます。メニューオプションのInvert selectionでこの作業が便利になるかもしれないということを覚えておいてください。2〜4つの適切な顕微鏡写真を選択したとき、例えばデフォーカスの大きさや氷の厚さはメニューからSave selectionを選択することを忘れないでください。もう1つの方法は、[Subset selection]jobタイプの【I/O】タブからOR select from micrographs.star: の行からCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択し、右クリックメニューからSave STAR with selected imagesを選択して下さい。どんなオプションを選んでも、Select jobへの2mics4autopickのようなエイリアスは意味があるのでしょうか?<br />
<br />
[Auto-picking]jobタイプの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
("Einsteinfrom-noise"の結果を得るために、データから得ようとしている最終的な解像度よりも大幅に低いローパスフィルターを使用することは非常に重要です)<br />
● Highpass filter (A): -1<br />
(たとえば200などの正の値を渡した場合、リファレンスは顕微鏡写真はautopickingよりも高いハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(負の値を渡した場合、入力した顕微鏡写真と同じスケールであると認識します。そうでない場合、例えば粒子を抜き出す上でのリファレンスを作るために使用される粒子をリスケールしたため、正しいピクセルサイズの正の値をここのリファレンスに追加します。)<br />
● Mask diameter (A): 200<br />
([2D classification] jobタイプのときに使った値と同じ値が使えます)<br />
● Angular sampling (deg): 5<br />
(この値はどんな場合でもほとんど正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒いので、使用するリファレンスは白を利用します)<br />
● Are References CTF corrected? Yes<br />
(CTF補正で2Dクラス平均を行ったため)<br />
● Ignore CTFs until first peak: No<br />
([2D classification]jobでもリファレンス作製のために使用した場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeak-searchアルゴリズムのためのFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは、隣接する2つの粒子間の最大許容距離です。反復的クラスタリングアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素領域や非常に汚染されてる特徴が見て取れる領域のピッキングを防止するのに有効です。標準化された顕微鏡写真のバックグラウンド標準偏差がこの値より高い領域のピークは無視される。効果的な値は1.0から1.2の範囲であることが多いです。バックグラウンド標準偏差が高いため、ピークを除去するためにこの機能をオフにするには値を-1にして下さい。)<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動ピッキングアルゴリズムは顕微鏡写真をリファレンスにおいてのローパスフィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の間の値は顕微鏡写真のサイズの画分の結果になります。これはshrink=1(縮小しない)にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(適切なGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。複数のMPI-processorsを使う場合(そうでない場合も)は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して【Running】タブでひとつのMPI processorを使って動かして下さい。おそらくoptimise_paramsのようなエイリアスが有効かもしれません。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真とリファレンスごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環するリファレンスと全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を利用したより高速なpeak-detectionアルゴリズムに従っています。これらのパラメータは最適化する必要があるため、プログラムは【References】タブで指定されているようにいわゆるFOMマップを作成します。これらはリファレンスごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(従って上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より高速に検出するパラメータになるように最適化するために使用されます。最初に、動作させ終えたばかりのjobで【Display:】ボタンから coords_sufix_autopick オプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウは、最後に実行した[Manual picking]jobのパラメーター(サイズやシグマコントラストなど)を利用することに注意しておいて下さい。実際に[Manual picking]jobタイプでこれらのパラメーターを変更でき、左上の jobs メニューから Save job settings オプションで設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjobを実行すると、以前と同じように【pick】と【CTF】ボタンを持つ同様のGUIが生成されます。表示ウィンドウから両方の顕微鏡写真を開き、粒子をより多くか、少なく検出するか(すなわち、しきい値を小さくするか大きくするか)と、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)を決定します。それぞれの粒子は赤(低いFOM値)から青(高いFOM値)に色付けされることに注意して下さい。次のステップに進む間に、両方の顕微鏡写真の表示ウィンドウを開いたままにすることができます。<br />
<br />
[Finished jobs]から、AutoPick/optimise_params jobを選択して下さい。そして【autopicking】タブ上でパラメーターを変更して下さい。次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した時、全てのFOMの再計算の代わりに、以前書きだされたFOMマップをディスクから再読み込みします。新しい座標のその後の計算は、数秒で実行されます。以降は、新しい座標セットを読み込むために、顕微鏡写真の表示ウィンドウ上で右クリックメニューから Reload coordinates を選択して下さい。この方法は2つのパラメーターを手早く最適化できます。<br />
<br />
3つのパラメータをすべて使いこなして、検出結果をどのように変更するかを確認してください。すべての顕微鏡写真の自動検出に使用するパラメータがわかったら、GUIの左上にあるbrowser jobタイプの[Auto-picking]オプションをクリックして、【Run now!】ボタンで選択します。【I/O】タブ上で、入力した顕微鏡写真のSTARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初の[CTF estunatuib]jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは並列に(FOMマップが書き出せされてないのであれば)実行されるかもしれません。【Running】タブで、自動検出を実行するコアの数を指定します。MPIプロセッサの最大有効数は、入力したSTARファイルの顕微鏡写真の数となります。<br />
<br />
FOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあることに注意して下さい。FOMマップを読み込みまたは書き出し、【Continue now】ボタンをクリックすることで、プログラムは(一般的には少数の)全ての入力した顕微鏡写真を再度検出します。しかし、FOMマップの読み込みまたは書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これはスケジュール化されたjobの反復にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。また、詳細は2.3のセクションを見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけ動作させる代わりとして)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上で[Auto-picking]をクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopick オプションをクリックすることで、結果を再確認することができます。手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好む方もいます。たとえば、顕微鏡写真上の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使って粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい。<br />
<br />
ひとたび全部の結果を満たしたすと、ディスクスペースを確保するために、最初のステップで書き出したFOMマップを削除したくなるかもしれません。手軽に行うために【Job actions】ボタンから、Gentle clean オプションを使うことができます。<br />
<br />
ひとたび座標全体セットを満たしたら、以前のデータを全て保ちつつ、[Partcle extraction]jobを再実行する必要がありますが、Input coordinatesを自動検出で新しく生成されたものに変えて下さい。これは下記のよりよい精密のために使われる初期シングル粒子データセットを作成します。おそらく、allmics_autopicked のようなエイリアスが有意義です。<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために、RELIOM-2.0では、コマンドライン引数 --shrink を通して顕微鏡写真をフィルタリングするオプションを実装しています。最もシンプルな使い方は --shrink 0 と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrink の初期状態の値は1.0ですが、これは効果がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 では、顕微鏡写真をテンプレートリファレンスのローパスと同じように、--lowpass までpassさせる結果になります。これはシングル粒子解析(らせん状検出のためではないが)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 では、size= val ·micrograph size にした結果になります(valとは顕微鏡写真のオリジナルサイズを適用させたスケールファクターです)。<br />
<br />
● --shrink val > 1 では、size = val − (val mod 2)、すなわち、valより小さい最小の偶数の整数値になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、致命的ではありませんが警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズもFFT計算の大きな落とし穴を避けるために自動的に調整されるようになりました。これの注釈と上書きの仕方は、ユーザーが実行する各自動検出の最初の出力に表示されます。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには、各粒子とそれらの調節されたCTF修正リファレンスとの間の差異に基づいて粒子を素早く分類する機能もあります。ソートプログラムは[Particle sorting]jobタイプからアクセスすることができ、それぞれの粒子でリファレンスが利用できるときであれば、いつでも動かせます。たとえば、[Auto-picking]、[2D classification]、[3D classificationo]、[3D auto-refaine]の後などです。その使用方法を示すために、自動検出の後に実行します。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後に抽出プログラムによって生成されます。[2D classification]、[3D classification]または、[3D auto-refine]jobの場合は、最後の反復での_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が [2D classification]、[3D classification]、[3D auto-refine]job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(抽出された粒子のための座標を与える自動検出jobに使われたリファレンスを入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリに particles_sort.star と呼ばれる入力ファイルと同じファイルを生成しますが、rlnPartileSelectZScore と呼ばれるコラムの追加があります。[Subset selection]jobタイプの OR select from particles.star とある行で、このファイルを選択することが出来ます。ポップアップ表示ウィンドウ内にて、その新しいコラムに基づいて粒子を可視化できます。ディスプレイの上に良い粒子、下に良くない粒子をもつために強度の傾向が出てきます。下から上にスクロールして、下のすべての粒子を破棄する必要があるポイントを決定でき、右マウスメニューを使用して Select all above および、または1つずつ粒子を選択することができます。右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは異なる成分です。問題は どのくらい寛容でいられるかです。RELIONの3Dマルチリファレンス精密手順は強力な教師無し3次元分類へのアプローチを提供しています。しかし、まずは低解像度の単一コンセンサスモデルが必要です。初期の結晶構造(PDB-ID 3I3E)から生成された低分解能のベータガラクトシダーゼモデルを使用します。これはすでに projectディレクトリの中に 3i3e_lp50A.mrcという名前で入っています。典型的なプロジェクトでは、良い初期モデルがないかもしれません。その場合は違うプログラムから別のモデルを持ってくる必要があります。その場合は、RELIONと同じように別のプログラムで生成する必要がありますが、初期モデル生成は行いません。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handlerというプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使用)とボックスサイズ(--new_box)を変更してもかまいません。<br />
<br />
この場合、[Import]jobタイプを使用し、直接プロジェクトに初期モデルをインポート出来ます。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使います。<br />
<br />
=== 5.1 Running the job===<br />
<br />
教師無し3次元分類は、[3D classification]jobタイプから実行可能です。<br />
<br />
<br />
【I/O】タブの設定:<br />
● Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
● Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
● Reference mask (optional):<br />
<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供した場所だとします。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類へのバイアスを最小限にする働きがあります。)<br />
<br />
<br />
【Reference】タブの設定:<br />
● Ref. map is on absolute greyscale: No<br />
(RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
<br />
● Initial low-pass filter (A): 50<br />
(精密化プロセスにバイアスが導入する可能性があるため、高解像度の開始モデルは使用してはいけません。[9]で説明したように、初期マップをできる限りフィルタリングする必要があります。リボソームでは大抵、70Åを使用し、小さい粒子では通常40〜60Åの値を使用します。)<br />
<br />
● Symmetry: C1<br />
(このサンプルはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。良くない粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
<br />
【CTF】タブの設定:<br />
● Do CTF corection? Yes<br />
<br />
● Has reference been CTF-correced? Yes<br />
<br />
(このモデルはPDBファイルで作成されているため、振幅はCTFの影響を受けていません。これは"CTF修正済み"とみなすことができます。ほとんどの他のEMパッケージから作られたモデルは、適切な低周波振幅補正を実行するパッケージが多くないため、ほとんどの場合CTF補正されていないことが多いです。(いくつかは補正されているかもしれません:したがって、モデルを通ってスライスをチェックすることができます。もし白黒で見えるならば、モデルはおそらく適切にCTF修正されたものでしょう;また、ブラックハローとグレイアッシュに見えるのであればそのモデルはおそらくCTF補正されていないでしょう。)これまでRELIONでCTF補正を行ったモデルは、適切に補正されています。)<br />
<br />
● Have data been phase flipped? No<br />
<br />
● Ignore CTFs untill first peak? No<br />
(リファレンスを作成するために使用した[2D classification]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
<br />
<br />
【Optimisation】タブの設定:<br />
● Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。)<br />
<br />
● Number of iterations: 25<br />
(これは一般的には変更する必要はありません。)<br />
<br />
● Regularisation parameter T: 4<br />
(Tの定義については[10]を参照してください。低温EM2次元分類では、通常、Tは1~2を設定し、3次元分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均にノイズが見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズの過剰適合を認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
<br />
● Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。)<br />
<br />
● Mask individual particles with zeros? Yes<br />
<br />
● Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体ウイルスのような大型で高い対称性をもつ粒子の場合のみ、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブは無視し、以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用するNumber of MPI processors(MPIプロセッサの数)とthreads(スレッド数)を指定できます。[2D classification]のjobタイプで説明したように、3次元分類は2次元分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3次元分類を表示するためにfirst_exhaustiveのようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
精密化された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与えます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。<br />
<br />
UCSFキメラなどを使用し、表示されたマップを3Dで見ると、マップが精密化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2次元分類の場合と同様に、[Subset selection]を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示ウィンドウには、4つの精密化されたモデルの中央スライスが表示されます。最適なクラスを選択し、右クリックメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2次元分類の実行時と同じです。(実際に2次元,3次元精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2次元クラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。例えば、run_it025_class00?.mrcというMRCマップです。<br />
<br />
今まで通り、小さいクラスは大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnplotがインストールされているのであれば、以下の通りに入力して下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は解像度を推定するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己高揚による過剰適合を避けることができます[13]。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで[3D auto-refine]jobタイプを選択してください。GUIでの入力引数は大部分は[3D classification]jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプリング率は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング率が自動的に増加されます。したがって、8面体または正20面体対称よりも小さい全ての精密化では、一般的に初期値の角度である7.5度のサンプルを使用し、部分的な調査では1.8度のサンプルから行います。より正確な対称の精密化を行うためにのみ、3.7度でのサンプリングを行い、部分的な調査では0.9度ごとにサンプリングを行います。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精密化は、[Post-processing]jobタイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作では【I/O】タブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。他にも、伸長された分子や、マスクを使用し、小さい部分の精密化に注目した時などに役立ちます。このような場合、マスクが使用されていない代表的なFSCは精密化の際の解像度が低く見積もられます。精密化を行っている最中であるため、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、[3D classification]実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精密化されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらく違いがほとんどありません。さらに、マップ内で高周波の精密化へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精密な”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精密化で2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、奇数のMPI処理装置のを使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。一点に収束した場合にのみ、run_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。<br />
<br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。<br />
<br />
例えば、以下のように試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3D自動精密化の実行後、マップをシャープに必要があります。それも、自動精密化物の内部の至適基準FSCカーブはマスク化されていないマップのみ使います(Use solvent-flattened FSCsオプションを使っていない場合に限ります)。これは実際の精密化中に、実際の解像度は概算値を下回っているということを意味しています。なぜなら、溶媒領域のノイズがFSCカーブよりも低くなるからです。RELIONにおけるBファクターでの鮮明化と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、タンパク質の末端と溶媒領域の開始点を精密化するためのマスクを作る必要があります。これは[Mask Creation]ジョブタイプを使って行います。<br />
<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3D自動精密化が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。【Mask】タブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶媒マスクのために良い選択と思われます)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われます)<br />
● Initial binarisation threshold: 0.02<br />
(これは例としてタンパク質領域の外側にノイズスポットが完全になく表示するキメラのように、ローパスフィルターのかかったマップの描写でのしきい値となります。適切なスポットを見つけるために、しきい値を上げたり下げたりしてみて下さい。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54オプションを付与させてrelion_image_handlerと呼ばれるコマンドラインプログラムを使用できることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりです)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値は白黒画像マスクを生成するのに使われます。このマップ中のホワイト値は全方向の多くのピクセルで増加します。これを使用して、最初のバイナリマスクのサイズを小さくします。)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスクに余弦形状のソフトエッジを配置します。これは、とても鋭いマスクにかなり繊細である可能性があるFSCカーブに、マスクが及ぼす影響を計測する補正手順として重要です。マスクの生成は相対的に早いので、しばしば解像度の最も適した概算を得るためのマスクパラメーターと共に使います。)<br />
<br />
【Helix】タブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通した切片を見たり、UCSFキメラにマスクを読み込ませることができます。後者は、マスクが構造全体をカプセル化するが、マスク内に多くの溶媒を残さないことを確認するために、自動精密手順のマップと一緒に良いアイデアになるかもしれません。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing]jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%異なっていたということがわかることがあります。RELION内では、この時までになしたもの全ては、まだ一貫しています。そのためマップの再精密化や、データのクラスの再分類をする必要はありません。正確なマップと最終解像度の推定のために必要なことが、ここに正しいピクセルサイズを提供することです。)<br />
<br />
【Sharpen】タブで以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、自身のディテクターのために、プロジェクトディレクトリの中に保存されている mtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
● Estimate B-factor automatically: Yes<br />
この手順は本誌[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要があります。もしマップの解像度が10Åに満たない場合、独自の “ad-hoc” Bファクターを代わりに使う必要があるかもしれません。<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
● Use your own B-factor? No<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションはときに、全体のマップ解像度を超えるような解像度へと拡張するマップ範囲を解析するのに便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3dref のようなエイリアスを使用して下さい。【Display】ボタンを使って、後処理されるマップと、この構造のFSCカーブとGuinierプロットを含んだPDFを通して、スライズを表示します。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D自動精密化の手順となる収束したマップでの全てのα-へリックスの場所を簡単に見ることが出来ます。解像度の推定は、以前に発表された[2]のフェイズランダムの手順に基づいてます。フェイズランダムマップのFSC(赤いカーブ)が、多かれ少なかれ、推定していた後処理マップの解像度のゼロ点であることを確認してください。そうでない場合は、マスクが鮮明すぎるか、細部の描写が多すぎます。この場合は。強いローパスフィルターや、以前の[Mask creation]ステップでの、より広く、より薄いマスクを使用し、後処理を繰り返して下さい。実際に少し薄いマスクを作りたくなるかもしれないので、その場合はエッジがだいたい5ピクセルになるように試してみてください。このために【Continue now】ボタンを使った場合、以前の結果が上書きされます。左側にあるjobタイプブラウザをクリックし、【Run now!】ボタンで新しい出力ディレクトリが出来ます。<br />
<br />
== 8 Local-resolution estimate(ローカル解像度推定) ==<br />
定例処理プログラムから解像度の推定は広域的な推定となります。しかしながら、シングルナンバーは高分子複合体の再構築でしばしば観測される解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する効果的なプログラムを記述しています[4]。RELION は、[Local resolution]jobタイプを通してプログラムのラッパーを実装しています。【I/O】タブ上で以下のように設定してください。<br />
<br />
● One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size: 3.54<br />
<br />
(正しいピクセルサイズであると考えたモデルを構築し始めたときに、実際には数パーセントずれていたことがわかることがあります。RELION内では、この時点までの全てが一貫しています。そのため、再度、マップの精密化とデータの分類をする必要はありません。正確なマップと最終的な解像度推定のために正しいピクセルサイズをここで指定するだけで良いです。)<br />
<br />
【ResMap】タブ上で以下のように設定してください。<br />
<br />
● ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(RESMAP実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
● P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
● Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7Åです)<br />
<br />
● Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
● Resolution step size (A): 0.5<br />
<br />
(ステップ数を増やせば、より正確なローカル解像度マップの結果が導き出せますが、更に実行時間は長くなります。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAPのGUIからフィルターボタンを利用して下さい。しかしながら、RELION上で生成されたマップに変更を加える必要がないことにしばしば気がつくでしょう。RESMAPプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、volume data valueで選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズ(閲覧)するために使われます。特別な場合では、データが低解像度処理され、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル解像度の変化は見るために良いというわけではありません。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択して[Import]という機能を使って動画を取り込んでください。<br />
<br />
また、後で動画-粒子正規化において、元の顕微鏡写真のそれぞれが対応する動画の平均であると仮定されます。 これがあなた自身のデータではない場合、画像処理手順全体を開始する前に、プログラムrelion_image_handlerを使用して任意の数のムービーフレームからの平均顕微鏡写真を計算することができます。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
[Movie refinemen]という機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させる、この二つの処理を組み合わせて行います。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
(これらの映画のファイル名は_movie.mrcsで終わるためです。)<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
<br />
([3D auto-refine]を実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。)<br />
<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
(少なくとも平均フレームで、約1 electron/Å2線量を持っているためこの値を調節します。各ムービーフレームで0.5-1 electron/Å2線量未満であれば1よりも高い値を使用します。)<br />
<br />
• Maximum number of MPI nodes: 8<br />
(このjobの第一ステップでは、動画粒子の抽出はI/Oディスク上で非常に集中します。<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。我々のクラスタでは、8がいいでしょう。)<br />
• Particle box suze (pix): 100<br />
([Particle extraction]jobで以前使用したサイズと同じか確認してください。)<br />
<br />
• Invert contrast? Yes <br />
([Particle extraction]jobの時と同じものを使用してください)<br />
<br />
• Rescale particles? No<br />
([Particle extraction]jobの時と同じものを使用してください)<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
([Particle extraction]jobの時と同じものを使用してください)<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
(最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。リボソームのような大きな分子では、実行するためには3-5 electron/Å2線量程あれば十分でしょう。)<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
(これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。)<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを【Runnning】タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
<br />
このjobから出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing(粒子の洗練) ===<br />
粒子のpolishingアルゴリズムは、MovieRefine/first3dref/run_avg7_off1_data.star から(おそらく非常にノイズの多い)移動軌跡(movement tracks)を取得し、それを利用して直線になるように適合させます。これらのトラックのノイズを更に減らすために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観測も利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の(ピクセルの)標準偏差は、ユーザによって決まります。第2のステップでは、polishingアルゴリズムは、Bファクターおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線ダメージは、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対ノイズ比が増加するので、"polished"または"shiny"だと言われます。<br />
<br />
[Particle polishing]jobタイプの【I/O】タブにて以下のようにして下さい<br />
●Input STAR file with aligned movies: MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子がより大きければ、ムービーの精密化からの移動軌跡の騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセルくらいをよく使用します。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単にコンピューターリソースを節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、シングルフレームの再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 Bファクターの形状を信頼して推定するために適切な高解像度を得られない再構成があれば、このオプションを使用して3、5ムービーフレーム7つを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、[Particle extraction]jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
【Helix】タブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えるでしょう。このjobの最大使用MPIプロセッサ数は、データのムービーフレーム数の二倍です。粒子ボックスが比較的大きい場合、メモリの要求は重要ですが、通常は3D自動精密化最後の反復実行時よりは大きくありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線ダメージの計量のBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と共に、そして動作軌跡と線形フィットはすべて、【Display】ボタンから開けるPolish/first3dref/logfile.pdf という大きなPDFファイルにあります。<br />
<br />
私たちはサンプルが大きく動く最初の1-2フレームではしばしば比較的大きな負のBファクタを観測し、その後に放射線ダメージが入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
何らかの形で推定されたBファクタまたはスケールファクタが奇妙に見える場合、Guinierプロットを通じて線形フィットを調べることができます。時には、Guinierプロットは、【Damage】タブに入力された全周波数領域にわたって直線でよくフィットすることができません。その後、異なるパラメータでjobを再実行する価値があります。また、シングルフレームの再構成が上記の20Åの周波数を超えて拡張されない場合、ラインにフィットせず、(推定されたB因子についてNaNを与える)プログラムは動作しません。そのような場合、Bファクタの計量をスキップするか、または同じタブの Average frames B-factor estimation: 1 を使用して複数のフレームを平均することを選択します。【Display】ボタンから出力された研磨粒子(shiny.star)を使ってSTARファイルを視覚化して、すべてが正しく行われていることを確認することは、おそらく悪い考えではありません。<br />
<br />
何らかの形で研磨結果に満足していない場合は、【Continue run】ボタンを使用して計算の一部を繰り返すことができます。 それをクリックすると、プログラムは次のファイルを探し、そこにあればその計算ステップをスキップして次のステップに移ります:<br />
<br />
●frame0??_half?_class001_unfil.mrc (これらの地図のいずれかが欠落している場合は、再計算されます。それらが既に存在する場合、それらの再構成計算はスキップされる。Average frames B-factor estimation オプションを変更した場合は、すべての再構成を再計算すべきです。その場合は、古いものを続けるのではなく、新しいjobを開始する方が良いでしょう。あるいは、既存のフレームの再構築をすべて取り除く必要があります。)<br />
<br />
●bfactors.star (このファイルが見つからない場合、プログラムは既存のすべてのフレーム再構成を読み込み、BファクタとスケールファクタをGuinierプロットを通して線形フィットするかどうか決定します。 したがって、たとえば【Damage】タブでフィットした解像度範囲を変更したが、Average frames B-factor estimation を変更しなかった場合、既存のbfactors.starファイルを削除すると非常に便利なので、新しいBファクタとスケールファクタが計算されますが、すべてのマップをもう再構築する必要はありません。 これはとても高速に進むでしょう。)<br />
<br />
●shiny.star (このファイルがない場合、既存の bfactors.starファイルが読み込まれ、光沢のある粒子はこれらのパラメータに従って再計量されます。 たとえば、以前に決定されたBファクタとスケールファクタのプロットに滑らかな曲線をフィットさせることを決定し、既存の bfactors.starファイルを新しくフィットしたものに置き換えた場合など、これは非常に便利です。 この場合、プログラムは光沢のある粒子のみを再作成します。)<br />
<br />
=== 9.4 Re-refine the polished particles(磨かれた粒子の精密化) ===<br />
shiny.starの磨かれた粒子は、元のものと比べてシグナル対ノイズ比が向上しています。 これは、さらに分類分けするときに役立ちます。 この時点での異なる分類分けの戦略の詳細な説明については、Methods in Enzymology [12]の最新の章を参照してください。 この章はまだオンラインでは入手できないため、以下コマンドで初期の資料をダウンロードできます。<br />
<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relionreview2016.pdf<br />
<br />
自身の研磨からの再構成は、より高い解像度マップをもたらす「確率加重 angular assignment(角度の割り当て) 」の実行の代わりに、最も可能性の高い方向に各粒子を配置するので、少なくとも、研磨された粒子を使用して最終的な[3D auto-refine]を実行します。 したがって、shiny.star を入力として3D auto-refineを繰り返してください。 この精密化の後、後処理と局所分解の推定のやり直しをすることを忘れないでください。<br />
<br />
このテストケースでは、movie-refinement と particle polishing の前に、復元は既に(ダウンサンプリングされた)データのナイキスト周波数に達しました。 したがって、後者は地図にほとんど影響しませんでした。 このデモンストレーションは、動画処理の仕方を教える上でまだ役立つことを願っています。<br />
<br />
== 10 Wrapping up(まとめ) ==<br />
どうやって最終的な再構築を成すか気になるでしょう。[Finished jobs]リストから実行する最後の動作を選択し、【Job actions】ボタンからMake flowchartオプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に分けられることに注意してください。ワークフローにブランチがあるかもしれません。したがって、jobの終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られます。最後のページには、正確なjob名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけではありませんのでご了承下さい。<br />
<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-26T16:09:29Z
<p>Fisherman1: /* 7.2 Postprocessing (後処理) */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjobリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ「2D classification」を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違い、RELION-2.0では【Display:】ボタンで適切なクラスを選択することができません。これは[Subset selection]jobタイプ上で行われます。Select classes from model.starと書かれた行の横にある【Browse】ボタンを利用して、【I/O】タブ上のClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2次元クラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。センタリングされたテンプレートが自動検出中に必要となる一方で、2D classification実行時ではクラス平均はセンタリングされないかもしれないので、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
これは、スペクトルノイズ強度とスケールファクターの推定が不安定なことで、それぞれの電子顕微鏡写真にある粒子が非常に少ない場合に便利なオプションです。デフォルトでは、スケールファクターの推定は顕微鏡写真ごとにそれぞれ計算されます。このオプションは計算実行時、複数の顕微鏡写真の粒子を一緒に計算してグループ化することが可能です。RELIONはクラス分類や自動精密化実行の際にグループがとても小さくなっている場合に警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionカラムに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子のクラス平均を4〜6つ選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
[Auto-picking]jobタイプにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての顕微鏡写真で自動検出を実行する前に、【autopicking】タブ上でPicking threshold、Minimum inter-particle distance、Maximum stddev noise、3つのメインパラメーターを最適化する必要があります。これは時間節約のために、数枚の顕微鏡写真でのみ行われます。<br />
<br />
そのため、2〜3つの顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。[Subset selection]jobタイプで行うには2つの方法があります。OR select from picked coords: の行からManualPick/job004/coords_suffix_manualpick.starを選択、その後左の選択ボックスを使用して2枚の顕微鏡写真のみを選択できます。メニューオプションのInvert selectionでこの作業が便利になるかもしれないということを覚えておいてください。2〜4つの適切な顕微鏡写真を選択したとき、例えばデフォーカスの大きさや氷の厚さはメニューからSave selectionを選択することを忘れないでください。もう1つの方法は、[Subset selection]jobタイプの【I/O】タブからOR select from micrographs.star: の行からCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択し、右クリックメニューからSave STAR with selected imagesを選択して下さい。どんなオプションを選んでも、Select jobへの2mics4autopickのようなエイリアスは意味があるのでしょうか?<br />
<br />
[Auto-picking]jobタイプの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
("Einsteinfrom-noise"の結果を得るために、データから得ようとしている最終的な解像度よりも大幅に低いローパスフィルターを使用することは非常に重要です)<br />
● Highpass filter (A): -1<br />
(たとえば200などの正の値を渡した場合、リファレンスは顕微鏡写真はautopickingよりも高いハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(負の値を渡した場合、入力した顕微鏡写真と同じスケールであると認識します。そうでない場合、例えば粒子を抜き出す上でのリファレンスを作るために使用される粒子をリスケールしたため、正しいピクセルサイズの正の値をここのリファレンスに追加します。)<br />
● Mask diameter (A): 200<br />
([2D classification] jobタイプのときに使った値と同じ値が使えます)<br />
● Angular sampling (deg): 5<br />
(この値はどんな場合でもほとんど正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒いので、使用するリファレンスは白を利用します)<br />
● Are References CTF corrected? Yes<br />
(CTF補正で2Dクラス平均を行ったため)<br />
● Ignore CTFs until first peak: No<br />
([2D classification]jobでもリファレンス作製のために使用した場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeak-searchアルゴリズムのためのFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは、隣接する2つの粒子間の最大許容距離です。反復的クラスタリングアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素領域や非常に汚染されてる特徴が見て取れる領域のピッキングを防止するのに有効です。標準化された顕微鏡写真のバックグラウンド標準偏差がこの値より高い領域のピークは無視される。効果的な値は1.0から1.2の範囲であることが多いです。バックグラウンド標準偏差が高いため、ピークを除去するためにこの機能をオフにするには値を-1にして下さい。)<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動ピッキングアルゴリズムは顕微鏡写真をリファレンスにおいてのローパスフィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の間の値は顕微鏡写真のサイズの画分の結果になります。これはshrink=1(縮小しない)にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(適切なGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。複数のMPI-processorsを使う場合(そうでない場合も)は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して【Running】タブでひとつのMPI processorを使って動かして下さい。おそらくoptimise_paramsのようなエイリアスが有効かもしれません。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真とリファレンスごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環するリファレンスと全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を利用したより高速なpeak-detectionアルゴリズムに従っています。これらのパラメータは最適化する必要があるため、プログラムはReferencesタブで指定されているようにいわゆるFROMマップを作成します。これらはリファレンスごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動ピッキングプログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より高速にピッキングするパラメータになるように最適化するために使用されます。。最初に、動作させ終えたばかりのjobで【Display:】ボタンから coords_sufix_autopick オプションを使って、現在の設定でオートピッキングされた粒子を調べます。ディスプレイウィンドウは、最後に実行した[Manual picking]jobのパラメーター(サイズやシグマコントラストなど)を利用することに注意しておいて下さい。実際に[Manual picking]jobタイプでこれらのパラメーターを変更でき、左上の jobs メニューから Save job settings オプションで設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjobを実行すると、以前と同じように【pick】と【CTF】ボタンを持つ同様のGUIが生成されます。表示ウィンドウから両方の顕微鏡写真を開き、粒子をより多くか、少なく検出するか(すなわち、しきい値を小さくするか大きくするか)と、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)を決定します。それぞれの粒子は赤(低いFOM値)から青(高いFOM値)に色付けされることに注意して下さい。次のステップに進む間に、両方の顕微鏡写真の表示ウィンドウを開いたままにすることができます。<br />
<br />
[Finished jobs]から、AutoPick/optimise_params jobを選択して下さい。そして【autopicking】タブ上でパラメーターを変更して下さい。次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した時、全てのFOMの再計算の代わりに、以前書きだされたFOMマップをディスクから再読み込みします。新しい座標のその後の計算は、数秒で実行されます。以降は、新しい座標セットを読み込むために、顕微鏡写真の表示ウィンドウ上で右クリックメニューから Reload coordinates を選択して下さい。この方法は2つのパラメーターを手早く最適化できます。<br />
<br />
3つのパラメータをすべて使いこなして、ピッキング結果をどのように変更するかを確認してください。すべての顕微鏡写真の自動ピッキングに使用するパラメータがわかったら、GUIの左上にあるbrowser jobタイプの[Auto-picking]オプションをクリックして、【Run now!】。【I/O】タブ上で、入力した顕微鏡写真のSTARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは並列に(FOMマップが書き出せされてないなら)実行されるかもしれない。【Running】タブで、自動ピッキングを実行するコアの数を指定します。MPIプロセッサの最大有効数は、入力したSTARファイルの顕微鏡写真の数となります。<br />
<br />
FOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあることに注意して下さい。FOMマップを読み込みまたは書き出し、[Continue now]ボタンをクリックすることで、プログラムは(一般的には少数の)全ての入力した顕微鏡写真を再度ピッキングします。しかし、FOMマップの読み込みまたは書き込みをしない場合、すなわち、自動ピッキングを全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動ピッキングを行っていない顕微鏡写真のみ再検出します。これはスケジュール化されたjobの反復にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけ動作させる代わりとして)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上で[Auto-picking]をクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopick オプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真上の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使って粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
ひとたび全部の結果を満たしたら、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle clean オプションを使うことができます。<br />
<br />
ひとたび座標全体セットを満たしたら、以前のデータを全て保ちつつ、[Partcle extraction]jobを再実行する必要があるが、Input coordinatesを自動検出で新しく生成されたものに変変えて下さい。これは下記のよりよい精密のために使われる初期シングル粒子データセットを作成します。おそらく、allmics_autopicked のようなエイリアスが有意義です。<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0では、コマンドライン引数 --shrink を通して顕微鏡写真をフィルタリングするオプションを実装しています。最もシンプルな使い方は --shrink 0 と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrink の初期状態の値は1.0ですが、これは反映がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動ピッキングと同一の動作をします<br />
<br />
● --shrink val = 0 では、顕微鏡写真をテンプレートリファレンスのローパスと同じように、--lowpass までpassさせる結果になります。これはシングル粒子解析(らせん状検出のためではないが)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 では、size= val ·micrograph size にした結果になります(valとは顕微鏡写真のオリジナルサイズを適用させたスケールファクターです)<br />
<br />
● --shrink val > 1 では、size = val − (val mod 2)、すなわち、valより小さい最小の偶数の整数値になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、致命的ではありませんが警告をならす結果となります。RELIONの自動ピッキングは多くのFFTを実行するため、顕微鏡写真のサイズもFFT計算の大きな落とし穴を避けるために自動的に調整されるようになりました。これの注釈と上書きの仕方は、ユーザーが実行する各自動ピッキングの最初の出力に表示されます。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには、各粒子とそれらの整列されたCTF修正リファレンスとの間の差異に基づいて粒子を素早く分類する機能もあります。ソートプログラムは[Particle sorting]jobタイプからアクセスすることができ、それぞれの粒子でリファレンスが利用できるときなら、いつでも動かせます。たとえば、[Auto-picking]、[2D classification]、[3D classificationo]、[3D auto-refaine]の後などです。その使用方法を示すために、自動ピッキングの後に実行します。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動ピッキング後に抽出プログラムによって生成されます。[2D classification]、[3D classification]または、[3D auto-refine]jobの場合は、最後の反復での_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が [2D classification]、[3D classification]、[3D auto-refine]job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(抽出された粒子のための座標を与える自動ピッキングjobに使われたリファレンスを入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリに particles_sort.star と呼ばれるインプットファイルと同じファイルを生成しますが、rlnPartileSelectZScore と呼ばれるカラムの追加があります。[Subset selection]jobタイプの OR select from particles.star とある行で、このファイルを選択することが出来ます。ポップアップ表示ウィンドウ内にて、その新しいカラムに基づいて粒子を可視化できます。ディスプレイの上に良い粒子、下に良くない粒子をもつために強度の傾向が出てきます。下から上にスクロールして、下のすべての粒子を破棄する必要があるポイントを決定でき、右マウスポップアップメニューを使用して Select all above および、または1つずつ粒子を選択することができます。右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この問題は どのくらい寛容でいられるかです。RELIONの3Dマルチリファレンス精密手順は強力な教師無し3次元分類へのアプローチを提供している。しかし、まずは低解像度の単一コンセンサスモデルが必要です。初期の結晶構造(PDB-ID 3I3E)から生成された低分解能のベータガラクトシダーゼモデルを使用します。これはすでに projectディレクトリの中に 3i3e_lp50A.mrcという名前で入っています。典型的なプロジェクトでは、良い初期モデルがないかもしれません。その場合は違うプログラムから別のモデルを持ってくる必要があります。その場合は、RELIONと同じように別のプログラムで生成する必要がありますが、初期モデル生成は行いません。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handlerというプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまいません。<br />
<br />
この場合、[Import]という機能を使って、直接プロジェクトに初期モデルをインポート出来きます。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使います。<br />
<br />
=== 5.1 Running the job===<br />
<br />
教師無しの3D分類は、3D分類jobタイプから実行可能です。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供した場所だとします。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類への偏りを最小限にする働きがあります。)<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
(RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
<br />
・Initial low-pass filter (A): 50<br />
(リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけません。[9]で説明したように、初期マップをできる限りフィルタリングする必要があります。 小さい粒子では通常40〜60Åの値を使用します。)<br />
<br />
・Symmetry: C1<br />
(このサンプルにはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。不良粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
(このモデルはPDBファイルで作成されているため、振幅はCTFの影響を受けていません。これは「CTF修正済み」とみなすことができます。ほとんどの他のEMパッケージから作られたモデルは、適切な低周波振幅補正を実行するパッケージが多くないため、ほとんどの場合CTF補正されていないことが多いです。(いくつかは補正されているかもしれません:したがって、モデルを通ってスライスをチェックすることができます。もし黒で白く見えるならば、モデルはおそらく適切にCTF修正されたものでしょう;また、ブラックハローでグレイアッシュに見えるならそのモデルはおそらくCTF補正されていないでしょう。)これまでCTF補正を行ったモデルは、適切に補正されています。)<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
(参照を作成するために使用した[2D分類]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。)<br />
<br />
・Number of iterations: 25<br />
(これは今後変更する必要はありません。)<br />
<br />
・Regularisation parameter T: 4<br />
(Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
<br />
・Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。)<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。[2D classification]のjobタイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与えます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、[Subset selection]を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2Dクラス化の実行時と同じです。(実際に2D,3Dクラス精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnplotがインストールされているのであれば、以下の通りに入力して下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は解像度を推定するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己高揚による過剰適合を避けることができます[13]。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで[3D auto-refine]jobタイプを選択してください。GUIでの入力引数は大部分は[3D classification]jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプリング率は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング率が自動的に増加されます。したがって、8面体または正20面体対称よりも小さい全ての精密化では、一般的に初期値の角度である7.5度のサンプルを使用し、部分的な調査では1.8度のサンプルから行います。より正確な対称の精密化を行うためにのみ、3.7度でのサンプリングを行い、部分的な調査では0.9度ごとにサンプリングを行います。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精密化は、[Post-processing]jobタイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作では【I/O】タブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。他にも、伸長された分子や、マスクを使用し、小さい部分の精密化に注目した時などに役立ちます。このような場合、マスクが使用されていない代表的なFSCは精密化の際の解像度が低く見積もられます。精密化を行っている最中であるため、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、[3D classification]実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精密化されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらく違いがほとんどありません。さらに、マップ内で高周波の精密化へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精密な”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精密化で2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、奇数のMPI処理装置のを使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。一点に収束した場合にのみ、run_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。<br />
<br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。<br />
<br />
例えば、以下のように試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3D自動精密化の実行後、マップをシャープに必要があります。それも、自動精密化物の内部の至適基準FSCカーブはマスク化されていないマップのみ使います(Use solvent-flattened FSCsオプションを使っていない場合に限ります)。これは実際の精密化中に、実際の解像度は概算値を下回っているということを意味しています。なぜなら、溶媒領域のノイズがFSCカーブよりも低くなるからです。RELIONにおけるBファクターでの鮮明化と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、タンパク質の末端と溶媒領域の開始点を精密化するためのマスクを作る必要があります。これは[Mask Creation]ジョブタイプを使って行います。<br />
<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3D自動精密化が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。【Mask】タブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶媒マスクのために良い選択と思われます)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われます)<br />
● Initial binarisation threshold: 0.02<br />
(これは例としてタンパク質領域の外側にノイズスポットが完全になく表示するキメラのように、ローパスフィルターのかかったマップの描写でのしきい値となります。適切なスポットを見つけるために、しきい値を上げたり下げたりしてみて下さい。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54オプションを付与させてrelion_image_handlerと呼ばれるコマンドラインプログラムを使用できることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりです)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値は白黒画像マスクを生成するのに使われます。このマップ中のホワイト値は全方向の多くのピクセルで増加します。これを使用して、最初のバイナリマスクのサイズを小さくします。)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスクに余弦形状のソフトエッジを配置します。これは、とても鋭いマスクにかなり繊細である可能性があるFSCカーブに、マスクが及ぼす影響を計測する補正手順として重要です。マスクの生成は相対的に早いので、しばしば解像度の最も適した概算を得るためのマスクパラメーターと共に使います。)<br />
<br />
【Helix】タブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通した切片を見たり、UCSFキメラにマスクを読み込ませることができます。後者は、マスクが構造全体をカプセル化するが、マスク内に多くの溶媒を残さないことを確認するために、自動精密手順のマップと一緒に良いアイデアになるかもしれません。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing]jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%異なっていたということがわかることがあります。RELION内では、この時までになしたもの全ては、まだ一貫しています。そのためマップの再精密化や、データのクラスの再分類をする必要はありません。正確なマップと最終解像度の推定のために必要なことが、ここに正しいピクセルサイズを提供することです。)<br />
<br />
【Sharpen】タブで以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、自身のディテクターのために、プロジェクトディレクトリの中に保存されている mtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
● Estimate B-factor automatically: Yes<br />
この手順は本誌[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要があります。もしマップの解像度が10Åに満たない場合、独自の “ad-hoc” Bファクターを代わりに使う必要があるかもしれません。<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
● Use your own B-factor? No<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションはときに、全体のマップ解像度を超えるような解像度へと拡張するマップ範囲を解析するのに便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3dref のようなエイリアスを使用して下さい。【Display】ボタンを使って、後処理されるマップと、この構造のFSCカーブとGuinierプロットを含んだPDFを通して、スライズを表示します。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D自動精密化の手順となる収束したマップでの全てのα-へリックスの場所を簡単に見ることが出来ます。解像度の推定は、以前に発表された[2]のフェイズランダムの手順に基づいてます。フェイズランダムマップのFSC(赤いカーブ)が、多かれ少なかれ、推定していた後処理マップの解像度のゼロ点であることを確認してください。そうでない場合は、マスクが鮮明すぎるか、細部の描写が多すぎます。この場合は。強いローパスフィルターや、以前の[Mask creation]ステップでの、より広く、より薄いマスクを使用し、後処理を繰り返して下さい。実際に少し薄いマスクを作りたくなるかもしれないので、その場合はエッジがだいたい5ピクセルになるように試してみてください。このために【Continue now】ボタンを使った場合、以前の結果が上書きされます。左側にあるjobタイプブラウザをクリックし、【Run now!】ボタンで新しい出力ディレクトリが出来ます。<br />
<br />
== 8 Local-resolution estimate(ローカル解像度推定) ==<br />
定例処理プログラムから解像度の推定は広域的な推定となります。しかしながら、シングルナンバーは高分子複合体の再構築でしばしば観測される解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する効果的なプログラムを記述しています[4]。RELION は、[Local resolution]jobタイプを通してプログラムのラッパーを実装しています。【I/O】タブ上で以下のように設定してください。<br />
<br />
● One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size: 3.54<br />
<br />
(正しいピクセルサイズであると考えたモデルを構築し始めたときに、実際には数パーセントずれていたことがわかることがあります。RELION内では、この時点までの全てが一貫しています。そのため、再度、マップの精密化とデータの分類をする必要はありません。正確なマップと最終的な解像度推定のために正しいピクセルサイズをここで指定するだけで良いです。)<br />
<br />
【ResMap】タブ上で以下のように設定してください。<br />
<br />
● ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(RESMAP実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
● P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
● Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7Åです)<br />
<br />
● Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
● Resolution step size (A): 0.5<br />
<br />
(ステップ数を増やせば、より正確なローカル解像度マップの結果が導き出せますが、更に実行時間は長くなります。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAPのGUIからフィルターボタンを利用して下さい。しかしながら、RELION上で生成されたマップに変更を加える必要がないことにしばしば気がつくでしょう。RESMAPプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、volume data valueで選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズ(閲覧)するために使われます。特別な場合では、データが低解像度処理され、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル解像度の変化は見るために良いというわけではありません。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing(粒子の洗練) ===<br />
粒子のpolishingアルゴリズムは、MovieRefine/first3dref/run_avg7_off1_data.star から(おそらく非常にノイズの多い)移動軌跡(movement tracks)を取得し、それを利用して直線にフィットさせます。これらのトラックのノイズをさらに減らすために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観測も利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の(ピクセルの)標準偏差は、ユーザによって決まります。第2のステップでは、polishingアルゴリズムは、Bファクターおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対ノイズ比が増加するので、"polished"または"shiny"だと言われます。<br />
<br />
[Particle polishing]jobタイプの【I/O】タブにて以下のようにして下さい<br />
●Input STAR file with aligned movies: MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子がより大きければ、ムービーの精密化からの移動軌跡の騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセル程をしばしば使用します。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単にコンピューターリソースを節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、シングルフレームの再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 Bファクターの形状を信頼して推定するために適切な高解像度を得られない再構成があれば、このオプションを使用して3、5ムービーフレーム7つを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、[Particle extraction]jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
Helixタブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えています。 このjobの最大MPIプロセッサ数は、データの2倍のムービーフレーム数です。 粒子ボックスが比較的大きい場合、メモリ要件は重要ですが、通常は3Dオートリファインの最後の反復実行時よりも大きくはありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線損傷重みのBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。 推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と、動作軌跡と線形フィットはすべて、Polish / first3drefという大きなPDFファイルにあります /logfile.pdfを開き、【Display】ボタンから開くことができます。<br />
<br />
私たちはしばしば最初の1-2フレームではサンプルが大きく動く比較的大きな負のBファクタを観測し、その後に放射線被害が入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
何らかの形で推定されたBファクタまたはスケールファクタが奇妙に見える場合、Guinierプロットを通じて線形フィットを調べることができます。時には、Guinierプロットは、Damageタブに入力された全周波数範囲にわたって直線でよくフィットすることができません。その後、異なるパラメータでjobを再実行する価値があります。また、単一フレームの再構成が上記の20Åの周波数を超えて拡張されない場合、線は適合できず、プログラムは動作しません(NaNに推定Bファクタが与えられます)。そのような場合、Bファクタの重み付けをスキップするか、または同じタブの平均フレームBファクタ推定:1を使用して複数のフレームを平均することを選択できます。【Display】ボタンから出力された研磨粒子(shiny.star)を使ってスターファイルを視覚化して、すべてが正しく行われていることを確認することは、おそらく悪い考えではありません。<br />
<br />
何らかの形で研磨結果に満足していない場合は、【Continue Run】ボタンを使用して計算の一部を繰り返すことができます。 それをクリックすると、プログラムは次のファイルを探し、そこにあればその計算ステップをスキップして次のステップに移ります:<br />
<br />
●frame0??_half?_class001_unfil.mrc<br />
(これらの地図のいずれかが欠落している場合は、再計算されます。それらが既に存在する場合、それらの再構成計算はスキップされる。平均フレームB因子推定のオプションを変更した場合は、すべての再構成を再計算する必要があります。その場合は、古いものを続けるのではなく、新しい仕事を開始する方が良いでしょう。あるいは、既存のフレームの再構築をすべて取り除く必要があります。)<br />
<br />
●bfactors.star<br />
(このファイルが見つからない場合、プログラムは既存のすべてのフレーム再構成を読み込み、Bファクタとスケールファクタを線形フィットからGuinierプロットまで決定します。 したがって、たとえば【Damage】タブのフィットの解像度範囲を変更しても平均フレームB係数推定値を変更しなかった場合、既存のbfactors.starファイルを削除すると非常に便利なので、新しいBファクタとスケールファクタが計算されますが、すべてのマップをもう再構築する必要はありません。 これはずっと速く進むでしょう。)<br />
<br />
●shiny.star<br />
(このファイルがない場合、既存のbfactors.starファイルが読み込まれ、光沢のある粒子はこれらのパラメータに従って再加重されます。 たとえば、以前に決定されたBファクタとスケールファクタのプロットに滑らかな曲線をフィットさせることを決定し、既存のbfactors.starファイルを新しく適合したものに置き換えた場合など、これは非常に便利です。 この場合、プログラムは光沢のある粒子のみを再作成します。)<br />
<br />
=== 9.4 Re-refine the polished particles(磨かれた粒子の精密化) ===<br />
shiny.starの磨かれた粒子は、元のものと比べてシグナル対ノイズ比が向上しています。 これは、再分類するのときに役立ちます。 この時点での異なる分類戦略の詳細な説明については、Methods in Enzymology [12]の最新の章を参照してください。 この章はまだオンラインでは入手できないため、以下を使用して初期の資料をダウンロードできます。<br />
<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relionreview2016.pdf<br />
<br />
研磨自体からの再構成は、より高い分解能のマップをもたらす確率加重角度割り当てを実行するのではなく、最も可能性の高い方向に各粒子を配置するので、少なくとも、研磨された粒子を使用して最終的な[3D auto-refine]を実行します。 したがって、shiny.starを入力として3D auto-refineを繰り返してください。 この精密化の後、後処理と部分的な分解能の推定のやり直しをすることを忘れないでください。<br />
<br />
このテストケースでは、movie-refinementとparticle polishingの前に、復元は既に(ダウンサンプリングされた)データのナイキスト周波数に達しました。 したがって、後者は地図にほとんど影響しませんでした。 このデモンストレーションは、動画処理の仕方を教える上でまだ役立つことを願っています。<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-26T16:06:50Z
<p>Fisherman1: /* 7.1 Making a mask (マスク作成) */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjobリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ「2D classification」を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違い、RELION-2.0では【Display:】ボタンで適切なクラスを選択することができません。これは[Subset selection]jobタイプ上で行われます。Select classes from model.starと書かれた行の横にある【Browse】ボタンを利用して、【I/O】タブ上のClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2次元クラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。センタリングされたテンプレートが自動検出中に必要となる一方で、2D classification実行時ではクラス平均はセンタリングされないかもしれないので、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
これは、スペクトルノイズ強度とスケールファクターの推定が不安定なことで、それぞれの電子顕微鏡写真にある粒子が非常に少ない場合に便利なオプションです。デフォルトでは、スケールファクターの推定は顕微鏡写真ごとにそれぞれ計算されます。このオプションは計算実行時、複数の顕微鏡写真の粒子を一緒に計算してグループ化することが可能です。RELIONはクラス分類や自動精密化実行の際にグループがとても小さくなっている場合に警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionカラムに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子のクラス平均を4〜6つ選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
[Auto-picking]jobタイプにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての顕微鏡写真で自動検出を実行する前に、【autopicking】タブ上でPicking threshold、Minimum inter-particle distance、Maximum stddev noise、3つのメインパラメーターを最適化する必要があります。これは時間節約のために、数枚の顕微鏡写真でのみ行われます。<br />
<br />
そのため、2〜3つの顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。[Subset selection]jobタイプで行うには2つの方法があります。OR select from picked coords: の行からManualPick/job004/coords_suffix_manualpick.starを選択、その後左の選択ボックスを使用して2枚の顕微鏡写真のみを選択できます。メニューオプションのInvert selectionでこの作業が便利になるかもしれないということを覚えておいてください。2〜4つの適切な顕微鏡写真を選択したとき、例えばデフォーカスの大きさや氷の厚さはメニューからSave selectionを選択することを忘れないでください。もう1つの方法は、[Subset selection]jobタイプの【I/O】タブからOR select from micrographs.star: の行からCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択し、右クリックメニューからSave STAR with selected imagesを選択して下さい。どんなオプションを選んでも、Select jobへの2mics4autopickのようなエイリアスは意味があるのでしょうか?<br />
<br />
[Auto-picking]jobタイプの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
("Einsteinfrom-noise"の結果を得るために、データから得ようとしている最終的な解像度よりも大幅に低いローパスフィルターを使用することは非常に重要です)<br />
● Highpass filter (A): -1<br />
(たとえば200などの正の値を渡した場合、リファレンスは顕微鏡写真はautopickingよりも高いハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(負の値を渡した場合、入力した顕微鏡写真と同じスケールであると認識します。そうでない場合、例えば粒子を抜き出す上でのリファレンスを作るために使用される粒子をリスケールしたため、正しいピクセルサイズの正の値をここのリファレンスに追加します。)<br />
● Mask diameter (A): 200<br />
([2D classification] jobタイプのときに使った値と同じ値が使えます)<br />
● Angular sampling (deg): 5<br />
(この値はどんな場合でもほとんど正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒いので、使用するリファレンスは白を利用します)<br />
● Are References CTF corrected? Yes<br />
(CTF補正で2Dクラス平均を行ったため)<br />
● Ignore CTFs until first peak: No<br />
([2D classification]jobでもリファレンス作製のために使用した場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeak-searchアルゴリズムのためのFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは、隣接する2つの粒子間の最大許容距離です。反復的クラスタリングアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素領域や非常に汚染されてる特徴が見て取れる領域のピッキングを防止するのに有効です。標準化された顕微鏡写真のバックグラウンド標準偏差がこの値より高い領域のピークは無視される。効果的な値は1.0から1.2の範囲であることが多いです。バックグラウンド標準偏差が高いため、ピークを除去するためにこの機能をオフにするには値を-1にして下さい。)<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動ピッキングアルゴリズムは顕微鏡写真をリファレンスにおいてのローパスフィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の間の値は顕微鏡写真のサイズの画分の結果になります。これはshrink=1(縮小しない)にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(適切なGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。複数のMPI-processorsを使う場合(そうでない場合も)は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して【Running】タブでひとつのMPI processorを使って動かして下さい。おそらくoptimise_paramsのようなエイリアスが有効かもしれません。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真とリファレンスごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環するリファレンスと全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を利用したより高速なpeak-detectionアルゴリズムに従っています。これらのパラメータは最適化する必要があるため、プログラムはReferencesタブで指定されているようにいわゆるFROMマップを作成します。これらはリファレンスごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動ピッキングプログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より高速にピッキングするパラメータになるように最適化するために使用されます。。最初に、動作させ終えたばかりのjobで【Display:】ボタンから coords_sufix_autopick オプションを使って、現在の設定でオートピッキングされた粒子を調べます。ディスプレイウィンドウは、最後に実行した[Manual picking]jobのパラメーター(サイズやシグマコントラストなど)を利用することに注意しておいて下さい。実際に[Manual picking]jobタイプでこれらのパラメーターを変更でき、左上の jobs メニューから Save job settings オプションで設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjobを実行すると、以前と同じように【pick】と【CTF】ボタンを持つ同様のGUIが生成されます。表示ウィンドウから両方の顕微鏡写真を開き、粒子をより多くか、少なく検出するか(すなわち、しきい値を小さくするか大きくするか)と、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)を決定します。それぞれの粒子は赤(低いFOM値)から青(高いFOM値)に色付けされることに注意して下さい。次のステップに進む間に、両方の顕微鏡写真の表示ウィンドウを開いたままにすることができます。<br />
<br />
[Finished jobs]から、AutoPick/optimise_params jobを選択して下さい。そして【autopicking】タブ上でパラメーターを変更して下さい。次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した時、全てのFOMの再計算の代わりに、以前書きだされたFOMマップをディスクから再読み込みします。新しい座標のその後の計算は、数秒で実行されます。以降は、新しい座標セットを読み込むために、顕微鏡写真の表示ウィンドウ上で右クリックメニューから Reload coordinates を選択して下さい。この方法は2つのパラメーターを手早く最適化できます。<br />
<br />
3つのパラメータをすべて使いこなして、ピッキング結果をどのように変更するかを確認してください。すべての顕微鏡写真の自動ピッキングに使用するパラメータがわかったら、GUIの左上にあるbrowser jobタイプの[Auto-picking]オプションをクリックして、【Run now!】。【I/O】タブ上で、入力した顕微鏡写真のSTARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは並列に(FOMマップが書き出せされてないなら)実行されるかもしれない。【Running】タブで、自動ピッキングを実行するコアの数を指定します。MPIプロセッサの最大有効数は、入力したSTARファイルの顕微鏡写真の数となります。<br />
<br />
FOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあることに注意して下さい。FOMマップを読み込みまたは書き出し、[Continue now]ボタンをクリックすることで、プログラムは(一般的には少数の)全ての入力した顕微鏡写真を再度ピッキングします。しかし、FOMマップの読み込みまたは書き込みをしない場合、すなわち、自動ピッキングを全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動ピッキングを行っていない顕微鏡写真のみ再検出します。これはスケジュール化されたjobの反復にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけ動作させる代わりとして)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上で[Auto-picking]をクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopick オプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真上の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使って粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
ひとたび全部の結果を満たしたら、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle clean オプションを使うことができます。<br />
<br />
ひとたび座標全体セットを満たしたら、以前のデータを全て保ちつつ、[Partcle extraction]jobを再実行する必要があるが、Input coordinatesを自動検出で新しく生成されたものに変変えて下さい。これは下記のよりよい精密のために使われる初期シングル粒子データセットを作成します。おそらく、allmics_autopicked のようなエイリアスが有意義です。<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0では、コマンドライン引数 --shrink を通して顕微鏡写真をフィルタリングするオプションを実装しています。最もシンプルな使い方は --shrink 0 と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrink の初期状態の値は1.0ですが、これは反映がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動ピッキングと同一の動作をします<br />
<br />
● --shrink val = 0 では、顕微鏡写真をテンプレートリファレンスのローパスと同じように、--lowpass までpassさせる結果になります。これはシングル粒子解析(らせん状検出のためではないが)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 では、size= val ·micrograph size にした結果になります(valとは顕微鏡写真のオリジナルサイズを適用させたスケールファクターです)<br />
<br />
● --shrink val > 1 では、size = val − (val mod 2)、すなわち、valより小さい最小の偶数の整数値になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、致命的ではありませんが警告をならす結果となります。RELIONの自動ピッキングは多くのFFTを実行するため、顕微鏡写真のサイズもFFT計算の大きな落とし穴を避けるために自動的に調整されるようになりました。これの注釈と上書きの仕方は、ユーザーが実行する各自動ピッキングの最初の出力に表示されます。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには、各粒子とそれらの整列されたCTF修正リファレンスとの間の差異に基づいて粒子を素早く分類する機能もあります。ソートプログラムは[Particle sorting]jobタイプからアクセスすることができ、それぞれの粒子でリファレンスが利用できるときなら、いつでも動かせます。たとえば、[Auto-picking]、[2D classification]、[3D classificationo]、[3D auto-refaine]の後などです。その使用方法を示すために、自動ピッキングの後に実行します。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動ピッキング後に抽出プログラムによって生成されます。[2D classification]、[3D classification]または、[3D auto-refine]jobの場合は、最後の反復での_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が [2D classification]、[3D classification]、[3D auto-refine]job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(抽出された粒子のための座標を与える自動ピッキングjobに使われたリファレンスを入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリに particles_sort.star と呼ばれるインプットファイルと同じファイルを生成しますが、rlnPartileSelectZScore と呼ばれるカラムの追加があります。[Subset selection]jobタイプの OR select from particles.star とある行で、このファイルを選択することが出来ます。ポップアップ表示ウィンドウ内にて、その新しいカラムに基づいて粒子を可視化できます。ディスプレイの上に良い粒子、下に良くない粒子をもつために強度の傾向が出てきます。下から上にスクロールして、下のすべての粒子を破棄する必要があるポイントを決定でき、右マウスポップアップメニューを使用して Select all above および、または1つずつ粒子を選択することができます。右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この問題は どのくらい寛容でいられるかです。RELIONの3Dマルチリファレンス精密手順は強力な教師無し3次元分類へのアプローチを提供している。しかし、まずは低解像度の単一コンセンサスモデルが必要です。初期の結晶構造(PDB-ID 3I3E)から生成された低分解能のベータガラクトシダーゼモデルを使用します。これはすでに projectディレクトリの中に 3i3e_lp50A.mrcという名前で入っています。典型的なプロジェクトでは、良い初期モデルがないかもしれません。その場合は違うプログラムから別のモデルを持ってくる必要があります。その場合は、RELIONと同じように別のプログラムで生成する必要がありますが、初期モデル生成は行いません。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handlerというプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまいません。<br />
<br />
この場合、[Import]という機能を使って、直接プロジェクトに初期モデルをインポート出来きます。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使います。<br />
<br />
=== 5.1 Running the job===<br />
<br />
教師無しの3D分類は、3D分類jobタイプから実行可能です。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供した場所だとします。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類への偏りを最小限にする働きがあります。)<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
(RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
<br />
・Initial low-pass filter (A): 50<br />
(リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけません。[9]で説明したように、初期マップをできる限りフィルタリングする必要があります。 小さい粒子では通常40〜60Åの値を使用します。)<br />
<br />
・Symmetry: C1<br />
(このサンプルにはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。不良粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
(このモデルはPDBファイルで作成されているため、振幅はCTFの影響を受けていません。これは「CTF修正済み」とみなすことができます。ほとんどの他のEMパッケージから作られたモデルは、適切な低周波振幅補正を実行するパッケージが多くないため、ほとんどの場合CTF補正されていないことが多いです。(いくつかは補正されているかもしれません:したがって、モデルを通ってスライスをチェックすることができます。もし黒で白く見えるならば、モデルはおそらく適切にCTF修正されたものでしょう;また、ブラックハローでグレイアッシュに見えるならそのモデルはおそらくCTF補正されていないでしょう。)これまでCTF補正を行ったモデルは、適切に補正されています。)<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
(参照を作成するために使用した[2D分類]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。)<br />
<br />
・Number of iterations: 25<br />
(これは今後変更する必要はありません。)<br />
<br />
・Regularisation parameter T: 4<br />
(Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
<br />
・Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。)<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。[2D classification]のjobタイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与えます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、[Subset selection]を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2Dクラス化の実行時と同じです。(実際に2D,3Dクラス精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnplotがインストールされているのであれば、以下の通りに入力して下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は解像度を推定するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己高揚による過剰適合を避けることができます[13]。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで[3D auto-refine]jobタイプを選択してください。GUIでの入力引数は大部分は[3D classification]jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプリング率は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング率が自動的に増加されます。したがって、8面体または正20面体対称よりも小さい全ての精密化では、一般的に初期値の角度である7.5度のサンプルを使用し、部分的な調査では1.8度のサンプルから行います。より正確な対称の精密化を行うためにのみ、3.7度でのサンプリングを行い、部分的な調査では0.9度ごとにサンプリングを行います。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精密化は、[Post-processing]jobタイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作では【I/O】タブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。他にも、伸長された分子や、マスクを使用し、小さい部分の精密化に注目した時などに役立ちます。このような場合、マスクが使用されていない代表的なFSCは精密化の際の解像度が低く見積もられます。精密化を行っている最中であるため、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、[3D classification]実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精密化されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらく違いがほとんどありません。さらに、マップ内で高周波の精密化へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精密な”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精密化で2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、奇数のMPI処理装置のを使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。一点に収束した場合にのみ、run_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。<br />
<br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。<br />
<br />
例えば、以下のように試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3D自動精密化の実行後、マップをシャープに必要があります。それも、自動精密化物の内部の至適基準FSCカーブはマスク化されていないマップのみ使います(Use solvent-flattened FSCsオプションを使っていない場合に限ります)。これは実際の精密化中に、実際の解像度は概算値を下回っているということを意味しています。なぜなら、溶媒領域のノイズがFSCカーブよりも低くなるからです。RELIONにおけるBファクターでの鮮明化と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、タンパク質の末端と溶媒領域の開始点を精密化するためのマスクを作る必要があります。これは[Mask Creation]ジョブタイプを使って行います。<br />
<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3D自動精密化が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。【Mask】タブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶媒マスクのために良い選択と思われます)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われます)<br />
● Initial binarisation threshold: 0.02<br />
(これは例としてタンパク質領域の外側にノイズスポットが完全になく表示するキメラのように、ローパスフィルターのかかったマップの描写でのしきい値となります。適切なスポットを見つけるために、しきい値を上げたり下げたりしてみて下さい。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54オプションを付与させてrelion_image_handlerと呼ばれるコマンドラインプログラムを使用できることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりです)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値は白黒画像マスクを生成するのに使われます。このマップ中のホワイト値は全方向の多くのピクセルで増加します。これを使用して、最初のバイナリマスクのサイズを小さくします。)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスクに余弦形状のソフトエッジを配置します。これは、とても鋭いマスクにかなり繊細である可能性があるFSCカーブに、マスクが及ぼす影響を計測する補正手順として重要です。マスクの生成は相対的に早いので、しばしば解像度の最も適した概算を得るためのマスクパラメーターと共に使います。)<br />
<br />
【Helix】タブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通した切片を見たり、UCSFキメラにマスクを読み込ませることができます。後者は、マスクが構造全体をカプセル化するが、マスク内に多くの溶媒を残さないことを確認するために、自動精密手順のマップと一緒に良いアイデアになるかもしれません。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing]jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%異なっていたということがわかることがあります。RELION内では、この時までになしたもの全ては、まだ一貫しています。そのためマップの再精密化や、データのクラスの再分類をする必要はありません。正確なマップと最終解像度の推定のために必要なことが、ここに正しいピクセルサイズを提供することです。)<br />
<br />
【Sharpen】タブで以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、自身のディテクターのために、プロジェクトディレクトリの中に保存されている mtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
● Estimate B-factor automatically: Yes<br />
この手順は本誌[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要がある。もしマップの解像度が10Åに満たない場合、独自の “ad-hoc” Bファクターを代わりに使う必要があるかもしれない。<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
● Use your own B-factor? No<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションはときに、全体のマップ解像度を超えるような解像度へと拡張するマップ範囲を解析するのに便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3dref のようなエイリアスを使用して下さい。【Display】ボタンを使って、後処理されるマップと、この構造のFSCカーブとGuinierプロットを含んだPDFを通して、スライズを表示します。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D自動精密化の手順となる収束したマップでの全てのα-へリックスの場所を簡単に見ることが出来ます。解像度の推定は、以前に発表された[2]のフェイズランダムの手順に基づいてます。フェイズランダムマップのFSC(赤いカーブ)が、多かれ少なかれ、推定していた後処理マップの解像度のゼロ点であることを確認してください。そうでない場合は、マスクが鮮明すぎるか、細部の描写が多すぎます。この場合は。強いローパスフィルターや、以前の[Mask creation]ステップでの、より広く、より薄いマスクを使用し、後処理を繰り返して下さい。実際に少し薄いマスクを作りたくなるかもしれないので、その場合はエッジがだいたい5ピクセルになるように試してみてください。このために【Continue now】ボタンを使った場合、以前の結果が上書きされます。左側にあるjobタイプブラウザをクリックし、【Run now!】ボタンで新しい出力ディレクトリが出来ます。<br />
<br />
== 8 Local-resolution estimate(ローカル解像度推定) ==<br />
定例処理プログラムから解像度の推定は広域的な推定となります。しかしながら、シングルナンバーは高分子複合体の再構築でしばしば観測される解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する効果的なプログラムを記述しています[4]。RELION は、[Local resolution]jobタイプを通してプログラムのラッパーを実装しています。【I/O】タブ上で以下のように設定してください。<br />
<br />
● One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size: 3.54<br />
<br />
(正しいピクセルサイズであると考えたモデルを構築し始めたときに、実際には数パーセントずれていたことがわかることがあります。RELION内では、この時点までの全てが一貫しています。そのため、再度、マップの精密化とデータの分類をする必要はありません。正確なマップと最終的な解像度推定のために正しいピクセルサイズをここで指定するだけで良いです。)<br />
<br />
【ResMap】タブ上で以下のように設定してください。<br />
<br />
● ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(RESMAP実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
● P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
● Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7Åです)<br />
<br />
● Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
● Resolution step size (A): 0.5<br />
<br />
(ステップ数を増やせば、より正確なローカル解像度マップの結果が導き出せますが、更に実行時間は長くなります。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAPのGUIからフィルターボタンを利用して下さい。しかしながら、RELION上で生成されたマップに変更を加える必要がないことにしばしば気がつくでしょう。RESMAPプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、volume data valueで選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズ(閲覧)するために使われます。特別な場合では、データが低解像度処理され、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル解像度の変化は見るために良いというわけではありません。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing(粒子の洗練) ===<br />
粒子のpolishingアルゴリズムは、MovieRefine/first3dref/run_avg7_off1_data.star から(おそらく非常にノイズの多い)移動軌跡(movement tracks)を取得し、それを利用して直線にフィットさせます。これらのトラックのノイズをさらに減らすために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観測も利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の(ピクセルの)標準偏差は、ユーザによって決まります。第2のステップでは、polishingアルゴリズムは、Bファクターおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対ノイズ比が増加するので、"polished"または"shiny"だと言われます。<br />
<br />
[Particle polishing]jobタイプの【I/O】タブにて以下のようにして下さい<br />
●Input STAR file with aligned movies: MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子がより大きければ、ムービーの精密化からの移動軌跡の騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセル程をしばしば使用します。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単にコンピューターリソースを節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、シングルフレームの再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 Bファクターの形状を信頼して推定するために適切な高解像度を得られない再構成があれば、このオプションを使用して3、5ムービーフレーム7つを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、[Particle extraction]jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
Helixタブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えています。 このjobの最大MPIプロセッサ数は、データの2倍のムービーフレーム数です。 粒子ボックスが比較的大きい場合、メモリ要件は重要ですが、通常は3Dオートリファインの最後の反復実行時よりも大きくはありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線損傷重みのBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。 推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と、動作軌跡と線形フィットはすべて、Polish / first3drefという大きなPDFファイルにあります /logfile.pdfを開き、【Display】ボタンから開くことができます。<br />
<br />
私たちはしばしば最初の1-2フレームではサンプルが大きく動く比較的大きな負のBファクタを観測し、その後に放射線被害が入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
何らかの形で推定されたBファクタまたはスケールファクタが奇妙に見える場合、Guinierプロットを通じて線形フィットを調べることができます。時には、Guinierプロットは、Damageタブに入力された全周波数範囲にわたって直線でよくフィットすることができません。その後、異なるパラメータでjobを再実行する価値があります。また、単一フレームの再構成が上記の20Åの周波数を超えて拡張されない場合、線は適合できず、プログラムは動作しません(NaNに推定Bファクタが与えられます)。そのような場合、Bファクタの重み付けをスキップするか、または同じタブの平均フレームBファクタ推定:1を使用して複数のフレームを平均することを選択できます。【Display】ボタンから出力された研磨粒子(shiny.star)を使ってスターファイルを視覚化して、すべてが正しく行われていることを確認することは、おそらく悪い考えではありません。<br />
<br />
何らかの形で研磨結果に満足していない場合は、【Continue Run】ボタンを使用して計算の一部を繰り返すことができます。 それをクリックすると、プログラムは次のファイルを探し、そこにあればその計算ステップをスキップして次のステップに移ります:<br />
<br />
●frame0??_half?_class001_unfil.mrc<br />
(これらの地図のいずれかが欠落している場合は、再計算されます。それらが既に存在する場合、それらの再構成計算はスキップされる。平均フレームB因子推定のオプションを変更した場合は、すべての再構成を再計算する必要があります。その場合は、古いものを続けるのではなく、新しい仕事を開始する方が良いでしょう。あるいは、既存のフレームの再構築をすべて取り除く必要があります。)<br />
<br />
●bfactors.star<br />
(このファイルが見つからない場合、プログラムは既存のすべてのフレーム再構成を読み込み、Bファクタとスケールファクタを線形フィットからGuinierプロットまで決定します。 したがって、たとえば【Damage】タブのフィットの解像度範囲を変更しても平均フレームB係数推定値を変更しなかった場合、既存のbfactors.starファイルを削除すると非常に便利なので、新しいBファクタとスケールファクタが計算されますが、すべてのマップをもう再構築する必要はありません。 これはずっと速く進むでしょう。)<br />
<br />
●shiny.star<br />
(このファイルがない場合、既存のbfactors.starファイルが読み込まれ、光沢のある粒子はこれらのパラメータに従って再加重されます。 たとえば、以前に決定されたBファクタとスケールファクタのプロットに滑らかな曲線をフィットさせることを決定し、既存のbfactors.starファイルを新しく適合したものに置き換えた場合など、これは非常に便利です。 この場合、プログラムは光沢のある粒子のみを再作成します。)<br />
<br />
=== 9.4 Re-refine the polished particles(磨かれた粒子の精密化) ===<br />
shiny.starの磨かれた粒子は、元のものと比べてシグナル対ノイズ比が向上しています。 これは、再分類するのときに役立ちます。 この時点での異なる分類戦略の詳細な説明については、Methods in Enzymology [12]の最新の章を参照してください。 この章はまだオンラインでは入手できないため、以下を使用して初期の資料をダウンロードできます。<br />
<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relionreview2016.pdf<br />
<br />
研磨自体からの再構成は、より高い分解能のマップをもたらす確率加重角度割り当てを実行するのではなく、最も可能性の高い方向に各粒子を配置するので、少なくとも、研磨された粒子を使用して最終的な[3D auto-refine]を実行します。 したがって、shiny.starを入力として3D auto-refineを繰り返してください。 この精密化の後、後処理と部分的な分解能の推定のやり直しをすることを忘れないでください。<br />
<br />
このテストケースでは、movie-refinementとparticle polishingの前に、復元は既に(ダウンサンプリングされた)データのナイキスト周波数に達しました。 したがって、後者は地図にほとんど影響しませんでした。 このデモンストレーションは、動画処理の仕方を教える上でまだ役立つことを願っています。<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-26T16:03:43Z
<p>Fisherman1: /* 前書き */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjobリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ「2D classification」を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違い、RELION-2.0では【Display:】ボタンで適切なクラスを選択することができません。これは[Subset selection]jobタイプ上で行われます。Select classes from model.starと書かれた行の横にある【Browse】ボタンを利用して、【I/O】タブ上のClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2次元クラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。センタリングされたテンプレートが自動検出中に必要となる一方で、2D classification実行時ではクラス平均はセンタリングされないかもしれないので、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
これは、スペクトルノイズ強度とスケールファクターの推定が不安定なことで、それぞれの電子顕微鏡写真にある粒子が非常に少ない場合に便利なオプションです。デフォルトでは、スケールファクターの推定は顕微鏡写真ごとにそれぞれ計算されます。このオプションは計算実行時、複数の顕微鏡写真の粒子を一緒に計算してグループ化することが可能です。RELIONはクラス分類や自動精密化実行の際にグループがとても小さくなっている場合に警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionカラムに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子のクラス平均を4〜6つ選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
[Auto-picking]jobタイプにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての顕微鏡写真で自動検出を実行する前に、【autopicking】タブ上でPicking threshold、Minimum inter-particle distance、Maximum stddev noise、3つのメインパラメーターを最適化する必要があります。これは時間節約のために、数枚の顕微鏡写真でのみ行われます。<br />
<br />
そのため、2〜3つの顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。[Subset selection]jobタイプで行うには2つの方法があります。OR select from picked coords: の行からManualPick/job004/coords_suffix_manualpick.starを選択、その後左の選択ボックスを使用して2枚の顕微鏡写真のみを選択できます。メニューオプションのInvert selectionでこの作業が便利になるかもしれないということを覚えておいてください。2〜4つの適切な顕微鏡写真を選択したとき、例えばデフォーカスの大きさや氷の厚さはメニューからSave selectionを選択することを忘れないでください。もう1つの方法は、[Subset selection]jobタイプの【I/O】タブからOR select from micrographs.star: の行からCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択し、右クリックメニューからSave STAR with selected imagesを選択して下さい。どんなオプションを選んでも、Select jobへの2mics4autopickのようなエイリアスは意味があるのでしょうか?<br />
<br />
[Auto-picking]jobタイプの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
("Einsteinfrom-noise"の結果を得るために、データから得ようとしている最終的な解像度よりも大幅に低いローパスフィルターを使用することは非常に重要です)<br />
● Highpass filter (A): -1<br />
(たとえば200などの正の値を渡した場合、リファレンスは顕微鏡写真はautopickingよりも高いハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(負の値を渡した場合、入力した顕微鏡写真と同じスケールであると認識します。そうでない場合、例えば粒子を抜き出す上でのリファレンスを作るために使用される粒子をリスケールしたため、正しいピクセルサイズの正の値をここのリファレンスに追加します。)<br />
● Mask diameter (A): 200<br />
([2D classification] jobタイプのときに使った値と同じ値が使えます)<br />
● Angular sampling (deg): 5<br />
(この値はどんな場合でもほとんど正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒いので、使用するリファレンスは白を利用します)<br />
● Are References CTF corrected? Yes<br />
(CTF補正で2Dクラス平均を行ったため)<br />
● Ignore CTFs until first peak: No<br />
([2D classification]jobでもリファレンス作製のために使用した場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeak-searchアルゴリズムのためのFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは、隣接する2つの粒子間の最大許容距離です。反復的クラスタリングアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素領域や非常に汚染されてる特徴が見て取れる領域のピッキングを防止するのに有効です。標準化された顕微鏡写真のバックグラウンド標準偏差がこの値より高い領域のピークは無視される。効果的な値は1.0から1.2の範囲であることが多いです。バックグラウンド標準偏差が高いため、ピークを除去するためにこの機能をオフにするには値を-1にして下さい。)<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動ピッキングアルゴリズムは顕微鏡写真をリファレンスにおいてのローパスフィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の間の値は顕微鏡写真のサイズの画分の結果になります。これはshrink=1(縮小しない)にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(適切なGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。複数のMPI-processorsを使う場合(そうでない場合も)は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して【Running】タブでひとつのMPI processorを使って動かして下さい。おそらくoptimise_paramsのようなエイリアスが有効かもしれません。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真とリファレンスごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環するリファレンスと全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を利用したより高速なpeak-detectionアルゴリズムに従っています。これらのパラメータは最適化する必要があるため、プログラムはReferencesタブで指定されているようにいわゆるFROMマップを作成します。これらはリファレンスごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動ピッキングプログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より高速にピッキングするパラメータになるように最適化するために使用されます。。最初に、動作させ終えたばかりのjobで【Display:】ボタンから coords_sufix_autopick オプションを使って、現在の設定でオートピッキングされた粒子を調べます。ディスプレイウィンドウは、最後に実行した[Manual picking]jobのパラメーター(サイズやシグマコントラストなど)を利用することに注意しておいて下さい。実際に[Manual picking]jobタイプでこれらのパラメーターを変更でき、左上の jobs メニューから Save job settings オプションで設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjobを実行すると、以前と同じように【pick】と【CTF】ボタンを持つ同様のGUIが生成されます。表示ウィンドウから両方の顕微鏡写真を開き、粒子をより多くか、少なく検出するか(すなわち、しきい値を小さくするか大きくするか)と、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)を決定します。それぞれの粒子は赤(低いFOM値)から青(高いFOM値)に色付けされることに注意して下さい。次のステップに進む間に、両方の顕微鏡写真の表示ウィンドウを開いたままにすることができます。<br />
<br />
[Finished jobs]から、AutoPick/optimise_params jobを選択して下さい。そして【autopicking】タブ上でパラメーターを変更して下さい。次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した時、全てのFOMの再計算の代わりに、以前書きだされたFOMマップをディスクから再読み込みします。新しい座標のその後の計算は、数秒で実行されます。以降は、新しい座標セットを読み込むために、顕微鏡写真の表示ウィンドウ上で右クリックメニューから Reload coordinates を選択して下さい。この方法は2つのパラメーターを手早く最適化できます。<br />
<br />
3つのパラメータをすべて使いこなして、ピッキング結果をどのように変更するかを確認してください。すべての顕微鏡写真の自動ピッキングに使用するパラメータがわかったら、GUIの左上にあるbrowser jobタイプの[Auto-picking]オプションをクリックして、【Run now!】。【I/O】タブ上で、入力した顕微鏡写真のSTARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは並列に(FOMマップが書き出せされてないなら)実行されるかもしれない。【Running】タブで、自動ピッキングを実行するコアの数を指定します。MPIプロセッサの最大有効数は、入力したSTARファイルの顕微鏡写真の数となります。<br />
<br />
FOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあることに注意して下さい。FOMマップを読み込みまたは書き出し、[Continue now]ボタンをクリックすることで、プログラムは(一般的には少数の)全ての入力した顕微鏡写真を再度ピッキングします。しかし、FOMマップの読み込みまたは書き込みをしない場合、すなわち、自動ピッキングを全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動ピッキングを行っていない顕微鏡写真のみ再検出します。これはスケジュール化されたjobの反復にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけ動作させる代わりとして)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上で[Auto-picking]をクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopick オプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真上の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使って粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
ひとたび全部の結果を満たしたら、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle clean オプションを使うことができます。<br />
<br />
ひとたび座標全体セットを満たしたら、以前のデータを全て保ちつつ、[Partcle extraction]jobを再実行する必要があるが、Input coordinatesを自動検出で新しく生成されたものに変変えて下さい。これは下記のよりよい精密のために使われる初期シングル粒子データセットを作成します。おそらく、allmics_autopicked のようなエイリアスが有意義です。<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0では、コマンドライン引数 --shrink を通して顕微鏡写真をフィルタリングするオプションを実装しています。最もシンプルな使い方は --shrink 0 と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrink の初期状態の値は1.0ですが、これは反映がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動ピッキングと同一の動作をします<br />
<br />
● --shrink val = 0 では、顕微鏡写真をテンプレートリファレンスのローパスと同じように、--lowpass までpassさせる結果になります。これはシングル粒子解析(らせん状検出のためではないが)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 では、size= val ·micrograph size にした結果になります(valとは顕微鏡写真のオリジナルサイズを適用させたスケールファクターです)<br />
<br />
● --shrink val > 1 では、size = val − (val mod 2)、すなわち、valより小さい最小の偶数の整数値になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、致命的ではありませんが警告をならす結果となります。RELIONの自動ピッキングは多くのFFTを実行するため、顕微鏡写真のサイズもFFT計算の大きな落とし穴を避けるために自動的に調整されるようになりました。これの注釈と上書きの仕方は、ユーザーが実行する各自動ピッキングの最初の出力に表示されます。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには、各粒子とそれらの整列されたCTF修正リファレンスとの間の差異に基づいて粒子を素早く分類する機能もあります。ソートプログラムは[Particle sorting]jobタイプからアクセスすることができ、それぞれの粒子でリファレンスが利用できるときなら、いつでも動かせます。たとえば、[Auto-picking]、[2D classification]、[3D classificationo]、[3D auto-refaine]の後などです。その使用方法を示すために、自動ピッキングの後に実行します。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動ピッキング後に抽出プログラムによって生成されます。[2D classification]、[3D classification]または、[3D auto-refine]jobの場合は、最後の反復での_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が [2D classification]、[3D classification]、[3D auto-refine]job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(抽出された粒子のための座標を与える自動ピッキングjobに使われたリファレンスを入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリに particles_sort.star と呼ばれるインプットファイルと同じファイルを生成しますが、rlnPartileSelectZScore と呼ばれるカラムの追加があります。[Subset selection]jobタイプの OR select from particles.star とある行で、このファイルを選択することが出来ます。ポップアップ表示ウィンドウ内にて、その新しいカラムに基づいて粒子を可視化できます。ディスプレイの上に良い粒子、下に良くない粒子をもつために強度の傾向が出てきます。下から上にスクロールして、下のすべての粒子を破棄する必要があるポイントを決定でき、右マウスポップアップメニューを使用して Select all above および、または1つずつ粒子を選択することができます。右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この問題は どのくらい寛容でいられるかです。RELIONの3Dマルチリファレンス精密手順は強力な教師無し3次元分類へのアプローチを提供している。しかし、まずは低解像度の単一コンセンサスモデルが必要です。初期の結晶構造(PDB-ID 3I3E)から生成された低分解能のベータガラクトシダーゼモデルを使用します。これはすでに projectディレクトリの中に 3i3e_lp50A.mrcという名前で入っています。典型的なプロジェクトでは、良い初期モデルがないかもしれません。その場合は違うプログラムから別のモデルを持ってくる必要があります。その場合は、RELIONと同じように別のプログラムで生成する必要がありますが、初期モデル生成は行いません。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handlerというプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまいません。<br />
<br />
この場合、[Import]という機能を使って、直接プロジェクトに初期モデルをインポート出来きます。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使います。<br />
<br />
=== 5.1 Running the job===<br />
<br />
教師無しの3D分類は、3D分類jobタイプから実行可能です。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供した場所だとします。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類への偏りを最小限にする働きがあります。)<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
(RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
<br />
・Initial low-pass filter (A): 50<br />
(リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけません。[9]で説明したように、初期マップをできる限りフィルタリングする必要があります。 小さい粒子では通常40〜60Åの値を使用します。)<br />
<br />
・Symmetry: C1<br />
(このサンプルにはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。不良粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
(このモデルはPDBファイルで作成されているため、振幅はCTFの影響を受けていません。これは「CTF修正済み」とみなすことができます。ほとんどの他のEMパッケージから作られたモデルは、適切な低周波振幅補正を実行するパッケージが多くないため、ほとんどの場合CTF補正されていないことが多いです。(いくつかは補正されているかもしれません:したがって、モデルを通ってスライスをチェックすることができます。もし黒で白く見えるならば、モデルはおそらく適切にCTF修正されたものでしょう;また、ブラックハローでグレイアッシュに見えるならそのモデルはおそらくCTF補正されていないでしょう。)これまでCTF補正を行ったモデルは、適切に補正されています。)<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
(参照を作成するために使用した[2D分類]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。)<br />
<br />
・Number of iterations: 25<br />
(これは今後変更する必要はありません。)<br />
<br />
・Regularisation parameter T: 4<br />
(Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
<br />
・Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。)<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。[2D classification]のjobタイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与えます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、[Subset selection]を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2Dクラス化の実行時と同じです。(実際に2D,3Dクラス精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnplotがインストールされているのであれば、以下の通りに入力して下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は解像度を推定するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己高揚による過剰適合を避けることができます[13]。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで[3D auto-refine]jobタイプを選択してください。GUIでの入力引数は大部分は[3D classification]jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプリング率は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング率が自動的に増加されます。したがって、8面体または正20面体対称よりも小さい全ての精密化では、一般的に初期値の角度である7.5度のサンプルを使用し、部分的な調査では1.8度のサンプルから行います。より正確な対称の精密化を行うためにのみ、3.7度でのサンプリングを行い、部分的な調査では0.9度ごとにサンプリングを行います。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精密化は、[Post-processing]jobタイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作では【I/O】タブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。他にも、伸長された分子や、マスクを使用し、小さい部分の精密化に注目した時などに役立ちます。このような場合、マスクが使用されていない代表的なFSCは精密化の際の解像度が低く見積もられます。精密化を行っている最中であるため、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、[3D classification]実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精密化されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらく違いがほとんどありません。さらに、マップ内で高周波の精密化へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精密な”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精密化で2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、奇数のMPI処理装置のを使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。一点に収束した場合にのみ、run_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。<br />
<br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。<br />
<br />
例えば、以下のように試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3D自動精密化の実行後、マップをシャープに必要があります。それも、自動精密化物の内部の至適基準FSCカーブはマスク化されていないマップのみ使います(Use solvent-flattened FSCsオプションを使っていない場合に限ります)。これは実際の精密化中に、実際の解像度は概算値を下回っているということを意味しています。なぜなら、溶媒領域のノイズがFSCカーブよりも低くなるからです。RELIONにおけるBファクターでの鮮明化と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、タンパク質の末端と溶媒領域の開始点を精密化するためのマスクを作る必要があります。これは[Mask Creation]ジョブタイプを使って行います。<br />
<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3D自動精密化が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。【Mask】タブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶媒マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例としてタンパク質領域の外側にノイズスポットが完全になく表示するキメラのように、ローパスフィルターのかかったマップの描写でのしきい値となります。適切なスポットを見つけるために、しきい値を上げたり下げたりしてみて下さい。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54オプションを付与させてrelion_image_handlerと呼ばれるコマンドラインプログラムを使用できることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりです)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値は白黒画像マスクを生成するのに使われます。このマップ中のホワイト値は全方向の多くのピクセルで増加します。これを使用して、最初のバイナリマスクのサイズを小さくします。)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスクに余弦形状のソフトエッジを配置します。これは、とても鋭いマスクにかなり繊細である可能性があるFSCカーブに、マスクが及ぼす影響を計測する補正手順として重要です。マスクの生成は相対的に早いので、しばしば解像度の最も適した概算を得るためのマスクパラメーターと共に使います。)<br />
<br />
【Helix】タブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通した切片を見たり、UCSFキメラにマスクを読み込ませることができます。後者は、マスクが構造全体をカプセル化するが、マスク内に多くの溶媒を残さないことを確認するために、自動精密手順のマップと一緒に良いアイデアになるかもしれません。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing]jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%異なっていたということがわかることがあります。RELION内では、この時までになしたもの全ては、まだ一貫しています。そのためマップの再精密化や、データのクラスの再分類をする必要はありません。正確なマップと最終解像度の推定のために必要なことが、ここに正しいピクセルサイズを提供することです。)<br />
<br />
【Sharpen】タブで以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、自身のディテクターのために、プロジェクトディレクトリの中に保存されている mtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
● Estimate B-factor automatically: Yes<br />
この手順は本誌[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要がある。もしマップの解像度が10Åに満たない場合、独自の “ad-hoc” Bファクターを代わりに使う必要があるかもしれない。<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
● Use your own B-factor? No<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションはときに、全体のマップ解像度を超えるような解像度へと拡張するマップ範囲を解析するのに便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3dref のようなエイリアスを使用して下さい。【Display】ボタンを使って、後処理されるマップと、この構造のFSCカーブとGuinierプロットを含んだPDFを通して、スライズを表示します。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D自動精密化の手順となる収束したマップでの全てのα-へリックスの場所を簡単に見ることが出来ます。解像度の推定は、以前に発表された[2]のフェイズランダムの手順に基づいてます。フェイズランダムマップのFSC(赤いカーブ)が、多かれ少なかれ、推定していた後処理マップの解像度のゼロ点であることを確認してください。そうでない場合は、マスクが鮮明すぎるか、細部の描写が多すぎます。この場合は。強いローパスフィルターや、以前の[Mask creation]ステップでの、より広く、より薄いマスクを使用し、後処理を繰り返して下さい。実際に少し薄いマスクを作りたくなるかもしれないので、その場合はエッジがだいたい5ピクセルになるように試してみてください。このために【Continue now】ボタンを使った場合、以前の結果が上書きされます。左側にあるjobタイプブラウザをクリックし、【Run now!】ボタンで新しい出力ディレクトリが出来ます。<br />
<br />
== 8 Local-resolution estimate(ローカル解像度推定) ==<br />
定例処理プログラムから解像度の推定は広域的な推定となります。しかしながら、シングルナンバーは高分子複合体の再構築でしばしば観測される解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する効果的なプログラムを記述しています[4]。RELION は、[Local resolution]jobタイプを通してプログラムのラッパーを実装しています。【I/O】タブ上で以下のように設定してください。<br />
<br />
● One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size: 3.54<br />
<br />
(正しいピクセルサイズであると考えたモデルを構築し始めたときに、実際には数パーセントずれていたことがわかることがあります。RELION内では、この時点までの全てが一貫しています。そのため、再度、マップの精密化とデータの分類をする必要はありません。正確なマップと最終的な解像度推定のために正しいピクセルサイズをここで指定するだけで良いです。)<br />
<br />
【ResMap】タブ上で以下のように設定してください。<br />
<br />
● ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(RESMAP実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
● P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
● Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7Åです)<br />
<br />
● Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
● Resolution step size (A): 0.5<br />
<br />
(ステップ数を増やせば、より正確なローカル解像度マップの結果が導き出せますが、更に実行時間は長くなります。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAPのGUIからフィルターボタンを利用して下さい。しかしながら、RELION上で生成されたマップに変更を加える必要がないことにしばしば気がつくでしょう。RESMAPプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、volume data valueで選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズ(閲覧)するために使われます。特別な場合では、データが低解像度処理され、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル解像度の変化は見るために良いというわけではありません。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing(粒子の洗練) ===<br />
粒子のpolishingアルゴリズムは、MovieRefine/first3dref/run_avg7_off1_data.star から(おそらく非常にノイズの多い)移動軌跡(movement tracks)を取得し、それを利用して直線にフィットさせます。これらのトラックのノイズをさらに減らすために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観測も利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の(ピクセルの)標準偏差は、ユーザによって決まります。第2のステップでは、polishingアルゴリズムは、Bファクターおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対ノイズ比が増加するので、"polished"または"shiny"だと言われます。<br />
<br />
[Particle polishing]jobタイプの【I/O】タブにて以下のようにして下さい<br />
●Input STAR file with aligned movies: MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子がより大きければ、ムービーの精密化からの移動軌跡の騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセル程をしばしば使用します。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単にコンピューターリソースを節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、シングルフレームの再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 Bファクターの形状を信頼して推定するために適切な高解像度を得られない再構成があれば、このオプションを使用して3、5ムービーフレーム7つを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、[Particle extraction]jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
Helixタブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えています。 このjobの最大MPIプロセッサ数は、データの2倍のムービーフレーム数です。 粒子ボックスが比較的大きい場合、メモリ要件は重要ですが、通常は3Dオートリファインの最後の反復実行時よりも大きくはありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線損傷重みのBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。 推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と、動作軌跡と線形フィットはすべて、Polish / first3drefという大きなPDFファイルにあります /logfile.pdfを開き、【Display】ボタンから開くことができます。<br />
<br />
私たちはしばしば最初の1-2フレームではサンプルが大きく動く比較的大きな負のBファクタを観測し、その後に放射線被害が入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
何らかの形で推定されたBファクタまたはスケールファクタが奇妙に見える場合、Guinierプロットを通じて線形フィットを調べることができます。時には、Guinierプロットは、Damageタブに入力された全周波数範囲にわたって直線でよくフィットすることができません。その後、異なるパラメータでjobを再実行する価値があります。また、単一フレームの再構成が上記の20Åの周波数を超えて拡張されない場合、線は適合できず、プログラムは動作しません(NaNに推定Bファクタが与えられます)。そのような場合、Bファクタの重み付けをスキップするか、または同じタブの平均フレームBファクタ推定:1を使用して複数のフレームを平均することを選択できます。【Display】ボタンから出力された研磨粒子(shiny.star)を使ってスターファイルを視覚化して、すべてが正しく行われていることを確認することは、おそらく悪い考えではありません。<br />
<br />
何らかの形で研磨結果に満足していない場合は、【Continue Run】ボタンを使用して計算の一部を繰り返すことができます。 それをクリックすると、プログラムは次のファイルを探し、そこにあればその計算ステップをスキップして次のステップに移ります:<br />
<br />
●frame0??_half?_class001_unfil.mrc<br />
(これらの地図のいずれかが欠落している場合は、再計算されます。それらが既に存在する場合、それらの再構成計算はスキップされる。平均フレームB因子推定のオプションを変更した場合は、すべての再構成を再計算する必要があります。その場合は、古いものを続けるのではなく、新しい仕事を開始する方が良いでしょう。あるいは、既存のフレームの再構築をすべて取り除く必要があります。)<br />
<br />
●bfactors.star<br />
(このファイルが見つからない場合、プログラムは既存のすべてのフレーム再構成を読み込み、Bファクタとスケールファクタを線形フィットからGuinierプロットまで決定します。 したがって、たとえば【Damage】タブのフィットの解像度範囲を変更しても平均フレームB係数推定値を変更しなかった場合、既存のbfactors.starファイルを削除すると非常に便利なので、新しいBファクタとスケールファクタが計算されますが、すべてのマップをもう再構築する必要はありません。 これはずっと速く進むでしょう。)<br />
<br />
●shiny.star<br />
(このファイルがない場合、既存のbfactors.starファイルが読み込まれ、光沢のある粒子はこれらのパラメータに従って再加重されます。 たとえば、以前に決定されたBファクタとスケールファクタのプロットに滑らかな曲線をフィットさせることを決定し、既存のbfactors.starファイルを新しく適合したものに置き換えた場合など、これは非常に便利です。 この場合、プログラムは光沢のある粒子のみを再作成します。)<br />
<br />
=== 9.4 Re-refine the polished particles(磨かれた粒子の精密化) ===<br />
shiny.starの磨かれた粒子は、元のものと比べてシグナル対ノイズ比が向上しています。 これは、再分類するのときに役立ちます。 この時点での異なる分類戦略の詳細な説明については、Methods in Enzymology [12]の最新の章を参照してください。 この章はまだオンラインでは入手できないため、以下を使用して初期の資料をダウンロードできます。<br />
<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relionreview2016.pdf<br />
<br />
研磨自体からの再構成は、より高い分解能のマップをもたらす確率加重角度割り当てを実行するのではなく、最も可能性の高い方向に各粒子を配置するので、少なくとも、研磨された粒子を使用して最終的な[3D auto-refine]を実行します。 したがって、shiny.starを入力として3D auto-refineを繰り返してください。 この精密化の後、後処理と部分的な分解能の推定のやり直しをすることを忘れないでください。<br />
<br />
このテストケースでは、movie-refinementとparticle polishingの前に、復元は既に(ダウンサンプリングされた)データのナイキスト周波数に達しました。 したがって、後者は地図にほとんど影響しませんでした。 このデモンストレーションは、動画処理の仕方を教える上でまだ役立つことを願っています。<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-26T16:01:03Z
<p>Fisherman1: /* 5.2 Analysing the results in more detail */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjobリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ「2D classification」を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違い、RELION-2.0では【Display:】ボタンで適切なクラスを選択することができません。これは[Subset selection]jobタイプ上で行われます。Select classes from model.starと書かれた行の横にある【Browse】ボタンを利用して、【I/O】タブ上のClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2次元クラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。センタリングされたテンプレートが自動検出中に必要となる一方で、2D classification実行時ではクラス平均はセンタリングされないかもしれないので、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
これは、スペクトルノイズ強度とスケールファクターの推定が不安定なことで、それぞれの電子顕微鏡写真にある粒子が非常に少ない場合に便利なオプションです。デフォルトでは、スケールファクターの推定は顕微鏡写真ごとにそれぞれ計算されます。このオプションは計算実行時、複数の顕微鏡写真の粒子を一緒に計算してグループ化することが可能です。RELIONはクラス分類や自動精密化実行の際にグループがとても小さくなっている場合に警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionカラムに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子のクラス平均を4〜6つ選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
[Auto-picking]jobタイプにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての顕微鏡写真で自動検出を実行する前に、【autopicking】タブ上でPicking threshold、Minimum inter-particle distance、Maximum stddev noise、3つのメインパラメーターを最適化する必要があります。これは時間節約のために、数枚の顕微鏡写真でのみ行われます。<br />
<br />
そのため、2〜3つの顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。[Subset selection]jobタイプで行うには2つの方法があります。OR select from picked coords: の行からManualPick/job004/coords_suffix_manualpick.starを選択、その後左の選択ボックスを使用して2枚の顕微鏡写真のみを選択できます。メニューオプションのInvert selectionでこの作業が便利になるかもしれないということを覚えておいてください。2〜4つの適切な顕微鏡写真を選択したとき、例えばデフォーカスの大きさや氷の厚さはメニューからSave selectionを選択することを忘れないでください。もう1つの方法は、[Subset selection]jobタイプの【I/O】タブからOR select from micrographs.star: の行からCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択し、右クリックメニューからSave STAR with selected imagesを選択して下さい。どんなオプションを選んでも、Select jobへの2mics4autopickのようなエイリアスは意味があるのでしょうか?<br />
<br />
[Auto-picking]jobタイプの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
("Einsteinfrom-noise"の結果を得るために、データから得ようとしている最終的な解像度よりも大幅に低いローパスフィルターを使用することは非常に重要です)<br />
● Highpass filter (A): -1<br />
(たとえば200などの正の値を渡した場合、リファレンスは顕微鏡写真はautopickingよりも高いハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(負の値を渡した場合、入力した顕微鏡写真と同じスケールであると認識します。そうでない場合、例えば粒子を抜き出す上でのリファレンスを作るために使用される粒子をリスケールしたため、正しいピクセルサイズの正の値をここのリファレンスに追加します。)<br />
● Mask diameter (A): 200<br />
([2D classification] jobタイプのときに使った値と同じ値が使えます)<br />
● Angular sampling (deg): 5<br />
(この値はどんな場合でもほとんど正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒いので、使用するリファレンスは白を利用します)<br />
● Are References CTF corrected? Yes<br />
(CTF補正で2Dクラス平均を行ったため)<br />
● Ignore CTFs until first peak: No<br />
([2D classification]jobでもリファレンス作製のために使用した場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeak-searchアルゴリズムのためのFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは、隣接する2つの粒子間の最大許容距離です。反復的クラスタリングアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素領域や非常に汚染されてる特徴が見て取れる領域のピッキングを防止するのに有効です。標準化された顕微鏡写真のバックグラウンド標準偏差がこの値より高い領域のピークは無視される。効果的な値は1.0から1.2の範囲であることが多いです。バックグラウンド標準偏差が高いため、ピークを除去するためにこの機能をオフにするには値を-1にして下さい。)<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動ピッキングアルゴリズムは顕微鏡写真をリファレンスにおいてのローパスフィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の間の値は顕微鏡写真のサイズの画分の結果になります。これはshrink=1(縮小しない)にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(適切なGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。複数のMPI-processorsを使う場合(そうでない場合も)は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して【Running】タブでひとつのMPI processorを使って動かして下さい。おそらくoptimise_paramsのようなエイリアスが有効かもしれません。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真とリファレンスごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環するリファレンスと全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を利用したより高速なpeak-detectionアルゴリズムに従っています。これらのパラメータは最適化する必要があるため、プログラムはReferencesタブで指定されているようにいわゆるFROMマップを作成します。これらはリファレンスごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動ピッキングプログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より高速にピッキングするパラメータになるように最適化するために使用されます。。最初に、動作させ終えたばかりのjobで【Display:】ボタンから coords_sufix_autopick オプションを使って、現在の設定でオートピッキングされた粒子を調べます。ディスプレイウィンドウは、最後に実行した[Manual picking]jobのパラメーター(サイズやシグマコントラストなど)を利用することに注意しておいて下さい。実際に[Manual picking]jobタイプでこれらのパラメーターを変更でき、左上の jobs メニューから Save job settings オプションで設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjobを実行すると、以前と同じように【pick】と【CTF】ボタンを持つ同様のGUIが生成されます。表示ウィンドウから両方の顕微鏡写真を開き、粒子をより多くか、少なく検出するか(すなわち、しきい値を小さくするか大きくするか)と、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)を決定します。それぞれの粒子は赤(低いFOM値)から青(高いFOM値)に色付けされることに注意して下さい。次のステップに進む間に、両方の顕微鏡写真の表示ウィンドウを開いたままにすることができます。<br />
<br />
[Finished jobs]から、AutoPick/optimise_params jobを選択して下さい。そして【autopicking】タブ上でパラメーターを変更して下さい。次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した時、全てのFOMの再計算の代わりに、以前書きだされたFOMマップをディスクから再読み込みします。新しい座標のその後の計算は、数秒で実行されます。以降は、新しい座標セットを読み込むために、顕微鏡写真の表示ウィンドウ上で右クリックメニューから Reload coordinates を選択して下さい。この方法は2つのパラメーターを手早く最適化できます。<br />
<br />
3つのパラメータをすべて使いこなして、ピッキング結果をどのように変更するかを確認してください。すべての顕微鏡写真の自動ピッキングに使用するパラメータがわかったら、GUIの左上にあるbrowser jobタイプの[Auto-picking]オプションをクリックして、【Run now!】。【I/O】タブ上で、入力した顕微鏡写真のSTARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは並列に(FOMマップが書き出せされてないなら)実行されるかもしれない。【Running】タブで、自動ピッキングを実行するコアの数を指定します。MPIプロセッサの最大有効数は、入力したSTARファイルの顕微鏡写真の数となります。<br />
<br />
FOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあることに注意して下さい。FOMマップを読み込みまたは書き出し、[Continue now]ボタンをクリックすることで、プログラムは(一般的には少数の)全ての入力した顕微鏡写真を再度ピッキングします。しかし、FOMマップの読み込みまたは書き込みをしない場合、すなわち、自動ピッキングを全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動ピッキングを行っていない顕微鏡写真のみ再検出します。これはスケジュール化されたjobの反復にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけ動作させる代わりとして)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上で[Auto-picking]をクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopick オプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真上の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使って粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
ひとたび全部の結果を満たしたら、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle clean オプションを使うことができます。<br />
<br />
ひとたび座標全体セットを満たしたら、以前のデータを全て保ちつつ、[Partcle extraction]jobを再実行する必要があるが、Input coordinatesを自動検出で新しく生成されたものに変変えて下さい。これは下記のよりよい精密のために使われる初期シングル粒子データセットを作成します。おそらく、allmics_autopicked のようなエイリアスが有意義です。<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0では、コマンドライン引数 --shrink を通して顕微鏡写真をフィルタリングするオプションを実装しています。最もシンプルな使い方は --shrink 0 と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrink の初期状態の値は1.0ですが、これは反映がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動ピッキングと同一の動作をします<br />
<br />
● --shrink val = 0 では、顕微鏡写真をテンプレートリファレンスのローパスと同じように、--lowpass までpassさせる結果になります。これはシングル粒子解析(らせん状検出のためではないが)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 では、size= val ·micrograph size にした結果になります(valとは顕微鏡写真のオリジナルサイズを適用させたスケールファクターです)<br />
<br />
● --shrink val > 1 では、size = val − (val mod 2)、すなわち、valより小さい最小の偶数の整数値になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、致命的ではありませんが警告をならす結果となります。RELIONの自動ピッキングは多くのFFTを実行するため、顕微鏡写真のサイズもFFT計算の大きな落とし穴を避けるために自動的に調整されるようになりました。これの注釈と上書きの仕方は、ユーザーが実行する各自動ピッキングの最初の出力に表示されます。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには、各粒子とそれらの整列されたCTF修正リファレンスとの間の差異に基づいて粒子を素早く分類する機能もあります。ソートプログラムは[Particle sorting]jobタイプからアクセスすることができ、それぞれの粒子でリファレンスが利用できるときなら、いつでも動かせます。たとえば、[Auto-picking]、[2D classification]、[3D classificationo]、[3D auto-refaine]の後などです。その使用方法を示すために、自動ピッキングの後に実行します。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動ピッキング後に抽出プログラムによって生成されます。[2D classification]、[3D classification]または、[3D auto-refine]jobの場合は、最後の反復での_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が [2D classification]、[3D classification]、[3D auto-refine]job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(抽出された粒子のための座標を与える自動ピッキングjobに使われたリファレンスを入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリに particles_sort.star と呼ばれるインプットファイルと同じファイルを生成しますが、rlnPartileSelectZScore と呼ばれるカラムの追加があります。[Subset selection]jobタイプの OR select from particles.star とある行で、このファイルを選択することが出来ます。ポップアップ表示ウィンドウ内にて、その新しいカラムに基づいて粒子を可視化できます。ディスプレイの上に良い粒子、下に良くない粒子をもつために強度の傾向が出てきます。下から上にスクロールして、下のすべての粒子を破棄する必要があるポイントを決定でき、右マウスポップアップメニューを使用して Select all above および、または1つずつ粒子を選択することができます。右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この問題は どのくらい寛容でいられるかです。RELIONの3Dマルチリファレンス精密手順は強力な教師無し3次元分類へのアプローチを提供している。しかし、まずは低解像度の単一コンセンサスモデルが必要です。初期の結晶構造(PDB-ID 3I3E)から生成された低分解能のベータガラクトシダーゼモデルを使用します。これはすでに projectディレクトリの中に 3i3e_lp50A.mrcという名前で入っています。典型的なプロジェクトでは、良い初期モデルがないかもしれません。その場合は違うプログラムから別のモデルを持ってくる必要があります。その場合は、RELIONと同じように別のプログラムで生成する必要がありますが、初期モデル生成は行いません。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handlerというプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまいません。<br />
<br />
この場合、[Import]という機能を使って、直接プロジェクトに初期モデルをインポート出来きます。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使います。<br />
<br />
=== 5.1 Running the job===<br />
<br />
教師無しの3D分類は、3D分類jobタイプから実行可能です。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供した場所だとします。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類への偏りを最小限にする働きがあります。)<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
(RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
<br />
・Initial low-pass filter (A): 50<br />
(リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけません。[9]で説明したように、初期マップをできる限りフィルタリングする必要があります。 小さい粒子では通常40〜60Åの値を使用します。)<br />
<br />
・Symmetry: C1<br />
(このサンプルにはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。不良粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
(このモデルはPDBファイルで作成されているため、振幅はCTFの影響を受けていません。これは「CTF修正済み」とみなすことができます。ほとんどの他のEMパッケージから作られたモデルは、適切な低周波振幅補正を実行するパッケージが多くないため、ほとんどの場合CTF補正されていないことが多いです。(いくつかは補正されているかもしれません:したがって、モデルを通ってスライスをチェックすることができます。もし黒で白く見えるならば、モデルはおそらく適切にCTF修正されたものでしょう;また、ブラックハローでグレイアッシュに見えるならそのモデルはおそらくCTF補正されていないでしょう。)これまでCTF補正を行ったモデルは、適切に補正されています。)<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
(参照を作成するために使用した[2D分類]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。)<br />
<br />
・Number of iterations: 25<br />
(これは今後変更する必要はありません。)<br />
<br />
・Regularisation parameter T: 4<br />
(Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
<br />
・Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。)<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。[2D classification]のjobタイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与えます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、[Subset selection]を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2Dクラス化の実行時と同じです。(実際に2D,3Dクラス精密時に同じ記法を利用しています)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が_model.starファイルのdata_model_class_Nテーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りに入力して下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お好みの言語でプロットできます。もし、使用者のコンピューターにgnplotがインストールされているのであれば、以下の通りに入力して下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
これまででお分かりのように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなるrelion_star_printtableのようなスクリプトは、だいたいgrepやawkのようなlinuxのシェルコマンドと併用して実行できます。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は解像度を推定するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己高揚による過剰適合を避けることができます[13]。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで[3D auto-refine]jobタイプを選択してください。GUIでの入力引数は大部分は[3D classification]jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプリング率は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング率が自動的に増加されます。したがって、8面体または正20面体対称よりも小さい全ての精密化では、一般的に初期値の角度である7.5度のサンプルを使用し、部分的な調査では1.8度のサンプルから行います。より正確な対称の精密化を行うためにのみ、3.7度でのサンプリングを行い、部分的な調査では0.9度ごとにサンプリングを行います。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精密化は、[Post-processing]jobタイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作では【I/O】タブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。他にも、伸長された分子や、マスクを使用し、小さい部分の精密化に注目した時などに役立ちます。このような場合、マスクが使用されていない代表的なFSCは精密化の際の解像度が低く見積もられます。精密化を行っている最中であるため、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、[3D classification]実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精密化されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらく違いがほとんどありません。さらに、マップ内で高周波の精密化へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精密な”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精密化で2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、奇数のMPI処理装置のを使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。一点に収束した場合にのみ、run_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。<br />
<br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。<br />
<br />
例えば、以下のように試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3D自動精密化の実行後、マップが鋭くなっている必要がある。それも、自動精密化物の内部の至適基準FSCカーブはマスク化されていないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の精密化中に、実際の解像度は概算値を下回っているということを意味している。なぜなら、溶媒領域のノイズがFSCカーブよりも低くなるからです。RELIONにおけるBファクターでの鮮明化と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、タンパク質の末端と溶媒領域の開始点を精密化するためのマスクを作る必要があります。これは[Mask Creation]ジョブタイプを使って行います。<br />
<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3D自動精密化が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。【Mask】タブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶媒マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例としてタンパク質領域の外側にノイズスポットが完全になく表示するキメラのように、ローパスフィルターのかかったマップの描写でのしきい値となります。適切なスポットを見つけるために、しきい値を上げたり下げたりしてみて下さい。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54オプションを付与させてrelion_image_handlerと呼ばれるコマンドラインプログラムを使用できることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりです)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値は白黒画像マスクを生成するのに使われます。このマップ中のホワイト値は全方向の多くのピクセルで増加します。これを使用して、最初のバイナリマスクのサイズを小さくします。)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスクに余弦形状のソフトエッジを配置します。これは、とても鋭いマスクにかなり繊細である可能性があるFSCカーブに、マスクが及ぼす影響を計測する補正手順として重要です。マスクの生成は相対的に早いので、しばしば解像度の最も適した概算を得るためのマスクパラメーターと共に使います。)<br />
<br />
【Helix】タブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通した切片を見たり、UCSFキメラにマスクを読み込ませることができます。後者は、マスクが構造全体をカプセル化するが、マスク内に多くの溶媒を残さないことを確認するために、自動精密手順のマップと一緒に良いアイデアになるかもしれません。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing]jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%異なっていたということがわかることがあります。RELION内では、この時までになしたもの全ては、まだ一貫しています。そのためマップの再精密化や、データのクラスの再分類をする必要はありません。正確なマップと最終解像度の推定のために必要なことが、ここに正しいピクセルサイズを提供することです。)<br />
<br />
【Sharpen】タブで以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、自身のディテクターのために、プロジェクトディレクトリの中に保存されている mtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
● Estimate B-factor automatically: Yes<br />
この手順は本誌[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要がある。もしマップの解像度が10Åに満たない場合、独自の “ad-hoc” Bファクターを代わりに使う必要があるかもしれない。<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
● Use your own B-factor? No<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションはときに、全体のマップ解像度を超えるような解像度へと拡張するマップ範囲を解析するのに便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3dref のようなエイリアスを使用して下さい。【Display】ボタンを使って、後処理されるマップと、この構造のFSCカーブとGuinierプロットを含んだPDFを通して、スライズを表示します。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D自動精密化の手順となる収束したマップでの全てのα-へリックスの場所を簡単に見ることが出来ます。解像度の推定は、以前に発表された[2]のフェイズランダムの手順に基づいてます。フェイズランダムマップのFSC(赤いカーブ)が、多かれ少なかれ、推定していた後処理マップの解像度のゼロ点であることを確認してください。そうでない場合は、マスクが鮮明すぎるか、細部の描写が多すぎます。この場合は。強いローパスフィルターや、以前の[Mask creation]ステップでの、より広く、より薄いマスクを使用し、後処理を繰り返して下さい。実際に少し薄いマスクを作りたくなるかもしれないので、その場合はエッジがだいたい5ピクセルになるように試してみてください。このために【Continue now】ボタンを使った場合、以前の結果が上書きされます。左側にあるjobタイプブラウザをクリックし、【Run now!】ボタンで新しい出力ディレクトリが出来ます。<br />
<br />
== 8 Local-resolution estimate(ローカル解像度推定) ==<br />
定例処理プログラムから解像度の推定は広域的な推定となります。しかしながら、シングルナンバーは高分子複合体の再構築でしばしば観測される解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する効果的なプログラムを記述しています[4]。RELION は、[Local resolution]jobタイプを通してプログラムのラッパーを実装しています。【I/O】タブ上で以下のように設定してください。<br />
<br />
● One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size: 3.54<br />
<br />
(正しいピクセルサイズであると考えたモデルを構築し始めたときに、実際には数パーセントずれていたことがわかることがあります。RELION内では、この時点までの全てが一貫しています。そのため、再度、マップの精密化とデータの分類をする必要はありません。正確なマップと最終的な解像度推定のために正しいピクセルサイズをここで指定するだけで良いです。)<br />
<br />
【ResMap】タブ上で以下のように設定してください。<br />
<br />
● ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(RESMAP実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
● P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
● Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7Åです)<br />
<br />
● Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
● Resolution step size (A): 0.5<br />
<br />
(ステップ数を増やせば、より正確なローカル解像度マップの結果が導き出せますが、更に実行時間は長くなります。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAPのGUIからフィルターボタンを利用して下さい。しかしながら、RELION上で生成されたマップに変更を加える必要がないことにしばしば気がつくでしょう。RESMAPプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、volume data valueで選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズ(閲覧)するために使われます。特別な場合では、データが低解像度処理され、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル解像度の変化は見るために良いというわけではありません。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing(粒子の洗練) ===<br />
粒子のpolishingアルゴリズムは、MovieRefine/first3dref/run_avg7_off1_data.star から(おそらく非常にノイズの多い)移動軌跡(movement tracks)を取得し、それを利用して直線にフィットさせます。これらのトラックのノイズをさらに減らすために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観測も利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の(ピクセルの)標準偏差は、ユーザによって決まります。第2のステップでは、polishingアルゴリズムは、Bファクターおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対ノイズ比が増加するので、"polished"または"shiny"だと言われます。<br />
<br />
[Particle polishing]jobタイプの【I/O】タブにて以下のようにして下さい<br />
●Input STAR file with aligned movies: MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子がより大きければ、ムービーの精密化からの移動軌跡の騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセル程をしばしば使用します。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単にコンピューターリソースを節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、シングルフレームの再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 Bファクターの形状を信頼して推定するために適切な高解像度を得られない再構成があれば、このオプションを使用して3、5ムービーフレーム7つを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、[Particle extraction]jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
Helixタブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えています。 このjobの最大MPIプロセッサ数は、データの2倍のムービーフレーム数です。 粒子ボックスが比較的大きい場合、メモリ要件は重要ですが、通常は3Dオートリファインの最後の反復実行時よりも大きくはありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線損傷重みのBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。 推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と、動作軌跡と線形フィットはすべて、Polish / first3drefという大きなPDFファイルにあります /logfile.pdfを開き、【Display】ボタンから開くことができます。<br />
<br />
私たちはしばしば最初の1-2フレームではサンプルが大きく動く比較的大きな負のBファクタを観測し、その後に放射線被害が入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
何らかの形で推定されたBファクタまたはスケールファクタが奇妙に見える場合、Guinierプロットを通じて線形フィットを調べることができます。時には、Guinierプロットは、Damageタブに入力された全周波数範囲にわたって直線でよくフィットすることができません。その後、異なるパラメータでjobを再実行する価値があります。また、単一フレームの再構成が上記の20Åの周波数を超えて拡張されない場合、線は適合できず、プログラムは動作しません(NaNに推定Bファクタが与えられます)。そのような場合、Bファクタの重み付けをスキップするか、または同じタブの平均フレームBファクタ推定:1を使用して複数のフレームを平均することを選択できます。【Display】ボタンから出力された研磨粒子(shiny.star)を使ってスターファイルを視覚化して、すべてが正しく行われていることを確認することは、おそらく悪い考えではありません。<br />
<br />
何らかの形で研磨結果に満足していない場合は、【Continue Run】ボタンを使用して計算の一部を繰り返すことができます。 それをクリックすると、プログラムは次のファイルを探し、そこにあればその計算ステップをスキップして次のステップに移ります:<br />
<br />
●frame0??_half?_class001_unfil.mrc<br />
(これらの地図のいずれかが欠落している場合は、再計算されます。それらが既に存在する場合、それらの再構成計算はスキップされる。平均フレームB因子推定のオプションを変更した場合は、すべての再構成を再計算する必要があります。その場合は、古いものを続けるのではなく、新しい仕事を開始する方が良いでしょう。あるいは、既存のフレームの再構築をすべて取り除く必要があります。)<br />
<br />
●bfactors.star<br />
(このファイルが見つからない場合、プログラムは既存のすべてのフレーム再構成を読み込み、Bファクタとスケールファクタを線形フィットからGuinierプロットまで決定します。 したがって、たとえば【Damage】タブのフィットの解像度範囲を変更しても平均フレームB係数推定値を変更しなかった場合、既存のbfactors.starファイルを削除すると非常に便利なので、新しいBファクタとスケールファクタが計算されますが、すべてのマップをもう再構築する必要はありません。 これはずっと速く進むでしょう。)<br />
<br />
●shiny.star<br />
(このファイルがない場合、既存のbfactors.starファイルが読み込まれ、光沢のある粒子はこれらのパラメータに従って再加重されます。 たとえば、以前に決定されたBファクタとスケールファクタのプロットに滑らかな曲線をフィットさせることを決定し、既存のbfactors.starファイルを新しく適合したものに置き換えた場合など、これは非常に便利です。 この場合、プログラムは光沢のある粒子のみを再作成します。)<br />
<br />
=== 9.4 Re-refine the polished particles(磨かれた粒子の精密化) ===<br />
shiny.starの磨かれた粒子は、元のものと比べてシグナル対ノイズ比が向上しています。 これは、再分類するのときに役立ちます。 この時点での異なる分類戦略の詳細な説明については、Methods in Enzymology [12]の最新の章を参照してください。 この章はまだオンラインでは入手できないため、以下を使用して初期の資料をダウンロードできます。<br />
<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relionreview2016.pdf<br />
<br />
研磨自体からの再構成は、より高い分解能のマップをもたらす確率加重角度割り当てを実行するのではなく、最も可能性の高い方向に各粒子を配置するので、少なくとも、研磨された粒子を使用して最終的な[3D auto-refine]を実行します。 したがって、shiny.starを入力として3D auto-refineを繰り返してください。 この精密化の後、後処理と部分的な分解能の推定のやり直しをすることを忘れないでください。<br />
<br />
このテストケースでは、movie-refinementとparticle polishingの前に、復元は既に(ダウンサンプリングされた)データのナイキスト周波数に達しました。 したがって、後者は地図にほとんど影響しませんでした。 このデモンストレーションは、動画処理の仕方を教える上でまだ役立つことを願っています。<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-26T14:14:38Z
<p>Fisherman1: /* 5.1 Running the job */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjobリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ「2D classification」を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違い、RELION-2.0では【Display:】ボタンで適切なクラスを選択することができません。これは[Subset selection]jobタイプ上で行われます。Select classes from model.starと書かれた行の横にある【Browse】ボタンを利用して、【I/O】タブ上のClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2次元クラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。センタリングされたテンプレートが自動検出中に必要となる一方で、2D classification実行時ではクラス平均はセンタリングされないかもしれないので、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
これは、スペクトルノイズ強度とスケールファクターの推定が不安定なことで、それぞれの電子顕微鏡写真にある粒子が非常に少ない場合に便利なオプションです。デフォルトでは、スケールファクターの推定は顕微鏡写真ごとにそれぞれ計算されます。このオプションは計算実行時、複数の顕微鏡写真の粒子を一緒に計算してグループ化することが可能です。RELIONはクラス分類や自動精密化実行の際にグループがとても小さくなっている場合に警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionカラムに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子のクラス平均を4〜6つ選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
[Auto-picking]jobタイプにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての顕微鏡写真で自動検出を実行する前に、【autopicking】タブ上でPicking threshold、Minimum inter-particle distance、Maximum stddev noise、3つのメインパラメーターを最適化する必要があります。これは時間節約のために、数枚の顕微鏡写真でのみ行われます。<br />
<br />
そのため、2〜3つの顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。[Subset selection]jobタイプで行うには2つの方法があります。OR select from picked coords: の行からManualPick/job004/coords_suffix_manualpick.starを選択、その後左の選択ボックスを使用して2枚の顕微鏡写真のみを選択できます。メニューオプションのInvert selectionでこの作業が便利になるかもしれないということを覚えておいてください。2〜4つの適切な顕微鏡写真を選択したとき、例えばデフォーカスの大きさや氷の厚さはメニューからSave selectionを選択することを忘れないでください。もう1つの方法は、[Subset selection]jobタイプの【I/O】タブからOR select from micrographs.star: の行からCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択し、右クリックメニューからSave STAR with selected imagesを選択して下さい。どんなオプションを選んでも、Select jobへの2mics4autopickのようなエイリアスは意味があるのでしょうか?<br />
<br />
[Auto-picking]jobタイプの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
("Einsteinfrom-noise"の結果を得るために、データから得ようとしている最終的な解像度よりも大幅に低いローパスフィルターを使用することは非常に重要です)<br />
● Highpass filter (A): -1<br />
(たとえば200などの正の値を渡した場合、リファレンスは顕微鏡写真はautopickingよりも高いハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(負の値を渡した場合、入力した顕微鏡写真と同じスケールであると認識します。そうでない場合、例えば粒子を抜き出す上でのリファレンスを作るために使用される粒子をリスケールしたため、正しいピクセルサイズの正の値をここのリファレンスに追加します。)<br />
● Mask diameter (A): 200<br />
([2D classification] jobタイプのときに使った値と同じ値が使えます)<br />
● Angular sampling (deg): 5<br />
(この値はどんな場合でもほとんど正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒いので、使用するリファレンスは白を利用します)<br />
● Are References CTF corrected? Yes<br />
(CTF補正で2Dクラス平均を行ったため)<br />
● Ignore CTFs until first peak: No<br />
([2D classification]jobでもリファレンス作製のために使用した場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeak-searchアルゴリズムのためのFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは、隣接する2つの粒子間の最大許容距離です。反復的クラスタリングアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素領域や非常に汚染されてる特徴が見て取れる領域のピッキングを防止するのに有効です。標準化された顕微鏡写真のバックグラウンド標準偏差がこの値より高い領域のピークは無視される。効果的な値は1.0から1.2の範囲であることが多いです。バックグラウンド標準偏差が高いため、ピークを除去するためにこの機能をオフにするには値を-1にして下さい。)<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動ピッキングアルゴリズムは顕微鏡写真をリファレンスにおいてのローパスフィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の間の値は顕微鏡写真のサイズの画分の結果になります。これはshrink=1(縮小しない)にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(適切なGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。複数のMPI-processorsを使う場合(そうでない場合も)は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して【Running】タブでひとつのMPI processorを使って動かして下さい。おそらくoptimise_paramsのようなエイリアスが有効かもしれません。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真とリファレンスごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環するリファレンスと全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を利用したより高速なpeak-detectionアルゴリズムに従っています。これらのパラメータは最適化する必要があるため、プログラムはReferencesタブで指定されているようにいわゆるFROMマップを作成します。これらはリファレンスごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動ピッキングプログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より高速にピッキングするパラメータになるように最適化するために使用されます。。最初に、動作させ終えたばかりのjobで【Display:】ボタンから coords_sufix_autopick オプションを使って、現在の設定でオートピッキングされた粒子を調べます。ディスプレイウィンドウは、最後に実行した[Manual picking]jobのパラメーター(サイズやシグマコントラストなど)を利用することに注意しておいて下さい。実際に[Manual picking]jobタイプでこれらのパラメーターを変更でき、左上の jobs メニューから Save job settings オプションで設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjobを実行すると、以前と同じように【pick】と【CTF】ボタンを持つ同様のGUIが生成されます。表示ウィンドウから両方の顕微鏡写真を開き、粒子をより多くか、少なく検出するか(すなわち、しきい値を小さくするか大きくするか)と、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)を決定します。それぞれの粒子は赤(低いFOM値)から青(高いFOM値)に色付けされることに注意して下さい。次のステップに進む間に、両方の顕微鏡写真の表示ウィンドウを開いたままにすることができます。<br />
<br />
[Finished jobs]から、AutoPick/optimise_params jobを選択して下さい。そして【autopicking】タブ上でパラメーターを変更して下さい。次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した時、全てのFOMの再計算の代わりに、以前書きだされたFOMマップをディスクから再読み込みします。新しい座標のその後の計算は、数秒で実行されます。以降は、新しい座標セットを読み込むために、顕微鏡写真の表示ウィンドウ上で右クリックメニューから Reload coordinates を選択して下さい。この方法は2つのパラメーターを手早く最適化できます。<br />
<br />
3つのパラメータをすべて使いこなして、ピッキング結果をどのように変更するかを確認してください。すべての顕微鏡写真の自動ピッキングに使用するパラメータがわかったら、GUIの左上にあるbrowser jobタイプの[Auto-picking]オプションをクリックして、【Run now!】。【I/O】タブ上で、入力した顕微鏡写真のSTARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは並列に(FOMマップが書き出せされてないなら)実行されるかもしれない。【Running】タブで、自動ピッキングを実行するコアの数を指定します。MPIプロセッサの最大有効数は、入力したSTARファイルの顕微鏡写真の数となります。<br />
<br />
FOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあることに注意して下さい。FOMマップを読み込みまたは書き出し、[Continue now]ボタンをクリックすることで、プログラムは(一般的には少数の)全ての入力した顕微鏡写真を再度ピッキングします。しかし、FOMマップの読み込みまたは書き込みをしない場合、すなわち、自動ピッキングを全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動ピッキングを行っていない顕微鏡写真のみ再検出します。これはスケジュール化されたjobの反復にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけ動作させる代わりとして)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上で[Auto-picking]をクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopick オプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真上の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使って粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
ひとたび全部の結果を満たしたら、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle clean オプションを使うことができます。<br />
<br />
ひとたび座標全体セットを満たしたら、以前のデータを全て保ちつつ、[Partcle extraction]jobを再実行する必要があるが、Input coordinatesを自動検出で新しく生成されたものに変変えて下さい。これは下記のよりよい精密のために使われる初期シングル粒子データセットを作成します。おそらく、allmics_autopicked のようなエイリアスが有意義です。<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0では、コマンドライン引数 --shrink を通して顕微鏡写真をフィルタリングするオプションを実装しています。最もシンプルな使い方は --shrink 0 と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrink の初期状態の値は1.0ですが、これは反映がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動ピッキングと同一の動作をします<br />
<br />
● --shrink val = 0 では、顕微鏡写真をテンプレートリファレンスのローパスと同じように、--lowpass までpassさせる結果になります。これはシングル粒子解析(らせん状検出のためではないが)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 では、size= val ·micrograph size にした結果になります(valとは顕微鏡写真のオリジナルサイズを適用させたスケールファクターです)<br />
<br />
● --shrink val > 1 では、size = val − (val mod 2)、すなわち、valより小さい最小の偶数の整数値になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、致命的ではありませんが警告をならす結果となります。RELIONの自動ピッキングは多くのFFTを実行するため、顕微鏡写真のサイズもFFT計算の大きな落とし穴を避けるために自動的に調整されるようになりました。これの注釈と上書きの仕方は、ユーザーが実行する各自動ピッキングの最初の出力に表示されます。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには、各粒子とそれらの整列されたCTF修正リファレンスとの間の差異に基づいて粒子を素早く分類する機能もあります。ソートプログラムは[Particle sorting]jobタイプからアクセスすることができ、それぞれの粒子でリファレンスが利用できるときなら、いつでも動かせます。たとえば、[Auto-picking]、[2D classification]、[3D classificationo]、[3D auto-refaine]の後などです。その使用方法を示すために、自動ピッキングの後に実行します。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動ピッキング後に抽出プログラムによって生成されます。[2D classification]、[3D classification]または、[3D auto-refine]jobの場合は、最後の反復での_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が [2D classification]、[3D classification]、[3D auto-refine]job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(抽出された粒子のための座標を与える自動ピッキングjobに使われたリファレンスを入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリに particles_sort.star と呼ばれるインプットファイルと同じファイルを生成しますが、rlnPartileSelectZScore と呼ばれるカラムの追加があります。[Subset selection]jobタイプの OR select from particles.star とある行で、このファイルを選択することが出来ます。ポップアップ表示ウィンドウ内にて、その新しいカラムに基づいて粒子を可視化できます。ディスプレイの上に良い粒子、下に良くない粒子をもつために強度の傾向が出てきます。下から上にスクロールして、下のすべての粒子を破棄する必要があるポイントを決定でき、右マウスポップアップメニューを使用して Select all above および、または1つずつ粒子を選択することができます。右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この問題は どのくらい寛容でいられるかです。RELIONの3Dマルチリファレンス精密手順は強力な教師無し3次元分類へのアプローチを提供している。しかし、まずは低解像度の単一コンセンサスモデルが必要です。初期の結晶構造(PDB-ID 3I3E)から生成された低分解能のベータガラクトシダーゼモデルを使用します。これはすでに projectディレクトリの中に 3i3e_lp50A.mrcという名前で入っています。典型的なプロジェクトでは、良い初期モデルがないかもしれません。その場合は違うプログラムから別のモデルを持ってくる必要があります。その場合は、RELIONと同じように別のプログラムで生成する必要がありますが、初期モデル生成は行いません。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handlerというプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまいません。<br />
<br />
この場合、[Import]という機能を使って、直接プロジェクトに初期モデルをインポート出来きます。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使います。<br />
<br />
=== 5.1 Running the job===<br />
<br />
教師無しの3D分類は、3D分類jobタイプから実行可能です。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
(これは空白のままにしておきます。これは、例えば、注目しているリボソーム精密化のために大/小サブユニットマスクを提供した場所だとします。この項目を空のままにしておくと、[Optimisation]タブで指定された粒径の球形マスクが使用されます。 これは分類への偏りを最小限にする働きがあります。)<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
(RELION内の同じデータから再構築されていないマップは、おそらく、正しいグレースケール上にないと考慮しておきましょう。)<br />
<br />
・Initial low-pass filter (A): 50<br />
(リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけません。[9]で説明したように、初期マップをできる限りフィルタリングする必要があります。 小さい粒子では通常40〜60Åの値を使用します。)<br />
<br />
・Symmetry: C1<br />
(このサンプルにはD2の対称性があることはわかっていますが、対称性を持たない初期分類を実行することをお勧めします。不良粒子は適切なものから分離することができ、対称性は再構成されたマップで確認することができます。)<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
(このモデルはPDBファイルで作成されているため、振幅はCTFの影響を受けていません。これは「CTF修正済み」とみなすことができます。ほとんどの他のEMパッケージから作られたモデルは、適切な低周波振幅補正を実行するパッケージが多くないため、ほとんどの場合CTF補正されていないことが多いです。(いくつかは補正されているかもしれません:したがって、モデルを通ってスライスをチェックすることができます。もし黒で白く見えるならば、モデルはおそらく適切にCTF修正されたものでしょう;また、ブラックハローでグレイアッシュに見えるならそのモデルはおそらくCTF補正されていないでしょう。)これまでCTF補正を行ったモデルは、適切に補正されています。)<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
(参照を作成するために使用した[2D分類]jobでもこのオプションを使用した場合にのみ、このオプションを使用します。)<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
(より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算コストは、CPU時間と必要なコンピュータメモリの両方の観点から、クラス数に比例して変化します。)<br />
<br />
・Number of iterations: 25<br />
(これは今後変更する必要はありません。)<br />
<br />
・Regularisation parameter T: 4<br />
(Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定します。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。)<br />
<br />
・Mask diameter (A): 200<br />
(前回の[2D classification]のjobタイプと同じ値を使用してください。)<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
(正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。実際に必要にではありませんが、10~15Aに設定されている可能性があります。)<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の[2D-classification]の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。[2D classification]のjobタイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与えます。【Display:】ボタンを使用して、最後の反復からの再構成のいずれかを選択して、RELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、[Subset selection]を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットは一旦選択されると、このサブセットを自動的に高い解像度に精密化するために[3D auto-refine]を使用することができます。この手順は解像度を推定するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己高揚による過剰適合を避けることができます[13]。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで[3D auto-refine]jobタイプを選択してください。GUIでの入力引数は大部分は[3D classification]jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプリング率は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、角度サンプリング率が自動的に増加されます。したがって、8面体または正20面体対称よりも小さい全ての精密化では、一般的に初期値の角度である7.5度のサンプルを使用し、部分的な調査では1.8度のサンプルから行います。より正確な対称の精密化を行うためにのみ、3.7度でのサンプリングを行い、部分的な調査では0.9度ごとにサンプリングを行います。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精密化は、[Post-processing]jobタイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作では【I/O】タブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。他にも、伸長された分子や、マスクを使用し、小さい部分の精密化に注目した時などに役立ちます。このような場合、マスクが使用されていない代表的なFSCは精密化の際の解像度が低く見積もられます。精密化を行っている最中であるため、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、[3D classification]実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精密化されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらく違いがほとんどありません。さらに、マップ内で高周波の精密化へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精密な”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精密化で2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、奇数のMPI処理装置のを使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。一点に収束した場合にのみ、run_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では、2つの独立した半分の復元データが一緒に結合されているので、一般的に最終反復で解像度がかなり改良されます。プログラムはすべてのデータでナイキスト周波数を使用しているので、この反復では更に多くのメモリとCPUが必要です。<br />
<br />
角度サンプリングでの自動増加が自動精密化手順の様子が重要な側面であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。<br />
<br />
例えば、以下のように試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3D自動精密化の実行後、マップが鋭くなっている必要がある。それも、自動精密化物の内部の至適基準FSCカーブはマスク化されていないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の精密化中に、実際の解像度は概算値を下回っているということを意味している。なぜなら、溶媒領域のノイズがFSCカーブよりも低くなるからです。RELIONにおけるBファクターでの鮮明化と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、タンパク質の末端と溶媒領域の開始点を精密化するためのマスクを作る必要があります。これは[Mask Creation]ジョブタイプを使って行います。<br />
<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3D自動精密化が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。【Mask】タブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶媒マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例としてタンパク質領域の外側にノイズスポットが完全になく表示するキメラのように、ローパスフィルターのかかったマップの描写でのしきい値となります。適切なスポットを見つけるために、しきい値を上げたり下げたりしてみて下さい。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54オプションを付与させてrelion_image_handlerと呼ばれるコマンドラインプログラムを使用できることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりです)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値は白黒画像マスクを生成するのに使われます。このマップ中のホワイト値は全方向の多くのピクセルで増加します。これを使用して、最初のバイナリマスクのサイズを小さくします。)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスクに余弦形状のソフトエッジを配置します。これは、とても鋭いマスクにかなり繊細である可能性があるFSCカーブに、マスクが及ぼす影響を計測する補正手順として重要です。マスクの生成は相対的に早いので、しばしば解像度の最も適した概算を得るためのマスクパラメーターと共に使います。)<br />
<br />
【Helix】タブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通した切片を見たり、UCSFキメラにマスクを読み込ませることができます。後者は、マスクが構造全体をカプセル化するが、マスク内に多くの溶媒を残さないことを確認するために、自動精密手順のマップと一緒に良いアイデアになるかもしれません。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing]jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%異なっていたということがわかることがあります。RELION内では、この時までになしたもの全ては、まだ一貫しています。そのためマップの再精密化や、データのクラスの再分類をする必要はありません。正確なマップと最終解像度の推定のために必要なことが、ここに正しいピクセルサイズを提供することです。)<br />
<br />
【Sharpen】タブで以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、自身のディテクターのために、プロジェクトディレクトリの中に保存されている mtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
● Estimate B-factor automatically: Yes<br />
この手順は本誌[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要がある。もしマップの解像度が10Åに満たない場合、独自の “ad-hoc” Bファクターを代わりに使う必要があるかもしれない。<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
● Use your own B-factor? No<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションはときに、全体のマップ解像度を超えるような解像度へと拡張するマップ範囲を解析するのに便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3dref のようなエイリアスを使用して下さい。【Display】ボタンを使って、後処理されるマップと、この構造のFSCカーブとGuinierプロットを含んだPDFを通して、スライズを表示します。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D自動精密化の手順となる収束したマップでの全てのα-へリックスの場所を簡単に見ることが出来ます。解像度の推定は、以前に発表された[2]のフェイズランダムの手順に基づいてます。フェイズランダムマップのFSC(赤いカーブ)が、多かれ少なかれ、推定していた後処理マップの解像度のゼロ点であることを確認してください。そうでない場合は、マスクが鮮明すぎるか、細部の描写が多すぎます。この場合は。強いローパスフィルターや、以前の[Mask creation]ステップでの、より広く、より薄いマスクを使用し、後処理を繰り返して下さい。実際に少し薄いマスクを作りたくなるかもしれないので、その場合はエッジがだいたい5ピクセルになるように試してみてください。このために【Continue now】ボタンを使った場合、以前の結果が上書きされます。左側にあるjobタイプブラウザをクリックし、【Run now!】ボタンで新しい出力ディレクトリが出来ます。<br />
<br />
== 8 Local-resolution estimate(ローカル解像度推定) ==<br />
定例処理プログラムから解像度の推定は広域的な推定となります。しかしながら、シングルナンバーは高分子複合体の再構築でしばしば観測される解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する効果的なプログラムを記述しています[4]。RELION は、[Local resolution]jobタイプを通してプログラムのラッパーを実装しています。【I/O】タブ上で以下のように設定してください。<br />
<br />
● One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size: 3.54<br />
<br />
(正しいピクセルサイズであると考えたモデルを構築し始めたときに、実際には数パーセントずれていたことがわかることがあります。RELION内では、この時点までの全てが一貫しています。そのため、再度、マップの精密化とデータの分類をする必要はありません。正確なマップと最終的な解像度推定のために正しいピクセルサイズをここで指定するだけで良いです。)<br />
<br />
【ResMap】タブ上で以下のように設定してください。<br />
<br />
● ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(RESMAP実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
● P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
● Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7Åです)<br />
<br />
● Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
● Resolution step size (A): 0.5<br />
<br />
(ステップ数を増やせば、より正確なローカル解像度マップの結果が導き出せますが、更に実行時間は長くなります。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAPのGUIからフィルターボタンを利用して下さい。しかしながら、RELION上で生成されたマップに変更を加える必要がないことにしばしば気がつくでしょう。RESMAPプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、volume data valueで選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズ(閲覧)するために使われます。特別な場合では、データが低解像度処理され、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル解像度の変化は見るために良いというわけではありません。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing(粒子の洗練) ===<br />
粒子のpolishingアルゴリズムは、MovieRefine/first3dref/run_avg7_off1_data.star から(おそらく非常にノイズの多い)移動軌跡(movement tracks)を取得し、それを利用して直線にフィットさせます。これらのトラックのノイズをさらに減らすために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観測も利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の(ピクセルの)標準偏差は、ユーザによって決まります。第2のステップでは、polishingアルゴリズムは、Bファクターおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対ノイズ比が増加するので、"polished"または"shiny"だと言われます。<br />
<br />
[Particle polishing]jobタイプの【I/O】タブにて以下のようにして下さい<br />
●Input STAR file with aligned movies: MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子がより大きければ、ムービーの精密化からの移動軌跡の騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセル程をしばしば使用します。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単にコンピューターリソースを節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、シングルフレームの再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 Bファクターの形状を信頼して推定するために適切な高解像度を得られない再構成があれば、このオプションを使用して3、5ムービーフレーム7つを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、[Particle extraction]jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
Helixタブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えています。 このjobの最大MPIプロセッサ数は、データの2倍のムービーフレーム数です。 粒子ボックスが比較的大きい場合、メモリ要件は重要ですが、通常は3Dオートリファインの最後の反復実行時よりも大きくはありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線損傷重みのBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。 推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と、動作軌跡と線形フィットはすべて、Polish / first3drefという大きなPDFファイルにあります /logfile.pdfを開き、【Display】ボタンから開くことができます。<br />
<br />
私たちはしばしば最初の1-2フレームではサンプルが大きく動く比較的大きな負のBファクタを観測し、その後に放射線被害が入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
何らかの形で推定されたBファクタまたはスケールファクタが奇妙に見える場合、Guinierプロットを通じて線形フィットを調べることができます。時には、Guinierプロットは、Damageタブに入力された全周波数範囲にわたって直線でよくフィットすることができません。その後、異なるパラメータでjobを再実行する価値があります。また、単一フレームの再構成が上記の20Åの周波数を超えて拡張されない場合、線は適合できず、プログラムは動作しません(NaNに推定Bファクタが与えられます)。そのような場合、Bファクタの重み付けをスキップするか、または同じタブの平均フレームBファクタ推定:1を使用して複数のフレームを平均することを選択できます。【Display】ボタンから出力された研磨粒子(shiny.star)を使ってスターファイルを視覚化して、すべてが正しく行われていることを確認することは、おそらく悪い考えではありません。<br />
<br />
何らかの形で研磨結果に満足していない場合は、【Continue Run】ボタンを使用して計算の一部を繰り返すことができます。 それをクリックすると、プログラムは次のファイルを探し、そこにあればその計算ステップをスキップして次のステップに移ります:<br />
<br />
●frame0??_half?_class001_unfil.mrc<br />
(これらの地図のいずれかが欠落している場合は、再計算されます。それらが既に存在する場合、それらの再構成計算はスキップされる。平均フレームB因子推定のオプションを変更した場合は、すべての再構成を再計算する必要があります。その場合は、古いものを続けるのではなく、新しい仕事を開始する方が良いでしょう。あるいは、既存のフレームの再構築をすべて取り除く必要があります。)<br />
<br />
●bfactors.star<br />
(このファイルが見つからない場合、プログラムは既存のすべてのフレーム再構成を読み込み、Bファクタとスケールファクタを線形フィットからGuinierプロットまで決定します。 したがって、たとえば【Damage】タブのフィットの解像度範囲を変更しても平均フレームB係数推定値を変更しなかった場合、既存のbfactors.starファイルを削除すると非常に便利なので、新しいBファクタとスケールファクタが計算されますが、すべてのマップをもう再構築する必要はありません。 これはずっと速く進むでしょう。)<br />
<br />
●shiny.star<br />
(このファイルがない場合、既存のbfactors.starファイルが読み込まれ、光沢のある粒子はこれらのパラメータに従って再加重されます。 たとえば、以前に決定されたBファクタとスケールファクタのプロットに滑らかな曲線をフィットさせることを決定し、既存のbfactors.starファイルを新しく適合したものに置き換えた場合など、これは非常に便利です。 この場合、プログラムは光沢のある粒子のみを再作成します。)<br />
<br />
=== 9.4 Re-refine the polished particles(磨かれた粒子の精密化) ===<br />
shiny.starの磨かれた粒子は、元のものと比べてシグナル対ノイズ比が向上しています。 これは、再分類するのときに役立ちます。 この時点での異なる分類戦略の詳細な説明については、Methods in Enzymology [12]の最新の章を参照してください。 この章はまだオンラインでは入手できないため、以下を使用して初期の資料をダウンロードできます。<br />
<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relionreview2016.pdf<br />
<br />
研磨自体からの再構成は、より高い分解能のマップをもたらす確率加重角度割り当てを実行するのではなく、最も可能性の高い方向に各粒子を配置するので、少なくとも、研磨された粒子を使用して最終的な[3D auto-refine]を実行します。 したがって、shiny.starを入力として3D auto-refineを繰り返してください。 この精密化の後、後処理と部分的な分解能の推定のやり直しをすることを忘れないでください。<br />
<br />
このテストケースでは、movie-refinementとparticle polishingの前に、復元は既に(ダウンサンプリングされた)データのナイキスト周波数に達しました。 したがって、後者は地図にほとんど影響しませんでした。 このデモンストレーションは、動画処理の仕方を教える上でまだ役立つことを願っています。<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-25T13:13:24Z
<p>Fisherman1: /* 前書き */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjobリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ「2D classification」を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違い、RELION-2.0では【Display:】ボタンで適切なクラスを選択することができません。これは[Subset selection]jobタイプ上で行われます。Select classes from model.starと書かれた行の横にある【Browse】ボタンを利用して、【I/O】タブ上のClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2次元クラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。センタリングされたテンプレートが自動検出中に必要となる一方で、2D classification実行時ではクラス平均はセンタリングされないかもしれないので、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
これは、スペクトルノイズ強度とスケールファクターの推定が不安定なことで、それぞれの電子顕微鏡写真にある粒子が非常に少ない場合に便利なオプションです。デフォルトでは、スケールファクターの推定は顕微鏡写真ごとにそれぞれ計算されます。このオプションは計算実行時、複数の顕微鏡写真の粒子を一緒に計算してグループ化することが可能です。RELIONはクラス分類や自動精密化実行の際にグループがとても小さくなっている場合に警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionカラムに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子のクラス平均を4〜6つ選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
[Auto-picking]jobタイプにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての顕微鏡写真で自動検出を実行する前に、【autopicking】タブ上でPicking threshold、Minimum inter-particle distance、Maximum stddev noise、3つのメインパラメーターを最適化する必要があります。これは時間節約のために、数枚の顕微鏡写真でのみ行われます。<br />
<br />
そのため、2〜3つの顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。[Subset selection]jobタイプで行うには2つの方法があります。OR select from picked coords: の行からManualPick/job004/coords_suffix_manualpick.starを選択、その後左の選択ボックスを使用して2枚の顕微鏡写真のみを選択できます。メニューオプションのInvert selectionでこの作業が便利になるかもしれないということを覚えておいてください。2〜4つの適切な顕微鏡写真を選択したとき、例えばデフォーカスの大きさや氷の厚さはメニューからSave selectionを選択することを忘れないでください。もう1つの方法は、[Subset selection]jobタイプの【I/O】タブからOR select from micrographs.star: の行からCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択し、右クリックメニューからSave STAR with selected imagesを選択して下さい。どんなオプションを選んでも、Select jobへの2mics4autopickのようなエイリアスは意味があるのでしょうか?<br />
<br />
[Auto-picking]jobタイプの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
("Einsteinfrom-noise"の結果を得るために、データから得ようとしている最終的な解像度よりも大幅に低いローパスフィルターを使用することは非常に重要です)<br />
● Highpass filter (A): -1<br />
(たとえば200などの正の値を渡した場合、リファレンスは顕微鏡写真はautopickingよりも高いハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(負の値を渡した場合、入力した顕微鏡写真と同じスケールであると認識します。そうでない場合、例えば粒子を抜き出す上でのリファレンスを作るために使用される粒子をリスケールしたため、正しいピクセルサイズの正の値をここのリファレンスに追加します。)<br />
● Mask diameter (A): 200<br />
([2D classification] jobタイプのときに使った値と同じ値が使えます)<br />
● Angular sampling (deg): 5<br />
(この値はどんな場合でもほとんど正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒いので、使用するリファレンスは白を利用します)<br />
● Are References CTF corrected? Yes<br />
(CTF補正で2Dクラス平均を行ったため)<br />
● Ignore CTFs until first peak: No<br />
([2D classification]jobでもリファレンス作製のために使用した場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeak-searchアルゴリズムのためのFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは、隣接する2つの粒子間の最大許容距離です。反復的クラスタリングアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素領域や非常に汚染されてる特徴が見て取れる領域のピッキングを防止するのに有効です。標準化された顕微鏡写真のバックグラウンド標準偏差がこの値より高い領域のピークは無視される。効果的な値は1.0から1.2の範囲であることが多いです。バックグラウンド標準偏差が高いため、ピークを除去するためにこの機能をオフにするには値を-1にして下さい。)<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動ピッキングアルゴリズムは顕微鏡写真をリファレンスにおいてのローパスフィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の間の値は顕微鏡写真のサイズの画分の結果になります。これはshrink=1(縮小しない)にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(適切なGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではひとつのMPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有効かもしれません。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この問題は どのくらい寛容でいられるかです。RELIONの3Dマルチリファレンス精密手順は強力な教師無し3次元分類へのアプローチを提供している。しかし、まずは低解像度の単一コンセンサスモデルが必要です。初期の結晶構造(PDB-ID 3I3E)から生成された低分解能のベータガラクトシダーゼモデルを使用します。これはすでに projectディレクトリの中に 3i3e_lp50A.mrcという名前で入っています。典型的なプロジェクトでは、良い初期モデルがないかもしれません。その場合は違うプログラムから別のモデルを持ってくる必要があります。その場合は、RELIONと同じように別のプログラムで生成する必要がありますが、初期モデル生成は行いません。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handlerというプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまいません。<br />
<br />
この場合、[Import]という機能を使って、直接プロジェクトに初期モデルをインポート出来きます。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使います。<br />
<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットは一旦選択されると、RELION内の[3D auto-refine]を使える可能性があります。これは、このサブセットを自動的に高い解像度に精密化できます。この手順は解像度を推定するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己高揚による過剰適合を避けることができます[13]。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refine jobタイプを選択してください。GUIでの入力引数は大部分は3D classification jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3D自動精密化の実行後、マップが鋭くなっている必要がある。それも、自動精密化物の内部の至適基準FSCカーブはマスク化されていないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の精密化中に、実際の解像度は概算値を下回っているということを意味している。なぜなら、溶媒領域のノイズがFSCカーブよりも低くなるからです。RELIONにおけるBファクターでの鮮明化と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、タンパク質の末端と溶媒領域の開始点を精密化するためのマスクを作る必要があります。これは[Mask Creation]ジョブタイプを使って行います。<br />
<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3D自動精密化が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。【Mask】タブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶媒マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例としてタンパク質領域の外側にノイズスポットが完全になく表示するキメラのように、ローパスフィルターのかかったマップの描写でのしきい値となります。適切なスポットを見つけるために、しきい値を上げたり下げたりしてみて下さい。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54オプションを付与させてrelion_image_handlerと呼ばれるコマンドラインプログラムを使用できることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりです)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値は白黒画像マスクを生成するのに使われます。このマップ中のホワイト値は全方向の多くのピクセルで増加します。これを使用して、最初のバイナリマスクのサイズを小さくします。)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスクに余弦形状のソフトエッジを配置します。これは、とても鋭いマスクにかなり繊細である可能性があるFSCカーブに、マスクが及ぼす影響を計測する補正手順として重要です。マスクの生成は相対的に早いので、しばしば解像度の最も適した概算を得るためのマスクパラメーターと共に使います。)<br />
<br />
【Helix】タブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通した切片を見たり、UCSFキメラにマスクを読み込ませることができます。後者は、マスクが構造全体をカプセル化するが、マスク内に多くの溶媒を残さないことを確認するために、自動精密手順のマップと一緒に良いアイデアになるかもしれません。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing] jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%外れていたということがわかることがあります。RELION内では、この時までにあげたものは、全部まだ信頼できます。そのため、またマップの精密化やデータのクラス分類をする必要はありません。正確なマップと最終解像度推定のために、ここに正しいピクセルサイズを提供することが今やるべきことです。)<br />
<br />
【Sharpen】タブでは以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、プロジェクトディレクトリの中に保存されているmtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
<br />
● Estimate B-factor automatically: Yes<br />
<br />
この手順は[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要がある。もしマップが10Åに満たない場合、特別なB-factorを代わりに使う必要があるかもしれない。<br />
<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
<br />
● Use your own B-factor? No<br />
<br />
<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションは、全体マップの解像度を超えるような解像度へと拡張するマップ範囲を解析するために、ときどき便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3drefのようなエイリアスを使ってください。【Display】ボタンを使って、後処理されるマップとFSCカーブの入ったPDFと構造のギニエプロットを通して、ディスプレイを切り分けられます。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D auto-refineのマップに収束されている全てのα-へリックスの場所を簡単に見ることが出来る。<br />
<br />
解像度の推定は、以前に発表された[2]の相のランダム化手順に基づいている。相のランダムマップのFSC(赤いカーブ)が、推定していた後処理マップの解像度のゼロ点より多いのか少ないのかを確認してください。少ない場合は、マスクが鮮明すぎるか、細部の描写が多すぎます。この場合は。強いローパスフィルターを使ったり、以前のマスクを作るステップにて、より広く柔らかいマスクを使ったりしてください。実際に少し柔らかいマスクを作りたくなるかもしれない。その場合は5ピクセルの角がよくなるように試してみてください。もし、このために【Continue now】ボタンを使ったら、前の結果が上書きされます。【Run now!】ボタンの左にある[browser]ジョブをクリックしてください。すると、新しい出力ディレクトリが出来ます<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing(パーティクルポリッシング) ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: <br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子が大きければ大きいほど、ムービーリファインメントからの動きの騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセルなどの値を使用することがよくあります。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単に計算資源を節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、単一フレーム再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 信頼できるBファクタを推定するのに十分な解像度を得られない再構成があれば、このオプションを使用して3つまたは7つの5つのムービーフレームのムービーフレームを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、粒子抽出jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
Helixタブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えています。 このjobの最大MPIプロセッサ数は、データの2倍のムービーフレーム数です。 粒子ボックスが比較的大きい場合、メモリ要件は重要ですが、通常は3Dオートリファインの最後の反復実行時よりも大きくはありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線損傷重みのBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。 推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と、動作軌跡と線形フィットはすべて、Polish / first3drefという大きなPDFファイルにあります /logfile.pdfを開き、【Display】ボタンから開くことができます。<br />
<br />
私たちはしばしば最初の1-2フレームではサンプルが大きく動く比較的大きな負のBファクタを観測し、その後に放射線被害が入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
何らかの形で推定されたBファクタまたはスケールファクタが奇妙に見える場合、Guinierプロットを通じて線形フィットを調べることができます。時には、Guinierプロットは、Damageタブに入力された全周波数範囲にわたって直線でよくフィットすることができません。その後、異なるパラメータでjobを再実行する価値があります。また、単一フレームの再構成が上記の20Åの周波数を超えて拡張されない場合、線は適合できず、プログラムは動作しません(NaNに推定Bファクタが与えられます)。そのような場合、Bファクタの重み付けをスキップするか、または同じタブの平均フレームBファクタ推定:1を使用して複数のフレームを平均することを選択できます。【Display】ボタンから出力された研磨粒子(shiny.star)を使ってスターファイルを視覚化して、すべてが正しく行われていることを確認することは、おそらく悪い考えではありません。<br />
<br />
何らかの形で研磨結果に満足していない場合は、【Continue Run】ボタンを使用して計算の一部を繰り返すことができます。 それをクリックすると、プログラムは次のファイルを探し、そこにあればその計算ステップをスキップして次のステップに移ります:<br />
<br />
●frame0??_half?_class001_unfil.mrc<br />
(これらの地図のいずれかが欠落している場合は、再計算されます。それらが既に存在する場合、それらの再構成計算はスキップされる。平均フレームB因子推定のオプションを変更した場合は、すべての再構成を再計算する必要があります。その場合は、古いものを続けるのではなく、新しい仕事を開始する方が良いでしょう。あるいは、既存のフレームの再構築をすべて取り除く必要があります。)<br />
<br />
●bfactors.star<br />
(このファイルが見つからない場合、プログラムは既存のすべてのフレーム再構成を読み込み、Bファクタとスケールファクタを線形フィットからGuinierプロットまで決定します。 したがって、たとえば【Damage】タブのフィットの解像度範囲を変更しても平均フレームB係数推定値を変更しなかった場合、既存のbfactors.starファイルを削除すると非常に便利なので、新しいBファクタとスケールファクタが計算されますが、すべてのマップをもう再構築する必要はありません。 これはずっと速く進むでしょう。)<br />
<br />
●shiny.star<br />
(このファイルがない場合、既存のbfactors.starファイルが読み込まれ、光沢のある粒子はこれらのパラメータに従って再加重されます。 たとえば、以前に決定されたBファクタとスケールファクタのプロットに滑らかな曲線をフィットさせることを決定し、既存のbfactors.starファイルを新しく適合したものに置き換えた場合など、これは非常に便利です。 この場合、プログラムは光沢のある粒子のみを再作成します。)<br />
<br />
=== 9.4 Re-refine the polished particles(磨かれた粒子の再精製) ===<br />
shiny.starの磨かれた粒子は、オリジナルのものと比べて信号対ノイズ比が向上しています。 これは、再分類するのに役立ちます。 この時点での異なる分類戦略の詳細な説明については、Methods in Enzymology [12]の最新の章を参照してください。 この章はまだオンラインでは入手できないため、以下を使用して初期のドラフトをダウンロードできます。<br />
<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relionreview2016.pdf<br />
<br />
研磨自体からの再構成は、より高い分解能のマップをもたらす確率加重角度割り当てを実行するのではなく、最も可能性の高い方向に各粒子を配置するので、少なくとも、研磨された粒子を使用して最終的な[3D自動調整]を実行します。 そのため、shiny.starを入力として3Dオートリファインを繰り返します。 この改良の後、後処理と局所分解能推定をやり直すことを忘れないでください。<br />
<br />
このテストケースでは、ムービーリファインメントとパーティクルポリシングの前に、再構成はすでに(ダウンサンプリングされた)データのナイキスト周波数に達しました。 したがって、後者は地図にほとんど影響しませんでした。 このデモンストレーションは、映画処理の仕方を教える上でまだ役立つことを願っています。<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-25T11:07:57Z
<p>Fisherman1: /* 9.3 Particle polishing */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjobリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ「2D classification」を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違い、RELION-2.0では【Display:】ボタンで適切なクラスを選択することができません。これは[Subset selection]jobタイプ上で行われます。Select classes from model.starと書かれた行の横にある【Browse】ボタンを利用して、【I/O】タブ上のClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2次元クラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。センタリングされたテンプレートが自動検出中に必要となる一方で、2D classification実行時ではクラス平均はセンタリングされないかもしれないので、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
これは、スペクトルノイズ強度とスケールファクターの推定が不安定なことで、それぞれの電子顕微鏡写真にある粒子が非常に少ない場合に便利なオプションです。デフォルトでは、スケールファクターの推定は顕微鏡写真ごとにそれぞれ計算されます。このオプションは計算実行時、複数の顕微鏡写真の粒子を一緒に計算してグループ化することが可能です。RELIONはクラス分類や自動精密化実行の際にグループがとても小さくなっている場合に警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionカラムに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子のクラス平均を4〜6つ選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
[Auto-picking]jobタイプにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての顕微鏡写真で自動検出を実行する前に、【autopicking】タブ上でPicking threshold、Minimum inter-particle distance、Maximum stddev noise、3つのメインパラメーターを最適化する必要があります。これは時間節約のために、数枚の顕微鏡写真でのみ行われます。<br />
<br />
そのため、2〜3つの顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。[Subset selection]jobタイプで行うには2つの方法があります。OR select from picked coords:の行からManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionでこの作業が便利になるかもしれないということを覚えておいてください。<br />
2-4つの適切な顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)はメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、[Subset selection]jobタイプの【I/O】タブからOR select from micrographs.star:の行からでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
[Auto-picking]jobタイプの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などの正の値を渡した場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(負の値を渡した場合、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズの正の値をここに入力します)<br />
● Mask diameter (A): 200<br />
([2D classification] jobタイプのときに使った値と同じ値が使えます)<br />
● Angular sampling (deg): 5<br />
(この値はどんな場合でもほとんど正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製のために使用した[2D classification]jobも行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です。反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。正常化された顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するためにこの機能をオフにするには値を-1にして下さい。)<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパスフィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の間の値は顕微鏡写真のサイズの画分の結果になります。<br />
すなわち、これはshrink=1(縮小しない)にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(適切なGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではひとつのMPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有効かもしれません。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精密手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットは一旦選択されると、RELION内の[3D auto-refine]を使える可能性があります。これは、このサブセットを自動的に高い解像度に精密化できます。この手順は解像度を推定するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己高揚による過剰適合を避けることができます[13]。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refine jobタイプを選択してください。GUIでの入力引数は大部分は3D classification jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3D自動精密化の実行後、マップが鋭くなっている必要がある。それも、自動精密化物の内部の至適基準FSCカーブはマスク化されていないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の精密化中に、実際の解像度は概算値を下回っているということを意味している。なぜなら、溶媒領域のノイズがFSCカーブよりも低くなるからです。RELIONにおけるBファクターでの鮮明化と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、タンパク質の末端と溶媒領域の開始点を精密化するためのマスクを作る必要があります。これは[Mask Creation]ジョブタイプを使って行います。<br />
<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3D自動精密化が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。【Mask】タブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶媒マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例としてタンパク質領域の外側にノイズスポットが完全になく表示するキメラのように、ローパスフィルターのかかったマップの描写でのしきい値となります。適切なスポットを見つけるために、しきい値を上げたり下げたりしてみて下さい。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54オプションを付与させてrelion_image_handlerと呼ばれるコマンドラインプログラムを使用できることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりです)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値は白黒画像マスクを生成するのに使われます。このマップ中のホワイト値は全方向の多くのピクセルで増加します。これを使用して、最初のバイナリマスクのサイズを小さくします。)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスクに余弦形状のソフトエッジを配置します。これは、とても鋭いマスクにかなり繊細である可能性があるFSCカーブに、マスクが及ぼす影響を計測する補正手順として重要です。マスクの生成は相対的に早いので、しばしば解像度の最も適した概算を得るためのマスクパラメーターと共に使います。)<br />
<br />
【Helix】タブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通した切片を見たり、UCSFキメラにマスクを読み込ませることができます。後者は、マスクが構造全体をカプセル化するが、マスク内に多くの溶媒を残さないことを確認するために、自動精密手順のマップと一緒に良いアイデアになるかもしれません。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing] jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%外れていたということがわかることがあります。RELION内では、この時までにあげたものは、全部まだ信頼できます。そのため、またマップの精密化やデータのクラス分類をする必要はありません。正確なマップと最終解像度推定のために、ここに正しいピクセルサイズを提供することが今やるべきことです。)<br />
<br />
【Sharpen】タブでは以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、プロジェクトディレクトリの中に保存されているmtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
<br />
● Estimate B-factor automatically: Yes<br />
<br />
この手順は[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要がある。もしマップが10Åに満たない場合、特別なB-factorを代わりに使う必要があるかもしれない。<br />
<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
<br />
● Use your own B-factor? No<br />
<br />
<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションは、全体マップの解像度を超えるような解像度へと拡張するマップ範囲を解析するために、ときどき便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3drefのようなエイリアスを使ってください。【Display】ボタンを使って、後処理されるマップとFSCカーブの入ったPDFと構造のギニエプロットを通して、ディスプレイを切り分けられます。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D auto-refineのマップに収束されている全てのα-へリックスの場所を簡単に見ることが出来る。<br />
<br />
解像度の推定は、以前に発表された[2]の相のランダム化手順に基づいている。相のランダムマップのFSC(赤いカーブ)が、推定していた後処理マップの解像度のゼロ点より多いのか少ないのかを確認してください。少ない場合は、マスクが鮮明すぎるか、細部の描写が多すぎます。この場合は。強いローパスフィルターを使ったり、以前のマスクを作るステップにて、より広く柔らかいマスクを使ったりしてください。実際に少し柔らかいマスクを作りたくなるかもしれない。その場合は5ピクセルの角がよくなるように試してみてください。もし、このために【Continue now】ボタンを使ったら、前の結果が上書きされます。【Run now!】ボタンの左にある[browser]ジョブをクリックしてください。すると、新しい出力ディレクトリが出来ます<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing(パーティクルポリッシング) ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: <br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子が大きければ大きいほど、ムービーリファインメントからの動きの騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセルなどの値を使用することがよくあります。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単に計算資源を節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、単一フレーム再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 信頼できるBファクタを推定するのに十分な解像度を得られない再構成があれば、このオプションを使用して3つまたは7つの5つのムービーフレームのムービーフレームを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、粒子抽出jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
Helixタブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えています。 このjobの最大MPIプロセッサ数は、データの2倍のムービーフレーム数です。 粒子ボックスが比較的大きい場合、メモリ要件は重要ですが、通常は3Dオートリファインの最後の反復実行時よりも大きくはありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線損傷重みのBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。 推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と、動作軌跡と線形フィットはすべて、Polish / first3drefという大きなPDFファイルにあります /logfile.pdfを開き、【Display】ボタンから開くことができます。<br />
<br />
私たちはしばしば最初の1-2フレームではサンプルが大きく動く比較的大きな負のBファクタを観測し、その後に放射線被害が入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
何らかの形で推定されたBファクタまたはスケールファクタが奇妙に見える場合、Guinierプロットを通じて線形フィットを調べることができます。時には、Guinierプロットは、Damageタブに入力された全周波数範囲にわたって直線でよくフィットすることができません。その後、異なるパラメータでjobを再実行する価値があります。また、単一フレームの再構成が上記の20Åの周波数を超えて拡張されない場合、線は適合できず、プログラムは動作しません(NaNに推定Bファクタが与えられます)。そのような場合、Bファクタの重み付けをスキップするか、または同じタブの平均フレームBファクタ推定:1を使用して複数のフレームを平均することを選択できます。【Display】ボタンから出力された研磨粒子(shiny.star)を使ってスターファイルを視覚化して、すべてが正しく行われていることを確認することは、おそらく悪い考えではありません。<br />
<br />
何らかの形で研磨結果に満足していない場合は、【Continue Run】ボタンを使用して計算の一部を繰り返すことができます。 それをクリックすると、プログラムは次のファイルを探し、そこにあればその計算ステップをスキップして次のステップに移ります:<br />
<br />
●frame0??_half?_class001_unfil.mrc<br />
(これらの地図のいずれかが欠落している場合は、再計算されます。それらが既に存在する場合、それらの再構成計算はスキップされる。平均フレームB因子推定のオプションを変更した場合は、すべての再構成を再計算する必要があります。その場合は、古いものを続けるのではなく、新しい仕事を開始する方が良いでしょう。あるいは、既存のフレームの再構築をすべて取り除く必要があります。)<br />
<br />
●bfactors.star<br />
(このファイルが見つからない場合、プログラムは既存のすべてのフレーム再構成を読み込み、Bファクタとスケールファクタを線形フィットからGuinierプロットまで決定します。 したがって、たとえば【Damage】タブのフィットの解像度範囲を変更しても平均フレームB係数推定値を変更しなかった場合、既存のbfactors.starファイルを削除すると非常に便利なので、新しいBファクタとスケールファクタが計算されますが、すべてのマップをもう再構築する必要はありません。 これはずっと速く進むでしょう。)<br />
<br />
●shiny.star<br />
(このファイルがない場合、既存のbfactors.starファイルが読み込まれ、光沢のある粒子はこれらのパラメータに従って再加重されます。 たとえば、以前に決定されたBファクタとスケールファクタのプロットに滑らかな曲線をフィットさせることを決定し、既存のbfactors.starファイルを新しく適合したものに置き換えた場合など、これは非常に便利です。 この場合、プログラムは光沢のある粒子のみを再作成します。)<br />
<br />
=== 9.4 Re-refine the polished particles(磨かれた粒子の再精製) ===<br />
shiny.starの磨かれた粒子は、オリジナルのものと比べて信号対ノイズ比が向上しています。 これは、再分類するのに役立ちます。 この時点での異なる分類戦略の詳細な説明については、Methods in Enzymology [12]の最新の章を参照してください。 この章はまだオンラインでは入手できないため、以下を使用して初期のドラフトをダウンロードできます。<br />
<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relionreview2016.pdf<br />
<br />
研磨自体からの再構成は、より高い分解能のマップをもたらす確率加重角度割り当てを実行するのではなく、最も可能性の高い方向に各粒子を配置するので、少なくとも、研磨された粒子を使用して最終的な[3D自動調整]を実行します。 そのため、shiny.starを入力として3Dオートリファインを繰り返します。 この改良の後、後処理と局所分解能推定をやり直すことを忘れないでください。<br />
<br />
このテストケースでは、ムービーリファインメントとパーティクルポリシングの前に、再構成はすでに(ダウンサンプリングされた)データのナイキスト周波数に達しました。 したがって、後者は地図にほとんど影響しませんでした。 このデモンストレーションは、映画処理の仕方を教える上でまだ役立つことを願っています。<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-25T11:07:20Z
<p>Fisherman1: /* 9.4 */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjobリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ「2D classification」を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違い、RELION-2.0では【Display:】ボタンで適切なクラスを選択することができません。これは[Subset selection]jobタイプ上で行われます。Select classes from model.starと書かれた行の横にある【Browse】ボタンを利用して、【I/O】タブ上のClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2次元クラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。センタリングされたテンプレートが自動検出中に必要となる一方で、2D classification実行時ではクラス平均はセンタリングされないかもしれないので、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
これは、スペクトルノイズ強度とスケールファクターの推定が不安定なことで、それぞれの電子顕微鏡写真にある粒子が非常に少ない場合に便利なオプションです。デフォルトでは、スケールファクターの推定は顕微鏡写真ごとにそれぞれ計算されます。このオプションは計算実行時、複数の顕微鏡写真の粒子を一緒に計算してグループ化することが可能です。RELIONはクラス分類や自動精密化実行の際にグループがとても小さくなっている場合に警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionカラムに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子のクラス平均を4〜6つ選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
[Auto-picking]jobタイプにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての顕微鏡写真で自動検出を実行する前に、【autopicking】タブ上でPicking threshold、Minimum inter-particle distance、Maximum stddev noise、3つのメインパラメーターを最適化する必要があります。これは時間節約のために、数枚の顕微鏡写真でのみ行われます。<br />
<br />
そのため、2〜3つの顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。[Subset selection]jobタイプで行うには2つの方法があります。OR select from picked coords:の行からManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionでこの作業が便利になるかもしれないということを覚えておいてください。<br />
2-4つの適切な顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)はメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、[Subset selection]jobタイプの【I/O】タブからOR select from micrographs.star:の行からでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
[Auto-picking]jobタイプの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などの正の値を渡した場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(負の値を渡した場合、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズの正の値をここに入力します)<br />
● Mask diameter (A): 200<br />
([2D classification] jobタイプのときに使った値と同じ値が使えます)<br />
● Angular sampling (deg): 5<br />
(この値はどんな場合でもほとんど正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製のために使用した[2D classification]jobも行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です。反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。正常化された顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するためにこの機能をオフにするには値を-1にして下さい。)<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパスフィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の間の値は顕微鏡写真のサイズの画分の結果になります。<br />
すなわち、これはshrink=1(縮小しない)にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(適切なGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではひとつのMPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有効かもしれません。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精密手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットは一旦選択されると、RELION内の[3D auto-refine]を使える可能性があります。これは、このサブセットを自動的に高い解像度に精密化できます。この手順は解像度を推定するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己高揚による過剰適合を避けることができます[13]。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refine jobタイプを選択してください。GUIでの入力引数は大部分は3D classification jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3D自動精密化の実行後、マップが鋭くなっている必要がある。それも、自動精密化物の内部の至適基準FSCカーブはマスク化されていないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の精密化中に、実際の解像度は概算値を下回っているということを意味している。なぜなら、溶媒領域のノイズがFSCカーブよりも低くなるからです。RELIONにおけるBファクターでの鮮明化と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、タンパク質の末端と溶媒領域の開始点を精密化するためのマスクを作る必要があります。これは[Mask Creation]ジョブタイプを使って行います。<br />
<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3D自動精密化が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。【Mask】タブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶媒マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例としてタンパク質領域の外側にノイズスポットが完全になく表示するキメラのように、ローパスフィルターのかかったマップの描写でのしきい値となります。適切なスポットを見つけるために、しきい値を上げたり下げたりしてみて下さい。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54オプションを付与させてrelion_image_handlerと呼ばれるコマンドラインプログラムを使用できることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりです)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値は白黒画像マスクを生成するのに使われます。このマップ中のホワイト値は全方向の多くのピクセルで増加します。これを使用して、最初のバイナリマスクのサイズを小さくします。)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスクに余弦形状のソフトエッジを配置します。これは、とても鋭いマスクにかなり繊細である可能性があるFSCカーブに、マスクが及ぼす影響を計測する補正手順として重要です。マスクの生成は相対的に早いので、しばしば解像度の最も適した概算を得るためのマスクパラメーターと共に使います。)<br />
<br />
【Helix】タブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通した切片を見たり、UCSFキメラにマスクを読み込ませることができます。後者は、マスクが構造全体をカプセル化するが、マスク内に多くの溶媒を残さないことを確認するために、自動精密手順のマップと一緒に良いアイデアになるかもしれません。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing] jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%外れていたということがわかることがあります。RELION内では、この時までにあげたものは、全部まだ信頼できます。そのため、またマップの精密化やデータのクラス分類をする必要はありません。正確なマップと最終解像度推定のために、ここに正しいピクセルサイズを提供することが今やるべきことです。)<br />
<br />
【Sharpen】タブでは以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、プロジェクトディレクトリの中に保存されているmtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
<br />
● Estimate B-factor automatically: Yes<br />
<br />
この手順は[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要がある。もしマップが10Åに満たない場合、特別なB-factorを代わりに使う必要があるかもしれない。<br />
<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
<br />
● Use your own B-factor? No<br />
<br />
<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションは、全体マップの解像度を超えるような解像度へと拡張するマップ範囲を解析するために、ときどき便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3drefのようなエイリアスを使ってください。【Display】ボタンを使って、後処理されるマップとFSCカーブの入ったPDFと構造のギニエプロットを通して、ディスプレイを切り分けられます。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D auto-refineのマップに収束されている全てのα-へリックスの場所を簡単に見ることが出来る。<br />
<br />
解像度の推定は、以前に発表された[2]の相のランダム化手順に基づいている。相のランダムマップのFSC(赤いカーブ)が、推定していた後処理マップの解像度のゼロ点より多いのか少ないのかを確認してください。少ない場合は、マスクが鮮明すぎるか、細部の描写が多すぎます。この場合は。強いローパスフィルターを使ったり、以前のマスクを作るステップにて、より広く柔らかいマスクを使ったりしてください。実際に少し柔らかいマスクを作りたくなるかもしれない。その場合は5ピクセルの角がよくなるように試してみてください。もし、このために【Continue now】ボタンを使ったら、前の結果が上書きされます。【Run now!】ボタンの左にある[browser]ジョブをクリックしてください。すると、新しい出力ディレクトリが出来ます<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: <br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子が大きければ大きいほど、ムービーリファインメントからの動きの騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセルなどの値を使用することがよくあります。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単に計算資源を節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、単一フレーム再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 信頼できるBファクタを推定するのに十分な解像度を得られない再構成があれば、このオプションを使用して3つまたは7つの5つのムービーフレームのムービーフレームを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、粒子抽出jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
Helixタブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えています。 このjobの最大MPIプロセッサ数は、データの2倍のムービーフレーム数です。 粒子ボックスが比較的大きい場合、メモリ要件は重要ですが、通常は3Dオートリファインの最後の反復実行時よりも大きくはありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線損傷重みのBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。 推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と、動作軌跡と線形フィットはすべて、Polish / first3drefという大きなPDFファイルにあります /logfile.pdfを開き、【Display】ボタンから開くことができます。<br />
<br />
私たちはしばしば最初の1-2フレームではサンプルが大きく動く比較的大きな負のBファクタを観測し、その後に放射線被害が入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
何らかの形で推定されたBファクタまたはスケールファクタが奇妙に見える場合、Guinierプロットを通じて線形フィットを調べることができます。時には、Guinierプロットは、Damageタブに入力された全周波数範囲にわたって直線でよくフィットすることができません。その後、異なるパラメータでjobを再実行する価値があります。また、単一フレームの再構成が上記の20Åの周波数を超えて拡張されない場合、線は適合できず、プログラムは動作しません(NaNに推定Bファクタが与えられます)。そのような場合、Bファクタの重み付けをスキップするか、または同じタブの平均フレームBファクタ推定:1を使用して複数のフレームを平均することを選択できます。【Display】ボタンから出力された研磨粒子(shiny.star)を使ってスターファイルを視覚化して、すべてが正しく行われていることを確認することは、おそらく悪い考えではありません。<br />
<br />
何らかの形で研磨結果に満足していない場合は、【Continue Run】ボタンを使用して計算の一部を繰り返すことができます。 それをクリックすると、プログラムは次のファイルを探し、そこにあればその計算ステップをスキップして次のステップに移ります:<br />
<br />
●frame0??_half?_class001_unfil.mrc<br />
(これらの地図のいずれかが欠落している場合は、再計算されます。それらが既に存在する場合、それらの再構成計算はスキップされる。平均フレームB因子推定のオプションを変更した場合は、すべての再構成を再計算する必要があります。その場合は、古いものを続けるのではなく、新しい仕事を開始する方が良いでしょう。あるいは、既存のフレームの再構築をすべて取り除く必要があります。)<br />
<br />
●bfactors.star<br />
(このファイルが見つからない場合、プログラムは既存のすべてのフレーム再構成を読み込み、Bファクタとスケールファクタを線形フィットからGuinierプロットまで決定します。 したがって、たとえば【Damage】タブのフィットの解像度範囲を変更しても平均フレームB係数推定値を変更しなかった場合、既存のbfactors.starファイルを削除すると非常に便利なので、新しいBファクタとスケールファクタが計算されますが、すべてのマップをもう再構築する必要はありません。 これはずっと速く進むでしょう。)<br />
<br />
●shiny.star<br />
(このファイルがない場合、既存のbfactors.starファイルが読み込まれ、光沢のある粒子はこれらのパラメータに従って再加重されます。 たとえば、以前に決定されたBファクタとスケールファクタのプロットに滑らかな曲線をフィットさせることを決定し、既存のbfactors.starファイルを新しく適合したものに置き換えた場合など、これは非常に便利です。 この場合、プログラムは光沢のある粒子のみを再作成します。)<br />
<br />
=== 9.4 Re-refine the polished particles(磨かれた粒子の再精製) ===<br />
shiny.starの磨かれた粒子は、オリジナルのものと比べて信号対ノイズ比が向上しています。 これは、再分類するのに役立ちます。 この時点での異なる分類戦略の詳細な説明については、Methods in Enzymology [12]の最新の章を参照してください。 この章はまだオンラインでは入手できないため、以下を使用して初期のドラフトをダウンロードできます。<br />
<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relionreview2016.pdf<br />
<br />
研磨自体からの再構成は、より高い分解能のマップをもたらす確率加重角度割り当てを実行するのではなく、最も可能性の高い方向に各粒子を配置するので、少なくとも、研磨された粒子を使用して最終的な[3D自動調整]を実行します。 そのため、shiny.starを入力として3Dオートリファインを繰り返します。 この改良の後、後処理と局所分解能推定をやり直すことを忘れないでください。<br />
<br />
このテストケースでは、ムービーリファインメントとパーティクルポリシングの前に、再構成はすでに(ダウンサンプリングされた)データのナイキスト周波数に達しました。 したがって、後者は地図にほとんど影響しませんでした。 このデモンストレーションは、映画処理の仕方を教える上でまだ役立つことを願っています。<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-25T10:58:49Z
<p>Fisherman1: /* 9.3 Particle polishing */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjobリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ「2D classification」を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違い、RELION-2.0では【Display:】ボタンで適切なクラスを選択することができません。これは[Subset selection]jobタイプ上で行われます。Select classes from model.starと書かれた行の横にある【Browse】ボタンを利用して、【I/O】タブ上のClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2次元クラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。センタリングされたテンプレートが自動検出中に必要となる一方で、2D classification実行時ではクラス平均はセンタリングされないかもしれないので、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
これは、スペクトルノイズ強度とスケールファクターの推定が不安定なことで、それぞれの電子顕微鏡写真にある粒子が非常に少ない場合に便利なオプションです。デフォルトでは、スケールファクターの推定は顕微鏡写真ごとにそれぞれ計算されます。このオプションは計算実行時、複数の顕微鏡写真の粒子を一緒に計算してグループ化することが可能です。RELIONはクラス分類や自動精密化実行の際にグループがとても小さくなっている場合に警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionカラムに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子のクラス平均を4〜6つ選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
[Auto-picking]jobタイプにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての顕微鏡写真で自動検出を実行する前に、【autopicking】タブ上でPicking threshold、Minimum inter-particle distance、Maximum stddev noise、3つのメインパラメーターを最適化する必要があります。これは時間節約のために、数枚の顕微鏡写真でのみ行われます。<br />
<br />
そのため、2〜3つの顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。[Subset selection]jobタイプで行うには2つの方法があります。OR select from picked coords:の行からManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionでこの作業が便利になるかもしれないということを覚えておいてください。<br />
2-4つの適切な顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)はメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、[Subset selection]jobタイプの【I/O】タブからOR select from micrographs.star:の行からでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
[Auto-picking]jobタイプの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などの正の値を渡した場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(負の値を渡した場合、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズの正の値をここに入力します)<br />
● Mask diameter (A): 200<br />
([2D classification] jobタイプのときに使った値と同じ値が使えます)<br />
● Angular sampling (deg): 5<br />
(この値はどんな場合でもほとんど正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製のために使用した[2D classification]jobも行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です。反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。正常化された顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するためにこの機能をオフにするには値を-1にして下さい。)<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパスフィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の間の値は顕微鏡写真のサイズの画分の結果になります。<br />
すなわち、これはshrink=1(縮小しない)にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(適切なGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではひとつのMPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有効かもしれません。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精密手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットは一旦選択されると、RELION内の[3D auto-refine]を使える可能性があります。これは、このサブセットを自動的に高い解像度に精密化できます。この手順は解像度を推定するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己高揚による過剰適合を避けることができます[13]。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refine jobタイプを選択してください。GUIでの入力引数は大部分は3D classification jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3D自動精密化の実行後、マップが鋭くなっている必要がある。それも、自動精密化物の内部の至適基準FSCカーブはマスク化されていないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の精密化中に、実際の解像度は概算値を下回っているということを意味している。なぜなら、溶媒領域のノイズがFSCカーブよりも低くなるからです。RELIONにおけるBファクターでの鮮明化と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、タンパク質の末端と溶媒領域の開始点を精密化するためのマスクを作る必要があります。これは[Mask Creation]ジョブタイプを使って行います。<br />
<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3D自動精密化が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。【Mask】タブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶媒マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例としてタンパク質領域の外側にノイズスポットが完全になく表示するキメラのように、ローパスフィルターのかかったマップの描写でのしきい値となります。適切なスポットを見つけるために、しきい値を上げたり下げたりしてみて下さい。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54オプションを付与させてrelion_image_handlerと呼ばれるコマンドラインプログラムを使用できることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりです)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値は白黒画像マスクを生成するのに使われます。このマップ中のホワイト値は全方向の多くのピクセルで増加します。これを使用して、最初のバイナリマスクのサイズを小さくします。)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスクに余弦形状のソフトエッジを配置します。これは、とても鋭いマスクにかなり繊細である可能性があるFSCカーブに、マスクが及ぼす影響を計測する補正手順として重要です。マスクの生成は相対的に早いので、しばしば解像度の最も適した概算を得るためのマスクパラメーターと共に使います。)<br />
<br />
【Helix】タブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通した切片を見たり、UCSFキメラにマスクを読み込ませることができます。後者は、マスクが構造全体をカプセル化するが、マスク内に多くの溶媒を残さないことを確認するために、自動精密手順のマップと一緒に良いアイデアになるかもしれません。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing] jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%外れていたということがわかることがあります。RELION内では、この時までにあげたものは、全部まだ信頼できます。そのため、またマップの精密化やデータのクラス分類をする必要はありません。正確なマップと最終解像度推定のために、ここに正しいピクセルサイズを提供することが今やるべきことです。)<br />
<br />
【Sharpen】タブでは以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、プロジェクトディレクトリの中に保存されているmtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
<br />
● Estimate B-factor automatically: Yes<br />
<br />
この手順は[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要がある。もしマップが10Åに満たない場合、特別なB-factorを代わりに使う必要があるかもしれない。<br />
<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
<br />
● Use your own B-factor? No<br />
<br />
<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションは、全体マップの解像度を超えるような解像度へと拡張するマップ範囲を解析するために、ときどき便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3drefのようなエイリアスを使ってください。【Display】ボタンを使って、後処理されるマップとFSCカーブの入ったPDFと構造のギニエプロットを通して、ディスプレイを切り分けられます。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D auto-refineのマップに収束されている全てのα-へリックスの場所を簡単に見ることが出来る。<br />
<br />
解像度の推定は、以前に発表された[2]の相のランダム化手順に基づいている。相のランダムマップのFSC(赤いカーブ)が、推定していた後処理マップの解像度のゼロ点より多いのか少ないのかを確認してください。少ない場合は、マスクが鮮明すぎるか、細部の描写が多すぎます。この場合は。強いローパスフィルターを使ったり、以前のマスクを作るステップにて、より広く柔らかいマスクを使ったりしてください。実際に少し柔らかいマスクを作りたくなるかもしれない。その場合は5ピクセルの角がよくなるように試してみてください。もし、このために【Continue now】ボタンを使ったら、前の結果が上書きされます。【Run now!】ボタンの左にある[browser]ジョブをクリックしてください。すると、新しい出力ディレクトリが出来ます<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: <br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子が大きければ大きいほど、ムービーリファインメントからの動きの騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセルなどの値を使用することがよくあります。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単に計算資源を節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、単一フレーム再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 信頼できるBファクタを推定するのに十分な解像度を得られない再構成があれば、このオプションを使用して3つまたは7つの5つのムービーフレームのムービーフレームを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、粒子抽出jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
Helixタブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えています。 このjobの最大MPIプロセッサ数は、データの2倍のムービーフレーム数です。 粒子ボックスが比較的大きい場合、メモリ要件は重要ですが、通常は3Dオートリファインの最後の反復実行時よりも大きくはありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線損傷重みのBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。 推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と、動作軌跡と線形フィットはすべて、Polish / first3drefという大きなPDFファイルにあります /logfile.pdfを開き、【Display】ボタンから開くことができます。<br />
<br />
私たちはしばしば最初の1-2フレームではサンプルが大きく動く比較的大きな負のBファクタを観測し、その後に放射線被害が入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
何らかの形で推定されたBファクタまたはスケールファクタが奇妙に見える場合、Guinierプロットを通じて線形フィットを調べることができます。時には、Guinierプロットは、Damageタブに入力された全周波数範囲にわたって直線でよくフィットすることができません。その後、異なるパラメータでjobを再実行する価値があります。また、単一フレームの再構成が上記の20Åの周波数を超えて拡張されない場合、線は適合できず、プログラムは動作しません(NaNに推定Bファクタが与えられます)。そのような場合、Bファクタの重み付けをスキップするか、または同じタブの平均フレームBファクタ推定:1を使用して複数のフレームを平均することを選択できます。【Display】ボタンから出力された研磨粒子(shiny.star)を使ってスターファイルを視覚化して、すべてが正しく行われていることを確認することは、おそらく悪い考えではありません。<br />
<br />
何らかの形で研磨結果に満足していない場合は、【Continue Run】ボタンを使用して計算の一部を繰り返すことができます。 それをクリックすると、プログラムは次のファイルを探し、そこにあればその計算ステップをスキップして次のステップに移ります:<br />
<br />
●frame0??_half?_class001_unfil.mrc<br />
(これらの地図のいずれかが欠落している場合は、再計算されます。それらが既に存在する場合、それらの再構成計算はスキップされる。平均フレームB因子推定のオプションを変更した場合は、すべての再構成を再計算する必要があります。その場合は、古いものを続けるのではなく、新しい仕事を開始する方が良いでしょう。あるいは、既存のフレームの再構築をすべて取り除く必要があります。)<br />
<br />
●bfactors.star<br />
(このファイルが見つからない場合、プログラムは既存のすべてのフレーム再構成を読み込み、Bファクタとスケールファクタを線形フィットからGuinierプロットまで決定します。 したがって、たとえば【Damage】タブのフィットの解像度範囲を変更しても平均フレームB係数推定値を変更しなかった場合、既存のbfactors.starファイルを削除すると非常に便利なので、新しいBファクタとスケールファクタが計算されますが、すべてのマップをもう再構築する必要はありません。 これはずっと速く進むでしょう。)<br />
<br />
●shiny.star<br />
(このファイルがない場合、既存のbfactors.starファイルが読み込まれ、光沢のある粒子はこれらのパラメータに従って再加重されます。 たとえば、以前に決定されたBファクタとスケールファクタのプロットに滑らかな曲線をフィットさせることを決定し、既存のbfactors.starファイルを新しく適合したものに置き換えた場合など、これは非常に便利です。 この場合、プログラムは光沢のある粒子のみを再作成します。)<br />
<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-23T15:06:42Z
<p>Fisherman1: /* 9.3 Particle polishing */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは【Subset selection】ジョブタイプ上で行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精密化を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精密手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refine jobタイプを選択してください。GUIでの入力引数は大部分は3D classification jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing] jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%外れていたということがわかることがあります。RELION内では、この時までにあげたものは、全部まだ信頼できます。そのため、またマップの精密化やデータのクラス分類をする必要はありません。正確なマップと最終解像度推定のために、ここに正しいピクセルサイズを提供することが今やるべきことです。)<br />
<br />
【Sharpen】タブでは以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、プロジェクトディレクトリの中に保存されているmtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
<br />
● Estimate B-factor automatically: Yes<br />
<br />
この手順は[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要がある。もしマップが10Åに満たない場合、特別なB-factorを代わりに使う必要があるかもしれない。<br />
<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
<br />
● Use your own B-factor? No<br />
<br />
<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションは、全体マップの解像度を超えるような解像度へと拡張するマップ範囲を解析するために、ときどき便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3drefのようなエイリアスを使ってください。【Display】ボタンを使って、後処理されるマップとFSCカーブの入ったPDFと構造のギニエプロットを通して、ディスプレイを切り分けられます。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D auto-refineのマップに収束されている全てのα-へリックスの場所を簡単に見ることが出来る。<br />
<br />
解像度の推定は、以前に発表された[2]の相のランダム化手順に基づいている。相のランダムマップのFSC(赤いカーブ)が、推定していた後処理マップの解像度のゼロ点より多いのか少ないのかを確認してください。少ない場合は、マスクが鮮明すぎるか、細部の描写が多すぎます。この場合は。強いローパスフィルターを使ったり、以前のマスクを作るステップにて、より広く柔らかいマスクを使ったりしてください。実際に少し柔らかいマスクを作りたくなるかもしれない。その場合は5ピクセルの角がよくなるように試してみてください。もし、このために【Continue now】ボタンを使ったら、前の結果が上書きされます。【Run now!】ボタンの左にある[browser]ジョブをクリックしてください。すると、新しい出力ディレクトリが出来ます<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: <br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子が大きければ大きいほど、ムービーリファインメントからの動きの騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセルなどの値を使用することがよくあります。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単に計算資源を節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、単一フレーム再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 信頼できるBファクタを推定するのに十分な解像度を得られない再構成があれば、このオプションを使用して3つまたは7つの5つのムービーフレームのムービーフレームを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、粒子抽出jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
Helixタブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えています。 このjobの最大MPIプロセッサ数は、データの2倍のムービーフレーム数です。 粒子ボックスが比較的大きい場合、メモリ要件は重要ですが、通常は3Dオートリファインの最後の反復実行時よりも大きくはありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線損傷重みのBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。 推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と、動作軌跡と線形フィットはすべて、Polish / first3drefという大きなPDFファイルにあります /logfile.pdfを開き、Display:ボタンから開くことができます。<br />
<br />
私たちはしばしば最初の1-2フレームではサンプルが大きく動く比較的大きな負のBファクタを観測し、その後に放射線被害が入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
何らかの形で推定されたBファクタまたはスケールファクタが奇妙に見える場合、Guinierプロットを通じて線形フィットを調べることができます。時には、Guinierプロットは、Damageタブに入力された全周波数範囲にわたって直線でよくフィットすることができません。その後、異なるパラメータでjobを再実行する価値があります。また、単一フレームの再構成が上記の20Åの周波数を超えて拡張されない場合、線は適合できず、プログラムは動作しません(NaNに推定Bファクタが与えられます)。そのような場合、Bファクタの重み付けをスキップするか、または同じタブの平均フレームBファクタ推定:1を使用して複数のフレームを平均することを選択できます。Display:ボタンから出力された研磨粒子(shiny.star)を使ってスターファイルを視覚化して、すべてが正しく行われていることを確認することは、おそらく悪い考えではありません。<br />
<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-23T11:21:08Z
<p>Fisherman1: /* 9.3 Particle polishing */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
(このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。)<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブでは初期値を変更することは、ほとんどありません。いくつかの正20面体ウイルスでは、より細かな角度ごとでのサンプリングが必要かもしれませんが、ほとんどの場合は5°ごとの角度サンプリングで十分です。その場合、最初に5°ごとのサンプリングを25回反復実行し、2°ごとのサンプリングを、さらに5回反復して(【Continue now】ボタンを使って)同じ実行を続けます(Number of iterations: 30 【Optimisation】タブで設定)。今回のデータセットの場合、この操作は全く必要ありません。前に何らかの形で失敗したjobを、【Continue now】ボタンを使用して再開することもできます。この場合、どのパラメータも変更はされません。「2D classification」、「3D classification」、または「3Dauto-refine job」を続行するには、常に【I / O】タブ上で_optimiser.starファイルを指定する必要があります。<br />
<br />
<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
(この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。)<br />
<br />
●Use parallel disc I/O? Yes<br />
(このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(並列)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。この時、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。)<br />
<br />
●Number of pooled particles: 3<br />
(粒子はMPIスレーブによって個々のバッチ処理されます。各バッチの中で、粒子画像のスタッは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチサイズは、少なくともスレッド毎に1つの粒子が読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAM(ランダム・アクセス・メモリ)の使用量を増加させることができます。)<br />
<br />
●Pre-read all particles into RAM? Yes<br />
(Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。並列ディスクI / Oが「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。並列ディスクI / Oが「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の反復中にMPIスレーブにそれらの粒子を送信します。)<br />
<br />
●Use GPU acceleration? Yes<br />
(これらに合ったGPUをお持ちの場合、このjobは高速化されます。)<br />
<br />
●Which GPUs to use: 0<br />
(これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。)<br />
<br />
【Running】タブで、Number of MPO processorsとNumber of threadsを指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、「3D classification」と「3D auto-refine」jobでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセス間通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります。<br />
<br />
多くの「2D classification」jobを実行するので、例えばmanualpickのような意味のあるエイリアスを使用することが賢いやり方ですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution(昇順の代わりに降順の並び替え)、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは【Subset selection】ジョブタイプ上で行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精密化を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精密手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refine jobタイプを選択してください。GUIでの入力引数は大部分は3D classification jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing (後処理)===<br />
[Post-processing] jobタイプを選択して、【I/O】タブで以下のように設定して下さい。<br />
● One of the 2 unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
● Solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
● Calibrated pixel size (A): 3.54<br />
<br />
(ときどき、正確なピクセルサイズと思って作り始めたモデルが、実は数%外れていたということがわかることがあります。RELION内では、この時までにあげたものは、全部まだ信頼できます。そのため、またマップの精密化やデータのクラス分類をする必要はありません。正確なマップと最終解像度推定のために、ここに正しいピクセルサイズを提供することが今やるべきことです。)<br />
<br />
【Sharpen】タブでは以下のように設定してください。<br />
● MTF of the detector (STAR file): mtf falcon2 300kV.star<br />
このメーカーは、プロジェクトディレクトリの中に保存されているmtf_falcon_300kV_down4.starファイルと同じ形式で保存することになる適切なMTFカーブを提供します。RELION wikiに記録した解析結果から、2,3個の一般的なカーブをダウンロードすることもできます。<br />
<br />
● Estimate B-factor automatically: Yes<br />
<br />
この手順は[8]に基づき、最終解像度が確実に10Åを超えるように伸ばす必要がある。もしマップが10Åに満たない場合、特別なB-factorを代わりに使う必要があるかもしれない。<br />
<br />
● Lowest resolution for auto-B fit (A): 10<br />
これは通常変える必要はありません。<br />
<br />
● Use your own B-factor? No<br />
<br />
<br />
【Filter】タブでは以下のように設定してください。<br />
● Skip FSC-weighting? No<br />
このオプションは、全体マップの解像度を超えるような解像度へと拡張するマップ範囲を解析するために、ときどき便利です。今回は当てはまらないので、Noにします。<br />
<br />
jobを実行(クラスターは必要ないほど、このjobはすぐ終わります)し、first3drefのようなエイリアスを使ってください。【Display】ボタンを使って、後処理されるマップとFSCカーブの入ったPDFと構造のギニエプロットを通して、ディスプレイを切り分けられます。ChimeraでPostProcess/first3dref/postprocess.mrcマップを開くこともできます。そこでは、3D auto-refineのマップに収束されている全てのα-へリックスの場所を簡単に見ることが出来る。<br />
<br />
The resolution estimate os based on the phase-randomization procedure as pub-lished previously [2]. Make sure that the FSC of the phase-randomized maps (the red curve) is more-or-less zero at the estimated resolution of the postpro-cessed map. If it is not, then your mask is too sharp or has too many details.In that case use a stronger low-pass filter and/or a wider and more softer mask in the Mask creation step above, and repeat the postprocessing. Actually, you may want to make the mask you just made a bit softer, so perhaps try an edge of 5 pixels as well? If you use the Continue now button for that, the previous results will be overwritten. Click on the job-type browser on the left to generate a Run now! button, which will create a new output directory.<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: <br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子が大きければ大きいほど、ムービーリファインメントからの動きの騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセルなどの値を使用することがよくあります。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単に計算資源を節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、単一フレーム再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 信頼できるBファクタを推定するのに十分な解像度を得られない再構成があれば、このオプションを使用して3つまたは7つの5つのムービーフレームのムービーフレームを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、粒子抽出jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
Helixタブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えています。 このjobの最大MPIプロセッサ数は、データの2倍のムービーフレーム数です。 粒子ボックスが比較的大きい場合、メモリ要件は重要ですが、通常は3Dオートリファインの最後の反復実行時よりも大きくはありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線損傷重みのBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。 推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と、動作軌跡と線形フィットはすべて、Polish / first3drefという大きなPDFファイルにあります /logfile.pdfを開き、Display:ボタンから開くことができます。<br />
<br />
私たちはしばしば最初の1-2フレームではサンプルが大きく動く比較的大きな負のBファクタを観測し、その後に放射線被害が入る後のフレームでも観測します。このチュートリアルのムービーはムービーフレームあたり1電子/Å2で記録されているため、16電子/Å2の合計線量はそれほど高くなく、放射線被害のみが重要な役割を果たしません。多くの場合、最初の数フレームは比較的悪い可能性があるが、ギニープロットのY軸(すなわち、線形強度スケールファクタ)を備えたフィッティングされたラインの切片は線量とともに減少する。<br />
<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-23T04:59:18Z
<p>Fisherman1: </p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAM()の量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精密化を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精密手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refine jobタイプを選択してください。GUIでの入力引数は大部分は3D classification jobタイプと同様ですが、一部、利用できません。【Sampling】タブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0は【Optimisation】タブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: <br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子が大きければ大きいほど、ムービーリファインメントからの動きの騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセルなどの値を使用することがよくあります。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
(このオプションは、単に計算資源を節約するためのものです。 個々のフレームの再構成は、ナイキストにまで拡張されないため、この値をここに指定して、単一フレーム再構成を実行する際に考慮する周波数を制限することができます。)<br />
<br />
●Lowres-limit B-factor estimation (A): 20<br />
(このアルゴリズムは、個々のフレーム再構成と、一緒に平均化されたすべてのムービーフレームからの再構成との間の相対的なギニアプロットを推定します。 これらのプロットは直線にフィットするために使用されることがあり、[8]で提案された元のギニアプロットよりも頻繁に低い周波数がこれらのプロットに含まれることがあります。)<br />
<br />
●Average frames B-factor estimation: 1<br />
(常に最初に1の値を使用するようにしてください。 信頼できるBファクタを推定するのに十分な解像度を得られない再構成があれば、このオプションを使用して3つまたは7つの5つのムービーフレームのムービーフレームを平均することができます。 奇数の値のみが許可されます。)<br />
<br />
●• Symmetry: D2<br />
<br />
【normalise】タブの設定:<br />
●Diameter background circle (pix): 60<br />
<br />
(前と同じように、粒子抽出jobタイプで使用します。)<br />
●Stddev for white dust removal: -1<br />
<br />
●Stddev for black dust removal: -1<br />
<br />
Helixタブを無視し、first3drefのようなエイリアスを使用して、jobを実行します。 粒子の研磨はGPU加速されていないので、おそらくこれをクラスタ上で実行したいと考えています。 このjobの最大MPIプロセッサ数は、データの2倍のムービーフレーム数です。 粒子ボックスが比較的大きい場合、メモリ要件は重要ですが、通常は3Dオートリファインの最後の反復実行時よりも大きくはありません。<br />
<br />
プログラムは、モーショントラックの線形フィッティング、放射線損傷重みのBファクタおよびスケールファクタを推定するための単一フレーム再構成を実行し、新しい光沢のある粒子を作成します。 推定されたBファクタとスケールファクタは、これらのファクタを計算するために使用されたGuinierプロット(および直線とのフィット)と、動作軌跡と線形フィットはすべて、Polish / first3drefという大きなPDFファイルにあります /logfile.pdfを開き、Display:ボタンから開くことができます。<br />
<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-23T04:39:28Z
<p>Fisherman1: /* 9.3 Particle polishing */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPUアクセラレータによって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された電子線によって誘起された変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAM()の量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレータまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精密化を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精密手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: <br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
●Mask for the reconstruction: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
(後処理で良い結果を出したものと同じものを使用してください。)<br />
【Movement】タブの設定:<br />
●Linear fit particle movements? Yes<br />
<br />
●Stddev on particle distance (pix): 300<br />
(粒子が大きければ大きいほど、ムービーリファインメントからの動きの騒音は少なくなります。したがって、ここでは小さな値を使用できます。 リボソームについては、100ピクセルなどの値を使用することがよくあります。 値が小さいほど、複雑な動きのパターンが記述できます。)<br />
【Damage】タブの設定:<br />
●Perform B-factor weighting? Yes<br />
<br />
●Highres-limit per-frame maps (A): 6<br />
<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-23T04:31:19Z
<p>Fisherman1: /* 1.3 Install CUDA(CUDAのインストール) */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPUアクセラレータをサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPUアクセラレータはnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPU加速によって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された誘導線変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAM()の量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精密化を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精密手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: <br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.<br />
<br />
[6] Joseph A. Mindell and Nikolaus Grigorieff. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology, 142(3):334–347, June 2003.<br />
<br />
[7] Alexis Rohou and Nikolaus Grigorieff. CTFFIND4: Fast and accurate defocus estimation from electron micrographs. Journal of Structural Biology, 192(2):216–221, November 2015.<br />
<br />
[8] Peter B Rosenthal and Richard Henderson. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of Molecular Biology, 333(4):721–745, October 2003.<br />
<br />
[9] Sjors H W Scheres. Classification of Structural Heterogeneity by MaximumLikelihood Methods. In Cryo-EM, Part B: 3-D Reconstruction, volume 482 of Methods in Enzymology, pages 295–320. Academic Press, 2010.<br />
<br />
[10] Sjors H W Scheres. A Bayesian view on cryo-EM structure determination. Journal of Molecular Biology, 415(2):406–418, January 2012.<br />
<br />
[11] Sjors H W Scheres. RELION: Implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology, 180(3):519–530, December 2012.<br />
<br />
[12] Sjors H W Scheres. Processing of structurally heterogeneous cryo-em data in relion. Methods in Enzymology, in press, 2016.<br />
<br />
[13] Sjors H W Scheres and Shaoxia Chen. Prevention of overfitting in cryo-EM structure determination. Nature methods, 9(9):853–854, September 2012.<br />
<br />
[14] Sjors H W Scheres, R. Nunez-Ramirez, C. O. S Sorzano, J. M Carazo, and R. Marabini. Image processing for electron microscopy single-particle analysis using XMIPP. Nature Protocols, 3(6):977–90, 2008.<br />
<br />
[15] J M Smith. Ximdisp–A visualization tool to aid structure determination from electron microscope images. Journal of structural biology, 125(2-3):223–228, May 1999.<br />
<br />
[16] Guang Tang, Liwei Peng, Philip R. Baldwin, Deepinder S. Mann, Wen Jiang, Ian Rees, and Steven J. Ludtke. EMAN2: an extensible image processing suite for electron microscopy. Journal of Structural Biology, 157(1):38–46, January 2007.<br />
<br />
[17] Kutti R. Vinothkumar, Greg McMullan, and Richard Henderson. Molecular Mechanism of Antibody-Mediated Activation of -galactosidase. Structure, 22(4):621–627, April 2014.<br />
<br />
[18] Kai Zhang. Gctf: Real-time CTF determination and correction. Journal of Structural Biology, 193(1):1–12, January 2016.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-23T04:30:47Z
<p>Fisherman1: /* 2.2.1 GPU-acceleration(GPU加速) */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPUアクセラレータ) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPU加速器はnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPU加速によって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された誘導線変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAM()の量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精密化を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精密手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: <br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-23T04:29:48Z
<p>Fisherman1: /* 9.3 Particle polishing */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPU加速) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPU加速器はnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPU加速によって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された誘導線変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAM()の量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精密化を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精密手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: <br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-23T04:28:49Z
<p>Fisherman1: /* 9.3 Particle polishing */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPU加速) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPU加速器はnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPU加速によって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された誘導線変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAM()の量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精密化を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精密手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: <br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-23T04:28:28Z
<p>Fisherman1: /* 9.3 Particle polishing */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPU加速) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPU加速器はnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPU加速によって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的なシグナル減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精密化の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られるシグナルをマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を精密化したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された誘導線変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精密化を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAM()の量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精密のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精密されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精密されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精密過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精密手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精密時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおけるシグナルの解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、シグナル対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
パーティクル研磨jobタイプのI/Oタブセット:<br />
●Input STAR file with aligned movies: </BR><br />
MovieRefine/first3dref/run avg7 off1 data.star<br />
<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-23T04:21:01Z
<p>Fisherman1: /* 9.3 */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
http://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPU加速) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPU加速器はnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPU加速によって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的な信号減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られる信号をマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された誘導線変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。<pre style="color:red">【I/O】</pre>タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAM()の量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは動作タイプを <span style="border:1px solid #000000;">Subset selection</span> にして行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
[[ファイル:3d4.png]]<br />
<br />
4つのクラスの内の1つ<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 Particle polishing ===<br />
パーティクルポリシングアルゴリズムは、MovieRefine / first3dref / run_avg7_off1_data.starからの(おそらく非常にノイズの多い)動きのトラックを取り、それを通る直線にフィットします。これらのトラックのノイズをさらに低減するために、顕微鏡写真上の隣接する粒子がしばしば同様の方向に移動するという観察を利用します。これは、複数の隣接する粒子のトラックを一緒に評価することによって行われる。ここで、各粒子のその隣接トラックへの寄与は、粒子間距離のガウス関数によって決定される。このガウス分布の標準偏差(ピクセル単位)は、ユーザによって決まります。第2のステップでは、研磨アルゴリズムは、Bファクタおよび線形強度ファクタを推定して、個々のムービーフレームにおける信号の解像度依存パワーを記述する。このように、解像度に依存する放射線損傷は、各粒子のすべての整列ムービーフレームの加重平均を行うことによりモデル化することができます。得られる粒子は、信号対雑音比が増加するので、「研磨」または「光沢」と呼ばれます。<br />
<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-22T02:35:29Z
<p>Fisherman1: /* 2 What's new in RELION-2.0? */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI(GUIについて) ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach(パイプラインアプローチ) ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel(上半分:jobタイプブラウザとパラメータパネル) ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows(下半分:jobリストとstdout/stderrウィンドウ) ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button(ディスプレイボタン) ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button(jobアクションボタン) ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space(ディスク領域を節約するためのクリーンアップ) ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup(ステップアップのための計算を最適化) ===<br />
==== 2.2.1 GPU-acceleration(GPU加速) ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPU加速器はnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPU加速によって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的な信号減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られる信号をマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された誘導線変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。<pre style="color:red">【I/O】</pre>タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAM()の量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-22T02:28:41Z
<p>Fisherman1: /* 1 Getting prepared(準備) */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI(MPIのインストール) ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA(CUDAのインストール) ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION(RELIONのインストール) ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software(モーション補正ソフトウェアのインストール) ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software(CTF推定ソフトウェアのインストール) ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP(RESMAPのインストール) ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data(テストデータのダウンロード) ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
==== 2.2.1 GPU-acceleration ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPU加速器はnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPU加速によって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的な信号減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られる信号をマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された誘導線変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。<pre style="color:red">【I/O】</pre>タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAM()の量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-22T02:25:13Z
<p>Fisherman1: /* 2.2.2 Disk access */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
==== 2.2.1 GPU-acceleration ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPU加速器はnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access(ディスクへのアクセス) ====<br />
GPU加速によって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
比較的小さなデータセット(および/または大量のRAMを持つコンピュータ)を使用する場合は、計算の開始時にすべての粒子をRAMに事前に読み込むことができます。これにより、ディスクアクセスが比較的遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子はフロート精度で読み込まれるため、N個の粒子をRAMに読み込むには(N×boxsize×boxsize×4)/(1024×1024×1024)GBが必要です。200ピクセルのボックスサイズを持つ100,000個の粒子は15Gbになり、400ピクセルのボックスサイズでは同じ数の粒子に対して60Gbになります。<br />
<br />
データセットが大きすぎてRAMに先読みできないが、各計算ノードに同じ名前でマウントされたローカルの高速ディスク(ソリッドステートドライブなど)がある場合、各MPIスレーブはすべての粒子を 計算を開始する前にローカルディスクを使用してください。これは、粒子をスクラッチディレクトリにコピーすることによって行われます。複数のスレーブが同じノード上で実行される場合、最初のスレーブだけが粒子をコピーします。ローカルディスクが小さすぎてデータセット全体を保持できない場合、スクラッチディスクに孤立していない粒子は元の位置から読み込まれます。relion_volatileというサブディレクトリが、指定されたディレクトリ名の内部に作成されます。例えば、/ ssdを指定すると、/ ssd / relion_volatileという名前のディレクトリが作成されます。 / ssd / relion_volatileディレクトリがすでに存在する場合は、粒子をコピーする前に消去されます。 次に、プログラムはすべての入力粒子をこのディレクトリ内の単一の大きなスタックにコピーします。 ジョブが正常に終了すると、/ ssd / relion_volatileディレクトリが再度削除されます。 終了する前にjobがクラッシュした場合は、それを自分で削除することができます。 プログラムは、/ ssd / relion_volatileディレクトリを作成し、全員に書き込み権限を与えます。 それにより、スクラッチディレクトリとして/ ssdを、すなわちユーザ名なしで使用することを選択することができる。 この方法では、各コンピューティングノード上の1人のユーザーが常に1つのjobしか実行しない限り、ローカルディスクは、jobがクラッシュし、ユーザーがスクラッチディスクのクリーニングを忘れたときに、ジャンクでいっぱいになる危険性はありません。<br />
<br />
最後に、ディスクに反復を組み合わせるオプションがあります。Yesに設定すると、すべてのMPIスレーブはすべての繰り返しの最後に、蓄積された結果を含む大きなファイルを書き出します。MPIマスターはこれらすべてのファイルを読み込み、それらをすべて結合し、結合された状態で新しいファイルを書き出します。すべてのMPIの服役服は、その後、結合された結果を読み込みます。これにより、ネットワークの負荷が軽減されますが、ディスクI / Oの負荷が増加します。これは、期待値ステップの終わりに達する進捗バー(マウスがチーズに達する)とその後の最大化ステップの開始にかかる時間に影響します。最も効率的なシステム設定に依存します。このオプションは当初、LMBの古いクラスタ上のネットワークカードのバグを回避するために実装されました。 今日では、洗練された洗練が高解像度に達すると非常に遅くなる傾向があるので、このオプションは使用しない方が望ましいです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的な信号減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られる信号をマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (解析の準備)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(電子線により誘起される画像の動きの補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された誘導線変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。<pre style="color:red">【I/O】</pre>タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロ点とモデルのゼロ点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に一致していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に一致するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、【Display】タブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒では標準偏差の3倍低く、白では標準偏差の3倍高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均からシグナルを切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAM()の量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 8 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、精密化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0では【Display】ボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。【Browse】ボタン上のコマンドラインでSelect classes flom model.starと入力して、【I/O】タブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
【Class opitions】タブ上で下記のように入力してください。<br />
●Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
●Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、jobタイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、【Auto-picking】タブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これはjobタイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、jobタイプSubset selectionの【I/O】タブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的なjobを選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
jobタイプAuto-pickingの【I/O】タブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
【Refernces】タブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2D classification jobタイプのときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
【autopicking】タブでは以下のように設定します<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
【Helix】タブは無視して下さい。そして【Running】タブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムは【Refernces】タブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときの【Display:】ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターをjpbタイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。【Colors】タブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
【Running】タブ上でjob実行をすると、以前の【pick】と【CTF】ボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そして【autopicking】タブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
【Continue now】ボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上から【Run now!】ボタンを選択するために、jpbタイプbrowser中で、Auto-pickingをクリックします。【I/O】タブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib jobで作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルは【References】タブに全て残して下さい。そして、【autopicking】タブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、jobは平行で(FOMマップが書き出せされてないなら)行われるかもしれません。【Running】タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、【Continue now】ボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目のjobでは、【Continue now】ボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、【Run now!】ボタンの代わりに、左にあるjobタイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
【Display:】ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。【Display:】ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うために【Job actions】ボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムはjobタイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
【I/O】タブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine jobの場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine job由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
【CTF】タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。このjobは出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。jobタイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これはjobタイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
【I/O】タブ上で3次元自動精製のjobが終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Mask【タブ】上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helix【タブ】とfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。【Display:】ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-19T13:52:29Z
<p>Fisherman1: /* 2.2 Optimise computations for your stepup */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
==== 2.2.1 GPU-acceleration ====<br />
Erik Lindahl(ストックホルム)のグループのDari KimaniusとBjoern Forsbergは、GPUを使用するためにRELIONの計算コストの高い部分を移植しました。彼らはNVIDIAのcuda-librariesを使ってこの作業を行っていたため、RELION内のGPU加速器はnvidiaカードでしか動作しません。これらは、計算能力3.5以上である必要があります。単精度と倍精度の両方のカードが動作するため、高価な倍精度カードに限らず安価なゲーミングカードを使用することもできます。<br />
<br />
relion_autopick(自動ピッキング)とrelion_refine(2次元分類、3次元分類、3次元自動修正job)の異なる2つのRELIONプログラムがGPUアクセラレーションされています。これらのプログラムのシーケンシャル版とMPI版の両方が加速されました。<br />
<br />
==== 2.2.2 Disk access ====<br />
GPU加速によって画像処理の速度がはるかに向上し、ハードディスクへのアクセスがますますネックになります。RELION-2.0のGUIには、データセットとコンピュータセットアップのディスクアクセスを最適化するためのいくつかのオプションが用意されています。2次元分類、3次元分類、3次元自動修正のために、パラレルディスクI/Oの使用を選択できます。Yesに設定すると、すべてのMPIプロセスがハードディスクから同時に粒子を読み込みます。それ以外の場合は、マスターだけがイメージを読み取り、ネットワークを介してスレーブに送信します。fhgfsのglusterのような並列ファイルシステムは、並列ディスクI/Oで優れています。NFSは、多くのスレーブが並行して読み込みを行うと中断することがあります。<br />
<br />
プールされた粒子の数を設定することもできます。粒子はMPIスレーブによって個々のバッチで処理されます。各バッチ中に、粒子画像のスタックは、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。これらのバッチのサイズは、使用されるスレッド当たり少なくとも粒子1つ分です。このパラメータは、スレッドごとにバッチ内で一緒に読み込まれる粒子の数を制御します。3に設定し、1つにつき8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。それは、RAMの使用量を増加させるための控えめなコストです。<br />
<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的な信号減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られる信号をマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (組織化する)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(誘導線運動補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された誘導線変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply:】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間の基点とモデルの基点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に適合していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に適合するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、Displayタブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、標準偏差が黒では平均の3より低く、白では3より高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均から信号を切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-19T04:40:36Z
<p>Fisherman1: /* 2.1 The GUI */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
[[ファイル:relion.png]]<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。他のjobタイプでは、それらが以前に実行されるまで、その時点から継続することができます。モーション補正、CTF推定、自動ピッキング、パーティクル抽出は、これまでに行われていなかった顕微鏡写真でのみ実行されます。このjobへの入力とこのjobからの出力は、リンクjobをまとめてリストし、プロジェクト履歴内を前後にブラウズするために使用できます。<br />
<br />
GUIの下半分の下部には、選択された(実行済みまたは実行中の)jobの標準出力(標準出力)と標準エラー(標準誤差)がそれぞれ黒と赤のテキストで表示されます。stderrは理想的には空白でなければなりません。これらのテキスト表示は、jobリスト内のjobをクリックするたびに更新されます。stdoutまたはstderrのディスプレイをダブルクリックすると、より便利なスクロールのためにテキスト全体を含むポップアップウィンドウが開きます。<br />
<br />
==== 2.1.4 The Display button ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
RELION-2.0には、一般的な【Display】ボタンの代わりに、【Run】ボタンと【Schedule】ボタンの下に、より具体的な【Display:】ボタンがあります。GUIの下半分にあるjobリストのjobを選択し、このボタンをクリックすると、このjobの入力と出力がのすべて(たとえば、パーティクル、顕微鏡写真、座標、 PDFファイルなど)がポップアップメニューとして表示されます。 これにより、新しい【Display】ボタンはファイルブラウザを起動する必要がなくなりました。<br />
<br />
もう1つの違いは、RELION-1.4での【Display】ボタンは、(_model.starを表示することによって)クラスファイルを選択するために使用されていました。RELION-2.0では、【Display:】ボタンでこれを行うことができなくなり、代わりに、【Subset selection】の新しいjobタイプがあり、クラスや顕微鏡写真を選択することができます。このjobタイプには、顕微鏡写真を再グループ化し、質量中心に応じて自動的に2Dクラス平均を集中させる設定できるタブもあります。後者は、これらのクラス平均を自動ピッキングのテンプレートとして使用する場合に便利です。<br />
<br />
==== 2.1.5 The Job action button ====<br />
【Job action】ボタンは、選択した(実行中、完了後、またはスケジュールされた)ジョブの設定を含む小さなメニューを開きます。ここで、note.txtというファイルにアクセスすることができます。このファイルは個々のジョブディレクトリに保存されており、ユーザーのコメントを格納したり、jobのエイリアスを変更したり、jobを終えたものをマークすることができたり、job履歴のフローチャートを作ったり(LATEXとTikZパッケージがシステムにインストールされている場合は、第10章を参照してください)、ディスク容量を節約するためにjobを削除またはクリーンアップ(下記参照)したりすることができます。<br />
<br />
==== 2.1.6 Clean-up to save disk space ====<br />
jobを削除すると、jobディレクトリ全体がProjectディレクトリからTrash/というディレクトリに移動します。RELIONの左上にある【File】メニューの【Trash】フォルダを空にすると、完全に削除され空き領域が増えます。これを行うまでは、左上の[job]メニューから対応する設定を使用して、jobを復元することができます。<br />
<br />
ディスク容量を節約するため、jobを「clean」にすると、refine jobのすべての中間的な繰り返しに対して書き出されたファイルのような中間ファイルをごみ箱フォルダに移動します。2つのクリーニングオプションがあり、片方は軽度なクリーニング方法で、他のジョブへの入力として使用できるすべてのファイルをそのまま残します。もう一方は荒いクリーニング方法でより多くの容量を確保でき、【Motion correction】、【Particle extraction】、【Movie refinement】、【Particle polishing】のjobタイプから選択できる粒子スタックまたは顕微鏡写真を含むディレクトリに関しては特に、大きく容量を確保できます。また、RELIONの左上にある【job】メニューの対応するオプションを使用して、プロジェクト内のすべてのディレクトリをワンクリックで消去することもできます。NO_HARSH_CLEANというファイルをその中に置くことで、特定のディレクトリを削除対象から除外することもできます。保護したい粒子データがある場合、次のコマンドを実行してください。<br />
●touch Polish/job098/NO_HARSH_CLEAN<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的な信号減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られる信号をマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (組織化する)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(誘導線運動補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された誘導線変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正した顕微鏡写真からCTFの値を推定します。速度のためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3やAlexis Rohou’s CTFFIND4が使えることに留意してください(【CTFFIND】タブの値は初期値が良いでしょう)。CTFFIND4は顕微鏡動画を使用できます。これは、Thon ringsや顕微鏡動画位相版(Voltatype?)から推定した位相のずれよりも計算が速いです。【I/O】タブで、MotionCorr jobのcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(強度コントラストはほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果が良くなることが示されています。この方法は低周波数の弱い散乱がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2倍のビンデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムをNiko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFから選択することができます。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブでの、CTFFINDの一般的な値を設定します(正確な意味についてはNikoのドキュメンテーションを参照してください)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、ダブルクォーテーションの間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
CTFFIND-4.1以降を使用している場合は、<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
を追加する必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは画像の中央を設定したサイズ正方形で切り取り、この部分の画像のみでCTFを推定します。これは、余計な情報が含まれているスキャンされた画像に対して有効です。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。マシンに応じて、複数のMPI処理を使用してプログラムを実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。jobが終わると、出力のCtfFind/job003/Micrographsという出力ディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply:】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間の基点とモデルの基点は一致しているでしょう。デフォーカス、最大解像度、性能指数などの順番の表示を並び替えることができます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に適合していない場合、それらの顕微鏡写真の.logファイルを削除できます。Finished jobsリストからCtfFind/job003を選択し、parameter-panelの値を修正し、【Continue now】ボタンをクリックするとjobを再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分に適合するまで実行できます。もしこれでも実行できない、または、不十分なThon-ringがあり、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプで破棄することができます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking jobタイプでは(平均化された)顕微鏡写真の粒子座標を手動で選択して使います。詳しいデータを得るために複数の顕微鏡写真を使うのが通例です。選択した粒子は教師無2次元クラス平均を計算するために使用します。そのために、これらの粒子は全データセットの粒子を自動検出するためのテンプレートとなります。<br />
<br />
手動粒子検出は経験あるのみです!RELIONでいちいち粒子の検出をするのが面倒であれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)の座標ファイル形式もサポートしています。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめた座標ファイルを保存して下さい。そして、同じ顕微鏡写真のルートネームですが、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starとなります。Import jobタイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking jobタイプの【I/O】タブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するために【Brose】ボタンを使用し、【Colors】タブは無視し、Displayタブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(これは画面サイズによります)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、標準偏差が黒では平均の3より低く、白では3より高くなります。グレースケールでは黒から白への直線的な変化になっています。詳細は[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/DisplayImages DisplayImages entry on the RELION wiki]を見てください。)<br />
● White value: 0<br />
(どの値を白にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(どの値を黒にするか手動で設定してください。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(ノイズのひどい顕微鏡写真の粒子をより見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の暗い部分のグラデーションを取り除くのに役立つことがあります。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径や、low-pass filter、high-pass filterの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に、顕微鏡写真で【CTF】ボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
【Run now!】ボタンをクリックすることでjobが実行され、顕微鏡写真の合計約1000個の粒子が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックでメニューが表示され、座標の保存ができます。【Continue now】ボタンをクリックし、Finished jobsからManualPick/job004を選択することによって、いつでも、メニューから保存した座標のSTARファイルに戻ることができます。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの座標ファイルがあると、一致する粒子の抽出ができ、Particle extraction jobタイプで必要なすべてのメタデータを収集することができます。Particle extraction jobタイプの【I/O】タブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択に【Brose】ボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine jobから_data.starファイルが使用できます。例えば、抽出時に粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの手動編集が必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(CTF情報が含まれていない顕微鏡写真STARファイルを入力する時のみ必要です。)<br />
<br />
【extract】タブで、実際の粒子抽出のための値を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒を白に反転します。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロと標準偏差の平均値で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の指定された円の外側の部分すべてのピクセルと決められています。負の値を設定すると、粒子ボックスサイズの75%の値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(データを実際に見る場合、異常に白や黒よりの値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは異常な値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。そのため、適切な粒子の初期分類での処理速度を上げるために初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じjobタイプを使用するので、manualpickのようなエイリアスをjobにつけることをお勧めします。【Helix】タブは無視し、単一のMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/という新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。【Display:】ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてうまく進んでいるかの確認が速くできます。画面上で右クリックでするとすべての粒子を選択(Invert selection)や、すべての整列されていない粒子の平均の計算(Show average of selection)などができます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上で(【Browse】ボタンを使って)Extract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
(ベイズ推定において位相振幅補正を行います。)<br />
●Have data been phase-flipped? No<br />
(このオプションはRELION外でデータを事前処理した場合にのみ有効です。)<br />
●Ignore CTFs until first peak? No<br />
(振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジークラスに分類されたりした場合にこのオプションが役立ちます。)<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
(クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50程のより少ない粒子を使用します。)<br />
●Number of iterations: 25<br />
(これはほとんど変える必要はありません。)<br />
●Regularisation parameter T: 2<br />
(Tの定義については[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3が、3次元分類ではT=3-4の値が一般的に使用されます。ネガティブ染色の場合、これよりもより小さい値の方が良い場合もあります。一般的にプラス平均にノイズが現れた場合は、一旦Tの値を減らしてください。もし、クラス平均の解像度が低すぎる場合はTの値を増やしてください。あくまでも主要は過剰なノイズに気付けるか重要なのです。)<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、粒子画像の溶媒ノイズや隅にあるような隣接した粒子を除去するのに使われます。一方で、ノイズが大きい溶媒と隣り合った粒子が相互干渉してしまうかもしれないため、直径は小さく保ってください。また他方では、クラス平均から信号を切り捨てたくないため、粒子の大きさよりも直径が大きいか確かめる必要があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はグループに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にノイズの多いデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
【Number of class: 10】とした場合の結果<br />
<br />
[[ファイル:2d10.png]]<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-17T00:41:34Z
<p>Fisherman1: /* 1.3 Install CUDI */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDA ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。<br />
<br />
==== 2.1.4 The Display button ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
==== 2.1.5 The Job action button ====<br />
<br />
==== 2.1.6 Clean-up to save disk space ====<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的な信号減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られる信号をマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (組織化する)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(誘導線運動補正)===<br />
Motion correction jobタイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORR [5]ラッパーを規定します。【I/O】タブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(【Browse】ボタンはSTARファイルの動画のリストのみを作ります。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(これらは16フレームの動画で、すべてのフレームを使って平均化します。)<br />
<br />
【Motioncorr】タブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数の初期値を/wherever/it/is/motioncorrにするために上記のように設定してください。)<br />
● Binning factor (1 or 2): 1<br />
(超高解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超高解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、【Unblur】タブで利用できるNiko Grigorieff’s UNBLURプログラム [3]も使用できます。すべてのMOTIONCORR設定は無視され、初期値でUNBLURが実行できるため、高度なオプションが必要ありません。UNBLUR ラッパーはversion 1.0.2でテストされています。【run】ボタンの下の【Display:】ボタンからout:logfile.pdfを選択することで推定された誘導線変化を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の総数を見ることができます。スクリーンサイズによりますが、顕微鏡写真(Scale:0.3)は縮小し、Sigma contrast:3を使い、見やすい数のコラム(Number of columns: 3くらい)にするべきです。このディスプレイから顕微鏡写真は選択できないことに注意してください。取り除きたい顕微鏡写真がある場合(今回はすべて使います)、Subset selection jobタイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正された顕微鏡写真からCTF引数を推定します。目的のスピードのためKai Zhang’s GCTFラッパーとしてCTF estimation jobタイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3かAlexis Rohou’s CTFFIND4が使えることに留意してください(この場合、初期値は【CTFFIND】タブが良いでしょう)。CTFFIND4はThon ringsよりも計算が速い顕微鏡動画を使用でき、位相版から位相シフトを推定できます(Voltatype?)。【I/O】タブで、MotionCorr動作のcorrected_micrographs.starファイルを選択するために【Browse】ボタンを使います。他のタブは以下のように入力します。<br />
<br />
【Microscopy】タブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(振幅対比はほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果がよくなると示されています。この方法は低周波数の適応性のない散財がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2xのデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムを以下から選択することができます。Niko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFです。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
【CTFFIND】タブで、CTFFINDの一般的な引数を規定します(正しい手段でNiko’sドキュメンテーションを見る)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様に【Gctf】タブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、二重引用符の間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
追加引数はCTFFIND-4.1以降を使用している場合は必要ありませんが、新しいバージョンで【CTFFIND4】タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは中央を正方形で設定したサイズで切り取り、切り取られた画像のみでCTFを推定します。これはサイズで分類されたスキャンされたフィルムで役に立ちます。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、【CTFFIND4】と【Gctf】タブは無視してください。プログラムはマシン上で複数のMPI処理を使って実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。動作が終わると、出力のCtfFind/job003/Micrographsディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、【Disply:】ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロはモデルと一致させるべきです。デフォーカス、最大解像度、性能指数などの順番の表示は並び替えできます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に適合していない場合、それらの顕微鏡写真の.logファイルを削除でき、Finished jobsリストからCtfFind/job003項目を選択し、parameter-panelの引数を修正し、【Continue now】ボタンをクリックすると動作を再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分になるまで実行できます。もし可能ではない、または、十分でないThon-ringがなく、顕微鏡写真を削除すると決めた場合、Subset selection jobタイプを使用できます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking動作タイプでは(平均化された)顕微鏡写真をまとめた粒子を手入力で選択したものを使用します。詳しいデータを得るために少なくともいくつかの顕微鏡写真を手動で選択します。すべてのデータセットの自動粒子検出のためにテンプレートとして使用される教師無2Dクラス平均を計算するために手動で選択された粒子を使用します。<br />
<br />
手動粒子検出は個人の経験です!RELIONで粒子の検出をしたくないのであれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)のファイルフォーマットの整理のサポートもします。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめたファイルが同じ顕微鏡写真のルートネーム、ただし、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starです。Import動作タイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking動作タイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBroseボタンを使用し、Colorsタブは無視し、Displayタブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(画面サイズ次第です。)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒は標準偏差3より低く、白は標準偏差3より高くします。グレースケールではいつも黒から白に直線になっています。詳細はDisplayImages entry on the RELION wikiを見てください。)<br />
● White value: 0<br />
(値を白に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(値を黒に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(顕微鏡写真の多くのノイズの中の粒子を見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の明暗のグラデーションを取り除くのにたまに役立ちます。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径、ローパスフィルター、ハイパスフィルターの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に顕微鏡写真でCTFボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
Run now!ボタンをクリックすることで動作が実行され、顕微鏡写真のおよそ1000の粒子の総数が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックで整理したものの保存で必要なポップアップメニューがでます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって離れたところ(ポップアップメニューから整理されたSTARファイルを保存した)からさらに選択するためにいつでも戻ってくることができることに注意してください。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの整理されたファイルがあると、一致する粒子の抽出ができ、Particle extraction動作タイプで必要なすべてのメタデータを収集することができます。Particle extraction動作タイプのI/Oタブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine動作から_data.starファイルが使用できます。例えば、抽出で粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの編集にマニュアルが必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(入力顕微鏡写真のSTARファイルにCTF情報が含まれていないことが必要です。)<br />
<br />
extractタブで、実際の粒子抽出のための引数を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒の粒子の代わりに白にします。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロの平均値と標準偏差で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の与えられた直径の円の外のすべてのピクセルと決められています。負の値を明記するとき、粒子ボックスサイズの75%の初期値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(実際にデータを見る場合、白か黒の外れ値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは外れ値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。その結果、適切な粒子の初期分類での速度を上げるために処理の初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じ動作タイプを使用するので、manualpickのようなエイリアスを動作に与えると良いです。Helixタブは無視し、ひとつのMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/と呼ばれる新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。Display:ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてが順調である確認が速くなります。画面上で右クリックで例えば、すべての粒子を選択(Invert selection)、すべてのアラインメントされていない粒子の平均の計算(Show average of selection)を使用できます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、jobタイプ【2D classification】を使用します。<br />
【I/O】タブ上でExtract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
●Do CTF-correction? Yes<br />
ベイジアンフレームワークにおいて位相振幅補正を行います。<br />
●Have data been phase-flipped? No<br />
この選択はRELION外でデータを事前処理した場合にのみ有効です。<br />
●gnore CTFs until first peak? No<br />
振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジー分類されたりした場合にこのオプションが役立ちます。<br />
<br />
【Optimisation】タブの設定:<br />
●Number of classes: 10<br />
クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50個の粒子を使用します。<br />
●Number of iterations: 25<br />
これはほとんど変える必要はありません。<br />
●Regularisation parameter T: 2<br />
Tの定義にてついては[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3を、3次元分類ではT=3-4の値を使用してください。ネガティブ染色の場合、これよりも小さい値の方が良い場合もあります。一般的に平均値がばらついている場合は、一旦Tの値を減らしてください。もし、平均値が低解像度のままであった場合はTの値を増やしてください。あくまでもメインは過剰な高解像度のノイズに気付けるかどうかなのです。<br />
●Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、溶媒ノイズや粒子画像の隅にあるような隣接した粒子を除去するのに使われます。一方で、多くの目立った溶媒と隣接した粒子が列を乱すおそれがあるため、直径は小さく保ってください。また、クラス平均からのいくつかの信号を取り出したくないため、最大寸法よりも直径が大きいか確かめる可能性があります。<br />
●Mask individual particles with zeros? Yes<br />
●Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はアライメントに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にややこしいデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したjobを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refine jobを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
●Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
●Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
●Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
●Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
●Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
●Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classification jobを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-16T13:51:33Z
<p>Fisherman1: /* 2.1 The GUI */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。<br />
<br />
==== 2.1.4 The Display button ====<br />
RELION-1.4には、GUI上に一般的な【Display!】ボタンがあり、粒子、顕微鏡写真、マップ、マスクなどの表示に使用できます。これらのファイルを選択すると一般的なファイルブラウザが開きます。このボタンは、RELION-2.0のGUIからは消えましたが、GUIの左上にある【File】メニューの【Display】オプションを使用してアクセスすることができます。<br />
<br />
==== 2.1.5 The Job action button ====<br />
<br />
==== 2.1.6 Clean-up to save disk space ====<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs(スケジュール化されたジョブの高速処理実行) ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
subset selectionはスケジュールすることができますが、2D classificationの_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。全てのjobの実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing(ヘリカル処理) ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリ処理のためのワークフローを実装しています。これには、Auto-picking、Partcle extraction、2Dclassification、3Dclassification、3D auto-refine、Particle polishing、およびMask createといったjobタイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーが[http://www2.mrc-lmb.cam.ac.uk/relion/index.php/Helical_processing RELION Wiki]の関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities(他の新しい機能) ===<br />
==== 2.5.1 Dealing with differently scaled particles(異なるスケールの粒子の取扱) ====<br />
RELION-1.4では、STARファイル等を修正するためのawkスクリプトに関わっているため、粒子をどれだけ縮小したか(あるいはしてないか)による変更がいくらか影響を及ぼしていました。しかし、RELION-2.0では手軽に縮小ができるようになりました。Particle extraction jobでは、Manual picking、Auto-pickingから座標を提供する代わりに、2D classification、3D classification、3D auto-refineから _data.starを提供するre-extract refined particleオプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際、各入力粒子のスケールの違いを正しく判断します。また入力_data.starファイルの調整された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことはAuto-pickingでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上でpixel size in referencesで値を与える時に(もしくは【I/O】タブ上のpixel size in micrographsオプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
Particle subtraction jobタイプは、RELION-2.0パイプライン内部で部分的な信号減算の手順を形式化しています。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
【粒子から得られる信号をマスクに反映させ、それを一面黒のマップに適用することで、粒子のある領域では白く、それ以外では黒いマップができます】<br />
<br />
同じjobタイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減算された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減算後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0ではパイプラインの公式化に伴い、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルへとつなげることができるようになりました。このことは、join star fileという新しいjobタイプによって行われます。4つ以上のファイルを結合する場合は、GUIからこのユーティリティを複数回呼び出す必要があります(完全に記述されたパイプラインを維持したい場合)。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度Importを用いる方法でもできます<br />
<br />
=== 2.6 How this tutorial works(本チュートリアルでの動作法) ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をprojectディレクトリにコピーすることができます。RELION-2.0では動作にパイプラインをもちいりため、同じことができません。かわりに、PrecalculatedResultsディレクトリに完全に実行されたパイプラインを用意しています。ユーザーはbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用していたら、1日以内に終わります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONでそれぞれのプログラムから抽出された分子を使用できますが、おすすめできません。多くのプログラムが粒子自体を例えば、段階の切り替えや帯域通過、ウィナーフィルター、マスクなどによって変化させているためです。これらはすべてその後のRELIONの使用のために最適とはいえません。さらに、RELIONタイプのSTARファイルにフォーマットされたファイルの中に必須のメタデータを全て収集すると、エラーが発生する傾向があります。RELIONでの粒子の再抽出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。ラッパーが作られたとき、うまく活用しようと試みましたが、完全には制御できず、これらのラッパーが最適な方法でRELIONを使用できているかどうかわかりませんでした。そのため、ラッパーで得られた結果に疑問がある場合、後述のチュートリアルで説明している手順で行うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (組織化する)===<br />
解析したい構造ごとに一つのディレクトリを作ることをお勧めします。これをprojectディレクトリといいます。'''projrctディレクトリからRELIONを起動することが重要です。'''projectディレクトリの中にすべての未加工の顕微鏡写真や顕微鏡動画をMRC形式で保存するための別ディレクトリを作ってください。例えば、すべての顕微鏡写真がひとつのディレクトリにある場合は、通例ではディレクトリをMicrographs/にします。また、異なるディレクトリにある場合(例えば、違う日に収集した顕微鏡写真)はMicrographs/15jan16/やMicrographs/23jan16/などにすると良いでしょう。もし何らかの理由でRELIONのprojectディレクトリの中に顕微鏡写真を入れたくない場合は、projectディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。単一像顕微鏡写真の代わりに動画を集めた場合、それらを直接使用できます。別のプログラムで動画の平均を計算し、さらに顕微鏡写真と動画の平均を両方とも使用したい場合、動画のファイル名は顕微鏡写真の平均と同じルートネームにするべきです。つまり、顕微鏡写真の平均のファイルの後に”_”と、動画のルートネーム、.mrcs拡張子をつけます。例えば、顕微鏡写真の平均がmic001.mrcの場合、一致する動画はmic001_movie.mrcsとしてください(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、projectディレクトリ(betagal/)と、記録されたすべての顕微鏡動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。projectディレクトリに行き、以下の入力をすると、どのくらい顕微鏡動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONを起動しましょう。前述の通り、RELIONは常にprojectディレクトリからの起動が必要です。エラーを防ぐために、RELIONは新しいディレクトリを初めて起動したときに確認を要求します。そのため、新しいディレクトリでRELIONを初めて起動するときは、バックグラウンドで起動するための”&”の文字を使うべきではありません。projectディレクトリ内にいることを確認し、以下の入力でRELIONを起動します。<br />
<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中へ録画した顕微鏡動画の取り込みを行います。jobタイプのブラウザから”Import”を選択し、項目を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereという空欄に効果的なエイリアスを規定することができます。【Run now!】のボタンをクリックするとjob起動できます。Import/job001/というディレクトリが作成され、一緒にImport/moviesというこのディレクトリへのシンボリックリンクが作成されます。テキストエディターでnote.txtファイルが開かれ、中には実際の実行コマンドが入っており、コメントも記入できます。必要なければ閉じてください。STARファイルとすべての動画が新しいディレクトリの中に作成されます。以下のコマンドを使って中を見ましょう。<br />
<br />
less Import/job001/movies.star<br />
<br />
違うソフトウェアで粒子を抽出した場合、もしくは、RELION-1.4で抽出した粒子をRELION-2.0に移動させたい場合は、後述の事前処理を行う代わりに、STARファイルや3次元リファレンス、3次元マスクなどを取り込むために”Import”jobタイプを使用してください。<br />
<br />
=== 3.2 Beam-induced motion correction(誘導線運動補正)===<br />
Motion correction動作タイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORRラッパーを規定します。I/Oタブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(BrowseボタンはSTARファイルの動画リストのみです。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(16フレームの動画があり、すべてのフレームで平均化します。)<br />
<br />
Motioncorrタブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数は$RELION_MOTIONCORR_EXECUTABLEを使うと、初期値から調節できます。)<br />
● Binning factor (1 or 2): 1<br />
(超解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、Unblurタブで利用できるNiko Grigorieff’s UNBLURプログラムも使用できます。すべてのMOTIONCORR設定は無視され、向上したオプションなしで初期値でUNBLURのみが実行できます。UNBLUR version 1.0.2でテストされています。Display:ボタンの後のrunボタンからout:logfile.pdfを選択することで誘導線変化の推定を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の合計を見ることができます。スクリーンサイズに左右されるため、顕微鏡写真(Scale:0.3)はおそらく縮小し、Sigma contrast:3を使い、見やすいコラム(Number of columns: 3くらい)にするべきです。ディスプレイから顕微鏡写真は選択できないことに注意してください。もしこの時に顕微鏡写真を排除したい場合(すべて良いのでしません)、Subset selection動作タイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正された顕微鏡写真からCTF引数を推定します。目的のスピードのためKai Zhang’s GCTFラッパーとしてCTF estimation動作タイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3かAlexis Rohou’s CTFFIND4が使えることに留意してください(この場合、初期値はCTFFINDタブが良いでしょう)。CTFFIND4はThon ringsよりも計算が速い顕微鏡写真の動画を使用でき、位相版から位相シフトを推定できます(Voltatype?)。I/Oタブで、MotionCorr動作のcorrected_micrographs.starファイルを選択するためにBrowseボタンを使います。他のタブは以下のように入力します。<br />
<br />
Microscopyタブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(振幅対比はほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果がよくなると示されています。この方法は低周波数の適応性のない散財がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2xのデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムを以下から選択することができます。Niko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFです。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
CTFFINDタブで、CTFFINDの一般的な引数を規定します(正しい手段でNiko’sドキュメンテーションを見る)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様にGctfタブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、二重引用符の間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
追加引数はCTFFIND-4.1以降を使用している場合は必要ありませんが、新しいバージョンでCTFFIND4タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは中央を正方形で設定したサイズで切り取り、切り取られた画像のみでCTFを推定します。これはサイズで分類されたスキャンされたフィルムで役に立ちます。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、CTFFIND4とGctfタブは無視してください。プログラムはマシン上で複数のMPI処理を使って実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。動作が終わると、出力のCtfFind/job003/Micrographsディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、Disply:ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロはモデルと一致させるべきです。デフォーカス、最大解像度、性能指数などの順番の表示は並び替えできます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に適合していない場合、それらの顕微鏡写真の.logファイルを削除でき、Finished jobsリストからCtfFind/job003項目を選択し、parameter-panelの引数を修正し、Continue nowボタンをクリックすると動作を再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分になるまで実行できます。もし可能ではない、または、十分でないThon-ringがなく、顕微鏡写真を削除すると決めた場合、Subset selection動作タイプを使用できます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking動作タイプでは(平均化された)顕微鏡写真をまとめた粒子を手入力で選択したものを使用します。詳しいデータを得るために少なくともいくつかの顕微鏡写真を手動で選択します。すべてのデータセットの自動粒子検出のためにテンプレートとして使用される教師無2Dクラス平均を計算するために手動で選択された粒子を使用します。<br />
<br />
手動粒子検出は個人の経験です!RELIONで粒子の検出をしたくないのであれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)のファイルフォーマットの整理のサポートもします。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめたファイルが同じ顕微鏡写真のルートネーム、ただし、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starです。Import動作タイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking動作タイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBroseボタンを使用し、Colorsタブは無視し、Displayタブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(画面サイズ次第です。)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒は標準偏差3より低く、白は標準偏差3より高くします。グレースケールではいつも黒から白に直線になっています。詳細はDisplayImages entry on the RELION wikiを見てください。)<br />
● White value: 0<br />
(値を白に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(値を黒に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(顕微鏡写真の多くのノイズの中の粒子を見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の明暗のグラデーションを取り除くのにたまに役立ちます。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径、ローパスフィルター、ハイパスフィルターの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に顕微鏡写真でCTFボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
Run now!ボタンをクリックすることで動作が実行され、顕微鏡写真のおよそ1000の粒子の総数が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックで整理したものの保存で必要なポップアップメニューがでます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって離れたところ(ポップアップメニューから整理されたSTARファイルを保存した)からさらに選択するためにいつでも戻ってくることができることに注意してください。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの整理されたファイルがあると、一致する粒子の抽出ができ、Particle extraction動作タイプで必要なすべてのメタデータを収集することができます。Particle extraction動作タイプのI/Oタブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine動作から_data.starファイルが使用できます。例えば、抽出で粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの編集にマニュアルが必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(入力顕微鏡写真のSTARファイルにCTF情報が含まれていないことが必要です。)<br />
<br />
extractタブで、実際の粒子抽出のための引数を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒の粒子の代わりに白にします。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロの平均値と標準偏差で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の与えられた直径の円の外のすべてのピクセルと決められています。負の値を明記するとき、粒子ボックスサイズの75%の初期値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(実際にデータを見る場合、白か黒の外れ値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは外れ値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。その結果、適切な粒子の初期分類での速度を上げるために処理の初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じ動作タイプを使用するので、manualpickのようなエイリアスを動作に与えると良いです。Helixタブは無視し、ひとつのMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/と呼ばれる新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。Display:ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてが順調である確認が速くなります。画面上で右クリックで例えば、すべての粒子を選択(Invert selection)、すべてのアラインメントされていない粒子の平均の計算(Show average of selection)を使用できます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、動作タイプ【2D classification】を使用します。<br />
【I/O】タブ上でExtract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
・Do CTF-correction? Yes<br />
ベイジアンフレームワークにおいて位相振幅補正を行います。<br />
・Have data been phase-flipped? No<br />
この選択はRELION外でデータを前処理した場合にのみ有効です。<br />
・Ignore CTFs until first peak? No<br />
振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジー分類されたりした場合にこのオプションが役立ちます。<br />
<br />
【Optimisation】タブの設定:<br />
・Number of classes: 10<br />
クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50個の粒子を使用します。<br />
・Number of iterations: 25<br />
これはほとんど変える必要はありません。<br />
・Regularisation parameter T: 2<br />
Tの定義にてついては[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3を、3次元分類ではT=3-4の値を使用してください。ネガティブ染色の場合、これよりも小さい値の方が良い場合もあります。一般的に平均値がばらついている場合は、一旦Tの値を減らしてください。もし、平均値が低解像度のままであった場合はTの値を増やしてください。あくまでもメインは高解像度のノイズの過剰適合に気付けるかどうかなのです。<br />
・Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、溶媒ノイズや粒子画像の隅にあるような隣接した粒子を除去するのに使われます。一方で、多くの目立った溶媒と隣接した粒子が列を乱すおそれがあるため、直径は小さく保ってください。また、クラス平均からのいくつかの信号を取り出したくないため、最大寸法よりも直径が大きいか確かめる可能性があります。<br />
・Mask individual particles with zeros? Yes<br />
・Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はアライメントに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にややこしいデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したジョブを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refineジョブを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
・Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
• Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
• Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
• Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
• Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
• Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classificationジョブを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-15T13:40:10Z
<p>Fisherman1: /* 2.3 On-the-fly processing running scheduled jobs */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。<br />
<br />
==== 2.1.4 The Display button ====<br />
==== 2.1.5 The Job action button ====<br />
==== 2.1.6 Clean-up to save disk space ====<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。このことは、ある補因子が目的の複合体に結合しているかどうかを確認するなどの場合に有用の可能性があります。<br />
<br />
【subset selection】はスケジュールすることができますが、【2D classification】の_model.starを表示して適切なクラスを選択するなど、入力を求められることに注意してください。例えば、最適なクラスを選択するためのから _model.starを表示させるよう全てのスケジュール化された動作の実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリの処理のためのワークフローを実装しています。これには、自動ピッキング、粒子抽出、2D分類化、3D分類化、自動3D精製、粒子洗練、およびマスク作といった動作タイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーがRELION Wikiの関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities ===<br />
==== 2.5.1 Dealing with differently scaled particles ====<br />
RELION-1.4では、粒子をどれだけダウンスケーリングし(あるいはそうでないか)変更することを、STARファイル等を変更するためにawkスクリプトを付与させることで、いくつか備えていました。RELION-2.0ではとても簡単になされます。粒子抽出動作タイプは、手動ピッキング、自動ピッキングから座標を提供する代わりに、2Dクラス化、3Dクラス化、自動3D精製動作から _data.starを与える【re-extract refined particle】オプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際に、各入力粒子のスケールの違いを正しく考慮します。また入力_data.starファイルの洗練された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことは自動ピッキングでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上で【pixel size in references】で値を与えられる時に(もしくは【I/O】タブ上の【pixel size in micrographs】オプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
粒子の削除動作タイプは、RELION-2.0パイプライン内の部分的なシグナル減算の手順を形式化します。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
同じの動作タイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減産された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減産後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0でのパイプラインの公式化により、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルにアクセスできることが必要になってきました。これは、新しいjobtype join starファイルによって提供されます。4つ以上のファイルを結合する場合(完全に記述されたパイプラインを維持したい場合)は、GUIからこのユーティリティを複数回呼び出す必要があります。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度インポートすることもできます。<br />
<br />
=== 2.6 How this tutorial works ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をプロジェクトディレクトリにコピーすることができます。RELION-2.0の動作のパイプライン化された性質のため、これは非常に困難になります。したがって、完全に実行されたパイプラインは代わりにPrecalculatedResultsディレクトリに提供されます。ユーザーは自分のマシン上のbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用します。これは1日以内に実行する必要があります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONで異なるプログラムから摘出された分子を使用できますが、おすすめはしません。多くのプログラムが分子を変化させています。例えば、段階の切り替えや帯域通過やウィナーフィルターやマスクなどです。RELIONには後続の使用のための準最適があります。さらに、正しいフォーマットのRELIONタイプのSTARファイルの中の必要なメタデータの全ての収集はエラーになる傾向があります。RELIONでの粒子の再摘出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでのいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。他の人が書いたラッパーを役立てようとしましたが、全く制御できず、最終生成物が最良の方法としてRELIONを使用するかどうかわかりません。その結果、ラッパーで得られた結果を疑い深く注視した場合、このチュートリアルで説明している手順に従うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (組織化する)===<br />
プロジェクトごと、すなわち、測定したい構造ごとに一つのディレクトリを作ることをお勧めします。これをプロジェクトディレクトリと呼びます。重要なことはプロジェクトディレクトリからのrelionのグラフィカルユーザインタフェイス(GUI)は常に起動していることです。プロジェクトディレクトリの中では未加工の顕微鏡写真やMRC形式の顕微鏡写真動画すべてを保存するためにディレクトリを分けて作るべきです。すべての顕微鏡写真がひとつのディレクトリにある場合は、ディレクトリをMictographs/と呼びます。また、異なるディレクトリにある場合(例えば、顕微鏡写真を異なるデータから収集した時)は例えば、Micrographs/15jan16/やMicrographs/23jan16/などと呼びます。もし何らかの理由でRELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。もし単一像顕微鏡写真の代わりに動画を集めたのであれば、それらのディレクトリを使用できます。もし異なるプログラムで動画の平均を計算する場合、また顕微鏡写真と動画の平均を両方とも使用したい場合、動画は顕微鏡写真の平均と一致するようなルートネームと同じように名付けられるべきである。つまり、”_”の文字、”movie rootname”、.mrcs拡張子です。例えば、顕微鏡写真の平均がmic001.mrcと呼ばれ、mic001_movie.mrcsと呼ばれる動画と一致する場合です(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、プロジェクトディレクトリ(betagal/)と、記録されたすべての顕微鏡写真の動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。プロジェクトディレクトリに行き、以下の入力をすると、どのくらい顕微鏡写真の動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONのGUIを起動することによって始めます。前述の通り、このGUIは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、GUIは新しいディレクトリを初めて起動したときに確認を要求します。その結果、新しいディレクトリでGUIを初めて起動したとき、バックグラウンドで起動するために”&”の文字を使うべきではありません。プロジェクトディレクトリ内で確かめ、以下の入力でGUIを起動します。<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中に記録された顕微鏡写真の動画の設定の取り込みを行います。動作タイプのブラウザから”Import”を選択し、引数を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereと名付けられた白い欄に意味のあるエイリアスを規定することができます。Run now!のボタンをクリックすると動作が起動します。Import/job001/と呼ばれるディレクトリが作成され、一緒にImport/moviesと呼ばれるシンボリックリンクのディレクトリも作成されます。note.txtファイルのテキストエディターには実際の実行コマンドと、コメントを記入できるところ、閉じるものが含まれます。STARファイルとすべての動画が新しく作成されたディレクトリの中に作成されます。見るには以下を使います。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし異なるソフトウェアで粒子を摘出した場合、もしくは、RELION-1.4で摘出した粒子をRELION-2.0に移動させたい場合は、後述の前処理段階を行う代わりに、STARファイルや3D references,3D masksなどを取り込むために”Import”動作タイプを使用します。<br />
<br />
=== 3.2 Beam-induced motion correction(誘導線運動補正)===<br />
Motion correction動作タイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORRラッパーを規定します。I/Oタブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(BrowseボタンはSTARファイルの動画リストのみです。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(16フレームの動画があり、すべてのフレームで平均化します。)<br />
<br />
Motioncorrタブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数は$RELION_MOTIONCORR_EXECUTABLEを使うと、初期値から調節できます。)<br />
● Binning factor (1 or 2): 1<br />
(超解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、Unblurタブで利用できるNiko Grigorieff’s UNBLURプログラムも使用できます。すべてのMOTIONCORR設定は無視され、向上したオプションなしで初期値でUNBLURのみが実行できます。UNBLUR version 1.0.2でテストされています。Display:ボタンの後のrunボタンからout:logfile.pdfを選択することで誘導線変化の推定を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の合計を見ることができます。スクリーンサイズに左右されるため、顕微鏡写真(Scale:0.3)はおそらく縮小し、Sigma contrast:3を使い、見やすいコラム(Number of columns: 3くらい)にするべきです。ディスプレイから顕微鏡写真は選択できないことに注意してください。もしこの時に顕微鏡写真を排除したい場合(すべて良いのでしません)、Subset selection動作タイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正された顕微鏡写真からCTF引数を推定します。目的のスピードのためKai Zhang’s GCTFラッパーとしてCTF estimation動作タイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3かAlexis Rohou’s CTFFIND4が使えることに留意してください(この場合、初期値はCTFFINDタブが良いでしょう)。CTFFIND4はThon ringsよりも計算が速い顕微鏡写真の動画を使用でき、位相版から位相シフトを推定できます(Voltatype?)。I/Oタブで、MotionCorr動作のcorrected_micrographs.starファイルを選択するためにBrowseボタンを使います。他のタブは以下のように入力します。<br />
<br />
Microscopyタブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(振幅対比はほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果がよくなると示されています。この方法は低周波数の適応性のない散財がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2xのデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムを以下から選択することができます。Niko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFです。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
CTFFINDタブで、CTFFINDの一般的な引数を規定します(正しい手段でNiko’sドキュメンテーションを見る)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様にGctfタブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、二重引用符の間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
追加引数はCTFFIND-4.1以降を使用している場合は必要ありませんが、新しいバージョンでCTFFIND4タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは中央を正方形で設定したサイズで切り取り、切り取られた画像のみでCTFを推定します。これはサイズで分類されたスキャンされたフィルムで役に立ちます。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、CTFFIND4とGctfタブは無視してください。プログラムはマシン上で複数のMPI処理を使って実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。動作が終わると、出力のCtfFind/job003/Micrographsディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、Disply:ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロはモデルと一致させるべきです。デフォーカス、最大解像度、性能指数などの順番の表示は並び替えできます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に適合していない場合、それらの顕微鏡写真の.logファイルを削除でき、Finished jobsリストからCtfFind/job003項目を選択し、parameter-panelの引数を修正し、Continue nowボタンをクリックすると動作を再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分になるまで実行できます。もし可能ではない、または、十分でないThon-ringがなく、顕微鏡写真を削除すると決めた場合、Subset selection動作タイプを使用できます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking動作タイプでは(平均化された)顕微鏡写真をまとめた粒子を手入力で選択したものを使用します。詳しいデータを得るために少なくともいくつかの顕微鏡写真を手動で選択します。すべてのデータセットの自動粒子検出のためにテンプレートとして使用される教師無2Dクラス平均を計算するために手動で選択された粒子を使用します。<br />
<br />
手動粒子検出は個人の経験です!RELIONで粒子の検出をしたくないのであれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)のファイルフォーマットの整理のサポートもします。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめたファイルが同じ顕微鏡写真のルートネーム、ただし、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starです。Import動作タイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking動作タイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBroseボタンを使用し、Colorsタブは無視し、Displayタブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(画面サイズ次第です。)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒は標準偏差3より低く、白は標準偏差3より高くします。グレースケールではいつも黒から白に直線になっています。詳細はDisplayImages entry on the RELION wikiを見てください。)<br />
● White value: 0<br />
(値を白に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(値を黒に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(顕微鏡写真の多くのノイズの中の粒子を見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の明暗のグラデーションを取り除くのにたまに役立ちます。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径、ローパスフィルター、ハイパスフィルターの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に顕微鏡写真でCTFボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
Run now!ボタンをクリックすることで動作が実行され、顕微鏡写真のおよそ1000の粒子の総数が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックで整理したものの保存で必要なポップアップメニューがでます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって離れたところ(ポップアップメニューから整理されたSTARファイルを保存した)からさらに選択するためにいつでも戻ってくることができることに注意してください。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの整理されたファイルがあると、一致する粒子の抽出ができ、Particle extraction動作タイプで必要なすべてのメタデータを収集することができます。Particle extraction動作タイプのI/Oタブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine動作から_data.starファイルが使用できます。例えば、抽出で粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの編集にマニュアルが必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(入力顕微鏡写真のSTARファイルにCTF情報が含まれていないことが必要です。)<br />
<br />
extractタブで、実際の粒子抽出のための引数を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒の粒子の代わりに白にします。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロの平均値と標準偏差で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の与えられた直径の円の外のすべてのピクセルと決められています。負の値を明記するとき、粒子ボックスサイズの75%の初期値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(実際にデータを見る場合、白か黒の外れ値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは外れ値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。その結果、適切な粒子の初期分類での速度を上げるために処理の初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じ動作タイプを使用するので、manualpickのようなエイリアスを動作に与えると良いです。Helixタブは無視し、ひとつのMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/と呼ばれる新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。Display:ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてが順調である確認が速くなります。画面上で右クリックで例えば、すべての粒子を選択(Invert selection)、すべてのアラインメントされていない粒子の平均の計算(Show average of selection)を使用できます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、動作タイプ【2D classification】を使用します。<br />
【I/O】タブ上でExtract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
・Do CTF-correction? Yes<br />
ベイジアンフレームワークにおいて位相振幅補正を行います。<br />
・Have data been phase-flipped? No<br />
この選択はRELION外でデータを前処理した場合にのみ有効です。<br />
・Ignore CTFs until first peak? No<br />
振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジー分類されたりした場合にこのオプションが役立ちます。<br />
<br />
【Optimisation】タブの設定:<br />
・Number of classes: 10<br />
クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50個の粒子を使用します。<br />
・Number of iterations: 25<br />
これはほとんど変える必要はありません。<br />
・Regularisation parameter T: 2<br />
Tの定義にてついては[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3を、3次元分類ではT=3-4の値を使用してください。ネガティブ染色の場合、これよりも小さい値の方が良い場合もあります。一般的に平均値がばらついている場合は、一旦Tの値を減らしてください。もし、平均値が低解像度のままであった場合はTの値を増やしてください。あくまでもメインは高解像度のノイズの過剰適合に気付けるかどうかなのです。<br />
・Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、溶媒ノイズや粒子画像の隅にあるような隣接した粒子を除去するのに使われます。一方で、多くの目立った溶媒と隣接した粒子が列を乱すおそれがあるため、直径は小さく保ってください。また、クラス平均からのいくつかの信号を取り出したくないため、最大寸法よりも直径が大きいか確かめる可能性があります。<br />
・Mask individual particles with zeros? Yes<br />
・Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はアライメントに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にややこしいデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したジョブを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refineジョブを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
・Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
• Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
• Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
• Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
• Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
• Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classificationジョブを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-15T13:25:24Z
<p>Fisherman1: /* 2.3 On-the-fly processing running scheduled jobs */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、今後の実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。<br />
<br />
==== 2.1.4 The Display button ====<br />
==== 2.1.5 The Job action button ====<br />
==== 2.1.6 Clean-up to save disk space ====<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
【Schedule】ボタンから、今後のjobの準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他のjobへの入力として利用できるため、Scheduled jobsに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化されたjobを実行できます。そのプログラムは何回スケジュール化された動作を実行するか聞いてきます。1より大きい値を指定すると、すべてのスケジュールしたjobが繰り返し実行されます。この設定にした場合、スケジュール化されたjob1週ごとに、何分経過させるべきかという質問が出てきます。(もしスケジュールしたjobの実行時間がこの時間よりも短い場合、このプログラムは、次にスケジュールしてあるjobの実行を待機させます。)次のjobタイプは、以前の反復(Import、Motion correction、CTF estimation、Auto-picking、Particle extraction、Movie refinment)ではまだ完了していない顕微鏡写真のみを処理します。他の全てのjobタイプはスケジュールしたjobタイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、高速処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましいのは、高速処理のための1つまたは複数の適切なGPUを搭載しているもの)にコピーするスクリプトを設定することができます。(大きなファイルをコピーするのには時間がかかり、まだコピーの終わっていない顕微鏡写真や動画をインポートするのは好ましくありません。そのため、このスクリプトはファイルを一時的なファイル名でコピーし、コピーが完全に終了したときにのみ、ファイルをちゃんとしたファイル名に変更することができます)スケジュールしたjpbリストの開始(例として【Micrograghs/*.mrcs】ファイルのImport)はMotion correction、CTF estimation、Auto-picking、(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、Particle extraction、2D classificationによって実行される。このスケジュールしたjobリストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます増えます。全ての粒子数をゼロから2D classificationしている間は、スケジュールしたjob(Motion correction、CTF estimation、Auto-picking、Particle extraction)の各反復は、新しい顕微鏡写真のみで実行されます。電子顕微鏡でデータ集めている間に2次元クラス平均を調べることは、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決めるのに有益な可能性があり、またおそらく、より氷が厚いグリッド上で収集する必要があります。既に3Dリファレンスが良ければ、3D classificationまたは3D auto-refineを高速で実行できるかもしれません。これは、例えば、関係ある補因子がインタレスト複合体に結合しているかどうかを確認するのに有用であり得る。<br />
【これは、例えば、ある補因子が関心対象の複合体に結合しているかどうかを確認するのに有用であり得る。】<br />
<br />
【subset selection】はスケジュール化されてますが、ユーザーは例えば最適なクラスを選択するための【2D classification】から _model.starを表示させるように入力するのを促されるのに注意して下さい。全てのスケジュール化された動作の実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリの処理のためのワークフローを実装しています。これには、自動ピッキング、粒子抽出、2D分類化、3D分類化、自動3D精製、粒子洗練、およびマスク作といった動作タイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーがRELION Wikiの関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities ===<br />
==== 2.5.1 Dealing with differently scaled particles ====<br />
RELION-1.4では、粒子をどれだけダウンスケーリングし(あるいはそうでないか)変更することを、STARファイル等を変更するためにawkスクリプトを付与させることで、いくつか備えていました。RELION-2.0ではとても簡単になされます。粒子抽出動作タイプは、手動ピッキング、自動ピッキングから座標を提供する代わりに、2Dクラス化、3Dクラス化、自動3D精製動作から _data.starを与える【re-extract refined particle】オプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際に、各入力粒子のスケールの違いを正しく考慮します。また入力_data.starファイルの洗練された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことは自動ピッキングでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上で【pixel size in references】で値を与えられる時に(もしくは【I/O】タブ上の【pixel size in micrographs】オプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
粒子の削除動作タイプは、RELION-2.0パイプライン内の部分的なシグナル減算の手順を形式化します。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
同じの動作タイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減産された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減産後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0でのパイプラインの公式化により、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルにアクセスできることが必要になってきました。これは、新しいjobtype join starファイルによって提供されます。4つ以上のファイルを結合する場合(完全に記述されたパイプラインを維持したい場合)は、GUIからこのユーティリティを複数回呼び出す必要があります。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度インポートすることもできます。<br />
<br />
=== 2.6 How this tutorial works ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をプロジェクトディレクトリにコピーすることができます。RELION-2.0の動作のパイプライン化された性質のため、これは非常に困難になります。したがって、完全に実行されたパイプラインは代わりにPrecalculatedResultsディレクトリに提供されます。ユーザーは自分のマシン上のbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用します。これは1日以内に実行する必要があります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONで異なるプログラムから摘出された分子を使用できますが、おすすめはしません。多くのプログラムが分子を変化させています。例えば、段階の切り替えや帯域通過やウィナーフィルターやマスクなどです。RELIONには後続の使用のための準最適があります。さらに、正しいフォーマットのRELIONタイプのSTARファイルの中の必要なメタデータの全ての収集はエラーになる傾向があります。RELIONでの粒子の再摘出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでのいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。他の人が書いたラッパーを役立てようとしましたが、全く制御できず、最終生成物が最良の方法としてRELIONを使用するかどうかわかりません。その結果、ラッパーで得られた結果を疑い深く注視した場合、このチュートリアルで説明している手順に従うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (組織化する)===<br />
プロジェクトごと、すなわち、測定したい構造ごとに一つのディレクトリを作ることをお勧めします。これをプロジェクトディレクトリと呼びます。重要なことはプロジェクトディレクトリからのrelionのグラフィカルユーザインタフェイス(GUI)は常に起動していることです。プロジェクトディレクトリの中では未加工の顕微鏡写真やMRC形式の顕微鏡写真動画すべてを保存するためにディレクトリを分けて作るべきです。すべての顕微鏡写真がひとつのディレクトリにある場合は、ディレクトリをMictographs/と呼びます。また、異なるディレクトリにある場合(例えば、顕微鏡写真を異なるデータから収集した時)は例えば、Micrographs/15jan16/やMicrographs/23jan16/などと呼びます。もし何らかの理由でRELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。もし単一像顕微鏡写真の代わりに動画を集めたのであれば、それらのディレクトリを使用できます。もし異なるプログラムで動画の平均を計算する場合、また顕微鏡写真と動画の平均を両方とも使用したい場合、動画は顕微鏡写真の平均と一致するようなルートネームと同じように名付けられるべきである。つまり、”_”の文字、”movie rootname”、.mrcs拡張子です。例えば、顕微鏡写真の平均がmic001.mrcと呼ばれ、mic001_movie.mrcsと呼ばれる動画と一致する場合です(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、プロジェクトディレクトリ(betagal/)と、記録されたすべての顕微鏡写真の動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。プロジェクトディレクトリに行き、以下の入力をすると、どのくらい顕微鏡写真の動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONのGUIを起動することによって始めます。前述の通り、このGUIは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、GUIは新しいディレクトリを初めて起動したときに確認を要求します。その結果、新しいディレクトリでGUIを初めて起動したとき、バックグラウンドで起動するために”&”の文字を使うべきではありません。プロジェクトディレクトリ内で確かめ、以下の入力でGUIを起動します。<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中に記録された顕微鏡写真の動画の設定の取り込みを行います。動作タイプのブラウザから”Import”を選択し、引数を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereと名付けられた白い欄に意味のあるエイリアスを規定することができます。Run now!のボタンをクリックすると動作が起動します。Import/job001/と呼ばれるディレクトリが作成され、一緒にImport/moviesと呼ばれるシンボリックリンクのディレクトリも作成されます。note.txtファイルのテキストエディターには実際の実行コマンドと、コメントを記入できるところ、閉じるものが含まれます。STARファイルとすべての動画が新しく作成されたディレクトリの中に作成されます。見るには以下を使います。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし異なるソフトウェアで粒子を摘出した場合、もしくは、RELION-1.4で摘出した粒子をRELION-2.0に移動させたい場合は、後述の前処理段階を行う代わりに、STARファイルや3D references,3D masksなどを取り込むために”Import”動作タイプを使用します。<br />
<br />
=== 3.2 Beam-induced motion correction(誘導線運動補正)===<br />
Motion correction動作タイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORRラッパーを規定します。I/Oタブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(BrowseボタンはSTARファイルの動画リストのみです。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(16フレームの動画があり、すべてのフレームで平均化します。)<br />
<br />
Motioncorrタブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数は$RELION_MOTIONCORR_EXECUTABLEを使うと、初期値から調節できます。)<br />
● Binning factor (1 or 2): 1<br />
(超解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、Unblurタブで利用できるNiko Grigorieff’s UNBLURプログラムも使用できます。すべてのMOTIONCORR設定は無視され、向上したオプションなしで初期値でUNBLURのみが実行できます。UNBLUR version 1.0.2でテストされています。Display:ボタンの後のrunボタンからout:logfile.pdfを選択することで誘導線変化の推定を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の合計を見ることができます。スクリーンサイズに左右されるため、顕微鏡写真(Scale:0.3)はおそらく縮小し、Sigma contrast:3を使い、見やすいコラム(Number of columns: 3くらい)にするべきです。ディスプレイから顕微鏡写真は選択できないことに注意してください。もしこの時に顕微鏡写真を排除したい場合(すべて良いのでしません)、Subset selection動作タイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正された顕微鏡写真からCTF引数を推定します。目的のスピードのためKai Zhang’s GCTFラッパーとしてCTF estimation動作タイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3かAlexis Rohou’s CTFFIND4が使えることに留意してください(この場合、初期値はCTFFINDタブが良いでしょう)。CTFFIND4はThon ringsよりも計算が速い顕微鏡写真の動画を使用でき、位相版から位相シフトを推定できます(Voltatype?)。I/Oタブで、MotionCorr動作のcorrected_micrographs.starファイルを選択するためにBrowseボタンを使います。他のタブは以下のように入力します。<br />
<br />
Microscopyタブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(振幅対比はほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果がよくなると示されています。この方法は低周波数の適応性のない散財がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2xのデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムを以下から選択することができます。Niko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFです。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
CTFFINDタブで、CTFFINDの一般的な引数を規定します(正しい手段でNiko’sドキュメンテーションを見る)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様にGctfタブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、二重引用符の間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
追加引数はCTFFIND-4.1以降を使用している場合は必要ありませんが、新しいバージョンでCTFFIND4タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは中央を正方形で設定したサイズで切り取り、切り取られた画像のみでCTFを推定します。これはサイズで分類されたスキャンされたフィルムで役に立ちます。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、CTFFIND4とGctfタブは無視してください。プログラムはマシン上で複数のMPI処理を使って実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。動作が終わると、出力のCtfFind/job003/Micrographsディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、Disply:ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロはモデルと一致させるべきです。デフォーカス、最大解像度、性能指数などの順番の表示は並び替えできます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に適合していない場合、それらの顕微鏡写真の.logファイルを削除でき、Finished jobsリストからCtfFind/job003項目を選択し、parameter-panelの引数を修正し、Continue nowボタンをクリックすると動作を再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分になるまで実行できます。もし可能ではない、または、十分でないThon-ringがなく、顕微鏡写真を削除すると決めた場合、Subset selection動作タイプを使用できます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking動作タイプでは(平均化された)顕微鏡写真をまとめた粒子を手入力で選択したものを使用します。詳しいデータを得るために少なくともいくつかの顕微鏡写真を手動で選択します。すべてのデータセットの自動粒子検出のためにテンプレートとして使用される教師無2Dクラス平均を計算するために手動で選択された粒子を使用します。<br />
<br />
手動粒子検出は個人の経験です!RELIONで粒子の検出をしたくないのであれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)のファイルフォーマットの整理のサポートもします。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめたファイルが同じ顕微鏡写真のルートネーム、ただし、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starです。Import動作タイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking動作タイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBroseボタンを使用し、Colorsタブは無視し、Displayタブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(画面サイズ次第です。)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒は標準偏差3より低く、白は標準偏差3より高くします。グレースケールではいつも黒から白に直線になっています。詳細はDisplayImages entry on the RELION wikiを見てください。)<br />
● White value: 0<br />
(値を白に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(値を黒に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(顕微鏡写真の多くのノイズの中の粒子を見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の明暗のグラデーションを取り除くのにたまに役立ちます。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径、ローパスフィルター、ハイパスフィルターの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に顕微鏡写真でCTFボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
Run now!ボタンをクリックすることで動作が実行され、顕微鏡写真のおよそ1000の粒子の総数が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックで整理したものの保存で必要なポップアップメニューがでます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって離れたところ(ポップアップメニューから整理されたSTARファイルを保存した)からさらに選択するためにいつでも戻ってくることができることに注意してください。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの整理されたファイルがあると、一致する粒子の抽出ができ、Particle extraction動作タイプで必要なすべてのメタデータを収集することができます。Particle extraction動作タイプのI/Oタブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine動作から_data.starファイルが使用できます。例えば、抽出で粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの編集にマニュアルが必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(入力顕微鏡写真のSTARファイルにCTF情報が含まれていないことが必要です。)<br />
<br />
extractタブで、実際の粒子抽出のための引数を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒の粒子の代わりに白にします。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロの平均値と標準偏差で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の与えられた直径の円の外のすべてのピクセルと決められています。負の値を明記するとき、粒子ボックスサイズの75%の初期値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(実際にデータを見る場合、白か黒の外れ値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは外れ値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。その結果、適切な粒子の初期分類での速度を上げるために処理の初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じ動作タイプを使用するので、manualpickのようなエイリアスを動作に与えると良いです。Helixタブは無視し、ひとつのMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/と呼ばれる新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。Display:ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてが順調である確認が速くなります。画面上で右クリックで例えば、すべての粒子を選択(Invert selection)、すべてのアラインメントされていない粒子の平均の計算(Show average of selection)を使用できます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、動作タイプ【2D classification】を使用します。<br />
【I/O】タブ上でExtract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
・Do CTF-correction? Yes<br />
ベイジアンフレームワークにおいて位相振幅補正を行います。<br />
・Have data been phase-flipped? No<br />
この選択はRELION外でデータを前処理した場合にのみ有効です。<br />
・Ignore CTFs until first peak? No<br />
振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジー分類されたりした場合にこのオプションが役立ちます。<br />
<br />
【Optimisation】タブの設定:<br />
・Number of classes: 10<br />
クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50個の粒子を使用します。<br />
・Number of iterations: 25<br />
これはほとんど変える必要はありません。<br />
・Regularisation parameter T: 2<br />
Tの定義にてついては[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3を、3次元分類ではT=3-4の値を使用してください。ネガティブ染色の場合、これよりも小さい値の方が良い場合もあります。一般的に平均値がばらついている場合は、一旦Tの値を減らしてください。もし、平均値が低解像度のままであった場合はTの値を増やしてください。あくまでもメインは高解像度のノイズの過剰適合に気付けるかどうかなのです。<br />
・Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、溶媒ノイズや粒子画像の隅にあるような隣接した粒子を除去するのに使われます。一方で、多くの目立った溶媒と隣接した粒子が列を乱すおそれがあるため、直径は小さく保ってください。また、クラス平均からのいくつかの信号を取り出したくないため、最大寸法よりも直径が大きいか確かめる可能性があります。<br />
・Mask individual particles with zeros? Yes<br />
・Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はアライメントに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にややこしいデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したジョブを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refineジョブを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
・Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
• Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
• Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
• Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
• Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
• Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classificationジョブを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-15T12:22:27Z
<p>Fisherman1: /* 2.1 The GUI */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ(【2D classification】のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の【Run!】ボタンが【Schedule】と【Run now!】の2つの新しいボタンに置き換えられました。前者のものは新しく、時間指定実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作(【Run now!】ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中の動作(【Running jobs】)、すでに完了している動作(【Finished jobs】)、または後で実行するようにスケジュールされた動作(【Scheduled jobs】)のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、【Run now!】ボタンの色が変わり、【continue now!】に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。【2D classification】、【3D classification】、【3D自 auto-refine】jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。<br />
<br />
==== 2.1.4 The Display button ====<br />
==== 2.1.5 The Job action button ====<br />
==== 2.1.6 Clean-up to save disk space ====<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
【Schedule】ボタンから、先の動作の準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他の動作への入力として利用できるため、スケジュールされた動作リストに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化された動作を実行できます。そのプログラムは何回スケジュール化された動作を実行するか問いてきます。1より大きい値を指定すると、すべてのスケジュール化された動作が繰り返し実行されます。もしこの動作を選択した場合、スケジュール化された動作の各リピート間で何分経過させるべきかという疑問が生じるでしょう。(もしスケジュール化された動作の実行が短い場合、このプログラムはスケジュール化された動作の次の動作を待機させます。)次の動作タイプは、以前の反復(インポート、モーション補正、CTF推定、自動ピッキング、粒子抽出、ムービーリファインメ)ではまだ完了していない顕微鏡写真のみを処理します。他の全ての動作タイプはスケジュール化された動作タイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、オンザフライ処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましくは、高速処理のための1つまたは複数の適切なGPUを搭載)にコピーするスクリプトをセットアップすることができます。(大きなファイルをコピーするのには時間がかかるため、顕微鏡写真と動画をインポートしたくなく、このスクリプトはファイルを一時的なファイル名としてコピーでき、それらが完全に終了したときにのみ、ファイルの最終的なファイル名に変更することができます)スケジュール化された動作リストの開始(例として【Micrograghs/*.mrcs】ファイルのインポート)はモーテョン推定、CTF推定、自動ピッキング。(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、粒子抽出、2Dクラス化によって実行される。このスケジュール化された動作リストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます長くなり、スケジュールされた動作(モーション補正、CTF推定、自動ピッキング、粒子抽出)の各反復は、その反復時の全ての粒子数をゼロから2Dクラス化している間に、新しい顕微鏡写真上でのみ実行する。電子顕微鏡でデータ補正中に2Dクラス化の査定は、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決定させるのに有益であるかもしず、またおそらく、より氷が厚いグリッド上で収集する必要があります。もし、既に3Dリファレンスが良ければ、オンザフライ上での【3Dクラス化】、【自動3D精製】を実行するかもしれません。これは、例えば、関係ある補因子がインタレスト複合体に結合しているかどうかを確認するのに有用であり得る。<br />
<br />
【subset selection】はスケジュール化されてますが、ユーザーは例えば最適なクラスを選択するための【2D classification】から _model.starを表示させるように入力するのを促されるのに注意して下さい。全てのスケジュール化された動作の実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリの処理のためのワークフローを実装しています。これには、自動ピッキング、粒子抽出、2D分類化、3D分類化、自動3D精製、粒子洗練、およびマスク作といった動作タイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーがRELION Wikiの関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities ===<br />
==== 2.5.1 Dealing with differently scaled particles ====<br />
RELION-1.4では、粒子をどれだけダウンスケーリングし(あるいはそうでないか)変更することを、STARファイル等を変更するためにawkスクリプトを付与させることで、いくつか備えていました。RELION-2.0ではとても簡単になされます。粒子抽出動作タイプは、手動ピッキング、自動ピッキングから座標を提供する代わりに、2Dクラス化、3Dクラス化、自動3D精製動作から _data.starを与える【re-extract refined particle】オプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際に、各入力粒子のスケールの違いを正しく考慮します。また入力_data.starファイルの洗練された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことは自動ピッキングでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上で【pixel size in references】で値を与えられる時に(もしくは【I/O】タブ上の【pixel size in micrographs】オプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
粒子の削除動作タイプは、RELION-2.0パイプライン内の部分的なシグナル減算の手順を形式化します。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
同じの動作タイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減産された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減産後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0でのパイプラインの公式化により、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルにアクセスできることが必要になってきました。これは、新しいjobtype join starファイルによって提供されます。4つ以上のファイルを結合する場合(完全に記述されたパイプラインを維持したい場合)は、GUIからこのユーティリティを複数回呼び出す必要があります。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度インポートすることもできます。<br />
<br />
=== 2.6 How this tutorial works ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をプロジェクトディレクトリにコピーすることができます。RELION-2.0の動作のパイプライン化された性質のため、これは非常に困難になります。したがって、完全に実行されたパイプラインは代わりにPrecalculatedResultsディレクトリに提供されます。ユーザーは自分のマシン上のbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用します。これは1日以内に実行する必要があります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONで異なるプログラムから摘出された分子を使用できますが、おすすめはしません。多くのプログラムが分子を変化させています。例えば、段階の切り替えや帯域通過やウィナーフィルターやマスクなどです。RELIONには後続の使用のための準最適があります。さらに、正しいフォーマットのRELIONタイプのSTARファイルの中の必要なメタデータの全ての収集はエラーになる傾向があります。RELIONでの粒子の再摘出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでのいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。他の人が書いたラッパーを役立てようとしましたが、全く制御できず、最終生成物が最良の方法としてRELIONを使用するかどうかわかりません。その結果、ラッパーで得られた結果を疑い深く注視した場合、このチュートリアルで説明している手順に従うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (組織化する)===<br />
プロジェクトごと、すなわち、測定したい構造ごとに一つのディレクトリを作ることをお勧めします。これをプロジェクトディレクトリと呼びます。重要なことはプロジェクトディレクトリからのrelionのグラフィカルユーザインタフェイス(GUI)は常に起動していることです。プロジェクトディレクトリの中では未加工の顕微鏡写真やMRC形式の顕微鏡写真動画すべてを保存するためにディレクトリを分けて作るべきです。すべての顕微鏡写真がひとつのディレクトリにある場合は、ディレクトリをMictographs/と呼びます。また、異なるディレクトリにある場合(例えば、顕微鏡写真を異なるデータから収集した時)は例えば、Micrographs/15jan16/やMicrographs/23jan16/などと呼びます。もし何らかの理由でRELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。もし単一像顕微鏡写真の代わりに動画を集めたのであれば、それらのディレクトリを使用できます。もし異なるプログラムで動画の平均を計算する場合、また顕微鏡写真と動画の平均を両方とも使用したい場合、動画は顕微鏡写真の平均と一致するようなルートネームと同じように名付けられるべきである。つまり、”_”の文字、”movie rootname”、.mrcs拡張子です。例えば、顕微鏡写真の平均がmic001.mrcと呼ばれ、mic001_movie.mrcsと呼ばれる動画と一致する場合です(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、プロジェクトディレクトリ(betagal/)と、記録されたすべての顕微鏡写真の動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。プロジェクトディレクトリに行き、以下の入力をすると、どのくらい顕微鏡写真の動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONのGUIを起動することによって始めます。前述の通り、このGUIは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、GUIは新しいディレクトリを初めて起動したときに確認を要求します。その結果、新しいディレクトリでGUIを初めて起動したとき、バックグラウンドで起動するために”&”の文字を使うべきではありません。プロジェクトディレクトリ内で確かめ、以下の入力でGUIを起動します。<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中に記録された顕微鏡写真の動画の設定の取り込みを行います。動作タイプのブラウザから”Import”を選択し、引数を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereと名付けられた白い欄に意味のあるエイリアスを規定することができます。Run now!のボタンをクリックすると動作が起動します。Import/job001/と呼ばれるディレクトリが作成され、一緒にImport/moviesと呼ばれるシンボリックリンクのディレクトリも作成されます。note.txtファイルのテキストエディターには実際の実行コマンドと、コメントを記入できるところ、閉じるものが含まれます。STARファイルとすべての動画が新しく作成されたディレクトリの中に作成されます。見るには以下を使います。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし異なるソフトウェアで粒子を摘出した場合、もしくは、RELION-1.4で摘出した粒子をRELION-2.0に移動させたい場合は、後述の前処理段階を行う代わりに、STARファイルや3D references,3D masksなどを取り込むために”Import”動作タイプを使用します。<br />
<br />
=== 3.2 Beam-induced motion correction(誘導線運動補正)===<br />
Motion correction動作タイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORRラッパーを規定します。I/Oタブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(BrowseボタンはSTARファイルの動画リストのみです。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(16フレームの動画があり、すべてのフレームで平均化します。)<br />
<br />
Motioncorrタブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数は$RELION_MOTIONCORR_EXECUTABLEを使うと、初期値から調節できます。)<br />
● Binning factor (1 or 2): 1<br />
(超解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、Unblurタブで利用できるNiko Grigorieff’s UNBLURプログラムも使用できます。すべてのMOTIONCORR設定は無視され、向上したオプションなしで初期値でUNBLURのみが実行できます。UNBLUR version 1.0.2でテストされています。Display:ボタンの後のrunボタンからout:logfile.pdfを選択することで誘導線変化の推定を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の合計を見ることができます。スクリーンサイズに左右されるため、顕微鏡写真(Scale:0.3)はおそらく縮小し、Sigma contrast:3を使い、見やすいコラム(Number of columns: 3くらい)にするべきです。ディスプレイから顕微鏡写真は選択できないことに注意してください。もしこの時に顕微鏡写真を排除したい場合(すべて良いのでしません)、Subset selection動作タイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正された顕微鏡写真からCTF引数を推定します。目的のスピードのためKai Zhang’s GCTFラッパーとしてCTF estimation動作タイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3かAlexis Rohou’s CTFFIND4が使えることに留意してください(この場合、初期値はCTFFINDタブが良いでしょう)。CTFFIND4はThon ringsよりも計算が速い顕微鏡写真の動画を使用でき、位相版から位相シフトを推定できます(Voltatype?)。I/Oタブで、MotionCorr動作のcorrected_micrographs.starファイルを選択するためにBrowseボタンを使います。他のタブは以下のように入力します。<br />
<br />
Microscopyタブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(振幅対比はほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果がよくなると示されています。この方法は低周波数の適応性のない散財がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2xのデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムを以下から選択することができます。Niko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFです。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
CTFFINDタブで、CTFFINDの一般的な引数を規定します(正しい手段でNiko’sドキュメンテーションを見る)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様にGctfタブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、二重引用符の間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
追加引数はCTFFIND-4.1以降を使用している場合は必要ありませんが、新しいバージョンでCTFFIND4タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは中央を正方形で設定したサイズで切り取り、切り取られた画像のみでCTFを推定します。これはサイズで分類されたスキャンされたフィルムで役に立ちます。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、CTFFIND4とGctfタブは無視してください。プログラムはマシン上で複数のMPI処理を使って実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。動作が終わると、出力のCtfFind/job003/Micrographsディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、Disply:ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロはモデルと一致させるべきです。デフォーカス、最大解像度、性能指数などの順番の表示は並び替えできます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に適合していない場合、それらの顕微鏡写真の.logファイルを削除でき、Finished jobsリストからCtfFind/job003項目を選択し、parameter-panelの引数を修正し、Continue nowボタンをクリックすると動作を再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分になるまで実行できます。もし可能ではない、または、十分でないThon-ringがなく、顕微鏡写真を削除すると決めた場合、Subset selection動作タイプを使用できます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking動作タイプでは(平均化された)顕微鏡写真をまとめた粒子を手入力で選択したものを使用します。詳しいデータを得るために少なくともいくつかの顕微鏡写真を手動で選択します。すべてのデータセットの自動粒子検出のためにテンプレートとして使用される教師無2Dクラス平均を計算するために手動で選択された粒子を使用します。<br />
<br />
手動粒子検出は個人の経験です!RELIONで粒子の検出をしたくないのであれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)のファイルフォーマットの整理のサポートもします。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめたファイルが同じ顕微鏡写真のルートネーム、ただし、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starです。Import動作タイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking動作タイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBroseボタンを使用し、Colorsタブは無視し、Displayタブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(画面サイズ次第です。)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒は標準偏差3より低く、白は標準偏差3より高くします。グレースケールではいつも黒から白に直線になっています。詳細はDisplayImages entry on the RELION wikiを見てください。)<br />
● White value: 0<br />
(値を白に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(値を黒に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(顕微鏡写真の多くのノイズの中の粒子を見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の明暗のグラデーションを取り除くのにたまに役立ちます。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径、ローパスフィルター、ハイパスフィルターの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に顕微鏡写真でCTFボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
Run now!ボタンをクリックすることで動作が実行され、顕微鏡写真のおよそ1000の粒子の総数が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックで整理したものの保存で必要なポップアップメニューがでます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって離れたところ(ポップアップメニューから整理されたSTARファイルを保存した)からさらに選択するためにいつでも戻ってくることができることに注意してください。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの整理されたファイルがあると、一致する粒子の抽出ができ、Particle extraction動作タイプで必要なすべてのメタデータを収集することができます。Particle extraction動作タイプのI/Oタブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine動作から_data.starファイルが使用できます。例えば、抽出で粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの編集にマニュアルが必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(入力顕微鏡写真のSTARファイルにCTF情報が含まれていないことが必要です。)<br />
<br />
extractタブで、実際の粒子抽出のための引数を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒の粒子の代わりに白にします。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロの平均値と標準偏差で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の与えられた直径の円の外のすべてのピクセルと決められています。負の値を明記するとき、粒子ボックスサイズの75%の初期値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(実際にデータを見る場合、白か黒の外れ値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは外れ値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。その結果、適切な粒子の初期分類での速度を上げるために処理の初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じ動作タイプを使用するので、manualpickのようなエイリアスを動作に与えると良いです。Helixタブは無視し、ひとつのMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/と呼ばれる新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。Display:ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてが順調である確認が速くなります。画面上で右クリックで例えば、すべての粒子を選択(Invert selection)、すべてのアラインメントされていない粒子の平均の計算(Show average of selection)を使用できます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、動作タイプ【2D classification】を使用します。<br />
【I/O】タブ上でExtract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
・Do CTF-correction? Yes<br />
ベイジアンフレームワークにおいて位相振幅補正を行います。<br />
・Have data been phase-flipped? No<br />
この選択はRELION外でデータを前処理した場合にのみ有効です。<br />
・Ignore CTFs until first peak? No<br />
振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジー分類されたりした場合にこのオプションが役立ちます。<br />
<br />
【Optimisation】タブの設定:<br />
・Number of classes: 10<br />
クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50個の粒子を使用します。<br />
・Number of iterations: 25<br />
これはほとんど変える必要はありません。<br />
・Regularisation parameter T: 2<br />
Tの定義にてついては[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3を、3次元分類ではT=3-4の値を使用してください。ネガティブ染色の場合、これよりも小さい値の方が良い場合もあります。一般的に平均値がばらついている場合は、一旦Tの値を減らしてください。もし、平均値が低解像度のままであった場合はTの値を増やしてください。あくまでもメインは高解像度のノイズの過剰適合に気付けるかどうかなのです。<br />
・Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、溶媒ノイズや粒子画像の隅にあるような隣接した粒子を除去するのに使われます。一方で、多くの目立った溶媒と隣接した粒子が列を乱すおそれがあるため、直径は小さく保ってください。また、クラス平均からのいくつかの信号を取り出したくないため、最大寸法よりも直径が大きいか確かめる可能性があります。<br />
・Mask individual particles with zeros? Yes<br />
・Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はアライメントに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にややこしいデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したジョブを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refineジョブを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
・Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
• Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
• Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
• Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
• Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
• Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classificationジョブを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-15T12:14:09Z
<p>Fisherman1: /* 2.1.1 A pipeline approach */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインを自動生成するだけにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ([2D classification]のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の[Run!]ボタンが[Schedule]と[Run now!]の2つの新しいボタンに置き換えられました。前者のものは新しく、時間指定実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作([Run now!]ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中の動作([Running jobs])、すでに完了している動作([Finished jobs])、または後で実行するようにスケジュールされた動作([Scheduled jobs])のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、[Run now!]ボタンの色が変わり、[continue now!]に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。[2D classification]、[3D classification]、[3D自 auto-refine]jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。<br />
<br />
==== 2.1.4 The Display button ====<br />
==== 2.1.5 The Job action button ====<br />
==== 2.1.6 Clean-up to save disk space ====<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
【Schedule】ボタンから、先の動作の準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他の動作への入力として利用できるため、スケジュールされた動作リストに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化された動作を実行できます。そのプログラムは何回スケジュール化された動作を実行するか問いてきます。1より大きい値を指定すると、すべてのスケジュール化された動作が繰り返し実行されます。もしこの動作を選択した場合、スケジュール化された動作の各リピート間で何分経過させるべきかという疑問が生じるでしょう。(もしスケジュール化された動作の実行が短い場合、このプログラムはスケジュール化された動作の次の動作を待機させます。)次の動作タイプは、以前の反復(インポート、モーション補正、CTF推定、自動ピッキング、粒子抽出、ムービーリファインメ)ではまだ完了していない顕微鏡写真のみを処理します。他の全ての動作タイプはスケジュール化された動作タイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、オンザフライ処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましくは、高速処理のための1つまたは複数の適切なGPUを搭載)にコピーするスクリプトをセットアップすることができます。(大きなファイルをコピーするのには時間がかかるため、顕微鏡写真と動画をインポートしたくなく、このスクリプトはファイルを一時的なファイル名としてコピーでき、それらが完全に終了したときにのみ、ファイルの最終的なファイル名に変更することができます)スケジュール化された動作リストの開始(例として【Micrograghs/*.mrcs】ファイルのインポート)はモーテョン推定、CTF推定、自動ピッキング。(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、粒子抽出、2Dクラス化によって実行される。このスケジュール化された動作リストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます長くなり、スケジュールされた動作(モーション補正、CTF推定、自動ピッキング、粒子抽出)の各反復は、その反復時の全ての粒子数をゼロから2Dクラス化している間に、新しい顕微鏡写真上でのみ実行する。電子顕微鏡でデータ補正中に2Dクラス化の査定は、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決定させるのに有益であるかもしず、またおそらく、より氷が厚いグリッド上で収集する必要があります。もし、既に3Dリファレンスが良ければ、オンザフライ上での【3Dクラス化】、【自動3D精製】を実行するかもしれません。これは、例えば、関係ある補因子がインタレスト複合体に結合しているかどうかを確認するのに有用であり得る。<br />
<br />
【subset selection】はスケジュール化されてますが、ユーザーは例えば最適なクラスを選択するための【2D classification】から _model.starを表示させるように入力するのを促されるのに注意して下さい。全てのスケジュール化された動作の実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリの処理のためのワークフローを実装しています。これには、自動ピッキング、粒子抽出、2D分類化、3D分類化、自動3D精製、粒子洗練、およびマスク作といった動作タイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーがRELION Wikiの関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities ===<br />
==== 2.5.1 Dealing with differently scaled particles ====<br />
RELION-1.4では、粒子をどれだけダウンスケーリングし(あるいはそうでないか)変更することを、STARファイル等を変更するためにawkスクリプトを付与させることで、いくつか備えていました。RELION-2.0ではとても簡単になされます。粒子抽出動作タイプは、手動ピッキング、自動ピッキングから座標を提供する代わりに、2Dクラス化、3Dクラス化、自動3D精製動作から _data.starを与える【re-extract refined particle】オプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際に、各入力粒子のスケールの違いを正しく考慮します。また入力_data.starファイルの洗練された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことは自動ピッキングでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上で【pixel size in references】で値を与えられる時に(もしくは【I/O】タブ上の【pixel size in micrographs】オプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
粒子の削除動作タイプは、RELION-2.0パイプライン内の部分的なシグナル減算の手順を形式化します。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
同じの動作タイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減産された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減産後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0でのパイプラインの公式化により、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルにアクセスできることが必要になってきました。これは、新しいjobtype join starファイルによって提供されます。4つ以上のファイルを結合する場合(完全に記述されたパイプラインを維持したい場合)は、GUIからこのユーティリティを複数回呼び出す必要があります。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度インポートすることもできます。<br />
<br />
=== 2.6 How this tutorial works ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をプロジェクトディレクトリにコピーすることができます。RELION-2.0の動作のパイプライン化された性質のため、これは非常に困難になります。したがって、完全に実行されたパイプラインは代わりにPrecalculatedResultsディレクトリに提供されます。ユーザーは自分のマシン上のbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用します。これは1日以内に実行する必要があります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONで異なるプログラムから摘出された分子を使用できますが、おすすめはしません。多くのプログラムが分子を変化させています。例えば、段階の切り替えや帯域通過やウィナーフィルターやマスクなどです。RELIONには後続の使用のための準最適があります。さらに、正しいフォーマットのRELIONタイプのSTARファイルの中の必要なメタデータの全ての収集はエラーになる傾向があります。RELIONでの粒子の再摘出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでのいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。他の人が書いたラッパーを役立てようとしましたが、全く制御できず、最終生成物が最良の方法としてRELIONを使用するかどうかわかりません。その結果、ラッパーで得られた結果を疑い深く注視した場合、このチュートリアルで説明している手順に従うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (組織化する)===<br />
プロジェクトごと、すなわち、測定したい構造ごとに一つのディレクトリを作ることをお勧めします。これをプロジェクトディレクトリと呼びます。重要なことはプロジェクトディレクトリからのrelionのグラフィカルユーザインタフェイス(GUI)は常に起動していることです。プロジェクトディレクトリの中では未加工の顕微鏡写真やMRC形式の顕微鏡写真動画すべてを保存するためにディレクトリを分けて作るべきです。すべての顕微鏡写真がひとつのディレクトリにある場合は、ディレクトリをMictographs/と呼びます。また、異なるディレクトリにある場合(例えば、顕微鏡写真を異なるデータから収集した時)は例えば、Micrographs/15jan16/やMicrographs/23jan16/などと呼びます。もし何らかの理由でRELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。もし単一像顕微鏡写真の代わりに動画を集めたのであれば、それらのディレクトリを使用できます。もし異なるプログラムで動画の平均を計算する場合、また顕微鏡写真と動画の平均を両方とも使用したい場合、動画は顕微鏡写真の平均と一致するようなルートネームと同じように名付けられるべきである。つまり、”_”の文字、”movie rootname”、.mrcs拡張子です。例えば、顕微鏡写真の平均がmic001.mrcと呼ばれ、mic001_movie.mrcsと呼ばれる動画と一致する場合です(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、プロジェクトディレクトリ(betagal/)と、記録されたすべての顕微鏡写真の動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。プロジェクトディレクトリに行き、以下の入力をすると、どのくらい顕微鏡写真の動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONのGUIを起動することによって始めます。前述の通り、このGUIは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、GUIは新しいディレクトリを初めて起動したときに確認を要求します。その結果、新しいディレクトリでGUIを初めて起動したとき、バックグラウンドで起動するために”&”の文字を使うべきではありません。プロジェクトディレクトリ内で確かめ、以下の入力でGUIを起動します。<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中に記録された顕微鏡写真の動画の設定の取り込みを行います。動作タイプのブラウザから”Import”を選択し、引数を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereと名付けられた白い欄に意味のあるエイリアスを規定することができます。Run now!のボタンをクリックすると動作が起動します。Import/job001/と呼ばれるディレクトリが作成され、一緒にImport/moviesと呼ばれるシンボリックリンクのディレクトリも作成されます。note.txtファイルのテキストエディターには実際の実行コマンドと、コメントを記入できるところ、閉じるものが含まれます。STARファイルとすべての動画が新しく作成されたディレクトリの中に作成されます。見るには以下を使います。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし異なるソフトウェアで粒子を摘出した場合、もしくは、RELION-1.4で摘出した粒子をRELION-2.0に移動させたい場合は、後述の前処理段階を行う代わりに、STARファイルや3D references,3D masksなどを取り込むために”Import”動作タイプを使用します。<br />
<br />
=== 3.2 Beam-induced motion correction(誘導線運動補正)===<br />
Motion correction動作タイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORRラッパーを規定します。I/Oタブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(BrowseボタンはSTARファイルの動画リストのみです。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(16フレームの動画があり、すべてのフレームで平均化します。)<br />
<br />
Motioncorrタブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数は$RELION_MOTIONCORR_EXECUTABLEを使うと、初期値から調節できます。)<br />
● Binning factor (1 or 2): 1<br />
(超解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、Unblurタブで利用できるNiko Grigorieff’s UNBLURプログラムも使用できます。すべてのMOTIONCORR設定は無視され、向上したオプションなしで初期値でUNBLURのみが実行できます。UNBLUR version 1.0.2でテストされています。Display:ボタンの後のrunボタンからout:logfile.pdfを選択することで誘導線変化の推定を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の合計を見ることができます。スクリーンサイズに左右されるため、顕微鏡写真(Scale:0.3)はおそらく縮小し、Sigma contrast:3を使い、見やすいコラム(Number of columns: 3くらい)にするべきです。ディスプレイから顕微鏡写真は選択できないことに注意してください。もしこの時に顕微鏡写真を排除したい場合(すべて良いのでしません)、Subset selection動作タイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正された顕微鏡写真からCTF引数を推定します。目的のスピードのためKai Zhang’s GCTFラッパーとしてCTF estimation動作タイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3かAlexis Rohou’s CTFFIND4が使えることに留意してください(この場合、初期値はCTFFINDタブが良いでしょう)。CTFFIND4はThon ringsよりも計算が速い顕微鏡写真の動画を使用でき、位相版から位相シフトを推定できます(Voltatype?)。I/Oタブで、MotionCorr動作のcorrected_micrographs.starファイルを選択するためにBrowseボタンを使います。他のタブは以下のように入力します。<br />
<br />
Microscopyタブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(振幅対比はほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果がよくなると示されています。この方法は低周波数の適応性のない散財がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2xのデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムを以下から選択することができます。Niko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFです。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
CTFFINDタブで、CTFFINDの一般的な引数を規定します(正しい手段でNiko’sドキュメンテーションを見る)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様にGctfタブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、二重引用符の間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
追加引数はCTFFIND-4.1以降を使用している場合は必要ありませんが、新しいバージョンでCTFFIND4タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは中央を正方形で設定したサイズで切り取り、切り取られた画像のみでCTFを推定します。これはサイズで分類されたスキャンされたフィルムで役に立ちます。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、CTFFIND4とGctfタブは無視してください。プログラムはマシン上で複数のMPI処理を使って実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。動作が終わると、出力のCtfFind/job003/Micrographsディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、Disply:ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロはモデルと一致させるべきです。デフォーカス、最大解像度、性能指数などの順番の表示は並び替えできます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に適合していない場合、それらの顕微鏡写真の.logファイルを削除でき、Finished jobsリストからCtfFind/job003項目を選択し、parameter-panelの引数を修正し、Continue nowボタンをクリックすると動作を再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分になるまで実行できます。もし可能ではない、または、十分でないThon-ringがなく、顕微鏡写真を削除すると決めた場合、Subset selection動作タイプを使用できます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking動作タイプでは(平均化された)顕微鏡写真をまとめた粒子を手入力で選択したものを使用します。詳しいデータを得るために少なくともいくつかの顕微鏡写真を手動で選択します。すべてのデータセットの自動粒子検出のためにテンプレートとして使用される教師無2Dクラス平均を計算するために手動で選択された粒子を使用します。<br />
<br />
手動粒子検出は個人の経験です!RELIONで粒子の検出をしたくないのであれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)のファイルフォーマットの整理のサポートもします。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめたファイルが同じ顕微鏡写真のルートネーム、ただし、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starです。Import動作タイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking動作タイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBroseボタンを使用し、Colorsタブは無視し、Displayタブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(画面サイズ次第です。)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒は標準偏差3より低く、白は標準偏差3より高くします。グレースケールではいつも黒から白に直線になっています。詳細はDisplayImages entry on the RELION wikiを見てください。)<br />
● White value: 0<br />
(値を白に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(値を黒に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(顕微鏡写真の多くのノイズの中の粒子を見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の明暗のグラデーションを取り除くのにたまに役立ちます。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径、ローパスフィルター、ハイパスフィルターの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に顕微鏡写真でCTFボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
Run now!ボタンをクリックすることで動作が実行され、顕微鏡写真のおよそ1000の粒子の総数が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックで整理したものの保存で必要なポップアップメニューがでます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって離れたところ(ポップアップメニューから整理されたSTARファイルを保存した)からさらに選択するためにいつでも戻ってくることができることに注意してください。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの整理されたファイルがあると、一致する粒子の抽出ができ、Particle extraction動作タイプで必要なすべてのメタデータを収集することができます。Particle extraction動作タイプのI/Oタブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine動作から_data.starファイルが使用できます。例えば、抽出で粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの編集にマニュアルが必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(入力顕微鏡写真のSTARファイルにCTF情報が含まれていないことが必要です。)<br />
<br />
extractタブで、実際の粒子抽出のための引数を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒の粒子の代わりに白にします。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロの平均値と標準偏差で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の与えられた直径の円の外のすべてのピクセルと決められています。負の値を明記するとき、粒子ボックスサイズの75%の初期値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(実際にデータを見る場合、白か黒の外れ値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは外れ値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。その結果、適切な粒子の初期分類での速度を上げるために処理の初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じ動作タイプを使用するので、manualpickのようなエイリアスを動作に与えると良いです。Helixタブは無視し、ひとつのMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/と呼ばれる新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。Display:ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてが順調である確認が速くなります。画面上で右クリックで例えば、すべての粒子を選択(Invert selection)、すべてのアラインメントされていない粒子の平均の計算(Show average of selection)を使用できます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、動作タイプ【2D classification】を使用します。<br />
【I/O】タブ上でExtract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
・Do CTF-correction? Yes<br />
ベイジアンフレームワークにおいて位相振幅補正を行います。<br />
・Have data been phase-flipped? No<br />
この選択はRELION外でデータを前処理した場合にのみ有効です。<br />
・Ignore CTFs until first peak? No<br />
振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジー分類されたりした場合にこのオプションが役立ちます。<br />
<br />
【Optimisation】タブの設定:<br />
・Number of classes: 10<br />
クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50個の粒子を使用します。<br />
・Number of iterations: 25<br />
これはほとんど変える必要はありません。<br />
・Regularisation parameter T: 2<br />
Tの定義にてついては[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3を、3次元分類ではT=3-4の値を使用してください。ネガティブ染色の場合、これよりも小さい値の方が良い場合もあります。一般的に平均値がばらついている場合は、一旦Tの値を減らしてください。もし、平均値が低解像度のままであった場合はTの値を増やしてください。あくまでもメインは高解像度のノイズの過剰適合に気付けるかどうかなのです。<br />
・Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、溶媒ノイズや粒子画像の隅にあるような隣接した粒子を除去するのに使われます。一方で、多くの目立った溶媒と隣接した粒子が列を乱すおそれがあるため、直径は小さく保ってください。また、クラス平均からのいくつかの信号を取り出したくないため、最大寸法よりも直径が大きいか確かめる可能性があります。<br />
・Mask individual particles with zeros? Yes<br />
・Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はアライメントに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にややこしいデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したジョブを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refineジョブを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
・Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
• Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
• Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
• Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
• Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
• Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classificationジョブを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-15T12:11:45Z
<p>Fisherman1: /* 2.1.3 The lower half: job-lists and stdout/stderr windows */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインジェネレータにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーはそれぞれのjobから出力ファイルを紐づけする必要がありました。また、以前のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべてのjobの動作経歴と、それぞれのjobがどのような出力をし、それを他のjobに入力したのかを保存します。そのため、パイプラインを形成できます。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。各jobタイプはそれぞれ独自の出力ディレクトリがあり、これらのjobタイプのディレクトリ内(例えばClass2D)では、新しいjobは連続する番号(Class2D/job010)を取得します。これら個々のjobディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々のjobディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側にjobタイプ([2D classification]のようなjobタイプを選ぶ縦の)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、それぞれのjobタイプへのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の[Run!]ボタンが[Schedule]と[Run now!]の2つの新しいボタンに置き換えられました。前者のものは新しく、時間指定実行のためにjobをスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作([Run now!]ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中の動作([Running jobs])、すでに完了している動作([Finished jobs])、または後で実行するようにスケジュールされた動作([Scheduled jobs])のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、[Run now!]ボタンの色が変わり、[continue now!]に変わります。それをクリックすると、新しい出力jobディレクトリは作成されませんが、パラメータパネルで指定されたパラメータに従ってjobが続行されます。[2D classification]、[3D classification]、[3D自 auto-refine]jobでは、_optimiser.starファイルが必要になり、ファイル名には、run_ct23のような継続された繰り返しのファイル名が付きます。<br />
<br />
==== 2.1.4 The Display button ====<br />
==== 2.1.5 The Job action button ====<br />
==== 2.1.6 Clean-up to save disk space ====<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
【Schedule】ボタンから、先の動作の準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他の動作への入力として利用できるため、スケジュールされた動作リストに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化された動作を実行できます。そのプログラムは何回スケジュール化された動作を実行するか問いてきます。1より大きい値を指定すると、すべてのスケジュール化された動作が繰り返し実行されます。もしこの動作を選択した場合、スケジュール化された動作の各リピート間で何分経過させるべきかという疑問が生じるでしょう。(もしスケジュール化された動作の実行が短い場合、このプログラムはスケジュール化された動作の次の動作を待機させます。)次の動作タイプは、以前の反復(インポート、モーション補正、CTF推定、自動ピッキング、粒子抽出、ムービーリファインメ)ではまだ完了していない顕微鏡写真のみを処理します。他の全ての動作タイプはスケジュール化された動作タイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、オンザフライ処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましくは、高速処理のための1つまたは複数の適切なGPUを搭載)にコピーするスクリプトをセットアップすることができます。(大きなファイルをコピーするのには時間がかかるため、顕微鏡写真と動画をインポートしたくなく、このスクリプトはファイルを一時的なファイル名としてコピーでき、それらが完全に終了したときにのみ、ファイルの最終的なファイル名に変更することができます)スケジュール化された動作リストの開始(例として【Micrograghs/*.mrcs】ファイルのインポート)はモーテョン推定、CTF推定、自動ピッキング。(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、粒子抽出、2Dクラス化によって実行される。このスケジュール化された動作リストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます長くなり、スケジュールされた動作(モーション補正、CTF推定、自動ピッキング、粒子抽出)の各反復は、その反復時の全ての粒子数をゼロから2Dクラス化している間に、新しい顕微鏡写真上でのみ実行する。電子顕微鏡でデータ補正中に2Dクラス化の査定は、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決定させるのに有益であるかもしず、またおそらく、より氷が厚いグリッド上で収集する必要があります。もし、既に3Dリファレンスが良ければ、オンザフライ上での【3Dクラス化】、【自動3D精製】を実行するかもしれません。これは、例えば、関係ある補因子がインタレスト複合体に結合しているかどうかを確認するのに有用であり得る。<br />
<br />
【subset selection】はスケジュール化されてますが、ユーザーは例えば最適なクラスを選択するための【2D classification】から _model.starを表示させるように入力するのを促されるのに注意して下さい。全てのスケジュール化された動作の実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリの処理のためのワークフローを実装しています。これには、自動ピッキング、粒子抽出、2D分類化、3D分類化、自動3D精製、粒子洗練、およびマスク作といった動作タイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーがRELION Wikiの関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities ===<br />
==== 2.5.1 Dealing with differently scaled particles ====<br />
RELION-1.4では、粒子をどれだけダウンスケーリングし(あるいはそうでないか)変更することを、STARファイル等を変更するためにawkスクリプトを付与させることで、いくつか備えていました。RELION-2.0ではとても簡単になされます。粒子抽出動作タイプは、手動ピッキング、自動ピッキングから座標を提供する代わりに、2Dクラス化、3Dクラス化、自動3D精製動作から _data.starを与える【re-extract refined particle】オプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際に、各入力粒子のスケールの違いを正しく考慮します。また入力_data.starファイルの洗練された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことは自動ピッキングでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上で【pixel size in references】で値を与えられる時に(もしくは【I/O】タブ上の【pixel size in micrographs】オプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
粒子の削除動作タイプは、RELION-2.0パイプライン内の部分的なシグナル減算の手順を形式化します。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
同じの動作タイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減産された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減産後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0でのパイプラインの公式化により、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルにアクセスできることが必要になってきました。これは、新しいjobtype join starファイルによって提供されます。4つ以上のファイルを結合する場合(完全に記述されたパイプラインを維持したい場合)は、GUIからこのユーティリティを複数回呼び出す必要があります。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度インポートすることもできます。<br />
<br />
=== 2.6 How this tutorial works ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をプロジェクトディレクトリにコピーすることができます。RELION-2.0の動作のパイプライン化された性質のため、これは非常に困難になります。したがって、完全に実行されたパイプラインは代わりにPrecalculatedResultsディレクトリに提供されます。ユーザーは自分のマシン上のbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用します。これは1日以内に実行する必要があります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONで異なるプログラムから摘出された分子を使用できますが、おすすめはしません。多くのプログラムが分子を変化させています。例えば、段階の切り替えや帯域通過やウィナーフィルターやマスクなどです。RELIONには後続の使用のための準最適があります。さらに、正しいフォーマットのRELIONタイプのSTARファイルの中の必要なメタデータの全ての収集はエラーになる傾向があります。RELIONでの粒子の再摘出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでのいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。他の人が書いたラッパーを役立てようとしましたが、全く制御できず、最終生成物が最良の方法としてRELIONを使用するかどうかわかりません。その結果、ラッパーで得られた結果を疑い深く注視した場合、このチュートリアルで説明している手順に従うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (組織化する)===<br />
プロジェクトごと、すなわち、測定したい構造ごとに一つのディレクトリを作ることをお勧めします。これをプロジェクトディレクトリと呼びます。重要なことはプロジェクトディレクトリからのrelionのグラフィカルユーザインタフェイス(GUI)は常に起動していることです。プロジェクトディレクトリの中では未加工の顕微鏡写真やMRC形式の顕微鏡写真動画すべてを保存するためにディレクトリを分けて作るべきです。すべての顕微鏡写真がひとつのディレクトリにある場合は、ディレクトリをMictographs/と呼びます。また、異なるディレクトリにある場合(例えば、顕微鏡写真を異なるデータから収集した時)は例えば、Micrographs/15jan16/やMicrographs/23jan16/などと呼びます。もし何らかの理由でRELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。もし単一像顕微鏡写真の代わりに動画を集めたのであれば、それらのディレクトリを使用できます。もし異なるプログラムで動画の平均を計算する場合、また顕微鏡写真と動画の平均を両方とも使用したい場合、動画は顕微鏡写真の平均と一致するようなルートネームと同じように名付けられるべきである。つまり、”_”の文字、”movie rootname”、.mrcs拡張子です。例えば、顕微鏡写真の平均がmic001.mrcと呼ばれ、mic001_movie.mrcsと呼ばれる動画と一致する場合です(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、プロジェクトディレクトリ(betagal/)と、記録されたすべての顕微鏡写真の動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。プロジェクトディレクトリに行き、以下の入力をすると、どのくらい顕微鏡写真の動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONのGUIを起動することによって始めます。前述の通り、このGUIは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、GUIは新しいディレクトリを初めて起動したときに確認を要求します。その結果、新しいディレクトリでGUIを初めて起動したとき、バックグラウンドで起動するために”&”の文字を使うべきではありません。プロジェクトディレクトリ内で確かめ、以下の入力でGUIを起動します。<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中に記録された顕微鏡写真の動画の設定の取り込みを行います。動作タイプのブラウザから”Import”を選択し、引数を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereと名付けられた白い欄に意味のあるエイリアスを規定することができます。Run now!のボタンをクリックすると動作が起動します。Import/job001/と呼ばれるディレクトリが作成され、一緒にImport/moviesと呼ばれるシンボリックリンクのディレクトリも作成されます。note.txtファイルのテキストエディターには実際の実行コマンドと、コメントを記入できるところ、閉じるものが含まれます。STARファイルとすべての動画が新しく作成されたディレクトリの中に作成されます。見るには以下を使います。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし異なるソフトウェアで粒子を摘出した場合、もしくは、RELION-1.4で摘出した粒子をRELION-2.0に移動させたい場合は、後述の前処理段階を行う代わりに、STARファイルや3D references,3D masksなどを取り込むために”Import”動作タイプを使用します。<br />
<br />
=== 3.2 Beam-induced motion correction(誘導線運動補正)===<br />
Motion correction動作タイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORRラッパーを規定します。I/Oタブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(BrowseボタンはSTARファイルの動画リストのみです。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(16フレームの動画があり、すべてのフレームで平均化します。)<br />
<br />
Motioncorrタブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数は$RELION_MOTIONCORR_EXECUTABLEを使うと、初期値から調節できます。)<br />
● Binning factor (1 or 2): 1<br />
(超解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、Unblurタブで利用できるNiko Grigorieff’s UNBLURプログラムも使用できます。すべてのMOTIONCORR設定は無視され、向上したオプションなしで初期値でUNBLURのみが実行できます。UNBLUR version 1.0.2でテストされています。Display:ボタンの後のrunボタンからout:logfile.pdfを選択することで誘導線変化の推定を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の合計を見ることができます。スクリーンサイズに左右されるため、顕微鏡写真(Scale:0.3)はおそらく縮小し、Sigma contrast:3を使い、見やすいコラム(Number of columns: 3くらい)にするべきです。ディスプレイから顕微鏡写真は選択できないことに注意してください。もしこの時に顕微鏡写真を排除したい場合(すべて良いのでしません)、Subset selection動作タイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正された顕微鏡写真からCTF引数を推定します。目的のスピードのためKai Zhang’s GCTFラッパーとしてCTF estimation動作タイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3かAlexis Rohou’s CTFFIND4が使えることに留意してください(この場合、初期値はCTFFINDタブが良いでしょう)。CTFFIND4はThon ringsよりも計算が速い顕微鏡写真の動画を使用でき、位相版から位相シフトを推定できます(Voltatype?)。I/Oタブで、MotionCorr動作のcorrected_micrographs.starファイルを選択するためにBrowseボタンを使います。他のタブは以下のように入力します。<br />
<br />
Microscopyタブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(振幅対比はほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果がよくなると示されています。この方法は低周波数の適応性のない散財がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2xのデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムを以下から選択することができます。Niko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFです。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
CTFFINDタブで、CTFFINDの一般的な引数を規定します(正しい手段でNiko’sドキュメンテーションを見る)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様にGctfタブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、二重引用符の間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
追加引数はCTFFIND-4.1以降を使用している場合は必要ありませんが、新しいバージョンでCTFFIND4タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは中央を正方形で設定したサイズで切り取り、切り取られた画像のみでCTFを推定します。これはサイズで分類されたスキャンされたフィルムで役に立ちます。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、CTFFIND4とGctfタブは無視してください。プログラムはマシン上で複数のMPI処理を使って実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。動作が終わると、出力のCtfFind/job003/Micrographsディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、Disply:ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロはモデルと一致させるべきです。デフォーカス、最大解像度、性能指数などの順番の表示は並び替えできます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に適合していない場合、それらの顕微鏡写真の.logファイルを削除でき、Finished jobsリストからCtfFind/job003項目を選択し、parameter-panelの引数を修正し、Continue nowボタンをクリックすると動作を再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分になるまで実行できます。もし可能ではない、または、十分でないThon-ringがなく、顕微鏡写真を削除すると決めた場合、Subset selection動作タイプを使用できます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking動作タイプでは(平均化された)顕微鏡写真をまとめた粒子を手入力で選択したものを使用します。詳しいデータを得るために少なくともいくつかの顕微鏡写真を手動で選択します。すべてのデータセットの自動粒子検出のためにテンプレートとして使用される教師無2Dクラス平均を計算するために手動で選択された粒子を使用します。<br />
<br />
手動粒子検出は個人の経験です!RELIONで粒子の検出をしたくないのであれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)のファイルフォーマットの整理のサポートもします。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめたファイルが同じ顕微鏡写真のルートネーム、ただし、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starです。Import動作タイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking動作タイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBroseボタンを使用し、Colorsタブは無視し、Displayタブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(画面サイズ次第です。)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒は標準偏差3より低く、白は標準偏差3より高くします。グレースケールではいつも黒から白に直線になっています。詳細はDisplayImages entry on the RELION wikiを見てください。)<br />
● White value: 0<br />
(値を白に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(値を黒に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(顕微鏡写真の多くのノイズの中の粒子を見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の明暗のグラデーションを取り除くのにたまに役立ちます。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径、ローパスフィルター、ハイパスフィルターの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に顕微鏡写真でCTFボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
Run now!ボタンをクリックすることで動作が実行され、顕微鏡写真のおよそ1000の粒子の総数が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックで整理したものの保存で必要なポップアップメニューがでます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって離れたところ(ポップアップメニューから整理されたSTARファイルを保存した)からさらに選択するためにいつでも戻ってくることができることに注意してください。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの整理されたファイルがあると、一致する粒子の抽出ができ、Particle extraction動作タイプで必要なすべてのメタデータを収集することができます。Particle extraction動作タイプのI/Oタブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine動作から_data.starファイルが使用できます。例えば、抽出で粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの編集にマニュアルが必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(入力顕微鏡写真のSTARファイルにCTF情報が含まれていないことが必要です。)<br />
<br />
extractタブで、実際の粒子抽出のための引数を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒の粒子の代わりに白にします。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロの平均値と標準偏差で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の与えられた直径の円の外のすべてのピクセルと決められています。負の値を明記するとき、粒子ボックスサイズの75%の初期値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(実際にデータを見る場合、白か黒の外れ値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは外れ値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。その結果、適切な粒子の初期分類での速度を上げるために処理の初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じ動作タイプを使用するので、manualpickのようなエイリアスを動作に与えると良いです。Helixタブは無視し、ひとつのMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/と呼ばれる新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。Display:ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてが順調である確認が速くなります。画面上で右クリックで例えば、すべての粒子を選択(Invert selection)、すべてのアラインメントされていない粒子の平均の計算(Show average of selection)を使用できます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、動作タイプ【2D classification】を使用します。<br />
【I/O】タブ上でExtract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
・Do CTF-correction? Yes<br />
ベイジアンフレームワークにおいて位相振幅補正を行います。<br />
・Have data been phase-flipped? No<br />
この選択はRELION外でデータを前処理した場合にのみ有効です。<br />
・Ignore CTFs until first peak? No<br />
振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジー分類されたりした場合にこのオプションが役立ちます。<br />
<br />
【Optimisation】タブの設定:<br />
・Number of classes: 10<br />
クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50個の粒子を使用します。<br />
・Number of iterations: 25<br />
これはほとんど変える必要はありません。<br />
・Regularisation parameter T: 2<br />
Tの定義にてついては[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3を、3次元分類ではT=3-4の値を使用してください。ネガティブ染色の場合、これよりも小さい値の方が良い場合もあります。一般的に平均値がばらついている場合は、一旦Tの値を減らしてください。もし、平均値が低解像度のままであった場合はTの値を増やしてください。あくまでもメインは高解像度のノイズの過剰適合に気付けるかどうかなのです。<br />
・Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、溶媒ノイズや粒子画像の隅にあるような隣接した粒子を除去するのに使われます。一方で、多くの目立った溶媒と隣接した粒子が列を乱すおそれがあるため、直径は小さく保ってください。また、クラス平均からのいくつかの信号を取り出したくないため、最大寸法よりも直径が大きいか確かめる可能性があります。<br />
・Mask individual particles with zeros? Yes<br />
・Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はアライメントに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にややこしいデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したジョブを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refineジョブを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
・Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
• Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
• Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
• Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
• Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
• Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classificationジョブを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (自動検出のためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 Getting organized(準備) ===<br />
<br />
3.2で説明したように、RELION経由で誘導電流で運動補正を実行しているため、既に全ての設定は終わっています。RELONでの作業以外で、モーション補正を行った場合は、最初にインポートした顕微鏡写真と同じディレクトリ内(このチュートリアルではMicrographs)に全ての動画を置く必要があります。このディレクトリ内で、以前選択した平均化された顕微鏡写真と同じrootnameで動画が呼び出されているかを確認してください。例えば、mic001.mrcのムービーはmic001_movie.mrcsとして呼び出されます。2D micrograph moviesオプションを選択してImportという機能を使って動画を取り込んでください。<br />
<br />
=== 9.2 Movie refinement(動画修正)===<br />
<br />
Movie refinementという機能は、動画フレームから粒子を抽出し、それらを3次元モデルに対応させます。<br />
<br />
【I/O】タブの設定:<br />
• Input movies STAR file:<br />
MotionCorr/job002/corrected micrograph movies.star<br />
<br />
• Rootname of movies files: movie<br />
これらの映画のファイル名は_movie.mrcsで終わるためです。<br />
<br />
• Continue 3D auto-refine from: <br />
Refine3D/after first class3d/run it020 optimiser.star<br />
3D auto-refineを実行後、含まれていた粒子のみ動画から抽出されます。これは、relion-1.4でのmovieparticle抽出とは大きく異なっています。<br />
• Process micrographs in batches of: -1<br />
relion-2.0には、大きな動画データセットを処理する際に計算が不安定になることがあることが分かっているため、顕微鏡動画をより小さなバッチで処理するオプションがあります。このテストデータセットには15個のムービーのみが含まれており、バッチ処理は不要であるため、-1の値が使用されます。大きなデータセットの場合、50-100のバッチで顕微鏡写真を処理することがよくあります。<br />
(データセット:コンピューターで処理されるデータのまとまり。一般的に属性によって分類されたり、ある目的で集められたりしたデータが記録されたファイル群)<br />
<br />
【extract】タブの設定:<br />
• First movie frame to extract: 1<br />
• Last movie frame to extract: 16<br />
• Average every so many frames: 1<br />
1より大きい値を使ってください。<br />
<br />
• Maximum number of MPI nodes: 8<br />
動作の最初に、動画粒子の抽出は<br />
したがって、動作のこの部分で多数のMPI processes使用するのは効率的ではないでしょうね。[Running]タブ上で、与えられたMPI processes数にかかわらず、ここでは与えられた数以より多くのProcessesを使うことはないでしょう。<br />
• Particle box suze (pix): 100<br />
以前使用したサイズと同じか確認してください。<br />
<br />
• Invert contrast? Yes <br />
以前と同じものを使用してください<br />
<br />
• Rescale particles? No<br />
以前と同じものを使用してください<br />
<br />
【normalise】タブの設定:<br />
• Normalize movie-particles? Yes<br />
• Diameter background circle (pix): 60<br />
以前と同じものを使用してください<br />
<br />
• Stddev for white dust removal: -1<br />
• Stddev for black dust removal: -1<br />
<br />
【refine】タブの設定:<br />
• Running average window: 7<br />
最適値は、粒子のサイズや線量率などによって決まります。基本的に、この粒子をどの程度正確に累積線量と累積線量との間で整列させることができるかということが主な問題となるでしょう。<br />
<br />
<br />
• Stddev on the translations (pix): 1<br />
これにより、動画フレームが平均位置からどれだけ遠くに移動できるかが制限されます。<br />
<br />
<br />
• Also include rotational searches? No<br />
回転を含めると計算上、コストがかかってしまいます。そして、粒子の研磨手順はビーム誘起回転を無視してしまいます。ビーム誘起回転(かつ、研磨段階をスキップ)を含む非常に大きなオブジェクトにのみ有用です。それでも、リボソームであっても、以下に概説する研磨手順が好ましいです。<br />
上で述べたように、この動作では最初に動画粒子を抽出し、3次元レファレンスとの配置合わせを行います。最初の段階では、制限されたMPI processesで実行されますが、2番目のパートは更に多くのMPI processesで実行する必要があります。これを[Runnning]タブ上で選択しないといけません。必要なメモリは、3次元自動レファレンスのときとほぼ同じです。したがって、スレッド数に応じて調整してください。おそらく、first3drefのようなエイリアスを再度使うことができるのではないでしょうか?<br />
この動作から出力された唯一のファイルは、全ての補正された動画粒子の動画フレーム粒子のSTARファイルとなります。MovieRefine / first3dref / run_avg7_off1_data.starという名前で呼び出されます。実行中の平均幅と変換のstddevの値が出力名に反映されるのは、これらのパラメータの値が異なる場合が多く、各設定に対してすべての動画粒子を再抽出しないようにするためです。 <br />
毎回、同じ動画抽出ステップを繰り返さないためにするためには、[Continue now]ボタンを使用して、同じ出力ディレクトリに対応するファイル名を持つ別のファイルを選択してください。<br />
<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-15T05:23:58Z
<p>Fisherman1: /* 2.1.3 The lower half: job-lists and stdout/stderr windows */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20_tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインジェネレータにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーは異なる動作で出力ファイルを紐づけなければならなかったため、RELION-1.4のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべての動作と、ある動作の出力を別の動作の入力としてどのように使用してパイプラインを形成するかを追跡します。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。動作の各タイプにはそれぞれ独自の出力ディレクトリがあり、これらの動作タイプのディレクトリ内(例えばClass2D)では、新しい動作は連続する番号(Class2D/job010)を取得します。これら個々の動作ディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々の動作ディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側に動作タイプ([2D classification]のような動作タイプの垂直リストの)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、異なる種類の動作へのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の[Run!]ボタンが[Schedule]と[Run now!]の2つの新しいボタンに置き換えられました。前者のものは新しく、将来の実行のために動作をスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作([Run now!]ボタン付き)が右側のパラメータパネルにロードされます。<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
GUIの下半分には、まだ実行中の動作([Running jobs])、すでに完了している動作([Finished jobs])、または後で実行するようにスケジュールされた動作([Scheduled jobs])のリストが含まれています。これらのリスト内の動作をクリックすると、その動作のパラメータがパラメータパネルにロードされ、[Run now!]ボタンの色が変わり、[continue now!]に変わります。<br />
<br />
==== 2.1.4 The Display button ====<br />
==== 2.1.5 The Job action button ====<br />
==== 2.1.6 Clean-up to save disk space ====<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
【Schedule】ボタンから、先の動作の準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他の動作への入力として利用できるため、スケジュールされた動作リストに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化された動作を実行できます。そのプログラムは何回スケジュール化された動作を実行するか問いてきます。1より大きい値を指定すると、すべてのスケジュール化された動作が繰り返し実行されます。もしこの動作を選択した場合、スケジュール化された動作の各リピート間で何分経過させるべきかという疑問が生じるでしょう。(もしスケジュール化された動作の実行が短い場合、このプログラムはスケジュール化された動作の次の動作を待機させます。)次の動作タイプは、以前の反復(インポート、モーション補正、CTF推定、自動ピッキング、粒子抽出、ムービーリファインメ)ではまだ完了していない顕微鏡写真のみを処理します。他の全ての動作タイプはスケジュール化された動作タイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、オンザフライ処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましくは、高速処理のための1つまたは複数の適切なGPUを搭載)にコピーするスクリプトをセットアップすることができます。(大きなファイルをコピーするのには時間がかかるため、顕微鏡写真と動画をインポートしたくなく、このスクリプトはファイルを一時的なファイル名としてコピーでき、それらが完全に終了したときにのみ、ファイルの最終的なファイル名に変更することができます)スケジュール化された動作リストの開始(例として【Micrograghs/*.mrcs】ファイルのインポート)はモーテョン推定、CTF推定、自動ピッキング。(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、粒子抽出、2Dクラス化によって実行される。このスケジュール化された動作リストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます長くなり、スケジュールされた動作(モーション補正、CTF推定、自動ピッキング、粒子抽出)の各反復は、その反復時の全ての粒子数をゼロから2Dクラス化している間に、新しい顕微鏡写真上でのみ実行する。電子顕微鏡でデータ補正中に2Dクラス化の査定は、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決定させるのに有益であるかもしず、またおそらく、より氷が厚いグリッド上で収集する必要があります。もし、既に3Dリファレンスが良ければ、オンザフライ上での【3Dクラス化】、【自動3D精製】を実行するかもしれません。これは、例えば、関係ある補因子がインタレスト複合体に結合しているかどうかを確認するのに有用であり得る。<br />
<br />
【subset selection】はスケジュール化されてますが、ユーザーは例えば最適なクラスを選択するための【2D classification】から _model.starを表示させるように入力するのを促されるのに注意して下さい。全てのスケジュール化された動作の実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリの処理のためのワークフローを実装しています。これには、自動ピッキング、粒子抽出、2D分類化、3D分類化、自動3D精製、粒子洗練、およびマスク作といった動作タイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーがRELION Wikiの関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities ===<br />
==== 2.5.1 Dealing with differently scaled particles ====<br />
RELION-1.4では、粒子をどれだけダウンスケーリングし(あるいはそうでないか)変更することを、STARファイル等を変更するためにawkスクリプトを付与させることで、いくつか備えていました。RELION-2.0ではとても簡単になされます。粒子抽出動作タイプは、手動ピッキング、自動ピッキングから座標を提供する代わりに、2Dクラス化、3Dクラス化、自動3D精製動作から _data.starを与える【re-extract refined particle】オプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際に、各入力粒子のスケールの違いを正しく考慮します。また入力_data.starファイルの洗練された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことは自動ピッキングでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上で【pixel size in references】で値を与えられる時に(もしくは【I/O】タブ上の【pixel size in micrographs】オプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
粒子の削除動作タイプは、RELION-2.0パイプライン内の部分的なシグナル減算の手順を形式化します。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
同じの動作タイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減産された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減産後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0でのパイプラインの公式化により、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルにアクセスできることが必要になってきました。これは、新しいjobtype join starファイルによって提供されます。4つ以上のファイルを結合する場合(完全に記述されたパイプラインを維持したい場合)は、GUIからこのユーティリティを複数回呼び出す必要があります。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度インポートすることもできます。<br />
<br />
=== 2.6 How this tutorial works ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をプロジェクトディレクトリにコピーすることができます。RELION-2.0の動作のパイプライン化された性質のため、これは非常に困難になります。したがって、完全に実行されたパイプラインは代わりにPrecalculatedResultsディレクトリに提供されます。ユーザーは自分のマシン上のbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用します。これは1日以内に実行する必要があります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONで異なるプログラムから摘出された分子を使用できますが、おすすめはしません。多くのプログラムが分子を変化させています。例えば、段階の切り替えや帯域通過やウィナーフィルターやマスクなどです。RELIONには後続の使用のための準最適があります。さらに、正しいフォーマットのRELIONタイプのSTARファイルの中の必要なメタデータの全ての収集はエラーになる傾向があります。RELIONでの粒子の再摘出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでのいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。他の人が書いたラッパーを役立てようとしましたが、全く制御できず、最終生成物が最良の方法としてRELIONを使用するかどうかわかりません。その結果、ラッパーで得られた結果を疑い深く注視した場合、このチュートリアルで説明している手順に従うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (組織化する)===<br />
プロジェクトごと、すなわち、測定したい構造ごとに一つのディレクトリを作ることをお勧めします。これをプロジェクトディレクトリと呼びます。重要なことはプロジェクトディレクトリからのrelionのグラフィカルユーザインタフェイス(GUI)は常に起動していることです。プロジェクトディレクトリの中では未加工の顕微鏡写真やMRC形式の顕微鏡写真動画すべてを保存するためにディレクトリを分けて作るべきです。すべての顕微鏡写真がひとつのディレクトリにある場合は、ディレクトリをMictographs/と呼びます。また、異なるディレクトリにある場合(例えば、顕微鏡写真を異なるデータから収集した時)は例えば、Micrographs/15jan16/やMicrographs/23jan16/などと呼びます。もし何らかの理由でRELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。もし単一像顕微鏡写真の代わりに動画を集めたのであれば、それらのディレクトリを使用できます。もし異なるプログラムで動画の平均を計算する場合、また顕微鏡写真と動画の平均を両方とも使用したい場合、動画は顕微鏡写真の平均と一致するようなルートネームと同じように名付けられるべきである。つまり、”_”の文字、”movie rootname”、.mrcs拡張子です。例えば、顕微鏡写真の平均がmic001.mrcと呼ばれ、mic001_movie.mrcsと呼ばれる動画と一致する場合です(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、プロジェクトディレクトリ(betagal/)と、記録されたすべての顕微鏡写真の動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。プロジェクトディレクトリに行き、以下の入力をすると、どのくらい顕微鏡写真の動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONのGUIを起動することによって始めます。前述の通り、このGUIは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、GUIは新しいディレクトリを初めて起動したときに確認を要求します。その結果、新しいディレクトリでGUIを初めて起動したとき、バックグラウンドで起動するために”&”の文字を使うべきではありません。プロジェクトディレクトリ内で確かめ、以下の入力でGUIを起動します。<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中に記録された顕微鏡写真の動画の設定の取り込みを行います。動作タイプのブラウザから”Import”を選択し、引数を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereと名付けられた白い欄に意味のあるエイリアスを規定することができます。Run now!のボタンをクリックすると動作が起動します。Import/job001/と呼ばれるディレクトリが作成され、一緒にImport/moviesと呼ばれるシンボリックリンクのディレクトリも作成されます。note.txtファイルのテキストエディターには実際の実行コマンドと、コメントを記入できるところ、閉じるものが含まれます。STARファイルとすべての動画が新しく作成されたディレクトリの中に作成されます。見るには以下を使います。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし異なるソフトウェアで粒子を摘出した場合、もしくは、RELION-1.4で摘出した粒子をRELION-2.0に移動させたい場合は、後述の前処理段階を行う代わりに、STARファイルや3D references,3D masksなどを取り込むために”Import”動作タイプを使用します。<br />
<br />
=== 3.2 Beam-induced motion correction(誘導線運動補正)===<br />
Motion correction動作タイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORRラッパーを規定します。I/Oタブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(BrowseボタンはSTARファイルの動画リストのみです。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(16フレームの動画があり、すべてのフレームで平均化します。)<br />
<br />
Motioncorrタブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数は$RELION_MOTIONCORR_EXECUTABLEを使うと、初期値から調節できます。)<br />
● Binning factor (1 or 2): 1<br />
(超解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、Unblurタブで利用できるNiko Grigorieff’s UNBLURプログラムも使用できます。すべてのMOTIONCORR設定は無視され、向上したオプションなしで初期値でUNBLURのみが実行できます。UNBLUR version 1.0.2でテストされています。Display:ボタンの後のrunボタンからout:logfile.pdfを選択することで誘導線変化の推定を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の合計を見ることができます。スクリーンサイズに左右されるため、顕微鏡写真(Scale:0.3)はおそらく縮小し、Sigma contrast:3を使い、見やすいコラム(Number of columns: 3くらい)にするべきです。ディスプレイから顕微鏡写真は選択できないことに注意してください。もしこの時に顕微鏡写真を排除したい場合(すべて良いのでしません)、Subset selection動作タイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正された顕微鏡写真からCTF引数を推定します。目的のスピードのためKai Zhang’s GCTFラッパーとしてCTF estimation動作タイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3かAlexis Rohou’s CTFFIND4が使えることに留意してください(この場合、初期値はCTFFINDタブが良いでしょう)。CTFFIND4はThon ringsよりも計算が速い顕微鏡写真の動画を使用でき、位相版から位相シフトを推定できます(Voltatype?)。I/Oタブで、MotionCorr動作のcorrected_micrographs.starファイルを選択するためにBrowseボタンを使います。他のタブは以下のように入力します。<br />
<br />
Microscopyタブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(振幅対比はほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果がよくなると示されています。この方法は低周波数の適応性のない散財がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2xのデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムを以下から選択することができます。Niko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFです。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
CTFFINDタブで、CTFFINDの一般的な引数を規定します(正しい手段でNiko’sドキュメンテーションを見る)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様にGctfタブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、二重引用符の間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
追加引数はCTFFIND-4.1以降を使用している場合は必要ありませんが、新しいバージョンでCTFFIND4タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは中央を正方形で設定したサイズで切り取り、切り取られた画像のみでCTFを推定します。これはサイズで分類されたスキャンされたフィルムで役に立ちます。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、CTFFIND4とGctfタブは無視してください。プログラムはマシン上で複数のMPI処理を使って実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。動作が終わると、出力のCtfFind/job003/Micrographsディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、Disply:ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロはモデルと一致させるべきです。デフォーカス、最大解像度、性能指数などの順番の表示は並び替えできます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に適合していない場合、それらの顕微鏡写真の.logファイルを削除でき、Finished jobsリストからCtfFind/job003項目を選択し、parameter-panelの引数を修正し、Continue nowボタンをクリックすると動作を再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分になるまで実行できます。もし可能ではない、または、十分でないThon-ringがなく、顕微鏡写真を削除すると決めた場合、Subset selection動作タイプを使用できます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking動作タイプでは(平均化された)顕微鏡写真をまとめた粒子を手入力で選択したものを使用します。詳しいデータを得るために少なくともいくつかの顕微鏡写真を手動で選択します。すべてのデータセットの自動粒子検出のためにテンプレートとして使用される教師無2Dクラス平均を計算するために手動で選択された粒子を使用します。<br />
<br />
手動粒子検出は個人の経験です!RELIONで粒子の検出をしたくないのであれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)のファイルフォーマットの整理のサポートもします。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめたファイルが同じ顕微鏡写真のルートネーム、ただし、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starです。Import動作タイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking動作タイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBroseボタンを使用し、Colorsタブは無視し、Displayタブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(画面サイズ次第です。)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒は標準偏差3より低く、白は標準偏差3より高くします。グレースケールではいつも黒から白に直線になっています。詳細はDisplayImages entry on the RELION wikiを見てください。)<br />
● White value: 0<br />
(値を白に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(値を黒に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(顕微鏡写真の多くのノイズの中の粒子を見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の明暗のグラデーションを取り除くのにたまに役立ちます。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径、ローパスフィルター、ハイパスフィルターの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に顕微鏡写真でCTFボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
Run now!ボタンをクリックすることで動作が実行され、顕微鏡写真のおよそ1000の粒子の総数が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックで整理したものの保存で必要なポップアップメニューがでます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって離れたところ(ポップアップメニューから整理されたSTARファイルを保存した)からさらに選択するためにいつでも戻ってくることができることに注意してください。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの整理されたファイルがあると、一致する粒子の抽出ができ、Particle extraction動作タイプで必要なすべてのメタデータを収集することができます。Particle extraction動作タイプのI/Oタブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine動作から_data.starファイルが使用できます。例えば、抽出で粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの編集にマニュアルが必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(入力顕微鏡写真のSTARファイルにCTF情報が含まれていないことが必要です。)<br />
<br />
extractタブで、実際の粒子抽出のための引数を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒の粒子の代わりに白にします。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロの平均値と標準偏差で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の与えられた直径の円の外のすべてのピクセルと決められています。負の値を明記するとき、粒子ボックスサイズの75%の初期値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(実際にデータを見る場合、白か黒の外れ値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは外れ値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。その結果、適切な粒子の初期分類での速度を上げるために処理の初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じ動作タイプを使用するので、manualpickのようなエイリアスを動作に与えると良いです。Helixタブは無視し、ひとつのMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/と呼ばれる新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。Display:ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてが順調である確認が速くなります。画面上で右クリックで例えば、すべての粒子を選択(Invert selection)、すべてのアラインメントされていない粒子の平均の計算(Show average of selection)を使用できます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、動作タイプ【2D classification】を使用します。<br />
【I/O】タブ上でExtract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
・Do CTF-correction? Yes<br />
ベイジアンフレームワークにおいて位相振幅補正を行います。<br />
・Have data been phase-flipped? No<br />
この選択はRELION外でデータを前処理した場合にのみ有効です。<br />
・Ignore CTFs until first peak? No<br />
振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジー分類されたりした場合にこのオプションが役立ちます。<br />
<br />
【Optimisation】タブの設定:<br />
・Number of classes: 10<br />
クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50個の粒子を使用します。<br />
・Number of iterations: 25<br />
これはほとんど変える必要はありません。<br />
・Regularisation parameter T: 2<br />
Tの定義にてついては[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3を、3次元分類ではT=3-4の値を使用してください。ネガティブ染色の場合、これよりも小さい値の方が良い場合もあります。一般的に平均値がばらついている場合は、一旦Tの値を減らしてください。もし、平均値が低解像度のままであった場合はTの値を増やしてください。あくまでもメインは高解像度のノイズの過剰適合に気付けるかどうかなのです。<br />
・Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、溶媒ノイズや粒子画像の隅にあるような隣接した粒子を除去するのに使われます。一方で、多くの目立った溶媒と隣接した粒子が列を乱すおそれがあるため、直径は小さく保ってください。また、クラス平均からのいくつかの信号を取り出したくないため、最大寸法よりも直径が大きいか確かめる可能性があります。<br />
・Mask individual particles with zeros? Yes<br />
・Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はアライメントに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にややこしいデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したジョブを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refineジョブを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
・Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
• Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
• Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
• Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
• Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
• Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classificationジョブを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (オートピッキングのためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これはRELION-2.0での新しいオプションです:これは2次元クラス平均化の自動センタリングを許可します。画像のセンタリングは質量の中心を基準にしており、中心は画像の白い部分を用いて計算されます。2次元クラス分類中はクラス平均はセンタリングされておらず、テンプレートのセンタリングが必要になるので、再センタリングがしばしば必要になります。<br />
<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
<br />
<br />
===3.7 Selecting templates for auto-picking(自動検出のためのテンプレート選択)===<br />
<br />
relion-1.4と違って、RELON-2.0では[Display]ボタンでは適切なクラスを選択することはできません。これは、サブセット選択ジョブタイプで行われます。[Browse]ボタン上のコマンドラインでSelect classes from model.starと入力し、【I/O】タブ上で、Class2D / manualpick / run_it025_model.starファイルを選択してください。<br />
<br />
【Class options】タブで以下の通りに設定を行ってください。<br />
• Re-center the class averages? Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
<br />
• Regroup the particles? No<br />
それぞれの顕微鏡写真に写っていた粒子が非常に少ない場合は、スペクトルノイズ量とスケールファクターが不安定になることがあり、これはそのときに役立つ設定である。デフォルトによって、後者は顕微鏡写真ごとに計算されます。この設定では、複数の顕微鏡写真から得られた粒子をグループ化し、計算することが可能です。RELIONは分類や、自動生成を行う際にグループが小さすぎると警告をします。<br />
<br />
<br />
Templates4autopickのようなエイリアスはいいアイデアですね。rlnClassDistributionに基づいてクラス平均を再度求めたとします。見た目が違う粒子の4-6のクラス平均を選択してください。似ている見た目の粒子を繰り返し選んだり、悪いクラス平均を含めたりはしないでください。クラス平均上で左クリックして選択してください。右クリックし、ダイアログメニューからSave selected classesオプションを使って、選択したクラス平均を保存することができます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
<br />
===前書き===<br />
十分に均質なサブセットひとつ選択すると、十分に自動化された高解像度のサブセットを精製するためにRELIONの3D auto-refine手順を使用できます。この手順は解像度を評価するためにFourier Shell Correlation(FSC)計算と言われる判断基準を用います。これにより、自己増強の過剰適合を避けることができます。角度の割り当ての精度を評価するためのノベル手順の混合は、精製が収束した時に自動的に決定されます。その結果、この手順は使用者の入力をほとんど必要としません。すなわち、多くのデータセットによる良いマップの産生のために観察される対象が残ったままです。もう一つの長所は一般的にこの手順は一回の実行のみが必要であり、最適化のための引数はほとんどありません。<br />
<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 ===<br />
=== 9.2 ===<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-15T05:05:36Z
<p>Fisherman1: /* 2.1 The GUI */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20-tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインジェネレータにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーは異なる動作で出力ファイルを紐づけなければならなかったため、RELION-1.4のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべての動作と、ある動作の出力を別の動作の入力としてどのように使用してパイプラインを形成するかを追跡します。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。動作の各タイプにはそれぞれ独自の出力ディレクトリがあり、これらの動作タイプのディレクトリ内(例えばClass2D)では、新しい動作は連続する番号(Class2D/job010)を取得します。これら個々の動作ディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々の動作ディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側に動作タイプ([2D classification]のような動作タイプの垂直リストの)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、異なる種類の動作へのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の[Run!]ボタンが[Schedule]と[Run now!]の2つの新しいボタンに置き換えられました。前者のものは新しく、将来の実行のために動作をスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作([Run now!]ボタン付き)が右側のパラメータパネルにロードされます。<br />
==== 2.1.3 The lower half: job-lists and stdout/stderr windows ====<br />
==== 2.1.4 The Display button ====<br />
==== 2.1.5 The Job action button ====<br />
==== 2.1.6 Clean-up to save disk space ====<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
【Schedule】ボタンから、先の動作の準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他の動作への入力として利用できるため、スケジュールされた動作リストに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化された動作を実行できます。そのプログラムは何回スケジュール化された動作を実行するか問いてきます。1より大きい値を指定すると、すべてのスケジュール化された動作が繰り返し実行されます。もしこの動作を選択した場合、スケジュール化された動作の各リピート間で何分経過させるべきかという疑問が生じるでしょう。(もしスケジュール化された動作の実行が短い場合、このプログラムはスケジュール化された動作の次の動作を待機させます。)次の動作タイプは、以前の反復(インポート、モーション補正、CTF推定、自動ピッキング、粒子抽出、ムービーリファインメ)ではまだ完了していない顕微鏡写真のみを処理します。他の全ての動作タイプはスケジュール化された動作タイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、オンザフライ処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましくは、高速処理のための1つまたは複数の適切なGPUを搭載)にコピーするスクリプトをセットアップすることができます。(大きなファイルをコピーするのには時間がかかるため、顕微鏡写真と動画をインポートしたくなく、このスクリプトはファイルを一時的なファイル名としてコピーでき、それらが完全に終了したときにのみ、ファイルの最終的なファイル名に変更することができます)スケジュール化された動作リストの開始(例として【Micrograghs/*.mrcs】ファイルのインポート)はモーテョン推定、CTF推定、自動ピッキング。(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、粒子抽出、2Dクラス化によって実行される。このスケジュール化された動作リストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます長くなり、スケジュールされた動作(モーション補正、CTF推定、自動ピッキング、粒子抽出)の各反復は、その反復時の全ての粒子数をゼロから2Dクラス化している間に、新しい顕微鏡写真上でのみ実行する。電子顕微鏡でデータ補正中に2Dクラス化の査定は、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決定させるのに有益であるかもしず、またおそらく、より氷が厚いグリッド上で収集する必要があります。もし、既に3Dリファレンスが良ければ、オンザフライ上での【3Dクラス化】、【自動3D精製】を実行するかもしれません。これは、例えば、関係ある補因子がインタレスト複合体に結合しているかどうかを確認するのに有用であり得る。<br />
<br />
【subset selection】はスケジュール化されてますが、ユーザーは例えば最適なクラスを選択するための【2D classification】から _model.starを表示させるように入力するのを促されるのに注意して下さい。全てのスケジュール化された動作の実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリの処理のためのワークフローを実装しています。これには、自動ピッキング、粒子抽出、2D分類化、3D分類化、自動3D精製、粒子洗練、およびマスク作といった動作タイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーがRELION Wikiの関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities ===<br />
==== 2.5.1 Dealing with differently scaled particles ====<br />
RELION-1.4では、粒子をどれだけダウンスケーリングし(あるいはそうでないか)変更することを、STARファイル等を変更するためにawkスクリプトを付与させることで、いくつか備えていました。RELION-2.0ではとても簡単になされます。粒子抽出動作タイプは、手動ピッキング、自動ピッキングから座標を提供する代わりに、2Dクラス化、3Dクラス化、自動3D精製動作から _data.starを与える【re-extract refined particle】オプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際に、各入力粒子のスケールの違いを正しく考慮します。また入力_data.starファイルの洗練された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことは自動ピッキングでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上で【pixel size in references】で値を与えられる時に(もしくは【I/O】タブ上の【pixel size in micrographs】オプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
粒子の削除動作タイプは、RELION-2.0パイプライン内の部分的なシグナル減算の手順を形式化します。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
同じの動作タイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減産された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減産後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0でのパイプラインの公式化により、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルにアクセスできることが必要になってきました。これは、新しいjobtype join starファイルによって提供されます。4つ以上のファイルを結合する場合(完全に記述されたパイプラインを維持したい場合)は、GUIからこのユーティリティを複数回呼び出す必要があります。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度インポートすることもできます。<br />
<br />
=== 2.6 How this tutorial works ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をプロジェクトディレクトリにコピーすることができます。RELION-2.0の動作のパイプライン化された性質のため、これは非常に困難になります。したがって、完全に実行されたパイプラインは代わりにPrecalculatedResultsディレクトリに提供されます。ユーザーは自分のマシン上のbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用します。これは1日以内に実行する必要があります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
===前書き===<br />
原理上はRELIONで異なるプログラムから摘出された分子を使用できますが、おすすめはしません。多くのプログラムが分子を変化させています。例えば、段階の切り替えや帯域通過やウィナーフィルターやマスクなどです。RELIONには後続の使用のための準最適があります。さらに、正しいフォーマットのRELIONタイプのSTARファイルの中の必要なメタデータの全ての収集はエラーになる傾向があります。RELIONでの粒子の再摘出は単純でとても速いため、後述の手順はRELIONでとても速い(良い)方法です。<br />
<br />
また、RELIONでのいくつかのラッパーの実装が報告されています(例えば、EMAN2、SCIPION、APPION)。他の人が書いたラッパーを役立てようとしましたが、全く制御できず、最終生成物が最良の方法としてRELIONを使用するかどうかわかりません。その結果、ラッパーで得られた結果を疑い深く注視した場合、このチュートリアルで説明している手順に従うことをお勧めします。<br />
<br />
=== 3.1 Getting organised (組織化する)===<br />
プロジェクトごと、すなわち、測定したい構造ごとに一つのディレクトリを作ることをお勧めします。これをプロジェクトディレクトリと呼びます。重要なことはプロジェクトディレクトリからのrelionのグラフィカルユーザインタフェイス(GUI)は常に起動していることです。プロジェクトディレクトリの中では未加工の顕微鏡写真やMRC形式の顕微鏡写真動画すべてを保存するためにディレクトリを分けて作るべきです。すべての顕微鏡写真がひとつのディレクトリにある場合は、ディレクトリをMictographs/と呼びます。また、異なるディレクトリにある場合(例えば、顕微鏡写真を異なるデータから収集した時)は例えば、Micrographs/15jan16/やMicrographs/23jan16/などと呼びます。もし何らかの理由でRELIONのプロジェクトディレクトリの中に顕微鏡写真を入れたくない場合は、プロジェクトディレクトリの中に顕微鏡写真が保存されているディレクトリとのシンボリックリンクを作成してください。<br />
<br />
単一像の顕微鏡写真には.mrc拡張子を、動画には.mrcs拡張子をつけてください。もし単一像顕微鏡写真の代わりに動画を集めたのであれば、それらのディレクトリを使用できます。もし異なるプログラムで動画の平均を計算する場合、また顕微鏡写真と動画の平均を両方とも使用したい場合、動画は顕微鏡写真の平均と一致するようなルートネームと同じように名付けられるべきである。つまり、”_”の文字、”movie rootname”、.mrcs拡張子です。例えば、顕微鏡写真の平均がmic001.mrcと呼ばれ、mic001_movie.mrcsと呼ばれる動画と一致する場合です(動画のルートネームはmovie)。<br />
<br />
チュートリアルのテストデータを解凍した時、プロジェクトディレクトリ(betagal/)と、記録されたすべての顕微鏡写真の動画と一致するbetagal/Micrographsディレクトリはすでに作成されています。プロジェクトディレクトリに行き、以下の入力をすると、どのくらい顕微鏡写真の動画があるか分かります。<br />
<br />
cd relion20_tutorial/betagal<br />
ls Micrographs/<br />
<br />
RELIONのGUIを起動することによって始めます。前述の通り、このGUIは常にプロジェクトディレクトリからの起動が必要です。エラーを防ぐために、GUIは新しいディレクトリを初めて起動したときに確認を要求します。その結果、新しいディレクトリでGUIを初めて起動したとき、バックグラウンドで起動するために”&”の文字を使うべきではありません。プロジェクトディレクトリ内で確かめ、以下の入力でGUIを起動します。<br />
relion<br />
<br />
ここで、新しいRELIONプロジェクトを作動するために”y”と答えます。<br />
<br />
最初にパイプラインの中に記録された顕微鏡写真の動画の設定の取り込みを行います。動作タイプのブラウザから”Import”を選択し、引数を以下のように入力します。<br />
<br />
Input files: Micrographs/*.mrcs<br />
Node type: 2D micrograph movies<br />
<br />
Currrent job: Give_alias_hereと名付けられた白い欄に意味のあるエイリアスを規定することができます。Run now!のボタンをクリックすると動作が起動します。Import/job001/と呼ばれるディレクトリが作成され、一緒にImport/moviesと呼ばれるシンボリックリンクのディレクトリも作成されます。note.txtファイルのテキストエディターには実際の実行コマンドと、コメントを記入できるところ、閉じるものが含まれます。STARファイルとすべての動画が新しく作成されたディレクトリの中に作成されます。見るには以下を使います。<br />
<br />
less Import/job001/movies.star<br />
<br />
もし異なるソフトウェアで粒子を摘出した場合、もしくは、RELION-1.4で摘出した粒子をRELION-2.0に移動させたい場合は、後述の前処理段階を行う代わりに、STARファイルや3D references,3D masksなどを取り込むために”Import”動作タイプを使用します。<br />
<br />
=== 3.2 Beam-induced motion correction(誘導線運動補正)===<br />
Motion correction動作タイプは便利な全体フレーム動画の調節にためのUCSF MOTIONCORRラッパーを規定します。I/Oタブで以下の設定をします。<br />
<br />
● Input movies STAR file: Import movies/movies.star<br />
(BrowseボタンはSTARファイルの動画リストのみです。)<br />
● Save aligned movie stacks? Yes<br />
● First frame for corrected sum: 1<br />
● Last frame for corrected sum: 16<br />
(16フレームの動画があり、すべてのフレームで平均化します。)<br />
<br />
Motioncorrタブは以下のように入力します。<br />
● MOTIONCORR executable: /wherever/it/is/motioncorr<br />
(環境変数は$RELION_MOTIONCORR_EXECUTABLEを使うと、初期値から調節できます。)<br />
● Binning factor (1 or 2): 1<br />
(超解像度動画では大抵、2を使用します。)<br />
● First frame for alignment: 1<br />
● Last frame for alignment:16<br />
● Bfactor: 150<br />
(超解像度動画では大きな値を使用します。)<br />
● Which GPUs to use:<br />
(NVIDIA GPUでの実行にはMOTIONCORRが必要です。)<br />
● Other MOTIONCORR armuments:<br />
<br />
このプログラムの実行にはおよそ1,2分かかります(しかし、この動作にはNVIDIA GPUが必要です)。あるいは、Unblurタブで利用できるNiko Grigorieff’s UNBLURプログラムも使用できます。すべてのMOTIONCORR設定は無視され、向上したオプションなしで初期値でUNBLURのみが実行できます。UNBLUR version 1.0.2でテストされています。Display:ボタンの後のrunボタンからout:logfile.pdfを選択することで誘導線変化の推定を見ることができます。または、out:corrected_micrographs.starを選択することで顕微鏡写真の合計を見ることができます。スクリーンサイズに左右されるため、顕微鏡写真(Scale:0.3)はおそらく縮小し、Sigma contrast:3を使い、見やすいコラム(Number of columns: 3くらい)にするべきです。ディスプレイから顕微鏡写真は選択できないことに注意してください。もしこの時に顕微鏡写真を排除したい場合(すべて良いのでしません)、Subset selection動作タイプが使用できます。<br />
<br />
=== 3.3 CTF estimation(CTF推定)===<br />
次に、補正された顕微鏡写真からCTF引数を推定します。目的のスピードのためKai Zhang’s GCTFラッパーとしてCTF estimation動作タイプにします。適切なGPUがない場合、Niko Grigorieff’s CTFFIND3かAlexis Rohou’s CTFFIND4が使えることに留意してください(この場合、初期値はCTFFINDタブが良いでしょう)。CTFFIND4はThon ringsよりも計算が速い顕微鏡写真の動画を使用でき、位相版から位相シフトを推定できます(Voltatype?)。I/Oタブで、MotionCorr動作のcorrected_micrographs.starファイルを選択するためにBrowseボタンを使います。他のタブは以下のように入力します。<br />
<br />
Microscopyタブでは実験の状況を設定します。<br />
● Sperical aberration(mm): 2<br />
(顕微鏡メーカーがこの値を規定します。)<br />
● Voltage(kV):300<br />
● Amplitude contrast:0.1<br />
(振幅対比はほとんどないことが知られていますが、10%ほどの値を与えることで、多くの構造の結果がよくなると示されています。この方法は低周波数の適応性のない散財がモデル化されていないためです。)<br />
● Magnified pixel size(A): 3.54<br />
(2xのデータがあり、もとのピクセルサイズは1.77Aです。)<br />
<br />
CTF推定に使用するプログラムを以下から選択することができます。Niko Grigorieff’s CTFFIND3、Alexis Rohou’s CTFFIND4、Kai Zhang’s GCTFです。例として、CTFFIND-4.0.8を使用したものを以下に示します。<br />
<br />
CTFFINDタブで、CTFFINDの一般的な引数を規定します(正しい手段でNiko’sドキュメンテーションを見る)。<br />
<br />
● CTFFIND executable: /wherever/is/your/ctffind.exe<br />
環境変数は$RELION_CTFFIND_EXECUTABLEを使うと、初期値から調節でき、同様にGctfタブでGCTF実行ファイルの初期値は$RELION_GCTF_EXECUTABLEで調節できます。CTFFIND-4.0.xを使っている場合、二重引用符の間の実行ファイルが実行され、以下の追加の引数を規定します。<br />
“/path/to/ctffind.exe –omp-num-threads 1 –old-school-input”<br />
追加引数はCTFFIND-4.1以降を使用している場合は必要ありませんが、新しいバージョンでCTFFIND4タブを使用する場合は表示が必要です。<br />
● FFT box size(pix): 512<br />
● Minimun resolution(A): 30<br />
● Maximun resokution(A): 7.1<br />
● Minimun defocus cvalue(A): 5000<br />
● Maximun defocus cvalue(A): 50000<br />
● Defocus step size(A): 500<br />
● Amount of astigmatism(A): 100<br />
● Estimate CTF on window size(pix): -1<br />
正の値を設定した場合、プログラムは中央を正方形で設定したサイズで切り取り、切り取られた画像のみでCTFを推定します。これはサイズで分類されたスキャンされたフィルムで役に立ちます。<br />
<br />
CTFFIND3かCTFFIND-4.0.xを使うとき、CTFFIND4とGctfタブは無視してください。プログラムはマシン上で複数のMPI処理を使って実行できます。5つのMPI処理を使うと、CTFFIND-4.0.8を使うと動作は5分程度かかります(CTFFIND-4.1では一つの処理に2分半かかり、GCTFを使うと数秒かかります)。動作が終わると、出力のCtfFind/job003/Micrographsディレクトリの中にそれぞれの顕微鏡写真ごとに追加ファイルができます。.ctfファイルは算出されたパワースペクトルと適合したCTFモデルのMRCフォーマットの画像を含んでいます。.logファイルはCTFFINDかGCTFからの出力を含んでいます(CTFFIND3、4を使用した場合のみ、.comファイルはCTFFINDを起動するために使用したスクリプトを含んでいます)。<br />
<br />
out: micrographs_ctf.starを選択し、Disply:ボタンを使ってすべてのThon-ring画像を可視化できます。実験画像のThon-ring間のゼロはモデルと一致させるべきです。デフォーカス、最大解像度、性能指数などの順番の表示は並び替えできます。<br />
<br />
もしCTFモデルが実験のThon-ringに十分に適合していない場合、それらの顕微鏡写真の.logファイルを削除でき、Finished jobsリストからCtfFind/job003項目を選択し、parameter-panelの引数を修正し、Continue nowボタンをクリックすると動作を再実行します。存在しない.logファイルの顕微鏡写真のみが再処理されます。すべてのCTFモデルが十分になるまで実行できます。もし可能ではない、または、十分でないThon-ringがなく、顕微鏡写真を削除すると決めた場合、Subset selection動作タイプを使用できます。<br />
<br />
=== 3.4 Manual particle picking(粒子検出マニュアル)===<br />
次のManual picking動作タイプでは(平均化された)顕微鏡写真をまとめた粒子を手入力で選択したものを使用します。詳しいデータを得るために少なくともいくつかの顕微鏡写真を手動で選択します。すべてのデータセットの自動粒子検出のためにテンプレートとして使用される教師無2Dクラス平均を計算するために手動で選択された粒子を使用します。<br />
<br />
手動粒子検出は個人の経験です!RELIONで粒子の検出をしたくないのであれば、Jude Short’s XIMDISP(拡張子なし)、XMIPP-2.4(拡張子なし)、Steven Ludtke’s E2BOXER.PY(拡張子.box)のファイルフォーマットの整理のサポートもします。もしこれらを使う場合、顕微鏡写真(動画)を取り込んだディレクトリと同じディレクトリにテキストファイルとしてまとめたファイルが同じ顕微鏡写真のルートネーム、ただし、異なる(suffix+)拡張子で保存されていることを確認してください。例えば、顕微鏡写真がMicrographs/006.mrcの時、Micrographs/006.boxやMicrographs/006_pick.starです。Import動作タイプを使用し、Node type:を2D/3D particle coordinatesに設定してください。Imput Files:の欄に整理されたファイルの拡張子に従ってlinux wildcardが含まれていることを確認してください。上記の例であれば、それぞれMicrographs/*.boxやMicrographs/*_pick.starになります。<br />
<br />
Manual picking動作タイプのI/OタブではCtfFind/job003に作成されたmicrographs_ctf.starファイルを選択するためにBroseボタンを使用し、Colorsタブは無視し、Displayタブでは以下のように入力します。<br />
● Particle diameter(A): 200<br />
(これは単に顕微鏡写真に表示された円の直径を調節します。)<br />
● Scale for micrographs: 0.5<br />
(画面サイズ次第です。)<br />
● Sigma contrast: 3<br />
(顕微鏡写真はほとんど最適な”sigma-contrast”で表示されています。すなわち、黒は標準偏差3より低く、白は標準偏差3より高くします。グレースケールではいつも黒から白に直線になっています。詳細はDisplayImages entry on the RELION wikiを見てください。)<br />
● White value: 0<br />
(値を白に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Black value: 0<br />
(値を黒に手動で設定するために使います。この動作ではSigma contrastは0に設定されます。)<br />
● Lowpass filter(A): 20<br />
(顕微鏡写真の多くのノイズの中の粒子を見やすくする動作です。)<br />
● Highpass filter(A): 0<br />
(全部の顕微鏡写真の明暗のグラデーションを取り除くのにたまに役立ちます。)<br />
● Pixel size: 3.54<br />
(これは粒子の直径、ローパスフィルター、ハイパスフィルターの計算に必要です。)<br />
● Scale for CTF image: 1<br />
(これは単に顕微鏡写真でCTFボタンをクリックした時にThon-ring画像がどのくらい大きくなるかを調節します。)<br />
<br />
Run now!ボタンをクリックすることで動作が実行され、顕微鏡写真のおよそ1000の粒子の総数が選択されます。左クリックで選択、中クリックで選択された粒子の削除、右クリックで整理したものの保存で必要なポップアップメニューがでます。Continue nowボタンをクリックし、Finished jobsからManualPick/job004を選択することによって離れたところ(ポップアップメニューから整理されたSTARファイルを保存した)からさらに選択するためにいつでも戻ってくることができることに注意してください。<br />
<br />
=== 3.5 Particle extraction(粒子の抽出)===<br />
選択したい粒子の顕微鏡写真ごとの整理されたファイルがあると、一致する粒子の抽出ができ、Particle extraction動作タイプで必要なすべてのメタデータを収集することができます。Particle extraction動作タイプのI/Oタブで以下の設定をします。<br />
● Micrograph STAR file: CtfFind/job003/micrographs_ctf.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● Coordinate-file suffix: ManulPick/job004/coords_suffix_manualpick.star<br />
(ファイルの選択にBroseボタンを使用します。)<br />
● OR re-extract refined particles? No<br />
(これはRELION-2.0の新しいオプションです。STARファイルの粒子のみを再抽出するために2D classification、3D classification、3D auto-refine動作から_data.starファイルが使用できます。例えば、抽出で粒子を前もって縮小した場合、初めの分類後はもとの大きさの粒子で精製を実行したいときに役に立ちます。RELION-1.4では面倒で、STARファイルの編集にマニュアルが必要でした。RELION-2.0ではすべてがこのオプションで自動でできます。)<br />
● Manually set pixel size? No<br />
(入力顕微鏡写真のSTARファイルにCTF情報が含まれていないことが必要です。)<br />
<br />
extractタブで、実際の粒子抽出のための引数を以下のように設定します。<br />
● Particle box size (pix): 100<br />
(これは常に偶数にすべきです!)<br />
● Invert contrast? Yes<br />
(これは黒の粒子の代わりに白にします。)<br />
● Normalize particles? Yes<br />
(常に標準化します。)<br />
● Diameter background circle(pix): 60<br />
(粒子はバックグラウンド領域のすべてのピクセルでのゼロの平均値と標準偏差で標準化されます。バックグラウンド領域はピクセル中(縮尺変更前)の与えられた直径の円の外のすべてのピクセルと決められています。負の値を明記するとき、粒子ボックスサイズの75%の初期値が使用されます。)<br />
● Stddev for white dust removal: -1<br />
● Stddev for black dust removal: -1<br />
(実際にデータを見る場合、白か黒の外れ値のピクセルのみ除去されます。この場合、stdevの値は5程度を使います。このデータセットでは外れ値のピクセルはありませんので、補正せずに、初期値の-1のままです。(すなわち、何もしません))<br />
● Rescale particles? No<br />
(縮小した粒子は計算速度が速くなります。その結果、適切な粒子の初期分類での速度を上げるために処理の初期段階ではよく粒子を縮小します。再構築はナイキスト周波数に近づくと、縮小せずに粒子を再抽出します。上記のように、RELION-1.4よりもRELION-2.0がとても速いです。)<br />
<br />
全ての自動検出された粒子を抽出するために後にも使用するものと同じ動作タイプを使用するので、manualpickのようなエイリアスを動作に与えると良いです。Helixタブは無視し、ひとつのMPI処理を使い、実行してください。<br />
<br />
粒子はExtract/job005/Micrographs/と呼ばれる新しいディレクトリの中のMRCスタック(RELIONではいつも.mrcs拡張子をもつ)の中に抽出されます。Display:ボタンからout: particles.starに抽出された粒子が可視化することによって、すべてが順調である確認が速くなります。画面上で右クリックで例えば、すべての粒子を選択(Invert selection)、すべてのアラインメントされていない粒子の平均の計算(Show average of selection)を使用できます。<br />
<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、動作タイプ【2D classification】を使用します。<br />
【I/O】タブ上でExtract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
・Do CTF-correction? Yes<br />
ベイジアンフレームワークにおいて位相振幅補正を行います。<br />
・Have data been phase-flipped? No<br />
この選択はRELION外でデータを前処理した場合にのみ有効です。<br />
・Ignore CTFs until first peak? No<br />
振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジー分類されたりした場合にこのオプションが役立ちます。<br />
<br />
【Optimisation】タブの設定:<br />
・Number of classes: 10<br />
クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50個の粒子を使用します。<br />
・Number of iterations: 25<br />
これはほとんど変える必要はありません。<br />
・Regularisation parameter T: 2<br />
Tの定義にてついては[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3を、3次元分類ではT=3-4の値を使用してください。ネガティブ染色の場合、これよりも小さい値の方が良い場合もあります。一般的に平均値がばらついている場合は、一旦Tの値を減らしてください。もし、平均値が低解像度のままであった場合はTの値を増やしてください。あくまでもメインは高解像度のノイズの過剰適合に気付けるかどうかなのです。<br />
・Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、溶媒ノイズや粒子画像の隅にあるような隣接した粒子を除去するのに使われます。一方で、多くの目立った溶媒と隣接した粒子が列を乱すおそれがあるため、直径は小さく保ってください。また、クラス平均からのいくつかの信号を取り出したくないため、最大寸法よりも直径が大きいか確かめる可能性があります。<br />
・Mask individual particles with zeros? Yes<br />
・Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はアライメントに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にややこしいデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したジョブを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refineジョブを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
・Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
• Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
• Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
• Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
• Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
• Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classificationジョブを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (オートピッキングのためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これはRELION-2.0での新しいオプションです:これは2次元クラス平均化の自動センタリングを許可します。画像のセンタリングは質量の中心を基準にしており、中心は画像の白い部分を用いて計算されます。2次元クラス分類中はクラス平均はセンタリングされておらず、テンプレートのセンタリングが必要になるので、再センタリングがしばしば必要になります。<br />
<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
<br />
<br />
===3.7 Selecting templates for auto-picking(自動検出のためのテンプレート選択)===<br />
<br />
relion-1.4と違って、RELON-2.0では[Display]ボタンでは適切なクラスを選択することはできません。これは、サブセット選択ジョブタイプで行われます。[Browse]ボタン上のコマンドラインでSelect classes from model.starと入力し、【I/O】タブ上で、Class2D / manualpick / run_it025_model.starファイルを選択してください。<br />
<br />
【Class options】タブで以下の通りに設定を行ってください。<br />
• Re-center the class averages? Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
<br />
• Regroup the particles? No<br />
それぞれの顕微鏡写真に写っていた粒子が非常に少ない場合は、スペクトルノイズ量とスケールファクターが不安定になることがあり、これはそのときに役立つ設定である。デフォルトによって、後者は顕微鏡写真ごとに計算されます。この設定では、複数の顕微鏡写真から得られた粒子をグループ化し、計算することが可能です。RELIONは分類や、自動生成を行う際にグループが小さすぎると警告をします。<br />
<br />
<br />
Templates4autopickのようなエイリアスはいいアイデアですね。rlnClassDistributionに基づいてクラス平均を再度求めたとします。見た目が違う粒子の4-6のクラス平均を選択してください。似ている見た目の粒子を繰り返し選んだり、悪いクラス平均を含めたりはしないでください。クラス平均上で左クリックして選択してください。右クリックし、ダイアログメニューからSave selected classesオプションを使って、選択したクラス平均を保存することができます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
=== 6.1 Running the job (動作の実行)===<br />
RELIONのGUIで3D auto-refineの動作タイプを選択してください。GUIでの入力引数は大部分は3D classification動作タイプと同様ですが、一部、利用できません。Samplingタブでの配向性のサンプル比は反復の最初のみ使用されており、ここでのアルゴリズムは収束するまで、サンプリング比の角度を自動的に増加させます。その結果、8面体か20面体対称よりも少ないすべての精製では一般的に初期値の角度である7.5度のサンプルを、部分的な調査では1.8度のサンプルを使用します。高対称の精製のみ3.7度のサンプルを、部分的な調査の実行では0.9度のサンプルを使用します。<br />
<br />
RELION-2.0はOptimisationタブでUse solvent-flattend FSCsと呼ばれる新しいオプションがあります。このオプションの設定はRELION-1.4のようにNoで実行します。もしYesで設定した場合、自動精製は、Post-processing動作タイプで使用するものと似ている代表的なFSC曲線で溶解補正が使われます。その結果、この動作ではI/Oタブでマスクの規定もします。タンパク質が粒子ボックスの中に比較的小さい体積を占有している時、このオプションは非常に役に立ちます。例えば、伸長された分子や、マスクを使用し、小さい部分での精製に注目した時です。このような場合、マスクが使用されていない代表的なFSCは精製の解像度が低く見積もられます。今行っている精製では、このオプションはNoのままです。(マスクを規定する必要がないためです。)<br />
<br />
入力STARファイルとして、Select/class3d_first_exhaustive/particles.starを選択し、3D classification実行(例えば、Class3D/first_exhaustive/run_it025_class004.mrc)から初期モデルとして、精製されたマップのひとつを使用します。あるいは、以前に使用したものと同じ、3i3e_lp50A.mrcモデルを使用します。それはおそらくほとんど違いがありません。さらに、マップ内で高周波の構成へのバイアスを防ぐため、また、初期マップよりも高い解像度で完全に独立した精製の”gold-standard”を保持するために初期マップのローパスフィルターが最も良いです。再び50Åを使いましょう。分子が対称に見えるときは、精製を2D symmentryにしましょう。<br />
<br />
MPIのノードはマスター(周りを管理するだけのもの)と2つのスレーブ(2つの半分のセットに作用する)のセットで分かれているので、MPI処理装置の奇数を使用するのが最も効率が良いです。ナイキストまでのすべての周波数が考慮されているため、必要メモリは最終反復でかなり増加します。さらに、テストデータセットの中のより大きいボックスはクラスターノードで同じくらいの筋があります。もしかするとafter_first_class3dのようなエイリアスが良いかもしれません。<br />
<br />
=== 6.2 Analysing the results (結果の分析)===<br />
出力ファイルも3D classification実行と大部分が同じです。しかし、プログラムのそれぞれの反復は2つのrun_it0??_half?_model.star と2つのrun_it0??_half?_class001.mrcファイルに書き出されます。それぞれが独立してデータの半分を精製します。収束だけひとつのrun_model.starとrun_class001.mrcファイルに書き出されます(名前に_it0??がありません)。最終反復では2つの独立した半分の復元が加えられているので、解像度は一般的に最終反復でかなり良くなります。プログラムはすべてのデータでナイキスト周波数を使用しているので、反復でもメモリとCPUがより必要です。<br />
<br />
角度サンプリングでの自動増加は自動精製手順の様子が重要であることに注意してください。[11]で説明されているシグナル対ノイズの考察が基礎となっており、角度の精度と併進運動の割り当てを評価します。プログラムは必要だと判断したものよりも細かい角度や並進運動サンプリング比は使用しません(結果がよくならないためです)。評価された精度と採用したサンプリング比は現在の解像度評価と一緒にすべて_optimiser.starと_model.starファイルに保存されますが、stdoutファイルから引用されるかもしれません。例えば、以下を試してみてください。<br />
<br />
grep Auto Refine3D/after_first_class3d/run.out<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 ===<br />
=== 9.2 ===<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-14T14:56:30Z
<p>Fisherman1: /* 2.1 The GUI */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20-tutorial.tar.gz<br />
<br />
gunzip relion20_tutorial.tar.gz<br />
<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
==== 2.1.1 A pipeline approach ====<br />
RELION-1.4のGUIは便利なコマンドラインジェネレータにすぎませんでしたが、RELION-2.0のGUIは新しいパイプラインのアプローチでより中心的な役割を果たします。以前のバージョンでは、ユーザーは異なる動作で出力ファイルを紐づけなければならなかったため、RELION-1.4のプログラムはプロジェクトの履歴を認識できませんでした。RELION-2.0では、GUIがすべての動作と、ある動作の出力を別の動作の入力としてどのように使用してパイプラインを形成するかを追跡します。その結果、ユーザは、出力ファイルがどこに格納されるかをより長い間把握することができます。動作の各タイプにはそれぞれ独自の出力ディレクトリがあり、これらの動作タイプのディレクトリ内(例えばClass2D)では、新しい動作は連続する番号(Class2D/job010)を取得します。これら個々の動作ディレクトリ内では、Class2D/job010/runのように出力名が固定されています。動作に意味のある名前を付ける仕組みを提供するために、ファイルシステム上の個々の動作ディレクトリへのシンボリックリンクとして実装されたジョブ "エイリアス"のシステムが使用されています。<br />
<br />
パイプラインに関するすべての情報はdefault_pipeline.starというファイルに保存されますが、通常の状況ではユーザーはこのファイルを調べる必要はありません。<br />
==== 2.1.2 The upper half: jobtype-browser and parameter-panel ====<br />
GUIは上半分と下半分に分かれています。上半分はRELION-1.4に似ています。左側に動作タイプ([2D classification]のような動作タイプの垂直リストの)ブラウザがあります。このリストはRELION-2.0で拡張されました。右側には複数のタブがあるパネルがあり、異なる種類の動作へのパラメータを入力できます。GUIの左上には3つの異なるメニューがあり、さまざまな機能が提供されています。RELION1.4の[Run!]ボタンが[Schedule]と[Run now!]の2つの新しいボタンに置き換えられました。前者のものは新しく、将来の実行のために動作をスケジュールするために使用できます。これは、データが収集される際にリアルタイムで反復的に実行できる完全に自動化された「パイプライン」の準備に特に役立ちます。詳細は以下を参照してください。GUIの左側のjobtype-browserをクリックすると、新しい動作([Run now!]ボタン付き)が右側のパラメータパネルにロードされます。<br />
<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
【Schedule】ボタンから、先の動作の準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他の動作への入力として利用できるため、スケジュールされた動作リストに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化された動作を実行できます。そのプログラムは何回スケジュール化された動作を実行するか問いてきます。1より大きい値を指定すると、すべてのスケジュール化された動作が繰り返し実行されます。もしこの動作を選択した場合、スケジュール化された動作の各リピート間で何分経過させるべきかという疑問が生じるでしょう。(もしスケジュール化された動作の実行が短い場合、このプログラムはスケジュール化された動作の次の動作を待機させます。)次の動作タイプは、以前の反復(インポート、モーション補正、CTF推定、自動ピッキング、粒子抽出、ムービーリファインメ)ではまだ完了していない顕微鏡写真のみを処理します。他の全ての動作タイプはスケジュール化された動作タイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、オンザフライ処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましくは、高速処理のための1つまたは複数の適切なGPUを搭載)にコピーするスクリプトをセットアップすることができます。(大きなファイルをコピーするのには時間がかかるため、顕微鏡写真と動画をインポートしたくなく、このスクリプトはファイルを一時的なファイル名としてコピーでき、それらが完全に終了したときにのみ、ファイルの最終的なファイル名に変更することができます)スケジュール化された動作リストの開始(例として【Micrograghs/*.mrcs】ファイルのインポート)はモーテョン推定、CTF推定、自動ピッキング。(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、粒子抽出、2Dクラス化によって実行される。このスケジュール化された動作リストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます長くなり、スケジュールされた動作(モーション補正、CTF推定、自動ピッキング、粒子抽出)の各反復は、その反復時の全ての粒子数をゼロから2Dクラス化している間に、新しい顕微鏡写真上でのみ実行する。電子顕微鏡でデータ補正中に2Dクラス化の査定は、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決定させるのに有益であるかもしず、またおそらく、より氷が厚いグリッド上で収集する必要があります。もし、既に3Dリファレンスが良ければ、オンザフライ上での【3Dクラス化】、【自動3D精製】を実行するかもしれません。これは、例えば、関係ある補因子がインタレスト複合体に結合しているかどうかを確認するのに有用であり得る。<br />
<br />
【subset selection】はスケジュール化されてますが、ユーザーは例えば最適なクラスを選択するための【2D classification】から _model.starを表示させるように入力するのを促されるのに注意して下さい。全てのスケジュール化された動作の実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリの処理のためのワークフローを実装しています。これには、自動ピッキング、粒子抽出、2D分類化、3D分類化、自動3D精製、粒子洗練、およびマスク作といった動作タイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーがRELION Wikiの関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities ===<br />
==== 2.5.1 Dealing with differently scaled particles ====<br />
RELION-1.4では、粒子をどれだけダウンスケーリングし(あるいはそうでないか)変更することを、STARファイル等を変更するためにawkスクリプトを付与させることで、いくつか備えていました。RELION-2.0ではとても簡単になされます。粒子抽出動作タイプは、手動ピッキング、自動ピッキングから座標を提供する代わりに、2Dクラス化、3Dクラス化、自動3D精製動作から _data.starを与える【re-extract refined particle】オプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際に、各入力粒子のスケールの違いを正しく考慮します。また入力_data.starファイルの洗練された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことは自動ピッキングでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上で【pixel size in references】で値を与えられる時に(もしくは【I/O】タブ上の【pixel size in micrographs】オプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
粒子の削除動作タイプは、RELION-2.0パイプライン内の部分的なシグナル減算の手順を形式化します。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
同じの動作タイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減産された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減産後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0でのパイプラインの公式化により、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルにアクセスできることが必要になってきました。これは、新しいjobtype join starファイルによって提供されます。4つ以上のファイルを結合する場合(完全に記述されたパイプラインを維持したい場合)は、GUIからこのユーティリティを複数回呼び出す必要があります。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度インポートすることもできます。<br />
<br />
=== 2.6 How this tutorial works ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をプロジェクトディレクトリにコピーすることができます。RELION-2.0の動作のパイプライン化された性質のため、これは非常に困難になります。したがって、完全に実行されたパイプラインは代わりにPrecalculatedResultsディレクトリに提供されます。ユーザーは自分のマシン上のbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用します。これは1日以内に実行する必要があります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
=== 3.1 ===<br />
=== 3.2 ===<br />
=== 3.3 ===<br />
=== 3.4 ===<br />
=== 3.5 ===<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、動作タイプ【2D classification】を使用します。<br />
【I/O】タブ上でExtract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
・Do CTF-correction? Yes<br />
ベイジアンフレームワークにおいて位相振幅補正を行います。<br />
・Have data been phase-flipped? No<br />
この選択はRELION外でデータを前処理した場合にのみ有効です。<br />
・Ignore CTFs until first peak? No<br />
振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジー分類されたりした場合にこのオプションが役立ちます。<br />
<br />
【Optimisation】タブの設定:<br />
・Number of classes: 10<br />
クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50個の粒子を使用します。<br />
・Number of iterations: 25<br />
これはほとんど変える必要はありません。<br />
・Regularisation parameter T: 2<br />
Tの定義にてついては[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3を、3次元分類ではT=3-4の値を使用してください。ネガティブ染色の場合、これよりも小さい値の方が良い場合もあります。一般的に平均値がばらついている場合は、一旦Tの値を減らしてください。もし、平均値が低解像度のままであった場合はTの値を増やしてください。あくまでもメインは高解像度のノイズの過剰適合に気付けるかどうかなのです。<br />
・Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、溶媒ノイズや粒子画像の隅にあるような隣接した粒子を除去するのに使われます。一方で、多くの目立った溶媒と隣接した粒子が列を乱すおそれがあるため、直径は小さく保ってください。また、クラス平均からのいくつかの信号を取り出したくないため、最大寸法よりも直径が大きいか確かめる可能性があります。<br />
・Mask individual particles with zeros? Yes<br />
・Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はアライメントに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にややこしいデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したジョブを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refineジョブを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
・Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
• Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
• Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
• Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
• Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
• Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classificationジョブを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (オートピッキングのためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これはRELION-2.0での新しいオプションです:これは2次元クラス平均化の自動センタリングを許可します。画像のセンタリングは質量の中心を基準にしており、中心は画像の白い部分を用いて計算されます。2次元クラス分類中はクラス平均はセンタリングされておらず、テンプレートのセンタリングが必要になるので、再センタリングがしばしば必要になります。<br />
<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
<br />
<br />
===3.7 Selecting templates for auto-picking(自動検出のためのテンプレート選択)===<br />
<br />
relion-1.4と違って、RELON-2.0では[Display]ボタンでは適切なクラスを選択することはできません。これは、サブセット選択ジョブタイプで行われます。[Browse]ボタン上のコマンドラインでSelect classes from model.starと入力し、【I/O】タブ上で、Class2D / manualpick / run_it025_model.starファイルを選択してください。<br />
<br />
【Class options】タブで以下の通りに設定を行ってください。<br />
• Re-center the class averages? Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
<br />
• Regroup the particles? No<br />
それぞれの顕微鏡写真に写っていた粒子が非常に少ない場合は、スペクトルノイズ量とスケールファクターが不安定になることがあり、これはそのときに役立つ設定である。デフォルトによって、後者は顕微鏡写真ごとに計算されます。この設定では、複数の顕微鏡写真から得られた粒子をグループ化し、計算することが可能です。RELIONは分類や、自動生成を行う際にグループが小さすぎると警告をします。<br />
<br />
<br />
Templates4autopickのようなエイリアスはいいアイデアですね。rlnClassDistributionに基づいてクラス平均を再度求めたとします。見た目が違う粒子の4-6のクラス平均を選択してください。似ている見た目の粒子を繰り返し選んだり、悪いクラス平均を含めたりはしないでください。クラス平均上で左クリックして選択してください。右クリックし、ダイアログメニューからSave selected classesオプションを使って、選択したクラス平均を保存することができます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
=== 6.1 Running the job ===<br />
<br />
=== 6.2 Analysing the results ===<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 ===<br />
=== 9.2 ===<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-13T02:40:23Z
<p>Fisherman1: /* 1.8 Download the test data */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20-tutorial.tar.gz<br />
<br />
gunzip relion20_tutorial.tar.gz<br />
<br />
tar -xf relion20_tutorial.tar<br />
このチュートリアルの後に独自のコンピュータシステムを使用している場合は、クラスタで実行するには特定のキューイングシステム用に構成されたqsub.cshスクリプトが必要です。 正しいスクリプトを持っているかどうかわからない場合は、システム管理者に相談してください。<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
【Schedule】ボタンから、先の動作の準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他の動作への入力として利用できるため、スケジュールされた動作リストに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化された動作を実行できます。そのプログラムは何回スケジュール化された動作を実行するか問いてきます。1より大きい値を指定すると、すべてのスケジュール化された動作が繰り返し実行されます。もしこの動作を選択した場合、スケジュール化された動作の各リピート間で何分経過させるべきかという疑問が生じるでしょう。(もしスケジュール化された動作の実行が短い場合、このプログラムはスケジュール化された動作の次の動作を待機させます。)次の動作タイプは、以前の反復(インポート、モーション補正、CTF推定、自動ピッキング、粒子抽出、ムービーリファインメ)ではまだ完了していない顕微鏡写真のみを処理します。他の全ての動作タイプはスケジュール化された動作タイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、オンザフライ処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましくは、高速処理のための1つまたは複数の適切なGPUを搭載)にコピーするスクリプトをセットアップすることができます。(大きなファイルをコピーするのには時間がかかるため、顕微鏡写真と動画をインポートしたくなく、このスクリプトはファイルを一時的なファイル名としてコピーでき、それらが完全に終了したときにのみ、ファイルの最終的なファイル名に変更することができます)スケジュール化された動作リストの開始(例として【Micrograghs/*.mrcs】ファイルのインポート)はモーテョン推定、CTF推定、自動ピッキング。(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、粒子抽出、2Dクラス化によって実行される。このスケジュール化された動作リストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます長くなり、スケジュールされた動作(モーション補正、CTF推定、自動ピッキング、粒子抽出)の各反復は、その反復時の全ての粒子数をゼロから2Dクラス化している間に、新しい顕微鏡写真上でのみ実行する。電子顕微鏡でデータ補正中に2Dクラス化の査定は、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決定させるのに有益であるかもしず、またおそらく、より氷が厚いグリッド上で収集する必要があります。もし、既に3Dリファレンスが良ければ、オンザフライ上での【3Dクラス化】、【自動3D精製】を実行するかもしれません。これは、例えば、関係ある補因子がインタレスト複合体に結合しているかどうかを確認するのに有用であり得る。<br />
<br />
【subset selection】はスケジュール化されてますが、ユーザーは例えば最適なクラスを選択するための【2D classification】から _model.starを表示させるように入力するのを促されるのに注意して下さい。全てのスケジュール化された動作の実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリの処理のためのワークフローを実装しています。これには、自動ピッキング、粒子抽出、2D分類化、3D分類化、自動3D精製、粒子洗練、およびマスク作といった動作タイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーがRELION Wikiの関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities ===<br />
==== 2.5.1 Dealing with differently scaled particles ====<br />
RELION-1.4では、粒子をどれだけダウンスケーリングし(あるいはそうでないか)変更することを、STARファイル等を変更するためにawkスクリプトを付与させることで、いくつか備えていました。RELION-2.0ではとても簡単になされます。粒子抽出動作タイプは、手動ピッキング、自動ピッキングから座標を提供する代わりに、2Dクラス化、3Dクラス化、自動3D精製動作から _data.starを与える【re-extract refined particle】オプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際に、各入力粒子のスケールの違いを正しく考慮します。また入力_data.starファイルの洗練された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことは自動ピッキングでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上で【pixel size in references】で値を与えられる時に(もしくは【I/O】タブ上の【pixel size in micrographs】オプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
粒子の削除動作タイプは、RELION-2.0パイプライン内の部分的なシグナル減算の手順を形式化します。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
同じの動作タイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減産された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減産後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0でのパイプラインの公式化により、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルにアクセスできることが必要になってきました。これは、新しいjobtype join starファイルによって提供されます。4つ以上のファイルを結合する場合(完全に記述されたパイプラインを維持したい場合)は、GUIからこのユーティリティを複数回呼び出す必要があります。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度インポートすることもできます。<br />
<br />
=== 2.6 How this tutorial works ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をプロジェクトディレクトリにコピーすることができます。RELION-2.0の動作のパイプライン化された性質のため、これは非常に困難になります。したがって、完全に実行されたパイプラインは代わりにPrecalculatedResultsディレクトリに提供されます。ユーザーは自分のマシン上のbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用します。これは1日以内に実行する必要があります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
=== 3.1 ===<br />
=== 3.2 ===<br />
=== 3.3 ===<br />
=== 3.4 ===<br />
=== 3.5 ===<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、動作タイプ【2D classification】を使用します。<br />
【I/O】タブ上でExtract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
・Do CTF-correction? Yes<br />
ベイジアンフレームワークにおいて位相振幅補正を行います。<br />
・Have data been phase-flipped? No<br />
この選択はRELION外でデータを前処理した場合にのみ有効です。<br />
・Ignore CTFs until first peak? No<br />
振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジー分類されたりした場合にこのオプションが役立ちます。<br />
<br />
【Optimisation】タブの設定:<br />
・Number of classes: 10<br />
クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50個の粒子を使用します。<br />
・Number of iterations: 25<br />
これはほとんど変える必要はありません。<br />
・Regularisation parameter T: 2<br />
Tの定義にてついては[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3を、3次元分類ではT=3-4の値を使用してください。ネガティブ染色の場合、これよりも小さい値の方が良い場合もあります。一般的に平均値がばらついている場合は、一旦Tの値を減らしてください。もし、平均値が低解像度のままであった場合はTの値を増やしてください。あくまでもメインは高解像度のノイズの過剰適合に気付けるかどうかなのです。<br />
・Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、溶媒ノイズや粒子画像の隅にあるような隣接した粒子を除去するのに使われます。一方で、多くの目立った溶媒と隣接した粒子が列を乱すおそれがあるため、直径は小さく保ってください。また、クラス平均からのいくつかの信号を取り出したくないため、最大寸法よりも直径が大きいか確かめる可能性があります。<br />
・Mask individual particles with zeros? Yes<br />
・Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はアライメントに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にややこしいデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したジョブを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refineジョブを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
・Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
• Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
• Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
• Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
• Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
• Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classificationジョブを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (オートピッキングのためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これはRELION-2.0での新しいオプションです:これは2次元クラス平均化の自動センタリングを許可します。画像のセンタリングは質量の中心を基準にしており、中心は画像の白い部分を用いて計算されます。2次元クラス分類中はクラス平均はセンタリングされておらず、テンプレートのセンタリングが必要になるので、再センタリングがしばしば必要になります。<br />
<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
<br />
<br />
===3.7 Selecting templates for auto-picking(自動検出のためのテンプレート選択)===<br />
<br />
relion-1.4と違って、RELON-2.0では[Display]ボタンでは適切なクラスを選択することはできません。これは、サブセット選択ジョブタイプで行われます。[Browse]ボタン上のコマンドラインでSelect classes from model.starと入力し、【I/O】タブ上で、Class2D / manualpick / run_it025_model.starファイルを選択してください。<br />
<br />
【Class options】タブで以下の通りに設定を行ってください。<br />
• Re-center the class averages? Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
<br />
• Regroup the particles? No<br />
それぞれの顕微鏡写真に写っていた粒子が非常に少ない場合は、スペクトルノイズ量とスケールファクターが不安定になることがあり、これはそのときに役立つ設定である。デフォルトによって、後者は顕微鏡写真ごとに計算されます。この設定では、複数の顕微鏡写真から得られた粒子をグループ化し、計算することが可能です。RELIONは分類や、自動生成を行う際にグループが小さすぎると警告をします。<br />
<br />
<br />
Templates4autopickのようなエイリアスはいいアイデアですね。rlnClassDistributionに基づいてクラス平均を再度求めたとします。見た目が違う粒子の4-6のクラス平均を選択してください。似ている見た目の粒子を繰り返し選んだり、悪いクラス平均を含めたりはしないでください。クラス平均上で左クリックして選択してください。右クリックし、ダイアログメニューからSave selected classesオプションを使って、選択したクラス平均を保存することができます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
=== 6.1 Running the job ===<br />
<br />
=== 6.2 Analysing the results ===<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 ===<br />
=== 9.2 ===<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-13T02:32:29Z
<p>Fisherman1: /* 1.8 Download the test data */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20-tutorial.tar.gz<br />
<br />
gunzip relion20_tutorial.tar.gz<br />
<br />
tar -xf relion20_tutorial.tar<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
【Schedule】ボタンから、先の動作の準備をできます。スケジュール化された動作の予想される出力ファイルは、既に【Browse】ボタンから他の動作への入力として利用できるため、スケジュールされた動作リストに複数の連続した動作の「パイプライン」を構築することが可能です。GUIのトップ上の【Autorun】メニューからスケジュール化された動作を実行できます。そのプログラムは何回スケジュール化された動作を実行するか問いてきます。1より大きい値を指定すると、すべてのスケジュール化された動作が繰り返し実行されます。もしこの動作を選択した場合、スケジュール化された動作の各リピート間で何分経過させるべきかという疑問が生じるでしょう。(もしスケジュール化された動作の実行が短い場合、このプログラムはスケジュール化された動作の次の動作を待機させます。)次の動作タイプは、以前の反復(インポート、モーション補正、CTF推定、自動ピッキング、粒子抽出、ムービーリファインメ)ではまだ完了していない顕微鏡写真のみを処理します。他の全ての動作タイプはスケジュール化された動作タイプの実行の各反復後、再度ゼロから算出し始める。<br />
<br />
この設定により、顕微鏡写真を収集する際に、オンザフライ処理を便利に行うことができます。顕微鏡写真や顕微鏡動画を顕微鏡コンピュータから処理コンピュータ(好ましくは、高速処理のための1つまたは複数の適切なGPUを搭載)にコピーするスクリプトをセットアップすることができます。(大きなファイルをコピーするのには時間がかかるため、顕微鏡写真と動画をインポートしたくなく、このスクリプトはファイルを一時的なファイル名としてコピーでき、それらが完全に終了したときにのみ、ファイルの最終的なファイル名に変更することができます)スケジュール化された動作リストの開始(例として【Micrograghs/*.mrcs】ファイルのインポート)はモーテョン推定、CTF推定、自動ピッキング。(適切なテンプレートがすでに用意されている場合は、いくつかの顕微鏡写真を取得した後で手動で粒子を選択する必要があります)、粒子抽出、2Dクラス化によって実行される。このスケジュール化された動作リストはおそらく各反復間に少なくとも30分または60分何回も反復され、インポートされた顕微鏡写真のリストはますます長くなり、スケジュールされた動作(モーション補正、CTF推定、自動ピッキング、粒子抽出)の各反復は、その反復時の全ての粒子数をゼロから2Dクラス化している間に、新しい顕微鏡写真上でのみ実行する。電子顕微鏡でデータ補正中に2Dクラス化の査定は、既に最初から価値のあるデータが得られたかどうか、方向性分布が大丈夫かどうかを決定させるのに有益であるかもしず、またおそらく、より氷が厚いグリッド上で収集する必要があります。もし、既に3Dリファレンスが良ければ、オンザフライ上での【3Dクラス化】、【自動3D精製】を実行するかもしれません。これは、例えば、関係ある補因子がインタレスト複合体に結合しているかどうかを確認するのに有用であり得る。<br />
<br />
【subset selection】はスケジュール化されてますが、ユーザーは例えば最適なクラスを選択するための【2D classification】から _model.starを表示させるように入力するのを促されるのに注意して下さい。全てのスケジュール化された動作の実行はユーザーがこの選択を保存するまで続きません。このステップの自動化は次のRELIONのバージョンに組み込ませるつもりです。<br />
<br />
=== 2.4 Helical processing ===<br />
Scheresグループの博士課程学生であるShaoda Heは、ヘリカルアセンブリの処理のためのワークフローを実装しています。これには、自動ピッキング、粒子抽出、2D分類化、3D分類化、自動3D精製、粒子洗練、およびマスク作といった動作タイプのパラメータパネルへの追加タブが含まれます。これらオプションのより詳細な説明は、ユーザーがRELION Wikiの関連するページから参照できます。<br />
<br />
=== 2.5 Other new functionalities ===<br />
==== 2.5.1 Dealing with differently scaled particles ====<br />
RELION-1.4では、粒子をどれだけダウンスケーリングし(あるいはそうでないか)変更することを、STARファイル等を変更するためにawkスクリプトを付与させることで、いくつか備えていました。RELION-2.0ではとても簡単になされます。粒子抽出動作タイプは、手動ピッキング、自動ピッキングから座標を提供する代わりに、2Dクラス化、3Dクラス化、自動3D精製動作から _data.starを与える【re-extract refined particle】オプションを備えています。このオプションは、抽出された粒子の新しいSTARファイルに原点オフセットを書き出す際に、各入力粒子のスケールの違いを正しく考慮します。また入力_data.starファイルの洗練された原点オフセットによって定義された中心の粒子を抽出します(Re-center refined coordinatesオプションを使用します)。<br />
<br />
他のRELION-1.4の不便なことは自動ピッキングでのテンプレートが取得してきた顕微鏡写真と同じスケールでなければならないことです。RELION-2.0ではそうではなく、【Reference】タブ上で【pixel size in references】で値を与えられる時に(もしくは【I/O】タブ上の【pixel size in micrographs】オプションを利用時)、入力する顕微鏡写真のSTARファイルで定義されたピクセルサイズと違ってても構わない。<br />
<br />
==== 2.5.2 Particle subtraction ====<br />
粒子の削除動作タイプは、RELION-2.0パイプライン内の部分的なシグナル減算の手順を形式化します。入力マップの投影は、入力粒子から削除されます。(以前の3Dクラス化または自動3D精製の _data.starファイルとして提供されます。)マップを投影する前に、入力マスクがマップに適用されます。それゆえに、粒子から減算したい領域では白く、それ以外では黒くする必要があります。<br />
<br />
同じの動作タイプで、(入力 _data.starファイル上のコラムを【rlnImageName】と【rlnImageOriginName】切り替えることで)減産された粒子から元の粒子へと戻すことができます。これは、たとえば、データを構造的に同種のサブセットに分類するために部分シグナル減産後に、複合体全体を再精製したい場合などに便利です。シグナル減算の手順の詳細については、eLifeの論文[1]を参照してください。<br />
<br />
==== 2.5.3 Join STAR files ====<br />
RELION-2.0でのパイプラインの公式化により、粒子、顕微鏡写真、または顕微鏡動画のSTARファイルにアクセスできることが必要になってきました。これは、新しいjobtype join starファイルによって提供されます。4つ以上のファイルを結合する場合(完全に記述されたパイプラインを維持したい場合)は、GUIからこのユーティリティを複数回呼び出す必要があります。または、relion_star_combineコマンドラインプログラムを多数のファイルで実行し、結果のSTARファイルをパイプラインに再度インポートすることもできます。<br />
<br />
=== 2.6 How this tutorial works ===<br />
RELION-1.4チュートリアルでは、チュートリアルの時間を節約するために、あらかじめ計算された結果をプロジェクトディレクトリにコピーすることができます。RELION-2.0の動作のパイプライン化された性質のため、これは非常に困難になります。したがって、完全に実行されたパイプラインは代わりにPrecalculatedResultsディレクトリに提供されます。ユーザーは自分のマシン上のbetagalディレクトリ内のすべてのステップを実行することができます(少なくとも1つの適切なGPUを使用します。これは1日以内に実行する必要があります)。またはPrecalculatedResultsディレクトリのプロセスに従います。<br />
<br />
== 3 Preprocessing ==<br />
=== 3.1 ===<br />
=== 3.2 ===<br />
=== 3.3 ===<br />
=== 3.4 ===<br />
=== 3.5 ===<br />
=== 3.6 Making templates for auto-picking(自動検出のためのテンプレート作成)===<br />
<br />
次に、全顕微鏡写真の自動検出のためのテンプレートを計算するために、動作タイプ【2D classification】を使用します。<br />
【I/O】タブ上でExtract / job005 / particles.starファイルを選択し、【CTF】タブ上で以下の操作を行ってください。<br />
・Do CTF-correction? Yes<br />
ベイジアンフレームワークにおいて位相振幅補正を行います。<br />
・Have data been phase-flipped? No<br />
この選択はRELION外でデータを前処理した場合にのみ有効です。<br />
・Ignore CTFs until first peak? No<br />
振幅補正によって低解像度成分が誤って認識されたり、全ての粒子が一緒にファジー分類されたりした場合にこのオプションが役立ちます。<br />
<br />
【Optimisation】タブの設定:<br />
・Number of classes: 10<br />
クライオ電子顕微鏡(cryo-EM)では、少なくともクラス当たり約100個の粒子を使用するのが望ましいです。ネガティブ染色法の場合、1クラスで20~50個の粒子を使用します。<br />
・Number of iterations: 25<br />
これはほとんど変える必要はありません。<br />
・Regularisation parameter T: 2<br />
Tの定義にてついては[10]を参照してください。クライオ電子顕微鏡(cryo-EM)において、2次元分類ではT=2-3を、3次元分類ではT=3-4の値を使用してください。ネガティブ染色の場合、これよりも小さい値の方が良い場合もあります。一般的に平均値がばらついている場合は、一旦Tの値を減らしてください。もし、平均値が低解像度のままであった場合はTの値を増やしてください。あくまでもメインは高解像度のノイズの過剰適合に気付けるかどうかなのです。<br />
・Mask diameter (A): 200<br />
このマスクは全ての2次元クラス平均に適用されます。また、溶媒ノイズや粒子画像の隅にあるような隣接した粒子を除去するのに使われます。一方で、多くの目立った溶媒と隣接した粒子が列を乱すおそれがあるため、直径は小さく保ってください。また、クラス平均からのいくつかの信号を取り出したくないため、最大寸法よりも直径が大きいか確かめる可能性があります。<br />
・Mask individual particles with zeros? Yes<br />
・Limit resolution E-step to (A): -1<br />
正の値が得られた場合、この値を超える周波数はアライメントに含まれません。これは過剰適合を防ぐのにも役立ちます。ここではそれは必要ではありませんが、10-15Aで設定されている可能性があります。難しい分類、すなわち非常にややこしいデータの場合は、解像度を制限することによって問題が解決することが多いです。<br />
<br />
【Sampling】タブではデフォルトを変更することは、ほとんどありません。いくつかの大きな20面体ウイルスでは、より細かな角度でのサンプリングが必要かもしれませんが、ほとんどの場合は5度の角度サンプリングで十分です。その場合、最初に5度のサンプリングで25回繰り返し実行し、(Number of iterations: 30 【Optimisation】タブで設定)2度のサンプリングで、さらに5回繰り返して【Continue now】ボタンを使って)同じ実行を続けます。このデータセットの場合、これはまったく必要ではありません。【Continue now】ボタンを使用して前に何らかの形で失敗したジョブを再開することもできます。この場合、いずれのパラメータも変更されません。2D classification、3D classification、または3Dauto-refineジョブを続行するには、常に【I / O】タブ上で継続してから_optimiser.starファイルを指定する必要があります。<br />
【Helix】タブは無視し、【Compute】タブで以下のように設定を行います。<br />
・Combine iterations through disc? No<br />
この方法で、全てのMPIノードは、各反復の終わりにネットワークを介してデータを結合します。ネットワークがボトルネックであるか何らかの原因で問題が発生している場合は、このオプションをNoに設定できます。その場合、すべてのMPIノードはデータをディスクに書き込み / 読み出します。<br />
• Use parallel disc I/O? Yes<br />
このようにして、すべてのMPIスレーブは自分の粒子をディスクから読み込みます。<br />
高速(parallel?)ファイルシステムを使用している場合は、このオプションを使用してください。 並列ではないファイルシステムは、複数のMPIノードからの並行したアクセスを処理できない場合があることに注意してください。そのような場合、このオプションをNoに設定することができます。その場合、マスターMPIノードだけが粒子を読み込み、ネットワーク経由でMPIスレーブに送信します。<br />
• Number of pooled particles: 3<br />
粒子はMPIスレーブによって個々のバッチで処理されます。各バッチの中で、積み重なっている粒子画像は、ディスクアクセス時間を改善するために1回だけ開閉されます。1つのバッチのすべての粒子画像は一緒にメモリに読み込まれます。nr_pooled_particlesパラメータは、スレッドごとに読み込まれる粒子の数を制御します。3に設定され、1つが8つのスレッドを使用する場合、3x8 = 24個の粒子のバッチが一緒に読み込まれます。これにより、ディスクアクセス、特にディスクアクセスのメタデータ処理が問題となるシステムでのパフォーマンスが向上する可能性があります。わずかなコストで RAMの使用量を増加させることができます。<br />
<br />
• Pre-read all particles into RAM? Yes<br />
Yesを選択すると、すべての粒子画像がコンピュータのメモリに読み込まれ、ディスクアクセスが遅いシステムでの計算が大幅に高速化されます。ただし、使用可能なRAMの量には注意が必要です。粒子は倍精度で読み込まれるため、N個の粒子をRAMに読み込むには(N *box size*box size* 4 /(1024 * 1024 * 1024))ギガバイトかかることになります。パラレルディスク【I / O】が「Yes」で選択されている場合、すべてのMPIスレーブは粒子すべて読み込みます。パラレルディスク【I / O】が「No」で選択されている場合、マスタのみがすべての粒子をRAMに読み込み、細分化の繰り返し中にMPIスレーブにそれらの粒子を送信します。<br />
• Use GPU acceleration? Yes<br />
これらに合ったGPUをお持ちの場合、この仕事ははるかに速くなります。<br />
• Which GPUs to use: 0<br />
これを空のままにすると、プログラムは使用するGPUを特定しようと試みます。0または1を使ってGPU IDを入力してください。複数のMPIプロセッサを使用している場合、指定したGPUで各MPIプロセスを実行できます。異なるMPIプロセスのGPU IDは、コロンで区切られます。 0:1:0:1はGPU 0でMPIプロセス0と2を実行し、MPIプロセス1と3はGPU 1で実行されます。<br />
【Running】タブで、MPIプロセッサの数と使用するスレッド数を指定します。要求されたCPUまたはコアの総数は、2つの値の積になります。 スレッドは、より効率的なRAM使用の利点を提供してくるが、MPIの並列化はスレッドよりも優れています。多くの場合、3D classificationと3D auto-refineジョブでは、各(マルチコアの)計算ノードで使用可能なRAMを共有するために、多くのスレッドを使用することが必要になります。2D分類はメモリを消費しないので、スレッドがあまり必要ない場合があります。しかし、MPIプロセッサ間の通信(拡張のボトルネック)が、多くのスレッドを実行する場合に比べて制限される点は、さまざまなクラスタによって異なりますので、これらのパラメータを使用して最適なパフォーマンスを得る必要があります 。<br />
より多くの2D classificationジョブを実行するので、意味のあるエイリアス、例えばmanualpickを使用することも良いアイデアですね。GPUアクセラレーションまたは(合理的なサイズの)クラスタを使用している場合、このジョブは数分で終了する必要があります。それ以外の場合は、コア数が少ないデスクトップでは15〜20分かかります。[Display]ボタン上でrun_it025_model.starを選択し、得られたクラス平均を見ることができます。ポップアップウィンドウでは、rlnClassDistribution、またはrlnAccuracyRotationsに基づいて、特定の順序でクラス平均を調べ、選択してみることができます。<br />
<br />
=== 3.7 Selecting templates for auto-picking (オートピッキングのためのテンプレート選択)===<br />
RELION-1.4と違って、RELION-2.0ではDisplayボタンは適切なクラスを選択することを許可していない。これは動作タイプをSubset selectionにして行われます。 Browseボタン上のコマンドラインでSelect classes flom model.starと入力して、I/Oタブ上でClass2D/manualpick/run_it025_model_.starファイルを選択してください。<br />
<br />
Class opitionsタブ上で下記のように入力してください。<br />
Re-center the class averages?: Yes<br />
これはRELION-2.0での新しいオプションです:これは2次元クラス平均化の自動センタリングを許可します。画像のセンタリングは質量の中心を基準にしており、中心は画像の白い部分を用いて計算されます。2次元クラス分類中はクラス平均はセンタリングされておらず、テンプレートのセンタリングが必要になるので、再センタリングがしばしば必要になります。<br />
<br />
Regroup the particles? No<br />
それぞれの電子顕微鏡写真にある粒子がとてもすくないときは、スペクトルノイズ強度の推定とスケールファクターが不安定になるケースがあるので、これはそのときに便利なオプションです。デフォルトでは、後者は電子顕微鏡写真ごとにそれぞれ計算されます。このオプションは複数の顕微鏡写真の粒子を一緒にグループ化して、計算することを許可します。RELIONはクラス分類または自動精製を行うときにグループがとても小さくなっていたら警告を出します。<br />
<br />
templates4autopickのようなエイリアスはとてもいいアイディアです。rlnClassDistributionに基づいたクラス平均を再び求める可能性があります。代表となる違う見た目の粒子の4-6のクラス平均を選択してください。似ている見た目のものを繰り返し選択したり、よくないクラス平均を含めたりしないでください。選択するにはクラス平均上で左クリックしてください。右クリックメニューからSave selected classes オプションを使うことで、選択したクラス平均を保存できます。<br />
<br />
<br />
<br />
===3.7 Selecting templates for auto-picking(自動検出のためのテンプレート選択)===<br />
<br />
relion-1.4と違って、RELON-2.0では[Display]ボタンでは適切なクラスを選択することはできません。これは、サブセット選択ジョブタイプで行われます。[Browse]ボタン上のコマンドラインでSelect classes from model.starと入力し、【I/O】タブ上で、Class2D / manualpick / run_it025_model.starファイルを選択してください。<br />
<br />
【Class options】タブで以下の通りに設定を行ってください。<br />
• Re-center the class averages? Yes<br />
これは、relion-2.0の新しいオプションで、2Dクラス平均の自動センタリングが可能です。画像のセンタリングはその重心を基準としており、粒子の白(黒ではない)の部分をもとに計算されます。2次元分類ではクラス平均はセンタリングされず、テンプレートのセンタリングが自動検出中に必要となるため、再センタリングがしばしば必要となります。<br />
<br />
• Regroup the particles? No<br />
それぞれの顕微鏡写真に写っていた粒子が非常に少ない場合は、スペクトルノイズ量とスケールファクターが不安定になることがあり、これはそのときに役立つ設定である。デフォルトによって、後者は顕微鏡写真ごとに計算されます。この設定では、複数の顕微鏡写真から得られた粒子をグループ化し、計算することが可能です。RELIONは分類や、自動生成を行う際にグループが小さすぎると警告をします。<br />
<br />
<br />
Templates4autopickのようなエイリアスはいいアイデアですね。rlnClassDistributionに基づいてクラス平均を再度求めたとします。見た目が違う粒子の4-6のクラス平均を選択してください。似ている見た目の粒子を繰り返し選んだり、悪いクラス平均を含めたりはしないでください。クラス平均上で左クリックして選択してください。右クリックし、ダイアログメニューからSave selected classesオプションを使って、選択したクラス平均を保存することができます。<br />
<br />
=== 3.8 Auto-picking(自動検出)===<br />
続いて、動作タイプ:Auto-pickingにてテンプレートとして選択された2次元クラス平均を使います。<br />
しかし、全ての電子顕微鏡写真をオートピッキングで動かす前に、オートピッキングタブ上でPicking threshold、the Minimum inter-particle distance、maximum stddev noiseの3つのメインパラメーターを最適化する必要があります。これは2、3の電子顕微鏡写真のみの場合は省くことができます。<br />
<br />
それゆえに、2か3の電子顕微鏡写真だけ選択する場合は最初にSTARファイルが必要になります。これは動作タイプ:Subset selectionで行うには2つの方法があります。OR select from picked coords:ラインでManualPick/job004/coords_suffix_manualpick.starを選択できます。そしてそのときに2つの電子顕微鏡写真だけ選択するために左クリックで矩形選択を使います。<br />
メニューオプションのInvert selectionがこれを便利してくれるかもしれないということを覚えておいてください。<br />
2-4の適切な電子顕微鏡写真を選択したとき(例えばデフォーカスの大きさや氷の厚さ)ときはメニューからSave selectionを選択することを忘れないでください。<br />
もう1つの方法は、動作タイプSubset selectionのI/OタブからOR select from micrographs.star:ラインでCtfFind/job003/micrographs/ctf.starを選択できます。左クリックで顕微鏡写真を選択して下さい。そして、右クリックメニューからSave STAR with selected imagesを選択して下さい。どのようなオプションを選択すれば、効果的な動作を選択するための2mics4autopickのようなエイリアスになるのでしょうか<br />
<br />
動作タイプAuto-pickingのI/Oタブ上で以下のように設定します。<br />
● Input micrographs for autopick: Select/2mics4autopick/micrographs.star<br />
● References: Select/templates4autopick/class averages.star<br />
● Pixel size in microgfraphs (A): -1<br />
(入力STARファイルがCtfFind jobからピクセルサイズ情報を得ていますので無視されます)<br />
<br />
Referncesタブでは以下のように設定します<br />
● Lowpass filter references (A): 20<br />
(これはローパスフィルターを使うためには非常に重要な項目です。ローパスフィルターとは、データから得たい最終解像度がかなり低い場合に、Einstein-from-noiseをベイに残すためのものです)<br />
● Highpass filter (A): -1<br />
(たとえば200などのはっきりとした値を渡したい場合は、顕微鏡写真は自動検出よりも先にハイパス・フィルターが適用されます。これは強いグレースケールが顕微鏡写真にかかっているときに役立ちます)<br />
● Pixel size in references (A): -1<br />
(もし負の値が与えられたら、入力顕微鏡写真と同じスケールと認識します。そうでない場合、例えば粒子を抜き出す上での参照値を作ろうと、粒子のリスケール行ったため、正しいピクセルサイズのしっかりした値をここに入力します)<br />
● Mask diameter (A): 200<br />
(2次元クラス分類の動作のときに使った値と同じものが使えます)<br />
● Angular sampling (deg): 5<br />
(この値はほとんどどんな場合でも正常に動くと思われます)<br />
● References have inverted contrast? Yes<br />
(顕微鏡写真の中にある粒子は黒く、参照するときには白い粒子として使うのでコントラストを反転します)<br />
● Are References CTF corrected? Yes<br />
(CTF correctoinで2次元平均化を行ったため)<br />
● Ignore CTFs until first peak: No<br />
(参照作製と使った2次元クラス分類も行った場合のみこのオプションを使って下さい)<br />
<br />
autopickingタブでは以下の用に設定して下さい<br />
●Picking threshold: 0.8<br />
(これはpeal-searchアルゴリズムのためにFOMマップ中のしきい値です。この値よりも低いFOMの粒子は検出されません)<br />
● Minimum inter-particle distance (A): 200<br />
(これは隣り合う粒子として認める粒子間の最大距離です<br />
反復動作するアルゴリズムはこの距離よりも互いに近い粒子を取り除きます。これの効果的な値は粒子直径の50%から60%の範囲であることが多いです)<br />
● Maximum stddev noise: 1.5<br />
(これは炭素である範囲や特に大きいゴミがある範囲を検出防止するのに有効です。基準に合わせられた顕微鏡写真の背面標準偏差のピークがこの値よりも大きい場合は無視されます。効果的な値は1.0から1.2の範囲であることが多いです。背面標準偏差が高い結果のピークを除去するための特徴を切るためには、この値を-1にして下さい。<br />
● Write FOM maps? Yes<br />
(下の説明参照)<br />
● Read FOM maps? No<br />
(下の説明参照)<br />
● Shrink factor: 0<br />
(これを0に設定することで、自動検出アルゴリズムは顕微鏡写真を参照値に沿ったローパス・フィルターの解像度にまで縮小します。これはチュートリアルを手軽にできるように、実行をとても早く、要求メモリも軽くしてくれます。0から1の値は顕微鏡写真のサイズの小部分の結果になります。<br />
すなわち、これはshrink=1にするよりもいくらか正確さの低い検出になるということに注意して下さい。これの新要素についての詳細な説明は次のサブセクションでします)<br />
● Use GPU acceleration? Yes<br />
(ふさわしいGPUを備えている場合のみ使って下さい)<br />
● Which GPUs to use:<br />
(これを空白のままにした場合、このプログラムはどのGPUを使えばよいのか判断しようとします。しかし、もし使いたいGPUのIDが例えば0や1などと、はっきりと分かる場合は、この項目に入力して下さい。もし複数のMPI-processorsを使う場合は、それぞれのMPI processを特定のGPUで動かすことができます。それぞれのMPI processesに割り振るGPU IDは0:1:0:1など、コロンで分けられています。0:1:0:1とはMPI processの0と2はGPU 0上を、MPI processの1と3はGPU 1上で動作しているという意味です。<br />
<br />
Helixタブは無視して下さい。そしてRunningタブではa single MPI processorを使って動かして下さい。<br />
おそらくoptimise_paramsのようなエイリアスが有意義になるかもしれない。チュートリアルでは2000×2000の顕微鏡写真を使っているので、1枚の顕微鏡写真につき、計算に5分ほどかかります。<br />
より一般的な4000×4000の顕微鏡写真を使った場合は、一般的に顕微鏡写真と参照ごとにだいたい5分ほどかかります。GPU-accelerationを使った場合は。10秒以内に動作完了します。そのため、FOMマップの書き込みと読み込みがあまり関係なくなります。<br />
<br />
この計算の高負荷な部分はa probability-based figure-of-merit(顕微鏡写真の中で循環する参照と全ての位置の間で相互相関係数に関係しています)の計算をすることです。この計算は上で設定したしきい値と距離の最小値を基に、peak-detectionアルゴリズムに従っています。これらの値が最適化される必要があるので、このプログラムはReferncesタブ上のFOMマップと呼ばれる場所に詳細を書き出します。これらは参照ごとに2つの大きなサイズ(顕微鏡写真のサイズ)のファイルになります。ハードディスク動作中のI/O障害を避けるために、FOMマップに書き出すときに自動検出プログラムは順次に動作するようにできます(これゆえに上記のsingle MPI processor)<br />
<br />
FOMマップを一度でもディスクに書き出せば、より速くなる検出値に最適化してくれます。最初に、動作させたときのDisplay:ボタンからcoords_sufix_autopickオプションを使って、現在の設定で自動検出された粒子を調べます。ディスプレイウィンドウのパラメーター(サイズやシグマコントラスト)は、最後にManual pickingを実行したときのものが使われることを覚えておいて下さい。実際にこれらのパラメーターを動作タイプ:Manual pickingから変更でき、左のjobsメニューの一番上にあるSave job settingsオプションを使って、設定を保存できます。Colorsタブで次のように設定したあとに、これを行って下さい。<br />
● Blue<>red color particles? Yes<br />
● MetaDataLabel for color: rlnAutopickFigureOfMerit<br />
● STAR file with color label:<br />
Leave this empty.<br />
● Blue value: 1<br />
● Red value: 0<br />
<br />
Runningタブ上で動作実行をすると、以前のpickとCTFボタンがあるGUIに似た描画がされます。ディスプレイウィンドウから両方の顕微鏡写真を開いて下さい。すると、粒子をもっと多く、または少なく検出するか(すなわち、しきい値を小さくするか大きくするか)を決定します。そして、近くの粒子を同一とするか異なるものとするか(すなわち、粒子間の最小距離値の設定)も決めます。それぞれの粒子は赤から青に色付けされていて、赤がとても低いFOM値で青がとても高いFOM値であることを覚えておいて下さい。両方の顕微鏡写真を開くために次のステップに進むまでの間、ディスプレイウィンドウを残しておくことができます。<br />
<br />
Finished jobsから、AutoPick/optimise_paramsを選択して下さい。そしてautopickingタブ上の値を変更して下さい。また、次のように変更して下さい<br />
● Write FOM maps? No<br />
● Read FOM maps? Yes<br />
<br />
Continue nowボタンをクリックすることで実行した場合は、FOMの再計算は行わず、以前書きだされたFOMマップをディスクから再読み込みします。その後の新しい同等の計算は2,3秒で終了します。以降は、新しい同等のセットを読み込むために、顕微鏡写真のディスプレイウィンドウ上で右クリックメニューからReload coordinatesを選択して下さい。この方法は2つの値を手早く最適化できます。<br />
<br />
どのように検出結果を変えるかを見るために、全部で3つの値の周りで遊びを持たせて下さい。一旦、全ての顕微鏡写真の自動検出のために使いたい値を知るなら、GUIの左一番上からRun now!ボタンを選択するために、動作タイプbrowser中で、Auto-pickingをクリックします。I/Oタブ上で、入力顕微鏡写真STARファイルを2つの選択された顕微鏡写真と交換します。2つの写真の1つは最初のCTF estunatuib動作で作られたファイル(CtfFind/job003/micrographs_ctf.star)です。このファイルはReferencesタブに全て残して下さい。そして、autopickingタブでは以下のように設定して下さい。<br />
● Picking threshold: 0.4<br />
● Minimum inter-particle distance (A): 110<br />
● Maximum stddev noise: 1.1<br />
● Write FOM maps? No<br />
● Read FOM maps? No<br />
ここで、動作は平行で(FOMマップが書き出せされてないなら)行われるかもしれません。Running タブ上では、自動検出を動かすための核となる数字を指定して下さい。<br />
MPI processorsの最大限度の有効な数は入力STARファイルの中の顕微鏡写真の数です。<br />
<br />
重要な違いがFOMマップを読み込み書き出しをするかどうかによって、Continue nowボタンの動作の仕方に重要な違いがあります。FOMマップを読み込み書き出しをする場合はどちらもContinue nowをクリックすることで、プログラムは(一般的には少数の)全ての入力された顕微鏡写真を再検出します。しかし、FOMマップの読み込みや書き込みをしない場合、すなわち、自動検出を全ての顕微鏡写真で行う2回目の動作では、Continue nowボタンをクリックすることで、まだ自動検出を行っていない顕微鏡写真のみ再検出します。これは計画的反復動作にて有効です。たとえば、顕微鏡検査セッションの間の高速データ処理などです。2.3のセクションもより詳細に見て下さい。もし再検出を全ての顕微鏡写真について、新しい値のセットを用いてしたい場合は(仕上がっていない顕微鏡写真だけで代わりに行う場合)、Run now!ボタンの代わりに、左にある動作タイプブラウザ上でAuto-pickingのクリックして下さい。そのとき、新しい出力ディレクトリが作成されます。<br />
<br />
Display:ボタンからcoords_suffix_autopickオプションをクリックすることで、結果を再確認することができます。一部の人は手動で全ての顕微鏡写真を調べて誤検知を取り除くのを好みます。たとえば、顕微鏡写真状の炭素端や高コントラストの人工物はしばしば粒子と誤認されます。Display:ボタンからポップアップウィンドウを使うことで、それぞれの顕微鏡写真においてこれを実行できます。マウスの中ボタンを使うことで、粒子を取り除いて下さい。ボタンを押しっぱなしにすることで、広い範囲の誤認粒子を複数取り除けます。忘れずに右ボタンメニューから新しい座標を保存して下さい<br />
<br />
一旦、全部の結果を満たしたとき、ディスクスペースに保存するために、最初のステップで書き出したFOMマップを削除したくなる可能性がある。手軽に行うためにJob actionsボタンから、Gentle cleanオプションを使うことができます。<br />
<br />
一旦、座標全体セットを満たしたら、Partcle extractionを再実行する必要があり、以前のデータを全て保つために、しかし、Input coordinatesを自動検出で新しく生成されたものに変えます。これは下記のよりよい精製のために使われる初期単粒子データセットを作成します。おそらく、allmics_autopickedのようなエイリアスが有意義です。<br />
<br />
Once you are happy with your entire set of coordinates, you will need to re-<br />
run a Particle extraction job, keeping everything as before, but change the<br />
Input coordinates for the newly generated, autopick ones. This will gener-<br />
ate your initial single-particle data set that will be used for further refinements below. Perhaps an alias like allmics_autopicked would be meaning ful?<br />
<br />
====3.8.1 The shrink parameter(縮小値)====<br />
<br />
より速い処理を可能にするために。RELIOM-2.0の顕微鏡写真のフィルタリングオプションは--shrinkという新しいコマンドライン引数を通して実行されます。最もシンプルな使い方は--shrink 0と使うことです。しかし、これはもっと制御して使うことができます。その場合は、次の方法に従って動作して下さい。<br />
<br />
--shrinkの初期状態の値は1.0です。これは影響がなく、顕微鏡写真に全くフィルターをかけません。これは以前のバージョンのRELIONの自動検出と同一の動作をします<br />
<br />
● --shrink val = 0 <br />
では、顕微鏡写真をテンプレート参照のローパスと同じように、--lowpassまでpassさせる結果になります。これは単粒子解析(らせん状検出ではない)のために使うことをお勧めします。<br />
<br />
● --shrink 0 < val ≤ 1 <br />
では、size= val ·micrograph sizeにした結果になります(valとは顕微鏡写真のオリジナルサイズをスケールファクターとして適用したもの)<br />
<br />
● --shrink val > 1<br />
では。 size = val − (val mod 2)、すなわち、valよりも低い値の中で最も近い偶数になります。これは顕微鏡写真に特定の(偶数の)整数サイズ与える方法です。<br />
<br />
もし新しいサイズが--lowpassよりも小さい場合、これは要求された(あるいは初期設定の)解像度を超えたこの限界の解像度なので、非致命的な警告をならす結果となります。RELIONの自動検出は多くのFFTを実行するため、顕微鏡写真のサイズはFFT計算の落とし穴の大部分を避けるように自動的に調整されます。この手順と無効のさせ方はそれぞれのユーザーの実行する自動検出の初期主力内に表記される。<br />
<br />
=== 3.9 Particle sorting(粒子ソート) ===<br />
<br />
RELIONには整列させたそれぞの粒子の間で、CTF-corrected参照に基づいた粒子の素早いソートをする機能があります。ソートプログラムは動作タイプ:Particle sortingかあらアクセスすることができ、それぞれの粒子が参照できるときなら、いつでも動かせます。たとえば、Auto-pickingの後や2D classification、3D classificationo、3D auto-refaineの後などです。デモンストレーションのために自動検出の後にこれを動かしましょう。<br />
<br />
I/Oタブでは以下のように設定してください。<br />
<br />
● Input particles to be sorted: Extract/allmics autopicked/particles.star<br />
(このファイルは自動検出後にプログラムから取り出すことで生成されました。2D classification , 3D classification または、 3D auto-refine動作の場合は、最後の反復動作後の_data.starを入力するべきです。)<br />
<br />
● Are these from an Extract job? Yes<br />
(入力粒子が 2D classification、3D classification、3D auto-refine動作由来の場合、これをNoにセットしてください。)<br />
<br />
● Autopicking references: Select/templates4autopick/class averages.star<br />
(取り出された粒子のための座標に与えた自動検出のために使われた参照元を入力してください。)<br />
<br />
CTF タブ上では以下のように設定してください。<br />
● Are References CTF corrected? Yes<br />
● Ignore CTFs until first peak? No<br />
<br />
このプログラムはとても早く(分単位で)動作します。複数のMPI processorsを動かす必要がないほどです。おそらくエイリアスとしてafter_sortingを使えると思います。この動作は出力ディレクトリにparticles_sort.starと呼ばれるファイルを生成します。このファイルはインプットファイルと同じになるだろう。しかし、PartileSelectZScoreと呼ばれる列の追加がります。動作タイプ:Subset selectionでこのファイルを選択することが出来ます。OR select from particles.starとライン上で入力してください。ポップアップディスプレイウィンドウ内にて、新しい列に基づいて粒子を見えるようにできます。ディスプレイの下に良い粒子と良くない粒子の強度傾向が出てきます。これは下からスクロールアップが出来ます。また、特定の点を決めることができ、これを下回る粒子すべては捨てるべきものとすることができます。マウスの右クリックメニューのSelect all aboveを選択して、一つずつ基準となる粒子の選択を外すか、除去する粒子だけを選択します<br />
右クリックメニューを使って、出力STARファイルに忘れずに保存しましょう<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 Analysing the results in more detail ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。<br />
<br />
== 6 High-resolution 4D refinment ==<br />
=== 6.1 Running the job ===<br />
<br />
=== 6.2 Analysing the results ===<br />
<br />
== 7 Mask creation & Postprocessing(マスク作成&後処理) ==<br />
===前書き===<br />
3次元自動精製を実行した後は、マップが鋭くなっている必要がある。それも、<br />
<br />
自動精製物の内部の至適基準FSCカーブは隠されてないマップのみ使う(Use solvent-flattened FSCsオプションを使っていない場合に限る)。これは実際の解像度は実際の精製の間に概算を下回っているということを意味している。なぜなら、溶解可能範囲のノイズがFSCカーブよりも低くなるからです。RELIONにおけるB-factor sharpening と、マスク化したFSCカーブ[2]を計算するための手順は、"post-processing"と呼ばれています。しかし最初には、マスクを作る必要が精製タンパク質末端と溶解可能範囲の開始場所を明らかにするためにマスクを作る必要があります。これは動作タイプ:Mask Creationを使って行います。<br />
=== 7.1 Making a mask (マスク作成)===<br />
I/Oタブ上で3次元自動精製の動作が終わった出力マップ、Refine3D/after_first_class3d/run_class001.mrcを選択してください。Maskタブ上で以下のように設定してください。<br />
<br />
● Lowpass filter map (A): 15<br />
(15Åのローパスフィルターが滑らかな溶解可能マスクのために良い選択と思われる)<br />
● Pixel size (A): 3.54<br />
(この値はローパスフィルターの計算にのみ使われる)<br />
● Initial binarisation threshold: 0.02<br />
(これは例えばタンパク質の範囲の外側にノイズスポットが完全にないと完全に示されたキメラのような、ローパスフィルターのかかったマップの描写についてのしきい値となります。適切なスポットが分かるように敷地を上げたり下げたりしてください。入力マップのローパスフィルターがかけられたバージョンを得るために --lowpass 15 --angpix 3.54という設定のrelion_image_handlerと呼ばれるコマンドラインでのプログラムを使うことが出来ることを覚えておいてください。初期しきい値としてよい値はだいたい、0.01から0.04のあたりである)<br />
● Extend binary map this many pixels: 2<br />
(上記のしきい値はブラック&ホワイトマスクを生成するのに使われる。このマップ中のホワイト値は全ての方向でこのthis many pixelsへ伸びている。初期境界マスクを作るためにこれを使うと、やっかいなことになりにくい)<br />
● Add a soft-edge of this many pixels: 3<br />
(これはマスク上にコサインの形をしたやらかい縁を設置することになります。これは重要なことです。マスクの形に高感度すぎる可能性があるFSCカーブへの、マスクの影響を測定する正しい手順になるからです。マスクの精製は相対的に早いので、しばしば最も適した解像度の概算を得るためのマスク値と使います。)<br />
<br />
Helixタブとfirst3dref_th002_ext2_edg3のようなエイリアスを使うことは無視してください。Display:ボタンを使うことで、マスクの結果を通して切片を見ることが出来る。または、UCSF キメラの中へマスクを入れることが出来ます。後者は良い手法であるかもしれません。自動精製手段から得たマップを一緒にすることことで、マスクのカプセルがからの構造なのかどうかを確認できる。しかし、マスクの中にたくさんの溶媒は残せない。<br />
<br />
=== 7.2 Postprocessing ===<br />
<br />
== 8 Local-resolution estimate ==<br />
定例処理プログラムから解像度の推定はグローバルな推定となる。しかしながらシングルナンバーは、しばしば高分子錯体の再構築がしばしば観測される程の解像度の変化を描写できません。Alp Kucukelbir and Hemant Tagareはマップ全体の解像度の変化を推定する気難しいプログラムを記述する。RELION動作タイプは【Local resolution】を通したプログラムのラッパーを内包する。【I/O】タブ上で以下の通りにして下さい。<br />
<br />
• One of the two unfiltered half-maps: Refine3D/after first class3d/run half1 class001 unfil.mrc<br />
• User-provided solvent mask: MaskCreate/first3dref th002 ext2 edg3/mask.mrc<br />
• Calibrated pixel size: 3.54<br />
<br />
(時には、正しいピクセルサイズだと思ったモデルを構築し始めたときに、実際には数パーセントずれていたことがわかります。RELION内では、この時点までの全てが一貫しています。そのため、再度マップを精製、データのクラス化をする必要がない。正確なマップと最終的な解像度推定のためにここに正しいピクセルサイズを指定するだけです。)<br />
【ResMap】タブ上で以下の通りにして下さい。<br />
<br />
ResMap executable: /where/ever/it/is/resmap.exe<br />
<br />
(resmap実行可能ファイルへのパスを指定します。シェル上で環境変数$RELION_RESMAP_EXECUTABLEを定義することで、どのディレクトリ上でもコマンドを打てることに注意して下さい。)<br />
<br />
P-value: 0.05<br />
<br />
(これを変更することはほとんどありません)<br />
<br />
Highest resolution (A): 7<br />
<br />
(ナイキスト周波数は7˚Aです)<br />
<br />
Lowest resolution (A): 10<br />
<br />
(計算上での最低の解像度を指定します)<br />
<br />
Resolution step size (A): 0.5<br />
<br />
(よりステップ数を増やせば、より正確なローカルリソルーションマップの結果導き出すが、より実行時間は長くなる。)<br />
<br />
first3refのようなエイリアスを使用して下さい。RASMAPプログラムからポップアップ画面上に表示されたら、緑色の線が水平であるかどうかを確認してください。それを変更するためには、RESMAP上のGUIからフィルターボタンを利用して下さい。しかしながら、RELION上でマップを生成し、変化させる必要がないことにしばしば気がつくでしょう。resmapプログラムが完了するまでに時間がかかることがあります。Resmap/first3dref/half1_resmap.mrcの結果は、UCSF chimera上でTools -> Volume data -> Surface colorと選択した後、【volume data value】で選択したローカル解像度によってPostprocess/first3dref/postprocess.mrcのマップに色をつけ、rasmapファイルをブラウズするために使われる。この特別な場合、データが低解像度処理されてたことや、ベータガラクトシダーゼは非常に柔軟な粒子ではないために、ローカル低解像度のバリエーションは見るに良いというわけではないです。しかし、とにかく全体を知るのはいいことです。<br />
<br />
== 9 Moving-processing & particle polishing ==<br />
=== 9.1 ===<br />
=== 9.2 ===<br />
=== 9.3 ===<br />
=== 9.4 ===<br />
<br />
== 10 Wrapping up ==<br />
どうやって最終的な再構築を成すか気になるでしょう。【Finished jobs】リストから実行する最後の動作を選択し、【Job actions】ボタンから【Make flowchart】オプションを試して下さい。これを実行するには、【LATEX】や【TikZ】をコンピューターにインストールする必要があります。最初のフローチャートはどうやってここまで終わらせるかについて示します。10ステップ以上からなるフローチャートは複数の塊に別けられる。ワークフローでブランチを切られる。したがって、動作の終わり毎にしたがって切られるブランチからなるフローチャートもある。ブルーボックスをクリックすることで、PDBファイル内の位置に相当するデータを得られる。最後のページには、正確な動作名のないフローチャートが表示されます。これは、出版目的に役立ちます。<br />
以上です!このチュートリアルを楽しんで、それが役に立つことを願います。もし他にRELIONについて質問があるならば、最初にRELION WikiのFAQとCCPEMメーリングリストを確認してみてください。もし望んだ情報が得られなければ、CCPEMリストを利用して質問してみてください。Sjorsにダイレクトメールをしないで下さい。質問すべてに返答できるわけでなありませんのでご了承下さい。<br />
もしRELIONが利用者の研究に有益であると判断できましたら、私たちの論文を引用したり、周りに伝えてみてください。<br />
<br />
== References ==<br />
[1] Xiao-chen Bai, Eeson Rajendra, Guanghui Yang, Yigong Shi, and Sjors HW Scheres. Sampling the conformational space of the catalytic subunit of human -secretase. eLife, 4, December 2015.<br />
<br />
[2] Shaoxia Chen, Greg McMullan, Abdul R. Faruqi, Garib N. Murshudov, Judith M. Short, Sjors H W Scheres, and Richard Henderson. High-resolution noise substitution to measure overfitting and validate resolution in 3d structure determination by single particle electron cryomicroscopy. Ultramicroscopy, 135:24–35, December 2013.<br />
<br />
[3] Timothy Grant and Nikolaus Grigorieff. Measuring the optimal exposure for single particle cryo-EM using a 2.6 reconstruction of rotavirus VP6. eLife, 4:e06980, 2015.<br />
<br />
[4] Alp Kucukelbir, Fred J Sigworth, and Hemant D Tagare. Quantifying the local resolution of cryo-EM density maps. Nature methods, 11(1):63–65, January 2014.<br />
<br />
[5] Xueming Li, Paul Mooney, Shawn Zheng, Christopher R Booth, Michael B Braunfeld, Sander Gubbens, David A Agard, and Yifan Cheng. Electron counting and beam-induced motion correction enable near-atomicresolution single-particle cryo-EM. Nature methods, 10(6):584–590, June 2013.</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-10T02:58:50Z
<p>Fisherman1: /* 1.8 Download the test data */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
このチュートリアルでは、さまざまなベータガラクトシダーゼの再構成を計算するために使用される顕微鏡写真のサブセットであるテストデータセットを使用しています[13,2,17]。計算負荷を軽減するために、これらのデータを2倍ダウンサンプリングしました。データは、次のコマンドを使用してダウンロードして解凍することができます。<br />
wget ftp://ftp.mrc-lmb.cam.ac.uk/pub/scheres/relion20-tutorial.tar.gz<br />
gunzip relion20_tutorial.tar.gz<br />
tar -xf relion20_tutorial.tar<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
=== 2.4 Helical processing ===<br />
=== 2.5 Other new functionalities ===<br />
=== 2.6 How this tutorial works ===<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-10T02:47:17Z
<p>Fisherman1: /* 1.7 Install RESMAP */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
ローカル解像度推定もRELIONの一部ではありません。 代わりに、RELIONはAlp KucukelbirのRESMAP [4]にラッパーを提供します。 AlpのRESMAPウェブサイトからダウンロードし、彼のインストール手順に従ってください。<br />
<br />
=== 1.8 Download the test data ===<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
=== 2.4 Helical processing ===<br />
=== 2.5 Other new functionalities ===<br />
=== 2.6 How this tutorial works ===<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-10T02:43:18Z
<p>Fisherman1: /* 1.6 Install CTF-estimation software */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
CTF推定はRELIGIONの一部ではありません。代わりに、RELIONは、Niko GrigorieffのCTFFIND3 [6]、またはAlexis Rohou、CTFFIND4 [7]によって書かれたこのプログラムの次世代へのラッパーを提供します。NikoのCTFFINDのWebサイトからダウンロードし、インストール手順に従ってください。また、あなたのマシンにNVIDIAグラフィックスカード(GPU)を持っている場合は、Kai ZhangのGCTF [18]を使用することもできます。これはKaiのウェブサイトLMBからダウンロードできます。<br />
<br />
=== 1.7 Install RESMAP ===<br />
=== 1.8 Download the test data ===<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
=== 2.4 Helical processing ===<br />
=== 2.5 Other new functionalities ===<br />
=== 2.6 How this tutorial works ===<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-10T02:26:54Z
<p>Fisherman1: /* 1.5 Install motion-correction software */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
RELION-2.0は、全フレーム顕微鏡写真ムービー認識[5]に使用されるUCSFプログラムMOTIONCORRへのラッパーを提供します。Yigan Chengのページからプログラムをダウンロードし、インストール手順に従ってください。また、Niko grigorieffのグループからUNBLUR [3]を使用することもできます。 NikoのUNBLUR Webサイトからダウンロードしてください。<br />
<br />
=== 1.6 Install CTF-estimation software ===<br />
=== 1.7 Install RESMAP ===<br />
=== 1.8 Download the test data ===<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
=== 2.4 Helical processing ===<br />
=== 2.5 Other new functionalities ===<br />
=== 2.6 How this tutorial works ===<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
relion内の同じデータから再構築されていないマップは、おそらく正しいグレースケールではない。<br />
<br />
・Initial low-pass filter (A): 50<br />
リファインメントプロセスにバイアスを導入する可能性があるため、高解像度の開始モデルは使用してはいけない。[9]で説明したように、初期マップをできる限りフィルタリングする必要がある。 小さいパーティクルでは通常40〜60Åの値を使用する。<br />
<br />
・Symmetry: C1<br />
このサンプルにはD2の対称性があることはわかっているが、どのような対称性も持たない初期分類を行うアイデア粒子は適切なものから分離することができ、対称性は再構成された地図で確認された。<br />
<br />
【CTF】タブの設定:<br />
・Do CTF corection? Yes<br />
<br />
・Has reference been CTF-correced? Yes<br />
<br />
<br />
・Have data been phase flipped? No<br />
<br />
・Ignore CTFs untill first peak? No<br />
2D分類ジョブでもそうした場合にのみ、このオプションを使用する。<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-10T02:18:47Z
<p>Fisherman1: /* 1.4 Install RELION */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
RELIONはオープンソースのソフトウェアです。RELION wikiを無料でダウンロードして、インストール手順に従ってください。もし動作投入システム(Sun Grid EngineやPBS/TORQUEなど)に詳しくない場合は、インストール手順の説明に従って、qsub.cshスクリプトの設定に関するヘルプをシステム管理者に問い合わせてください。分散メモリ並列化のためのMPIと共用メモリ並列化のためのPthreadsの両方を使用する計算のハイブリッド並列動作を実行することをお勧めします。動作投入待ち行列システムは、これを可能にするためにいくつかの調整が必要な場合があります。その場合は再度、システム管理者に問い合わせてください。<br />
<br />
=== 1.5 Install motion-correction software ===<br />
=== 1.6 Install CTF-estimation software ===<br />
=== 1.7 Install RESMAP ===<br />
=== 1.8 Download the test data ===<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
=== 2.4 Helical processing ===<br />
=== 2.5 Other new functionalities ===<br />
=== 2.6 How this tutorial works ===<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 Running the job===<br />
<br />
無監視の3D分類は、3D分類ジョブタイプから実行してもよい。<br />
<br />
<br />
【I / O】タブの設定:<br />
・Input images STAR file: Select/class2d_aftersort/particles.star<br />
<br />
・Reference map: Import/initial_3dref/3i3e_lp50A.mrc<br />
<br />
・Reference mask (optional):<br />
<br />
これは空白のままにしておく。リボソーム改良のための大/小サブユニットマスク。 <br />
左が空の場合、最適化によって与えられた粒径の球形マスクタブが使用される。 これにより、分類に与える影響が最小限に抑えられる。<br />
<br />
<br />
【Reference】タブの設定:<br />
・Ref. map is on absolute greyscale: No<br />
<br />
・Initial low-pass filter (A): 50<br />
<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-10T01:49:55Z
<p>Fisherman1: /* 1.3 Install CUDI */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
NVIDIAの比較的最新のGPU(計算能力3.5+以上)をお持ちの場合、オートピッキング、分類、洗練作業を大幅に短縮することができます。GPU加速をサポートするRELIONをコンパイルするには、CUDAをインストールする必要があります。このチュートリアルの準備にはCUDA-7.5を使用しました。 NVIDIAのWebサイトからダウンロードしてください。<br />
<br />
=== 1.4 Install RELION ===<br />
=== 1.5 Install motion-correction software ===<br />
=== 1.6 Install CTF-estimation software ===<br />
=== 1.7 Install RESMAP ===<br />
=== 1.8 Download the test data ===<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
=== 2.4 Helical processing ===<br />
=== 2.5 Other new functionalities ===<br />
=== 2.6 How this tutorial works ===<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 ===<br />
<br />
<br />
<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-10T01:27:37Z
<p>Fisherman1: /* 1.2 Install MPI */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
MPI(massage passing interface)がインストールされたコンピューティングクラスタ(もしくはNVIDIA GPU搭載のマルチコアデスクトップマシン)が必要になることに注意してください。RELIONをコンパイルするには、mpi-develパッケージが必要です。種類(openMPI、MPICH、LAM-MPIなど)またはバージョンはおそらくそれほど重要ではありません。まだmpi-develがインストールされていない場合は、openMPIをインストールすることをお勧めします。<br />
<br />
=== 1.3 Install CUDI ===<br />
=== 1.4 Install RELION ===<br />
=== 1.5 Install motion-correction software ===<br />
=== 1.6 Install CTF-estimation software ===<br />
=== 1.7 Install RESMAP ===<br />
=== 1.8 Download the test data ===<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
=== 2.4 Helical processing ===<br />
=== 2.5 Other new functionalities ===<br />
=== 2.6 How this tutorial works ===<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 ===<br />
<br />
<br />
<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-10T01:11:23Z
<p>Fisherman1: /* 1.1 Recommended reading(参考書) */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
=== 1.3 Install CUDI ===<br />
=== 1.4 Install RELION ===<br />
=== 1.5 Install motion-correction software ===<br />
=== 1.6 Install CTF-estimation software ===<br />
=== 1.7 Install RESMAP ===<br />
=== 1.8 Download the test data ===<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
=== 2.4 Helical processing ===<br />
=== 2.5 Other new functionalities ===<br />
=== 2.6 How this tutorial works ===<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 ===<br />
<br />
<br />
<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-10T01:10:51Z
<p>Fisherman1: /* 1.1 Recommended reading(参考書) */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
=== 1.3 Install CUDI ===<br />
=== 1.4 Install RELION ===<br />
=== 1.5 Install motion-correction software ===<br />
=== 1.6 Install CTF-estimation software ===<br />
=== 1.7 Install RESMAP ===<br />
=== 1.8 Download the test data ===<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
=== 2.4 Helical processing ===<br />
=== 2.5 Other new functionalities ===<br />
=== 2.6 How this tutorial works ===<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 ===<br />
<br />
<br />
<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-10T01:10:23Z
<p>Fisherman1: /* 1.1 Recommended reading */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading(参考書) ===<br />
RELIONの品質向上の背景には以下の論文があります。<br />
●S.H.W. Scheres (2012) "RELION: Implementation of a Bayesian approach to cryo-EM structure determination" ''J.Struc. Biol.'', 180, 519-530.<br />
●S.H.W. Scheres (2012) "A Bayesian view on cryo-EM structure determination" ''J.Mol. Biol.'' 415, 406-418.<br />
RELIONの使い方の包括的な概要に関しては以下の論文を参考にしています。<br />
●S.H.W. Scheres (2016) "Processing of structurally heterogeneous cryo-EM data in RELION" ''Meth. Enzym.'', in press.<br />
<br />
=== 1.2 Install MPI ===<br />
=== 1.3 Install CUDI ===<br />
=== 1.4 Install RELION ===<br />
=== 1.5 Install motion-correction software ===<br />
=== 1.6 Install CTF-estimation software ===<br />
=== 1.7 Install RESMAP ===<br />
=== 1.8 Download the test data ===<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
=== 2.4 Helical processing ===<br />
=== 2.5 Other new functionalities ===<br />
=== 2.6 How this tutorial works ===<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 ===<br />
<br />
<br />
<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-10T00:50:22Z
<p>Fisherman1: /* 1 Getting prepared */</p>
<hr />
<div>== 1 Getting prepared(準備) ==<br />
=== 1.1 Recommended reading ===<br />
=== 1.2 Install MPI ===<br />
=== 1.3 Install CUDI ===<br />
=== 1.4 Install RELION ===<br />
=== 1.5 Install motion-correction software ===<br />
=== 1.6 Install CTF-estimation software ===<br />
=== 1.7 Install RESMAP ===<br />
=== 1.8 Download the test data ===<br />
<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
=== 2.4 Helical processing ===<br />
=== 2.5 Other new functionalities ===<br />
=== 2.6 How this tutorial works ===<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 ===<br />
<br />
<br />
<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。</div>
Fisherman1
https://www.yasunaga-lab.bio.kyutech.ac.jp/EosJ/index.php/RELION%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB
RELIONチュートリアル
2017-02-10T00:48:32Z
<p>Fisherman1: /* 1.Getting prepared */</p>
<hr />
<div>== 1 Getting prepared ==<br />
=== 1.1 Recommended reading ===<br />
=== 1.2 Install MPI ===<br />
=== 1.3 Install CUDI ===<br />
=== 1.4 Install RELION ===<br />
=== 1.5 Install motion-correction software ===<br />
=== 1.6 Install CTF-estimation software ===<br />
=== 1.7 Install RESMAP ===<br />
=== 1.8 Download the test data ===<br />
== 2 What's new in RELION-2.0? ==<br />
=== 2.1 The GUI ===<br />
=== 2.2 Optimise computations for your stepup ===<br />
=== 2.3 On-the-fly processing running scheduled jobs ===<br />
=== 2.4 Helical processing ===<br />
=== 2.5 Other new functionalities ===<br />
=== 2.6 How this tutorial works ===<br />
<br />
== 4. Reference-free 2D class averaging (参照無2次元クラス平均) ==<br />
=== 前書き===<br />
良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。<br />
<br />
前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。<br />
<br />
良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。<br />
<br />
=== 4.1 Running the jobs (動作の実行)===<br />
このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。<br />
Input images STAR file: Select/after_sorting/particle.star<br />
現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。<br />
Number of class: 100<br />
この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。<br />
<br />
動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。<br />
<br />
この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。<br />
<br />
=== 4.2 Analysing the results in more detail(より詳細な結果の分析) ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。<br />
2D クラス平均算出の最終反復時では、以下のファイルが作成されます。<br />
<br />
● Class2D/allparts_run1/run_it025_classes.mrcs <br />
<br />
これはクラス平均結果をMRCスタックしています。これらはメインGUIのDisplay: ボタンから _modal.star を選択したときに表示される画像です。RELION は GUIから選択した場合、完全なCTF補正かかることに注意して下さい。そのためクラス平均はおそらくモノクロになります。もしデータが良ければ、その画像はローパスフィルターをかけた原子モデルにとてもそっくりな投影になります。<br />
2D クラス平均の質は3Dマップがうまくいくかどうかの指標になります。我々はタンパク質ドメインの投影を用いた内部構造と、理想的には平らになっているであろう粒子周りの溶解可能領域を見たいと思う。<br/><br />
溶解可能領域の放射状に伸びた筋は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification アルゴリズムのE-step内で解像度に制限をかけてみて下さい。<br />
<br />
●Class2D/allparts_run1/run_it025_model.star <br />
<br />
これは実際のクラス平均に沿って精製されたモデルパラメーター(classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比の球体平均、全てのグループのノイズスペクトラム、など)を含んでいます。<br />
<br />
less コマンドを使って、このファイルの中身を見てください。特に、data_model_classesテーブルのそれぞれのクラスの粒子分布を確認して下さい。これとクラス平均を比較すると、低解像度のクラスにある粒子はほとんどない一方で、高解像度のクラスに存在する粒子は多いと分かる。<br />
<br />
平均的に少ない粒子を通しての平均化は自然と低いシグナル対ノイズ比になりますので、このときにベイズ推論的な考えを持つことが重要になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N テーブルに保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model_group_Nテーブルに保存されます。data_model_groupsテーブルはそれぞれのグループにて精製されたscale-factor強度を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、平均よりも低い値をもつグループは相対的に低いシグナルである)<br />
<br />
これらの値はデフォーカスと相互関係があることが多いだけでなく、汚れのの蓄積や氷の厚さに影響される。<br />
<br />
<br />
●Class2D/allparts_run1/run_it025_data.star<br />
<br />
これはそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報の他に、最適な方向、最適なクラス課題、対数尤度への寄与、などなどに関する追加情報。<br />
<br />
このファイルは再度新しく洗練されたデータをstarファイル同様の形式のでの入力に使用される。<br />
<br />
●Class2D/allparts_run1/run_it025_optimiser.star <br />
<br />
これは終了しなかった場合の再起動に必要な精製過程についての全体的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したクラス平均を比較できる)、Finished jobs パネルの中で以下の機能を選択できる。I/O タブ上で、Continue from hereから上記のファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。また、Sampling タブで緻密な角度や並列処理をするサンプリング比率を選ぶかもしれない。optimiser.starファイルのもう1つの有用な特徴が1行目に、これを動かすために与えられた正確なコマンドライン引数コメントが含まれています。<br />
<br />
●Class2D/allparts_run1/run_it025_sampling.star <br />
<br />
これはサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。<br />
<br />
=== 4.3 Making groups ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
RELIONの粒子グループはともに以下のふたつのことを実行します。氷の厚さ、デフォーカスまたは汚染のためのスペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。<br />
<br />
通常、顕微鏡写真上の全ての粒子は別々のグループとして扱う。この動作は顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなります。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということに注意しておいて下さい。<br />
<br />
顕微鏡写真ごとに粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、RELION 2.0での新しいGUIとして【Subset selection】上で便利な機能が追加されています。それは【I/O】タブ上で _model.starファイルを選択した時、【Regroup particle?】と表示された時【Yes】と入力し、【Approximate nr of groups : 5】と【Class option】タブで入力することで、すべての粒子を5つのグループに分類できます。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのRELIONでは避けられた方法でした。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。<br />
<br />
RELIONは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意しておいて下さい。RELIONは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正されます。<br />
<br />
== 5. Unsupervised 3D classification (教師無3次元クラス分類) ==<br />
=== 前書き ===<br />
全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。<br />
<br />
すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない<br />
<br />
<br />
この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。<br />
=== 5.1 ===<br />
<br />
<br />
<br />
<br />
<br />
【Optimisation】タブの設定:<br />
・Number of class: 4<br />
より多くのクラスを使用すると、多様な情報が含まれているデータセットがより多くのサブセットに分割されます。計算のコストCPUとメモリに関係して、クラスの数に比例して増加します。<br />
<br />
・Number of iterations: 25<br />
これは今後変更する必要はありません。<br />
<br />
・Regularisation parameter T: 4<br />
Tの定義については[10]を参照してください。低温EM2D分類では、通常、Tは1~2を設定し、3D分類では2~4を設定する。ネガティブ染色の場合、少し低い値が効果的な時があります。クラス平均が荒々しく見える場合はTの値を低くし、逆にクラス平均の解像度が低すぎる場合はTの値を高くします。高解像度のノイズを大きく認識することが主になります。あらかじめ計算された結果に2という値を使用しました。おそらく4を設定しても同じようにうまくいくでしょう。<br />
<br />
・Mask diameter (A): 200<br />
前回の【2D classification】の動作タイプと同じ値を使用してください。<br />
<br />
・Mask individual particles with zeros? Yes<br />
<br />
・Limit resolution E-step to (A): -1<br />
正の値を指定すると、この値を超える周波数はアラインメントに含まれません。これは過適合を防ぐのにも役立ちます。ここではそれは本当に必要にではありませんが、10~15Aに設定されている可能性があります。<br />
<br />
【Sampling】タブでは、通常何かを変更する必要はありません(正20面体のような大型で高度に対称な粒子の場合、線量1は典型的にはこの時点で3.7度の角度サンプリングを使用します)。【Helix】タブを無視し、以前の【2D-classification】の場合と同様に【Compute】タブに記入してください。ここでも、【Running】タブで、使用する【Number of MPI processors(MPIプロセッサの数)】と【threads(スレッド数)】を指定できます。【2D classification】の動作タイプで説明したように、3D分類は2D分類よりも多くのメモリを必要とするため、より多くのスレッドが使用されることがあります。しかし、この場合、画像はかなり小さく、RAM不足はそれほど大きな問題ではないかもしれません。おそらく、最初の3D分類を示すために[first_exhaustive]のようなエイリアスを使用でき、徹底的な角度検索を使用しているのではないでしょうか。<br />
<br />
洗練された再構成を分析する際には、UCSFキメラなどのしきい値マップだけでなく、スライスでそれらを見ることも非常に便利です。スライスビューでは、未解決の異質性のより良い印象を受けるでしょう。これは、スライスに不鮮明な領域や縞状の領域として表示されます。スライスはまた、溶媒領域の平坦性の良好な印象を与える。[Display]を使用します。ボタンを押して、最後の反復からの再構成のいずれかを選択してRELIONのスライスビューを開きます。<br />
<br />
レンダリングされた地図を3Dで見ると UCSFキメラを使用すると、マップが細分化の間にわずかに回転する可能性があるので、それらをすべて最良のものに合わせることはしばしば良い考えです。キメラでは、【Tools】 - > 【Volume Data】 - > 【Fit in Map】ツールを使用します。お互いに並んでいる複数のマップを見るには、【Tools】 - > 【Structure Comparison】 - >【Title Structures】ツールと、【Viewing】ウィンドウの【independent】中心回転方法を組み合わせたものが好ましいです。<br />
<br />
2D分類の場合と同様に、【Subset selection】を使用して、1つ以上のクラスに割り当てられた粒子のサブセットを選択することができます。【I/O】タブで、_model.starファイルのサブセットを最後の反復から選択します。表示された表示ウィンドウには、4つの洗練されたモデルの中央スライスが表示されます。最適なクラスを選択し、マウス右クリックポップアップメニューを使用して対応する粒子を保存します。class3d_first_exhaustiveのようなエイリアスを使用してください。<br />
<br />
=== 5.2 ===<br />
<br />
''ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。''<br />
''お急ぎの方はこのセクションをスキップしても構いません。''<br />
<br />
出力ファイルは基本的に2dクラス化の実行時と同じです。(実際に2d,3dクラス精製時に同じ記法を利用している)唯一の違いは、以前に出力された2Dクラス平均に関するシングルMRCスタックとは対照的に、各クラスのマップが別々のMRCマップとして保存されることです。<br />
<br />
今まで通り、よりクラスが小さいと、大きなクラスより精密にローパスフィルターにかけられ、スペクトルのシグナル対ノイズ比が【_model.star】ファイルの【data_model_class_N】テーブル(N = 1,,,,K)に保存されます。おそらく今がSTARファイルから任意のタイプのデータを抽出するのに便利な2つの手軽なスクリプトを導入するいい機会です。以下の通りにタイプして下さい。<br />
<br />
relion_star_printtable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
<br />
上記はdata_model_class_1テーブルから解像度に関する(rlnResolution)コラムとスペクトルのシグナル対ノイズ比に関する(rlnSsnrMap)コラムを画面に出力します。ここでそのファイルを参照して、お気に入りの言語でプロットできます。もし、使用者のコンピューターに【gnplot】がインストールされているのであれば、以下の通りにタイプして下さい。<br />
<br />
relion_star_plottable Class3D/first_exhaustive/run_it025_model.star data_model_class_1 rlnResolution rlnSsnrMap<br />
<br />
実行が収束したかどうかを確認するには(上記のように)、以下でも確認できます。<br />
<br />
grep _rlnChangesOptimalClasses Class3D/first_exhaustive/run_it???_optimiser.star<br />
<br />
今までで分かるように、STARファイルはさまざまなタイプの入出力データを扱うのに非常に便利なツールです。得られた結果の分析するための柔軟で強力なツールとなる【relion_star_printtable】のようなスクリプトは、だいたい【grep】や【awk】のようなlinuxのシェルコマンドと併用して実行できる。</div>
Fisherman1