RELIONチュートリアル

提供: Eospedia
2017年2月6日 (月) 02:21時点におけるYamamotoTakayuki0 (トーク | 投稿記録)による版

移動: 案内検索

4. Reference-free 2D class averaging (参照無2次元クラス平均)

前書き

良くない粒子を取り除くために、大抵は参照なし2Dクラス平均を使います。

前項で述べた粒子抽出ステップ(例えば、自動検出結果の手動管理や抽出された粒子の分類)で良い粒子を含もうとしますが、ほとんどの場合、良くない粒子がデータの中にまだ存在しています。

良くない粒子は一緒にうまく平均化しないので、大抵は比較的小さいクラスになりやすく、不適切な2Dクラス平均を算出します。これらを取り除くことで効率的にデータをきれいにします。

4.1 Running the jobs (動作の実行)

このチュートリアルでは動作タイプを【2D classificiation(2次元分類)】にセットし、その中の【I/O】タブは次の通りにセットします。その他オプションは、前述の自動検出のテンプレートを作成した時と同じです。

Input images STAR file: Select/after_sorting/particle.star

現在約10,000個の粒子が存在するので、もっと多くのクラスを利用することができます。従って、【Optimisation(最適化)】タブを次の通りにセットします。

Number of class: 100

この動作は以前に述べた動作のものよりはるかに負担がかかる(アルゴリズムは粒子の数とクラスの数に比例してスケーリングされます)ので、この動作を並列処理することをお勧めします。1つもしくは複数のGPUがある場合、この動作を1時間半分程度で実行できます。aftersortのようなエイリアスを使用できます。

動作が終了したら、_model.staファイルを選択して【Subset select】を起動することができます。class2d_aftersortのようなエイリアスは意味があります。ここで、すべての見栄えの良いクラスをクリックして選択します。(もしくは右クリックメニューオプション【Select all classes above】を使用する。)この時、自動検出において低いしきい値を使用して、高解像度のノイズが蓄積している場合、低解像度の影のように見える【Einstein-from-noise】クラスに気を付けてください。上記の選択は避けて下さい。より良いクラスがすべて選択されたら、マウス右クリックメニューオプションから選択したものを保存します。

この手順は、複数回繰り返すことがあるので、覚えておきましょう。また、2D classficationのあとのデータに残っている異常値を識別するために、ソート(並べ替え)アルゴリズムを再実行できることに注意してください。

4.2 Analysing the results in more detail(より詳細な結果の分析)

ここではRELIONへの興味が深い人向けの、より詳細な情報を含んでいます。 お急ぎの方はこのセクションをスキップしても構いません。

RELION は 2D(3D)classification を繰り返すごとに、ファイルに書き出します。 2D クラス平均算出の最終反復時では、以下のファイルが作成されます。

● Class2D/allparts_run1/run_it025_classes.mrcs 

はclass averages結果のMRCスタックです。これらはメインGUIのDisplay: ボタンをから _modal.star を選択したときにRELION GUI内に表示される画像です。RELION は 多くのCTF correctionを実行する(GUIから選択した場合)ということをメモして下さい。そのため、class averageはおそらく黒背景の上に白です。もしデータが良いならば、その画像はとてもそっくりなローパスフィルターをかけた原子モデルの投影になります。 2D class averagesの質はどのくらい良い3Dマップになるかのよい指標です。我々はタンパク質ドメインの投影を用いて内部構造を見るのを好む、そして溶解可能部分の周りの粒子は、理想的には平らになっている。
溶解可能範囲の放射状に伸びた筋(光線?)は典型的な過剰適合の兆候です。もしこれがおきたときは、2D classification algorithmのE-step内で分析に制限をかけてみて下さい。

●Class2D/allparts_run1/run_it025_model.star 

は、実際のclass averagesに沿って精製されたモデルパラメーター、(すなわち、classを超えた画像の分布、再構成された構造中のシグナル対ノイズ比のspherical平均、全てのグループのノイズスペクトラム、など)を含んでいます。

このファイルを除くと より少ないコマンドを使っている。特に、data_model_classes.内の表のそれぞれのクラスの粒子分布を確認して下さい。もしこれとclass averageを比較したら、ほんの僅かなクラスの粒子が低解像度である一方で、たくさんの粒子のクラスは高解像度だとわかるだろう。

これはベイズ理論の成功において重要ではない。平均的に少ない粒子を通してのaveragingは自然と低いシグナル対ノイズ比になります。それぞれのクラスにおいて概算されたスペクトラル、シグナル対ノイズ比はdata_model_class_N の表に保存されます。同様に、それぞれのグループにおいて概算されたノイズスペクトラムはdata_model?group_Nと呼ばれる表に保存されます。data_model_groupsの表はそれぞれのグループにて精製された強度倍率を保存します。(平均よりも高い値をもつグループはより強力なシグナルを持っている、相対的に低いシグナルのグループは平均よりも低い値である)

これらの値は焦点ぼけと相互関係があることが多いだけでなく、汚染物質を蓄積や氷濃度に影響される。

 

●Class2D/allparts_run1/run_it025_data.star

はそれぞれの粒子に関わる全てのメタデータを含んでいます。particles.star fileに入力した情報に沿って、最適な順応についての情報追加、最適なclass課題、対数尤度への寄与、などなど

このファイルは新作成に入力するために再び使うことが出来ることを覚えておいて下さい。starファイル形式は同じものができます。  

●Class2D/allparts_run1/run_it025_optimiser.star 

は終了しなかった場合の再起動に必要な生成過程についての一般的な情報が含まれています。たとえば、もし25反復後でもまだ収束しなかった過程を考える場合(評価のために反復24と25から出したclass averageを比較できる)、Finished jobs パネルの中でこの機能を選択できる。そして、I/O タブ上で、ココから続けるためにこのファイルを選択することが出来る。そしてそのときに、Optimisationタブ上でNumber of iterations:40 と設定して下さい。おそらくSampling タブで緻密な角度やトランスレーショナルなサンプリング率を選ぶだろう。optimiser.starファイルのもう1つの有用な特徴が1行目にこれを動かすために与えられた正確なコマンドライン宣言コメントが含まれている。  

●Class2D/allparts_run1/run_it025_sampling.star 

はにサンプリング率の採用についての情報が含まれています。このファイルもまた再起動に必要なファイルです。

4.3 Making groups

もしチュートリアルをスルーして早くしたい場合、このセクションはスキップできます。ここでは興味のある読者向けの情報をより詳細に記述しています。

relionの粒子グループはともに以下のふたつのことを実行する。氷の厚さ、デフォーカスまたは汚染のために、スペクトラムノイズ強度平均の推定と、そのデータの異なる部分間全体のシグナル対ノイズ比の違いを表すシングルナンバー強度スケールファクターの推定。

通常、顕微鏡写真上の全ての粒子はそれぞれのグループとして扱う。この振る舞いは顕微鏡写真ごとに多くの粒子が存在する場合良い。しかし、高倍率で扱っている場合、サンプルは非常に希釈されるか、最終的に選択されたものは顕微鏡写真ごとには少数しか粒子が含まれておらず、スケールファクター(またノイズスペクトラ)強度の推定は不安定なものとなる。一般的に各グループに少なくとも10〜20の粒子がある方が良いとしているが、各グループの粒子の初期数は2D,3Dクラス化後より少なくなるだろうということを考慮しておいて下さい。

顕微鏡写真ごとの粒子が殆ど無い場合、複数の顕微鏡写真から粒子グループを作る方が良い。このことから、relion2.0での新しいGUIとして「Subset selection」上で便利な機能が追加されている。それは「I/O」タブ上でmodel.starファイルを選択した時、ある時は「Regroup particle?」と表示された時「Yes」と入力し、「Approximate nr of groups : 5」と「Class option」タブで入力することで、すべての粒子を5つのグループに分類できる。(実際の数は入力値によって幾分変化するため、入力上での近似値となる)この方法は以前の最終バージョンのrelionでは避けられた方法だった。このチュートリアルの顕微鏡写真には十分な粒子が含まれているので、ここではこの手順を使用しません。

relionは、他のプログラムで時々使用されるデフォーカスグループとは非常に異なることに注意してください。relionは常に各粒子に使用されたグループとは無関係に(異方性の)CTF補正される。

5. Unsupervised 3D classification (教師無3次元クラス分類)

前書き

全てのデータセットは違う成分です!この疑問は どのくらい進んで関連付けられるかです。RELIONの 3Dマルチリファレンス精製手順は強力な無監視の3D classification への近道を提供している。しかし、まだ一つ必要になる。低解像度の総意モデルが一緒にスタートとするには。低解像度の初期のクリスタル構造から生成したガラクトシダーゼモデル(PDB-ID 3I3E)を使うとしよう。これはすでに project directory の中に 3i3e_lp50A.mrcという名前で入っている。定型的なプロジェクトの中では良い初期モデルを用意できない可能性がある。その場合は違うプログラムから別のモデルを持ってくる必要がある。RELIONは最初のモデルを生成することはまだできない。   すでにリファレンスモデルを正しいピクセルとボックスサイズで作っています。もしこの事例に当てはまらないモデルを使う場合は、コマンドラインからrelion_image_handler というプログラムを使って、ピクセルサイズ(--anpixelと--rescale_angpixというオプションを使う)とボックスサイズ(--new_box)を変更してもかまわない  

この場合、Importという機能を使って、直接プロジェクトに初期モデルをインポート出来る。ファイルを入力したら、3i3a_lp50A.mrc を選択して、the Node typeで3D referenceを選択して下さい。initial-3drefのようなエイリアスを使う。

5.1

5.2