RELIONのSTARファイル
本ページについて
- https://www3.mrc-lmb.cam.ac.uk/relion/index.php/Conventions_%26_File_formats のMetadata I/Oの節の和訳+追記したものになります。
STARファイル
STARフォーマットで中身が記述されたテキストファイルのことをSTARファイルと呼びます。
STARフォーマット
RELIONでは、メタデータをSTAR (Self-defining Text Archiving and Retrieval)フォーマット(Hall, Allen and Brown, 1991)で読み書き、保存します。STARフォーマットはメタデータをラベル名と値のペアで記述するためのフォーマットです。XMLと類似していますが、STARフォーマットはより可読性が高く、かつファイルサイズも小さく済みます。STARフォーマットは結晶学分野においてCIF(Crystallographic Information Framework)として使われています。電顕分野では、Bernard Haymannが開発したBSOFTパッケージにおいて初めて使用されました。また、Xmipp-3.0も現在STARフォーマットを使用しています。
RELIONにおけるSTARフォーマットは、以下の規則に従っています。(一部はBSOFTのマニュアルから拝借したものです。)
- ファイル名は".star"拡張子を持つ。
- 各ファイルは1つ以上のデータブロックから成る。データブロックの開始キーワードは"data_"である。"data_"の後ろには、そのデータブロックを他と区別するための文字列を続けることができる(例:"data_images")。
- "loop_"キーワードに続けてラベル名を列挙し、その後に各ラベルに対応する値を追加していくことで、データテーブルを作ることができる。値はホワイトスペース(スペース、タブ、EOL、CR)で区切る。ループを終了するには空白行を置く。
- ラベル名はアンダースコア"_"で開始する。Each label may only be used once within each data block (??)
- 値は数値または文字列である。スペースを含まない文字列は1個の文字列として認識される。
- ファイルにはコメントをつけることができる。コメントの書式は3種類ある。
- ファイルコメント:ファイル内の最初の"data_"キーワードよりも前にあるすべてのテキスト
- データブロックコメント:行頭が"#"記号または";"記号で始まるテキスト
- アイテムコメント:Strings on the same line as and following tag-value items, also indicated by a leading "#". (よく意味がわからないがいわゆるインラインコメントのことだと思います)
定義済みラベルの一覧
RELIONで定義済みのラベルの一覧は以下のコマンドで確認できます。簡単な説明付きです。
$ relion_refine --print_metadata_labels
一応こちらに出力を貼っておきます → RELIONの定義済みラベル
例
以下は、単粒子画像のスタック /lmb/home/scheres/data/VP7/all_images.mrcs の中の1枚目から3枚目について、そのCTF情報を記述したSTARファイルになります。loop_を使って複数のラベルからなるデータを複数個記述する方法に注目してください。
data_images loop_ _rlnImageName _rlnDefocusU _rlnDefocusV _rlnDefocusAngle _rlnVoltage _rlnAmplitudeContrast _rlnSphericalAberration 000001@/lmb/home/scheres/data/VP7/all_images.mrcs 13538 13985 109.45 300 0.15 2 000002@/lmb/home/scheres/data/VP7/all_images.mrcs 13293 13796 109.45 300 0.15 2 000003@/lmb/home/scheres/data/VP7/all_images.mcrs 13626 14085 109.45 300 0.15 2
以下はコメントを入れてみた例です。(日本語を入れていいのかわからないので英語で入れておきます)
This line is file-comment. This line is also file-comment. data_images # This line is data-comment. ; Data-comment in the other style. loop_ _rlnImageName # column 1 (This is an item-comment.) _rlnDefocusU # column 2 _rlnDefocusV # column 3 _rlnDefocusAngle # column 4 _rlnVoltage # column 5 _rlnAmplitudeContrast # column 6 _rlnSphericalAberration # column 7 # First image in the stack 000001@/lmb/home/scheres/data/VP7/all_images.mrcs 13538 13985 109.45 300 0.15 2 # Second image in the stack 000002@/lmb/home/scheres/data/VP7/all_images.mrcs 13293 13796 109.45 300 0.15 2 # Third image in the stack 000003@/lmb/home/scheres/data/VP7/all_images.mcrs 13626 14085 109.45 300 0.15 2
RELION3チュートリアルのSTARファイルたち
- Motion correctionジョブのstarファイル
- CTF estimationジョブのSTARファイル
- LoGピッキングのSTARファイル
- Particle extractionジョブのSTARファイル
- 2D classificationジョブのSTARファイル