RELIONのSTARファイル

提供: Eospedia
移動: 案内検索

本ページについて


STARファイル

STARフォーマットで中身が記述されたテキストファイルのことをSTARファイルと呼びます。


STARフォーマット

RELIONでは、メタデータをSTAR (Self-defining Text Archiving and Retrieval)フォーマット(Hall, Allen and Brown, 1991)で読み書き、保存します。STARフォーマットはメタデータをラベル名と値のペアで記述するためのフォーマットです。XMLと類似していますが、STARフォーマットはより可読性が高く、かつファイルサイズも小さく済みます。STARフォーマットは結晶学分野においてCIF(Crystallographic Information Framework)として使われています。電顕分野では、Bernard Haymannが開発したBSOFTパッケージにおいて初めて使用されました。また、Xmipp-3.0も現在STARフォーマットを使用しています。


RELIONにおけるSTARフォーマットは、以下の規則に従っています。(一部はBSOFTのマニュアルから拝借したものです。)

  • ファイル名は".star"拡張子を持つ。
  • 各ファイルは1つ以上のデータブロックから成る。データブロックの開始キーワードは"data_"である。"data_"の後ろには、そのデータブロックを他と区別するための文字列を続けることができる(例:"data_images")。
  • "loop_"キーワードに続けてラベル名を列挙し、その後に各ラベルに対応する値を追加していくことで、データテーブルを作ることができる。値はホワイトスペース(スペース、タブ、EOL、CR)で区切る。ループを終了するには空白行を置く。
  • ラベル名はアンダースコア"_"で開始する。Each label may only be used once within each data block (??)
  • 値は数値または文字列である。スペースを含まない文字列は1個の文字列として認識される。
  • ファイルにはコメントをつけることができる。コメントの書式は3種類ある。
    • ファイルコメント:ファイル内の最初の"data_"キーワードよりも前にあるすべてのテキスト
    • データブロックコメント:行頭が"#"記号または";"記号で始まるテキスト
    • アイテムコメント:Strings on the same line as and following tag-value items, also indicated by a leading "#". (よく意味がわからないがいわゆるインラインコメントのことだと思います)

定義済みラベルの一覧

RELIONで定義済みのラベルの一覧は以下のコマンドで確認できます。簡単な説明付きです。

$ relion_refine --print_metadata_labels

一応こちらに出力を貼っておきます → RELIONの定義済みラベル

以下は、単粒子画像のスタック /lmb/home/scheres/data/VP7/all_images.mrcs の中の1枚目から3枚目について、そのCTF情報を記述したSTARファイルになります。loop_を使って複数のラベルからなるデータを複数個記述する方法に注目してください。

data_images
loop_
_rlnImageName
_rlnDefocusU
_rlnDefocusV
_rlnDefocusAngle
_rlnVoltage
_rlnAmplitudeContrast
_rlnSphericalAberration
000001@/lmb/home/scheres/data/VP7/all_images.mrcs 13538 13985 109.45 300 0.15 2
000002@/lmb/home/scheres/data/VP7/all_images.mrcs 13293 13796 109.45 300 0.15 2
000003@/lmb/home/scheres/data/VP7/all_images.mcrs 13626 14085 109.45 300 0.15 2


以下はコメントを入れてみた例です。(日本語を入れていいのかわからないので英語で入れておきます)

This line is file-comment.
This line is also file-comment.
data_images
# This line is data-comment.
; Data-comment in the other style.
loop_
_rlnImageName # column 1 (This is an item-comment.)
_rlnDefocusU # column 2
_rlnDefocusV # column 3
_rlnDefocusAngle # column 4
_rlnVoltage # column 5
_rlnAmplitudeContrast # column 6
_rlnSphericalAberration # column 7
# First image in the stack
000001@/lmb/home/scheres/data/VP7/all_images.mrcs 13538 13985 109.45 300 0.15 2
# Second image in the stack
000002@/lmb/home/scheres/data/VP7/all_images.mrcs 13293 13796 109.45 300 0.15 2
# Third image in the stack
000003@/lmb/home/scheres/data/VP7/all_images.mcrs 13626 14085 109.45 300 0.15 2


RELION3チュートリアルのSTARファイルたち