Protein Annotation Workflow


Protein Annotation Workflowはアミノ酸配列から立体構造に関する様々な情報を提供することを目的としています。

使用方法

  1. アミノ酸配列を入力
  2. 膜タンパク質関連予測を行うかを選択する (All beta prediction, beta-sheet region prediction, Cellular localization prediction)
  3. メールアドレスを入力
  4. submitボタンをクリック
  5. 計算が始まり、20-60分程度(jobが多い時または配列が大きい時は60分を越える場合もあり)で終了後、計算完了のメールが到着
  6. メールに結果を示すURLが記載されており、そのURLから結果を参照
PageTop

使用プログラム

このWorkflowは以下のプログラムを使用しています。

PageTop

計算結果の見方

サマリー画像画面

summary result 詳細以外の全ての結果をサマリー及び画像として表示している。

上から順に二次構造予測、構造認識、埋もれ残基予測、ディスオーダー予測、 SwissProt検索結果、InterProScan検索結果、膜タンパク質予測、ベータシート膜タンパク質関連予測、細胞内局在予測結果を表示している。

画像は右横の説明にあるように予測対象毎に色別に表示している。 またConfidenceは0-10(0-1.0)の範囲で確率を示している。 残基毎の詳細は右横のDetailsをクリックすると表示される。

画面例は右記に表示。

PageTop

二次構造予測

second str 全体を俯瞰比較可能な帯状画像とアミノ酸文字ベースの2種類が用意されている。

COILSを除く各プログラムにはConfidence Levelの文字列が表示されている。 画面右側にはユーザの入力した問い合わせ配列が表示され、それぞれのアミノ酸配列について、対応するプログラムで予測した2次構造予測領域を表示する。 PSIPRED、Jnet、SABLEの場合、赤色で表示されているアミノ酸領域をHelix、橙色で表示されている領域をSheet、黒色で表示されている領域をその他の構造としている。

一方、COILSの場合、黄緑色で表示されている領域がcoiled-coilと予測された領域であり、黒色はそれ以外の領域を示している。 COILSを除く各アミノ酸残基の下には0から9のConfidence Levelが表示される。 また、アミノ酸配列及びConfidence Levelは全て10残基ごとに区切られており、これらは問い合わせ配列のアミノ酸残基と一致するように並べられている。

詳細画面例は右記に表示。

PageTop

アミノ酸残基埋没度予測

buried 二次構造予測と同様に全体を俯瞰比較可能な帯状画像とアミノ酸文字ベースの2種類が用意されている。

Jnetの場合、下部にSOL25、SOL5、 SOL0の文字列が表示され、それぞれ25% Accessible、5% Accessible、0% Accessibleの3つの条件による予測が行われていることを意味している。 画面右側にはユーザの入力した問い合わせ配列が表示され、それぞれのアミノ酸配列について、対応するプログラムで予測したアミノ酸の埋没度予測結果を表示する。 空色で表示されている領域が埋もれているアミノ酸残基と予測されたことを示している。

一方、SABLEの場合、画面右側にはBuried及びConfidence Levelの文字列が、画面左側には各アミノ酸の埋没度を数値で表現したものが表示される。 この場合、埋没していると予測されるアミノ酸残基ほど値は0に近く、露出していると予測されているアミノ酸残基は9に近い値を取る。 Confidence Levelは0から9の範囲で表示される。

詳細画面例は右記に表示。

PageTop

Disorder予測

disorder 二次構造予測と同様に全体を俯瞰比較可能な帯状画像とアミノ酸文字ベースの2種類が用意されている。

Disorder予測を行ったプログラム名が POODLE-S、POODLE-L、POODLE-T、POODLE-W、これらの結果を統合したFinal Disorder Prediction(赤文字)の順番で表示される。

POODLE-Wを除く各プログラムにはConfidence Levelの文字列が表示されている。

POODLE-S、POODLE-L、POODLE-T、Final Disorder Predictionの場合、画面右側にはユーザの入力した問い合わせ配列が表示され、それぞれのアミノ酸配列について、対応するプログラムで予測した Disorder領域を表示する。 この場合、黒色で表示されているアミノ酸残基をOrder、青色で表示されているものをDisorderとしている。 また、各アミノ酸残基の下には0から9のConfidence Levelが表示され、Disorderと判定されているアミノ酸残基のConfidence Levelは全て5以上である。 表示されているアミノ酸配列及びConfidence Levelは全て10残基ごとに区切られており、これは上方の配列テーブルのアミノ酸残基と一致するように並べられている。

POODLE-Wの場合、画面右側にまずDisorderである確率が0.0001~0.99999の範囲内で表示され、0.50000以上の場合には”Disordered.”、 0.50000未満の場合には”Ordered.”の文字列が表示される。

詳細画面例は右記に表示。

PageTop

構造認識

fold 二次構造予測と同様に全体を俯瞰比較可能な帯状画像とアミノ酸文字ベースの2種類が用意されている。

結果ではヒットしたモデル配列のZ-scoreの高い順に出力される。

画面左側には、問い合わせ配列とヒットしたモデルのID、ヒットした際のZ-score、対応するPDBのID(+チェイン識別子)が表示される。 PDBのIDはリンク付き文字列となっており、クリックするとThe Protein Data Bank(http://www.rcsb.org)に飛ぶ。

画面右側には、ヒットしたモデルのアミノ酸配列が表示され、これらは問い合わせ配列とのアラインメントの情報を保持したまま表示される。 赤色のアミノ酸配列がHelix、橙色がSheet、黒色がそれ以外の構造を表しており、ハイフン”-”は問い合わせ配列とのアラインメントの際に生じたモデル配列側のギャップ、アスタリスク”*”はモデル配列のMissing Region(立体構造の決定されていない領域)を示している。

また、モデル配列には時々Bold体で表示されているアミノ酸残基が存在するが、これはこの残基の直前まで問い合わせ配列側にギャップが生じていることを意味している。 Bold体のアミノ酸にマウスを合わせると、問い合わせ配列に生じたギャップと対応するモデル配列の領域がポップアップ形式で小文字で表示される。 問い合わせ配列にギャップを入れないようにしているため、問い合わせ配列のギャップに対応するモデル配列の領域は全てポップアップで表示している。 Bold体のアミノ酸シンボルにマウスを合わせることで、問い合わせ配列のギャップに対応するモデル配列の領域が小文字で表示される。 最後の文字は大文字で表されるが、これはBold体で表されたアミノ酸と一致する。

また、アスタリスク ”*” はこのモデル配列のMissing Regionであることを示している。

詳細画面例は右記に表示。

PageTop

TMBETA-COMP

tmbetanet ベータストランド領域がアミノ酸配列上に赤で示され、同時にセグメント毎の情報も表示される。

また確率も同様に色分けされアミノ酸配列上に表示される。

詳細画面例は右記に表示。

PageTop

TMBETA-DISC

tmbetadisc 左から順に残基(residue)、頻度(occurence)、組成(composition)、球状タンパク質差異(globular protein diff)、アウター膜タンパク質差異(OMP diff)が表示される。 球状タンパク質差異(globular protein diff)はクエリー配列と球状タンパク質との組成差、アウター膜タンパク質差異(OMP diff)はクエリー配列とアウター膜タンパク質との組成差を意味する。 予測結果は一番下に表示される。

詳細画面例は右記に表示。

PageTop

WoLF-PSORT

Animal, Plant, Fungiの3種の結果が表示される。

PageTop

ご注意: 結果を商用目的に使用する場合、プログラムによっては制限がありますのでご注意下さい。

ご意見、ご質問等は workflow[at]medals.jp へお願い致します。