Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
グローバル距離テスト
グローバル距離テスト (global distance test、GDT) は、既知のアミノ酸対応を持ちながら (例えば同一のアミノ酸配列)、三次構造が異なる2つのタンパク質構造間の類似性を測定する尺度であり、「合計スコア」を表すためにGDT_TSとも呼ばれる。これは、タンパク質の構造予測の結果を、X線結晶構造解析またはタンパク質NMRによって測定された実験的に決定された構造と比較するために最も一般的に使用される。著者のAdam Zemla氏が説明するGDT測定値は、より一般的なRMSD測定値よりも正確な測定を目的としており、これは構造中の個々のループ領域のモデル化が不十分なために外れ値領域の影響を受けやすいが、それ以外の場合は適度に正確である。GDT_TS測定値は、タンパク質構造予測精密評価 (CASP、Critical Assessment of Structure Prediction) の結果を作成する際の主要な評価基準として使用される。CASPは、現在のモデリング技術の評価と、その主要な欠陥を特定に特化した構造予測コミュニティでの大規模な実験である。一般的にGDT_TSが高いほど、参照構造と比較して与えられたモデルが優れている。
算出
GDTスコアは、2つの構造を重ね合わせた後、実験構造内で位置が定義された距離カットオフ内に収まるような、モデル構造におけるアミノ酸残基のα炭素原子の最大集合として計算される。独自の設計により、GDTアルゴリズムは20個のGDTスコア、すなわち20個の連続した距離カットオフ (0.5Å、1.0Å、1.5Å、...10.0Å) のそれぞれについて計算する。構造類似性評価では、いくつかのカットオフ距離からのGDTスコアを使用することを意図しており、スコアは一般的にカットオフ距離の増加に伴って増加する。この増加の変動が少ない状態( プラトー)は、実験構造と予測構造の間に極端な相違があることを示している可能性があり、妥当な距離の任意のカットオフ内に追加の原子が含まれていないことを示唆する (GDTプロットを参照)。CASPにおける従来のGDT_TSの合計スコアは、1、2、4、8Åのカットオフの平均値である。
オリジナルのGDT_TSは、Local Global Alignment (LGA)プログラムを用いて生成された重ね合わせとGDTスコアに基づいて計算される。GDT_HAと呼ばれる高精度版は、より小さなカットオフ距離 (GDT_TSの半分のサイズ) を選択することによって行われ、参照構造からの大きな偏差に大きなペナルティを課す。それはCASP7の高精度カテゴリで使用されていた。CASP8では、GDT_TSから正解近くにクラスタリングされた残基に対するペナルティを差し引いた新しい「TRスコア」を定義している。これは、予測された構造における立体的な衝突にペナルティを与えるもので、時にはGDTのカットオフ値を駆け引きすることもある。
一次GDT評価では、α炭素原子のみを使用する。タンパク質の側鎖の機能末端に重ね合わせベースのスコアリングを適用するために、側鎖のグローバル距離計算 (GDC_sc) と呼ばれるGDTに似たスコアが設計され、2008年にLGAプログラム内に実装された。GDC_scでは、α炭素原子に基づいて残基位置を比較する代わりに、各側鎖タイプの末端近くにある特徴的な原子を用いて残基-残基距離の偏差を評価する。GDCスコアの「全原子」バリエーション (GDC_all) は、完全なモデル情報を用いて計算され、CASPの主催者や評価者が予測構造モデルの精度を評価するために用いる標準的な尺度の一つである。
参照項目
- 二乗平均平方根偏差 (バイオインフォマティクス) (英語版) - 構造比較尺度
- テンプレートモデリングスコア (英語版) - 構造比較尺度
- 最長連続セグメント (LCS) (英語版) - LGAプログラム内で実装されている構造比較尺度
- グローバル距離計算 (GDC_sc、GDC_all) (英語版) - 類似性を評価するために (α炭素だけでなく) 完全なモデル情報を使用する構造比較尺度
- ローカルグローバルアラインメント (LGA) (英語版) - 構造アラインメントプログラムと構造類似性尺度で、GDT、GDC、LCS、およびLGA_Sがある
参考文献
外部リンク
- GDTプロット - CASP5実験で評価された構造モデルのGDT解析によるプロット例
- GDC、GDT、LCS、LGA記述 - 構造比較と類似性対策に関するサービスとドキュメント