GoogleAnalytics

SyntaxHighlighter

2011年4月19日火曜日

[PX] S-SAD について私が知っている二、三の事柄 その1

タイトルが「ライフハック」系くさくって、生理的にとても気持ち悪いですが、まぁイイでしょうw

アクセス解析の結果、PX 関連のエントリを同業者は見ていないことが分かりましたので、以降チラ裏モードで行きます。

S-SAD を行なう上において、不明に思う点として、
  1. このタンパク(の結晶)は、S-SAD解析ができるのか?
  2. S-SAD解析をおこなうに適した回折データ収集条件(測定波長、冗長度…)は?
  3. 得られた回折データを、どのようなパラメータで S-SAD解析するか?
の3点が多いのではないでしょうか。

3. について、解析ソフトウェアに「shelx C/D(/E)」を使った場合に私が経験したことを、ちょっと書いてみます。

…長いですよw


1. shelxC の統計値を信用してはいけない

shelxC は、入力された回折強度ファイルについて、いくつかの統計値を出力します(unmerged な回折強度なら、さらに多い)。
shelx C/D/E - CCP4 wiki」によれば、これらの統計値を用いて、データの良し悪しや、次の shelxD のパラメータを決めると良い、なんて書いてあります。

…果たしてホントなんでしょうか?

例えば、ココにこんなことが書いてあります。
1. The resolution cutoff. In the MAD case this is best determined by finding where the correlation coefficient between the signed anomalous differences for wavelengths with the highest anomalous signal (PEAK and HREM or PEAK and INFL) falls below about 30%. For SAD a less reliable guide is where the mean value of |ΔF|/σ(ΔF) falls below about 1.2 (a value of 0.8 would indicate pure noise), and for S-SAD with CuKα the data can be truncated where I/σ for the native data falls below 30. If unmerged data are used, SHELXC calculates a correlation coefficient between two randomly selected subsets of the signed anomalous differences; this is a better indicator because it does not require that the intensity esds are on an absolute scale, but it does require a reasonable redundancy and again the data can be truncated where it drops to below 30% (the CCP4 program SCALA prints a similar statistic).

さらっと要約すると、「shelxD の Resolution Cutoff は、

  1. SAD の場合、【|ΔF|/σ(ΔF)】が 1.2 を下回るとこで切れ(純粋なノイズだと 0.8 )
  2. S-SAD(Cu-Kαで測定した)の場合、  I/σ が 30 を下回るとこで切れ

」と書いてあります。要するに、「これらを満たさないデータではS-SADは上手くいかない」ってことですね。

…ここに、波長1.5Åで360° 測定した Thaumatin 結晶のデータがあります(どこで取ったかは秘密w)。
これを iMosflm で拾って、Scala で Batch スケーリングしたものが、以下のデータになります(出力は unmerged で .sca 形式)。
                                           Overall  InnerShell  OuterShell
  Low resolution limit                       21.46     21.46      1.74
  High resolution limit                       1.66      5.23      1.66

  Rmerge                                     0.186     0.067     0.588
  Rmerge in top intensity bin                0.104        -         -
  Rmeas (within I+/I-)                       0.193     0.070     0.610
  Rmeas (all I+ & I-)                        0.190     0.071     0.603
  Rpim (within I+/I-)                        0.050     0.018     0.163
  Rpim (all I+ & I-)                         0.036     0.014     0.117
  Fractional partial bias                   -0.122    -0.026    -0.304
  Total number of observations              828635     27637    112197
  Total number unique                        31167      1138      4364
  Mean((I)/sd(I))                             13.1      17.8       6.0
  Completeness                                99.3      98.6      98.0
  Multiplicity                                26.6      24.3      25.7

  Anomalous completeness                      99.4      99.6      97.9
  Anomalous multiplicity                      14.3      15.4      13.5
  DelAnom correlation between half-sets     -0.458     0.186    -0.402
  Mid-Slope of Anom Normal Probability       0.592       -         -
…まぁ、きったないデータですねw

これを shelxC にかけてみた統計値が以下の通り。

上記条件のどれにもあてはまりませんw

…でも、ちょっと解析を続けてみましょう。
まずは shelxD…

…むむむ……shelxE は…
決まってるっぽいですね。Coot はこんな感じ。
Wの穴も開いてキレイなマップです、さすが分解能 1.7 Å超。


で、この同じデータを、Scala の「on rotation axis with secondary beam correction」でスケーリングしたのがこちら。
                                           Overall  InnerShell  OuterShell
  Low resolution limit                       21.46     21.46      1.74
  High resolution limit                       1.66      5.23      1.66

  Rmerge                                     0.077     0.048     0.464
  Rmerge in top intensity bin                0.039        -         -
  Rmeas (within I+/I-)                       0.080     0.050     0.482
  Rmeas (all I+ & I-)                        0.080     0.051     0.479
  Rpim (within I+/I-)                        0.021     0.013     0.130
  Rpim (all I+ & I-)                         0.015     0.010     0.093
  Fractional partial bias                    0.000    -0.007    -0.031
  Total number of observations              828494     27560    112200
  Total number unique                        31167      1138      4364
  Mean((I)/sd(I))                             31.4      51.4       9.7
  Completeness                                99.3      98.6      98.0
  Multiplicity                                26.6      24.2      25.7

  Anomalous completeness                      99.4      99.6      97.9
  Anomalous multiplicity                      14.3      15.3      13.5
  DelAnom correlation between half-sets      0.125     0.506    -0.175
  Mid-Slope of Anom Normal Probability       1.042       -         -
…それなりにキレイなデータだったんですね。
shelxC の統計値はこんな感じ。
上記基準はギリギリで満たしてますが、パッと見「これはイケるぜ!」という感じはしません(特に、|ΔF|/σ(ΔF)が 0.8 ギリしかありません)。
でも、解析を続けてみると、
これまたキレイでイイ感じです。

要するに、このデータは、
  • 「on rotation axis with secondary beam correction」スケーリングのものが示すように、S-SAD解析をするのに充分なクォリティを持っていた。
  • 「Batch」スケーリングしたものは、スケーリングの不具合のため、統計値が損なわれているが、(大筋では)クォリティを失っていなかった。
  • 「Batch」スケーリングしたものの shelxC の統計値は、スケーリングで損なわれた統計値の影響で、不当に低く見積もられていた。
  • しかし、クォリティを(大筋では)失っていないため、以降のS-SAD解析では、それなりに成功する。
のではないかと考えられます。


個人的な経験ですと、得られたデータが S-SAD解析に耐えうるかどうかの指標としては、Rpim(と冗長度)しかまともに使えるものはない、と思っています。

0 件のコメント: