Skyline 中嵌入的 mProphet 軟件會根據同一肽段的多個子離子峰的 feature 進行打分。 Feature 包括子離子共流出峰形、保留時間偏差、 dotp 值、信噪比等。為了區分假陽性的子離子峰, mProphet 可以建立 decoy 庫,也可以將打分排名第二的肽段作為decoy,計算 FDR[5,6]。篩選 FDR < 0.01 的肽段段作為可信的定量肽段(圖 1)。

圖 2. QE HF 掃描目標質核比窗口 400–1000 采集 50 張 MS/MS 所需時間在 2.4–3 s
2. DDA 鑒定結果以及譜圖庫建立
500 ng Hela 細胞進行 60 min 色譜梯度進行 DDA 數據采集。在 60 min 內,三次重復, QE HF 分別采集到49065、 49031、 48885張譜圖,鑒定到 22030、 21820、 21654 個肽段,對應到約 3909、 3900、 3878 個蛋白。將三次的肽段和蛋白合并,一共鑒定到32446 個肽段, 4510 個蛋白(圖 3)。蛋白和肽段鑒定結果導入 skyline 建立譜圖庫。通過該譜圖庫,在 skyline 中建立需定量的候選肽段和蛋白。為了提高蛋白定量的準確性,在 skyline 中設置一些肽段的限制條件, m/z 400–1000,母離子電荷 2+– 4+,無漏切位點。 32446 個肽段中符合這些條件的肽段有 29686 個,對應 4296 個蛋白。在 DDA 定量實驗中,為每個候選肽段添加強度最高的3 個同位素峰(M、 M+1、 M+2)作為定量離子,共生成 89027 個定量離子。在 DIA 定量實驗中,為每個肽段添加 5 個強度最高的子離子(b3-bn, y3-yn),共生成 145736 個定量離子。

圖 3. 500 ng Hela 細胞裂解液 3 次 DDA 鑒定結果(A)鑒定到的蛋白交蓋圖(B)鑒定到的肽段的交蓋圖
3. 基于母離子的 DDA 定量和基于子離子的 DIA 定量結果比較
對于 DDA 定量, skyline 會從 DDA 數據一級譜圖中進行母離子同位素峰抽提。篩選同位素分布與理論同位素分布較好的肽段作為可靠的定量肽段,即 idotp > 0.8。由于 DDA、 DIA 實驗中用的是相同的色譜梯度, DDA 實驗中肽段的保留時間信息可以傳遞給 DIA 實驗。所以在 DIA 定量時,限制 skyline 只抽提該肽段譜庫中保留時間 5 min 范圍內的子離子。通過保留時間限制可以降低 DIA 數據處理的復雜度和提高定量的準確度。同時篩選 Q value < 0.01 的肽段最為可靠的定量肽段。
三次 DDA 實驗從一級譜圖中分別定量到 25214、 25515、 24873個肽段; 3969、 3975、 3917 個蛋白;定量到的肽段占總候選肽段的 84%;峰面積的 CV 值在 20% 以下的占總定量肽段的58.81%; CV 值在 10% 以下的占 25.25%(圖 4)。三次 DIA 定量分別定量到 27558、 27604、 27483 個肽段; 4067、 4080、 4073 個蛋白。定量到的肽段張總候選肽段的 93%;峰面積的CV 值在 20% 以下的占總定量肽段的 90.3%; CV 值在 10% 以下的占 69.01%(圖 5)。可以看出 DIA 能夠定量到更多的肽段,而且定量肽段的峰面積 CV 值遠遠小于 DDA。

圖 4. 3 次 DDA 實驗和 3 次 DIA 實驗定量到的肽段和蛋白

圖 5. DDA 定量和 DIA 定量母離子和子離子峰面積 CV
結論
DDA 一般用于蛋白/肽段鑒定,同時可以基于母離子進行的定量,在非常復雜的基質中,非常容易受到其他肽段的干擾,導致定量不準確, CV 值過大。 DIA 定量是基于二級子離子的定量,用子離子定量會提高定量的選擇性,降低其他肽段的干擾,定量會比基于一級峰面積的定量更加準確, CV 值較小。該實驗中,用 500 ng Hela 細胞裂解液評價 DDA 定量和 DIA 定量能力。 3 次 DDA 實驗鑒定到 32446 個肽段, 4510 個蛋白。將鑒定到的蛋白和肽段導入 skyline 建立譜圖庫,篩選出 4296個候選定量蛋白, 29686 個候選定量肽段,作為 DDA 和 DIA共同定量目標。 DDA 定量到了 84% 的肽段, 92% 的蛋白;而DIA 定量到了 93% 的肽段, 95% 的蛋白。 DIA 比 DDA 能定量到更多的肽段和蛋白,同時 DIA 定量子離子峰面積的 CV 遠遠小于 DDA 定量母離子峰面積的 CV。結果表明,基于二級子離子的定量要由于基于一級母離子的定量。
QE HF 在一小時梯度內就能從 500 ng Hela 細胞裂解液鑒定并定量 4000 個蛋白,這得益于 QE HF 較好的離子傳輸效率,超快的掃描速度。目前 DIA 定量基于一維反向色譜質譜聯用分析還不適用于二維色譜質譜聯用分析。但是可以通過延長一維反向色譜的梯度,提高分離效率達到細胞蛋白質組的全覆蓋。 Matthais Mann 研究小組 2014 年用一維反向色譜在小鼠NSC-34 和 N2a 細胞裂解液 240 min 色譜圖梯度,就鑒定到了8000 多蛋白,基本上達到細胞系蛋白組全覆蓋[7]。通過 DDA鑒定肽段蛋白,建立譜圖庫, DIA 進行蛋白定量可能成為定量蛋白質組學新的發展方向。
參考文獻
1.
Gillet, L C. et al. Targeted data extraction of the MS/MS spectra
generated by data-independent acquisition: a new concept forconsistent
and accurate proteome analysis. Mol Cell Proteomics, 2012, 11(6): O111
016717.
2. Kelstrup, C D. et al. Rapid and deep proteomes by faster
sequencing on a benchtop quadrupole ultra-high-field orbitrap mass
spectrometer. J Proteome Res, 2014,13(12):6187-6195.
3. Scheltema R
A. et al. The Q Exactive HF, a benchtop massspectrometer with a
pre-filter, high performance quadrupole andan ultra-high field orbitrap
analyzer. Mol Cell Proteomics, 2014,
13(12):3698-3708
4.
Abbatiello S E. et al. Design, implementation, and multi-site evaluation
of a system suitability protocol for the quantitative assessment of
instrument performance in LC-MRM-MS. Mol Cell Proteomics, 2013,
12(9):2623-2639
5. Reiter, L. et al. mProphet: automated data
processing and statistical validation for large-scale SRM experiments.
Nat. Methods.2011, 8 (5):430-435
6.
R?st H L. et al. OpenSWATH enables automated, targeted analysis of
data-independent acquisition MS-data. Nat. Biotechnol.
2014,32(3):219-223
7. Horburg D. et al. Deep Proteomic Evaluation of
Primary and Cell Line Motoneuron Disease Models Delineates Major
Differences in Neuronal Characteristics. Mol Cell Proteomics, 2014,
13(12):3410-3420