<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

一種利用高能碰撞誘導電離碎裂技術鑒定蛋白的方法

文檔序號:6161640閱讀:2156來源:國知局
一種利用高能碰撞誘導電離碎裂技術鑒定蛋白的方法
【專利摘要】本發明公開了一種利用高能碰撞碎裂技術(high?collision?induced?dissociation)鑒定蛋白的方法。本發明提供了一種利用高能碰撞碎裂技術鑒定未知目的蛋白的方法,包括主要步驟如下:用搜索引擎對獲得的二級HCD質譜圖進行候選肽段搜索并生成理論譜;再匹配所述實驗譜與所述理論譜,輸出鑒定結果;所述生成理論譜為同時進行生成理論b離子單一同位素峰質荷比、生成理論y離子單一同位素峰質荷比和對y離子增加第一同位素峰離子的質荷比。本發明的方法簡單有效,可在不更改數據庫搜索引擎數據結構和匹配打分算法下顯著提升肽段鑒定靈敏度。
【專利說明】一種利用高能碰撞誘導電離碎裂技術鑒定蛋白的方法
【技術領域】
[0001]本發明涉及生物信息學領域,尤其涉及一種利用高能碰撞誘導電離碎裂技術鑒定蛋白的方法。
【背景技術】
[0002]隨著質譜技術的發展,高能碰撞碎裂技術(HCD, high-energy collisioninduced dissociation)被廣泛用于蛋白質組表達譜和修飾譜的定性和定量鑒定中(Olsen, Macek et al.2007 ;Nagaraj, D' Souza et al.2010;Savitski, Mathieson etal.2010;de Graaf, Altelaar et al.2011;Frese, Altelaar et al.2011)? 新一代的高精度質譜儀LTQ-OrbiTrap Velos的HCD 二級圖譜產出靈敏度與CID (collisioninduceddissociation)接近或相當,均高于電子轉移碎裂(ETD, electron transferdissociation)圖譜,但HO)圖譜質量更佳,具有更高的鑒定成功率(Frese, Altelaar etal.2011),這是因為HCD質譜數據具有以下特點:
[0003](I) 二級質量分辨率可達15000,質量精度可達ppm級別(Olsen, Macek etal.2007),可有效減少子離子錯誤匹配,從而顯著提高肽段打分和圖譜鑒定率。例如,Frese等人使用Hela細胞樣品,系統比較了不同上樣量條件下CID、HCD和ETD等三種裂解模式CID、HCD和ETD的MASCOT鑒定結果,發現HCD質譜數據具有最高的圖譜匹配打分(ionscore)以及最高的圖譜鑒定成功率(>50%) (Frese, Altelaar et al.2011) ? Shen等人將高質量精度的二級離子信息用于肽段鑒定質控的特征參數,比常規的搜索引擎多過濾出20%-40% 的肽段鑒定結果(Shen, T0Iicet al.2011)。
[0004](2)肽段碎裂充分,二級譜的離子連續性好。針對HCD圖譜進行從頭測序(denovo)效果較好。Shen Y等人詳細比較了相同方法下CID、HCD和電子轉移碎裂(ETD)圖譜得到的連續碎片離子長度,發現7個氨基酸以上的肽段鑒定結果中,HCD圖譜具有最高的肽段鑒定數(Shen,Tolic et al.2`011)。中科院計算所發展了專門針對HCD的質譜數據從頭測序軟件PN0V0,利用了二級碎裂離子高質量精度、低質量區域離子豐富、存在內部碎片(internal)和亞氨(immonium)離子等特點對HCD圖譜從頭測序,與常規搜索引擎鑒定結果重疊率達到80%以上,并可尋找脫酰胺基修飾和氨基酸突變(Chi,Sun et al.2010)。
[0005](3)低質量區域碎片離子豐富,可提高iTRAQ報告離子碎裂峰強從而提高定量精度(McAlister, Phanstiel et al.2010)。
[0006](4)可產生internal離子和immonium離子,某些immonium離子是修飾鑒定的重要特征離子(Olsen, Macek et al.2007; Nagaraj, D' Souza et al.2010)。
[0007]盡管HCD圖譜質量更好,但現有的HCD數據搜索引擎和質量控制方法仍沿用CID數據的分析策略,未能充分利用HCD數據特點,相對于硬件的發展,HCD的數據分析算法和工具面臨發展相對滯后的狀態。
[0008]國際上專門針對HCD數據的分析方法非常有限,僅有的集中在HCD數據的預處理、鑒定結果質控和從頭測序上。如Savitski等人設計了 H-score,通過對HCD圖譜進行去同位素峰(de-1sotope) (Nielsen, Savitski et al.2005)和解卷積(de-convolution)(Zhang, Ficarro et al.2009),以及對MASCOT鑒定結果重打分來提高了肽段鑒定靈敏度(Savitski, Mathieson et al.2010)。另一方面,使用蛋白質序列數據庫搜索策略進行圖譜鑒定時(其基本原理是產生肽段的理論碎裂圖譜,并與實際圖譜進行匹配,通過匹配相似性的好壞來鑒定序列),現有的數據庫搜索引擎如MASCOT、SEQUEST和X!Tandem等仍產生較為簡單的序列理論圖譜,未充分利用HCD圖譜特征,例如對碎片離子的相對峰強進行簡單的模擬(Li,Arnold etal.2010),不考慮高精度二級碎片離子的同位素峰信息及其它離子類型等,造成了 HCD圖譜鑒定靈敏度的損失。
[0009]綜上所述,現有HCD數據解析面臨以下問題:
[0010](1)常規搜索引擎如MASCOT、SEQUEST和X!Tandem等并未針對HCD設計相應的理論圖譜和匹配打分,對HCD的處理仍沿用與CID相同的理論譜和打分方法;
[0011](2)肽段鑒定質控方法未充分利用HCD數據特征。如Η-score并未將高質量精度、internal和immonium離子類型考慮在內,并且僅針對富含修飾的樣品數據。MASCOTPercoIator 中也僅考慮了 b、y 離子匹配(Brosch, Yu et al.2009)。
[0012](3)現有針對HCD圖譜的從頭測序算法考慮修飾類型有限,目前尚未見針對HCD數據的修飾類型預篩方法。
[0013](4)在圖譜庫搜索方面,目前尚未出現針對HCD數據優化的圖譜庫構建方法和圖譜庫搜索引擎(Lam 2011)。
[0014]隨著HCD技術的不斷進步,其在表達譜、修飾譜構建及蛋白質定量研究領域會發揮越來越重要的作用。了解和充分利用HCD數據特征,發展相應的鑒定、質控和定量算法,開發HCD質譜數據的深度解析平臺是當務之急。

【發明內容】

[0015]本發明旨在利用HCD圖譜二級碎裂離子具有豐富的同位素峰信息以及高質量精度特點,通過在理論譜中增加同位素峰信息來提高肽段鑒定的準確度、靈敏度和成功率。
[0016]本發明的目的是建立一種利用高能碰撞碎裂產生豐富的高精度二級同位素峰的高效鑒定未知目的蛋白的方法,尤其是提供一種利用高能碰撞碎裂鑒定待測蛋白的方法。
[0017]本發明提供的方法,包括如下步驟:
[0018]1)將待測蛋白酶解得到肽段;
[0019]2 )將所述肽段經液相色譜質譜串聯檢測,得到二級HCD質譜圖,記作實驗譜;所述液相色譜-質譜串聯中的二級質譜產生模式采用高能碰撞碎裂;檢測采用高分辨質量檢測器,由此產生二級HCD質譜圖;
[0020]3)將所述二級HCD質譜圖轉換成數據庫搜索引擎可讀格式;
[0021]4)用搜索引擎先對經過3)處理的二級HCD質譜圖進行候選肽段搜索并生成理論譜;再匹配所述實驗譜與所述理論譜,輸出鑒定結果;
[0022]所述生成理論譜為同時進行生成理論b離子單一同位素峰質荷比、生成理論y離子單一同位素峰質荷比和對y離子增加第一同位素峰離子的質荷比;
[0023]將所述生成理論y離子的單一同位素峰質荷比記作m/zyi述對y離子增加其第一同位素峰離子的質荷比記作m/Zyi’,且m/Zyi' =m/zyi+l.003355/z, yi代表候選肽段從C端開始數第i個肽鍵位置斷裂后形成的I離子;yi’表示代表候選肽段從C端開始數第i個肽鍵位置斷裂后形成的I離子的第一同位素峰,其中i=l,2,3,...L-1 ;L為候選肽段的長度;
[0024]5)將所述鑒定結果進行質量控制和錯誤發現率(false discovery rate, FDR)計算,得到待測蛋白中肽段的序列和數目,實現鑒定待測蛋白之目的。
[0025]上述方法中,步驟I)中,所述酶為蛋白質組學研究中常用的蛋白酶,包括但不限于胰蛋白酶(trypsin);也可以為賴氨酸蛋白酶C (Lys-C)或者精氨酸蛋白酶C (Arg-C)等。這些酶都可以特異性切割蛋白質,而且都在強堿性氨基酸K或者R后面斷裂,生成帶有堿性氨基酸的肽段。
[0026]步驟4)中,所述候選肽段搜索為根據實驗譜的母離子質量(酶解后肽段的質量),在目的蛋白質序列數據庫中搜索出實驗譜對應的候選肽段。
[0027]步驟3)中,所述轉換采用的軟件為質譜儀原始格式常用轉換軟件,包括但不局限于msconvert ;所述數據庫搜索引擎可讀格式為二級質譜圖格式,二級質譜圖格式包括但不局限于mzXML、mgf、dta等;
[0028]步驟4)中,所述搜索引擎為常用蛋白質序列數據庫搜索引擎,包括但不局限于X!Tandem、MASCOT、SEQUEST等;所述匹配實驗譜與理論譜采用的公式包括但不局限于HyperScore 公式(X!Tandem 自帶的);
[0029]步驟5)中,所述質量控制采用的軟件為TPP ;所述質量控制采用的算法為TPP軟件中的PeptideProphet算法。
[0030]上述方法中,所述待測蛋白來源于酵母細胞;所述目的蛋白質序列數據庫為酵母S⑶數據庫。
[0031]上述的方法在定性或定量鑒定蛋白質組表達譜或修飾譜中的應用也是本發明保護的范圍。
[0032]本發明的實驗證明,使用同位素峰添加后的理論譜進行肽段鑒定可顯著提高肽段鑒定靈敏度。本發明通過一組實測數據分析,分別比較了僅考慮b離子、僅考慮y離子和b、y離子同時考慮三種類型,以及與不考慮同位素峰、僅考慮第一同位素峰、考慮第一和第二同位素峰、以及考慮第一、第二和第三同位素峰四種情況共12種組合,比較了高可信的肽段鑒定數,以最高的肽段鑒定數對應的離子類型和同位素峰個數作為最優組合。通過比較發現,僅考慮y離子和僅考慮第一同位素峰的組合獲得最多的肽段鑒定數。本發明方法的優勢在于簡單有效,可在不更改現有數據庫搜索引擎的數據結構和打分算法前提下實現鑒定靈敏度的提升和鑒定成功率的提聞,鑒定更多的蛋白質。
【專利附圖】

【附圖說明】
[0033]圖1為X!Tandem在不同離子類型和同位素峰個數條件組合下生成理論譜后高可信肽段鑒定數比較
【具體實施方式】
[0034]下述實施例中所使用 的實驗方法如無特殊說明,均為常規方法。
[0035]下述實施例中所用的材料、試劑等,如無特殊說明,均可從商業途徑得到。
[0036]實施例1、利用HCD串聯二級質譜圖數據分析鑒定肽段序列[0037]1、酶解獲得肽段
[0038]釀酒酵母菌株ATCC 201388 (BY4741,MATa his3deltal Ieu2delta0metl5delta0ura3delta)購自美國典型菌種培養物保藏中心(American Type CultureCollection)。
[0039]菌株培養:使用YPD培養基培養酵母ATCC 201388、30°C恒溫搖床培養至0D600為
1.5,5000rpm離心5分鐘收集菌體,將上清液倒出,0.1%的疊氮鈉磷酸鹽緩沖液漂洗沉淀,離心去上清后收集菌體,置于-80°C冰箱冷凍保存。
[0040]菌體裂解:將尿素裂解液(SM尿素,50mM的碳酸氫銨,50mM的碘乙酰胺)加入到酵母菌體沉淀,再加入等菌體體積的玻璃珠,置于渦旋混合儀上最大轉速渦旋裂解5min、13000rpm離心2min,收集上清液,即得到酵母蛋白樣品。
[0041]蛋白酶解:將酵母蛋白樣品用聚丙烯酰胺凝膠電泳富集,電泳時,待蛋白樣品進入膠內0.5cm時停止電泳,考馬斯亮藍染色,脫色。將富集了樣品的膠條切下,切成Imm3的膠粒,對膠粒進行脫色,干燥。加入酶解液(IOng/ μ L胰蛋白酶,50mM碳酸氫銨,5%乙腈),37度恒溫培養箱過夜消化。
[0042]樣品提取:消化后,加入酸溶液(5%甲酸,5%乙腈)終止酶解反應,離心取出上清液,加入乙腈進一步提取肽段樣品,合并上清液并真空干燥,獲得肽段干粉樣品,置于-20度冰箱冷凍保存。
[0043]2、LC-MS檢測獲得HCD串聯二級質譜圖
[0044]液相采用Waters超高壓高效液相色譜儀(nanoAcquity UltraPerformanceLC, Waters),分析柱為C18填料(3μηι,200Α)自制毛細管分析柱(75um*150mm).流動相A:2%乙腈,0.1%甲酸水溶液,流動相B:0.1%甲酸的乙腈溶液。洗脫條件:5-32min,流動相比例由5%B線性升至45%B,32_50min,流動相比例由45%線性升至50%。最后用80%流動相B沖洗lOmin。流動相流速為300nL/min,進樣體積為3 μ L.[0045]質譜儀為LTQ-Orbitrap Velos (美國,Thermo Fisher)。使用納噴離子源(Nanospray ion source),噴霧電壓2kV,毛細管溫度為250度,質譜分析采用數據依賴的二級質譜掃描模式(Data Dependent MS/MS Scan)。一級質譜全掃描在Orbitrap中進行,分辨率為30000,質荷比范圍為m/z300-1600。二級質譜檢測在Orbitrap中進行,分辨率為7500。采用串聯質譜掃描的動態排除功能(dynamic exclusion),排除時間為30s。依次選取一級質譜中離子豐度最強的前10個離子進行高能碰撞碎裂(HCD)分析。HCD碰撞室的碰撞氣為高純氦氣(99.999%),最大累計時間為100ms,動態排除列表大小設置為150。歸一化碰撞能量為40%。用于打二級碎裂的離子排除+1價離子和價態不確定的離子。
[0046]將上述肽段干粉樣品按照上述條件進行LC-MS檢測,得到肽段HCD質譜圖組成的原始Raw文件,即為二級HCD質譜圖,記作實驗譜。
[0047]3、格式轉換
[0048]從原始Raw文件中提取二級譜圖(16,479張),用質譜文件格式轉換工具msconvert (Kessner, Chambers et al.2008)轉換成數據庫搜索引擎可讀格式mzXML文件。
[0049]轉換不引入去同位素峰(de-1sotope)過程,即保留HCD 二級圖譜中的同位素峰信
肩、O
[0050]4、搜索、生成理論譜并進行匹配打分[0051 ] 對上述格式為mzXML文件的二級HCD質譜圖使用X! Tandem搜索引擎在酵母SGD 數據庫(http://downloads.yeastgenome.0rg /sequence /S288C_reference /orf_protein/)進行候選多肽搜索;并將mzXML文件中每一張二級HCD質譜圖中的每一個長度為L的候選肽段生成理論b離子的單一同位素峰質荷比m/zb1、生成理論y離子單一同位素峰質荷比m/zyi和對y離子增加第一同位素峰離子的質荷比m/zyi’ ;得到理論譜;
[0052]候選肽段搜索為根據實驗譜的母離子質量(酶解后肽段的質量),在目的蛋白質序列數據庫中搜索出實驗譜對應的候選肽段;
[0053]上述搜索參數設為母離子質量誤差=20ppm,子離子質量誤差=0.1Da,全酶切搜庫,固定修飾為半胱氨酸烷基化,可變修飾為甲硫氨酸氧化修飾,正反庫混合搜索,反庫由正庫理論酶切肽段序列直接反轉構成。
[0054]上述bi代表候選肽段從N端開始數第i個肽鍵位置斷裂后形成的b離子,一共有L-1個b離子,其中i=l,2,3,...L-1 ;z為子離子電荷,m為子離子質量,bi放在m/z的下標,表示該bi離子的質荷比;
[0055]yi代表候選肽段從C端開始數第i個肽鍵位置斷裂后形成的y離子,其中i=l, 2,3,…L-1 ;
[0056]yi’表示代表候選肽段從C端開始數第i個肽鍵位置斷裂后形成的y離子的第一同位素峰,其中i=l,2,3,...L-1 ;
[0057]其中m/zyi’ 滿足:m/zyi’=m/zyi+l.003355/z,其中 i=l,2,3,...L-1 ;
[0058]再將實驗圖譜和生成的理論圖譜的相似度進行匹配打分,公式采用HyperScore (Fenyo and Beavis 2003),輸出鑒定結果。其中每張圖譜挑選HyperScore最高的肽段作為該圖譜的鑒定結果,HyperScore的計算由X ! Tandem內嵌函數自動實現。
[0059]HyperScore的具體計算公式為:
[0060]
【權利要求】
1.一種利用高能碰撞碎裂鑒定待測蛋白的方法,包括如下步驟: I)將待測蛋白酶解得到肽段; 2 )將所述肽段經液相色譜質譜串聯檢測,得到二級HCD質譜圖,記作實驗譜;所述液相色譜質譜串聯中的中的二級質譜產生模式采用高能碰撞碎裂; 3)將所述二級HCD質譜圖轉換成數據庫搜索引擎可讀格式; 4)用搜索引擎先對經過3)處理的二級HCD質譜圖進行候選肽段搜索并生成理論譜;再匹配所述實驗譜與所述理論譜,輸出鑒定結果; 所述生成理論譜為同時進行生成理論b離子單一同位素峰質荷比、生成理論I離子單一同位素峰質荷比和對y離子增加第一同位素峰離子的質荷比; 將所述生成理論I離子的單一同位素峰質荷比記作m/zyi,所述對y離子增加其第一同位素峰離子的質荷比記作m/zyi’,且m/zyi’ =m/zyi+l.003355/z, yi代表候選肽段從C端開始數第i個肽鍵位置斷裂后形成的I離子;yi,表示代表候選肽段從C端開始數第i個肽鍵位置斷裂后形成的I離子的第一同位素峰,其中i=l,2,3,...L-1 ;L為候選肽段的長度; 5)將所述鑒定結果進行質量控制和錯誤發現率計算,得到待測蛋白中肽段的序列和數目,實現鑒定待測蛋白。
2.根據權利要求1所述的方法,其特征在于: 步驟I)中,所述酶是蛋白酶,所述蛋白酶具體為胰蛋白酶、賴氨酸蛋白酶C或精氨酸蛋白酶C ; 步驟4)中,所述候選肽段搜索為根據所述實驗譜的母離子質量,在目的蛋白質序列數據庫中搜索出實驗譜對應的候選肽段。
3.根據權利要求1或2所述的方法,其特征在于: 步驟3)中,所述轉換采用的軟件為質譜儀原始格式轉換軟件,所述質譜儀原始格式轉換軟件具體為msconvert ;所述數據庫搜索引擎可讀格式為二級質譜圖格式,二級質譜圖格式具體為mzXML、mgf或dta ; 步驟4)中,所述搜索引擎為蛋白質序列數據庫搜索引擎,所述蛋白質序列數據庫搜索引擎具體為X!Tandem、MASCOT或SEQUEST ;所述匹配實驗譜與理論譜匹配采用的公式為HyperScore 公式; 步驟5)中,所述質量控制采用的軟件為TPP ;所述質量控制采用的算法為TPP軟件中的 PeptideProphet 算法。
4.根據權利要求1-3中所述的方法,其特征在于: 所述待測蛋白來源于酵母細胞;所述目的蛋白質序列數據庫為酵母SGD數據庫。
5.權利要求1-4中任一所述的方法在定性或定量鑒定蛋白質組表達譜或修飾譜中的應用。
【文檔編號】G01N30/86GK103698447SQ201210367352
【公開日】2014年4月2日 申請日期:2012年9月28日 優先權日:2012年9月28日
【發明者】徐平, 李寧 申請人:中國人民解放軍軍事醫學科學院放射與輻射醫學研究所
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影