專利名稱:高敏感的內切核酸酶的生產方法、內切核酸酶的新制品及其用途的制作方法
技術領域:
本發明涉及鑒定和制備具有高活性和敏感性以及寬底物特異性的錯配特異的內切核酸酶。
背景技術:
上個世紀初,對通過輻射或化學品在DNA內部誘導突變的可能性的發現已經為理解活體內基因功能帶來了相當大的希望。自那時起,誘變作用和自然序列變化已經被廣泛地用于鑒定新功能、對應于特異功能的基因以及一個特異蛋白質內部的活性位點。
實施這個方法的一個關鍵方面,特別是在點突變的情況下,是對突變檢測方法的選擇,這些方法被設計為對大段的DNA進行篩選而不減少診斷敏感性或特異性,并且同時能提供有關突變位點的信息。最常用的工具當中有基于不完全配對的DNA的方法,該DNA能夠通過兩個DNA分子的變性和復性在試管內產生。使用如溝結合劑等化學品或能夠在錯配位點上特異地剪切單鏈DNA的分子在這些異源雙鏈分子中檢測到錯配。可替代地,單鏈特異的內切核酸酶已經被用于在錯配位點剪切DNA。目前已被描述的絕大多數內切核酸酶屬于S1/P1類核酸酶。
例如S1、P1和綠豆核酸酶等核酸酶,屬于被命名為“S1/P1族核酸酶”或為“S1族核酸酶”的同一族,已知能用于在單鏈區域切開DNA。但是這些核酸酶所具有的酸性pH最佳值是在4.0-5.0的范圍內。
這對于錯配檢測是不利的,因為低pH值有利于DNA脫嘌呤并且使得DNA雙鏈體不穩定,導致非特異的DNA降解,并且降低檢測的敏感性和特異性。
幾年前,OLEYKOWSKI等人(Nucleic Acids Res,26,4597-4602,1998)從不同的植物提取物中檢測到一個錯配內切核酸酶的活性,其具有中性的pH最佳值(大約pH 8)并在錯配位點的3’端完成一個單鏈切開。這些作者報道了該錯配內切核酸酶的活性與苜蓿芽、蘆筍、芹菜和西紅柿的提取物中的甘露糖基糖蛋白(mannosyl glycoproteins)有關。芹菜中的酶,稱之為CEL I,是通過連續的硫酸銨沉淀步驟從芹菜莖中提純,結合到一個刀豆體球蛋白A-瓊脂糖柱并且被[α]-d+-甘露糖洗提,結合到一個磷酸纖維素柱并且被線性梯度的KCl洗提,并且用尺寸排阻色譜法分級分離。因此獲得的CEL I制品包含幾個34-39KDa的蛋白帶。
YANG等人(Biochemistry,39,3533-3541,2000)和PCT申請WO 01/62974描述了一種改進的CEL I提純,它是通過在提純緩沖液中使用α-甲基甘露糖苷來克服CEL I與內源性選擇素的聚集反應。這些文件還披露了CEL IcDNA的克隆。以序列數據為基礎,CEL I被指定為S1/P1族核酸酶的一個亞族,并且鑒定出幾個用擬南芥(Arabidopsis thaliana)的BFN1(GenBank核苷酸(nucleotide)AY040016)、百日草屬植物的ZEN1(GenBank核苷酸AB003131)和萱草的DSA6(GenBank核苷酸AF082031)的基因進行編碼的可能的同系物。
CEL I內切核酸酶活性已經顯示出對于堿基替換的錯配以及由于插入/缺失情況引起的錯配是高度特異的,并且獨立于側翼序列環境。因此它在包括突變篩選等不同的方法中作為突變檢測試劑是很有用的。CEL I錯配檢測系統是一個簡單的測定法,它需要靶序列的聚合酶鏈反應擴增(PCR擴增)、變性和退火,以允許在野生型和突變體等位基因之間生成異源雙鏈體,酶的錯配剪切,以及通過凝膠電泳法的產品分析。因為它在對大段DNA中的錯配進行檢測時的特異性和敏感性,它比其他流行的錯配檢測系統有利,比如變性HPLC。
通過實施例,OLEYKOWSKI等人和YANG等人(上面引用的出版物)報道將其用于檢測人類與家族性乳腺癌有關的基因(BRCA1基因)的序列改變,并且SOKURENKO等人(Nucl.Acids Res.,29,e111,2001)披露了將其用于檢測大范圍基因組DNA的突變和多態性。CEL I也在TILLING(基因組中靶向誘導的局部損害(Targeting Induced Local Lesions IN Genomes))的高產率篩選中得到使用,其中化學誘變之后對基因點突變進行篩選,或將其用于檢測自然群體中的多態現象,也被稱作“Ecotilling”( 等人,Plant Journal,37,778-786,2004)。它已經被用在植物(COLBERT等人,Plant Physiology 126,480-484,2001;TILL等人,GenomeResearch 13,524-530,2003;PERRY等人,Plant Physiology 131,866-871,2003)和動物中,例如斑馬魚(WIENHOLDS等人,Genome Res.,13,2700-2707,2003)。PCT申請WO 03/066809提出在相關聚核苷酸之中重新配置序列變化的一種方法中使用CEL I,該方法稱作“通過解決錯配的基因重排列”(″Genetic Reassortment by Mismatch Resolution″(GRAMMR))。
但是CEL I的缺點是所具有的剪切效率由一個錯配到另一個錯配而變化在具有單一核苷酸插入的DNA環的情況下,OLEYKOWSKI等人(Nucleic Acids Res.1998 Oct15;26(20)4597-602)報道了CEL I底物優選特性為G>A>C>T;在堿基替換的錯配情況下,CEL I底物優選特性為C/C≥C/A~C/T≥G/G>A/C~A/A~T/C>T/G~G/T~G/A~A/G>T/T。它的功效在錯配C/A,C/C,C/T,G/G是很明顯的。在其他的錯配上觀察到活性降低,它對于錯配T/T幾乎無效。當需要在一個DNA庫中對某一等位基因進行檢測時,這種剪切功效上的變化可能會導致在檢測某些突變時的較低正確率。
限制CEL I應用的另一個不便之處是可用的提純法的低產率。OLEYKOWSKI等人從含有大約350克蛋白質的7千克芹菜莖開始獲得了3ml的0.1μg/μl的CEL I;由YANG等人和PCT WO 01/62974中披露的提純過程得到5μg純化的CEL I,特異活性為3.1×107 CEL I單位/毫克蛋白質,從105千克芹菜莖開始。
為了獲得更大量的CEL I,已經提出它可以通過重組DNA技術來生產。PCT申請WO03/066809提出了一個可能合適的載體和宿主細胞的很大的清單,包括幾乎任何已知的原核或真核生物表達系統;但是,這個文件中實際披露的唯一表達系統是基于煙草花葉病毒組的載體。通過在所述載體中將融合到一個編碼為6-組氨酸標簽的該CEL I的cDNA進行克隆的構造已經被用于感染煙草植物。重組CEL I從被感染植物的細胞內液中回收,在鎳-NTA樹脂上通過金屬親和層析法提純。PCT WO 03/066809對于提純的酶的產率沒有敘述。它表明其在GRAMMR反應中的活性與芹菜中提純的某一個天然酶近似。這個系統的一個不便之處是病毒傾向于重組,部分或全部失去該表達基因。這帶來除了完整長度的CEL I之外還會產生截短的形式,降低了該酶的特異活性。
PCT申請WO2004/035771涉及一種在酵母中生產CEL I的方法。對于這個作用,對CELI編碼的一個合成基因是按照酵母中密碼子的使用通過修飾CEL I的天然DNA序列而構成。這個文件表明由該合成基因生產的重組CEL I能夠識別所有可能的錯配組和,并且用例證說明了錯配A/A的識別和剪切。另一方面,它對所述重組CEL I的錯配優選特性沒有敘述。
從上面看來目前可用的生產重組CEL I的各種方法并沒有提供與從芹菜生產天然CEL I相比較的任何重大的改進。另外他們沒有提及天然CEL I底物優選特性的問題。
并且,希望能有像CELI的其他內切核酸酶能夠在中性pH下剪切異源雙鏈DNA模板的單堿基對錯配,但是它們具有不同的錯配優選特性,或優選地,能對所有錯配進行同樣良好的剪切。但是,直到現在尚未鑒定出這樣的內切核酸酶。
像CEl I的內切核酸酶活性的存在已經在許多植物中被報道(cf.例如上面引用的OLEYKOWSKI等人,1998)。但是帶來這些活性的酶還沒有進行特征標記,它們的生化特性例如底物優選特性還沒有被研究,并且它們的序列還沒有被鑒定。另一方面,CEL I的結構同系物已經在計算機硅片上(in silico)被確認(上面引用的YANG等人,TILL等人NucleicAcids Res.,32,2632-41,2004)。它們中的三個(擬南芥的BFN1,百日草屬的ZEN1和萱草的DSA6)已經有報道涉及植物枯萎(PEREZ-AMADOR等人,Plant Physiol.122,169-180 2000)。但是,它們沒有被提純,保持生化上未進行特征標記特別是試管內識別異源雙鏈DNA錯配的效率還沒有被試驗。已經從菠菜中提純出被稱作SP的一種內切核酸酶,基于其活性它已經被歸屬為S1/P1族,并且它具有中性的pH最佳值。像CEL I,該酶剪切插入/缺失和堿基替換的錯配;但是它不識別那些包含鳥嘌呤殘基的錯配(OLEYKOWSKI等人,Biochemistry,38,2200-5,1999)。
在尋找獲得重組CEL I的替代方法的過程中,諸位發明人已經嘗試了通過土壤桿菌屬介導的瞬時表達在植物中(in planta)對其進行表達。
他們已經在農桿菌浸潤的(agroinfiltrated)煙葉上表達了重組CEL I,并且用硫酸銨沉淀法從葉子提取物中將其提純。他們已經驚訝地發現,他們獲得了具有高活性的重組CEL I的非常高的產率,另外,比之現有技術中已知的CEL I的制品,該重組CEL I制品以更寬的特異性和更高的敏感性來識別錯配,即使對例如T/T這樣的錯配也允許清楚地檢測,而它們被認為用CEL I是很難識別的。
發明內容
鑒于這些結果,諸位發明人已經想到使用該方法通過在試管內測試它們的活性來篩選在計算機芯片上被鑒別為屬于S1/P1族的各個內切核酸酶。
因此本發明提供了從少量的起始材料獲得大量內切核酸酶,特別是S1/P1核酸酶的一種簡單快速的方法,并且還提供了一種在試管內評價候選內切核酸酶活性的方法,特別是為了鑒定錯配特異的內切核酸酶。
一個錯配特異的內切核酸酶在此處定義為一種能夠特定地剪切所有堿基替代的錯配(即A/A,G/G,C/C,T/T,A/G,A/C,G/T,C/T,G/A,C/A,T/C,T/G)以及一個或多個核苷酸的插入/缺失的內切核酸酶。
因此本發明的一個目的就是提供生產重組內切核酸酶的一種方法,其中所述方法包括-在宿主植物細胞中表達所述重組內切核酸酶,由包含表達載體的土壤桿菌屬菌株瞬時轉化,該表達載體包括對所述內切核酸酶進行編碼的聚核苷酸;-從所述宿主植物細胞中分離出所述重組內切核酸酶。
所述植物細胞可以是細胞懸液或者組織或器官培養的一部分。在這種情況下,該酶能夠從上清液和/或從培養的細胞或組織或器官中收集。優選地,它們是整個植物或由此分離的器官的一部分;在這種情況下,以土壤桿菌屬菌株的瞬時轉化將通過農桿菌浸潤(agroinfiltration)來實現。
農桿菌浸潤是基于將包含有關基因的農桿菌送入完整的植物組織中的一種瞬時表達方法。
一個包括有關基因的DNA結構被克隆成為一個二元載體并且被轉移進一個選定的土壤桿菌屬菌株,并且該經轉化的農桿菌生長至對數生長期或者飽和并且用與常規土壤桿菌屬介導的轉化相同的方法進行收集。經典地,農桿菌浸潤是通過將被轉化的土壤桿菌屬細胞的懸浮液或者用沒有針頭的注射器注射進選定植物的一個器官(通常是葉子),或者通過幾分鐘的真空浸潤。將該真空釋放后,該器官或整個植物被放在一個生長室內。該有關的表達蛋白質從浸潤的器官提取,一般在浸潤后一至四天。各個農桿菌浸潤方案在不同的發表物上有披露,例如KAPILA等人,(Plant Sci.122,101-108,1997);BENDAHMANE等人,(Plant Cell,11,781-792,1999);SCOFIELD等人,(Science.,274,2063-5,1996);TANG等人,(Science.,274,2060-3,1996);MARILLONNET等人,(Proc Natl Acad Sci USA,101,6852-7,2004);WROBLEWSKI等人,(Plant Biotech.J.,3,pp.259-273,2005)。
用于土壤桿菌屬介導的瞬時表達的、特別是用于農桿菌浸潤的經典方案能夠用在本發明的實踐中。具有二元載體的土壤桿菌屬菌株以及控制有關基因表達的調控元素有很大的選擇范圍,一位本領域有技能的人士可以在它們中間選擇更適合的、例如按照計劃使用的宿主植物。
在以下實施例中披露的實驗中,諸位發明人使用了一個pBIN19-衍生的二元載體,pBIN61,和潛伏了高毒性pCH32質粒的土壤桿菌屬菌株C58C1,并且cDNA或基因組編碼序列已經在CaMV 35S啟動子下進行了表達。但是,其他二元載體、其他土壤桿菌屬菌株和其他構成或可誘導啟動子能夠被用于到達同樣的結果。
有利的是,農桿菌浸潤將在葉子中進行,它能夠任選地在浸潤之前或之后立即從所述植物分離。
能夠在本發明的方法中使用的宿主植物包括與土壤桿菌屬轉化相容的任何植物。優選的植物特別包括煙草屬的那些植物,尤其是本塞姆氏煙草(Nicotiana benthamiana)和普通煙草(Nicotiana tabacum)。
根據本發明的一個優選的實施方案,通過包含下列步驟的方法從農桿菌浸潤的植物器官,特別是從農桿菌浸潤的葉子中分離出所述內切核酸酶-從表達所述內切核酸酶的農桿菌浸潤的器官提取細胞內含物;-將終濃度為30%或以上的硫酸銨加入到所述提取物中,并從上清液中分離蛋白質沉淀物;-將終濃度為80%或以上的硫酸銨加入到所述上清液中,并回收含內切核酸酶的蛋白質沉淀物。
所述蛋白質沉淀物在一個合適的緩沖液中被再次懸浮,例如是一個包含Tris HCl(pH 8)、PMSF和10%甘油的緩沖液。它可以直接使用,或者在-80℃下保存至使用。
可替代地,上面表明的該第一個步驟之后所獲得的全部提取物可以如此使用,而不用進行多個硫酸銨沉淀的步驟。
可任選地,本發明的方法生產的內切核酸酶能夠用本身已知的任何適當方法進一步提純,例如柱親和提純法,其中用一個標簽將CEL I標記為在柱中對某一特殊成分具有親和力。按照一個優選的實施方案,本發明的CEL I被標以6-組氨酸標簽,用在鎳-NTA上的金屬親和層析法提純。
本發明還提供了一種方法,用于測試候選內切核酸酶是否為錯配特異的內切核酸酶,其中所述方法包括a)用如上定義的本發明的方法以重組方式生產所述候選內切核酸酶;b)對所述重組內切核酸酶的降解單鏈DNA的能力進行測試;c)對所述重組內切核酸酶在一個預定的錯配位點剪切試驗異源雙鏈DNA片段的能力進行測試;d)對所述重組內切核酸酶剪切攜帶所有類型錯配(即堿基替代錯配A/A,G/G,C/C,T/T,A/G,A/C,G/T,C/T,G/A,C/A,T/C,T/G,以及插入或缺失錯配)的異源雙鏈DNA片段的能力進行測試。
如果內切核酸酶通過了步驟b)、c)和d)的測試(即如果它能夠降解單鏈DNA,能夠在預定的錯配位點剪切試驗異源雙鏈DNA片斷,并且能夠剪切攜帶所有類型錯配的異源雙鏈DNA片斷),它就被認為是錯配特異的內切核酸酶。
本發明還提供了一種篩選錯配特異的內切核酸酶的方法,其中所述方法包括a)用如上定義的本發明的方法以重組方式生產所述候選內切核酸酶;b)對所述重組內切核酸酶降解單鏈DNA的能力進行測試;c)對該重組內切核酸酶能夠降解單鏈DNA進行測試,并且對它們在已知并且有良好特征標記的錯配位點剪切試驗異源雙鏈DNA片段的能力進行測試;d)選擇能夠在已知并且有良好特征標記的錯配位點剪切試驗異源雙鏈DNA片段的重組內切核酸酶,并對它們剪切攜帶所有類型錯配的異源雙鏈DNA片斷的能力進行測試;e)選擇通過步驟b)、c)和d)測試的重組內切核酸酶。
按照上面定義的方法的一個優選的實施方案,它們還包含一個步驟,它包括在過量的野生型等位基因的存在下測試在DNA庫中檢測突變體等位基因的能力來對所述內切核酸酶測試它們的敏感性,并且選擇在至少9倍過量(即10個一群中有一個突變體等位基因)的野生型等位基因存在下能夠檢測出所述突變體等位基因的內切核酸酶,優選至少14倍過量存在,還更加優選至少19倍過量存在,并且按照增加的優選特性的順序,29倍過量、39倍過量、49倍過量、59倍過量的野生型等位基因。
優選地,以上定義的試驗是在具有pH值7至8,更有利7.4至7.8,并含有5至20mM,更有利10mM的MgCl2的反應混合物中進行。有利的是,所述反應混合物還包括0.5mM至2mM,優選1mM的DTT。諸位發明人還已經觀察到在2%至10%(w/v),特別是5%的最終反應混合物中添加PEG-8000,增加了該內切核酸酶的總體活性。
能夠用本發明的方法試驗的候選內切核酸酶能夠在該S1/P1族之中找到。在PFAM數據庫中(BATEMAN等人,Nucleic Acids Res.32,D138-41,2004),該族被指定為PFAM 02265。例如可以使用從PFAM 02265建立的HMM分布(隱含馬爾代夫模型(Hidden Markov Models))作為探針來篩選可用的DNA序列數據庫,使用HMMER軟件在不同的植物中識別候選內切核酸酶。
可替代地,InterPro IPR003154代碼(對應于S1/P1核酸酶)能被用于篩選數據庫內容,例如使用下列地址http//www.ebi.ac.uk/interpro/ISpy?ipr=IPR003154用此代碼篩選Trembl/Swissprot數據庫識別出了43個蛋白質(表1)。
表1用IPR003154代碼篩選Trembl/Swissprot數據庫的結果
這個分析優選通過在數據庫(blastp或tblastn)上執行Blast完成,使用一個參考蛋白序列(例如CEL I序列),選擇最佳命中數。
下面的各實施例將以更多的細節描述測試從擬南芥得到的五個候選內切核酸酶。
諸位發明人發現這些內切核酸酶之一,在所附序列表中表示在SEQ ID NO2名下(相應的DNA序列表示在SEQ ID NO1名下),并且它對應于擬南芥的BFN1,具有一個不同的特異性,以及比CEL I有更大的敏感性。
作為一個錯配特異的內切核酸酶,BFN1特性的這個發現,它直到此前是未知的,允許將它提議作為突變檢測試劑來使用,以便檢測由于堿基替代,以及由于一個或多個核苷酸插入/缺失而造成的錯配。
BFN1,以及任何根據本發明的方法可以確認的錯配特異的內切核酸酶,均可用生產內切核酸酶的方法大量獲得。
本發明還包括根據本發明的生產方法可獲得的重組體內切核酸酶制品。這些特別是重組體CEL I制品和重組體BFN1制品。
本發明的重組體CEL I制品與現有技術的CEL I制品相比具有不同的錯配特異性和更高的敏感性。本發明的重組體CEL I制品具有以下錯配優選特性T/G~A/G~G/G~G/T~T/T~G/A≥A/A~C/C≥T/C~C/T>A/C~C/A,而現有技術的CEL I制品的錯配優選特性是C/C≥C/A~C/T≥G/G>A/C~A/A~T/C>T/G~G/T~G/A~A/G>T/T。本發明的重組體CEL I制品能夠在23倍過量野生型等位基因存在下識別出突變體等位基因,而現有技術的CEL I制品在被稀釋超過8倍稀釋時不能有效地識別出突變體等位基因。
本發明的重組體BFN1制品與現有技術的CEL I制品和本發明的重組體CEL I制品相比也具有不同的錯配特異性。本發明的重組體BFN1制品有以下錯配優選特性G/G~G/A~A/G~G/T~T/G>T/T~A/A~C/C~T/C>C/T~A/C~C/A。這些酶中的每一個的錯配優選特性總結在下面表2中。
表2錯配識別優選特性比較
*=這些錯配由BFN1(ENDO1)識別比由重組體Cel I更有效。**注意剪切效率估測只是半定量的;因此,基于它們被內切核酸酶的識別,取決于研究者和/或試驗,輕微的差異會出現在錯配的排序中。
此外本發明的重組體BFN1制品比現有技術的CEL I制品和本發明的重組體CEL I制品均有更高的敏感性。本發明的重組體BFN1制品能夠在59-倍過量野生型等位基因存在下識別出一個突變體等位基因。
如上所述,本發明的重組體BFN1或CEL I內切核酸酶制品能夠作為一種突變檢測試劑在涉及錯配篩選的任何方法中使用。它們在基因分型,在TILLING、高產率TILLING、Ecotilling、GRAMMR等方面特別有利。
使用本發明的內切核酸酶制品的方法基本上包括如現有技術中一樣的步驟,即靶序列的聚合酶鏈反應擴增(PCR擴增),擴增產品的變性和退火以允許在野生型和突變體等位基因之間形成異源雙鏈,內切核酸酶剪切該異源雙鏈,以及分析剪切產品。在實行這些方法時不同內切核酸酶的混合能有利地被用于剪切這些異源雙鏈。
由于它們的高敏感性,本發明的內切核酸酶制品還能夠實行高產率方法來鑒別一個樣品中的突變。例如,根據本發明的內切核酸酶制品能用于對一個大的多的樣本數目實行例如WO 01/75167中描述的方法,因為它有可能將許多樣本集中在一起進行分析。
根據本發明,上述的內切核酸酶制品能用于針對來自任何生物體或由其衍生的細胞系的一個很大數目的樣本在靶基因中對一個或多個突變進行篩選,所執行的步驟如下a)從所述種群的每一單體對所述靶基因或其一部分進行擴增,b)在2維或3維矩陣中對所述擴增產品進行排序,包括行、列(2維矩陣)和柱(3維矩陣),c)將所述擴增產品集中,例如以此來獲得不同的庫,每個庫代表所述矩陣的一列、一行或一柱,d)向每個庫中添加從非變異基因中獲得的參考擴增產品,在能夠形成異源雙鏈的環境下對這些庫進行培養,e)用根據本發明的內切核酸酶制品對每個庫進行培養,并且f)在所述培養的庫中對異源雙鏈的存在進行檢測。
可替代地,以上方法能夠通過首先在矩陣中對樣本進行排序,然后將它們(連同添加的參考)集中,并且實行擴增、培養和檢測步驟。
取決于要篩選的樣本數目,該矩陣可以是2維或3維矩陣。例如,如果要篩選576個樣本,可以使用24×24矩陣。如果要篩選13824個樣本,那么3維矩陣可能會更合適(24×24×24)。僅需要72個反應來篩選該種群,并且各突變的基因將按照它所屬的庫的柱、列和行來單獨區分。
該參考擴增產品對應于從該參考基因(與之對照來尋找突變)獲得的一個擴增產品,以與該種群中的靶基因相同的引物來擴增。添加一個參考擴增產品是很重要的。確實,盡管所有的樣本留存著與參考基因相比完全一樣的突變是非常不太可能的,但是這將確保如果該群包含了一個留存著突變的靶基因,那么異源雙鏈就可以形成。
本發明將由以下的進一步描述來說明,其中參照的實施例展示了重組體CEL-I內切核酸酶的制備和性能,對來自擬南芥的五個候選內切核酸酶的測試,以及對BFN1(以下也被命名為ENDO1)作為錯配特異的內切核酸酶的鑒別。但是應該理解,這些實施例僅用來解釋本發明,并不構成對其任何形式的限制。
圖1瓊脂糖凝膠上的點突變檢測。(野生型和突變體DNA的)異源雙鏈已經被由不同的重組體Cel I的稀釋液(D100~D1000)或不含蛋白質(-)來培養。
圖2丙烯酰胺凝膠上的點突變檢測。WT+Mut來自野生型的DNA和突變體在聚合酶鏈式反應(PCR)之前已經被混合在一起,因此產生異源雙鏈。WT僅有野生型DNA被用于PCR,因此僅產生同源雙鏈。Mut僅有突變體DNA被用于PCR,因此僅產生同源雙鏈。D100,D500和D1000重組體蛋白質Cel I的稀釋液。
在凝膠上部指出了同源雙鏈的尺寸(661bp)。在405bp處的箭頭顯示由FAM熒光染料標記的片斷。在256bp處的箭頭顯示由ROX熒光染料標記的片斷。
圖3瓊脂糖凝膠上的基因組DNA中的點突變檢測。PCR產品按照以下實施例4的披露用引物4-960和4-721(SEQ ID Nos3和4)來獲得。然后它們用由硫酸銨沉淀法獲得的重組體CEL I制品的不同稀釋液來酶解(如實施例2披露),并且在瓊脂糖凝膠上進行分析。rms 1-13突變體和野生型等位基因的PCR產品的尺寸大約是500bp(確切的是481bp)。作為異源雙鏈DNA內突變的檢測結果,獲得了大約200和300bp的兩個帶。即使在煙草產生的蛋白質1/1000稀釋時這兩個帶也能在瓊脂糖凝膠內看到。
1D100;2D500;3D1000;4沒有酶。
ATerese;Brms1.13;CT+rms1.13。
圖4所有錯配類型的重組體Cel I活性分析。基于Rx基因的一系列突變體通過PCR產生,并且異源雙鏈是通過將對應于那些不同突變體的擴增產品進行混合而獲得。用IRD700和IRD800熒光基團(MWS)標記的寡核苷酸被用于PCR,并且錯配檢測是在LICOR4300(LICOR)上進行。該圖顯示IRD染料700(A)和IRD染料800(B)的運行通路。通路A顯示204bp片斷的5’端片段被IRD-700-標記,通路B顯示438bp片斷在3’端片斷用IRD-800染料標記。
圖5煙草中產生的重組體Cel I蛋白質的敏感性。1野生型豌豆(WtPea);2 Le1;3 Wt+Le1;4 Wt+Le1+2DNAs;5 Wt+Le1+4DNAs;6 Wt+Le1+6DNAs;7 Wt+Le1+8DNAs;8 Wt+Le1+10DNAs。
圖6用五個候選內切核酸酶在C-A/T-G錯配位點剪切異源雙鏈DNA。(Ho)=同源雙鏈DNA;(Ht)=異源雙鏈DNA。
圖7用ENDO1和ENDO5對所有類型錯配的特異識別的詳細分析。使用了與圖4相同的實驗方案。
圖8測量ENDO1檢測敏感性的試驗。突變體(Le-1)和野生型(Torstag)DNA的一個混合物按以下比例用作ENDO1活性的模板1個突變體對應2,4,6,8,10,15,20,25,30,35,40,50和60個野生型(從左到右)。每個幅面的最后兩行是同源雙鏈(僅有突變體和僅有野生型)。左邊的幅面IRD700通路,檢測到的片斷尺寸=338bp。右邊的幅面IRD800通路,檢測到的片斷尺寸=300bp。
圖9用Cel 1和Endo1錯配檢測的對比。第1,5,8和10行對應同源雙鏈。被內切核酸酶剪切得到的片斷為405bp(用藍色標記)和256bp(用紅色標記,在黑白畫面上不太明顯)。Endo1比Cel 1更有效地識別出錯配。此外,用Endo1背景(非特異活性)更低。
圖10在兩種不同稀釋液中(D1000和D5000)用ENDO1在丙烯酰胺凝膠上對一個已知點突變的檢測。M5和M12是兩個含有Rx基因的質粒;一個包含Wt型,另一個包含突變型。引物Rx21rox和Rx22fam(在該圖中,較小的剪切帶,用紅色標記,在凝膠上顯示很明顯,但是在黑白圖上不太明顯)。
具體實施例方式
實施例1CEL I內切核酸酶的克隆、提純和生產克隆CEL I的cDNA從芹菜中提取RNA嫩葉組織(1g)在液氮中用一個研棒和研缽磨碎。將粉末懸浮在10ml Trizol(Gibco)提取緩沖液中。該混懸液與2ml氯仿混合,在4C時12000rpm下離心15分鐘。該上清液與等體積的異丙醇混合,總RNA用離心沉淀法在4℃時12000rpm下沉淀10分鐘。該片狀沉淀物用80%的乙醇沖洗,風干并且在200μl二乙基焦磷酰胺(DEPC)水中再次懸浮。
脫氧核糖核酸酶(DNase)處理進行脫氧核糖核酸酶(DNase)處理來水解污染RNA制品的DNA。按照生產廠的條件(普洛麥格(Promega))將10μg總RNA用10個單位的DNase培養。
反應在室溫下培養15分鐘,然后通過添加乙二胺四乙酸(EDTA)至最終濃度為25mM并通過在65℃時使DNase加熱失活10分鐘使反應停止。
CEL I cDNA合成將10微升DNAse處理的RNA用于第一股(first strand)cDNA的合成。第一股cDNA合成用2皮克分子的20mers oligo dT引物來引發。50μl的反應混合物(10μl的5x Superscript緩沖液[GIBCO-BRL],5μl的100mM DTT,5μl的5mM dNTP)在70℃加熱10分鐘,然后在冰上冷卻。加入1μl的Superscript逆轉錄酶(200單位/μl;GIBCO-BRL)和1μl RNA酶抑制劑(RNase inhibitor)(37單位/μl,Pharmacia),并且該反應在42℃培養1小時。使用PCR擴增將第一股cDNA轉化成雙鏈DNA,這是通過使用兩個對CEL I的5’和3’非翻譯區(UTR)特異的引物(見下面表3)的PCR擴增。
克隆CEL I并且在煙葉上表達全長CEL I開放讀碼框被PCR擴增并且在二元載體pBin19的35S啟動子和花椰菜花葉病毒(CaMV)轉錄終子之間插入,以此產生pBIN35S-CELI。另一個構造pBIN35S-CELI8His也被創立。pBIN35S-CELI8His與pBIN35S-CELI完全相同,僅除外在CEL I蛋白質C-端插入8個氨基酸的組氨酸標簽。用于產生pBIN35S-CELI和pBIN35S-CELI8His的寡核苷酸在下面表3顯示。
表3
這些構造被轉化進入攜帶毒性輔助細胞質粒pCH32的土壤桿菌屬菌種C58C1(Hamilton等人,PNAS,93(18)9975-9979,1996)。pCH32表達了VirG和VirE而且被用于促進T-DNA轉化。土壤桿菌屬細胞被接種到添加了50μg/mL卡那霉素和5μg/mL四環素(tetracycline)的5mL的L肉湯培養基(Sambrook等人,1989)中,在28℃下生長一夜。然后將添加了50μg/mL卡那霉素,5μg/mL四環素的L肉湯培養基(50mL)接種到5-mL過夜的培養液中,在29℃下生長2天。細胞在一個包含10mM MgCl2,10mM MES,pH 5.6,以及150μM乙酰丁香酮的溶液中被沉淀和再次懸浮至最終濃度為0.5OD600。培養液在農桿菌浸潤進入煙葉(Nicotianabenthamiana leaves)之前在室溫下培養2個小時。
土壤桿菌屬混懸液用一個沒有針頭的注射器注射進葉子內。
農桿菌浸潤的本塞姆氏煙草屬植物(Nicotiana benthamiana plants)在24℃下至少培養48小時,16小時光照,60%的濕度。為了測試農桿菌浸潤的效率,植物還用表達綠色熒光蛋白質(GFP)的構造進行農桿菌浸潤。在收割這些葉子之前,使用紫外燈檢查每一片葉子的GFP表達強度。只有當GFP被表達了,植物葉子才能收割。
通過硫酸銨沉淀法從煙葉中制備蛋白質農桿菌浸潤的煙葉被收割并稱重。兩克農桿菌浸潤的葉子在含有0.1M Tris-HCl pH8,200μM PMSF,0.125mM β-巰基乙醇和10%甘油的7ml緩沖液內進行均質處理,然后在3000g下離心25分鐘使細胞碎片成粒狀。對于上清液,加入100%的硫酸銨使最終濃度達到30%,然后將樣本在冰上培養1小時,在30000g下4℃時離心30分鐘使蛋白質成粒狀,這些粒狀蛋白質在30%的硫酸銨沉淀。對于上清液,加入100%的硫酸銨使最終濃度達到80%,然后將樣本再次在冰上培養1小時,如上離心使蛋白質成粒狀,在80%的硫酸銨沉淀。包含在80%硫酸銨沉淀的蛋白質的片狀沉淀物在600μl均質化緩沖液中再次懸浮。蛋白質濃度用考馬斯試劑分析試劑盒(kit Coomassie Plus Reagent Assay(Pierce))確定。均質的片狀沉淀物包含14μg蛋白質/μl。因此,從2克農桿菌浸潤的煙葉中收回8400μg蛋白質。均質的片狀沉淀物在含有50mM Tris-HCl pH8,10%甘油和100μM PMSF的緩沖液中稀釋至1μg/μl,等分樣本并在-80℃下保存。
用Ni-NTA親和色譜法提純His-6標記的蛋白質收集5克農桿菌浸潤的煙葉并且在含有磷酸鈉(100mM),Tris HCl pH 8(10mM),NaCl(200mM),甲基重亞硫酸鈉(Sodium methabisulfite)(0.2%),PMSF(1mM),β巰基乙醇(10mM)的冰凍的緩沖液中進行均質處理。均質化之后,樣本在6000g(Beckman,轉子JA 20)4℃下離心10分鐘。將咪唑(10mM)加入該上清液,用NaOH將pH調至9。該溶液在42,000g(Beckman,轉子JA 20)4℃下離心60分鐘。該上清液與預先用均質化緩沖液+10mM咪唑pH9(緩沖液B)平衡的1ml Ni-NTA瓊脂糖(Quiagen)混合。該混合物在4℃均質2個小時,以使蛋白質結合到Ni-NTA瓊脂糖粒。將該粒被裝在1ml的聚丙烯柱內(Quiagen),樹脂用20ml的緩沖液B沖洗。該蛋白質用5ml(5×1ml)的緩沖液B+250mM咪唑pH9洗脫。等分部分在提純過程中被保存來進行酶的活性。為了避免高濃度咪唑對于酶活性的任何抑制作用,被洗脫的部分用4升含有Tris-HCl pH8,0.1M,PMSF 100μM和ZnCl22μM的緩沖液在4℃透析一夜。這樣,回收1000μg蛋白質。均質的片狀沉淀物在含有50mM Tris-HCl pH8,10%甘油和100μM PMSF的緩沖液中稀釋至3μg/μl,等分樣本并且在-80℃保存。(稀釋D10,000)。
實施例2單鏈特異DNA降解該重組體Cel I降解單鏈DNA的活性如以前的描述來進行(SUNG SC,LAKKOWSKI MSr.(1962),J Biol Chem.1962 Feb;237506-11)。將30微克的脫氧核糖核酸酶(Dnase)、核糖核酸酶(Rnase)和無蛋白酶妁豌豆基因組DNA(protease free Pea genomic DNA)在一個含有50mM Tris-HCl(pH 7.6),10mM MgCl2,1mM DTT和5%PEG-8000的緩沖液中用2μg蛋白質提取物培養。為了終止反應,加入0.2N HCl中的等體積的20mM LaCl3。樣本在21000g下離心40分鐘,使用分光光度計測量上清液在260nm的吸收度以確定變成可溶于酸的DNA的量。
實施例3煙草中產生的內切核酸酶在瓊脂糖和丙烯酰胺凝膠上剪切異源雙鏈DNA以及檢測一個試驗基因的已知點突變為了測試在煙草中產生的CEL I內切核酸酶是否能夠識別單個的點突變,通過硫酸銨沉淀法獲得的重組體CELI制品的活性對在單一點突變不同的兩個克隆的異源雙鏈DNA進行了測試C-G至A-T轉變(Bendhamane等人,Plant Cell,11,781-792,1999)。使用兩個寡核苷酸R21和R22(R21 5′GAC ATA TGG ACT ACA GAA GCT TGG G 3′SEQ ID N°8;R22 5′GTT CAC GGG TCA CAT CAT GCA TTC C 3′SEQ ID N°9)在兩個克隆上進行了聚合酶鏈式反應(PCR)。用下列方案進行了異源雙鏈DNA的PCR擴增和重組在95℃下變性2分鐘,隨后進行7個循環的94℃ 20秒,Tm(55℃)+3℃至Tm-4℃進行15s,每個循環-1℃,以0.5℃/秒梯度降至72℃而且在72℃延長1分鐘,然后進行44個循環的94℃20秒,30℃的Tm -5℃,以0.5℃/秒梯度降至72℃而且在72℃延長1分鐘,最后在72℃延長5分鐘,并且在94℃進行變性步驟10分鐘,然后降至40℃保持20秒,每個循環-0.3℃。
該PCR產品(野生型和突變體DNA的混合物,或僅是野生型或突變體DNA)按如下用CEL I制品(1μg/μl母液被稀釋至1/100,1/500,或1/1000)培養例如,10μl的PCR產品(500ng)用總體積為25μl的2.5μl反應緩沖液(Hepes 10mM,MgSO4 10mM,Triton X1000.002%,KCl10mM)和2.5μl稀釋的CEL I制品在37℃培養30分鐘。反應用5μl的500mM EDTA終止,將該酶解產品在3%的瓊脂糖凝膠上進行分析。
如圖1所示,在異源雙鏈DNA上的試驗基因Rx的點突變的檢測由稀釋至1/100,1/500和1/1000的大約200bp和400bp的兩個帶的出現所揭示。未加入酶時這些帶不會出現。
使用熒光標記的引物獲得的而且用同上面一樣方法酶解的PCR產品在ABI377定序器上在丙烯酰胺凝膠上進行分析(圖2)。
如圖2所示,在256和405bp的這兩個帶只有當Wt和Mut DNAs混合在一起時才出現,因為這兩個DNA之間形成了異源雙鏈。當使用不同長度波來使凝膠顯影時這就顯現得更清晰。特別是,當使用WT+Mut混合作為PCR模板時,用ROX熒光染料(紅色)標記的256bp帶就會清楚地呈現,而在黑白圖2上不是非常清楚地個別化,而且在其他情況下并不存在。
這些結果顯示植物內(in planta)產生的CEL I蛋白質能夠在DNA中識別錯配。
實施例4用重組體CEL I檢測從豌豆中得到的基因組DNA中的點突變為了試驗從煙草提純的重組體CEL I是否能被用于檢測豌豆中的單個點突變,先前由Catherine Rameau進行了特征標記的(MORUS等人Plant Physiol 2001,1261205-1213.;RAMEAU等人,Plant Physiol 2002,115458-467)不同的豌豆rms和le突變體被用于實驗;rms1.11包含G---->A位于基因序列中的不同位置;rms 1-12包含G---->A;rms 1-13包含G--->A。所有都是在同一基因rms1對G---->A發生突變,但位于不同位置。
為了擴增rms位置(rms1-13,rms1-10,rms1-12)和le位置的野生型和突變體等位基因,50毫微克的豌豆基因組DNA被用作模板。在這個PCR擴增中使用的引物總結于表4之中。
表4
PCR擴增的程序是94℃ 1分鐘,(94℃ 15秒,55℃ 15秒,74℃ 1分鐘,X35)74℃ 7分鐘,8℃。該PCR產品在瓊脂糖凝膠上進行分析和用硫酸銨沉淀法獲得的重組體CEL I制品的不同稀釋如上面實施例2的披露進行酶解。如圖3所示,rms1-13突變體和野生型突變體的PCR產品的尺寸大約為500bp(準確地是481bp)。作為異源雙鏈DNA中突變檢測的結果,獲得了大約200和300bp的兩個帶。這兩個帶即使在煙草中產生的蛋白質1/1000的稀釋也能在瓊脂糖凝膠內看到。這個結果顯示植物內產生的蛋白質首先能夠識別基因組DNA中出現的點突變,其次因為即使蛋白質被稀釋到1/1000酶解產品也能被看到,所以它是非常有活性的。
實施例5用重組體CEL I在不同錯配之處剪切錯配的效率為了測試根據本發明制備的重組體CEL I是否像從芹菜提純的CEL I一樣優選地切斷某一類型的錯配,創造了一系列基于Rx基因的突變體。為了那個目的,我們設計了不同的引物(稱作Rx-A,T,G或C),每個包含一個不同的點突變。這些引物的每一個允許在Rx基因指定位置引進4個基底中的一個(A,T,G或C)。異源雙鏈是通過混合用不同引物獲得的擴增產品來創造。
PCR混合物(總體積為50μl)包含模板DNA(50ng),dNTP(0.2mM),5μl PCR塞子Pfu(10X,Stratagene),引物Rx 21(0.4μM),引物Rx-A或Rx-T或Rx-G或Rx-C(0.4μM),Pfu(5U,Stratagene,2.5單位/μl)。用于PCR擴增的程序為94℃ 1分鐘,(94℃ 15秒,55℃ 15秒,74℃ 2分鐘,X35)74℃ 7分鐘,8℃過夜。用IRD700和IRD800熒光基團(MWS)標記的寡核苷酸被用于該PCR以允許在LICOR4300(LICOR)上的錯配檢測。
該PCR產品在瓊脂糖凝膠上進行分析,并在pGEM 3Zf內進行克隆。所有的克隆已經被排序以確保正確的突變已經被插入。PCR擴增中作為模板的這些構造的組合被用于重組所有類型的錯配。
錯配的PCR產品如上面實施例2披露的方法進行培養,使用如上面實施例1披露的用硫酸銨沉淀法從煙葉中獲得的重組體CEL I制品。
各個酶解產品在瓊脂糖凝膠上進行分析。使用了變性6.5%的丙烯酰胺凝膠,電泳條件是1500V,40W,40mA,45℃,掃描速度為1。
結果顯示在圖4上(Licor Gel)。
這些結果顯示本發明的CEL I制品識別出所有類型的錯配,尤其是現有技術報道的直接從芹菜提純的CEL I所微弱識別的錯配。確實,如上面表2所示,本發明的CEL I制品以非常高的特異性識別被現有技術的CEL I制品微弱識別的錯配,如T/T,G/A,A/G,G/T,T/G,而且這個酶的錯配優選特性如下T/G~A/G~G/G~G/T>T/T~G/A~A/A~C/C>T/C~C/T~A/C~C/A。
當CEL I反應緩沖液補充進5%PEG時,該特異活性還會被提高(未顯示數據)。
實施例6重組體CEL I的敏感性為了驗證本發明的重組體CEL I能被用于高流率基因分型,對它是否能夠在一個單體庫中識別出突變進行了試驗。
對應于矮豌豆突變體Le1的具有一個已知SNP(C-->T)的基因組DNA和來自野生型豌豆栽培變種Torstag的基因組DNA已經被用于擴增Le1基因座。這些基因組DNA已經在同源雙鏈和異源雙鏈的形成時用作對照。
為了產生異源雙鏈DNA,le1基因座的從豌豆植物同質結合體得到的基因組DNA被用不同比例的Le1基因座的從豌豆植物同質結合體得到的基因組DNA進行稀釋,用被TET熒光染料(5’-TGATATTGTCGTGCAATATGATGAAAC-3’SEQ ID N°14)標記的引物Le2462和被ROX(MWG)熒光染料(5’-ATACCTATTTAGCCCACTTGGACAC-3’SEQ ID N°15)標記的Le3082,將30ng用于PCR擴增。該PCR反應如下進行94℃ 1分鐘,(94℃ 15秒,55℃ 15秒,74℃ 1分鐘)X35,74℃ 7分鐘。從PCR產品重組的異源雙鏈DNA在上面描述的錯配檢查測定法中被用作模板。
使用從煙草產生的蛋白質的這個集中實驗的結果在圖5顯示。如所期望的,無論何時在野生型鏈和突變體DNA鏈之間已經形成異源雙鏈時,我們的重組體蛋白質都能夠識別出SNPLe1。作為酶解的結果,已經獲得了期望尺寸的兩個帶(300bp和338bp),和符合未酶解同源雙鏈的第3個帶(638bp)。被標記為紅色的這個338bp帶清楚地顯示在凝膠上(但是黑白圖上可見性差一些)。最有趣的是,即便使用了24個不同基因組DNA的一個庫(添加23種未知基因組DNA的Le1和野生型)時,該突變仍能夠被蛋白質檢測到。
總之,植物內產生的蛋白質具有高敏感性、允許從來自至少24個個體的基因組DNA擴增的DNA序列之中鑒別出一個已知SNP。
實施例7擬南芥中不同內切核酸酶的生物信息研究使用來自數據庫PFAM的蛋白質序型(protein profile)PF02265,已經做了來自編碼為內切核酸酶的擬南芥的基因族的分析。該序型HMM被用作探針以靶向擬南芥基因組的所有27117預測蛋白質,并且為了避免自動結構注解效應對全部基因組進行了6次不同移碼的平移。在該分析中我們鑒定出5個候選基因At1g11190,At1g68290,At4g21590,At4g21585和At4g21600。
實施例8在煙葉中克隆和表達擬南芥候選基因每個候選基因的cDNA被PCR擴增并插入35S啟動子和二元載體pBin61中的轉錄端子的CaMV之間以產生pBIN35S-ENDO1,-ENDO2,-ENDO3,-ENDO4和-ENDO5,它們分別對應著At1g11190,At1g68290,At4g21585,At4g21590和At4g21600(表5)。這些構造被轉化成攜帶毒性輔助細胞質粒pCH32的土壤桿菌屬菌株C58C1(HAMILTON CM,等人,(1996)ProcNatl Acad Sci USA.,93(18)9975-9)。pCH32表達了VirG和VirE而且被用作提高T-DNA轉移。土壤桿菌屬細胞被接種到2mL的L肉湯培養基中(SAMBROOK等人1989),該培養基添加了50μg/mL卡那霉素和5μg/mL四環素并且在28℃生長一整夜。細胞在一個包含10mM MgCl2,10mM MES,pH 5.6,和150μM乙酰丁香酮的溶液中被沉淀而且再次懸浮至最終濃度為0.5OD600。該培養液在農桿菌浸潤進本塞姆氏煙葉之前在室溫下培養2小時。農桿菌浸潤的本塞姆氏煙草植物在24℃,16小時光照,60%濕度至少培養24小時。為了測試農桿菌浸潤的效率,植物還被用表達綠色熒光蛋白(GFP)的構造進行農桿菌浸潤。在收割這些葉子之前,每片葉子GFP表達的強度使用紫外光燈檢查。這些植物葉子只有當GFP被表達了才收割。候選蛋白質用硫酸銨沉淀法提取,如實施例1所披露的。
表5用于克隆帶有或沒有組氨酸標簽的候選內切核酸酶的引物的序列
實施例9候選蛋白質的生物化學特征。
作為一個簡單的實驗來判斷候選蛋白質是否有活性,我們用不同稀釋的蛋白質提取物(80%硫酸銨沉淀物)培養了一些超螺旋質粒。作為蛋白質提取物中內切核酸酶存在的結果,該超螺旋結構應該被松弛,當你在一個瓊脂糖凝膠上進行培養基質走膠時會出現一些新的DNA帶。使用不同的稀釋,我們能夠比較不同的內切核酸酶而且能夠看出哪一個是最活躍的。對照組總是通過硫酸銨沉淀法制備的重組體Cel I內切核酸酶,如上面實施例1所披露的。
為了篩選能夠在錯配位點剪切異源雙鏈DNA的候選蛋白質,我們還可以使用基于三個連續步驟的快速特征標記系統。
在第一步中,測試該候選蛋白質降解單鏈DNA的能力。對該條件進行測試是因為異源雙鏈DNA錯配位點的DNA是單鏈的。因此,一個不能酶解單鏈DNA的內切核酸酶被預測為不能在錯配位點剪切DNA。第二,該候選蛋白質應該在已知并很好地特征標記了的錯配位點上剪切一個試驗異源雙鏈DNA。第三,對通過試驗1和2的蛋白質評估它們剪切攜帶所有類型錯配的異源雙鏈DNA片段的效率。這是利用由一組很好地特征標記了的質粒構造組成的DNA工具箱來進行,這些質粒構造在插入的特定位置上包含四種可能核苷酸中的每一種。
降解單鏈DNA的能力該候選蛋白質降解單鏈DNA的活性如實施例2描述的進行。在該分析中所有五個候選蛋白質顯示出核酸酶活性,而且從最活躍到不活躍被分級為ENDO1,ENDO5,ENDO2,ENDO3和ENDO4。
在C-A/T-G錯配位點剪切異源雙鏈DNA為了測試煙草產生的該候選蛋白質是否能夠識別出單個點突變,我們在按實施例3的披露所產生的異源雙鏈DNA上測試了蛋白質提取物的活性。包括每個或兩個等位基因的PCR產品用1/1000稀釋的蛋白質提取物培養,這些蛋白質提取物是從用候選內切核酸酶基因或用GFP作為對照進行農桿菌浸潤的葉子得來的,其方式如下500ng PCR產品在最終體積為25μl包含50mM Tris-HCl(pH 7.6),10mM MgCl2,1mM DTT和5%PEG-8000的煙草蛋白質提取物中在37℃培養30分鐘。這些反應在最終濃度80mM用EDTA終止,并且在3%瓊脂糖凝膠上進行分析。
如果這兩個寡核苷酸被熒光標記了,該酶解產品在丙烯酰胺凝膠上用377Abi DNA序列測定儀進行分析。在該實驗中,我們預計如果蛋白質提取物包含錯配特異的內切核酸酶,該異源雙鏈DNA將在錯配位點被剪切,因此釋放出256bp和405bp兩個帶。
這些結果在圖6上顯示(注意,用紅色標記的256bp帶在酶存在于異源雙鏈中時很清楚看到,若不存在就不清楚;該帶在黑白圖上不是很清晰)。
從這個生化分析中,我們的結論是這五個內切核酸酶顯示出了錯配特異的剪切活性。另外,具有更高單鏈DNA特異-核酸酶活性的三個酶ENDO1,ENDO5,ENDO2,也以更高效率在C-A/T-G錯配位點剪切異源雙鏈DNA。而且,在這三個內切核酸酶中,ENDO1和ENDO5是最活躍的。因此,這兩個核酸酶被選擇進行更精確的特征標記。
候選內切核酸酶在不同錯配位點的錯配剪切效率這個任務的主要目標是鑒別能夠剪切CEL-I不能有效識別的錯配的內切核酸酶。這是使用由一組很好地特征標記了的質粒構造組成的DNA工具箱來進行,這些質粒構造在插入的特定位置包含四種可能核苷酸中的每一種。這些構造的組合作為PCR擴增中的模板被用于重組所有類型的錯配。
錯配的PCR產品用候選內切核酸酶如上進行培養(見實施例5)并且在LICOR序列測定機器上進行分析。
結果顯示于圖7。
在這個分析中,ENDO5像CEL-I一樣微弱地識別T/T型錯配。相反,ENDO1高效率地識別幾乎所有類型的錯配。從這個分析中我們可以得出結論ENDO1能夠識別CEL-I未檢測出的錯配。
實施例10在一個DNA庫中ENDO1檢測突變體等位基因的敏感性ENDO1的敏感性已經如實施例3的描述進行了評估,用攜帶野生型等位基因的DNA的2,4,6,8,10,15,20,25,30,35,40,50或60倍稀釋。
該集中試驗的結果呈現于圖8,它顯示了從一個同質結合體野生型的60個等位基因中將來自一個同質結合體突變體的一個等位基因檢測出來。已經做了來自兩個有機體的PCR,而且擴增子已經在瓊脂糖凝膠上定量化,按照PCR擴增子從1∶1到1∶60遞減的比例混合在一起。然后測定了在那些不同突變體∶野生型的比例下ENDO1的活性。
在相同的實驗中,從芹菜中提純的CEL-I能夠以低靈敏度最多從16個當中檢測出一個等位基因,只有當稀釋不足或等于8倍時才能獲得正確的靈敏度。
總之,根據本發明的內切核酸酶特別是ENDO1比Cel I具有更少的背景噪音,與Cel I相比能夠被用在非常高的稀釋度而且比Cel I內切核酸酶具有更好的特異性和活性。
在丙烯酸胺凝膠上檢測點突變。
創造了基于Rx基因的一系列突變體。為了顯示ENDO1的特異性,我們已經設計了包含每一種類型錯配的不同質粒。該PCR混合物包含對質粒特異的寡核苷酸。用ROX和FAM熒光基團(MWG)標記的寡核苷酸被用于PCR以允許在ABI377 MWG上進行錯配檢測。
如圖9所示,當僅有同源雙鏈存在時ENDO1不會切開,例如線1或線5,而且我們在凝膠上所能夠看到的僅有的帶是凝膠頂端的同源雙鏈(大約600bp)。
任何時候我們在樣本中有一個錯配時(來自兩個不同質粒的兩個DNA鏈之間形成的異源雙鏈,例如在線2,3,4或6,7,和9),ENDO1就能在錯配位點上進行識別和切開,導致出現對應著兩個產品的兩個帶,每一個用一個熒光基團標記。由于該ENDO 1酶解,能夠在背景中看到減少,并且某些錯配僅可被ENDO1檢測出來(例如線9)。
在兩個不同稀釋D1000和D5000中在ENDO 1的丙烯酸胺凝膠上對一個已知點突變的檢測使用了包含一個野生類型和一個突變類型的Rx基因的兩個質粒。它們僅由一個已知的點突變來區別。該PCR混合物包括對質粒特異的寡核苷酸。用ROX和FAM熒光基團(MWG)標記的寡核苷酸被用于PCR以允許在ABI377 MWG上進行錯配檢測。
如圖10所示,任何時候在我們的樣本中出現異源雙鏈時(M5+M12),ENDO1就能夠在該錯配位點進行識別并且切開,導致出現熒光基團標記的兩個帶。當只有M5或M12同源雙鏈出現時,ENDO1不切開而且我們在凝膠上能夠看到的僅有的帶是在凝膠頂端的同源雙鏈(大約600bp)。當我們對ENDO1使用了D5000時能夠看到背景的改進。因此,Endo1與本領域中已知的任何內切核酸酶相比可以使用非常高的稀釋度。
序列表<110>法國植物基因組研究計劃-華萊法國國家農業科學研究院阿卜杜勒菲德·本達馬內貝內迪克特·斯圖勒保耶斯卡利內·特里凱斯米歇爾·卡博什<120>高敏感的內切核酸酶的生產方法、內切核酸酶的新制品及其用途<130>MJP/bv1516-19<150>PCT/EP2004/009159<151>2004-07-30<150>PCT/EP2004/009166<151>2004-07-30<160>25<170>PatentIn version 3.3<210>1<211>2640<212>DNA<213>擬南芥(Arabidopsis thaliana)<220>
<221>misc_feature<223>ENDO1基因At1g11190<400>1aaattcgatg aggttgttat agacaagaga agacattttt atacaaaaga gtttatcatt 60atataagttt caaactttga agatatggca tcggctttta gatcatccac gaggttgatt120cttgtattag gtatactgat tttgtgttcg gtttcttctg tccgaagctg gagcaaagaa180ggtcatattc ttacttgtag aattgctcag gtaattaagt taatgatcta ttgtttgaag240caactatttt ggttattctt gtcttatata tgtattagtg agatatacct acaaattttt300
aattaggatt gacttttaaa ttgctatacg ttaccatgcc taacatctca tgtagatgat360catgaataca aacatgtcta atggcatatc aaattccaag tttttttggt agagatctga420gtcatttgac cgttataaga ttcataacaa aagttcgtat gtgtgtgttt ttgtggtgtg480accagaatct tttagaagcc ggaccagcac atgtagtaga gaatctgtta ccggattacg540tgaaaggaga tttatcagca ttgtgtgtgt ggcctgacca gatccgacat tggtacaagt600atcgttggac cagccatctc cattacatcg acactcccga ccaagcctgc tcttacgaat660actctagtaa gtcacaaccg agacattttc agataacctt aatccgtttt ctaattatct720tgaaccggag ttaaccaaaa aatcaattac aaataccaaa ccggattaaa aacaggggat780tgtcatgatc aacatggatt gaaggatatg tgtgtggatg gagcaatcca gaatttcacg840tctcagcttc agcattacgg tgaaggaaca tctgatcgta gatgtatgtc atcattttca900tttatttcat ataatgatga tatccaaagt gtaactgcgt attttgtatt ttgatgcata960acttaagttt ttaaaattat aatatatcct tgttcaatca catagataac atgaccgaag 1020cccttttgtt cttgtctcat ttcatgggag atattcatca ggtttattac tcatcatcga 1080ttcatttcac acctccacac atatagctct atttccatgt taaatattta attaacatgg 1140tttttttttt tttccttaaa aagccgatgc atgtgggatt cacaagtgat gaaggaggaa 1200acacgataga tttacgttgg tacaaacaca aatccaatct acatcatgta agcttcttct 1260tttgtctctt tcaactttaa atttcatcat gaaaacaaaa aaaaaattaa cgaaggaaac 1320aaaatatgta ggtatgggat agagagatca ttctcacggc tctaaaagaa aactacgaca 1380agaacttgga tcttctccaa gaggatcttg agaagaacat caccaatgta atagacacta 1440atttattcat attttactat aattttaaga atctttataa tggttatcat atattaggga 1500ttatggcacg acgatctatc ttcgtggaca gaatgcaacg atcttatcgc ttgtccacac 1560aagtaagttt taaattactt ggtttaagat tggcttgacg ctcgtttgaa gctagctaca 1620
aattttgata ctttttctgg tccaaaaatc ttacaaagat actgaaaata aaataatagg 1680ttttaaactt ttaatttatt tggagttgga taggattaag tttcactaac ttccaattca 1740aagtcaatta atagtagttt accatgatta gtgggttgac taatgtacca tatatattac 1800cttatatcac atcttatttc cgatgtgaga tttcttatga aacataatta gactcgaacc 1860ttttgtgttt cgatatatgt agtgtattca tgatcagaat cttattaagt ttacaactga 1920aaactaaaat attaacatca taattataga ttcttaagta ggttttgttt gggtggagaa 1980aatatccaat ttcgaataac attatataaa atattgaact aattttaatt gtatacgcag 2040gtatgcttca gagagtataa agttagcttg taaatgggga tacaaaggcg tcaagtctgg 2100tgaaacgtta tcaggtacgt tgtttgcttc ttctttttct cgtacgctaa caaaaatatt 2160taaaaataaa cccgaccaaa tgaagtttaa ttaatcggat taatgatttt taatagtcac 2220tacttttttt gtgtgggata tatgactgtc taatatataa ttttataaga aagctaaagg 2280atttgtttaa taatttccga taaataattt tgcagaagaa tatttcaata caaggttgcc 2340aatagtgatg aagagaatag ttcagggagg agttagacta gccatgatac taaaccgggt 2400ttttagtgac gatcatgcta ttgctggtgt tgctgccact tgaaccaaac ccgacatacc 2460ggggcatcaa agcatttgat taagagatta tttgatacat tcacaaaatt aattaaggct 2520gatcagacat tcttttcttt tagtagcttt atctatgtga cagctaatgc ctgtggactg 2580ctttgtttag aagtgtttag cattagatca tatgctaatt caatgttatt aattcatcgt 2640<210>2<211>305<212>PRT<213>擬南芥(Arabidopsis thaliana)<220>
<221>misc_feature<223>蛋白質ENDO1 At1g11190
<400>2Met Ala Ser Ala Phe Arg Ser Ser Thr Arg Leu Ile Leu Val Leu Gly1 5 10 15Ile Leu Ile Leu Cys Ser Val Ser Ser Val Arg Ser Trp Ser Lys Glu20 25 30Gly His Ile Leu Thr Cys Arg Ile Ala Gln Asn Leu Leu Glu Ala Gly35 40 45Pro Ala His Val Val Glu Asn Leu Leu Pro Asp Tyr Val Lys Gly Asp50 55 60Leu Ser Ala Leu Cys Val Trp Pro Asp Gln Ile Arg His Trp Tyr Lys65 70 75 80Tyr Arg Trp Thr Ser His Leu His Tyr Ile Asp Thr Pro Asp Gln Ala85 90 95Cys Ser Tyr Glu Tyr Ser Arg Asp Cys His Asp Gln His Gly Leu Lys100 105 110Asp Met Cys Val Asp Gly Ala Ile Gln Asn Phe Thr Ser Gln Leu Gln115 120 125His Tyr Gly Glu Gly Thr Ser Asp Arg Arg Tyr Asn Met Thr Glu Ala130 135 140Leu Leu Phe Leu Ser His Phe Met Gly Asp Ile His Gln Pro Met His145 150 155 160Val Gly Phe Thr Ser Asp Glu Gly Gly Asn Thr Ile Asp Leu Arg Trp165 170 175
Tyr Lys His Lys Ser Asn Leu His His Val Trp Asp Arg Glu Ile Ile180 185 190Leu Thr Ala Leu Lys Glu Asn Tyr Asp Lys Asn Leu Asp Leu Leu Gln195 200 205Glu Asp Leu Glu Lys Asn Ile Thr Asn Gly Leu Trp His Asp Asp Leu210 215 220Ser Ser Trp Thr Glu Cys Asn Asp Leu Ile Ala Cys Pro His Lys Tyr225 230 235 240Ala Ser Glu Ser Ile Lys Leu Ala Cys Lys Trp Gly Tyr Lys Gly Val245 250 255Lys Ser Gly Glu Thr Leu Ser Glu Glu Tyr Phe Asn Thr Arg Leu Pro260 265 270Ile Val Met Lys Arg Ile Val Gln Gly Gly Val Arg Leu Ala Met Ile275 280 285Leu Asn Arg Val Phe Ser Asp Asp His Ala Ile Ala Gly Val Ala Ala290 295 300Thr305<210>3<211>28<212>DNA<213>人工序列(Artificial sequence)<220>
<223>引物4-960
<400>3gtgtttgtcc agtaatagtg tcagcata28<210>4<211>26<212>DNA<213>人工序列(Artificial sequence)<220>
<223>引物4-721<400>4aggaacctga gaaaagactc gccagc 26<210>5<211>40<212>DNA<213>人工序列(Artificial sequence)<220>
<223>CEL N末端<400>5tatcgttcta gagggaatga cgcgattata ttctgtgttc 40<210>6<211>27<212>DNA<213>人工序列(Artificial sequence)<220>
<223>CEL C末端<400>6tatctgaatt catgccaaag aatgatc 27<210>7<211>50<212>DNA<213>人工序列(Artificial sequence)
<220>
<223>CEL C末端8 His<400>7aattcaatgg tgatggtggt gatggtgatg tgccaaagaa tgatctgcgg 50<210>8<211>25<212>DNA<213>人工序列(Artificial sequence)<220>
<223>引物(R21)<400>8gacatatgga ctacagaagc ttggg25<210>9<211>25<212>DNA<213>人工序列(Artificial sequence)<220>
<223>引物(R22)<400>9gttcacgggt cacatcatgc attcc25<210>10<211>22<212>DNA<213>人工序列(Artificial sequence)<220>
<223>引物4m118<400>10ttggttggac ttcactttga gc 22<210>11<211>22
<212>DNA<213>人工序列(Artificial sequence)<220>
<223>引物4m984<400>11cacaacaatc agcaatgaca gc 22<210>12<211>23<212>DNA<213>人工序列(Artificial sequence)<220>
<223>引物4-347<400>12gtgattgctc cacctccgcc acc23<210>13<211>30<212>DNA<213>人工序列(Artificial sequence)<220>
<223>引物4-134<400>13tacagcgatt gatataatat aaaattatcc30<210>14<211>27<212>DNA<213>人工序列(Artificial sequence)<220>
<223>引物le 2462<400>14tgatattgtc gtgcaatatg atgaaac 27
<210>15<211>25<212>DNA<213>人工序列(Artificial sequence)<220>
<223>引物le 3082<400>15atacctattt agcccacttg gacac 25<210>16<211>27<212>DNA<213>人工序列<220>
<223>ENDO5的正向引物<400>16aaggatccga aagctctgtg tttcaga 27<210>17<211>28<212>DNA<213>人工序列(Artificial sequence)<220>
<223>ENDO5的反向引物<400>17ggagttgtta cgtgggttct caaggatc28<210>18<211>28<212>DNA<213>人工序列(Artificial sequence)<220>
<223>ENDO4的正向引物
<400>18ctggatccct gtttttaact ttggaaag 28<210>19<211>26<212>DNA<213>人工序列(Artificial sequence)<220>
<223>ENDO4的反向引物<400>19ggatgttcaa gtgattctcc tggatc 26<210>20<211>27<212>DNA<213>人工序列(Artificial sequence)<220>
<223>ENDO3的正向引物<400>20aaggatccat tcgacaaact ttgtaac 27<210>21<211>28<212>DNA<213>人工序列(Artificial sequence)<220>
<223>ENDO3的反向引物<400>21agagtggtct tgggaatatt tatctcag 28<210>22<211>26<212>DNA<213>人工序列(Artificial sequence)
<220>
<223>ENDO2的正向引物<400>22acggatccca tttcaaagaa ctctga 26<210>23<211>26<212>DNA<213>人工序列(Artificial sequence)<220>
<223>ENDO2的反向引物<400>23gaccaatcat tatgctgtaa cttcag 26<210>24<211>25<212>DNA<213>人工序列(Artificial sequence)<220>
<223>ENDO1的正向引物<400>24caggatccaa gtttcaaact tgaag 25<210>25<211>26<212>DNA<213>人工序列(Artificial sequence)<220>
<223>ENDO1的反向引物<400>25cggtatgtcg ggtttggttc aagtgg 2權利要求
1.一種生產重組體內切核酸酶的方法,其中所述方法包括-在宿主植物的細胞內表達所述重組體內切核酸酶,由包含表達載體的土壤桿菌屬菌株進行瞬時轉化,該表達載體包括對所述內切核酸酶進行編碼的聚核苷酸;-從所述宿主植物細胞中分離出所述重組體內切核酸酶。
2.如權利要求1所述的方法,其特征在于,所述植物細胞是在完整植物內或由其分離出來的器官內,并且其中使用所述土壤桿菌屬菌株的瞬時轉化是通過農桿菌浸潤來完成的。
3.如權利要求2所述的方法,其特征在于,所述農桿菌浸潤是在所述宿主植物的葉子內進行。
4.如權利要求1至3中任一項所述的方法,其特征在于,所述宿主植物屬于煙草屬(thegenus Nicotiana)。
5.如權利要求2至4中任一項所述的方法,其特征在于,通過包含下列步驟的方法從農桿菌浸潤的植物器官內分離出所述內切核酸酶-從表達所述內切核酸酶的農桿菌浸潤的器官提取出細胞內含物;-向所述提取物添加硫酸銨至最終濃度至少為30%,并從上清液中分離出蛋白質沉淀;-向所述上清液添加硫酸銨至最終濃度至少為80%,并回收包含內切核酸酶的蛋白質沉淀。
6.如權利要求5所述的方法,其特征在于,硫酸銨是在第一個沉淀步驟中添加至30%的最終濃度,并在第二個沉淀步驟中至80%的最終濃度。
7.一種測試S1/P1族(PFAM 02265)的候選內切核酸酶是否為錯配特異的內切核酸酶的方法,其中所述方法包括a)用如權利要求1至5中任一項所述的方法生產重組體形式的所述候選內切核酸酶;b)對所述重組體內切核酸酶降解單鏈DNA的能力進行試驗;c)對所述重組體內切核酸酶在預定的錯配位點上剪切試驗異源雙鏈DNA片段的能力進行試驗;d)對所述重組體內切核酸酶剪切攜帶所有類型錯配的異源雙鏈DNA片段的能力進行試驗。
8.一種篩選錯配特異的內切核酸酶的方法,其中所述方法包括a)用如權利要求1至5中任一項所述的方法生產重組體形式的候選內切核酸酶;b)對所述重組體內切核酸酶降解單鏈DNA的能力進行試驗;c)對能夠降解單鏈DNA的重組體內切核酸酶進行試驗,并對它們在已知而且很好地特征標記了的錯配位點上剪切試驗異源雙鏈DNA片段的能力進行試驗;d)選擇出能夠在已知而且很好地特征標記了的錯配位點上剪切試驗異源雙鏈DNA片段的重組體內切核酸酶,并對它們剪切攜帶所有類型錯配的異源雙鏈DNA片段的能力進行試驗;e)選擇出通過步驟b)、c)和d)的試驗的重組體內切核酸酶。
9.如權利要求7或8所述的方法,進一步包括一個試驗所述重組體內切核酸酶敏感度的步驟,這是在過量野生型等位基因存在下、對它們在DNA庫內檢測出突變體等位基因的能力進行試驗,并且選擇在至少9倍過量野生型等位基因存在下能夠檢測出所述突變體等位基因的內切核酸酶。
10.一種可通過如權利要求7至9中任一項所述方法獲得的重組體內切核酸酶制品。
11.如權利要求10所述的重組體內切核酸酶制品,其特征在于,所述內切核酸酶選自來源于芹菜(Apium graveolens)的CELI和來源于擬南芥(Arabidopsis thaliana)的BFN1。
12.如權利要求11所述的重組體CELI內切核酸酶制品,其特征在于,所述重組體CELI內切核酸酶具有以下錯配優選特性T/T~T/G~A/G~G/G~G/A~G/T≥A/A~C/C≥T/C~C/T>A/C~C/A,并且能夠在23倍過量野生型等位基因存在下識別突變體等位基因。
13.一種可由如權利要求7所述方法獲得的重組體BFN1內切核酸酶制品,其中所述重組體BFN1具有以下錯配優選特性G/G~G/A~A/G~G/T~T/G>T/T~A/A~C/C~T/C>C/T~A/C~C/A,并且能夠在59倍過量野生型等位基因存在下識別突變體等位基因。
14.一種如權利要求10至13中任一項所述重組體內切核酸酶制品的用途,用于檢測在DNA雙鏈體內由堿基替代引起的錯配,或者在所述雙鏈體中的一個鏈內插入或缺失一個或多個核苷酸引起的錯配。
15.一種如權利要求10至13中任一項所述的重組體內切核酸酶制品在基因組中靶向誘導的局部損害(Targeting-Induced Local Lesions IN Genomes,TILLING)錯配剪切方案中的用途。
16.一種如權利要求10至13中任一項所述重組體內切核酸酶制品的用途,用于通過Ecotilling鑒別自然群體中DNA的多態性。
17.一種如權利要求10至13中任一項所述重組體內切核酸酶制品作為錯配檢測試劑的用途。
18.一種如權利要求10至13中任一項所述重組體內切核酸酶制品在錯配篩選方法中的用途。
19.一種如權利要求10至13中任一項所述重組體內切核酸酶制品的用途,用于在任何有機體種群或由此衍生的細胞系中的靶基因中同時篩選一個或多個突變,其通過下列步驟進行a)對所述種群中每一個體的所述靶基因或其部分進行擴增,b)將所述擴增產品在2維或3維矩陣中進行排序,包括行、列(2維矩陣)和柱(3維矩陣),c)將所述擴增產品集中,以此獲得不同的庫,每一個庫代表所述矩陣的一列、一行或一柱,d)向每一個庫添加從非突變基因獲得的參照擴增產品,并在允許形成異源雙鏈的環境下對這些庫進行培養,以及e)用所述內切核酸酶制品對每一個庫進行培養,以及f)在所述培養的庫中檢測異源雙鏈的存在。
20.一種如權利要求10至13中任一項所述重組體內切核酸酶制品的用途,用于在任何有機體種群中或由其衍生的細胞系中對一個靶基因中的一個或多個突變同時進行篩選,其中進行以下步驟a)在包括行、列(2維矩陣)和柱(3維矩陣)的2維或3維矩陣中對所述種群的每一個體進行排序,b)將每一列、行和柱集中以此獲得不同的庫,從而使每一個庫代表所述矩陣的一列、一行或一柱,c)向每一個庫中添加從非突變基因獲得的參照基因產品,d)在每一個庫內對所述靶基因或其部分進行擴增,以此獲得擴增產品的庫,e)在允許形成異源雙鏈的環境下對所述擴增產品的庫進行培養,f)用所述內切核酸酶制品對所述擴增產品的庫進行培養,以及g)在所述培養的庫中檢測異源雙鏈的存在。
全文摘要
本發明涉及生產具有高敏感性的重組體內切核酸酶的方法,并且涉及用所述方法獲得的內切核酸酶制品,以及其用途,特別是用于檢測錯配。
文檔編號C12N9/22GK101044238SQ200580031302
公開日2007年9月26日 申請日期2005年7月29日 優先權日2004年7月30日
發明者阿卜杜勒菲德·本達馬內, 貝內迪克特·斯圖勒保耶斯, 卡利內·特里凱斯, 米歇爾·卡博什 申請人:法國植物基因組研究計劃-華萊, 法國國家農業科學研究院