<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

改進的大突變分析的制作方法

文檔序號:393129閱讀:204來源:國知局
專利名稱:改進的大突變分析的制作方法
技術領域
克隆負責僅通過表型界定的生物性狀的基因(所謂的正向基因克隆)已成為遺傳學和生物技術中長期的挑戰。特別是在(作物)植物領域中,快速而經濟的正向基因克隆方法是急需的。目前的要求是找到提高正向基因分離速度降低其成本,特別是擴展可以進行基因克隆的物種范圍的方法。在具有含有大量重復DNA的大或無特征(uncharacterized)的基因組的物種中,基因克隆尤其繁重。這種物種是萵苣、胡椒、洋蔥、韭菜、豆、小麥、黑麥、大麥以及許多其它的。
背景技術
正向基因克隆的目的是鑒別僅從表型獲知,而沒有或僅非常有限的分子信息或沒有序列信息可獲得的那些基因。正向遺傳學的起點可以是例如天然存在的表型變體或人工誘導的突變體。 本質上,已經認識了兩組正向基因克隆的方法繪圖(mapping)策略和標簽(tagging)策略。這些策略是互補的,各自都存在其固有局限性。在繪圖策略中,通過標記輔助的減數分裂重組繪圖將表型精確定點在染色體的最小片段上。基于繪圖的克隆是非常繁雜的程序,特別可用在一小群模式物種上,對于該物種可獲得其廣泛的基因組信息,優選全基因組DNA序列。理論上,基于繪圖的克隆對于通過有性繁殖(cycle)而復制的任何生物體是普遍適用程序(Peters 等人,(2003) Trends in Plant Science Vol. 8No. IOpp 484-491)。然而在實踐中,存在基本的生物學限制。最重要的是,基于繪圖的克隆關鍵取決于在感興趣基因區域內減數分裂重組的良好頻率。其次,這在特征很少的大基因組例如在植物如萵苣、胡椒、洋蔥和許多其它基因組中變得越來越困難,因為在其中重復DNA構成了基因組的大部分,阻礙了 DNA標記的清晰繪圖以及阻礙了跨越遺傳間隔的大的連續DNA序列的拼接。在經典的標簽策略中,良好特征的生物插入誘變劑(轉座子或T-DNA插入)已被用作載體來克隆基因。將可轉座元件插入基因中會導致功能喪失或獲得、表達模式的變化、或對基因功能可以沒有影響,這取決于插入片段是否占據例如基因的編碼或非編碼區。負責任何新產生的表型的基因經界定位于插入元件的兩側,并且因此通過沿著基因組DNA兩側片段找回插入序列而進行克隆。通過插入突變的幫助進行加標簽理論上是克隆基因的優選方法,因為這是快速的,并獨立于減數分裂重組,而且不要求事先的基因組資源比如遺傳圖或大量的序列信息(見Maes等人,Trends Plant Sci. 1999Mar ;4 (3) :90-96)。通過加標簽克隆突變的基因不受重復基因組序列或基因組大小的阻礙。加標簽方法在少數模式生物體中已經成功,在這些生物體中天然基因標簽(轉座子)體系是已知的,或大量個體可用隨機整合DNA (T-DNA)進行轉化(見例如Settles等人,BMC Genomics 2007,8:116,用玉米)。除了這一小群物種之外,標簽不能或很難應用,由于缺乏已知的插入元件,或者由于群大小的邏輯限制。邏輯上,為了尋找一個或幾個特異突變體,標簽要求幾千個個體的群,因為每基因組插入序列的數量很低(1-200)。

發明內容
本發明的目標之一在于提供一種新方法及其用途,其允許高效鑒別參與特定表型顯現的核酸。該方法可以應用于任何可人工雜交和操作的(植物)物種,而無需該物種的廣泛的減數分裂重組繪圖和預先存在的基因組DNA序列知識。本發明的其他目標將明顯地體現在本發明的說明書、實施方式和權利要求中。定義在以下說明書和實施例中使用了幾個術語。為了在說明書和權利要求中提供明確且一致的理解,包括這些術語給出的范圍,提供以下定義。除非此處另有定義,否則所有使用的技術和科學術語具有發明所屬領域普通技術人員所通常理解的含義。所有發表、專利申請、專利和其它參考文獻的公開通過引用其全部并入此處。

等位基因在同源染色體上可以具有相同位置并負責可替換的性狀的至少兩個可替換形式基因的其中一個。非限制性實例是花中的花簇顏色基因——單個基因可控制花瓣的顏色,但是可能存在基因的幾個不同版本或等位基因。一個版本可形成紅色花瓣,而另一可形成白色花瓣。個體花的最終顏色取決于其擁有基因的哪兩個等位基因以及兩者如何相互作用。特征與生物體的表型質量相關。特征可使自身顯現成不同性狀。例如,生物體可以是以花朵顏色作為特征的植物,紅色或白色花朵是該特征的性狀A和B。在本發明內,特征(或性狀)可以是任意的,只要具有特征第一性狀的生物體成員可以在表型上區別于具有特征第二性狀的生物體成員。這不僅局限于那些可通過觀測生物體直接觀察到的區別,也包括那些通過進一步分析生物體而呈現出的特征/性狀,例如基于對特定環境(如對特定的疾病)的抗性的分析,或基于對這些生物體中特定代謝產物的存在的分析。本發明上下文中“基因的表達”或“表達的核酸”涉及這樣的過程,其中與合適的調控區特別是啟動子可操作連接的DNA區被轉錄成生物活性的RNA,即,該RNA能夠被翻譯成生物活性蛋白質或肽或其自身就有活性。“基因”是含有與適宜轉錄調控區(如啟動子)可操作連接的區域(轉錄區)的DNA序列,在細胞中該區域被轉錄成RNA分子(如mRNA)。因而基因可含有幾個可操作連接的序列,例如啟動子、含有例如參與翻譯起始的序列的5’非翻譯前導序列(也稱為5’ UTR,其對應著翻譯起始密碼子的轉錄mRNA序列上游)、(蛋白)編碼區(cDNA或基因組DNA)和含有如轉錄終止位點和多腺苷酸化位點的3’非翻譯序列(也稱為3’非翻譯區,或3’ UTR)。同基因的表示遺傳上相同。同基因的群內的個體細胞通常是具有等價的遺傳構成的單一祖先的子代。本發明中,除了由于自然變異所造成的,或在本發明優選實施方式中,由致突變處理所造成的任何點突變之外,“同基因的”被解釋為在cDNA水平上個體成員95-99%甚至100%相同。實際上術語“同基因”是公知的也是本領域技術人員可以理解的。致突變或致突變處理此處該術語涉及導致在核酸、基因、或基因組中引入變化的處理,例如導致引入點突變和/或插入或刪除長達10個連續核苷酸。核酸本發明的核酸可包括嘧啶和嘌呤堿基(分別優選胞嘧啶、胸腺嘧啶和尿嘧唳,以及腺嘌呤和鳥嘌呤)的任何聚合物或寡聚物(見Albert L. Lehninger, Principles ofBiochemistry,在793-800 (Worth Pub. 1982),出于所有目的其通過引用全部并入此處)。核酸可以是DNA,包括cDNA,或RNA,或其混合物,其可以是永久或暫時存在的單鏈或雙鏈形式,包括同源雙鏈、異源雙鏈(heteroduplex)和雜交狀態。測序該術語測序涉及確定核酸樣品如DNA或RNA中核苷酸順序(堿基序列)。性狀生物學中,性狀涉及生物體的個體成員與相同生物體的(任何)其他個體成員相比時任何表型上可區別的特征。在本發明的上下文中,性狀可以是遺傳的,即通過生物體的遺傳信息方式被傳代至生物體的下一世代。性狀的非限定性實例包括,例如,可以視覺觀察的性狀或可以通過分析觀察的性狀(例如,對于代謝物的存在或水平)。“相同特征的性狀”或“所述特征的性狀”:一個特征所存在(或呈現)的一組至少兩種性狀的任一個。例如,對于特征“花的顏色”的情況,表型上的顯現可包括藍色、紅色、白
色等。在以上實例中,藍色、紅色和白色都是相同特征的不同性狀。發明詳述通過提供所附權利要求描述的方法令人驚奇地解決了以上所述的目的。更具體地,提供了鑒別和任選分離與生物體特征相關的表達的核酸序列的方法,其特征在于該方法包括以下步驟a)提供具有所述特征的性狀A的所述生物體的至少兩個成員,其中具有性狀A的所述成員源自,優選獨立地源自,具有性狀B的所述生物體的同基因成員,其中性狀A和性狀B不同;b)從具有性狀A的步驟a)的各成員中獲得cDNA,并確定至少部分,優選獲自具有性狀A的成員的每個個體cDNA的核苷酸序列;c)通過與具有性狀A的其它成員的相應cDNA的比較,在具有性狀A的成員的每個個體cDNA中確定單核苷酸多態性位置;d)鑒別個體cDNA,其中具有性狀A的成員中的至少2個,優選所有具有性狀A的成員,含有至少一個單核苷酸多態性,以及優選其中對于所述至少兩個優選所有具有性狀A的成員,這些單核苷酸多態性位于cDNA的不同位置;e)任選,驗證與生物體的特征有關的步驟d)中鑒別的每個cDNA。任選并優選,方法可以包括鑒別來自d)中鑒別的每個cDNA的個體cDNA的步驟(f),其中至少兩個,優選所有具有性狀A的成員具有至少一個非同義的單核苷酸多態性。然后,在一個優選實施方式中,方法可包括鑒別來自前述步驟(f)中鑒別的每個cDNA的個體cDNA的步驟(g),其中至少兩個,優選所有具有性狀A的成員恰好具有一個非同義的單核苷酸多態性。并且,方法可包括列出進行的步驟(d)、(f)和/或(g)中鑒別的所有個體cDNA、根據所遵循的進行的步驟(d)、(f)和/或(g)的數目將個體cDNA排名(依從性最大的排名最高)的步驟(h)。方法還可包括,優選,鑒別表達的核酸序列(鑒別的cDNA源自表達的核酸序列),以及任選,克隆包括表達的核酸序列的基因。本發明是基于這樣的實現目前正向克隆策略的上述問題可通過本發明的方法解決,以及通過使用可用于任何生物體的非生物誘變劑來克服基于生物誘變劑的加標簽方法的局限性,其可以在每基因組中產生幾千個易于檢測的突變體從而盡可能地消除邏輯群限制,結合上對獲自顯示表型(性狀A)的(至少兩個成員的)突變體集合(collection)的轉錄物組(cDNA)進行測序,并在此基礎上在所述突變體集合的各成員中鑒別攜帶至少一個單核苷酸多態性(優選至少一個非同義的單核苷酸多態性)的任何基因(但不一定在所述基因/cDNA中的相同位置)。此外,突變體集合可獲自自然變異。除了通過用例如誘變劑處理所誘導的突變以外,還可使用發生在其它同基因的群中的自發突變體。換言之,如果在具有性狀B的同基因的群中,發現至少兩個成員具有性狀A (如由于自發突變),可以用如此處所公開的方法鑒別負責特征和性狀的基因。認識到,用化學誘導的突變如點突變可以在任何生物體的基因中加標簽(并從而可顯現區別表型)。然而主要問題在于如何在全基因組中檢測這些小而隨機的突變(標簽),因為這些突變的質量不足以進行任何形式的特定PCR擴增。而且,化學誘導的突變以高頻率隨機引入到基因組中。因此,與原始物種的基因相比,許多基因可能同時含有突變,從而使得正確鑒別負責觀察到的表型或顯示特定性狀的基因復雜化。本發明人已認識到,解決方案可以來自在待克隆的基因座上創建獨立且區別的突 變體等位基因的集合(但是尚且未知),并將來自這種集合的所有cDNA進行多次再測序。當與這種集合中的(所有)cDNA序列比較時,突變體池中的一個cDNA將顯示出一致的突變。這極可能是形成突變表型基礎的基因。換言之,以及例如,可以用例如在基因組中誘導點突變的誘變劑,處理顯現特定性狀B (例如紅色的花)的同基因的群(的種子)。由于用所述誘變劑處理的結果,隨機突變引入至各處理的成員的基因組中。通常,處理之后大多經處理的成員將仍然顯現特定性狀B。在那些成員中,用誘變劑處理引入的突變不改變性狀。換言之,在這些成員中沒有涉及性狀的特征的基因經突變而改變性狀(例如變成性狀A,例如,黃色的花)。然而,在一些成員中,誘變劑可以這樣的方式誘導構成觀察到的性狀基礎的基因的突變,即在那些成員中原始性狀B不再顯現,但是性狀A顯現。由于誘變劑的隨機特征,如果至少兩個成員,優選更多成員被觀察到具有性狀A,那么極有可能由誘變劑誘導的并負責從性狀B到性狀A的改變的突變盡管是位于相同基因,但不在所述基因的相同位置。例如,在具有性狀A的第一成員中,突變可能位于核苷酸R,在具有性狀A的第二成員中,突變可能位于核苷酸S,在具有性狀A的第三、第四和第五成員中,突變可能分別位于位置T、U和V (基因中R、S、T、U和V位于不同的位置)。換言之,當互相比較時,這些成員均顯示出在負責的基因不同位置的突變。與此同時,盡管顯示性狀A的成員還攜帶遍及基因上其它位置的突變,在現在顯示性狀A的每個成員中另一個表達基因被修飾的可能幾乎為零。現在通過相互比較獲自具有性狀A的成員的cDNA時,可鑒別出在具有性狀A的各成員中攜帶至少一個核苷酸的修飾的cDNA,該修飾位于至少兩個所述成員中所述cDNA中的不同位置。所述cDNA負責觀察到的相同特征的性狀。在本發明的方法中,池由另外的同基因遺傳背景中的(誘導的)等位基因系列組成。本發明的方法檢測位于待克隆的基因中的SNP。本方法適用于可以人工雜交和致突變的所有物種,包括這些眾所周知的難以操作的作物如胡椒和洋蔥,且本發明不依賴于遺傳圖的存在并將在任何大小和復雜性的基因組中起作用。
根據本發明的方法,因此現在已可能在大量的基因中鑒別那些為可能參與或負責觀察到的性狀的候選者的基因。在實踐中,當采用本發明的方法時,可能的候選者的組可以快速且可靠地限定為,例如10、5、3、2或甚至I個候選基因。使用根據本發明的方法,負責或參與特定性狀的顯現的基因的快速鑒別,現在已經成為可能。更詳細地,在本發明的方法中,比較具有特定表型(或具有特定性狀A)的生物體的至少兩個個體成員。至少兩個成員源自具有(不同的)性狀B的同基因生物體。對于本發明重要的是,具有性狀A或性狀B的生物體的成員是(性狀A的情況時)源自(如通過誘變劑處理或通過自發突變)或是(性狀B的情況時)所述生物體的同基因成員,換言之,生物體具有相同的遺傳背景(例如源自相同近交系)。除了由于自然變異或者,在本發明的優選實施方式中,由于致突變處理引入遺傳物質中的變化外,具有性狀A或性狀B的個體成員是同基因的,即具有相同的遺傳背景。具有性狀A的成員和具有性狀B的成員之間遺傳物質中的這些差異中,包括觀察到的表型。由于特征中觀察的變化(從性狀A至性狀B),具有性狀A的成員必須進行這樣的 修飾從而它們表達至少一個不同于具有性狀B的生物體的成員所表達核酸的核酸,并且核酸與生物體的特征有關,性狀A和性狀B是特征的表型形式。優選,具有性狀A的至少兩個成員獨立地源自具有性狀B的所述生物體的同基因成員。術語“獨立地源自”表示具有性狀A的至少兩個成員是例如由于誘變劑處理而彼此獨立地獲得所述性狀A的成員。如果生物體是植物,由于例如種子(植物生長自種子)的誘變劑處理,至少兩個成員可能已各自獲得性狀A。在這個實施例中,性狀引入獨立于顯現性狀A的任何其它成員的第一成員。換言之,例如在最后的3、4、5、6、7、8、9或10代期間,優選具有性狀A的成員不共享已顯現所述性狀A的共同前輩(predecessor)。優選所有成員都獨立地源自具有性狀B的所述生物體的同基因成員。如上所述,由于兩個不同性狀的存在所顯現的,具有性狀A的成員表達至少一個不同于具有性狀B的其它成員所表達核酸的核酸,并且該核酸與生物體的特征有關,性狀A和性狀B是該特征的表型形式。為了檢測這種帶標簽的(通過,例如,點突變)核酸,在本發明方法中,獲得來自具有性狀A的步驟a)的各成員的cDNA,優選總cDNA,以及確定來自具有性狀A的所述成員的個體cDNA,優選每個cDNA的核苷酸序列。換言之,具有性狀A的所有成員的轉錄物組(優選總轉錄物組),與具有獨立獲得性狀A的所有其它成員的轉錄物組(優選總轉錄物組)比較。優選比較所選組織中所有表達的基因的完整序列。對此,cDNA優選總cDNA是從具有性狀A的至少兩個成員中獲得的。可以通過技術人員已知的任何適宜方法完成cDNA優選總cDNA的制備。可購買許多商業可獲得的 cDNA 合成試劑盒,例如從 ABgene> Ambion> Applied Biosystems、BioChain、Bio-Rad、Clontech、GE Healthcare、GeneChoice、Invitrogen、Novagen、QiagenΛ Roche AppliedScience、Stratagene 等。這種方法例如在 Sambrook 等 A (Sambrook, J.、Fritschj E.F.和 Maniatis,T.,在 Molecular Cloning:A Laboratory Manual. Cold Spring HarborLaboratory Press,NY,Vol. 1,2,3(1989))中有描述。技術人員還將理解,例如通過正態化來降低體現為個體cDNA形式的差異,cDNA可進一步進行處理(Evrogen等)。
如所示,本發明的方法要求獲得、測序并相互比較具有性狀A的至少兩個成員的cDNA優選總cDNA。如上所解釋的,不需要和獲自具有性狀B的成員的cDNA進行比較。更優選地,本發明方法中提供/使用至少3、4、5、6、7或8個生物體的成員,并且各具有性狀A。如上所解釋的,本發明是基于這樣的實現可通過比較獨立地獲得表型性狀(性狀A)的生物體的(優選全)轉錄物組的序列而鑒別與特定特征(或性狀)相關的遺傳差異。因為在優選實施方式中,具有性狀A的成員是通過對具有性狀B的成員進行隨機的(化學)致突變處理而產生的,這種處理的生物體的遺傳物質將含有許多且隨機的突變,其中大部分并不與所觀察的性狀相關。比較具有性狀A的一個成員的cDNA (優選總cDNA)和具有性狀B的一個成員的cDNA (優選總cDNA)將因此允許鑒別與所觀察表型相關的核酸。然而本發明人認識到當具有性狀A的至少兩個成員相互比較時,并各自優選具有獨立獲得的所述性狀A,有可能鑒別負責(或有關)特征(或性狀)的核酸具有性狀A的成員(獨立地)源自相同的同基因的來源。由于同基因的來源的突變處理,變化被隨機引入遺傳物質中。在第一成員中誘導的變化將不同于在第二成員中誘導的變化。然而,如果所述第一成員和所述第二成員,由于致突變處理,現在都表達出表型,即 具有性狀A,則極可能是在通土成員中,相同cDNA將表現出單核苷酸多態性(SNP)。由于突變處理的隨機過程,這種SNP不太可能位于這種cDNA內的相同位置。所述cDNA現在可鑒別為源自表達核酸的cDNA,而該表達核酸與所研究的生物體的特定性狀或特征相關,因為在具有性狀A的至少兩個成員中,這種非相關的cDNA將表現這種SNP的變化幾乎為零。換言之,本發明是基于這樣的實現在來自如一個基因(性狀A)中的5個等位基因突變的“突變池”的所有cDNA序列中,當相互比較時,將只有一個個體cDNA —直顯示出序列中的差異。為了比較具有性狀A的各成員的cDNA優選總cDNA,具有性狀A的成員的cDNA優選總cDNA需要進行測序。cDNA的測序可通過技術人員已知的任何適宜方法完成。然而,尤其非常優選Margulies M.等人(http:// www. 454. com,Genome sequencing inmicrofabricated high-density picolitre reactors. Nature 437:376-80,2005)中描述的這些方法,其允許快速并高效地對全轉錄物組(所有cDNA)進行測序。例如,在優選實施方式中,所獲得的cDNA片段的核苷酸序列可通過高通量測序方法確定,例如WO 03/004690、WO 03/054142、WO 2004/069849,W02004/070005,WO 2004/070007 和 WO 2005/003375、Seo等人(2004) Proc. Natl. Acad. Sci. USA 101:5488-93 以及 Helicos、Solexa、US Genomics、etcetera的技術中所公開的那些,其都通過參考引入此處。在本發明所述方法的下一步中,將所獲得的具有性狀A的成員的cDNA優選總cDNA序列與具有性狀A的其它成員的cDNA優選總cDNA比較,從而建立cDNA中單核苷酸多態性頻率。可以通過技術人員已知的任何適宜方法完成這種確定,例如在所附實施例中展示的那些。簡言之,例如cDNA片段核苷酸序列的比對可用于收集源自相同轉錄基因(但是來自具有性狀A的不同成員)的核苷酸序列,并比較這些核苷酸序列。核苷酸序列是否源自相同的轉錄基因,可以基于序列之間的同源性來建立。為了本發明的目的,假定他們在至少30、優選至少50、更優選至少90、還更優選至少100、150、200個核苷酸長度中至少百分之95、96、97、98、99、100是同源的,則核苷酸序列是源自相同的轉錄基因。
在下一步,基于獲得的數據,可以鑒別具有提高的SNP頻率的具有性狀A的成員的cDNA集合中的cDNA,優選總cDNA。在本發明方法中,鑒別個體cDNA,其中具有性狀A的至少兩個成員含有至少一個單核苷酸多態性,以及優選其中這些單核苷酸多態性位于cDNA中的不同位置。優選所分析的具有性狀A的各成員在所述cDNA中優選在cDNA中不同位置含有至少一個單核苷酸多態性。例如,如果分析具有性狀A的四個植物,可鑒別在四個植物的(相同,即源自各植物的相同基因)cDNA中對于植物1、2、3和4分別在位置25、34、56和101上含有SNP的cDNA。或者,對于一些植物,而非另一些植物,SNP可能在相同位置上。例如,對于植物I、2、3和4,SNP可能分別在位置25、25、56和101,或甚至25、25、101和101。在本發明的方法中,在具有性狀A的成員中測序的所有cDNA中,至少一個特異性cDNA將在至少兩個成員中,但優選具有性狀A的各成員中,攜帶至少一個遺傳上(優選非同義的)單核苷酸多態性(SNP)。換言之,這些特異性cDNA將在經分析的具有性狀A的各成員中包括至少一個SNP(不一定在相應cDNA中的相同位置)。這種cDNA可能是源自參與或負責所觀察到的性狀A的基因的cDNA的候選者,并且這一信息可隨后通過技術人員已知的方法用于鑒別表達的核酸序列并克隆相應的基因。任選且優選,在本發明方法的下一步驟中,對來自之前步驟中鑒別的每個cDNA的個體cDNA進行鑒別,其中具有性狀A的至少兩個優選所有成員具有至少一個非同義的單核苷酸多態性。技術人員將了解,之前的步驟中鑒別的cDNA中發現的至少一個SNP,必須極有可能與編碼的蛋白質中氨基酸的變化有關,以便參與或負責或因果上與觀察到的表型(性狀A)相關。因此,鑒別至少一個非同義的存在(導致密碼子的變化,導致編碼的氨基酸的變化)進一步改善本發明的方法,并允許甚至更可靠地鑒別參與觀察到的性狀A的基因。的確,技術人員理解本發明上下文中的術語“非同義的”,表示由于三聯體堿基中的至少一個核苷酸的變化,發生密碼子變化,其中與原始密碼子相比,變化的密碼子編碼不同的氨基酸。如果進行在先的鑒別cDNA的步驟,其中具有性狀A的至少兩個優選所有成員具有至少一個非同義單核苷酸多態性,任選,但優選,在下一步中,鑒別來自之前步驟中的每個cDNA的個體cDNA,其中具有性狀A的至少兩個優選所有成員具有不超過一個非同義單核苷酸多態性。本發明人發現實際上這種cDNA極有可能是源自負責或因果上與觀察到的表型(性狀A)相關的基因的候選者,從而進一步改善本發明的方法。本發明方法的進一步改善可以涉及鑒別來自任意在先步驟中鑒別的每個cDNA的個體cDNA,其中具有性狀A的至少兩個優選所有成員具有非同義單核苷酸多態性,其在進化上保守的氨基酸位置上引起氨基酸變化,并優選這些新的氨基酸化學上區別于原始非突變的氨基酸(即芳香的相對于非芳香的,極性相對于非極性,在特定PH下負電的、正電的或中性的,親水性正的或負的(親水的或疏水的)等)。根據本發明方法所進行的以上公開的步驟,可以根據所符合的(所進行的)步驟d-f的數目對在進行的步驟((1)、(^、(8)和/或(h)中鑒別的所有個體cDNA排名。在下一步驟中,符合所有步驟(d)、(f)、(g)和/或(h)的表達的核酸序列因而被排為最高,可以被鑒別為最有可能參與、負責或因果上與觀察到的表型/尤其(./esp)相關的候選者。基于以上,可以鑒別表達的核酸序列并可以克隆基因。在優選實施方式中,提供本發明所述的方法,其中具有性狀A的所述生物體的成員是通過具有所述性狀B的所述生物體的成員致突變而獲得的,其中具有性狀B的所述成員在所述致突變處理之前是同基因的。在本發明方法的一個實施方式中,具有區別特征性狀A的至少兩個成員可以是自然變異的結果,即由于在之前顯現性狀B的所述生物體中核酸中的自然或自發變化。在遺傳信息中的這些突變是非刻意的,但揭示了生物體攜帶負責所觀察的表型變化的遺傳信息(例如,從性狀B至性狀A)。然而優選地,本發明方法不依賴于遺傳信息中的這種非刻意和不可控的變異,反而依賴于刻意致突變引起的具有特定性狀的突變。技術人員可以理解如何使任何生物體的遺傳信息發生突變,例如通過采用已知的誘變劑。由于采用這些誘變劑,突變可隨機發生在 生物體成員的基因組中。換言之,核酸例如基因可以用(化學地、生物地或通過輻射方式)誘導的突變(如點突變,如通過甲磺酸乙酯)進行加標簽(與非突變核酸相比)。“輻射致突變”的實例包括X-射線、Y -射線、UV光、或電離粒子。“生物致突變”的實例包括例如W00150847所述的這種方法,例如使用重組酶如recA。可用于本發明方法的“化學誘變劑”的實例包括應用特定化學品如甲磺酸乙酯(EMS )、硫酸二乙酯(DES )、N-亞硝基-N-乙脲(ENU)、雙環氧丁烷、2-氨基嘌呤、5-溴尿嘧啶、溴化乙啶、亞硝酸、亞硝基胍、羥胺、疊氮鈉或甲醛。優選地,致突變方法誘導基因組的點突變、或插入、置換或高達10個連續核苷酸的刪除。技術人員將理解在該實施方式上下文中,具有性狀A的成員和具有性狀B的成員是同基因的(因為它們源自相同的遺傳背景),除所述致突變處理引入的突變之外。然而,與經典繪圖和用插入突變的加標簽策略相反,這種小而隨機的突變難以檢測,因為它們的質量不足以進行任何形式的特定PCR擴增。然而,使用以上策略存在幾個好的理由在于致突變本質上可應用于任何感興趣的物種、誘導突變體的譜比加標簽途徑更廣、致突變通常更高效并且更易于獲得第二位點突變。盡管可以采用多種適宜的致突變方法,優選地誘變劑不是選自轉座子插入物或T-DNA插入物的生物誘變劑。優選地,所用的致突變方法在遺傳物質中引入點突變。在另一實施方式中,提供了本發明的方法,并且其中生物體是植物,優選選自如下的作物植物番茄、胡椒、茄子、萵苣、胡蘿卜、洋蔥、韭菜、菊苣、蘿卜、歐芹、菠菜、甜瓜、和黃瓜。可用于本發明的生物體可以是任何生物體,包括細菌、原核生物和真核生物。然而優選生物體是真核生物,特別是植物,更特別是作物植物。優選地,植物是屬于以下重要作物植物的植物包括番茄、胡椒、茄子、萵苣、胡蘿卜,但是本方法本質上可應用于所有其他植物。特別地,本發明允許核酸的鑒別和克隆,如來自作物植物的基因,這些作物植物中現有技術中可用的繪圖和加標簽技術變得不可能或很難采用。在另一實施方式中,提供了本發明的方法,其中生物體是植物,并且其中在步驟a)之前建立編碼隱性性狀A的等位基因和編碼顯性性狀B的第二等位基因的雜合的Fl雜交群,并且其中所述Fl雜交群經致突變,且其中在所述致突變之后從所述Fl群中選擇具有性狀A的成員。優選地,可通過例如在一個基因座選擇新的等位基因的標準遺傳方法構建等位基因系列。這種方法是由建立一個參照等位基因(其產生這個基因座之前識別的隱性表型,即性狀A)和一個顯性等位基因(產生這個基因座性狀B)的雜合Fl群組成的。當有害突變發生在等位基因B中時,Fl的致突變將顯露新的產生性狀A的等位基因。這種帶有性狀A的突變Fl植物以一定的頻率出現,而大部分Fl群將顯示性狀B。在一個實施例中,可以使攜帶基因座的顯性等位基因(編碼性狀B)的開紅花的栽培品種的種子(或花粉,或任何其它組織)致突變,并使用這種材料與攜帶基因座的隱性參考等位基因(編碼性狀A)的非致突變的
開白花的栽培品種進行有性雜交。在獲得的Fl子代中,大部分個體將是紅色的,除了少數白色個體攜帶顯性B等位基因中新誘導的、獨立的突變從而它們表達性狀A。在第二個實施例中,可直接使Fl材料(如種子,或任何適宜的組織)致突變,并在生長于致突變材料的獲得的個體植物中,對性狀A的表達進行評分。實施例I和2的優勢在于,使用位于基因座的A和B等位基因的Fl材料雜合子,允許將新產生的性狀A等位基因相對確定地指定至待克隆的基因座。沒有Fl方法,例如原始致突變的材料自體受精所取得的F2群,理論上可能是開白花的突變體植物由不同基因(而不是待克隆的基因)突變的結果而產生。因此這些新產生的突變可能是非等位基因的,并將本發明上下文中混淆。通過本發明方法鑒別的核酸,之后可以被分離、克隆(基因)或引入宿主細胞、或用于例如植物培育程序。綜上所述,本發明涉及鑒別和任選地分離在生物體中所表達的并與所述生物體的特定表型(特征的性狀)相關的核酸序列的新策略。與本領域已知的方法相反,本發明的方法可以高效地鑒別、分離或克隆生物體例如(作物)植物的基因,因為這些植物沒有或只有有限的基因組相關信息是可獲得的。此外,現在可以利用化學誘導點突變作為通用、廣泛地可用于建立致突變的群的方法,例如這比通過使用T-DNA或轉座子系統生成高得多的突變頻率,從而減少該方法所需要的生物體(例如植物)的量。而且,該方法不依賴于標記在基因組中的使用或存在,因為它直接檢測感興趣的基因的變化。


圖I是本發明方法的(實施方式的)示意概況。概況中,并適用于此處公開的發明,顯示了通過單個個體來描述同基因的群,其中單個個體是在基因(其為當純合時可觀察到的表型顯現的基因)上攜帶突變(黑圈)的參考等位基因的雜合體,其是通過本發明方法所要鑒別的基因(圖1A,左圖)。致突變處理之后,群將含有消除或補償基因功能的新型等位基因(圖IA右圖,灰圈),從而參考等位基因的表型作用通過雜合性丟失變得可觀察。在圖IA中描述了五種獨立的非同義等位基因。圖IB顯示這五個植物的等位基因組成,選作用于與雜合性丟失有關的表型顯現的組。在圖IB的左圖中,這五個植物的基因型描述為1-5,親本或母本等位基因用詞綴“a”或“b”表示,對于與所選表型顯現無關的基因。可見植物和親本中這種基因不含有有關的多態性。相反,因果上與所選表型有關的所選基因(圖1B,右圖)含有一個非同義的、或遺傳上非中性的等位基因,等位基因由五個同基因的植物共享,而且對于親本之一是排他的(這種情況中,親本“a”)。此外,其在五個表型上選擇的植物中的每個中含有新型且不同的非同義、或遺傳上非中性的多態性。這種多態性模式必然是極罕見的,并因此可用于鑒別構成由所選表型所限定的性狀的核酸序列(基因)。圖2即為表I。表IA)三個獨立矮牽牛花突變體的轉錄物組測序之后的組合結果(參考轉錄物組)的總結,具有通過雜合性丟失獲得的紅色花顏色。B)根據本發明中的步驟,運用基于單基因(unigenes)中多態性模式的選擇原則之后,剩余的單基因數目。還給出了選擇之后的富集因素,表示為參考轉錄物組中單基因總數的百分比。C)基于本發明的方法,剩余的基因的排名列表。最遵循所有所用原則的三個基因。 經推理(a priori )構成紅色花顏色的基因是花青素-3-0-葡糖基轉移酶,與兩個其它基因共同排為I。
具體實施例方式實施例矮牽牛花中花著色基因的從頭克隆在單個花顏色基因中產生突變體為了證實本發明的所述方法,我們意圖從頭鑒別之前已知的雜交矮牽牛花的花顏色基因(RT)。由自交系 W5 (rt: : dTph3 ;Stuurman 和 Kuhlemeier 2005, PlantJ. 41(6):945-55)和 Ml (RT,Snowden KC 和 Napoli CA(1998)Psl:a novel Spm-Iiketransposable element from Petunia hybrida. Plant J. 14:43-54)之間雜交產生開紫紅色花的Fl雜交矮牽牛花,其導致在基因RT上攜帶隱性等位基因的開紫紅色花的雜合基因型,其編碼UDP鼠李糖花青素-3-葡萄糖苷鼠李糖基轉移酶。在所用遺傳背景中,RT的無效突變產生紅色的花,這是花青素-3-葡萄糖苷積累的結果(Kroon等人,1994,PlantJ. 5(1) :69-80 ;Brugliera 等人,1994,Plant J. 5(1) :81-92)。用甲磺酸乙酯(EMS)致突變處理Fl雜交種子,一些獲得的植物在野生型RT等位基因上會攜帶新的突變,這造成了雜合性丟失并表達紅色花冠顏色。從EMS處理的種子生長出3600個Fl植物的群,可以目測記錄所有個體植物的花的顏色。觀察了七個開紅色花的突變體。因為紅色是隱性的,在原始致突變的群中表達這種顏色表示開紅花的突變體在RT基因的野生型拷貝中攜帶了 EMS誘導的點突變。這些新分離的突變必然是雜合的。為了在新鑒別的突變等位基因中從頭鑒別構成紅色的基因,在三個獨立的突變體中,對發育時間點時的花冠檐(corolla limb)完整且正態化的轉錄物組進行測序,這正是花青素色素變得可見的發育時間點。使用SMART cDNA合成試劑盒(Clontech公司,1290 Terra Bella Avenue, Mountain View, CA 94043, USA)將 3 個突變體的每個總 RNA 轉化成 ds-cDNA。使用 Trimmer 試劑盒(Evrogen 公司,Miklukho-Maklaya str,16/10, 117997,Moscow,Russia)對雙鏈(ds-)cDNA進行正態化。來自各個體突變體植物的正態化的cDNA分別經加工用于在GS-FLX肽測序儀(454 Life Sciences)上進行測序。加工涉及cDNA片段化為 700nt,并用IObp的多重識別符(multiplex identifier) (MID)力口標簽。隨后將來自所有突變體的所有經加工的cDNA樣本合并起來,在GS-FLX肽測序儀上進行兩輪測序。我們獲得平均300個核苷酸長度的總共I' 977' 422個讀取。使用拼接程序Newbler (Roche 454 軟件發布2. 3-PreRelease_9/14/2009)使用缺省運行拼接設置,將所有合并的序列數據經修剪去除接頭序列和MID序列,隨后拼接成重疊群的非冗余組。結果概況在表IA中給出。獲得總共39306個獨特的重疊群(平均大小為955個核苷酸,中值大小為1025個核苷酸),這代表花冠中表達的單基因的充分補充。每堿基覆蓋度是24X,意味著核苷酸平均進行24次測序。這種補充因此稱為“參考”,因為它代表隨后用于本發明方法的一致參考轉錄物組序列。相似地,重疊群因此稱為“單基因”。根據本發明方法的假設,單基因中,一個特異性單基因在用于生成轉錄物組序列的大多或各突變體中將攜帶遺傳上非同義單核苷酸多態性(SNP)。在此處給出的特異實施例中,負責生成紅色花顏色的基因應突變三次,構成cDNA池的個體突變體植物中各一次。因為隨機EMS突變頻率典型地為 I次每200,000個堿基,如果單基因因果上與表型(在表型的基礎上選擇突變植物)無關,那么3個區別的核苷酸突變將最終發生在任何單個單基因中的機會幾乎為零。符合這種突變原則并且其中堿基變化還是非同義的特定基因,這意味 著引起該基因的蛋白產物的氨基酸變化,極有可能是造成紅色花顏色的基因。在其余上下文中,堿基變化表示為單核苷酸突變(SW)并且非同義單核苷酸突變表示為nSW。可以注意到同義堿基變化,即那些不會引起氨基酸變化的變化,有時可以是遺傳上非中性的,如果它們如位于內含子外顯子剪接位點。然而注意的是,本發明的方法對于相對罕見的情況,如至少一對或優選一組等位基因用于比較,是強大的,因為剪接錯誤將導致重大改變的cDNA。在所有個體454序列讀取中,通過將它們與上述參考花冠轉錄物組比,我們分析了花冠454序列數據組的S匪發生率。只有當讀取與參考至少98% —致時,454讀取的比對用于S匪分析。可以通過本領域技術人員已知的各種生物信息學方法進行比對。在本實施例中SW被定義為(I)在完整的454讀取組中發生至少3次(3X覆蓋度)(2)只發生于3個個體突變體植物中的一個(3)發生于來自個體突變體植物中所有讀取的10% <N<90%這三個原則證實S匪不是測序錯誤(1),是獨立的(2),并且在雜合情況下發生
(3)。技術人員將理解,根據池中突變體植物的數目、S匪調取(calling)中I型和2型錯誤的水平的規定,這些原則可以制定得更嚴格或更寬松。此外,在這種實施例中,只有G->A或C->T的轉換被考慮為是可能的SW,由于這些是由所用誘變劑(EMS)誘導的主要突變。技術人員將理解,繪圖的讀取的98%同一性閾值可以制定得更嚴格或更寬松,這種閾值可以影響發現的SW的數目。作為下一個步驟,我們搜索其中存在至少三個S匪的單基因,池中三個突變體各一個,并通過上述指定的S匪調取原則(1、2、3)進行鑒別。因果上與開紅花表型有關的任何單基因必須理論上遵循這種規則,假設測序覆蓋度足以使所有S匪滿足S匪調取的三個原則。發現26個單基因在編碼區含有至少三個S匪,各自源自不同的突變體植物。其中,20個含有剛好含有三個SW,而6個含有4-7個SW。遵循所有上述S匪的形式遺傳模式的26個單基因隨后檢驗nS匪的發生率。首先,通過找到最長的預測的開放閱讀框(ORF),根據標準的將DNA三聯體翻譯成氨基酸的真核遺傳密碼子,將26個單基因的DNA序列轉換成氨基酸序列。然后使用標準BLASTp程序,與蛋白質序列的UniProt數據庫比較這些ORF,以便檢測同源蛋白質,從而確認預測的ORF是在正確的有生物學意義的翻譯閱讀框中。然后將各26參考單基因的蛋白質序列,與它們對應的含有SW的突變體植物的蛋白質序列比較。如果氨基酸變化發生在包括SW的密碼子中,SW標記為nSW。根據定義,只有nS匪可以導致編碼區內的表型變化。因此,任何不含至少三個nS匪的26個單基因以及含有至少一個nS匪的各突變體植物,作為引起開紅花表型的可能候選者而被棄掉。此操作之后,9個單基因仍然留在候選名單中(表1B)。留下的9個單基因的組隨后將根據形式遺傳原則進行排序過程。對于存在三個以上的nS匪給予罰分,其中如剛好三個突變體植物用于分析的事實所示的,完美的模式是剛好三個。nS匪越多,排名越低。本操作之后,3個單基因共同排為第I。9個單基因及其排名的完整列表給于表IC中,包括和UniProt數據庫的最佳BLAST匹配。可見RT基因,根據
推理被認為引起開紅花的表型并編碼UDP鼠李糖花青素-3-葡萄糖苷鼠李糖基轉移酶,排名I。從這些數據可以得出結論,本發明的方法允許在39306個單基因的背景中一小組候選者之中鑒別引起突變體表型的單一基因。本領域技術人員將理解,可以在除矮牽牛花以外的任何物種中進行本發明的方法。本領域技術人員將理解,可以用每個池不同的突變體個體數目、繪圖期間讀取相對于參考轉錄物組不同的同一性百分比、每S匪覆蓋度的不同嚴謹度(stringencies)、或搜索所采用的其它可衡量的設置進行方法。還明確的是可以單獨或組合使用用于候選者排名的額外客觀標準,其可包括-獲自原始測序數據的可能的S匪的堿基調取質量分數-根據所用突變體植物的池組成以及雜合或純合狀態所遵循的形式遺傳預測,在池中個體等位基因中S匪最佳分布的匹配度。-和野生型氨基酸相比,由于nS匪的氨基酸取代的化學相似性得分材料和方法I)制備cDNA用于GS-FLX肽測序為了制備適于分析的cDNA樣本,按照如下步驟。I.根據制造商的說明書,使用Qiagen RNeasy Plant Mini試劑盒(Qiagen公司,27220 Turnberry Lane Valencia, CA 91355)分離正處于著色開始階段的各突變體植物的花瓣組織的總RNA。II.根據制造商的說明書,根據用于文庫構建操作的SMART cDNA合成(Clontech公司,1290 Terra Bella Avenue, Mountain View, CA 94043,USA)進行 SMART 雙鏈(ds_)cDNA的合成。III.根據制造商的說明書,使用 TRIMMER cDNA Normalization 試劑盒(Evrogen公司,Miklukho-Maklaya str, 16/10, 117997, Moscow, Russia)對 cDNA 正態化。IV.使用如下反應設置,通過BAL31核酸外切酶(New England Biolabs, 240County Road, Ipswich, MA 01938-2723,USA)從 ds-DNA 去除 polyA 尾
權利要求
1.一種方法,其用于鑒別和任選分離與生物體特征相關的表達的核酸序列,其特征在于方法包括以下步驟 a)提供具有所述特征的性狀A的所述生物體的至少兩個成員,其中具有性狀A的所述成員源自,優選獨立地源自,具有性狀B的所述生物體的同基因成員,其中性狀A和性狀B是不同的; b)從具有性狀A的步驟a)的每個成員中獲得cDNA,并確定至少部分,優選每個獲自具有性狀A的成員的個體cDNA的核苷酸序列; c)通過與具有性狀A的其它成員的相應cDNA比較,在具有性狀A的成員的每個個體cDNA中確定單核苷酸多態性位置; d)鑒別個體cDNA,其中具有性狀A的成員中的至少2個,優選所有具有性狀A的成員,含有至少一個單核苷酸多態性,以及優選其中對于所述至少兩個,優選所有具有性狀A的成員,這些單核苷酸多態性位于cDNA的不同位置; e)任選,驗證與生物體的特征有關的步驟d)中鑒別的每個cDNA。
2.根據權利要求I的方法,其中具有性狀A的所述生物體的成員是通過具有所述性狀B的所述生物體的成員致突變而獲得的,其中具有性狀B的所述成員在所述致突變處理之前是同基因的。
3.根據權利要求2的方法,其中致突變的方法誘導點突變。
4.根據權利要求2-3任一項的方法,其中致突變是通過非生物誘變劑的使用進行的。
5.根據前述權利要求中的任一項的方法,其中所述生物體是植物,優選選自如下的作物植物番茄、胡椒、茄子、萵苣、胡蘿卜、洋蔥、韭菜、菊苣、蘿卜、歐芹、菠菜、甜瓜、黃瓜。
6.根據前述權利要求中的任一項的方法,其中所述生物體是植物并且其中在步驟(a)之前建立編碼隱性性狀A的等位基因和編碼顯性性狀B的第二等位基因的雜合的Fl雜交群,并且其中所述Fl雜交群經致突變,且其中在所述致突變之后從所述Fl群中選擇具有性狀A的成員。
全文摘要
本發明涉及鑒別和任選分離在生物體中表達的并與所述生物體特定表型(特征的性狀)因果上相關的核酸序列的新策略。與本領域已知的方法相反,本發明的方法有可能高效地富集、鑒別、分離和/或克隆生物體例如(作物)植物的基因,這些植物沒有或只有有限的基因組相關的信息是可獲得的。
文檔編號C12Q1/68GK102791880SQ201080056670
公開日2012年11月21日 申請日期2010年12月17日 優先權日2009年12月18日
發明者F·亞爾欽, J·斯圖爾曼 申請人:凱津公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影