專利名稱:玉米中與絲黑穗病抗性相關聯的基因座的制作方法
技術領域:
本公開涉及用于提高玉米對絲黑穗病的抗性的組合物和方法。
背景技術:
絲黑穗病是由宿主特異性的真菌絲軸黑粉菌(Sphacelotheca reiliana(Kuhn) Clint.)在玉米中引起的一種源于土壤的系統性疾病(Frederiksen 1977)。來自埋于土壤中的孢子囊群的冬孢子,是主要的感染源,并且可在土壤中存活三年而不會發生感染能力的任何損失(mi等人,1981)。在種子出苗期間或之后,上述真菌通過根或胚芽鞘感染幼苗(Krilger 1962)。在易感品種被感染后,植株繼續正常的營養生長,但有一些可能會發育不良(Matyac和Kommedahl 1985a)。在成熟期,孢子囊群取代了被感染植株的穗或雄穗, 導致該玉米植株幾乎絕收。在被感染的大田中,被感染植株的比例可達80% (Frederiksen 1977)。根據對易感栽培品種進行栽培的結果,Jin(2000)報道該疾病的發生率為從7. 0% 到35. 0%,有些甚至達到62. 0%。在中國北方,絲黑穗病每年導致最多30萬噸的產量損失 (Bai等人,1994)。據報道,歐洲南部、北美和亞洲的玉米也受到該疾病的嚴重損害(Xu等人,1999)。考慮到經濟學和生態學因素,抗性品種的栽培是控制絲黑穗病流行的一個有效途徑。通過育種將抗絲黑穗病的多個抗性基因/QTL轉入優良玉米品種,將會是提高對該疾病抗性的一條有希望的途徑。迄今為止,許多研究者已對絲黑穗病抗性的遺傳模型進行了研究。Mei等人 (1982)報道,絲黑穗病抗性受部分顯性的核基因控制,這些基因在正反交中不表現出差異。 Ma等人(198 報道,玉米對絲黑穗病的抗性是定量性狀,受部分抗性基因和它們的非等位基因相互作用影響。Mromberg等人(1984)發現,F1種群表現出介于抗性的和易感的親本之間的中等的疾病發生率。Ali和Baggett (1990)報道,加性遺傳和顯性遺傳作用在不同處理下是優勢的。Bernardo等人(199 采用世代平均值分析法研究了抗性基因的遺傳效應,表明加性效應是決定性的,而顯性效應和上位效應是微弱的。Shi等人000 報道,除了加性效應之外,超顯性效應在絲黑穗病抗性中也起著關鍵作用。顯然,玉米中抗絲黑穗病的抗性可能涉及若干遺傳因子,并以復雜的方式作用。發明概述提供了用于鑒定和選擇具有提高的絲黑穗病抗性的玉米植物的組合物和方法。在第一實施方案中,本發明涉及分離的多核苷酸,所述分離的多核苷酸包括一種多核苷酸,其選自(a)至少一種編碼賦予或提高絲黑穗病抗性的多肽的核苷酸序列,所述多肽選自 SEQ ID NO :27、32、35、38、41、44、105、108、111、113 和 116 ;(b)至少一種能夠編碼賦予或增強絲黑穗病抗性的多肽的核苷酸序列,所述核苷酸序列選自 SEQ ID NO :25、26、30、31、;34、36、37、39、40、42、43、45、104、106、107、109、110、 112、114、115和 117;和(C) (a)或(b)的核苷酸序列的互補序列,其中所述互補序列和核苷酸序列由相同數目的核苷酸組成并且100 %互補。在第二實施方案中,本發明涉及載體,所述載體包括受權利要求書保護的分離的多核苷酸。在第三實施方案中,本發明涉及重組DNA構建體,所述重組DNA構建體包括可操縱地連接到至少一個調控序列上的本發明的分離的多核苷酸。在第四實施方案中,本發明涉及玉米細胞,所述玉米細胞包含本發明的重組DNA 構建體或分離的多核苷酸。在第五實施方案中,本發明涉及用于生產玉米植物的方法,所述方法包括用本發明的重組DNA構建體轉化植物細胞以及從轉化過的植物細胞再生植物。在第六實施方案中,本發明涉及玉米植物,所述玉米植物包含本發明的重組DNA 構建體。在第七實施方案中,本發明涉及玉米種子,所述玉米種子包含本發明的重組DNA 構建體。在第八實施方案中,本發明涉及賦予或提高絲黑穗病抗性的方法,所述方法包括用本發明的重組DNA構建體轉化植物,從而賦予或提高絲黑穗病抗性。在第九實施方案中,本發明涉及判定本發明的多核苷酸在玉米植物中是否存在的方法,所述方法至少包括下列之一(a)從所述玉米植物分離核酸分子并擴增與本發明的多核苷酸同源的序列,或(b)從所述玉米植物分離核酸分子并進行DNA雜交,或(c)從所述玉米植物分離蛋白質并利用該蛋白質的抗體進行蛋白質印跡,或(d)從所述玉米植物分離蛋白質并利用該蛋白質的抗體進行ELISA測定,或(e)證明源自mRNA轉錄物、并且絲黑穗病抗性基因座特有的mRNA序列的存在,從而證明本發明的多核苷酸在所述玉米植物中的存在。在第十實施方案中,本發明涉及判定絲黑穗病抗性基因座在玉米植物中是否存在的方法,所述方法至少包括下列之一(a)從所述玉米植物分離核酸分子并擴增本發明的多核苷酸的特有的序列,或(b)從所述玉米植物分離蛋白質并利用該蛋白質的抗體進行蛋白質印跡,或(c)從所述玉米植物分離蛋白質并利用該蛋白質的抗體進行ELISA測定,或(d)證明源自mRNA轉錄物、并且絲黑穗病抗性基因座特有的mRNA序列的存在,從而證明絲黑穗病抗性基因座在所述玉米植物中的存在。在第十一實施方案中,本發明涉及改變能賦予玉米細胞抗絲黑穗病的蛋白質的表達水平的方法,所述方法包括(a)用本發明的重組DNA構建體來轉化玉米細胞,以及(b)使上述轉化的玉米細胞在適于所述重組DNA構建體表達的條件下生長,其中所述重組DNA構建體的表達導致能在所述轉化的玉米細胞中賦予絲黑穗病抗性的蛋白質的表達且其表達水平與該蛋白質在具有絲黑穗病抗性的野生型玉米植物中的表達水平相比發生改變。在第十二實施方案中,本發明涉及能在玉米細胞中賦予絲黑穗病抗性的蛋白質的表達水平改變的方法,所述方法包括(a)用本發明的重組DNA構建體來轉化玉米細胞;以及(b)使上述轉化的玉米細胞在適于所述重組DNA構建體表達的條件下生長,其中所述重組DNA構建體的表達導致能在所述轉化的玉米細胞中賦予絲黑穗病抗性的蛋白質的表達且其表達水平與該蛋白質在具有絲黑穗病抗性的野生型玉米植物中的表達水平相比發生改變。在第十三實施方案中,本發明涉及改變能在玉米植物中賦予絲黑穗病抗性的蛋白質的表達水平的方法,所述方法包括(a)用本發明的重組DNA構建體來轉化玉米植物細胞;以及(b)從上述轉化的玉米植物細胞再生轉化的玉米植物;以及(c)使上述轉化的玉米植物在適于所述重組DNA構建體表達的條件下生長,其中所述重組DNA構建體的表達導致能在所述轉化的玉米植物中賦予絲黑穗病抗性的蛋白質的表達且其表達水平與該蛋白質在具有絲黑穗病抗性的野生型玉米植物中的表達水平相比發生改變。在第十四實施方案中,本發明涉及改變能在玉米植物中賦予絲黑穗病抗性的蛋白質的表達水平的方法,所述方法包括(a)用本發明的重組DNA構建體來轉化玉米植物細胞;以及(b)從上述轉化的玉米植株細胞再生所述轉化的玉米植物;以及(c)使上述轉化的玉米植物在適于所述重組DNA構建體表達的條件下生長,其中所述重組DNA構建體的表達導致能在所述轉化的玉米植物中賦予絲黑穗病抗性的蛋白質的表達且其表達水平與該蛋白質在具有絲黑穗病抗性的野生型玉米植物中的表達水平相比發生改變。在第十五實施方案中,本發明涉及鑒定表現出絲黑穗病抗性的玉米植物的方法, 所述方法包括在玉米植物中檢測遺傳標記基因座,其中(a)包含所述遺傳標記基因座或其互補序列的全部或部分的遺傳標記探針,在嚴格條件下與 bacm. pk071. jl2、bacm. pk007. 18 和 bacm2. pkl66. hi 雜交;并且(b)所述遺傳標記基因座包含與絲黑穗病抗性相關聯的至少一個等位基因。在第十六實施方案中,本發明涉及鑒定表現出絲黑穗病抗性的玉米植物的方法, 所述方法包括在所述玉米植物的種質中檢測標記基因座的至少一個等位基因,其中(a)所述標記基因座位于 SSR148152、CAPS25082、STS171、SNP661 和 STS1944 的 7cM內;并且(b)至少一個等位基因與絲黑穗病抗性相關聯。在第十七實施方案中,本發明涉及鑒定表現出絲黑穗病抗性的玉米植物的方法, 所述方法包括在所述玉米植物的種質中檢測標記基因座的至少一個等位基因,其中(a)所述標記基因座位于包括且兩翼為umcl736和umc2184的染色體區間內,或包括且兩翼為SSR148152/SNP661的染色體區間內;并且(b)至少一個等位基因與絲黑穗病抗性相關聯。
在第十八實施方案中,本發明涉及標記輔助的選擇的方法,所述方法包括(a)獲取具有標記基因座的至少一個等位基因的第一玉米植株,其中所述標記基因座位于公開的IBM基因圖譜上的SSR148152、CAPS25082、STS171、SNP661和STS1944的 7cM內,并且所述等位基因與提高的絲黑穗病抗性相關聯;(b)將所述第一玉米植株與第二玉米植株雜交;(c)至少就所述等位基因對子代進行評估;以及(d)選擇至少具有所述等位基因的子代玉米植株。在第十九實施方案中,本發明涉及標記輔助的選擇的方法,所述方法包括(a)獲取具有標記基因座的至少一個等位基因的第一玉米植株,其中所述標記基因座位于包括且兩翼為umcl736和umc2184的染色體區間內,并且所述等位基因與提高的絲黑穗病抗性相關聯;(b)將所述第一玉米植株與第二玉米植株雜交;(c)至少就所述等位基因對子代進行評估;并且(d)選擇至少具有所述等位基因的子代玉米植株。在第十九實施方案中,本發明涉及檢測絲黑穗病抗性基因座的方法,所述方法包括檢測至少一個標記等位基因的存在,所述標記等位基因選自ΜΖΑ6393、1Μ2-9、E6765-3、 2Μ4-1、2Μ10-5、2Μ11-3、3Μ1-25 和 STS148-1。此外,顯然在前述的任何方法中,任何所述的與絲黑穗病抗性相關聯的標記等位基因均可與任何第二標記等位基因連接。此類第二標記等位基因也可與絲黑穗病抗性相關聯,并以上文所述的方式起作用。附圖以及序列清單的說明根據以下的詳細描述和附圖以及序列表可更全面地理解本發明,以下的詳細描述和附圖以及序列表形成本申請的一部分。序列表包含核苷酸序列字符的單字母碼以及氨基酸的三字母碼,如遵照IUPAC-IUBMB標準所定義的,該標準在Nucleic Acids Research 13: 3021-3030(1985)以及在 Biochemical Journal 219 (No. 2) :345-373(1984)中有所描述, 這兩篇文獻全文以引用方式并入本文。用于核苷酸和氨基酸序列數據的符號和格式遵循在 37C. F. R. § 1. 822中所列出的規定。
圖1.針對AZM4_140313 (來自TIGR的拼接的玉米序列)的單核苷酸多態性標記 (SNP140313)的開發,及其在BC群體基因分型中的應用。圖2.新開發的標記在bin2. 09區域的基因作圖。圖3.來自Mol7和B73的木聚糖酶抑制劑基因的比對。Mol7序列存在于qHSRl 中,該基因座在玉米中賦予絲黑穗病抗性。B73是絲黑穗病敏感的玉米品種。圖4. Mol7、B73和Huangzhao在qHSR區域中基因組結構的比較圖。與Mol7相比,B73和Huangzhao在該區域中均具有缺失。本發明描述的標記顯示于上方。標注了六個感興趣的基因Mol7特有的一個水解酶基因;基因1為錨蛋白重復蛋白基因,存在于全部三個品系中;基因2是一種細胞壁關聯激酶,存在于Mol7和B73中;基因3和4是相關的LRR-Xa21-樣激酶,它們是Mol7特有的;基因5是第三種LRR_Xa21D_樣激酶,其完整地或部分地存在于全部三個品系中。在該區域中,Mol7的長度為1721Λ,Huangzhao的長度為 56kb。
本文所附的序列描述和序列表遵循在37C. F. R. § 1. 821-1. 825中所列出的用于專利申請公開中的核苷酸和/或氨基酸序列的規定。序列表包含遵循IUPAC-IUBMB標準的核苷酸序列的單字母編碼和氨基酸序列的三字母編碼,IUPAC-IUBMB標準描述于Nucleic Acids Res. 13 :3021-3030(1985)和 Biochemical J. 219(2) :345-373(1984)中,它們引入本文以供參考。用于核苷酸和氨基酸序列數據的符號和格式遵循在37C. F. R. § 1. 822中所列出的規定。SEQIDNO1為擴增引物CAPS25082-L。
SEQIDNO2為擴增引物CAPS25082-R。
SEQIDNO3為擴增引物SNP140313-L。
SEQIDNO4為擴增引物SNP140313-R。
SEQIDNO5 為擴增引物 SNP140313-snpL。
SEQIDNO6 為擴增引物 SNP140313-snpR。
SEQIDNO7為擴增引物SNP661-L。
SEQIDNO8為擴增引物SNP661-R。
SEQIDNO9為擴增引物SNP661-snpL。
SEQIDNO10為擴增引物SNP661-snpR。
SEQIDNO11為擴增引物STS1944-L。
SEQIDNO12為擴增引物STS1944-R。
SEQIDNO13為擴增引物STS171-L。
SEQIDNO14為擴增引物STS171-R。
SEQIDNO15為擴增引物SSR148152-L。
SEQIDNO16為擴增引物SSR148152-R。
SEQIDNO17 為擴增引物 STSrga3195-L。
SEQIDNO18 為擴增引物 STSrga3195-R。
SEQIDNO19 為擴增引物 STSrga840810-L。
SEQIDNO20 為擴增引物 STSrga8408IO-R0
SEQIDNO:21為擴增引物STkynl-L。
SEQIDNO22為擴增引物SI^synl-R。
SEQIDNO23 為 MZA6393 標記(來自 bacm.
qHSRl基因座的BAC重疊群的一端。該標記的Huangzhao和B73版本分別列于SEQ ID NO: 47禾口 48中。SEQ ID NO 24 為 ST148 標記,來自 ZMMBBc0478L09f 的 Mol7 版本,該標記限定了覆蓋qHSRl基因座的BAC重疊群的一端。該標記的Huangzhao版本可見于SEQ ID NO 49中。SEQ ID NO 25為BAC重疊群,該重疊群由覆蓋了 qHSRl基因座的重疊克隆bacm. pk071. j 12, bacm. pk007. 18 和 bacm2. pkl66. hi 組成。SEQ ID NO :26為來自Mol7的核酸序列,該序列代表qHRSl基因座中包含的-木聚糖酶抑制劑基因的編碼區。SEQ ID NO 27 為 SEQ ID NO 26 的翻譯產物。
SEQ ID NO 28為來自B73的核酸序列,該序列代表一個木聚糖酶抑制劑基因的編碼區,所述木聚糖酶抑制劑基因被包含于B73基因組上與qHRSl基因座同線的區域。SEQ ID NO 29 為 SEQ ID NO 28 的翻譯產物。SEQ ID NO :30為來自Mol7的、編碼SEQ ID NO :26/27的木聚糖酶抑制劑的基因組DNA區域,以及該編碼區上游的31Λ區域。SEQ ID NO :31為來自Mol7的核酸序列,該序列代表qHRSl基因座中包含的一個細胞壁關聯激酶基因的編碼區。SEQ ID NO 32 為 SEQ ID NO 31 的翻譯產物。SEQ ID NO 33為來自Mol7的、編碼SEQ ID NO :31/32的細胞壁關聯蛋白激酶的基因組DNA區域,以及該編碼區上游的2. 4kb區域。SEQ ID NO :34為來自Mol7的核酸序列,該序列代表qHRSl基因座中包含的一個 HAT家族二聚化蛋白基因(PC0662117)編碼區。SEQ ID NO 35 為 SEQ ID NO 34 的翻譯產物。SEQ ID NO 36為來自Mol7的、編碼SEQ ID NO 34/35的HAT家族二聚化蛋白的基因組DNA區域,以及該編碼區上游的2. 4kb區域。SEQ ID NO :37為來自Mol7的核酸序列,該序列代表qHRSl基因座中包含的一個 HAT 家族二聚化蛋白基因(PC0662162/PC0M8849/PC0523172)編碼區。SEQ ID NO 38 為 SEQ ID NO 37 的翻譯產物。SEQ ID NO 39為來自Mol7的、編碼SEQ ID NO :37/38的HAT家族二聚化蛋白的基因組DNA區域,以及該編碼區上游的2. 4kb區域。SEQ ID NO :40為來自Mol7的核酸序列,該序列代表qHRSl基因座中包含的一個未表征蛋白的基因(PC0648231)編碼區。SEQ ID NO 41 為 SEQ ID NO 40 的翻譯產物。SEQ ID N0:42為來自Mol7的、編碼SEQ ID NO :40/41的未表征蛋白的基因組DNA 區域,以及該編碼區上游的2. 4kb區域。SEQ ID NO :43為來自Mol7的核酸序列,該序列代表qHRSl基因座中包含的一個未表征蛋白蛋白基因(61_24)編碼區。SEQ ID NO 44 為 SEQ ID NO 43 的翻譯產物。SEQ ID NO :45為來自Mol7的、編碼SEQ ID NO :43/44的未知蛋白的基因組DNA 區域,以及該編碼區上游的2. 4kb區域。SEQ ID NO 46為編碼一個單獨的EST的核酸序列,所述EST序列來自Mol7,被包含于qHRSl基因座中。SEQIDNO47為來自Huangzhao的覆蓋了 qHSRl基因座的MZA6393標記。
SEQIDNO48為來自B73的覆蓋了 qHSRl基因座的MZA6393標記。
SEQIDNO49為來自Huangzhao的ST148標記。
SEQIDNO47 為來自 Huangzhao4 的 MZA6393 標記。
SEQIDNO48為來自B73的MZA6393標記。
SEQIDNO49 為來自 Huangzhao4 的 STS 148-1 標記。
SEQIDNO50為擴增引物MZA6393L。[ol 26] SEQID N。5l為擴增引物MZA6393R。[ol 27] SEQID N。52為擴增引物1M2—9L。[ol 28]SEQID N。53為擴增引物1M2—9R。[ol 29]SEQID N。54為來自M017的1M2—9標記。
SEQID N。55為來自Huangzha04的1M2—9標記。
SEQID N。56為擴增引物E6765—3L。[ol 32]SEQID N。57為擴增引物E6765—3R。
SEQID N。58為來自M017的E6765—3標記。[ol 34]SEQID N。59為擴增引物2M4一lL。[ol 35]SEQID N。60為擴增引物2M4—1R。[ol 36]SEQID NO6l為來自M017的2M4一l標記。[ol 37]SEQID N。62為擴增引物2MlO一5L。[ol 38]SEQID N。63為擴增引物2MlO一5R。[ol 39]SEQID N。64為來自M017的2MlO一5標記。
SEQID N。65為擴增引物2M1l一3L。
SEQID N。66為擴增引物2M1l一3R。
SEQID N。67為來自M017的2M1 l一3標記。
SEQID N。68為擴增引物3M1—25L。
SEQID N。69為擴增引物3M1—25R。
SEQID N。70為來自M017的3M1—25標記。
SEQID N。7l為來自Huangzha04的3M1—25標記。
SEQID N。72為擴增引物S/S148一lL。
SEQID N。73為擴增引物S/S148—1R。
SEQID N。74為擴增引物MZAl5839—4一L。[ol 50]SEQID N。75為擴增引物MZAl5839—4一R。
SEQID N。76為擴增引物MZAl8530—16一L。[ol 52]SEQID N。77為擴增引物MZAl8530—16一R。[ol 53]SEQID N。78為擴增引物MZA5473—80l—L。[ol 54]SEQID N。79為擴增引物MZA5473—80l—R。[ol 55-1 SEQID N。80為擴增引物MZAl6870—15一L。[ol 56]SEQID NO8l為擴增引物MZAl6870—15一R。[ol 57]SEQID N。82為擴增引物MZA4087—19一L。[ol 58]SEQID N。83為擴增引物MZA4087—19一R。[ol 59]SEQID N。84為擴增引物MZAl58—30一L。[ol 60] SEQID N。85為擴增引物MZAl58—30一R。
SEQID N。86為擴增引物MZAl5493—15一L。[ol 62] SEQID N。87為擴增引物MZAl5493—15一R。[ol 63]SEQID N。88為擴增引物MZA9967一l l—L。[ol 64]SEQID N。89為擴增引物MZA9967一l l—R。
SEQIDNO90 為擴增引物 MZA1556-23-L。
SEQIDNO91 為擴增引物 MZA1556-23-R。
SEQIDNO92 為擴增引物 MZA1556-801-L。
SEQIDNO93 為擴增引物 MZA1556-801-R。
SEQIDNO94 為擴增引物 MZA17365-10-L。
SEQIDNO95 為擴增引物 MZA17365-10-R。
SEQIDNO96 為擴增引物 MZA17365-801-L。
SEQIDNO97 為擴增引物 MZA17365-801-R。
SEQIDNO98 為擴增引物 MZA14192-8-L。
SEQIDNO99 為擴增引物 MZA14192-8-R。
SEQIDNO100 為擴增引物 MZA155M-13-L。
SEQIDNO101 為擴增引物 MZA155M-13-R。
SEQIDNO102 為擴增引物 MZA44M-14-L。
SEQIDNO103 為擴增引物 MZA44M-14-R。
SEQIDNO:104為來自Mol7的核酸序列,該序列代表錨蛋白重復蛋白(基因1,圖4)的基因編碼區O
SEQIDNO105為SEQ ID NO :104的翻譯產物。
SEQIDNO106為來自Mol7的編碼錨蛋白重復蛋白的基因組DNA區域。
SEQIDNO107為來自Mol7的核酸序列,該序列代表水解酶的基因編碼區。
SEQIDNO108為SEQ ID NO :107的翻譯產物。
SEQIDNO109為來自Mol7的編碼水解酶的基因組DNA區域。SEQ ID NO=IlO為來自Mol7的核酸序列,該序列代表LRR_Xa21_樣激酶(基因3, 圖4)的基因編碼區。SEQ ID NO :111 為 SEQ ID NO :110 的翻譯產物。SEQ ID NO :112為來自Mol7的核酸序列,該序列代表LRR_Xa21_樣激酶(基因4, 圖4)的基因編碼區。SEQ ID NO :113 為 SEQ ID NO :112 的翻譯產物。SEQ ID NO :114為來自Mol7的編碼LRR_Xa21_樣激酶(基因4,圖4)的基因組 DNA區域。SEQ ID NO :115為來自Mol7的核酸序列,該序列代表LRR-Xa21D_樣激酶(基因 5,圖4)的基因編碼區。SEQ ID NO :116 為 SEQ ID NO :115 的翻譯產物。SEQ ID NO :117為來自Mol7的編碼LRR_Xa21D_樣激酶(基因5,圖4)的基因組 DNA區域。發明詳述本發明提供玉米等位基因組合物和鑒定并選擇具有提高的絲黑穗病抗性的玉米植物的方法。等位基因組合物和用于鑒定并反選擇具有降低的絲黑穗病抗性的玉米植物的方法也在本發明的范圍內。提供以下定義以利于理解本發明。所述絲黑穗病抗性基因座的作圖描述于^ngsheng Chen、Qing Chao、GuoqingTan、Jing Zhao、Meijing Zhang、Qing Ji 禾口 Mingliang Xu 所著文禾高“ Identification and fine-mapping of a major QTL conferring resistance against head smut in maize" 中。該文稿作為附錄附屬于本說明書。術語“等位基因”指在特定基因座處發生的兩個或更多個不同核苷酸序列的其中一個。“有利等位基因”為位于特定基因座、賦予或有助于所期望的農學表型的等位基因, 所述表型例如提高的絲黑穗病抗性,或者作為另外一種選擇,為允許具有降低的絲黑穗病抗性的植物的鑒定的等位基因,其中所述植物可從育種計劃或種植中被篩除(“反選擇”)。 標記的有利等位基因是與有利表型共分離的標記等位基因,或者作為另外一種選擇,與不利植物表型共分離,從而提供鑒定植物的有益效果。染色體片段的有利等位基因形式是包括一段核苷酸序列的染色體片段,所述核苷酸序列在一個或多個位于所述染色體片段上的基因座有助于優異的農學性狀。“等位基因頻率”是指一個等位基因存在于一個個體、一個品系或一個包括多個品系的群體中的頻率(比例或百分比)。例如,就等位基因“A”而言, 基因型“AA”、“Aa”、或“aa”的二倍體個體分別具有1. 0,0. 5或0. 0的等位基因頻率。人們能夠通過平均化來自品系的個體樣品的等位基因頻率來估計該品系中的等位基因頻率。同樣地,人們能夠通過平均化構成種群的品系的等位基因頻率來計算該種群品系中的等位基因頻率。就一組限定數目的個體或品系而言,可將所有等位基因頻率表示為包含等位基因的個體或品系(或任何其他指定組)的計數。當等位基因與性狀相關聯時,并且當所述等位基因的存在是期望的性狀或性狀形式將發生在包含所述等位基因的植物中的指示時,所述等位基因與性狀“正”關聯。當等位基因與性狀相關聯時,并且當所述等位基因的存在是期望的性狀或性狀形式將不會發生在包含所述等位基因的植物中的指示時,所述等位基因與性狀“負”關聯。假如個體在一個基因座僅有一種類型的等位基因(例如二倍體生物體在兩條同源染色體中的每一條的一個基因座具有一個拷貝的相同等位基因),則該個體在該基因座是“純合的”。假如一種以上的等位基因類型存在于一個基因座上(例如二倍體個體具有兩個不同等位基因中的每一個的一個拷貝),則該個體是“雜合的”。術語“同質”指一組成員在一個或多個特定基因座上具有相同基因型。與之相反,術語“異質”用于指明一組內的個體在一個或多個特定基因座上基因型不同。本文所用術語“染色體區間”或“染色體片段”是指植物體內存在于單個染色體上的連續的線性基因組DNA跨度。位于單染色體間隔上的遺傳因子或基因是物理上連鎖的。 不特別限定染色體區間的大小。在一些方面,位于單個染色體區間內的遺傳因子在遺傳上連鎖,遺傳重組距離通常為例如小于或等于20cM,或者小于或等于10cM。S卩,位于單個染色體區間內的兩個遺傳因子以小于或等于20%或10%的頻率進行重組。術語“雜交的”或“雜交”指經由授粉產生子代的配子融合(例如細胞、種子或植物)。該術語包括有性雜交(一株植物被另一株植物授粉)和自交(自花授粉,例如當花粉和胚珠來自相同植物時)。“頂交測試”是通過將每一親本與相同測試者(通常是純合品系)雜交而進行的子代測試。測試親本可為自由授粉的品種、雜交品系或近交系。“基因圖譜”是對一個給定物種的一條或多條染色體(或連鎖群)上的基因座之間的基因連鎖關系的描述,一般以圖表或表格形式呈現。“基因作圖”是通過遺傳標記的使用、 與這些標記相關的種群分離和重組頻率的標準遺傳學原理,界定基因座之間連鎖關系的過程。“基因圖譜位置”是在相同連鎖群上,相對于圍繞的遺傳標記在基因圖譜上的位置,其中能夠在給定種群中發現指定標記。如果兩個不同的標記具有相同的基因圖譜位置,則這兩個標記彼此緊鄰,以至于它們之間發生重組的頻率低至不能被檢測到。一個基因圖譜與另一個基因圖譜在遺傳標記間的順序和遺傳距離上可能不同。這是因為每一基因圖譜是作圖的種群、使用的標記的類型、以及不同種群間各個標記的多態性潛力的產物。例如,在內部來源的基因圖譜上(本文也將Pioneer Hi-Bred稱為“PHB”) 的IOcM大概等同于在IBM22005鄰接框公開圖譜(在玉米⑶B上可用的高分辨率圖譜)上的25-30cM。然而,使用常見標記的通用框能夠將一個圖譜與另一個圖譜的信息關聯。本領域的普通技術人員可使用常見標記的框架來鑒定在各個個體基因圖譜上的遺傳標記位置和QTL (數量性狀位點)。表3中可見內部來源的基因圖譜和IBM2neighb0rS基因圖譜之間的標記位點比較。“遺傳重組頻率”是兩個基因座之間的交換事件(重組)的頻率。在標記和/或減數分裂后性狀的分離后可觀察到重組頻率。可將遺傳重組頻率用厘摩(cM)表示,其中一 cM是兩個遺傳標記間的距離,它們顯示的重組頻率(即那兩個標記間每100次細胞分裂發生交換事件一次)。術語“基因型”是個體(或個體組)在一個或多個基因座上的基因組成,它與可觀察到的性狀(表型)形成對照。基因型由一個或多個已知基因座的一種或多種等位基因限定,個體已經從其親本中繼承了所述基因座。術語基因型可被用于指個體在單個基因座上的基因組成,在多個基因座上的基因組成,或者更一般的,術語基因型可被用于指個體在其基因組中的所有基因的基因組成。“種質”指個體(例如一個植株)、一組個體(例如一個植物品系、品種或家族)、或來源于一個品系、品種、物種、或培養物的克隆的或從其中得到的遺傳物質。種質可為生物或細胞的部分,或者可從生物或細胞中分離得到。種質通常給遺傳物質提供特異性分子構成,該分子構成提供生物或細胞培養物的一些或全部遺傳性狀的物理基礎。如本文所用,種質包括可從中生長出新植物的細胞、種子或組織,或者植物部分如葉、莖、花粉、或細胞,它們能夠被培養成整個植株。“單倍型”是個體在多個基因座上的基因型,即等位基因組合。單倍型描述的基因座通常是物理上和遺傳上連鎖的,即在相同染色體片段上。“雜交”或“核酸雜交”是指互補的RNA和DNA鏈的配對以及互補的DNA單鏈的配對。“嚴格度”是指核酸雜交發生的條件,包括溫度、離子強度和某些有機溶劑,例如甲酰胺的存在。在高嚴格度條件下(高溫度和低鹽),只要兩條核酸片段之間存在高頻率的互補堿基序列,它們就將配對,或者說“雜交”。術語“滲入”指基因座的期望等位基因從一種遺傳背景傳遞到另一種遺傳背景的現象。例如在特定基因座的期望等位基因通過滲入、經由相同物種的兩個親本間的有性雜交可被傳遞到至少一個子代,其中至少一個親本在其基因組中具有期望的等位基因。作為另外一種選擇,例如等位基因的傳遞能夠通過兩個供體基因組之間的重組而發生,例如在融合原生質體中,其中至少其中一個供體原生質體在其基因組中具有期望的等位基因。期望的等位基因可為例如標記的選擇等位基因、QTL、轉基因等。在任何情況下,能夠將包含期望等位基因的子代與具有期望遺傳背景的品系反復回交并選擇期望的等位基因以產生固定在選擇遺傳背景中的等位基因。“品系”或“品種”是一組具有相同親本的個體,它們一般是某種程度的自交體,并且一般在大多數基因座是純合的和同質的(同基因的或接近同基因的)。“亞系”指子代的自交體亞群,它們與相同祖先來源的其他相似自交體亞群遺傳上不同。“祖先品系”是用作基因來源的親本品系,例如用于開發優良品系。“祖先種群”是對被用于培育優良品系的大部分基因變異有所貢獻的祖先的群體。“后代”是祖先的后代, 并可通過許多世代的繁殖與其祖先分離。例如,優良品系是它們的祖先的后代。“譜系結構” 規定了后代和產生該后代的各個祖先的關系。譜系結構能夠跨越一代或多代,描述后代及其父母親本、祖父母親本、曾祖父母親本等的關系。“優良株系”或“優良品系”是農學上優異的品系,該品系由多代育種以及選擇優異農學特性產生。多個優良品系對玉米育種領域的技術人員來說是可用的和已知的。“優良種群”是一類優良個體或品系,根據給定作物物種如玉米的農學上優異的基因型,它們將可用于代表技術發展水平。同樣的,“優良種質”或優良品種的種質是農學上優異的種質,通常來源于和/或能夠生成具有優異農學性能的植物,如現有的或新開發的優良玉米品系。“公開的IBM基因圖譜”指任何以下圖譜IBM、IBM2、IBM2neighbors、IBM2 FPC0507> IBM2 2004 neighbors、IBM2 2005neighbors>^ IBM2 2005 neighbors _。 這些IBM基因圖譜基于B73XMol7種群,其中來自初始雜交的子代在構建重組自交系用于作圖前隨機交配產生多代。較新的版本反映了基因和BAC作圖基因座的加入以及由于包含來自其他基因圖譜的信息帶來的圖譜精細度的提高。與之相反,“外來玉米品系”或“外來玉米種質”是來源于不屬于可利用優良玉米株系或品系的種質的玉米的品系或種質。在雜交發生在兩個玉米植株或品系的種質之間的情況下,外來種質的子代不與它雜交的優良種質密切相關。最常見的是外來種質不來源于任何已知的玉米優良品系,而是選擇將新遺傳因子(通常新等位基因)導入育種程序。如本文所用,術語“連鎖”用于描述一個標記基因座與另一個標記基因座或其他基因座(例如絲黑穗病抗性基因座)“關聯”的程度。分子標記和表型間的連鎖關系被稱為 “概率”或“調整概率”。概率值(也稱為P-值)是表型的特定組合和特定標記等位基因隨機性存在或不存在的統計學可能性。因此,概率評分越低,表型和特性標記將共分離的可能性越大。在某些方面,認為概率評分是“顯著的”或“不顯著的”。在一些實施方案中,認為隨機分離的概率評分為0.05 (ρ = 0.05,或5%的概率)是共分離的顯著性指示。然而,可接受的概率可為小于50% (p = 0. 5)的任何概率。例如,顯著概率可小于0. 25、小于0. 20、 小于0. 15、小于0. 1、小于0. 05、小于0. 01、或小于0. 001。在區間作圖中,兩個標記基因座之間的連鎖可以用優勢比(即連鎖對不連鎖的比率)進行計算。上述比率更加方便地表示為比率的對數,稱為優勢對數(LOD)值或LOD分數(Risch,Science 255 =803-804 (1992)) 兩個標記之間的LOD值為3表示連鎖的可能性比不連鎖的可能性大1000倍。較低的LOD值,例如2. 0或2. 5,可用于檢測較大水平的連鎖。“連鎖基因座”位置緊鄰,使得這兩個基因座之間不發生高頻率(等于或小于10% 的頻率)的同源染色體對間的減數分裂重組,例如連鎖基因座在至少約90%的時間,如 91%,92%,93%,94%,95%,96%,97%,98%,99%,99. 5%,99. 75%、或更多的時間共分離。當標記基因座顯示與期望性狀(例如提高的絲黑穗病抗性)共分離(連鎖)的顯著概率時,它們尤其有用。例如在某些方面,這些標記可被稱為“連鎖QTL標記”。連鎖可表示為所期望的界限或范圍。例如在一些實施方案中,當標記分離距離為小于50、40、30、25、20、或15圖譜單位(或cM)時,任何標記與任何其他標記連鎖(基因上和物理上)。進一步的連鎖可被描述為距離14、13、12、11、10、9、8、7、6、5、4、3、2、1圖譜單位 (或cM)。在某些方面,限定范圍形式的連鎖,例如介于10和20cM之間、介于10和30cM之間、或者介于10和40cM之間,是有利的。標記與第二基因座連鎖越緊密,標記越可能變成第二基因座的指示。因此,“緊密連鎖基因座”例如一個標記基因座和一個第二基因座,表現出10%或更低、或約9%或更低、或約8%或更低、或約7%或更低、或約6%或更低、或約5%或更低、或約4%或更低、或約3%或更低、或約2%或更低的基因座間重組頻率。在其他實施方案中,關聯基因座顯示約或更低的重組頻率,例如約0. 75%或更低,或約0. 5%或更低,或約0. 25%或更低的重組頻率。位于相同染色體上,并且它們間的距離使得兩個基因座間的重組發生頻率小于 10% (例如約 9%、8%、7%、6%、5%、4%、3%、2%、1%、0. 75%,0. 5%,0. 25%、或更低)的兩個基因座也稱為彼此“鄰近”。因為一 cM是顯示出的重組頻率的兩個標記之間的距離,當任何標記與任何其他標記緊鄰,例如距離等于或小于IOcM時,這兩個標記緊密連鎖 (遺傳上和物理上)。在相同染色體上的兩個緊密連鎖的標記可被彼此定位于彼此相距9、 8、7、6、5、4、3、2、1、0· 75,0. 5,0. 25,0. 1,0. 075,0. 05,0. 025 或 0. OlcM 或更小。當涉及兩個遺傳因子間的關系時,如有助于提高絲黑穗病抗性的遺傳因子和鄰近的標記,“相引”相連鎖指示下述狀態其中在莖稈強度基因座上的“有利”等位基因與相應連鎖的標記基因座的“有利”等位基因物理上關聯在相同染色體鏈上。在耦合相(前有絲分裂期)中,兩個有利等位基因被繼承了該染色體鏈的子代一起繼承。在“相斥”相連鎖中, 在受關注基因座上的“有利”等位基因與在鄰近的標記基因座上的“不利”等位基因物理上連鎖,并且兩個“有利”等位基因不被一起繼承(即這兩個基因座彼此“異相”)。術語“連鎖不平衡”指基因座或性狀(或者兩者都有)非隨機地分離。在任一情況下,連鎖不平衡意味著相關的基因座沿著一段染色體在物理上足夠接近,以便它們以大于隨機(即非隨機)的頻率一起分離(在共分離性狀的情況下,產生該性狀的基因座彼此足夠接近)。顯示連鎖不平衡的標記被認為是連鎖的。連鎖基因座在超過50%的情況下共分離,例如約51%至約100%的情況。換句話說,共分離的兩個標記具有小于50% (并且根據定義,在相同連鎖群上分離距離小于50cM)的重組頻率。如本文所用,連鎖可存在于兩個標記或者標記和表型之間。標記基因座可與性狀“相關聯”(連鎖),所述性狀例如絲黑穗病抗性。測量分子標記與表型性狀的連鎖程度,例如分子標記與表型共分離的統計學概率。連鎖不平衡最常見地用量度r2測量,它通過Hill,W.G.和Robertson,A, Theor. App 1. Genet. 38 =226-231 (1968)所述的公式計算。當r2 = 1時,兩個標記座位間存在完全的LD,意味著標記還未進行重組分離并且具有相同的等位基因頻率。r2值大于1/3指示足夠強的 LD 將被用于作圖(Ardlie 等人,Nature Reviews Genetics 3 :299-309 (2002)) 因此,當成對標記座位間的r2值大于或等于0. 33、0. 4、0. 5、0. 6、0. 7、0. 8、0. 9、或1. 0時,等位基因處于連鎖不平衡。如本文所用,“連鎖平衡”描述其中兩個標記獨立地分離的情況,即,在子代中隨機分離。認為顯示連鎖平衡的標記不連鎖(無論它們是否位于相同染色體上)。“基因座”是基因或標記所在的染色體區域。例如“基因座”是物種基因組中能夠在其中發現特定基因的特定染色體位置。“玉米(maize),,和“玉米(corn),,本文可互換使用。術語“標記”、“分子標記”、“標記核酸”、和“標記座位”指核苷酸序列或其編碼的產物(例如蛋白),當鑒定關聯的基因座時它們用作參考點。標記能夠來源于基因組核苷酸序列或表達的核苷酸序列(例如來源于剪接的RNA或cDNA),或來源于編碼的多肽。該術語也指與標記序列互補或側接標記序列的核酸序列,如用作探針或能夠擴增標記序列的引物對的核酸。“標記探針”是可用于通過核酸雜交鑒定標記座位存在與否的核酸序列或分子,例如與標記座位序列互補的核酸分子探針。包含標記座位的30個或更多鄰接核苷酸(“所有或部分”標記座位序列)的標記探針可用于核酸雜交。作為另外一種選擇,在某些方面分子探針指能夠區別(即基因型)存在于標記座位上的特定等位基因的任何類型的探針。當核酸在溶液中特異性“雜交”或配對時,例如根據Watson-Crick堿基配對原則雜交,核酸是 “互補的”。以PHM命名的標記表示一組擴增一段特異性DNA (本文中稱為“擴增子”)的引物。 將來自多個玉米品系的擴增子的核苷酸序列進行比較,從而鑒定了多態性或變異。所述多態性包括單核苷酸多態性(SNP)、簡單重復序列(SSR)、插入/缺失(插入缺失)等。“標記等位基因”或者“標記基因座的等位基因”可以指種群中位于標記基因座的多個多態性核苷酸序列的其中一個,它就標記座位而言是多態的。作為另外一種選擇,以數字命名的標記等位基因表示在該特異性標記基因座的信息性多態性位點的等位基因的特定組合,也稱為“單倍型”。在一些方面,提供了與玉米中絲黑穗病抗性相關的標記基因座。“標記座位”是可用于追蹤第二連接基因座存在的基因座,例如編碼或有助于表達表型性狀的連接的基因座。例如標記座位能夠用于監控等位基因在某一基因座的分離,如 QTL,它們與標記座位在遺傳上或在物理上連鎖。“遺傳標記”是種群中的多態核酸,并且可通過一種或多種分析方法,例如RFLP、 AFLP、同功酶、SNP、SSR等,檢測并區分所述標記等位基因。該術語也指與基因組序列互補的核酸序列,如用作探針的核酸。對應于種群成員之間的遺傳多態性的標記能夠通過本領域已建立的方法進行檢測。這些方法包括例如DNA測序、基于PCR的序列特異性擴增方法、限制性片段長度多態性檢測(RFLP)、同功酶標記檢測、通過等位基因特異性雜交(ASH)進行的多核苷酸多態性檢測、植物基因組的擴增可變序列檢測、自主序列復制檢測、簡單重復序列檢測(SSR)、單核苷酸多態性檢測(SNP)、或擴增片段長度多態性檢測(AFLP)。已經建立的方法也已知用于檢測表達序列標簽(EST)和來源于EST序列的SSR標記以及隨機擴增的多態性DNA(RAPD)。“絲黑穗病抗性”是指玉米植物耐受宿主特異性的真菌絲軸黑粉菌 (Sphacelotheca reiliana(Kuhn)Clint)感染的能力。這些抗性包括但不限于,與缺乏本文所述的抗性基因座的玉米植株相比,減少的孢子囊群生產、提高的植株活力、提高的抽穗功能和提高的玉米產量。本發明實施方案的核酸和多肽可用于賦予或增強植物真菌抗性的方法中。抗性的來源可以是天然存在的遺傳的抗性基因座,所述基因座通過育種實現向缺少該抗性基因座的敏感型玉米種群的基因滲入,或者,賦予抗性的基因可作為轉基因異位表達,所述轉基因當在敏感型種群中表達時賦予抗性。因此,本文公開的組合物和方法在保護植物不受病原真菌侵害中是有用的。“病原抗性”、“真菌抗性”和“疾病抗性”意指植物避免了作為植物-病原體相互作用結果的疾病癥狀。即,防止了病原體導致植物疾病和相關的疾病癥狀, 或者,病原體導致的疾病癥狀被最小化或減弱了,例如壓力和相關的產量損失的降低。本領域的技術人員將會知道,本文所公開的組合物和方法可與本領域中可用的其他組合物和方法一起被用于保護植物免受病原體攻擊。因此,本發明實施方案的方法可被用于保護植物免受疾病,尤其是由植物病原真菌導致的疾病的侵害。如本文所用,“真菌抗性”是指與野生型植物的對應性質相比,對病原真菌增強的抗性或耐受性。效果可以從對病原真菌的影響的耐受性的略微增加(例如部分抑制),直至使得植物不受病原真菌存在的影響這樣的完全抗性。針對一種特定的病原真菌或針對更廣泛的病原真菌譜的抗性水平的提高,構成了“增強的”或提高的真菌抗性。本發明的實施方案也將增強或提高植物病原真菌抗性,使得植物對一種或多種病原真菌的抗性提高。術語“增強”是指提高、增加、擴大、倍增、提升、上升等。在本文中,本發明的植物被描述為由于本發明的絲黑穗病抗性基因座而對絲軸黑粉菌的感染具有抗性或者對絲軸黑粉菌的感染具有“增強的抗性”。相應地,與因缺少絲黑穗病抗性基因座而對絲軸黑粉菌的感染敏感的相應植物相比,它們通常表現出對該疾病提高的抗性。在一些特定方面,賦予或增強植物真菌抗性的方法包括將至少一種表達盒轉入植物,其中所述表達盒包括編碼本發明實施方案的抗真菌多肽的核苷酸序列,其中所述核苷酸序列可操作地連接至在所述植物中驅動表達的啟動子。植物表達所述多肽,從而賦予了該植物真菌抗性,或提高了該植物抗性的固有水平。在特定實施方案中,所述基因賦予了對病原真菌絲軸黑粉菌的抗性。所述實施方案的抗真菌多肽的表達可定位于對病原體的抗性在其處尤其重要的特定的植物組織,例如葉、根、莖或維管組織。此類組織優先的表達可通過根優先的、葉優先的、維管組織優先的、莖優先的或種子優先的啟動子而實現。“核苷酸序列”、“多核苷酸”、“核酸序列”、和“核酸片段”可互換使用,并且指作為單鏈或雙鏈的RNA或DNA聚合物,任選含有合成的、非天然的或改變的核苷酸堿基。“核苷酸” 是構成DNA或RNA聚合物的單體單元,它由嘌呤或嘧啶堿基、戊糖、和磷酸基組成。核苷酸 (通常以它們的5'-單磷酸形式存在)通過它們下述的單字母命名法指“A”指腺苷酸或脫氧腺苷酸(分別用于RNA或DNA),“C”指胞苷酸或脫氧胞苷酸,“G”指鳥苷酸或脫氧鳥苷酸,“U”指尿苷酸,“T”指脫氧胸苷酸,“R”指嘌呤(A或G),“Y”指嘧啶(C或Τ),“Κ”指G或 Τ,“H”指A或C或Τ,“ I ”指肌苷,“N”指任何核苷酸。術語“多肽”、“肽”和“蛋白質”在本文中可互換使用,指氨基酸殘基的聚合物。該術語適用于其中一個或多個氨基酸殘基是相應的天然存在的氨基酸的人工化學類似物的氨基酸聚合物,以及適用于天然存在的氨基酸聚合物。本發明實施方案的多肽既可從本文所公開的核酸產生,也可通過使用標準的分子生物學技術而產生。例如,本發明實施方案的截短的蛋白質可通過在適當的宿主細胞中表達本發明實施方案的重組核酸而產生,或者通過離體過程的組合,例如蛋白酶消化和純化而產生。
如本文所用,術語“編碼”或“編碼的”當用于特定的核酸時,意指該核酸包含用以指導從其核苷酸序列向特定蛋白質的翻譯的必要信息。蛋白質被編碼所用的信息通過密碼子的使用而具體化。編碼蛋白質的核酸可在所述核酸的翻譯區之間包含非翻譯序列(即內含子),或者可沒有此類居間的非翻譯序列(例如,如在cDNA中)。本發明的實施方案包括分離的或充分純化的多核苷酸或蛋白質組合物。“分離的” 或“純化的”多核苷酸或蛋白質,或其生物活性部分,是充分地或基本上不含那些在天然存在環境中伴隨所述多核苷酸或蛋白質或與其相互作用的組分的。因此,分離的或純化的多核苷酸或蛋白質,當其是通過重組技術(例如PCR擴增)產生的時,基本上不含其他細胞物質,或者當其是化學合成的時,基本上不含化學前體或其他化學品。最理想的情況,“分離的”多核苷酸不含在該多核苷酸所來源于的生物的基因組DNA中天然地存在于所述多核苷酸兩翼(即,位于所述多核苷酸的5'和3'端)的序列(例如,蛋白質編碼序列)。例如,在不同的實施方案中,所述分離的多核苷酸可包含少于約51Λ、約41Λ、約31Λ、約21Λ、約 IWK約0. 51Λ、或約0. 11Λ的在該多核苷酸所來源于的細胞的基因組DNA中天然地存在于所述多核苷酸兩翼的核苷酸序列。基本上不含細胞物質的蛋白質包括制備含有少于約30%、 約20%、約10%、約5%或約(以干重計)的雜蛋白的蛋白質。當所述實施方案的蛋白質或其生物活性部分為重組生產的時,最佳的培養基包含少于約30%、約20%、約10%、約 5%或約(以干重計)的化學前體或非目標蛋白質的化學品。本文公開的核苷酸序列及其編碼的蛋白質的片段和變體同樣包括在本發明的實施方案中。“片段”意指核苷酸序列的部分,或氨基酸序列的部分以及由此編碼的蛋白質的部分。核苷酸序列的片段可編碼保留了天然蛋白質的生物學活性的蛋白質片段,所述蛋白質片段因此具有賦予植物真菌抗性的能力。作為另外一種選擇,作為雜交探針起作用的核苷酸序列的片段不必編碼保留了生物學活性的片段蛋白質。因此,核苷酸序列片段的長度范圍可以是至少約15核苷酸、約50核苷酸、約100核苷酸、以及最多為編碼本發明實施方案的多肽的全長核苷酸序列。編碼本發明實施方案的多肽的一個生物活性部分的一條核苷酸序列片段,將編碼至少約15個、約25個、約30個、約40個或約50個連續的氨基酸,或最多存在于本發明實施方案的全長多肽中的總的數量的氨基酸。用作雜交探針或PCR引物的核苷酸序列片段一般不需要編碼蛋白質的生物活性部分。如本文所用,關于特定多核苷酸的“全長序列”,意指具有天然序列的完整的核酸序列。“天然序列”旨在表示內源性序列,即存在于生物體基因組中的非人工改造的序列。因此,本發明實施方案的核苷酸序列的片段可編碼多肽的生物活性部分,或者它可以是能用作使用下文所公開方法的雜交探針或PCR引物的片段。抗病原體的多肽的生物活性部分,可通過分離本發明實施方案的核苷酸序列之一的一個部分、表達所述蛋白質的編碼部分、以及評估所述蛋白質的編碼部分賦予或增強植物的真菌抗性的能力進行制備。 作為本發明實施方案的核苷酸序列的片段的核酸分子,包含至少約15個、約20個、約50 個、約75個、約100個或約150個核苷酸,或最多存在于本文所公開的全長核苷酸序列中的總的數量的核苷酸。“變體”旨在表示基本上類似的序列。就多核苷酸而言,變體包括在天然多核苷酸的一個或多個內部位點有一個或多個核苷酸的缺失和/或插入,和/或在天然多核苷酸的一個或多個位點有一個或多個核苷酸的取代。如本文所用,“天然”多核苷酸或多肽分別包括天然存在的核苷酸序列或氨基酸序列。本領域的技術人員將認識到,本發明實施方案的核酸的變體將被構建為使得開放閱讀框(ORF)被保留。就多核苷酸而言,保守的變體包括那些由于遺傳密碼的簡并性,編碼本發明實施方案的多肽之一的氨基酸序列的序列。天然存在的等位變體如這些能通過使用熟知的分子生物學技術鑒定的變體,所述技術例如下文所列出的聚合酶鏈反應(PCR)和雜交技術。變體多核苷酸還包括合成得到的多核苷酸,例如,那些通過利用例如定點誘變產生的多核苷酸,但其仍然編碼本發明實施方案的蛋白質。 一般來講,如通過序列比對程序和本文其他地方所述的參數所測定的,本發明實施方案的特定多核苷酸的變體與該特定多核苷酸之間將至少具有約40%、約45%、約50%、約55%、 約 60%、約 65%、約 70%、約 75%、約 80%、約 85%、約 90%、約 91%、約 92%、約 93%、約 94 %、約95 %、約96 %、約97 %、約98 %、約99 %或更高的序列同一性。本發明實施方案的特定多核苷酸(即參考多核苷酸)的變體,還可通過比較變體多核苷酸所編碼的多肽和參考多核苷酸所編碼的多肽之間的序列同一性百分比來加以評估。因此,例如,本文公開了所編碼的多肽與SEQ ID NO :3的多肽具有給定的序列同一性百分比的分離的多核苷酸。任何兩種多肽之間的序列同一性百分比可利用序列比對程序和本文其他地方所述的參數計算出。當通過比較本發明實施方案的任何一對給定的多核苷酸所編碼的兩種多肽之間的序列同一性百分比,來評估所述任何一對給定的多核苷酸時, 上述兩種編碼的多肽之間的序列同一性百分比為至少約40%、約45%、約50%、約55%、 約 60%、約 65%、約 70%、約 75%、約 80%、約 85%、約 90%、約 91%、約 92%、約 93%、約 94%、約95%、約96%、約97%、約98%、約99%或更高。“變體”蛋白質旨在表示通過在天然蛋白質的一個或多個內部位點有一個或多個氨基酸的缺失或插入,和/或在天然蛋白質的一個或多個位點有一個或多個氨基酸的取代而源自于所述天然蛋白質的蛋白質。本發明實施方案所包括的變體蛋白質是具有生物活性的,也就是說它們仍然擁有天然蛋白質所擁有的所期望的生物活性,即賦予或增強植物病原真菌抗性的能力,如本文所述。此類變體可得自例如遺傳多態性或得自人工操縱。如通過序列比對程序和本文其他地方所述的參數所測定的,本發明實施方案的天然蛋白質的具生物活性的變體與該天然蛋白質的氨基酸序列之間將至少具有約40%、約45%、約50%、 約 55%、約 60%、約 65%、約 70%、約 75%、約 80%、約 85%、約 90%、約 91%、約 92%、約 93%、約94%、約95%、約96%、約97%、約98%、約99%或更高的序列同一性。本發明實施方案的蛋白質的具生物活性的變體與該蛋白質之間,可以在少至約1-15個氨基酸殘基、 少至約1-10個,例如約6-10個、少至約5個、少至4、3、2甚或1個氨基酸殘基上存在不同。本發明實施方案的蛋白質可用多種方法進行改變,包括氨基酸取代、刪除、截短、 和插入。此類操縱方法是本領域一般已知的。例如,所述抗病原體的蛋白質的氨基酸序列變體和片段可通過DNA上的突變進行制備。用于誘變和多核苷酸改變的方法是本領域熟知的。參見例如 Kunkel (1985)Proc. Natl. Acad. Sci. USA 82 :488-492 ;Kunkel 等人(1987) Methods in Enzymo 1. 154 :367-382 ;美國專利 4,873,192 ;Walker 和 Gaastra, eds. (1983) Techniques in Molecular Biology (MacMillan Publishing Company, New York)及其引用的參考文獻。關于不影響受關注蛋白質的生物活性的適當氨基酸取代的指導可參見 Dayhoff ^AWIIM, (1978) Atlas of Protein Sequence and Structure (Natl. Biomed.Res. Found.,Washington, D. C.),該參考文獻以引用方式并入本文。可優選保守取代,如用一個具有相似性質的氨基酸取代另一個氨基酸。因此,本發明實施方案的基因和多核苷酸既包括天然存在的序列也包括突變形式。同樣的,本發明實施方案的蛋白質既包括天然存在的蛋白質也包括其變體和修飾形式。 此類變體將繼續擁有所期望的賦予或增強植物病原真菌抗性的能力。顯然,在編碼變體的 DNA中制造的突變不應將所述序列置于閱讀框之外,并且優選地將不產生能導致產生mRNA 二級結構的互補區域。參見專利EP 0075444。不期望本文包括的蛋白質序列的刪除、插入、和取代導致所述蛋白質的特性產生巨大的改變。然而,考慮到取代、刪除或插入的確切效果在進行這些操作之前難以預料, 本領域的技術人員將會知道,將通過篩選用變體蛋白轉化的轉基因植物對所述效果進行評估,以確定對植物抵御病原真菌攻擊的能力的影響。變體多核苷酸和蛋白質也包括來源于誘變或重組過程(包括且不限于例如DNA改組這樣的過程)的序列和蛋白質。本領域的技術人員能夠設想那些將會改變蛋白質相應的病原體的范圍的修飾。通過此類過程,一種或多種不同的蛋白質編碼序列可被操作,以產生擁有所期望的性質的新蛋白質。如此,從一組包含具有基本的序列同一性、并且能在體外或體內進行同源重組的序列區域的相關多核苷酸序列,產生了重組多核苷酸文庫。例如,采用這一途徑,編碼一個受關注的結構域的序列基序,可以在本發明實施方案的蛋白質基因和其他已知的蛋白質基因之間重排,以得到編碼一種具有改良的受關注特性的蛋白質的新基因,所述特性例如提高的賦予或增強植物病原真菌抗性的能力。此類DNA改組方法是本領域已知的。參見例如 Stemmer (1994)Proc. Natl. Acad. ki. USA 91 :10747-10751 ; Stemmer(1994)Nature370 :389-391 ;Crameri 等人(1997)Nature Biotech. 15 :436-438 ; Moore 等人(1997) J. Biol. 272 :336-347 ;Zhang 等人(1997) Proc. Natl. Acad. Sci. USA 94 4504-4509 ;Crameri 等人(1998) Nature 391 :288-291 ;和美國專利公開 5,605,793 和 5,837,458。本發明實施方案的多核苷酸可被用于從其他生物(尤其是其他植物)分離相應的序列。如此,能使用例如PCR、雜交等方法基于此類序列與本文所述序列的序列同源性鑒定此類序列。基于其與本文所述的完整序列之間或與它們的變體和片段之間的序列同一性而被分離的序列,被包括在本發明實施方案之內。此類序列包括是本文所公開序列的直系同源體的序列。“直系同源體”旨在表示源自共同的祖先基因,并由于物種形成存在于不同物種中的基因。當存在于不同物種中的基因的核苷酸序列和/或它們編碼的蛋白質序列至少具有約 60%,約 70%,約 75%,約 80%,約 85%,約 90%,約 91%,約 92%,約 93%,約 94%, 約95 %,約96 %,約97 %,約98 %,約99 %,或更高的序列同一性時,這些基因被認為是直系同源體。各物種之間的直系同源體的功能常常是高度保守的。因此,編碼賦予或增強植物病原真菌抗性的蛋白質,以及在嚴格條件下與本文所公開的序列、或其變體或片段雜交的分離的多核苷酸,被包括在本發明實施方案之內。在一個PCR方法中,能設計寡核苷酸引物用于PCR反應以從提取自任何受關注生物的cDNA或基因組DNA中擴增相應的DNA序列。用于設計PCR弓丨物和PCR克隆的方法是本領域一般已知的,公開于 Sambrook 等人(1989) Molecular Cloning =ALaboratory Manual (2d ed. , Cold Spring Harbor Laboratory Press, Plainview, New York)0 See also Innis等人·,eds. (1990)PCR Protocols :A Guide to Methods and Applications (Academic Press, New York) ;Innis 禾口 Gelfand, eds. (1995)PCR Strategies(Academic Press, New York);以及 Innis 禾口 Gelfand, eds. (1999)PCR Methods Manual(Academic Press, New York) 0已知的PCR方法包括且不限于使用成對引物、巢式引物、單個特異引物、簡并引物、 基因特異性引物、載體特異性引物、部分錯配引物等的方法。在雜交技術中,將已知多核苷酸的全部或部分用作探針,探針選擇性地雜交到來自所選擇生物的存在于一組克隆基因組DNA片段或cDNA片段的其他對應多核苷酸上(即, 基因組或cDNA文庫)。雜交探針可以是基因組DNA片段、cDNA片段、RNA片段、或其他寡核苷酸,并且可以用可檢測的基團如32P、或任何其他可檢測標記物標記。因此,例如,通過基于本發明實施方案的多核苷酸標記合成的寡核苷酸,可制得用于雜交的探針。用于制備雜交探針和構建cDNA和基因組文庫的方法是本領域一般已知的,并且公開于Sambrook等人所著文獻(1989,參見上文)中。例如,本文所公開的一種完整的多核苷酸,或其一個或多個部分,可被用作能特異性地與相應的多核苷酸和信使RNA雜交的探針。為了在多種條件下實現特異性雜交,此類探針包括特有的序列,并且所述序列的長度優選為至少約10個核苷酸、至少約15個核苷酸或至少約20個核苷酸。此類探針可被用于通過PCR從選定的生物擴增相應的多核苷酸。可使用此技術分離來自所期望生物的附加編碼序列或作為診斷檢測分析法測定編碼序列在一種生物中的存在。雜交技術包括雜交篩選置于板上的DNA文庫(噬菌斑或菌落;參見例如Sambrook等人(1989,參見上文)。可在嚴格條件下進行此類序列的雜交。“嚴格條件”或“嚴格雜交條件”是指在該條件下探針將以比其他序列更高的可檢測程度雜交到其靶序列上(例如至少2倍于背景)。 嚴格條件是序列依賴性的并將因不同的環境而異。通過控制雜交和/或洗滌條件的嚴格性,可鑒定與探針100%互補的靶序列(同源探測)。作為另一種選擇,可調節嚴格條件以允許序列中的一些錯配,以便檢測到更低程度的相似性(異源探測)。通常,探針的長度少于約1000個核苷酸,優選長度少于500個核苷酸。通常,嚴格條件將是如下那些條件在pH7. O至8. 3下鹽濃度低于約1. 5M鈉離子, 通常約0. 01至1. OM鈉離子濃度(或其它鹽),并且對于短探針(例如10至50個核苷酸) 溫度為至少約30°C,而對于長的探針(例如多于50個核苷酸)溫度為至少約60°C。嚴格條件也可以通過加入諸如甲酰胺之類的去穩定劑來實現。示例性的低嚴格條件包括在37°C 下于含有30至35%甲酰胺、IM NaClU % SDS (十二烷基硫酸鈉)的緩沖液中雜交,以及在 50至55°C下用IX至2X SSC(20XSSC = 3. OM NaCl/0. 3M檸檬酸三鈉)洗滌。示例性的中等嚴格條件包括在37°C下于40至45%甲酰胺、1. OM NaClU % SDS中雜交,以及在55至60°C 下用0. 5X至IX SSC洗滌。示例性的高度嚴格條件包括在37°C下于50%甲酰胺、IM NaCl, 1 % SDS中雜交,以及最終在60至65°C下用0. IX SSC洗滌至少30分鐘。任選地,洗滌緩沖液可包含約0. 至約的SDS。雜交時間一般小于約M小時,通常為約4至約12小時。洗滌時間為至少足夠達到平衡狀態的一段時間。特異性通常取決于雜交后洗滌,最后的洗滌溶液的離子強度和溫度是關鍵因素。就DNA-DNA雜交體而言,熱力學熔點(Tm)可以估算自Meinkoth和Wahl (1984) Anal. Biochem. 138 :267-284 的方程式Tm = 81. 5 °C +16. 6 (log Μ) +0. 41 ( % GC)-0. 61( %form)-500/L ;其中M是單價陽離子的體積摩爾濃度,% GC是DNA中鳥苷和胞嘧啶核苷酸的百分比,% form是雜交溶液中甲酰胺的百分比,而L是以堿基對表示的雜交體的長度。Tm是(在確定的離子強度和pH下)50%的互補靶序列與完全匹配的探針雜交時的溫度。每出現的錯配,Tm降低約1°C ;因此,可調節Tm、雜交和/或洗滌條件以與具有所期望的同一性的序列雜交。例如,如果要尋求具有>90%同一性的序列,則可將Tm降低 10°C。通常,在確定的離子強度和pH下,嚴格條件選擇為比特定序列及其互補序列的TJS 約5°C。然而,極嚴格條件可采用在比TJS 1、2、3或4°C的溫度下雜交和/或洗滌;中等嚴格條件可采用在比Tm低6、7、8、9或10°C的溫度下雜交和/或洗滌;低嚴格條件可采用在比Tm低11、12、13、14、15或20°C的溫度下雜交和/或洗滌;利用所述等式、雜交和洗滌組合物以及所期望的Tm,本領域的技術人員將會理解,雜交和/或洗滌溶液的嚴格性的變化已經在本質上進行了描述。如果所需的錯配程度導致Tm低于45°C (水溶液)或32°C (甲酰胺溶液),則優選提高SSC的濃度以便能使用更高的溫度。對核酸雜交的一個廣泛適用白勺指導可見于 Ti jssen (1993) Laboratory Techniques in Biochemistry and Molecular BiologyHybridization with Nucleic Acid Probes, Part I, Chapter 2 (Elsevier, New York);以及Current Protocolsin Molecular Biology,第 2章,Ausubel 等人編輯,Greene Publishing and ffiley-Interscience, New York (1995)。參見 Sambrook 等人(1989,參見上文)。有多種方法可被用于檢測特定序列的DNA、RNA或蛋白質是否存在。這些方法包括,例如,DNA印跡、RNA印跡、蛋白質印跡和ELISA分析。諸如上述這些的技術為本領域的技術人員所熟知,并且有大量提供了詳細操作規程的參考文獻存在。此類參考文獻包括 Sambrook 等人(1989,參見上文)和 Crowther,J. R. (2001) ,The ELISA Guidebook,Humana Press, Totowa, NJ, USA。下列術語用于描述兩種或更多種多核苷酸或多肽之間的序列關系(a) “參考序列”,(b) “比對窗口”,(c) “序列同一性”,(d) “序列同一性百分比”。(a)如本文所用,“參考序列”是用作序列比對基準的定義序列。參考序列可以是指定序列的一部分或全部;例如,全長cDNA或基因序列的一個片段,或全長cDNA或基因序列。(b)如本文所用,“比對窗口”比較參考序列和多核苷酸序列的連續的指定片段,其中在所述比對窗口中的多核苷酸序列與參考序列(不包含插入或缺失)相比可以包含插入或缺失(即間隙),以獲得兩段多核苷酸之間的最大匹配。一般來講,比對窗口的長度為至少約20個連續的核苷酸,并且任選地可以為約30個、約40個、約50個、約100個或更長。 本領域的技術人員懂得為了避免由于在多核苷酸序列中包含空位導致的它與參考序列的高度相似,通常導入空位罰分并從匹配數目中減去空位罰分。用于比對的序列比對方法是本領域熟知的。因此,能使用數學算法測定任意兩個序列之間的序列同一性百分比。此類數學算法的非限制性實例是Myers和Miller算法 (1988)CABIOS 4 :11-17 ;Smith 等人的局部比對算法(1981)Adv. Appl. 2 :482 ;Needleman 和Wunsch的全局比對算法(1970)J. Biol.48 :443-453 ;Pearson和Lipman的局部搜尋比對方法(1988)Proc. Natl. Acad. Sci. 85 :2444-2448 ;Karlin 和 Altschul 的算法(1990) Proc. Natl. Acad. Sci. USA 872洸4,Karlin 和 Altschul 的改進算法(1993)Proc. Natl. Acad. Sci.USA 90 :5873-5877o能利用計算機實施這些數學算法,以比對序列、測定序列同一性。此類具體實施包括且不限于在 PC/Gene 程序中的 CLUSTAL(得自 htelligenetics,Mountain View, California) ;ALIGN 程序(版本 2· 0)和 GCG Wisconsin Genetics Software Package,版本 10(可自 Accelrys Inc. ,9685Scranton Road, San Diego, California, USA 獲得)中的GAP、BESTFIT、BLAST、FASTA和TFASTA。能夠使用默認參數進行使用這些程序的比對。 CLUSTAL 程序詳述于 Higgins 等人(1988)Gene73 :237-244(1988) ;Higgins 等人(1989) CABI0S5 :151-153 ;Corpet 等人(1988)Nucleic Acids Res. 16 :10881-90;Huang 等人 (1992)CABI0S8 :155-65 ;和 Pearson 等人(1994)Meth. Mol. Biol. 24 :307-331。上述 ALIGN 程序基于的是Myers和Miller的算法(1988,參見上文)。當比對氨基酸序列時,PAM120權重殘基表、空位長度罰分12、以及空位罰分4能與ALIGN程序一起使用。Altschul等人的 BLAST 程序(1990) J. Biol. 215 :403 基于 Karlin 和 Altschul 的算法(1990,參見上文)。可使用BLASTN程序進行BLAST核苷酸搜索,得分=100,字長=12,以獲取與編碼本發明實施方案的蛋白質的核苷酸序列同源的核苷酸序列。可使用BLASTX程序進行BLAST蛋白質搜索,得分=50,字長=3,以獲取與本發明實施方案的多肽同源的氨基酸序列。為了實現帶間隙的比對以進行比較,可使用(BLAST 2.0中的)Gapped BLAST,如Altschul等人(1997) Nucleic Acids Res. 25 :3389 中所述。或者,可使用(BLAST 2. 0 中的)PSI-BLAST 來進行迭代搜索,以檢測分子之間的遠緣關系。參見Altschul等人(1997)同上。當利用BLAST、 Gapped BLAST、PSI-BLAST時,可使用相應程序(例如用于核苷酸序列的BLASTN,用于蛋白的BLASTX)的默認參數。參見www. ncbi. ηlm. nih. gov。也可通過檢查進行手動比對。除非另有說明,本文提供的序列同一性/相似性值是指利用GAP版本10、采用下列參數獲得的值核苷酸序列的同一性百分比和相似性百分比采用的空位權重(Gap Weight)為50、長度權重(Length Weight)為3,并采用nwsgapdna. cmp計分矩陣;氨基酸序列的同一性百分比和相似性百分比采用的空位權重(Gap Weight)為8、長度權重(Length Weight)為2,并采用BL0SUM62計分矩陣;或者它們的任何等效程序。“等效程序”是指滿足下列條件的任何序列比對程序就任何正被討論的兩個序列而言,與GAP版本10生成的對應比對相比,所述序列比對程序生成具有相同核苷酸或氨基酸殘基匹配和相同序列同一性百分比的比對。GAP 使用 Needleman 和 Wunsch 算法(1970) J. Biol. 48 :443-453,以找出兩個完整序列之間使匹配數最大化和空位數最小化的比對結果。GAP考慮所有可能的比對和空位位點,并制備最大數目的匹配堿基和最少的空位。它允許以匹配堿基單位提供空位形成罰分和空位延伸罰分。GAP必須對它插入的每個空位形成空位形成罰分匹配數。如果選擇空位延伸罰分大于零,GAP必須另外形成對每個空位延伸罰分的空位次數的插入長度的空位罰分。蛋白質序列的GCG Wisconsin Genetics Software Package版本10默認的空位形成罰分值和空位延伸罰分值分別是8和2。就核苷酸序列而言,默認的空位形成罰分為50,而默認的空位延伸罰分為3。空位形成和空位延伸罰分可表示為選自從0至200的整數。如此,例如,空位形成和空位延伸罰分可以是0、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、 45、50、55、60、65 或更高。GAP提供了比對家族中的一個最優成員。此家族中可能有很多成員,并且其他成員沒有更好的質量。GAP顯示了用于比對的四個質量因數質量、比率、同一性、和相似性。質量是比對序列的最大量度。比率是質量除以較短片段中的堿基數。同一性百分比是實際匹配的符號的百分比。百分比相似性是相似符號的百分比。忽略來自空位對面的符號。當一對符號的得分矩陣值大于或等于0.50時(相似性閾值),對相似性打分。GCG Wisconsin Genetics Software Package版本10中使用的得分矩陣是BL0SUM62 (參見Henikoff和 Henikoff (1989)Proc. Natl. Acad. Sci. USA 89 :10915)。(c)如本文所用,涉及兩種多核苷酸或多肽序列時的“序列同一性”或“同一性”是指兩序列中的殘基當在指定比較窗口中比對最大匹配時是相同的。已經認識到當序列同一性百分比用于蛋白質時,不同的殘基位置常常存在保守氨基酸取代的差異,其中氨基酸殘基被取代為具有相似化學性質(例如電荷或疏水性)的其他氨基酸殘基,并因此不改變該分子的功能特性。當序列出現保守殘基取代差異時,可上調序列同一性百分比進行糾正以保持取代的保守性質。存在此類保守取代差異的序列被稱為具有“序列相似性”或“相似性”。進行此類調整的方法為本領域的技術人員所熟知。通常這涉及給一個保守取代評分為部分而不是完全錯配,因此提高序列同一性百分比。如此,例如,當完全相同的氨基酸評分為1,而非保守的取代評分為O時,給予保守的取代介于O和1之間的評分。保守取代評分的計算,例如,如程序PC/GENEantelligenetics,Mountain View, California)中所執行的。(d)如本文所用,“序列同一性百分比”是指通過在比較窗口中比較兩個最優化比對的序列而測定的值,其中比較窗口中的多核苷酸序列的部分與參考序列(參考序列不包括插入或刪除)相比可包括插入或刪除(即間隙)以達到兩序列的最佳比對效果。所述百分比的計算方法是,統計相同的核酸堿基或氨基酸殘基在兩段序列中同時出現的位點的數量以得到匹配位點數,將此匹配位點數除以比對窗口中的總位點數,再將結果乘以100,從而得到序列同一性百分比。術語“多核苷酸”的使用并無將實施方案限制于包括DNA在內的多核苷酸之意。本領域的一般技術人員將認識到,多核苷酸可包括核糖核苷酸以及核糖核苷酸和脫氧核糖核苷酸的組合。此類脫氧核糖核苷酸和核糖核苷酸包括天然存在的分子和合成類似物。本發明實施方案的多核苷酸還包括所有形式的序列,所述形式包括且不限于單鏈形式、雙鏈形
式等等。可將本發明實施方案的分離的多核苷酸結合到能夠導入并在宿主細胞中復制的重組DNA構建體中。“載體”可以是這樣的一類構建體,其包括一套復制體系和能夠在給定的宿主細胞中轉錄和翻譯多肽編碼序列的序列。適用于穩定轉染植物細胞或構建轉基因植物的許多載體,已描述于,例如,Pouwels 等人,Cloning Vectors :A Laboratory Manual, 1985, supp. 1987 ;Weissbach 和 Weissbach, Methods for Plant Molecular Biology, Academic Press,1989 ;以及 Flevin 等人’ Plant Molecular Biology Manual, Kluwer Academic Publishers,1990中。通常,植物表達載體包括,例如,一個或多個處于5‘和3' 調控序列控制下的克隆的植物基因和顯性的選擇性標記。這樣的植物表達載體還可含有啟動子調控區(例如控制著誘導型或組成型、環境或發育調控的、或細胞或組織特異性表達的調控區)、轉錄起始開始位點、核糖體結合位點、RNA加工信號、轉錄終止位點和/或聚腺苷酸化信號。
術語“重組構建體”、“表達盒”、“表達構建體”、“嵌合構建體”、“構建體”、“重組DNA 構建體”、和“重組DNA片段”在本文中可互換使用,并且均為核酸片段。重組構建體包括人造的核酸片段組合,包括且不限于天然條件下不一起存在的調控序列和編碼序列。例如,重組DNA構建體可包括源于不同來源的調控序列和編碼序列,或者包括源于同一來源并以不同于天然存在的方式排列的調控序列和編碼序列。此類構建體可獨自使用或與載體組合使用。如果使用載體,則載體的選擇取決于用以轉化宿主細胞的方法,該宿主細胞是本領域的技術人員所熟知的。例如可以使用質粒載體。技術人員熟知為了成功地轉化、篩選和繁殖包括本發明實施方案的任何分離的核酸片段的宿主細胞,必須存在于載體上的遺傳因子。為獲得表現出所期望表達水平和模式的多核苷酸或Rcgl基因座的品系而進行的篩選,可通過擴增、DNA的DNA分析、mRNA表達的RNA分析、蛋白質表達的免疫印跡分析、表型分析等等完成。術語“重組DNA構建體”是指從獲得自不同來源的核酸片段組裝而成的DNA構建體。所述核酸片段的類型和來源可以是大為不同的。在一些實施方案中,進一步提供了表達盒,所述表達盒包含可操作地連接至所述實施方案的異源核苷酸序列的啟動子。所述實施方案的表達盒用于產生轉化的植株、植物細胞和微生物,以及用于本文所公開的引起植物病原真菌抗性的方法的實施。所述表達盒將包括可操作地連接至所述實施方案的多核苷酸的5'和3'調控序列。“可操作地連接” 旨在表示兩種或更多種元件之間的功能性連接。“調控序列”是指位于編碼序列的上游(5’ 非編碼序列)、內部或下游(3’非編碼序列),并且可影響所關聯的編碼序列的轉錄、RNA加工、穩定性或翻譯的核苷酸。調控序列可包括且不限于啟動子、翻譯前導序列、內含子和多腺苷酸化識別序列。例如,受關注的多核苷酸和調控序列(例如一個啟動子)之間的可操作的連接,為允許該受關注的多核苷酸的表達的功能性連接。可操作地連接的元件可以是連續的或不連續的。當用于指兩個蛋白質編碼區的連接時,“可操作地連接”意指所述編碼區處于同一閱讀框。所述盒可附加地包含至少一個將被轉化到生物體中的附加基因。作為另外一種選擇,能通過多個表達盒提供附加基因。這樣的表達框具有多個限制性位點和/ 或重組位點,用以將編碼抗病原體的多肽的多核苷酸插入至使其處于所述調控區的轉錄調控之下的位置。所述表達盒可附加地包含選擇性標記基因。所述表達框將在5' -3'的轉錄方向上包括一個轉錄起始區(即,一個啟動子)、 翻譯起始區、所述實施方案的多核苷酸、一個翻譯終止區以及任選地,一個在宿主生物中有功能的轉錄終止區。所述調控區(即,啟動子、轉錄調控區和翻譯終止區)和/或所述實施方案的多核苷酸對宿主細胞而言或者對彼此而言可以是天然的/類似的。作為另外一種選擇,所述調控區和/或所述實施方案的多核苷酸對宿主細胞而言或者對彼此而言可以是異源的。本文在序列方面所用的“異源”是指,源自外來物種的序列,或者,如果源自相同物種,則為通過蓄意的人為干預而從其天然形式在組成和/或基因組基因座方面受到充分修飾的序列。例如,可操作地連接至異源多核苷酸的一個啟動子所來自的物種,不同于所述多核苷酸所來源自的物種,或者,如果二者來自相同的/類似的物種,則二者之一或二者均為從其原始形式和/或基因組基因座經過充分修飾的,或者所述啟動子并非針對可操作地連接的多核苷酸的天然啟動子。任選地包括的終止區就轉錄起始區而言可以是天然的、就受關注的可操作地連接的多核苷酸而言可以是天然的、就植物宿主而言可以是天然的,或者就啟動子、受關注的所述多核苷酸、宿主或者它們的任意組合而言,可以是源自其他來源的(即,外來的或異源的)。方便的終止區得自根癌農桿菌(A. tumefaciens)的Ti-質粒,例如章魚堿合酶和胭脂堿合酶的終止區。也參見Guerineau等人(1991)Mol. Gen. Genet. 262 :141-144 ; Proudfoot (1991) Cell 64 :671-674 ;Sanfacon 等人(1991)Genes Dev. 5 :141-149 ;Mogen 等人(1990)Plant Cell 2 :1261-1272 ;Munroe 等人(1990)Gene 91 :151-158 ;Ballas 等人 (198 Nucleic Acids Res. 17 :7891-7903 ;禾口 Joshi 等人(1987)Nucleic Acids Res. 15 9627-9639。在特定實施方案中,使用馬鈴薯蛋白酶抑制劑II基因(PinII)。參見例如Keil 等人(1986)Nucl. Acids Res. 14:5641-5650 ;和 An 等人(1989)Plant Cell 1 :115-122, ± 述參考文獻全文以引用方式并入本文。有多種啟動子可用于本發明實施方案的實施中,包括所關注的多核苷酸序列的天然啟動子。能基于所需結果選擇啟動子。Potenza等人最近的綜述0004) Vitro Cell Dev Biol-Plant 40 :1_22中討論了范圍廣泛的植物啟動子,該參考文獻以引用方式并入本文。例如,核酸可與組成型的、組織優選的、病原體誘導的或者其他的啟動子相結合以在植物中表達。此類組成型啟動子包括,例如,Rsyn7啟動子和在WO 99/43838和美國專利6,072,050中公開的其他組成型啟動子的核心啟動子;CaMV 35S核心啟動子 (Odell 等人,(1985)Nature 313 :810-812);稻肌動蛋白啟動子(McElroy 等人(1990)Plant Cell2 :163-171);泛素啟動子(Christensen 等人(1989)Plant Mol. Biol. 12 :619-632 和 Christensen 等人(1992)Plant Mol. Biol.,18 :675-689) ;pEMU(Last 等人(1991)Theor. Appl. Genet. 81 :581-588) ;MAS(Velten等人(1984)EMBO J. 3 :2723-2730) ;ALS啟動子(美國專利5,659,026)等。其他組成型啟動子包括例如美國專利公開5,608,149 ;5, 608,144 ; 5,604,121 ;5,569,597 ;5,466,785 ;5,399,680 ;5,268,463 ;5,608,142 ;和 6,177,611。由誘導型啟動子,特別是由病原體誘導型啟動子表達基因有時可以是有益的。這樣的啟動子包括源自發病機理相關蛋白O3R蛋白)的那些,其是在被病原體感染后誘導的, 所述蛋白是例如,I3R蛋白質、SAR蛋白質、β-1,3-葡聚糖酶、殼多糖酶等。參見例如Redolfi 等人(1983)Neth. J. Plant Pathol. 89 :245-254 ;Uknes等人(1992)Plant Cell4 :645-656 ; 和 Van Loon (1985) Plant Mol. Virol. 4 :111_116。另參見 TO 99/43819,該專利以引用方式并入本文。受關注的是在病原體感染處或在其附近導致蛋白質局部表達的啟動子。參見例如 Marineau 等人(1987)Plant Mol. Biol. 9 :335-342 ;Matton 等人(1989)Molecular Plant-Microbe Interactions 2 :325-331 ;Somsisch 等人(1986)Proc. Natl. Acad. Sci. USA 83 :2427-2430 ;Somsisch 等人(1988)Mol. Gen. Genet. 2 :93-98 ;以及 Yang(1996) Proc. Natl. Acad. Sci. USA 93 :14972-14977。另參見,Chen 等人(1996)Plant J. 10 955-966 ;Zhang 等人(1994)Proc. Natl. Acad. ki. USA91 :2507-2511 ;Warner 等人 (1993)Plant J. 3 :191-201 ;Siebertz 等人(1989)Plant Cell 1 :961-968 ;美國專利 5,750,386(線蟲-誘導型);以及其中所引用的參考文獻。特別關注的是針對玉米PRms基因的誘導型啟動子,其表達是由病原體串珠鐮孢菌(Risarium moniliforme)誘導的(參見例如 Cordero 等人(1992) Physiol. Plant Path. 41 :189-200)。此外,在病原體發現經由傷口或昆蟲損害而進入植物的入口時,傷口誘導型啟動子可用于本發明實施方案的構建。這樣的傷口誘導型啟動子包括馬鈴薯蛋白酶抑制劑 (pin II)基因(Ryan(1990)Ann. Rev. Phytopath. 28 :425-449 ;Duan 等人(1996)Nature Biotechnologyl4 :494-498) ;wunl 和 wun2,美國專利 5,428,148 ;winl 和 win2 (Manford 等人(1989)Mol. Gen. Genet. 215 :200-208);系統素(systemin) (McGurl 等人(1992) Science 225 :1570-1573) ;WIPl (Rohmeier 等人(1993)Plant Mol. Biol. 22 :783-792 ;Eckelkamp 等人(1993) FEBS Letters323 :73-76) ;MPI 基因(Corderok 等人(1994) Plant J. 6 (2) 141-150);等等,其引入本文以供參考。化學調節的啟動子可用于通過施用外來化學調節劑來調節基因在植物中的表達。 根據這一目標,啟動子可以是化學誘導型啟動子,其中施用化學物質來誘導基因表達,或化學抑制型啟動子,其中施用化學物質來抑制基因表達。化學誘導型啟動子是本領域已知的, 并且包括且不限于玉米In2-2啟動子,其是通過苯磺酰胺除草劑安全劑來激活的,玉米GST 啟動子,其是通過用作芽前除草劑的疏水親電性化合物而激活的,以及煙草PR-Ia啟動子, 其是通過水楊酸激活的。所關注的其他化學調節的啟動子包括留類化合物反應性啟動子 (參見例如糖皮質激素誘導型啟動子,Schena等人(1991) Proc. Natl. Acad. Sci. USA 88 10421-10425 和 McNellis 等人(1998)Plant J. 14(2) :247-257)以及四環素誘導型和四環素抑制型啟動子(參見例如Gatz等人(1991)Mol. Gen. Genet. 227 =229-237和美國專利 5,814,618和5,789,156),上述文獻以引用方式并入本文。組織優先的啟動子可用于將本發明實施方案的多核苷酸增強的表達定位于特定植物組織內。例如,組織優先的啟動子可被用于在一種植物組織中表達一種多肽,其中在所述組織處疾病抗性尤其重要,所述組織例如根、莖或葉。組織優先的啟動子包括Yamamoto 等人(1997)Plant J. 12(2) :255-265 ;Kawamata 等人(1997)Plant Cell Physiol. 38(7) 792-803 ;Hansen 等人(1997)Mol. Gen Genet. 254(3) :337-343 ;Russell 等人(1997) Transgenic Res. 6(2) 157-168 ;Rinehart φ 人(1996)Plant Physiol. 112(3) 1331-1341 ;Van Camp 等人(1996)Plant Physiol. 112 (2) :525-535 ;Canevascini 等人(1996)Plant Physiol. 112(2) :513-524 ;Yamamoto ψ 人(1994)Plant Cell Physiol. 35(5) :773-778 ;Lam(1994)Results Prob1. Cell Differ. 20 :181-196 ;Orozco 等人(1993)Plant MolBiol. 23(6) :11四_1138 ;Matsuoka 等人(1993)Proc Natl. Acad. Sci. USA90 (20) :9586-9590 ;以及 Guevara-Garcia 等人(1993)Plant J. 4(3) :495_505。如果必要,此類啟動子可被修飾以進行弱表達。維管組織優先的啟動子是本領域已知的并且包括那些選擇性地在例如木質部和韌皮部的組織中驅動蛋白質表達的啟動子。維管組織優先的啟動子包括且不限于,黑櫻桃 (Prunus serotina)野黑櫻苷水解酶基因啟動子(參見例如國際公布WO 03/006651),以及見于美國專利申請10/109,488中的那些啟動子。莖優先的啟動子可用于驅動本發明實施方案的多肽的表達。示例性的莖優先的啟動子包括玉米MS8-15基因啟動子(參見例如美國專利5,986,174和國際公布WO 98/00533),以及見于 Graham 等人(1997)Plant Mol Biol 33(4) :7四_735 中的那些啟動子。葉優先的啟動子是本領域已知的。參見例如Yamamoto等人(1997) Plant J. 12(2) :255-265 ;Kwon 等人(1994)Plant Physiol. 105 :357-67 ;Yamamoto 等人(1994)Plant Cell Physiol. 35(5) :773-778 ;Gotor 等人(1993)Plant J. 3 :509-18 ;Orozco 等人 (1993)Plant Mol0Biol. 23(6) :1129-1138 ;和Matsuoka等人(1993)Proc. Natl. Acad. Sci. USA 90(20) :9586-9590。根優先的啟動子是已知的,并且可以選自文獻中記載的很多啟動子或者從不同相容物種中重新分離的啟動子。參見例如Hire等人(1992) Plant Mol. Biol. 20 (2) 207-218(大豆根特異性谷氨酰胺合酶基因);Keller和Baumgartner(1991)Plant Cell 3(10) :1051-1061(法國菜豆的GRP 1. 8基因的根特異性控制元件);Sanger等人(1990) PlantMol. Biol. 14(3) :433-443 (根癌農桿菌(Agrobacterium tumefaciens)的甘露氨酸合酶(MAQ基因的根特異性啟動子);和Miao等人(1991)Plant Cell 3(1) :11-22(編碼胞質谷氨酰胺合酶(GQ的全長cDNA克隆,其在大豆的根和根瘤中表達)。還參見Bogusz等人 (1990) Plant Cell2(7) :633_641,其中描述了兩種根特異性啟動子,它們是從來自固氮非豆科的Parasponia andersonii以及相關的非固氮非豆科的山黃麻(Trema tomentosa)的血紅蛋白基因分離的。將這些基因的啟動子與葡糖醛酸酶報道基因連接,并且導入非豆科的煙草(Nicotiana tabacum)和豆科的百脈根(Lotus corniculatus)內,在這兩種情況下,都保持了根特異性啟動子活性。Leach和^Voyagi (1991)描述了他們對于發根農桿菌 (Agrobacterium rhizogenes)的高度表達的rolC和rolD根誘導基因的啟動子的分析(參見Plant Science (Limerick) 79(1) :69-76)。他們推斷,增強子和組織特異性DNA決定子在這些啟動子中解離。Teeri等人(1989)使用與IacZ的基因融合以表明編碼章魚堿合酶的農桿菌屬(Agrobacterium)菌T-DNA基因在根尖的表皮中具有特別活性,以及TR2'基因在完整植物中是根特異性的,并且受葉組織中的傷害的刺激,這是用來與殺蟲或殺幼蟲基因一起使用的特別期望的特征組合(參見EMBO J.8(2) :343-350) 0與nptll (新霉素磷酸轉移酶II)融合的TRl'基因表現出類似特征。另外的根優先的啟動子包括VfEN0D-GRP3基因啟動子(Kuster 等人(1995)Plant Mol. Biol. 29(4) :759-772);和 rolB 啟動子(Capana 等人(1994)Plant Mol. Biol. 25(4) :681_691。另參見美國專利 5,837,876 ;5,750,386 ; 5,633,363 ;5,459,252 ;5,401,836 ;5,110,732 ;和 5,023,179。“種子優先的”啟動子包括“種子特異性的”啟動子(那些在種子發芽期間有活性的啟動子,如種子貯藏蛋白啟動子)以及“種子發芽”啟動子(那些在種子發芽期間有活性的啟動子)。參見^Thompson等人(1989) BioEssays 10 108,該參考文獻以引用方式并入本文。 此類種子優先的啟動子包括且不限于Ciml (細胞分裂素誘導的信使);CZ19B1 (玉米19kDa 蛋白);miIps (肌醇-1-磷酸合酶)(參見W000/11177和美國專利公開6,225,529 ;以引用方式并入本文)。Y-玉米醇溶蛋白基因啟動子(Gamma-zein)為優選的胚乳特異性啟動子。 Glob-I為優選的胚芽特異性啟動子。就雙子葉植物而言,種子特異性的啟動子包括且不限于菜豆β-菜豆蛋白、napin、β-伴球蛋白、大豆凝集素、十字花科蛋白(cruciferin)等的啟動子。就雙子葉植物而言,種子特異性的啟動子包括且不限于玉米15kDa玉米醇溶蛋白、 22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、g_玉米醇溶蛋白、糯質基因(waxy)、超甜基因 1 (shrunken 1)、超甜基因2 (shrunken 2)、球蛋白1等的啟動子。另參見WO 00/12733,其中公開了來自endl和end2基因的種子優選的啟動子;該參考文獻以引用方式并入本文。在細胞宿主中促進基因表達的附加序列的修改形式是已知的。這些序列包括消除編碼偽聚腺苷酸化信號的序列、外顯子-內含子接合位點信號的序列、轉座子樣重復序列、和其他此類對基因表達不利的特征明顯的序列。就一個給定的細胞宿主而言,可以將所述序列的G-C含量調節至平均水平,所述平均水平通過參考宿主細胞中表達的已知基因進行計算。當可能的時候,修飾所述序列以避免經推測可能發生的mRNA發夾二級結構。表達盒可附加地包含5'前導序列。此類前導序列能夠促進翻譯。翻譯前導序列是本領域已知的,包括小核糖核酸病毒前導序列,例如EMCV前導序列(腦心肌炎5' 非編碼區)(Elroy-Mein 等人(1989)Proc. Natl. Acad. ki. USA 86:6126-6130);馬鈴薯 Y病毒(potyvirus)前導序列,例如TEV前導序列(煙草蝕刻病毒)(fellie等人(1995) Gene 165(2) :233-238),MDMV前導序列(玉米矮小花葉病毒),和人免疫球蛋白重鏈結合蛋白(BiP) (Maceiak等人(1991)Nature353 :90-94);非翻譯前導序列,來自苜蓿花葉病毒的外殼蛋白 mRNA(AMV RNA 4)(Jobling 等人(1987)Nature 325 :622-625);煙草花葉病毒前導序列(TMV) (Gallie 等人(1989) in Molecular Biology of RNA, ed. Cech (Liss, New York), pp. 237-256);和玉米枯黃斑點病毒前導序列(MCMV) (Lommel等人(1991) Virology 81:382-385)。另參見,Della-Cioppa 等人(1987)Plant Physiol. 84 :965_968。也可使用增強翻譯的其他已知方法,例如內含子等。在制備表達盒的過程中,可操作多個DNA片段以在正確方向上,以及,如果適當的話,在正確閱讀框中提供DNA序列。為了這一目的,可使用銜接子或連接子以接合DNA片段,或者使用其他操作方法提供方便的限制性位點以移除冗余DNA、移除限制性位點等。為了這一目的,可使用體外誘變、引物修復、限制性酶切、退火、再取代,例如轉換和顛換。表達盒也可包含選擇性標記基因,用于選擇轉化過的細胞。利用選擇性標記基因以選擇轉化過的細胞或組織。標記基因包括編碼抗生素抗性的基因,例如那些編碼新霉素磷酸轉移酶II(NEO)和潮霉素磷酸轉移酶(HPT)的基因,以及賦予除草化合物抗性的基因,除草化合物如草胺磷銨、溴苯腈、咪唑啉酮類、和2,4_ 二氯苯氧乙酸Q,4-D)。附加的選擇性標記包括表型標記例如β-半乳糖苷酶,和熒光蛋白例如綠色熒光蛋白(GFP) (Su 等人 U004)Biotechnol Bioeng 85 :610-9 和 Fetter 等人 Q004)Plant Cell 16: 215-28)、青色熒光蛋白(CYP) (Bolte 等人 Q004)J. Cell Science 117 :943-54 和 Kato 等人 Q002)Plant PhysiolU9 :913-42)、和黃色熒光蛋白(來自 Evrogen 的 PhiYFP , 參見Bolte等人Q004) J. Cell Science 117:943-54)。關于附加的選擇性標記,一般參見 Yarranton(1992)Curr. Opin. Biotech. 3 :506-511 ;Christopherson 等人(1992)Proc. Natl. Acad. Sci. USA 89 :6314-6318 ;Yao 等人(1992)Cell 71 :63-72 ;Reznikoff (1992) Mol. Microbiol. 6 :2419-2422 ;Barkley 等人(1980)in The Operon, pp. 177-220 ;Hu 等人(1987)Cell48 :555-566 ;Brown 等人(1987)Cell 49 :603-612 ;Figge 等人(1988) Cell52 :713-722 ;Deuschle 等人(1989)Proe. Natl. Acad. Aci. USA86 :5400-5404 ;Fuerst 等人(1989)Proc. Natl. Acad. ki.USA86 :2549-2553 ;Deuschle 等人(1990)kience 248 :480-483 ;Gossen(1993)博士 論文,University of Heidelberg ;Reines 等人 (1993)Proc. Natl. Acad. Sci. USA 90 :1917-1921 ;Labow 等人(1990)Mol. Cell. Biol. 10 3343-3356 ;Zambretti 等人(1992)Proc. Natl. Acad. Sci. USA89 :3952-3956 ;Baim 等人(1991)Proc. Natl. Acad. ki.USA88 :5072-5076 ;Wyborski 等人(1991) Nucleic Acids Res. 19 :4647-4653 ;Hillenand-ffissman(1989)Topics Mol. Struc. Biol. 10 :143-162 ; Degenkolb 等人(1991)Antimicrob. Agents Chemother. 35 :1591-1595 ;Kleinschnidt等人(1988)Biochemistry 27 :1094-1104 ;Bonin(1993)博士 論文,University of Heidelberg ;Gossen ^ 人(1992)Proc. Natl. Acad. Sci. USA 89 :5547-5551 ;01iva 等人 (1992)Antimicrob. Agents Chemother. 36 :913-919 ;Hlavka φ 人(1985)Handbook of Experimental Pharmacology, Vol. 78(Springer-Verlag, Berlin) ;Gill 等人(1988) Nature334 :721_7M。此類公開內容以引用方式并入本文。上文的選擇性標記基因列表并不意味著受限制。本發明實施方案中可使用任何選擇性標記基因。在某些實施方案中,該實施方案的核酸序列可以與受關注的多核苷酸序列的任何組合堆疊以產生具有所需表型的植物。堆疊可通過在DNA構建體內的基因組合,或者通過將Rcgl與包含所述組合的其他品系雜交而實現。例如,所述實施方案的多核苷酸可以與該實施方案的任何其它多核苷酸或其它基因進行堆疊。生成的組合也可包括受關注的多核苷酸的多個拷貝中的任何一個。所述實施方案的多核苷酸也可與任何其它基因或基因組合發生堆疊以產生具有多種所期望的性狀組合的植物,包括且不限于動物飼料所需的特性,如高油基因(例如美國專利6,232,529);平衡的氨基酸(例如hordothionins (美國專利 5,990,389 ;5,885,801 ;5,885,802 ;和 5,703,409);大麥高賴氨酸(Williamson 等人, (1987),Eur. J. Biochem. 165 :99-106 ;和 W098/20122);和高甲硫氨酸蛋白(Pedersen 等人,(1986) ,J. Biol. Chem. 261 :6279 ;Kirihara 等人(1988) Gene 71 :359 ;和 Musumura 等人 (1989)Plant Mol. Biol. 12 123));改進的可消化性(例如,修飾的貯藏蛋白質(美國專利申請10/053,410,提交于2001年11月7日);和硫氧還蛋白(美國專利申請10/005,似9, 提交于2001年12月3日)),上述公開以引用方式并入本文。所述實施方案的多核苷酸也可與關于昆蟲、疾病或除草劑抗性的期望性狀(例如,蘇云金芽孢桿菌(Bacillus thuringiensis)毒性蛋白(美國專利 5,366,892 ;5,747,450 ;5,737,514 ;5723,756 ; 5, 593, 881 ;Geiser 等人(1986) Gene 48 :109);凝集素(Van Damme 等人(1994) Plant Mol. Biol. 24 825);伏馬毒素解毒基因(美國專利5,792,931);無毒性和抗病基因(Jones等人(1994)Science266 :789 ;Martin 等人(1993) Science 262 :1432 ;Mindrinos 等人(1994) Cell 78 1089);導致除草劑抗性的乙酰乳酸合酶(ALS)突變體,如S4和/或Hra突變體; 谷氨酰胺合酶抑制劑,如草胺膦或basta(例如bar基因);和草甘膦抗性(EPSPS基因、 GAT基因如那些公開于美國專利申請公布US2004/0082770、W002/36782和W003/092360中的基因));和產品的加工或處理所期望的性狀,例如高油(例如,美國專利6,232,529); 改性油脂(例如,脂肪酸去飽和酶基因(美國專利5,952,M4;W0 94/11516));改性淀粉 (例如ADPG焦磷酸化酶(AGPase)、淀粉合酶(SS)、淀粉支鏈化酶(SBE)和淀粉去支鏈化酶 (SDBE));以及聚合物或生物塑料(例如美國專利5. 602,321 ;有利于表達聚羥基脂肪酸酯 (PHA)的β-酮硫解酶、聚羥基丁酯合酶、和乙酰乙酰-CoA還原酶(khubert等人(1988) J. Bacteriol. 170 :5837-5847))相堆疊,上述公開以引用方式并入本文。也可以將所述實施方案的多核苷酸與提供農學性狀的多核苷酸組合,所述農學性狀例如雄性不育(例如, 參見美國專利5. 583,210)、秸稈強度、開花時間、或轉化技術性狀如細胞周期調節或基因打靶(例如W099/61619 ;WO 00/17364 ;WO 99/25821),上述公開以引用方式并入本文。可通過任何方法產生這些堆疊的組合,包括且不限于通過任何常規方法或 TopCross 方法的雜交育種植物,或者基因轉化。如果所述特性通過遺傳轉化植物堆疊,則受關注的多核苷酸序列可在任何時間以任何順序進行組合。例如,可將包括一種或多種所需特性的轉基因植物用作靶,通過后續的轉化導入更多特性。可以用共轉化規程將特性與受關注的多核苷酸同時導入,所述多核苷酸由轉化盒的任何組合提供。例如,加入將導入兩個序列,可將兩個序列包含在分離的轉化盒中(反式)或包含在相同轉化盒中(順式)。可通過相同啟動子或不同啟動子促進序列表達。在某些實例中,可能期望導入將抑制受關注的多核苷酸表達的轉化盒。這可以與其它抑制盒或超表達盒的任何組合組合使用以在植物中生成所需特性組合。本發明實施方案的方法可涉及且不限于將多肽或多核苷酸導入植物。“導入”旨在表示使所述多核苷酸出現在所述植物中。在一些實施方案中,多核苷酸將以使所述序列能夠進入植物的細胞內部的方式存在,包括其向植物基因組可能的插入。所述實施方案的方法不依賴于將序列導入植物的特定方法,只要使多核苷酸進入植物的至少一個細胞的內部即可。用于將多核苷酸導入植物的方法是本領域已知的,包括且不限于穩定轉化方法、瞬時轉化方法和病毒介導的方法。“轉化”是指將核酸片段轉入宿主生物的基因組中,導致基因穩定遺傳。包含轉入的核酸片段的宿主生物稱為“轉基因”生物。“宿主細胞”指重組DNA構建體轉化至其中的細胞,可包括酵母細胞、細菌細胞和植物細胞。植物轉化方法的實例包括農桿菌介導的轉化(De Blaere等人,1987,Meth. Enzymol. 143 :277)和微粒加速的或者“基因槍”轉化技術 (Klein 等人,1987,Nature (London) 327 :70-73 ;美國專利 4,945,050),等等。“穩定轉化”旨在表示轉入植物的核苷酸構建體整合進了該植物的基因組,并且能夠遺傳給其子代。“瞬時轉化”或“瞬時表達”旨在表示多核苷酸被轉入植物并且沒有整合進該植物的基因組,或者多肽被轉入植物。轉化規程以及用于將多肽或多核苷酸序列導入植物內的規程可以根據被作為轉化目標的植物或植物細胞的類型,例如單子葉植物或雙子葉植物而改變。將多肽和多核苷酸導入植物細胞的適當方法包括顯微注射(Crossway等人(1986)Biotechniques 4:320-334)、電穿孑L (Riggs 等人(1986) Proc. Natl. Acad. Sci. USA 83:5602-5606)、 農桿菌介導的轉化(美國專利5,563,055和5,981,840)、直接基因轉移(I^aszkowski 等人(1984)EMBO J. 3 :2717-2722)、以及彈道微粒加速(參見,例如Sanford等人., 美國專利 4,945,050 ;5,879,918 ;5,886,244 ;和 5,932,782 ;Tomes 等人(1995) in Plant Cell, Tissue, and Organ Culture !Fundamental Methods, ed. Gamborg 禾口 Phillips (Springer-Verlag, Berlin) ;McCabe 等人(1988) Biotechnology 6 :923-926);和 Lecltransformation (WO 00/28058)。另參見 Weissinger 等人(1988) Ann. Rev. Genet. 22 421-477 ;Sanford ^A (1987) Particulate Science and Technology 5 :27-37( #, ); Christou 等人(1988)Plant Physiol. 87 :671-674(大豆);McCabe 等人(1988)Bio/ Technology 6 :923-926 (大豆);Finer 和 McMullen (1991) In Vitro Cell Dev. Biol. 27P 175-182(大豆);Singh 等人(1998)Theor. Appl. Genet. 96 :319-324(大豆);Datta 等人 (1990) Biotechnology 8 :736-740 (水稻);Klein 等人(1988) Proc. Natl. Acad. Sci. USA 85 :4305-4309(玉米);Klein 等人(1988) Biotechnology6 :559-563 (玉米);美國專利 5,240,855 ;5,322,783 和 5,324,646 ;Klein 等人(1988)Plant Physiol. 91 :440-444(玉米);Fromm 等人(1990)Biotechnology 8 :833-839(玉米);Hooykaas-Van Slogteren等人(1984) Nature (London) 311 :763-764 ;美國專利 5,736,369 (谷類);Bytebier 等人 (1987) Proc. Natl. Acad. Sci. USA 84 :5345-5349 (百合科);De Wet 等人(1985) in The Experimental Manipulation of Ovule Tissues, ed. Chapman 等人(Longman, New York), pp. 197-209(花粉);Ka印pier 等人(1990)Plant Cell Reports 9 :415-418 和 Ka印pier 等人(1992) Theor. Appl. Genet. 84 :560-566 (頸須介導的轉化);D' Halluin 等人(1992) Plant Cell4 :1495-1505(電穿孔);Li 等人(1993)Plant Cell Reports 12 :250-255 和 Christou和R)rd(1995)Annals of Botany 75 :407-413 (水稻);Osjoda等人(1996)Nature Biotechnology 14 :745-750 (玉米,通過根癌農桿菌);所有這些文獻以引用方式并入本文。用于在植物基因組的特定位置定向插入多核苷酸的方法是本領域中已知的。在一個實施方案中,多核苷酸在所期望的基因組位置的插入利用位點特異性重組系統實現。參見例如 W099/25821、W099/25854, W099/25840、W099/25855、和 W099/25853,它們均以引用方式并入本文。簡而言之,所述實施方案的多核苷酸被包含在轉移盒中,兩翼與兩個不同的重組位點相連。所述轉移盒被導入植物中,所述植物的基因組中已穩定地整合了兩翼與兩個不同的重組位點相連的靶位點,所述重組位點對應于所述轉移盒中的位點。提供了適當的重組酶,并且所述轉移盒被整合至所述靶位點。受關注的多核苷酸從而被整合至所述植物基因組的特定染色體位置。已經被轉化的細胞可根據常規方法生長為植株。參見例如McCormick等人(1986) Plant Cell Reports 5 :81_84。然后可以使這些植株生長,并用相同的轉化品系或者不同的品系對其授粉,并且鑒定所期望的表型特征具有組成型表達的子代。可以生長兩代或多代以保證所希望的表型特征的表達穩定地保持和遺傳,然后收獲種子以保證所希望的表型特征的表達已經實現。以這種方式,所述實施方案提供了轉化的種子(也稱為“轉基因種子”),所述轉化的種子具有穩定地整合至其基因組中的所述實施方案的核苷酸構建體,例如所述實施方案的表達盒。如本文所用,術語“植物”可以是整個植株、其任意的部分、或者來源于植物的細胞或組織培養物。因此,術語“植物”可指代以下任何一種材料整個植株、植物的部分或器官 (包括但不限于胚芽、花粉、胚珠、種子、葉片、花、枝、果實、果仁、穗、穗軸、殼、莖、根、根尖、 花粉囊,等等)、植物組織、植物細胞、植物原生質體、可從其再生出玉米植株的植物細胞組織培養物、植物愈傷組織、植物叢和植物種子。植物細胞是植物的細胞,其或者直接取自種子或植株,或者源自取自植物的細胞的培養物。谷物旨在表示商業化種植者出于栽培或繁殖物種之外的目的生產的成熟種子。再生植物的子代、變體和突變體也包括在本發明實施方案的范圍內,前提條件是這些部分包含導入的多核苷酸。本發明的實施方案可被用于賦予或增強植物病原真菌抗性,或者使植物免受病原真菌攻擊傷害,所述植物尤其是玉米(Zea mays)。其將保護植物的不同部分免受病原體攻擊傷害,所述部分包括且不限于莖、穗、葉片、根和雄穗。在本發明實施方案的實施中,其他植物物種也可以是受關注的,所述植物物種包括且不限于,術語“表型”或“表型性狀”或“性狀”指生物的一個或多個性狀。表型可用肉眼或者本領域已知的任何其他評估手段觀察到,例如顯微鏡法、生物化學分析、或電裝置檢測分析法。在某些情況下,表型由單個基因或基因座直接控制,即“單基因性狀”。在其他情況下,表型是若干個基因的結果。基因組的“物理圖譜”是顯示染色體DNA上可辨認的界標(包括基因、標記等)的線性順序的圖譜。然而與基因圖譜相比,界標間的距離是絕對的(例如以堿基對測量的或分離的和重疊的鄰接基因片段)并且不基于基因重組。在玉米中,已經將許多BAC或細菌人工染色體裝配成重疊群(重疊的鄰接基因片段,或“鄰接DNA” ),它們每個包含玉米基因組DNA的較大插入序列。BAC可基于序列比對裝配至重疊群,如果該BAC經過測序,或者經由它的BAC指紋與重疊群中其他BAC指紋的比對裝配至重疊群。公眾可利用玉米基因組瀏覽器(Maize GenomeBrowser)進行裝配,所述玉米基因組瀏覽器可從互聯網上公開獲得。“植物”可為整個植株、其任何部分、或來源于植物的細胞或組織培養物。因此,術語“植物”可指代以下任何一種材料整個植株、植物部分或器官(例如葉片、莖、根等)、植物組織、種子、植物細胞、和/或子代的相同材料。植物細胞是從植物中獲取的細胞或來源于從植物中所獲取細胞經培養出的細胞。因此,術語“玉米植物”包括整個玉米植株、玉米植物細胞、玉米植物原生質體、可從其中再生玉米植株的玉米植物細胞或玉米組織培養物、 玉米植物愈傷組織、和玉米植物中的完整玉米植物細胞或玉米植物部分,如玉米種子、玉米芯、玉米花、玉米子葉、玉米葉、玉米莖、玉米芽、玉米根、玉米根尖等。術語“數量性狀基因座”或“QTL”指在至少一種遺傳背景下(例如在至少一個育種種群中),具有與表型性狀的差異表達關聯的DNA區域。QTL與基因或引起所討論的性狀的基因緊密連鎖。在詳述本發明之前,應當了解本發明不受特定實施方案的限制。也應當了解本文所用的術語僅是為了描述特定實施方案,而不旨在進行限制。當在本文和所附權利要求中使用時,除非內容清楚地表明,單數和單數形式的術語包括復數指代。因此,例如術語“一個植物”也包括多個植物;取決于上下文,使用的術語“植物”也可包括該植物遺傳相似或相同的子代;使用的術語“核酸”任選地包括該核酸分子的多個拷貝;提供了通過對相關的標記基因座進行基因分型鑒定具有提高的絲黑穗病抗性的玉米植物的方法。鑒于絲黑穗病感染使產量降低,玉米中的絲黑穗病抗性是農學上重要的性狀。在相當一段時間內已經認識到,對生物基因組中與特定定量表型如絲黑穗病抗性相關聯的特定染色體基因座(或區間)可進行基因作圖。此類基因座稱為數量性狀基因座或QTL。有利的是,植物育種人員可使用分子標記通過鑒定標記等位基因鑒定期望的個體, 所述標記等位基因顯示與期望表型共分離的統計意義上顯著的概率,表現為連鎖不平衡。 通過鑒定與定量性狀共分離的分子標記或分子標記簇,育種人員因此鑒定QTL。通過鑒定并選擇與期望表型相關聯的標記等位基因(或來自多個標記的期望等位基因),植物育種人員能夠通過選擇合適的分子標記等位基因迅速選擇期望的表型(一種稱為標記輔助選擇或MAS的方法)。本領域熟知的多種方法可用于檢測與數量性狀如絲黑穗病抗性共分離的分子標記或分子標記簇。所有這些方法背后的基本原理是檢測具有顯著不同平均表型的供選擇的基因型(或等位基因)的標記。因此,比較標記座位之間的供選擇基因型(或等位基因) 之間的差異大小或差異顯著性水平。推斷性狀基因位于最靠近一個或多個標記的位置,所述標記與基因型差異具有最大的關聯性。用于檢測QTL的兩種此類方法是1)基于種群的結構關聯分析和2)基于家譜的關聯分析。在基于種群的結構關聯分析中,從具有多個創始者(例如優良育種品系)的已有種群中獲取品系。基于種群的結構關聯分析依靠連鎖不平衡(LD)的弱化和以下觀點在非結構化的種群中,在如此多代隨機交配之后,僅有QTL和與QTL緊密連鎖的標記之間的關聯將保存下來。實際上,大多數已有種群具有種群亞結構。因此,通過把個體分配到種群中, 使用得自無規分布于基因組的標記的數據,采用結構關聯方法有助于控制種群結構,從而最小化由于單個種群(也稱為亞種群)內的種群結構帶來的不平衡。表型值與在亞群中每個品系的每個標記座位上基因型(等位基因)進行比較。顯著的標記-性狀關聯指示標記座位和涉及該性狀表達的一個或多個基因座接近。在基于譜系的關聯分析中,通過從少量的創始者建立種群產生LD。例如,在區間作圖方法中(Lander和Botstein,Geneticsl21 185-199 (1989)),測試沿基因圖譜(例如IcM間隔)的許多位點中的每一個位點上QTL位于該位點的概率。基因型/表型數據用于計算每個測試位點的LOD評分(概率比率的對數)。當LOD評分大于臨界閾值(本文中為2. 5)時,有顯著證據表明,QTL位于基因圖譜上的該位點上(它將位于兩個特定標記基因座之間)。本文中鑒定了與絲黑穗病抗性性狀相關聯的標記,同樣地,鑒定了與提高或降低的絲黑穗病抗性相關聯的標記等位基因。方法涉及檢測與提高或降低的絲黑穗病抗性相關聯的至少一個標記等位基因在玉米植物的種質中的存在。連鎖的常見量度是性狀共分離的頻率。這可以共分離百分比(重組頻率)表示, 或者以厘摩(cM)表示。cM是基因重組頻率的量度單位。一 cM等于由于在一代中的交換導致的在一個基因座上的性狀將與在另一個基因座上的性狀分離的概率為(意味著性狀 99%的情況下共分離)。因為染色體距離與性狀間交換事件的頻率大約成比例,有與重組頻率關聯的近似物理距離。例如,在玉米中,IcM平均與約2,140,000個堿基對(2. 14Mbp)相關聯。標記座位本身是性狀,并且在分離期間能夠通過跟蹤標記座位、根據標準連鎖分析進行評估。因此,一 cM等于經過單代雜交的標記座位將與在另一個基因座分離的的概率。與QTL標記連鎖的其他標記可被用于預測玉米植株中絲黑穗病抗性的狀態。這包括距離所述基因座50cM以內的任何標記。一個標記與QTL標記連鎖越緊密,該標記越會更有效地和更有利地成為期望性狀的指示物。緊密連鎖的基因座顯示約10%或更低,優選約9 %或更低,更優選約8 %或更低,更優選約7 %或更低,更優選約6 %或更低,更優選約5 %或更低,更優選約4 %或更低,更優選約3 %或更低,更優選約2 %或更低的基因座內交換頻率。在高度優選的實施方案中,相關基因座(例如標記座位和靶基因座如QTL)顯示約或更低的重組頻率,例如約0. 75%或更低,更優選約0. 5%或更低,或更優選的約 0. 25%或更低的重組頻率。因此,所述基因座分開距離為約10cM、9cM、8cM、7cM、6cM、5cM、 4cM、3cM、2cM、lcM、0. 75cM、0. 5cM、0. 25cM、0. lcM、0. 075cM、0. 05cM、0. 025cM、或 0. OlcM 或更低。換句話說,位于相同染色體上,并且它們間的距離使得兩個基因座間的重組發生頻率小于 10% (例如約 9%、8%、7%、6%、5%、4%、3%、2%、1%、0· 75%,0. 5%,0. 25%, 0. 1%,0. 075%,0. 05%,0. 025%、或0. 01%或更低)的兩個基因座稱為彼此“鄰近”。
盡管特定標記等位基因可顯示與絲黑穗病抗性表型共分離,但重要的是注意到標記基因座不一定是負責表達絲黑穗病抗性表型的QTL基因座的部分。例如,不要求標記多核苷酸序列是賦予絲黑穗病抗性的基因的部分(例如是基因開放閱讀框的部分)。特定標記等位基因與提高或降低的絲黑穗病抗性表型的關聯,是由于在QTL等位基因從中起源的祖先玉米品系中,標記等位基因和QTL等位基因之間的最初“相引”相連鎖。最后通過反復重組,標記和QTL基因座間的交換事件能夠改變這種取向。正是因為這個原因,有利標記等位基因可根據存在于耐受性親本中的相連鎖發生改變,所述耐受性親本用于制備分離種群。這不改變可使用遺傳標記監控表型分離的事實。它僅僅改變在給定分離種群中認為哪個標記等位基因是有利的。本領域熟知的多種方法可用于鑒定染色體區間。劃定此類染色體區間的邊界以包含將與一個或多個QTL連鎖的標記。換句話說,染色體區間以使得位于區間內的任何標記 (包括限定區間邊界的末端標記)可被用作絲黑穗病抗性標記的方式劃定。每個區間包含至少一個QTL,此外甚至可包含一個以上的QTL。相同區間中非常接近的多個QTL可攪亂特定標記與特定QTL的關聯,因為一個標記可顯示與一個以上的QTL連鎖。相反地,例如如果非常接近的兩個標記顯示與期望表型性狀共分離,有時分不清楚是否那些標記中的每一個鑒定相同QTL或兩個不同的QTL。無論如何,完成或實施本發明不需要了解在特定區間中有多少QTL。也提供用于標記輔助選擇(MAS)的方法,其中基于標記基因型選擇表型。為了進行MAS,檢測來自將進行選擇的植物的生物樣品中對應于標記核酸等位基因的核酸。這種檢測能夠采取探針核酸與標記等位基因或其擴增子雜交的形式,例如使用等位基因特異性雜交、DNA分析、RNA分析、原位雜交、引物雜交后進行標記區域的PCR擴增、PCR擴增產物的 DNA測序等。用于檢測標記等位基因的方法是本領域普通技術人員已知的。在證實生物樣本中存在(或不存在)特定標記等位基因后,選擇所述植物并與第二植物(優選來自優良品系的玉米植株)雜交。可評估雜交制備的子代植物的特定標記等位基因,并且僅有那些具有期望的標記等位基因的子代植物將被選擇。玉米植物育種人員期望所需基因座的組合,例如那些與提高的絲黑穗病抗性相關聯的標記等位基因與高產量以及其他期望性狀的基因的組合,以開發改良的玉米品種。通過非分子方法(例如玉米植物性狀評估)篩選大量樣品可能是昂貴的、耗時的并且不可靠的。當與絲黑穗病抗性基因座遺傳連鎖時,本文所述的多態性標記的使用提供了在育種程序中選擇具有絲黑穗病抗性的品種的有效方法。例如,就絲黑穗病抗性而言,標記輔助選擇 (MAS)相對于田間評價的一個優點是,MAS能夠在一年中的任何時間進行,不受生長季節的限制。此外環境效應很大程度上與標記輔助選擇無關。MAS在植物育種中的另一個用途是輔助通過回交育種恢復輪回親本基因型。回交育種是將子代與其他的其中一個親本或親本品系回交的方法。回交通常用于將來自供體親本(例如包含所期望的絲黑穗病抗性標記基因座的親本)的一個或一些基因座,滲入來自輪回親本(例如另外的高產量玉米品系)的其他期望的遺傳背景中。回交進行的次數越多, 輪回親本對所得滲入品種的遺傳貢獻越大。這常常是必需的,因為植物否則可為非期望的, 例如因為低產量、低結實率等。與之相反,作為多次育種程序的結果的品系,可具有優異的產量、結實率等,只不過缺少一個期望性狀如絲黑穗病抗性。
MAS的一個應用是使用標記提高基因滲入或回交的效率,上述嘗試的目的在于將提高絲黑穗病抗性的QTL導入所期望的(通常為高產量)背景。在特定標記(以及關聯的 QTL)的標記輔助回交中,例如從供體來源回交到優良的或外來的遺傳背景,技術人員在回交子代中選擇供體性狀,然后重復回交到優良的或外來的品系以重構盡可能多的優良/外來背景的基因組。用于MAS的最優選的QTL標記(或標記等位基因),是與絲黑穗病抗性性狀具有最強相關性的那些。
實施例提供以下實施例以示出所述權利要求,但本發明不受以下實施例的限制。應當理解本文所述的實施例和實施方案僅用于例證性的目的,并且本領域的技術人員將認識到, 在不脫離本發明精神或所附權利要求范圍的情況下可改變多種試劑或參數。實施例1棺物材料使用了兩種對宿主特異性的絲軸黑粉菌抗性大為不同的近交系,“Jil037”(供體親本)和“HUangZha04”(輪回親本),來培育本研究中的所有作圖種群。本研究中測試的所有植物材料均人工接種了絲軸黑粉菌。“Jil037”表現出對絲黑穗病的完全抗性,并且在大田中沒有觀察到任何易感個體;而“HuangZha04” ( 一種中國的優良近交系)對絲黑穗病高度易感,大田中易感個體占 75%。2004年,由314個個體組成的BC1種群與二親本一起被種植于吉林省農業科學院(Jilin Academy of Agricultural Sciences),公主嶺 (Gongzhulin)的實驗農場中。對每一 BC1個體進行了絲黑穗病抗性的評估。將抗性BC1個體與“HuangzhaW回交,從而產生BC1:2家族(BC2種群)。2005年,來自每一 BC1:2家族的 20植株被種植于單獨的實驗田中,以評估它們的絲黑穗病抗性。鑒定了來自BC2種群的重組個體,并將它們與“HuangzhaW”回交,以產生BC2:3家族,或者進行自花授粉以產生BC2F2 家族。2006年,來自59個BC2:3家族和九個BC2F2家族中每一個的約80個個體被種植于吉林省農業科學院的實驗農場,以研究它們的絲黑穗病抗性。實施例2大田中的人工接種和抗性評分在上一生長季節,從大田中收集了包含絲軸黑粉菌冬孢子的孢子囊群并置于布袋中,存儲在干燥且通風良好的環境中。在種植前,將孢子從孢子囊群移出并過濾,然后按 1 1000的比例與土壤混合。播種時,用土壤和冬孢子的混合物覆蓋玉米籽粒以進行人工接種。就穗或雄穗中孢子囊群的存在/不存在,對成熟期的植株進行了評分,作為易感性/ 抗性的指標。DNA 抽提收集來自一月齡植株的葉片組織并在液氮中磨成粉末。按照Murray和 Thompson (1980)描述的方法抽提了基因組DNA。SSR(簡單重復序列)標記基因分型和連鎖圖譜構建首先檢測了 SSR標記在“Jil037”和“HuangzhaW” 二親本之間的多態性。只有那些表現出清晰的多態性條帶并且在十條染色體間均勻分布的SSR標記才被用于分離種群的基因分型。PCR反應的進行如下94°C變性2分鐘;然后是35個循環的94°C變性30秒, 58°C退火30秒,72°C延伸30秒;最后在72°C延伸10分鐘。在6%聚丙烯酰胺凝膠中對PCR 產物進行電泳,然后通過銀染顯影。從BC1代隨機選擇了總共94個BC1個體,并分析了它們在113個多態性SSR標記處的基因型。如果PCR條帶與供體親本的PCR條帶相同,則將其標記為“2”,如果它與輪回親本的PCR條帶相同,則將其標記為“1”。通過χ2檢驗,針對在每一 SSR標記處1 1的一致性,對BC1回交種群中純合體(1/1)對雜合體(1/2)的比例進行了分析。通過MAPMAKER/ Exp版本3. Ob (Lincoln等人1992)估算了 SSR標記之間的遺傳距離。另外,對2號染色體上的一些標記在不同規模的種群中進行了基因分型,并在JoinMap軟件中針對整合數據調整了它們的遺傳位置。數據分析和QTL/基因作圖根據基于性狀的分析(Lebowitz等人1987)的設計III,鑒定了賦予絲黑穗病抗性的假定的QTL。簡而言之,帶有抗性QTL的BC1個體預期會比不帶抗性QTL的那些更能耐受絲黑穗病。因此,在上述抗性組中,在偶合中與抗性QTL相鄰的標記等位基因將表現出比在易感組中更高的頻率。采用四重網格X2檢驗(SAS 8. 2版本)檢測了所有的標記在抗性和易感組之間的等位基因頻率,以對整個基因組進行假定的QTL的掃描。然后,采用了若干方法來確認主效QTL區域及其在絲黑穗病抗性中的有效性。首先,使用假定的主效QTL區域中的SSR標記,對全部的BC1個體進行基因分型以確認主效QTL的存在。第二,基于BC1個體的BC1:2子代,估算了 BC1個體的感染百分比以通過單因素方差分析確認假定的主效QTL。 第三,通過復合區間作圖法(Windows QTL Cartographer軟件,版本2. 0),對上述10條染色體鑒定了假定的QTL。最后,通過評估主效QTL在降低疾病發生率方面的遺傳效應,進一步確認了主要的QTL。實施例3區域特異性標記的開發主要抗性QTL區域中可用的序列,包括錨定的EST、IDP、RGA、BAC和BAC-末端序列,被用于開發高密度標記。通過tBLASTn,將這些序列與NCBI和MAGI數據庫進行比較以獲得可能的更長的序列。使用PRIMER5. 0軟件按照下列參數設計引物長度為20個核苷酸,GC含量為40 %至60 %,無二級結構,并且沒有連續成串的單種核苷酸。引物對被用于從二親本擴增對應的片段。除了退火溫度根據不同的引物對進行調整之外,循環參數被設置為與上文所述的相同。僅將那些與預期的相同或更大的擴增子從凝膠上切下,并用 Gel Extraction Kit(Qiagen GmbH,Hilden,Germany)純化。然后將純化的PCR產物克隆進載體pGEM-T (!Iomega,Madison,USA)。通常,對每一擴增子,選擇三至五個陽性克隆進行測序以避免任何污染或錯配。首先將擴增子序列與其所源自的初始序列比較以確保獲得的是正確的序列,然后通過使用DNAMAN軟件,在二親本之間進行比較以尋找序列差異。插入缺失被用于開發序列標簽位點(STQ標記;而單核苷酸多態性(SNP)可被用于開發SNP標記或CAPS標記(酶切擴增多態性序列)。如果SNP與給定的限制性位點相關,則形成了 CAPS標記。在SNP標記的開發中,SeqVISTA軟件的SNPpicker程序被用于驗看是否有可能通過向引物中引入錯配堿基對,將特定限制性位點的“不完全位點”變為“完全位點”,從而構建出特定的限制性位點,如Niu和Hu (2004)所述的方法。
引物對被用于擴增二親本以開發高密度標記。就STS標記而言,多態性PCR條帶應在電泳之后出現在瓊脂糖或聚丙烯酰胺凝膠上。就上述CAPS和SNP標記而言,多態性條帶可在以特定的限制性內切核酸酶消化后在瓊脂糖或聚丙烯酰胺凝膠上觀察到。實施例4精細作圖用所述主效QTL區域的SSR標記,將重組個體從BC2種群中篩選出。由于絲黑穗病抗性的局部外顯性,基于單一個體的表現來判斷一個BC2重組體是否攜帶抗性基因將會有很高風險。因此,我們采用了更穩妥的方法,基于單個的BC2重組體的子代的基因型和表型, 來判斷抗性基因在該重組體中的存在/不存在。如果在特定BC2重組體的供體區域沒有抗性基因,則其具有供體區域的子代與不含供體區域的那些在絲黑穗病抗性方面將不會表現出差異。相反,如果供體區域包含所述抗性基因,那么具有供體區域的子代將會比不含供體區域的那些表現出顯著更高的抗性。通過比較上述“抗性的”和“非抗性的”供體區域的插入片段大小,我們能夠確定所述抗性基因所在的區間。通過應用新開發的高密度標記,我們能夠確切地界定攜帶抗性基因的供體區域,并從而將抗性區域縮短至一段很短的區間。在所有的比較中,顯著性差異均在SAS軟件商使用X2檢驗估算。實施例5SSR連鎖圖譜的構津對總計700個SSR標記檢測了它們在“Jil037”和“Huangzhao4”之間的多態性。 在347個多態性SSR標記中,選擇了 113個在十條染色體間均勻分布的標記,用于對BC1作圖種群進行基因分型。在這113個標記中,33個09.2%)表現出偏分離(P<0.05或ρ <0.01)。一般來講,表現出遺傳偏分離的標記對QTL檢測沒有負面影響。因此,使用全部 113個SSR標記構建了連鎖圖譜。該圖片長度為 1753. kM,平均每14. 6cM有一個標記。實施例6對假定的QTL講行作圖按照TB分析(Lebowitz等人1987)的設計III,測試了上述113個SSR標記中每一個在抗性組和易感組中1/2(雜合體)和1/1(純合體)的頻率。對位于四個染色體區域 (位點1. 02/3,2. 08/9,6. 07和10. 03/4)的標記,觀察到了在抗性組和易感組之間頻率的顯著偏差,暗示了四個假定的QTL的存在(表1)。例如,位點2. 09上的標記表現出在整個 BCjt群中雜合體和純合體之間沒有偏離1 1的比例。然而,對于這些標記,抗性組和易感組之間雜合體的百分比顯著地不同,P值< 0.0001 (表1)。該結果有力地表明了一個主效QTL(命名為qHSRl)在該區域的存在。位點10. 03/4和位點1. 02/3上的標記具有P值 < 0. 01 (表1),暗示在這兩個區域中存在具有較弱效應的假定的QTL。位點6. 07上的標記也表現出P值< 0.05(表1)的偏差,暗示一個可能的次要QTL的存在。此外,在位點4. 01 或位點5. 03上,僅有一個標記被發現在抗性組和易感組之間表現出頻率偏差(表1),因此, 難以判斷QTL是否的確在這兩個位點存在。表1 通過對113個SSR標記的四重網格x 2檢驗,對整個基因組掃描假定的QTL
權利要求
1.測定多核苷酸在玉米植物中存在或不存在的方法,所述方法至少包括下列之一(a)從所述玉米植物分離核酸分子并擴增與所述多核苷酸同源的序列,或(b)從所述玉米植物分離核酸分子并進行DNA雜交,或(c)從所述玉米植物分離蛋白質并利用所述蛋白質的抗體進行蛋白質印跡,或(d)從所述玉米植物分離蛋白質并利用所述蛋白質的抗體進行ELISA測定,或(e)證明源自mRNA轉錄物、并且是絲黑穗病抗性基因座特有的mRNA序列的存在;并且其中所述多核苷酸選自(i)至少一種編碼賦予或提高絲黑穗病抗性的多肽的核苷酸序列,所述多肽選自SEQ ID NO :27、32、35、38、41、44、105、108、111、113 和 116 ;( )至少一種能夠賦予或增強絲黑穗病抗性的核苷酸序列,所述核苷酸序列選自SEQ ID NO :25、26、30、31、34、36、37、39、40、42、43、45、104、106、107、109、110、112、114、115 和 117 ;和(iii) (i)或(ii)的核苷酸序列的互補序列,其中所述互補序列和所述核苷酸序列由相同數目的核苷酸組成并且100%互補;從而測定所述多核苷酸在所述玉米植物中的存在。
2.測定絲黑穗病抗性基因座在玉米植物中存在或不存在的方法,所述方法至少包括下列之一(a)從所述玉米植物分離核酸分子并擴增賦予絲黑穗病抗性的多核苷酸特有的序列,或(b)從所述玉米植物分離蛋白質并利用所述蛋白質的抗體進行蛋白質印跡,或(c)從所述玉米植物分離蛋白質并利用所述蛋白質的抗體進行ELISA測定,或(d)證明源自mRNA轉錄物、并且是絲黑穗病抗性基因座特有的mRNA序列的存在;并且其中所述多核苷酸選自(i)至少一種編碼賦予或提高絲黑穗病抗性的多肽的核苷酸序列,所述多肽選自SEQ ID NO :27、32、35、38、41、44、105、108、111、113 和 116 ;( )至少一種能夠賦予或增強絲黑穗病抗性的核苷酸序列,所述核苷酸序列選自SEQ ID NO :25、26、30、31、34、36、37、39、40、42、43、45、104、106、107、109、110、112、114、115 和 117 ;和(iii) (i)或(ii)的核苷酸序列的互補序列,其中所述互補序列和所述核苷酸序列由相同數目的核苷酸組成并且100%互補;從而測定所述絲黑穗病抗性基因座在所述玉米植物中的存在。
3.鑒定表現出絲黑穗病抗性的玉米植物的方法,所述方法包括在玉米植物中檢測遺傳標記基因座,其中(a)包含所述遺傳標記基因座或其互補序列的全部或部分的遺傳標記探針,在嚴格條件下與 bacm. pk071. jl2、bacm. pk007. 18 和 bacm2. pkl66. hi 雜交;并且(b)所述遺傳標記基因座包含與絲黑穗病抗性相關聯的至少一個等位基因。
4.鑒定表現出絲黑穗病抗性的玉米植物的方法,所述方法包括在所述玉米植物的種質中檢測標記基因座的至少一個等位基因,其中(a)所述標記基因座位于 SSR148152、CAPS25082、STS171、SNP661 和 STS1944 的 7cM 內;并且(b)至少一個等位基因與絲黑穗病抗性相關聯。
5.鑒定表現出絲黑穗病抗性的玉米植物的方法,所述方法包括在所述玉米植物的種質中檢測標記基因座的至少一個等位基因,其中(a)所述標記基因座位于染色體區間內,所述染色體區間包含并且側接umcl736和 umc2184 ;并且(b)至少一個等位基因與絲黑穗病抗性相關聯。
6.權利要求5的方法,其中所述標記基因座位于包含且側接SSR148152/SNP661的染色體區間內。
7.標記輔助的選擇方法,所述方法包括(a)獲取具有標記基因座的至少一個等位基因的第一玉米植物,其中所述標記基因座位于公開的 IBM 基因圖譜上的 SSR148152、CAPS25082、STS171、SNP661 和 STS1944 的 7cM 內,并且所述等位基因與提高的絲黑穗病抗性相關聯;(b)將所述第一玉米植物與第二玉米植物雜交;(c)至少就所述等位基因對子代進行評估;以及(d)選擇至少具有所述等位基因的子代玉米植物。
8.標記輔助的選擇方法,所述方法包括(a)獲取具有標記基因座的至少一個等位基因的第一玉米植物,其中所述標記基因座位于包括且側接umcl736和umc2184的染色體區間內,并且所述等位基因與提高的絲黑穗病抗性相關聯;(b)將所述第一玉米植物與第二玉米植物雜交;(c)至少就所述等位基因對子代進行評估;并且(d)選擇至少具有所述等位基因的子代玉米植物。
9.檢測絲黑穗病抗性基因座的方法,所述方法包括檢測至少一個標記等位基因的存在,所述標記等位基因選自ΜΖΑ6393、1Μ2-9、E6765-3、2M4-1、2M10-5、2M11-3、3M1_25 和 STS148-1。
10.任何根據權利要求3-9所述的方法,其中所述與絲黑穗病抗性相關聯的至少一個標記等位基因與第二標記等位基因連鎖。
11.通過權利要求3-9的方法中的任何一個產生的玉米植物。
12.從權利要求11的玉米植物獲得的后代。
全文摘要
絲黑穗病是玉米中最具破壞性的疾病之一,在世界各地導致嚴重的產量損失。本發明描述了對賦予絲黑穗病抗性的主效QTL的精細作圖。描述了對育種有用的標記和用于賦予絲黑穗病抗性的方法。公開了來自賦予絲黑穗病抗性的遺傳基因座的核酸序列。公開了編碼賦予絲黑穗病抗性的蛋白質的基因。
文檔編號C12Q1/68GK102165072SQ200980132323
公開日2011年8月24日 申請日期2009年8月21日 優先權日2008年8月21日
發明者J·趙, K·芬格勒, M·徐, Q·朝, X·趙, Y·陳, 李柏林 申請人:中國農業大學