專利名稱:在單子葉植物中調控表達的表達盒的制作方法
技術領域:
本發明涉及表達盒,包括至少一個可從如下單子葉植物基因中獲得的轉錄調控核苷酸序列咖啡酰-CoA-O-甲基轉移酶基因、C8,7-固醇異構酶基因、富含羥脯氨酸的糖蛋白(HRGP)基因、乳酸脫氫酶基因以及葉綠體蛋白12樣基因。更優選轉錄調控序列可從玉米(Zea mays)或稻(Oryza sativa)中獲得。所述轉錄調控序列對于根/仁偏好性表達、 葉/胚乳偏好性表達、根/穗絲/仁偏好性表達或者組成型表達尤其有用。
背景技術:
操作植物以改變和/或改善表型特征(如生產力或品質)需要在植物組織中表達異源基因。這類基因操作依賴于用于驅動和控制所需基因表達的方法的可用性。例如,基因操作依賴于在植物中有效并在轉基因植物中調控基因表達以產生期望效果的適當啟動子的可用性和使用。在需要在植物發育的所有(或大部分)時間在所有(或大部分)組織中表達的情況下優選組成型啟動子。在單子葉植物中有功能的組成型啟動子的數量是有限的,并且包括稻肌動蛋白 1 (Wang 1992 ;US 5,641,876)、CaMV35S(Odell 1985)、CaMV 19S(Lawton 1987)和玉米遍在蛋白啟動子(Christensen 1996)。盡管以序列描述了雙子葉植物的幾種組成型和組織特異性啟動子(例如,歐芹的咖啡酰-CoA-O-甲基轉移酶基因(Grimmig 1997)、楊樹(Chen 1998)和松樹(Li 1999)的啟動子),但是在異源基因表達方面,僅表征了非常有限的啟動子。與雙子葉啟動子相比,單子葉植物的啟動子仍然非常有限。最好可以選擇多種不同啟動子,以便可以選擇對特定基因、構建體、細胞、組織、植物或環境最適宜的啟動子。此外,隨著對用多重植物轉錄單位(PTU)共轉化植物日益增長的興趣,以及與用于這些目的的共有調控序列的使用有關的潛在問題,我們應該獲得多種啟動子序列。根優選的或根特異性的啟動子有益于改變根組織的功能、改良生長速度、改進對根偏好性病原體、害蟲、除草劑或不利天氣條件的抗性,有益于土壤解毒以及擴大植物可生長的土壤或環境的范圍。根豐富的或根特異性基因表達將提供一種機制,據此可改變形態學和代謝,以改善產量并生產更大量的有用蛋白質。特別是,根特異性啟動子可有益于表達防御相關基因,包括賦予昆蟲抗性和脅迫耐性的那些基因,例如,鹽、寒冷或干旱耐性,以及用于改變養分攝取的基因。在單子葉植物中有功能的根偏好性和根特異性啟動子的數量非常有限。這些包括玉米MR7啟動子(美國專利No. 5,837,848)、玉米ZRP2啟動子(美國專利No. 5,633,363)和玉米MTL啟動子(美國專利No. 5,466,785和6,018,099)。這些實例中的許多公開了表達模式限于有限數量根組織的啟動子。其他的不能提供所選基因表達所需的根特異性。最好可以選擇多種不同的啟動子,以便可選擇對特定基因、構建體、細胞、組織、植物或環境最適宜的啟動子。此外,隨著對用多重植物轉錄單位(PTU)共轉化植物日益
5增長的興趣,以及與用于這些目的的共有調控序列的使用有關的潛在問題,我們應該獲得多種啟動子序列。因此,本領域技術中非常需要鑒定新的序列,其可用于在經濟上最重要的單子葉植物,尤其是在稻和玉米中表達所選的轉基因。因此本發明的目的是提供用于在單子葉植物中表達轉基因的新的和可選擇的表達盒,更優選借此調節表達的組織特異性。附圖的簡短說明
圖10s. CCoAMTI啟動子玉米遍在蛋白內含子GUS(PIV2) CCoAMT 1終止子嵌合構建體(PBPSMM325)圖。該質粒包含表達構建體,所述表達構建體含有有效連接于玉米遍在蛋白內含子的 Os. CCoAMTI啟動子、β葡糖醛酸糖苷酶基因(⑶S,包括馬鈴薯轉化酶[PIV]2內含子)以及Os.CCoAMTl的非翻譯區和轉錄終止區。SM盒代表選擇標記(ahas)盒。圖2玉米中受稻(Os)CCoAMTI啟動子構建體(pBPSMM325)控制的⑶S表達。上面一組(I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區域覆蓋的清楚地被染成藍色的區域。(A)葉+根5葉期⑶葉開花期(C)仁(授粉前)(D)仁授粉后 30 天(30DAP)照片代表15個T1單拷貝株系的可重復表達模式。圖3A :0s. CCoAMTI啟動子玉米遍在蛋白內含子⑶S(PIV2) NOS終止子融合構建體(PBPSMM271)圖。該質粒包含表達構建體,所述表達構建體含有有效連接于玉米遍在蛋白內含子的 Os. CCoAMTI啟動子、β葡糖醛酸糖苷酶基因(⑶S,包括馬鈴薯轉化酶[PIV]2內含子)以及胭脂堿合酶(N0Q終止子。SM盒代表選擇標記(ahas)盒。B 玉米中受(os) CCoAMTI啟動子構建體(pBPSMM271)控制的GUS表達。上面一組 (I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區域覆蓋的清楚地被染成藍色的區域。(A)葉和根5葉期⑶葉開花期(C)仁(授粉后 30 天30DAP)照片代表15個T1單拷貝株系的可重復表達模式。圖4A :0s. Si:玉米遍在蛋白內含子⑶S(PIV2) :N0S終止子融合構建體 (pBPSMM331)圖。該質粒包含表達構建體,所述表達構建體含有有效連接于玉米遍在蛋白內含子的 Os. SI啟動子、β葡糖醛酸糖苷酶基因(GUS,包括馬鈴薯轉化酶[PIV]2內含子)以及NOS 終止子的表達構建體。SM盒代表選擇標記盒。B 玉米中受Os. SI啟動子構建體(pBPSMM331)控制的⑶S表達。上面一組(I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區域覆蓋的清楚地被染成藍色的區域。
(A)葉和根5葉期(B)葉5葉期;葉開花期(C)仁(授粉后 30 天30DAP)照片代表15個T1單拷貝株系的可重復表達模式。圖5A =Zm. HRGP玉米遍在蛋白內含子GUS (PIV2) :Zm. HRGP終止子融合構建體(pBPSET003)圖。該質粒包含表達構建體,所述表達構建體含有有效連接于玉米遍在蛋白內含子的 Sii. HRGP啟動子、β葡糖醛酸糖苷酶基因(GUS,包括馬鈴薯轉化酶[PIV]2內含子)以及 HRGP終止子。SM盒代表選擇標記(ahas)盒。B 玉米中受玉米Sn. HRGP啟動子構建體(pBPSET003)控制的⑶S表達。上面一組 (I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區域覆蓋的清楚地被染成藍色的區域。(A)葉和根5葉期(B)葉5葉期;葉開花期(C)仁(授粉后 30 天30DAP)照片代表15個T1單拷貝株系的可重復表達模式。圖6A :Zm. LDH:玉米遍在蛋白內含子⑶S(PIV2) :N0S終止子融合構建體 (pBPSMM272)圖。該質粒包含表達構建體,所述表達構建體含有有效連接于玉米遍在蛋白內含子的 Sii. LDH啟動子、β葡糖醛酸糖苷酶基因(GUS,包括馬鈴薯轉化酶[PIV]2內含子)以及NOS 終止子。SM盒代表選擇標記(ahas)盒。B 玉米中受玉米Sn. LDH啟動子構建體(pBPSMM272)控制的⑶S表達。上面一組 (I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區域覆蓋的清楚地被染成藍色的區域。含有PBPSMM272或pBPSET007的轉基因植物顯示出同樣的表達模式。(A)葉和根5葉期(B)葉5葉期;葉開花期(C)仁(授粉后 30 天30DAP)照片代表8個T1單拷貝株系的可重復表達模式。圖7A =Zm. LDH:玉米遍在蛋白內含子⑶S(PIV2) :Zm. LDH終止子融合構建體 (pBPSET007)圖。該質粒包含表達構建體,所述表達構建體含有有效連接于玉米遍在蛋白內含子的 Sii. LDH啟動子、β葡糖醛酸糖苷酶基因(GUS,包括馬鈴薯轉化酶[PIV]2內含子)以及LDH 終止子。SM盒代表選擇標記(ahas)盒。B 玉米中受玉米Zm. LDH啟動子構建體(pBPSET007)控制的GUS表達。上面一組 (I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區域覆蓋的清楚地被染成藍色的區域。(A)葉和根5葉期(B)葉開花期(C)仁(授粉后 30 天30DAP)
7
照片代表15個T1單拷貝株系的可重復表達模式。圖8A :0s. CP12:玉米遍在蛋白內含子⑶S(PIV2) :N0S終止子融合構建體 (pBPSMM304)圖。該質粒包含表達構建體,所述表達構建體含有有效連接于玉米遍在蛋白內含子的 0S.CP12啟動子、β葡糖醛酸糖苷酶基因(⑶S,包括馬鈴薯轉化酶[PIV]2內含子)以及NOS 終止子。SM盒代表選擇標記盒。B 玉米中受玉米Os. CP12啟動子構建體(pBPSMM304)控制的GUS表達。上面一組 (I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區域覆蓋的清楚地被染成藍色的區域。(A)葉和根5葉期(B)葉開花期(C)仁(授粉后 30 天30DAP)照片代表15個T1單拷貝株系的可重復表達模式。圖9干旱脅迫誘導的玉米中Sii. LDH啟動子構建體(pBPSMM272)的表達。將5葉期轉基因植物通過停止供水進行干旱脅迫。在所示的時間點從葉上采集樣品。從葉樣品中分離RNA,并以定量RT-PCR進行分析。將GUS表達對每個樣品中的內對照基因進行標準化。 將結果表示為與0時間點相比表達水平增加的倍數,其中將0時間點的表達設定為1。圖10A-B稻乳酸脫氫酶(LDH)蛋白與玉米(1)、稻(2)、大麥(3)、稻(4)、擬南芥 (Arabidopsis) (5、6)、番茄(7)、馬鈴薯(8)LDH蛋白的蛋白質序列比對。區分單子葉LDH蛋白和其他雙子葉LDH蛋白的序列基序加框表示(用“ + ”標記相應的不同氨基酸)。本領域技術人員基于本序列比對可以很容易地鑒定更多的這類序列基序。圖11稻C8,7固醇異構酶(Si)蛋白與擬南芥(1-3)和稻(4)SI蛋白的蛋白質序列比對。圖12稻咖啡酰-CoA-O-甲基轉移酶1 (CCoAMTl)與煙草(1)、桉樹⑵、楊樹(3)、 玉米G、5、6)和稻(7) CCoAMTl蛋白的蛋白質序列比對。區分單子葉CCoAMT蛋白和其他雙子葉CCoAMT蛋白的序列基序加框表示(用“ + ” 標記相應的不同氨基酸)。本領域技術人員基于本序列比對可以很容易地鑒定更多的這類序列基序。發明_既述因此,本發明的第一個實施方案涉及用于在單子葉植物中調控表達的表達盒,包括i)至少一個單子葉植物基因的轉錄調控核苷酸序列,所述的單子葉植物基因選自咖啡酰-CoA-O-甲基轉移酶基因、C8,7-固醇異構酶基因、富含羥脯氨酸的糖蛋白(HRGP)基因、乳酸脫氫酶基因以及葉綠體蛋白12樣基因,和與之功能性相連的ii)至少一個核苷酸序列,其與所述轉錄調控序列是異源的。優選轉錄調控核苷酸序列可從多肽編碼基因的單子葉植物基因組DNA中獲得,其中所述多肽
al)包含單子葉植物乳酸脫氫酶蛋白的至少一個序列基序,所述序列基序選自如下氨基酸序列i)SLSELGFDA(SEQIDNO:76),
ii)VIGAGNVGMA(SEQIDNO:77),
iii)IVTAGARQI(SEQIDNO:78),
iv)L(F/Y)RKIVP(SEQIDNO:79),
ν)GFPASRV(SEQIDNO:80),
Vi)RF(L/I)AEHL(SEQIDNO:81),
vii)QAYMVGEH(SEQIDNO:82),
viii)ALEGIRRAV(SEQIDNO:83), ^P
ix)GYSVAS(L/I)A(SEQIDNO:84),或者bl)編碼單子葉植物乳酸脫氫酶蛋白,與選自SEQ ID NO :26、60和65所述的多肽具有至少90%的氨基酸序列同一性,或者a2)包含單子葉植物咖啡酰-CoA-O-甲基轉移酶蛋白的至少一個序列基序,所述序列基序選自如下氨基酸序列x) EQKTRHSE(SEQIDNO:85),
xi) L (I/L)KLIGAK(SEQIDNO:86),
xii) KTMEIGVY(SEQIDNO:87),
xiii)HERL(L/M)KLV(SEQIDNO:88),
xiv) CQLPV⑶G(SEQIDNO:89), ^P
xv) TLCRRVK(SEQIDNO:90),或者b2)編碼單子葉植物咖啡酰-CoA-O-甲基轉移酶蛋白,與選自SEQ IDNO :5和70所述的多肽具有至少90%的氨基酸序列同一性,或者b3)編碼單子葉植物富含羥脯氨酸的糖蛋白,與選自SEQ ID N0:18和75所述的多肽具有至少90%的氨基酸序列同一性,或者b4)編碼單子葉植物C8,7-固醇異構酶蛋白,與SEQ ID NO 10所述的多肽具有至少90 %的氨基酸序列同一性,或者b5)編碼單子葉植物葉綠體蛋白12樣蛋白,與SEQ ID NO 31所述的多肽具有至少90%的氨基酸序列同一性。優選轉錄調控核苷酸序列來自玉米或稻植物。甚至更優選轉錄調控核苷酸序列是選自稻咖啡酰-CoA-O-甲基轉移酶基因、稻C8,7-固醇異構酶基因、玉米富含羥脯氨酸的糖蛋白(HRGP)基因、玉米乳酸脫氫酶基因、稻葉綠體蛋白12樣基因的植物基因及其功能等同物。優選功能等同物編碼的多肽與選自SEQ ID NO :5、10、18、26、31、60、65、70和75所述多肽具有至少90%的氨基酸序列同一性。在更優選的實施方案中,轉錄調控核苷酸序列選自如下序列i)由 SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、 29、56、57、58、61、62、63、66、67、68、71、72 和 73 所述的序列,和
ii) i)中序列的至少50個連續堿基的片段;和iii)與 SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、 觀、29、56、57、58、61、62、63、66、67、68、71、72或73所述轉錄調控核苷酸序列基本上相似的
核苷酸序列(優選具有至少60%的序列同一性;更優選通過BLASTN程序以如下默認參數測量字長(W)為11、期望值(E)為10、截斷為100、M= 5、N = -4,并進行兩條鏈的比較); 和iV)能與 SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、 觀、29、56、57、58、61、62、63、66、67、68、71、72或73所述的轉錄調控核苷酸序列或其互補物
雜交的核苷酸序列;和ν)能與如下核酸雜交的核苷酸序列,其中所述核酸包含SEQ ID NO :1、2、3、6、7、8、 11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72 或73所述的轉錄調控核苷酸序列或其互補物的50-200個或更多連續核苷酸(優選在 % 十二燒基硫酸鈉(SDS)、0· 5Μ NaPO4UmM EDTA 中于 50°C雜交,用 2X SSC、0. 1 % SDS 于 50°C 洗滌;更優選在十二烷基硫酸鈉(SDS)、0. 5MNaP04、lmM EDTA中于50°C雜交,用1 X SSC、 0. SDS于50°C洗滌,還更優選在7%十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于 50°C雜交,用0. 5XSSC、0. 1% SDS于50°C洗滌,甚至更優選在7%十二烷基硫酸鈉(SDS)、 0. 5M NaPO4UmM EDTA 中于 50°C雜交,用 0. 1 XSSC、0. 1 % SDS 于 50°C洗滌,最優選在 7% 十二燒基硫酸鈉(SDS)、0· 5M NaPO4UmM EDTA 中于 50°C雜交,用 0. 1 XSSC、0. 1 % SDS 于 65°C洗滌);和vi)上述i)至ν)核苷酸序列中任一的互補物或反向互補物核苷酸序列。另一優選的實施方案涉及用于在單子葉植物中調控表達的表達盒,其包括a)至少一個在單子葉植物中有功能的轉錄調控核苷酸序列,其包含選自如下序列的至少一個序列i)SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、 56、57、58、61、62、63、66、67、68、71、72 和 73 所述的序列,和ii) i)中序列的至少50個連續堿基的片段;和iii)與 SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、 觀、29、56、57、58、61、62、63、66、67、68、71、72或73所述轉錄調控核苷酸序列基本上相似的
核苷酸序列(優選具有至少60%的序列同一性;更優選通過BLASTN程序以如下默認參數測量字長(W)為11、期望值(E)為10、截斷為100、M= 5、N = -4,并進行兩條鏈的比較); 和iν)能與 SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、 觀、29、56、57、58、61、62、63、66、67、68、71、72或73所述的轉錄調控核苷酸序列或其互補物雜交的核苷酸序列(優選在十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交,用2XSSC、0. SDS于50°C洗滌;更優選在7%十二烷基硫酸鈉(SDS)、0. 5M NaPO4, ImM EDTA中于50°C雜交,用1XSSC、0. SDS于50°C洗滌,還更優選在7%十二烷基硫酸鈉(SDS) ,0. 5M 妝卩04、1111]\^01六中于501雜交,用0.5\55(、0.1%503于501洗滌,甚至更優選在7%十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交,用0. 1XSSC、0. 1% SDS于50°C洗滌,最優選在7%十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交,用 0. 1 X SSC、0. 1 % SDS T 65°c洗滌);禾口ν)能與如下核酸雜交的核苷酸序列,其中所述核酸包含SEQ ID NO :1、2、3、6、7、8、 11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72 或73所述的轉錄調控核苷酸序列或其互補物的50-200個或更多連續核苷酸;和Vi)上述i)至ν)核苷酸序列中任一的互補物或反向互補物核苷酸序列,禾口b)至少一個核苷酸序列,其與所述轉錄調控序列是異源的。優選上段中ii)、iii)、iv)、ν)和vi)中定義的序列能夠在單子葉植物細胞或生物體中修飾轉錄。更優選ii)、iii)、iv)、ν)和vi)中定義的所述序列與SEQID NO :1、2、 3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、 68、71、72或73所述的轉錄調控核苷酸序列基本上具有相同的轉錄調控活性。還優選上述iii)中定義的序列與 SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、 16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72 或 73 所述序列具有至少60 %、優選70 %或80 %、更優選90 %或95 %的序列同一性,其中同一性優選通過 BLASTN程序以如下默認參數測量字長(W)為11、期望值(E)為10、截斷為100、M = 5、N =_4,并進行兩條鏈的比較。更優選上述iv)或ν)中定義的序列在嚴謹條件下,優選在中等嚴謹條件下,最優選在高嚴謹條件下(如在十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交, 用0. 1 X SSC、0. 1 % SDS于65°C洗滌)與指定的靶序列雜交。在本發明表達盒的一個優選的實施方案中,核酸序列的表達導致蛋白質的表達, 或者反義RNA、正義或雙鏈RNA的表達。本發明表達盒的表達譜可依靠轉錄調控核苷酸序列與增強表達的內含子和/或轉錄終止序列的結合進行調控。在本發明表達盒的優選實施方案中,這包括至少一種選自如下的額外元件a) 5’非翻譯區,和b)內含子編碼序列,和c)轉錄終止序列。內含子編碼序列優選編碼單子葉植物的表達增強內含子。更優選內含子序列是遍在蛋白、肌動蛋白或醇脫氫酶基因的內含子。優選將內含子插入到表達構建體中欲表達核酸序列的5’非翻譯區(即,位于轉錄調控核苷酸序列與蛋白質編碼序列(開放讀框)或欲表達核酸序列之間)。優選5’非翻譯區來自與轉錄調控序列相同的基因。轉錄終止序列優選也包括誘導多聚腺苷化作用的序列。轉錄終止序列可以異源于轉錄調控核苷酸序列和/或待表達核酸序列,但也可以是所述轉錄調控核苷酸序列和/或所述待表達的核酸序列基因的天然轉錄調控核苷酸序列。在本發明一個優選的實施方案中,轉錄調控核苷酸序列是轉錄調控序列基因的天然轉錄調控核苷酸序列。優選轉錄終止序列選自SEQ IDNO 32,34和35所述的序列。本發明的轉錄調控序列尤其可用于單子葉植物中組成型或根/仁偏好性表達或根/仁特異性表達。然而不排除在其他植物(例如,雙子葉或裸子植物)和其他組織中的應用。已經證明,本發明的轉錄調控序列的組織特異性能夠最好通過結合內含子和/或轉錄終止序列進行調控。表達盒可用于多種表達目的,例如用于蛋白質的表達,或者反義RNA、正義或雙鏈 RNA的表達。優選核酸序列的表達賦予植物農藝學上有價值的性狀。本發明有些轉錄調控序列甚至如所述的那樣是新的(即,如所分離的核苷酸序列)。因此,本發明的另一個實施方案涉及分離的核苷酸序列,其包含至少一個如SEQ ID NO :6、7、8、11、12、13、19、20或21所述的轉錄調控核苷酸序列。本發明的其他實施方案涉及含有本發明表達盒的載體,以及含有本發明表達盒或載體的轉基因宿主細胞或非人生物。優選生物是植物,更優選是單子葉植物,最優選選自玉米、禾§、小麥(Triticum aestivum)、大麥(Hordeum vulgare)禾口燕麥(Avena sativa)。本發明的另一個實施方案涉及用于在單子葉植物中鑒定和/或分離轉錄調控核苷酸序列的方法,其特征在于所述鑒定和/或分離利用如SEQ IDN0:5、10、18、26、31、60、 65,70或75所述氨基酸序列的編碼核酸序列,或者至少15個堿基的所述核酸序列的部分。 優選所使用的核酸序列為SEQ ID NO :4、9、17、25、30、59、64、69或74,或者至少15個堿基的所述核酸序列的部分。優選所述鑒定和/或分離通過選自聚合酶鏈式反應、雜交和數據庫篩選的方法實現。本發明的另一個實施方案涉及提供用于在單子葉植物中進行異源表達的轉基因表達盒的方法,包括步驟I.利用至少一個核酸序列或其部分從單子葉植物中分離轉錄調控核苷酸序列,其中所述序列編碼SEQ ID NO :5、10、18、洸、31、60、65、70或75所述的多肽,或者至少15個堿基的所述核酸序列的部分,和II.將所述轉錄調控核苷酸序列功能性連接于其他目的核苷酸序列,后者與所述轉錄調控核苷酸序列異源。對于上述兩類方法,優選分離所述轉錄調控核苷酸序列所采用的核苷酸序列編碼這樣的多肽,所述多肽包含al)單子葉植物乳酸脫氫酶蛋白的至少一個序列基序,其中序列基序選自如下氨基酸序列i)SLSELGFDA(SEQ ID NO76),
ii)VIGAGNVGMA(SEQ ID NO77),
iii)IVTAGARQI(SEQIDNO:78),
iv)L(F/Y)RKIVP(SEQIDNO:79),
ν)GFPASRV(SEQIDNO:80),
Vi)RF (L/1)AEHL(SEQIDNO:81),
vii)QAYMVGEH(SEQIDNO:82),
viii)ALEGIRRAV(SEQIDNO:83), ^P
ix)GYSVAS (L/Dk (SEQIDNO:84),
或者 a2)單子葉植物咖啡酰-CoA-O-甲基轉移酶蛋白的至少一個序列基序,其中序列基序選自如下氨基酸序列
χ)EQKTRHSE(SEQ ID NO85),
Xi)L(I/L)KLIGAK(SEQ ID NO86),
xii)KTMEIGVY(SEQ ID NO87),
xiii)HERL(L/M)KLV(SEQ ID NO88),
xiv)CQLPVGDG(SEQ ID NO:8 ,和
XV)TLCRRVK(SEQ ID NO90)。
定義
應當理解的是,本發明不限于所述的特定方法、方案、細胞系、植物物種或屬、構建
體以及試劑身。也應當理解的是,這里所使用的術語僅用于描述特定實施方案的目的,而非旨在限制本發明的范圍,后者將僅通過所附的權利要求書進行限定。必須注意到,如文中和所附權利要求書中所使用的,單數形式的“一個”、“一種”和“該”包括復數,除非上下文清楚地另行指示。因此,例如,提及“載體”時是指一種或多種載體,包括本領域技術人員已知的其等同物,等等。文中所使用的術語“約”是指近似地、粗略地、左右或附近。當術語“約”與數值范圍一起使用時,其通過擴展所示數值的上下邊界而修飾該范圍。通常,文中所使用的術語 “約”以所示值上下20%的方差、優選上下(高低)10%的方差修飾數值范圍。如這里所使用的,措辭“或”是指特定列單中的任何一個成員,也包括該列單中成員的任意組合。術語“基因”廣泛地指與生物功能有關的任何核酸節斷。因此,基因包括編碼序列和/或它們表達必需的調控序列。例如,基因指表達mRNA或功能性RNA,或者編碼特定蛋白質的核酸片段,并且包括調控序列。基因也包括非表達的DNA節斷,例如,構成其他蛋白質的識別序列。基因可從多種來源獲得,包括從目的來源中克隆,或者根據已知的或預測的序列信息合成,并且可包括設計用于具有期望參數的序列。術語“內含子”指基因內的DNA區段(間插序列),其不編碼基因所產生的蛋白質的部分,并且在從細胞核中輸出前,其在從基因中轉錄的mRNA中被剪接掉。內含子序列指內含子的核酸序列。因此,內含子是DNA序列中那些隨編碼序列(外顯子)一起被轉錄, 但是在成熟mRNA的形成期間被除去的區域。內含子可位于實際的編碼區內或者位于前 mRNA(未剪接的mRNA)的5’或3’非翻譯前導區。將初級轉錄物中的內含子切除,并將編碼序列同時精確地連接起來,從而形成成熟mRNA。內含子和外顯子的接點形成剪接位點。 內含子的序列以GU開始并以AG結束。此外,在植物中,已經描述了兩例AU-AC內含子擬南芥(Arabidopsis thaliana)的RecA-樣蛋白基因的內含子14和G5基因的內含子7是 AU-AC內含子,含有內含子的前mRNA具有三個短序列,除了其他序列之外,這三個短序列是內含子準確剪接必需的。這些序列是5’剪接位點、3’剪接位點和分支點。mRNA剪接是除去初級mRNA轉錄物中存在的間插序列(內含子)并結合或連接外顯子序列。這也被稱作順式剪接,其在除去間插序列(內含子)的同一 RNA上連接兩個外顯子。內含子的功能元件包括被剪接體的特異性蛋白組分識別并結合的序列(例如,內含子末端的剪接共有序列)。 功能性元件與剪接體的相互作用導致從未成熟的mRNA中除去內含子序列并將外顯子序列重新連接。內含子具有三個短序列,是內含子被準確剪接所必要的,但并非充分條件。這些序列是5’剪接位點、3’剪接位點和分支點。分支點序列在植物的剪接和剪接位點選擇中很重要。分支點序列通常位于3’剪接位點上游10-60核苷酸處。植物序列就分支點而言顯示出序列偏差,共有序列是CURAY或YURAY。術語“天然的”或“野生型”基因指未轉化細胞的基因組中存在的基因,S卩,沒有已知突變的細胞。“標記基因”編碼可選擇的或可篩選的性狀。術語“嵌合基因”指任何基因,其包括1)DNA序列,包括并非在自然界中連在一起的調控和編碼序列,或者2)編碼非天然毗鄰的蛋白質部分的序列,或者3)非天然毗鄰的啟動子部分。因此,嵌合基因可包括源自不同來源的調控序列和編碼序列,或者包括源自同一來源的調控序列和編碼序列,但是以不同于天然發現的方式排列。“轉基因”指已通過轉化引入到基因組內并穩定維持的基因。轉基因可包括,例如, 與待轉化的特定植物的基因異源或同源的基因。另外,轉基因可包括插2到非天然生物體內的天然基因,或者嵌合基因。術語“內源基因”指生物體基因組中其天然位置中的天然基因。“外源”基因指通常未在宿主生物體中發現,但通過基因轉移被引入的基因。與本發明的核苷酸序列對應的“寡核苷酸”,例如用于探測或擴增反應,長度可以是約30個或更少核苷酸(例如,9、12、15、18、20、21或對,或者是9-30的任意數)。通常, 特異性引物長度超過14個核苷酸。對于最適特異性和成本效率來說,長度為16-M個核苷酸的引物可能是優選的。本領域技術人員通曉用于如PCR方法的引物設計。如果必需的話,可用這里所公開的基因的整套限制性片段進行探測,其長度可以是100個或者甚至是 1,000個核苷酸。術語“蛋白質”、“肽”和“多肽”這里可互換使用。可將本發明的核苷酸序列引入到任何植物中。可在表達盒中方便地使用待引入的基因,用于任何目的植物中的引入和表達。這類表達盒將包括與目的核苷酸序列相連的本發明的轉錄起始區。優選的啟動子包括組成型、組織特異性、發育特異性、誘導型和/或病毒啟動子。提供具有多個限制性位點的這類表達盒,用于將目的基因插入到調控區的轉錄調控下。表達盒可另外含有可選擇的標記基因。該盒在5' -3'轉錄方向上將包括在植物中有功能的轉錄和翻譯起始區、目的DNA序列,以及轉錄和翻譯終止區。終止區可以是轉錄起始區的天然終止區,可以是目的DNA序列的天然終止區,或者可以來自其他來源。合適的終止區可從根癌農桿菌(Agrobacterium tumefaciens)的Ti-質粒中獲得,如,章魚堿合酶和胭脂堿合酶終止區(也見,Guerineau 1991 ;Proudfoot 1991 ;Sanfacon 1991 ;Mogen 1990 ;Munroe1990 ;Ballas 1989 Joshi 1987)。“編碼序列”指編碼特定氨基酸序列并排除非編碼序列的DNA或RNA序列。其可構成“不間斷的編碼序列”,即,缺乏內含子,如在cDNA中,或者其可包括由適當的剪接接點為界限的一個或多個內含子。“內含子”是RNA序列,初級轉錄物中含有該序列,但是在細胞內通過RNA的裂解和再連接被除去以產生可被翻譯成蛋白質的成熟mRNA。術語“開放讀框”和“0RF”指編碼序列的翻譯起始和終止密碼子之間所編碼的氨基酸序列。術語“起始密碼子”和“終止密碼子”指編碼序列中三個相鄰核苷酸單位(“密碼子”),其分別規定蛋白質合成(mRNA翻譯)的起始和鏈終止。
“功能性RNA”指反義RNA、雙鏈RNA、核糖核酸酶,或不被翻譯的其他RNA。術語“RNA轉錄物”指由RNA聚合酶催化DNA序列的轉錄所產生的產物。當RNA轉錄物是DNA序列的完全互補拷貝時,其被稱作初級轉錄物,或者其可以是源于初級轉錄物的轉錄后加工的RNA序列并被稱作成熟RNA。“信使RNA”(mRNA)指無內含子并且可被細胞翻譯成蛋白質的RNA。“cDNA”指與mRNA互補并源于其的單鏈或雙鏈DNA。“轉錄調控核苷酸序列”、“調控序列”,和“適當的調控序列”,每個都指影響轉錄、 RNA加工或穩定性、或者相關(或功能性相連的)待轉錄核苷酸序列的翻譯的核苷酸序列。 相對于待轉錄的核苷酸序列,轉錄調控核苷酸序列的定位可有多處。轉錄調控核苷酸序列可位于待轉錄序列(例如,編碼序列)的上游(5'非編碼序列),之內或下游(3‘非編碼序列)。轉錄調控序列可選自增強子、啟動子、翻譯前導序列、內含子、5'非翻譯序列、3'非翻譯序列以及多聚腺苷酸化信號序列。它們包括天然的和合成的序列,可以是合成的和天然序列的組合。如上所述,術語“轉錄調控序列”不限于啟動子。然而,優選本發明的轉錄調控核苷酸序列包括至少一個啟動子序列(例如,位于基因的轉錄起點上游,能誘導下游序列的轉錄的序列)。在本發明的一個優選的實施方案中,本發明的轉錄調控核苷酸序列包括相應基因的啟動子序列,任選且優選所述基因的天然5'非翻譯區。此外,也可使用所述基因的;V非翻譯區和/或多聚腺苷酸化區。“5'非編碼序列”指位于編碼序列5'(上游)的核苷酸序列。其位于經過充分加工的mRNA的起始密碼子的上游,并且可以影響初級轉錄物加工成mRNA、影響mRNA穩定性或翻譯效率(Turner 1995)。“3'非編碼序列”指位于編碼序列3'(下游)的核苷酸序列,并且包括多聚腺苷酸化信號序列和編碼能影響mRNA加工或基因表達的調控信號的其他序列。通常,多聚腺苷酸化信號的特征是影響向mRNA前體的3'末端添加多聚腺苷酸束。Ingelbrecht等,1989 舉例說明了不同3'非編碼序列的用途。術語“翻譯前導序列”指基因的啟動子和編碼序列之間的DNA序列部分,其轉錄成 RNA并且位于經過充分加工的mRNA的轉錄起始密碼子的上游(5')。翻譯前導序列可影響初級轉錄物加工成mRNA、影響mRNA穩定性或翻譯效率。“信號肽”指多肽的氨基末端延伸,其與多肽一起翻譯,形成前體肽,并且對于其進入分泌途徑是必需的。術語“信號序列”指編碼信號肽的核苷酸序列。如這里所使用的術語“轉運肽”指所表達的多肽的一部分(優選指多肽的氨基末端延伸),其與多肽一起翻譯, 形成前體肽,并且對于其進入細胞器是必需的(如質體(例如,葉綠體)或線粒體)。術語 “轉運序列”指編碼轉運肽的核苷酸序列。“啟動子”指通常位于編碼序列上游(5')的核苷酸序列,通過提供對正確轉錄所必需的RNA聚合酶和其他因子的識別,控制編碼序列的表達。“啟動子”包括短DNA序列的最小啟動子,其由TATA盒和用于指定轉錄起始位點的其他序列構成,向其添加調控元件用于表達的控制。“啟動子”也指包括最小啟動子加上能用于控制編碼序列或功能性RNA表達的調控元件的核苷酸序列。該類型的啟動子序列由近側和更遠側的上游元件構成,后者通常稱作增強子。因此,“增強子”是這樣的DNA序列,其可刺激啟動子活性,并且可以是啟動子的先天元件或者是插入的異源元件,以增強啟動子的水平或組織特異性。其在兩個方向上都能發揮功能(正常的或翻轉的),并且甚至當移動到啟動子的上游或下游時仍然有功
15能。增強子和其他上游啟動子元件都與介導其效應的序列特異性的DNA結合蛋白結合。啟動子可整體源自天然基因,或者由不同元件構成,源自天然所發現的完全不同的啟動子,或者甚至由合成的DNA片段構成。啟動子也可含有參與蛋白因子結合的DNA序列,其控制響應生理或發育條件的轉錄起始的效率。“起始位點”是圍繞第一核苷酸的位置,是所轉錄序列的一部分,其也被定義為位置+1。相對于此位點對基因的所有其他序列和其控制區進行編號。將下游序列(即,3'方向上其余蛋白質編碼序列)命名為正,而將上游序列(5'方向上控制區的大部分)命名為負。將啟動子元件,特別是TATA元件,在缺乏上游激活時無活性或者啟動子活性極度降低,稱作“最小或核心啟動子”。在存在適當的轉錄因子時,最小啟動子起允許轉錄的功能。“最小或核心啟動子”因此僅由轉錄起始所必需的所有基本元件構成,即,TATA盒和/ 或起始子。“組成型表達”指使用組成型或可調型啟動子的表達。“組織非依賴性的”、“組織通用的”或“組成型”旨在指大部分時間在整個植物的細胞中和在大部分組織中的表達。與歸為“組成型”的其他啟動子(例如,遍在蛋白)一樣, 可以在不同組織或階段的絕對表達水平存在一些變動。然而,組成型啟動子通常在大多數組織中,優選在所有組織中,以及在大多數發育階段,優選在所有發育階段都高水平或中等水平表達。“有條件的”和“可調的表達”指受可調型啟動子控制的表達。“組成型啟動子”指這樣的啟動子,其能在植物的所有或幾乎所有發育階段期間在所有或幾乎所有植物組織中表達受其控制的開放讀框(ORF)。各轉錄激活元件都不顯示絕對的組織特異性,但在大多數植物部分中介導的轉錄激活水平至少為在轉錄最活躍的植物部分中所達水平的1%。“可調型啟動子”指指導基因非組成型表達,而以時間和/或空間調控的方式表達的啟動子,并且包括組織特異性和誘導型啟動子。其包括天然的和合成序列,可以是合成的和天然序列的組合。不同啟動子可在不同組織或細胞類型中,或在不同的發育階段,或者響應不同的環境條件指導基因的表達。在植物細胞中有用的多種類型的新啟動子不斷地被發現,眾多實例可見于Okamuro等(1989)的匯編出版物。在植物中有用的典型的可調型啟動子包括但不限于安全劑誘導型啟動子、源于四環素誘導型系統的啟動子、源于水楊酸誘導型系統的啟動子、源于醇誘導型系統的啟動子、源于糖皮質激素誘導型系統的啟動子、源于病原體誘導型系統的啟動子,以及源于蛻皮激素誘導型系統的啟動子。“組織特異性啟動子”指不在所有植物細胞中表達,而僅在特定器官(如葉或種子)、特定組織(如胚或子葉)中的一種或多種細胞類型中表達、或僅在特定細胞類型(如葉實質或種子儲藏細胞)中表達的可調型啟動子。這些也包括時間調控的啟動子,如在早期或晚期胚發生中,在發育種子或果實的果實成熟期間,在完全分化的葉中,或者在衰老開始發生時。在本發明上下文中,術語“根”是指通常為地下的植物器官,其缺乏芽或葉或節,吸收水分和礦物鹽,并通常將植物固定在地面。植物根由許多細胞類型構成,如表皮細胞、根冠、軸柱、皮層、中柱鞘、維管細胞和形成根毛的生毛細胞,組織起來形成根組織或根區,例如,根尖、根表皮、分生組織區、初生根、側根、根毛和維管組織。分離為根特異性或根偏好的轉錄調控序列可在一種或幾種這些細胞類型中調控表達。該細胞特異性活性可用于特異性應用,如僅在分生細胞區中調控分生組織活性,或者僅在線蟲害蟲接觸的細胞類型中調控殺線蟲基因的表達。在本發明上下文中,就某組織或組織群(例如,根和仁)而言的術語“組織特異性轉錄”是指轉錄調控元件如此轉錄核酸序列,從而在整個植物中在其發育的任何一個階段期間,所述核酸序列在所述組織或組織群中的轉錄占由所述核酸序列轉錄的全部RNA量的 90%以上,優選95%以上,更優選99%以上。在本發明上下文中,就某組織或組織群(例如,根和仁)而言的術語“組織偏好的轉錄”是指轉錄調控元件如此轉錄核酸序列,從而在整個植物中在其發育的任何一個階段期間,所述核酸序列在所述組織或組織群中的轉錄占由所述核酸序列轉錄的全部RNA量的 50%以上,優選70%以上,更優選80%以上。“誘導型啟動子”指可在一種或多種細胞類型中被外部刺激,例如化學品、光、激素、脅迫或病原體開啟的那些可調型啟動子。“有效連接”指單鏈核酸片段上核酸序列的結合,使得一個核酸序列的功能受另一個核酸序列的影響。例如,如果調控DNA序列與編碼RNA或多肽的DNA序列的排布使得調控 DNA序列影響編碼DNA序列的表達(即,編碼序列或功能性RNA在啟動子的轉錄控制下), 則調控DNA序列被表述為“有效連接于”或“連于”編碼RNA或多肽的DNA序列。可將編碼序列以正義或反義方向有效連接到調控序列上。“表達”指植物中內源基因、ORF或其部分、或者轉基因的轉錄和/或翻譯。例如, 在反義構建體的情況中,表達可以僅指反義DNA的轉錄。另外,表達還指正義(mRNA)或功能性RNA的轉錄和穩定累積。表達也可指蛋白質的產生。“特異性表達”是基因產物的表達限于一種或幾種植物組織(空間限制)和/或限于植物的一個或幾個發育階段(時間限制)。普遍認為幾乎不存在真正的特異性啟動子似乎優選在一些組織中開啟,而在其他組織中可能不開啟或者僅有很小的活性。這種現象被稱作滲漏表達。然而,在本發明中特異性表達意味著在一個或幾個植物組織中的偏好表達。啟動子的“表達模式”(有或無增強子)是表達水平的模式,其表明在植物中何處、 在哪個發育階段,轉錄由所述啟動子引發。當一個啟動子的表達模式顯示與其他啟動子的表達模式幾乎不重疊時,將這組啟動子的表達模式稱作是互補的。可通過測量標準的轉錄報道分子mRNA的“穩態”濃度,確定啟動子的表達水平。這種測量是間接的,因為報道分子 mRNA的濃度不僅依賴于其合成速率,而且也依賴于mRNA被降解的速率。因此,穩態水平是合成速率和降解速率的乘積。然而,當所轉錄的序列相同時,降解速率可視為以固定速率進行,因此這個值可作為合成速率的衡量值。當以這種方式比較啟動子時,本領域技術人員可利用的技術是雜交 Sl-RNAse分析、Northern印跡和競爭性RT-PCR。該技術列表決不代表所有可利用的技術, 而僅僅是說明分析轉錄活性和mRNA的表達水平的常用方法。在幾乎所有啟動子中,轉錄起點的分析已經顯示轉錄起點通常不是單個堿基,而是一組或多或少簇集的起始位點,其中的每一個都是mRNA的某些起點。由于該分布隨著啟動子不同而變化,因此群體各個體中報道分子mRNA的序列相互之間也將不同。由于每種mRNA物質或多或少易于降解,因此不能預測不同報道分子mRNA的單個降解速度。對于多種真核啟動子序列來說,已證明圍繞起始位點(起始子)的序列在決定由該特定啟動子所指導的RNA表達水平中起著重要的作用。這也包括部分轉錄序列。因此啟動子與報道序列的直接融合將導致轉錄的亞適度水平。通常所使用的用于分析表達模式和水平的方法是通過測定細胞中蛋白質累積的 “穩態”水平。對于報告基因來說,本領域技術人員已知的通常使用的候選物是葡糖醛酸糖苷酶(⑶幻、氯霉素乙酰轉移酶(CAT)和具有熒光特性的蛋白質,如Aequora victoria 的綠色熒光蛋白(GFP)。然而,原則上,更多蛋白質適于這個目的,只要所述蛋白質不干擾基本的植物功能。許多工具適合定量和測定定位。例如,可很容易地創建或者獲得基于免疫化學、酶促、熒光檢測和定量的檢測系統。可使用蛋白質表達的原位分析測定植物組織提取物中或完整組織中的蛋白質水平。通常,具有嵌合啟動子報道構建體的單個轉化系的報道基因的表達水平將不同。 也常常觀察到這類轉化體不表達任何可檢測產物(RNA或蛋白質)的現象。盡管通常不清楚這種失活的分子機制基礎,但是表達的變異性通常歸咎于“位置效應”。“過表達”指轉基因細胞或生物體中表達的水平超過正常或者未轉化(非轉基因) 細胞或生物體中的表達水平。“反義抑制”指反義RNA轉錄物的產生能抑制內源性基因或轉基因的蛋白質表達。“基因沉默”指病毒基因、轉基因,或內源性核基因的依賴同源性的抑制。基因沉默可以是轉錄水平的,此時的抑制是由于受影響基因的轉錄降低,或者是轉錄后水平的,此時的抑制是由于與受影響的基因同源的RNA物質的周轉(降解)增加(English 1996)。基因沉默包括病毒誘導的基因沉默(Ruiz等1998)。術語“異源DNA序列”、“外源DNA片段”或“異源核酸”,如這里所使用的,每一個都指源于與特定宿主細胞異源來源的序列,或者如果來自同一來源,那么是從其原來形式中經過修飾的。因此,宿主細胞中的異源基因包括是特定宿主細胞的內源性基因,但是已經通過例如使用DNA改組進行過修飾。該術語也包括天然存在的DNA序列的非天然發生的多個拷貝。因此,該術語指外源的或與細胞異源,或者與細胞同源但是元件不在平常發現的宿主細胞核酸內的位置上的DNA片段。表達外源DNA片段以生產外源多肽。“同源”DNA序列是與其所引入的宿主細胞天然相關的DNA序列。在核苷酸序列同一性的上下文中,“同源”指兩核酸分子的核苷酸序列或者兩蛋白質分子的氨基酸序列之間的相似性。通過本領域技術人員充分理解的在嚴謹條件下的 DNA-DNA 或 DNA-RNA 雜交(如在 Haines 和 Higgins (編輯),Nucleic Acid Hybridization, IRL Press, Oxford, U. K.所描述的),或者通過兩核酸或蛋白質之間的序列相似性的比較提供這種同源性的評估。術語“基本上相似”指代表這里所具體公開的玉米或稻的轉錄調控序列的功能和 /或結構等同物的核苷酸和氨基酸序列。在其最廣泛的意思中,當談到核苷酸序列時,這里所使用的術語“基本上相似的” 是指核苷酸序列是基因的一部分,其編碼與由參照核苷酸序列的基因所編碼的多肽具有基本上相同結構和功能的多肽,例如,核苷酸序列包括是與參照核苷酸序列相應基因的直向同源物的基因的啟動子,以及在結構上與這里所舉例說明的啟動子序列相關的啟動子序列,g卩,基本上相似的啟動子序列與這里所舉例說明的啟動子序列的互補物在高或極高嚴謹條件下雜交。例如,僅僅反映遺傳密碼的簡并性、但編碼與特定氨基酸序列相同氨基酸序列的改變了的核苷酸序列,與該特定序列基本上相似。術語“基本上相似”也包括序列已被修飾以例如優化特定細胞內的表達的核苷酸序列,以及相對于由參照序列所編碼的(未修飾的)多肽,編碼具有一個或多個氨基酸取代的變體多肽的核苷酸序列,其中,相對于未修飾的多肽,取代不改變變體多肽的活性。在其最廣泛的意思中,當談到多肽時,這里所使用的術語“基本上相似的”是指多肽與參照多肽具有基本上相同的結構和功能。另外,與特定序列基本上相似的氨基酸序列是與本發明序列的全部氨基酸同一性至少為65%或者更高的那些。產生等同核苷酸或氨基酸序列的修飾在本領域的常規技術內。基本上相似的多肽和參照多肽之間的氨基酸序列同一性百分比為至少 65%、66%、67%、68%、69%、70%,例如 71 % ,72 % ,73 % ,74 %, 75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%,甚至 90%或者更高,例如 91%、92%、93%、94%、95%、96%、97%、98%,直至至少 99%,其中參照多肽是由具有SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、 28、29、56、57、58、61、62、63、66、67、68、71、72或73中任一序列的啟動子的基因所編碼的多肽,包括具有SEQ IDNO :4、9、17、25、30、59、64、69或74中任一序列的開放讀框的核苷酸序列,其編碼SEQ ID NO :5、10、18、26、31、60、65、70或75中任一序列。除了具有基本上相同的功能之外,兩多肽相互之間基本上相似的一個指標還在于特異性結合一條多肽的物質 (例如抗體),也特異性結合另一條。可使用Smith-Waterman 序列比對算法(見,例如,Waterman (1995)或者 http// www hto.usc.edu/software/seqaln/index.html)進行序列比較。優選使用具有如下參數的locals程序,1. 16版匹配1,錯配罰分0. 33,開放缺口罰分2,延伸缺口罰分2。此外,將與參照核苷酸序列“基本上相似”的核苷酸序列稱作參照核苷酸序列的 “等同物”。技術人員能夠認識到,本發明所包含的等同核苷酸序列也可通過它們在低、中等和/或嚴謹條件下(例如,0. 1XSSC,0. 1% SDS, 65°C )與本發明權利要求的文字范圍內的核苷酸序列雜交的能力來定義。當談到多核苷酸或多肽片段使用時,“基本上相同的活性”是指該片段具有全長多核苷酸或者全長多肽活性的至少65%、66%、67%、68%、69%、70%,例如71%、72%、 73%,74%,75%,76%,77%,78%,79%,80%,81 %,82%,83%,84%,85%,86%,87%, 88%、89%,甚至 90% 或更高,例如 91%、92%、93%、94%、95%、96%、97%、98%,直至至少 99%。“靶基因”指復制子上的基因,表達期望的靶編碼序列、功能性RNA或蛋白質。靶基因不是復制子復制必需的。另外,靶基因可包括插入到非天然生物體內的天然非病毒基因, 或者嵌合基因,并且將在適當的調控序列的控制下。因此,靶基因中的調控序列可來自任何來源,包括病毒。靶基因可包括與待轉化的特定植物的基因異源或同源的編碼序列。然而, 靶基因不包括天然病毒基因。典型的靶基因包括,但不限于結構蛋白、種子儲藏蛋白、傳達除草劑抗性的蛋白,以及傳達昆蟲抗性的蛋白的編碼基因。由靶基因編碼的蛋白質稱作“外源蛋白”。靶基因在植物中的表達一般地將產生改變的植物性狀。術語“改變的植物性狀”是指相對于野生型或非轉基因植物宿主,轉基因植物中的表型或基因型的改變。“復制基因”指編碼病毒復制蛋白的基因。除了復制蛋白的ORF外,復制基因也可含有其他重疊或非重疊0RF,如自然界在病毒序列中所發現的。這些額外的ORF盡管不是復制必需的,卻可以增強復制和/或病毒DNA累積。這類額外ORF的實例分別是ACMV和TGMV 雙生病毒中的AC3和AL3。“嵌合反式作用復制基因”指不同于天然病毒復制基因的復制基因,其中復制蛋白的編碼序列在可調型植物啟動子的控制下,或者修飾的天然病毒復雜基因,例如,其中在5’ 轉錄但不翻譯的區域中插入位點特異性序列。這種嵌合基因也包括在啟動子和轉錄起始位點之間插入結合復制蛋白的已知位點,削弱病毒復制蛋白基因的轉錄。“染色體整合的”指外源基因或DNA構建體通過共價鍵整合到宿主DNA內。如果基因不是“染色體整合的”,它們可以是“瞬時表達的”。基因的瞬時表達指沒有被整合到宿主染色體組內但獨立地起作用,例如,作為自主復制的質粒或表達盒的一部分,或者作為另一個生物系統如病毒的一部分的基因的表達。術語“轉化”指核酸片段轉移到宿主細胞的基因組內,導致遺傳上的穩定遺傳。將含有轉化核酸片段的宿主細胞稱作“轉基因”細胞,將包括轉基因細胞的生物體稱作“轉基因生物體”。轉化植物和植物細胞方法的實例包括農桿菌(Agrobacterium)介導的轉化(De Blaere 1987)和粒子轟擊技術(US 4,945,050)。整個植物可通過技術人員公知的方法從轉基因細胞中再生(見,例如,Fromm 1990)。“轉化的”、“轉基因的”和“重組的”指已引入異源核酸分子的宿主生物體,如細菌或植物。可通過本領域技術中通常已知的和公開的方法(Sambrook 1989 ;Innis 1995 ; Gelfand 1995 ;Innis&Gelfand 1999)將核酸分子穩定地整合到基因組內。已知的PCR法包括,但不限于,使用成對引物、嵌套引物、單特異性引物、簡并引物、基因特異性引物、載體特異性引物、部分錯配引物等引物的方法。例如,“轉化的”、“重組的”和“轉基因的”植物或愈傷組織已經歷轉化過程并含有整合到其染色體內的外源基因。術語“未轉化的”指沒有經歷轉化過程的正常植物。“瞬時轉化的”指已引入轉基因和外源DNA(例如,通過如農桿菌介導的轉化或生物射彈轟擊這樣的方法),但未經穩定維持選擇的細胞。“穩定轉化的”指已經選擇并在轉化后在選擇培養基上再生的細胞。“瞬時表達”指在通過病毒感染或通過如農桿菌介導的轉化、電穿孔或生物射彈轟擊這樣的方法引入病毒或轉基因,但未經穩定維持選擇的細胞表達。“遺傳上穩定的”和“可遺傳的”指在植物中穩定維持并由子代通過連續傳代而穩定遺傳的染色體整合的遺傳元件。“初級轉化體”和“TO代”指與最初轉化的組織同一遺傳代的轉基因植物(即,自轉化后沒有經歷減數分裂和受精)。“次級轉化體”和“T1、T2、T3代等”指初級轉化體通過一個或多個減數分裂和受精周期得到的轉基因植物。它們可來自初級或次級轉化體的自體受精或者初級或次級轉化體與其他轉化的或未轉化植物的雜交。“野生型”指天然發現的沒有任何已知突變的病毒或生物體。“基因組”指生物體的全部遺傳物質。
20
術語“核酸”指以單鏈或雙鏈形式的脫氧核糖核苷酸或核糖核苷酸及其多聚體,由含糖、磷酸鹽和堿基的單體(核苷酸)構成,其中堿基是嘌呤或嘧啶。除非特別限定,該術語包括含有天然核苷酸的已知類似物的核酸,其具有與參照核酸類似結合特性,并且以與天然存在的核苷酸類似的方式代謝。除非有其他指示,特定核酸序列也包括其保守修飾的變體(例如,簡并密碼子取代)和互補序列以及明確表示的序列。具體地,可通過用混合堿基和/或脫氧肌苷殘基取代所選的一個或多個(或者所有)密碼子的第三位所產生的序列來實現簡并密碼子取代(Batzer 1991 ;Ohtsuka 1985 ;Rossolinil994)。“核酸片段”是給定核酸分子的一部分。在高等植物中,脫氧核糖核酸(DNA)是遺傳物質,而核糖核酸(RNA) 參與將DNA內所含的信息傳遞給蛋白質。術語“核苷酸序列”指DNA或RNA的多聚體,其可以是單鏈或雙鏈,任選地含有能整合到DNA或RNA多聚體內的合成的、非天然的或改變的核苷酸堿基。術語“核酸”或“核酸序列”也可與基因、cDNA、DNA和由基因所編碼的RNA交換使用。本發明包括分離的或基本上純的核酸或蛋白質組合物。在本發明的上下文中,“分離的”或“純化的” DNA分子或者“分離的”或“純化的”多肽是通過人工方法獲得的,遠離其天然環境存在的DNA分子或多肽,因此不是自然的產物。分離的DNA分子或多肽可以純化形式存在或者可存在于非天然環境如轉基因宿主細胞中。例如,“分離的”或“純化的”核酸分子或蛋白質或其生物活性部分,當通過重組技術生成時,基本上無其他細胞材料或培養基, 或者當通過化學方法合成時,基本上無化學前體或其他化學品。優選“分離的”核酸不含核酸來源生物體基因組DNA中天然位于該核酸兩側(S卩,位于核酸的5'和3'端的序列)的序列(優選編碼蛋白質的序列)。例如,在多個實施方案中,分離的核酸分子可含有小于約 5kb,4kb,3kb,2kbUkb,0. 5kb或0. Ikb的側接核苷酸序列,其中所述側接核苷酸序列在核酸所來源的細胞的基因組DNA中天然地位于核酸分子的兩側。基本上不含細胞材料的蛋白質包括具有小于約30^^20^^10^5% (以干重計)污染蛋白的蛋白質或多肽制品。當通過重組生成本發明的蛋白質或其生物活性部分時,優選培養基代表小于約30<%、20%、10% 或5% (以干重計)的化學前體或非蛋白目的化學品。本發明的核苷酸序列包括天然存在的序列以及突變體(變體)形式。這類變體將繼續具有期望的活性,即,啟動子活性或者由非變體核苷酸序列的開放讀框所編碼的產物的活性。就序列(例如,多肽或核苷酸序列,例如本發明的轉錄調控核苷酸序列)而言,術語“變體”旨在表示基本上相似的序列。對于包括開放讀框的核苷酸序列,變體包括那些由于遺傳密碼子的簡并性而存在的編碼天然蛋白質的相同氨基酸序列的那些序列。天然發生的等位基因變體如可使用公知的分子生物學技術,例如用聚合酶鏈式反應(PCR)和雜交技術鑒定的這些。變體核苷酸序列也包括合成來源的核苷酸序列,例如通過使用定點誘變所產生的那些;以及對于開放讀框而言,編碼天然蛋白質,以及相對于天然蛋白質,編碼具有氨基酸取代的多肽的那些。通常,本發明的核苷酸序列變體與天然(野生型或內源)核苷酸序列相比,將具有至少40%、50%、60%,至70%,例如優選71%、72%、73%、74%、75%、 76%、77%、78%,至 79%,通常至少 80%,例如 81% -84%,至少 85 %,例如,86 %、87 %、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%,至 98% 以及 99% 的核苷酸序列同一性。
特定核酸序列“保守修飾的變異”指編碼相同或基本上相同氨基酸序列的那些核酸序列,或者其中核酸序列不編碼氨基酸序列,指基本上相同的序列。由于遺傳密碼子的簡并性,大量功能上相同的核酸編碼任何指定的多肽。例如,密碼子CGT、CGC、CGA、CGG、AGA 和AGG都編碼氨基酸精氨酸。因此,在精氨酸用密碼子表示的每個位置上,可將該密碼子變為所述相應密碼子中的任何一個,而不改變所編碼的蛋白質。這種核酸變異是“沉默變異”, 其是“保守性修飾變異”中的一種。這里所述的每個編碼多肽的核酸序列,也記述了每種可能的沉默變異,除非有其他注釋。本領域技術人員將會意識到可通過標準技術修飾核酸中的每個密碼子(除了 ATG,其平常僅是甲硫氨酸的密碼子)以產生功能相同的分子。因此, 編碼多肽的核酸的每個“沉默變異”是每個所述序列中固有的。可“優化”本發明的核酸分子以提高目的植物中的表達(見,例如,WO 91/16432 ; Perlak 1991 ;Murray 1989)。在該方式中,可利用植物偏好的密碼子合成基因的開放讀框或基因片段(見,例如,Campbell&GOwri,1990對宿主偏好密碼子使用的討論)。因此,可優化核苷酸序列用于任何植物的表達。人們公認,可優化或合成基因序列的全部或者任何一部分。換句話說,也可以使用合成的或部分優化的序列。變體核苷酸序列和蛋白質也包括,從誘變和重組方法如DNA改組中獲得的序列和蛋白質。可用這類方法操作一個或多個不同的編碼序列,以產生具有期望特性的新多肽。在該方式中,從大量包括序列基本上相同并能在體外或在體內同源重組的序列區域的相關序列多核苷酸群中產生重組多核苷酸文庫。這種DNA改組的策略在本領域技術中是公知的(見,例如,Stemmer 1994 ;Stemmer 1994 ;Crameri 1997 ;Moore 1997 ;Zhang 1997 ;Crameri 1998 ;以及 US 5,605,793 和 5,837,458)。“變體”多肽是指源自天然蛋白質的多肽,通過在天然蛋白質的N末端和/或C末端缺失(所謂的截短)或者添加一個或多個氨基酸;在天然蛋白質的一個或多個位點上缺失或添加一個或多個氨基酸;或者在天然蛋白質的一個或多個位點上取代一個或多個氨基酸。這種變體可以由于,例如,遺傳多態性或人為操作所產生。這類操作的方法通常是本領域已知的。因此,可以多種方式改變多肽,包括氨基酸取代、缺失、截短和插入。這種操作的方法通常是本領域已知的。例如,可通過DNA突變制備多肽的氨基酸序列變體。誘變和核苷酸序列改變的方法是本領域公知的(見,例如,Kunkel 1985 ;Kunkel 1987 ;US 4,873, 192 ; Walker&Gaastra,1983及其中所引用的參考文獻)。可在Dayhof降(1978)的模型中發現對不影響目的蛋白質的生物活性的適當氨基酸取代的指導。優選保守取代,如氨基酸與其他具有相似性質的氨基酸的交換。在編碼序列中,改變、添加或缺失單個氨基酸或小百分比的氨基酸(一般小于 5%,更一般地小于)的個別取代、缺失或添加是“保守性修飾變異”,其中,該改變導致用化學上相似的氨基酸取代另一個氨基酸。提供功能相似氨基酸的保守取代表是本領域公知的。如下五組中,每組都含有彼此是保守性取代的氨基酸脂肪族氨基酸甘氨酸(G)、 丙氨酸(A)、纈氨酸(V)、亮氨酸(L)、異亮氨酸(I);芳香族氨基酸苯丙氨酸(F)、酪氨酸 (Y)、色氨酸(W);含硫氨基酸甲硫氨酸(M)、半胱氨酸(C);堿性氨基酸精氨酸(I )、賴氨酸(K)、組氨酸(H);酸性氨基酸天冬氨酸(D)、谷氨酸(E)、天冬酰胺(N)、谷胺酰胺⑴)。 也見,Creight0n,1984。另外,編碼序列中改變、添加或缺失單個氨基酸或小百分比氨基酸的個別取代、缺失或添加也是“保守性修飾變異”。這里所使用的“表達盒”是指能在適當的宿主細胞中指導特定核苷酸序列表達的 DNA序列,包括有效連接于目的核苷酸序列的啟動子,其任選地有效連接于終止信號和/或其他調控元件。表達盒也可包括核苷酸序列的正確翻譯所必需的序列。編碼區通常編碼目的蛋白質,但也可編碼目的功能性RNA,例如正義或反義方向的反義RNA或非翻譯的RNA。包括目的核苷酸序列的表達盒可以是嵌合的,是指其至少一個組分對于其至少一個其他組分來說是異源的。表達盒也可以是這樣的表達盒,其是天然存在的,但以用于異源表達的重組體形式獲得。表達盒可以完全在細胞外裝配(例如,通過重組體克隆技術)。然而,表達盒也可以使用部分內源組分進行裝配。例如,表達盒可通過將啟動子序列置于(插入)內源序列上游獲得,其因此形成功能上相連的并通過所述啟動子序列控制的表達盒。同樣地,可將待表達核酸序列置于(或插入)內源性啟動子序列的下游,由此形成表達盒。表達盒中核苷酸序列的表達可在保守性啟動子的控制下,或者在僅在宿主細胞暴露于某些特定外部刺激時引起轉錄的誘導型啟動子的控制下。在多細胞生物體的情況中,啟動子也可以特異于特定的組織或器官或發育階段(例如,根/仁特異性或偏好性)。“載體”定義為包括,特別地,雙鏈或單鏈線性或環型的任何質粒、粘粒、噬菌體或農桿菌雙載體,其可以或者不能自我傳遞或移動,并且其可通過整合到細胞基因組內或者在染色體外存在(例如,具有復制起點的自主復制質粒)來轉化原核或真核宿主。特別包括穿梭載體,其意味著天然地或通過設計,能在兩種不同宿主生物體中復制的DNA載體,其可選自放線菌屬(Actinomycetes)和相關物種、細菌和真核生物(例如, 高等植物、哺乳動物、酵母或真菌細胞)。優選載體中的核酸在適當的啟動子或其他調控元件的控制下,并與之有效連接, 用于在宿主細胞如微生物,例如細菌,或者植物細胞中進行轉錄。載體可以是在多個宿主中起作用的雙功能表達載體。在基因組DNA的情況中,這可以包含其自己的啟動子或者其他調控元件,在cDNA的情況中,這可以是在用于在宿主細胞中表達的適當啟動子或者其他調控元件的控制下。“克隆載體”一般含有一個或少量限制性核酸內切酶識別位點以及適于在用克隆載體轉化的細胞的鑒定和選擇中使用的標記基因,可在所述內切酶識別位點上以可測定的方式插入外源DNA序列,而不喪失載體的基本生物功能。標記基因一般包括提供四環素抗性、潮霉素抗性或氨芐青霉素抗性的基因。“轉基因植物”為具有含表達載體的一個或多個植物細胞的植物。“植物組織”包括分化的和未分化的組織或植物,包括但不限于,根、莖、葉、花粉、 種子、腫瘤組織以及多種形式細胞和培養物,如單細胞、原生質體、胚以及愈傷組織。植物組織可以在植物或在器官中,可以是組織或細胞培養物。如下術語用于描述兩個或多個核酸或者多核苷酸之間的序列關系(a) “參照序列”,(b) “比較窗”,(c) “序列同一性”,(d) “序列同一性百分比”和(e) “基本相同”。(a)如這里所使用的,“參照序列”是用作序列對比基礎的定義序列。參照序列可為指定序列的子集或全部;例如,為全長cDNA或基因序列的片段,或者全長cDNA或基因序列。(b)如這里所使用的,“比較窗”涉及多核苷酸序列的連續指定片段,其中與用于兩序列最佳比對的參照序列(其不包括添加或缺失)相比,比較窗中的多核苷酸序列可包括添加或缺失(即,缺口)。通常,比較窗至少為20個連續的核苷酸,任選地可以是30、40、 50、100或者更長。本領域技術人員理解,為了避免由于多核苷酸序列中包含缺口而與參照序列具有高相似性,一般地引入缺口罰分并從匹配數中減去。用于比較的序列比對的方法是本領域公知的。因此,可使用數學算法完成任何兩個序列之間同一性百分比的測定。優選這類數學算法的非限制性實例是Myers和Miller, 1988的算法;Smith等1981的局部同源性算法;Needleman和^msch 1970的同源性比對算法;Pearson 和 Lipman 1988 的搜索相似性法;Karl in 和 Altschul,1990 的算法,在 Karlin 和Altschul, 1993中予以改進。可利用計算機執行這些數學算法用于序列的比較以確定序列同一性。這類執行包括,但不限于PC/Gene 程序(可從 htelligenetics,Mountain View, Calif.獲得)中的 CLUSTAL ;ALIGN 程序(2. 0 版)以及 Wisconsin Genetics 軟件包,8 版(可從 Genetics Computer Group (GCG), 575 Science Drive,Madison,Wis.,USA 中獲得)中的GAP、BESTFIT、 BLAST、FASTA和TFASTA。可使用默認參數進行使用這些程序的比對。已充分描述了 CLUSTAL 程序(Higgins 1988,1989 ;Corpet 1988 ;Huang 1992 ;Pearsonl994)。ALIGN 程序是基于 Myers 和 Miller 的算法,同前。Altschul 等,1990 的 BLAST 程序是基于 Karlin 和 Altschul 的算法,同前。公眾可通過國立生物技術信息中心(National Center for Biotechnology Information) (http: //www. ncbi. nlm. nih. gov/)獲得進行 BLAST 分析的軟件。該算法包括通過鑒定查詢序列中長度為W的短字節,首先鑒定高得分序列對(HSP),當與數據庫序列中同樣長度的字節比對時,其匹配或滿足某些正數閾值得分T。將T稱作鄰近字節得分閾值 (Altschul 1990)。這些最初的鄰近字節命中事件作為種子起始搜索,以發現含有它們的更長HSP。然后在兩個方向上沿著每個序列延伸字節命中,只要累積比對得分增加。使用參數 M(匹配殘基對的獎勵得分;總是>0)和N(錯配殘基的罰分;總是<0)計算核苷酸序列的累積得分。對于氨基酸序列,使用評分矩陣計算累積得分。當累積比對得分從其獲得的最大值下降量達X,累積得分由于一個或多個得負分的殘基比對的累積而變為零或者零以下, 或者到達序列的一端時,停止每個方向上字節命中的延伸。除了計算序列同一性百分比,BLAST算法也進行兩個序列之間相似性的統計學分析(見,例如Karlin&Altschul (1993)。由BLAST算法所提供的相似性的一個測量值是最小總概率(P (N)),為兩核苷酸或氨基酸序列之間將偶然發生匹配的概率指數。例如,如果在測試核酸序列與參照核酸序列的比較中最小總概率小于約0. 1,更優選小于約0.01,且最優選小于約0. 001,那么認為測試核酸序列與參照序列相似。為了獲得用于比較目的的缺口比對,可如Altschul等1997所述利用Gapped BLAST (BLAST 2.0)。可選地,可使用PSI-BLAST (BLAST 2.0)進行檢測分子之間的遠關系的重復搜索(見Altschul等,同前)。當利用BLAST, Gapped BLAST、PSI-BLAST時,可使用相應程序的默認參數(例如,用于核苷酸序列的BLASTN,用于蛋白質的BLASTX)。BLASTN程序 (用于核苷酸序列)使用如下默認值字長(W)為11、期望值(E)為10、截斷為100、M = 5、 N = _4,并且比較兩條鏈。對于氨基酸序列,BLASTP程序使用字長(W)為3、期望值(E)為 10 作為默認值,以及 BL0SUM62 評分矩陣(見,Henikoff&Henikoff,1989)。見 http://www.
24ncbi. nlm. nih. gov。也可通過目測人工進行比對。對于本發明的目的,優選使用具有默認參數的BlastN程序(1. 4. 7版或更新的版本)或者任何等同程序進行核苷酸的比較,用于測定與這里所公開的啟動子序列的序列同一性百分比。“等同程序”是指任何序列比較程序,當與通過優選程序所產生的相應比對比較時,其對于任何兩個所討論的序列都產生具有相同核苷酸或氨基酸殘基匹配和相同百分比序列同一性的比對。(c)如這里所使用的,在兩核酸或多肽序列的上下文中,“序列同一性”或“同一性” 是指在指定比較窗進行比對以獲得最大對應性時,兩序列中相同的殘基。當使用序列同一性百分比涉及蛋白質時,公認不相同的殘基位置常常由于保守性氨基酸取代而不同,其中將氨基酸殘基用具有相似化學特性(例如,電荷或疏水性)的其他氨基酸殘基取代,因此不改變分子的功能特性。當序列因保守性取代而不同時,可上調序列同一性百分比以修正取代的保守性。將由于這種保守取代而不同的序列稱作具有“序列相似性”或“相似性”。進行這種調整的方法是本領域技術人員公知的。一般這包括保守性取代作為部分而不是完全錯配進行評分,因此提高序列同一性百分比。因此,例如,對相同的氨基酸給1分,非保守性取代給0分,保守性取代給0和1之間的記分。計算保守性取代的得分,例如,如在程序PC/ GENEdntelligenetics, Mountain View, Calif.)中進行的那樣。(d)如這里所使用的,“序列同一性百分比”是指通過將兩個最佳比對序列對比較窗進行比較所測定的值,其中與用于兩個序列最佳比對的參照序列(其不包括添加或缺失)相比,比較窗中的多核苷酸序列中的部分可包括添加或缺失(即,缺口)。如下計算百分比測定兩個序列中出現相同核酸堿基或氨基酸殘基的位置數以產生匹配的位置數,將匹配的位置數除以比較窗中的總的位置數,并將結果乘以100以產生序列同一性百分比。(e)⑴術語“基本上相同”的多核苷酸序列是指與參照序列相比,多核苷酸包括具有至少 70%、71%、72%、73%、74%、75%、76%、77%、78%,或 79%,優選至少 80%,81%, 82%、83%、84%、85%、86%、87%、88%,或 89%,更優選至少 90 %、91 %、92 %、93 %,或 94 %,以及最優選至少95 %、96 %、97 %、98 %,或99 %序列同一性的序列,用所述使用標準參數的比對程序之一。本領域技術人員將會意識到,通過考慮密碼子簡并性、氨基酸相似性、閱讀框位置分布等因素,可將這些值適當地進行調整以確定相應的由兩個核苷酸序列所編碼的蛋白質的同一性。用于這些目的的基本相同的氨基酸序列通常意味著至少70%的序列同一性,更優選至少80 %、90 %,且最優選至少95 %。核苷酸序列基本上相同的另一指標是兩個分子是否在嚴謹條件下相互雜交(見下文)。通常,選擇嚴謹條件低于固定離子強度和PH時特定序列的熱解鏈溫度(Tm)約5°C。 然而,嚴謹條件包括約1°C到約20°C的溫度范圍,取決于期望的嚴謹度,如文中別處所限定的那樣。如果它們編碼的多肽基本上相同,那么嚴謹條件下不相互雜交的核酸仍然基本上相同。這可以發生,例如,當使用遺傳密碼子所允許的最大密碼子簡并性產生核酸的拷貝時。兩個核酸序列基本上相同的一個指標是由第一個核酸所編碼的多肽與由第二個核酸所編碼的多肽在免疫學上發生交叉反應。(ii)在肽的上下文中,術語“基本上相同”表示在所指定的比較窗上,肽包括與參照序列具有至少 70%、71%、72%、73%、74%、75%、76%、77%、78%,或 79%,優選 80%、 81 %,82 %,83 %,84%,85 %,86 %,87 %,88 %,或 89 %,更優選至少 90 %、91 %、92 %、CN 102277377 A
說明書
22/102 頁
93 %,或94 %,或者甚至優選95 %、96 %、97 %、98 %或99 %序列同一性的序列。優選使用 Needleman和^msch (1970)的同源性比對算法進行最佳比對。兩個多肽序列基本上相同的指標是一個肽與針對第二個肽所產生的抗體在免疫學上發生反應。因此,肽與第二個肽基本上相同,例如,其中兩個肽僅由于保守性取代而不同。對于序列比較,一般一個序列作為與測試序列比較的參照序列。當使用序列比較算法時,將測試和參照序列輸入到計算機中,如果必要的話,指定序列坐標,并指定序列算法程序參數。然后,基于指定的程序參數,序列比較算法計算測試序列相對于參照序列的序列同一性百分比。如上所指出的,兩個核酸序列基本上相同的另一個指標是兩個分子在嚴謹條件下相互雜交。當序列以復雜混合物(例如,總細胞DNA或RNA)存在時,術語“特異性雜交于” 指在嚴謹條件下分子僅與特定核苷酸序列結合、形成雙鏈體或雜交。“基本上結合”指探針核酸和靶核酸的互補雜交,并且包括可通過降低雜交介質的嚴謹性提供較小的錯配,以達到靶核酸序列的期望檢測。在核酸雜交試驗如Southern和Northern雜交的上下文中,“嚴謹雜交條件”和“嚴謹雜交洗滌條件”是序列依賴性的,并且在不同環境參數下是不同的。Tm是50%的靶序列與完全匹配的探針雜交的溫度(在固定的離子強度和PH條件下)。特異性一般是雜交后洗滌的函數,關鍵因素是離子強度和最后的洗滌溶液的溫度。對于DNA-DNA雜交,Tm可從 Meinkoth和Wahl,1984的等式中估計Tm = 81. 5"C +16. 6 (Iog10M) +0. 41(% GC)-0. 61 甲酰胺)-500/L其中,M是單價陽離子的摩爾濃度,% GC是DNA中鳥苷和胞嘧啶核苷酸的百分比,%甲酰胺是雜交溶液中甲酰胺的百分比,L是雜合體的堿基對長度。每發生錯配, Tm減少約1°C ;因此,可調整Tm、雜交,和/或洗滌條件以與期望同一性的序列雜交。例如, 如果尋找具有>90%同一性的序列,那么可將Tm降低10°C。通常,選擇嚴謹條件低于固定離子強度和PH時阿到序列和其互補物的熱解鏈溫度I約5°C。然而,嚴格嚴謹條件可在比熱解鏈溫度I低1、2、3或4°C時進行雜交和/或洗滌;中等嚴謹條件可在比熱解鏈溫度I 低6、7、8、9或10°C時進行雜交和/或洗滌;低嚴謹條件可在比熱解鏈溫度I低11、12、13、 14,15或20°C時進行雜交和/或洗滌。利用該等式、雜交和洗滌組合物以及期望的T,普通技術人員將會理解,雜交和/或洗滌溶液的嚴謹性的變動已予以內在地描述。如果期望的錯配程度導致T小于45°C (水溶液)或32°C (甲酰胺溶液),那么優選增加SSC濃度以便可使用更高的溫度。有關核酸雜交的詳盡指導可見Tijssen,1993。通常,選擇高嚴謹雜交和洗滌條件低于固定離子強度和PH時特定序列的熱解鏈溫度Tm約5°C。高嚴謹洗滌條件的實例是0. 15M NaCl,72°C約15分鐘。嚴謹洗滌條件的實例是于65°C用0. 2XSSC洗滌15分鐘(見,Sambrook,下文,對SSC緩沖液的描述)。常常,高嚴謹洗滌之前是低嚴謹洗滌,以除去背景探針信號。對于雙鏈體,例如100個以上核苷酸, 中等嚴謹洗滌的實例是在45°C用IX SSC洗滌15分鐘。對于雙鏈體,例如100個以上核苷酸,低嚴謹洗滌的實例是在40°C用6X SSC洗滌15分鐘。對于短探針(例如,約10-50個核苷酸),嚴謹條件一般包括小于約1. 5M的鹽濃度,優選約0. 01-1. 0Μ,ρΗ 7. 0-8. 3的鈉離子濃度(或者其他鹽),溫度一般是至少約30°C,對于長探針(例如,>50個核苷酸)至少約 60°C。也可通過添加去穩定劑如甲酰胺獲得嚴謹條件。通常,在特定雜交測定中,信噪比為無關探針所觀察到的2倍(或者更高),表示特異性雜交的檢測。如果它們編碼的蛋白質基本上相同,那么嚴謹條件下不相互雜交的核酸仍然是基本上相同的。這發生在,例如,當使用由遺傳密碼子所允許多最大密碼子簡并性產生核酸拷貝時。選擇非常嚴謹的條件是與特定探針的Tm相等。Southern或Northern印跡中濾膜上具有100個以上互補殘基的互補核酸的嚴謹雜交條件的實例是在50%甲酰胺,例如,在 50%甲酰胺,IM NaCl,l% SDS中于37°C雜交,以及在0. 1父55(中于60-651洗滌。示范性的低嚴謹條件包括在37°C用30-35%甲酰胺、IM NaCl, 1% SDS(十二烷基硫酸鈉)的緩沖液雜交,并在50_55°C,在IX至2XSSC(20XSSC = 3. OM NaCl/0. 3M檸檬酸三鈉)中洗滌。 示范性的中等嚴謹條件包括在37°C在40-45%甲酰胺、1. OM NaCl, 1% SDS(十二烷基硫酸鈉)中雜交,以及在55-60°C,在0. 5X至IXSSC中洗滌。如下是可用于克隆與本發明的參照核苷酸序列基本上相同的直向同源物核苷酸序列的雜交/洗滌條件設置的實例參照核苷酸序列優選在7%十二烷基硫酸鈉(SDS)、 0. 5M NaPO4UmM EDTA中與參照核苷酸序列于50°C雜交,用2 X SSC、0. 1%SDS于50°C洗滌; 還更期望在十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交,用1 XSSC、 0. SDS于50°C洗滌;還更期望在7%十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交,用0. 5XSSC、0. SDS于50°C洗滌;優選在7%十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交,用0. 1XSSC、0. SDS于50°C洗滌;更優選在7%十二烷基硫酸鈉(SDS) ,0. 5M NaPO4UmM EDTA 中于 50°C雜交,用 0. 1XSSC、0. 1 % SDS 于65°C洗滌。"DNA改組”是在DNA分子中引入突變或重排(優選隨機),或者在兩個或多個DNA 分子之間發生DNA序列的交換(優選隨機)的方法。由DNA改組所得到的DNA分子是改組的DNA分子,是從至少一個模板DNA分子中獲得的非天然發生的DNA分子。改組的DNA優選編碼對由模板DNA所編碼的多肽進行修飾的變體多肽,并且相對于由模板DNA所編碼的多肽,可以具有改變的生物學活性。“重組DNA分子”是使用重組DNA技術和用于將DNA序列連接在一起的方法連接在一起的DNA序列的組合,所述技術和方法如Sambrook等,1989所述。用語“植物”指任何植物,特別是農藝上有用的植物(例如,種子植物),“植物細胞”是植物的結構和生理單位,其包括細胞壁但也可指原生質體。植物細胞可以為分離的單細胞或培養細胞的形式,或者作為高級的有組織的單元的一部分,例如,植物組織,或者分化成存在于植物發育的任何階段的結構的植物器官。這類結構包括一種或多種植物器官, 包括但不限于果實、枝條(shoot)、莖、葉、花瓣等。優選術語“植物”包括整個植物、枝條營養器官/結構(例如,葉、莖和塊莖)、根、花和花器官/結構(例如,苞、萼片、花瓣、雄蕊、心皮、花藥和胚珠)、種子(包括胚、胚乳和種皮)和果實(成熟子房)、植物組織(例如,維管組織、基本組織等)及細胞(例如,保衛細胞、卵細胞、毛狀體等),及其子代。可在本發明中使用的植物的種類通常與適用于轉化技術的高等或低等植物的種類一樣寬,包括被子植物(單子葉和雙子葉植物)、裸子植物、蕨類以及多細胞藻類。其包括多種倍性水平的植物,包括非整倍體、多倍體、二倍體、單倍體和半合子。包括在本發明范圍內的是植物界的高等和低等植物的所有屬和種。此外包括成熟植物、種子、枝條和幼苗,以及從其衍生的部分、繁殖材料(例如,種子和果實)和培養物,例如細胞培養物。一年生、多年生的單子葉植物和雙子葉植物是用于產生轉基因植物的優選的宿主生物體。此外,在所有觀賞植物、林業、果實,或觀賞樹木、花、切花、灌木或草皮中使用重組系統或者根據本發明的方法是有利的。所述植物可包括但不限于苔蘚植物如苔綱Ofepaticae)(獐耳細辛屬(h印aticas))和蘚綱(Musci)(蘚類(mosses));蕨類植物 (pteridophyte)如蕨(fern)、馬尾(horsetail)和石松類(clubmosses);裸子植物如松柏綱(conifers)、蘇鐵綱(cycads)類植物、銀杏綱(ginkgo)以及買麻藤綱(Gnetaeae);藻類如綠藻綱(Chlorophyceae)、褐藻綱(Phaeophpyceae)、紅藻綱(Rhodophyceae)、粘藻綱 (Myxophyceae)、黃藻綱(Xanthophyceae)、娃藻綱(Bacillariophyceae)(娃藻(diatoms)) 禾口裸藻綱(Euglenophyceae)。用于本發明目的的植物可包括薔薇科(Rosaceae)家族如玫瑰,杜鵑花科(Ericaceae)如北美杜鵑花(rhododendrons)和杜鵑花(azaleas),大戟科 (Euphorbiaceae)如 M木(poinsettias)禾口巴豆(croton),石竹禾斗(Caryophyllaceae)如石竹花(pinks),茄科(Solanaceae)如矮牽牛花(petunias),苦苣苔科(Gesneriaceae)如非洲紫羅蘭(African violet),鳳仙花科(Balsaminaceae)如鳳仙花(touch-me-not),蘭科(Orchidaceae)如蘭花(orchids),鳶尾科(Iridaceae)如唐菖蒲(gladioli)、鳶尾屬植物(iris)、小蒼蘭(freesia)、番紅花(crocus),菊禾斗(Compositae)如萬壽菊(marigold), 牛兒苗禾斗(Geraniaceae)如天竺奏(geraniums),百合禾斗(Liliaceae)如Drachaena,桑禾斗 (Moraceae)如榕樹(ficus),天南星科(Araceae)如蔓綠絨(philodendron)和許多其他植物。此外,根據本發明的轉基因植物選自雙子葉農作物植物,如,例如選自豆科 (Leguminosae)的植物如豌豆、苜蓿和大豆;傘形科(Umbelliferae),特別是胡蘿卜屬(Daucus)(非常特別地是胡蘿卜(D.carota))和芹屬(Apium)(非常特別地是旱芹 (A. graveolens var. dulce))以及許多其他植物;茄科,特別是番茄屬(Lycopersicon) 和茄屬(Solanum),非常特別地是番茄(L. esculentum)、馬鈴薯(S. tuberosum)和茄子 (S.melongena)、煙草和許多其他植物;辣椒屬(Capsicum),非常特別地是辣椒(C. annum) 和許多其他植物;豆科(Leguminosae),特別是大豆屬(Glycine),非常特別地是大豆(G max)和許多其他植物;十字花科(Cruciferae),特別是蕓苔屬(Brassica),非常特別地是甘藍型油菜(B. napus)(油料種子油菜)、白菜型油菜(B. campestris)(甜菜)、甘藍 (B. oleracea cv Tastie)、花挪菜(B. oleracea cv Snowball Y)禾口挪菜(B. oleracea cv Emperor);擬南芥屬(Arabidopsis),非常特別地是擬南芥(A. thaliana)和許多其他植物; 菊科(Compositae),特別是萵苣屬(Lactuca),非常特別地是萵苣(L. sativa)和許多其他植物。另外優選是樹木,如蘋果樹、梨樹、溫柏、李樹、櫻桃樹、桃樹、油桃樹、杏樹、番木瓜樹、 芒果樹以及包括針葉樹和落葉樹的其他木本物種,如楊樹、松樹、美洲杉、雪松、橡樹等。最優選根據本發明的轉基因植物可選自單子葉作物植物。當指根據本發明的轉基因植物或指本發明的轉錄調控序列的來源時,術語“單子葉植物”旨在包括單子葉植物的所有科、屬和種。優選是禾本科(Gramineae)植物如,例如,谷類如玉米、稻、小麥、大麥、高粱、 栗、黑麥、黑小麥,或燕麥,以及其他非谷類單子葉植物如甘蔗或香蕉。尤其優選是谷物(玉米)、稻、大麥、小麥、黑麥和燕麥。最優選是玉米和稻的所有品種。“顯著增加”是大于測量技術固有誤差界限的增加,優選增加約2倍或更多。“顯著減少”是指大于測量技術固有誤差界限的減少,優選減少約2倍或更多。
發明詳述本發明提供分離的核酸分子,其包括在植物細胞中優選在單子葉植物中指導有效連接的核酸片段轉錄的植物核苷酸序列。具體地,本發明提供用于在單子葉植物中調控表達的表達盒,包括i)至少一個單子葉植物基因的轉錄調控核苷酸序列,所述的單子葉植物基因選自咖啡酰-CoA-O-甲基轉移酶基因、C8,7-固醇異構酶基因、富含羥脯氨酸的糖蛋白(HRGP)基因、乳酸脫氫酶基因以及葉綠體蛋白12樣基因,和與之功能性相連的ii)至少一個核苷酸序列,其與所述轉錄調控序列是異源的。優選本發明的轉錄調控核苷酸序列包括至少一個相應基因的啟動子序列(例如, 位于相應基因的轉錄起點上游,能誘導下游序列轉錄的序列)。本發明的轉錄調控核苷酸序列可包括所述基因的啟動子序列,但可進一步包括其他元件如5’ -非翻譯序列、增強子、內含子等。優選所述啟動子序列指導有效連接的核苷酸片段在植物或植物細胞中的轉錄,例如,連接的植物DNA包括結構或調控基因的開放讀框。本發明的轉錄調控序列可與多種5’非翻譯區、內含子(優選表達增強內含子)以及轉錄終止序列(在下文所更詳細地描述)組合。已證明,通過與內含子和/或轉錄終止序列的組合,可有利地調控本發明的轉錄調控序列的組織特異性。在大多數組合中,所得的表達盒顯示在根和仁中偏好性或特異性表達。然而,可獲得其他表達特異性(例如,組成型表達)。在根中具有表達活性的轉錄調控序列可用于改變根組織的功能,改進生長速度,改善對根偏好的病原體、害蟲、除草劑或不利天氣調控的抗性,用于土壤的解毒以及擴大植物可生長的土壤或環境的范圍。根豐富的或根特異性基因表達將提供一種機制,據此可改變形態學和代謝,以改善產量并生產更大量的有用蛋白質。然而,在某些組合中,轉錄調控序列可顯示強組成型表達譜。在需要在植物發育的所有(或者大部分)時間在所有(或者大部分)組織中表達的情況下,優選組成型啟動子。 其他組織特異性可以取決于與本發明的轉錄調控序列組合使用的調控元件。下表1舉例說明優選從中分離本發明啟動子的基因、所述基因的功能、所述基因編碼的cDNA,以及由所述基因編碼的蛋白質(ORF)。表1 優選從中分離本發明啟動子的基因、所述基因的推定功能、由所述基因編碼的cDNA和蛋白質
29
權利要求
1.在單子葉植物中調控表達的表達盒,包括i)至少一個單子葉植物基因的轉錄調控核苷酸序列,所述的單子葉植物基因選自C8, 7-固醇異構酶基因、富含羥脯氨酸的糖蛋白(HRGP)基因、乳酸脫氫酶基因以及葉綠體蛋白 12樣基因,和與之功能性相連的 )至少一個核苷酸序列,其與所述轉錄調控序列是異源的。
2.權利要求1的表達盒,其中轉錄調控核苷酸序列可從多肽編碼基因的單子葉植物基因組DNA中獲得,其中所述多肽al)包含單子葉植物乳酸脫氫酶蛋白的至少一個序列基序,所述序列基序選自如下氨基酸序列i)SLSELGFDA(SEQ ID NO 76),ii)VIGAGNVGMA(SE Q ID NO 77),iii)IVTAGARQI(SE Q ID NO 78),iv)L(F/Y)RKIVP(SE Q ID NO 79),ν)GFPASRV(SEQ ID NO 80),Vi)RF(L/I)AEHL(SEQ ID NO 81),vii)QAYMVGEH(SE Q ID NO 82),viii)ALEGIRRAV(SEQ ID NO :83),和ix)GYSVAS(L/I)A(SE Q ID NO 84),或者bl)編碼單子葉植物乳酸脫氫酶蛋白,與選自SEQ ID NO 至少90%的氨基酸序列同一性,或者b2)編碼單子葉植物富含羥脯氨酸的糖蛋白,與選自SEQ 具有至少90%的氨基酸序列同一性,或者b3)編碼單子葉植物C8,7-固醇異構酶蛋白,與SEQ ID 90 %的氨基酸序列同一性,或者b4)編碼單子葉植物葉綠體蛋白12樣蛋白,與SEQ ID NO :31所述的多肽具有至少90% 的氨基酸序列同一性,或者
3.權利要求1或2的表達盒,其中轉錄調控核苷酸序列來自玉米或稻植物。
4.權利要求1至3中任一項的表達盒,其中轉錄調控核苷酸序列來自選自稻C8,7-固醇異構酶基因、玉米富含羥脯氨酸的糖蛋白(HRGP)基因、玉米乳酸脫氫酶基因、稻葉綠體蛋白12基因及其功能等同物的植物基因。
5.權利要求4的表達盒,其中功能等同物基因編碼與選自SEQID NO :10、18、26、31、 60,65和75所述多肽具有至少90%氨基酸序列同一性的多肽。
6.在單子葉植物中調控表達的表達盒,包括a)至少一個在單子葉植物中有功能的轉錄調控核苷酸序列,其包含選自如下序列的至少一個序列i)SEQ ID NO :6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、 61、62、63、71、72和73所述的序列,和2=26,60和65所述的多肽具有 ID NO: 18和75所述的多肽 NO: 10所述的多肽具有至少ii)i)中序列的至少50個連續堿基的片段;和iii)與SEQID NO :6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、 58、61、62、63、71、72或73所述轉錄調控核苷酸序列基本上相似、具有至少60%序列同一性的核苷酸序列;和iv)能與SEQ ID NO :6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、四、56、 57、58、61、62、63、71、72或73所述的轉錄調控核苷酸序列或其互補物在7%十二烷基硫酸鈉(SDS)、0. 5麗aP04、lmM EDTA 中于 50°C雜交,用 2XSSC、0. SDS 于 50°C洗滌的條件下雜交的核苷酸序列;和ν)能與如下核酸雜交的核苷酸序列,其中所述核酸包含SEQ ID N0:6、7、8、ll、12、13、 14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、71、72 或 73 所述的轉錄調控核苷酸序列或其互補物的50至200個或更多個連續核苷酸;和vi)上述i)至ν)核苷酸序列中任一的互補物或反向互補物核苷酸序列, 禾口b)至少一個核酸序列,其與所述轉錄調控序列是異源的。
7.權利要求1至5中任一項的表達盒,其中轉錄調控核苷酸序列如權利要求6中所定義。
8.權利要求6或7的表達盒,其中權利要求6的ii)、iii)、iv)、v)和vi)中所定義的序列能夠在單子葉植物細胞或生物體中修飾轉錄。
9.權利要求6或7的表達盒,其中權利要求6的ii)、iii)、iv)、v)和vi)中所定義的序列與 SEQ ID NO :6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、四、56、57、58、 61、62、63、71、72或73所述的轉錄調控核苷酸序列基本上具有相同的轉錄調控活性。
10.權利要求6的表達盒,其中權利要求6的iv)或ν)中所定義的序列在7%十二烷基硫酸鈉(SDS)、0· 5M NaPO4UmM EDTA 中于 50°C雜交,用 0. 1XSSC、0. 1%SDS 于 65°C洗滌的嚴謹條件下與所指定的靶序列雜交。
11.權利要求1至10中任一項的表達盒,其中核酸序列的表達導致蛋白質的表達,或者反義RNA、正義或雙鏈RNA的表達。
12.權利要求1至11中任一項的表達盒,其中表達盒還包括至少一種選自如下的元件a)植物表達基因的5’非翻譯區,和b)植物表達基因的內含子序列,和c)植物表達基因的轉錄終止序列。
13.權利要求12的表達盒,其中轉錄終止序列選自SEQID NO :32、34和35所述的序列。
14.權利要求12的表達盒,其中5’非翻譯區與轉錄調控序列來自相同的基因。
15.權利要求12的表達盒,其中內含子序列具有增強表達的特性。
16.權利要求12或15的表達盒,其中內含子序列是遍在蛋白、肌動蛋白或醇脫氫酶基因的內含子。
17.權利要求1至16中任一項的表達盒,其中核酸序列的表達賦予植物農藝學上有價值的性狀。
18.分離的核酸序列,包含至少一個如SEQID NO :6、7、8、11、12、13、19、20或21所述的轉錄調控核苷酸序列。
19.載體,含有權利要求1至17中任一項所述的表達盒。
20.轉基因宿主細胞或者非人生物體,含有權利要求1至17中任一項所述的表達盒或者權利要求19所述的載體。
21.轉基因植物,含有權利要求1至17中任一項所述的表達盒或者權利要求19所述的載體。
22.用于在單子葉植物中鑒定和/或分離轉錄調控核苷酸序列的方法,其特征在于所述鑒定和/或分離利用如SEQ ID N0:10、18、26、31、60、65或75所述氨基酸序列的編碼核酸序列,或者至少15個堿基的所述核酸序列的部分。
23.權利要求22的方法,其中核酸序列如SEQID NO :9、17、25、30、59、64或74所述, 或其至少15個堿基的部分。
24.權利要求22或23的方法,其中所述鑒定和/或分離通過選自聚合酶鏈式反應、雜交和數據庫篩選的方法實現。
25.提供用于在單子葉植物中進行異源表達的轉基因表達盒的方法,包括步驟I.利用至少一個核酸序列或其部分從單子葉植物分離轉錄調控核苷酸序列,其中所述序列編碼SEQ ID N0:10、18、26、31、60、65或75所述的多肽,或者至少15個堿基的所述核酸序列的部分,和II.將所述轉錄調控核苷酸序列功能性連接于其他目的核苷酸序列,后者與所述轉錄調控核苷酸序列異源。
26.權利要求22至25中任一項的方法,其中分離所述轉錄調控核苷酸序列所采用的核苷酸序列編碼這樣的多肽,所述多肽包含 al)單子葉植物乳酸脫氫酶蛋白的至少一個序列基序,其中序列基序選自如下氨基酸序列i)SLSELGFDA(SEQIDNO:76)ii)VIGAGNVGMA(SEQIDNO:77)iii)IVTAGARQI(SEQIDNO:78)iv)L(F/Y)RKIVP(SEQIDNO:79)ν)GFPASRV(SEQIDNO:80)Vi)RF(L/I)AEHL(SEQIDNO:81)vii)QAYMVGEH(SEQIDNO:82)viii)ALEGIRRAV(SEQIDNO:83)ix)GYSVAS(L/I)A(SEQIDNO:84)
全文摘要
本發明涉及在單子葉植物中調控表達的表達盒,包括至少一個可從如下單子葉植物基因中獲得的轉錄調控核苷酸序列咖啡酰-CoA-O-甲基轉移酶基因、C8,7-固醇異構酶基因、富含羥脯氨酸的糖蛋白(HRGP)基因、乳酸脫氫酶基因以及葉綠體蛋白12樣基因。更優選轉錄調控序列可從玉米或稻中獲得。所述轉錄調控序列對于根/仁偏好性表達、葉/胚乳偏好性表達、根/穗絲/仁偏好性表達或組成型表達尤其有用。
文檔編號C12Q1/68GK102277377SQ20111023447
公開日2011年12月14日 申請日期2006年2月8日 優先權日2005年2月9日
發明者A·多布森, C·E·羅赫, C·達曼, E·托倫, H-S·宋, M·莫拉 申請人:巴斯福植物科學有限公司