新型玉米泛素啟動子的制作方法
【專利摘要】玉米栽培種B73泛素?1(玉米栽培種B73 Ubi?1)啟動子在植物中驅動組成型轉基因的高水平表達。在多基因構建體中反復使用相同的玉米栽培種B73 Ubi?1啟動子還會導致基因沉默,從而使轉基因產物有效性降低。提供了基因調控啟動子元件、構建體,和使用來自不同玉米基因型玉米栽培種LLN37的Ubi?1啟動子的基因調節元件在植物細胞和/或植物組織中表達轉基因的方法。
【專利說明】新型玉米泛素啟動子
[0001 ]相關專利申請相互參考
[0002]本申請要求根據35USC§ 119 (e)獲得于2013年12月31日提交的美國臨時專利申請 系列號61/922,525的利益,其全部公開內容通過提述并入本文。
[0003]援引電子提交的序列表
[0004] 序列表的正式拷貝已作為ASCII格式序列表通過EFS-Web電子提交,文件名為 "75663_ST25.txt",創建于2014年12月30日,大小為13.4千字節,并與本說明書同時提交。 該ASCII格式文檔中包含的序列表是本說明書的一部分,并且其全部內容通過提述并入本 文。 發明領域
[0005] 本發明一般地涉及植物分子生物學領域,更具體地,涉及在植物中表達轉基因的 領域。
[0006] 背景
[0007] 許多植物物種能夠被轉基因轉化,以引入農藝學期望的性狀或特征。開發和/或修 飾植物物種使之具有特定的期望性狀。一般地,期望的性狀包括,例如,提高營養價值品質、 增加產量、賦予病蟲害抗性、提高干旱和脅迫耐受性、提高園藝品質(例如,色素沉著和生 長)、賦予除草劑抗性、能夠從植物生產工業上有用的化合物和/或材料,和/或賦予生產藥 物的能力。
[0008] 通過植物轉化技術產生在單個基因組座位上堆疊多個轉基因的轉基因植物物種。 植物轉化技術將轉基因引入到植物細胞中,回收在植物基因組中穩定整合了轉基因拷貝的 能育的轉基因植物,隨后通過轉基因的轉錄和翻譯進行轉基因表達,從而產生具有期望性 狀和表型的轉基因植物。不過,能夠產生高表達以性狀堆疊的形式工程構建的多個轉基因 的轉基因植物物種的辦法是令人期望的。
[0009] 類似地,能夠在植物的特定組織或器官中表達轉基因的辦法也是令人期望的。例 如,通過用病原體抗性基因轉化植物基因組從而使病原體抗性蛋白在植物的根部強烈表 達,可能實現植物對土壤源性病原體感染的抗性提高。或者,可能期望在處于特定生長或發 育階段,例如細胞分裂或伸長期,的植物組織中表達轉基因。
[0010] 本文描述了玉米ubi-l啟動子調節元件,其包括啟動子、上游啟動子、5'-UTR和內 含子。進一步描述了使用該基因調節元件的構建體和方法。
[0011] 概要
[0012] 本文公開了用于在植物細胞和/或植物組織中表達轉基因的啟動子、構建體和方 法。在一個實施方案中,轉基因的表達包括使用啟動子。在一個實施方案中,啟動子包含多 核苷酸序列。在一個實施方案中,啟動子多核苷酸序列包含上游啟動子,5'-非翻譯區(5'_ UTR)或前導序列,和內含子。在一個實施方案中,啟動子多核苷酸序列包含泛素-1基因 (Ubi-l)。在一個實施方案中,啟動子多核苷酸序列包含玉米(Z.mays)的Ubi-l基因。
[0013] 在一個實施方案中,構建體包括基因表達盒,所述基因表達盒包含從玉米Ubi-l基 因獲得的啟動子多核苷酸序列。在一個實施方案中,來自玉米的Ubi-i啟動子多核苷酸序列 包括上游啟動子區,5'-UTR或前導序列,和內含子。在一個實施方案中,構建體包括基因表 達盒,所述基因表達盒包含從玉米Ubi-1基因獲得的啟動子多核苷酸序列,該啟動子多核苷 酸序列與來自杯水母屬(Phialidium)物種的黃色熒光蛋白編碼基因(PhiYFP)的內含子融 合。在一個實施方案中,構建體包括基因表達盒,該基因表達盒包含來自玉米Ubi-1基因的 啟動子多核苷酸序列,所述啟動子多核苷酸序列與來自杯水母屬物種的黃色熒光蛋白編碼 基因(PhiYFP)的內含子融合,隨后是來自玉米過氧化物酶5基因(ZmPer5)的3'-非翻譯區 (3'-UTR)。所得的多核苷酸序列包括新的啟動子基因調控元件。
[0014] 在一個實施方案中,基因表達盒包括與轉基因或異源編碼序列可操作連接的基因 啟動子調節元件。在一個實施方案中,基因表達盒包括至少1、2、3、4、5、6、7、8、9、10個或更 多個轉基因。
[0015] 本文公開了培植植物的方法,所述植物使用新型基因啟動子調節元件(例如,上游 啟動子,5'-UTR和內含子)表達轉基因。本文還公開了培養植物組織和細胞的方法,所述植 物組織和細胞使用新的基因啟動子調節元件表達轉基因。在一個實施方案中,本文公開的 方法包括植物葉、根、愈傷組織和花粉中的組成型基因表達。本文還公開了純化包含新的基 因啟動子調節元件的多核苷酸序列的方法。
[0016] 附圖簡述
[0017]圖1顯示構成玉米栽培種B73Ubi-l基因的示意性的新型啟動子。該啟動子包括上 游元件、5'-UTR或前導序列,和內含子。該上游元件位于轉錄起始位點(TSS)的5'上游,用長 箭頭指示。該上游元件由調節元件(例如TATA盒,用短箭頭指示)和熱休克元件(用星號指 示)構成。
[0018] 圖2顯示了載體pDAB105714的質粒圖,其包括PCR擴增的玉米栽培種LLN37Ubi-l基 因的啟動子序列。
[0019]圖3顯示了玉米栽培種B73Ubi-l基因對照啟動子(SEQ ID N0:1)的多核苷酸序列, 上游啟動子區用下劃線指示,5'-UTR/前導序列用陰影指示,內含子區用小寫字母指示。
[0020]圖4顯示了玉米栽培種LLN37UM-1啟動子(SEQ ID N0:2)的多核苷酸序列,上游啟 動子區用下劃線指示,5'-UTR/前導序列用陰影指示,內含子區用小寫字母指示。
[0021]圖5顯示了玉米栽培種LLN37的上游啟動子區(SEQ ID如:4)與玉米栽培種873的 對照上游啟動子序列(SEQ ID N0:3)的多核苷酸序列比對。
[0022] 圖6顯示了玉米栽培種LLN37的5'-UTR/前導區(SEQ ID N0:6)與玉米栽培種B73的 對照5'-UTR/前導序列(SEQ ID N0:5)的多核苷酸序列比對。
[0023]圖7顯示了玉米栽培種LLN37的內含子區(SEQ ID如:8)與玉米栽培種873的對照 內含子序列(SEQ ID N0:7)的多核苷酸序列比對。
[0024]圖8顯示了二元表達構建體pDAB105748的載體圖,其包括插入在目的載體 pDABl0197中的對照入門載體pDABl05742(玉米栽培種B73)。
[0025]圖9顯示了二元表達構建體pDAB105747的載體圖,其包括插入在目的載體 PDAB10197中的入門載體pDAB105741(玉米栽培種LLN37)。
[0026] 圖10顯示了二元表達構建體pDAB105748(玉米栽培種B73)和pDAB105747(玉米栽 培種LLN37)的Phi YFP基因在T。植物愈傷組織中的表達。
[0027] 圖11顯示了二元表達構建體pDAB105748(玉米栽培種B73)、pDAB105747 (玉米栽培 種LLN37)和陰性對照的Phi YFP基因在Ti植物花粉中的表達。
[0028] 詳細說明
[0029] 定義
[0030] 如本文所使用的,除非在上下文中清晰且明確地指出,否則冠詞"一"、"一個"和 "該"包括復數指代。
[0031]如本文所使用的,術語"回交"是指如下的過程,其中育種者將雜交后代與其中一 個親本雜交,例如第一代雜交體F1與F1雜交體的親本基因型的其中一個雜交。
[0032] 如本文所使用的,術語"內含子"是指基因(或者被表達的感興趣核苷酸序列)中包 含的任何被轉錄但不被翻譯的核酸序列。內含子包括被表達的DNA序列內的非翻譯核酸序 列,以及從其轉錄的RNA分子中的相應序列。
[0033] 本文所述的構建體還可以包含可增強翻譯和/或mRNA穩定性的序列,例如內含子。 這樣的一個內含子的實例是擬南芥組蛋白H3變異體基因 II的第一內含子,或者任何其它公 知的內含子序列。內含子可以和啟動子序列組合使用,以提高翻譯和/或mRNA穩定性。
[0034]如本文所使用的,術語"5 '非翻譯區"或"5 ' -UTR"是指前mRNA或成熟mRNA 5 '端的 非翻譯區段。例如,在成熟的mRNA上,5 ' -UTR通常在其5 '端有一個7-甲基鳥苷帽,并且參與 許多過程,例如剪接、多酰苷酸化、mRNA外排到細胞質、mRNA的5 '端被翻譯機構識別,和保護 mRNA免于降解。
[0035]如本文所使用的,術語"3'非翻譯區"或"3'-UTR"是指前mRNA或成熟mRNA 53'端的 非翻譯區段。例如,在成熟的mRNA上,這個區域具有多-(A)尾巴,并且已知在mRNA穩定性、翻 譯起始和mRNA外轉運中具有多種功能。
[0036] 如本文所使用的,術語"多腺苷酸化信號"是指mRNA轉錄本中存在的核酸序列,其 在多-(A)聚合酶存在時允許轉錄本的多酰苷酸化位點(例如位于多-(A)信號下游10-30個 堿基)多酰苷酸化。許多多酰苷酸化信號是本領域已知的,并可用于本發明。一個示例性序 列包括AAUAAA及其變異體,如Loke J.,et al.,(2005)Plant Physiology 138(3); 1457-1468所述。
[0037] 如本文所使用的,術語"分離的"是指與該組分自然存在的生物體細胞中的其它生 物組分(即,其它染色質和染色質外DNA)分離的生物組分(包括核酸或蛋白質)。
[0038] 如本文所使用的,在指示核酸分子時,術語"純化的"不需要絕對的純(例如,同質 的制備物)。相反,它表示該序列比其在天然的細胞環境中相對更純。例如,核酸的"純化"水 平在濃度或基因表達水平上應當比自然水平大至少2-5倍。
[0039]請求保護的DNA分子可以從總DNA或總RNA中直接分離。此外,cDNA克隆不是自然存 在的,但優選地通過對部分純化的、天然存在的物質(信使RNA)進行操作而得。從mRNA構建 cDNA文庫涉及創制合成的物質(cDNA)。單個cDNA克隆能夠通過對攜帶cDNA文庫的細胞進行 克隆選擇而從合成文庫中純化。因此,包括從mRNA構建cDNA文庫和純化不同cDNA克隆的過 程會產出純化大約1 〇6倍的天然信息。類似地,啟動子DNA序列可以被克隆到質粒中。這種質 粒不是天然存在的,而是優選地通過對部分純化的、天然存在的物質例如基因組DNA文庫進 行操作而獲得的。因此,在這些技術中,優選地使純化放大至少1個數量級,在一些實施方案 中,放大2個或3個數量級,在其它實施方案中,放大4個或5個或更多個數量級。
[0040] 類似地,純化表示組分DNA序列發生了化學或功能上的改變。"被純化"的核酸分子 和蛋白質包括通過標準純化方法純化的核酸分子和蛋白質。術語"純化的"還包括通過重組 DNA方法在宿主細胞(例如植物細胞)中制備的核酸和蛋白質,以及化學合成的核酸分子、蛋 白質和肽。
[0041] 術語"重組的"意思是其中發生了遺傳重組的細胞或生物體。它還包括通過人為干 預被人工或合成(即非自然的)改變的分子(例如,載體、質粒、核酸、多肽或小RNA)。對分子 進行改變可以在其自然環境或狀態下執行或者從其自然環境或狀態下移除。
[0042] 如本文所使用的,術語"表達"是指多核苷酸被轉錄成mRNA(包括小RNA分子)的過 程,和/或被轉錄的mRNA(也稱作"轉錄本")被隨后翻譯成肽、多肽或蛋白質的過程。基因表 達可能受到外部信號的影響,例如細胞、組織或生物體暴露于可增加或降低基因表達的試 劑。基因的表達還可以在從DNA到RNA到蛋白質的通路的任何位置被調節。基因表達的調節 通過例如控制轉錄、翻譯、RNA轉運和加工、中間分子如mRNA的降解,或者通過在特定蛋白質 分子被制造出后使它們激活、失活、區室化或降解,或者通過它們的組合,而發生。基因表達 可以在RNA水平或蛋白質水平通過本領域已知的任何方法進行測量,包括但不僅限于, Northern印跡、RT_PCR、Western印跡、或者體外、原位或體內蛋白活性測定。
[0043] 如本文所使用的,術語"基于同源性的基因沉默"或"HBGS"是通用術語,其包括轉 錄基因沉默和轉錄后基因沉默。靶基因座被非連鎖的沉默基因座沉默可以由轉錄抑制(轉 錄基因沉默;TGS)或mRNA降解(轉錄后基因沉默;PTGS)導致,它們分別是由于產生了相應于 啟動子或轉錄序列的雙鏈RNA(dsRNA)。每個過程涉及不同的細胞組分,這表明dsRNA誘導的 TGS和PTGS很可能來自于一個共同的古老機制的多樣化。然而,難以進行對TGS和PTGS的嚴 格比較,因為這一般依賴于對不同沉默基因座的分析。單個轉基因座位可以被描述為可觸 發TGS和PTGS二者,因為它會產生相應于不同靶基因的啟動子和被轉錄序列的dsRNA。
[0044] 如本文所使用的,術語"核酸分子"、"核酸"或"多核苷酸"(所有這三個術語彼此之 間是同義的)是指多聚體形式的核苷酸,其可以包括RNA、cDNA、基因組DNA的有義和反義鏈, 及其合成形式和混合聚合物。"核苷酸"可以指核糖核苷酸、脫氧核糖核苷酸或或任一種核 苷酸的修飾形式。除非另外指出,否則核酸分子的長度通常為至少10個堿基。該術語可以指 不定長度的RNA或DNA分子。該術語包括單鏈和雙鏈形式的DNA。核酸分子可以包括天然存在 的和/或經過修飾的核苷酸,藉由天然存在的和/或非天然存在的核苷酸鍵連而連接在一 起。
[0045] 核酸分子可以被化學修飾或者生物化學修飾,或者可以包含非天然的或衍生化的 核苷酸堿基,這是本領域技術人員可以容易理解的。這些修飾包括,例如,標簽、甲基化、一 個或多個天然發生的核苷酸用類似物取代、核苷酸內部修飾(例如不帶電的連接:例如,甲 基膦酸酯,磷酸三酯,磷酰胺,氨基甲酸酯等;帶電荷的連接:例如,硫代磷酸酯,二硫代磷酸 酯等;懸垂部分:例如,肽;嵌入劑:例如,吖啶,補骨脂素等;螯合劑;烷化劑;和修飾的鍵:例 如,a異頭核酸等)。術語"核酸分子"還包括任何拓撲構象,包括單鏈、雙鏈、部分雙鏈體、三 鏈體(triplexed),發針式(hairpinned),圓形和掛鎖構象。
[0046] 轉錄沿著DNA鏈沿著5'-3'的方式前進。這意味著,RNA的制備是通過向生長鏈的3' 端順次添加核糖核苷酸_5'_三磷酸(要求清除焦磷酸)。在線性或環狀核酸分子中,如果離 散的元件(例如,特定的核苷酸序列)鍵合或者將要鍵合于相同核酸上的其他元件的5'方 向,則其被稱作位于該其他元件的"上游"。類似地,如果離散的元件鍵合或者將要鍵合于相 同核酸上的其他元件的3'方向,則其被稱作位于該其他元件的"下游"。
[0047]如本文所使用的,術語"堿基位置"是指給定堿基或核苷酸殘基在指定核酸內的位 置。指定的核酸可以通過與參考核酸進行比對加以定義。
[0048]如本文所使用的,術語"雜交"是指多核苷酸或寡核苷酸和它們的類似物通過互補 堿基之間的氫鍵鍵合而雜交的過程,氫鍵包括Wat son-Crick、Hoogs teen或反向Hoogsteen 氫鍵。一般地,核酸分子包括含氮堿基,含氮堿基是嘧啶(胞嘧啶(C),尿嘧啶(U)和胸腺嘧啶 (T))或者嘌呤(腺嘌呤(A)和鳥嘌呤(G))。這些含氮堿基在嘧啶與嘌呤之間形成氫鍵,嘧啶 與嘌呤的鍵合稱作"堿基配對"。更具體地,A與T或U氫鍵鍵合,G與C鍵合。"互補"是指兩個不 同核酸序列或同一核酸序列的兩個不同區域之間發生的堿基配對。
[0049]如本文所使用的,術語"可特異性雜交"或"特異性互補"是指足夠程度的互補性, 使得在寡核苷酸/多核苷酸和DNA或RNA靶之間發生穩定而特異的結合。寡核苷酸/多核苷酸 不需要與祀序列100 %互補才能特異性雜交。當寡核苷酸/多核苷酸與革EDNA或RNA分子的結 合會干擾靶DNA或RNA的正常功能,并且存在足夠程度的互補性以避免寡核苷酸/多核苷酸 在特異性結合所期望的條件下(例如在體內測定或系統的生理條件下)與非靶序列發生非 特異性結合時,寡核苷酸/多核苷酸是可特異性雜交的。這種結合被稱作特異性雜交。導致 特定嚴格程度的雜交條件隨著所選雜交方法的性質和雜交核酸序列的組成和長度而改變。 一般地,雜交溫度和雜交緩沖液的離子強度(特別是Na+和/或Mg 2+濃度)對雜交嚴格度有貢 獻,但清洗次數也會影響嚴格度。關于獲得特定嚴格程度所需的雜交條件的計算在 Sambrooket al. (ed.),Molecular Cloning: A Laboratory Manual,第2版,第1-3卷,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York, 1989中有討論。
[0050]如本文所使用的,術語"嚴格條件"包括如下條件,其中只有當雜交分子和DNA靶之 間的錯配小于50 %時才會發生雜交。"嚴格條件"包括進一步特定水平的嚴格性。因此,如本 文所使用的,"中等嚴格"條件是指序列錯配超過50%的分子不會雜交的條件;"高嚴格"條 件是指序列錯配超過20 %的序列不會雜交的條件;和"極高嚴格"條件是指序列錯配超過 10%的序列不會雜交的條件。在特定的實施方案中,嚴格條件可以包括在65°C雜交,隨后在 65°C用0. lx SSC/0.1 %SDS清洗40分鐘。下面是代表性的、非限制性的雜交條件:
[00511 ?極高嚴格性:在5x SSC緩沖液中65°C雜交16個小時;在2x SSC緩沖液中室溫下 清洗2次,每次15分鐘;和在0.5x SSC緩沖液中65 °C清洗2次,每次20分鐘。
[0052] ?高嚴格性:在5-6x SSC緩沖液中65-70°C雜交16-20個小時;在2x SSC緩沖液中 室溫下清洗2次,每次5-20分鐘;和在lx SSC緩沖液中55-70°C清洗2次,每次30分鐘。
[0053] ?中等嚴格性:在6x SSC緩沖液中在室溫-55°C雜交16-20個小時;在2-3x SSC緩 沖液中室溫下清洗至少2次,每次20-30分鐘。
[0054] 在一個實施方案中,可特異性雜交的核酸分子能夠在極高嚴格性雜交條件下保持 結合。在一個實施方案中,可特異性雜交的核酸分子能夠在高嚴格性雜交條件下保持結合。 在一個實施方案中,可特異性雜交的核酸分子能夠在中等嚴格性雜交條件下保持結合。
[0055] 如本文所使用的,術語"寡核苷酸"是指短核酸多聚體。寡核苷酸可以通過切割長 核酸區段或者通過聚合單個核苷酸前體而形成。自動合成儀允許合成長度達數百個堿基對 的寡核苷酸。因為寡核苷酸可以結合互補的核苷酸序列,所以它們被用作檢測DNA或RNA的 探針。由DNA構成的寡核苷酸(寡脫氧核糖核苷酸)可以用在聚合酶鏈式反應中,這是一種用 于擴增小DNA序列的技術。在聚合酶鏈式反應中,寡核苷酸通常被稱作"引物",其允許DNA聚 合酶延伸寡核苷酸并復制互補鏈。
[0056]如本文所使用的,術語"聚合酶鏈式反應"或"PCR"是指一種微量的核酸、RNA和/或 DNA被擴增的程序或技術,其中,如美國專利No. 4,683,195所述。一般地,來自感興趣區域末 端或超過該末端的序列信息必須可得,才能設計寡核苷酸引物;這些引物在序列上與待擴 增模板的相對鏈相同或相似。兩個引物的5'端核苷酸可以和被擴增材料的末端一致。PCR可 用于擴增特定的RNA序列,從總基因組DNA中擴增特定的DNA序列,和從總細胞RNA、噬菌體或 質粒序列中轉錄cDNA,等。一般地參見Mu 11 i s e t a 1 ?,Co 1 d Spr i ng Harbor Symp ? Quant .Biol. ,51:263(1987); Erlich編輯,PCR Technology,(Stockton Press,NY, 1989)〇
[0057] 如本文所使用的,術語"引物"是指當條件適合于合成引物延伸產物時,能夠作為 沿著互補鏈的合成起始點的寡核苷酸。合成條件包括四種不同的脫氧核糖核苷酸三磷酸和 至少一種聚合誘導劑例如逆轉錄酶或DNA聚合酶的存在。它們處于合適的緩沖液中,該緩沖 液包括輔助因子或可以在各種合適的溫度下影響條件(例如pH等)的成分。引物優選地是單 鏈序列,從而可以使擴增效率最佳,但是也可以使用雙鏈序列。
[0058] 如本文所使用的,術語"探針"是指與靶序列雜交的寡核苷酸或多核苷酸序列。在 TaqManK STaqManK類測定程序中,探針與位于兩個引物退火位點之間的靶部分雜交。 探針包括大約8個核苷酸,大約10個核苷酸,大約15個核苷酸,大約20個核苷酸,大約30個核 苷酸,大約40個核苷酸,或者大約50個核苷酸。在一些實施方案中,探針包括大約8個核苷 酸-大約15個核苷酸。
[0059]在Southern印跡測定程序中,探針與附著在膜上的DNA片段雜交。在這種測定中, 探針包括大約10個核苷酸,大約100個核苷酸,大約250個核苷酸,大約500個核苷酸,大約1, 〇〇〇個核苷酸,大約2,500個核苷酸,或者大約2,500個核苷酸。
[0060] 探針可以進一步包括可檢測的標簽,例如放射性標簽、生物素化標簽、熒光團( Texas-.RedK),異硫氰酸熒光素,等)。可檢測的標簽可以直接共價連接到探針寡核苷酸上, 例如位于探針的5 '端或探針的3 '端。包含焚光團的探針還進一步包括淬滅劑(例如Black Hole Quencher?,Iowa Black?等)〇
[0061] 如本文所使用的,術語"序列同一性"或"同一性"可以互換使用,指當通過比對兩 個序列以在特定比較窗口上實現最大的相應度時,兩個序列中相同的核酸殘基。
[0062] 如本文所使用的,術語"百分比序列同一性"是指通過比較在比較窗口上最佳比對 的序列(例如,核酸序列或氨基酸序列)而確定的數值,其中為了使兩個序列實現最佳比對, 一個序列在比較窗口中的部分與參考序列(其不包含添加或缺失)相比,可以包含添加或缺 失(即,缺口)。通過確定兩個序列中出現相同核酸或氨基酸殘基的位置的數目以產生匹配 位置的數目,用匹配位置的數目除以比較窗口中的位置總數,所得結果乘以1〇〇計算出百分 數,從而產生百分比序列同一性。比對序列以供比較的方法是眾所周知的。各種程序和比對 算法在下列文獻中有描述,例如:Smith and Waterman(1981)Adv ? Appl ? Math ? 2 : 482 ; Needleman and ffunsch(1970)J.Mol.Biol.48:443;Pearson and Lipman(1988) Proc?Natl?Acad.Sci.U.S.A.85:2444;Higgins and Sharp(1988)Gene 73:237-44; Higgins and Sharp(1989)CABI0S 5:151-3;Corpetet al.(1988)Nucleic Acids Res.16: 10881-90;Huang et al.(1992)Comp.Appl.Biosci.8:155-65;Pearson et al.(1994) Methods Mol.Biol.24:307-31;Tatiana et al.(1999)FEMS Microbiol.Lett.174:247-50〇
[0063] 美國國家生物技術信息中心(NCBI)基本局部比對搜索工具(BLAST?;Altschulet al. (1990) J.Mol. Biol. 215:403-10)可以從多個來源訪問,包括美國國家生物技術信息中 心(BetheSda,MD)和在互聯網上,用于和多種序列分析程序結合使用。關于如何使用該程序 確定序列同一性的描述可以在互聯網上在BLAST?的"幫助"部分獲得。對于核酸序列的比 較,可以使用默認參數執行BLAST?程序的"BLAST 2序列"功能(Blastn)。當使用這種方法進 行評估時,與參考序列的相似性越大的核酸序列將顯示更高的百分比同一性。
[0064]如本文所使用的,術語"可操作連接"是指核酸被置于與另一個核酸的功能關系 中。一般地,"可操作連接"可以表示被連接的各核酸是毗連的。連接可以通過在方便限制位 點處進行連接作用來實現。如果不存在這些位點,則用合成的寡核苷酸銜接子或結構與核 酸進行連接作用或退火,并用于連接毗連的多核苷酸片段。然而,元件不必是毗連的才能可 操作連接。
[0065]如本文所使用的,"啟動子"是指一段DNA區域,其一般位于基因的上游(朝著基因 的5'區),并且是觸發和驅動基因轉錄所需要的。啟動子可以允許它所控制的基因被合適地 激活或抑制。啟動子可能含有被轉錄因子識別的特定序列。這些因子可以結合啟動子DNA序 列,導致RNA聚合酶被招募,這種酶從基因的編碼區合成RNA。啟動子一般指位于基因上游的 全部基因調節元件,包括上游啟動子、5'-UTR、內含子和前導序列。
[0066]如本文所使用的,術語"上游啟動子"是指足夠指導轉錄起始的一段毗連的多核苷 酸序列。如本文所使用的,上游啟動子包括轉錄起始位點,其具有多個序列基序,包括TATA 盒、起始子序列(initiator sequence )、TFI IB識別元件(BRE)和其它啟動子基序 (Jennifer,E ? F ? et al ?,(2002)Genes&Dev ?,16: 2583-2592)。上游啟動子提供了RNA聚合酶 11( 一種多亞基酶)與基礎或一般轉錄因子如TFIIA,B,D,E,F和H的作用位點。這些因子組裝 成轉錄前-起始復合體,后者催化從DNA模板合成RNA。
[0067]上游啟動子的激活是通過加入調節性DNA序列元件,多種蛋白質與調節性DNA序列 元件結合,并隨后與轉錄起始復合體接觸從而激活基因表達。這些基因調節元件序列與特 定的DNA結合因子相互作用。這些序列基序有時被稱作順式元件。這些順式元件與組織特異 性或發育特異性轉錄因子結合,它們可以單獨或者組合地在轉錄水平上決定啟動子的時空 表達模式。這些順式元件對可操作連接基因的控制類型可能差異很大。一些元件會響應環 境響應(例如溫度、濕度、和致傷)使可操作連接基因的轉錄增加。其它順式元件可以響應發 育線索(例如萌發、種子成熟和開花)或者響應空間信息(例如組織特異性)。參見例如 Langridge et al.,(1989)Proc.Natl.Acad.Sci .USA 86:3219-23。這些順勢元件的位置與 轉錄起始點的距離并不相同,一些順式元件(稱作鄰近元件)與最小核心啟動子區域毗鄰, 而其它元件可以位于啟動子上游或下游數千堿基的位置(增強子)。
[0068]如本文所使用的,術語"轉化"包括所有能夠將核酸分子引入到細胞內的技術。實 例包括,但不僅限于:病毒載體轉染;質粒載體轉化;電穿孔;脂質體轉染;顯微注射 (Mueller et al.(1978)Cell 15:579-85);土壤桿菌介導的轉移;直接DNA攝入;WHISKERS? 介導的轉化;和微射彈轟擊。這些技術可用于植物細胞的穩定轉化和瞬時轉化二者。"穩定 轉化"是指核酸片段引入到宿主生物體的基因組內,導致在遺傳上穩定的繼承。一旦被穩定 轉化,核酸片段便穩定地整合進宿主生物體和任何后代的基因組中。含有轉化核酸片段的 宿主生物被稱為"轉基因"生物。"瞬時轉化"是指核酸片段被引入到宿主生物體的細胞核或 含DNA的細胞器中,引起基因表達但不會在遺傳上穩定的繼承。
[0069]如本文所使用的,術語"轉導"是指病毒將核酸轉移到細胞內的過程。
[0070]如本文所使用的,術語"轉基因"是指外源核酸序列。在一個實例中,轉基因是基因 序列(例如,除草劑抗性基因),編碼工業或制藥上有用的化合物的基因,或者編碼期望農藝 學性狀的基因。在另外的實施例中,轉基因是反義核酸序列,其中該反義核酸序列的表達會 抑制靶核酸序列的表達。轉基因可以含有與轉基因可操作連接的調節序列(例如,啟動子、 內含子或3'_UTR)。在一些實施方案中,感興趣的核酸是轉基因。然而,在其它實施方案中, 感興趣的核酸是內源核酸,其中該內源核酸的額外基因組拷貝是期望的,或者是與宿主生 物體中的靶核酸序列處于反義取向的核酸。
[0071] 如本文所使用的,術語"載體"是指被引入到細胞內從而產生轉化細胞的核酸分 子。載體可以包括允許它在宿主細胞內復制的核酸序列,例如復制原點。實例包括,但不僅 限于,質粒、粘粒、菌體、細菌人工染色體(BAC),或可攜帶外來DNA進入細胞的病毒。載體 還可以包括一個或多個基因、反義分子和/或選擇標志物基因和本領域已知的其它遺傳元 件。載體可以轉導、轉化或感染細胞,借此導致細胞表達核酸分子和/或由該載體編碼的蛋 白質。載體可以任意地包括幫助核酸分子進入細胞內的材料(例如脂質體)。
[0072] 如本文所使用的,術語"盒子"、"表達盒"和"基因表達盒"是指能夠被插入到核酸 或多核苷酸的特定限制位點處或者通過同源重組插入核酸或多核苷酸的DNA區段。DNA區段 包括含有感興趣基因的多核苷酸,感興趣基因編碼感興趣的小RNA或多肽,并且該盒子和限 制位點被設計成確保盒子以正確的閱讀框被插入,以保證轉錄和翻譯。在一個實施方案中, 表達盒可包括編碼感興趣的小RNA或多肽的多核苷酸,并可具有除該多核苷酸之外的促進 特定宿主細胞的轉化的元件。在一個實施方案中,基因表達盒還可以包括如下元件,其允許 在宿主細胞中增強編碼感興趣的小RNA或多肽的多核苷酸的表達。這些元件可以包括,但不 僅限于:啟動子,最小啟動子,增強子,應答元件,內含子,5'非翻譯區序列,3'非翻譯區序 列,終止子序列,多腺苷酸化序列,等。
[0073] 如本文所使用的,術語"異源編碼序列"用于指示任何編碼、或者最終編碼肽或蛋 白質或其等價氨基酸序列(例如酶)的多核苷酸,所述肽或蛋白質或其等價氨基酸序列在宿 主生物體中通常不存在,并且在合適的條件下能夠在宿主細胞中表達。這樣,"異源編碼序 列"可以包括一個或多個拷貝的在宿主細胞中通常不存在的編碼序列,從而使細胞表達額 外拷貝的在細胞中通常不存在的編碼序列。異源編碼序列可以是RNA或者其任何類型(例如 mRNA),DNA或其任何類型(例如cDNA),或RNA/DNA的雜交體。編碼序列的實例包括,但不僅限 于,全長轉錄單元,其包括例如編碼序列、內含子、啟動子區、S'-UTRd'-UTR和增強子區等 特征。
[0074] "異源編碼序列"還包括肽或酶的編碼部分(即cDNA或mRNA序列),全長轉錄單元的 編碼部分(即包含內含子和外顯子的基因),編碼酶或者編碼其等價氨基酸序列的"密碼子 優化"序列、截短的序列和其它具有改變的序列的形式,前提是該等價氨基酸序列可產生功 能性蛋白。這樣的等價氨基酸序列可以具有一個或多個氨基酸缺失,該缺失在N端、C端或內 部。也設想了截短的形式,只要它們具有本文所述的催化能力即可。
[0075] 如本文所使用的,術語"對照"是指在分析程序中用于比較目的的樣品。對照可以 是"陽性"或"陰性"。例如,當分析程序的目的是檢測細胞或組織中差異表達的轉錄本或多 肽時,一般優選地包含陽性對照,例如來自已知顯示期望表達的植物的樣品,和陰性對照, 例如來自已知缺少期望表達的植物的樣品。
[0076] 如本文所使用的,術語"植物"包括植物和植物部分,包括但不僅限于,植物細胞和 植物組織,例如葉、愈傷組織、莖、根、花、花粉和種子。可以在本發明中使用的植物類別寬泛 到包括適合于誘變的高等和低等植物,包括被子植物,裸子植物,蕨類植物和多細胞藻類。 因此,"植物"包括雙子葉和單子葉植物。雙子葉植物的實例包括煙草,擬南芥,大豆,番茄, 木瓜,芥花(canola),向日葵,棉花,苜蓿,馬鈴薯,葡萄,木豆,豌豆,蕓苔(Brassica),鷹嘴 豆,甜菜,油菜,西瓜,甜瓜,辣椒,花生,南瓜,蘿卜,菠菜,倭瓜,西蘭花,卷心菜,胡蘿卜,花椰 菜,芹菜,大白菜,黃瓜,茄子,和萵苣。單子葉植物的實例包括玉米,大米,小麥,甘蔗,大麥, 黑麥,高粱,蘭花,竹,香蕉,香蒲,百合,燕麥,洋蔥,小米和黑小麥。
[0077]如本文所使用的,術語"植物部分"是指葉、愈傷組織、莖、根、花或花的部分、果實、 花粉、卵細胞、合子、種子、插條、細胞或組織培養物,或者植物的任何其它部分或產物。在一 個實施方案中,植物材料包括子葉和葉。在一個實施方案中,植物材料包括根組織和其它位 于地下的植物組織。
[0078]如本文所使用的,術語"選擇標志物基因"是指在植物轉化中被任選地用于例如保 護植物細胞免于選擇劑的傷害或者提供對選擇劑的抗性/耐受性的基因。此外,"選擇標志 物基因"意圖包括報告基因。只有那些接受了功能性的選擇標志物的細胞或植物才能夠在 具有選擇劑的條件下分裂或生長。選擇劑的實例可包括,例如,抗生素,包括壯觀霉素,新霉 素,卡那霉素,巴龍霉素,慶大霉素,和潮霉素。這些選擇標志物包括新霉素磷酸轉移(npt II),其表達的酶可賦予對抗生素卡那霉素的抗性,和針對相關抗生素新霉素、巴龍霉素、慶 大霉素和G418的基因,或者潮霉素磷酸轉移酶(hpt)的基因,其表達的酶可賦予對潮霉素的 抗性。其它選擇標志物基因可以包括編碼除草劑抗性的基因,包括bar或pat(抵抗草銨膦銨 鹽或膦絲菌素),乙酰乳酸合酶(ALS,抵抗抑制劑例如磺酰脲類(SU),咪唑啉酮類(頂1),三 口坐并啼啶(了?),啼啶氧基苯甲酸(口5^;[ 1]1丨(1;[1171(?5^611203丨6)(?013),和磺酰羰基三唑啉酮, 其可阻止支鏈氨基酸合成的第一步,草甘膦,2,4-D和金屬抗性或敏感性。可以用來作為選 擇標志物基因的"報告基因"的實例包括可以視覺觀察所表達報告基因的蛋白,例如編碼0 葡糖苷酸酶(GUS)、熒光素酶、綠色熒光蛋白(GFP)、黃色熒光蛋白蛋白(YFP)、D SRed、0-半乳 糖苷酶、氯霉素乙酰轉移酶(CAT)、堿性磷酸酶和類似物的蛋白質。短語"標志物陽性"是指 已經被轉化為包含選擇標志物基因的植物。
[0079]如本文所使用的,術語"可檢測標志物"是指能夠檢測的標記,例如放射性同位素, 熒光化合物,生物發光化合物,化學發光化合物,金屬螯合劑,或酶。可檢測標記物的實例包 括,但不僅限于,下述者:熒光標記(例如,FITC,羅丹明,鑭系磷光體),酶標記(例如辣根過 氧化物酶,0半乳糖苷酶,螢光素酶,堿性磷酸酶),化學發光,生物素基團,可以被第二報告 分子識別的預定多肽表位(例如,亮氨酸拉鏈對序列,第二抗體的結合位點,金屬結合結構 域,附加表位)。在一個實施方案中,可檢測標記物可以附加各種長度的間隔臂,以減少潛在 的空間位阻。
[0080] 如本文所使用的,術語"檢測"使用其最廣泛的含義,包括對特定分子的定性和定 量測量,例如測量特定的多肽。
[0081] 除非另有具體說明,否則本文使用的所有技術和科學術語具有與本公開所屬領域 普通技術人員所公知的相同的含義。分子生物學常用術語的定義可以在列文獻中找到,例 如:Lewin,Genes V,0xford University Press,1994;Kendrew et al.(編輯),The Encyclopedia of Molecular Biology,Blackwell Science Ltd. ,1994;和Meyers(編輯), Molecular Biology and Biotechnology:A Comprehensive Desk Reference,VCH Publishers,Inc.,1995。
[0082]啟動子作為基因表達調節元件
[0083] 用于基礎研究或生物技術應用的植物啟動子一般是單向的,指導融合到其3'端 (下游)的轉基因的組成型表達。代謝工程和性狀堆疊通常需要在植物體內強表達轉基因。 此外,在轉基因作物中通常需要多個新啟動子來驅動多個基因的表達。本文公開了能夠指 導融合在其3'端的轉基因的表達的組成型啟動子。
[0084] 轉基因產品的開發日益復雜,需要強表達轉基因并在單個基因座中堆疊多個轉基 因。傳統上,每個轉基因的表達通常需要一個獨特的啟動子,其中在一個基因堆疊內需要多 個啟動子來表達不同的轉基因。隨著基因堆疊規模的增加,這經常導致為了表達單個多基 因性狀而重復使用相同的啟動子,以獲得不同轉基因的相似水平的表達模式。
[0085]已知受相同啟動子驅動的多基因構建體會導致基因沉默,導致轉基因產物在大田 中有效的效力降低。由于啟動子重復而產生的過多的轉錄因子(TF)結合位點會導致內源TF 的枯竭,從而使轉錄失活。轉基因沉默很可能對為表達轉基因而產生的轉基因植物的性能 帶來不利影響。轉基因內的重復序列會導致基因座位內的同源重組,進而導致多核苷酸重 排。
[0086] 除了組成型啟動子,組織特異性或者器官特異性啟動子驅動基因在特定的組織 中,如在谷粒、根、葉、愈傷組織、花粉或植物的絨氈層中表達。組織和發育階段特異的啟動 子驅動基因在特定的組織中或者在植物發育過程的特定時間段內表達。組織特異性啟動子 對于轉基因植物產業的某些應用是需要的,并且是期望的,因為它們允許在不同組織和/或 在選定的發育階段中特異性地表達異源基因,指示異源基因在各種器官、組織和/或在不同 時間內差異性表達,而非在其他情況下表達。
[0087] 例如,可以通過用病原抗性基因轉化植物基因組,使得病原體抗性蛋白在植物中 強烈表達,來實現增強植物對土壤傳播的病原體的感染的抵抗力。或者,可能期望在處于特 定生長或發育階段,例如細胞分裂或伸長期,的植物組織中表達轉基因。另一個應用是使用 組織特異性啟動子的可取之處,使得啟動子能夠將編碼農藝性狀的轉基因的表達限制在發 育中的植物部分(即,根,葉,愈傷組織,或花粉)中。
[0088] 本文所述的啟動子可望成為制備含有多個基因的商業轉基因構建體的工具。這些 啟動子還提供了在細菌宿主內的結構穩定性和在植物細胞中的功能穩定性,例如減少轉基 因沉默,從而為轉基因表達創造條件。具有不同表達范圍的啟動子,也可以通過使用本文所 述的方法獲得。相比于多次使用單個啟動子的轉基因構建體,本申請中描述的多樣化啟動 子構建體更加適合轉基因事件的下游分子分析。使用本文描述的多樣化啟動子還可以減少 在用鋅指技術進行靶定過程中轉基因多基因座位的重排(SHUKLA等人.2009)。
[0089]玉米泛素 -1啟動子
[0090] 玉米Ubi-1啟動子已經成為生物技術產業的標準手段,主要用于在玉米中穩定高 表達轉基因(CHRISTENSEN and QUAIL 1996;CHRISTENSEN et al,1992;T0KI et al. 1992)。每個轉基因的充分表達通常需要一個特定的啟動子。在一個基因堆疊中通常需 要多個啟動子來表達不同的轉基因。這種范式經常導致重復使用玉米Ubi-1啟動子,因為它 有令人期望的高水平蛋白質表達和組成型表達模式。
[0091] 然而,在轉基因座位內故意引入重復的序列也會對轉基因的表達和穩定性產生不 期望的負面影響(FLADUNG and KUMAR 2002;KUMAR and FLADUNG 2000a;KUMAR and FLADUNG 2000b;KUMAR and FLADUNG 200la;KUMAR and FLADUNG 2001b;KUMAR and FLADUNG 2002;MEITE et al_1999;M0URRAIN et al. 2007)。多個轉基因協調表達這一挑戰 可以使用啟動子多樣化方法來解決,其中不同的啟動子用于驅動具有相同的表達概貌的不 同轉基因(PEREMARTI et al.2010)。本申請描述了通過從不同玉米基因型中鑒定和純化新 啟動子而獲得的多樣化Ubi-1啟動子序列。
[0092] 植物基因中基因表達的轉錄起始和調節受到多個DNA序列元件的指導,這些序列 元件集合排列成一個較大的序列,稱為啟動子。真核啟動子通常由最小核心啟動子和上游 調節序列構成。核心啟動子是足以指導轉錄的準確起始的最小一段連續DNA序列。植物中的 核心啟動子一般包括與轉錄起始相關的規范區(canonical region),例如CAAT和TATA框 (共有序列TATAWAWhTATA框元件通常位于轉錄起始位點(TSS)上游大約20-35個堿基對 (bp)。核心啟動子的激活由上游調節序列實現,它們結合各種蛋白質,隨后與轉錄起始復合 體相互作用,從而激活基因表達。這些調節元件包括確定啟動子時空表達模式的DNA序列。 [0093] 參考圖1,玉米Ubi-1基因啟動子來自于玉米近交細胞系B73。玉米Ubi-1啟動子包 括位于TSS 5 '上游的大約895bp的DNA序列(即,上游元件)。此外,玉米Ubi-1啟動子包括位 于TSS 3'下游的大約1093bp的DNA序列(參見美國專利5,510,474)。因此,玉米1^-1啟動子 的總DNA序列包括大約2000個堿基對(kb)。
[0094] 玉米Ubi-1啟動子的上游元件包括位于TSS 5'上游大約30bp的TATA框(圖1和3)。 此外,該上游元件包括位于TSS 5'直接上游的兩個重疊的熱休克共有元件。一個82bp的5'-UTR或前導序列位于TSS的3'直接下游,隨后是內含子,其從堿基83延伸到1093(圖1和3)。 [0095]以前的工作已經描述了由玉米Ubi-1啟動子調節的基因和/或轉基因的基因表達 增加。例如,氯霉素乙酰轉移酶(CAT)基因與玉米Ubi-1啟動子的轉錄融合使得CAT在玉米原 生質體中的活性是由花椰菜花葉病毒35S啟動子驅動的表達的超過10倍CHRISTENSEN and QUAIL 1996;CHRISTENSEN et al.1992)。
[0096]除了對照玉米Ubi-1啟動子之外,本申請還描述了新型玉米Ubi-1啟動子。與來自 玉米基因型栽培種B73的對照Ubi-1啟動子不同,新型Ubi-1啟動子來自玉米基因型栽培種 LLN37。還提供了使用包含多核苷酸序列的玉米Ubi-1啟動子的構建體和方法。在一個實施 方案中,啟動子可以包括來自玉米栽培種B73Ubi-l基因的多核苷酸,如下:
[0100] 對本文所描述的啟動子通過克隆以及隨后的DNA序列同源性分析進行了表征,以 鑒定啟動子的特定區域(即,上游的啟動子,5'-UTR,和內含子區域)。提供了使用組成型玉 米Ubi-1啟動子在植物中表達轉基因的構建體和方法,其包括上游啟動子區,5-UTR或前導 區,和內含子。在一個實施方案中,啟動子可以包括來自玉米栽培種B73UM-1基因的上游啟 動子多核苷酸序列,如下:
[0102]在另一個實施方案中,啟動子可以包括來自玉米栽培種LLN37Ubi-l基因的上游啟 動子多核苷酸序列,如下:
[0104]其他的基因調節元件
[0105]轉基因表達還可以受到位于上游啟動子序列3'下游的5'-UTR和/或內含子區的調 節。包含與5'-UTR和/或內含子可操作連接的上游啟動子區的啟動子能夠調節轉基因的表 達。上游啟動子是驅動轉錄必需的,而5'-UTR和/或內含子的存在能夠增加表達水平,導致 產生更多的mRNA轉錄物用于翻譯和蛋白質合成。在上游啟動子多核苷酸序列中添加 5'-UTR 和/或內含子能夠幫助轉基因的穩定表達。
[0106]此外,包含上游啟動子多核苷酸序列的組成型啟動子的后面可以跟隨5'-UTR或前 導序列,以幫助轉基因在植物內的表達。在一個實施方案中,啟動子可以包括來自玉米栽培 種B73Ubi-l基因的5'-UTR或前導多核苷酸序列,如下:
[0108]在另一個實施方案中,啟動子可以包括來自玉米栽培種LLN37Ubi-l基因的5'-UTR 或前導多核苷酸序列,如下:
[0110]進一步地,包含上游啟動子多核苷酸序列后隨5'-UTR或前導序列的組成型啟動子 還可以后隨內含子,以幫助轉基因在植物內的表達。在一個實施方案中,啟動子可以包括來 自玉米栽培種B73Ubi-l基因的內含子多核苷酸序列,如下:
[0112]在另一個實施方案中,啟動子可以包括來自玉米栽培種LLN37Ubi-l基因的內含子 多核苷酸序列,如下:
[0114] 轉基因和報告基因表達盒
[0115] 轉基因表達還可以受到基因表達盒的調節。在一個實施方案中,基因表達盒包括 啟動子。在一個實施方案中,基因表達盒包括Ubi-1啟動子。在一個實施方案中,基因表達盒 包括來自植物的Ubi-1啟動子。在一個實施方案中,基因表達盒包括來自玉米栽培種LLN37 的Ubi-1啟動子。
[0116] 在一個實施方案中,基因表達盒包括玉米栽培種LLN37Ubi-l啟動子,其中該啟動 子與SEQ ID N0:2具有至少80%,85%,90%,91%,92%,93%,94%,95%,96%,97%, 98 %,99 %,99.5 %,99.8 %,或100 %的同一性。在一個實施方案中,基因表達盒包括組成型 啟動子,例如玉米栽培種LLN37Ubi-l啟動子,其與報告基因或轉基因可操作連接。在一個實 施方案中,基因表達盒包括與轉基因可操作連接的組成型啟動子,其中該轉基因可以是殺 蟲抗性轉基因,除草劑耐受性轉基因,氮利用效率轉基因,水利用效率轉基因,營養品質轉 基因,DNA結合轉基因,選擇標志物轉基因,或其組合。在一個實施方案中,包含組成型啟動 子的基因表達盒可以驅動一個或多個轉基因或報告基因的表達。在一個實施方案中,包含 組成型啟動子的基因表達盒可以驅動兩個或多個轉基因或報告基因的表達。
[0117] 在一個實施方案中,基因表達盒包括玉米栽培種LLN37Ubi-l啟動子,其中上游啟 動子序列與SEQ ID N0:4具有至少80% ,85% ,90% ,91% ,92% ,93% ,94% ,95% ,96%, 97% ,98% ,99% ,99.5% ,99.8%,或100%的同一性。在一個實施方案中,基因表達盒包括 組成型啟動子,例如玉米栽培種LLN37Ubi-l上游啟動子,其與報告基因或轉基因可操作連 接。在一個實施方案中,基因表達盒包括與轉基因可操作連接的組成型上游啟動子,其中該 轉基因可以是殺蟲抗性轉基因,除草劑耐受性轉基因,氮利用效率轉基因,水利用效率轉基 因,營養品質轉基因,DNA結合轉基因,選擇標志物轉基因,或其組合。在一個實施方案中,包 含組成型上游啟動子的基因表達盒可以驅動一個或多個轉基因或報告基因的表達。在一個 實施方案中,包含組成型上游啟動子的基因表達盒可以驅動兩個或更多個轉基因或報告基 因的表達。在進一步的實施方案中,上游啟動子可以包括內含子。在一個實施方案中,上游 啟動子可以包括與報告基因或轉基因可操作連接的內含子序列。在另一個實施方案中,上 游啟動子可以包括5'-UTR或前導序列。在一個實施方案中,上游啟動子可以包括與報告基 因或轉基因可操作連接的5'_UTR或前導序列。在另外一個實施方案中,上游啟動子可以包 括5'-UTR或前導序列和內含子序列。在一個實施方案中,上游啟動子可以包括與報告基因 或轉基因可操作連接的5'_UTR或前導序列和內含子序列。
[0118] 在一個實施方案中,基因表達盒包括玉米栽培種LLN37UM-1啟動子,其中該5'-1^1?或前導序列與5£〇10腸:6具有至少80%,85%,90%,91%,92%,93%,94%,95%, 96% ,97% ,98% ,99% ,99.5% ,99.8%,或100%的同一性。在一個實施方案中,基因表達盒 包括來自編碼泛素-1蛋白的玉米基因的5'_UTR或前導序列,其與啟動子可操作連接,其中 該啟動子是玉米栽培種LLN37Ubi-l啟動子,或者來自植物(例如玉米泛素-1啟動子)、病毒 (例如木薯葉脈花葉病毒啟動子),或細菌(例如土壤桿菌de 1 ta mas)的啟動子。在一個例示 性實施方案中,基因表達盒包括玉米栽培種LLN37 5 ' -UTR或前導序列,其來自編碼泛素-1 蛋白的玉米基因,并與轉基因可操作連接,其中該轉基因可以是殺蟲抗性轉基因,除草劑耐 受性轉基因,氮利用效率轉基因,水利用效率轉基因,營養品質轉基因,DNA結合轉基因,選 擇標志物轉基因,或其組合。
[0119] 在一個實施方案中,基因表達盒包括玉米栽培種LLN37Ubi-l啟動子,其中內含子 序列與SEQ ID N0:8具有至少80% ,85% ,90% ,91% ,92% ,93% ,94% ,95% ,96% ,97%, 98% ,99% ,99.5% ,99.8%,或100%的同一性。在一個實施方案中,基因表達盒包括來自編 碼泛素-1蛋白的玉米基因的內含子,其與啟動子可操作連接,其中該啟動子是玉米栽培種 LLN37UM-1啟動子,或者來自植物(例如玉米泛素 -1啟動子)、病毒(例如木薯葉脈花葉病毒 啟動子),或細菌(例如土壤桿菌delta mas)的啟動子。在一個例示性實施方案中,基因表達 盒包括來自編碼泛素-1蛋白的玉米基因的內含子,其與轉基因可操作連接,其中該轉基因 可以是殺蟲抗性轉基因,除草劑耐受性轉基因,氮利用效率轉基因,水利用效率轉基因,營 養品質轉基因,DNA結合轉基因,選擇標志物轉基因,或其組合。
[0120] 在一個實施方案中,載體可以包括如本文所述的基因表達盒。在一個實施方案中, 載體可以是質粒、粘粒、細菌人工染色體(BAC )、噬菌體、病毒、或用于直接轉化或基因靶定 的切離的多核苷酸片段,例如供體DNA。
[0121] 在一個實施方案中,細胞或植物包括如本文所述的基因表達盒。在一個實施方案 中,細胞或植物包括包含如本申請中公開的基因表達盒的載體。在一個實施方案中,載體可 以是質粒、粘粒、細菌人工染色體(BAC)、噬菌體、或病毒。據此,包含基因表達盒的細胞或植 物分別是轉基因細胞或轉基因植物。
[0122] 在一個實施方案中,轉基因植物可以是單子葉植物或雙子葉植物。轉基因單子葉 植物的實施方案可以是,但不僅限于,玉米、小麥、水稻、高粱、燕麥、黑麥、香蕉、甘蔗、和小 米。轉基因雙子葉植物的實施方案可以是,但不僅限于大豆、棉花、向日葵、或芥花。實施方 案還包括來自轉基因植物的轉基因種子,如本文所述的。
[0123] 選擇標志物
[0124] 各種選擇標志物,也稱為報告基因,可以整合到所選表達載體中,以允許鑒定和選 擇被轉化的植物("轉化體")。有多種方法可用于確認選擇標志物在轉化的植物中的表達, 包括例如DNA測序、聚合酶鏈式反應(PCR)、Southern印跡、RNA印跡、用于檢測從載體表達的 蛋白質的免疫學方法,例如介導膦絲菌素抗性的沉淀蛋白,或者視覺觀察其它蛋白質,例如 編碼葡糖苷酸酶(GUS)、熒光素酶、綠色熒光蛋白(GFP)、黃色熒光蛋白(YFP)、D SRed、0-半 乳糖苷酶、氯霉素乙酰轉移酶(CAT)、堿性磷酸酶等的報告基因(參見Sambr〇〇k,et al., Molecular Cloning:A Laboratory Manual,第三版,Cold Spring Harbor Press ,N. Y., 2001,其全部內容通過引用并入本文)。
[0125] 選擇標志物基因用于選擇被轉化的細胞或組織。選擇標志物基因包括編碼抗生素 抗性的基因,例如編碼新霉素磷酸轉移酶II(NEO)和潮霉素磷酸轉移酶(HPT)的基因,以及 賦予對除草化合物抗性的基因。除草劑抗性基因一般編碼經過修飾的對除草劑不敏感的靶 蛋白,或者編碼在除草劑在植物中發揮作用之前將其降解或脫毒的酶。例如,已經通過使用 編碼突變型靶酶,5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS),的基因而獲得了對草甘膦的抗 性。EPSPS的基因和突變體是眾所周知的,并且在下文中有進一步的描述。對草胺膦銨鹽、溴 苯腈和2,4-二氯苯氧乙酸(2,4-0)的抗性已經通過使用編碼口&1:或03|/[-2、腈水解酶、33(1-1 或aad-12基因的細菌基因得以實現,這些基因可以將各自的除草劑脫毒。
[0126] 在一個實施方案中,除草劑可以抑制生長點或分生組織,包括咪唑啉酮或磺酰脲, 且用于抵抗/耐受這些除草劑的乙酰羥酸合酶(AHAS)和乙酰乳酸合酶(ALS)的基因。草甘膦 抗性基因分別包括突變的5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS)和dgt-28基因(通過引入 重組核酸和/或各種形式的天然EPSP基因的體內誘變),ar 〇A基因和草甘膦乙酰轉移酶 (GAT)基因。對其它含膦化合物的抗性基因包括來自鏈霉菌屬,包括吸水鏈霉菌 (Streptomyces hygroscopicus)^RStreptomyces viridichromogenes,的BAR基因,和P比啶 氧基(pyridinoxy)或苯氧基(phenoxy)丙酸和環己酮(ACC酶抑制劑編碼基因)。可賦予對環 己二酮和/或芳氧苯氧丙酸(aryloxyphenoxypropanoic acid)(包括蓋草能,禾草靈,噁挫 禾草靈,吡氟禾草靈,精喹禾靈)的抗性的示例性基因包括乙酰輔酶A羧化酶(ACC酶)一一 Accl-S1,A CC1-S2和Accl-S3的基因。在一個實施方案中,除草劑能夠抑制光合作用,包括三 嗪(psbA和ls+基因)或芐腈(腈水解酶基因)。
[0127] 在一個實施方案中,選擇標志物包括,但不僅限于,編碼如下的基因:新霉素磷酸 轉移酶II;氨腈水合酶;天冬氨酸激酶;二氫吡啶二羧酸合酶;色氨酸脫羧酶;二氫吡啶二羧 酸合酶和脫敏的天冬氨酸激酶;bar基因;色氨酸脫羧酶;新霉素磷酸轉移酶(NE0);潮霉素 磷酸轉移酶(HPT或HYG);二氫葉酸還原酶(DHFR);膦絲菌素乙酰轉移酶;2,2_二氯丙酸脫鹵 素酶;乙酰羥酸合成酶;5-烯醇丙酮酸-莽草酸-磷酸合酶(aroA);鹵代乙腈;乙酰輔酶A羧化 酶;二氫蝶酸合酶(sul I);和32kD光系統II多肽(psbA)。
[0128] 實施方案還包括編碼對如下者的抗性的基因:氯霉素;甲氨蝶呤;潮霉素;壯觀霉 素;溴苯腈;草甘膦;和膦絲菌素。
[0129] 上述的選擇標志物基因的列表并不意味著有限制性。本發明可以包含任何報告或 選擇標志物基因。
[0130] 選擇標志物基因以在植物中最佳表達為目的而合成。例如,在一個實施方案中,基 因的編碼序列已經被密碼子優化修飾,以提高在植物中的表達。選擇標志物基因可以被優 化用于在特定的植物物種中表達,或者,可以被修飾用于在雙子葉或單子葉植物中最佳表 達。植物優選的密碼子可以從感興趣的特定植物物種中以表達量最大的蛋白質的頻率最高 的密碼子中確定。在一個實施方案中,選擇標志物基因被設計成在植物中以更高的水平被 表達,從而產生更高的轉化效率。對于植物基因優化的方法是眾所周知的。關于合成多核苷 酸序列的優化和制造的指導可見于,例如,W02013016546,W02011146524,W01997013402,美 國專利6166302和美國專利5,380,831,其內容通過引用并入本文。
[0131] 轉基因
[0132] 公開的方法和組合物可用于在植物基因組中表達多核苷酸基因序列。因此,編碼 除草劑抗性、昆蟲抗性、營養、抗生素或治療性分子的基因的表達可以被新型啟動子驅動。
[0133] 在一個實施方案中,本公開的組成型啟動子調節元件與一個或多個編碼多核苷酸 序列的基因組合或可操作連接,該基因可提供對草甘膦、2,4_D、草銨膦或其他除草劑的抗 性或耐受性,提供對選擇昆蟲或疾病的抗性或耐受性,和/或營養增強,改良的農學特征,用 于在飼料、食品、工業、醫藥或其它用途中有用的蛋白質或其它產品。轉基因可以在植物基 因組中與兩個或多個感興趣的核酸序列"堆疊"。堆疊可以通過例如使用兩個或多個事件的 傳統植物育種,用含有感興趣序列的構建體轉化植物,轉基因植物的再轉化,或者通過同源 重組的靶向整合添加新的性狀,來實現。
[0134] 這些感興趣的多核苷酸序列包括,但不僅限于,下面提供的實例:
[0135] 1.賦予害蟲或疾病抗性的轉基因或編碼序列(例如iRNA)
[0136] (A)植物疾病抗性基因。植物防御經常通過植物中疾病抗性基因(R)的產物與病原 體中相應的無毒性(Avr)基因的產物的特異相互作用而被激活。可以用克隆的抗性基因轉 化植物品種,從而工程構建對特定病原體株有抗性的植物。這些基因的實例包括:提供黃枝 抱霉(Cladosporium fulvum)抗性的番前 Cf_9 基因(Jones et al.,1994Science 266: 789);,提供丁香假單胞桿菌番茄致病變種抗性的番茄Pto基因,其編碼一種蛋白激酶 (Martin et al.,1993Science 262:1432),和提供丁香假單胞菌抗性的擬南芥RSSP2基因 (Mindrinos et al.,1994Cell 78:1089)〇
[0137] (B)蘇云金芽孢桿菌蛋白質、其衍生物或以其為模本的人造多肽,例如BtS-內毒素 基因的多核苷酸序列(Geiser et al.,1986Gene 48:109)和植物殺蟲(VIP)基因(見,例如, Estruch et al ?( 1996)Proc ? Natl ? Acad ? Sci ? 93:5389-94)。此外,編碼S-內毒素基因的DNA 分子可以從美國典型培養物保藏中心(Rockville,Md.)購得,ATCC登錄號為40098,67136, 31995和31998。
[0138] (C)植物凝集素,例如,多種君子蘭(Clivia miniata)甘露糖結合性植物凝集素基 因的核苷酸序列(Van Damme et al ?,1994Plant Molec.Biol ? 24:825)。
[0139] (D)維生素結合蛋白質,例如親和素及親和素同源物,其可用作針對昆蟲類害蟲的 殺幼蟲劑。見美國專利5,659,026。
[0140] (E)酶抑制劑,例如蛋白酶抑制劑或淀粉酶抑制劑。這些基因的實例包括水稻半胱 氨酸蛋白質酶抑制劑(Abe et al.,1987J.Biol.Chem.262:16793),煙草蛋白酶抑制劑I (他油6七&1.,1993卩1&1^]\1〇16(3.13;[01.21:985),和(1-淀粉酶抑制劑(311111;^&1116七&1., 1993Biosci.Biotech.Biochem.57:1243)0
[0141] (F)昆蟲特異性激素或信息素,例如蛻皮激素和保幼激素或其變體、基于它們的模 擬物,或其拮抗劑或激動劑,例如桿狀病毒表達的克隆保幼激素酯酶,保幼激素的失活子 (Hammock et al.,1990Nature 344:458)〇
[0142] (G)昆蟲特異性肽或神經肽,其在表達時會擾亂受影響的害蟲的生理機能 (J.Biol. Chem. 269:9)。這些基因的實例包括昆蟲利尿激素受體(Regan, 1994),在太平洋折 翅蠊(Diploptera punctata)中鑒定的咽側體抑制素(allostatin) (Pratt,1989),和昆蟲 特異性麻痹神經毒素(美國專利No. 5,266,361)。
[0143] (H)在自然界中由蛇、馬蜂等產生的昆蟲特異性毒液,例如蝎子昆蟲毒性肽(Pang, 1992Gene 116:165)。
[0144] (I)負責超富集單萜、倍半萜、留體、異羥肟酸、苯丙烷衍生物或其它具有殺蟲活性 的非蛋白質分子的酶。
[0145] (J)參與生物活性分子修飾(包括翻譯后修飾)的酶;例如糖酵解酶、蛋白質水解 酶、脂肪分解酶、核酸酶、環化酶、轉氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、彈 性蛋白酶、幾丁質酶和葡聚糖酶,無論是天然的還是人造的。這些基因的實例包括馬蹄蓮 (callas)基因(PCT公開的申請W0 93/02197),幾丁質酶編碼序列(其可以從例如ATCC以登 錄號 3999637 和 67152 獲得),煙草鉤蟲幾丁質酶(Kramer et al.,1993Insect Molec.Biol.23:691),和歐序 ubi4_2 多聚泛素基因(Kawalleck et al.,1993Plant Molec.Biol.21:673)。
[0146] (K)刺激信號轉導的分子。這些分子的實例包括綠豆鈣調蛋白cDNA克隆的核苷酸 序列(Botella et al.,1994Plant Molec.Biol.24:757),和玉米鈣調蛋白cDNA克隆的核苷 酸序列(Griess et al.,1994Plant Physiol .104:1467)。
[0147] (L)疏水矩妝(hydrophobic moment peptide)。見例如美國專利Nos.5,659,026和 5,607,914,后者教導了賦予疾病抗性的人造抗微生物肽。
[0148] (M)膜透性酶,通道形成劑或通道阻斷劑,例如殺菌肽裂解肽類似物(Jaynes et al.,1993Plant Sci . 89:43),其使轉基因煙草植物對青枯病有抗性。
[0149] (N)病毒侵襲性蛋白質或由其衍生的復雜毒素。例如,在經轉化的植物細胞中,病 毒衣殼蛋白的積累可賦予針對該衣殼蛋白所來源的病毒以及相關病毒所致的病毒感染和/ 或疾病發展的抗性。已經給轉化植物賦予了衣殼蛋白介導的,針對苜蓿花葉病毒、黃瓜花葉 病毒、煙草條紋病毒、馬鈴薯X病毒、馬鈴薯Y病毒、煙草蝕紋病毒、煙草脆裂病毒和煙草花葉 病毒的抗性。參見,例如,Beachy et al ? (1990)Ann.Rev.Phytopathol ? 28:451。
[0150] (0)昆蟲特異性抗體或由其衍生的免疫毒素。因此,靶向昆蟲腸道關鍵代謝功能的 抗體可以使受影響的酶失活,殺死昆蟲。例如,Taylor等人(1994),在第七屆國際分子植物-微生物相互作用研討會(Seventh Int'l .Symposium on Molecular Plant Microbe Interactions)上的第497號摘要顯示了轉基因煙草中通過產生單鏈抗體片段的酶失活。 [0151 ] (P)病毒特異性抗體。見例如Tavladoraki et al ? (1993)Nature 266:469,其顯不 了表達重組抗體基因的轉基因植物被保護免于病毒攻擊。
[0152] (Q)由病原體或寄生物自然產生的發育阻滯(developmental-arrestive)蛋白質。 因此,真菌內切a-1,4-D多聚半乳糖醛酸酶通過溶解植物細胞壁的均聚-a-1,4-D-半乳糖醛 酸而促進真菌定殖和植物營養素釋放(Lamb et al.,1992)Bio/Technology 10:1436。 Toubart等(1992Plant J. 2: 367)描述了豆類內切多聚半乳糖醛酸酶抑制蛋白的編碼基因 的克隆和表征。
[0153] (R)由植物自然產生的發育阻滯(developmental-arrestive)蛋白質,例如大麥核 糖體失活基因,其提供了增加的針對真菌疾病的抗性(Longemann et al.,1992) .Bio/ Technology 10:3305〇
[0154] (S)RNA干擾,其中用RNA分子抑制靶基因的表達。一個實施例中的RNA分子是部分 或完全雙鏈的,其觸發沉默響應,導致dsRNA被切割成小的干擾RNA,它們隨后被納入到靶向 復合體中,革巴向復合體破壞同源的mRNA。見例如Fire等人,美國專利6,506,559;Graham等 人,美國專利6,573,099。
[0155] 2.賦予除草劑抗性的基因
[0156] ( A )編碼針對抑制生長點或分生組織的除草劑,例如咪唑啉酮類 (imidazalinone)、磺酰苯胺類(811]^〇1^11;[11(16)或磺酰脲類除草劑的抗性或耐受性的基 因。這類基因的實例編碼一種突變ALS酶(Lee et al.,1988£1?0入7:1241),其也稱六說1酶 (Miki et al.,1990Theor.Appl.Genet.80:449)0
[0157] (B)-種或多種額外的編碼針對草甘膦抗性或耐受性的基因,所述抗性或耐受性 是由突變體EPSP合酶和aroA基因賦予的,或者是通過一些基因如DGT-28、2mEPSPS、GAT(草 甘膦乙酰轉移酶)或G0X(草甘膦氧化酶)和其它膦酰基化合物,如草胺膦(pat,bar,和dsm-2 基因),和芳氧基苯氧基丙酸和環己二酮(ACC酶抑制劑編碼基因)所致的代謝失活而獲得 的。見例如美國專利4,940,835,其公開了可賦予草甘膦抗性的£?5?形式的核苷酸序列。編 碼突變體aroA基因的DNA分子能夠以ATCC登錄號39256獲得,突變體基因的核苷酸序列在美 國專利4,769,061中公開。歐洲專利申請No. 0 333 033和美國專利4,975,374公開了可賦予 除草劑如L-草銨膦抗性的谷氨酰胺合酶基因的核苷酸序列。歐洲專利申請No.0 242 246提 供了草銨膦乙酰轉移酶基因的核苷酸序列。De Greef et al.(1989)Bio/Technology 7:61 中描述了表達編碼草銨膦乙酰轉移酶活性的嵌合bar基因的轉基因植物的產生。賦予針對 芳氧基苯氧基丙酸和環己二酮如稀禾定和甲禾靈(haloxyf op)的抗性的示例性基因是 Accl-Sl,Accl_S2和Accl_S3基因,如Marshall et al ? (1992)Theor.Appl .Genet.83:435所 述。
[0158] (C)編碼針對可抑制光合作用的除草劑例如三嗪(psbA和gs+基因)和芐腈(腈水解 酶基因)的抗性的基因。?^訃111 &6七&1.(1991汗1&1^〇6113:169描述了使用編碼突變 體psbA基因的質粒轉化衣藻。在美國專利4,810,648中公開了腈水解酶基因的核苷酸序列, 含有這些基因的DNA分子可以通過ATCC登錄號53435、67441和67442獲得。Hayes et al. (1992沖1〇(*6111.1.285:173中描述了編碼谷胱甘肽3-轉移酶的0嫩的克隆和表達。
[0159] (D)編碼針對可結合羥基苯基丙酮酸二加氧酶(HPPD)的除草劑的抗性基因,HPPD 是催化對-羥基苯基丙酮酸(HPP)轉化形成尿黑酸的反應的酶。這包括例如異噁唑 (£?418175,£?470856,£?487352,£?527036,£?560482,£卩682659,美國專利5,424,276),特 別是異噁唑草酮,其是玉米的選擇性除草劑,二酮腈(diketonitri le ) (EP496630, EP496631),特別是2-氰基-3-環丙基-1-(2-S02CH3-4-CF3苯基)丙烷-1,3_二酮和2-氰基- 3-環丙基-1-(2-S02CH3-4-2,3C12 苯基)丙烷-1,3-二酮,三酮類(EP625505,EP625508,美國 專利5,506,195),特別是磺草酮、和口7抑2〇111^七6等除草劑。在植物中產生過量冊^)的基因 能夠提供針對這些除草劑的耐受性或抗性,包括例如美國專利6,268,549和6,245,968和美 國專利申請公開No. 2003/0066102中描述的基因。
[0160] (E)編碼針對苯氧基生長素除草劑,如2,4_二氯苯氧基乙酸(2,4-D)的抗性或耐受 性的基因,其也可以賦予針對芳氧基苯氧基丙酸類(A0PP)除草劑的抗性或耐受性。這些基 因的實例包括a_酮戊二酸依賴性的雙加氧酶(aad-1)基因,如美國專利7,838,733所述。
[0161] (F)編碼針對苯氧基生長素除草劑如2,4_二氯苯氧基乙酸(2,4-D)的抗性或耐受 性的基因,其也可以賦予針對吡啶基氧基生長素除草劑,如氟草煙或綠草定的抗性或耐受 性。這些基因的實例包括a-酮戊二酸依賴性的雙加氧酶(aad-12)基因,如W02007/053482-A2所述。
[0162] (G)編碼針對麥草畏的抗性或耐受性的基因(見例如美國專利公開0030135879)。
[0163] (H)編碼針對抑制原卟啉原氧化酶(PP0)的除草劑的抗性或耐受性的基因(見美國 專利 No.5,767,373)。
[0164] (I)提供針對可結合光系統II反應中心(PS II)核心蛋白質的三嗪除草劑(例如莠 去津)和尿素衍生物(如敵草隆)除草劑的抗性或耐受性的基因。見Brussian et al., (1989)EMB0 J.1989,8(4):1237-1245。
[0165] 3.可賦予或貢獻數量疊加性狀(Value Added Trait)的基因
[0166] (A)修飾的脂肪酸代謝,例如通過用反義基因或硬脂酰-ACP去飽和酶轉化玉米或 蕓苔屬植物從而增加植物的硬脂酸含量(Knultzon et al.,1992)Proc.Nat.Acad.Sci.USA 89:2624。
[0167] (B)降低的植酸含量
[0168] (1)引入植酸酶編碼基因,如黑曲霉植酸酶基因(Van Hartingsveldt et al., 1993Gene 127:87),提高植酸降解,向被轉化植物添加更多游離磷酸鹽。
[0169] (2)可引入降低植酸含量的基因。在玉米中,這可以通過,例如,克隆然后重新導入 如下所述的單個等位基因的相關DNA來實現:該單個等位基因導致以植酸水平低為特征的 玉米突變體的原因(Raboy et al.,1990Maydica 35:383)。
[0170] (C)改良的碳水化合物組成,例如通過用編碼改變淀粉的分支模式的酶的基因轉 化植物而實現。這些酶的實例包括,粘液鏈球菌(Streptococcus mucus)果糖基轉移酶基因 (Shiroza et al.,1988)J.Bacteriol.170:810,枯草芽孢桿菌果聚糖鹿糖酶基因 (Steinmetz et al.,1985Mol.Gen.Genel.200:220),地衣芽抱桿菌a-淀粉酶(Pen et al., 1992Bio/Technology 10:292),番茄轉化酶基因(Elliot et al. ,1993),大麥淀粉酶基因 (Sogaard et al.,1993J.Biol.Chem.268:22480),和玉米胚乳淀粉分支酶II(Fisher et al.,1993Plant Physiol.102:10450)。
[0171] 轉化
[0172] 用于轉化植物的合適方法包括任何能夠將DNA引入到細胞內的方法,例如但不僅 限于:電穿孔(參見例如美國專利5,384,253);微粒射彈(參見例如美國專利5,015,580;5, 550,318; 5,538,880; 6,160,208; 6,399,861;和6,403,865); 土壤桿菌介導的轉化(參見例 如美國專利5,635,055 ;5,824,877; 5,591,616;5,981,840;和 6,384,301);和原生質體轉化 (參見例如美國專利5,508,184)。這些方法可用于穩定轉化或瞬時轉化植物。
[0173] DNA構建體可以使用下述技術直接引入到植物細胞的基因組DNA中,例如用碳化硅 纖維攪動(參見,例如,美國專利5,302,523和5,464,765),或者0嫩構建體可以使用生物射 彈方法,例如DNA粒子轟擊,直接引入到植物組織中(參見,例如,Klein et al .,( 1987) Nature 327 :70-73)。或者,DNA構建體可以通過納米顆粒轉化引入到植物細胞中(參見,例 如,美國專利公開No. 2009/0104700,通過提述將其整體并入本文)。
[0174]此外,基因轉移可以使用非土壤桿菌或病毒實現,例如根瘤菌NGR234、苜蓿中華根 瘤菌、中慢生根瘤菌、馬鈴薯X病毒、花椰菜花葉病毒、木薯葉脈花葉病毒和/或煙草花葉病 毒,參見例如,Chung et al.,(2006)Trends Plant Sci.ll(l):l_4〇
[0175] 通過這些轉化技術的應用,幾乎任何植物物種的細胞都可以被穩定地轉化,并且 這些細胞可以通過眾所周知的技術發育成轉基因植物。例如,美國專利5,846,797; 5,159, 135 ; 5,004,863和6,624,344中描述了特別可用于棉花轉化內容的技術;例如美國專利5, 750,871中描述了特別用于轉化蕓苔屬植物的技術;美國專利6,384,301中描述了用于轉化 大豆的技術;美國專利7,060,876和5,591,616和國際?(:1'公開冊95/06722中描述了用于轉 化玉米的技術。
[0176] 在將外源核酸遞送到受體細胞之后,通常要鑒定出轉化細胞用于進一步的培養和 植物再生。為了提高鑒定轉化體的能力,可能期望采用選擇標志物基因,與用于產生轉化體 的轉化載體一起使用。在示例性實施方案中,可以通過將細胞暴露于一種或多種選擇劑對 被轉化的細胞群體進行測定,或者可以根據期望的標記基因性狀對細胞進行篩選。
[0177] 對于在暴露于選擇劑時存活的細胞,或者在篩選測定中被評定為陽性的細胞,可 以在支持植物再生的培養基中加以培養。在一個實施方案中,可以對任何合適的植物組織 培養基進行修改,使之包含更多的物質,例如生長調節劑。植物組織可以維持在含有生長調 節劑的基礎培養基中,直到可以獲得足夠的組織用于開始植物再生工作,或者經過重復多 輪的人工選擇,直到組織的形態適合于再生為止(例如,至少2周),然后可以將組織轉移到 有助于芽形成的培養基中。周期性地轉移培養物,直到發生充分的芽形成。一旦形成芽,便 將它們轉移到有助于根形成的培養基中。一旦形成了足夠的根,可將植物轉移到土壤中,用 于進一步的生長和成熟。
[0178] 為了確認再生植物中存在包含所提供構建體的期望核酸,可以多種測定。這樣的 測定可以包括:分子生物學測定,例如Southern和Northern印跡和PCR;生物化學測定,通過 免疫學方法如ELISA,western印跡,和/或LC-MS MS分光光度法,或者通過酶促功能檢測蛋 白質產物的存在,例如通過植物部分測定法,例如葉、愈傷組織或花粉測定;和/或分析整個 再生植物的表型。
[0179] 可以通過例如PCR擴增,使用特異針對感興趣的核酸分子的寡核苷酸引物對轉基 因事件進行篩選。PCR基因分型被理解為包括,但不僅限于,對分離和/或純化自預計含有整 合在基因組內的感興趣核酸分子的宿主植物組織的基因組DNA進行PCR擴增,隨后進行常規 克隆和PCR擴增產物序列分析。PCR基因分型方法已經有充分描述(參見,例如,Rios et al. (2002)Plant J.32:243-53),并且可應用于來自任何植物物種或組織類型(包括細胞培養 物)的基因組DNA。一組結合靶序列和引入序列的寡核苷酸引物可以在PCR擴增反應中順次 使用或復用。可以產生設計為結合靶位點、引入核酸序列、和/或這兩種類型的核酸序列之 組合的寡核苷酸引物。因此,PCR基因分型策略可以包括,例如但不僅限于:擴增植物基因組 中的特有序列;擴增植物基因組中的多個特有序列;擴增植物基因組中的非特有序列;和上 述的任意組合。本領域的技術人員可以設計出其它的引物和擴增反應的組合來查詢基因 組。例如,可以設計一組正向和反向寡核苷酸引物,使之與引入核酸序列的邊界之外的靶標 特有序列退火。
[0180] 正向和反向寡核苷酸引物可被設計為與引入的核酸分子特異性退火,例如在引入 的核酸分子中包含的感興趣核苷酸序列內的編碼區的相應序列處退火,或者在該核酸分子 的其它部分退火。引物可以和本文描述的引物聯合使用。寡核苷酸引物可以根據期望的序 列合成,并且是可商購的(例如,從 Integrated DNA Technologies, Inc.,Coralville,IA)〇 擴增之后可以進行克隆和測序,或者對擴增產物直接進行序列分析。在一個實施方案中,在 PCR擴增中使用特異針對基因靶標的寡核苷酸引物。
[0181] 表達轉基因的方法
[0182] 在一個實施方案中,在植物中表達至少一種轉基因的方法包括培植包含與至少一 個轉基因可操作連接的玉米栽培種LLN37Ubi-l啟動子(SEQ ID N0:2)的植物。在一個實施 方案中,在植物組織或植物細胞中表達至少一種轉基因的方法包括培植包含與至少一個轉 基因可操作連接的玉米栽培種11^371]1^-1啟動子(5£〇10從) :2)的植物組織或植物細胞。
[0183] 在一個實施方案中,在植物中表達至少一種轉基因的方法包括培植包含與至少一 個轉基因可操作連接的玉米栽培種LLN37Ubi-l啟動子(SEQ ID N0:2)的基因表達盒的植 物。在一個實施方案中,在植物組織或植物細胞中表達至少一種轉基因的方法包括培養包 含與至少一個轉基因可操作連接的玉米栽培種LLN37UM-1啟動子(SEQ ID N0:2)的基因表 達盒的植物組織或植物細胞。
[0184] 在一個實施方案中,植物、植物組織或植物細胞包括基因表達盒,其包括與轉基因 可操作連接的玉米栽培種LLN37Ubi-l啟動子(SEQ ID N0:2)。其中,該玉米栽培種 LLN37Ubi-l啟動子(SEQ ID N0:2)包括上游啟動子(SEQ ID N0:4)、5'-UTR(SEQ ID N0:6)、 和內含子(SEQ ID NO:8)。在一個實施方案中,植物、植物組織或植物細胞包括基因表達盒, 其包括玉米栽培種LLN37Ubi-l上游啟動子(SEQ ID N0:4)、5'-UTR(SEQ ID N0:6)、和內含 子(SEQ ID N0:8)。在一個實施方案中,植物、植物組織或植物細胞包括基因表達盒,其包括 玉米栽培種LLN37Ubi-l上游啟動子(SEQ ID N0:4)、5'-UTR(SEQ ID N0:6)、和玉米栽培種 LLN37Ubi-l基因的內含子(SEQ ID N0:8)。在一個實施方案中,植物、植物組織或植物細胞 包括基因表達盒,其包括玉米栽培種LLN37Ubi-l上游啟動子(SEQ ID N0:4)、5'-UTR(SEQ ID N0:6)和玉米栽培種LLN37Ubi-l基因的內含子(SEQ ID N0:8)。
[0185] 在一個實施方案中,植物、植物組織或植物細胞包括玉米栽培種LLN37UM-1啟動 子。在一個實施方案中,玉米栽培種1^似71]1^-1啟動子可以是5£〇10^) :2。在一個實施方 案中,植物、植物組織或植物細胞包括基因表達盒,所述基因表達盒包含啟動子,其中該啟 動子與SEQ ID N0:2具有80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%, 99 %,99.5 %,99.8 %,或100 %相同。在一個實施方案中,植物、植物組織或植物細胞包括基 因表達盒,所述基因表達盒包含與轉基因可操作連接的玉米栽培種LLN37UM-1啟動子。在 一個示例性實施方案中,植物、植物組織或植物細胞包括基因表達盒,所述基因表達盒包含 與轉基因可操作連接的玉米栽培種LLN37Ubi-l啟動子,其中該轉基因可以是殺蟲抗性轉基 因,除草劑耐受性轉基因,氮利用效率轉基因,水利用效率轉基因,營養品質轉基因,DNA結 合轉基因,選擇標志物轉基因,或其組合。
[0186] 在一個實施方案中,植物、植物組織或植物細胞包括玉米栽培種LLN37UM-1上游 啟動子。在一個實施方案中,玉米栽培種LLN37Ubi-l上游啟動子可以是SEQ ID N0:4。在一 個實施方案中,植物、植物組織或植物細胞包括基因表達盒,所述基因表達盒包含上游啟動 子,其中該上游啟動子與SEQ ID N0:4至少80% ,85% ,90% ,91% ,92% ,93% ,94% ,95%, 96% ,97% ,98% ,99% ,99.5% ,99.8% ,或100%相同。在一個實施方案中,植物、植物組織 或植物細胞包括基因表達盒,其包含與轉基因可操作連接的玉米栽培種LLN37UM-1上游啟 動子。在一個示例性實施方案中,植物、植物組織或植物細胞包括基因表達盒,其包含與轉 基因可操作連接的玉米栽培種LLN37UM-1上游啟動子,其中該轉基因可以是殺蟲抗性轉基 因,除草劑耐受性轉基因,氮利用效率轉基因,水利用效率轉基因,營養品質轉基因,DNA結 合轉基因,選擇標志物轉基因,或其組合。
[0187] 在一個實施方案中,植物、植物組織或植物細胞包括玉米栽培種LLN37Ubi_l 5'-UTR或前導序列。在一個實施方案中,玉米栽培種LLN37Ubi-l 5'-UTR或前導序列可以是SEQ ID NO: 6的多核苷酸。在一個實施方案中,植物、植物組織或植物細胞包括基因表達盒,所述 基因表達盒含有5'_UTR或前導序列,其中該5'-UTR或前導序列與SEQ ID N0:6至少80%, 85% ,90% ,91% ,92% ,93% ,94% ,95% ,96% ,97% ,98% ,99% ,99.5% ,99.8%,或 100% 相同。在一個實施方案中,基因表達盒包括與啟動子可操作連接的玉米栽培種LLN37UM-15'-UTR或前導序列,其中該啟動子是泛素啟動子,或者來自植物(例如玉米泛素-1啟動 子)、病毒(例如木薯葉脈花葉病毒啟動子),或細菌(例如土壤桿菌delta mas)的啟動子。在 一個實施方案中,植物、植物組織或植物細胞包括基因表達盒,所述基因表達盒含有與轉基 因可操作連接的玉米栽培種LLN37Ubi-15'-UTR或前導序列。在一個示例性實施方案中,植 物、植物組織或植物細胞包括基因表達盒,所述基因表達盒含有與轉基因可操作連接的玉 米栽培種LLN37Ubi-l 5'-UTR或前導序列,其中該轉基因可以是殺蟲抗性轉基因,除草劑耐 受性轉基因,氮利用效率轉基因,水利用效率轉基因,營養品質轉基因,DNA結合轉基因,選 擇標志物轉基因,或其組合。
[0188] 在一個實施方案中,植物、植物組織或植物細胞包括Ubi-1內含子。在一個實施方 案中,植物、植物組織或植物細胞包括玉米栽培種LLN37Ubi-l內含子。在一個實施方案中, 玉米栽培種LLN37Ubi-l內含子可以是SEQ ID N0:8的多核苷酸。在一個實施方案中,植物、 植物組織或植物細胞包括基因表達盒,所述基因表達盒含有內含子,其中該內含子與SEQ ID N0: 8至少80 % ,85% ,90% ,91% ,92% ,93% ,94% ,95% ,96% ,97% ,98% ,99%, 99.5% ,99.8%,或100%相同。在一個實施方案中,基因表達盒包括與啟動子可操作連接的 玉米栽培種LLN37Ub i -1內含子,其中該啟動子是泛素啟動子,或者來自植物(例如玉米泛 素-1啟動子)、病毒(例如木薯葉脈花葉病毒啟動子),或細菌(例如土壤桿菌delta mas)的 啟動子。在一個實施方案中,植物、植物組織或植物細胞包括基因表達盒,所述基因表達盒 含有與轉基因可操作連接的玉米栽培種LLN37Ubi-l內含子。在一個示例性實施方案中,植 物、植物組織或植物細胞包括基因表達盒,所述基因表達盒含有與轉基因可操作連接的玉 米栽培種LLN37Ubi-l內含子,其中該轉基因可以是殺蟲抗性轉基因,除草劑耐受性轉基因, 氮利用效率轉基因,水利用效率轉基因,營養品質轉基因,DNA結合轉基因,選擇標志物轉基 因,或其組合。
[0189] 在一個實施方案中,植物、植物組織或植物細胞包括與轉基因可操作連接的玉米 栽培種LLN37Ubi-l上游啟動子、Ubi-1內含子和Ubi-1 5'-UTR。當基因表達盒包括2個或更 多個轉基因時,該玉米栽培種LLN37Ubi-l上游啟動子、Ubi-1內含子和Ubi-1 5'-UTR可以和 基因表達盒內的不同轉基因可操作連接。在一個示例性實施方案中,基因表達盒包括與轉 基因可操作連接的玉米栽培種LLN37Ubi-l啟動子,其中該轉基因可以是殺蟲抗性轉基因, 除草劑耐受性轉基因,氮利用效率轉基因,水利用效率轉基因,營養品質轉基因,DNA結合轉 基因,選擇標志物轉基因,或其組合。在一個示例性實施方案中,基因表達盒包括與轉基因 可操作連接的玉米栽培種LLN37Ubi-l內含子,其中該轉基因可以是殺蟲抗性轉基因,除草 劑耐受性轉基因,氮利用效率轉基因,水利用效率轉基因,營養品質轉基因,DNA結合轉基 因,選擇標志物轉基因,或其組合。在一個實施方案中,基因表達盒包括與啟動子可操作連 接的玉米栽培種LLN37UM-1內含子,其中該啟動子是泛素啟動子,或者來自植物(例如玉米 泛素-1啟動子)、病毒(例如木薯葉脈花葉病毒啟動子),或細菌(例如土壤桿菌delta mas) 的啟動子。在一個示例性實施方案中,基因表達盒包括與轉基因可操作連接的玉米栽培種 LLN37Ubi-l 5 ' -UTR,轉基因可以是殺蟲抗性轉基因,除草劑耐受性轉基因,氮利用效率轉 基因,水利用效率轉基因,營養品質轉基因,DNA結合轉基因,選擇標志物轉基因,或其組合。
[0190] 在一個實施方案中,植物、植物組織或植物細胞包括含有如本文所述的組成型基 因啟動子調節元件的載體。在一個實施方案中,植物、植物組織或植物細胞包括含有如本文 所述的與轉基因可操作連接的組成型基因啟動子調節元件的載體。在一個實施方案中,植 物、植物組織或植物細胞包括含有如本文所述的基因表達盒的載體。在一個實施方案中,載 體可以是質粒、粘粒、細菌人工染色體(BAC)、噬菌體、或病毒片段。
[0191] 在一個實施方案中,根據本文公開方法的植物、植物組織或植物細胞可以是單子 葉植物。該單子葉植物、植物組織或植物細胞可以是,但不僅限于,玉米,水稻,小麥,甘蔗, 大麥,黑麥,高粱,蘭花,竹子,香蕉,香蒲,百合,燕麥,洋蔥,小米,和黑小麥。
[0192] 在另一個實施方案中,根據本文公開方法的植物、植物組織或植物細胞可以是雙 子葉植物。該雙子葉植物、植物組織或植物細胞可以是,但不僅限于,油菜,芥花(canola), 印度芥,埃塞俄比亞芥,大豆,向日葵和棉花。
[0193] 關于遺傳修飾植物的產生,用于將植物基因工程的方法是本領域眾所周知的。例 如,已經開發了大量用于植物轉化的方法,包括用于雙子葉植物以及單子葉植物的生物和 物理轉化方案(例如Goto-Fumiyukiet al.,Nature Biotech 17: 282-286(1999) ;Miki et al.,Methods in Plant Molecular Biology and Biotechnology,G1ick,B?R?和 Thompson,J.E?編輯,CRC Press , Inc ?,Boca Raton,第67-88頁(1993))。此外,用于植物細 胞或組織轉化和植物再生的載體和體外培養方法可以在例如下列文獻中獲取:Grub er et al.,Methods in Plant Molecular Biology and Biotechnology,G1ick,B?R?和 Thompson,J.E.編輯,CRC Press,Inc.,Boca Raton,第89-119頁(1993)。
[0194] 本領域的技術人員會意識到,在外源序列穩定組入到轉基因植物體內并被確認可 以工作之后,可以通過有性雜交將它引入到其它植物中。可以使用大量標準育種技術中的 任一種,取決于待雜交的物種。
[0195] 通過對經過工程化的植物材料選擇或篩選由轉化DNA上存在的標記基因所編碼的 性狀,可以鑒定并分離出轉化的植物細胞、根、葉、愈傷組織、組織或植物。例如,可以通過在 含有抑制量的抗生素或除草劑(轉化基因構建體可以賦予對該抗生素或除草劑的抗性)的 培養基上培育工程化的植物材料來進行選擇。另外,還可以通過篩選重組核酸構建體上可 能存在的任何可見的標志物基因(例如,YFP,GFP,0_葡萄糖醛酸酶,焚光素酶,B或C1基因) 的活性來鑒定轉化細胞。這些選擇和篩選方法是本領域技術人員眾所周知的。
[0196] 還可以使用物理和生物化學方法鑒定含有插入基因構建體的植物或植物細胞轉 化體。這些方法包括但不僅限于:1) Southern分析或PCR擴增,用于檢測和確定重組DNA插入 物的結構;2)Northern印跡、S1RNA酶保護、引物延伸或逆轉錄酶-RNA擴增,用于檢測并檢查 基因構建體RNA轉錄本;3)酶學測定,用于檢測酶或核酶活性,如果這樣的基因產物由所述 基因構建體編碼的話;4)二代測序(NGS)分析;或5)蛋白凝膠電泳、western印跡技術、免疫 沉淀或酶聯免疫吸附測定(ELISA),如果所述基因構建體的產物是蛋白質的話。也可以使用 其它的技術,例如原位雜交、酶染色和免疫染色,來檢測重組構建體在特定植物器官和組織 中的存在或表達。實施這些實驗的方法是本領域技術人員眾所周知的。
[0197] 使用本文公開的方法進行的基因操作的效果可以通過,例如,從感興趣的組織中 分離的RNA(例如,mRNA)的Northern印跡來進行觀察。通常,如果存在mRNA或者mRNA的量增 加了,則可以推定相應的轉基因被表達。可以使用其它用于測量基因和/或編碼多肽活性的 方法。可以使用不同類型的酶測定,取決于所用的底物以及檢測反應產物或副產物增加或 降低的方法。此外,多肽的表達水平可以用免疫化學手段測量,通過使用ELISA,RIA,EIA和 本領域技術人員眾所周知的其它基于抗體的測定,例如通過電泳檢測方法(無論是與染色 還是印跡法聯用)。作為一個非限制性的實例,在美國專利公開號2009/0093366(通過提述 并入其全部內容)中描述了使用ELISA測定檢測AAD-1 (芳氧基鏈烷酸雙加氧酶;參見W0 2005/107437)和PAT(膦絲菌素-N-乙酰基轉移酶)蛋白。轉基因還可以選擇性地在一些細胞 類型或植物組織中表達,或者在某些發育階段中表達。轉基因還可以在基本上所有的植物 組織中沿著其整個生命周期表達。然而,任何組合的表達模式也是可以使用的。
[0198] 本公開還包括上述轉基因植物的種子,其中該種子包括報告基因、轉基因、或基因 表達盒。本公開進一步包括上述轉基因植物的后代、克隆、細胞系或細胞,其中所述后代、克 隆、細胞系或細胞包括所述報告基因、轉基因或基因構建體。
[0199] 盡管已經參考具體的方法和實施方案對本發明進行了描述,但是應當意識到,在 不背離本文中描述的本發明的前提下可以進行各種修改和變化。 實施例
[0200] 實施例1:新型啟動子鑒定和分離
[0201] 使用聚合酶鏈式反應(PCR)從玉米栽培種LLN37的Ubi-1基因擴增了新型啟動子序 列。設計用于擴增該新型啟動子,稱為玉米栽培種LLN37,的寡核苷酸(表1)來自于用作對照 的玉米栽培種B73UM-1啟動子序列的保守區。從玉米栽培種LLN37獲得了一個PCR產物,并 進行了表征。
[0202] 使用Invitrogen Zer〇B:lutlt?_TOPO?PCR克隆試劑盒并根據制造商的使用說 明,將包含新型啟動子的PCR產物克隆到Topo?載體中。提供了一幅載體圖來顯示包含新型 啟動子PCR產物的克隆質粒。質粒pDAB105712對應于玉米栽培種LLN37(圖2)。
[0204]克隆之后,使用本領域技術人員已知的方法對含有PCR產物的啟動子插入物進行 測序。將玉米栽培種LLN37的各啟動子多核苷酸序列(圖4)計算比對,隨后分析它們與玉米 栽培種B73UM-1對照序列(圖3)的序列同源性。序列同源性分析使用本領域技術人員已知 的生物信息學方法和/或軟件程序,例如ClustalW或Sequencher來執行。
[0205]實施例2:新啟動子表征
[0206] 序列同源性分析(圖3-7),包括與玉米栽培種B73UM-1對照序列(SEQ ID N0:1;圖 3)的序列比對和比較,顯示了一個供進一步表征的新Ubi-1啟動子。還觀察到這個獲自玉米 栽培種LLN37的新Ubi-1啟動子序列(SEQ ID N0:2;圖4)包括三個不同區域的多核苷酸序 列:1)上游啟動子區(SEQ ID N0:4),2)5'-UTR(SEQ ID N0:6),和3)內含子(SEQ ID N0:8)。 分析了來自玉米栽培種LLN37的啟動子區和特異性啟動子元件與玉米栽培種B73Ubi-l對照 序列的序列同源性(圖5-7)。更具體地,進行序列比對來獨立地比較玉米栽培種LLN37啟動 子的上游啟動子、5'-UTR和內含子區,以及TATA框和熱休克元件(HSE)調節元件與玉米栽培 種B73Ubi-l對照序列的相應區域(圖5-7,表2)。
[0208]圖5顯示了玉米栽培種LLN37啟動子的上游啟動子區與玉米栽培種B73UM-1對照 啟動子序列的上游啟動子區的序列比對。圖6顯示了玉米栽培種LLN37啟動子的5 ' -UTR或前 導序列與玉米栽培種B73Ubi-l對照啟動子序列的5'-UTR或前導序列的序列比對。圖7顯示 了玉米栽培種LLN37啟動子的內含子區與玉米栽培種B73Ubi-l對照啟動子序列的內含子序 列的序列比對。
[0209] 從玉米栽培種11^37得到的啟動子元件與玉米栽培種8731]1^-1序列顯示99.5%的 總體序列同一性(表2)。來自玉米栽培種LLN37的新型啟動子序列的特征確認,通常在功能 性啟動子中發現的大多數啟動子調節元件(即,TATA框或熱休克元件)在玉米栽培種LLN37 啟動子的核心啟動子區域內也是高度保守的(表2)。例如,圖5顯示了高度保守的TATA框(堿 基對869-876,用斜體和下劃線顯示),它被鑒定并被發現定位在新型玉米栽培種LLN37UM-1啟動子的上游啟動子區的TSS 5'上游大約50bp處。類似地,圖5顯示了兩個重疊的熱休克 元件(HSE)序列(分別為堿基對457-481,用下劃線顯示,和482-500,用雙下劃線顯示),它們 在本項研究分析的新型玉米栽培種LLN37UM-1啟動子中是保守的,并且位于TSS 5'上游大 約200bp處。此外,位于玉米栽培種LLN37Ubi-l啟動子上游啟動子區內的10bp啟動子調節元 件(堿基對90-100,用下劃線顯示)與在玉米栽培種B73Ubi-l上游啟動子區內發現的相同元 件100%相同(圖5)。
[0210] 新型玉米栽培種LLN37Ubi-l啟動子的5'-UTR或前導區與玉米栽培種B73Ubi-l對 照序列100%相同(圖6),但是在上游啟動子區(圖5)和內含子區(圖7)中也鑒定了序列保守 性略低的區域。例如,玉米栽培種LLN37Ub i -1啟動子的上游啟動子和內含子區與玉米栽培 種B73UM-1啟動子的序列同一性分別是99.9%和99%。總體上,玉米栽培種11^37啟動子的 所有區域與玉米栽培種B73Ubi-l對照啟動子序列(表2)相比高度保守。
[0211] 此外,在延伸到TSS 5'上游100-200bp的玉米Ubi-1上游啟動子區內存在更多的調 芐基序。這些基序與轉錄因子結合,這些轉錄因子與轉錄起始復合體相互作用并易化其組 裝,提高其穩定性,或一旦轉錄機構開始工作,增加啟動子脫離的效率(PEREMARTI et al.2010)。因此,這個調節區域內的缺失、取代和錯配會潛在影響啟動子的強度和特異性。
[0212] 實施例3:使用新型啟動子用于基因表達的載體構建
[0213] 除非另外指出,否則這個實施例和后續實施例中描述的分子生物學和生物化學操 作通過標準方法實施,例如在Ausubel et al.(1995)和Sambrook et al.(1989)及其更新 版本中公開的。本實驗中使用的構建體在下面有更詳細的描述(表3)。
[0214] 從玉米物種的Ubi-1基因提取包含如前所述上游啟動子、5'_UTR和內含子區的玉 米啟動子,并且PCR擴增子使用QIAquick凝膠提取試劑|?(Qiagen Carlsbad,CA)進行凝 膠純化。然后使用本領域已知的標準克隆技術將啟動子多核苷酸序列克隆到Gateway 入門載體? ( Invitrogen)中。通過限制性消化和測序進行確認所得的Gateway 人門載體⑧包括玉米栽培種LLN37的Ubi-1啟動子序列。將包括玉米栽培種B73Ubi-l啟動 子序列的對照入門載體也使用本領域的標準克隆技術克隆到Gateway入門載體中。
[0215] 除了Ubi-1啟動子序列之外,入門載體還包括來自杯水母物種的黃色熒光蛋白報 告基因(PhiYFP;Shagin,D.A.,(2004)M〇1 Biol Evol. 21; 841-50),在其序列中納入了ST-LS1 內含子(Vancanneyt,G.,(1990)M〇1 Gen Genet.220;245_50),和玉米過氧化物酶5基因 (ZmPer5;美國專利6,699,984)的3 ' -UTR區。提供了顯示包含每一個啟動子序列的克隆入門 載體的載體圖。構建體PDAB105742對應于包含玉米栽培種B73Ubi-l啟動子序列的對照入門 載體。構建體PDAB105741對應于包含玉米栽培種LLN37Ubi-l啟動子序列的對照入門載體。 這樣,建立了包含玉米Ubi-1啟動子、PhiYFP基因和ZmPer5 3'-UTR的基因表達盒的入門載 體。
[0216] 如表3所示,構建了二元表達載體構建體,其包括受所述新啟動子序列驅動并以 ZmPer5 3'-UTR終止的PhiYFP報告基因。使用標準目的二元載體pDAB101917和包含如上所 述的基因表達盒的入門載體通過使用標準克隆方法和Gateway?重組反應構建了用于土 壤桿菌介導的玉米胚轉化的轉化或表達載體。
[0217]二元目的載體PDAB101917包括除草劑耐受基因,草胺膦乙酰轉移酶(PAT; Wehrmann et al.,1996,Nature Biotechnology 14:1274-1278)。在pDAB101917載體中, PAT基因的表達受到玉米Ubi-1啟動子、5'-UTR和內含子的控制。該pDAB101917載體還包括 來自玉米脂肪酶基因(ZmLip;美國專利7,179,902)的3 ' -UTR區。該ZmLip 3 ' -UTR用于終止 PAT mRNA的轉錄。該Gateway?重組反應能夠將每個包含基因表達盒(即玉米栽培種LLN37 或玉米栽培種B73Ubi-l啟動子、PhiYFP基因和ZmPer5 3'-UTR)的入門載體插入到 pDAB 101917目的二元載體中。入門載體被插入在pDAB 101917目的載體內T-DNA邊界A和B之 間,并位于PAT表達盒的上游。
[0219]提供了顯示二元表達載體pDAB101917的載體圖,其具有基因表達盒,該表達盒包 括納入的玉米Ubi-1啟動子、PhiYFP基因和ZmPer5 3'-UTR。對照構建體pDAB105748對應于 包含玉米栽培種B73Ubi-l啟動子的基因表達盒(圖8)。此外,構建體pDAB105747對應于包含 玉米栽培種LLN37Ubi-l啟動子序列(圖9)的基因表達盒。
[0220] 實施例4:植物轉化
[0221]使用本領域已知的標準轉化技術將二元載體構建體,pDAB105748(玉米栽培種 B73)和pDAB105747 (玉米栽培種LLN37),各自轉化進入根癌土壤桿菌菌株EHA101中。分離細 菌菌落,并提取二元質粒DNA,純化,并通過限制酶消化進行確認。
[0222] 玉米植物的轉化根據Vega et al.,2008,Plant Cell Rep 27:297-305中描述的 方案進行,采用土壤桿菌介導的轉化和膦絲菌素乙酰轉移酶基因(PAT;Wehrmann et al., 1996,Nature Biotechnology 14:1274-1278)作為選擇性植物標志物。使用包含二元載體 構建體(如上所述)的根癌土壤桿菌培養物轉化玉米栽培種Hi-II植物,產生了第一輪To轉 基因玉米事件(表4)。在轉化2.5個月之后,產生、制備并收獲了未成熟的合子胚。
[0223] 各個基因表達構建體的轉化結果進一步如表4所述。公開了產生的胚的總數、在愈 傷組織階段和在整個植物中觀察到的轉基因事件的總數,以及總體轉化效率百分比。由于 在許多實驗中胚的活力較差,二元表達構建體的總體轉化效率低于先前的報道(Vega et al.,2008)〇
[0225] 實施例5:轉基因拷貝數分析
[0226] 通過水解探針測定確認Phi YFP轉基因在轉基因玉米植物基因組內的穩定整合。獲 得從愈傷組織發育而來的穩定轉化的轉基因玉米小植物,并分析鑒定含有全長T-鏈插入物 的低拷貝數(即,1 -2個拷貝)事件。
[0227] 使用Roche Light Cycler 480?系統根據制造商的使用說明確定轉基因拷貝數。 該方法使用二重TaqMan hcR反應,其在單一測定體系中采用特異針對PhiYFP基因的寡核 苷酸和針對內參基因玉米轉化酶(ZmInv;Genbank登錄號U16123.1)的寡核苷酸。通過測量 PhiYFP特異性熒光相對于Zmlnv特異性熒光的強度,并與已知拷貝數標準進行比較,確定拷 貝數和接合性。
[0228] 用一組TaqMan"引物/探針擴增PhiYFP基因特異性DNA片段,該組含有用FAM?熒 光染料標記的探針;用第二組TaqManiy引物/探針擴增Zmlnv,該組含有用HEX?熒光染料標 記的探針(表5)。用于拷貝數分析的引物和探針由Integrated DNA Technologies (Coralville,IA)商業合成。FAM?熒光基團在465/510nm光密度下激發,而HEX?熒光基團在 533/580nm光密度下被激發。
[0229] 使用表6所述的試劑準備10yl最終反應體積的PCR反應。根據表7中提出的熱循環 條件擴增了基因特異性DNA片段。通過測量特異針對報告基因 PhiYFP的熒光與特異針對參 考基因 Zmlnv的熒光的相對強度,與已知拷貝數的標準進行比較,確定樣品的拷貝數和接合 性。
[0230] 通過將載體pDAB108706稀釋到玉米栽培種LLN37基因組DNA(gDNA)中以獲得具有 已知的PDAB108706: gDNA比值的標準品,制作了拷貝數標準品。例如,制備了具有1、2、和4個 拷貝載體DNA/1個拷貝玉米栽培種LLN37gDNA的樣品。pDAB108706的1或2拷貝稀釋物與玉米 栽培種LLN37gDNA標準品混合,以已知為雜合的對照玉米事件和已知為純合的對照玉米事 件(即,玉米事件278;參見PCR國際專利公開No.W0 2011/022469A2)作為對照加以驗證。
[0231] 采用特異針對PAT基因的寡核苷酸和特異針對內源Zmlnv參考基因的寡核苷酸實 施TaqMai^二重PCR擴增測定。使用一組TaqMan?引物和用FAM?熒光染料標記的探針 (表5 ),通過PCR擴增檢測PAT基因特異性DNA片段。還使用第二組引物和用HEX?熒光染料標 記的探針擴增并檢測Zmlnv內參/對照基因(表5) 〇PATTaqMan?反應混合物的制備如表6所 示,并根據表7中列出的條件擴增特異性片段。
[0232] 表8顯示了通過用不同啟動子構建體轉化獲得的轉基因植物的轉基因拷貝數分析 的結果。將只有具有1 -2個拷貝PhiYFP轉基因的植物轉移到溫室中,并培植用于進一步的表 達分析。
[0238] 實施例6: PhiYFP和PAT蛋白的ELISA定量
[0239]使用葉ELISA測定對V4-5發育期的植物進行采樣。將樣品收集在96孔收集管平板 中,每個樣品采集4個葉盤(紙張打孔器尺寸)。向每個試管添加2個4.5mm BB(Daisy corporation,Roger,AR)和 200yL 提取緩沖液[lxPBS,補充0 ? 05 % Tween?-20 和0 ? 05 %BSA (Mi 11 iporeProbumill⑨,EMD Millipore Corp.,Billerica,MA)]。向每個試管再添加200ii L提取緩沖液,隨后通過顛倒混勻。將平板3000rpm離心5分鐘。將上清液轉移到保持于冰上 的深孔96的相應孔中。使用NullC__96孔Maxi-Sorp平板(Thermo Fisher Scientific Inc ?,Rockford,IL)進行ELISA。用小鼠單克隆抗-YFP捕獲抗體(OriGene Technologies Inc.,Rockville,MD)包被平板。抗體用roS稀釋(lyg/mL),每個孔添加150yL稀釋的roS。將 平板置于4°C溫育過夜。將過夜平板保持于室溫20-30分鐘,之后用350此清洗緩沖液[lx PBS 補充 0.05%丁\\$611?-20(31811^41扣1(*,5七丄01118,]\?))]清洗4次。平板用200此/孔封 閉緩沖液[1 x PBS補充0? 05%Tween?-20+0.5:%.BSA(Millip0reProbumin?)]在+37°C 封閉最少1小時,隨后用350此清洗緩沖液(Tomtec QuadraWash? 2,Tomtec,Inc.,Hamden, CT)清洗4次。
[0240]對于YFP ELISA,使用Evrogen重組Phi-YFP lmg/mL(Axxora LLC,Farmingdale, NY)作為標準品。使用5參數擬合標準曲線(lng/ml-0.125ng/ml標準)以確保所有數據均落 在該曲線的線性部分。向孔中添加100yL標準品或樣品。使用在測定緩沖液中最少1:4稀釋 的樣品。將平板置于平板搖床(250rpm;Titer Plate搖床)上室溫溫育1小時,隨后用350yL 清洗緩沖液(Tomtec QuadraWash? 2)清洗4次。向每個孔添加大約lOOyL lyg/mL Evrogen 兔多克隆抗-PhiYFP第一抗體(Axxora)。將平板置于平板搖床上以250rpm室溫溫育1小時, 隨后用350yL清洗緩沖液(Tomtec QuadraWash? 2)清洗4次。接著,添加100此用封閉/測定 緩沖液以1:5000稀釋的抗-兔IgG HRP第二抗體(Thermo Scientific),使用Envirologix的 試劑盒(P〇rtland,ME)對PAT蛋白進行定量。ELISA使用多個稀釋的植物提取物,且基本上使 用由供應商提供的試劑和使用說明。
[0241] 實施例7:與新型啟動子可操作連接的轉基因的穩定表達
[0242] 在轉基因植物組織中對蛋白表達進行觀察。例如,觀察在通過與土壤桿菌共培養 而穩定轉化的To植物的愈傷組織中的PhiYFP表達。從使用含有新型啟動子pDAB105747(玉 米栽培種LLN37,圖9)和對照啟動子pDAB105748(玉米栽培種B73,圖8)的二元載體構建體轉 化的玉米胚培植轉基因植物。在使用YFP濾鏡和500nm光源的立體顯微鏡(Leica Microsystems,Buffalo Grove,IL)下觀察植物愈傷組織。圖10顯示了在包含pDAB105747的 轉基因T 〇玉米植物的愈傷組織中觀察到的P h i Y F P穩定表達的代表性實例,并與對照 PDAB105748進行比較。數據證實,如本文所述的包含pDAB105747(玉米栽培種LLN37)的新型 啟動子能夠驅動Ph iYFP基因在To轉基因植物的愈傷組織中強烈表達。
[0243] 如表8所示,將含有低拷貝數(即1-2個拷貝)PhiYFP轉基因的整株植物培植在溫室 中。一般地,每個構建體有大約5個到大約10個事件,每個事件有大約5株植物用于Ti表達分 析。ELISA數據表明,與對照構建體pDAB105748(玉米栽培種B73)相比,在使用含有新型啟動 子pDAB105747(玉米栽培種LLN37)的載體構建體的!^玉米植物的葉中存在PhiYFP蛋白的一 致性表達。
[0244] 在包含新型啟動子構建體pDAB105747(玉米栽培種LLN37,圖9)的1^植物中觀察到 的平均PhiYFP蛋白表達為大約153.7ng/mg(+/-20.9ng/mg) PhiYFP,相比之下,在包含對照 構建體pDAB105748(玉米栽培種B73,圖8)的對照植物中產生的PhiYFP蛋白為大約285.3ng/ mg(+/-22.7ng/mg)。從這些結果可以確認,本文所述的來自玉米栽培種LLN37的新型啟動子 可用于以高水平蛋白產生制造轉基因性狀。
[0245] 此外,所有包含pDAB105747(玉米栽培種植物的平均PAT表達為大約 73.2ng/mg(+/-6.8),而在包含來自玉米栽培種B73啟動子的pDAB105748的對照植物中產生 的PAT蛋白為大約105.8ng/mg(+/-7.4ng/mg)。總體上,所有植物的PAT蛋白表達均顯著低于 玉米植物中觀察到的Phi YFP基因的表達。
[0246] 對于代表本文中描述的每種新啟動子構建體的選定!^轉基因植物,還測量了這些 植物的雄穗(tassel)的花粉中的PhiYFP蛋白表達。如圖11所示,轉基因花粉的圖形分析確 認,包含如本申請所述pDAB105747(玉米栽培種LLN37)的新型啟動子可在花粉中驅動 PhiYFP蛋白的高表達。
【主權項】
1. 一種基因表達盒,其包括與轉基因可操作連接的啟動子,其中該啟動子包括與SEQ ID NO:2具有至少90%序列同一性的多核苷酸。2. 權利要求1的基因表達盒,其中該啟動子在嚴格條件下與如下所述的多核苷酸探針 雜交:該多核苷酸探針包含與SEQ ID NO:2的互補物的至少90%的序列同一性。3. 權利要求1的基因表達盒,其中該可操作連接的轉基因編碼多肽或小RNA。4. 權利要求1的基因表達盒,其中該轉基因選自下組:殺蟲劑抗性轉基因、除草劑耐受 性轉基因、氮利用效率轉基因、水分利用效率轉基因、營養品質轉基因、DNA結合轉基因、和 選擇標志物轉基因。5. 權利要求1的基因表達盒,其進一步包括3 非翻譯區。6. -種重組載體,其包括權利要求1的基因表達盒。7. 權利要求6的重組載體,其中該載體選自下組:質粒、粘粒、細菌人工染色體、病毒、和 噬菌體。8. -種轉基因細胞,其包括權利要求1的基因表達盒。9. 權利要求8的轉基因細胞,其中該轉基因細胞是轉基因植物細胞。10. -種轉基因植物,其包括權利要求9的轉基因植物細胞。11. 權利要求10的轉基因植物,其中該轉基因植物是單子葉植物或雙子葉植物。12. 權利要求11的轉基因植物,其中該單子葉植物選自下組:玉米植物,水稻植物,和小 麥植物。13. 來自權利要求10的轉基因植物的轉基因種子。14. 一種轉基因細胞,其包含與SEQ ID N0:2具有至少90%序列同一性的合成多核苷 酸。15. 權利要求14的轉基因細胞,其中該合成多核苷酸在嚴格條件下與如下所述的多核 苷酸探針雜交:該多核苷酸探針與SEQ ID NO:2的互補物包含至少90%的序列同一性。16. 權利要求14的轉基因細胞,其中該轉基因細胞是轉基因植物細胞。17. 權利要求16的轉基因細胞,其中該轉基因植物細胞是通過植物轉化方法產生的。18. 權利要求17的轉基因細胞,其中該植物轉化方法選自下組:土壤桿菌介導的轉化 法,生物射彈轉化法,碳化硅轉化法,原生質體轉化法和脂質體轉化法。19. 一種轉基因植物,其包括權利要求14的轉基因植物細胞。20. 權利要求19的轉基因植物,其中該轉基因植物是單子葉植物。21. 權利要求20的轉基因植物,其中該單子葉植物選自下組:玉米植物,水稻植物,和小 麥植物。22. 來自權利要求21的轉基因植物的轉基因種子。23. -種重組載體,其包括權利要求14的基因表達盒。24. 權利要求23的重組載體,其中該載體選自下組:質粒、粘粒、細菌人工染色體、病毒 和噬菌體。25. -種用于在轉基因植物中表達異源編碼序列的方法,該方法包括: a) 用含有如下所述的多核苷酸序列的基因表達盒轉化植物細胞:該多核苷酸序列包含 與異源編碼序列可操作連接的SEQ ID N0:2,該異源編碼序列與3'非翻譯區可操作連接; b) 分離包含該基因表達盒的轉化植物細胞; C)將該轉化植物細胞再生成轉基因植物;和 d)獲得該轉基因植物,其中該轉基因植物包括所述含有包含SEQ ID NO: 2的多核苷酸 序列的基因表達盒。26. 權利要求25的方法,其中該異源編碼序列選自下組:殺蟲劑抗性編碼序列、除草劑 抗性編碼序列、氮利用效率編碼序列、水分利用效率編碼序列、營養品質編碼序列、DNA結合 編碼序列、和選擇標志物編碼序列。27. 權利要求25的方法,其中轉化植物細胞是植物轉化方法。28. 權利要求27的方法,其中該植物轉化方法選自下組:土壤桿菌介導的轉化法,生物 射彈轉化法,碳化硅轉化法,原生質體轉化法和脂質體轉化法。29. 權利要求25的方法,其中該轉基因植物是單子葉植物或雙子葉轉基因植物。30. 權利要求29的方法,其中該單子葉轉基因植物選自下組:玉米植物,小麥植物,和水 稻植物。31. 來自權利要求25的轉基因植物的轉基因種子。32. 權利要求25的方法,其中該異源編碼序列在轉基因植物組織中表達。33. 權利要求25的方法,其中該轉基因植物組織是轉基因植物根、芽、莖或花粉組織。34. -種用于分離包含與SEQ ID NO: 2的至少90%序列同一性的多核苷酸序列的方法, 該方法包括: a) 鑒定包含與SEQ ID的至少90%序列同一性的多核苷酸序列; b) 產生多個寡核苷酸引物序列,其中該寡核苷酸引物序列能結合包含與SEQ ID的至少 90 %序列同一性的多核苷酸序列; c) 用選自該多個寡核苷酸引物序列的寡核苷酸引物序列從DNA樣品擴增包含與SEQ ID 的至少90%序列同一性的多核苷酸序列;和 d) 分離包含與SEQ ID的至少90%序列同一性的多核苷酸序列。35. 權利要求34的方法,其中該包含與SEQ ID N0:2的至少90%序列同一性的分離多核 苷酸序列與轉基因可操作連接。36. 權利要求35的方法,其中該可操作連接的轉基因編碼多肽或小RNA。37. -種純化的多核苷酸序列,其包含與SEQ ID N0:2的至少90%的序列同一性,其中 該純化的多核苷酸序列促進轉基因的表達。38. 權利要求37的純化多核苷酸序列,其中包含與SEQ ID NO: 2的至少90%序列同一性 的多核苷酸探針序列在嚴格條件下與權利要求37的純化多核苷酸序列雜交。39. 權利要求37的純化多核苷酸序列,其中該純化多核苷酸序列與轉基因可操作連接。40. 權利要求39的可操作連接的轉基因,其中該可操作連接的轉基因編碼多肽。41. 一種基因表達盒,其包含與轉基因可操作連接的權利要求37的純化多核苷酸序列, 所述轉基因與3 非翻譯區可操作連接。42. 權利要求41的基因表達盒,其中該轉基因選自下組:殺蟲劑抗性轉基因、除草劑抗 性轉基因、氮利用效率轉基因、水分利用效率轉基因、營養品質轉基因、DNA結合蛋白轉基 因、和選擇標志物轉基因。43. -種重組載體,其包括權利要求41的基因表達盒。44. 權利要求43的重組載體,其中該載體選自下組:質粒載體、粘粒載體、和BAC載體。45. -種轉基因細胞,其包括權利要求37的純化多核苷酸序列。46. 權利要求45的轉基因細胞,其中該轉基因細胞是轉基因植物細胞。47. -種轉基因植物,其包括權利要求46的轉基因植物細胞。48. 權利要求47的轉基因植物,其中該轉基因植物是單子葉植物。49. 權利要求48的轉基因植物,其中該單子葉植物選自下組:玉米植物,小麥植物,和水 稻植物。50. 來自權利要求49的轉基因植物的轉基因種子。
【文檔編號】C12N15/00GK106029882SQ201480076356
【公開日】2016年10月12日
【申請日】2014年12月31日
【發明人】S·庫馬爾, M·古普塔, T·R·賴特, S·M·杰恩, D·A·史密斯, D·阿拉伯德
【申請人】美國陶氏益農公司