的"包括指已通過引入異源核酸進行修飾的細胞或載體,或者源 于經運樣修飾過的細胞的細胞。因此,例如,重組細胞可由于蓄意人為干預而表達不W同樣 形式存在于天然(非重組)形式的該細胞內的基因或者表達原本被異常表達、低表達或根本 不被表達的天然基因;或者可具有減低了的或消除了的天然基因表達。本文所用的術語"重 組的"不涵蓋通過天然發生的事件(例如自發突變、天然轉化/轉導/轉座)進行的細胞或載 體的改變,所述事件諸如在沒有有意人為干預的情況下發生的那些。
[0105] 本文所用的"重組表達盒"是核酸構建體,通過重組法或合成法產生,具有一系列 規定的核酸元件,其允許特定核酸在祀細胞中的轉錄。重組表達盒可滲入質粒、染色體、線 粒體DNA、質體DNA、病毒或核酸片段中。通常,除了其他序列W外,表達載體的重組表達盒部 分還包含待轉錄的核酸和啟動子。
[0106] 如本文所用,"轉基因植物"包括指在其基因組內包含異源多核巧酸的植物。一般 來講,異源多核巧酸穩定地整合在基因組內使得該多核巧酸得W傳遞到連續世代。異源多 核巧酸可單獨整合進基因組中,或者作為重組表達盒的一部分整合進基因組中。"轉基因" 在本文中用來包括其基因型已因異源核酸的存在而被改變的任何細胞、細胞系、愈傷組織、 組織、植物部分或植物,包括那些最初如此改變的轉基因 W及那些通過從最初的轉基因進 行有性雜交或無性繁殖而產生的轉基因在內。如本文所用,術語"轉基因"不涵蓋通過常規 植物育種方法或通過諸如隨機異花受精、非重組病毒感染、非重組細菌轉化、非重組轉座或 自發突變之類的自然發生事件導致的基因組(染色體基因組或染色體外基因組)的改變。
[0107] 本文所用的"載體"包括指用于轉染宿主細胞并可在其中插入多核巧酸的核酸。載 體常常是復制子。表達載體容許插入其中的核酸的轉錄。
[0108] W下術語用來描述兩條或更多條核酸或多核巧酸或多膚之間的序列關系:(a)"參 考序列",(b)"比較窗口",(C)"序列同一性",(d)"序列同一性百分比"和(e)"基本上同一 伴'。
[0109] 如本文所用,"參考序列"是用作序列比較基準的確定的序列。參考序列可W是指 定序列的子集或全體;例如,作為全長cDNA或基因序列的區段,或者完全的cDNA或基因序 列。
[0110] 本文所用的"比較窗口"意指包括指多核巧酸序列的連續和指定的區段,其中該多 核巧酸序列可與參考序列進行比較,并且其中所述多核巧酸序列在比較窗口中的部分相比 于參考序列(不包含添加或缺失)可包含添加或缺失(即空位),W便兩個序列的最佳比對。 通常,比較窗口長度為至少20個連續的核巧酸,任選可為30、40、50、100個或更長。本領域技 術人員理解,為避免由于在多核巧酸序列中加入空位所致的與參考序列的高度相似性,通 常引入空位罰分并從匹配數扣除空位罰分。
[0111] 將核巧酸和氨基酸序列進行比對W作比較的方法是本領域公知的。Smith and Waterman, (1981 )Adv. Appl .Math 2:482(Smith和Waterman,1981年,《應用數學進展》,第2 卷,第482頁)的局部同源算法(BESTFIT)可對用于比較的序列進行最佳比對;Needleman and Wunsch,( 1970) J.Mol.Biol. 48:443-53(化edleman和Wunsch,1970年,分子生物學雜 志,第 48 卷,第 443-453 頁)的同源比對算法(GAP);Pearson and Lipman,( 1988) Proc. Natl. Acad. Sci . USA 85:2444(Pearson和Lipman,1988年,《美國國家科學院院刊》,第 85卷,第2444頁)的相似性捜索算法(Tfasta和化sta);運些算法的計算機化執行包括但不 限于:加利福尼亞州山景城Intelligenetics公司(Intelligenetics .Mountain View, California)的PC/Gene程序中的CLUSTAL、WisconsinGenetics軟件包,第8版(可得自 Genetics Computer G;toup(GCGK程序,加利福尼亞州圣地亞哥Accelrys公司 (Accel巧S,Inc.,San Diego,CA))中的GAP、邸STFIT、BLAST、FASTA和TFASTA。化USTAL程序 在W下文獻中得到很好的描述:Higgins and Sha;rp,(1988)Gene 73:237-44化iggins和 化日巧,1988年,《基因》,第73卷,第237頁);化旨旨1118日11(1化日巧,(1989化481055:151-3 化iggins和化曰巧,1989年,《計算機在生物科學中的應用》,第5卷,第151-153頁);Co巧et, et al.,(1988)Nucleic Acids Res.l6:10881-90(C〇巧et等人,1988年,《核酸研究》,第 16 卷,第10881-10890頁);Huang,et al.,(1992)Computer Applications in the Biosciences 8:155-65化uang等人,1992年,《計算機在生物科學中的應用》,第8卷,第155- 165頁)W及化arson,et al .,( 1994)Meth .Mol. Biol. 24:307-31 (Pearson等人,1994年,《分 子生物學方法》,第24卷,第307-331頁)。用于多個序列的最佳全局比對的優選程序是 PileUp(Feng and Doolittle,(1987)J.Mol.Evol.,25:351-60Weng和Doolittle,1987年, 《分子進化學雜志》,第25卷,第351-360頁),其類似于Higgins and化日巧,(1989)CABI0S5: 151-53化iggins和化曰巧,1989年,《計算機在生物科學中的應用》,第5卷,第151-153頁)中 描述的方法,將文獻W引用方式并入本文。可用于數據庫相似性捜索的化AST程序家族包 括:用于核巧酸查詢序列對核巧酸數據庫序列的BLASTN;用于核巧酸查詢序列對蛋白質數 據庫序列的BLASTX;用于蛋白質查詢序列對蛋白質數據庫序列的BLASTP;用于蛋白質查詢 序列對核巧酸數據庫序列的TBLASTN和用于核巧酸查詢序列對核巧酸數據庫序列的 TBLASTX。參見Current Protocols in Molecular Biology .Chapter 19 ,Ausubel et al., eds.,Greene Publishing and Wiley-Interscience,化w 化rk(1995)(《現代分子生物學 實驗技術》,第19章,Ausubel等人(編輯),威利-英特科學出版公司,紐約,1995年)。
[0112] 如本領域普通技術人員將會理解的,BLAST捜索假定蛋白質可W隨機序列建模。然 而,許多真實蛋白質包含非隨機序列區,該非隨機序列可為同聚段、短周期重復或富含一種 或多種氨基酸的區域。運種低復雜性區域可在不相關的蛋白質之間比對,盡管該蛋白質的 其他區域完全不相似。可采用多種低復雜性過濾程序來減少運種低復雜性比對。例如,可單 獨使用或組合使用SEG(Wooten and 化derhen,( 1993),Comput.Chem. 17:149-63(Wooten和 Federhen,1993年,《計算化學雜志》,第17卷,第149-163頁))和XNlKClaverie and Sl:ates, (1993)Comput. Chem. 17:191-201 (Claverie 和 S化 tes,1993年,《計算化學雜志》,第 17卷,第 191-201頁))低復雜性過濾程序。
[0113] 在兩條核酸或多膚序列的情形中,本文所用的"序列同一性"或"同一性"包括是指 當在指定的比較窗口上進行比對W獲得最大對應時兩個序列中相同的殘基。當序列同一性 百分比針對蛋白質使用時,認識到不相同的殘基位置往往差別在于保守氨基酸替換,其中 氨基酸殘基由具有相似化學性質(例如電荷或疏水性)的其他氨基酸殘基替換,因此不會改 變分子的功能性質。如果序列差別在于保守替換,則可上調序列同一性百分比w校正替換 的保守性質。差異在于運種保守替換的序列被稱為具有"序列相似性"或"相似性"。作出運 個調整的手段是本領域技術人員公知的。通常,運設及將保守替換評定為部分錯配而不是 完全錯配,從而提高了序列同一性百分比。因此,例如,如果相同的氨基酸給予1分,非保守 替換給予0分,則保守替換給予0至1之間的分數。例如,根據Meyers and Miller,(1988) Computer Applic.Biol.Sci .4:11-17(Meyers和Miller,1988年,《計算機在生物科學中的 應用》,第4卷,第11-17頁)的算法計算保守替換的分數,例如如在程序PC/GE肥(美國加利福 尼亞少Η山景城Intelli邑enetics公司(Intelli邑enetics .Mountain View,California, USA))中所實現的。
[0114] 本文所用的"序列同一性百分比"意指通過在比較窗口上比較兩個最佳比對的序 列所確定的數值,其中多核巧酸序列在該比較窗口中的部分與參考序列(不包含添加或缺 失)相比可包含添加或缺失(即,空位),W便兩個序列的最佳比對。該百分比是運樣計算的: 確定在兩個序列中出現相同核酸堿基或氨基酸殘基的位置的數目W得到匹配的位置的數 目,將匹配的位置的數目除W比較窗口中的位置的總數目,然后將結果乘W100W得到序列 同一性百分比。
[0115] 術語多核巧酸序列的"基本上同一性"意指利用所描述的比對程序之一采用標準 參數與參考序列比較時,多核巧酸包含具有50-100%之間的序列同一性,優選至少50%的 序列同一性,優選至少60 %的序列同一性,優選至少70 %,更優選至少80 %,更優選至少 90%且最優選至少95%序列同一性的序列。技術人員將會認識到,可通過考慮密碼子簡并 性、氨基酸相似性、閱讀框定位等等適當調整運些值W確定兩個核巧酸序列所編碼的蛋白 質的相應同一性。出于運些目的,氨基酸序列的基本上同一性通常意指55-100%之間,優選 至少55%,優選至少60%,更優選至少70%、80%、90%,最優選至少95%的序列同一性。
[0116] 直系同源和旁系同源
[0117] 上述同源序列可包含直系同源序列和旁系同源序列。本領域技術人員已知有若干 不同方法用于鑒別和定義運些功能上同源的序列。描述了用于定義直系同源物和旁系同源 物的Ξ種一般方法;可通過下述方法中的一種或多種來鑒別直系同源物、旁系同源物或同 源物。
[011引非編碼區中的變體核巧酸序列
[0119] 硝酸鹽吸收相關的核巧酸序列用于產生變體核巧酸序列,所述變體核巧酸序列具 有5 非翻譯區、3 非翻譯區或啟動子區的核巧酸序列,其與相應的SEQ ID NO: 1的原始核 巧酸序列具有大約70%、75%、80%、85%、90%和95%同一性。運些變體然后與種質中的與 谷物顆粒質量和/或谷物顆粒產量相關的構成性狀的天然變異相關聯。該相關的變體用作 標記單倍型來選擇所期望的性狀。
[0120] OsBGl相關多膚的變體氨基酸序列
[0121] 產生了OsBGl相關多膚的變體氨基酸序列。在本實施例中,改變一個氨基酸。具體 而言,觀察開放閱讀框W確定適當的氨基酸改變。通過參考蛋白質比對(與其他直系同源基 因或來自各種物種的其他基因家族成員的比對)來選擇氨基酸進行改變。選擇據認為不處 于高選擇壓力下(不是高度保守的)且相當易于用具有類似化學特性(即,類似功能性側鏈) 的氨基酸進行替換的氨基酸。利用蛋白質比對,可對適當的氨基酸進行改變。一旦鑒定出目 標氨基酸,即遵循本文所述的程序。使用運個方法產生出具有約70%、75%、80%、85%、 90%和95 %核酸序列同一性的變體。運些變體然后與種質中的與谷物顆粒質量和/或谷物 顆粒產量相關的構成性狀的天然變異相關聯。該相關的變體用作標記單倍型來選擇所期望 的性狀。
[01。] 用于構建核酸的合成方法
[0123] 本公開的分離的核酸也可W通過直接化學合成通過W下方法來制備,諸如用憐酸 Ξ醋方法(化rang,et al. , (1979)Meth.Enz;ymol .68:90-9(化rang等人,1979年,《酶學方 法》,第68卷,第90-99頁));憐酸二醋方法(Brown,et al.,( 1979)Meth. Enzymol. 68:109-51 (Brown等人,1979年,《酶學方法》,第68卷,第109-151頁));二乙基亞憐酷胺方法 (Beaucage ,et al(1981)Tetra 丄etts. 22(20): 1859-62(Beaucage等人,1981年,《四面體 通訊》,第22卷,第20期,第1859-1862頁));如上的Beaucage等人所述的固相亞憐酷胺Ξ醋 方法,用例如如化e化am-VanDevanter,et al.,(1984)Nucleic Acids Res. 12:6159-68 (Nee化am化nDevanter等人,1984年,《核酸研究》,第12卷,第6159-6168頁)所述的自動合 成儀,W及美國專利No.4,458,066的固相支撐方法。化學合成通常產生單鏈寡核巧酸。運可 通過與互補序列雜交或通過使用該單鏈作為模板用DNA聚合酶進行聚合來轉變為雙鏈DNA。 技術人員將會認識到,雖然DNA的化學合成局限于約100個堿基的序列,但可通過連接較短 的序列來獲得較長的序列。
[0124] UTR和密碼子偏好性
[0125] 總體來說,已發現翻譯效率受RNA的5'非編碼或非翻譯區(5'UTR)中的特定序列元 件的調控。正序列基序包括翻譯起始共有序列化〇zak,(1987)Nucleic Acids Res. 15:8125 (Kozak ,1987年,《核酸研究》,第15卷,第81 25頁))和5<G〉7甲基GpppG RNA帽結構 (Drummond,et al.,(1985)Nucleic Acids Res.13:7375(D;rummond等人,1985年,《核酸研 究》,第13卷,第7375頁))。負元件包括穩定的分子內5 'UTR莖-環結構(Muesing,et al., (1987)Cell 48:691 (Muesing等人,1987年,《細胞》第48卷,第691頁))和5'UTR中的AUG序列 或前面有適當AUG的短開放閱讀框(Kozak(出處同上)、Rao ,et al.,(1988)Mol. and Cel 1.Biol. 8: 284(Rao等人,1988年,《分子和細胞生物學》,第8卷,第284頁))。因此,本公開 提供了用于調節異源編碼序列的翻譯的5 '和/或3 ' UTR區。
[012W 植物轉化方法
[0127] 多種用于將外來基因引入植物中的方法是已知的并可用來將硝酸鹽吸收相關的 多核巧酸插入植物宿主中,運包括生物學和物理學的植物轉化方案。參見例如,Miki,et al"Procedure for Introducing Foreign DNA into Plantsin Methods in Plant Molecular Biology and Biotechnology,Glick and Thompson,eds.,CRC Press , Inc., Boca Raton,pp. 67-88 (1993) (M化i等人,"將外來DNA引入植物中的程序",《植物分子生物 學和生物技術方法》,Glick和化ompson編輯,波卡拉頓的CRC出版社,第67-88頁,1993年)。 所選擇的方法隨宿主植物而變化,包括化學轉染方法諸如憐酸巧介導的基因轉移、微生物 介導的基因轉移諸如農桿菌介導的基因轉移化orsch et al.,(1985)Science 227:1229- 31化orsch等人,1985年,《科學》,第227卷,第1229-1231頁))、電穿孔、顯微注射和基因槍轟 山ο
[0128] 用于植物細胞或組織轉化和植物再生的表達盒和載體W及體外培養方法是已知 的并可獲得。參見例如Gruber et al., "Vectors for Plant Transformation,"in Methods in Plant Molecular Biology and Biotechnology,supra,pp.89-119(Gruber等 人,"用于植物轉化的載體",《植物分子生物學和生物技術方法》,出處同上,第89-119頁)。
[0129]可通過一種或多種通常用于直接遞送至細胞中的技術將分離的多核巧酸或多膚 引入植物中。取決于要進行基因修飾的生物體、細胞、植物或植物細胞的類型(即單子葉植 物或雙子葉植物),運種方案可不同。轉化植物細胞的合適方法包括顯微注射(Crossway,et al.,( 1986)Biotechniques 4:320-334(Crossway等人,1986年,《生物技術》,第4卷,第320- 334頁)和美國專利 No. 6 ,300 ,543)、電穿孔(Riggs,et al. ,(1986) Proc. Natl. Acad. Sci . USA83:5602-5606(Riggs等人,1986年,《美國國家科學院院刊》,第83 卷,第5602-5606頁))、直接基因轉移(Paszkowski,et al. ,(1984化MB0 J.3:2717-2722 (化szkowski等人,1984年,《歐洲分子生物學組織雜志》,第3卷,第2717-2722頁))W及彈道 粒子加速(參見例如Sanford等人,美國專利No. 4,945,050; W0 91/10725;和McCabe,et al.,( 1988)Biotechnology6:923-926(McCabe等人,1988年,《生物技術》,第6卷,第923-926 頁))。還可參見 Tomes,et al., "Direct DNA Transfer into Intact Plant Cells Via Microprojectile Bombardment".pp.197-213in Plant Cell,Tissue and Organ Culture.Fundamental Methods .eds.Gamborg and Phillips .Springer-Verlag Berlin Heide化erg化w York,1995(Tomes等人,"通過微粒轟擊將DNA直接轉移到完整的植物細胞 中",第197-213頁,載于《植物細胞、組織和器官培養:基本方法》,Gamborg和化i 11 ips編輯, 施普林格出版社柏林海德堡,紐約,1995年);美國專利No . 4,945,0505,736,369 (分生組 織);Weissinger'et al.,(1988)Ann.Rev.Genet.22:421-477(Weissinger等人,1988年, 《遺傳學年評》,第22卷,第421-477頁);Sanford,et al.,(1987)Pa;rticulate Science and Technology 5 : 27-37(Sanford等人,1987年,《顆粒科學與技術》,第5卷,第27-37頁)(洋 蔥);化;ristou,et al(1988)Plant Physiol. 87:671-674(Qiristou等人,1988年,《植物 生理學》,第87卷,第671-674頁)(大豆);Datta,et al.,(1990)Biotechnology 8:736-740 (Datta等人,1990年,《生物技術》,第8卷,第736-740頁)(水稻);Klein,et al. ,(1988) Proc.化tl. Acad. Sci. USA 85:4305-4309化lein等人,1988年,《美國國家科學院院刊》,第 85卷,第4305-4309頁)(玉米);Klein,et al.,(1988)Biotechnology 6:559-563化16111等 人,1988年,《生物技術》,第6卷,第559-563頁)(玉米);W0 91/10725(玉米);Klein,et al., (1988)Plant I^ysiol. 91:440-444化lein等人,1988年,《植物生理學》,第91 卷,第440-444 頁)(玉米);Ρ?〇πιπι,θ? al. , (1990)Biotechnology 8:833-839(Ρ?οπιπι等人,1990年,《生物技 術》,第8卷,第833-839頁)和Gordon-Kamm,et al.,(1990)Plant Cell 2:603-618(Gordon- Kamm等人,1990年,《植物細胞》,第2卷,第603-618頁)(玉米);Hooydaas-Van Slogteren and Hooykaas (1984)Na1:ure (Xondon) 311:763-764 (Hooydaas-Van Slogteren和Hooykaas, 1984年,《自然》(倫敦),第311卷,第763-764頁);Bytebierm,et al .,( 1987) Proc.Natl. Acad. Sci . USA 84:5345-5349(Bytebier等人,1987年,《美國國家科學院院刊》, 第 84 卷,第 5345-5349 頁)(百合科);De Wet, et al.,(1985)In The Experimental Manipulation of Ovule Tissues,ed.Chapman,et al.,pp.197-209.Longman,NY(De Wet 等人,1985年,載于《胚珠組織的實驗操作》,畑apman等人編輯,朗文出版社,紐約,第197- 209頁)(花粉);Kaepple;r,et al.,(1990)Plant Cell Repo;rts9:415-418化aeppler等人, 1990年,《植物細胞報道》,第9卷,第415-418頁);W及Kaeppler,etal.,( 1992) Theor. Appl. Genet. 84:560-566化aeppler等人,1992年,《理論與應用遺傳學》,第84卷,第 560-566頁)(晶須介導的轉化);美國專利5,693,512(超聲處理);0'化1111111,6*曰1., (1992沖1日111〇611 4:1495-1505(0'化1111111等人,1992年,《植物細胞》,第4卷,第1495- 1505頁)(電穿孔);Li,et al.,(1993)Plant Cell R邱OTtsl2:250-255(Li等人,1993年, 《植物細胞報道》,第 12卷,第250-2