專利名稱:無融合生殖種子的產生方法
技術領域:
本發明涉及遺傳轉化的植物的產生方法。具體地說,本發明主要涉及誘導無融合生殖的方法,由該方法得到的無融合生殖種子,以及從這些種子萌發的植物和它們的子代。
無融合生殖,即通過種子的營養(無性)繁殖,是發現于一些非栽培性的多倍體物種中的基因控制生殖機理。該過程分類為配子體生殖或無配子體生殖。在配子體無性生殖中,有兩種類型(無孢子生殖和倍數孢子形成),形成多個尤其缺少反足核的胚囊,或者在胚囊中產生其它大孢子。在不定胚生殖(無配子體無融合生殖)中,體細胞胚直接由胚囊細胞,子房壁或子房膜發育而來。在不定胚生殖中由周圍細胞發育而來的體細胞胚侵入有性子房,其中一個體細胞胚競爭過其它的體細胞胚和有性胚,并利用所產生的胚乳。
無融合生殖是一種可控制的再生現象,在有性植物與單性植物的有效雜交情況下,它呈現出許多促進植物改良和育種的優點。
例如,無融合生殖能提供純種,雜交種。而且,無融合生殖能縮短和簡化培育過程,以便除去經檢驗能產生和/或穩定一種理想基因組合的自花授精體和子代。由于無融合生殖基因型繁殖與雜合性無關,故無融合生殖將用作具有獨特基因組合的基因型品種。基因或基因組就這樣“象金字塔狀重疊”并“固定”在超基因型中。每一種從有性-單性雜交得來的較好的無融合生殖基因型都有潛能成為育種植物。植物育種者利用無融合生殖能夠發展具有穩定特性的育種植物,比如植株高度,種子和飼料質量及成熟期。育種者在雜交種的商業生產中不受(ⅰ)細胞質-細胞核相互作用產生雄性不育雌性親本或(ⅱ)授粉者的能育性恢復能力的限制。幾乎所有的雜交親合種質都可以是產生單性雜種的潛在親本。
最后,無融合生殖將簡化商業雜交種子的生產。特別是,(ⅰ)將消除對商用雜交種生產田進行物理性隔離的需要;(ⅱ)所有的可用田地都可能用來增加雜交種,以代替在授粉植株系和雄性不育系之間劃分空間;(ⅲ)同時也不必保留親本系的良種。
由無融合生殖種子的產生帶來的潛在益處目前還未被意識到,很大程度上是由于無融合生殖能力進入所感興趣植物體的工程問題。本發明提供了解決該問題的方案,即提供了獲得顯示無融合生殖的不定胚生殖類型的植物的方法。
按照本發明,其中提供了一種產生無融合生殖種子的方法,該方法包括以下幾個步驟(ⅰ)利用編碼一種蛋白質的核苷酸序列轉化植物材料,所說的蛋白質在細胞中或細胞膜中存在時,使得所說的細胞變為胚發生性的,(ⅱ)使轉化材料再生成為植物體,或者其包含心皮的部分,以及(ⅲ)在胚囊附近表達序列。
“胚囊附近”意指下列一項或幾項心皮,珠被,胚珠,胚珠premordium,子房壁,合點,珠心,菌纖索和胎盤。專業人員清楚“珠被”也包括那些組織,如從珠被中獲得的內種皮。“胚發生性的”意指在允許條件下細胞發育成胚的能力。“以活性形式”這一術語包括截短的蛋白質或由于限制條件而突變的其它蛋白質,所說的條件是它們促使胚胎發育開始或擴增,無論其是否發生作用都與信號轉導組分相互作用,要不然它們將含于它們通常存在的組織中。
術語“植物材料”包括原生質體,具有細胞壁的分離植物細胞(如氣孔保衛細胞),花粉,整個組織如外露胚根,莖干,葉片,花瓣,下胚軸段,頂端分生組織,子房,合子胚本身,根,維管束,中柱鞘,花藥纖絲,體細胞胚及其類似物。
本發明另一實施方案涉及一種包含編碼蛋白質的核苷酸序列的DNA分子,所說的蛋白質在細胞中或細胞膜中以活性形式存在時,使得所說的細胞變成胚發生性的。
可將所說的核苷酸序列導入植物材料中,主要是通過細菌或病毒載體,通過微注射,通過在高分子量的乙二醇存在時同時溫育植物材料與序列,或通過在生物惰性微粒表面包被序列,然后將所說微粒導入植物材料中。
表達序列可能產生能跨越植物細胞膜的蛋白激酶,特別地是,該激酶如能夠自身磷酸化的激酶一樣,是富含亮氨酸重復單位的受體。專業人員清楚術語“如激酶一樣的富含亮氨酸重復單位的受體”意味著什么。這種蛋白質的例子包括Arabidopsis RLK5(Walker,1993),ArabidopsisRPS2(Bent等,1994),番茄CF-9基因產物(Jones等,1994),番茄N(Whitham等,1994),矮牽牛花PRK1(Mu等,1994),果蠅Toll基因產物(Hashimoto等,1988),水稻OsPK10基因編碼的蛋白激酶(Zhao等,1994),水稻EST克隆ric2976的翻譯產物及果蠅屬Pelle基因產物(Shelton和Wasserman,1993)。這種蛋白質的其它例子包括,來自Arabidopsis的TMK1,Clavatal,Erecta,和TMKL1基因產物,來自Drosophila的Flightless-1基因產物,來自豬的TrkC基因產物,大鼠LhCG受體和FSH受體,狗TSH受體,以及人Trk受體激酶。蛋白質可能包含配體結合結構域,脯氨酸盒,跨膜結構域,激酶結構域和蛋白質結合結合域。在許多受體激酶中,細胞外(配體結合)結構域作為無配體狀態下激酶結構域的抑制劑。在結合配體之后除去這一抑制。因此,在本發明的一個實施方案中,蛋白質或者是缺少配體結合結構域或者是配體結合結構域功能失活,以便在缺少激活信號(配體)情況下激酶結構域在組成上是有活性的。蛋白質是否具有配體結合結構域-功能活性或功能失活,其一旦被表達并摻入到植物細胞膜中,蛋白質結合結構域優選在細胞內定位。
在本方法的一個優選的實施方案中,所說的序列還編碼細胞膜靶向序列。序列可以是那些在SEO ID Nos:1,2,20,或32中所描述的序列或其類似物,即它互補于在嚴格條件下與所說序列雜交并且編碼具激酶活性的膜結合蛋白質之序列的序列。“類似物”意指一種序列,它互補于能夠與發明序列雜交的試驗序列。當試驗序列和發明序列是雙鏈時,構成試驗序列的核酸在20℃內優選具有發明序列的TM。在試驗序列和發明序列混合并同時變性情況下,序列的TM值相互優選在10℃內。試驗或發明DNA優選受支持時,優選在嚴格條件下完成雜交。這樣,變性試驗序列或發明序列任一種優選與支持體結合,在50至70℃溫度下,在雙強度的含0.1%SDS檸檬酸鹽緩沖鹽水(SSC)中,在特定的時間段內進行雜交,隨后在相同溫度下,用SSC濃度降低的緩沖液沖洗支持體。取決于所需的嚴格程度,以及這樣獲得的序列的相似程度,在一特殊溫度下,例如60℃時,這種濃度降低的緩沖液,典型的是含0.1%SDS的單強度SSC,含0.1%SDS的半強度SSC,含0.1%SDS的十分之一強度的SSC。相似程度最大的序列是那些序列,其雜交過程至少受到在濃度降低的緩沖液中洗滌的影響。最優選的是試驗序列和發明序列是如此的相似,以便在含0.1%SDS的十分之一強度檸檬酸鈉緩沖液中洗滌或溫育時,它們之間的雜交本質上不受影響。
因此,本發明還包括如SEQ ID No.22,24,26,28和30中所描述的DNA序列或互補于在嚴格條件下與所說序列進行雜交并且編碼具激酶活性的膜結合蛋白質的序列的DNA序列。
所說的序列可以被修飾,由此除去已知的mRNA不穩定性序列基元或聚腺苷酸化信號,和/或利用摻入所說序列之植物的優選密碼子,以便在所說植物中這種修飾的序列的表達產生蛋白質,該蛋白質本質上類似于在有機體(其中蛋白質是內源性的)中表達未修飾序列獲得的蛋白質。
為了以組織特異性方式在再生植物體(特別是在其心皮部分)中獲得序列表達,所說的序列優選地在一個誘導型或發育調節型啟動子的表達控制之下,典型地如下列中之一在植物中調節SERK基因表達的啟動子,Arabidopsis ANT基因啟動子,來自Phalaenopsis的O126基因啟動子,胡蘿卜殼多糖酶DcEP3-1基因啟動子,Arabidopsis AtChitⅣ基因啟動子,Arabidopsis LTP-1基因啟動子,Arabidopsis bel-1基因啟動子,矮牽牛花fbp-7基因啟動子,Arabidopsis AtDMC1啟動子,pTA7001誘導型啟動子。DcEP3-1基因是在內部珠被降解期間被瞬時表達,后來在發育胚乳的內襯細胞中表達。AtChiⅣ基因是在珠孔胚乳中被瞬時表達至細胞形成(cellularisation)。LTP-1啟動子在發育珠心的表皮中有活性,包括珠被,種皮和早期的胚。bel-Ⅰ基因在發育的內珠被中表達,而fbb-7啟動子在胚囊發育期間有活性。Arabidopsis ANT基因在珠被發育期間表達,而來自于Phalaenopsis的O126基因在成熟胚珠中表達。
最優選的是在胚囊,子房壁,珠心,或珠被的體細胞中表達所說的序列。
無融合生殖種子中的胚乳來自于胚囊中極性核與授粉的雄配子核子的融合。優選的是表達編碼蛋白質的序列優選于極性核與雄配子核子的融合。
本發明還包括一種DNA,但優選地是一種重組DNA,其包含編碼一種蛋白質的序列,所說的蛋白質在細胞中或細胞膜中存在時,使得所說的細胞變成胚發生性的。優選的是編碼蛋白質的DNA是同激酶一樣的富含亮氨酸重復單位的受體,包括配體結合結構域,脯氨酸盒,跨膜結構域,激酶結構域及蛋白質結合結構域,配體結合結構域可以缺少或是功能上無活性的。
特別是,本發明所說的DNA包含一種DNA序列,其編碼具有以下氨基酸序列的N端蛋白質片段Gln Ser Trp Asp Pro Thr Leu Val AsnPro Cys Thr Trp Phe His Val Thr Cys Asn。
本發明的特定實施方案中涉及到一種DNA,包括編碼蛋白質的DNA序列,這些蛋白質具有SEQ ID Nos 3或21中所描述的序列,或者是一種實質上與其相似的蛋白質,它能夠與膜結合,并具有激酶活性。實質上相似意味著是具有一種氨基酸序列的純蛋白質,該氨基酸序列至少90%類似于以下SEQ ID No 3中描述的蛋白質序列。在本發明的上下文中,彼此至少有90%相似性的兩個氨基酸序列至少具有90%完全相同的或當序列對比最佳出現8個缺口時,在相似的位置進行保守置換的氨基酸殘基,條件是對于每個缺口來說總的不超過4個氨基酸殘基受到影響。為了實現本發明的目的,可能在下組的氨基酸之間進行保守置換(ⅰ)絲氨酸和蘇氨酸;(ⅱ)谷氨酸和天冬氨酸;(ⅲ)精氨酸和賴氨酸;(ⅳ)天冬酰胺和谷氨酰胺;(ⅴ)異亮氨酸,亮氨酸,纈氨酸和甲硫氨酸;(ⅳ)苯丙氨酸,酪氨酸和色氨酸;
(ⅶ)丙氨酸和甘氨酸。
此外,非保守置換也可能低頻發生。因此,本發明還涉及一種DNA序列,包含編碼N端蛋白質片段的DNA序列,這些蛋白質片段具有以下氨基酸序列Val Xaa Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys ThrTrp Phe His Val Thr Cys Asn,Xaa是可變氨基酸,但優選Leu或Val。
在本發明范圍內特別優選的是一種包含編碼N端蛋白質片段DNA序列的DNA,該蛋白質片段具有以下氨基酸序列Val Xaa Gln Ser TrpAsp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val Thr Cys AsnXab Xac Xad Xae Val Xaf Arg Val Asp Leu Gly Asn Xag Xah Leu SerGly His Leu Xai Pro Glu Leu Gly Xaj Leu Xak Xal Leu Gln,從Xaa到Xak為可變氨基酸,但優選Xaa=Leu或ValXab=Asn或GlnXac=Glu或Asp或HisXad=Asn或HisXae=Ser或Arg或GlnXaf=Ile或ThrXag=Ala或SerXah=Glu或AsnXai=Val或AlaXaj=Val或LysXak=Lys或GluXal=Asn或His優選的是,DNA還編碼細胞膜靶向序列,并且蛋白質編碼區處于發育調節型或誘導型啟動子的表達控制之下,例如,在植物中調節SERK基因表達的啟動子,胡蘿卜殼多糖酶DcEP3-1基因啟動子,ArabidopsisAtChitⅣ基因啟動子,Arabidopsis LTP-1基因啟動子,Arabidopsisbel-1基因啟動子,petunia fbp-7基因啟動子,Arabidopsis ANT基因啟動子,或來自Phalaenopsis的O126基因啟動子;Arabidopsis AtDMC1啟動子,或pTA7001誘導型啟動子。
對于所說的DNA,特別優選的實施方案包括在SEQ ID Nos.1,2,20或32中所描述的那些或者是那些互補于在嚴格條件下與所說序列進行雜交的序列,并且其編碼有激酶活性的膜結合蛋白。如上所述,所說的DNA可被修飾,由此除去已知的mRNA不穩定性序列基元或聚腺苷酸化信號,和/或利用摻入所說序列之植物的優選密碼子,以便在所說植物中這種修飾的序列的表達產生蛋白質,該蛋白質本質上類似于在有機體(其中蛋白質是內源性的)中表達未修飾序列獲得的蛋白質。
本發明還包括含有前三段中所述DNA的載體,以重組DNA或載體轉化的植物,含有穩定摻入的DNA的這種植物的子代,和/或該植物或其子代的無融合生殖種子。
本發明的重組DNA分子可通過一些經認證的方法引入植物細胞。本領域技術人員清楚對方法的選擇可以取決于植物的類型,即單子葉植物或者雙子葉植物,作為轉化的目標。適宜的轉化植物細胞的方法包括微注射(Crossway等,生物技術4:320-334(1986)),電穿孔法(Riggs等,美國國家科學院院報83:5602-5606(1986),土壤桿菌介導的轉化(Hinchee等,生物技術6:915-921(1988)),直接基因轉移(Paszkowski等,EMBO J.3:2717-2722(1984)),利用Agracetus公司,Madison,威斯康星及Dupont公司,Wilmington,Delaware提供的彈道粒子加速裝置(見,例如,Sanford等,美國專利4,945,050;和McCabe等,生物技術6:923-926(1988)),原生質體轉化/再生方法(見1994年9月27日頒發給Ciba-Geigy公司的美國專利5,350,689)。也可參見,Weissinger等,遺傳學年鑒22:421-477(1988);Sanford等,粒子科學與技術5:27-37(1987)(洋蔥);Christou等,植物生理87:671-674(1988)(大豆);McCabe等,生物/技術6:923-926(1988)(大豆);Datta等,生物/技術8:736-740(1990)(稻米);Klein等,美國國家科學院院報,85:4305-4309(1988)(玉米);Klein等,生物/技術6:559-563(1988)(玉米);Klein等,植物生理,91:440-444(1988)(玉米);Fromm等,生物/技術8:833-839(1990);及Gordon-Kamm等,植物細胞2:603-618(1990)(玉米)。
包括在本發明范圍之內的是轉基因植物,尤其是通過上述過程轉化的轉基因能育植物和它們的無性和/或有性子代,它們仍包含穩定摻入的DNA和/或這種植物或其子代的無融合生殖種子。
按照本發明的轉基因植物可以是雙子葉或單子葉植物。這些植物包括大田作物,蔬菜類及水果類,有番茄,胡椒,瓜,萵苣,花椰菜,椰菜,甘藍,布魯塞爾苗菜,糖甜菜,玉米,甜玉米,洋蔥,胡蘿卜,韭菜,黃瓜,煙草,苜蓿,紫茄子,甜菜,蠶豆,芹菜,菊苣,豇豆,菊荬菜,葫蘆,落花生,番木瓜,豌豆,花生,鳳梨,馬鈴薯,紅花,脆豆,大豆,菠菜,南瓜,向日葵,高梁,西瓜及其同類植物;同時觀賞植物包括鳳仙花屬,秋海棠屬,矮牽牛花,天竺葵屬的植物,Viola,櫻草屬植物,馬鞭草屬植物,長春花屬,萬壽菊屬,櫻草屬,Saint Paulia,藿香,莧屬植物,Anthirrhinum,耬斗菜屬,菊花,瓜菊,苜蓿,Cosmo,豇豆,大麗花屬,Datura,飛燕草,大丁草,劍蘭,大巖桐,Hippeastrum,松葉菊屬,蛾蝶花,Zinnia及其同類植物。在一個優選的實施方案中,在“種子作物”,如玉米,甜玉米,及豌豆等中表達DNA,通過該方式表達獲得的無融合生殖種子與來自未轉化的同類作物的種子相比,未發生物理性突變或受到損害。優選的Graminaceae科單子葉植物包括Lolium,Zea,Triticum,Triticale,Sorohum,Saccharum,Bromus,Oryzae,Avena,Hordeum,Secale和Setaria植物。
更優選的是轉基因玉米,小麥,大麥,高粱,黑麥,燕麥,草皮及草料草,小米和稻米。特別優選的是玉米,小麥,高粱,黑麥,燕麥,草皮草和稻米。
在雙子葉植物中,Arabidopsis,大豆,棉花,糖甜菜,甘蔗,油籽油菜,煙草和向日葵是較優選的。特別優選的是大豆,棉花,煙草,糖甜菜及油籽油菜。
“子代”表達可理解為包括轉基因植物的“無性”和“有性”方法產生的子代。該定義也意味著包括通過已知方法可得到的所有突變體和變體,例如細胞融合或突變體選擇,連同所有的轉化植物材料雜交和融合產物一起,仍然顯示了初始轉化植物的特征性性狀。只要所說的子代植物仍包含本發明說明的DNA,該定義也包括回交獲得的子代植物。
本發明的另一目的涉及轉基因植物的增殖材料。
轉基因植物的增殖材料,相對本發明,其定義為能夠在體內或在體外經有性或無性繁殖的任何植物材料。在本發明的范圍內特別優選的是原生質體,細胞,愈傷組織,組織,器官,種子,胚,花粉,卵細胞,合子,及其他任何從轉基因植物獲得的繁殖材料。
植物的局部,例如來源于轉基因植物或者通過本發明的方法預先轉化的它們的子代并因此至少部分由轉基因細胞組成的花,莖,果,葉,根,也都是本發明的目的。特別優選無融合生殖種子。
本發明的另一目的是一種產生無融合生殖種子,但優選的是屬于不定胚生殖類型的種子的方法,包括以下步驟(ⅰ)利用編碼一種蛋白質的核苷酸序列轉化植物材料,所說的蛋白質在細胞中或細胞膜中以活性形式存在時使所說的細胞變為胚發生性的,但優選的蛋白質是一種能跨躍植物細胞膜并能自身磷酸化的蛋白質激酶;(ⅱ)使這種轉化材料再生成為植物,或該植物的含心皮部分,以及(ⅲ)在胚囊附近表達序列。
由本發明的DNA表達的激酶蛋白質優選的是如同激酶一樣的富含亮氨酸重復單位的受體,包含配體結合結構域,脯氨酸盒,跨膜結構域,激酶結構域和蛋白質結合結構域。在本發明的特定實施方案中,所說的激酶蛋白質可能缺乏功能性配體結合結構域,但包含脯氨酸盒,跨膜結構域,激酶結構域和蛋白質結合結構域。
通過工程化進入上述轉基因種子和植物的遺傳特性,經有性生殖或營養生長傳遞,能在子代植物中保留和遺傳。一般所說的保留與遺傳使用適合特定的目的,如耕種,播種或收獲而建立的已知農業方法。也可應用專門的方法如水培或溫室技術。當生長的農作物易受昆蟲的傷害或侵染以及雜草植物的競爭時,應采取措施控制雜草,植物病害,昆蟲,線蟲類及其它不利的條件以便提高產量。這些措施包括機械措施,如翻耕土壤或除去雜草及受侵染的植物,也可使用農用化學品,如除草劑,殺真菌劑,殺配子劑,殺線蟲劑,生長調節劑,催熟劑和殺蟲劑。
可進一步在植物育種中利用本發明轉基因植物與種子的有利的遺傳特性,目的在于開發具有改良特性的植物,這些特性如對害蟲,除草劑,或不利條件的耐受性,提高營養價值,增加產量,或改善結構減少因倒伏或落花而造成的損失。各育種步驟以完全確定的人工干涉為特征,如選擇雜交系,引導親本系授粉,或選擇合適的子代植物。取決于所要求的性質不同,采取不同的育種措施。有關技術在本領域是熟知的,包括但不限于雜交,近交,回交繁育,多次繁育,品種融合,種間雜交,非整倍體技術等。雜交技術也包括通過機械、化學或生化手段進行植物絕育產生雄性或雌性不育植物。雄性不育植物用不同系的花粉進行異花傳粉,確保雄性不育但雌性能育植物的基因組將始終如一地獲得雙親系的特性。這樣,本發明的轉基因種子和植物可用于改良植物系的繁育,例如這些植物系可增加常規方法的效能,象使用除草劑或殺蟲劑處理,或者可實現用所說方法進行分配,因為它們具有改進的遺傳特性。另外可獲得對不利條件具有較強耐受性的新的農作物,因為它們優化的基因“裝備”,其生產收獲的產品質量要好于那些不能耐受類似的不利發育條件的產品質量。
在種子生產中,種子萌芽質量和種子均勻性是十分重要的產品特征,而農民收獲和出售的種子,這些并不是重要。因為保持一種作物不混雜有其他作物及雜草種子,控制種生性疾病,并產生萌芽率高的種子十分困難,在培育、調控和銷售純種子的領域中有經驗的種子生產者已經發展了相當廣泛和完全確定的生產實踐。這樣,農民購買經鑒定過的達到一定質量標準的種子,而不是利用自己收獲的種子就是一件平常的事情了。作為繁殖材料的種子通常用保護劑進行包衣處理,包衣物質包含除草劑,殺蟲劑,殺真菌劑,殺細菌劑,殺線蟲劑,軟體動物滅殺劑或它們的混合物。
慣用的保護劑包衣包括化合物如克菌丹,萎銹靈,福美雙(TMTD_),methalaxyl(Apron_)及pirimiphos-methyl(Actellico_)。如果需要將這些化合物與另外一些在制劑領域中習慣使用的載體,表面活性劑或應用促進佐劑混合在一起,可避免受到由細菌,真菌或動物害蟲造成的破壞。保護劑包衣可通過以液態制劑浸漬繁殖材料,也可通過以組合的潮濕或者干燥制劑涂敷來施用。其它的使用方法也有可能,如針對芽或者果實的處理方法。
提供所培養植物的繁殖材料,特別是植物種子是本發明的又一個目的,用通常用于種子處理的種子保護劑包衣對種子進行處理。
提供新的農藝方法是本發明的又一方面,如以上舉例說明的方法,這些方法的特征是利用本發明的轉基因植物,轉基因植物材料,或者轉基因種子。
為了由按照本發明的方法轉化的植物繁育子代,可能要用到下列方法如下述實施例中所述產生的植物在溫室的盆中或土壤里培育,如本領域中已知的方法,允許其開花。從成熟雄蕊獲得花粉,用于給同株植物,同胞植物,或任一理想植物的雌蕊授粉。同樣地,在轉化植物上發育的雌蕊可能由得自同株植物,同胞植物,或者任一理想植物的花粉受粉。通過這一方法獲得的轉化子代可能因存在引入基因和/或伴隨DNA(基因型),或所賦予的表型而區別于非轉化子代。轉化子代同樣地可以自交或與其它植物雜交,如通常任何一種帶有理想性狀的植物所完成的一樣。類似地,用該方法產生的煙草或其它轉化植物可能自交或雜交,如在本領域中已知的一樣,以便產生具有所要求特征的子代。同樣地,結合使用本領域及本發明已知的方法產生的其它轉基因有機體可按本領域已知的方法育種以便產生具有理想特征的子代。
本發明進一步包括一種由植物材料獲得胚發生細胞的方法,該方法包括用本發明中的重組DNA序列或載體轉化植物材料,在該材料或其衍生物中表達序列并使所說的材料或其衍生物受一種化合物的作用,這種化合物充當所說序列基因產物的配體。
本發明進一步涉及一種在體外條件下產生體細胞胚的方法,其中所說的SERK蛋白質被異位超量表達。
本發明還包括在無融合生殖種子生產中使用所說的DNA,在此應用中的序列是在胚囊附近表達的。
在本發明的特定實施方案中,SERK基因可能在轉基因植物,如,例如Arabidopsis植物中,在植物表達信號控制下表達,尤其在植物中調節SERK基因表達的啟動子,但優選發育調節型或誘導型啟動子,如,例如胡蘿卜殼多糖酶DcEP3-1基因啟動子,Arabidopsis AtChitⅣ基因啟動子,Arabidopsis LTP-1基因啟動子,Arabidopsis bel-1基因啟動子,petunia fbp-7基因啟動子,Alabidopsis ANT基因啟動子,或來自Phalaenopsis的O126基因啟動子;Arabidopsis AtDMC1啟動子,或pTA7001誘導型啟動子。
DcEP3-1和AtChitⅣ基因的啟動子可經標準化過程進行克隆和表征。DcSERK編碼序列(SEQ ID No.2)在DcEP3-1,AtChitⅣ或AtLTP-1啟動子后克隆,并轉化進入Arabidopsis。以這樣的方式完成連接,即啟動子與將被轉錄的序列可操作地連接。這一構建體,也含有為選擇轉化材料提供的已知的標記基因,被插入到一個二元載體,如pBIN19的T-DNA區域并轉化進入Arabidopsis。土壤桿菌介導的進入Arabidopsis的轉化,通過專業人員已知的真空滲透或根轉化過程來完成。選擇和收獲轉化的種子并(如有可能)通過正常的自交建立轉化系。以35S啟動子-SERK構建體和整個SERK基因本身的平行轉化用來作為對照,評價在許多細胞中或者僅在極少數天然表達SERK基因細胞中的超量表達。在植物中無論何處存在激活SERK-介導的轉導鏈的信號,35S啟動子-SERK構建體都可引起胚發生。基于攜帶LTP1啟動子-GUS和SERK啟動子-芽孢桿菌RNA酶花粉的供體植物系去雄和產生,建立一個試驗系統。
相同的構建體(35S,EP3-1,AtChitⅣ,AtLTP-1和SERK啟動子融合于SERK編碼序列)用來轉化進入幾個Arabidopsis本底植物。這些本底植物是野生型,雄性不育,fis(emb 173的等位基因)和primordiatiming(pt)-1系,或者是這些本底植物中兩種或幾種的組合。wt系用作對照來評價對正常合子胚形成可能發生的作用,并且記錄去雄后未受精的種子套數。ms系用來直接記錄未受精的種子套數。fis系顯示未受精的種子和胚發育的一定程度,因此可望具有一種無融合生殖胚發生的自然趨勢,它因SERK構建體的存在而增強。pt-1系有很強的再生能力,用來啟動第一個穩定胚發生Arabidopsis細胞的懸浮培養物。可通過相互間的雜交及與包含表達構建體的異位SERK的系進行雜交獲得幾個以上本底植物的組合。除了ms系之外,繁殖都可通過正常的自交進行,隨后分析去雄株的無融合生殖性狀。接著一類似策略是,ATChiⅣ,AtLTP-1及SERK啟動子由bel-1和fbp-7啟動子代替,也可由對雌性配子體組分特異的其它啟動子代替。
產生的附加構建體具有組成型受體激酶活性。大多數的SERK類型受體激酶充當均二聚(homodimeric)受體,需要在能激活下游信號轉導級聯之前自身磷酸化。在許多受體激酶中,在無配體階段胞外結構域成為激酶結構域的抑制劑。在結合配體之后除去這一抑制(Cadena和Gill,1992)。通過導入SERK構建體,從中除去了胞外結合配體結構域,能產生帶有組成上活化的激酶結構域的突變均二聚蛋白質(在沒有自然種群的SERK蛋白質的細胞中)或者均二聚蛋白質(在也表達未修飾形式的細胞中)。這一方法,當與珠心區域的活性啟動子之一結合時,在缺少激活信號的情況下導致胚發生途徑的活化。在必須或需要使SERK途徑的活化僅僅依賴于特異的啟動子活性,而獨立于激活信號的時序調節的情況下這可能是重要的選擇。引入導致不依賴于受精的胚發生(fie)的SERK構建體,在其它物種中試驗它們的作用。為了識別fie表型,專業人員將利用合適的雄性不育本底植物。然而,為了確保產生胚乳,對于不定形胚生殖類型的無融合生殖來說,授粉常常是必要的。
盡管已通過SERK基因在心皮的珠心區域的異源表達產生無融合生殖種子的方法特別描述了本發明,專業人員還將認識到其它的基因,其產物與SERK基因產物有類似的結構/功能,也可能具有同樣的表達結果。此外,雖然實施例說明了在Arabidopsis中無融合生殖種子的產生,但本發明當然不僅限于在這一植物中進行無融合生殖種子誘導基因表達。而且,目前公開的內容也包括這樣一種可能性,即以組成型組織非特異方式在轉化植物材料中表達SERK(或相關)基因序列(例如在CaMV35S或NOS啟動子的轉錄控制下表達)。在此情況下,所說基因產物的配體在胚囊附近范圍內的局部存在,確保了組織特異性。此外,SERK(或相關)基因產物可能與蛋白質如轉錄因子相互作用,這些因子牽涉到調節胚發生。在按照現公開方法轉化的組織內的相互作用也是本發明的一部分。
受益于本說明書的專業人員將清楚SERK基因(和前面段落中描述的其它基因)可轉化進植物材料,植物材料能繁殖和/或分化并用作為外植體,從外植體上可獲得體細胞胚。在轉化組織(易受激酶基因產物的配體的作用)中這種序列的表達本質上增加了細胞在組織中的百分比(與存在于非轉化的類似組織中的細胞數目相比),這樣的細胞能夠形成體細胞胚。
通過下列描述和有關的圖及序列表,本發明將更加明確。
SEQ ID NO.1描述推定的受體激酶(SERK)的Daucus carota基因組克隆,該激酶與感受態細胞向胚發生細胞的過渡有關;SEQ ID NO.2描述所說的推定的激酶的cDNA;SEQ ID NO.3描述預測的由SEQ ID NO:1中的DNA編碼的SERK蛋白質序列;SEQ ID NOs:4-16描述各種PCR引物的序列;SEQ ID NOs:17-19描述SEQ ID NO.2的基因產物中所包含的特異性肽。
SEQ ID NO:20描述推定受體激酶(SERK)的Arabidopsis thaliana部分基因組克隆,該激酶與感受態細胞向胚發生細胞的過渡有關;SEQ ID NO:21描述預測的由SEQ ID NO:20中的DNA編碼的SERK蛋白質序列;SEQ ID NOs:22,24,26,28和30描述與SERK LRR序列具有高同源性的5個EST克隆的部分DNA序列。
SEQ ID NOs.23,25,27,29和31描述SEQ ID NOS:22,24,26,28和30中的5個EST克隆的部分DNA序列的預測蛋白質序列。
SEQ ID NO:32描述來自Arabidopsis thaliana的SERK cDNA的核苷酸序列。
SEQ ID NO:33描述預測的由SEQ ID NO:32中的DNA編碼的Arabidopsis thaliana SERK蛋白質的氨基酸序列。
圖1顯示對從上述組織中提取的RNA進行的RT-PCR實驗結果。顯現SERK表達必須在40個循環后對產生的帶進行Southern印跡分析。泳道包括第7天的外植物,用2,4-D處理少于3天(泳道1)或多于3天(泳道2)。在原物中,在泳道2而不是泳道1中可見到一十分微弱的信號。建立的胚發生培養物(泳道4-6)而不是非胚發生對照物(泳道3)表達SERK基因。在胡蘿卜中,授粉之后除了發育種子外檢測不到任何表達(泳道7)。至授粉后第7天,胡蘿卜合子仍然未分裂,表明觀察到的信號僅來自合子。在第10天和在第20天,胡蘿卜合子胚發生分別達到早球期和心期。在Northern印跡上看不到任何信號。
圖2A顯示用2,4-D處理3天后的第7天的外植體與SERK cDNA整體原位雜交的結果。外植體表面的極少數細胞表達SERK基因,那些表達的細胞都變為胚發生細胞。圖2B顯示包含球期合子胚的部分解剖的種子的整體原位雜交。雜交可通過DIG染色顯現。
圖3顯示在胚發生胚軸細胞中激素誘導活化期間的SERK表達(由整體原位雜交確定)。棒眼50mm(A-E)由活化胚軸的機械斷裂產生的細胞群。只有極少數的一定類型的細胞,被確定增大的細胞顯示SERK表達(星號)。小胞質細胞(c),增大細胞(eg)和大細胞(l)不顯示SERK表達。
(F)在激素誘導的活化之前的胚軸縱向段。在任一類型細胞中都不可能檢測到SERK表達。
(G-I)激素處理開始10天后,來自內胚軸組織的增殖塊(縱向段)。G中在一排顯示相同形態的陰性細胞中,可檢測到顯示SERK表達的單一增大的細胞。H中顯示SERK表達的單一增大的細胞從增殖塊表面分離。I中在增殖組織表面可檢測到一群顯示SERK表達的增大的細胞。
(J)根處理開始10天后,來自內胚軸組織的增殖塊(用2,4-D處理24小時隨后除去激素)。根原基和從表面分離的增大的細胞均不顯示任何SERK表達。
圖4顯示Arabidopsis WS轉化植物的表型,在幼苗階段用2200 bpSERK-熒光素酶構建體對其進行轉化。照片拍于T2種子萌發后28天。在植物Ⅱ和Ⅲ萌芽7天之后的幼苗階段,未見到清晰的枝條分生組織。頭兩片葉子,如果發育完全,如萌發后28天所拍照片上所示的一樣呈針狀。植物Ⅰ已經開始開花,尚未顯示清晰的表型。次生枝條分生組織在第Ⅱ號植物中已經發育,隨后也將在第Ⅱ1號植物中發育。枝條分生組織,花序及正常的花最終在所有植物上發育。
圖5顯示2200 bp SERK螢光素酶構建體如何影響轉化植物長角果中發育胚珠的數量。
圖6顯示體外純化SERK融合蛋白質的自身磷酸化。泳道1純化SERK融合蛋白質;泳道2絲氨酸磷酸酯;泳道3蘇氨酸磷酸酯;泳道4酪氨酸磷酸酯。
下列描述說明如何分離與克隆SERK基因和由所說基因在心皮的珠心區域中的異源表達產生無融合生殖種子,因此形成體細胞胚,它們穿透胚囊并隨著胚囊的發育被種子包裹。SERK基因的分離和克隆在胡蘿卜胚細胞培養物中優選表達的cDNA克隆的分離為了增加成功獲得在能形成胚的胡蘿卜懸浮細胞中表達的基因的機會,要確定一系列建立的細胞培養物中胚形成細胞的數量。培養物的透過30mm尼龍篩的細胞亞群從八種不同培養物中分離出來,培養物的壽命范圍為2個月到4年之間。在這些30mm的子群體中,確定由單一細胞和小細胞群形成的胚的數量,并表示為占胚形成開始時存在的細胞總數的百分比。能夠形成體細胞胚的頻率超過1%的過篩<30mm的培養物隨后可作為感受態細胞的來源,產生不到0.01%胚的培養物用作為非成胚對照。除常規示差篩選cDNA文庫之外,冷噬斑篩選(Hodge等,1992)和示差顯示(dd)RT-PCR(Liang和Pardee,1992)作為主要的克隆方法。
示差篩選的標記探針從篩出的<30mm的細胞子群體中的RNA獲得,這些子群體來自于成胚或非成胚細胞培養物。用這些探針在大約2000種噬斑的文庫篩選中產生噬斑,其中26種不能與任一探針進行雜交。純化并進一步分析這些所謂的冷噬斑。從進行雜交的噬斑總數來看,大約有30種僅與來自成胚細胞的探針進行雜交。從三種成胚和三種非成胚懸浮培養物中分離mRNA,在其上進行利用一個錨引物和一個十鏈節(decamer)引物組合的ddRT-PCR反應。每次反應獲得大約50個不同的ddRT-PCR片段。使用三個不同的錨和六個不同的十鏈節引物的組合,總共大約有1000個不同的cDNA片段顯現。其中所說的六個PCR片段僅在以mRNA和以寡聚體構成的泳道內發現,這些mRNA來自成胚培養物的<30mm的細胞群體(表1),而寡聚體是錨引物(5'-TTTTTTTTTTTGC-3')和十鏈節引物(5′-GGGATCTAAG-3'),(5'-ACACGTGGTC-3′),(5'-TCAGCACAGG-3')的組合。因為差別PCR片段經常是由幾個未分離的cDNA片段組成的(Li等,1994),事實證明克隆所得的PCR片段先于對其的進一步表征十分重要。
所有獲得的克隆都經過第二次篩選,其包括在高度嚴格條件下完成的斑點Northern雜交。這一方法,使用來自整個未篩分的成胚和非成胚懸浮培養物的RNA,證明是一種快速和可靠的另外的可選擇方法。示差篩選后獲得的30個克隆中,僅有一個(22-28)證明局限于成胚細胞培養物,而大多數都是組成型表達的。由冷噬斑篩選獲得的26個克隆在斑點Northern分析中需要長時間暴露。其中六個克隆不顯示任一雜交信號,19個證明能夠在成胚和非成胚細胞培養物中表達。一個克隆(31-50)在所有成胚培養物和一種非成胚培養物,而非其它培養物中顯示出低的表達。由ddRT-PCR顯示獲得的六個克隆片段中,其中四個顯示雜交或多或少地限制到成胚培養物中存在的克隆。對所有經過第二次篩選的克隆進行測序。ddRT-PCR克隆中的兩個(6-8和7-13)與胡蘿卜脂質移換蛋白質(LTP)基因完全相同,以前確定為胡蘿卜成胚細胞培養物的標記。LTP表達限制到成胚細胞群和表皮層,表皮層指來自早球期的體細胞胚表皮和合子胚表皮(Sterk等,1991)。因此,若LTP基因不是感受態細胞的標記,那它在篩選中的出現就確認了我們方法的有效性,即關于體細胞胚發生期間早期表達基因的克隆。cDNA克隆31-50編碼包含受體樣激酶的富含亮氨酸重復單位與分離的克隆31-50對應的mRNA帶有開放的具有1659核苷酸讀框,該讀框編碼55kDa的計算Mw的蛋白質。因為克隆31-50主要在成胚細胞培養物中表達,它被重新命名為體細胞胚發生受體激酶(SERK)。SERK蛋白質包含具有富含五次重復的亮氨酸基元的N端結構域,這種基元在LRR受體激酶中充當蛋白質結合結構域(Kobe和Deisenhofer,1994)。在SERK的胞外LRR結構域和跨膜區域之間是富含脯氨酸的一個33個氨基酸的區域(13),那是SERK蛋白質所特有的。其中特別令人感興趣的是序列SPPPP,它保存在伸展蛋白(一類普通植物的細胞壁蛋白質)中(Varner和Lin,1989)。所提到的蛋白質胞內結構域含有蛋白質激酶的催化核心所特有的11個子結構域。核心序列HRDVKAAN與GTLGYIAPE分別存在于激酶子結構域VB與Ⅷ中,表明其具有絲氨酸和蘇氨酸激酶功能(Hanks等1988)。SERK蛋白質胞內部分的另一令人感興趣的特征是C端24個氨基酸類似單一LRR。存在于胞內LRR序列之內的絲氨酸與蘇氨酸殘基被酸性殘基圍繞,并可能是SERK自身磷酸化的靶,因此以類似方式調節其它蛋白質與這種受體激酶相互作用的能力,象描述的酪氨酸受體激酶的EGF家族的SH2結構域一樣。
SERK cDNA克隆與胡蘿卜基因組的雜交揭示,以EcoR1消化之后,儀有一條主要的雜交帶,可能反映了胡蘿卜基因組中只有一個SERK基因。以Ddel(在SERK基因內切割三次的酶)消化之后確認了這一點。對來自成胚細胞培養物的mRNA進行Northern印跡分析并與標記的SERK探針雜交后,觀察不到任一信號,反映出這些培養物中存在低水平的轉錄物。與其它探針相比暴露長時間之后,有可能在原始斑點印跡Northern上檢測SERK轉錄物。
使用含SERK蛋白質完整胞內區域的細菌融合蛋白質,按照以前描述的自身磷酸化測定方法(Mu等1994),在體外研究SERK蛋白質的自身磷酸化能力。細菌表達的SERK融合蛋白質能夠自身磷酸化,表明SERK蛋白質能夠在體內作為蛋白激酶發揮作用(Heldin,1995)。SERK基因表達符合胚軸活化期間感受態細胞的首先出現以2,4-D誘導胡蘿卜胚軸時,僅僅維管束組織的細胞增殖。表皮和皮層來源的細胞只是膨脹,表明維管束組織從新開始的懸浮培養物中衍生細胞。除去2,4-D 2-3周之后開始形成體細胞胚。成胚細胞先于體細胞胚,成胚細胞又是從感受態細胞發育的。2,4-D存在時感受態和成胚細胞形成,這發生在什么時間及哪些細胞獲得感受態都不清楚。由于以前的實驗(Toonen等1994)揭示了細胞形態不是一種好的標準,用實驗方法確定首先出現的單一感受態細胞,通過在大群的固定化細胞上進行半自動細胞跟蹤來完成。胚軸外植體用2,4-D活化處理七天,發生機械斷裂,所生成的主要單一懸浮細胞群樣品被固定化,從而能夠通過細胞跟蹤來記錄它們的發育狀況。通過該方法得到的固定化細胞群包含所有形態上可辨的細胞類型,這些細胞類型在未斷裂活化胚軸中也可看到。因為已知胚軸活化期間所觀察的不同的細胞形態(Guzzo等1995),所以在活化外植體中追溯每種類型細胞的原始位置是可能的。小的富含細胞質的細胞(16×16mm)是增殖細胞,圍繞在維管束周圍。正在增大的有空泡細胞(16×40mm)富含在增殖細胞群表面可見,當其充分增大時,可從該表面分離(35×90mm)。大的有空泡細胞(超過60×140mm)是胚軸表皮與皮層薄壁組織的非增殖殘余部分。正在增大的和已充分增大的細胞的形狀可從橢圓變化至細長或三角形。跟蹤從活化七天的胚軸釋放的總共24,722個細胞,顯示僅有20個單一細胞形成體細胞胚。由于對連續2,4-D處理的依賴性,形成胚的單一細胞仍處于感受態細胞階段。所有形成胚的單一細胞屬于3,511個增大的細胞的范疇,因此包含那些形成胚頻率為0.56%的感受態細胞。單一細胞跟蹤實驗清楚地揭示了外植體細胞在2,4-D作用下的重新引發細胞分裂的能力,產生胞質含量高并能迅速增殖的細胞群,這些細胞確實與胚形成能力有因果關系。有一點也是清楚的,即在組成新開始的成胚懸浮培養物的細胞中,僅有極有限數量的細胞確實是能形成成胚細胞的感受態細胞。
SERK基因表達,如在細胞跟蹤實驗中使用方法一樣,由在類似的細胞群體上進行的整體原位雜交來確定,發現僅限于0.44%的增大細胞。因此,看起來SERK基因表達的質量和數量都與感受態單一細胞密切相關。
為了洞察外植體活化過程中對SERK表達的時序調節,整體原位雜在完全未經觸動的或手切的外植體上完成,外植體用2,4-D處理不同的時間。在返回到B5-0之前,每隔一天從未處理和用2,4-D處理三天,六天,七天或十天的外植體上收集有代表性的樣品。在用2,4-D處理不到三天的外植體上從未發現任一表達SERK的細胞。盡管在頭五天培養之后增大的細胞開始出現,但在6-7天的2,4-D處理的培養物中,發現極少數最先出現的表達SERK的增大的細胞。這些極少數細胞存在于起源于維管束原組織的增殖細胞群的表面。在用2,4-D處理十天的胚軸中,SERK陽性細胞數量增加至3.04%,在這一階段也包括存在于小型細胞群中的細胞。在小的富含胞質的細胞或大的有空泡細胞中不曾發現任一SERK轉錄物。胚軸也只用2,4-D處理一天,接著在無激素培養基中培養總共七或十天。在這些條件下,外植體細胞增殖并引起根的發生和非成胚細胞培養物的生成,而從未發現SERK表達。上述的原位雜交結果來自數量相對較少的細胞,因此進行RT-PCR后進行Sorthern雜交以便獲得更定量的結果。這些結果在圖7中顯示,并確認在2,4-D處理三天的外植體中感受態細胞的首先出現與SERK基因表達之間的密切時序關系。在與SERK的cDNA探針雜交之后,Northern雜交從未給出任一信號,延長其在Phosphorlmager中的暴露時間后也不曾給出任一信號,符合SERK基因的極端限制表達模式。SERK基因表達符合建立的成胚細胞培養物中感受態細胞的出現迄今為止所描述的結果均表明,感受態細胞和成胚細胞的形成在外植體活化期間局限于一類特殊的增大細胞,在建立的成胚細胞培養物中該情況更復雜。在這種培養物中的感受態單一細胞似乎不屬于任一特殊細胞類型,但卻顯示起源于所有的形態各異的細胞類型。在細胞跟蹤實驗中,成胚細胞,不需要用外源植物生長素處理,從未觀察到其單一形態而總是由至少3-4個細胞團組成(Toonen等1994)。在所有的形態可辨單一細胞類型中,均可觀察到SERK表達,單細胞類型存在于成胚細胞培養物中,取決于細胞類型其頻率在0.1和0.5%之間。在非成胚培養物中,從未見到SERK表達細胞。象在活化外植體中觀察到的一樣,SERK表達并不只限于單一細胞,也出現在2至16個細胞組成的小細胞團中。由于已知這種規模的細胞團由成胚細胞組成,這些數據說明SERK表達不只限于感受態單一細胞,也可能存在于小型成胚細胞團中。在體細胞胚發生的晚球期、心期和魚雷期,未見到任一SERK表達。SERK基因在合子胚中瞬時表達胡蘿卜中的SERK基因表達由RT-PCR測定。結果表明授粉之前,在成熟植物的器官或花中均沒有SERK mRNA積聚。能檢測到SERK表達的第一個場合是在授粉(DAP)后三天的花中,在此階段同時完成受精和胚乳發育過程。與合子胚的早球期對應,直至二十DAP SERK mRNA僅存在于花中(Yeung等人1996)。部分解剖的胡蘿卜種子的整體原位雜交證明SERK基因表達僅發生在早期胚中直到球期。在整個胚胎包括胚柄中觀察到SERK基因表達。受精前后,在幼苗,根,莖干,葉子,發育和成熟的花器官,花粉粒,柱頭中未見到SERK基因表達。發育的種子組織如種子外衣,珠被,受精前所有的胚囊組分及胚乳,在所研究的所有發育階段沒有顯示任一SERK表達。后來的胡蘿卜合子胚階段也完全沒有SERK mRNA。假設這一方式的表達,限定于在合子胚中進行,那么通過RT-PCR檢測花中的信號達3和7DAP一定來自存在于合子中的SERK mRNA,因為胡蘿卜合子在授粉后一周仍然沒分裂(Yeung等,1996)。當與體細胞胚相比時,雖然SERK表達持續至合子球期胚的稍后階段,這些結果確認了體細胞胚發生期間觀察到的SERK基因瞬時表達方式,并意味著在體外感受態細胞的形成和在體內合子的形成之間存在對應關系。方法細胞培養,胚軸外植體誘導及細胞跟蹤細胞培養物來自Daucus carota栽培品種Flakkese,保存方法如前述(De Vries等,1988a)。細胞懸浮培養物,以高細胞密度保存于補充2mM 2,4-D的B5介質(B5-2介質)中(Gamborg等,1968)。具有球期、心期和魚雷期體細胞胚的培養物來自在沒有2,4-D的B5介質(B5-0)中以低細胞密度(100 000細胞/ml)培養的<30mm過篩細胞培養物。對于胚軸外植體誘導實驗,植物幼苗從前述的Daucus carota栽培品種S Valery種子獲得(Guzzo等,1994)。將一周幼苗的胚軸切分成3-5mm的小段,在B5-2介質中培養不同時間再返回B5-0介質。胚軸分段在移出和暴露于2,4-D七天后,在170mm篩上斷裂,收集得到的細胞以形成優質細胞懸浮液。這些細胞在B5-0.2介質中的固定是在一植物凝膠薄層上完成的(Toonen等,1994)。進一步培養一周后通過用B5-0介質沖洗平板除去2,4-D。這樣允許胚在球期后發育。通過前述Toonen等(1994)方法的改進過程記錄固定化細胞的發育。主要變化包括一新的用于自動3維運動的微掃描程序,以掃描在植物凝膠中的所有細胞(Toonen等,1996)。核酸分離和分析RNA從De Vries等(1988b)描述的培養細胞和植物組織中分離而來。Poly(A)+-RNA由低聚(dT)纖維素(Biolabs)純化過程獲得。為進行RNA凝膠印跡分析,10mg的總RNA樣品在甲酰胺凝膠上電泳,并且轉移到nytran-plus膜上。為進行RNA斑點印跡分析,使用hybridot岐管將5mg總RNA變性并吸印到nytran-plus濾膜上。
基因組DNA按照Sterk等(1991)的方法進行分離。10mg的基因組DNA樣品用不同的限制酶消化和在瓊脂糖凝膠上分離,并且轉移到nytran-plus膜(Schleicher和Schuell)上。RNA印跡的雜交在42℃條件下的含50%的甲酰胺,6×SSC,5×Denhardt,0.5%SDS和0.1mg/ml鮭精DNA的雜交緩沖液中進行。DNA印跡的雜交以前述方法完成(Sterk等,1991)。雜交后,在嚴格條件下(在0.1%SSC,1%SDS中,3×20分鐘,65℃)洗滌濾膜。使濾膜曝光于柯達X-Omat AR膠卷。印跡上RNA的完整性和數量經與18S核糖體RNA探針雜交而確認。用ABI373A自動化DNA測序儀(應用生物系統)完成核苷酸序列分析。篩選過程兩個獨立的cDNA文庫用等量的poly(A)+RNA構建,這些poly(A)+RNA來自B5-2介質中培育六天建立的總的細胞培養物,B5-0介質中培育六天的過篩<125mm的細胞培養物及B5-0介質中培育六天的過篩<30mm的細胞培養。cDNA合成和進入Uni-ZAPTM載體的克隆按照“制造商方案”(Stratagene)完成。
cDNA文庫的示差篩選基本上由Scott等(1991)描述的方法完成。三個成胚或三個非成胚細胞培養物經30mm目的篩子篩分后在B5-2介質中培育七天,從中分離RNA。第一條cDNA鏈合成利用AMV逆轉錄酶(Gibco BgL)在4mg總的RNA上完成。利用標記于第一條cDNA上的隨機引物制備[32P]dATP標記的探針。來自成胚和非成胚細胞群的探針與兩對硝酸纖維素濾膜雜交,每對包含來自一個cDNA文庫的1000個噬斑。65℃條件下在0.1%SSC,1%SDS中洗滌3×20分鐘后,由在柯達X-omatic膠卷上的放射自顯影技術顯現雜交兩天。僅顯示具有成胚轉錄物探針信號的噬斑進一步經兩個循環的篩選而純化。
為了確認在<30mm過篩細胞群中以低水平表達的cDNA克隆,用象Hodge等(1992)所描述的方法進行冷噬斑篩選。從示差篩選獲得的,放射自顯影七天后沒有顯示任一信號的噬斑進一步經過兩個循環的篩選純化。得到的克隆作為表征相應基因表達模式的探針。示差顯示RT-PCR示差顯示mRNA基本上如Liang和Pardee(1992)描述的方法完成。cDNA合成通過將1mg總的RNA于10ml的緩沖液中退火,緩沖液包含200mM KCl,10mM Tris-HCl(pH8.3),和1mM具有100ng下列錨引物之一的EDTA:(5)′-TTTTTTTTTTTGC-3′),(5′-TTTTTTTTTTTCTG-3′),(5′-TTTTTTTTTTTCA-3′)。退火通過在83℃下加熱混合物3分鐘,隨后在42℃下培養30分鐘來進行。退火之后加入15ml提前加溫的包含16mM MgCl2,24mM Tris-HCl(pH8.3),8mM DTT,400mM dNTP,以及4單位AMV逆轉錄酶(Gibco BRL)的cDNA緩沖液。42℃條件下發生cDNA合成90分鐘,第一條cDNA鏈用苯酚/氯仿提取并用糖原作為載體用乙醇沉淀。PCR反應在20ml的反應量中完成,包含10%合成cDNA,100ng的錨引物,20ng的下列10鏈節引物之一(5′-GGGATCTAAG-3′),(5′-TCAGCACAGG-3′),(5′-GACATCGTCC-3′),(5′-CCCTACTGGT-3),(5′-ACACGTGGTC-3′),(5′-GGTGACTGTC-3'),2mM dNTP,PCR緩沖液(10mMTris-HCl(pH9.0),1.5mM MgCl250mM KCl,0.01%明膠和0.1%TritonX100)中0.5單位Taq酶和6nM[α-32p]dATP(Amersham)。PCR參數是94℃ 30秒,40℃ 1分鐘和72℃ 30秒,利用Cetus 9600(Perkin-Elmer)40個循環。擴增和標記的cDNAs在6%的變性DNA測序凝膠上分離。在不固定條件下干燥凝膠,同時利用柯達X-omatic膠卷自顯影16小時顯現帶。將包含150-450個核苷酸的差別表達的cDNA片段的帶從凝膠上切下,同時從凝膠切片提取DNA,通過電洗脫將其提取到DE-81紙(Whatmann)上。在低鹽緩沖液(10mM TE緩沖液中100mM LiCl2)中洗滌紙,以及在高鹽緩沖液(在10mM含20%乙醇的TE緩沖液中1M LiCl2)中洗脫cDNA,然后以糖原為載體cDNA通過于乙醇中沉淀而濃縮。利用同上所述的相同的PCR循環參數再擴增cDNA片段,但是PCR緩沖液包含2.5mM的10鏈節和錨低聚引物及100mM dNTP。DE-81紙允許對DNA片段的有效回收和40個循環后再擴增產生平均為500ng的DNA。利用大腸桿菌DNA聚合酶Ⅰ(Pharmacia)的Klenow片段鈍化擴增的PCR產物末端,在SephacryⅠ-S200柱(Pharmacia)上進行純化,連接進SmaⅠ線形pBluescript載體ⅡSK-(Stratagene),并利用電穿孔法轉化進大腸桿菌。RT-PCR來自Daucus carota的成熟植物組織從S & G seeds(Enkhuizen)獲得。手工控制授粉。花組織RNA從每一時間點的三個競爭傘狀花序獲得,其包含所有的包括花粉粒的花器官。來自成熟植物組織或細胞培養物的2mg總RNA在42℃下與50ng低聚(5'-TCTTGGACCAGATAATTC-3′)在10ml退火緩沖液(250mM KCl,10mM Tris-HCl pH8.3,1mMEDTA)中退火。退火30分鐘之后,在15ml cDNA緩沖液(24mM Tris-HClpH8.3,16mM MgCl2,8mM DTT,0.4mM dNTP)中加入1單位的AMV-逆轉錄酶。逆轉錄反應在42℃條件下發生90分鐘。SERK-cDNA的PCR擴增用對SERK激酶結構域特異的兩個低聚引物,(5′-CTCTGATGACTTTCCAGTC-3′)和(5′-AATGGCATTTGCATGG-3′)進行。擴增在94℃ 30秒進行30個循環,在54℃退火30秒,及在72℃延伸1分鐘,隨后在72℃最后延伸10分鐘。整體原位雜交整體原位雜交基本上如前面描述的方法(Engler等1994)完成。將細胞培養物和體細胞胚在外涂多聚-L-賴氨酸的玻片上固定化,在固定期間進行以改善處理。經將七日齡幼苗的胚軸埋入3%的Seaplaque瓊脂糖(Duchefa)中并在Eppendorf試管中處理它們,在外植體上的整體原位雜交發生。橫向及縱向段均用vibrotome(Biorad microcut)制成。厚50-170mm的段在B5-2介質中培養至少三天以誘導胚形成細胞的形成。最佳的誘導是用至少90mm厚的縱向胚軸段實現的。為了獲得增殖的,非成胚細胞培養物,可將胚軸段暴露于2,4-D中僅1天,接著轉入B5-0介質中(Guzzo等,1994)。在發育種子上的整體原位雜交,通過去除種子的合點端使得探針的穿入更容易來完成。雜交之后,小心地剝去珠被和胚乳的外包層以暴露發育的胚。在分段上的原位雜交方法除了利用非放射性探針外如前所述(Sterk等1991)。
所有樣品均在包含70mM EGTA,4%仲甲醛,0.25%戊二醛,0.1%吐溫20及10%DMSO的PBS中固定60分鐘。然后洗滌樣品,用蛋白酶K處理10分鐘,再次洗滌并第二次固定。雜交溶液由包含0.1%吐溫20,330mM NaCl,50mg/ml肝素及50%去離子甲酰胺的PBS組成。利用洋地黃毒苷標記的意義或反義核酸探針(BoehringerMannheim),在42℃進行雜交16小時。洗滌之后用RNaseA處理細胞,同時用抗洋地黃毒苷堿性磷酸酶綴合物(Boehringer Mannheim)培養,該綴合物預先用植物蛋白質提取物吸附。除去過量抗體,可通過沖洗后在染色緩沖液(100mM Tris-HCl pH9.5,100mM NaCl,5mM MgCl2,1mM左旋咪唑)中清洗來完成,并且在包含NBT和BCIP的緩沖液中的染色反應時間為16小時。利用裝備有Nomarski鏡片的Nikon Opbiphot顯微鏡進行觀察。自身磷酸化測定編碼大多數N端三個LRRs以外的開放讀框的SERK cDNA的1.4kB SspⅠ cDNA片段被克隆進入pGEX表達載體(Pharmacia)。由SERK和谷胱甘肽S-轉移酶基因產物組成的融合蛋白質通過以2mM IPTG誘導轉化的E.coli反應三小時而合成。如前述方法(Horn和Walker,1994)分離和純化融合蛋白質。純化的融合蛋白質與谷胱甘肽瓊脂糖小珠(Sigma)連接,在20℃ 10ml的緩沖液(50mM Hepes(pH7.6),10mM MgCl2,10mM MnCl2,1mM DTT,1mCi[y-32p](3000 Ci/mmol))中培養20分鐘。通過在4℃ 50mM Tris-HCl(pH7.3),10mM MgCl2中洗滌融合蛋白質/谷胱甘肽瓊脂糖小珠三次5分鐘除去過量標記物。通過在SDS-PAGE加樣緩沖液中熬煉除去小珠中的蛋白質。等量蛋白質由SDS-PAGE分離,同時通過放射自顯影術顯現蛋白質自身磷酸化。用桿狀病毒表達系統產生的SERK融合蛋白質包含Daucus carota SERK蛋白質的胞內部分(胡蘿卜SERK cDNA克隆31-50的1.0 kB HindⅢ/SspⅠ片段)的另外一些融合蛋白質利用桿狀病毒載體pAcHLT制造。利用這一純化蛋白質的體外磷酸化研究顯示了這一SERK融合蛋白質若非全部,大多數的自身磷酸化發生在蘇氨酸殘基上(圖6)。病毒轉移載體的構建pAcHLT-B與pAcHLT-C桿狀病毒轉移載體用于胡蘿卜SERK基因的兩個cDNA片段的克隆。將胡蘿卜DcSERK cDNA的SspⅠ 1.41 kB片段克隆進入pAcHLT-B的SmaⅠ位點,將胡蘿卜DcSERK cDNA的SspⅠ/PvuⅡ 1.07 kB片段克隆進入pAcHLT-C的SmaⅠ位點。第一構建體包含DcSERK蛋白質的完全的C端部分和推定的胞外區中的脯氨酸富集區和三個富含亮氨酸的重復單位。第二個構建體僅含有DcSERK基因產物的推定的胞內區。為了確認載體內DcSERK cDNA的存在和取向,進行核苷酸序列分析。昆蟲細胞的轉化產生的轉移載體與線性化的AcMNPV桿狀病毒DNA結合用來轉染(脂轉染)來自草地夜蛾(Spodoptera frugiperda)的昆蟲細胞培養物Sf21。單層SF21細胞在裝有2ml Hink介質的35mm的培養皿中轉染。將1微克線形AcMNPV桿狀病毒DNA(Baculogold,Invitrogen)加入到25微升水中的5微克pAcHLT/SERK載體構建體中。15微升Lipofectin(BRL)與10微升水混合,之后加入DNA溶液。混勻后加入200微升Hink介質到混合物中,同時將溶液轉移到單層細胞上,從中除去介質。一小時后,加入500微升Hink介質并培養細胞另3小時。最后,加入含20%胎牛血清(FBS)的Hink介質1ml,同時培養細胞4天。在轉染之后,病毒感染能通過細胞生長的減慢,細胞的膨脹,以及細胞核的增大來鑒定。四天后,收獲被感染的細胞,收集包含感染性芽植病毒的介質并用于噬斑測定和擴增重組病毒原種。單一重組病毒的分離單一重組病毒噬斑從單層細胞分離,這些單層細胞以一定滴定范圍的初級病毒原種感染。感染在具有單層細胞的35mm培養皿中完成。將病毒原種在600微升Graces介質中稀釋,加到單層細胞中,隨后在含20%FBS的Graces介質中溫育90分鐘。接下來,高壓滅菌3%海洋噬斑(Sea Plaque)瓊脂糖,與等量的含20%FBS的2×Graces介質混合,從得到的瓊脂糖取出上層溶液2ml,在除去病毒接種物之后涂布于細胞單層上。溫育4天后可見單一的噬斑并能對其進行純化和進一步分析。融合蛋白質產生確定純化的重組病毒滴度后,在75cm2的瓶中以10的感染復數(MOI)感染單層Sf21細胞。與病毒接種物的細胞溫育進行90分鐘,之后加入8ml含10%FBS的Hink介質。溫育3天后,收獲細胞并用PBS清洗兩次。細胞在冰上溶解于二十倍體積1×昆蟲細胞溶解緩沖液(10mM TrispH7.5,130mM NaCl,1%Triton,100mM NaF,10mM NaPi,10mM NaPPi,并具有蛋白酶抑制劑16mg/l芐脒,10mg/l菲咯啉,10mg/l抑蛋白酶肽,10mg/l亮抑蛋白酶肽,10mg/l胃酶抑制劑A,1mM PMSF)45分鐘。
溶胞產物通過在10.000g下離心30分鐘清除,同時上清液在TALON樹脂(具有對重組體融合蛋白質6×HIS標記的高親和性)中分批培養。室溫下輕輕攪拌20分鐘完成結合過程。樹脂用溶解緩沖液洗滌三次,其后用含200mM咪唑的溶解緩沖液進行洗脫。收集純化的融合蛋白質并通過SDS-PAGE試驗其純度和完整性。自身磷酸化測定通過溫育1微克純化的融合蛋白質30分鐘測定蛋白激酶活性,條件為室溫下在包含10mM MgCl2,10mM MnCl2,1mM DTT和10μM[γ-32]ATP(105pm/pmol ATP)的緩沖液中。在SDS-PAGE之后在含50mM NH4CO3,0.1%SDS,0.25%β-巰基乙醇的緩沖液中從凝膠中純化自身磷酸化的融合蛋白質。用20μg/ml BSA和20%(w/v)固體三氯乙酸沉淀蛋白質。離心之后收集沉淀物,在120℃下在50μl 6N HCl中水解1小時。其后用凍干法除去HCl并將小球懸浮在由2.2%甲酸和7.8%乙酸組成的緩沖液中。水解的蛋白質與對照氨基酸樣品(磷酸絲氨酸,磷酸蘇氨酸,磷酸酪氨酸)一道載于纖維素薄層層析平板上。層析在包含丙酸∶1M氨水∶異丙醇(90∶35∶35v/v/v)的緩沖液中完成。分離和顯現干燥平板之后,所分離的氨基酸通過噴以0.25%丙酮中的茚三酮,其后在65℃加熱5分鐘來顯現。為了檢測磷標記的氨基酸接著使平板暴露于PhosphoImager暗盒。SERK抗體純化的融合蛋白質(10μg)與弗氏完全佐劑混合,IP注射進入BALBc小鼠體內。4周后注射激發抗原(在弗氏不完全佐劑中的10μg純化的融合蛋白質)。兩周后最后一次加強注射。最后加強注射后一周,從這些小鼠體內收集血清。得到的血清的特異性和滴度利用具有或沒有SERK融合蛋白質的總昆蟲細胞提取物在Western印跡上試驗。SERK基因引入植物和無融合生殖種子利用SERK啟動子片段/熒光素酶基因融合轉化胡蘿卜二元載體pMT500基于pBIN19載體(Bevan,1984),包含具有五個獨特限制位點的多接頭熒火蟲熒光素酶基因下游,通過以下方式產生,即螢火蟲螢光素酶編碼區的單向連接,后跟二元載體pMOG800(由荷蘭Mogen N.V.,Leiden友好提供)的HindⅢ-XbaⅠ位點中的來自豌豆rbcS::E9基因的聚腺苷酸化序列。二元載體pMOG800基于pBIN19(Bevan,1984),但當在pBIN19中時,多接頭在側面與左邊緣和新霉素磷酸轉移酶(NPTⅡ)表達盒連接,在pMOG800中的多接頭在側面與右邊緣和NPTⅡ表達盒連接。來自胡蘿卜SERK基因的轉錄調節序列通過用HindⅢ和DraⅠ消化從基因組λ克隆分離而來(SEQ ID NO.1),并克隆進入pBluescript SK+的HindⅢ/SmaⅠ位點。從得到的載體分離包含SERK基因組DNA的KpnⅠ/SstⅠ片段并將其克隆進入二元載體pMT500的KpnⅠ/SstⅠ位點。得到的DNA構建體,pMT531,包含2200bp基因組SERKDNA片段作為啟動子序列,熒光素酶基因作為必需的報道基因,及E9轉錄終止序列。
二元載體pMT531經電穿孔法轉化進入根瘤土壤桿菌菌株MOG101和MOG301(為轉化進入胡蘿卜細胞)和根瘤土壤桿菌菌株C58C1(為轉化進入Arabidipsis thaliana植物)。在含有100mg/l卡那霉素的LB平板上選擇轉化的菌落。胡蘿卜細胞的轉化在基因組胡蘿卜HindⅢ/DraⅠ 2200 bp DNA片段控制下的螢火蟲螢光素酶編碼序列,通過根瘤土壤桿菌介導的胚軸段的轉化引入胡蘿卜細胞。Daucus carota栽培品種‘Amsterdamse bak’的轉化通過將黑暗中生長的一周齡幼苗切成10-20mm的小段完成。切段在新制備的稀釋10倍的過夜土壤桿菌屬培養物上培養20分鐘。將切段干燥和轉移到修飾的Gamborgs B5介質(P1介質;S & G seeds,Enkhuizen,荷蘭)中,B5介質用2μM 2,4-D補充(P1-2)并用瓊脂(Difco,底特律,Mi,美國)固化。在25+0.5℃條件下在暗處培養兩天后,將切段轉移到固化的用卡那霉素(100mg/l),羧芐青霉素(500mg/l;Duchefa)和萬古霉素(100mg/l;Duchefa)補充的P1-2介質中。三周后將切段轉移到新鮮平板上,另三周后挑出轉化的愈傷組織。在16小時光照/8小時黑暗條件下,轉化的愈傷組織與抗生素一起在P1-2平板上培育3周。通過把0.2g愈傷組織轉移到10ml以200mg/l卡那霉素,250mg/l羧芐青霉素和50mg/l萬古霉素補充的液態P1-2介質中,轉化的成胚懸浮培養物如所描述的開始啟動。在最初的幾周內,每間隔一周往培養物中加入1至3體積的新鮮介質。5到7周后將培養物分培至每兩周每50ml介質2ml的疊集細胞量,在25+0.5℃,在16小時光照/8小時黑暗條件下培養。
轉移到卡那霉素選擇介質上一周后,用螢光素噴霧胚軸段以試驗在轉化的愈傷組織中是否是轉化后立即出現螢光素酶表達。大量的胚軸段在切割邊緣顯示螢光素酶活性,但沒有發育愈傷組織。代而行之的是細菌的生長,表明螢光素酶活性具有細菌起源。轉化后六至十周,獲得的愈傷組織顯示可變化量的螢光素酶活性,而不能再觀察到細菌生長。12周后,測定直徑為5-10mm的愈傷組織用來開始懸浮培養。這時未觀察到任何細菌污染。對照轉化實驗,其中在CaMV 35S啟動子作用之下的螢光素酶表達在懸浮培養物中的單一細胞和細胞團中觀察到,證明螢光素酶蛋白質在Daucus carota懸浮培養的細胞中有活性。細胞固定化一周齡的高密度(106-107細胞/ml)懸浮培養物通過連續孔徑為300,125,50和30μm的尼龍篩(Monodur-PES;Verseidag Techfab,Walbeck,德國)進行篩分。通過最后一篩的單一細胞和細胞團被命名為<30μm的細胞群體。未轉化細胞的對照實驗以在P1-2介質中所培育的懸浮培養物Daucus carota栽培品種‘Trophy’(S & G seeds)來進行。按大小分級分離的小于30μm的細胞群體在培養皿(Heraeus,Hanau,德國)中固定于植物凝膠(P8196;Sigma,St Louis,Mo,美國)中。底層由1ml的含有5mM Ca2+和0.2%植物凝膠的P1-0介質組成。以0.1%植物凝膠補充的無Ca2+的B5-0介質中二十萬個細胞(<30μm和<50μm群體)傾倒在底層上面。對于這一層應用了B5,因為在室溫下植物凝膠在無Ca2+的P1介質中固化。固化后2小時,含0.2%植物凝膠的附加P1-0層傾倒在細胞層上以阻止B5層的移動。為防止植物凝膠層的脫水并供給細胞螢光素,固化后加入0.5ml含0.05μM螢光素(Promega,Madison,Wi,美國)的P1-0介質。培養物中最后的螢光素濃度是0.02μM。在單一細胞上螢光素檢測用CCD照相機完成,時間為每小時5次(Schmidt等,(1997)發育124:2049-2062)。培養7天后,通過用P1-0介質徹底洗滌除去培養物中的螢光素。利用SERK啟動子片段/熒光素酶基因融合的Arabidopsis轉化野生型WS植物在標準天長條件下培育16小時光照和8小時黑暗。
為了增加花序的數量除去最先出現的花序。五天后,植物準備進行真空滲透。包含轉化質粒的土壤桿菌屬菌株C58C1培育在具有50mg/l卡那霉素,50mg/l利福霉素和25mg/l慶大霉素的LB平板上。一單一菌落用于接種含50mg/l卡那霉素,50mg/l利福霉素和25mg/l慶大霉素的LB介質。培養物在28℃條件下O/N培育,得到的對數期培養物(OD6000.8)經離心使細胞成團,并重新懸浮于150ml的滲透介質(含5%蔗糖和10μl/l芐基氨基嘌呤的0.5×MS介質(pH5.7))中。6種Arabidopsis植物的花序浸沒在滲透懸浮液中,而植物的余下部分(仍然是盆栽)倒置在金屬網上以避免與滲透懸浮液接觸。在50kPa時對整個裝置抽真空10分鐘。隨后把植物直接放在標準天長條件下。下種后用1%次氯酸鈉浸泡進行表面滅菌,然后用無菌水徹底清洗,并種在具有0.5×MS介質和80mg/l卡那霉素的培養皿上,目的是選出已轉化的種子。在長天條件(10.000lux)之下發芽后五天,轉化的幼苗可通過其子葉的綠色來識別(未轉化幼苗變黃),并在C1實驗室長天條件下的土壤中進一步培育。這種真空滲透方法大約能產生0.1%的轉化種子。
包含編碼卡那霉素抗性基因和與螢火蟲螢光素酶基因融合的2200bp(HindⅢ/DraⅠ)SERK基因組DNA的構建體通過真空滲透轉化進Arabidopsis thaliana(WS),產生六種不同的卡那霉素抗性初級轉化體(Ⅰ,Ⅱ,Ⅲ,Ⅳ,Ⅴ和Ⅵ)。植物Ⅳ和Ⅵ在幼苗階段死去,雖然它們具卡那霉素抗性。T2代能從四種植物Ⅰ,Ⅱ,Ⅲ和Ⅴ獲得(圖4)。在Ⅲ和Ⅴ號植物T2代的長角果內,在大約25-50%種子中能觀察到發育中的早期抑制現象。植物Ⅰ與Ⅱ沒有顯示出發育種子在數量上的減少(圖5)。類似的結果在T3代中也觀察到,其中又是大約25-50%的種子顯示出正常種子發育的早期抑制作用。利用AtSERK基因的Arabidopsis轉化分離AtSERK基因組與cDNA克隆利用DcSERK cDNA序列(seq ID no.2)作為探針,由ArabidopsisLandsberg erecta總基因組DNA形成的λZipLox基因文庫根據同源序列的存在被篩選。可獲得分別具有14,18和20kb插入物的三種不同的λ克隆。14kb克隆由EcoRⅠ消化,得到的片段亞克隆進入pBluescript載體。對橫跨AtSERK基因整個編碼序列的片段進行分離,測序,并且與Daucus相應物比較。所得的序列如SEQ ID NO:20所示。
利用DcSERK cDNA序列(SEQ ID NO:2)作為探針,ZAPⅡ cDNA文庫根據同源序列的存在被篩選。獲得四個λ克隆,它們的插入物利用輔助噬菌體切除過程亞克隆進入pBluescript載體。對橫跨AtSERK基因整個AtSERK cDNA編碼序列的片段進行分離,測序,并且與Daucus相應物比較。所得的序列如SEQ ID NO:32所示。包含啟動子序列的質粒Arabidopsis thaliana LTP1啟動子片段從二元質粒pUH1000(Thoma,S.,Hecht,U.,Kipper,A.,Borella,J.,De Vries,S.C.,Sommerville,C.(1994)植物生理105,35-45),通過用BamHⅠ和HindⅢ消化并克隆進pBluescript SK-(pMT121)獲得。
-由-343到-90區的重復增強的CaMV 35S啟動子(Kay等,(1987)科學236:1299-1302)從pMON999載體,通過用HindⅢ和SstⅠ消化并克隆進入pBluescript SK-載體(pMT120)分離。-啟動子AtDMC1(Klimyuk和Jones(1997)植物雜志11:1-14)。
質粒SLJ 9691是包括pBluescript SK+的構建體,其中Arabidopsisthaliana DMC1基因組克隆(登記號U76670)克隆進入EcoRⅤ位點。SLJ9691攜帶如下修飾過的AtDMC1基因5′端的EcoRV片段BgⅢ位點代替第二HpaⅠ位點,兩個ATG密碼子在第一外顯子中和XhoⅠ位點在第二外顯子的ATG密碼子位置。-來自矮牽牛花的FBP7啟動子(Angenent等(1995)植物細胞7:1569-1582)。
FBP7基因啟動子通過亞克隆FBP7的0.6 kb HindⅢ-XbaⅠ基因組DNA片段進入pBluescript KS-的HindⅢ-XbaⅠ位點被克隆,產生載體FBP201。pAtSERK二元載體的構建體基于pBIN 19載體,構建二元載體pAtSERK以便在不同啟動子控制下轉化Arabidopsis thaliana SERK cDNA。
SERK的全長Arabidopsis thaliana eDNA克隆(Seq ID No.NEW)從pBluescript SK-質粒獲得。包含AtSERK cDNA的SmaⅠ-KpnⅠ2.1 kb片段克隆進入pBIN19 SmaⅠ-KpnⅠ。為了產生二元載體pAtSERK,通過克隆Klenow-填補的EcoRⅠ-HindⅢ E9 DNA片段進入pBIN19:AtSERK載體的Klenow-填補的XmaⅠ位點,豌豆rbcS::E9基因(Millar等,(1992),植物細胞41075-1087)的聚腺苷酸化序列被置于AtSERKES cDNA的下游。植物表達載體的構建pAtSERK二元載體用來產生下列啟動子-AtSERK構建體。
-AtLTP1啟動子在二元載體pAtSERK的SmaⅠ位點克隆,作為Klenow-填補的KpnⅠ-SstⅠDNA片段來給出pAtLTP1AtSERK載體。
-CaMV 35S啟動子在二元載體pAtSERK的SmaⅠ位點克隆,作為Klenow-填補的KpnⅠ-SstⅠ片段來給出p35SAtSERK載體。
-AtDMC1啟動子由來自克隆SLJ 9691的BgⅢ-XhoⅠ3.3kB片段組成,其由Klenow填補并克隆進入pAtSERK二元載體的SmaⅠ位點以給出pAtDMC1AtSERK載體。
-FBP2101的SacⅠ-KpnⅠ片段用Klenow填補并克隆進入pAtSERK二元載體的SmaⅠ位點以給出pFBP2101AtSERK載體。植物表達載體引入Arabidopsis thaliana植物細胞上述載體構建體(pAtLTP1AtSERK,p35SAtSERK,pAtDMC1AtSERK,pFBP2101AtSERK)已經電轉化進入本領域所知的Arabidopsis thaliana植物細胞C58C1菌株。
野生型Arabidopsis thaliana WS植物在標準天長條件下培育16小時光照和8小時黑暗。
去除首先出現的花序目的是增加花序數量。五天后,植物準備好進行真空滲透。包含轉化質粒(pAtLTP1AtSERK載體或p35SAtSERK或pAtDMC1AtSERK載體或pFBP2101AtSERK載體)的土壤桿菌屬菌株C58C1在有50mg/l卡那霉素,50mg/l利福霉素和25mg/l慶大霉素的LB平板上培育。單一菌落用于接種500ml的含50mg/l卡那霉素,50mg/l利福霉素和25mg/l慶大霉素的LB介質。培養物在28℃下O/N培育,離心得到的對數期培養物(OD600 0.8)使細胞成團并重新懸浮于150ml的滲透介質(含5%蔗糖和1mg/l芐基氨基嘌呤的0.5×MS介質(pH5.7))中。6種Arabidopsis植物花序浸沒在滲透懸浮液中,植物的余下部分(仍然是盆栽)倒置在金屬網上以避免與滲透懸浮液接觸。
在50kPa時對整個裝置抽真空10分鐘。隨后將植物直接放置在標準天長條件下。下種后用1%次氯酸鈉浸透進行表面滅菌,然后用無菌水徹底清洗,并種到具有0.5×MS介質和80mg/l卡那霉素的培養皿上以便選出轉化的種子。長天(10.000lux)條件之下發芽后五天,轉化的幼苗可通過其子葉的綠色來識別(未轉化的幼苗子葉變黃),進一步在長天條件下的土壤中培育。真空滲透方法產生大約0.1%的轉化的種子。SERK序列在Arabidopsis thaliana植物細胞中的表達對轉基因和不轉基因的Arabidopsis thaliana植物的花序分析,通過以AtSERK cDNA為探針的整體原位雜交分析來實現。在含70mMEGTA,4%仲甲醛,0.25%戊二醛,0.1%吐溫20及10%DMSO的PBS中固定不同發育階段的花序60分鐘。然后沖洗樣品,用蛋白酶K處理10分鐘,再次沖洗滌并進行第二次固定。雜交溶液由包含0.1%吐溫20,330mM NaCl,50 mg/ml肝素及50%去離子甲酰胺的PBS組成。利用洋地黃毒苷-標記的意義或反義核酸探針(Boehringer Mannheim)的雜交在42℃條件下發生16小時。洗滌之后,細胞用RNaseA處理,同時與用植物蛋白提取物預吸附的抗-洋地黃毒苷-堿性磷酸酶綴合物(Boehringer Mannheim)一起培養。通過沖洗后在染色緩沖液(100mMTris-HCl pH9.5,100mM NaCl,5mM MgCl2,1mm左旋咪唑)中清洗除去過量抗體,在含NBT和BCIP的緩沖液中進行染色反應16小時。利用裝有Nomarski鏡片的Nikon Optiphot顯微鏡進行觀察。
轉化的植物顯示在胚囊附近的SERK異位表達。參考文獻Aleith,F.和Richter,G.(1990)植物183,17-24。
Bent,A.F.,Kunkel,B.N.,Dahlbeck D.,Brown,K.L.,Schmidt,R.,Giraudat,J.,Leung,J.和Staskawicz,B.J.(1994)科學265,1856-1860。
Braun T,Schofield P.R.和Sprengel R.(1991)EMBO J.10,1885-1890。
Dangl,J.L.(1995)細胞80,363-366。
De Jong,A.J.,Schmidt,E.D.L.和De Vries,S.C.(1993)植物分子生物學5,367-377。
De Vries,S.C.,Booij,H.,Meyerink,P.,Huisman,G.,Wilde,H.D.,Thomas T.L.和Van Kammen,A.(1988a)植物176,196-204。
De Vries,S.C.,Hoge,H.和Bisseling,T.(1988b)植物分子生物學手冊,B6,S.B.Gelvin,R.A.Schilperoort和D.P.S.Verma.eds(Dordrecht,荷蘭Klnwer學院出版社),pp1-13。
Dubois,T.,Guedira,M.,Dubois,D.和Vasseur,J.(1991)原生質162,120-127。
Dudits,D.,Gyorgyey,J.,Bogre,L.和Bako,L.(1995)在植物中的體外胚發生。Ed.Thorpe,TA.Klnwer出版社,pp.267-308。
Engler J.A.,Van Montagu M.和Engler G.(1994)植物分子生物學報告12,321-331。
Gamborg,O.L.,Miller,R.A.和Ojima,K.(1968)Exp.Cell.Res.50,151-158。
Giorgetti,L.,Vergara,M.R.,Evangelista,M.,LoSchiavo,F.,Terzi,M.和Ronchi,V.N.(1995)Mol.Gen.Genet.246,657-662。
Goldberg,R.B.,Barker,S.J.和Perez-Grau,L.(1989)細胞56,149-160.
Goldberg,R.B.,Barker,S.J.,Perez-Grau,L.(1989)細胞56,149-160.
Goldberg,RB.,de Paiva,G.和Yadegari,R(1994)科學266,605-614.
Govind,S.和Steward,R.(1991)Drosophila中Dorsoventral模式形成。Trends Genet.7,119-125。
Guzzo,F.,Baldan,B.,Levi,M.,Sparvoli,E.,LoSchiavo,F.,Terzi,M.,和P.Mariani(1995).原生質185,28-36.
Guzzo,F.,Baldan,B.,Mariani,P.,LoSchiavo,F.和Terzi,M.(1994)實驗植物學45,1427-1432。
Hanks,S.K.,Quinn,A.M.和Hunter,T.(1988)科學241,42-52。
Hashimoto,C.,Hudson,K.L.和Anderson K.V.(1988)細胞52,269-279。
Heck,G.R.,Perry,S.E.,Nichols,K.W.和Femandez,D.E.(1995)AGL15,在發育胚中表達的MADS結構域蛋白質。植物細胞7,1271-1282。
Heldin,C-H.(1995)細胞80,213-223。
Hodge,R.,Paul,Wyatt,Draper,J.和Scott,R(1992)植物雜志2,257-260。
Horn,M.A.和Walker,J.C.(1994)生物化學生物物理學報1208,65-74。
Jones,D.A.,Thomas,C.M.,Hammond-Kosack,K.E.,Balint-Kurti,P.J.和Jones,J.D.G.(1994)科學266,789-792。
Kobe B,和Deisenhofer J.(1994)TIBS 19,415-421。
Li,F.,Barnathan,E.S.和Kariko,K(1994)核酸研究22,1764-1765。
Liang,P.和Pardee,A.B.(1992)科學,257,967-971。
Meyerowitz,E.M.(1995)EDBC 95歐洲發育生物學組織討論會。摘要S14。
Mu J-H.,Lee H-S.和Kao T-h.(1994)植物細胞6,709-721。
Pennell,R.I.,Janniche,L.,Scofield,G.N.,Booij,H.,de Vries,S.C.和Roberts,K.(1992)細胞生物學雜志119,1371-1380。
Rounsley,S.D.,Ditta,G.S.和Yanofsky,M.F.(1995)植物細胞7,1259-1269。
Sato,S.,Toya,T.,Kawahara,R.,Whittier,R.F.,Fukuda,H.和Komamine,A.(1995)植物分子生物學28,39-46。
Shelton,C.A.和Wasserman,S.A.(1993)細胞72,515-525。
Sterk,P.,和De Vries,S.C.(1992)In Redenbangh K(ed),Synseeds使用合成種子對農作物的改良,CRC出版社,倫敦(1992)。
Sterk,P.,Booij,H.,Schellekens,G.A.,Van Kammen,A.和De Vries,S.C.(1991)植物細胞3,907-921。
Thomas,T.L.(1993)植物細胞5,1401-1410。
Toonen,M.A.J.和De Vries,S.C.(1995)在胚胎發生,植物的產生。Eds.Wang,T.L.和Cuming,A.BIOS科學出版社,牛津大學,英國,pp.173-189。
Toonen,M.A.J.,Hendriks,T.,Schmidt,E.D.L.,Verhoeven,H.A.,Van Kammen,A和De Vries,S.C.(1994)植物194,565-572。
Toonen,M.A.J.,Schmidt,E.D.L.,Hendriks,T.,Verhoeven,H.A.,Van Kammen,A.和De Vries,S.C.(1996)submitted。
Torii,K.U.和Komeda,Y.(1994)第四次國際植物分子生物學討論會。摘要692。
Van Engelen,F.A.和De Vries,S.G.(1992)Trends Genet.8,66-70。
Varner,J.E.和Lin,L.-S.(1989)細胞56,231-239。
Walker J.C.(1994)植物分子生物學26,1599-1609。
Walker,J.C.(1993)植物雜志3,451-456。
Whitham,S.,Dinesh-Kumar,S.P.,Choi,D.,Hehl,R.,Corr,C.和Baker,B.(1994)細胞78,1101-1115。
Wilde,H.T.,Nelson,W.S.,Booij H.,de Vries,S.C.和Thomas,T.L.(1988)植物176,205-213。
Wurtele,E.S.,Wang,H.,Durgerian,S.,Nikolau,B.J.和Ulrich,T.H.(1993)植物生理102,303-312。
Zhao,Y.,Feng,X.H.,Watson,J.C.,Bottino,P.J.和Kung,S.D.(1994)植物分子生物學26,791-803。
Zimmerman,J.L.(1993)植物細胞5,1411-1423。序列表(1)一般信息(ⅰ)申請人A)姓名;NOVARTIS AG(B)街道Schwarzwaldallee 215(C)城市Basel(E)國家瑞士(F)郵區代碼(ZIP):4058(G)電話+41 61 69 11 11(H)傳真+41 61 696 79 76(I)電傳962 991(ⅱ)發明名稱在有機化合物上或有關有機化合物的改進(ⅲ)序列數33(ⅳ)計算機可讀形式(A)介質類型軟盤(B)計算機IBM PC兼容機(C)操作系統PC-DOS/MS-DOS(E)軟件PatentIn Release #1.0,版本#1.25(EPO)(2)SEQ ID NO:1的信息(ⅰ)序列特征(A)長度6695個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構未知(ⅱ)分子類型DNA(基因組)(ⅲ)假設否(ⅲ)反義否(ⅸ)原始來源(A)生物體Daucus carota
(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置3696..6671(ⅸ)特征(A)名稱/關鍵詞內含子(B)位置3731..3802(ⅸ)特征(A)名稱/關鍵詞內含子(B)位置3851..3979(ⅸ)特征(A)名稱/關鍵詞內含子(B)位置4124..4211(ⅸ)特征(A)名稱/關鍵詞內含子(B)位置4284..4357(ⅸ)特征(A)名稱/關鍵詞內含子(B)位置4430..4528(ⅸ)特征(A)名稱/關鍵詞內含子(B)位置4642..4757(ⅸ)特征(A)名稱/關鍵詞內含子(B)位置4890..4967(ⅸ)特征(A)名稱/關鍵詞內含子(B)位置5295..5803(ⅸ)特征(A)名稱/關鍵詞內含子
(B)位置6197..6339(ⅸ)序列描述SEQ ID NO:1:TCTAGATGAC GAAATCGCGC TACCTTTGAT TTNGAAATAC TAGGTTGTAG TATCTTGATT60AGTTTTTTGG ATATCTTGCT GTAATTTCTT TAGGAGATGC AAACGGTCTT CATTTAATAT 120GAGCCCTTGT GACTTGACAA AAGTATCTAG CATGTTTGAT CACGAGGTAG CTAAAAAGTA 180GCGTGTTTGA TTAAGCACAT AATATTGTAT TGGGCCTATT GGCTATCAAT GAAGTTTGAT 240GCAAGTATAT AGCTTGTATT ATGCATGTGA TGAGGGTATA TAAAAGGGGT AAAGAACATT 300CTCTCGTAGC ATTCATTTTT CTCTTGCCTA TAGTTAACGA GTTTTGTCAC ACATGACGTT 360GAAACTGGAT GTGTCTGTTC TTCCATCTAA GTTTGGATTA CCTGATAGAT GCTCAACTTC 420TTCGTCAGCC TTTTCTTTCC GATTTTTCCC AAGACAAGAT TCTTTAGTTA ATAGTTATTG 480CTCTGGTGGC TTGTGTGCAT TTTAGGAATC TTACTCTGTT TTTTAATGGA GAAACGAAAC 540CTACCTTTTT TTCTGTGTTC CCTTTTATGA TATCACCTGC TTGGAGGCGT TTAGACTTTA 600TCCACCTAAA CTATTCATGT TTACCAGACA AGCTATACGT TTTATCCCCC CCCCCCGCGG 660ACCTGNGGAC AAAAGAAGCG CTGATGAACT GATTTAATCC GTGTTTTATT ATATTACACA 720TTGATGCTTC ATGGAGCTAA TATCTTTGGT TAAATTTCAT GTATATATAT ACCCTTCCCT 780CTTGTGATGG CAGTGGCCCC TCGTTTAATT AGCGTACTTA ATTATCTGAT GGATACTGTA 840TGCTTGGCAG ATGATGTCAT CAGATTATAC CATTTGTTGT GCTCTACAAA ATAAAAAACC 900TCTATTTATG TTCATCTTTT TGGTAACAAG TAACTAATTG ATGCGCTATG TTGACAGGCG 960ATGCATTACA CAACTTACGA ACTAGCTTGC AAGATCCCAA CAATGTCCTG CAGAGCTGGG 1020ATCCAACCCT TGTGAACCCT TGCACATGGT TTCATGTGAC ATGTAACAAT GAAAACAGTG 1080TTATAAGAGT GTAGGTCACT TCCCTTATTA ATTTTTTTAG CAAGTTACGA ATATTTACTC 1140AATTGAGCAG ATGTCTCTTT AAATATTTTT CTTTAATTTC TTAGCTAAGC GGAGCATCTA1200TCTTAAGTAT CTCTACTGAA TTTAAGACAT AATACATTTT TTTAAAAAAT CTATTAGAGT 1260GTTTTTTCCG CACAGCGCAC ATATATCTTT TTTCTGGTAA TTCAGACAAC CTTTCTCCCG 1320ACGATAAAAT AATATAAGAT TAACTCCTTG AACTAATTTT TTATTTTTCT TTTCTTTTTA 1380TGTTCTTTGC AGAAAGTTTC TTATGGTCTT TTGTGAAAAG TACATTCTAT GATAATTTTT 1440TGGCAACTCA TATAAATTTA TATATATTCC ATGTAGTTAT AAGTTAAAAA AAGCTTCCTA 1500TTAATTCCAA GATAGAGGTT CATTTTTATA GTTTGGGCAT CCATGAGTTT TTGAAAATGT 1560CAGAAATTTT GTTGAGTTAA TTTTACTTAC CAACTTTTAT GGCGTCATGC AGTGATCTTG 1620GGAATGCAGC ATTATCTGGT CAATTGGTTC CTCTTGGCCA GTTGAAAAAT TTACAATACT 1680TGTAAGACCA TATCACTTGG AATGCTTTAG TTTTTATACA GCACAATGCT TTCAATATCT 1740GTTAAAAGTG TGAAAAAGTT GACTTTCTAG CTTCAGCAGT TGTTCGGATA ATATCTATGA 1800AGCACTTAAA AGGCTGGGCA ATTTTTTTGT TATTATTTCA AATATTGTTA ATTGTTACTA 1860CTTAATATGA TAAACTGATT TAACTCCTCA TGATTGGTCT CAGTCCAATG TGCCCTCATT 1920AGTCACATNA TAAAATTCCN GGGTTGGACA AATATAACTT CTTTTCTTAA GGTCCAGAAA 1980GAGCACTTAT CAACCTTGTC TAGCGCATAA CGTCACAGTG GGTCAGTCAC GGGCTATCCA 2040GTTTGGGGAG GTTTTAATGA GCACTTATTT ACCTTGTCTT TTAAACGTCT GAGGATGTTA 2100TTAAAGTCTG CATCATTCAG AGTTTAAATT AGCACTTTCA GTTGTATTAT GAATGGTACA 2160TGAAAGATAC ATATCTTAAT GTTCCTATGC CTGTTTCAAC ATGTCTCTAA TATTCTGTTA 2220TCTTTGTCAT CTTAAAAATG GCACTGATTA AAATGTGAGA AAGGTAGTCT TCCAATACCA 2280TTTCATGTAT ACCAGAGAAT ATCATAATTT TTTTAAATCA TAAGTTGGGC CCTAGAGTTT 2340TCTCAGTATT GGTCTATTTA TATTTTCCAC CATTTATAAC TGTGTTGTCA GATGAAAATC 2400TTGGACTTCC ACAGAAGATC TTATAGTAAA AGTATTCTTT AGATCTGATG ATGAAAGTTG 2460TCATGGTGTG GCCTGTCCCA GAATTTAAAT CAATCCCATG TCACATGTTT GTTGATCTGA 2520CTACTCACTG TTAATCGAAG AGTAACTATT TGTGAATTAA ATGCTTTTTT TTTTGTTCTT 2580CATGCTTAGC GTTATAAAGG TCTACGTCTG ACTATGGTTT TTAACATGTT ATAGTTTTGT 2640ACTGACAAGT TTAAAGTTTC TCTTGTTTAC GAATTAAGAA TATATAATAT AAAACGCTTT 2700AACTTTCTCT GTGGAAGGTG TTCTTACCTT TTTATATATA TATATAGATA CTCAGACTCT 2760GCTGGCAATT ATATCTTACG AACTTACGAG TATACAGAAC TTGTATATTA GGTTCAGATG 2820AGTGGCTGTA GTAGAACACC TTAAGCAAGA ACTTAATCAT GAGGTTTCAA CCTTTTAACT 2880TTCTTTTTAG ATTTTTTCAA GTTTATGGAA AATTGTACCT CATGATCGTG GTTTCTTTCC 2940ATAAACTTTC CATATAAGTC CGTTTCTTGA CGTTTTCATG TAAGCTGTTC ACGAGTGATT 3000ATTAGCGGTT CTTTCAATAA TCATAATGTG TCTCACTTTG ATGAGGCCTG TACTTATTAT 3060TGCACCTTGC ACTTAACCTT GATCCTCATG TCATCTTGAT TGTCATAGTC ATCTAACCGA 3120GTTGAACATG GTTTATCATG TCTTTTGAGG TAACAATGTA GCTTTCACCT CTGTCCTTGA 3180TATAGGTTTA AGGCTTGCAC CTCCCACTAG CCTTTCGTTG TTTTATTCAC AGTTCACACA 3240CCTACTAGCA CTGTTCACCT CTAGTCTTTT GTCCGCAAAT AGTAAGAAGT TTCTTTCGCA 3300TAATAGTGGA TGATCATTTA AGAAATAGTG AATCAAATTA TCGTGTTATT GTGTTTGTAC 3360TTTGGAATTA AATGAGTTGC TGAACATTGT TGCTGTTTAT CGTTGTCAAG GCTTTGCCAA 3420GGAAGGCGAT TAGTAAGAGT GGGCATCCAA GCGCCTTTAT CTTGAAGGGG CGGGCGGCAC 3480GTTGTGGATT CTGGGTGTCT ATTAGAGGAC ATTATCTATA TATACTGATT ATTTATTAGA 3540ATATAAATCA ACTACTATAT TTTTCTTTGT AATGTTTATA TAGAAATCCC ACTCGTAAAC 3600TTGACAAATA CCATTGAAAT ATTTGAACCT AATTAATTAG TAGTGTCAGG TTTAAATTCA 3660AACTCATTTA ATTTTACTTT AAAAAATAAT TCTATATGAA TCGTAACAGT ATAAATATAT3720TAAATTACAT GTATGTGTGC CTATATATAG CTGAATGTCT AATAGACTCC AAGACGGCTG 3780CTCTTACTGC CTAGGCGTCC AGGCAGTTCA CTGATGCTTA CCTTGACAAA TATGGGGTTC 3840GTATGACATT GTTGGGGATC CCTATCACTG GATTCCTGTT TTGCTGACCC TCTGTTCAAT 3900TGATTTTCAT TGATGTAGTA TTACTAGTTT TATAAATATT CTTTATTGCA ATAATTTAAC 3960TGGAGTTTAA CAATGACAGG GAGCTTTACA GCAATAACAT AAGTGGACCA ATTCCTAGTG 4020ATCTTGGGAA TCTGACAAAT TTGGTGAGCT TGGACCTATA CATGAATAGC TTCTCTGGAC 4080CTATACCGGA CACATTAGGA AAGCTTACAA GGCTAAGATT CTTGTATGAC TACAAATCTT 4140CACTAGTTTT TAACTTAATG CAATTTGATT ATCCTTTCAA GTGATTGATT ATATCACAAA 4200TTACTGGATA GGCGTCTCAA CAACAACTGC CTCTCTGGTC CAATTCCAAT GTCACTGACT 4260AATATTACAA CTCTTCAAGT CCTGTAAGTA TTCCGACCTT TCCAGATAGT TTTGTTGTTG 4320TGGATGTTTC AATTTTAATA CTAAATATGT TCATCAGGGA TTTATCAAAC AATCGGCTAT 4380CAGGACCAGT ACCGGATAAT GGCTCATTTT CTTTGTTTAC ACCTATCAGG TTTAATGCTA 4440GTAATATCTT TAATATTATG GTTCTTACTT CTACTGCGAA AGCTATGATA ATATTTTTTT 4500TCTCCTTCAT ATATTATCAC TTTCGCAGTT TTGGCAATAA TTTGAATTTA TGTGGACCTG 4560TAACTGGGAG GCCCTGCCCT GGATCTCCCC CATTTTCTCC ACCACCTCCG TTCATCCCAC 4620CATCAACAGT ACAGCCTCCA GGTGATTTAG TTTTTATATT AATTCCCGTA ATTAATTTTA 4680TGACTGTAAA AATTGGTGTT AATTTCACCA GTTGCGAATA AAGTATTTTC CTTCTTTCTC 4740TTCTTATTAT TATGAAGGAC AAAATGGTCC CACTGGAGCT ATTGCTGGGG GAGTAGCTGC 4800TGGTGCTGCT TTACTGTTTG CTGCACCTGC AATGGCATTT GCATGGTGGC GGAGAAGAAA 4860ACCGCGAGAA CATTTCTTTG ATGTGCCAGG TTAGTCCTGT AAATAGATAT CTATTGAAGC 4920GCTTACTGTC TGTGGACTTT GTTTTCACTG TCATTAGTTA ACTTCAGCTG AAGAGGACCC 4980AGAAGTGCAC CTTGGTCAAC TGAAGAGGTT TTCTCTGCGA GAATTGCAAG TCGCAACGGA 5040TACTTTTAGT ACCATCCTTG GAAGAGGTGG ATTTGGTAAG GTGTATAAGG GACGCCTTGC 5100TGATGGCTCA CTTGTAGCAG TTAAAAGGCT TAAAGAAGAA CGAACACCAG GTGGCGAGCT 5160GCAGTTTCAA ACAGAAGTGG AAATGATTAG CATGGCTGTG CATCGAAATC TTCTGCGTCT 5220ACGTGGTTTC TGCATGACAC CTACCGAGCG GCTTCTTGTA TATCCATACA TGGCTAATGG 5280AAGTGTTGCG TCATGTTTAA GAGGTATCTC AGTTACAATT ACCATAACTT GCCAGAAGTT 5340TGTTTGATTA AAAATGAAAT ATAACTCCCT ACACTATGTT AAGGTGTTAT AATTTCTGAG 5400CAGATCTTAT TTCCCATTGC AAGATACCAG TTATTATTGT TTTTTCTGTA ATTGATACCG 5460GTTATATTTC TTTCTTGTAT TTGGTTATAT GCAAGGATTT CGAGTCTAAT AAGTTATCAA 5520ACTGGATGCT ATGTTTATTC TGCAATTGAA TTCTTGCTTC AGGTGCCAAA ATATATATGA 5580TTCAACTTGG AATCATCTTA TAATATACTG TGTAAAGTCA GCTGTTGACT TTCATCATTA 5640ATTAGTCTTC ATAAATCAGA ATCTGCCTAG TGAGCTTTAC CGACATACTC TAAACCTTTC 5700TTATGGCCCT GTATATAATC GTCCCACTTA CTTTATTCAG TTTGTCTGCT CTCTGAATTT 5760TTGATCTGTA CATTGTGATG TCTTGTTTTC ATCAAATGTA GAGCGTCAGC CATCAGAACC 5820TCCCCCTGAT TGGCCAACTA GGGAGAGGAT TGCACTAGGA TCTTCTAGGG GCCTATCTAA 5880ATTGCATGAC CATTGTGATC CCAAGATTAT CCATCGCGAT GTAAAAGCTG CAAATATATT 5940ATTGGACGAA GAATTTGAGG CTGTTGTAGG TGATTTTGGG TTAGCTAGGC TCATGGATTA 6000CAAGGATACC CATGTTACGA CTGCTGTAAG GGGTACCATT GGGCACATAG CTCCCGAGTA 6060CCTCTCGACT GGAAAGTCAT CAGAGAAGAC CGATGTCTTT GGTTATGGGA TAATGCTCCT 6120AGAGCTCATT ACTGGACAGA GGGCTTTTGA TCTTGCTCGC CTTGCGAACG ATGATGATGT 6180ATTGTTGTTG GATTGGGTAT GTGTCCCGGG TGTTCCTTTG GTTAATTATT TCACATATTA 6240GTGCTTACTA CTTTGTTGTG GCCCTTTGTT TTTATTTCCT GCCTGTATTT GATTCTTAGT 6300CATGTTATGC ATATTGACCT GCTTTGCAAT GTCTTTTAGG TTAAAAGCCT TTTGAAAGAG 6360AAAAAGTTGG AGATGCTGGT CGATCCTGAC CTGCAGAACA ATTACATTGA CACAGAAGTT 6420GAGCAGCTTA TTCAAGTAGC ATTACTCTGT ACCCAGGGTT CGCCAATGGA GCGGCCTAAG 6480ATGTCAGAGG TAGTCCGAAT GCTTGAAGGT GATGGCCTTG CAGAAAAGTG GGACGAGTGG 6540CAAAAAGTTG AAGTCATCCA TCAAGACGTA GAATTAGCTC CACATCGAAC TTCTGAATGG 6600ATCCTAGACT CGACAGATAA CTTGCATGCT TTTGAATTAT CTGGTCCAAG ATAAACAGCA 6660TATAAAATGT AATGAAATTA ATATTTTTTA TGGTT6695(2)SEQ ID NO:2的信息(ⅰ)序列特征(A)長度1815個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅲ)假設否(ⅲ)反義否(ⅳ)原始來源(A)生物體Daucus carota(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置94..1752(ⅸ)序列描述SEQ ID NO:2:GACAAATACC ATTGAAATAT TTGAACCTAA TTAATTGTA GTGTCAGGTT TAAATTCAAA60CTCATTTAAT TTTACTTTAA AAAATAATTC TAT ATG AAT CGT AAC AGT ATA AAT 114Met Asn Arg Asn Ser Tle Asn1 5ATA TTA AAT TAC ATG CAG TTC ACT GAT GCT TAC CTT GAC AAA TAT GGG162Ile Leu Asn Tyr Met Gln Phe Thr Asp Ala Tyr Leu Asp Lys Tyr Gly10 15 20GTT CTT ATG ACA TTG GAG CTT TAC AGC AAT AAC ATA AGT GGA CCA ATT210Val Leu Met Thr Leu Glu Leu Tyr Ser Asn Asn Ile Ser Gly Pro Ile25 30 35CCT AGT GAT CTT GGG AAT CTG ACA AAT TTG GTG AGC TTG GAC CTA TAC258Pro Ser Asp Leu Gly Asn Leu Thr Asn Leu Val Ser Leu Asp Leu Tyr40 45 50 55ATG AAT AGC TTC TCT GGA CCT ATA CCG GAC ACA TTA GGA AAG CTT ACA306Met Asn Ser Phe Ser Gly Pro Ile Pro Asp Thr Leu Gly Lys Leu Thr60 65 70AGG CTA AGA TTC TTG CGT CTC AAC AAC AAC AGC CTC TCT GGT CCA ATT354Arg Leu Arg Phe Leu Arg Leu Asn Asn Asn Ser Leu Ser Gly Pro Ile75 80 85CCA ATG TCA CTG ACT AAT ATT ACA ACT CTT CAA GTC CTG GAT TTA TCA402Pro Met Ser Leu Thr Asn Ile Thr Thr Leu Gln Val Leu Asp Leu Ser90 95 100AAC AAT CGG CTA TCA GGA CCA GTA CCG GAT AAT GGC TCA TTT TCT TTG450Asn Asn Arg Leu Ser Gly Pro Val Pro Asp Asn Gly Ser Phe Ser Leu105 110 115TTT ACA CCT ATC AGT TTT GCC AAT AAT TTG AAT TTA TGT GGA CCC GTA498Phe Thr Pro Ile Ser Phe Ala Asn Asn Leu Asn Leu Cys Gly Pro Val120 125 130 135ACT GGG AGG CCC TGC CCT GGA TCT CCC CCA TTT TCG CCA CCA CCT CCG 546Thr Gly Arg Pro Cys Pro Gly Ser Pro Pro Phe Ser Pro Pro Pro Pro140 145 150TTC ATC CCA CCA TCA ACA GTA CAG CCT CCA GGA CAA AAT GGT CCC ACT 594Phe Ile Pro Pro Ser Thr Val Gln Pro Pro Gly Gln Asn Gly Pro Thr155 160 165GGA GCT ATT GCT GGG GGA GTA GCT GCT GGT GCT GCT TTA CTG TTT GCT 642Gly Ala Ile Ala Gly Gly Val Ala Ala Gly Ala Ala Leu Leu Phe Ala170 175 180GCA CCT GCA ATG GCA TTT GCA TGG TGG CGG AGA AGA AAA CCG CGA GAA 690Ala Pro Ala Met Ala Phe Ala Trp Trp Arg Arg Arg Lys Pro Arg Glu185 190 195CAT TTC TTT GAT GTG CCA GCT GAA CAG GAC CCA GAA GTG CAC CTT GGT 738His Phe Phe Asp Val Pro Ala Glu Glu Asp Pro Glu Val His Leu Gly200 205 210 215CAA CTG AAG AGG TTT TCT CTG CGA GAA TTG CAA GTC GCA ACG GAT ACT 786Gln Leu Lys Arg Phe Ser Leu Arg Glu Leu Gln Val Ala Thr Asp Thr220 225 230TTT AGT ACC ATA CTT GGA AGA GGT GGA TTT GGT AAG GTG TAT AAG GGA 834Phe Ser Thr Ile Leu Gly Arg Gly Gly Phe Gly Lys Val Tyr Lys Gly235 240 245CGC CTT GCT GAT GGC TCA CTT GTA GCA GTT AAA AGG CTT AAA GAA GAA 882Arg Leu Ala Asp Gly Ser Leu Val Ala Val Lys Arg Leu Lys Glu Glu250 255 260CGA ACA CCA GGT GGT GAG CTG CAG TTT CAA ACA GAG GTG GAA ATG ATT 930Arg Thr Pro Gly Gly Glu Leu Gln Phe Gln Thr Glu Val Glu Met Ile
265 270 275AGC ATG GCT GTG CAT CGA AAT CTT CTG CGT CTA CGT GGT TTC TGC ATG 978Ser Met Ala Val His Arg Asn Leu Leu Arg Leu Arg Gly Phe Cys Met280 285 290 295ACA CCA ACA GAG CGG CTT CTT GTA TAT CCA TAC ATG GCT AAT GGA AGT 1026Thr Pro Thr Glu Arg Leu Leu Val Tyr Pro Tyr Met Ala Asn Gly Ser300 305 310GTT GCG TCG TGT TTA AGA GAG CGT CAG CCA TCA GAA CCT CCC CTT GAT 1074Val Ala Ser Cys Leu Arg Glu Arg Gln Pro Ser Glu Pro Pro Leu Asp315 320 325TGG CCA ACT AGG AAG AGG ATT GCA CTA GGA TCT GCT AGG GGG CTT TCT 1122Trp Pro Thr Arg Lys Arg Ile Ala Leu Gly Ser Ala Arg Gly Leu Ser330 335 340TAT TTG CAT GAC CAT TGT GAT CCC AAG ATT ATC CAT CGT GAT GTA AAA 1170Tyr Leu His Asp His Cys Asp Pro Lys Ile Ile His Arg Asp Val Lys345 350 355GCT GCA AAT ATA TTA TTG GAC GAA GAA TTT GAG GCT GTT GTA GGT GAT 1218Ala Ala Asn Ile Leu Leu Asp Glu Glu Phe Glu Ala Val Val Gly Asp360 365 370 375TTT GTG TTA GCT ATG CTC ATG GAT TAC AAG GAT ACC CAT GTT ACA ACT 1266Phe Gly Leu Ala Arg Leu Met Asp Tyr Lys Asp Thr His Val Thr Thr380 385 390GCT GTA AGG GGT ACC TTG GGC TAC ATA GCT CCC GAG TAC CTC TCG ACT 1314Ala Val Arg Gly Thr Leu Gly Tyr Ile Ala Pro Glu Tyr Leu Ser Thr395 400 405GGA AAG TCA TCA GAG AAG ACC GAT GTC TTT GGT TAT GGG ATT ATG CTC 1362Gly Lys Ser Ser Glu Lys Thr Asp Val Phe Gly Tyr Gly Ile Met Leu410 415 420TTA GAG CTC ATT ACT GGA CAG AGA GCT TTT GAT CTT GCT CGC CTT GCG 1410Leu Glu Leu Ile Thr Gly Gln Arg Ala Phe Asp Leu Ala Arg Leu Ala425 430 435AAC GAT GAT GAT GTT ATG TTG TTG GAT TGG GTT AAA AGC CTT TTG AAA 1458Asn Asp Asp Asp Val Met Leu Leu Asp Trp Val Lys Ser Leu Leu Lys440 445 450 455GAG AAA AAG TTG GAG ATG CTG GTC GAT CCT GAC CTG GAG AAC AAT TAC 1506Glu Lys Lys Leu Glu Met Leu Val Asp Pro Asp Leu Glu Asn Asn Tyr460 465 470ATT GAC ACA GAA GTT GAG CAG CTT ATT CAA GTA GCA TTA CTC TGT ACC 1554Ile Asp Thr Glu Val Glu Gln Leu Ile Gln Val Ala Leu Leu Cys Thr475 480 485CAG GGT TCG CCA ATG GAG CGG CCT AAG ATG TCA GAG GTA GTC CGA ATG 1602Gln Gly Ser Pro Met Glu Arg Pro Lys Met Ser Glu Val Val Arg Met490 495 500CTT GAA GGT GAT GGC CTT GCA GAA AAG TGG GAC GAG TGG CAA AAA GTA 1650Leu Glu Gly Asp Gly Leu Ala Glu Lys Trp Asp Glu Trp Gln Lys Val505 510 515GAA GTC ATC CAT CAA GAC GTA GAA TTA GCT CCA CAT CGA ACT TCT GAA 1698Glu Val Ile His Gln Asp Val Glu Leu Ala Pro His Arg Thr Ser Glu520 525 530 535TGG ATC CTA GAC TCG ACA GAT AAC TTG CAT GCT TTT GAA TTA TCT GGT 1746Trp Ile Leu Asp Ser Thr Asp Asn Leu His Ala Phe Glu Leu Ser Gly540 545 550CCA AGA TAAACAGGAT ATAAAATGTG AATGAAATTA ATAAAAAAAA TGGTTAAAAA 1802Pro ArgAAAAAAAAAA AAA 1815(2)SEQ ID NO:3的信息(ⅰ)序列特征(A)長度553個氨基酸(B)類型氨基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅸ)序列描述SEQ ID NO:3:Met Asn Arg As Ser Ile Asn Ile Leu Asn Tyr Met Gln Phe Thr Asp1 5 10 15Ala Tyr Leu Asp Lys Tyr Gly Val Leu Met Thr Leu Glu Leu Tyr Ser20 25 30Asn Asn Ile Ser Gly Pro Ile Pro Ser Asp Leu Gly Asn Leu Thr Asn35 40 45Leu Val Ser Leu Asp Leu Tyr Met Asn Ser Phe Ser Gly Pro Ile Pro50 55 60Asp Thr Leu Gly Lys Leu Thr Arg Leu Arg Phe Leu Arg Leu Asn Asn65 70 75 80Asn Ser Leu Ser Gly Pro Ile Pro Met Ser Leu Thr Asn Ile Thr Thr85 90 95Leu Gln Val Leu Asp Leu Ser Asn Asn Arg Leu Ser Gly Pro Val Pro100 105 110Asp Asn Gly Ser Phe Ser Leu Phe Thr Pro Ile Ser Phe Ala Asn Asn115 120 125Leu Asn Leu Cys Gly Pro Val Thr Gly Arg Pro Cys Pro Gly Ser Pro130 135 140Pro Phe Ser Pro Pro Pro Pro Phe Ile Pro Pro Ser Thr Val Gln Pro145 150 155 160Pro Gly Gln Asn Gly Pro Thr Gly Ala Ile Ala Gly Gly Val Ala Ala165 170 175Gly Ala Ala Leu Leu Phe Ala Ala Pro Ala Met Ala Phe Ala Trp Trp180 185 190Arg Arg Arg Lys Pro Arg Glu His Phe Phe Asp Val Pro Ala Glu Glu195 200 205Asp Pro Glu Val His Leu Gly Gln Leu Lys Arg Phe Ser Leu Arg Glu210 215 220Leu Gln Val Ala Thr Asp Thr Phe Ser Thr Ile Leu Gly Arg Gly Gly225 230 235 240Phe Gly Lys Val Tyr Lys Gly Arg Leu Ala Asp Gly Ser Leu Val Ala245 250 255Val Lys Arg Leu Lys Glu Glu Arg Thr Pro Gly Gly Glu Leu Gln Phe260 265 270Gln Thr Glu Val Glu Met Ile Ser Met Ala Val His Arg Asn Leu Leu275 280 285Arg Leu Arg Gly Phe Cys Met Thr Pro Thr Glu Arg Leu Leu Val Tyr290 295 300Pro Tyr Met Ala Asn Gly Ser Val Ala Ser Cys Leu Arg Glu Arg Gln305 310 315 320Pro Ser Glu Pro Pro Leu Asp Trp Pro Thr Arg Lys Arg Ile Ala Leu
325330 335Gly Ser Ala Arg Gly Leu Ser Tyr Leu His Asp His Cys Asp Pro Lys340 345 350Ile Ile His Arg Asp Val Lys Ala Ala Asn Ile Leu Leu Asp Glu Glu355 360 365Phe Glu Ala Val Val Gly Asp Phe Gly Leu Ala Arg Leu Met Asp Tyr370 375 380Lys Asp Thr His Val Thr Thr Ala Val Arg Gly Thr Leu Gly Tyr Ile385 390 395 400Ala Pro Glu Tyr Leu Ser Thr Gly Lys Ser Ser Glu Lys Thr Asp Val405 410 415Phe Gly Tyr Gly Ile Met Leu Leu Glu Leu Ile Thr Gly Gln Arg Ala420 425 430Phe Asp Leu Ala Arg Leu Ala Asn Asp Asp Asp Val Met Leu Leu Asp435 440 445Trp Val Lys Ser Leu Leu Lys Glu Lys Lys Leu Glu Met Leu Val Asp450 455 460Pro Asp Leu Glu Asn Asn Tyr Ile Asp Thr Glu Val Glu Gln Leu Ile465 470 475 480Gln Val Ala Leu Leu Cys Thr Gln Gly Ser Pro Met Glu Arg Pro Lys485 490 495Met Ser Glu Val Val Arg Met Leu Glu Gly Asp Gly Leu Ala Glu Lys500 505 510Trp Asp Glu Trp Gln Lys Val Glu Val Ile His Gln Asp Val Glu Leu515 520 525Ala Pro His Arg Thr Ser Glu Trp Ile Leu Asp Ser Thr Asp Asn Leu530 535 540His Ala Phe Glu Leu Ser Gly Pro Arg545 550(2)SEQ ID NO:4的信息(ⅰ)序列特征(A)長度13個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅲ)假設否(ⅲ)反義否(ⅳ)原始來源(A)生物體引物(primer)(ⅸ)序列描述SEQ IDNO:4:TTTTTTTTTT TGC13(2)SEQ ID NO:5的信息(ⅰ)序列特征(A)長度10個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體引物(ⅸ)序列描述SEQ IDNO:5:GGGATCTAAG10(2)SEQ ID NO:6的信息(ⅰ)序列特征(A)長度10個堿基對
(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體引物(ⅸ)序列描述SEQ ID NO:6:ACACGTGGTC10(2)SEQ ID N0:7的信息(ⅰ)序列特征(A)長度10個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體引物(ⅸ)序列描述SEQ ID NO:7:TCAGCACAGG10(2)SEQ ID NO:8的信息(ⅰ)序列特征(A)長度14個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知
(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體引物(ⅸ)序列描述SEQ ID NO:8:TTTTTTTTTT TCTG 14(2)SEQ ID NO:9的信息(ⅰ)序列特征(A)長度13個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體引物(ⅸ)序列描述SEQ ID NO:9:TTTTTTTTTT TCA13(2)SEQ ID NO:10的信息(ⅰ)序列特征(A)長度10個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源
(A)生物體引物(ⅸ)序列描述SEQ ID NO:10:GACATCGTCC10(2)SEQ ID NO:11的信息(ⅰ)序列特征(A)長度10個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體引物(ⅸ)序列描述SEQ ID NO:11:CCCTACTGGT10(2)SEQ ID NO:12的信息(ⅰ)序列特征(A)長度10個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體引物(ⅸ)序列描述SEQ ID NO:12:ACACGTGGTC10(2)SEQ ID NO:13的信息(ⅰ)序列特征(A)長度10個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體引物(ⅸ)序列描述SEQ ID NO:13:GGTGACTGTC10(2)SEQ ID NO:14的信息(ⅰ)序列特征(A)長度18個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體引物(ⅸ)序列描述SEQ ID NO:14:TCTTGGACCA GATAATTC 18(2)SEQ ID NO:15的信息(ⅰ)序列特征
(A)長度19個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體引物(ⅸ)序列描述SEQ ID NO:15:CTCTGATGAC TTTCCAGTC 19(2)SEQ ID NO:16的信息(ⅰ)序列特征(A)長度16個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構未知(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體引物(ⅸ)序列描述SEQ ID NO:16:AATGGCATTT GCATGG 16(2)SEQ ID NO:17的信息(ⅰ)序列特征(A)長度5個氨基酸(B)類型氨基酸(C)鏈型單鏈
(D)拓撲結構未知(ⅱ)分子類型肽(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體Daucus carota(ⅸ)序列描述SEQ ID NO:17:Ser Pro Pro Pro Pro1 5(2)SEQ ID NO:18的信息(ⅰ)序列特征(A)長度8個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構未知(ⅱ)分子類型肽(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體Daucus carota(ⅸ)序列描述SEQ ID NO:18:His Arg Asp Val Lys Ala Ala Asn1 5(2)SEQ ID NO:19的信息(ⅰ)序列特征(A)長度9個氨基酸(B)類型氨基酸
(C)鏈型單鏈(D)拓撲結構未知(ⅱ)分子類型肽(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體Daucus carota(ⅸ)序列描述SEQ ID NO:19:Gly Thr Leu Gly Tyr Ile Ala Pro Glu1 5(2)SEQ ID NO:20的信息(ⅰ)序列特征(A)長度4081個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構未知(ⅱ)分子類型DNA(基因組)(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體Arabidopsis thaliana(ⅵ)間接來源(A)克隆Arabidopsis SERK基因(ⅸ)特征(A)名稱/關鍵詞外顯子(B)位置1280..1367(ⅸ)特征(A)名稱/關鍵詞外顯子
(B)位置1796..1928(ⅸ)特征(A)名稱/關鍵詞外顯子(B)位置2014..2085(ⅸ)特征(A)名稱/關鍵詞外顯子(B)位置2203..2346(ⅸ)特征(A)名稱/關鍵詞外顯子(B)位置2450..2521(ⅸ)特征(A)名稱/關鍵詞外顯子(B)位置2617..2688(ⅸ)特征(A)名稱/關鍵詞外顯子(B)位置2772..2884(ⅸ)特征(A)名稱/關鍵詞外顯子(B)位置3015..3146(ⅸ)特征(A)名稱/關鍵詞外顯子(B)位置3305..3646(ⅸ)特征(A)名稱/關鍵詞外顯子(B)位置3760..4081(ⅸ)序列描述SEQ ID NO:20:TCTAGAAACC TTTTGATCAT AATGAAAATA AAGAGTCCAT CCACCACATG GGGTAAGCAT 60AATGTGTGAT ATTTAAAGGG TAACAAATGT AATCTGCTTT TTATTTTACT TTTTACCTCT 120ACTCAAATTG TATGGGCAGT TTTTTTTTTT TTTTAAATGA TAAGACAAGT ATCTGTTTAA 180TGGTATTGTG ATGAAACAGT AGTAAAGTCA TATCGGGCAC GCCATACTAC TTCCACAGTG 240GAACTTGGCC AAATTTTGTC TTTGCCGTCT CTACAGTTTC TTCCACCAAA TTTTTTGTTG 300ACAAAACTCA AATCTTTCAA TCTCATCTCT GCCAAAGTTG GGTTTAGAAA GAATATCAGC 360AAACACTAAT ATCTTTATTG TTGCATGGTT TATCAATCAC AAAATTCACA ACCATTGTAA 420AAAAAAATTC ACATTTTTGG TATGAGATTG CTCACATGAT AGTGAACCTC TTTAACATTT 480TAACTTTACT TTCATAAATA CGGGATTACG AATCTTACTT GCATTAAAAA TTTAGAAAAG 540GTTTTTCTAC TTAAAGAAAA AAGGGACCCA ACAGAGAGAG GTTTGACCAG GAGAAACGGG 600TGCATAGCCT TAAGAGCTTT CAACTACTTT ACCCCAAACC CAAAGCGATG TCACTTTCAA 660CCATCTCTTC TCTCCCCCGA ACCCGTTTTT TTGACCGGTC AGTTCGGGCA GCAGCACCGT 720TACGGGCAGC TTATATTCCT CGTCTTCCTC CTCTACACCA CTGCATGCCC ATAAATAAAG 780CCCGTTGAGA TCTTTAAAAA TATTAAATAA TATATCAACG AAAAAGCTAT TTTATTCATA 840AGAAGAAAAA GAGAGGAACA ACAACAACAC ACTAATCATA GTTTCTCTGG CAGGCTTGTT 900GTTGCGGCTT AATAAAAAGC TCTTTTGTTA TTATTACTTC ACGTAGATTT TCCCCAAAAA 960GCTCTTATTT TTTTGTTTAA AAAAAAAAGT TTCATCTTTA TTCAACTTTT GTTTTACAGT1020GTGTGTGTGA GAGAGAGAGT GTGGTTTGAT TGAGGAAAGA CGACGACGAG AACGCCGGAG 1080AATTAGGATT TTTATTTTAT TTTTTACTCT TTGTTTGTTT TAATGCTAAT GGGTTTTTAA 1140AAGGGTTATC GAAAAAATGA GTGAGTTTGT GTTGAGGTTG TCTCTGTAAA GTGTTAATGG 1200TGGTGATTTT CGGAAGTTAG GGTTTTCTCG GATCTGAAGA GATCAAATCA AGATTCGAAA 1260TTTAGCATTG TTGTTTGAAA TGGAGTCGAG TTATGTGGTG TTTATCTTAC TTTCACTGAT 1320CTTACTTCCG AATCATTCAC TGTGGCTTGC TTCTGCTAAT TTGGAAGGTT CTTGGTTACT 1380CAATTACTCA TCTTTACTCG TTTCTCAATT ACTTTCTCGA TTCTTTTTTA TTTGGAGGTG 1440AATCGCTATC TTTAGTGTCT GCATTTTGAT TTATGAAAAT TGTTGTTGTT CTTTGTATTT 1500GTAAGATTTA GTGGCTCGTA CTTTGAATAC ACTGTTTTGC TTTTCTTGTT CAGATCAACT 1560TTGTATATTG TAAAGGCATG TTCTTTGGGT TGAAAAGCTG GGTTATTTGA TATCTTAAGA 1620TTGATGTTGT TGATCCAAAC ATTCTCTGAA AGACTTCATT TGTTTTTGGT TTTGTAAAGA 1680ATTTGTTTAA TTATTAGCCT CTAATCTCAG AGAGGCCTGT TTGAATAGTT CTCTCTTGAA 1740ATTAGACTTT TCACCAATTG ATGCTAATTG TGTAGATTTG TTGTTCTTGT TATAGGTGAT 1800GCTTTGCATA CTTTGAGGGT TACTCTAGTT GATCCAAACA ATGTCTTGCA GAGCTGGGAT 1860CCTACGCTAG TGAATCCTTG CACATGGTTC CATGTCACTT GCAACAACGA GAACAGTGTC 1920ATAAGAGTGT AAAGCTTTCT TCTACTAATC CCACTTTTTA AACTTTGACC TCAGCGTGGT1980TACCGACATT TTTGTTTCTT TTGTCAAATA CAGTGATTTG GGGAATGCAG AGTTATCTGG2040CCATTTAGTT CCAGAGCTTG GTGTGCTCAA GAATTTGCAG TATTTGTAAG TTCCACTTAT2100GCATCATGCT TTAACAAAAC AAATCCAAGA TTTGACAGAA GAAGCACTGG AGTTACCTTT2160TGTAATTGAA ATCTTTTTAA CAAGTTTCTT ATTTTCTTAC AGGGAGCTTT ACAGTAACAA2220CATAACTGGC CCGATTCCTA GTAATCTTGG AAATCTGACA AACTTAGTGA GTTTGGATCT2280TTACTTAAAC AGCTTCTCCG GTCCTATTCC GGAATCATTG GGAAAGCTTT CAAAGCTGAG2340ATTTCTGTGA GTATACATAT GCTTTACCGG CTCAGTTACA GTCTTTGTTT AATCTTAGGT2400TTTGTTCCAA TTTTTGACTC TTTGCTGAAA ATTTTACATG CAAGAATAGC CGGCTTAACA2460ACAACAGTCT CACTGGGTCA ATTCCTATGT CACTGACCAA TATTACTACC CTTCAAGTGT2520TGTGAGTCCT CTCATTAACT TTCATTTATG TCTACTTCAT TCTCCCTCAG TTGATTTGTT2580GAGTTAATGC ACTTAACCTT GATGGATGCA ACACAGAGAT CTATCAAATA ACAGACTCTC2640TGGTTCAGTT CCTGACAATG GCTCCTTCTC ACTCTTCACA CCCATCAGGT TCTATGATTT2700ATCCTCTTCA GTTATTTCAG TTGTTGTGTC AGTGTCTGAA CTTATTCTGA AACTTTCATT2760TCCTTGTGCA GTTTTGCTAA TAACTTAGAC CTATGTGGAC CTGTTACAAG TCACCCATGT2820CCTGGATCTC CCCCGTTTTC TCCTCCACCA CCTTTTATTC AACCTCCCCC AGTTTCCACC2880CCGAGTAAGC CTCCTCTTTT TAGTTTACAT TATAGGAAAC AGAAGATGAA ATCTTTGCTT2940CTCTGTCAAT CCTTTTTCTC ATATAACTCA TCTTGCCAAT AAGGCAATAA CCAAATGATC3000TAATTTGATT TCAGGTGGGT ATGGTATAAC TGGAGCAATA GCTGGTGGAG TTGCTGCAGG3060TGCTGCTTTG CTCTTTGCTG CTCCTGCAAT AGCCTTTGCT TGGTGGCGAC GAAGAAAGCC3120ACTAGATATT TTCTTCGATG TGCCTGGTGA GTTTATTATT CGCATTAGTT TCTGTTCTTA3180GCCAGCAATT TTGTTTTGCA GAAAAGTATT GGAACAACTG TTAATGAAAA TCAATACATA3240AGTCATTGTT TTTTAAGTTA CAAACTCTTT TGAGTAAAAT CTCGATTGCA AAATCTCTAT3300GCAGCCGAAG AAGATCCAGA AGTTCATCTG GGACAGCTCA AGAGGTTTTC TTTGCGGGAG3360CTACAAGTGG CGAGTGATGG GTTTAGTAAC AAGAACATTT TGGGCAGAGG TGGGTTTGGG3420AAAGTCTACA AGGGACGCTT GGCAGACGGA ACTCTTGTTG CTGTCAAGAG ACTGAAGGAA3480GAGCGAACTC CAGGTGGAGA GCTCCAGTTT CAAACAGAAG TAGAGATGAT AAGTATGGCA3540GTTCATCGAA ACCTGTTGAG ATTACGAGGT TTCTGTATGA CACCGACCGA GAGATTGCTT3600GTGTATCCTT ACATGGCCAA TGGAAGTGTT GCTTCGTGTC TCAGAGGTAA AAACTAAACA3660ATTAAACATC TTGTGCTCTC TCTCAATTAC TTTGACGTGA ATTGTTTTTT CATGTTTTCC3720TTTATGGGTT CATAATTGTT GGTTACACTA ATGACACAGA GAGGCCACCG TCACAACCTC3780CGCTTGATTG GCCAACGCGG AAGAGAATCG CGCTAGGCTC AGCTCGAGGT TTGTCTTACC3840TACATGATCA CTGCGATCCG AAGATCATTC ACCGTGACGT AAAAGCAGCA AACATCCTCT3900TAGACGAAGA ATTCGAAGCG GTTGTTGGAG ATTTCGGGTT GGCAAAGCTA ATGGTCTATA3960AAGACACTCA CGTGACAACA GCAGTCCGTG GCACCATCGG TCACATCGCT CCAGAATATC4020TCTCAACCGG AAAATCTTCA GAGAAAACCG ACGTTTTCGG ATACGGAATC ATGCTTCTAG4080A4081(2)STQ ID NO:21的信息(ⅰ)序列特征(A)長度494個氨基酸(B)類型氨基酸(C)鏈型未知(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅲ)假設否(ⅴ)片段類型N-端(ⅸ)序列描述SEQ ID NO:21:Met Glu Ser Ser Tyr Vel Vel Phe Ile Leu Leu Ser Leu Ile Leu Leu1 5 10 15Pro Asn His Ser Leu Trp Leu Ala Ser Ala Asn Leu Glu Gly Asp Ala20 25 30Leu His Thr Leu Arg Val Thr Leu Val Asp Pro Asn Asn Val Leu Gln35 40 45Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val Thr50 55 60Cys Asn Asn Glu Asn Ser Val Ile Arg Val Asp Leu Gly Asn Ala Glu65 70 75 80Leu Ser Gly His Leu Val Pro Glu Leu Gly Val Leu Lys Asn Leu Gln85 90 95Glu Leu Tyr Ser Asn Asn Ile Thr Gly Pro Ile Pro Ser Asn Leu Gly100 105 110Aan Leu Thr Asn Leu Val Ser Leu Asp Leu Tyr Leu Asn Ser Phe Ser115 120 125Gly Pro Ile Pro Glu Ser Leu Gly Lys Leu Ser Lys Leu Arg Phe Leu130 135 140Arg Leu Asn Asn Asn Ser Leu Thr Gly Ser Ile Pro Met Ser Leu Thr145 150 155 160Asn Ile Thr Thr Leu Gln Val Leu Asp Leu Ser Asn Asn Arg Leu Ser165 170 175Gly Ser Val Pro Asp Asn Gly Ser Phe Ser Leu Phe Thr Pro Ile Ser180 185 190Phe Ala Asn Asn Leu Asp Leu Cys Gly Pro Val Thr Ser His Pro Cys195 200 205Pro Gly Ser Pro Pro Phe Ser Pro Pro Pro Pro Phe Ile Gln Pro Pro210 215 220Pro Val Ser Thr Pro Ser Gly Tyr Gly Ile Thr Gly Ala Ile Ala Gly225 230 235 240Gly Val Ala Ala Gly Ala Ala Leu Leu Phe Ala Ala Pro Ala Ile Ala245 250 255Phe Ala Trp Trp Arg Arg Arg Lys Pro Leu Asp Ile Phe Phe Asp Val260 265 270Pro Ala Glu Glu Asp Pro Glu Val His Leu Gly Gln Leu Lys Arg Phe275 280 285Ser Leu Arg Glu Leu Gln Val Ala Ser Asp Gly Phe Ser Asn Lys Asn
290 295 300Ile Leu Gly Arg Gly Gly Phe Gly Lys Val Tyr Lys Gly Arg Leu Ala305 310 315 320Asp Gly Thr Leu Val Ala Val Lys Arg Leu Lys Glu Glu Arg Thr Pro325 330 335Gly Gly Glu Leu Gln Phe Gln Thr Glu Val Glu Met Ile Ser Met Ala340 345 350Val His Arg Asn Leu Leu Arg Leu Arg Gly Phe Cys Met Thr Pro Thr355 360 365Glu Arg Leu Leu Val Tyr Pro Tyr Met Ala Asn Gly Ser Val Ala Ser370 375 380Cys Leu Arg Glu Arg Pro Pro Ser Gln Pro Pro Leu Asp Trp Pro Thr385 390 395 400Arg Lys Arg Ile Ala Leu Gly Ser Ala Arg Gly Leu Ser Tyr Leu His405 410 415Asp His Cys Asp Pro Lys Ile Ile His Arg Asp Val Lys Ala Ala Asn420 425 430Ile Leu Leu Asp Glu Glu Phe Glu Ala Val Val Gly Asp Phe Gly Leu435 440 445Ala Lys Leu Met Asp Tyr Lys Asp Thr His Val Thr Thr Ala Val Arg450 455 460Gly Thr Ile Gly His Ile Ala Pro Glu Tyr Leu Ser Thr Gly Lys Ser465 470 475 480Ser Glu Lys Thr Asp Val Phe Gly Tyr Gly Ile Met Leu Leu485 490(2)SEQ ID NO:22的信息(ⅰ)序列特征(A)長度1106個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型cDNA到mRNA(ⅲ)假設否(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置142..795(ⅸ)序列描述SEQ ID NO:22:TCGACCCACG CGTCCGTCCA ACTTCAATAA AGGGGAAACC AACGTAACCC TAATTTTGCT 60TTCTCCTCTT TGTTCAGAAA ATTTTCCCTT TACTCTCAAA TTCCTTTTCG ATTTCCCTCT 120CTTAAACCTC CGAAAGCTCA C ATG GCG TCT CGA AAC TAT CGG TGG GAG CTC 171Met Ala Ser Arg Asn Tyr Arg Trp Glu Leu1 5 10TTC GCA GCT TCG TTA ACC CTA ACC TTA GCT TTG ATT CAC CTG GTC GAA 219Phe Ala Ala Ser Leu Thr Leu Thr Leu Ala Leu Ile His Leu Val Glu15 20 25GCA AAC TCC GAA GGA GAT GCT CTC TAC GCT CTT CGC CGG AGT TTG ACA 267Ala Asn Ser Glu Gly Asp Ala Leu Tyr Ala Leu Arg Arg Ser Leu The30 35 40GAT CCA GAC CAT GTC CTC CAG AGC TGG GAT CCA ACT CTT GTT AAT CCT315Asp Pro Asp His Val Leu Gln Ser Trp Asp Pro Thr Leu Val Asn Pro45 50 55TGT ACC TGG TTC CAT GTC ACC TGT AAC CAA GAC AAC CGC GTC ACT CGT363Cys Thr Trp Phe His Val Thr Cys Asn Gln Asp Asn Arg Val Thr Arg60 65 70GTG GAT TTG GGA AAT TCA AAC CTC TCT GGA CAT CTT GCG CCT GAG CTT411Val Asp Leu Gly Asn Ser Asn Leu Ser Gly His Leu Ala Pro Glu Leu75 80 85 90GGG AAG CTT GAA CAT TTA CAG TAT CTA GAG CTC TAC AAA AAC AAC ATC459Gly Lys Leu Glu His Leu Gln Tyr Leu Glu Leu Tyr Lys Asn Asn Ile95 100 105CAA GGA ACT ATA CCT TCC GAA CTT GGA AAT CTG AAG AAT CTC ATC AGC507Gln Gly Thr Ile Pro Ser Glu Leu Gly Asn Leu Lys Asn Leu Ile Ser110 115 120TTG GAT CTG TAC AAC AAC AAT CTT ACA GGG ATA GTT CCC ACT TTC TTG555Leu Asp Leu Tyr Asn Asn Asn Leu Thr Gly Ile Val Pro Thr Phe Leu125 130 135GGA AAA TTG AAG TCT CTG GTC TTT TTA CGG CTT AAT GAC AAC CGA TTG603Gly Lys Leu Lys Ser Leu Val Phe Leu Arg Leu Asn Asp Asn Arg Leu140 145 150ACC GGT CCA ATC CTA GAG CAC TCA CGG CAA TCC CAA GCC TTT AAA GTT651Tnr Gly Pro Ile Leu Glu His Ser Arg Gln Ser Gln Ala Phe Lys Val155 160 165 170GTT GAC GTC TCA AGC AAT GAT TTG TGT GGG ACA ATC CCA ACA AAC GGA699Val Asp Val Ser Ser Asn Asp Leu Cys Gly Thr Ile Pro Thr Asn Gly175 180 185CCC TTT GCT CAC ATT CCT TTA CAG AAC TTT GAG AAC AAC CCG AGA TTG747Pro Phe Ala His Ile Pro Leu Gln Asn Phe Glu Asn Asn Pro Arg Leu190 195 200GAS GGA CCG GAA TTA CTC GGT CTT GCA AGC TAC GAC ACT AAC TGC ACC 795Glu Gly Pro Glu Leu Leu Gly Leu Ala Ser Tyr Asp Thr Asn Cys Thr205 210 215TGAAACAACT GGCAAAACCT GAAAATGAAG AATTGGGGGG TGACCTTGTA AGAACACTTC855ACCACTTTAT CAAATATCAC ATCTATTATG TAATAAGTAT ATATATGTAG TAAAAACAAA915AAAAATGAAG AATCGAATCG GTAATATCAT CTGGTCTCAA TTGAGAACTT CGAGGTCTGT975ATGTAAAATT TCTAAATGCG ATTTTCGCTT ACTGTAATGT TCGGTTGTGG GATTCTGAGA 1035AGTAACATTT GTATTGGTAT GGTATCAAGT TGTTCTGCCT TGTCTGCAAA AAAAAAAAAA 1095AAAAAAAAAA A1106(2)SEQ ID NO:23的信息(ⅰ)序列特征(A)長度218個氨基酸(B)類型氨基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅸ)序列描述SEQ ID NO:23:Met Ala Ser Arg Asn Tyr Arg Trp Glu Leu Phe Ala Ala Ser Leu Thr1 5 10 15Leu Thr Leu Ala Leu Ile His Leu Val Glu Ala Asn Ser Glu Gly Asp20 25 30Ala Leu Tyr Ala Leu Arg Arg Ser Leu Thr Asp Pro Asp His Val Leu35 40 45Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Tro Phe His Val50 55 60Thr Cys Asn Gln Asp Asn Arg Val Thr Arg Val Asp Leu Gly Asn Ser65 70 75 80Asn Leu Ser Gly His Leu Ala Pro Glu Leu Gly Lys Leu Glu His Leu85 90 95Gln Tyr Leu Glu Leu Tyr Lys Asn Asn Ile Gln Gly Thr Ile Pro Ser100 105 110Glu Leu Gly Asn Leu Lys Asn Leu Ile Ser Leu Asp Leu Tyr Asn Asn115 120 125Asn Leu Thr Gly Ile Val Pro Thr Phe Leu Gly Lys Leu Lys Ser Leu130 135 140Val Phe Leu Arg Leu Asn Asp Asn Arg Leu Thr Gly Pro Ile Leu Glu145 150 155 160His Ser Arg Gln Ser Gln Ala Phe Lys Val Val Asp Val Ser Ser Asn165 170 175Asp Leu Cys Gly Thr Ile Pro Thr Asn Gly Pro Phe Ala His Ile Pro180 185 190Leu Gln Asn Phe Glu Asn Asn Pro Arg Leu Glu Gly Pro Glu Leu Leu195 200 205Gly Leu Ala Ser Tyr Asp Thr Asn Cys Thr210 215(2)SEQ ID NO:24的信息(ⅰ)序列特征(A)長度981個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型cDNA到mRNA(ⅲ)假設否(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置104..757(ⅸ)序列描述SEQ ID NO:24:AGTGTGAGTA ATTTAGTTTG CTTTCTCCTC TTTGTTCAGA AAATTTTCCC TTTACTCTCA 60AATTCCTTTT CGATTTCCCT CTCTTAAACC TCCGAAAGCT CAC ATG GCG TCT CGA115Met Ala Ser Arg1AAC TAT CGG TGG GAG CTC TTC GCA GCT TCG TTA ACC CTA ACC TTA GCT163Asn Tyr Arg Trp Glu Leu Phe Ala Ala Ser Leu Thr Leu Thr Leu Ala5 10 15 20TTG ATT CAC CTG GTC GAA GCA AAC TCC GAA GGA GAT GCT CTC TAC GCT211Leu Ile His Leu Val Glu Ala Asn Ser Glu Gly Asp Ala Leu Tyr Ala25 30 35CTT CGC CGG AGT TTG ACA GAT CCA GAC CAT GTC CTC CAG AGC TGG GAT259Leu Arg Arg Ser Leu Thr Asp Pro Asp His Val Leu Gln Ser Trp Asp40 45 50CCA ACT CTT GTT AAT CCT TGT ACC TGG TTC CAT GTC ACC TGT AAC CAA307Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val Thr Cys Asn Gln55 60 65GAC AAC CGC GTC ACT CGT GTG GAT TTG GGA AAT TCA AAC CTC TCT GGA355Asp Asn Arg Val Thr Arg Val Asp Leu Gly Asn Ser Asn Leu Ser Gly70 75 80CAT CTT GCG CCT GAG CTT GGG AAG CTT GAA CAT TTA CAG TAT CTA GAG403His Leu Ala Pro Glu Leu Gly Lys Leu Glu His Leu Gln Tyr Leu Glu85 90 95 100CTC TAC AAA AAC AAC ATC CAA GGA ACT ATA CCT TCC GAA CTT GGA AAT451Leu Tyr Lys Asn Asn Ile Gln Gly Thr Ile Pro Ser Glu Leu Gly Asn105 110 115CTG AAG AAT CTC ATC AGC TTG GAT CTG TAC AAC AAC AAT CTT ACA GGG499Leu Lys Asn Leu Tle Ser Leu Asp Leu Tyr Asn Asn Asn Leu Thr Gly120 125 130ATA GTT CCC ACT TCT TTG GGA AAA TTG AAG TCT CTG GTC TTT TTA CGG547Ile Val Pro Thr Ser Leu Gly Lys Leu Lys Ser Leu Val Phe Leu Arg135 140 145CTT AAT GAC AAC CGA TTG ACC GGT CCA ATC CCT AGA GCA CTC ACG GCA595Leu Asn Asp Asn Arg Leu Thr Gly Pro Ile Pro Arg Ala Leu Thr Ala150 155 160ATC CCA AGC CTT AAA GTT GTT GAC GTC TCA AGC AAT GAT TTG TGT GGA643Ile Pro Ser Leu Lys Val Val Asp Val Ser Ser Asn Asp Leu Cys Gly165 170 175 180ACA ATC CCA ACA AAC GGA CCC TTT GCT CAC ATT CCT TTA CAG AAC TTT691Thr Ile Pro Thr Asn Gly Pro Phe Ala His Ile Pro Leu Gln Asn Phe185 190 195GAG AAC AAC CCG AGA TTG GAG GGA CCG GAA TTA CTC GGT CTT GCA AGC739Glu Asn Asn Pro Arg Leu Glu Gly Pro Glu Leu Leu Gly Leu Ala Ser200 205 210TAC GAC ACT AAC TGC ACC TGAAACAACT GGCCAAAACCT GAAAATGAAG 787Tyr Asp Thr Asn Cys Thr215AATTGGGGGG TGACCTTGTA AGAACACTTC ACCACTTTAT CAAATATCAC ATCTATTATG 847TAATAAGTAT ATATATGTAG TAAAAACAAA AAAAATGAAG AATCGAATCG GTAATATCAT 907CTGGTCTCAA TTGAGAACTT CGAGGTCTGT ATGTAAAATT TCTAAATGCG ATTTTCGCCT 967AAATTACTCA CACT981(2)SEQ ID NO:25的信息(ⅰ)序列特征(A)長度218個氨基酸(B)類型氨基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅸ)序列描述SEQ ID NO:25:Met Ala Ser Arg Asn Tyr Arg Trp Glu Leu Phe Ala Ala Ser Leu Thr1 5 10 15Leu Thr Leu Ala Leu Ile His Leu Val Glu Ala Asn Ser Glu Gly Asp20 25 30Ala Leu Tyr Ala Leu Arg Arg Ser Leu Thr Asp Pro Asp His Val Leu35 40 45Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val
50 55 60Thr Cys Asn Gln Asp Asn Arg Val Thr Arg Val Asp Leu Gly Asn Ser65 70 75 80Asn Leu Ser Gly His Leu Ala Pro Glu Leu Gly Lys Leu Glu His Leu85 90 95Gln Tyr Leu Glu Leu Tyr Lys Asn Asn Ile Gln Gly Thr Ile Pro Ser100 105 110Glu Leu Gly Asn Leu Lys Asn Leu Ile Ser Leu Asp Leu Tyr Asn Asn115 120 125Asn Leu Thr Gly Ile Val Pro Thr Ser Leu Gly Lys Leu Lys Ser Leu130 135 140Val Phe Leu Arg Leu Asn Asp Asn Arg Leu Thr Gly Pro Ile Pro Arg145 150 155 160Ala Leu Thr Ala Ile Pro Ser Leu Lys Val Val Asp Val Ser Ser Asn165 170 175Asp Leu Cys Gly Thr Ile Pro Thr Asn Gly Pro Phe Ala His Ile Pro180 185 190Leu Gln Asn Phe Glu Asn Asn Pro Arg Leu Glu Gly Pro Glu Leu Leu195 200 205Gly Leu Ala Ser Tyr Asp Thr Asn Cys Thr210 215(2)SEQ ID NO:26的信息(ⅰ)序列特征(A)長度789個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型cDNA到mRNA(ⅲ)假設否(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置2..661(ⅸ)序列描述SEQ ID NO:26:T CGA CCC ACG CGT CCG CGA AAC TAT CGG TGG GAG CTC TTC GCA GCT 46Arg Pro Thr Arg Pro Arg Asn Tyr Arg Trp Glu Leu Phe Ala Ala1 5 10 15TCG TTA ATC CTA ACC TTA GCT TTG ATT CAC CTG GTC GAA GCA AAC TCC 94Ser Leu Ile Leu Thr Leu Ala Leu Ile His Leu Val Glu Ala Asn Ser20 25 30GAA GGA GAT GCT CTT TAC GCT CTT CGC CGG AGT TTA ACA GAT CCG GAC142Glu Gly Asp Ala Leu Tyr Ala Leu Arg Arg Ser Leu Thr Asp Pro Asp35 40 45CAT GTT CTC CAG AGC TGG GAT CCA ACT CTT GTT AAT CCT TGT ACC TGG190His Val Leu Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp50 55 60TTC CAT GTC ACC TGT AAC CAA GAC AAC CGC GTC ACT CGT GTG GAT TTG238Phe His Val Thr Cys Asn Gln Asp Asn Arg Val Thr Arg Val Asp Leu65 70 75GGG AAT TCA AAC CTC TCT GGA CAT CTT GCA CCT GAG CTT GGG AAG CTP286Gly Asn Ser Asn Leu Ser Gly His Leu Ala Pro Glu Leu Gly Lys Leu80 85 90 95GAA CAT TTA CAG TAT CTA GAG CTC TAC AAA AAC AAC ATC CAA GGA ACT334Glu His Leu Gln Tyr Leu Glu Leu Tyr Lys Asn Asn Ile Gln Gly Thr100 105 110ATA CCT TCC GAA CTT GGA AAT CTG AAG AAT CTC ATC AGC TTG GAT CTG382Ile Pro Ser Glu Leu Gly Asn Leu Lys Asn Leu Ile Ser Leu Asp Leu115 120 125TAC AAC AAC AAT CTT ACA GGG ATA GTT CCC ACT TCT TTG GGA AAA TTG430Tyr Asn Asn Asn Leu Thr Gly Ile Val Pro Thr Ser Leu Gly Lys Leu130 135 140AAG TCT CTG GTC TTT TTA CGG CTT AAT GAC AAC CGA TTG ACG GGG CCA478Lys Ser Leu Val Phe Leu Arg Leu Asn Asp Asn Arg Leu Thr Gly Pro145 150 155ATC CCT AGA GCA CTC ACT GCA ATC CCA AGC CTT AAA GTT GGT GAT GTC526Ile Pro Arg Ala Leu Thr Ala Ile Pro Ser Leu Lys Val Val Asp Val160 165 170 175TCA AGC AAT GAT TTG TGT GGA ACA ATC CCA ACA AAC GGA CCT TTT GCT574Ser Ser Asn Asp Leu Cys Gly Thr Ile Pro Thr Asn Gly Pro Phe Ala180 185 190CAC ATT CCT TTA CAG AAC TTT GAG AAC AAC CCG AGG TTG GAG GGA CCG622His Ile Pro Leu Gln Asn Phe Glu Asn Asn Pro Arg Leu Glu Gly Pro195 200 205GAA TTA CTC GGT CTT GCA AGC TAC GAC ACT AAC TGC ACC TGAAAAAATT 671Glu Leu Leu Gly Leu Ala Ser Tyr Asp Thr Asn Cys Thr210 215 220GGCAAAACCT GAAAATGAAG AATTGGGGGG TGACCTTTTA AGAACACTTC ACCACTTTAT 731CAAATATCAC ATCTACTATG TAATAAGTAT ATATATGTAG TCCAAAAAAA AAAAAAAA789(2)SEQ ID NO:27的信息(ⅰ)序列特征(A)長度220個氨基酸(B)類型氨基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅸ)序列描述SEQ IDNO:27:Arg Pro Thr Arg Pro Arg Asn Tyr Arg Trp Glu Leu Phe Ala Ala Ser1 5 10 15Leu Ile Leu Thr Leu Ala Leu Ile His Leu Val Glu Ala Asn Ser Glu20 25 30Gly Asp Ala Leu Tyr Ala Leu Arg Arg Ser Leu Thr Asp Pro Asp His35 40 45Val Leu Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe50 55 60His Val Thr Cys Asn Gln Asp Asn Arg Val Thr Arg Val Asp Leu Gly65 70 75 80Asn Ser Asn Leu Ser Gly His Leu Ala Pro Glu Leu Gly Lys Leu Glu85 90 95His Leu Gln Tyr Leu Glu Leu Tyr Lys Asn Asn Ile Gln Gly Thr Ile100 105 110Pro Ser Glu Leu Gly Asn Leu Lys Asn Leu Ile Ser Leu Asp Leu Tyr115 120 125Asn Asn Asn Leu Thr Gly Ile Val Pro Thr Ser Leu Gly Lys Leu Lys130 135 140Ser Leu Val Phe Leu Arg Leu Asn Asp Asn Arg Leu Thr Gly Pro Ile145 150 155 160Pro Arg Ala Leu Thr Ala Ile Pro Ser Leu Lys Val Val Asp Val Ser165 170 175Ser Asn Asp Leu Cys Gly Thr Ile Pro Thr Asn Gly Pro Phe Ala His180 185 190Ile Pro Leu Gln Asn Phe Glu Asn Asn Pro Arg Leu Glu Gly Pro Glu195 200 205Leu Leu Gly Leu Ala Ser Tyr Asp Thr Asn Cys Thr210 215 220(2)SEQ ID NO:28的信息(ⅰ)序列特征(A)長度894個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型cDNA到mRNA(ⅲ)假設否(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置1..675(ⅸ)序列描述SEQ ID NO:28:GGA CCG ATT CAA GCC TCC GAA GGG GAC GCT CTT CAC GCG CTT CGC CGG 48Gly Pro Ile Gln Ala Ser Glu Gly Asp Ala Leu His Ala Leu Arg Arg1 5 10 15AGC TTA TCA GAT CCA GAC AAT GTT GTT CAG AGT TGG GAT CCA ACT CTT 96Ser Leu Ser Asp Pro Asp Asn Val Val Gln Ser Trp Asp Pro Thr Leu20 25 30GTT AAT CCT TGT ACT TGG TTT CAT GTC ACT TGT AAT CAA CAC CAT CAA 144Val Asn Pro Cys Thr Trp Phe His Val Thr Cys Asn Gln His His Gln35 40 45GTC ACT CGT CTG GAT TTG GGG AAT TCA AAC TPA TCT GGA CAT CTA GTA 192Val Thr Arg Leu Asp Leu Gly Asn Ser Asn Leu Ser Gly His Leu Val50 55 60CCT GAA CTT GGG AAG CTT GAA CAT TTA CAA TAT CTG TAT GGA ATC ATC 240Pro Glu Leu Gly Lys Leu Glu His Leu Gln Tyr Leu Tyr Gly Ile Ile65 70 75 80ACT CTT TTG CCT TTT GAT TAT CTG AAA ACA TTT ACA TTA TCA GTC ACA 288Thr Leu Leu Pro Phe Asp Tyr Leu Lys Thr Phe Thr Leu Ser Val Thr85 90 95CAT ATA ACA TTT TGC TTT GAG TCA TAT AGT GAA CTC TAC AAA AAC GAG 336His Ile Thr Phe Cys Phe Glu Ser Tyr Ser Glu Leu Tyr Lys Asn Glu100 105 110ATT CAA GGA ACT ATA CCT TCT GAG CTT GGA AAT CTG AAG AGT CTA ATC 384Ile Gln Gly Thr Ile Pro Ser Glu Leu Gly Asn Leu Lys Ser Leu Ile115 120 125AGT TTG GAT CTG TAC AAC AAC AAT CTC ACC GGG AAA ATC CCA TCT TCT 432Ser Leu Asp Leu Tyr Asn Asn Asn Leu Thr Gly Lys Ile Pro Ser Ser130 135 140TTG GGA AAA TTG AAG TCA CTT GTT TTT TTG CGG CTT AAC GAA AAC CGA 480Leu Gly Lys Leu Lys Ser Leu Val Phe Leu Arg Leu Asn Glu Asn Arg145 150 155 160TTG ACC GGT CCT ATT CCT AGA GAA CTC ACA GTT ATT TCA AGC CTT AAA 528Leu Thr Gly Pro Ile Pro Arg Glu Leu Thr Val Ile Ser Ser Leu Lys165 170 175GTT GTT AGT GTC TCA GGG AAT GAT TTG TGT GGA ACA ATT CCA GTA GAA 576Val Val Asp Val Ser Gly Asn Asp Leu Cys Gly Thr Ile Pro Val Glu180 185 190GGA CCT TTT GAA CAC ATT CCT ATG CAA AAC TTT GAG AAC AAC CTG AGA 624Gly Pro Phe Glu His Ile Pro Met Gln Asn Phe Glu Asn Asn Leu Arg195 200 205TTG GAG GGA CCA GAA CTA CTA GGT CTT GCG AGC TAT GAC ACC AAT TGC 672Leu Glu Gly Pro Glu Leu Leu Gly Leu Ala Ser Tyr Asp Thr Asn Cys210 215 220ACT TAAAAAGAAG TTGAAGAACC TATAAAGAAG AATGTTAGGT GACCTTGTAA 725Thr225GAACTCTGTA CCAAGTGTTT GTAAATCTAT ATAGAGCCTT GTTTCATGTT ATATATGAAA 785GCTTTGAGAG ACAGTAACTT GCAATGTATT GGTATTGGTA GAAAAAGTTG AAATGAGAAT 845TGCTTTGTAA TTGGATTTGT GTTTCTTATG TAACTTGAAT TTCTTATTA 894(2)SEQ ID NO:29的信息(ⅰ)序列特征(A)長度225個氨基酸(B)類型氨基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅸ)序列描述SEQ ID NO:29:Gly Pro Ile Gln Ala Ser Glu Gly Asp Ala Leu His Ala Leu Arg Arg1 5 10 15Ser Leu Ser Asp Pro Asp Asn Val Val Gln Ser Trp Asp Pro Thr Leu20 25 30Val Asn Pro Cys Thr Trp Phe His Val Thr Cys Asn Gln His His Gln35 40 45Val Thr Arg Leu Asp Leu Gly Asn Ser Asn Leu Ser Gly His Leu Val50 55 60Pro Glu Leu Gly Lys Leu Glu His Leu Gln Tyr Leu Tyr Gly Ile Ile65 70 75 80Thr Leu Leu Pro Phe Asp Tyr Leu Lys Thr Phe Thr Leu Ser Val Thr85 90 95His Ile Thr Phe Cys Phe Glu Ser Tyr Ser Glu Leu Tyr Lys Asn Glu100 105 110Ile Gln Gly Thr Ile Pro Ser Glu Leu Gly Asn Leu Lys Ser Leu Ile115 120 125Ser Leu Asp Leu Tyr Asn Asn Asn Leu Thr Gly Lys Ile Pro Ser Ser130 135 140Leu Gly Lys Leu Lys Ser Leu Val Phe Leu Arg Leu Asn Glu Asn Arg145 150 155 160Leu Thr Gly Pro Ile Pro Arg Glu Leu Thr Val Ile Ser Ser Leu Lys165 170 175Val Val Asp Val Ser Gly Asn Asp Leu Cys Gly Thr Ile Pro Val Glu180 185 190Gly Pro Phe Glu His Ile Pro Met Gln Asn Phe Glu Asn Asn Leu Arg195 200 205Leu Glu Gly Pro Glu Leu Leu Gly Leu Ala Ser Tyr Asp Thr Asn Cys210 215 220Thr225(2)SEQ ID NO:30的信息(ⅰ)序列特征(A)長度1063個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型cDNA到mRNA(ⅲ)假設否(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置106..759(ⅸ)序列描述SEQ IDNO:30:TCGACCCACG CGTCCGACGA AACCCTAATT TTGCTTCCTC ATCTTGTTCA GAAAATTACT60CAAATTCCTA TTAGATTACT CTCTCTTCGA CCTCCGATAG CTCAC ATG GCG TCT 114Met Ala SerCGA AAC TAT CGG TGG GAG CTC TTC GCA GCT TCG TTA ATC CTA ACC TTA 162Arg Asn Tyr Arg Trp Glu Leu Phe Ala Ala Ser Leu Ile Leu Thr Leu5 10 15GCT TTG ATT CAC CTG GTC GAA GCA AAC TCC GAA GGA GAT GCT CTT TAC 210Ala Leu Ile His Leu Val Glu Ala Asn Ser Glu Gly Asp Ala Leu Tyr20 25 30 35CCT CTT CGC CGG AGT TTA ACA GAT CCG GAC CAT GTT CTC CAG AGC TGG 258Ala Leu Arg Arg Ser Leu Thr Asp Pro Asp His Val Leu Gln Ser Trp40 45 50GAT CCA ACT CTT GTT AAT CCT TGT ACC TGG TTC CAT GTC ACC TGT AAC 306Asp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val Thr Cys Asn55 60 65CAA GAC AAC CGC GTC ACT CGT GTG GAT TTG GGG AAT TCA AAC CTC TCT 354GLn Asp Asn Arg Val Thr Arg Val Asp Leu Gly Asn Ser Asn Leu Ser70 75 80GGA CAT CTT GCG CCT GAG CTT GGG AAG CTT GAA CAT TTA CAG TAT CTA 402Gly His Leu Ala Pro Glu Leu Gly Lys Leu Glu His Leu Gln Tyr Leu85 90 95GAG CTC TAC AAA AAC AAC ATC CAA GGA ACT ATA CCT TCC GAA CTT GGA 450Glu Leu Tyr Lys Asn Asn Ile Gln Gly Thr Ile Pro Ser Glu Leu Gly100 105 110 115AAT CTG AAG AAT CTC ATC AGC TTG GAT CTG TAC AAC AAC AAT CTT ACA 498Asn Leu Lys Asn Leu Ile Ser Leu Asp Leu Tyr Asn Asn Asn Leu Thr120 125 130GGG ATA GTT CCC ACT TCT TTG GGA AAA TTG AAG TCT CTG GTC TTT TTA 546Gly Ile Val Pro Thr Ser Leu Gly Lys Leu Lys Ser Leu Val Phe Leu135 140 145CGG CTT AAT GAC AAC CGA TTG ACG GGG CCA ATC CCT AGA GCA CTC ACT 594Arg Leu Asn Asp Asn Arg Leu Thr Gly Pro Ile Pro Arg Ala Leu Thr150 155 160GCA ATC CCA AGC CTT AAA GTT GTT GAT GTC TCA AGC AAT GAT TTG TGT 642Ala Ile Pro Ser Leu Lys Val Val Asp Val Ser Ser Asn Asp Leu Cys165 170 175GGA ACA ATC CCA ACA AAC GGA CCT TTT GCT CAC ATP CCT TPA CAG AAC 690Gly Thr Ile Pro Thr Asn Gly Pro Phe Ala His Ile Pro Leu Gln Asn180 185 190 195TTT GAG AAC AAC CCG AGG TTG GAG GGA CCG GAA TEA CTC GGT CTT GCA 738Phe Glu Asn Asn Pro Arg Leu Glu Gly Pro Glu Leu Leu Gly Leu Ala200 205 210AGC TAC GAC ACT AAC TGC ACC TCAAAAAAATT GGCAAAACCT GAAAATGAAG789Ser Tyr Asp Thr Asn Cys Thr215AATTGGGGGG TGACCTTGTA AGAACACTTC ACCACTTTAT CAAATATCAC ATCTACTATG849TAATAAGTAT ATATATGTAG TCCAAAAAAA AAATGAAGAA TCGAATCAGT AATATCATCT909GGTCTCAATP GAGAACTTTG AGGTCTGTGT ATGTAAAATT TCTAAATGCG ACTTTCGCGT969ACTGTAATGT TCGGTTGTGG GATTCTGAGA AGTAACATTT GTATTGGTAT GGTATCAAGT 1029TGTTCTGCCT TGTCTGCAAA AAAAAAAAAA AAAA 1063(2)SEQ ID NO:31的信息(ⅰ)序列特征(A)長度218個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅸ)序列描述SEQ ID NO:31:Met Ala Ser Arg Asn Tyr Arg Trp Glu Leu Phe Ala Ala Ser Leu Ile1 5 10 15Leu Thr Leu Ala Leu Ile His Leu Val Glu Ala Asn Ser Glu Gly Asp20 25 30Ala Leu Tyr Ala Leu Arg Arg Ser Leu Thr Asp Pro Asp His Val Leu35 40 45Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val50 55 60Thr Cys Asn Gln Asp Asn Arg Val Thr Arg Val Asp Leu Gly Asn Ser65 70 75 80Asn Leu Ser Gly His Leu Ala Pro Glu Leu Gly Lys Leu Glu His Leu85 90 95Gln Tyr Leu Glu Leu Tyr Lys Asn Asn Ile Gln Gly Thr Ile Pro Ser100 105 110Glu Leu Gly Asn Leu Lys Asn Leu Ile Ser Leu Asp Leu Tyr Asn Asn115 120 125Asn Leu Tnr Gly Ile Val Pro Thr Ser Leu Gly Lys Leu Lys Ser Leu130 135 140Val Phe Leu Arg Leu Asn Asp Asn Arg Leu Thr Gly Pro Ile Pro Arg145 150 155 160Ala Leu Thr Ala Ile Pro Ser Leu Lys Val Val Asp Val Ser Ser Asn165 170 175Asp Leu Cys Gly Thr Ile Pro Thr Asn Gly Pro Phe Ala His Ile Pro180 185 190Leu Gln Asn Phe Glu Asn Asn Pro Arg Leu Glu Gly Pro Glu Leu Leu195 200 205Gly Leu Ala Ser Tyr Asp Thr Asn Cys Thr210 215(2)SEQ ID NO:32的信息(ⅰ)序列特征(A)長度2089個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(ⅱ)分子類型cDNA到mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物體Arabidopsis thaliana(ⅵ)間接來源(A)克隆SERK基因cDNA(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置195..2069(ⅸ)序列描述SEQ ID NO:32GGATTTTTAT TTTATTTTTT ACTCTTTGTT TGTTTTAATG CTAATGGGTT TTTAAAAGGG 60TTATCGAAAA AATGAGTGAG TTTGTGTTGA GGTTGTCTCT GTAAAGTGTT AATGGTGGTG 120ATTTTCGGAA GTTAGGGTTT TCTCGGATCT GAAGAGATCA AATCAAGATT CGAAATTTAC 180CATTGTTGTT TGAA ATG GAG TCG AGT TAT GTG GTG TTT ATC TTA CTT TCA 230Met Glu Ser Ser Tyr Val Val Phe Ile Leu Leu Ser1 5 10CTG ATC TTA CTT CCG AAT CAT TCA CTG TGG CTT GCT TCT GCT AAT TTG 278Leu Ile Leu Leu Pro Asn His Ser Leu Trp Leu Ala Ser Ala Asn Leu15 20 25GAA GGT GAT GCT TTG CAT ACT TTG AGG GTT ACT CTA GTT GAT CCA AAC 326Glu Gly Asp Ala Leu His Thr Leu Arg Val Thr Leu Val Asp Pro Asn30 35 40AAT GTC TTG CAG AGC TGG GAT CCT ACG CTA GTG AAT CCT TGC ACA TGG 374Asn Val Leu Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp45 50 55 60TTC CAT GTC ACT TGC AAC AAC GAG AAC AGT GTC ATA AGA GTT GAT TTG 422Phe His Val Thr Cys Asn Asn Glu Asn Ser Val Ile Arg Val Asp Leu65 70 75GGG AAT GCA GAG TTA TCT GGC CAT TTA GTT CCA GAG CTT GGT GTG CTC 470Gly Asn Ala Glu Leu Ser Gly His Leu Val Pro Glu Leu Gly Val Leu80 85 90AAG AAT TTG CAG TAT TTG GAG CTT TAC AGT AAC AAC ATA ACT GGC CCG 518Lys Asn Leu Gln Tyr Leu Glu Leu Tyr Ser Asn Asn Ile Thr Gly Pro95 100 105ATT CCT AGT AAT CTT GGA AAT CTG ACA AAC TTA GTG AGT TTG GAT CTT 566Ile Pro Ser Asn Leu Gly Asn Leu Thr Asn Leu Val Ser Leu Asp Leu110 115 120TAC TTA AAC AGC TTC TCC GGT CCT ATT CCG GAA TCA TTG GGA AAG CTT 614Tyr Leu Asn Ser Phe Ser Gly Pro Ile Pro Glu Ser Leu Gly Lys Leu125 130 135 140TCA AAG CTG AGA TTT CTC CGG CTT AAC AAC AAC AGT CTC ACT GGG TCA 662Ser Lys Leu Arg Phe Leu Arg Leu Asn Asn Asn Ser Leu Thr Gly Ser145 150 155ATT CCT ATG TCA CTG ACC AAT ATT ACT ACC CTT CAA GTG TTA GAT CTA 710Ile Pro Met Ser Leu Thr Asn Ile Thr Tnr Leu Gln Val Leu Asp Leu160 165 170TCA AAT AAC AGA CTC TCT GGT TCA GTT CCT GAC AAT GGC TCC TTC TCA 758Ser Asn Asn Arg Leu Ser Gly Ser Val Pro Asp Asn Gly Ser Phe Ser175 180 185CTC TTC ACA CCC ATC AGT TTT GCT AAT AAC TTA GAC CTA TGT GGA CCT 806Leu Phe Thr Pro Ile Ser Phe Ala Asn Asn Leu Asp Leu Cys Gly Pro190 195 200GTT ACA AGT CAC CCA TGT CCT GGA TCT CCC CCG TTT TCT CCT CCA CCA854Val Thr Ser His Pro Cys Pro Gly Ser Pro Pro Phe Ser Pro Pro Pro205 210 215 220CCT TTT ATT CAA CCT CCC CCA GTT TCC ACC CCG AGT GGG TAT GGT ATA902Pro Phe Ile Gln Pro Pro Pro Val Ser Thr Pro Ser Gly Tyr Gly Ile225 230 235ACT GGA GCA ATA GCT GGT GGA GTT GCT GCA GGT GCT GCT TTG CCC TTT950Thr Gly Ala Ile Ala Gly Gly Val Ala Ala Gly Ala Ala Leu Pro Phe240 245 250GCT GCT CCT GCA ATA GCC TTT GCT TGG TGG CGA CGA AGA AGC CCA CTA998Ala Ala Pro Ala Ile Ala Phe Ala Trp Trp Arg Arg Arg Ser Pro Leu255 260 265GAT ATT TTC TTC GAT GTC CCT GCC GAA GAA GAT CCA GAA GTT CAT CTG 1046Asp Ile Phe Phe Asp Val Pro Ala Glu Glu Asp Pro Glu Val His Leu270 275 280GGA CAG CTC AAG AGG TTT TCT TTG CGG GAG CTA CAA GTG GCG AGT GAT 1094Gly Gln Leu Lys Arg Phe Ser Leu Arg Glu Leu Gln Val Ala Ser Asp285 290 295 300GGG TTT AGT AAC AAG AAC ATT TTG GGC AGA GGT GGG TTT GGG AAA GTC 1142Gly Phe Ser Asn Lys Asn Ile Leu Gly Arg Gly Gly Phe Gly Lys Val305 310 315TAC AAG GGA CGC TTG GCA GAC GGA ACT CTT GTT GCT GGC AAG AGA CTG 1190Tyr Lys Gly Arg Leu Ala Asp Gly Thr Leu Val Ala Val Lys Arg Leu320 325 330AAG GAA GAG CGA ACT CCA GGT GGA GAG CTC CAG TTT CAA ACA GAA GTA 1238Lys Glu Glu Arg Thr Pro Gly Gly Glu Leu Gln Phe Gln Thr Glu Val335 340 345GAG ATG ATA AGT ATG GCA GTT CAT CGA AAC CTG TTG AGA TTA CGA GGT 1286Glu Met Ile Ser Met Ala Val His Arg Asn Leu Leu Arg Leu Arg Gly350 355 360TTC TGT ATG ACA CCG ACC GAG AGA TTG CTT GTG TAT CCT TAC ATG GCC 1334Phe Cys Met Thr Pro Thr Glu Arg Leu Leu Val Tyr Pro Tyr Met Ala365 370 375 380AAT GGA AGT GTT GCT TCG TGT CTC AGA GAG AGG CCA CCG TCA CAA CCT 1382Asn Gly Ser Val Ala Ser Cys Leu Arg Glu Arg Pro Pro Ser Gln Pro385 390 395CCG CTT GAT TGG CCA ACG CGG AAG AGA ATC GCG CTA GGC TCA GCT CGA 1430Pro Leu Asp Trp Pro Thr Arg Lys Arg Ile Ala Leu Gly Ser Ala Arg400 405 410GGT TTG TCT TAC CTA CAT GAT CAC TGC GAT CCG AAG ATC ATT CAC CGT 1478Gly Leu Ser Tyr Leu His Asp His Cys Asp Pro Lys Ile Ile His Arg415 420 425GAC GTA AAA GCA GCA AAC ATC CTC TTA GAC GAA GAA TTC GAA GCG GTT 1526Asp Val Lys Ala Ala Asn Ile Leu Leu Asp Glu Glu Phe Glu Ala Val430 435 440GTT GGA GAT TTC GGG TTG GCA AAG CTT ATG GAC TAT AAA GAC ACT CAC 1574Val Gly Asp Phe Gly Leu Ala Lys Leu Met Asp Tyr Lys Asp Thr His445 450 455 460GTG ACA ACA GCA GTC CGT GGC ACC ATC GGT CAC ATC GCT CCA GAA TAT 1622Val Thr Thr Ala Val Arg Gly Thr Ile Gly His Ile Ala Pro Glu Tyr465 470 475CTC TCA ACC GGA AAA TCT TCA GAG AAA ACC GAC GTT TTC GGA TAC GGA 1670Leu Ser Thr Gly Lys Ser Ser Glu Lys Thr Aso Val Phe Gly Tyr Gly480 485 490ATC ATG CTT CTA GAA CTA ATC ACA GGA CAA AGA GCT TTC GAT CTC GCT 1718Ile Met Leu Leu Glu Leu Ile Thr Gly Gln Arg Ala Phe Asp Leu Ala495 500 505CGG CTA GCT AAC GAC GAC GAC GTC ATG TTA CTT GAC TGG GTG AAA GGA 1766Arg Leu Ala Asn Asp Asp Asp Val Met Leu Leu Asp Trp Val Lys Gly510 515 520TTG TTG AAG GAG AAG AAG CTA GAG ATG TTA GTG GAT CCA GAT CTT CAA 1814Leu Leu Lys Glu Lys Lys Leu Glu Met Leu Val Asp Pro Asp Leu Gln525 530 535 540ACA AAC TAC GAG GAG AGA GAA CTG GAA CAA GTG ATA CAA GTG GCG TTG 1862Thr Asn Tyr Glu Glu Arg Glu Leu Glu Gln Val Ile Gln Val Ala Leu545 550 555CTA TGC ACG CAA GGA TCA CCA ATG GAA AGA CCA AAG ATG TCT GAA GTT 1910Leu Cys Thr Gln Gly Ser Pro Met Glu Arg Pro Lys Met Ser Glu Val560 565 570GTA AGG ATG CTG GAA GGA GAT GGG CTT GCG GAG AAA TGG GAC GAA TGG 1958Val Arg Met Leu Glu Gly Asp Gly Leu Ala Glu Lys Trp Asp Glu Trp575 580 585CAA AAA GTT GAG ATT TTG AGG GAA GAG ATT GAT TTG AGT CCT AAT CCT 2006Gln Lys Val Glu Ile Leu Arg Glu Glu Ile Asp Leu Ser Pro Asn Pro590 595 600AAC TCT GAT TGG ATT CTT GAT TCT ACT TAC AAT TTG CAC GCC GTT GAG 2054Asn Ser Asp Trp Ile Leu Asp Ser Thr Tyr Asn Leu His Ala Val Glu605 610 615 620TTA TCT GGT CCA AGG TAAAAAAAAA AAAAAAAAAA 2089Leu Sar Gly Pro Arg625(2)SEQ ID NO:33的信息(ⅰ)序列特征(A)長度625個氨基酸(B)類型氨基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅸ)序列描述SEQ ID NO:33:Met Glu Ser Ser Tyr Val Vel Phe Ile Leu Leu Ser Leu Ile Leu Leu1 5 10 15Pro Asn His Ser Leu Trp Leu Ala Sar Ala Asn Leu Glu Gly Asp Ala20 25 30Leu His Thr Leu Arg Val Thr Leu Val Asp Pro Asn Asn Val Leu Gln35 40 45Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val Thr50 55 60Cys Asn Asn Glu Asn Ser Val Ile Arg Val Asp Leu Gly Asn Ala Glu65 70 75 80Leu Ser Gly His Leu Val Pro Glu Leu Gly Val Leu Lys Asn Leu Gln85 90 95Tyr Leu Glu Leu Tyr Ser Asn Asn Ile Thr Gly Pro Ile Pro Ser Asn100 105 110Leu Gly Asn Leu Thr Asn Leu Val Ser Leu Asp Leu Tyr Leu Asn Ser115 120 125Phe Ser Gly Pro Ile Pro Glu Ser Leu Gly Lys Leu Ser Lys Leu Arg130 135 140Phe Leu Arg Leu Asn Asn Asn Ser Leu Thr Gly Ser Ile Pro Met Ser145 150 155 160Leu Thr Asn Ile Thr Thr Leu Gln Val Leu Asp Leu Ser Asn Asn Arg165 170 175Leu Ser Gly Ser Val Pro Asp Asn Gly Ser Phe Ser Leu Phe Thr Pro180 185 190Ile Ser Phe Ala Asn Asn Leu Asp Leu Cys Gly Pro Val Thr Ser His195 200 205Pro Cys Pro Gly Ser Pro Pro Phe Ser Pro Pro Pro Pro Phe Ile Gln210 215 220Pro Pro Pro Val Ser Thr Pro Ser Gly Tyr Gly Ile Thr Gly Ala Ile225 230 235 240Ala Gly Gly Val Ala Ala Gly Ala Ala Leu Pro Phe Ala Ala Pro Ala245 250 255Ile Ala Phe Ala Trp Trp Arg Arg Arg Ser Pro Leu Asp Ile Phe Phe260 265 270Asp Val Pro Ala Glu Glu Asp Pro Glu Val His Leu Gly Gln Leu Lys275 280 285Arg Phe Ser Leu Arg Glu Leu Gln Val Ala Ser Asp Gly Phe Ser Asn290 295 300Lys Asn Ile Leu Gly Arg Gly Gly Phe Gly Lys Val Tyr Lys Gly Arg305 310 315 320Leu Ala Asp Gly Thr Leu Val Ala Val Lys Arg Leu Lys Glu Glu Arg325 330 335Thr Pro Gly Gly Glu Leu Gln Phe Gln Thr Glu Val Glu Met Ile Ser340 345 350Met Ala Val His Arg Asn Leu Leu Arg Leu Arg Gly Phe Cys Met Thr355 360 365Pro Thr Glu Arg Leu Leu Val Tyr Pro Tyr Met Ala Asn Gly Ser Val370 375 380Ala Ser Cys Leu Arg Glu Arg Pro Pro Ser Gln Pro Pro Leu Asp Trp385 390 395 400Pro Thr Arg Lys Arg Ile Ala Leu Gly Ser Ala Arg Gly Leu Ser Tyr405 410 415Leu His Asp His Cys Asp Pro Lys Ile Ile His Arg Asp Val Lys Ala
420 425 430Ala Asn Ile Leu Leu Asp Glu Glu Phe Glu Ala Val Val Gly Asp Phe435 440 445Gly Leu Ala Lys Leu Met Asp Tyr Lys Asp Thr His Val Thr Thr Ala450 455 460Val Arg Gly Thr Ile Gly His Ile Ala Pro Glu Tyr Leu Ser Thr Gly465 470 475 480Lys Ser Ser Glu Lys Thr Asp Val Phe Gly Tyr Gly Ile Met Leu Leu485 490 495Glu Leu Ile Thr Gly Gln Arg Ala Phe Asp Leu Ala Arg Leu Ala Asn500 505 510Asp Asp Asp Val Met Leu Leu Asp Trp Val Lys Gly Leu Leu Lys Glu515 520 525Lys Lys Leu Glu Met Leu Val Asp Pro Asp Leu Gln Thr Asn Tyr Glu530 535 540Glu Arg Glu Leu Glu Gln Val Ile Gln Val Ala Leu Leu Cys Thr Gln545 550 555 560Gly Ser Pro Met Glu Arg Pro Lys Met Ser Glu Val Val Arg Met Leu565 570 575Glu Gly Asp Gly Leu Ala Glu Lys Trp Asp Glu Trp Gln Lys Val Glu580 585 590Ile Leu Arg Glu Glu Ile Asp Leu Ser Pro Asn Pro Asn Ser Asp Trp595 600 605Ile Leu Asp Ser Thr Tyr Asn Leu His Ala Val Glu Leu Ser Gly Pro610 615 620Arg62權利要求
1.一種產生無融合生殖種子的方法,該方法包括以下步驟(ⅰ)利用編碼一種蛋白質的核苷酸序列轉化植物材料,所說的蛋白質在細胞中或細胞膜中存在時,使得所說的細胞變為胚發生性的,(ⅱ)使轉化材料再生成為植物體,或者其包含心皮的部分,以及(ⅲ)在胚囊附近表達序列。
2.按照前面的權利要求的方法,其中所說的無融合生殖種子是無定形胚芽型。
3.按照前面任一權利要求的方法,其中所說的序列表達產生能夠跨越植物細胞膜的蛋白激酶。
4.按照前面的權利要求的方法,其中所說的激酶能夠自身磷酸化。
5.按照前面任一權利要求的方法,其中所說的蛋白質是同激酶一樣的富含亮氨酸重復單位的受體,包含配體結合結構域,脯氨酸盒,跨膜結構域,激酶結構域和蛋白質結合結構域。
6.按照前面的權利要求的方法,其中所說的蛋白質缺少功能性配體結合結構域,但包含脯氨酸盒,跨膜結構域,激酶結構域和蛋白質結合結構域。
7.按照前面任一權利要求的方法,其中一旦摻入到細胞膜,蛋白質結合結構域即在細胞內定位。
8.按照前面任一權利要求的方法,其中所說的序列還編碼細胞膜靶向序列。
9.按照前面任一權利要求的方法,其中所說的序列是在SEQ ID Nos.1或2中描述的序列或者是互補于在嚴格條件下與所說序列雜交并且編碼具激酶活性的膜結合蛋白質之序列的序列。
10.按照前面任一權利要求的方法,其中所說的序列被修飾,由此除去已知的mRNA不穩定性序列基元或聚腺苷酸化信號,和/或利用插入所說序列之植物的優選密碼子,以便在所說植物中這種修飾的序列的表達產生蛋白質,該蛋白質本質上類似于在有機體(其中蛋白質是內源性的)中表達未修飾序列獲得的蛋白質。
11.按照前面任一權利要求的方法,其中序列的表達在一個誘導型或者發育調節型啟動子的控制之下。
12.按照前面權利要求的方法,其中的序列表達處于下列啟動子之一的控制之下植物中調節SERK基因表達的啟動子,胡蘿卜殼多糖酶DcEP3-1基因啟動子,Arabidopsis AtChitⅣ基因啟動子,ArabidopsisLTP-1基因啟動子,Arabidopsis bel-1基因啟動子,矮牽牛花fbp-7基因啟動子,Arabidopsis ANT基因啟動子,來自Phalaenopsis的O126基因啟動子。
13.按照前面任一權利要求的方法,其中所說的序列在胚囊,子房壁,珠心,或者珠被的體細胞中表達。
14.按照前面任一權利要求的方法,其中所說的無融合生殖種子內的胚乳來自胚囊內的極性核與授粉雄配子核子的融合。
15.按照前面權利要求的方法,其中編碼蛋白質序列的表達先于極性核與雄配子核子的融合。
16.包含編碼一種蛋白質的序列的DNA,所說的蛋白質在細胞中或細胞膜中存在時,使得所說的細胞變為胚發生性的。
17.按照權利要求16的DNA,其中所說的蛋白質是同激酶一樣的富含亮氨酸重復單位的受體,包含配體結合結構域,脯氨酸盒,跨膜結構域,激酶結構域及蛋白質結合結構域,配體結合結構域(可以是可以不是缺失或者功能上失活的)。
18.按照權利要求16或17的DNA,其包含編碼有下列氨基酸序列的N端蛋白質片段的DNA序列Gln Ser Trp Asp Pro Thr Leu Val AsnPro Cys Thr Trp Phe His Val Thr Cys Asn。
19.按照權利要求18的DNA,其包含編碼有下列氨基酸序列的N端蛋白質片段的DNA序列Val Xaa Gln Ser Trp Asp Pro Thr Leu ValAsn Pro Cys Thr Trp Phe His Val Thr Cys AsnXaa是一種可變氨基酸,但優選Leu或Val。
20.按照權利要求19的DNA,其包含編碼有下列氨基酸序列的N端蛋白質片段的DNA序列Val Xaa Gln Ser Trp Asp Pro Thr Leu ValAsn Pro Cys Thr Trp Phe His Val Thr Cys Asn Xab Xac Xad Xae ValXaf Arg Val Asp Leu Gly Asn Xag Xah Leu Ser Gly His Leu Xai Pro GluLeu Gly Xaj Leu Xak Xal Leu GlnXaa到Xak是一種可變氨基酸,但優選Xaa=Leu或ValXab=Asn或GlnXac=Glu或Asp或HisXad=Asn或HisXae=Ser或Arg或GlnXaf=Ile或ThrXag=Ala或SerXah=Glu或AsnXai=Val或AlaXaj=Val或LysXak=Lys或GluXal=Asn或His
21.包含編碼一種蛋白質的序列的DNA,所說的蛋白質具有SEQ IDNo.3中描述的序列,或本質上與其類似的并且能夠與膜結合和有激酶活性。
22.包含編碼一種蛋白質的序列的DNA,所說的蛋白質具有SEQ IDNo.21中描述的序列,或本質上與其類似的并且能夠與膜結合和有激酶活性。
23.包含編碼一種蛋白質的序列的DNA,所說的蛋白質具有SEQ IDNo.33中描述的序列,或本質上與其類似的并且能夠與膜結合和有激酶活性。
24.包含編碼一種蛋白質的序列的DNA,所說的蛋白質具有SEQ IDNos.23,25,27,29及31中描述的序列,或本質上與其類似的并且能夠與膜結合和有激酶活性。
25.按照前面任一權利要求的DNA,其包括具有SEQ ID Nos.1或2中所示序列的DNA,或者是具有互補于在嚴格條件下與所說序列雜交并且編碼具激酶活性的膜結合蛋白質之序列的DNA。
26.按照前面任一權利要求的DNA,其包括具有SEQ ID No:20中所示序列的DNA,或者是具有互補于在嚴格條件下與所說序列雜交并且編碼具激酶活性的膜結合蛋白質之序列的DNA。
27.按照前面任一權利要求的DNA,包括具有SEQ ID No:32中所示序列的DNA,或者是具有互補于在嚴格條件下與所說序列雜交并且編碼具激酶活性的膜結合蛋白質之序列的DNA。
28.按照前面任一權利要求的DNA,包括具有SEQ ID Nos:22,24,26,28和30中所示序列的DNA,或者是具有互補于在嚴格條件下與所說序列雜交并且編碼具激酶活性的膜結合蛋白質之序列的DNA。
29.按照前面任一權利要求的DNA,其還編碼細胞膜靶向序列。
30.按照前面任一權利要求的DNA,其中所說的蛋白質編碼區處于發育調節型或誘導型啟動子的表達控制之下。
31.按照權利要求30的DNA,其中所說的啟動子是下列之一植物中調節SERK基因表達的啟動子,胡蘿卜殼多糖酶DcEP3-1基因啟動子,Arabidopsis AtChitⅣ基因啟動子,Arabidopsis LTP-1基因啟動子,Arabidopsis bel-1基因啟動子,矮牽牛花fbp-7基因啟動子,Arabidopsis ANT基因啟動子,來自Phalaenopsis的O126基因啟動子;Arabidopsis DMC1啟動子,pTA7001誘導型啟動子。
32.按照前面任一權利要求的DNA,其中所說的DNA是重組體DNA。
33.按照前面任一權利要求的DNA,其中所說的序列被修飾,由此除去已知的mRNA不穩定性序列基元或聚腺苷酸化信號,和/或利用插入所說序列之植物的優選密碼子,以便在所說植物中這種修飾的序列的表達產生蛋白質,該蛋白質本質上類似于在有機體(其中蛋白質是內源性的)中表達未修飾序列獲得的蛋白質。
34.DNA,其互補于在嚴格條件下與權利要求16-29中任一的DNA雜交的DNA。
35.一種載體,其包含如權利要求16-34中任一所要求的DNA序列。
36.一種植物細胞,其是以權利要求16-34中的任一DNA或權利要求35中的載體轉化的植物細胞,含有穩定摻入到它的基因組的DNA。
37.按照權利要求36的植物細胞,其是整個植物的一部分。
38.以權利要求16-34中的任一DNA或權利要求35中的載體轉化的植物,包含穩定摻入DNA的這種植物的子代,和/或這種植物或這種子代的無融合生殖種子。
39.以由權利要求16-34中的重組DNA所包含的DNA轉化的植物。
40.權利要求16-34之任一中的DNA在無融合生殖種子生產中的用途。
41.植物,其來源于由權利要求1-15或40任一中的方法獲得的無融合生殖種子。
42.一種獲得栽培品種的方法,該方法包括以下步驟以權利要求38,39或40中的植物花粉或者用該方法得到的品種花粉給植物授精。
43.一種在植物材料中獲得胚發生細胞的方法,該方法包括利用如權利要求16-34中任一所要求的重組DNA序列,由權利要求16-34任一中的重組DNA所包含的DNA或者權利要求35中的載體轉化植物材料,在植物材料或其衍生物中表達序列,并使所說植物材料或其衍生物受到一種化合物的作用,該化合物充當所說序列基因產物的配體。
44.按照前面權利要求的方法,其中所說的序列編碼如同激酶一樣的富含亮氨酸重復單位的受體,所說的化合物是植物激素。
45.一種在體外條件下產生體細胞胚的方法,其中SERK蛋白質被異位超量表達。
46.包含由權利要求1-15或者40任一中的方法獲得的無融合生殖種子的袋子。
全文摘要
本發明主要提供了一種產生無融合生殖種子的方法,該方法包括以下幾個步驟:(i)利用編碼一種蛋白質的核苷酸序列轉化植物材料,所說的蛋白質在細胞中或細胞膜中存在時,使得所說的細胞變為胚發生性的,(ii)使轉化材料再生成為植物體,或者其包含心皮的部分,以及(iii)在胚囊附近表達序列。所說的蛋白質可以是富含亮氨酸重復單位的受體激酶,其優選地是修飾到這樣一種程度,即配體結合結構域被缺失或在功能上被滅活。
文檔編號C12N15/82GK1218510SQ97194634
公開日1999年6月2日 申請日期1997年5月13日 優先權日1996年5月14日
發明者S·C·德夫里斯, E·D·L·史密特, G·J·范霍爾斯特, V·F·G·赫克特 申請人:諾瓦提斯公司