專利名稱:絲狀真菌領域的新的表達調節序列和表達產物的制作方法
技術領域:
本發明涉及衍生自絲狀真菌,尤其衍生自金孢子菌屬(Chrysosporium)菌株的新酶,本發明還涉及這些酶的編碼序列和表達調節序列。本發明是1999年10月6日提請的WO 00/20555(PCT/NL99/00618)的延伸,該申請在本申請優先權日前未公布。這一文獻在此并入參考。
已經揭示許多真菌表達系統,例如黑曲霉,泡盛曲霉(Aspergillusawamori),構巢曲霉(Aspergillus nidulans),Trichoderma reesei。許多其它系統由于各種原因未發現可被廣泛接受或使用。一般而言,理想的宿主必須符合以下標準的大部分-理想的宿主必須易于使用價格低廉的培養基發酵。
-理想的宿主必須有效使用培養基。
-理想的宿主必須高產量地生產蛋白質或多肽,即必須表現出高的蛋白質/生物量比。
-理想的宿主應該能夠有效分泌蛋白質或多肽。
-理想的宿主必須保證所需要的蛋白質或多肽易于分離和純化。
-理想的宿主必須對所需要的蛋白質或多肽進行加工,以使它們以不需要另外活化或修飾步驟的活性形式被生產出來。
-理想的宿主應該易于被轉化。
-理想的宿主應該使用廣泛范圍的表達調控元件從而確保易于運用和多功能性。
-理想的宿主應該使用易于選擇并且用起來很便宜的標記。
-理想的宿主應該產生穩定的轉化體。
-理想的宿主應該允許在對所表達出的蛋白質或多肽無害的條件下培養,如低粘性、低剪切等。
WO 96/02563以及Novo Nordisk的美國專利5602004、5604129和5695985敘述了曲霉屬和木霉屬真菌系統的缺陷,并且提出其它真菌的培養條件或許會更適于大規模生產蛋白質。轉化的培養物的唯一的例子是嗜熱毀絲霉(Myceliophthora thermophila)、阿拉巴門支頂孢(Acremonium alabamense)、土生梭孢霉(Thielavia terrestris)和嗜纖維素孢子絲菌(Sporotrichum cellulophilum)。據報道孢子絲菌屬菌株在對其它菌株不造成同樣結果的發酵條件下裂解并且產生綠色素。也描述了土生梭孢霉的一種由于形態學而被選擇的不形成孢子的突變體。但是其也指出梭孢霉屬和支頂孢屬(由此所使用的支頂孢屬菌株是所使用的梭孢霉屬菌株的未完成體)的原生質體效率很低并且潮霉素不是一種有用的選擇標記。許多其它真菌也憑借其形態而被認為是潛在有用的但未敘述它們的轉化情況。這些真菌菌株是Corynascus、嗜熱子囊菌屬、毛殼屬、節霉屬、柱頂孢霉和Talaromyces。轉化的宿主因為所引入的Humicola木聚糖酶產量很低而被提及,梭孢霉屬的產量最低;但是,這些信息不很明確并且實際上能夠推斷梭孢霉屬是最佳的實施方案。對這些參考菌株的命名是基于1994年ATCC對工業真菌命名的基礎之上的。因而很明顯未能獲得高程度的異源表達并且實際上在假定的形態學和表達程度之間不存在正相關。即使可以得出一些相關性,頁很可能是負相關。根據1996年的ATCC真菌分類,嗜熱孢子絲菌ATCC 20493是一種嗜熱毀絲霉菌株。現在這個菌株仍然被鑒定為嗜熱毀絲霉。從這些最近的說明中可以明顯看出本技術領域的不可預知性。
Novo Nordisk的WO 97/26330提出了一種獲得用于生產異源多肽的具有改進特征的絲狀真菌親本細胞突變體的方法。此方法包含首先發現一個特定的形態學改變,然后評價轉化體是否比親本菌株生產出更多的異源多肽。僅就鏈孢屬A3/5菌株和米曲霉舉例說明了此方法。此方法建議可適用于曲霉、木霉、梭孢霉、鐮孢霉、鏈孢霉、支頂孢屬、Tolyplocadium、Humicola、柱頂孢屬、毀絲霉屬或毛霉屬的真菌。如上所述,由于本技術領域的不可預知性以及所引用申請的方法的不可預知性,尚未提出一種帶有合理的成功預期的普遍適用的方法。
在WO 00/20555中,我們已經闡述了一種替代性真菌表達系統,這種系統簡便使用滿足上述需要的上述曲霉和木霉。這個新系統提供了另外的優點,即轉化率高于通常使用的Trichoderma reesei系統。另外,所述培養條件提供了對多肽產物的附加益處。
發明詳述我們現在闡述了一些工業上令人感興趣的衍生自金孢子菌株的酶,及全序列信息。我們還闡述了衍生自金孢子菌菌株用于表達同源和異源基因的新啟動子系統。
本發明特別涉及通過其氨基酸序列鑒別的糖基水解酶的家族7(例如纖維二糖水解酶)和家族10(例如木聚糖酶),及磷酸甘油醛脫氫酶,以及衍生自這些酶蛋白的肽,和編碼這些肽和蛋白質的核酸序列,以及特別涉及與這些基因相關的調節序列。
特別地,本發明涉及上述三類分離或重組的酶蛋白或其活性部分,包括具有如下進一步說明的和權利要求中所述的至少一定程度序列相同性的突變體,以及編碼這些蛋白質或其一部分的核酸序列,和/或調節其表達的核酸序列。這些酶尤其是(1)糖基水解酶家族7(纖維二糖水解酶,CBH1),其與SEQ ID NO2序列具有至少75%,優選至少80%或者至少85%的氨基酸相同性;(2)糖基水解酶家族10(內切木聚糖酶XYL1),其與SEQ ID NO4的序列具有至少70%,優選至少75%或者至少80%氨基酸相同性;(3)磷酸甘油醛脫氫酶(GPD1),其與SEQ ID NO6序列具有至少86%,優選至少90%或至少93%氨基酸相同性。具有SEQ ID NO2、4和6的至少20個、優選至少30個連續氨基酸的多肽和編碼這些多肽的核酸序列也是本發明優選的一部分。相應的核苷酸序列分別示為SEQ ID No1(cbh1)、3(xyl1)和5(gpd1)。
所述重組的酶可以包含基本上完整的蛋白質,或者具有至少部分酶活性的截短的蛋白質。這種截短的部分可以是催化結構域,或其至少大約75%的氨基酸。例如,本發明的CBH1催化結構域包含SEQ ID NO2的第20-495位氨基酸序列,本發明的XYL1的催化結構域包含SEQ ID NO4的第54-384位氨基酸序列。所述催化結構域可以或不與源自另一種蛋白質的信號序列和/或來自另一種酶蛋白的碳水化合物結合結構域組合。或者,本發明所述酶(CBH1和XYL1)的纖維素結合結構域可以融合于其它酶蛋白的催化結構域。
本發明的核酸序列可以是完整蛋白質編碼區或寡核苷酸,或者優選是表達調節序列。寡核苷酸還可以用作探針以鑒別相當于但非相同于SEQ ID NO1,3和5基因的基因;當達到本文所限定的相同性百分比時,這些基因以及其編碼和非編碼部分及其表達產物,也是本發明的一部分。寡核苷酸的長度優選是15-75個核苷酸,更優選20-50個核苷酸。
本發明還涉及一種表達系統(表達盒),其包含與編碼另一種感興趣蛋白質的基因融合的所述三類蛋白質中任一蛋白質的一個表達調節區域(包括一個啟動子),或者與另一種表達調節區域融合的這些蛋白質中任一蛋白質的一個編碼區域,或者這些新蛋白質的表達調節區域和蛋白質編碼區域。所述表達調節區域包含至少60%,優選至少70%或者80%的SEQ ID NO1,3和5的5’非編碼區域,和/或來自這些5’非編碼區的至少20個,尤其至少40個連續核苷酸序列。相似地衍生自本發明所述基因3′非編碼區的終止序列,不論是否與同源或異源基因組合,在表達盒中也是有用的。
本發明的多核苷酸和寡核苷酸可以與SEQ ID NO1,3或5的相應序列具有最小的序列相同性,或者在嚴格雜交條件下與這些給定的序列雜交。嚴格雜交條件是本領域已知的那些條件,例如在6×SSC(20×SSC/1000ml175.3g NaCI,107.1g五水檸檬酸鈉,pH7.0),0.1%SDS,0.05%焦磷酸鈉,5×Denhardt’s溶液和20ug/ml變性鯡精DNA中,在56℃雜交18-24小時,隨后在56℃在5×SSC,0.1%SDS中洗兩次,每次30分鐘,及在56℃在2×SSC,0.1%SSC中洗兩次,每次30分鐘。
這些表達系統可以包含于金孢子菌宿主,如Chrysosporiumlucknowense宿主中,或者在另一種非真菌宿主或者優選真菌宿主中。其它真菌宿主例如是其它金孢子菌菌種或菌株,鐮孢屬(Fusarium),曲霉屬等。這種宿主有利的是不會自身地,固有地或由于培養條件導致產生相當于感興趣蛋白質的一種蛋白質,以便于回收相應的蛋白質。
在本說明書和所附權利要求中提及的“多肽”或“肽”或“感興趣多肽”或“感興趣肽”,是指本發明表達系統的產物,這個術語還包括蛋白質,即具有特定功能和/或二級和/或三級結構的多肽。本發明說明書中提及氨基酸相同性百分比時,這種相同性涉及完整蛋白質或通過起始和結束的氨基酸數目定義的一特殊部分,相同性百分比是通過常規使用的BLAST序列對比程序測定。
在WO 00/20555所述的真菌表達系統中,培養基的pH可以是中性或堿性的,因此不再使生產的蛋白質或多肽經歷侵蝕性和潛在滅活性酸性pH。在所述蛋白質或多肽更好地適于酸性環境的情況下,也可以在酸性環境下培養,如pH為4。可以在pH4.0-10.0之間進行合適的培養。然而優選中性至堿性pH,因為宿主在這種pH如pH6-9之間表現為較好生長。在一些情況下,在pH8以上而且甚至在高如pH10的堿性pH中生長也是一種良好的選擇。這種宿主菌株的培養溫度對一些類型的所產生的多肽的穩定性也是有益的。所述培養溫度適于在23-43℃。明顯地,這樣的條件對生產哺乳動物多肽而言是特別感興趣的。所選擇的溫度依賴于培養成本效率和所述多肽或培養菌株的敏感性。
也已經確定生物量與粘性之間的關系并且所產生的蛋白量對于金孢子菌宿主也是非常有利的。已經將Trichoderma longibrachiatum(以前認為是T.reesei)和黑曲霉進行了比較。在它們各自優化條件下,Trichoderma longibrachiatum的生物量是2.5-5克/升,黑曲霉的生物量是5-10克/升,金孢子菌宿主的生物量是0.5-1克/升,因此,這樣比商業上所用的菌株改良了5-10倍。本發明涉及包含編碼異源蛋白質或多肽的核酸序列的表達系統,所述核酸序列可操縱地連于下述的一個表達調節區域,并任選地連接于一個分泌信號編碼序列和/或一個載體蛋白編碼序列。優選地,本發明的重組菌株分泌感興趣多肽。這將避免破壞細胞以分離感興趣多肽的必要性,而且還使表達產物被宿主細胞的其它成分降解的風險降至最低。
可根據由Burgess出版公司1972年出版的Barnett和Hunter所著的《舉例說明的半知真菌屬》(第三版)一書中的形態學知識對金孢子菌屬真菌進行準確地描述。其它提供關于金孢子菌屬真菌分類的詳細資料的來源有例如Sutton分類法(Van Oorschot,C.A.N(1980)“金孢子菌屬及相關屬的修訂版”,荷蘭Baarn CBS的真菌學研究第20期1-36頁)。CBS是布達佩斯條約的菌種保藏機構之一。根據這些教科書,金孢子菌屬真菌是屬于絲孢目叢梗孢科的一種。以下菌株是金孢子菌,但金孢子菌非限于這些菌株C.botryoides,C.carmichaelii,C.crassitunicatum,C.europae,C.evolceannui,C.farinicola,C.fastidium,C.filiforme,C.georgiae,C.globiferum,C.globiferum var.articulatum,C.globiferum var.niveum,C.hirundo,C.hispanicum,C.holmii,C indicum,C inops,C.keratinophilum,C kreiselii,C kuzurovianum,C lignorum,C lobatum,C lucknowense,C.lucknowenseGarg 27K,C.medium,C.medium var.spissescens,C.mephiticum,C.merdarium,C.merdarium var.roseum,C.minor,C.pannicola,C.parvum,C.parvum var.crescens,C.pilosum,C.pseudomerdarium,C.pyriformis,C.queenslandicum,C.sigleri,C.sulfureum,C.synchronum,C.tropicum,C.undulatum,C.vallenarense,C.vespertilium,C.zonatum。
C.lucknowense構成了金孢子菌屬的一個種,由于它天然高產纖維素酶蛋白(WO 98/15633和相關的美國專利5811381),所以我們對其尤其感興趣。Chrysosporium lucknowense的特征如下在沙氏葡萄糖瓊脂培養基上生長14天后菌落直徑達到55毫米,呈奶油色,氈狀蓬松;中心致密并且3到5毫米厚;邊緣清晰、規則并且有傘緣;顏色從淡黃色到奶油色。菌絲是無色透明和表面光滑的并且薄壁,很少分枝。氣生菌絲通常是能育的并且密集分隔,大約1到3.5毫米寬;水下菌絲是不能育的,大約1到4.5毫米寬,較薄的菌絲通常被扭曲。分生孢子通常是頂孢子和側生孢子,大多數是無梗的或位于短的頻繁出現的圓錐形突起上或短側枝上。分生孢子是單生的但相互之間靠得很近;在一個菌絲細胞上生有1到4個分生孢子,近于無色,薄壁或壁光滑,大多數近球形,也有棍棒狀和倒卵形的,單細胞,2.5-11×1.5-6μm大小,帶有較寬的基板芽痕(1-2微米)。無居間分生孢子,也無厚垣孢子存在。Chrysosporiumlucknowense菌株的例子有ATCC44006,CBS251.72,CBS143.77和CBS272.77等,在WO 98/15633和相關的美國專利5811381中提供了其它的例子。
從此菌種中分離得到了一株具有更高的產纖維素酶能力的菌株。內部命名為C1菌株,此菌株根據布達佩斯條約于1996年8月29日保藏于位于莫斯科Bakrushina街8號郵編為113184的俄羅斯微生物保藏中心,其保藏編號為VKM F-3500D。此菌株被命名為Chrysosporium lucknowense Garg 27K。C1菌株的特征如下在馬鈴薯葡萄糖瓊脂培養基上生長7天菌落直徑達到大約55-66毫米;乳白色,氈狀。中心厚度為2-3微米厚,邊緣清晰,規則并且有傘緣;菌落顏色淡奶油色;菌絲是無色透明,壁光滑,薄壁,很少分枝。氣生菌絲是能育的,分隔,大約2-3毫米寬;水下菌絲是不能育的。分生孢子是頂孢子或側生孢子;無梗或位于短側枝上。分生孢子是單生的但相互之間靠得很近;近于無色,薄壁切光滑,近球形,棍棒狀或倒卵形,單細胞,4-10微米大小。無厚垣孢子,也無居間分生孢子存在。
在WO 98/15633、美國專利5811381和美國專利6,015,707中描述了分離C1菌株的方法。那些來源于金孢子菌屬前體菌株包括已經自然誘變或人工誘變的菌株也在金孢子菌屬的定義范圍之內。金孢子菌屬突變體可以通過誘導誘變,特別是通過組合輻射誘變和化學誘變而獲得。
例如C1菌株經紫外線照射產生了UV13-6菌株,UV13-6菌株進一步經N-甲基-N’-硝基-亞硝基胍的誘變產生了NG7c-19菌株。NG7c-19菌株經紫外線照射突變導致生成UV18-25菌株。在這一突變過程中在液體培養基中或培養皿上以及顯微鏡下培養物的形態學特征變化很大。隨著連續誘變,作為金孢子菌屬特征的在培養皿上菌落呈絨毛狀或氈狀生長的形態學特征逐漸喪失,最后得到一個扁平的無光澤的菌落。野生型菌株在某些培養基中產生棕色色素的現象在突變株中也不是很明顯。顯著的是UV18-25突變株在液體培養基中的粘性要比野生型C1菌株和UV13-6和NG7c-19突變株低得多。在所有菌株都維持金孢子菌屬總顯微特征的情況下,經連續突變后菌絲體變窄,并且UV18-25菌株可以明顯觀察到斷裂菌絲。菌絲體斷裂可能是引起UV18-25菌株相關的低粘度的原因。每個誘變步驟之后菌株形成孢子的能力降低。以上表明金孢子菌屬的每一菌株與上面的形態學定義都有一定的偏差。此外,每一突變步驟之后纖維素酶和細胞外蛋白的產量增加了,但一些突變導致蛋白酶表達降低。真菌分類學標準可以從例如CBS、VKMF和ATCC處得到。稱為金孢子菌株C1,菌株UV13-6,菌株NG7C-19和菌株UV18-25的這些菌株,根據布達佩斯條約已經保藏在莫斯科的俄羅斯微生物保藏中心(VKM)。野生型C1菌株保藏號為VKM F-3500 D,保藏日期為1996年8月29日,C1 UV13-6突變體保藏號為VKM F-3632 D(02-09-1998),C1 NG7c-19突變體保藏號為VKM F3633 D(02-09-1998)及C1 UV 18-25突變體保藏號為VKM F-3631 D(02-09-1998)。
優選使用本領域已知的一些非毒性金孢子菌株,因為這樣可降低大規模生產所造成的環境問題及使生產步驟簡便與降低成本一體化。
表達調節區域是用于表達的宿主金孢子菌屬菌株所識別的一段DNA序列。它含有一段與編碼待表達的多肽的核酸序列可操作連接的啟動子序列。啟動子的連接使得待表達序列起始密碼子的相對位置可以表達。密碼子序列可以是組成型的或誘導型的。任何能夠允許金孢子菌屬菌株多肽表達的表達調節序列或其組合形式均包括在本發明中。表達調節序列優選是真菌表達調節區例如子囊菌調節區域。合適的真菌表達調節區域來自于下列真菌菌屬任何之一表達調節區域曲霉屬、木霉屬、金孢子菌屬、漢遜酵母屬、毛霉屬、畢赤酵母屬、鏈孢霉屬、Tolyplocadium、根毛霉屬、鐮孢霉屬、青霉屬、酵母屬、Talaromyces或其另外的有性形式如裸殼孢屬、Hypocrea等,例如來自木霉的纖維二糖水解酶啟動子,來自曲霉的葡糖淀粉酶啟動子、甘油醛磷酸脫氫酶啟動子、醇脫氫酶A和醇脫氫酶R啟動子、TAKA淀粉酶啟動子,來自鏈孢霉的磷酸甘油酸和交叉旁路控制啟動子,來自曼赫根毛霉的天冬氨酸蛋白激酶啟動子、脂酶啟動子和來自變灰青霉的β-半乳糖苷酶啟動子。來自與宿主菌株同屬的表達調節序列尤其適合,這是因為它很可能特別適應特定的宿主。因此,優選的表達調節序列是來自金孢子菌屬真菌的表達調節序列。
優選應用能在選擇的宿主內高表達的表達調節區域。這優選是一個來自于本發明的金孢子菌的表達調節區域。其也可以是一個來自于異源宿主的高表達調節區域,如本領域眾所周知的。因此要大量表達的蛋白質和因此為本發明提供合適的表達調節序列的特定的例子不僅僅局限于疏水蛋白、蛋白酶、淀粉酶、木聚糖酶、果膠酶、酯酶、β-半乳糖苷酶、纖維素酶(例如內切葡聚糖酶;纖維二糖水解酶)和多聚半乳糖醛酸酶。已經明確在固體狀態下以及水下發酵條件下都可以高表達。評價這些蛋白質產生和產量的方法是本領域所眾所周知的,例如Sigma和Megazyme公司的產品目錄里有無數的例子。Megezyme公司位于愛爾蘭Wicklow縣的Bray商業區內。Sigma公司在全世界范圍內有許多分支機構例如密蘇里州圣路易絲市的14508信箱。對于纖維素酶的分析我們使用商用分析方法如羧甲基纖維素酶分析法、內粘度計分析法、微晶纖維素酶分析法、β-葡萄糖酶分析法、RBB羧甲基纖維素酶分析法、Cellazyme C分析法。另外的方法是本領域熟練技術人員眾所周知的并且可以從關于這個主題的一般文獻中查到,這些信息引入本文做參考。我們參考“酶學方法1995第一卷直至1998第297-299卷”作為例子。為確保宿主能夠很好地識別我們應用了金孢子菌屬真菌的啟動子序列。
我們已經發現在金孢子菌屬真菌中異源表達調節序列像天然的金孢子菌屬真菌序列一樣有效地工作。這就允許眾所周知的構建物和載體被用于轉化金孢子菌屬真菌以及為在這種新的表達和分泌宿主中構建高表達的載體提供眾多其他的可能性。例如可以使用如Christiansen等在Bio/Technol 61419-1422(1998)中所描述的標準的曲霉轉化技術。其它文獻例如美國專利4816405,5198345,5503991,5364770和5578463,EP-B-215.594(也用于木霉)中提供了曲霉轉化載體的詳細資料,這些文獻以及它們的內容引入本文做參考。由于已經明確金孢子菌屬真菌可以以極高水平表達纖維素酶,所以這些蛋白的表達調節區域是優選的。我們把前面提到的保藏的金孢子菌屬真菌作為特定的例子。
與含有和待表達的多肽可操作連接的核酸表達調節區域的金孢子菌屬突變株一樣,含有來自金孢子菌屬真菌,優選來自Chrysosporium lucknowense的核酸表達調節區域或其衍生物的核酸構建體組成了本發明的一個單獨的實施方案。這樣的合適的核酸構建體是與纖維素酶或木聚糖酶表達,優選與纖維二糖水解酶,或者磷酸甘油醛脫氫酶表達有關的金孢子菌屬真菌的表達調節區域,如下詳述。本發明的核酸序列可適當地得自金孢子菌菌株,這種菌株在說明書的另一部分中定義。可以確定啟動子序列的方式有很多,而且是本領域所熟知的。在相關基因起始處ATG密碼子的上游區域進行核酸酶缺失實驗可以提供這種序列。另外例如分析共有序列也可以發現感興趣的基因。使用雜交和擴增方法,本領域技術人員可以容易得出相應的啟動子序列。
通過克隆相應基因這種方式鑒定了C1內切葡聚糖酶的啟動子序列。本發明的優選的啟動子是55kDa的纖維二糖水解酶(CBH1)啟動子和30kDa的木聚糖酶(Xyl1)啟動子和磷酸甘油醛脫氫酶啟動子,因為這些酶通過它們自己的啟動子高水平地表達。相應的啟動子序列通過克隆以直截了當的方式鑒別的,如WO 00/20555所述,分別使用SEQ ID NO1(針對CBH1)和SEQ ID NO3(針對Xyl1)提供的序列信息。金孢子菌的碳水化合物降解酶的啟動子,尤其C1啟動子,可以有利地用于在宿主生物體中表達所需的多肽,尤其在真菌或其它微生物宿主生物體中。與SEQ ID NO.1和3和5,或與金孢子菌屬其它基因序列具有至少65%,優選至少70%,最優選至少75%核苷酸序列相同性的啟動子序列也是本發明的一部分。
本發明的重組菌株和核酸序列的特別的實施方案參見實施例。關于重組菌株,也參見現有技術,如敘述高表達的啟動子序列特別是那些在真菌例如曲霉和木霉中提供高表達的啟動子序列。現有技術中提供了許多可用于曲霉的表達調節區域,如Novo的美國專利5252726和Unilever的美國專利5705358。這些內容引入文中做參考。
疏水蛋白基因是一個高表達的真菌基因。因此提示疏水蛋白基因,優選來自金孢子菌屬真菌的疏水蛋白基因的啟動子序列可能適合于在本發明合適的實施方案中用做表達調節序列。本領域已經公開了Trichoderma reesei和Trichoderma harzianum疏水蛋白的基因序列以及煙曲霉和構巢曲霉的基因序列,相關的序列信息引入文中做參考(Munoz等,現代遺傳學1997,32(3)225-230;Nakari-SetalaT等,歐洲生物化學雜志1996,15235(1-2)248-255;M.Parta等,傳染免疫學1994 62(10)4389-4395和Stringer M.A.等,分子微生物學1995,16(1)33-44)。利用這些序列信息,本領域熟練技術人員使用上面已經提到的標準技術就可以很容易地得到金孢子菌屬真菌疏水蛋白基因的表達調節序列。本發明的金孢子菌屬重組菌株包含與編碼感興趣的多肽的序列可操作連接的疏水蛋白調控區。
表達調節序列也可以另外包含增強子或沉默子。這些也是本領域眾所周知的并且它們通常都位于離啟動子有一段距離的地方。表達調節序列也可以包含帶有激活劑結合位點和阻遏蛋白結合位點的啟動子。在一些情況下也可以修飾這些位點以消除這種類型的調控。已經描述了帶有creA位點的絲狀真菌啟動子。可以突變這樣的creA位點確保阻抑葡萄糖,通常情況下去除未突變的creA位點可導致這種結果。Gist Brocades的WO 94/13820舉例說明了這種原理。使用這樣的啟動子可以使由核酸序列所編碼的多肽的表達能夠在葡萄糖存在的情況下受此啟動子調節。WO 97/09438中也說明了此原理。帶有或不帶有creA位點的這些啟動子都可以使用。creA位點已經被突變的突變株可被用做本發明的重組菌株的表達調節序列,這樣它所調節的核酸序列就可以在葡萄糖存在的情況下表達。這些金孢子菌屬真菌啟動子可以以WO 97/09438中所例證的類似方式脫阻抑。creA位點是本領域眾所周知的。另外,可以在阻遏系統帶有突變例如creA基因本身突變的宿主菌株中應用帶有creA結合位點的啟動子,因此盡管此菌株帶有creA結合位點,它仍然可以在有葡萄糖存在的情況下產生蛋白質或多肽。
終止子序列也是表達調節序列,它們與待表達基因的3’端可操作連接。任何真菌終止子在本發明的金孢子菌屬真菌中都是有功能的,例如構巢曲霉trpC終止子(1),黑曲霉α-葡糖苷酶終止子(2)、黑曲霉葡糖淀粉酶終止子(3)、曼赫氏毛霉羧基蛋白酶終止子(美國專利5578463)和T.reesei纖維二糖水解酶終止子。天然的金孢子菌終止子序列如CBH1終止子在金孢子菌屬真菌中也是有功能的并且是合適的。
用于本發明的合適的金孢子菌屬真菌重組株的待表達的核酸序列與編碼信號序列氨基酸序列的核酸序列可操作連接。信號序列是與待表達多肽的氨基酸序列可操作連接從而使之分泌到宿主真菌外的氨基酸序列。這樣的信號序列可以是正常與異源多肽相結合的,也可以是宿主本身的。它也可以對宿主和多肽來說都是異源的。編碼信號序列的核酸序列必須位于讀碼框內以允許信號序列和異源多肽的翻譯。任何一種能夠使金孢子菌屬真菌分泌多肽的信號序列均包括在本發明內。合適的這樣的序列是真菌的信號序列,優選子囊菌信號序列。
合適的信號序列的例子通常可以來自酵母或下列特定的真菌菌屬的任何之一曲霉、木霉、金孢子菌屬、畢赤酵母、鏈孢霉、根毛霉、Humicola、漢遜酵母、毛霉、Tolyplocadium、鐮孢霉、青霉、酵母屬、Talaromyces或其另外的有性形式如裸殼孢屬、Hypocrea等。特別有用的信號序列通常與下列蛋白質天然結合纖維二糖水解酶、內切葡聚糖酶、β-半乳糖苷酶、木聚糖酶、果膠酶、酯酶、疏水蛋白、蛋白酶或淀粉酶。例如曲霉或Humicola的淀粉酶(4)、米曲霉的TAKA淀粉酶、黑曲霉的α淀粉酶、毛霉的羧基肽酶(美國專利5578463)、曼赫氏根毛霉的脂酶、木霉的纖維二糖水解酶(5)、變灰青霉的β-半乳糖苷酶以及酵母的α交配因子。
或者,信號序列可以來自于芽孢桿菌的淀粉酶或枯草蛋白酶基因。來自與宿主菌株同屬的信號序列是最合適的,這是因為它很可能特異性適應宿主菌株,因此優選的信號序列是金孢子菌屬真菌的信號序列,特別是上述金孢子菌C1菌株、UV13-6菌株、NG7C-19菌株和UV18-25菌株的信號序列。來自于絲狀真菌、酵母和細菌的信號序列也是有用的。非真菌來源的信號序列也是有用的,特別是來自于細菌、植物和哺乳動物的信號序列。
根據本發明任何一個實施方案所用的重組的金孢子菌屬真菌可另外包含一個選擇標記。這樣的選擇標記將允許易于挑選轉化的或轉染的細胞。選擇標記通常編碼一種基因產物,此基因產物對未轉化的菌株提供了一種異源的特定類型的抗性。這可以是對重金屬、抗生素和殺蟲劑的抗性。原養型對于非抗生素品種來說也是一種有用的選擇標記。當著眼于這種產物更快或較不復雜的調控將感興趣的蛋白質或多肽用于食品或藥物中時,優選非抗生素選擇標記。GRAS指標常常用于這樣的標記。本領域熟練技術人員可用許多這樣的標記。例如FDA提供了一系列這樣的標記。最常用的選擇標記來自于賦予抗藥性或減輕營養缺陷的amdS(乙酰胺酶)、hph(潮霉素磷酸轉移酶)、pyrG(乳清酸核苷-5’-磷酸脫羧酶)、trpC(色氨酸合酶)、argB(鳥氨酸氨甲酰基轉移酶)、sC(硫酸腺嘌呤轉移酶)、bar(膦絲菌素乙酰轉移酶)、glufosinate抗性、niaD(硝酸還原酶)、博來霉素抗性基因,更特別的是Sh ble、磺酰脲抗性如乙酰乳酸合成酶ilv1突變。也可以通過共轉化選擇,其中選擇標記在另一個載體上或與編碼感興趣的多肽的多肽編碼序列在同一個核酸片段上。
本文中所用的術語異源多肽是指通常情況下不被本發明用于表達的金孢子菌屬真菌表達和分泌的蛋白質或多肽。多肽可以是植物或動物(脊椎動物或無脊椎動物)起源的例如哺乳動物、魚、昆蟲或微生物起源的,但限制條件是此多肽不能出現在宿主菌株中。哺乳動物包括人。微生物包含病毒、細菌、古細菌和真菌即絲狀真菌和酵母。伯杰氏細菌鑒定手冊提供了許多系列的細菌和古細菌。為藥物應用的目的優先選擇人體蛋白,因此構成本發明優選的實施方案的重組宿主是其中帶有人體起源的多肽的宿主。為例如食品生產的目的,合適的異源多肽是動物、植物或藻類起源的。因此,這些實施方案也是本發明合適的實施例。其他有用的實施方案也包括細菌、酵母、病毒、古細菌和真菌任何之一起源的異源多肽。真菌起源的多肽是最優選的。
本發明的合適的實施方案包含帶有合適的密碼子使用的異源核酸序列。這樣的序列編碼其所起源的宿主的天然的氨基酸序列,但具有不同核酸序列,即某些密碼子已經被其他編碼相同氨基酸的密碼子替換以使之更易于被用于表達的宿主菌株所使用的核酸序列。這可導致異源核酸序列的更好地表達。對于本領域熟練技術人員來說這是很普通的。這種合適的密碼子可以在已知的真菌密碼子使用對應于非真菌的密碼子使用的基礎上得到。它也可以更特異地適應于金孢子菌屬真菌本身的密碼子使用。相似之處是所觀察到的木霉、Humicola和曲霉的密碼子使用可以在不改變密碼子的情況下進行這些有機體之間的序列交換。關于這些真菌密碼子使用的詳細資料是本領域熟練技術人員可利用的,并且引入本文做參考。
本發明不僅僅局限于上面所提到的金孢子菌屬真菌菌株,也包括含有編碼金孢子菌屬真菌菌株同源蛋白的核酸序列的重組菌株,所述的核酸序列與一表達調節區可操作連接并且所述的重組菌株比相應的非重組菌株在同樣的條件下產生更多的所述的蛋白。所感興趣的同源多肽優選是中性或堿性酶如在本文其它地方已經描述的水解酶、蛋白酶或碳水化合物降解酶。多肽也可以是酸性的。優選的重組菌株比非重組菌株表達更多量的多肽。所有提到的關于異源多肽的評論也同樣適用于同源多肽纖維素酶。
因此,本發明也包括微生物基因工程菌株,其中所引入的序列是金孢子菌屬起源的。但是,由于以下原因例如用于轉化或轉染金孢子菌屬真菌的核酸序列中存在異源序列,由于存在編碼所感興趣的多肽的核酸序列的多拷貝這個事實或由于在同等條件下所表達的多肽的量多于非工程菌這個事實或由于在通常不表達的條件下發生表達這個事實,工程菌可以與原始自然菌株區分開來。后一情況可以是在與非重組菌相反的條件下誘導型啟動子調節所感興趣的序列或著是另外的因子誘導表達的結果。本發明涉及通過使用經典的基因工程或基因工程方法而獲得的菌株。
本發明的表達系統和含有其的重組菌株可以含有一段編碼選自下列物質的核酸序列碳水化合物降解酶(纖維素酶、木聚糖酶、甘露聚糖酶、甘露糖酶、果膠酶、淀粉酶例如葡糖淀粉酶、α淀粉酶、α和β半乳糖苷酶、α和β葡(萄)糖苷酶、β葡聚糖酶、幾丁質酶、聚N-乙酰葡糖胺酶)、蛋白酶(內切蛋白酶、氨基蛋白酶、氨基和羧基肽酶、角蛋白酶)、其它水解酶(脂酶、酯酶、植酸酶)、氧化還原酶(過氧化氫酶、葡萄糖氧化酶)和轉移酶(轉谷氨酰胺酶、轉糖基酶、異構酶和轉化酶)。
本發明所要表達的最令人感興趣的產物是纖維素酶、木聚糖酶、果膠酶、脂肪酶和蛋白酶。其中纖維素酶和木聚糖酶切割β-1,4鍵,纖維素酶包含內切葡聚糖酶,纖維二糖水解酶和β-葡糖苷酶。這些蛋白質在本領域已知的各種工業方法中均是非常有用的。特別是纖維素酶,例如我們提及的WO 98/15633闡述了纖維二糖水解酶和內切葡聚糖酶的使用。所述WO 98/15633的內容在此并入參考。
本發明的重組體,其包含編碼感興趣多肽的核酸序列,該序列編碼一種在酸性pH下即pH低于6,甚至pH低于5.5,更適合甚至pH低于5和甚至pH4或低于pH4的情況下失活或不穩定的蛋白質或多肽。這是一個特別令人感興趣的實施方案,因為通常披露的真菌表達系統并不是在中性到堿性的條件下培養而是在酸性條件下培養的。因此,本發明的這個系統提供了一種表達在酸性pH下易于失活或不穩定的蛋白質或多肽的安全的真菌表達系統。
正如在本發明任一實施方案中所詳細說明的那樣,一個更為特別的重組菌株被認為是本發明的一個優選的實施方案,其中編碼感興趣多肽的核酸序列編碼一種在pH5以上,優選中性或堿性pH(即大于7)和/或在pH大于6的情況下具有最佳活性和/或穩定性的蛋白質或多肽。在這樣的pH值下最佳活性大于50%,大于70%甚至大于90%被認為是特別有用的實施方案。在培養條件下所表達的多肽在此條件下沒有必要必須有活性,由于其活性形式可能對宿主有損害,所以實際上在其失活的條件下培養對它也是有利的。但是,蛋白質或多肽在此培養條件下必須穩定。穩定可以是熱穩定。它也可以是針對某些組合物或化學制品的穩定,例如存在于組合物中或生產過程中或在所感興趣的蛋白質或多肽的應用中。在含有纖維素酶或脂酶等的去垢劑組合物中的LAS是通常對蛋白質有損害的化學制品的例子。在應用中使用時間可能從短到長不等,因此對于每次應用來說穩定性的時間長短可能不同。熟練技術人員在各種情況的基礎上將能夠確保正確的條件。我們可以使用商用分析方法來確定不同的酶產物的最佳活性。例如Sigma和Megazyme公司的產品目錄上有這些分析方法。在本敘述的其它地方也都提到了特定的實施例。制造商提供了應用指導。
一種金孢子菌屬菌株適合被所要表達的感興趣的序列轉化或轉染且這種菌株生物量相當低。我們已經發現當培養至發酵的末尾階段粘度值為200-600cP時金孢子菌屬真菌菌株的生物量比T.reesei低2-3倍,當在相應條件下培養至粘度值為1500-2000cP時其生物量比黑曲霉低10-20倍,即它們各自最佳的培養條件能夠提供高水平的表達。這一表達水平極大地超過了這兩個商用菌株并且其生物量和粘度值相當低。這意味著這個金孢子菌屬菌株的表達產量要比黑曲霉和T.reesei高許多。這樣的一株轉化的或轉染的金孢子菌屬真菌菌株構成了本發明的一個合適的實施方案。
我們發現在上面所敘述的條件下金孢子菌屬C1菌株(18-25)的生物量是0.5-1.0克/升,而T.reesei的生物量是2.5-5.0克/升,黑曲霉的生物量是5-10克/升。在實施例中我們提供了這個過程的詳細資料。
在本發明的一個合適的實施方案中本發明的金孢子菌屬真菌重組菌株所產生的蛋白質或多肽的量至少應該等同于由UV13-6或C-19菌株所產生的摩爾每升纖維素酶的量,最優選的情況是至少應該等同于或高于由UV18-25菌株在相應條件或相同條件即在它們各自最佳的培養條件下產生的纖維素酶的量。
我們也發現當使用顯示UV18-25菌絲體形態的金孢子菌屬菌株即短的菌絲體片段時表達和分泌率非常高。因此本發明的重組菌株優選顯示這樣的形態。但是本發明也包括顯示這種新的和創造性特征的非重組菌株或其它金孢子菌屬真菌的工程菌株。本發明也包括在本發明任一實施方案中所描述的與C1菌株相比進一步表現出在相同的發酵條件下產生孢子能力降低,優選低于UV13-6菌株產孢能力,優選低于NG7C-19菌株產孢能力,優選低于UV18-25菌株產孢能力的金孢子菌屬真菌重組菌株。本發明也包括在本發明任一實施方案中所描述的在相同的發酵條件下顯示出與C1菌株相比,優選與UV13-6,NG7C-19和UV18-25菌株相比至少是其蛋白質產量與生物量比的金孢子菌屬真菌重組菌株。但是,本發明同樣也包括或與其它任一實施方案結合顯示這種新的和創造性特征的非重組菌株或其它金孢子菌屬真菌的工程菌株。
本發明的另一個吸引人的實施方案也包括在相應或等同的發酵條件下顯示出粘度值比NG7C-19菌株低,優選比UV18-25菌株低的金孢子菌屬真菌重組菌株。但是,本發明同樣也包括顯示這種新的和創造性特征的非重組菌株或其它金孢子菌屬真菌的工程菌株。我們已經確定在它們各自的最佳培養條件下發酵過程的末期階段UV18-25培養物的粘度值為10cP,而T.reesei的粘度值為200-600cP,黑曲霉的粘度值為1500-2000cP。在實施例中提供了這些測量過程。
在許多情況下粘度值可以通過視覺監測。物質的流動性變化程度很大,它可以呈近乎固體狀、醬狀或液體狀。粘性也很容易通過使用運動粘性管的Brookfield旋轉粘度計、降珠粘度計或杯形粘度計確定。這樣的低粘度值培養物每個時間單位和每個細胞的產量比已知的高粘度值的商業培養物要高。
對本發明的這些低粘度的培養物進行處理是有利的,特別是當放大培養時。本發明的低粘度的金孢子菌屬菌株在體積大至150000升的培養物中表現得非常好。因此任何一個體積至150000升的培養都是本發明的有用的實施方案。使用本發明的菌株任何其它傳統體積大小的發酵也應該能夠很好地實施。其后的原因是在大規模生產中出現的問題隨著聚集物的形成菌絲體太致密和/或不均勻分布。其結果是培養基在培養過程中不能被有效利用,因此導致生產過程低效,特別是在大規模發酵即體積大于150000升的情況下。通氣或混合導致了氧氣和營養饑餓因此降低了產物生物量的濃度和減少了培養過程中的多肽產量和/或導致發酵時間延長。此外,在商業發酵過程中高粘度和高剪切是我們所不希望發生的,并且在現在的商業發酵過程中它們是生產限制因素。從這一點上來說使用本發明的金孢子菌屬菌株可以克服所有這些負面特征,因為此菌株比商用T.reesei、黑曲霉和米曲霉顯示出更好的特征即蛋白質生產水平較高、更好的粘度特征和生物量數值。
根據本發明的任何一個上面提到的實施方案的金孢子菌屬菌株被認為是本發明最有用的實施方案,所述的菌株進一步呈現能生產選自上面所提到的碳水化合物降解酶、蛋白酶、其它水解酶、氧化還原酶和轉移酶的一種或多種真菌酶。特別是纖維素酶、木聚糖酶、果膠酶、脂酶和蛋白酶是最令人感興趣的產物。但是作為本發明的實施方案,生產一種或多種在中性或堿性優選堿性條件下顯示出最佳活性和/或穩定性的真菌酶的金孢子菌屬菌株也是有用的,所述的酶選自碳水化合物降解酶、水解酶和蛋白酶,優選水解酶和碳水化合物降解酶。在非重組金孢子菌屬菌株中,這種酶合適地是像WO98/15633所公開的那些除纖維素酶以外的酶。我們所特別感興趣的酶是木聚糖酶、蛋白酶、酯酶、α半乳糖苷酶、β半乳糖苷酶、β葡聚糖酶和果膠酶。這些酶不僅僅限于上面所提到的酶。本文中關于穩定性和活性的討論也同樣用于此處。
本發明也包括生產所感興趣的多肽的方法,所述方法包括在使所述多肽表達及優選分泌的條件下,培養本發明任何實施方案中的一種宿主菌株(例如真菌如金孢子菌,曲霉,木霉,漢遜酵母,毛霉,畢赤酵母,鏈孢霉,Tolypocladium,Rhizomucor,鐮孢,青霉或細菌或其它微生物),并回收隨后產生的相應多肽。
當提到蛋白質或多肽時,天然蛋白質的變種或突變體例如替換、插入或確實突變體被包括在顯示非突變體活性的蛋白或多肽中。相應的核酸序列也是如此。通過基因改組、蛋白質工程和定向進化定點突變和隨機突變等方法可以得到這樣的多肽、變種或突變體。美國專利5223409、5780279和5770356提供了定向進化的方法。利用這些方法例如通過易錯聚合酶鏈反應進行基因改組可在任何細胞類型中產生隨機突變的基因序列庫。每一基因都帶有分泌區和一固定區,從而使產物蛋白分泌出來并且固著在宿主表面。隨后創造此特定蛋白生物活性所必須的條件。經過許多循環之后最終導致具有所希望特征的終基因產生。換一句話說一個加速的定向進化過程。美國專利5763192也敘述了通過合成的多聚核苷酸偶聯隨機產生序列,將其引入宿主中隨后選擇具有預先設定特點的宿主細胞而獲得DNA、RNA、肽、多肽或蛋白質的方法。
本發明方法的另一種應用是在“定向進化”方法中,在其中產生新的蛋白質編碼DNA序列,在宿主細胞中表達所編碼的蛋白質,并且突變那些編碼具有所需特性的蛋白質的序列,并再次表達。將此方法重復多次直至獲得具有所需特性的蛋白質。例如可以通過基因改組,蛋白質工程,易錯PCR,定點誘變,和組合的和隨機誘變等方法,可以產生編碼外源蛋白質的新DNA序列。美國專利5,223,409,5,780,279和5,770,356提供了定向進化的教導。也見于Kuchner和Arnold,生物技術趨勢15523-530(1997);Schmidt-Dannert和Arnold,生物技術趨勢17ru35-136(1999);Arnold和Volkov,生物化學通用觀點354-59(1999);Zhao等,工業微生物學和生物技術手冊,第二版,(Demain和Davies編輯)pp.597-604,ASM出版社,華盛頓DC,1999;Arnold和Wintrode,生物技術百科全書,發酵,生物催化和生物分離(Flickinger和Drew編輯)pp.971-987,JohnWiley & Sons,紐約1999;及Minshull和Stemmer,生物化學通用觀點3284-290。
組合誘變的應用見于Hu等,生物化學1998,3710006-10015所揭示。美國專利5,763,192闡述了通過隨機產生合成的序列,將其導入宿主中,并選擇具有所需特性的宿主細胞的獲得蛋白質編碼DNA序列的一種新方法。影響人工基因重組(DNA改組)的方法包括隨機引發重組(Z.Shao等,核酸研究26681-683(1998)),交錯延伸方法(H.Zhao等,自然生物技術16258-262(1998)),和異源雙鏈重組(A.Volkov等,核酸研究27e18(1999))。易錯PCR是另一種方法(Song和Rhee,應用環境微生物學66890-894(2000))。
在定向進化方法中有兩種普遍應用的進行選擇步驟的方法。在一個方法中,感興趣的蛋白質活性對于宿主細胞的存活是關鍵的。例如,如果所需的活性是在pH8是活性的纖維素酶,那么可以將纖維素酶基因突變并導入所述宿主細胞中。用纖維素作為唯一碳源培養所述轉化體,并且逐漸提高pH,直至剩余一少部分存活者。將來自存活者的突變的纖維素酶基因,其大概編碼在較高pH是活性的纖維素酶,進行另一次突變循環,并重復進行這個方法直至獲得在pH8可以在纖維素上生長的轉化體。可同樣進化酶的耐熱變體,通過重復進行基因突變和高溫培養宿主細胞而進化(Liao等,美國科學院院報83576-580(1986);Giver等,美國科學院院報9512809-12813(1998)。
作為大規模平行“最適者生存”方法的一種替代方法是系列篩選。在這個方法中,各個轉化體是通過傳統方法篩選的,如指示培養基上生長的集落周圍的澄清區或有色區的觀測,比色或熒光測定酶分析,免疫分析,結合分析等。見例如Joo等,自然399670-673(1999),其中通過循環進行突變和篩選而進化不需要NADH作為輔因子的細胞色素P450單加氧酶;May等,自然18317-320(2000),其中以相似方式進化反向立體選擇性的一種乙內酰脲酶;及Miyazaki等,分子生物學雜志2971015-1026(2000),其中進化了一種耐熱枯草桿菌蛋白酶。
標準的克隆和蛋白質或多肽分離技術可以用于獲得所需的序列信息。部分已知序列可以用作探針以分離其它屬和菌株中的其它同源物。編碼特殊酶活性的核酸序列可以用于篩選例如一個金孢子菌文庫。本領域技術人員能意識到何種雜交條件是適當的。核酸雜交、構建文庫和克隆技術的常規方法見于Sambrook等(編輯)(1989),分子克隆實驗手冊,冷泉港出版社,Plainview,紐約和Ausubel等(編輯),分子生物學通用方法(1987),John Wiley和Sons,紐約。相關的信息也可見于后來的手冊和專利,以及來自本領域各種商購的試劑盒。
在另外的一個實施方案中,所述的方法包含在允許蛋白質或多肽或其前體表達和優選分泌的條件下培養菌株,隨后分離所產生的多肽并且任選將前體經過另外的分離和純化步驟以得到所感興趣的多肽。這樣的方法可能包含將前體裂解為感興趣的多肽或前體的合適的步驟。當一分泌的蛋白質載體和感興趣的多肽由一個蛋白酶位點連接時,可使用Kex-2樣蛋白酶、任一基本氨基酸配對的蛋白酶或Kex-2蛋白酶裂解。本領域熟練技術人員能夠很容易地找到Kex-2樣蛋白酶序列,因為現有一致序列的詳細資料可以利用并且已經公開了許多其它的序列如弗林蛋白酶。
根據本發明任一實施方案生產多肽的方法,培養的合適pH值大于5,優選5-10,更優選6-9。在此方法中合適的培養溫度是25-43℃,優選30-40℃。在此方法中所使用的菌株非常合適地是重組金孢子菌屬菌株或其它真菌或非真菌菌株。本發明的這種方法可進一步以制備本發明的重組菌株為前提。合適條件的選擇取決于待表達的多肽的性質,并且在本領域熟練技術人員的正常工作之內。
生產本發明重組菌株的方法也是本發明的一部分。此方法包含向合適的宿主菌株穩定引入一段編碼異源或同源多肽的核酸片段,所述的核酸序列與一表達調節區域可操作連接,所述的引入以一種已知的轉化絲狀真菌的形式發生。如上所述有無數的參考文獻可以利用,本文只引用了其中一小部分。所提供的信息足夠使本領域熟練技術人員毫不費力地施行此方法。此方法包含引入一核酸序列,去包含在本發明重組菌株的各種不同的實施方案中所描述的任一核酸元件或去組合。
例如核酸的引入是通過原生質體轉化的方法實現的。在實施例中詳細敘述了此方法。正如在本領域其它絲狀真菌中所描述的那樣,也可以使用另外的原生質體或球芽轉化技術。這些方法的詳細細節可在許多引用的參考文獻中找到,因此這些文獻引入本文做參考。本發明合適的方法包含使用非重組菌株作為引入所希望的編碼感興趣多肽的核酸序列的起始材料。
本發明也包括生產金孢子菌屬的酶的方法,所述的方法包含在pH值大于5,優選5-10,更優選6-9,6-7.5,7.5-9合適的中性和堿性pH范圍的培養基中或培養基上培養金孢子菌屬菌株或其它菌株。
通常來說,本發明進一步包含生產表現出中性或堿性最佳活性和/或穩定性,優選堿性最佳活性和/或穩定性的酶的方法。在本文的其它地方已經提供了優選的pH范圍和相應的最佳活性以及測量活性的分析方法。如上所述,酶應選自碳水化合物降解酶、蛋白酶、其它水解酶、氧化還原酶和轉移酶,所述的方法包含培養用編碼相應的酶的核酸片段轉化或轉染的宿主細胞。金孢子菌屬的酶是這樣的合適的酶。合適的類似的方法包含生產特別是如纖維素酶、木聚糖酶、果膠酶、脂酶和蛋白酶,其中纖維素酶和木聚糖酶帶有β-1,4-鍵,并且纖維素酶包含內切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。本發明的方法可包含培養本發明的含有編碼上述的這些酶的核酸的金孢子菌屬宿主。本發明的合適的非重組金孢子菌屬菌株主要生產碳水化合物降解酶、水解酶和蛋白酶。在這種情況下合適的酶是除纖維素酶以外的其它酶。分離方法等同于在WO 98/15633中所敘述的方法,此方法引入本文做參考。
本發明也包括由本發明所產生的酶。本發明也包括可從本發明的非重組金孢子菌屬菌株中分離的金孢子菌屬起源的酶。它們表現出前述的穩定性、活性特點。合適的是它們在LAS存在時也很穩定。特別要求保護的是具有前述活性穩定性特征的等電點為4-9.5的蛋白酶,分子量為25-95kD的蛋白酶;等電點為4.0-9.5的木聚糖酶,分子量為25-65kD的木聚糖酶;等電點為3.5-6.5的內切葡聚糖酶,分子量為25-55kD的內切葡聚糖酶;等電點為4-4.5的β-葡糖苷酶和α、β-半乳糖苷酶,分子量為45-50kD的β-葡糖苷酶和α、β-半乳糖苷酶;等電點為4-5的纖維二糖水解酶,分子量為45-75kD的纖維二糖水解酶例如等電點為4.5,分子量為55kD;等電點為4.0-5.0的多聚半乳糖醛酸酶,分子量為60-70kD如65kD的多聚半乳糖醛酸酶;等電點為4-5的酯酶,分子量為95-105kD的酯酶。分子量是通過SDS-PAGE電泳確定的。非重組酶即天然的酶是除在WO 98/15633中所公開的纖維素酶以外的其它酶。具有上面所提到的組合等電點和分子量的酶也包括在內。
本發明也涉及由本發明的突變(重組)菌株所(過量)產生的非蛋白質產物。這樣的非蛋白質產物包括基礎代謝產物如有機酸、氨基酸和次級代謝產物如抗生素,例如青霉素和頭孢菌素。這些產物是組合幾種生化途徑的結果,涉及一些目的真菌基因。真菌的基礎和次級代謝產物和在真菌中產生這些代謝產物的過程是本領域眾所周知的。MatteyM在有機酸的產生,現代生物技術評論12,87-132(1992)一文中描述了基礎代謝產物產生的例子。Penalva等在真菌中青霉素生物合成的優化,生物技術趨勢16,483-489(1998)一文中描述了次級代謝產物產生的例子。
在50微克/毫升時成功地選擇出了Sh ble(腐草霉素抗性)轉化的金孢子菌屬菌株。這也是用于T.reesei的選擇水平,因此表明在金孢子菌屬中可以很容易地達到差示選擇。150微克/毫升時,上面的討論同樣適用于帶有潮霉素抗性的轉化菌株。
在普遍使用的真菌轉化技術的基礎上原生質體轉化技術被用于金孢子菌屬真菌。在一個直徑為90毫米的PDA培養皿上所有的孢子被收獲到8毫升的IC1培養液中并轉移入帶有50毫升IC1培養液的搖瓶中,35℃、200轉/分鐘孵育15小時。然后對培養物離心,沉淀用MnP溶液洗滌,然后重懸于10毫升MnP和10毫克/毫升的C3Caylase的溶液中并于35℃振蕩(150轉/分鐘)孵育30分鐘。
過濾溶液,濾液3500轉/分鐘離心10分鐘。用10毫升的MnPCa2+溶液洗滌沉淀。然后于25℃再離心10分鐘后加入50微升冷PMC溶液。混合物置于冰浴30分鐘后加入2.5毫升PMC溶液。室溫15分鐘后,500微升處理的原生質體與3毫升MnR Soft混合并立即涂布于含有選擇因子腐草霉素或潮霉素的MnR培養皿上。30℃孵育5天后分析轉化體(48小時以后肉眼可見克隆),使用10微克pAN8-119參考質粒來測定轉化效率。結果見下表1。
表1轉化效率(使用10μg的參照質粒pAN8-1)
金孢子菌轉化體的存活力比木霉的好。所述菌株的轉化能力相當,因此在一個實驗中獲得的金孢子菌轉化體數目是T.reesei的4倍。因此金孢子菌轉化系統不僅比得上常用的T.reesei系統,而且比其更好。這種改良尤其可以用于比pAN8-1的轉化效力低的載體。這種低效力轉化載體例如是生產非真菌蛋白質的蛋白質載體,其一般產生少10倍的轉化體。
使用同源的金孢子菌蛋白質編碼序列和異源的蛋白質編碼序列構建了許多其它的轉化和表達載體,以用于用金孢子菌進行的轉化實驗中。
表達系統例如包括一個金孢子菌木聚糖酶Xyl1啟動子片段,其連接于木聚糖酶開放讀框框架中的一個木聚糖酶信號序列,后接一個木聚糖酶終止子序列。通過與一個選擇載體共轉染而選擇轉化體。
另一個實例是Chrysosporium lucknowense纖維二糖水解酶啟動子,其連接于青霉內切葡聚糖酶3開放讀框框架中青霉內切葡聚糖酶3信號序列,后接金孢子菌纖維二糖水解酶終止子序列。另外,這個載體攜帶另一個表達盒,其具有一個選擇標記,即乙酰胺酶S基因(AmdS基因)。
另一個實例包括金孢子菌甘油醛-3-磷酸脫氫酶1啟動子,其連接于黑曲霉葡糖淀粉酶信號序列和融合于人白細胞介素6開放讀框的葡糖淀粉酶開放讀框。另外,這個載體攜帶另一個表達盒,其具有一個選擇標記即AmdS基因。
再一個實例是構巢曲霉甘油醛-3-磷酸脫氫酶A啟動子,其連接于內切葡聚糖酶5開放讀框,后接一個構巢曲霉終止子序列。金孢子菌轉化體的異源和同源表達實施例對C1菌株(NG7C-19和/或UV18-25)分泌各種異源蛋白質的能力進行測試所述異源蛋白質是一種細菌蛋白質(Streptoalloteichushindustanus腐草霉素抗性蛋白,Sh ble),一種真菌蛋白質(Trichodermareesei木聚糖酶II,XYN2)和一種人體蛋白質(人溶菌酶HLZ)。C1分泌的Trichoderma reesei木聚糖酶II(XYN2)將C1菌株UV18-25用質粒pUT1064和pUT1065轉化。pUT1064具有以下兩種真菌表達盒第一種表達盒可以選擇腐草霉素抗性轉化體-Neurospora crassa交叉途徑控制基因1(cpc-1)啟動子14-Streptoalloteichus hindustanus腐草霉素抗性基因Sh ble4
-構巢曲霉色氨酸合酶(trpC)終止子5第二種表達盒是產生木聚糖酶的表達盒-T.reesei菌株TR2 cbh1啟動子15-T.reesei菌株TR2 xyn2基因(包括其信號序列)16-T.reesei菌株TR2 cbh1終止子15所述載體還攜帶來自質粒pUC196的一個大腸桿菌復制起點。所述質粒的詳圖見于
圖1。
pUT1065具有以下真菌表達盒-構巢曲霉甘油醛-3-磷酸脫氫酶(gpdA)啟動子2-合成的T.reesei纖維二糖水解酶I(cbh1)信號序列1,3-用作載體蛋白10的S.hindustanus腐草霉素抗性基因Sh ble4-一種接頭肽(SGERK),其特征在于一個類KEX2蛋白酶裂解位點1-T.reesei菌株TR2xyn2基因(沒有信號序列)16-構巢曲霉色氨酸合酶(trpC)終止子5所述載體還攜帶β-內酰胺酶基因(bla)和一個來自質粒pUC186的大腸桿菌復制起點。所述質粒的詳圖見于圖2。
將C1原生質體根據以上實施例中所述相同方法用質粒pUT1064或pUT1065C轉化。質粒pUT1065中的融合蛋白(Sh ble∷XYN2)具有腐草霉素抗性功能,因此易于選擇C1轉化體。另外,腐草霉素抗性水平與xyn2表達水平大致相關。在pUT1064中,xyn2是與其自身信號序列一起克隆的。
對C1轉化體(腐草霉素抗性克隆)產生的木聚糖酶通過以下木聚糖酶活性試驗進行分析將初級轉化體用牙簽挑至GS+腐草霉素(5ug/ml)平板上(確證抗性),并也置于XYLAN平板上(通過透明區觀測17檢測木聚糖酶活性)。將平板在32℃生長5天。將每個有效的克隆在XYLAN平板上亞克隆。將每個轉化體的兩個亞克隆用于接種PDA平板,以獲得孢子開始進行液體培養。將在IC1+5g/l鄰苯二甲酸鉀中的液體培養物在27℃生長5天(以180rpm振蕩)。然后,將培養物離心(5000g,10分鐘)。從這些樣品中,通過Miller等所述DNS方法測定木聚糖酶活性。
表2在C1(最佳生產菌)中活性XYN2的生產水平
這些數據示出1)實施例2中的1-4點得以證實。
2)C1可以用作分泌異源真菌蛋白的宿主。
實施例附錄培養基轉化培養基Mandels Base MnP培養基KH2PO42.0g/lMandels Base加上(NH4)2SO41.4g/l肽胨1g/lMgSO4·7H2O 0.3g/lMES 2g/lCaCl20.3g/l蔗糖100g/l少量元素 1.0ml/l 調整pH至5MnR MnP CA2+MnP+蔗糖 130g/lMnP培養基+
酵母提取物 2.5g/l CaCl2·2H2O 50mM葡萄糖 2.5g/l 調整pH至6.5瓊脂15g/lMnR Soft僅加7.5g/l瓊脂的MnRMPCCaCl250mM pH5.8MOPS 10mMPEG40%用于選擇和培養GS葡萄糖 10/glBiosoyase 5g/l[Merieux]瓊脂15g/l pH應為6.8PDA馬鈴薯右旋糖瓊脂 39g/l[Difco]pH應為5.5MPGMandels Base加上K.Phtalate 5g/l葡萄糖 30g/l酵母提取物 5g/l補加50μg/ml腐草霉素或100-150μg/ml潮霉素的再生培養基(MnR)用于選擇轉化體。補加5μg/ml腐草霉素的GS培養基用于證實抗生素抗性。
PDA是一種用于快速生長和良好形成孢子的完全培養基。用1/20的孢子懸浮液(來自一個90mm的PDA平板的所有孢子在5ml0.1%Tween中)接種液體培養基。將這種培養物在27℃在搖瓶中生長(200rpm)。C1基因和CBHI,XYLI和GPD基因表達序列的分離及定性構建UV18-25的BlueSTAR基因文庫將UV18-25的染色體DNA用Sau3A部分消化,分離12-15kb的片段,并連接于克隆載體BlueSTAR的一個BamHI位點中。對20%的連接混合物進行包裝,產生一個4.6×104個獨立克隆的基因文庫。將此文庫倍增,并貯存于4℃和-80℃。其它連接混合物也貯存于4℃。篩選UV18-25的基因文庫以分離cbh1,xyl1和gpd1基因為分離不同的基因,將每個探針以合計7.5×104個獨立BlueSTAR噬菌體雙份雜交。用cbh1和xyl1的PCR片段(如WO00/20555所述),在同源條件下(65℃;0.2×SSC)進行雜交,及用黑曲霉的gpd1基因在異源條件下(53℃;0.5×SSC)進行雜交。陽性信號的數目示于表3。將陽性克隆再篩選,并針對每個克隆使用兩種不同的噬菌體進行進一步實驗。將不同克隆的DNA通過限制分析加以分析,以確定分離自每個基因的不同克隆數目(結果示于表3)。針對這3種基因的每一種,分離4-6個不同克隆,我們推斷所述初級基因文庫(4-5×104個克隆)代表大約5倍的UV18-25基因組。從這個結果中,我們推斷UV18-25的完整基因組以9×103個克隆表示。基于13kb的平均基因組插入體,表明一個120Mb大小的基因組,其是曲霉基因組大小的3倍。
用針對所述質粒上存在的基因的特異性引物(基于預先從分離的PCR片段中確定的序列),和pBlueSTAR多接頭中存在的T7和T3引物進行PCR反應,我們能確定基因在眾多克隆中的位置。對于每個基因,使用一個質粒以確定所述基因的序列。表3用UV18-25的PCR片段篩選UV18-25基因文庫的7.5×104個噬菌體以獲得cbh1基因和xyl1基因(同源條件)和黑曲霉(A.niger)的gpdA基因(異源條件)。使用DNA分離和限制分析測定不同克隆的數目。
克隆的基因的序列分析針對cbh1,xyl1和gpd1基因,序列測定的結果分別示于SEQ IDNo1,3和5。推導的蛋白質氨基酸序列示于SEQ ID No2,4和6。所述蛋白質的一些性質見于表4。應提及的是翻譯起始位點和內含子的位置基于與來自相同家族的基因的同源性(即紙上遺傳學)而定。CBH1從CBH1的氨基酸序列中,我們推斷所述蛋白質的大小大約為63kDa,而且在所述蛋白質的C末端部分存在一個纖維素結合結構域(CBD)。令人感興趣地,在分離的55kD的主要蛋白質中未發現有存在CBD的跡象。然而,在所述編碼的CBH1蛋白(SEQ ID No.1,2)中存在來自這個55kD主要蛋白的分離的肽,證實所述55kD的蛋白質是由克隆的基因編碼的。對這些結果的一種可能的解釋是所述55kD的蛋白質是缺失CBD的CBH1蛋白的一種截短形式。
所述纖維二糖水解酶CBH1具有抗MUF-纖維二糖苷,MUF-乳糖苷,FP和微晶纖維素的活性,還具有抗對硝基苯基β-葡糖苷,纖維二糖和對硝基苯基乳糖苷的活性。其對于MUF纖維二糖苷的活性由纖維二糖抑制,抑制常數為0.4mM。對于MUF纖維二糖苷的Michaelis常數為0.14mM,對于MUF乳糖苷的Michaelis常數為4mM,對于CMC為3.6g/l。最適宜的pH為4.5-7。在pH8保持50%對于CMC的最大活性和80%對于RBB-CMC的活性。在pH5-8內在25小時溫育期間保持70-80%活性。最適宜的溫度是60-70℃。CBH1是纖維二糖水解酶7家族的一個成員。相應的CBH啟動子,是本發明的一個優選實施方案,示為SEQ ID No.1。Xyl1從Xyl1的氨基酸序列中,我們推斷在這個蛋白質的N末端也存在一個CBD(即直接附于信號序列或與其有少于5個氨基酸的間隔)。在文獻中,已知具有CBD的木聚糖酶很少(Fusariumoxysporum,Humicola grisea和Neocallimastix patriciarum)。估計Xyl1蛋白的大小為43kD,而且從源于這個蛋白質的一個30kD的木聚糖酶中分離到一些肽(SEQ ID No.3,4)。一些分離的肽在編碼序列中不能發現。這可以表明在UV 18-25中存在另一種木聚糖酶。在先前的分析中,未發現在此30kDa蛋白質中有存在CBD的跡象。從這些結果中,我們推測蛋白質的CBD通過蛋白酶解而裂解掉。對這個推測進行進一步分析(通過測定如下不同的C1菌株中不同蛋白質的活性,N末端序列和大小而分析C1野生型,NG7C,UV13-6,UV18-25和UV18-25的蛋白酶突變體)。CBD是否存在對酶活性的作用也進行更詳細分析。
可以考慮全長基因在各種C1宿主中的過表達情況。
存在一個纖維素結合結構域(CBD)是這種酶的一個特征。具有一個N末端CBD的唯一其它已知家族10糖酵解酶(木聚糖酶)是Fusarium oxysporum XylF。Chrysosporium lucknowense Xyl1蛋白的CBD具有以下序列WGQCG GQGWT GPTTC VSGAV CQFVNDWYSQ CV(SEQ ID No.4的22-53位氨基酸)。這個序列與美國專利5763254(Novo)所述CBD共有序列不一致。美國專利5763254的CBD共有序列是W/Y-G/A-Q-C-G G-Q/I/N-G/N-W/F/Y-S/T/N/QG-P/A/C-T/R/K-T/C/N-C X-X-G/P-S/T/F/L/A/--T/K C-V/T/R/E/K-K/Q/A-Q/I-N Q/D/A-W/F/Y-Y-Y/S/H/A-Q C-L/I/Q/V/T,其中W/Y意味著W或Y等,X意味著任何氨基酸,-意味著不存在氨基酸。在Xyl1中存在與最簡并共有序列的4處不同,在上述序列7中以下劃線表示。本發明因此涉及N末端CBD不同于這個共有的CBD且不同于Fusarium oxysporum木聚糖酶的木聚糖酶。更特別地,本發明的木聚糖酶的CBD與上述序列7具有至少55%,尤其至少65%,優選至少75%相同性。優選地,所述CBD在第23位含有氨基酸Phe,Tyr和Trp之一,或至少如下這四種氨基酸之一在第20位含有Val氨基酸、在第22位含有Gln,在第23位含有Phe,及在第24位含有Val。優選的序列包含Cys-Xaa-Phe,Xaa-Phe-Val,Cys-Xaa-Phe-Val,Cys-Gln-Phe,Val-Cys-Xaa-Phe,Gln-Phe-Val,Gln-Trp-Val,Gln-Tyr-Val,Val-Cys-Gln,Val-Cys-Gln-Phe,和Val-Cys-Xaa-Phe-Val,其中Xaa是任何氨基酸或優選是Val,Thr,Arg,Glu,Gln或Lys,或者最優選是Gln或Glu。
所述木聚糖酶不具有MUF纖維二糖酶活性,而且因此是一種真木聚糖酶。其在pH5-8的廣泛范圍內具有高度活性,在pH9-10保持65%的最大活性,其是木聚糖酶F家族的一個成員。相應的木聚糖酶啟動子,其是本發明的一個優選實施方案,示于SEQ ID No.3。對于樺樹木聚糖的Michaelis常數是4,對于30kD木聚糖酶為2g/l。最適溫度高,等于木聚糖酶的70℃。Gpd1gpd1基因的C末端部分的DNA序列未確定。這個基因的啟動子序列是本發明的一個優選實施方案,示于SEQ ID No.5。
通過Northern分析研究金孢子菌四種基因的表達水平。將C.lucknowense的各種菌株在33℃生長于含有藥基及纖維素和乳糖的豐富培養基(培養基1),或含有藥基和葡萄糖的豐富培養基(培養基2)中。在48小時后,收獲菌絲體并分離RNA。將所述RNA用4種不同的探針雜交EG5,EG6,Xyl1和CBH。在曝光后,將Northern印跡剝離,并用核糖體L3的探針再雜交,以對照印跡上mRNA的數量。在培養基1中,大多數菌株示出對CBH的極高應答,及對Xyl1的高度應答;在培養基2中,一半菌株示出對所有基因高度應答,另一半示出低應答。從這些數據中推導的表達強度順序是CBH>XylI>EG5>EG6。
C.lucknowense的蛋白質Xyl1與基因庫DATABASE中其最接近的同源物具有67%相同性(72%同源性)(表4)。CBH1蛋白與其相關的Humicola grisea同源物的的強同源性(74%相同性/82%同源性)值得注意。還應指出的是在所有情況中,最接近的同源物源自Fusarium,Humicola或其它核菌(Sordariamycetous)真菌(表4),而金孢子菌屬于NCBI數據庫中的不整子囊菌(Eurotiomycetous)真菌(表4)。因此本發明還涉及包含一個CBD的聚糖水解酶,尤其纖維二糖水解酶和木聚糖酶,所述CBD衍生自不整子囊菌真菌。
表4本發明的CBHI,Xyl1和GPD1的結構和對比數據
附圖描述圖1是pUT1064圖。
圖2是pUT1065圖。
參考文獻(其內容在此并入參考)1.Calmels T.P.,Martin F.,Durand H.和Tiraby G.(1991),在真菌中分泌蛋白質過程中的蛋白酶解情況,生物技術雜志17(1)p.51-66。
2.Punt P.J.,Dingemanse M.A.,Jacobs-Meijsing B.J.,Pouwels P.H.,和van den Hondel C.A.(1988),分離和定性Aspergillus nidulans的三磷酸甘油醛脫氫酶基因,基因69(1)p.49-57。
3.Shoemaker S.,Schweickart V.,Ladner M.,Gelfand D.,Kwok S.,Myambo K.,和Innis M.(1983),衍生自Trichoderma reesei菌株L27的外纖維二糖水解酶I的分子克隆,生物/技術10691-696。
4.Drocourt D.,Calmels T.,Reynes J.P.,Baron M.,和Tiraby G.(1990),轉化腐草霉素抗性低等和高等真核細胞的Streptoalloteichushindustanus ble基因的表達盒,核酸研究18(13)p.4009。
5.Mullaney E.J.,Hamer J.E.,Roberti K.A.,Yelton M.M.,和Timberlake W.E.(1985),來自Aspergillus nidulans的trpC基因的初級結構,分子基因遺傳199(1)p37-45。
6.Yanisch-Perron C.,Vieira J.,和Messing J.(1987),改良的M13噬菌體克隆載體和宿主菌株M13mp18和pUC19載體的核苷酸序列,基因33103-119。
7.Durand H.,Baron M.,Calmels T.,和Tiraby G.(1988),應用于Trichoderma reesei的傳統和分子遺傳學以選擇改良的分解纖維素的工業菌株,纖維素酶降解的生物化學和遺傳學,J.P.Aubert編輯,學術出版社,p135-151。
8.Lowry O.H.,Rosebrough N.J.,Farr A.L.,and Randall R.J.(1951),用thefolin苯酚試劑測定蛋白質,生物化學雜志193265-275。
9.Parriche M.,Bousson J.C.,Baron M.,and Tiraby G.,在絲狀真菌中產生異源蛋白質分泌系統,第三版,歐洲真菌遺傳學會議,1996.Miinster,德國。
10.Baron M.,Tiraby G.,Calmels T.,Parriche M.,和Durand H.(1992),通過Tolypocladium geodes真菌融合于Sh ble腐草霉素抗性蛋白的人溶菌酶的有效分泌,生物技術雜志24(3)p253-266。
11.Jeenes D.J.,Marczinke B.,MacKenzie D.A.,和Archer D.B.(1993),從黑曲霉中分泌異源蛋白質的一種截短的葡糖淀粉酶基因,FEMS微生物學通信107(2-3)p.267-271。
12.Stone P.J.,Makoff A.J.,Parish J.H.,和Radford A.(1993),neurospora-crassa葡糖淀粉酶基因的克隆和序列分析,現代遺傳學24(3)p.205-211。
13.Morsky P.(1983),用微球菌lysodeikticus細胞對溶菌酶進行濁度測定反應條件的復試,分析生物化學12877-85。
14.Paluh J.L.,Orbach M.J.,Legerton T.L.,和Yanofsky C.(1988),Neurospora crassa的交叉途徑控制基因cpc-1,其編碼類似于酵母GCN4的蛋白質和致癌基因v jun編碼的蛋白質的DNA結合結構域,美國科學院院報85(11)p3728-32。
15.Nakari T.,Onnela M.L.,Ilmen M.,Nevalainen K.,和Penttil M.(1994),在存在葡萄糖的情況下激活的真菌啟動子,WO 94/04673,Alko。
16.Torronen A.,Mach R.L.,Messner R.,Gonzalez R.,KalkkinenN.,Harkki A.,和Kubicek C.P.(1992),來自Trichoderma reesei的兩種主要的木聚糖酶對這兩種酶和基因的定性,生物技術(NY)10(11)p1461-5。
17.Farkas V.(1985),檢測生產纖維素酶和木聚糖酶的微生物的新培養基,FEMS微生物學通信28137-140。
18.Miller G.L.(1959),使用二硝基水楊酸試劑測定還原糖,分析化學31426-428。
19.Punt P.J.,Mattem I.E.,van den Hondel C.A.M.J.J.(1988),授予腐草霉素抗性的曲霉菌轉化載體,真菌遺傳學時事通訊35,25-30。
序列表SEQ ID No.1包括啟動子和終止子序列的完整金孢子菌CBH1基因的DNA序列和氨基酸序列。啟動子序列(1-1779),終止子序列(3427-4451)和內含子序列(2179-2256)以小寫字母示出。aaggtatccgatttggggaacgtcgatgaaagtattgcaaaagtgacgagagttgcgcaa 60ctaactcgctgccgaagaagctgcggaagaaagagaacaccgaaagtggaataacgttac 120ggatgtcctgacctcaaagttgaaaccagcccttcctgctctatttgggaaagcggcttg 180cccttgaatgcgctgcactgtggcacgactaccagtgatcgggaggagcaaactaccctg 240gtccgttccttggtggggcggcactaggcccaacttagggtgatcggaggtcgatgccgc 300ggtcctcgttggtctgggctcttctcatttcccggtttgcaccccccgttgcacctgctg 360atcgcccgccaacgccgatgaggttgcgcccagaccgacaatcaccgcggctgcattccc 420aagtatattgaagatggcaccaggtacccggttttgcgtcccagtcgtttggtgccaaat 480ttgggagtttttgagcctcaagatctggggaaatcgacctcaacttccatacaagttaaa 540gtcgcacacacggcgagttccacgaagagacacatttttttctgaaggcctctctccccg 600cacatcagaaaccaccaaataccaagactgcagaagccggggtaagtgggccaccgggac 660tacactaaaatgcggggagaagcgagatccgttgcgaagggaagggatggggtgtgctgc 720ggctttctccgctctcgtgcgccttttgcttgaatctagtgtacaccagggtaggctccg 780aaggagtatctacggcagcgctgttcgtgctgcgttgagagtcagggcggagacgagcag 840gcgacaggagcctcgcaccggcacttcggatcgcatttgcgcggagcgtcaaatacgctc 900ttctgcggtcatcagagagcatcgtgaaccaaggttcttccgcagggcggcctgggcttc 960gcagagtcgcactcggcggacgccttccgtgtcacccctgataacctggctgccgcgccc 1020agactcctccaatgaggtgtgtggttgccctcgccgacccttcagcaaccttaatcgctt 1080ccatcgcacggctccacgtcctcgaacgatgccctcagtccgtgcccggccgtggcaacc 1140ataacgtgacatcgccgcccagcctactagccgctatcgaccggttaggcttgtcaccgc 1200agcgcccattctccatcgggcctctactctgatccacctcacccaccgcaagcactagcg 1260agcctcaccagagtgcaagcgacacgacccgcttggcccttcgtccttgactatctccca 1320gacctcttgccatcttgccgacgccgcccccttttttttctcctccccctgccggcaggt 1380cggtggccccagtcccgagatggcattgctccgttgtccatgacgacccatcattcgatg 1140gctgactggcacactcgtcttgtttgagcatcgacggcccgcggcccgtctcccacggta 1500cggaacctcgttgtacagtacctctcgtaatgatacccaacaccggggccgagcgctggg 1560agggcggcgttcccgagaagccgggaaggcggctggccggctgacctttgtgacttggcg 1620atggatgcggccatggagaatgtccgtccgaagcgacgcgacaattagcctggctaccat 1680cgatataaattgggtgattcccagctcttgatgggcgtgtcttctgcctggcagccctcg 1740tcttcagatcaagcaactgtgtgctgatcctcttccgccATGTACGCCAAGTTCGCGACC 1800M Y A K F A TCTCGCCGCCCTTGTGGCTGGCGCCGCTGCTCAGAACGCCTGCACTCTGACCGCTGAGAAC 1860L A A L V A G A A A Q N A C T L T A E NCACCCCTCGCTGACGTGGTCCAAGTGCACGTCTGGCGGCAGCTGCACCAGCGTCCAGGGT 1920H P S L T W S K C T S G G S C T S V Q GTCCATCACCATCGACGCCAACTGGCGGTGGACTCACCGGACCGATAGCGCCACCAACTGC 1980S I T I D A N W R W T H R T D S A T N CTACGAGGGCAACAAGTGGGATACTTCGTACTGCAGCGATGGTCCTTCTTGCGCCTCCAAG 2040Y E G N K W D T S Y C S D G P S C A S KTGCTGCATCGACGGCGCTGACTACTCGAGCACCTATGGCATCACCACGAGCGGTAACTCC 2100C C I D G A D Y S S T Y G I T T S G N SCTGAACCTCAAGTTCGTCACCAAGGGCCAGTACTCGACCAACATCGGCTCGCGTACCTAC 2160L N L K F V T K G Q Y S T N I G S R T YCTGATGGAGAGCGACACCAAGTACCAGAgtaagttcctctcgcacccggccgccgggaga 2220L M E S D T K Y Q MtgatggcgcccagcccgctgacgcgaatgacacaGTGTTCCAGCTCCTCGGCAACGAGTT 2280F Q L L G N E FCACCTTCGATGTCGACGTCTCCAACCTCGGCTGCGGCCTCAATGGCGCCCTCTACTTCGT 2340T F D V D V S N L G C G L N G A L Y F VGTCCATGGATGCCGATGGTGGCATGTCCAAGTACTCGGGCAACAAGGCAGGTGCCAAGTA 2400S M D A D G G M S K Y S G N K A G A K YCGGTACCGGCTACTGTGATTCTCAGTGCCCCCGCGACCTCAAGTTCATCAACGGCGAGGC 2460G T G Y C D S Q C P R D L K F I N G E ACAACGTAGAGAACTGGCAGAGCTCGACCAACGATGCCAACGCCGGCACGGGCAAGTACGG 2520N V E N W Q S S T N D A N A G T G K Y GCAGCTGCTGCTCCGAGATGGACGTCTGGGAGGCCAACAACATGGCCGCCGCCTTCACTCC 2580S C C S E M D V W E A N N M A A A F T PCCACCCTTGCACCGTGATCGGCCAGTCGCGCTGCGAGGGCGACTCGTGCGGCGGTACCTA 2640H P C W V I G Q S R C E G D S C G G T YCAGCACCGACCGCTATGCCGGCATCTGCGACCCCGACGGATGCGACTTCAACTCGTACCG 2700S T D R Y A G I C D P D G C D F N S Y RCCAGGGCAACAAGACCTTCTACGGCAAGGGCATGACGGTCGACACGACCAAGAAGATCAC 2760Q G N K T F Y G K G M T V D T T K K I TGGTCGTCACCCAGTTCCTCAAGAACTCGGCCGGCGAGCTCTCCGAGATCAAGCGGTTCTA 2820V V T Q F L K N S A G E L S E I K R F YCGTCCAGAACGGCAAGGTCATCCCCAACTCCGAGTCCACCATCCCGGGCGTCGAGGGCAA 2880V Q N G K V I P N S E S T I P G V E G NCTCCATCACCCAGGACTGGTGCGACCGCCAGAAGGCCGCCTTCGGCGACGTGACCGACTT 2940S I T Q D W C D R Q K A A F G D V T D ?NCAGGACAAGGGCGGCATGGTCCAGATGGGCAAGGCCCTCGCGGGGCCCATGGTCCTCGT 3000Q D K G G M V Q M G K A L A G P M V L VCATGTCCATCTGGGACGACCACGCCGTCAACATGCTCTGGCTCGACTCCACCTGGCCCAT 3060M S I W D D H A V N M L W L D S T W P ICGACGGCGCCGGCAAGCCGGGCGCCGAGCGCGGTGCCTGCCCCACCACCTCGGGCGTCCC 3120D G A G K P G A E R G A C P T T S G V PCGCTGAGGTCGAGGCCGAGGCCCCCAACTCCAACGTCATCTTCTCCAACATCCGCTTCGG 3180A E V E A E A P N S N V I F S N I R F GCCCCATCGGCTCCACCGTCTCCGGCCTGCCCGACGGCGGCAGCGGCAACCCCAACCCGCC 3240P I G S T V S G L P D G G S G N P N P PCGTCAGCTCGTCCACCCCGGTCCCCTCCTCGTCCACCACATCCTCCGGTTCCTCCGGCCC 3300V S S S T P V P S S S T T S S G S S G PGACTGGCGGCACGGGTGTCGCTAAGCACTATGAGCAATGCGGAGGAATCGGGTTCACTGG 3360T G G T G V A K H Y E Q C G G I G F T GCCCTACCCAGTGCGAGAGCCCCTACACTTGCACCAAGCTGAATGACTGGTACTCGCAGTG 3420P T Q C E S P Y T C T K L N D W Y S Q CCCTGTAAacgaacctctctgaaggaggttctgagacacgcgcgattcttctgtatatagt 3480L *tttatttttcactctggagtgcttcgctccaccagtacataaaccttttttttcacgtaa 3540caaaatggcttcttttcagaccatgtgaaccatcttgatgccttgacctcttcagttctc 3600actttaacgtagttcgcgttagtctgtatgtcccagttgcatgtagttgagataaatacc 3660cctggaagtgggtctgggcctttgtgggacggagccctctttctgtggtctggagagccc 3720gctctctaccgcctaccttcttaccacagtacactactcacacattgctgaactgaccca 3780tcataccgtactttatcctgttaattcgtggtgctgtcgactattctatttgctcaaatg 3840gagagcacattcatcggcgcagggatacacggtttatggaccccaagagtgtaaggacta 3900ttattagtaatattatatgcctctaggcgccttaacttcaacaggcgagcactactaatc 3960aacttttggtagacccaattacaaacgaccatacgtgccggaaattttgggattccgtcc 4020gctctccccaaccaagctagaagaggcaacgaacagccaatcccggtgctaattaaatta 4080tatggttcattttttttaaaaaaattttttcttcccattttcctctcgcttttctttttc 4140gcatcgtagttgatcaaagtccaagtcaagcgagctatttgtgctatagctcggtggcta 4200taatcagtacagcttagagaggctgtaaaggtatgataccacagcagtattcgcgctata 4260agcggcactcctagactaattgttacggtctacagaagtaggtaataaaagcgttaattg 4320ttctaaatactagaggcacttagagaagctatctaaatatatattgaccctagcttatta 4380tccctattagtaagttagttagctctaacctatagatagccaaatgctataataggtacc 4440agggttcaaaa 4451SEQ ID No2完整金孢子菌CBH1蛋白的氨基酸序列。推定的信號肽(1-19)以斜體字示出,纖維素結合結構域(496-526)以粗體下劃線示出。
CTLTAENHPS LTWSKCTSGG SCTSVQGSIT 50IDANWRWTHR TDSATNCYEG NKWDTSYCSD GPSCASKCCI DGADYSSTYG 100ITTSGNSLNL KFVTKGQYST NIGSRTYLME SDTKYQMFQL LGNEFTFDVD 150VSNLGCGLNG ALYFVSMDAD GGMSKYSGNK AGAKYGTGYC DSQCPRDLKF 200INGEANVENW QSSTNDANAG TGKYGSCCSE MDVWEANNMA AAFTPHPC?V 250IGQSRCEGDS CGGTYSTDRY AGICDPDGCD FNSYRQGNKT FYGKGMTVDT 300TKKITVVTQF LKNSAGELSE IKRFYVQNGK VIPNSESTIP GVEGNSITQD 350WCDRQKAAFG DVTD?QDKGG MVQMGKALAG PMVLVMSIWD DHAVNMLWLD 400STWPIDGAGK PGAERGACPT TSGVPAEVEA EAPNSNVIFS NIRFGPIGST 450VSGLPDGGSG NPNPPVSSST PVPSSSTTSS GSSGPTGGTG VAKHY 500 * 526SEQ ID No.3包括啟動子和終止子序列的完整金孢子菌Xyl1基因的DNA序列。啟動子序列(1-969),終止子序列(2428-3030(3028))和內含子序列(1043-1116,1181-1332(1331),1596(1595)-1674(1672))以小寫字母示出。tcatcaacttggcgtttggatgtactaatattacacgtcgtttgcnnagcggagtctgtg 60tcatctccgtggggtcgggtgctccagacgacgcttcgggccgatcctgaattcgggaag 120gaaacggttcggctaatcaggtcctctaaaatataacgaagcactacagagggagttcct 180cagaggacatcgtatcaaccgaagaacgaagcgccgaaaggactgatcaaaacaggagta 240ggtagggatgtgtgagtacctaaactttccatacctgacataaaatcatcatggtgcttc 300agacctgtttgatgaggcgagggcggaggccgcattgtattttcgttccttccttctttt 360tgttagtatatctnagggttccatcgtaaaatggaatcttccagctctactagtaattag 420aacaatagttctgatgtcgtgcgccaagctttttcagatgactgccaaaaacccatcatg 480ggtatggacaaaagcagtaatcggagtcacaacgccgcattttccttcatgatttccgtc 540aaccggagaggtcggaggaggactccggccacatgtgatgcgaagaagtacatggcgcca 600tggttctaacctcttatagtctgaaaatgcgcggaggccagcgaagccaagcccgggaac 660cgttcttgtcatggtttcagtattgtttcgctaaacattctatccgattcgcgataggtg 720cggctgccaccgaaggttgtatccttaaagctttggtaagtacggagtacggaaatggaa 780acgcgccgcagtcctggttccatcggtatcctccgcatgctccgccaaaaaaagaaaacc 840cgggtatgtttacaaaggatataagagacaagatgcaccacccgcccccttcccatctgc 900cggttgcccacgtcgccgtcgactgcttgtccgcttcctacctgcagcctctttcagaga 960ccatcaaacATGCGTACTCTTACGTTCGTGCTGGCAGCCGCCCCGGTGGCTGTGCTTGCC 1020M R T L T F V L A A A P V A V L ACAATCTCCTCTGTGGGGCCAGTgtatgtaattgccttactcggaaaatagtcaccactag 1080Q S P L W G Q CagggacttaagctcactacttcctgtttcacaatagGCGGCGGTCAAGGCTGGACAGGTC 1140G G Q G W T GCCACGACCTGCGTTTCtGGCGCAGTATGCCAATTCGTCAAgtcagtaactgcttttatt 1200P T T C V S G A V C Q F V Ntctttcctctctgggattacgatttcgttttgcacttagcttggttctgcatttcattgt 1260tgtattgttctctttttgtgtgtgagaggttttattaccacctaaaggccatttgctaac 1320aaatctccccagTGACTGGTACTCCCAATGCGTGCCCGGATCGAGCAACCCTCCTACGGG 1380D W Y S Q C V P G S S N P P T GCACCACCAGCAGCACCACTGGAAGCACCCCGGCTCCTACTGGCGGCGGCGGCAGCGGAAC 1440T T S S T T G S T P A P T G G G G S G TCGGCCTCCACGACAAATTCAAGGCCAAGGGCAAGCTCTACTTCGGAACCGAGATCGATCA 1500G L H D K F K A K G K L Y F G T E I D HCTACCATCTCAACAACAATGCCTTGACCAACATTGTCAAGAAAGACTTTGGTCAAGTCAC 1560Y H L N N N A L T N I V K K D F G Q V TTCACGAGAACAGCTTGAAGTGGGATGCTACTGAGCgtgagtgacctctcctccttctccc 1620H E N S L K W D A T E PgacaataatagataattacgagccggttcgaggctgacattgcgcgattctagCGAGCC 1680S RGCAATCAATTCAACTTTGCCAACGCCGACGCGGTTGTCAACTTTGCCCAGGCCAACGGCA 1740N Q F N F A N A D A V V N F A Q A N G KAGCTCATCCGCGGCCACACCCTCCTCTGGCACTCTCAGCTGCCGCAGTGGGTGCAGAACA 1800L I R G H T L L W H S Q L P Q W V Q N ITCAACGACCGCAACACCTTGACCCAGGTCATCGAGAACCACGTCACCACCCTTGTCACTC 1860N D R N T L T Q V I E N H V T T L V T RGCTACAAGGGCAAGATCCTCCACTGGGACGTCGTTAACGAGATCTTTGCCGAGGACGGCT 1920Y K G K I L H W D V V N E I F A E D G SCGCTCCGCGACAGCGTCTTCAGCCGCGTCCTCGGCGAGGACTTTGTCGGCATCGCCTTCC 1980L R D S V F S R V L G E D F V G I A F RGCGCCGCCCGCGCCGCCGATCCCAACGCCAAGCTCTACATCAACGACTACAACCTCGACA 2040A A R A A D P N A K L Y I N D Y N L D ITTGCCAACTACGCCAAGGTGACCCGGGGCATGGTCGAGAAGGTCAACAAGTGGATCGCCC 2100A N Y A K V T R G M V E K V N K W I A QAGGGCATCCCGATCGACGGCATCGGCACCCAGTGCCACCTGGCCGGGCCCGGCGGGTGGA 2160G I P I D G I G T Q C H L A G P G G W NACACGGCCGCCGGCGTCCCCGACGCCCTCAAGGCCCTCGCCGCGGCCAACGTCAAGGAGA 2220T A A G V P D A L K A L A A A N V K E ITCGCCATCACCGAGCTCGACATCGCCGGCGCCTCCGCCAACGACTACCTCACCGTCATGA 2280A I T E L D I A G A S A N D Y L T V M NACGCCTGCCTCCAGGTCTCCAAGTGCGTCGGCATCACCGTCTGGGGCGTCTCTGACAAGG 2340A C L Q V S K C V G I T V W G V S D K DACAGCTGGAGGTCGAGCAGCAACCCGCTCCTCTTCGACAGCAACTACCAGCCAAAGGCGG 2400S W R S S S N P L L F D S N Y Q P K A ACATACAATGCTCTGATTAATGCCTTGTAAgaggaggtatattatttttagaggcaatgaa 2460Y N A L I N A L *gctaggaggaaagaggggaagtgaggtaattagctaggacaggcaaatctagcagcaatt 2520ataagtcaacactatataaaatattcctataatggcttgtgcttcggtgtgcaaaaaaaa 2580aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaactcaaaaacaaaaatgatccaacatgatt 2640cgaaatggcgaccttgcaaatgcacacctcagataataccactatacaatacaccttaaa 2700tggcacctaaatccatttgtctgcggtcatagacggggcttaagaagcctgggatgcagg 2760tgtcgatgcaagggttacgtcagtgtatgatatgagtatgaaccatgctgtctgggtaat 2820tctccactttccctccccttacgactcttcgggtgtgcctctctagaaagtcgactcctg 2880gcgcctcagatcgccctttggctctgttcggtacaatgacgtccgctggtttcttccaaa 2940gaccaggtatttctcccgtggcaacaaagaataccaaatacctatatcgaaccgtagtct 3000tctgataattagatgtctctcaaggcgcgg 3030SEQ ID No.4完整金孢子菌Xyl1蛋白的氨基酸序列。信號肽(1-20)以斜體字示出,纖維素結合結構域(22-53)以粗體下劃線示出。151 PGSSNPP TGTTSSTTGS TPAPTGGGGS GTGLHDKFKA KGKLYFGTEI101 DHYHLNNNAL TNIVKKDFGQ VTENSLKWDA TEPSRNQFNF ANADAVVNFA151 QANGKLIRGH TLLWHSQLPQ WVQNINDRNT LTQVIENHVT TLVTRYKGKI201 LHWDVVNEIF AEDGSLRDSV FSRVLGEDFV GIAFRAARAA DPNAKLYIND251 YNLDIANYAK VTRGMVEKVN KWIAQGIPID GIGTQCHLAG PGGWNTAAGV301 PDALKALAAA NVKEIAITEL DIAGASANDY LTVMNACLQV SKCVGITVWG351 VSDKDSWRSS SNPLLFDSNY QPKAAYNALI NAL*SEQ ID No5包括啟動子序列的部分金孢子菌GPD1基因的DNA序列。啟動子序列(1-1555)和內含子序列(1682-1781)以小寫字母示出。基因的3′末端未示出。tgagcagcaatgagcagcaatgagcattcctgggccaccgagtctgagtgccagtacgga 60gtatcgtacttcgtaccggggtttgatttggtgacggtgcttttcacctctcgatgcccg 120aaatcgggtctaagctgagtttgatcaaatatgtgactccaacatcgcccccttcggcaa 180accccgtcgacacgtgtgtcatccttccattgcaagcgatcactcgcagggcgtgacgat 240gaacgagatttttgcccggaccgattcgcggatatagcggcagccgaccagccctaccac 300actgatggccgtgtcactagtgtatgctcccagaaccgcaagcatacactgggcaatgct 360tggtatgcagttgaggcagctttatgtttccatacccttccacttcggctcggggactcg 420gcggggtcgcggaagtttgacggcagccgtcgggccttaggccgagattaccgtggttgt 480ggcccagttttagccgttcccgtccgtttcctaccggaccatgattttcgtgaaccattg 540caatcccgaagcgcatttccgacgttaaggagttacctccgctgcccagaattcatgatc 600gtggccggctcaaggcagcgtggcggggcatccgtgtcaagctcccaggaggaggtgcgc 660gatttcaaatccgggccaaaacaggccaagactggctggccaaaaaaaggagcgtagacg 720gcccgggacatcggacgtcagctcgcagccacccaaaaccggtccgatctactcgcttac 780tgtggtagttcaggtacttttgagtagtaaaaacgctacggcagggccggggggttcccc 840ggtgacggaggtgcctctgcggtggcgaacatcccacgcactctcgagctacggtgacac 900ctcgtgtcctgttggtcttgcaatgctggggcggcaggaaatgcgtcgcgctcctcccgg 960ccaagacctaaaacagacagcgccgcaaagtcgctcactagcaccgcgaaacgaagatgc 1020cccacctcaacgcaatctgtgatgcaagcaattgggaaggctcaccccacctcagcgagg 1080ggctcaaccatttttattatcagctcatgccaccacaacatgactgttttctttccttgc 1140tcatcccacatttgacaaaaatcgtcgattaatctctttccatacaggccgtccgcgctc 1200tgataaccacataaaagtctcttcagtcaacagctcaaagctccctcatccctccaggta 1260agcagccaaagagctcccccacggaccccgcactgcctcatcccgcctgtatcggacctg 1320cgcgacccagcagagaatcccaaacctttgctgcttgctgcccggttccggactgagctg 1380caacccaagcctttaaaaagcttttcccttctcccacggtgtcaactctgtcctatccct 1440ccgacatccgttgagctcaacaactccccgaaccttttaccccgcgccgagctacccctc 1500catcaaaccaccctgacagctcgctcactcacctccccacatcacagaaatcaaaATGAC 1560M T -TATCAAGGTCGGCATCAACGGTTTCGGCCGTATCGGCCGTATCGTCTTCCGCAACTCCAT 1620I K V G I N G F G R I G R I V F R N S I -CGAGCACTCGGATGTCGAGATCGTTGCCGTCAACGACCCCTTCATTGAGCCCAAGTACGC 1680E H S -D V E I V A V N D P F I E P K Y A -Tgtaagtagttttttttttccttcctcgcgttctttcctgttccatcgacagtacgagat 1740GatcttgcaggcggatcggagctaaccgcgattgtcgtacagGAGTACATGCTCAAGTAT 1800E Y M L K Y -GACTCGACCCACGGTATCTTCAACGGCACCATCGCCGTCGAGGGCAACGACCTCATTGTC 1860D S T H G I F N G T I A V E G N D L I V -AACGGCAAGAGGGTCAAGTTCTACACTGAGCGGGMCCCCGCCAACATTCCCTGGARGGAA 1920N G K R V K F Y T E R ? P A N I P W ? E -ACTGGTGCCGAGTACATMRTCGAGTCGACCGGTGTGTTCACCAMCACCSAGAAGGCTAGC 1980T G A E Y I ? E S T G V F T ? T ? K A S -GCCCACCTCAAGGGCGGCGCCAAGCGCGTCATCATCTCTGCTCCCTCGGCCGATGCCCCC 2040A H L K G G A K R V I I S A P S A D A P -ATGTACGTCATGGGCGTCAACGAGAAGACCTACGACGGCAAGGCCCAGGTCATCTCTAAC 2100M Y V M G V N E K T Y D G K A Q V I S N -GCCTCGTGCACCACCAACTGCCTGGCTCCCCTCGCCAAGGTCATCCACGACAAGTTCGGC 2160A S C T T N C L A P L A K V I H D K F G -CTCGTTGAGGGTCTCATGACCACCGTCCACTCCTACACTGCCACCCAGAAGACCGTCGAT 2220L V E G L M T T V H S Y T A T Q K T V D -GGTCCCTCTGCCAAGGACTGGCGTGGTGGCCGTGGTGCTGCTCAGAACATCATCCCCAGC 2280G P S A K D W R G G R G A A Q N I I P S -AGCACTGGCGCCGCCAAGGCCGTCGGCAAGGTCATCCCTGAGCTCAACGGCAAGCTCACC 2340S T G A A K A V G K V I P E L N G K L T -GGCATGTCCCTCCGTGTCCCCACCCCCAACGTTTCCGTTGTCGACCTCACCTGCCGCCTC 2400G M S L R V P T P N V S V V D L T C R L -GAGAAGGAGGCTACCTACGACGACATCAAGGCCGCCATCAAGGAGGCCGCCGCCGGCCCC 2460E K E A T Y D D I K A A I K E A A A G P -CTCAAGGgtgagttatctggttcctttttttttttttggagaacgacacatgctgataaa 2520L K GacccagGCATCCTCGACTACACTGAGG 2547I L D Y T ESEQ ID No.6部分金孢子菌GPD1蛋白的氨基酸序列(在該序列中沒有C末端)。MTIKVGINGF GRIGRIVFRN SIEHSDVEIV AVNDPFIEPK YAEYMLKYDSTHGIFNGTIA VEGNDLIVNG KRVKFYTER? PANIPW?ETG AEYI?ESTGVFT?T?KASAH LKGGAKRVII SAPSADAPMY VMGVNEKTYD GKAQVISNASCTTNCLAPLA KVIHDKFGLV EGLMTTVHSY TATQKTVDGP SAKDWRGGRGAAQNIIPSST GAAKAVGKVI PELNGKLTGM SLRVPTPNVS VVDLTCRLEKEATYDDIKAA IKEAAAGPLK GILDYTE
權利要求
1.一種與SEQ ID NO2的氨基酸序列呈現至少75%氨基酸相同性(通過BLAST序列對比測定)的相應于金孢子菌糖基水解酶家族7的蛋白質,或其具有至少20個連續氨基酸的一部分,所述至少20個連續氨基酸與SEQ ID No2的1-246或394-526位氨基酸序列的相應部分相同。
2.一種與SEQ ID NO4的氨基酸序列呈現至少70%氨基酸相同性(通過BLAST序列對比測定)的相應于金孢子菌糖基水解酶家族10的蛋白質,或其具有至少20個連續氨基酸的一部分,所述至少20個連續氨基酸與SEQ ID No4的1-133或252-383位氨基酸序列的相應部分相同。
3.一種與SEQ ID NO4的氨基酸序列呈現至少65%氨基酸相同性(通過BLAST序列對比測定)的相應于金孢子菌糖基水解酶家族10的蛋白質,或其具有至少20個連續氨基酸的一部分,所述至少20個連續氨基酸與SEQ ID No4的1-383位氨基酸序列的相應部分相同。
4.一種蛋白質,其相應于金孢子菌糖基水解酶家族10,并包含一個纖維素結合結構域,所述結構域與SEQ ID NO4的22-53位氨基酸序列具有至少55%的氨基酸相同性,和/或具有來自SEQ ID NO4的22-53位氨基酸序列的至少20個連續氨基酸,和/或在相關的第44位具有氨基酸F,W和Y之一。
5.一種與SEQ ID NO6的部分氨基酸序列呈現至少86%氨基酸相同性(通過BLAST序列對比測定)的相應于金孢子菌磷酸甘油醛脫氫酶的蛋白質,或其具有至少20個連續氨基酸的一部分,所述至少20個連續氨基酸與SEQ ID No6的1-277位氨基酸序列的相應部分相同。
6.一種水解β-糖苷鍵的方法,包括使用權利要求1的酶。
7.一種水解β-木糖苷鍵的方法,包括使用權利要求2,3或4的酶。
8.一種編碼權利要求1-5任一項的蛋白質的核酸序列。
9.一種核酸序列,其包含SEQ ID NO1,3和5任一個核酸序列的5’非編碼區中的至少70%的核苷酸。
10.一種核酸構建體,其包含一個衍生自金孢子菌的包含于SEQID NO1,3和5任一個核酸序列的5’非編碼區中的核酸表達調節區域,該區域可操作地連接于編碼感興趣多肽的核酸序列。
11.一種重組的微生物菌株,優選真菌菌株,其含有權利要求8-10任一項的核酸序列,并能表達由所述編碼核酸序列編碼的多肽。
12.一種使用權利要求10的構建體或權利要求11的微生物菌株生產多肽的方法。
13.一種寡核苷酸探針,其包含SEQ ID NO1,3,和5任一個核酸序列或其互補序列的至少15個連續核苷酸。
14.權利要求13的寡核苷酸探針,其中所述探針長度為20-50個核苷酸。
15.權利要求13或14的寡核苷酸探針,其中所述探針是用檢測標記而標記的。
全文摘要
本發明涉及相應于金孢子菌糖基水解酶家族7和10的新蛋白質,它們與SEQ ID NO2和4的氨基酸序列分別呈70%和75%的最小氨基酸相同性,以及涉及相應于金孢子菌磷酸甘油醛脫氫酶的蛋白質,其與SEQ ID NO6所示的部分氨基酸序列呈至少86%的氨基酸相同性。本發明還涉及編碼這些蛋白質的核酸序列,特別是調節相應基因表達的啟動子序列。用于表達這些基因的優選宿主是真菌,特別是金孢子菌菌株。
文檔編號C12Q1/68GK1436242SQ01811068
公開日2003年8月13日 申請日期2001年4月17日 優先權日2000年4月13日
發明者馬克·阿龍·埃馬爾法爾布, 彼德·揚·蓬特, 科爾內利婭·瑪麗亞, 約翰娜·范澤爾 申請人:馬克·阿龍·埃馬爾法爾布