專利名稱:絲狀真菌中dna表達文庫的高通量篩選的制作方法
發明概述本發明提供了一種在絲狀真菌宿主中表達和后繼篩選DNA文庫,尤其是合成文庫、基因組文庫和cDNA文庫的方法。該系統采用轉化或轉染的絲狀真菌,這些真菌在深層培養中通過諸如有效的孢子形成等途徑產生可轉移的復制單元。這些真菌優選表現這樣一種形態,即很少或不形成糾纏的菌絲體。其中更為優選的菌株還能表達可分離量的外源蛋白,用于評測。本發明的突變的真菌菌株由于產生可轉移的復制單元、可高水平的表達外源基因、以及非常低的培養粘度,因此它們非常適合高通量的篩選技術。
背景技術:
天然微生物種群表現廣泛的生化和代謝多樣性。由于許多微生物的分離和培養非常困難,這些微生物中大量有潛在價值的蛋白質和多肽不能被發現。事實上,據估計目前全世界只有不到1%的微生物被分離和培養。發明新的方法從未被認知乃至已被分離的微生物中分離蛋白質、多肽和代謝物仍然是一個迫切的需求。(術語“蛋白質”在后面的文章中應被理解為包括蛋白質和多肽。)鑒定和分離編碼這些蛋白質的基因,從而能修飾和/或生產這些蛋白質也是人們所需要的。
Short在美國專利5938672、6001574、6030779和6057103(它們的內容通過參考合并到本發明中)中闡述了解決這一問題的一個途徑。在該方法中,他們直接從環境樣品(如土樣)中制備了基因組DNA文庫,而沒有試圖從中分離或培養任何可能存在的生物。該文庫在大腸桿菌中被表達,并從獲得資源甚至純粹興趣的角度篩選表達的蛋白。Short暗示,但沒有明確論述或肯定在該方法中使用了真菌宿主細胞。
上述方法有許多重大缺陷,其中之一就是大腸桿菌不能有效地表達有內含子的基因。土壤中大約90%的物種是真核生物(主要是真菌),因此其中大部分生物的基因組DNA中有內含子。雖然已經發現的真菌有大約10萬種,但是估計大約有100萬種真菌仍未被發現(B.Kendrick,《第五界》,Mycologue出版社,1999),真菌基因組編碼蛋白質和代謝物的潛在多樣性遠比已知的真菌高,但是由于內含子的存在,使得絕大部分真菌特有蛋白和代謝物不能在細菌表達系統中有效表達。不僅許多種酶類(例如分泌形真菌木質素過氧化物酶和錳依賴型過氧化物酶)是真菌特有的,而且有許多真菌蛋白,包括酶類(例如木質素過氧化物酶和黑曲霉蔗糖酶)是糖基化的;但是如果這些蛋白在大腸桿菌中表達就不能被糖基化。由于真菌基因組的數量大,長度和復雜度非常高,許多蛋白是真菌特有的,并且許多真菌蛋白都要進行糖基化,所有這些都表明,如果將給定的環境微生物樣品的基因組DNA在細菌中進行表達,能被細菌識別并正確表達的微生物蛋白和代謝物的豐度不超過10%。
部分由于愛滋病的蔓延和接受器官移植的人數量的增加,越來越多的人受到免疫損害或免疫抑制,導致真菌感染的數量和種類穩步增長(《傳染病醫學雜志》16380-382,385-386(1999))。因此正在進行的研制新抗真菌藥的過程中需要分離和鑒定來自致病真菌的蛋白質,而這又需要有篩選來源于真菌基因組的DNA文庫的能力。由于真菌基因組中內含子的存在,使得在目前已知的絕大多數細菌宿主細胞中表達這些文庫變得非常困難。同樣,由于越來越多的細菌感染對抗生素產生抗藥性,也需要對有抗生素活性的真菌代謝物進行高通量篩選。
真核生物的基因組太復雜,以至于不能在細菌中完全表達其DNA文庫。如果算上所有的真核生物,細菌只代表所有已知物種的0.3%(E.O.Wilson,"生物多樣性的現狀",《生物多樣性》,國家學術出版社,華盛頓特區,1988,第一章);因而能在細菌中表達的全世界基因多樣性是極其有限的。
為了避免內含子的問題,可以構建cDNA文庫在細菌中表達。但是這種方法必須有轉錄產物RNA的存在,而任何當時未被活躍轉錄的基因都不會出現在該文庫中。而許多我們需要的蛋白只在特定條件下才表達(例如致病真菌中的毒性因子),并且不一定在收獲mRNA時存在。而且,為了獲得足夠量的RNA構建DNA文庫,需要培養大量的菌體。對于環境樣品中不易培養的生物,或者新的適宜培養條件還未找到的微生物而言,獲得大量的RNA是困難或不可靠的。相比之下,通過很少量的單個細胞,采用隨機引物或適合某一類基因的引物進行PCR擴增,就能獲得足夠的基因組DNA。最后,在某個生物體中表達量高的基因也會導致其mRNA的超量合成,而在基因文庫中,它的超量合成是以掩蓋一些微量表達的基因為代價的。如果是構建cDNA文庫而不是基因組文庫,為了包括盡可能多的現存mRNA種類,必須要篩選多得多的克隆,因為后者更能均衡地代表現存的基因種類。顯然,如果可能的話,人們更愿意構建基因組DNA文庫。
并且,大腸桿菌不能將許多蛋白質分泌出來,這對于用于篩選目的,而篩選依賴于宿主細胞將外源基因產物分泌到胞外的宿主細胞是一個缺陷。對于大腸桿菌和所有細菌宿主細胞來說,另一個缺陷是,許多真核生物蛋白需要多種翻譯后加工以獲得活性,而細菌不能對它們進行翻譯后加工。除了糖基化,亞基切分、二硫鍵形成和蛋白的正確折疊是生成有活性蛋白所常需的翻譯后加工的范例。
為了保證這些翻譯后加工,有時可以利用哺乳動物細胞,但是這些細胞很難培養,需要昂貴的培養基,并且不總是能高效地轉化外源基因。雖然科學家們努力嘗試用哺乳動物細胞做cDNA文庫篩選的宿主(Schouten et al.,WO 99/64582),但這種轉化系統顯然不適合蛋白質的高通量篩選。一種在文庫篩選前將轉化的原生質體與哺乳動物細胞融合的方法已被報道(美國專利5,989,814),但是細菌或酵母細胞中蛋白質文庫的表達發生在細胞融合之前。有人試圖用酶在宿主細胞表達外源蛋白后對蛋白的糖基化方式進行改造(Meynial-salles和Combes,J.Biotechnol.,461-14(1996)),但是這種方法必須針對不同的蛋白而改變,并且不適用于從DNA文庫中表達蛋白。在更近一些時候,Maras et al.,Eur.J.Biochem.,249701-707(1997)(又見美國專利5,834,251)報道一株里氏木霉(Trichoderma reesei)基因工程菌表達人類乙酰糖苷(GlcNAc)轉移酶I。該酶將所表達的其它外源基因的N-乙酰葡萄糖苷轉化為甘露糖殘基,這是向有天然活性的哺乳動物蛋白邁進的第一步。
用酵母作為宿主細胞解決了上述的一些問題,但卻引入了新的問題。酵母傾向于過度糖基化外源蛋白質(Bretthauer和Castellino,1999,Biotechnol.Appl.Biochem.30193-200),而由于糖基化方式的改變,常使得表達的哺乳動物蛋白質具有高抗原性(C.Ballou,Molecular Biology ofthe yeast saccharomyces(酵母的分子生物學),J.Strathern et al.,eds.,ColdSpring Habor Laboratory Press,NY,1982,335-360)。雖然酵母可以應付少數一些內含子,但是它們基本上不能處理從高等物種,比如脊椎動物的復雜基因。即使來自絲狀真菌的基因對于酵母來說也太復雜以至不能有效地轉錄,再加上酵母和絲狀真菌的表達和基因拼接序列不同,使這一問題變得更加復雜(參見例如M.Innis et al.,Science 1985,22821-26)。盡管有這些缺點,酵母轉化和表達體系還是被廣泛地開發,主要用作cDNA文庫的表達。人們開發酵母表達系統,用來篩選源自哺乳動物的自然分泌蛋白和膜蛋白(Klein,et al.,Proc.Natl.Acad.Sci.USA 1996 937108-7113;Treco,美國專利5,783,385),異源的真菌蛋白(Dalboge和Heldt-Hansen,Mol.Gen.Genet.243253-260(1994)),和哺乳動物蛋白(Tekamp-Olson和Meryweather,美國專利6,017,731)。
術語“酵母”在本文酵母表達系統部分中是指分類上屬于酵母目的生物,例如釀酒酵母和巴斯德畢赤氏酵母。為了明確上述定義,術語“真菌”和“真菌的”應被理解為擔子菌綱、結合菌綱、卵菌綱、壺菌綱和隸屬于真子囊菌綱的子囊菌,而不包括酵母目。絲狀真菌和酵母可以通過它們在無性繁殖時菌絲體的延長和需要空氣進行碳代謝來區別(酵母的無性繁殖是單個細胞的出芽生殖,而且酵母可以進行發酵生長代謝)。
真菌宿主細胞能最有效地進行真菌基因產物正確的內含子的拼接、糖基化、折疊和其它翻譯后加工,這使得絲狀真菌成為最好的進行土壤樣品基因組DNA篩選的宿主菌。同時絲狀真菌也成為生產有商業價值的真菌酶類,如蛋白酶、纖維素酶和淀粉酶的最好宿主菌。人們同時發現,絲狀真菌能夠轉錄、翻譯、加工和分泌其它真核生物基因產物,包括哺乳動物基因。該特性使得絲狀真菌成為生產有生物醫藥價值的蛋白質的合適宿主菌。與酵母相比,絲狀真菌引入的糖基化模式更接近于哺乳動物蛋白的糖基化模式。由于上述原因,科學家投入了巨大的努力來開發用來表達外源性蛋白的真菌宿主系統,并且已經開發出了許多真菌表達系統。欲了解該領域的工作,請參見Maras et al.,glycoconjugate J.,1699-107(1999);PEBERDY,Acta Microbiol.Immunol.Hung.46165-174(1999);Kruszewsa,Acta Biochim.Pol.46181-195(1999);Archer et al.,Crit.Rev.Biotechnol.17273-306(1997);和Jeenes et al.,Biotech.Genet.Eng.Rev.9327-367(1991)。
從真菌基因組構建的DNA文庫的高通量表達和鑒定也可以被用來確定許多現在功能未知的哺乳動物基因的功能。例如,一旦發現了一個真菌蛋白質具有一種令人感興趣的功能特性,可以將編碼該蛋白的基因序列與人類基因組序列相比較來尋找同源基因。
Yelton等在美國專利第4,816,405號中闡述了改造絲狀子囊菌以使其生產并分泌異源蛋白質。Buxton等在美國專利第4,885,249號,以及Baxton和Radford,Mol.Gen.Genet.196339-344(1994)中通過一個帶有可以整合到宿主細胞中的選擇標記的DNA載體對黑曲霉進行了轉化。McKnight等在美國專利第4,935,349號,以及Boel在美國專利第5,536,661號闡述了利用可以引導異源基因在根霉和其它絲狀真菌中表達外源基因的啟動子在曲霉中表達真核基因的方法。Royer等在美國專利第5,837,847號中,以及Berka等在WO 00/56900中,介紹了一種采用天然或突變過的鐮刀菌啟動子的有毒鐮刀菌表達系統。Conneely等在美國專利第5,955,613號中介紹了所構建的適合在曲霉中表達和生產乳鐵蛋白的質粒。枝孢菌的葡萄糖氧化酶已經在曲霉中被表達(美國專利第5,879,921號)。
相似的技術也被應用在鏈孢霉中。Lambowitzr在美國專利第4,486,533號中,介紹了一種可以在絲狀真菌中自動復制的DNA載體及其在鏈孢酶內引入和表達外源基因中的應用。Stuart等在美國專利第5,695,965號中介紹了厚壁鏈孢菌(Neurospora crassa)原生質球的哺乳動物基因和內源性轉錄調節因子的共轉化,并在美國專利第5,776,730號中描述了一株經改良后減少了胞外蛋白酶的鏈孢菌。美國專利第5,834,191號中公開了用于鏈孢菌轉化的載體。Taraki等在美國專利第5,436,158號中介紹了一種用于Rhizopus中的轉化系統。Sisniege-Barroso等在WO 99/51736中介紹了用于絲狀真菌的轉化系統,該系統采用了來自于Aspergillus awamori的谷氨酸脫氫酶啟動子。Dantas-Barbosa等在FERMS Microbiol.Lett.1998169185-190中,介紹了通過醋酸鋰法或電激法轉化灰色腐殖菌(Humicolagrisea)的Thermoidea變種,使它獲得了對潮霉素B的抗性。
更加成功的一些真菌表達系統是曲霉屬和木霉菌屬,相關例子請參見Berka等在美國專利第5,578,463號中的說明,在Devchand和Gwynne的文章J.Biotechnol.173-9(1991),以及Gouka等的文章Appl.Microbiol.Biotechnol.471-11(1997)中也有論述。菌種Myceliophthora thermophilia,Acremonium alabamense,陸生梭菌(Thielavia terrestris)和Sporotrichumcelluliphilum轉化株的例子分別在WO 96/02563,美國專利第5,602,004、5,604,129、5,695,985號中有報道。這些報道稱曲霉和木霉系統有一定的缺陷,暗示其它的真菌也許更適于大規模蛋白質生產。
除子囊菌門外其它門的轉化方法也有文章報道。請參見例子Munoz-Rivas等,Mol.Gen.Genet.1986 205103-106 Schizophyllum commune;van de Rhee等,Mol.Gen.Genet.1996 250252-258,雙孢傘菌(Agaricusbisporus);Arnau等,Mol.Gen.Genet.1991 225193-198,拳卷毛霉(Mucorcircinnelloides);Liou等,Biosci.Biotechnol.Biochem.1992 561503-1504光亮根霉(Rhizopus niveus);Judelson等,Mol.Plant Microbe Interact.1991 4602-607,致病疫霉(Phytophthora infestans);以及de Groot等,NatureBiotechnol.1998 16839-842,雙孢傘菌(Agaricus bisporus)。
絲狀真菌除了例如原生質體融合等常規轉化方法外,Chakraborty和Kapoor,在Nucleic.Acids Res.186737(1990)中介紹了利用電激法轉化絲狀真菌。De Groot等在Natyre Biotechnol.16839-842(1998)中采用根癌農桿菌(Agrobacterium tumefaciens)介導的幾種絲狀真菌的轉化。科學家也開始利用生物介質將外源DNA轉入真菌;例子有Christiansen等,Curr.Genet.29100-102(1995);Durand等,Curr.Genet.31158-161(1997);以及Barcellos等,Can.J.Microbiol.441137-1141(1998)。以磁粒作為“磁性生物介質”轉化細胞的報道參見美國專利第5,516,670號和5,753,477號,科學家希望這種方法適用于絲狀真菌。
顯然人們作了許多努力開發以真菌作為宿主菌的表達系統。然而,普通的真菌宿主都是絲狀真菌,在不加攪拌的培養液中會形成糾纏的菌絲體,而在加以攪拌的生物反應器中培養液粘度又會很大。絲狀真菌的這些特性也會在以之為宿主菌的工業化酶生產中導致問題。例如,高粘稠度和/或在局部形成的密集菌絲體堆積,將會對攪拌、通氣和營養物分散造成困難。一般來說,由于培養液的粘度,用微量移液器將絲狀真菌懸浮培養物吸到微量滴定板中有一定困難。而且,由于典型絲狀真菌培養物的菌絲體互相糾纏,用它來表達DNA文庫時,大規模地將糾纏的菌絲體分離為單個克隆并不容易,這將使檢測單個基因型這一高通量檢測系統所需的步驟遇到困難。
在不進行持續的攪拌時,典型的絲狀真菌傾向于在液體培養基的表面生長并形成一層菌絲體,并在其上產氣生孢子。而在培養基液面以下生長時又不總是產生孢子。這兩個特性都對在微量滴定板中培養絲狀真菌菌落,以及對有效地操作和利用這種培養物進行高通量的篩選制造了巨大的困難。懸浮的孢子和其它的可復制單元適于分離并分散到單個的微量滴定板孔中,但如果允許氣生菌絲體的形成,氣生孢子的產生會導致板孔間的交叉污染。在微量滴定板孔的培養基中進行攪拌以防止氣生菌絲層的形成是不可行的。除了難以控制的氣生孢子問題,氣生菌絲層會干擾光的轉移,使得許多檢測(尤其是分光光度吸收檢測)較難甚至無法進行。氣生菌絲層還對諸如供氧、試劑和營養的添加以及取樣等產生干擾。
真菌的形態特征對其培養物的物理特性的影響已經被認知,人們已經找到了有更好特性的自然產生的菌株,Jenssen和Boominathan的美國專利第5,695,985號提供了一個例子。松散的菌絲體均一分布,有規律的分枝,都是所描述的有益的形態特征。Schuster和Royer在國際專利申請WO 97/26330和美國專利6,184,206中提到了相似的方法,用來分離鑒定形態特征更適合于工業化生產外源蛋白質的真菌。該方法不是直接篩選野生型菌株,而是篩選親本真菌細胞的突變株系,轉化突變株,檢測是否有轉化子比親本產生更多的外源蛋白。比親本至少多出10%菌絲體分枝的突變株被特別注意。該方法被應用于木霉屬、鐮刀霉屬和曲霉屬的篩選,他們還暗示此方法可以應用于其它許多屬。
Bock等在Biotechnol.Bioeng.65638-648(1999)中檢測了分枝頻率對米曲霉突變株培養物粘度的影響;結果發現分枝越多的突變株培養物粘度越低。而Van Wezel等在PCT應用WO 00/00613中,介紹了一種減少菌絲分枝和/或增加菌絲體片段的數量的方法,培養液的粘度也被降低了。該方法將灰色鏈霉菌的SsgA基因轉入了微生物中。該方法采用的是放線菌目的絲狀細菌,但宣稱適用于絲狀真菌。在WO 00/56893中,Dunn-Colenman等描述了一株構巢曲霉的HbrA2突變株在42℃以上生長時分枝數大大增加,并且觀察到菌絲分枝度與培養物粘度之間呈線性關系。
對絲狀真菌表達系統的絕大多數前期研究都是為了分離鑒定適于工業化酶生產的菌株,因而人們的注意力主要集中在培養液粘度、轉化的穩定性、單位體積的外源蛋白產量,以及產量占生物量的百分比這些方面。已經在真菌中表達了一些DNA文庫,例如Gems和Clutterbuck在Curr.Genet.1993 24520-524這篇論文中,用構巢曲霉系統表達了構巢曲霉文庫。Gems等在Mol.Gen.Genet.1994 242467-471這篇論文中,用曲霉系統表達了一個來源于青霉的基因組文庫。但是這兩個例子都沒有透露或暗示對表達的蛋白進行了篩選;而是通過對宿主突變的等位基因的互補作用來證實來自DNA文庫的基因已經獲得了表達。這種互補的方法對每個想要檢測活性的外源蛋白都需要一個特定的突變株做宿主菌,因而不能對一般的文庫篩選提供一個工具。
Berges等人在Curr.Genet.1993 2453-59這篇論文中,闡述了用在Trichoderma reesei中表達的方法克隆了一個黑曲霉蔗糖酶基因。具體方法是利用一個構建在有選擇標記的粘粒上的黑曲霉基因組文庫,并采用一株不能利用蔗糖的里氏木霉(T.reesei)作為宿主菌,用同胞選擇的方法克隆了一個黑曲霉蔗糖酶基因。在這里,同樣需要有特定性狀的宿主菌來檢測特定單個外源蛋白的表達,基因組文庫的篩選沒有被提及甚或不可能。
一個適于表達DNA文庫的宿主菌的特點在許多方面與適合于工業化蛋白質生產的宿主菌不同。總的來說,一株適合于高通量篩選的真菌宿主菌應具備許多條件,其中包括-宿主菌必須能進行高效轉化。
-宿主菌必須能處理含有內含子的基因,并能進行任何必要的拼接。
-宿主菌必須能對表達的蛋白進行翻譯后加工,以使蛋白變為有活性的形式。
-當從文庫中篩選一種蛋白質時,宿主菌必須能夠生產足夠多的該蛋白以供分析之用。
-宿主菌必須能接受許多種表達調控因子,并能輕松利用各種調控因子。
-宿主菌培養物中的菌絲體不能相互糾纏而對分離單個克隆產生困難,也不能相互糾纏而升高粘度到不能在小型化的高通量篩選中(如微量取樣)有效轉移和復制的程度。
-宿主菌不能在培養基表面形成菌絲層,而應優先在培養基液面以下生長。
-在高通量篩選所提供的生長條件下,宿主菌必須能在培養基液面以下有效地形成孢子或其它無性繁殖體。
當被篩選物是代謝產物時,如果宿主細胞能將代謝產物分泌到培養基是再好不過了。在培養基中代謝產物可以被很容易地檢測和/或分析。在理想狀態下,宿主菌應該只分泌外源蛋白。
當對蛋白質進行分析時,如果宿主菌也能表達足夠用來分離和純化的外源蛋白就非常有利了。如果有具備這種特點的宿主菌,就可以只通過培養宿主細胞,而不用煩瑣費時的分子生物學操作將基因轉入其他生物體,來進一步鑒定所有感興趣的外源蛋白。宿主菌能將蛋白質分泌到胞外是一個好的特性,這樣可以進行更可靠和更多樣的檢測。
如果宿主細胞能方便地分離外源DNA也將是非常有利的,這樣進一步的研究以及改造基因本身也可以進行。
除了上述的特性,這種轉化系統還應具備一些其它的特點。轉化的效率應該足夠高,以產生有意義的篩選所必須的足夠轉化子數。在理想狀態下,外源蛋白的表達應由一種誘導物誘導,并且該誘導物通過一條途徑作用在一個啟動子上。
迄今為止,還沒有任何宿主菌和轉化系統的組合符合全部這些條件,甚至連能符合大部分的也沒有。因此,人們仍然需要能有效表達DNA文庫—尤其是基因組文庫和/或真核基因組文庫的基因產物的真菌宿主和轉化系統。
發明簡述本發明采用在深層培養時能產生“可轉移的復制單元”的絲狀真菌。“可轉移的復制單元”是指孢子、無性芽、菌絲片段、原生質體、皮層碎片,或其它符合下面兩個特征的真菌單元(1)在培養基中能容易地與其它這類單元分離,和(2)能夠自身復制成一個單克隆培養物。優選真菌還表現出絲狀形態不明顯和/或生長緊密的優點,并且產生適于高通量DNA文庫篩選中涉及的物理操作的低粘度培養物。尤其優選的是,即使在不加攪拌的情況下仍然傾向于在培養基內部生長,而不是在培養基表面形成菌絲層的絲狀真菌。
本發明利用了在國際專利申請PCT/NL99/00618和PCT/EP99/202516中公開的轉化系統的特點。這些申請描述了一種對諸如Chrysosporiumlucknowense、Aspergillus sojae等絲狀真菌宿主非常有效的轉化系統。這些申請還公開已經獲得了保留野生型宿主細胞所有優良性狀,但部分失去其絲狀表型的突變株,這種突變株降低了培養物的粘度。
本發明所采用的優選真菌能夠大量表達并分泌外源蛋白質,與已知絲狀真菌宿主相比蛋白質/生物量之比獲得了提高。本發明提供了一個表現高轉化子產量的轉化系統。本發明還提供了能有效表達外源cDNA插入體,尤其是基因組DNA插入體的蛋白產物的真菌轉化株庫。本發明的另一方面,轉化的真菌庫可以用來篩選外源蛋白的活性或特性,或者篩選轉化真菌由于外源蛋白的作用而產生的代謝物,也可以用來篩選外源DNA或其轉錄產物RNA。應該理解本發明還能夠高通量篩選具有上述性狀的非轉化菌株的代謝物。
本發明使用的術語“絲狀真菌突變株”僅指在自然界找不到的真菌。導致例如緊密的生長狀態、低粘度、低蛋白酶含量、在液面以下生長等可描述的表性特征的“突變”可以通過紫外線誘變和化學誘變等經典方法,或者通過如盒式突變等分子生物學手段隨機產生,還可以通過縝密的基因工程方法來獲得。如果一株天然真菌具有這些必要特性,它將理所當然地可以被應用于本發明的方法中。
在本發明的另一方面,轉化的真菌庫可以用來篩選真菌自身的有用性質,例如,一種特定表達的蛋白或代謝物的高水平生產。本發明的這一方面可以通過對目標表達蛋白的定量分析來說明,其中可以檢測到有最優良的蛋白生產、蛋白加工和蛋白分泌特性組合的特殊菌株。
在本發明的再一方面,轉化真菌庫可以用來篩選能夠與目標核酸探針雜交的DNA序列的存在。
圖1是實施例中描述的Western印跡圖。
圖2是質粒pUT720的圖譜。
圖3是質粒pUT970G的圖譜。
圖4是質粒pUT1064的圖譜。
圖5是質粒pUT1065的圖譜。
圖6是質粒pF6g的圖譜。
圖7是質粒pUT1150的圖譜。
圖8是質粒pUT1152的圖譜。
圖9是質粒pUT1155的圖譜。
圖10是質粒pUT1160的圖譜。
圖11是質粒pUT1162的圖譜。
圖12是pclA蛋白的結構圖。
圖13A是黑曲霉(Aspergillus niger)野生型的顯微照相圖。
圖13B是黑曲霉pclA突變株的顯微照相照片。
圖14A是醬油曲霉(Aspergillus sojae)野生型的顯微照相照片。
圖14B是醬油曲霉pclA突變株的顯微照相照片。
圖15A-E是pyrE基因的測序結果。帶下劃線的是氨基酸序列;由于一些核酸序列不確定導致氨基酸序列不連續。標出的氨基酸序列是最可能的序列,黑體字代表推測的/可能的內含子。
本發明的詳細描述從最廣義的角度來說,本發明涉及在懸浮培養液中能產生可轉移的復制單元的轉化絲狀真菌;涉及這種真菌庫;還涉及從這種庫中篩選諸如與表達的外源蛋白質或相關代謝產物(即由內源性和/或外源性酶產生的小分子量產物)有關的生物化學活性或生物學活性等所需生物學特性的方法。這個低粘度的絲狀真菌庫包括含有核酸序列的真菌,每段核酸序列編碼一個外源蛋白,每段所述核酸序列都可操作地連接于一個表達調控區,并可選擇地連接分泌信號編碼區和/或載體蛋白編碼區。本發明中的轉化菌株優選可以分泌外源蛋白。
本發明所使用的表達和篩選方法,和其中使用的真菌菌株,對生產真菌、蛋白質、代謝物和DNA分子這些在各方面有廣泛用途的物質很有用。本發明的方法對獲得核酸和蛋白質序列信息也很有用,這些信息本身也被看作本方法的有用產品之一。
本發明的優選絲狀真菌特征在于培養基粘度低。典型的工業級絲狀真菌的培養物粘度遠大于200厘泊(cP),通常是1,000cP以上,甚至能達到10,000cP;本發明的真菌在有充足營養及最適或接近最適生長條件下培養48小時或更長時間以后,培養物粘度在200cP以下,優選100cP以下,更優選60cP以下,最優選10cP以下。本發明的絲狀真菌通常呈現短的、不連續、不相互糾纏的菌絲或小團的形態。這些小團是從一個單克隆產生的有輕微或無相互糾纏的菌絲集合體,與從多個相互纏繞的克隆產生的菌絲團是不一樣的,后者要大得多。例如,Chrysoporiumlucknowense突變株UV18-25(培養粘度<10cP)和形態相似的Tricodermalongbanchiatum突變株X-525(培養粘度<60cP),特征在于有短的、明顯的、不相互糾纏的菌絲,長度在100-200微米之間;低粘度基因工程突變株Aspergillus sojae pclA的形態特征是有多分枝和短菌絲的緊密形態(參見圖14)。而WO97/2630中提到的低培養粘度真菌在形態上“分枝更多”,本發明中的真菌與非突變菌株相比菌絲分枝與之相當甚或更少。看起來菌絲的長度在控制培養物粘度上起關鍵作用。
特別優選的真菌菌株有高的外源分泌蛋白/生物量之比。這個比率大于1∶1,較有大于2∶1,更優選6∶1或更高,最優選8∶1或更高。這樣高的比率在高通量篩選環境中是有利的,因為它會使外源蛋白的濃度更高,允許更靈敏和/或更快速的篩選檢測。這在檢測的體積減小時尤其有利,例如從96孔微量滴定板到384孔板,再到1536孔板時。本發明的方法適用于所有這些型號的微量滴定板,也適用于絕大多數其它采用液體樣品的、HTS樣式的滴定板。
我們期望用本發明所講的突變方法,可以將所有絲狀真菌轉變為適合于在本發明中應用的突變株。優選的絲狀真菌的屬有金孢屬(Chrysosporium),梭孢殼屬(Thielavia),鏈孢酶屬(Neurospora),金色擔子菌屬(Aureobasidium),線黑粉菌屬(Filobasidium),Piromyces,Crylococcus,Acrimonium,Tolypocladium,Scrytalidium,裂褶菌屬(Schizophyllium),側孢霉屬(Sporotrichum),青霉屬(Penicillium),赤霉菌屬(Gibberella),毀絲霉屬(Myceliophthora),毛霉屬(Mucor),曲霉屬(Aspergillus),鐮刀霉屬(Fusarium),腐質霉屬(Humicola),和木霉屬(Trichoderma),和它們的無性型及遠距離刺激變形型。其中優選金孢屬,木霉屬,曲霉屬和鐮刀霉屬。更優選金孢屬。真菌的種屬可以根據與Barnett和Hunter所著的《不完善的真菌屬的圖解》第三版,1972,Burgess出版公司一一書中描繪的形態的一致性來定義。對金孢屬真菌的分類提供詳細原始資料的有Van Oorschot,C.A.N.(1980)“對金孢屬及其相關屬的修訂”, Studies in Mycology No.20 Cenntraal Bureau voorSchimmelcultures(CBS),Barrn,The Netherlands,第1-36頁。根據這些資料,金孢屬屬于絲孢菌目的叢梗孢科(Moniliaceae)。
另一個提供真菌命名的方便資源是布達佩斯條約的保藏,尤其是那些提供在線數據庫的(以下這些網址采用HTTP傳輸協議)。美國的ATCC在www.atcc.org提供信息,CBS(NE)在www.cbs.knaw.nl提供信息,俄羅斯的VKM在www.bdt.org.br.bdt.msdn.vkm/general提供信息。另一個資料來源是NT.ars-grin.gov/fungaldatabases。所有這些機構都能提供區分真菌種的特征的教程。在www.ncbi.nlm.nih.gov/htbon-post/taxonomy/wgetorg?mode=Undef&id=4890網站可以找到Ascomycota的另一種分類。根據這另外一種分類,金孢屬隸屬于Ascomycota門、Onygenales目、Onygenaceae科。
金孢屬的范圍包括但不局限于這些菌株C.botryoides,C.carmichaelli,C.crassitunicatum,C.Europe,C.evolceannui,C.farinicola,C.fastdium,C.filiforme,c.georgiae,C.globiferum,C.globiferum var articulatum,C.globiferum var niveum,C.hirundo,C.hispanicum,C.holmii,C.indicum,C.inops,C.keratinophilum,C.kreiseii,C.kuzurovianum,C.lignorum,C.lobatum,C.lucknowense,C.lucknowense Grag 27K,C.medium,C.mediumvar spissescens,C.mephiticum,C.merdarium,C.merdarium var roseum,C.minor,C.pannicola,C.parvum,C.parvium varcrescens,C.pilosum,C.pseudomerdarium,C.periformis,C.queenslandium,C.sigleri,C.sulfureum,C.synchronum,C.tropicum,C.undulantum,C.vallenarense,C.vsepertilium,C.zonatum.
C.Lucknowense是金孢屬的一個人們特別感興趣的種,因為在自然條件下它的纖維素酶蛋白的產量比較高(國際專利申請WO 98/15633,PCT/NL99/00618,和美國專利5,511,381和6,015,707)。國際保藏號為ATCC 44006,CBS 251.72,CBS 143.77,CBS 272.77,和VKM F-3500D的菌種都是Chrysosporium lucknowense菌株的例子。金孢屬的定義范圍還包括從金孢屬同一祖先衍生來的菌株,包括自發突變或誘變的突變株。本發明的方法,在一個具體方面,利用了一株通過輻射和化學誘變獲得的金孢屬突變株,該菌株在懸浮培養時傾向于產生可轉移的復制單元,其形態特征是短的、不連續的、不相互糾纏的菌絲(緊密生長),還有一個表型特征是在懸浮培養時在液面以下生長,發酵培養基的粘度較低。在另一個方面,本發明采用了形態相似的木霉屬突變株。在另一個方面,采用了形態相似的醬油曲霉或黑根霉突變株。
例如,將VKM F-3500D(C1菌株)用紫外線照射,獲得菌株UV13-6。隨后,該菌株用N-甲基-N’-硝基-N-亞硝基鳥嘌呤進一步誘變,產生菌株NG7C-19。后者接著被紫外線誘變,獲得菌株UV18-2(VKM F-361D)。在突變過程中,該菌株在液體培養基或平板以及顯微鏡下的形態特征發生了一些變化。在每一次連續的突變后,在平板上培養的突變株的金孢屬典型絨毛狀和氈狀的形態特征就會減少一些。野生型在某些培養基中生長時會產生棕色色素,而突變株的這種特征則不明顯。在液體培養基中生長時,突變株UV18-25的粘度明顯低于野生型菌株C1和突變株UV13-6和NG7C-19。雖然所有菌株都大致保持著金孢屬的顯微鏡下特征,但所有菌株每經過一代突變菌絲就變細一些,而UV18-25可以明顯觀察到菌絲呈片段狀。這種菌絲片段可能是造成UV18-25的培養物粘度降低的原因之一。每進行一代突變,菌株產生氣生孢子的能力就減弱一些。這些結果表明一個菌株可以總體上屬于金孢屬,而在形態上表現出與傳統分類(形態上)定義有一些差異。
特別是金孢屬的無性型,我們發現它特別適合本發明所述的篩選應用。無性型的代謝使其特別適合高效表達。有性型也應該適合,因為無性型和有性型的基因組成是一樣的。無性型和有性型的區別在于一個是無性狀態,另一個是有性狀態;這兩種狀態在特定培養條件下表現出不同的形態。
另一個代表基因工程突變菌株的例子是醬油曲霉(Aspergillus sojae)。這些突變株中的一株的編碼一個特定內切蛋白酶的基因被阻斷了。這一突變導致了菌絲變短,分枝增加,菌絲生長緊湊,在培養基液面以下形成菌絲小片。并且,在本應用中提到的Aspergillus sojae在特定的液體培養基內生長可以被誘導表現出高效的生孢子能力,這使得它特別適合用于高通量篩選系統。在這個例子中,誘導產生可轉移的復制單元的條件僅僅是由一種含0.6克/毫升EDTA的合成培養基組成。誘導條件會隨著不同的宿主而改變,但很明顯的是如果一個宿主菌適合,這個條件應該早就為人所知了。
人們喜歡用不產毒素和非致病的真菌菌株,現有技術已知道很多這種菌,因為這會降低操作者的危險性,并能簡化總體的篩選過程。在優選的實施方式中真菌還將是蛋白酶缺陷型,這樣可以最大程度地降低外源蛋白的降解,和/或易于抑制蛋白酶的產生。將蛋白酶缺失的菌株用作表達宿主菌是眾所周知的,例如PCT申請WO 96/29391。蛋白酶缺失的菌株可以通過篩選突變株來產生,或者蛋白酶基因可以被”敲除”,或者可以用本文中的方法使其失活,例如Christensen和Hynes在美國專利6,025,185號中所描述的(areA基因功能喪失的Aspergillus sojae)。
人們發現可以處理金孢屬突變株使其蛋白酶表達量下降,這就使它們更適合于生產蛋白類產品,尤其是當蛋白類產品對蛋白酶活性敏感時。因此本發明也可以使用一株金孢屬突變株,該突變株比諸如C.lucknowense菌株C1(VKM F-3500 D)等非突變金孢屬菌株產生的蛋白酶少。這些突變株的特別之處是其蛋白酶活性(除了所有的有選擇的用來切割分泌的融合蛋白的蛋白酶)小于C1菌株產生的活性的一半,更好的情況下小于30%,最好時小于10%。被降低的蛋白酶的活性可以用已知的方法測定,例如測量脫脂牛奶平板上的抑菌圈或牛血清白蛋白降解。
已經發現可以構建蛋白酶表達水平降低的金孢屬突變株,以使它們更適于生產蛋白產物,尤其是當蛋白產物對該蛋白酶活性敏感時。因此,本發明也可以利用比金孢屬非突變株例如C.lucknowense C1株(VKM F-3500 D)產生更少蛋白酶的金孢屬突變株。尤其是當該突變株的蛋白酶活性(而非裂解融合蛋白的蛋白酶)不及C1株的一半或少于30%甚至10%時更好。蛋白酶活性的減少用已知方法測定,如測定脫脂牛奶平板形成的抑菌圈或牛血清白蛋白的降解。
為了減少分析時宿主蛋白的干擾,去除宿主絲狀真菌的其它基因如編碼纖維素酶和其它分泌較多的蛋白的基因的活性,是再好不過了。可以刪除或突變編碼分泌蛋白的基因,或者對非目的蛋白的誘導系統及表達的有關途徑進行改造以降低其表達。本發明(見下面)中載體使用內源性操縱子,是為了滅活同一個誘導子控制下的其它的基因的活性。蛋白酶分泌較易抑制的真菌的蛋白酶表達往往受環境調節因子如氨基酸濃度的控制,而通過這些環境因子可以減少蛋白酶的生產。
轉化載體中優選應用能夠在選擇的宿主中高表達的同源表達調節區。來源于異源宿主如木霉屬或曲霉屬的高表達調節區,眾所周知而且都在使用。舉例但并不限于這些,已知大量表達并因此為本發明的應用提供合適表達調節序列的蛋白質的例子是hydrophobin,蛋白酶、淀粉酶、木聚糖酶、果膠酶、酯酶、β-半乳糖苷酶、纖維素酶(endo-glucanase,cellobiohydrolase)及多聚半乳糖醛酸酶。
表達調節區包含一個可控制的啟動子序列,和要表達的蛋白的核酸序列連接在一起。啟動子和要表達序列的起始密碼子緊密相連,以達到表達的目的。啟動子序列可以是組成型的,但誘導型的更好。使用誘導型啟動子和適當的誘導介質更利于和啟動子相連的序列的表達。我們曾考察過一些來源于同源物種或異源株系的、能夠促使蛋白質表達的表達調節序列。這種表達調節序列適合于真菌的表達調節區,例如子囊菌綱的調節區。合適的子囊菌綱的表達調節區是來自下列屬任意一種的調節區曲霉屬,木霉屬,金孢屬,腐質霉屬,鏈孢霉屬,Tolypocladium,鐮刀霉屬,青霉屬,Talaromyces,或它們的另一種性別型例如Emericela及鐮刀霉屬。來自木霉屬的cellobiohydrolase啟動子;曲霉屬的乙醇脫氫酶A,乙醇脫氫酶R,谷氨酸脫氫酶,RAKA淀粉酶,甘油淀粉酶,甘油醛磷酸脫氫酶啟動子,鏈孢霉屬的磷酸甘油及旁路的啟動子;Rhizomucor miehei的脂酶、冬氨酸蛋白酶啟動子;penicillium canescens的β-半乳糖苷酶的啟動子;而cellobiohydrolase,葡聚糖內切酶,木聚糖酶,甘油醛磷酸脫氫酶和蛋白酶的啟動子是典型代表。和宿主同屬的表達調節序列是最佳選擇,因為它更可能特別地適應宿主。
來自表達巨大量蛋白質的金孢屬菌株的天然表達調節序列特別優選。這些菌株的例子已經根據布達佩斯條約保藏于莫斯科的全俄菌種保藏機構(All Russian Collection,VKM)。野生型C1株保藏號為VKM F-3500 D,保藏日為1996年8月29日,C1 UV13-6突變株保藏號VKM F-3632 D,保藏日1998年9月2日,C1 NG7C-19突變株保藏號VKM F-3633 D,保藏日為1998年9月2日,C1 UV18-25突變株,保藏號VKM F-3631 D,保藏日為1998年9月2日。這些菌株也優選用來作為生產低-粘性突變株的菌源;事實上VKM F-3631D菌株已經表現必需的低粘度表型特征。經過對Trichoderma longibrachiatum18.2kk的兩輪輻射選擇,已經得到木霉屬的一個編號為X-252低粘度突變株,而X-252低粘度突變株是從Trichoderma longibrachiatum的QM 9414株的突變體(ATCC 26921)得到。本發明的其它實施方式利用了Aspergillus sojae和Aspergillus niger表現型近似的突變株。
當宿主是金孢屬時,優選應用金孢屬的啟動子序列,以保證啟動子被宿主正確識別。某些異源表達調節序列也和金孢屬本身的表達調節序列一樣在,金孢屬中具有相同的調節效率。這樣以來就使我們可以構建用于轉化,金孢屬的出色載體,并提供在此宿主中進行高效轉化和表達的許多可能性。如,標準的曲霉屬轉化技術可參考Christiansen等在Bio/Technology1998 61419-1422一文的描述,其它有關轉化載體的詳細描述包括美國專利4,816,405、5,198,345、5,503,991、5,364,770、5,705,358、5,728,547、5,578,463、EP-B-215.594(也適用于木霉屬),它們的內容通過參考并入本文。因為在金孢屬中發現纖維素的表達率非常高,纖維素基因的表達調節區很受歡迎。
本發明中載體允許插入編碼酶(尤其對分泌出去的酶)的基因的啟動子序列。這些酶包括糖降解酶(纖維素酶,木聚糖酶,甘露聚糖酶,甘露糖苷酶,果膠酶,淀粉酶,例如葡萄糖淀粉酶,α-淀粉酶,α和β半乳糖苷酶,α和β葡萄糖苷酶,β-葡聚糖酶,幾丁質酶),蛋白酶(內源蛋白酶,氨基蛋白酶,氨基及羧基多肽酶),其他水解酶(脂肪酶,酯酶,肌醇六磷酸酶),和轉移酶(糖基轉移酶,谷氨酰胺轉移酶,異構酶,轉化酶)。來自Chrysosporium lucknowense的幾個酶的例子見表A。表A來自Chrysosporium lucknowense的部分酶的特性
注*通過MALDI測定的分子量;其它均為通過SDS PAGE測定的分子量xyl=木聚糖酶endo=葡聚糖內切酶
gal=半乳糖苷酶gluc=葡糖苷酶CBN=cellbiohydrolasePGU=半乳糖醛酸酶核酸構建體優選包括來自金孢屬、最好是來自Chrysosporiumlucknowense或其衍生物的表達調控區,該調節區可操作地與一個編碼待表達蛋白的核酸序列連接。特別優選的核酸構建體將包括來自表達纖維素酶或木聚糖酶的金孢屬的表達調控區,優選包括來自表達cellobiohydrolase,更優選表達表A描述的55 kDa cellobiohydrolase(CBH1)的金孢屬的表達調控區。再舉些例子,金孢屬的hydrophobin、蛋白酶、淀粉酶、木聚糖酶、酯酶、果膠酶、β-半乳糖苷酶、纖維素酶(葡聚糖內切酶,cellobiohydrolase)和多聚半乳糖醛酸酶的啟動子序列也在本發明的范圍內。
表A中公開的酶的所有啟動子或表達調控區都可以恰當地得以使用。可以很容易地從金孢屬得到這些啟動子或表達調控區的核酸序列。確定啟動子序列的方法多種多樣而且眾所周知。啟動子序列通常緊靠在相關基因開始的起始密碼子ATG的上游。舉例來說,可以用去除相關基因上游的序列、重組DNA技術、及檢驗去除這些序列對基因表達的影響來鑒別啟動子序列。再例如,通過比較相關基因上游序列的同源啟動子序列,也可以發現啟動子序列。
比如,C1葡聚糖內切酶的啟動子序列就是通過克隆相應基因得來的(見PCT/NL99/00618)。本發明傾向于使用來自金孢屬55kDacellobiohydrolase(CBH1)、甘油醛磷酸脫氫酶A、30k Da的木聚糖酶(XylF)的啟動子,因為這些酶應用它們的啟動子時表達水平較高。Chrysosporiumlucknowense尤其是C.lucknowense GARG 27K糖降解酶的啟動子因可在其它真菌宿主中表達很多蛋白,很好使用。
本發明核酸序列的具體實施方式
是已知的金孢屬,曲霉屬和木霉屬的核酸序列。金孢屬的啟動子序列見PCT/NL99/00618的描述。現有技術提供了大量可在曲霉屬中應用的表達調控區,例如美國專利4,935,349;5,198,345;5,252,726;5,705,358;5,965,384和PCT申請WO93/07277。在木霉屬菌株中表達公開在美國專利6,002,725中。這些專利的內容通過參考其全文并入本發明。
Hydrophobin基因是一個高表達的真菌基因。有人認為Hydrophobin基因的啟動子序列、優選來自金孢屬的啟動子序列,適合用作本發明適當實施方式中的表達調節序列。Trichoderma reesei和Trichodermaharzianum的Hydrophobin基因序列已經為現有技術所公開,并且Aspergillus fumigatus和Aspergillus nidulans的基因序列及相關序列信息被參考并入本發明(Nakari-Setala等,Eur.J.Biochem.1996,235248-255;Parta等,Infect.Immun.1994 624389-4395;Munoz等,Curr.Genet.1997,32225-230;Stringer等,Mol.Microbio.1995 1633-44)。利用這些信息,本領域普通技術人員按照標準方法例如前面提到的技術,不必經過繁重實驗即可得到金孢屬hydrophobin基因的表達調控序列。根據本發明的一個重組金孢屬菌株可以包含一個可操作地與編碼外源蛋白的序列相連的hydrophobin調控區。
表達調控序列也可以另外包含一個增強子或沉默子。它們也是現有技術已知的,它們一般遠離啟動子。表達調控序列還包括具有激活物結合位點和阻抑物結合位點的啟動子。在某些情況下,這些部位也可以得以修飾以去除這種類型的調控。例如,存在creA位點的絲狀真菌啟動子的已有報道。可以使creA位點突變,以確保由于存在的creA被去除而導致葡萄糖的抑制。利用這樣的啟動子可以產生在葡萄糖存在下啟動子控制的核酸序列編碼的蛋白庫。這種技術的例子見WO 94/13820及WO97/09438。這些啟動子在有后無其creA位點的情況下均能使用。creA位點突變的突變體可用作本發明重組株的表達調控序列,而它所調控的核酸序列庫可以在葡萄糖存在下得以表達。這類啟動子如WO 97/09438中所描述的類似方式確保去抑制。CreA位點的鑒別知識是現有技術已知的。另外,可以在抑制系統以外具有突變的宿主菌株中應用CreA結合位點未突變的啟動子,從而該菌株盡管存在CreA結合位點,仍能夠在葡萄糖存在下產生蛋白庫。
終止序列也屬于表達調控序列,它們可操作地連接在要表達的序列的3’端。可能有許多已知的真菌終止子在本發明的宿主菌中起作用。如A.nidulans trpC的終止子,A.niger的α-葡糖苷酶終止子、A.niger的葡糖淀粉酶終止子、Mucor miehei的羧基蛋白酶終止子(參見US 5578463),以及Trichoderma reesei的cellobiohydrolase終止子。金孢屬的終止子序列,例如EG6終止子,當然在金孢屬中發揮很好的得作用。
用于本發明的合適轉化載體可以任選具有可操作地與信號序列的編碼序列連接的待表達外源核酸序列。而信號序列為一段氨基酸序列,當和待表達蛋白的氨基酸序列可操作地連在一起時,能夠使該蛋白從宿主生物體中分泌出去。這樣的一種信號序列可以是與異源蛋白有關的或是宿主本身的。編碼信號肽的核酸序列必須定位在讀碼框中,以使信號肽和異源蛋白一同翻譯。本發明信號肽的位置(包括單一的、分泌外源蛋白)最好處于分子進化該分子所處位置。
一個載體上只連接一個信號序列來進行文庫的表達,不是最好選擇,因為這將減少表達目的蛋白的可能。隨機剪斷DNA而建立的基因組文庫,然后再克隆到一個載體中,庫中基因正好和信號序列連接在一個閱讀框架的可能性較小。而且,即便是連接到一起,選擇的信號序列可能不會對所有基因起作用。鑒于此,最好不要應用信號序列來篩選基因組庫,而要通過檢測細胞內外源蛋白的存在來篩選基因組庫。細胞內蛋白的存在和活性分析可以通過用酶將真菌轉化為原生質體、然后再溶解后得以實現。有關操作見Zeyl等,J.Biotechnol.59221-224(1997)的描述。這種方法已經應用于生長在微量培養板上的金孢屬轉化子的PCR克隆檢測。
講解一下能使金孢屬菌株分泌蛋白的信號序列。此類序列以真菌的信號序列為好,但以Ascomycete的信號序列為最好。通常可以從真核細胞得到合適的信號序列,最好從酵母和以下各屬的真菌得到曲霉屬,金孢屬,木霉屬,Pichia,鏈孢霉屬,Rhizomucor,Hansenula,腐質霉屬,毛霉屬,Tolypocladium,鐮刀霉屬,青霉屬,Saccharomyces,Talaromyces,或不同生殖方式的Emericela、Hypocrea。那些和cellobiohydrolase、葡聚糖內切酶、β-半乳糖苷酶、木聚糖酶、果膠酶、酯酶、蛋白酶、hydrophobin或淀粉酶生來就連在一起的信號肽特別有用。如曲霉屬或腐質霉屬的淀粉酶或葡糖淀粉酶,Aspergillus oryzae TAKA淀粉酶,Aspergillus niger的α-淀粉酶,毛霉屬的羧基肽酶(US 5578463),Rhizomucor miehei的脂肪酶或蛋白酶,木霉屬的cellobiohydrolase,來自金孢屬Penicilliumcanecens CBH1株的β-半乳糖苷酶,Saccharomyces的α-交配因子的信號序列。
另外信號序列也可以是桿狀菌的淀粉酶或枯草桿菌蛋白的信號序列。從同一屬的宿主菌株得到的信號序列尤其適合,因為它最可能會特別適應特定宿主的要求;因此當宿主是Chrysosporium lucknowense時,信號序列最好是金孢屬的信號序列,金孢屬菌株分泌的蛋白量異常地高,當然來自這些株系的信號序列讓人感興趣。來自絲狀真菌和酵母的信號序列,也許和非真菌的信號序列一樣有用。
按照本發明的任意實施方式,轉化的重組真菌宿主可以進一步攜帶一個選擇標記。此選擇標記可用來選擇轉化或轉染細胞。選擇標記通常編碼一種基因產物,進而導致宿主產生不同于非轉化細胞的特定類型的抗性。通常可以是對重金屬的抗性、抗生素或殺生劑抗性。原養型是非抗生素變種的一種有用選擇型標記。自養型標記導致宿主產生營養缺陷,而糾正這些缺陷的基因可以用來作為選擇的標記。經常使用的抗性和自養選擇標記是amdS(已酰胺酶)、hph(潮霉素磷酸轉移酶)、pyrG(乳清酸核苷-5’-磷酸脫羧酶)、pyr(乳清酸P-核糖轉移酶)、trpC(鄰氨基苯甲酸合成酶)、argB(鳥氨酸氨甲酰基轉移酶)、sC(硫酸腺苷轉移酶)、bar(膦絲菌素乙酰轉移酶)、niaD(硝酸還原酶)、Sh-ble(博來霉素-腐草霉素抗性)、突變的乙酰乳酸合成酶(磺酰脲抗性)、新霉素磷酸轉移酶(氨基糖苷抗性)。金孢屬菌株最好的選擇標記是乳清酸P-核糖轉移酶。選擇標記單獨在一個載體上或者選擇標記和要表達異源蛋白的核酸序列在同一片段上,都能通過共轉化進行選擇。
可以通過使用AMA1復制子序列進一步提高轉化效率,這對Aspergillus niger(Verdoes等,Gene 146159-165(1994))是有用。該序列導致許多絲狀真菌的轉化效率增加10-100倍。另外,導入的DNA不整合到真菌的基因組中,而是以多拷貝、自主的形式保留在真菌細胞里。這對本發明中的高通量篩選方法有利,因為非整合狀態減少不同轉化子在基因表達水平上的差異。此外,因為導入的DNA不重組到宿主DNA中,宿主基因組不會發生非目的突變。借助于載體如AMA1的自主復制或在真菌端粒序列促進下的自主復制,外源基因得以均一表達。(參見A.Alesenko和L.Ivaniva,Mol.Gen.Genet.1998 260159-164.)本發明中使用的術語“異源蛋白”一詞,是指不能在本發明的宿主菌株中正常表達或分泌的蛋白質或多肽。異源蛋白既可來自原核生物,也可開自真菌、植物、昆蟲、或來自諸如哺乳動物的高等動物。對于藥物篩選目的,則人蛋白是首選,因此一個優選的實施方式是DNA文庫屬于人源的宿主。因此這樣一些實施方式也被認為是本發明的適當實施例。
用本發明的絲狀真菌表達人的基因,即來源于人基因組文庫的基因,有許多理由期望得到有效表達。現在知道人的基因平均大小為3000-5000bp,人的內含子平均為75-150bp(總范圍分布在40至>50000),絲狀真菌的內含子為40-75bp,但它們能處理堿基數高達500bp的內含子。人每個基因平均有3-5個內含子(M.Deutsch,M.Long,Nucl.Acids Res.1999273219-3228;見表B)。已知人的信號序列在真菌中也能正常工作。基于上述理由,很可能大量人基因可用本發明的方法高水平表達和分泌。
表B
本發明的方法有望對來自原核和真核基因組的DNA文庫的表達有所幫助。如上所述,該方法可以用來表達和檢測分泌及細胞內蛋白,而且適應于多種基因和蛋白的情況。
本發明的另一方面包括構建和篩選真菌突變體庫以及通過本發明方法構建的真菌突變體庫。可以應用本領域技術人員熟知的方法,利用任何整合或非整合方法,轉化本發明的真菌宿主得到上述突變體庫。通過優選宿主菌株形成的真菌庫可以用微量和/或高通量模式篩選方法處理和篩選外源蛋白的所需活性或特性。目的特性或活性意味著與文庫中基因的外源蛋白有關的任何物理的、生理化學的、化學的、生物學的或催化特性,或所述特性的任何增加、減少及改進。該文庫還可以篩選由于外源蛋白和/或內源蛋白的存在而產生的代謝物、或與代謝物有關的特性或活性。該文庫還可以用來篩選蛋白或代謝產物的量增加或減少的真菌。
在本發明的再一方面,轉化的真菌文庫可以用來篩選具有所需特性的真菌代謝物的存在。例如,這些代謝產物包括聚酮化合物、生物堿、和萜類天然產物。多基因或基因簇(操縱子)預期能轉導入本發明的宿主細胞中,而且不會因為編碼的酶的活性而在宿主細胞中產生非蛋白產物。例如,已經公開編碼生產lovastatin所必需的蛋白的DNA就能轉入Aspergillus oryzae(US 5362638;也可參見US 5849541)。
在本發明的另一個實施方式中,真菌轉化文庫可以用來篩選與目標核酸探針雜交的DNA的存在。在這個實施方式中,外源蛋白的表達和/或分泌并非必需的,盡管這通常是期望的。其中蛋白表達不是必須的,可以理解載體上的調控序列也不是必須的。
在本發明的再一個實施方式中,真菌轉化文庫可以用來篩選真菌本身的某些期望特性,如真菌對物理、化學極端環境條件的耐受性或產生、修飾、降解或代謝目的物質的能力。此類期望特性也許歸功于單個外源蛋白的存在、也許沒有關系。當被用作定向進化過程的一部分時,該實施方式將會非常有用。
異源DNA可以是利用多種已知的方法從生物樣品制備的基因組DNA或cDNA。生物樣品可以是環境中取樣(如混合肥料、森林垃圾、土壤、海水或新鮮水),或通過提取、過濾或離心或其它富集方法得到的樣品。從環境中得到的樣品進行的微生物混合培養也能拿來應用。生物樣品也可以來自單個物種的生物,如培養的微生物,或植物,昆蟲,或諸如哺乳動物的其它動物。另外,外源DNA可以是合成的或半合成的,如隨機DNA片段或經過重組的、突變過的或其它方式改變過的DNA片段。一個半合成核酸庫的例子參見Wagner等,WO 00/0632。從環境中取樣(或其混合培養物)的DNA對發現新蛋白十分有利,而從單一物種得來的DNA則有下列優點(1)更加明智地選擇合適的載體;和(2)如果已經鑒別了一種感興趣的蛋白,操作者可以直接對相關或類似的物種進行深入的篩選。
和傳統的真菌宿主相比較,呈現致密絲狀形態的UV 18-25的金孢屬菌株的轉化、表達和分泌率驚人地高。根據本發明,重組菌株最好為這種形態。然而本發明也覆蓋呈現這類特性的非重組菌株或通過其它方式得到的工程菌。本發明的另一吸引人的方面是,使用在相應或等同培條件下比NG7C-19菌株、最好比UV18-25粘性低的金孢屬菌株。我們測量了UV18-25培養物的粘度低于10cP,相比之下,已知Trichoderma reesei的粘度為200-600cP,而傳統的Aspergillus niger在最理想的培養條件下的發酵中期和晚期,粘度為1500-2000cP。因此,本發明可以使用具有低粘性的任何工程或突變絲狀真菌,如金孢屬的UV18-25(VKM F-3631D)菌株,木霉屬X252菌株,A.sojae pclA菌株(源自ATCC 11906)或A.nigerpclA。
絲狀真菌培養物的流動性可以在從近乎半固體到自由流動的液體的較寬范圍內變化,粘性可以用Brookfield旋轉粘度計、運動粘度試管、落球式粘度儀或杯狀粘度儀輕而易舉地進行定量。培養液為非牛頓型發酵液,總體粘性在某種程度上和收率相關(Goudar等,Appl.Microbiol.Biotechnol.1999 51310-315),本發明應用的低粘性培養物這種效應非常不明顯。
應用這種低粘性的培養物對篩選本發明方法的表達文庫十分有利。絲狀真菌中表達的DNA文庫的篩選曾受相對低效和煩瑣的方法所限制。通常,真菌一旦轉化(和任意選擇的轉化體),就必須制備孢子或分生胞子,或機械地打斷菌絲體,以便將轉化的真菌分散為單個生物,進一步培養成克隆化克隆或培養物。然后稀釋孢子、分生胞子或菌絲體,在標準平板上鋪開,對單個克隆進行顏色、對底物變化的檢查、驗證要尋找的蛋白特性或活性導致的其它可檢測的指標。另外,可以將分泌蛋白印跡到膜上,然后用對膜上因存在目的蛋白活性或特性而產生的標記進行搜索或檢測。應用膜的方法對那些存在降解問題的外源蛋白十分有用(Asgeirsdottir等,Appl.Environ.Microbiol.1999,652250-252)。這些操作的勞動強度大,尚未證明易于實現自動化,因此,對傳統絲狀真菌中真菌表達蛋白的檢測尚未實現高通量檢測。本申請中,高通量篩選就是指用部分、或全部自動化的篩選方法,即所述篩選方法一天能評估1,000個或更多轉化體所表達的蛋白,優選指一天能評估5,000個或更多轉化子所表達蛋白的方法,更優選一天能評估10,000個或更多轉化子所表達蛋白的方法。
根據本發明,對轉化真菌文庫的高通量自動化篩選,可以用許多已知方法進行。對細菌或酵母適用的方法通常也適用于本發明的低粘性真菌。低粘度真菌通過可轉移的復制單元的作用,使要用的突變菌絲體變得相對不再纏繞。在自動高通量篩選的機械操作時,突變的真菌和/或它們的可轉移的復制單元行為方面在本質上和單個細菌或酵母類似。這和野生型真菌、許多工業上馴化的真菌產生纏繞的菌絲、彼此之間不能分離的情況形成鮮明的對比。
例如,根據本發明,轉化真菌的稀釋懸浮液可以通過機械微量加樣器加到96孔微量反應板上。能向384孔和1536孔反應板加樣的液體裝置也可以用來向微量反應板添加微生物。懸浮的微生物的濃度可以根據需要進行調整,以便使每孔微生物(或其它的可轉移復制單元)控制在平均數量上。最好反應孔內有多個微生物,對孔內的物質進行稀釋、再培養為單個克隆化克隆或培養后,然后鑒別孔內目的蛋白的活性和性質。這樣以來,系統的總處理能力就會增加,但以需要對每孔的物質進行鑒定而增加的“干擾”為代價。
本發明另外還包括,在液體流通途徑中,可以加進去一個細胞分選器,根據分揀室的檢測結果將培養物流向微量反應板不同的孔內。這可以準確地將一個細胞分到一個孔內,對鑒別轉化子十分有用,因為本方法允許熒光激活的細胞分選器自動選擇轉化子。
在另一個實施方式中,固體培養基上生長的克隆可以用自動菌落挑選器挑選菌落,并且將微生物轉移到微量培養板。每孔只有單個的菌落生長。
分散的微生物在微量反應板上長成克隆培養物。誘導劑、營養物等用自動液體分流系統按要求添加。這套系統也可用于添加檢測目的蛋白的活性或特性所需要的試劑。例如,添加發光或熒光底物可用于分光光度檢測或熒光檢測酶的活性。微孔中培養物的低粘性和液面下生長的習性使試劑在培養物中擴散很快,大大地增加了分析的靈敏度和可靠性。氧和氮的擴散也得到了加強,保證了菌體的快速生長、外源蛋白表達和分泌的增加。某些分析方法,如閃爍親近測定法,依賴于液體成分的擴散才能達到平衡狀態;本發明中真菌的低粘性才能使高通量的檢測成為可能。最后,對一個高度自動化系統,希望具有自動挑選菌落、供氣、從微量反應板微孔中將目的克隆吸出的功能,而低粘性和在液面下生長習性才使這成為可能。就傳統的絲狀真菌培養物的粘性,尤其是培養物在微量培養板上長成攪不動、剪不開的一團的問題,使上述操作十分困難或者根本不可能。
在另一個實施方式中,單個細胞通過微量液體裝置時,可就感興趣的特性或活性進行光學檢測(Wada等,WO99/67639)。低粘性對微量液體設備是必須的,本發明的培養物的低粘度就是為了適合微量液體操作。Short等在美國專利6,174,673中描述了如何利用熒光底物檢測感興趣的酶的活性,及如何利用宿主細胞表達的此活性來用熒光激活的細胞分選器分離細胞。本發明的方法和這種表達蛋白的鑒別方法是一致的。
本發明中,當轉化子攜帶有熒光蛋白作為標記時,熒光可以定量,也可以作為基因表達或/和特定培養中表達蛋白的度量。在該實施方式中,即可以檢測感興趣的外源蛋白,也可以估計特定蛋白的活性,正如Blyna等在WO 00/78997中描述的那樣。當本發明的篩選方法用作定向進化過程的一部分時,該實施方式將特別優選。
在較大粘性可以接受的情況下,培養真菌時用膠形成基質具有一定的優勢,正如Bochner在美國6,046,021專利中描述的那樣,在微量板上進行生化分析。
另一類篩選方法為光度測量分析,利用數字成像分光光度法,對生長在固體物質上的許多單個菌落進行篩選。參見Youvan等在1994,Meth.Enzymol.246732-748所述。在此方法中,特定試劑的總吸光值或發射光譜的變化代表了異源目的蛋白活性或性質的存在。本發明的變異真菌具有弱側向生長趨勢,在固體培養基上形成光滑的、致密且輪廓清晰的菌斑,對這種篩選系統有利。再者,和細菌相比,真菌的較好的表達和分泌特性可以提供較大數量的蛋白供光度分析。
在
發明者彼得·揚·蓬特, 科妮莉亞·范塞爾, 科爾內留斯·范登洪德 申請人:馬克·阿龍·埃馬爾法爾布