專利名稱::具有纖維素分解增強活性的多肽和編碼該多肽的多核苷酸的制作方法
技術領域:
:本發明涉及具有纖維素分解增強活性的分離的多肽和編碼所述多肽的分離的多核苷酸。本發明還涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞,以及用于產生和使用所述多肽的方法。相關領域描述纖維素是單糖葡萄糖通過β-1,4-鍵共價連接的聚合物。許多微生物產生水解β-連接的葡聚糖的酶。這些酶包括內切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。內切葡聚糖酶在隨機位置消化纖維素聚合物,將其打開(openingit)以受到纖維二糖水解酶攻擊(attack)。纖維二糖水解酶繼而從纖維素聚合物的末端釋放纖維二糖的分子。纖維二糖是水溶性的β-1,4-連接的葡萄糖二聚體。葡糖苷酶將纖維二糖水解成葡萄糖。將含木質纖維素原料(lignocellulosicfeedstock)轉化為乙醇具有以下優勢大量原料現成可用,避免燃燒或填埋材料的合意性和乙醇燃料的清潔性。木材、農業殘余物、草本作物和城市固體廢物被認為是用于乙醇生產的原料。這些材料主要由纖維素、半纖維素和木質素組成。一旦將纖維素轉化成葡萄糖,葡萄糖將容易地由酵母發酵成乙醇。本領域中有利的是改進的轉化含纖維素原料的能力。WO2005/074647公開了具有纖維素分解增強活性的分離的多肽和它的來自土生梭孢霉(Thielaviaterrestris)的多核苷酸。WO2005/074656公開了具有纖維素分解增強活性的分離的多肽和它的來自嗜熱子囊菌(Thermoascusaurantiacus)的多核苷酸。WO2007/089290公開了具有纖維素分解增強活性的多肽和它的來自里氏木霉(Trichodermareesei)的多核苷酸。本發明涉及具有纖維素分解增強活性的多肽和編碼該多肽的多核苷酸。發明概述本發明涉及具有纖維素分解增強活性的分離的多肽,所述多肽選自下組(a)多肽,其包含氨基酸序列,所述氨基酸序列與SEQIDNO2或SEQIDNO4的成熟多肽具有至少60%同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在至少中嚴緊條件下與以下雜交(i)SEQIDNO1或SEQIDNO3的成熟多肽編碼序列,(ii)包含于SEQIDNO1或SEQIDNO3的成熟多肽編碼序列中的cDNA序列,或(iii)(i)或(ii)的全長互補鏈;(c)多肽,其由包含核苷酸序列的多核苷酸編碼,所述核苷酸序列與SEQIDNO=I或SEQIDNO3的成熟多肽編碼序列具有至少60%同一性;和(d)SEQIDNO:2或SEQIDNO:4的包含取代、缺失和/或插入一個或多個(數個)氨基酸的成熟多肽的變體。本發明還涉及編碼具有纖維素分解增強活性的多肽的分離的多核苷酸,所述多核苷酸選自下組(a)多核苷酸,其編碼包含氨基酸序列的多肽,所述氨基酸序列與SEQIDNO2或SEQIDNO4的成熟多肽具有至少60%同一性;(b)多核苷酸,其在至少中嚴緊條件下與以下雜交(i)SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列,(ii)包含于SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列中的cDNA序列或(iii)⑴或()的全長互補鏈;(c)多核苷酸,其包含核苷酸序列,所述核苷酸序列與SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列具有至少60%同一性;和(d)多核苷酸,其編碼SEQIDNO:2或SEQIDNO4的成熟多肽的包含取代、缺失和/或插入一個或多個(數個)氨基酸的變體。本發明還涉及包含所述多核苷酸的核酸構建體、重組表達載體和重組宿主細胞,和產生具有纖維素分解增強活性的多肽的方法。本發明還涉及抑制多肽在細胞中表達的方法,所述多肽具有纖維素分解增強活性,方法包括對細胞施用雙鏈RNA(dsRNA)分子或在細胞中表達雙鏈RNA(dsRNA)分子,其中dsRNA包括本發明的多核苷酸的亞序列。本發明還涉及這種雙鏈抑制性RNA(dsRNA)分子,其中任選地dsRNA是siRNA或miRNA分子。本發明還涉及用于降解或轉化纖維素材料的方法,其包括在存在具有纖維素分解增強活性的多肽的情況下,用纖維素分解酶組合物處理纖維素材料,其中與不存在具有纖維素分解增強活性的多肽相比,具有纖維素分解增強活性的多肽的存在增加纖維素材料的降解。本發明還涉及產生發酵產物的方法,其包括(a)在存在具有纖維素分解增強活性的多肽的情況下用纖維素分解酶組合物糖化纖維素材料,其中與不存在具有纖維素分解增強活性的多肽相比,具有纖維素分解增強活性的多肽的存在增加纖維素材料的降解;(b)用一種或多種發酵微生物發酵步驟(a)的糖化的纖維素材料以產生發酵產物;和(C)從發酵回收發酵產物。本發明還涉及發酵纖維素材料的方法,其包括用一種或多種發酵微生物發酵纖維素材料,其中在存在本發明的具有纖維素分解增強活性的多肽的情況下,用纖維素分解酶組合物水解纖維素材料,并且與不存在具有纖維素分解增強活性的多肽相比,具有纖維素分解增強活性的多肽的存在增加纖維素材料的水解。本發明還涉及包含分離的多核苷酸的植物,所述多核苷酸編碼具有纖維素分解增強活性的多肽。本發明還涉及用于產生具有纖維素分解增強活性的多肽的方法,其包括(a)在有益于產生該多肽的條件下培養包含多核苷酸的轉基因植物或植物細胞,所述多核苷酸編碼具有纖維素分解增強活性的多肽;和(b)回收所述多肽。本發明進一步涉及包含編碼蛋白質的基因的核酸構建體,其中將所述基因可操作地連接于編碼信號肽的核苷酸序列,所述信號肽包含SEQIDNO2的氨基酸1至17或SEQIDNO4的氨基酸1至15,或由SEQIDNO2的氨基酸1至17或SEQIDNO4的氨基酸1至15組成,其中所述基因對于核苷酸序列是外源的。附圖簡述圖1顯示具有纖維素分解增強活性的嗜熱毀絲霉CBS202.75GH61A多肽的基因組DNA序列和推定的氨基酸序列(分別為SEQIDNO=I和2)。圖2顯示pSMail90的限制圖譜。圖3顯示具有纖維素分解增強活性的嗜熱毀絲霉CBS202.75GH61F多肽的基因組DNA序列和推定的氨基酸序列(分別為SEQIDNO3和4)。圖4顯示pSMail92的限制圖譜。圖5顯示pSMail85的限制圖譜。圖6顯示pSMail98的限制圖譜。圖7顯示具有纖維素分解增強活性的嗜熱毀絲霉CBS202.75GH61A和GH61F多肽對經過預處理的玉米秸稈的酶水解的影響。定義纖維素分解增強活性術語“纖維素分解增強活性”在本文中定義為增強具有纖維素分解活性的蛋白質對纖維素材料的水解的生物學活性。就本發明而言,通過測量由纖維素酶蛋白在下述條件下水解纖維素材料所導致的還原糖增加或纖維二糖與葡萄糖的總量增加來確定纖維素分解增強活性l_50mg總蛋白/gPCS中的纖維素,其中總蛋白包含80-99.5%w/w的纖維素酶蛋白/gPCS中的纖維素,及0.5-20%w/w的具有纖維素分解增強活性的蛋白質,在50°C歷時1-7天,與用等量的總蛋白加載量而無纖維素分解增強活性(l-50mg纖維素酶蛋白/gPCS中的纖維素)所進行的對照水解相比。在一個優選的方面,在總蛋白重量的3%的米曲霉β-葡糖苷酶(根據WO02/095014在米曲霉中重組產生)或者總蛋白質量的3%的煙曲霉β-葡糖苷酶(根據WO02/095014的實施例22在米曲霉中重組產生)存在下使用CELLUCLASI1.5L(NovozymesA/S,Bagsvaerd,Denmark)的混合物作為纖維素分解活性的來源。本發明的具有纖維素分解增強活性的多肽具有SEQIDNO2或SEQIDNO4的成熟多肽的纖維素分解增強活性的優選至少20%,更優選至少40%,更優選至少50%,更優選至少60%,更優選至少70%,更優選至少80%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少100%。具有纖維素分解增強活性的多肽通過降低達到相同水解水平所需的纖維素分解酶的量而增強由具有纖維素分解活性的蛋白質催化的纖維素材料的水解,優選降低至少0.1倍,更優選至少0.2倍,更優選至少0.3倍,更優選至少0.4倍,更優選至少0.5倍,更優選至少1倍,更優選至少3倍,更優選至少4倍,更優選至少5倍,更優選至少10倍,更優選至少20倍,甚至更優選至少30倍,最優選至少50倍,并且甚至最優選至少100倍。纖維素分解活性術語“纖維素分解活性”在本文中定義為可以水解纖維素材料的生物活性。纖維素分解蛋白可以水解羧甲基纖維素(CMC),從而降低溫育混合物的粘度。通過振動粘度計(例如,來自Sofraser,France的MIVI3000)可以測定粘度的降低。纖維素酶活性的測定,其以纖維素酶粘度單位(CEVU)測定,可以通過測定樣品的降低羧甲基纖維素(CMC)溶液粘度的能力而將樣品中存在的催化活性的量定量。在適于纖維素分解蛋白和底6物的溫度和PH進行實驗。對于CELLUCLAST(NovozymesA/S,Bagsvaerd,Denmark),實驗在40°C在0.IM磷酸鹽pH9.O緩沖液中進行30分鐘,以CMC為底物(33.3g/L羧甲基纖維素Hercules7LFD),并且酶濃度約3.3-4.2CEVU/ml。相對于確定的酶標準品,如CELLUZYME標準品17-1194(獲得自NovozymesA/S,Bagsvaerd,Denmark)計算CEVU活性。就本發明而言,通過測定下述條件下由于纖維素分解混合物對纖維素材料水解的增加而確定纖維素分解活性=I-IOmg纖維素分解蛋白/gPCS中的纖維素,在50°C5-7天,與不加纖維素分解蛋白的對照水解相比較。內切葡聚糖酶術語“內切葡聚糖酶”在本文中定義為內切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(endo-l,4-0-D-glucan4-glucanohydrolase)(Ε.C.No.3.2.1.4),其催化纖維素、纖維素衍生物(例如羧甲基纖維素和羥乙基纖維素)、地衣淀粉(Iichenin)中的1,4_β-D-糖苷鍵、混合的β_1,3葡聚糖例如谷類β-D-葡聚糖或木葡聚糖和含有纖維素成分的其它植物材料中的β_1,4鍵的內水解(endohydrolysis)。就本發明而言,根據Ghose,1987,PureandApp1.Chem.59:257_268的方法,使用羧甲基纖維素(CMC)水解來測定內切葡聚糖酶活性。纖維二糖水解酶術語“纖維二糖水解酶”在本文中定義為l,4-i3_D-葡聚糖纖維二糖水解酶(1,4-beta-D-glucancellobiohydrolase)(Ε.C.No.3.2.1.91),其催化纖維素、纖維素寡糖,或任何包含β-1,4-連接葡萄糖的聚合物中的l,4-i3-D-糖苷鍵的水解,從鏈的還原或非還原末端釋放纖維二糖。就本發明而言,根據Lever等,1972,Anal.Biochem.47273-279禾口vanTilbeurgh等,1982,FEBSLetters149152—156;vanTilbeurgh和Claeyssens,1985,FEBSLetters187:283_288描述的方法測定纖維二糖水解酶活性。在本發明中,使用Lever等的方法評價玉米秸稈中纖維素的水解,而使用vanTilbeurgh等的方法確定對于熒光二糖衍生物的纖維二糖水解酶活性。β-葡糖苷酶術語“β-葡糖苷酶”在本文中定義為β-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(Ε.C.No.3.2.1.21),其催化末端非還原β-D-葡萄糖殘基的水解,并釋放β-D-葡萄糖。就本發明而言,根據Venturi等,2002,J.BasicMicrobiol.42:55_66描述的基本方法測定β_葡糖苷酶活性,只是使用于本文所述不同的條件。一個單位的β-葡糖苷酶活性定義為在50°C,pH5,以4mM對硝基苯基-β-D-葡糖吡喃糖苷酶為底物,在IOOmM檸檬酸鈉,0.01%TWEEN20中每分鐘產生1.O微摩爾對硝基苯。家族61糖苷水解酶術語“家族61糖苷水解酶”或“家族GH61”在本文中定義為根據HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309_316,及HenrissatB·,禾口BairochΑ.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316695-696屬于糖苷水解酶家族61的多肽。目前,Henrissat將GH61家族列為未分類,這說明性質,如機制、催化親和試劑/堿、催化質子受體和3-D結構對于屬于此家族的多肽而言是未知的。纖維素材料纖維素材料可以是包含纖維素的任何材料。生物質初生細胞壁(primarycellwall)中的主要多糖是纖維素,其次最豐富的是半纖維素,而第三是果膠。次生細胞壁(secondarycellwall)在細胞停止生長后產生,其同樣含有多糖并通過共價交聯至半纖維素的聚合木質素而加強。纖維素是脫水纖維二糖的均聚物,并且因此是線性β-(l-4)-D-葡聚糖,而半纖維素包括多種化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的復雜分支結構。盡管通常是多形的,存在于植物組織中的纖維素主要作為平行葡聚糖鏈的不溶晶體基質。半纖維素通常與纖維素以及其它半纖維素以氫鍵相連,其幫助穩定細胞壁基質。纖維素通常在,例如,植物的莖、葉、殼、皮和穗軸,或樹的葉、枝和木材。纖維素材料可以是,但不限于,草本材料、農業殘余物、林業殘余物、城市固體廢物、廢紙和紙漿與造紙廠殘余物。纖維素材料可以是任何類型的生物質,包括,但不限于,木材資源、城市固體廢物、廢紙、作物和作物殘余物(參見,例如,Wiselogel等,1995,于HandbookonBioethanol(CharlesΕ·Wyman編),pp.105-118,Taylor&Francis,WashingtonD.C.;ffyman,1994,BioresourceTechnology503-16;Lynd,1990,AppliedBiochemistryandBiotechnology24/25:695_719;Mosier等,,1999,RecentProgressinBioconversionofLignocellulosics,于AdvancesinBiochemicalEngineering/Biotechnology,T.Sch印er主編,Volume65,pp.23-40,Springer-Verlag,NewYork)。在本文中應理解的是,纖維素可以是任何形式的木質纖維素,在混合基質中包含木質素、纖維素和半纖維素的植物細胞壁。在一個優選的方面,纖維素材料是木質纖維素。在一個方面,纖維素材料是草本材料。在另一個方面,纖維素材料是農業殘余物。在另一個方面,纖維素材料是林業殘余物。在另一個方面,纖維素材料是城市固體廢物。在另一個方面,纖維素材料是廢紙。在另一個方面,纖維素材料是紙漿和造紙廠殘余物。在另一個方面,纖維素材料是玉米秸稈。在另一個優選的方面,纖維素材料是玉米纖維。在另一個方面,纖維素材料是玉米穗軸。在另一個方面,纖維素材料是橙皮。在另一個方面,纖維素材料是稻谷秸桿。在另一個方面,纖維素材料是小麥秸桿。在另一個方面,纖維素材料是柳枝稷(switchgrass)。在另一個方面,纖維素材料是芒草屬。在另一個方面,纖維素材料是甘蔗渣。在另一個方面,纖維素材料是微晶纖維素。在另一個方面,纖維素材料是細菌纖維ο纖維素材料可以直接使用或進行預處理,使用本領域已知的傳統方法,如本文所述。在一個優選的方面,預處理纖維素材料。預處理的玉米秸稈術語“PCS”或“預處理的玉米秸稈“在本文中定義為通過用熱和稀酸處理而源自玉米秸稈的纖維素材料。分離的多肽術語“分離的多肽”用于本文中指從來源分離的多肽。在一個優選的方面,多肽如通過SDS-PAGE測定的,為至少純,優選至少5%純,更優選至少10%純,更優選至少20%純,更優選至少40%純,更優選至少60%純,甚至更優選至少80%純,并且最優選至少90%純。基本上純的多肽術語“基本上純的多肽”在本文表示多肽制備物,所述多肽制備物含有按重量計至多10%,優選至多8%,更優選至多6%,更優選至多5%,更優選至多4%,更優選至多3%,甚至更優選至多2%,最優選至多1%,并且甚至最優選至多0.5%的與其天然或重組結合的(associated)的其它多肽材料。因此,優選所述基本上純的多肽是按存在于制備物中的全部多肽材料的重量計至少92%純,優選至少94%純,更優選至少95%純,更優選至少96%純,更優選至少96%純,更優選至少97%純,更優選至少98%純,甚至更優選至少99%純,最優選至少99.5%純,并且甚至最優選100%純。本發明的多肽優選是基本上純的形式。具體而言,優選所述多肽是“基本上(essentially)純的形式”,即,所述多肽制備物基本上(essentially)不合與其天然或重組結合的其它多肽材料。例如,這能夠通過以下實現通過公知的重組方法或由經典純化方法制備多肽。成熟多肽術語“成熟多肽”在本文中定義為以其在翻譯和任何翻譯后修飾之后的最終形式存在的多肽,所述修飾例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一個優選的方面,SignalP軟件(Nielsen等,1997,ProteinEngineering10:1_6)預測SEQIDNO2的氨基酸1至17是信號肽,根據該預測,成熟多肽是SEQIDNO2的氨基酸18至232。在另一個優選的方面,SignalP軟件預測SEQIDNO4的氨基酸1至15是信號肽,根據該預測,成熟多肽是SEQIDNO4的氨基酸16至235。成熟多肽編碼序列術語“成熟多肽編碼序列”在本文中定義為編碼具有纖維素分解增強活性的成熟多肽的核苷酸序列。在一個優選的方面,SignalP軟件預測SEQIDNO=I的核苷酸1至51編碼信號肽,根據該預測,成熟多肽編碼序列是SEQIDNO1的核苷酸52至921。在另一個優選的方面,SignalP軟件預測SEQIDNO3的核苷酸1至45編碼信號肽,根據該預測,成熟多肽編碼序列是SEQIDNO3的核苷酸46至851。同一性參數“同一性”描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關性。就本發明而言,兩個氨基酸序列之間的同一性程度通過Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)使用EMBOSS軟件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16276-277)的Needle程序來測定,優選3.0.0版或更高版本。使用的可選參數為缺口罰分(gappenalty)10,缺口延伸罰分(gapextensionpenalty)0·5和EBL0SUM62(BL0SUM62的EMBOSS版)取代矩陣。使用Needle標記為“最高同一性(longestidentity)”的輸出結果(使用-nobrief選項獲得)作為同一性百分比,并計算如下(同樣的殘基X100)/(比對長度-比對中缺口的總數)就本發明而言,兩個核苷酸序列之間的同一性程度通過Needleman-Wunsch算法(Needleman和Wunsch,1970,見上文)使用EMBOSS軟件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,見上文)的Needle程序來測定,優選3.0.0版或更高版本。使用的可選參數為缺口罰分10,缺口延伸罰分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩陣。使用Needle標記為“最高同一性”的輸出結果(使用-nobrief選項獲得)作為同一性百分比,并計算如下(同樣的脫氧核糖核苷酸X100)/(比對長度-比對中缺口的總數)同源序列術語“同源序列”在本文中定義為在用SEQIDNO2或SEQIDNO4的具有纖維素分解增強活性的嗜熱毀絲霉多肽進行的tfasty搜索(Pearson,W.R.,1999,于BioinformaticsMethodsandProtocols中,S.Misener禾口S.A.Krawetz編,pp.185-219)中E值(或期望值)小于0.001的預測蛋白質。多肽片段術語“多肽片段”在本文中定義為從SEQIDNO:2或SEQIDNO:4的成熟多肽或其同源序列的氨基和/或羧基末端缺失一個或多個(數個)氨基酸的多肽;其中所述片段具有纖維素分解增強活性。在一個優選方面,片段含有SEQIDNO:2的成熟多肽或其同源序列的至少185個氨基酸殘基,更優選至少195個氨基酸殘基,并且最優選至少205個氨基酸殘基。在另一個優選的方面,片段含有SEQIDNO:4的成熟多肽或其同源序列的至少190個氨基酸殘基,更優選至少200個氨基酸殘基,并且最優選至少210個氨基酸殘基。亞序列術語“亞序列(subsequence)”在本文中定義為從SEQIDNO:1或SEQIDNO3或其同源序列的5’和/或3’端缺失一個或多個(數個)核苷酸的核苷酸序列;其中所述亞序列編碼具有纖維素分解增強活性的多肽片段。在一個優選方面,亞序列含有SEQIDNO1的成熟多肽編碼序列或其同源序列的至少555個核苷酸,更優選至少585個核苷酸,并且最優選至少615個核苷酸。在另一個優選方面,亞序列含有SEQIDNO3的成熟多肽編碼序列或其同源序列的至少570個核苷酸,更優選至少600個核苷酸,并且最優選至少630個核苷酸。等位變體(allelicvariant)術語“等位變體”在本文中表示占據相同染色體基因座的基因的任何兩種或兩種以上可選形式。等位變異通過突變天然地發生,并且可導致種群內的多態性。基因突變可以是沉默的(在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。分離的多核苷酸術語“分離的多核苷酸”用于本文中指從來源分離的多核苷酸。在一個優選的方面,多核苷酸如通過瓊脂糖電泳測定的,為至少純,優選至少5%純,更優選至少10%純,更優選至少20%純,更優選至少40%純,更優選至少60%純,甚至更優選至少80%純,并且最優選至少90%純。基本上純的多核苷酸術語“基本上純的多核苷酸”用于本文指不含其它外來的或不期望的核苷酸的多核苷酸制備物,并且所述多核苷酸制備物處于適合于在遺傳工程的蛋白質生產體系中使用的形式。因此,基本上純的多核苷酸含有按重量計至多10%,優選至多8%,更優選至多6%,更優選至多5%,更優選至多4%,更優選至多3%,甚至更優選至多2%,最優選至多1%,并且甚至最優選至多0.5%的與其天然或重組結合的其它多核苷酸材料。然而,基本上純的多核苷酸可以包括天然存在的5’和3’非翻譯區,例如啟動子和終止子。優選基本上純的多核苷酸是按重量計至少90%純,優選至少92%純,更優選至少94%純,更優選至少95%純,更優選至少96%純,更優選至少97%純,甚至更優選至少98%純,最優選至少99%,并且甚至最優選至少99.5%純的。本發明所述多核苷酸優選為基本上純的形式。具體而言,優選在本文公開的多核苷酸是“基本上(essentially)純的形式”,即,所述多核苷酸制備物基本上不含與其天然或重組結合的其它多核苷酸材料。所述多核苷酸可以是基因組、cDNA、RNA、半合成、合成來源的,或它們的任何組合。編碼序列當用于本文時術語“編碼序列”的意思是直接指定其蛋白產物的氨基酸序列的核苷酸序列。編碼序列的邊界通常由開讀框決定,所述開讀框通常以ATG起始密碼子或可供選擇的起始密碼子例如GTG和TTG開始,并且以終止密碼子例如TAA、TAG和TGA結束。編碼序列可以是DNA、cDNA或重組核苷酸序列。cDNA:術語“cDNA,,在本文中定義為能夠通過反轉錄從得自真核細胞的成熟的、已剪接的mRNA分子制備的DNA分子。cDNA缺少通常存在于相應基因組DNA中的內含子序列。起始的(initial)、初級的RNA轉錄物是mRNA的前體,其通過一系列的步驟加工然后作為成熟的已剪接的mRNA出現。這些步驟包括通過稱為剪接的過程去除內含子序列。因而源自mRNA的cDNA沒有任何內含子序列。核酸構建體術語“核酸構建體”用于本文指單鏈或雙鏈的核酸分子,所述核酸分子分離自天然存在的基因,或將所述核酸分子以本來不存在于(nototherwiseexist)自然界中的方式修飾以含有核酸的區段。當所述核酸構建體含有表達本發明的編碼序列所需的調控序列時,術語核酸構建體與術語“表達盒”同義。調控序列(controlsequence)術語“調控序列”在本文定義為包括對編碼本發明多肽的多核苷酸表達是必需的或有利的所有成分。各個調控序列對于編碼所述多肽的核苷酸序列可以是天然的或外源的,或各個調控序列對于彼此可以是天然的或外源的。這些調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。最少的情況,調控序列包括啟動子和轉錄和翻譯的終止信號。調控序列可以和用于引入特異性限制位點的接頭一起提供,所述特異性限制位點促進調控序列與編碼多肽的核苷酸序列編碼區的連接。可操作地連接術語“可操作地連接”在本文表示這樣的構型,其中將調控序列置于相對于多核苷酸序列的編碼序列的適當位置,使得調控序列指導多肽編碼序列的表達。表達術語“表達”包括涉及多肽產生的任何步驟,其包括但不限于轉錄、轉錄后修飾、翻譯、翻譯后修飾和分泌。表達載體術語“表達載體”在本文定義為線性的或環狀的DNA分子,其包含編碼本發明多肽的多核苷酸,并且所述多核苷酸與提供用于其表達的額外核苷酸可操作地連接。宿主細胞如本文中所使用的術語“宿主細胞”包括任何細胞類型,所述細胞類型對于使用包含本發明多核苷酸的核酸構建體或表達載體的轉化、轉染、轉導等是易感的(susceptible)。修飾術語“修飾”在本文的意思是,對由SEQIDNO2或SEQIDNO4的成熟多肽組成的多肽或其同源序列的任何化學修飾,以及對編碼所述多肽的DNA的遺傳操作。所述修飾可以是一個或多個(數個)氨基酸的取代、缺失和/或插入,以及一個或多個(數個)氨基酸側鏈的置換。人工變體當用在本文時,術語“人工變體”的意思是具有纖維素分解增強活性的多肽,所述多肽由表達SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列或其同源序列的修飾的核苷酸序列的生物體產生。所述修飾的核苷酸序列通過人為干預(humanintervention),通過修飾公開于SEQIDNO:1或SEQIDNO:3或它們的同源序列的核苷酸序列來獲得。發明詳述具有纖維素分解增強活性的多肽在第一個方面,本發明涉及包含氨基酸序列的分離的多肽,所述氨基酸序列與SEQIDNO:2或SEQIDNO:4的成熟多肽具有優選至少60%,更優選至少65%,更優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少96%、至少97%、至少98%或至少99%的同一性程度,所述多肽具有纖維素分解增強活性(下文中的“同源多肽”)。在一個優選的方面,所述同源多肽具有氨基酸序列,其與SEQIDNO:2或SEQIDNO:4的成熟多肽相差十個氨基酸,優選相差五個氨基酸,更優選相差四個氨基酸,甚至更優選相差三個氨基酸,最優選相差兩個氨基酸,并且甚至最優選相差一個氨基酸。本發明的多肽優選包含SEQIDNO2的氨基酸序列或其等位變體;或它們的具有纖維素分解增強活性的片段。在一個優選的方面,多肽包含SEQIDNO:2的氨基酸序列。在另一個優選方面,多肽包含SEQIDNO:2的成熟多肽。在另一個優選方面,多肽包含SEQIDNO2的氨基酸18至232,或其等位變體;或它們的具有纖維素分解增強活性的片段。在另一個優選方面,多肽包含SEQIDNO2的氨基酸18至232。在另一個優選方面,多肽由SEQIDNO2的氨基酸序列或其等位變體;或它們的具有纖維素分解增強活性的片段組成。在另一個優選方面,多肽由SEQIDNO:2的氨基酸序列組成。在另一個優選方面,多肽由SEQIDNO2的成熟多肽組成。在另一個優選方面,多肽由SEQIDNO2的氨基酸18至232或其等位變體;或它們的具有纖維素分解增強活性的片段組成。在另一個優選方面,多肽由SEQIDNO2的氨基酸18至232組成。本發明的多肽優選還包含SEQIDNO4的氨基酸序列或其等位變體;或它們的具有纖維素分解增強活性的片段。在一個優選的方面,多肽包含SEQIDNO:4的氨基酸序列。在另一個優選方面,多肽包含SEQIDNO:4的成熟多肽。在另一個優選方面,多肽包含SEQIDNO4的氨基酸16至235,或其等位變體;或它們的具有纖維素分解增強活性的片段。在另一個優選方面,多肽包含SEQIDNO4的氨基酸16至235。在另一個優選方面,多肽由SEQIDNO4的氨基酸序列或其等位變體;或它們的具有纖維素分解增強活性的片段組成。在另一個優選方面,多肽由SEQIDNO:4的氨基酸序列組成。在另一個優選方面,多肽由SEQIDNO:4的成熟多肽組成。在另一個優選方面,多肽由SEQIDNO:4的氨基酸16至235或其等位變體;或它們的具有纖維素分解增強活性的片段組成。在另一個優選方面,多肽由SEQIDNO4的氨基酸16至235組成。在第二個方面,本發明涉及具有纖維素分解增強活性的分離的多肽,所述分離的多肽由多核苷酸編碼,所述多核苷酸在優選非常低嚴緊條件下,優選低嚴緊條件下,更優選中嚴緊條件下,更優選中_高嚴緊條件下,甚至更優選高嚴緊條件下,并且最優選非常高嚴緊條件下,與以下雜交(i)SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列,(ii)包含于SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列中的cDNA序列,(iii)⑴或(ii)的亞序列,或(iv)(i)、(ii)或(iii)的全長互補鏈(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列的亞序列含有至少100個連續的核苷酸或優選至少200個連續的核苷酸。此外,所述亞序列可編碼具有纖維素分解增強活性的多肽片段。在一個優選的方面,所述互補鏈是SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列的全長互補鏈。SEQIDNO:1或SEQIDNO3的核苷酸序列或其亞序列,以及SEQIDNO2或SEQIDNO:4的氨基酸序列或其片段,可用于設計核酸探針,以根據本領域內公知的方法從不同屬和種的菌株鑒定和克隆編碼具有纖維素分解增強活性的多肽的DNA。具體而言,根據標準的Southern印跡方法,可將這些探針用于與感興趣的屬或種的基因組或cDNA雜交,以鑒定和從其中分離相應的基因。這些探針可明顯短于完整序列,但長度上應為至少14,優選至少25,更優選至少35,并且最優選至少70個核苷酸。然而,優選所述核酸探針是至少100個核苷酸長度。例如,所述核酸探針的長度可為至少200個核苷酸,優選至少300個核苷酸,更優選至少400個核苷酸,或最優選至少500個核苷酸。甚至可以使用更長的探針,例如,長度是至少600個核苷酸,至少優選至少700個核苷酸,更優選至少800個核苷酸,或最優選至少900個核苷酸的核酸探針。DNA和RNA探針二者均可使用。通常將探針標記以探測相應的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)標記)。將這些探針包含于本發明中。因而,可從由這些其它生物體制備的基因組DNA或cDNA文庫中篩選DNA,所述DNA與上述探針雜交并且編碼具有纖維素分解增強活性的多肽。可以通過瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術分離來自這些其它生物體的基因組或其它DNA。可以將來自文庫的DNA或分離的DNA轉移至硝化纖維素(nitrocellulose)或其它合適的載體材料并且固定于其上。為了鑒定與SEQIDNO:1或SEQIDNO:3或其亞序列同源的克隆或DNA,將所述載體材料優選用在Sounthern印跡中。就本發明而言,雜交表示核苷酸序列在非常低至非常高的嚴緊條件下與標記的核酸探針雜交,所述核酸探針對應于SEQIDNO1或SEQIDNO3的成熟多肽編碼序列;包含于SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列中的cDNA序列;其全長互補鏈;或它們的亞序列。可使用例如X射線片(X-rayfilm)檢測在這些條件下與核酸探針雜交的分子。在一個優選的方面,核酸探針是SEQIDNO:1的成熟多肽編碼序列。在另一個優選方面,核酸探針是SEQIDNO:1的核苷酸52至921。在另一個優選方面,核酸探針是編碼SEQIDNO:2的多肽的多核苷酸序列,或其亞序列。在另一個優選方面,核酸探針是SEQIDNO:1。在另一個優選方面,核酸探針是包含在大腸桿菌(E.coli)NRRLB-50083中的質粒pSMail90中含有的多核苷酸序列,其中所述其多核苷酸序列編碼具有纖維素分解增強活性的多肽。在另一個優選方面,核酸探針是包含在大腸桿菌NRRLB-50083中的質粒pSMail90中含有的成熟多肽編碼區。在另一個優選的方面,核酸探針是SEQIDNO:3的成熟多肽編碼序列。在另一個優選方面,核酸探針是SEQIDNO:3的核苷酸46至851。在另一個優選方面,核酸探針是編碼SEQIDNO:4的多肽的多核苷酸序列,或其亞序列。在另一個優選方面,核酸探針是SEQIDNO:3。在另一個優選方面,核酸探針是包含在大腸桿菌NRRLB-50085中的質粒pSMail92中含有的多核苷酸序列,其中所述其多核苷酸序列編碼具有纖維素分解增強活性的多肽。在另一個優選方面,核酸探針是包含在大腸桿菌NRRLB-50085中的質粒pSMail92中含有的成熟多肽編碼區。對于長度至少100個核苷酸的長探針,將非常低至非常高的嚴緊條件定義為在42°C,在5XSSPE、0.3%SDS、200yg/ml已剪切并且變性的鮭精DNA中,并且對于非常低和低嚴緊性為25%的甲酰胺、對于中和中-高嚴緊性為35%的甲酰胺、或對于高和非常高嚴緊性為50%的甲酰胺,根據標準的Southern印跡法進行預雜交和雜交最佳12至24小時。對于長度為至少100個核苷酸的長探針,使用2XSSC、0.2%SDS優選至少在450C(非常低嚴緊性),更優選至少在50°C(低嚴緊性),更優選至少在55°C(中嚴緊性),更優選至少在60°C(中-高嚴緊性),甚至更優選至少在65°C(高嚴緊性),并且最優選至少在70°C(非常高嚴緊性)將載體材料最終洗滌三次,每次15分鐘。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將嚴緊條件定義為在比牛艮據Bolton禾口McCarthy計算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA481390)得出的Tm低大約5°C至大約10°C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,1XDenhardt溶液,ImM焦磷酸鈉(sodiumpyrophosphate),ImM舞酸二fiil^l(sodiummonobasicphosphate),0.ImMATP禾口0.2mg每ml的酵母RNA中,根據標準的Southern印跡步驟進行預雜交、雜交和雜交后洗滌最佳12至24小時。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將所述載體材料在6XSSC加0.1%SDS中洗滌一次15分鐘,并用6XSSC在比計算的Tm低5°C至10°C的溫度洗滌兩次,每次15分鐘。在第三個方面,本發明涉及由包含核苷酸序列或由核苷酸序列組成的多核苷酸編碼的分離的多肽,所述核苷酸序列與SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列具有優選至少60%,更優選至少65%,更優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少96%,至少97%,至少98%,或者至少99%的同一性程度,其編碼具有纖維素分解增強活性的多肽。參見本文的多核苷酸部分。在第四個方面,本發明涉及SEQIDNO2或SEQIDNO4的成熟多肽或其同源序列的包含取代、缺失和/或插入一個或多個(數個)氨基酸的人工變體。優選地,氨基酸改變對性質是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質的折疊和/或活性;通常為1至大約30個氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸殘基;多至大約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延伸,如多組氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或結合域(bindingdomain)。保守取代的實例是在以下組之內堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領域已知的,并且由例如H.Neurath和R.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu禾口Asp/Gly。除了20個基本氨基酸,非基本氨基酸(例如4-羥脯氨酸、6-N-甲基賴氨酸、2-氨基異丁酸、異纈氨酸和α-甲基絲氨酸)可以取代野生型多肽的氨基酸殘基。有限數量的非保守氨基酸、不由遺傳密碼編碼的氨基酸和非天然氨基酸可以取代氨基酸殘基。“非天然氨基酸”在蛋白質合成后已經過修飾,和/或在它們的側鏈具有不同于基本氨基酸的化學結構。非天然氨基酸能夠以化學方法合成,并且優選是商業上能夠獲得的,包括六氫吡啶羧酸(pipecolicacid)、噻唑燒羧酸(thiazolidinecarboxylicacid)、脫氫脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。可供選擇的是,氨基酸改變具有這樣的性質以使多肽的物理化學性質改變。例如,氨基酸改變可改進多肽的熱穩定性,改變底物特異性,改變最適PH等。能夠根據本領域已知的方法,例如定位誘變或丙氨酸分區誘變法(Cunningham和Wells,1989,Science244:1081_1085)來鑒定親本多肽中的必需氨基酸。在后一技術中,將單一丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的生物活性(即,纖維素分解增強活性)以鑒定對于所述分子的活性關鍵的氨基酸殘基。同樣參見Hilton等,1996,J.Biol.Chem.271:4699_4708。酶的活性部位或其它的生物相互作用也能夠通過結構的物理分析而測定,如通過以下這些技術如核磁共振、晶體學、電子衍射或光親和標記,連同推定的接觸位點氨基酸的突變來測定。參見例如deVos等,1992,Science255306-312;Smith等,1992,J.Mol.Biol.224:899_904;Wlodaver等,1992,FEBSLett.30959-64。必需氨基酸的身份(identity)也能夠從與多肽的同一性分析來推斷,所述多肽與根據本發明的多肽相關。能夠使用已知的誘變、重組和/或改組(shuffling)方法,然后是有關的篩選方法,例如那些由Reidhaar-Olson禾ΠSauer,1988,Science241:53_57;Bowie禾ΠSauer,1989,Proc.Natl.Acad.Sci.USA86:2152_2156;WO95/17413;或W095/22625公開的那些方法來進行并測試單個或多個氨基酸取代。能夠使用的其它方法包括易錯PCR、噬菌體展示(例如,Lowman等,1991,Biochem.3010832-10837;美國專利No.5,223,409;WO92/06204)和區域定向的誘變(Derbyshire等,1986,Gene46145;Ner等,1988,DNA7127)。誘變/改組方法能夠與高通量、自動化的篩選方法組合以檢測由宿主細胞表達的克隆的、誘變的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能夠從宿主細胞回收編碼活性多肽的誘變的DNA分子,并且使用本領域內標準方法快速測序。這些方法允許快速測定感興趣的多肽中單個氨基酸殘基的重要性,并且能夠應用于未知結構的多肽。SEQIDNO2或SEQIDNO4的成熟多肽的氨基酸取代、缺失和/或插入的總數是10,優選9,更優選8,更優選7,更優選至多6,更優選5,更優選4,甚至更優選3,最優選2,并且甚至最優選1。具有纖維素分解增強活性的多肽的來源本發明的多肽可以獲得自任何屬的微生物。就本發明而言,用于本文與給定的來源有關的術語“獲得自”,意思是核苷酸序列編碼的多肽由所述來源產生,或由其中插入了來自所述來源的核苷酸序列的菌株產生。在一個優選的方面,獲得自給定來源的多肽是胞外分泌的。本發明具有纖維素分解增強活性的多肽可以是細菌多肽。例如,所述多肽可以是革蘭氏陽性細菌多肽例如芽孢桿菌屬(Bacillus)、鏈球菌屬(Str印tococcus)、鏈霉菌屬(Streptomyces)、葡萄球菌屬(Staphylococcus)、腸球菌屬(Enterococcus)、乳酸菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、梭菌屬(Clostridium)、地芽孢桿菌屬(Geobacillus)或海洋芽孢桿菌屬(Oceanobacillus)多肽,所述多肽具有纖維素分解增強活性;或革蘭氏陰性細菌多肽,如大腸桿菌(E.coli)、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)ffifflifM(Campylobacter)、螺桿菌屬(Helicobacter)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)>iMlfliiM(Ilyobacter)、奈瑟氏菌屬(Neisseria)或脲原體屬(Ureaplasma)屬多肽,其具有纖維素分解增強活性。在一個優選方面,所述多肽是具有纖維素分解增強活性的嗜堿芽孢桿菌(Bacillusalkalophilus)、!軍定^1Ur包!f胃(Bacillusamyloliquefaciens)菌(Bacillusbrevis)、環狀芽孢桿菌(Bacilluscirculans)、克勞氏芽孢桿菌(Bacillusclausii)、凝結芽孢桿菌(Bacilluscoagulans)、堅強芽孢桿菌(Bacillusfirmus)、燦爛芽孢桿菌(Bacilluslautus)、遲緩芽孢桿菌(Bacilluslentus)、地衣芽孢桿菌(Bacilluslicheniformis)、巨大芽孢桿菌(Bacillusmegaterium)、短小芽孢桿菌(Bacilluspumilus)、嗜熱月旨肪芽孢桿菌(Bacillusstearothermophilus)、枯草芽孢桿菌(Bacillussubtilis)或蘇云金芽孢桿菌(Bacillusthuringiensis)多肽。在另一個優選的方面,所述多肽是具有纖維素分解增強活性的似馬鏈球菌(Streptococcusequisimilis)、酉良月農鏈球菌(Streptococcuspyogenes)、乳房鏈球菌(Streptococcusuberis)或馬鏈球菌獸痕亞禾中(Streptococcusequisubsp.Zooepidemicus)多月太。在另一個優選的方面,所述多肽是具有纖維素分解增強活性的不產色鏈霉菌(Streptomycesachromogenes)、除蟲鏈霉菌(Streptomycesavermitilis)、天藍鏈霉菌(Streptomycescoelicolor)、灰色鏈霉菌(Streptomycesgriseus)或淺青紫鏈霉菌(Streptomyceslividans)多月太。本發明具有纖維素分解增強活性的多肽也可以是真菌多肽,并且更優選酵母多肽如念珠菌屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或西洋蓍霉屬(Yarrowia)多肽,其具有纖維素分解增強活性;或更優選絲狀真菌多肽如枝頂孢霉屬(Acremonium)、傘菌屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、Botryospaeria、擬賭菌屬(Ceriporiopsis)、毛_殼屬(Chaetomidium)、金抱子菌屬(Chrysosporium)、Claviceps、Cochliobolus、鬼傘屬(Coprinopsis)、Coptotermes、棒囊殼屬(Corynascus)、隱叢赤殼菌屬(Cryphonectria)、隱球菌屬(Cryptococcus)、色二孢屬(Diplodia)、黑耳屬(Exidia)、Filibasidium,鐮孢屬(Fusarium)、赤霉屬(Gibberella)、全鞭毛蟲屬(Holomastigotoides)、腐質霉屬(Humicola)、耙齒菌屬(Irpex)>ΜM(Lentinula)>Leptospaeria>^cifelifM(Magnaporthe)>Melanocarpus>多孔菌屬(Meripilus)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新考瑪脂霉屬(Neocallimasix)、脈抱菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia、假黑盤菌屬(Pseudoplectania)、Pseudotrichonympha、根毛霉屬(Rhizomucor)、裂褶菌屬(Schizophyllum)、柱頂孢屬(Scytalidium)、踝節菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、長毛盤菌屬(Trichophaea)、輪枝孢屬(Verticillium)、包腳菇屬(Volvariella)或炭角菌屬(Xylaria)多肽,其具有纖維素分解增強活性。在一個優選的方面,所述多肽是具有纖維素分解增強活性的卡爾酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵16母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一個優選的方面,所述多肽是具有纖維素分解增強活性的解纖維枝頂孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、煙曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、構巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角質金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛChrysosporiumzonatum、桿抱狀德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、庫威,廉抱(Fusariumcrookwellense)、大刀,廉抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、異抱德抱(Fusariumheterosporum)、合歡木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉紅德抱(Fusariumroseum)、接骨木德抱(Fusariumsambucinum)、膚色德抱(Fusariumsarcochroum)、擬分枝抱德抱(Fusariumsporotrichioides)、硫色,廉抱(Fusariumsulphureum)、圓德抱(Fusariumtorulosum)、擬絲抱,廉抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰腐質霉(Humicolagrisea)、特異腐質毒(Humicolainsolens)、疏棉狀腐質毒(Humicolalanuginosa)、白奉巴齒菌(Irpexlacteus)、米黑毛霉Mucormiehei)、嗜熱毀絲霉、粗糙脈孢菌(Neurosporacrassa)、繩狀青霉(Penicilliumfuniculosum)、產紫青霉(Penicilliumpurpurogenum)、黃抱平革菌(Phanerochaetechrysosporium)、哈茨木霉(Trichodermaharzianum)、康寧木霉(Trichodermakoningii)、長枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或綠色木霉(Trichodermaviride)多月太。在另外的優選方面,所述多肽是具有纖維素分解增強活性的黃褐毀絲霉(Myceliophthorahinnulea)、黃毀絲霉(Myceliophthoralutea)、嗜熱毀絲霉或綿毛毀絲M(Myceliophthoravellerea)多月太。在更優選的方面,所述多肽是具有纖維素分解增強活性的嗜熱毀絲霉(Myceliophthorathermophila)多肽。在一個最優選的方面,所述多肽是具有纖維素分解增強活性的嗜熱毀絲霉CBS202.75多肽,例如包含SEQIDNO:2或SEQIDNO:4的成熟多肽的多肽。可理解的是對于前述的種,本發明包含完全和不完全階段(perfectandimperfectstates),和其它分類學的等同物(equivalent),例如無性型(anamorph),而無論它們已知的種名。本領域熟練技術人員將容易地識別適合的等同物的同一性。這些種的菌株在許多培養物保藏中心對于公眾能夠容易地取得,所述保藏中心諸如美國典型培養物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和細胞培養物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和農業研究機構專利培養物保藏中心北區研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。此外,可以使用上述的探針從其它來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物鑒定和獲得這些多肽。用于從天然生境(habitat)分離微生物的技術是本領域內公知的。隨后可通過相似地篩選這種微生物的基因組或cDNA文庫來獲得所述多核苷酸。一旦用所述探針檢測到編碼多肽的多核苷酸序列,就能夠使用本領域普通技術人員熟知的技術將所述多核苷酸分離或克隆(參見,例如,Sambrook等,1989,見上文)。本發明的多肽還包括融合多肽或可切割的融合多肽,其中將另外的多肽融合到所述多肽或其片段的N末端或C末端。通過將編碼另一個多肽的核苷酸序列(或其部分)融合于本發明的核苷酸序列(或其部分)來產生融合的多肽。產生融合多肽的技術是本領域已知的,并包括連接編碼多肽的編碼序列以使它們在閱讀框中,并且使融合多肽的表達在相同啟動子和終止子的控制下。融合多肽還可以包括切割位點。一旦分泌了融合多肽,就切割所述位點,從融合蛋白質釋放具有內切葡聚糖酶活性的多肽。切割位點的實例包括,但不限于,編碼二肽Lys-Arg的Kex2位點(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568_76;Svetina,2000,J.Biotechnol.76245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488_3493;Ward等,1995,Biotechnology13:498_503;和Contreras等,1991,Biotechnology9:378_381);Ile_(Glu或Asp)-Gly-Arg位點,其在精氨酸殘基后通過FactorXa蛋白酶切割(Eaton等,1986,Biochem.25:505_512);Asp-Asp-Asp-Asp-Lys位點,其在賴氨酸后通過腸激酶切割(Collins-Racie等,1995,Biotechnology13:982_987);His-Tyr-Glu位點或His-Tyr-Asp位點,其通過GenenaseI切割(Carter等,1989,ProteinsStructure,Function,andGenetics6:240_248);Leu-Val-Pro-Arg-Gly-Ser位點,其在Arg后通過凝血酶切割(Stevens,2003,DrugDiscoveryWorld435-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位點,其在Gln后通過TEV蛋白酶切割(Stevens,2003,見上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位點,其在Gln后通過基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,見上文)。多核苷酸本發明還涉及分離的多核苷酸,其包含編碼本發明具有纖維素分解增強活性的多肽的核苷酸序列,或由編碼本發明具有纖維素分解增強活性的多肽的核苷酸序列組成。在一個優選的方面,核苷酸序列包含SEQIDNO1或由SEQIDNO1組成。在另一個更優選的方面,核苷酸序列包含大腸桿菌NRRLB-50083中所含質粒pSMail90中所含的序列,或由大腸桿菌NRRLB-50083中所含質粒pSMail90中所含的序列組成。在另一個優選方面,核苷酸序列包含SEQIDNO1的成熟多肽編碼序列或由SEQIDNO=I的成熟多肽編碼序列組成。在另一個優選方面,核苷酸序列包含SEQIDNO:1的核苷酸52至921或由SEQIDNO1的核苷酸52至921組成。在另一個更優選的方面,核苷酸序列包含大腸桿菌NRRLB-50083中所含質粒pSMail90中含有的成熟多肽編碼序列或由大腸桿菌NRRLB-50083中所含質粒pSMail90中含有的成熟多肽編碼序列組成。在一個優選的方面,核苷酸序列包含SEQIDNO3或由SEQIDNO3組成。在另一個更優選的方面,核苷酸序列包含大腸桿菌NRRLB-50085中所含質粒pSMail92中含有的序列,或由大腸桿菌NRRLB-50085中所含質粒pSMail92中含有的序列組成。在另一個優選方面,核苷酸序列包含SEQIDNO3的成熟多肽編碼序列或由SEQIDNO3的成熟多肽編碼序列組成。在另一個優選方面,核苷酸序列包含SEQIDNO:3的核苷酸46至851或由SEQIDNO3的核苷酸46至851組成。在另一個更優選的方面,核苷酸序列包含大腸桿菌NRRLB-50085中所含質粒pSMail92中含有的成熟多肽編碼序列或由大腸桿菌NRRLB-50085中所含質粒pSMail92中含有的成熟多肽編碼序列組成。本發明還包含編碼多肽的核苷酸序列,所述多肽包含SEQIDNO:2或SEQIDNO4的氨基酸序列或其成熟多肽,或由SEQIDNO:2或SEQIDNO:4的氨基酸序列或其成熟多肽組成;由于遺傳密碼的簡并性,所述核苷酸序列分別不同于SEQIDNO:1或SEQIDNO3或其成熟多肽編碼序列。本發明還涉及SEQIDNO:1或SEQIDNO:3的亞序列,所述亞序列分別編碼具有纖維素分解增強活性的SEQIDNO2或SEQIDNO4的片段。本發明還涉及突變多核苷酸,所述突變多核苷酸在SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列中包含至少一個突變,或由在SEQIDNO1或SEQIDNO3的成熟多肽編碼序列中具有至少一個突變的核苷酸組成,其中所述突變核苷酸序列分別編碼SEQIDNO2或SEQIDNO4的成熟多肽。用于分離或克隆編碼多肽的多核苷酸的技術是本領域內已知的,包括從基因組DNA分離,從cDNA制備,或其組合。可通過例如使用熟知的聚合酶鏈式反應(PCR)或表達文庫的抗體篩選來檢測具有共有結構特性的克隆DNA片段,從而實現從這種基因組DNA克隆本發明的多核苷酸。參見,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸擴增方法,如連接酶鏈式反應(LCR)、連接活化轉錄(ligatedactivatedtranscription;LAT)和基于核苷酸序列的擴增(NASBA)。可以從毀絲霉屬菌株,或其它或相關生物體克隆多核苷酸,并且因此可以是例如所述核苷酸序列的多肽編碼區的等位基因變體或種變體(speciesvariant)。本發明還涉及包含核苷酸序列或由核苷酸序列組成的分離的多核苷酸,所述核苷酸序列與SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列具有優選至少60%,更優選至少65%,更優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少96%,至少97%,至少98%,或者至少99%同一性的同一性程度,其編碼具有纖維素分解增強活性的多肽。修飾編碼本發明多肽的核苷酸序列對于合成與所述多肽基本上相似的多肽可為必需的。術語與所述多肽“基本上相似”指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩定性、最適PH等方面不同的人工變體。可以在作為SEQIDNO1或SEQIDNO3的多肽編碼序列存在的核苷酸序列,例如其亞序列的基礎上,和/或通過引入如下核苷酸取代來構建變體序列所述取代不產生由核苷酸序列編碼的多肽的另外的氨基酸序列,但是符合意欲產生酶的宿主生物體的密碼子選擇;或者所述取代可產生不同的氨基酸序列。關于核苷酸取代的概述,參見,例如,Ford等,1991,ProteinExpressionandPurification2:95_107。對于本領域技術人員顯而易見的是,這些取代能夠在對于分子功能重要的區域之外進行,并且仍然產生活性多肽。對于由本發明的分離的多核苷酸編碼的多肽活性關鍵的并且因此優選不進行取代的氨基酸殘基,可以根據本領域公知的方法,例如定位誘變或丙氨酸分區誘變法(參見,例如,Cunningham和Wells,1989,見上文)來鑒定。在后一技術中,將突變引入到分子中的每個荷正電的殘基處,并且測試所得突變分子的纖維素分解增強活性,以鑒定對于所述分子的活性關鍵的氨基酸殘基。底物_酶相互作用的位點也能夠通過分析三維結構測定,通過如核磁共振分析、晶體學或光親和標記這樣的技術來測定(參見,例如,deVos等,1992,見上文;Smith等,1992,見上文;Wlodaver等,1992,見上文)。本發明還涉及編碼本發明多肽的分離的多核苷酸,所述分離的多核苷酸在非常低嚴緊條件下,優選低嚴緊條件,更優選中等嚴緊條件,更優選中_高嚴緊條件,甚至更優選高嚴緊條件,并且最優選非常高的嚴緊條件下,與以下序列雜交(i)SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列,(ii)包含于SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列中的cDNA序列,或(iii)⑴或(ii)的全長互補鏈;或它們的等位變體和亞序列(Sambrook等,1989,見上文),如本文所定義的。在一個優選的方面,互補鏈是SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列的全長互補鏈。本發明還涉及分離的多核苷酸,所述分離的多核苷酸通過以下方法獲得(a)在非常低、低、中、中-高、高或非常高嚴緊條件下,將DNA群體與以下雜交(i)SEQIDNO=I或SEQIDNO3的成熟多肽編碼序列,(ii)包含于SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列中的cDNA序列,或(iii)⑴或(ii)的全長互補鏈;和(b)分離雜交的多核苷酸,其編碼具有纖維素分解增強活性的多肽。在一個優選的方面,互補鏈是SEQIDN0:1或SEQIDNO:3的成熟多肽編碼序列的全長互補鏈。核酸構建體本發明還涉及包含本發明的分離的多核苷酸的核酸構建體,所述分離的多核苷酸與一個或多個(數個)調控序列可操作地連接,所述調控序列在合適的宿主細胞中在與該調控序列相容的條件下指導編碼序列的表達。可以用許多方式操作編碼本發明多肽的分離的多核苷酸以提供多肽的表達。依賴于表達載體,在將多核苷酸的序列插入載體之前對其進行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸序列的技術是本領域熟知的。調控序列可以是適當的啟動子序列,其是由用于表達編碼本發明多肽的多核苷酸的宿主細胞識別的核苷酸序列。啟動子序列含有介導多肽的表達的轉錄調控序列。啟動子可以是在所選的宿主細胞中顯示轉錄活性的任何核苷酸序列,包括突變的、截短的和雜合的啟動子,并且可以從編碼與宿主細胞同源或異源的胞外或胞內多肽的基因獲得。用于指導本發明的核酸構建體轉錄,特別是在細菌宿主細胞中轉錄的合適啟動子的實例是從下述獲得的啟動子大腸桿菌Iac操縱子、天藍鏈霉菌瓊脂糖酶基因(dagA)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌產麥芽淀粉酶基因(amyM)、解淀粉芽孢桿菌α_淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因和原核β-內酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),\)JsRtac(DeBoerφ,1983,ProceedingsoftheNationalAcademyofSciencesUSA80:21—25)。另外的啟動子在〃Usefulproteinsfromrecombinantbacteria"于ScientificAmerican,1980,242:74_94中;和在Sambrook等,1989,見上文中描述。用于指導本發明的核酸構建體在絲狀真菌宿主細胞中轉錄的合適啟動子的實例是從下列酶的基因獲得的啟動子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構酶、構巢曲霉乙酰胺酶、鑲片鐮孢淀粉葡糖苷酶(W000/56900)、鑲片鐮孢Daria(WC)00/56900)、鑲片鐮孢Quirm(W000/56900)、尖鐮孢胰蛋白酶樣蛋白酶(W096/00787)、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內切葡聚糖酶I、里氏木霉內切葡聚糖酶II、里氏木霉內切葡聚糖酶III、里氏木霉內切葡聚糖酶IV、里氏木霉內切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi啟動子(來自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸異構酶基因的啟動子的雜合體);和它們的突變的、截短的和雜合的啟動子。在酵母宿主中,有用的啟動子從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母半乳糖激酶(GALl)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)和釀酒酵母3-磷酸甘油酸激酶。對于酵母宿主細胞其它有用的啟動子由Romanos等,1992,Yeast8:423_488描述。調控序列也可以是合適的轉錄終止子序列,是由宿主細胞識別以終止轉錄的序列。所述終止子序列與編碼所述多肽的核苷酸序列的3’末端可操作地連接。可以將在所選宿主細胞中有功能的任何終止子用在本發明中。對于絲狀真菌宿主細胞優選的終止子從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖鐮孢胰蛋白酶樣蛋白酶。對于酵母宿主細胞優選的終止子從如下酶的基因獲得釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶。對于酵母宿主細胞其它有用的終止子由Romanos等,1992,見上文描述。調控序列還可以是合適的前導序列,其是對于宿主細胞的翻譯重要的mRNA非翻譯區。前導序列可操作地連接于編碼多肽的核苷酸序列的5’-末端。可以將在所選宿主細胞中有功能的任何前導序列用在本發明中。對于絲狀真菌宿主細胞優選的前導序列從如下酶的基因獲得米曲霉TAKA淀粉酶和構巢曲霉丙糖磷酸異構酶。對于酵母宿主細胞合適的前導序列從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)。調控序列也可以是聚腺苷酸化序列,其是與核苷酸序列的3,末端可操作地連接的序列,并且在轉錄時,宿主細胞將其識別為將聚腺苷殘基添加至轉錄的mRNA的信號。可以將在所選宿主細胞中有功能的任何聚腺苷酸化序列在本發明中使用。對于絲狀真菌宿主細胞優選的聚腺苷酸化序列從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶樣蛋白酶和黑曲霉α-葡糖苷酶。對于酵母宿主細胞有用的聚腺苷酸化序列由Guo和Sherman,1995,MolecularCellularBiology15:5983_5990描述。調控序列還可以是信號肽編碼區,其編碼與多肽的氨基末端相連的氨基酸序列,并且指導編碼的多肽進入細胞分泌途徑。核苷酸序列的編碼序列5’端可固有地包含信號肽編碼區,其與編碼分泌多肽的編碼區片段一起天然地連接在翻譯閱讀框中。可供選擇的是,編碼序列5’端可含有對于所述編碼序列異源的信號肽編碼區。異源信號肽編碼區在編碼序列不天然地含有信號肽編碼區時可為必需的。或者,外源信號肽編碼區可以簡單地取代天然信號肽編碼區以增強多肽的分泌。然而,指導表達的多肽進入所選宿主細胞的分泌途徑(即,分泌至培養基中)的任何信號肽編碼區可在本發明中使用。對于細菌宿主細胞有效的信號肽編碼區是從如下酶的基因獲得的信號肽編碼區芽孢桿菌屬NCIB11837產麥芽糖淀粉酶、嗜熱脂肪芽孢桿菌α-淀粉酶、地衣芽孢桿菌枯草蛋白酶(subtilisin)、地衣芽孢桿菌β-內酰胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢桿菌prsA。另外的信號肽由Simonen和Palva,1993,MicrobiologicalReviews57109-137描述。對于絲狀真菌宿主細胞有效的信號肽編碼區是從如下酶的基因獲得的信號肽編碼區米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特異腐質霉纖維素酶、特異腐質霉內切葡聚糖酶V和疏棉狀腐質霉脂肪酶。對于酵母宿主細胞有用的信號肽從釀酒酵母α因子和釀酒酵母轉化酶的基因獲得。其它有用的信號肽編碼區由Romanos等,1992,見上文描述。在一個優選的方面,信號肽包含SEQIDNO:2的氨基酸1至17,或者由SEQIDΝ0:2的氨基酸1至17組成。在另一個優選方面,信號肽編碼序列包含SEQIDNO1的核苷酸1至51,或者由SEQIDNO1的核苷酸1至51組成。在另一個優選方面,信號肽包含SEQIDNO:4的氨基酸1至15,或者由SEQIDN0:4的氨基酸1至15組成。在另一個優選方面,信號肽編碼序列包含SEQIDNO3的核苷酸1至45,或者由SEQIDNO3的核苷酸1至45組成。調控序列還可以是前肽編碼區,其編碼位于多肽氨基末端的氨基酸序列。所得多肽稱為酶原(proenzyme)或前多肽(propolyp印tide)(或在某些情況下稱為酶原(zymogen))0前多肽通常是無活性的并且能夠通過前肽的催化或自催化切割從前多肽轉化為成熟活性多肽。可以從枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜熱毀絲霉漆酶(W095/33836)的基因獲得前肽編碼區。當信號肽和前肽區二者均出現在多肽的氨基末端時,將前肽區置于緊接著(nextto)多肽氨基末端,并且將信號肽區置于緊接著前肽區的氨基末端。同樣理想的是添加調節序列,其允許相對于宿主細胞的生長來調節多肽的表達。調節系統的實例是引起基因表達響應化學或物理刺激物,包括調節化合物的存在而開啟或關閉的那些系統。原核系統中的調節系統包括lac、tac和trp操縱基因系統。在酵母中,可以使用ADH2系統或GALl系統。在絲狀真菌中,可以使用TAKAα-淀粉酶啟動子、黑曲霉葡糖淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子作為調節序列。調節序列的其它實例是那些允許基因擴增的序列。在真核系統中,這些序列包括在氨甲蝶呤(methotrexate)存在下擴增的二氫葉酸還原酶基因,和以重金屬(withheavymetal)擴增的金屬硫蛋白基因。在這些情況下,編碼多肽的核苷酸序列將與調節序列可操作地連接。表達載體本發明還涉及重組表達載體,所述重組表達載體包含本發明的多核苷酸、啟動子和轉錄和翻譯終止信號。本文所述的多種核酸和調控序列可以結合在一起以產生重組表達載體,所述表達載體可以包括一個或多個(數個)方便的限制位點以允許在這些位點插入或取代編碼多肽的核苷酸序列。可供選擇的是,可以通過在適當的用于表達的載體中插入包含所述序列的核苷酸序列或核酸構建體來表達本發明的核苷酸序列。在制備表達載體的過程中,將編碼序列置于載體中,從而將該編碼序列與適當的表達調控序列可操作地連接。重組表達載體可以是任何載體(例如,質粒或病毒),其能夠方便地進行重組DNA步驟,并且能夠產生核苷酸序列的表達。載體的選擇將通常依賴于載體與將引入該載體的宿主細胞的相容性。載體可以是線狀或閉合環狀質粒。載體可以是自主復制載體,即,作為染色體外實體(entity)存在的載體,其復制獨立于染色體復制,例如,質粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復制的手段(means)。或者,載體可以是一種當被引入宿主細胞中時,整合到基因組中并且與整合了該載體的染色體一起復制的載體。此外,可以使用單獨的載體或質粒或兩個或更多個載體或質粒,其共同含有待引入宿主細胞基因組的完整DNA(totalDNA),或可以使用轉座子(transposon)。本發明的載體優選地含有一個或多個(數個)選擇性標記,其允許簡單選擇經轉化、轉染、轉導等的細胞。選擇性標記是基因,其產物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養缺陷型的原養性(prototrophytoauxotrophs)等。細菌選擇性標記的實例是來自枯草芽孢桿菌或地衣芽孢桿菌的dal基因,或賦予抗生素抗性的標記,所述抗生素抗性例如氨芐青霉素、卡那霉素、氯霉素或四環素抗性。對于酵母宿主細胞合適的標記是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于絲狀真菌宿主細胞的選擇性標記包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰基轉移酶)、bar(草銨膦(phosphinothricin)乙酰轉移酶)、hph(潮霉素磷酸轉移酶)、niaD(硝酸還原酶)(nitratereductase)、pyrG(乳清酸核苷-5,-磷酸脫羧酶)(orotidine-5,-phosphatedecarboxylase),sC(硫酸腺苷酰轉移酶)和trpC(鄰氨基苯甲酸合酶(anthranilatesynthase))以及它們的等價物。優選用在曲霉屬細胞中的是構巢曲霉或米曲霉的amdS和pyrG基因禾口吸水鏈霄菌(Streptomyceshygroscopicus)的bar基因。本發明的載體優選含有元件,其允許載體整合入宿主細胞基因組或載體在細胞中獨立于基因組的自主復制。為了整合入宿主細胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件。或者,載體可以含有額外的核苷酸序列,用于指導通過同源重組整合入宿主細胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應優選含有足夠數量的核酸,如100至10,000堿基對,優選400至10,000堿基對,并且最優選800至10,000堿基對,其與相應的目標序列具有高度同一性以增強同源重組的概率。整合元件可以是任何序列,其與宿主細胞基因組中的目標序23列同源。此外,整合元件可以是非編碼或編碼的核苷酸序列。另一方面,可以將載體通過非同源重組整合到宿主細胞的基因組中。為了自主復制,載體可以進一步包含復制起點,其使載體能夠在所述的宿主細胞中自主地復制。復制起點可以是介導自主復制的任何質粒復制子(r印licator),其在細胞中發揮功能。術語“復制起點”或“質粒復制子”在本文定義為能夠使質粒或載體體內復制的核苷酸序列。細菌復制起點的實例是允許在大腸桿菌中復制的質粒pBR322、pUC19、pACYC177和pACYC184的復制起點,和允許在芽孢桿菌屬中復制的質粒pUBllO、pE194、pTA1060和ρΑΜβ1的復制起點。用于酵母宿主細胞中的復制起點的實例是2微米復制起點,ARSl,ARS4,ARSl和CEN3的組合,和ARS4和CEN6的組合。在絲狀真菌細胞中有用的復制起點的實例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch159163-9175;WO00/24883)。分離AMAl基因和構建包含該基因的質粒或載體能夠根據公開于WO00/24883中的方法完成。可以將多于一個拷貝的本發明的多核苷酸插入宿主細胞以增加基因產物的產生。多核苷酸拷貝數的增加可通過如下方法獲得將至少一個額外拷貝的序列整合入宿主細胞基因組,或將可擴增的選擇性標記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養細胞來選擇含有選擇性標記基因的擴增拷貝,且由此含有多核苷酸的額外拷貝的細胞。用于連接上述元件以構建本發明的重組表達載體的方法是本領域技術人員熟知的(參見,例如,Sambrook等,1989,見上文)。宿主細胞本發明還涉及重組宿主細胞,其包含本發明的分離的多核苷酸,可有利地用于多肽的重組生產中。將包含本發明多核苷酸的載體導入宿主細胞,使載體如前所述作為染色體整體或者作為自復制的染色體外載體維持。術語“宿主細胞”包括母體細胞的任何后代,其由于復制過程中發生的突變而不同于母體細胞。宿主細胞的選擇將在很大程度上依賴于編碼多核苷酸的基因及其來源。宿主細胞可以是在本發明的多肽的重組產生中有用的任何細胞,例如,原核或真核細胞。原核宿主細胞可以是任何革蘭氏陽性細菌或革蘭氏陰性細菌。革蘭氏陽性細菌包括但不限于,芽孢桿菌屬、鏈球菌屬、鏈霉菌屬、葡萄球菌屬、腸球菌屬、乳酸菌屬、乳球菌屬、梭菌屬、地芽孢桿菌屬和海洋芽孢桿菌屬。革蘭氏陰性細菌包括但不限于,大腸桿菌、假單胞菌屬、沙門氏菌屬、彎曲桿菌屬、螺桿菌屬、黃桿菌屬、梭桿菌屬、泥桿菌屬、奈瑟氏菌屬和脲原體屬。細菌宿主細胞可以是任何芽孢桿菌屬細胞。在本發明的實施中有用的芽孢桿菌屬細胞包括但不限于,嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環狀芽孢桿菌、克勞氏芽孢桿菌、凝結芽孢桿菌、堅強芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌細胞。在一個優選的方面,細菌宿主細胞是解淀粉芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪芽孢桿菌或枯草芽孢桿菌細胞。在更優選的方面,細菌宿主細胞是解淀粉芽孢桿菌細胞。在另一個更優選的方面,細菌宿主細胞是克勞氏芽孢桿菌細胞。在另一個更優選的方面,細菌宿主細胞是地衣芽孢桿菌細胞。在另一個更優選的方面,細菌宿主細胞是枯草芽孢桿菌細胞。細菌宿主細胞還可以是任何鏈球菌屬細胞。在本發明的實施中有用的鏈球菌屬細胞包括但不限于,似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌和馬鏈球菌獸瘟亞種細胞。在一個優選的方面,細菌宿主細胞是似馬鏈球菌細胞。在另一個優選的方面,細菌宿主細胞是釀膿鏈球菌細胞。在另一個優選的方面,細菌宿主細胞是乳房鏈球菌細胞。在另一個優選的方面,細菌宿主細胞是馬鏈球菌獸瘟亞種細胞。細菌宿主細胞還可以是任何鏈霉菌屬細胞。在本發明的實施中有用的鏈霉菌屬細胞包括但不限于,不產色鏈霉菌、除蟲鏈霉菌、天藍鏈霉菌、灰色鏈霉菌和淺青紫鏈霉菌細胞。在一個優選的方面,細菌宿主細胞是不產色鏈霉菌細胞。在另一個優選的方面,細菌宿主細胞是除蟲鏈霉菌細胞。在另一個優選的方面,細菌宿主細胞是天藍鏈霉菌細胞。在另一個優選的方面,細菌宿主細胞是灰色鏈霉菌細胞。在另一個優選的方面,細菌宿主細胞是淺青紫鏈霉菌細胞。可通過如下方法實現將DNA引入到芽孢桿菌屬細胞例如原生質體轉化(參見,例如,Chang和Cohen,1979,MolecularGeneralGenetics168:111_115),使用感受態細胞(參見,例如,Young禾口Spizizen,1961,JournalofBacteriology81:823_829或Dubnau和Davidooff-Abelson,1971,JournalofMolecularBiology56:209_221),電穿孔(參見,例如,Shigekawa和Dower,1988,Biotechniques6:742_751)或接合(參見,例如,Koehler和Thorne,1987,JournalofBacteriology169:5771—5278)。可通過如下方法實現將DNA引入到大腸桿菌細胞例如原生質體轉化(參見,例如,Hanahan,1983,J.Mol.Biol.166557-580)或電穿孔(參見,例如,Dower等,1988,NucleicAcidsRes.166127-6145)。可通過如下方法實現將DNA引入到鏈霉菌屬細胞例如原生質體轉化和電穿孔(參見,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399_405),接合(參見,例如,Mazodier等,1989,J.Bacteriol.171:3583_3585),或轉導(參見,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98=6289-6294)。可通過如下方法實現將DNA引入到假單胞菌屬細胞例如電穿孔(參見,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(參見,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51_57)。可通過如下方法實現將DNA引入到鏈球菌屬細胞例如天然感受態(naturalcompetence)(參見,例如,Perry和Kuramitsu,1981,Infect.Immun.321295-1297),原生質體轉化(參見,例如,Catt和Jollick,1991,Microbios.68189-2070),電穿孔(參見,例如,Buckley等,1999,Appl.Environ.Microbiol.653800-3804)或接合(參見,例如,Clewell,1981,Microbiol.Rev.45409-436)。然而,可以使用本領域已知的將DNA引入宿主細胞的任何方法。宿主細胞還可以是真核生物,如哺乳動物、昆蟲、植物或真菌細胞。在一個優選的方面,宿主細胞是真菌細胞。“真菌”用在本文包括以下門子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)禾口接合菌門(Zygomycota)(如由Hawksworth等,于AinsworthandBisby'sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定義)以及卵菌門(Oomycota)(如Hawksworth等,1995,見上,171頁中所引用),和所有有絲分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,見上文)。在一個更優選的方面,真菌宿主細胞是酵母細胞。“酵母”用在本文包括產子囊酵母(ascosporogenousyeast)(內孢霉目(Endomycetales))、產擔子酵母(basidiosporogenousyeast)禾口屬于半知菌類(FungiImperfecti)(芽抱綱(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發明而言,將酵母定義為如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,禾口Davenport,R.R.編,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。在一個甚至更加優選的方面,酵母宿主細胞是念珠菌屬、漢遜酵母屬(Hansenula)、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬細胞。在最優選的方面,酵母宿主細胞是卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母或卵形酵母細胞。在另一個最優選的方面,酵母宿主細胞是乳酸克魯維酵母(Kluyveromyceslactis)細胞。在另一個最優選的方面,酵母宿主細胞是解脂西洋蓍霉(Yarrowialipolytica)細胞。在另一個更優選的方面,真菌宿主細胞是絲狀真菌細胞。“絲狀真菌”包括真菌門(Eumycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復雜多糖組成的菌絲體壁。通過菌絲延伸進行營養生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養生長通過單細胞菌體的出芽生殖(budding)進行,而碳分解代謝可以是發酵的。在甚至更優選的方面,絲狀真菌宿主細胞是枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬蠟菌屬、金孢子菌屬、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬、Filibasidium、鐮孢屬、腐質霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬(Phanerochaete)、射脈菌屬(Phlebia)、瘤胃壺菌屬、側耳屬(Pleurotus)、裂褶菌屬、踝節菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細胞。在最優選的方面,絲狀真菌宿主細胞是泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉或米曲霉細胞。在另一個最優選方面,絲狀真菌宿主細胞是桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢細胞。在另一個最優選的方面,絲狀真菌宿主細胞是黑刺煙管菌(Bjerkanderaadusta)>zFifaIif(Ceriporiopsisaneirina)>zFifa|1>Ceriporiopsiscaregiea>Ceriporiopsisgilvescens>Ceriporiopsispannocinta>Ceriporiopsisrivulosa、Ceriporiopsissubrufa、蟲擬M菌(Ceriporiopsissubvermispora)、B譽角質金包子菌、Chrysosporiumlucknowense、熱帶金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、|£金包子菌、Chrysosporiumqueenslandicum>Chrysosporiumzonatum、灰蓋鬼傘(Coprinuscinereus)、毛革蓋菌(Coriolushirsutus)、特異腐質霉、疏棉狀腐質霉、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、產紫青霉、黃孢平革菌(Phanerochaetechrysosporium),輻射射脈菌(Phlebiaradiata)、刺芹側耳(Pleurotuseryngii)、土生梭孢霉、長絨毛栓菌(Trametesvillosa)、變色栓菌(Trametesversicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉細胞。可以將真菌細胞通過涉及原生質體形成、原生質體轉化和細胞壁重建的方法以本身公知的方式轉化。用于轉化曲霉屬和木霉屬宿主細胞的合適方法在EP238023和Yelton等,1984,ProceedingsoftheNationalAcademyofSciencesUSA811470-1474中描述。用于轉化鐮孢屬菌種的合適方法由Malardier等,1989,Gene78:147_156和WO96/00787描述。可以使用由如下文獻描述的方法轉化酵母=Becker和Guarente,于Abelson,J.N.禾口Simon,Μ.I.編,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,pp182—187,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriology153:163;禾口Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920o產生方法本發明還涉及用于產生本發明多肽的方法,其包括(a)在有益于產生多肽的條件下培養細胞,所述細胞以其野生型形式產生所述多肽;和(b)回收所述多肽。在一個優選的方面,所述細胞是毀絲霉屬的細胞。在更優選的方面,所述細胞是嗜熱毀絲霉。在最優選的方面,所述細胞是嗜熱毀絲霉CBS202.75。在另一個最優選的方面,所述細胞是嗜熱毀絲霉CBS117.65。本發明還涉及用于產生本發明的多肽的方法,其包括(a)如本文所述,在有益于產生多肽的條件下培養重組宿主細胞;和(b)回收所述多肽。本發明還涉及用于產生本發明的多肽的方法,包括(a)在有益于產生多肽的條件下培養重組宿主細胞,其中所述宿主細胞包含突變核苷酸序列,其在SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列中具有至少一個突變,其中所述突變核苷酸序列編碼多肽,該多肽包含SEQIDNO2或SEQIDNO4的成熟多肽或由SEQIDNO2或SEQIDNO4的成熟多肽組成,和(b)回收所述多肽。在本發明的產生方法中,使用本領域熟知的方法在適合于產生所述多肽的營養培養基中培養細胞。例如,可以通過在合適培養基中和允許表達和/或分離所述多肽的條件下進行的搖瓶培養,和實驗室或工業發酵罐中的小規模或大規模發酵(包括連續、分批、補料分批或固態發酵)來培養細胞。使用本領域已知的方法在合適的營養培養基中進行培養,所述營養培養基包含碳源和氮源和無機鹽。合適的培養基能夠從商業供應商獲得或可以根據公開的組成制備(例如,在美國典型培養物保藏中心的目錄中)。如果多肽分泌到營養培養基中,該多肽能夠從所述培養基中直接回收。如果多肽不分泌到培養基中,其能夠從細胞裂解物(Iysate)回收。可以使用本領域已知的對于所述多肽是特異性的方法來檢測多肽。這些檢測方法可包括特異性抗體的使用、酶產物的形成或酶底物的消失。例如,酶試驗(enzymeassay)可用于測定如本文所述的多肽的活性。所得多肽可以使用本領域已知的方法回收。例如,多肽可以通過常規方法從營養培養基中回收,所述常規方法包括但不限于離心、過濾、提取、噴霧干燥、蒸發或沉淀。本發明的多肽可以通過多種本領域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(pr印arative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS-PAGE或提取(參見,例如,ProteinPurification,J.-C.Janson禾口LarsRyden,editors,VCHPublishers,NewYork,1989)。植物本發明還涉及植物,例如,轉基因植物、植物部分或植物細胞,其包含分離的多核苷酸,所述多核苷酸編碼本發明具有纖維素分解增強活性的多肽,從而以可回收的量表達和產生所述多肽。多肽可從植物或植物部分回收。或者,同樣可以將含有該重組多肽的植物或植物部分用于改進食品或飼料的質量,例如,改進營養價值、適口性(palatability)和流變性質(rheologicalproperties),或用于破壞抗營養因子。轉基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實例是草(grasses),如草地早熟禾(meadowgrass)(藍草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperategrass),如Agrostis(剪股穎屬);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。雙子葉植物的實例是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和緊密相關的模型生物體擬南芥(Arabidopsisthaliana)。植物部分的實例是莖(stem)、愈傷組織(calIus)、葉(leaf)、根(root)、果實(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細胞區室(compartments),如葉綠體(chloroplast)、質夕卜體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)禾口細胞質(cytoplasm)也被認為是植物部分。此外,任何植物細胞,無論什么組織來源,都被認為是植物部分。同樣地,植物部分,如分離以促進本發明的應用的具體組織和細胞也被認為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)。同樣包含于本發明范圍內的還有這些植物、植物部分和植物細胞的子代。表達本發明多肽的轉基因植物或植物細胞可以依照本領域已知方法構建。簡而言之,通過如下方法構建所述植物或植物細胞將編碼本發明多肽的一個或多個(幾個)表達構建體并入植物宿主基因組或葉綠體基因組,并且將所得的修飾植物或植物細胞繁殖為轉基因植物或植物細胞。表達構建體便利地是包含編碼本發明多肽的多核苷酸的核酸構建體,所述多核苷酸與在選擇的植物或植物部分中表達該多核苷酸序列所需的適當的調節序列可操作地連接。此外,表達構建體可以包含對于鑒定宿主細胞有用的選擇性標記,在所述宿主細胞中整合了表達構建體和將該構建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。調節序列的選擇,例如啟動子和終止子序列和任選地信號或轉運序列的選擇,舉例來說,基于期望何時、何處以及如何表達多肽而確定。例如,編碼本發明多肽的基因28的表達可以是組成型的或誘導型的,或可以是發育、階段或組織特異性的,并且基因產物可以靶向特定的組織或植物部分例如種子或葉。調節序列由例如Tague等,1988,PlantPhysiology86:506所述。對于組成性表達,可以使用35S_CaMV、玉米泛素1和稻肌動蛋白1啟動子(Franck等,1980,Cell21:285_294,Christensen等,1992,PlantMo.Biol.18:675_689;Zhang等,1991,PlantCell3:1155_1165)。器官特異性啟動子可以是例如來自貯藏庫組織(storagesinktissue)例如種子、馬鈴薯塊蓮和果實的啟動子(Edwards&Coruzzi,1990,Ann.Rev.Genet.24:275_303),或來自代謝庫組織(metabolicsinktissue)例如分生組織的啟動子(Ito等,1994,PlantMol.Biol.24:863_878),種子特異性啟動子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動子(Wu等,1998,PlantandCellPhysiology39:885_889),來自豆球蛋白(Iegumin)B4和蠶豆(Viciafaba)的未知的種子蛋白基因的蠶豆啟動子(Conrad等,1998,JournalofPlantPhysiology152:708_711)、來自種子油體蛋白(oilbodyprotein)的啟動子(Chen等,1998,PlantandCellPhysiology39:935_941),來自歐洲油菜(Brassicanapus)的貯藏蛋白napA啟動子,或本
技術領域:
公知的任何其他種子特異性的啟動子,例如,在W091/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或番茄的rbcs啟動子(Kyozuka等,1993,PlantPhysiology102:991_1000),小球藻病毒(chlorellavirus)腺嘌呤甲基轉移酶(adeninemethyltransferase)基因啟動子(Mitra和Higgins,1994,PlantMolecularBiology26:85_93),或來自稻的aldP基因啟動子(Kagaya等,1995,Molecularandgeneralgenetics248:668_674),或傷口誘導的啟動子,如馬鈴薯pin2啟動子(Xu等,1993,PlantMolecularBiology22:573_588)。同樣地,所述啟動子可通過非生物的處理誘導,所述非生物的處理諸如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動子的物質誘導,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脫落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金屬。啟動子增強子元件也可以用于實現本發明多肽在植物中的較高表達。例如,啟動子增強子元件可以是內含子,其置于啟動子和編碼本發明多肽的核苷酸序列之間。例如Xu等,1993,見上,公開了使用稻肌動蛋白1基因的第一內含子以增強表達。選擇性標記基因和表達構建體的任何其它部分可以選自本領域內可用的那些。將核酸構建體根據本領域已知的常規技術并入植物基因組,所述常規技術包括土壤桿菌屬(Agrobacterium)介導的轉化、病毒介導的轉化、顯微注射(microinjection)、粒子轟擊、生物射彈轉化和電穿孔(Gasser等,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤桿菌(Agrobacteriumtumefaciens)介導的基因轉移(genetransfer),是產生轉基因雙子葉植物的優選方法(為了參考,見Hooykas和Schilperoort,1992,PlantMolecularBiology19:15_38),而且它也可以用于轉化單子葉植物,雖然對于這些植物其他的轉化方法是常用的。目前,產生轉基因單子葉植物的優選的方法,是用粒子(用轉化DNA涂覆的微觀的金或鎢粒子)轟擊胚愈傷組織(embryoniccalli)或發育中的胚(developingembryos)(Christou,1992,PlantJournal2275-281;Shimamoto,1994,CurrentOpinionBiotechnology5158-162;Vasilφ,1992,Bio/Technology1029667-674)。轉化單子葉植物的可供選擇的方法是基于原生質體轉化,如由Omirulleh等,1993,PlantMolecularBiology21:415_428所描述的。轉化之后,根據本領域熟知的方法選擇具有并入的表達構建體的轉化體并且再生成為完整植物。通常設計轉化方法用于通過如下方法在再生期間或在后續世代中選擇性消除選擇基因例如,使用帶有兩個獨立的T-DNA構建體的共轉化或通過特異性重組酶位點特異性地切除選擇基因。本發明還涉及用于產生本發明多肽的方法,其包括(a)在有益于產生多肽的條件下培養包含多核苷酸的轉基因植物或植物細胞,所述多核苷酸編碼本發明具有纖維素分解增強活性的多肽;和(b)回收所述多肽。去除或減少纖維素分解增強活性本發明還涉及用于產生親本細胞突變體的方法,其包括破壞或缺失編碼本發明的多肽的多核苷酸序列或其部分,所述方法導致在相同條件下培養時,與親本細胞相比突變的細胞產生較少的所述多肽。可以使用本領域熟知的方法(例如,插入、破壞、替代或缺失)通過減少或消除編碼本發明多肽的核苷酸序列的表達來構建突變細胞。在一個優選的方面,所述核苷酸序列是失活的。待修飾或失活的核苷酸序列可以是,例如,編碼區或其對活性關鍵的部分,或表達編碼區所需的調節元件。這種調節或調控序列的實例可以是啟動子序列或其功能部分,即,足以影響核苷酸序列表達的部分。用于可能的修飾的其它調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、信號肽序列、轉錄終止子和轉錄激活子。可以通過向親本細胞施以誘變,并且選擇其中已將所述核苷酸序列的表達減少或消除的突變細胞來進行核苷酸序列的修飾或失活。誘變可能是特異性的或隨機的,可以通過例如使用合適的物理或化學誘變劑進行,通過使用合適的寡核苷酸進行,或通過將所述DNA序列進行PCR產生的誘變。此外,可以通過使用這些誘變劑的任何組合來進行誘變。適合于本發明目的的物理或化學誘變劑的實例包括紫外線(UV)照射、羥胺、N-甲基-N'-硝基-N-亞硝基胍(MNNG)、0_甲基羥胺、亞硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亞硫酸氫鈉、甲酸和核苷酸類似物。當使用這些試劑時,通常通過如下方法來進行所述誘變在合適條件下存在優選的誘變劑時溫育待誘變的親本細胞,并篩選和/或選擇顯示基因表達減少的或無基因表達的突變體細胞。通過導入、取代或去除基因中的一個或多個(數個)核苷酸或其轉錄或翻譯所需的調控元件可以實現所述核苷酸序列的修飾或失活。例如,可以插入或去除核苷酸從而導致引入終止密碼子,去除起始密碼子,或改變開放閱讀框。按照本領域已知的方法通過定位誘變或PCR產生的誘變可以實現這種修飾或失活。盡管在理論上所述修飾可以在體內進行,即,直接在表達待修飾核苷酸序列的細胞上進行,但優選如下面所示例的那樣在體外進行所述修飾。消除或減少核苷酸序列通過細胞表達的便利方式的例子是基于基因取代,基因缺失,或基因破壞的技術。例如,在基因破壞方法中,將相應于內源核苷酸序列的核酸序列在體外進行誘變以產生缺陷性的核酸序列,隨后將其轉化入親本細胞中以產生缺陷基因。通過同源重組,所述缺陷性核酸序列替代了內源性核苷酸序列。理想的是所述缺陷性核苷酸序列還編碼標記,其可用于選擇其中核苷酸序列被修飾或破壞的轉化子。在特別優選的方面,用可選擇的標記(如本文所述的那些)來破壞所述核苷酸序列。或者,可以使用與所述核苷酸序列互補的序列通過確定的反義或RNAi技術來進行所述核苷酸序列的修飾或失活。更具體地,通過導入與所述基因的核苷酸序列互補的序列可以減少或消除所述核苷酸序列通過細胞的表達,所述序列可以在細胞中轉錄并且能夠與細胞中產生的mRNA雜交。由此在允許所述互補反義核苷酸序列與mRNA雜交的條件下,減少或消除翻譯的蛋白質的量。本發明進一步涉及親本細胞的突變體細胞,其包含編碼多肽的核苷酸序列或其調控序列的破壞或缺失,這導致與親本細胞相比突變體細胞產生更少的多肽或不產生多肽。這樣生成的多肽缺陷型突變細胞作為表達天然和/或異源多肽的宿主細胞特別有用。所以,本發明進一步涉及生產天然或異源多肽的方法,其包括(a)在有益于生產多肽的條件下培養突變細胞;和(b)回收所述多肽。術語“異源多肽”在本文中定義為對宿主細胞不是天然的多肽,進行了修飾以改變天然序列的天然蛋白,或作為通過重組DNA技術對宿主細胞操作的結果其表達在量上改變的天然蛋白。在另一方面,本發明涉及通過發酵可產生本發明的多肽以及目標蛋白產物的細胞來生產基本上無纖維素分解增強活性的蛋白質產品的方法在發酵之前、之中或發酵完成之后向發酵液(fermentationbroth)中添加有效量的能夠抑制纖維素分解增強活性的試劑,從發酵液中回收目標產物,并且任選地將回收的產物進行進一步純化。在另一方面,本發明涉及如下生產基本上無纖維素分解增強活性的蛋白質產品的方法在允許產物表達的條件下培養細胞,將得到的培養液進行組合的PH和溫度處理以基本上減少纖維素分解增強活性,和從發酵液中回收產物。或者,可以將從培養液回收的酶制備物進行組合的PH和溫度處理。所述組合的pH和溫度處理可任選地與用纖維素分解增強抑制劑處理組合使用。依照本發明的這個方面,可能去除至少60%,優選至少75%,更優選至少85%,還更優選至少95%,并且最優選至少99%的纖維素分解增強活性。可使用此方法獲得纖維素分解增強活性的完全去除。組合的pH和溫度處理優選在2-4或9-11范圍內的pH和至少60_70°C范圍內的溫度進行一段足夠的時間以達到期望的效果,通常30至60分鐘是足夠的。用于培養和純化感興趣的產物的方法可以通過本領域已知的方法進行。本發明用于產生基本上無纖維素分解增強活性的產物的方法在真核多肽,特別是真菌蛋白質例如酶的產生中是特別令人有興趣的。所述酶可以選自,例如,淀粉分解酶(anxiolyticenzyme)、脂肪分解酶、蛋白水解酶、纖維素分解酶(cellulolyticenzyme)、氧化還原酶或植物細胞壁降解酶。這些酶的實例包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、幾丁質酶(chitinase)、角質酶(cutinase)、環糊精糖基轉移酶、脫氧核糖核酸酶、內切葡聚糖酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、商素過氧化酶、半纖維素酶、轉化酶、異構酶、漆酶、連接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉移酶、轉谷氨酰胺酶或木聚糖酶。纖維素分解增強-缺陷細胞也可以用于表達在制藥上感興趣的異源蛋白質例如激素、生長因子、受體等。可理解的是術語“真核多肽”不僅包括天然多肽,也包括多肽例如酶,其通過氨基酸取代、缺失或添加或其它這樣的修飾而被修飾以增強活性、熱穩定性、PH耐受性等。在另外的方面,本發明涉及基本上無纖維素分解增強活性的蛋白質產物,其通過本發明的方法產生。抑制具有纖維素分解增強活性的多肽表達的方法本發明還涉及抑制具有纖維素分解增強活性的多肽在細胞中表達的方法,其包括對細胞施用雙鏈RNA(dsRNA)分子或者在細胞中表達雙鏈RNA(dsRNA)分子,其中dsRNA包含本發明多核苷酸的亞序列。在一個優選的方面,dsRNA長約15、16、17、18、19、20、21、22、23、24、25或更多的雙鏈體核苷酸。dsRNA優選是小干擾RNA(siRNA)或微RNA(miRNA)。在一個優選的方面,dsRNA是用于抑制轉錄的小干擾RNA(SiRNA)。在另一個優選的方面,dsRNA是用于抑制翻譯的小RNA(miRNA)。本發明還涉及用于抑制細胞中多肽表達的這些雙鏈RNA(dsRNA)分子,其包含SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列的部分。本發明不受限于任何特定作用機制,dsRNA能進入細胞,并引起相似或相同序列的單鏈RNA(SSRNA)的降解,所述RNA包括內源mRNA。當細胞接觸dsRNA時,來自同源基因的mRNA選擇性地受到稱為RNA干擾(RNAi)的過程的降解。本發明的dsRNA可以用于基因沉默療法。在一個方面,本發明提供使用本發明的dsRNAi選擇性地降解RNA的方法。所述過程可以在體外、在活體外(exvivo)或在體內進行。在一個方面,dsRNA分子能夠用于產生細胞、器官或動物中的功能缺失突變(loss-of-functionmutation)。制備或使用選擇性降解RNA的dsRNA分子的方法在本領域中公知,參見,例如,美國專利No.6,506,559;美國專利No.6,511,824;美國專利No.6,515,109;和美國專利No.6,489,127。組合物本發明還涉及包含本發明的多肽的組合物。優選地,所述組合物富含這種多肽。術語“富含”表示所述組合物的纖維素分解增強活性,例如,以至少1.1的富集因數(enrichmentfactor)增力口。所述組合物可以包含本發明的多肽作為主要酶成分,例如,單成分組合物。或者,所述組合物可以包含多種酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、鹵素過氧化物酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠分解酶、肽谷氨酰胺酶(peptidoglutaminase)、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶或木聚糖酶。額外的酶可以通過例如屬于以下屬或種的微生物產生曲霉屬,優選棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉或米曲霉;鐮孢屬,優選桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢;腐質霉屬,優選特異腐質霉或疏棉狀腐質霉;或木霉屬,優選哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉。32可以依照本領域內已知的方法制備多肽組合物,并且可以是液體或干組合物的形式。例如,所述多肽組合物可以是顆粒(granulate)或微粒(microgranulate)的形式。可以依照本領域內已知方法將包括于所述組合物中的多肽穩定化。下面給出的是本發明多肽組合物的優選的用途的實例。本發明的多肽組合物的劑量和使用該組合物的其它條件可以基于本領域內已知的方法確定。纖維素材料的加工本發明還涉及降解或轉化纖維素材料的方法,其包括在存在本發明的具有纖維素分解增強活性的多肽的情況下,用纖維素分解酶組合物處理纖維素材料。在一個優選方面,所述方法還包括回收已降解或轉化的纖維素材料。本發明還涉及產生發酵產物的方法,其包括(a)在存在本發明的具有纖維素分解增強活性的多肽的條件下,用纖維素分解酶組合物糖化纖維素材料;(b)用一種或多種發酵微生物發酵步驟(a)的糖化纖維素材料以產生發酵產物;和(c)從發酵回收發酵產物。本發明還涉及發酵纖維素材料的方法,其包括用一種或多種發酵微生物發酵纖維素材料,其中在存在具有纖維素分解增強活性的多肽的條件下,用纖維素分解酶組合物水解纖維素材料,并且與不存在具有纖維素分解增強活性的多肽相比,具有纖維素分解增強活性的多肽的存在增加纖維素材料的水解。在一個優選的方面,纖維素材料的發酵產生發酵產物。在另一個優選的方面,方法進一步包括從發酵回收發酵產物。包含具有纖維素分解增強活性的多肽的組合物可以是去除或不去除細胞的粗發酵液形式,或是半純化或純化的酶制劑形式,或者,組合物可以包含本發明的宿主細胞,所述宿主細胞在使用生物質的發酵方法中作為具有纖維素分解增強活性的多肽的來源。本發明的方法可以用于將纖維素材料糖化成可發酵糖,并且將可發酵糖轉化成很多有用的物質,例如,化學品和燃料。從纖維素材料產生期望的發酵產物通常涉及預處理、酶水解(糖化)和發酵。根據本發明的纖維素材料的處理可以使用本領域的常規過程完成。此外,本發明的方法能使用經配置以依照發明操作的任何常規生物質處理設備進行。水解(糖化)和發酵,分別或同時,包括但不限于,分離的水解和發酵(SHF)、同步糖化和發酵(SSF)、同步糖化和共發酵(SSCF)、混合的水解和發酵(HHF)、SHCF(分離的水解和共發酵)、HHCF(混合的水解和共發酵),和直接微生物轉化(DMC)。SHF使用分離的處理步驟以首先將木質纖維素酶水解為可發酵糖,例如,葡萄糖,纖維二糖、纖維三糖和戊糖,然后將可發酵糖發酵成為乙醇。在SSF中,木質纖維素的酶水解和糖變為乙醇的發酵在一個步驟中組合(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanolProductionandUtilization,ffyman,C.E編,Taylor&Francis,Washington,DC,179-212)。SSCF包括多種糖的共發酵(Sheehan,J.,和Himmel,Μ.,1999,Enzymes,energyandtheenvironment:AstrategicperspectiveontheU.S.DepartmentofEnergy'sresearchanddevelopmentactivitiesforbioethanol,Biotechnol.Prog.15=817-827)0HHF在同步糖化和水解步驟之外,還涉及單獨的水解步驟,所述步驟可以在同一個反應器中進行。HHF過程中的步驟可以在不同的溫度,S卩,高溫酶糖化,然后在發酵菌株能夠耐受的較低溫度進行SSF。DMC在一個或多個步驟中組合了所有三個過程(酶產生、木質纖維素水解和發酵),其中使用相同的生物體產生用于將木質纖維素轉化成可發酵糖并將可發酵糖轉化成終產物的酶(Lynd,L.R.,ffeimer,P.J.,vanZyl,W.H.,禾口Pretorius,I.S.,2002,Microbialcelluloseutilization!Fundamentalsandbiotechnology,Microbiol.Mol.Biol.Reviews66:506_577)。在本文可以理解的是,本領域中任何已知的方法,包括預處理、酶水解(糖化)、發酵,或它們的組合,可用于實施本發明的方法。常規設備包括補料批式攪拌反應器、批式攪拌反應器、具有超濾的連續流攪拌反應器和/或連續活塞流柱式反應器(FernandadeCastilhosCorazza,FlavioFariadeMoraes,GisellaMariaZanin禾口IvoNeitzel,2003,Optimalcontrolinfed-batchreactorforthecellobiosehydrolysis,ActaScientiarum.Technology25:33_38;Gusakov,A.V.,禾口Sinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose:1.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7:346_352)、研磨反應器(Ryu,S.K.,和Lee,J.Μ.,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.25:53_65),或者具有由電磁場引起的強烈攪拌的反應器(Gusakov,Α.V.,Sinitsyn,Α.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,0.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,Appl.Biochem.Biotechnol.56:141-153)。其它反應器類型包括流化床、升流層、固定化和用于水解和/或分解的擠出機型的反應器。預處理。在本發明的方法的實施中,可以使用本領域已知的任何預處理過程破壞植物細胞壁成分。纖維素材料也可以在預處理之前使用本領域中已知的方法進行預浸泡、潤濕或調節。常規的預處理包括,但不限于,蒸汽預處理(具有或不具有爆炸)、稀酸預處理、熱水預處理、石灰預處理、濕氧化、濕爆炸、氨纖維爆炸、有機溶劑預處理和生物預處理。其它預處理包括超聲、電穿孔、微波、超臨界CO2、超臨界H2O和氨滲濾預處理。可以在水解和/或發酵之前預處理纖維素材料。預處理優選在水解前進行。或者,預處理可以與水解同時進行,如與用一種或多種纖維素分解酶或者其它酶活性處理纖維素材料同時進行以釋放可發酵糖,如葡萄糖和/或麥芽糖。在大多數情況下,預處理步驟本身使一些生物質轉化成可發酵糖(甚至在不存在酶的情況下)。蒸汽預處理。在蒸汽預處理中,加熱纖維素材料以破壞植物細胞壁成分,包括木質素、半纖維素和纖維素,使酶可以到達纖維素和其它部分,例如,半纖維素。將木質纖維素物質通過或穿過反應容器,其中注入蒸汽以增加溫度至需要的溫度和壓力,并且在其中保持期望的反應時間。蒸汽預處理優選在140-230°C,更優選160-200°C,并且最優選170-190°C進行,其中最優的溫度和范圍依賴于加入的任何化學催化劑。蒸汽預處理的停留時間優選1-15分鐘,更優選3-12分鐘,并且最優選4-10分鐘,其中最優的停留時間依賴于溫度范圍和加入的任何化學催化劑。蒸汽預處理允許相對較高的固體加載量,使纖維素材料在預處理過程中通常僅僅變得潮濕。蒸汽預處理經常與預處理后對物質的爆炸放料(explosivedischarge)組合,這稱為蒸汽爆炸,即,快速閃變至大氣壓和物質的湍流,以通過破碎增加可接觸的表面積(Duff禾口Murray,1996,BioresourceTechnology8551-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618_628;美國專利申請No.20020164730)。在蒸汽預處理過程中,切割半纖維素乙酰基團,并且得到的酸自催化纖維素部分水解成單糖和寡糖。去除木質素至有限的程度。經常在蒸汽預處理之前加入催化劑如H2SO4或SO2(通常0.3至3%w/w),其可減少時間,降低溫度,增加回收率,并促進酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132496-508;Varga^,2004,Appl.Biochem.Biotechnol.113-116509-523;Sassner等·,2006,EnzymeMicrob.Technol.39:756_762)。化學預處理術語“化學處理“指能促進纖維素、半纖維素和/或木質素分離和/或釋放的任何化學處理。合適的化學預處理步驟的實例包括例如稀酸預處理、石灰預處理、濕氧化、氨纖維/冷凍爆炸(AFEX)、氨滲濾(APR)和有機溶劑預處理。在稀酸預處理中,將纖維素材料與稀酸(通常是H2SO4)和水混合以形成漿料,由蒸汽加熱至期望的溫度,并在一段停留時間后閃變至大氣壓。可以用很多反應器設計進行稀酸預處理,例如,活塞流式反應器、逆流反應器或連續逆流收縮床反應器(Duff和Murray,1996,supra;Schell等,2004,BioresourceTechnol.91179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93_115)。還可以使用堿性條件下的幾種預處理方法。這些堿預處理包括,但不限于,石灰預處理、濕氧化、氨滲濾(APR)和氨纖維/冷凍爆炸(AFEX)。用碳酸鈣、氫氧化鈉或氨,在85_150°C的低溫進行石灰預處理,停留時間從1小時到幾天(Wyman等,2005,BioresourceTechnol.961959-1966;Mosier等,2005,BioresourceTechnol.96:673_686)。WO2006/11089UW02006/11899,WO2006/11900和WO2006/110901公開了使用氨的預處理方法。濕法氧化是熱預處理,通常在180-220°C進行5_15分鐘,加入氧化劑如過氧化氫或過壓氧(Schmidt禾口Thomsen,1998,BioresourceTechnol.64139-151;Palonen等,2004,Appl.Biochem.Biotechnol.1171-17;Varga^,2004,Biotechnol.Bioeng.88567-574;Matin等,2006,J.Chem.Technol.Biotechnol.811669-1677)。預處理以優選1-40%干物質,更優選2-30%干物質,并且最優性5-20%干物質進行,并且由于加入堿如碳酸鈉,初始PH經常會增加。濕法氧化預處理方法的修改方法,稱為濕爆炸(濕氧化和蒸汽爆炸的組合),能夠處理高達30%的干物質。在濕爆炸中,在預處理過程中,在一定的停留時間后引入氧化劑。然后通過閃變至大氣壓而結束預處理(W02006/032282)。氨纖維爆炸(AFEX)涉及在溫和溫度如90-100°C和高壓如17_20bar,用液體或氣體氨處理纖維素材料5-10分鐘,其中干物質含量可以高達60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23_35;Chundawat等,2007,Biotechnol.Bioeng.96219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133_1141;Teymouri等,2005,BioresourceTechnol.96:2014_2018)。AFEX預處理導致纖維素解聚,和半纖維素的部分水解。木質素_糖復合物得到切割。有機溶劑預處理通過用含水乙醇(40-60%乙醇)在160_200°C提取30-60分鐘而將纖維素材料去木質素化(Pan等,2005,Biotechnol.Bioeng.90:473_481;Pan等,2006,Biotechnol.Bioeng.94:851_861;Kurabi等,2005,Appl.Biochem.Biotechnol.121219-230)。經常加入硫酸作為催化劑。在有機溶劑預處理中,去除大部分半纖維素。合適的預處理方法的其他實例如Schell等,2003,Appl.BiochemandBiotechn.105-108:69-85,禾口Mosier等,2005,BioresourceTechnology96:673_686,禾口美國專利公開申請2002/0164730所述。在一個方面,化學預處理優選作為酸處理,并且更優選作為連續稀酸和/或弱酸(mildacid)處理進行。酸通常是硫酸,但也可以使用其它酸,如乙酸、檸檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氫或其混合物。弱酸處理在優選1-5,更優選1-4,并且最優選1-3的PH范圍內進行。在一個方面,酸濃度在優選0.01至20wt%酸,更優選0.05至IOwt%酸,甚至更優選0.1至5襯%酸,并且最優選0.2至2.Owt%酸的范圍內。酸與纖維素材料接觸,并在優選160-220°C,和更優選165-195°C范圍內的溫度保持數秒到數分鐘,例如1秒-60分鐘的時間。在另一個方面,預處理作為氨纖維爆炸步驟(AFEX預處理步驟)進行。在另一個方面,預處理發生在含水漿料中。在優選的方面,在預處理過程中纖維素材料以優選10-80wt%,更優選20-70wt%,并且最優性30-60wt%,如約50wt%的量存在。預處理的纖維素材料可以不洗滌或者使用本領域任何已知的方法洗滌,例如,用水洗滌。機械預處理術語“機械預處理”指各種類型的研磨或碾磨(例如,干磨、濕磨或振動球磨)。物理預處理術語“物理預處理”指促進纖維素、半纖維素和/或木質素從纖維素材料分離和/或釋放的任何處理。例如,物理預處理可涉及輻射(例如,微波輻射)、汽蒸/蒸汽爆炸、水熱解(hydrothermolysis)和它們的組合。物理預處理可以涉及高壓和/或高溫(蒸汽爆炸)。在一個方面,高壓指優選約300至約600psi,更優選約350至約550psi,并且最優選約400至約500psi,如約450psi的壓力。在另一個方面,高溫指約100至300°C,優選約140至235°C的溫度。在一個優選的方面,機械預處理在使用如上所定義的高溫和高壓的分批過程、蒸汽槍水解器系統,例如來自SundsDefibratorAB,Sweden的SundsHydrolyzer中進行。組合的物理和化學預處理可以對纖維素材料進行物理和化學預處理。例如,預處理步驟可以涉及稀酸或弱酸處理和高的溫度和/或壓力處理。根據需要,可以順序或同時進行物理和化學預處理。還可以包括機械預處理。因此,在一個優選的方面,對纖維素材料進行機械、化學或物理預處理,或者它們的任何組合,以促進纖維素、半纖維素和/或木質素的分離和/或釋放。生物預處理術語“生物預處理”指可以促進纖維素、半纖維素和/或木質素從纖維素材料分離和/或釋放的任何生物預處理。生物預處理技術可以包括應用溶解木質素的微生物(參見,例如,Hsu,1996,Pretreatmentofbiomass,于HandbookonBioethanolProductionandUtilization,Wyman,C.E編,Taylor&Francis,Washington,DC,179-212;Ghosh禾口Singh,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,Adv.App1.Microbiol.39295-333;McMillan,1994,Pretreatinglignocellulosicbiomass:areview,于EnzymaticConversionofBiomassforFuelsProduction,Himmel,Baker禾口Overend編,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,chapter15;Gong,Cao,Du禾口Tsao,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper編,Springer-VerlagBerlinHeidelberg,Germany,65:207_241;Olsson禾口Hahn-Hagerdal,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18312—331;禾口Vallander禾口Eriksson,1990,Productionofethanolfromlignocellulosicmaterials:Stateoftheart,Adv.Biochem.Eng./Biotechnol.42:63_95)0MM。在水解(也稱作糖化)步驟中,將預處理的纖維素材料水解以將纖維素和任選地也將半纖維素分解成可發酵糖,如葡萄糖、木糖、木酮糖、阿拉伯糖、麥芽糖、甘露糖、半乳糖,或可溶的寡糖。水解由纖維素分解酶組合物以酶法進行,所述組合物包含本發明具有纖維素分解增強活性的多肽,其可以進一步包含一種或多種半纖維素分解酶。組合物的酶還可以順序加入。酶水解優選在易于由本領域技術人員確定的條件下,在合適的含水環境中進行。在一個優選的方面,水解在適于酶的活性,即對于酶最優的條件下進行。水解可以以補料批式或連續的過程進行,其中將預處理的纖維素材料(底物)逐漸補入,例如,含酶的水解溶液中。糖化通常在攪拌釜反應器或發酵罐中,在受控的pH、溫度和混合條件下進行。合適的處理時間、溫度和PH條件可以由本領域技術人員容易地確定。例如,糖化可以持續長達200小時,但是通常優選進行約12至約96小時,更優選約16至約72小時,并且最優選約24至約48小時。溫度優選約25°C至約70°C,更優選約30°C至約65°C,并且最優選約40°C至約60°C,特別是約50°C。pH優選約3至約8,更優選約3.5至約7,并且最優選約4至約6,特別是約pH5。干燥固體含量優選約5至約50wt%,更優選約10至約40wt%,并且最優選約20至約30wt%。除了本發明具有纖維素分解增強活性的多肽之外,組合物的纖維素分解酶成分優選是具有內切葡聚糖酶、纖維二糖水解酶,和β-葡糖苷酶活性的酶。在一個優選的方面,纖維素分解酶組合物包含一種或多種(幾種)選自下組的纖維素分解酶纖維素酶、內切葡聚糖酶、纖維二糖水解酶,和葡糖苷酶。在另一個優選的方面,纖維素分解酶制劑可補充有選自下組的一種或多種其它酶活性半纖維素酶、酯酶(例如,脂肪酶、磷脂酶,和/或角質酶)、蛋白酶、漆酶、過氧化物酶,或它們的混合物。在本發明的方法中,可以在發酵前或過程中(包括在發酵微生物的繁殖的過程中或之后)加入其它酶。酶可以源自或獲得自任何合適的來源,包括細菌、真菌、酵母、植物或哺乳動物來源。術語“獲得”在本文中表示酶可以從天然地產生所述酶作為天然酶的生物體分離。術語“獲得”在本文中還表示酶可以在采用本文所述方法的宿主生物體中重組產生,其中重組產生的酶對宿主生物體是天然或外源的,或具有修飾的氨基酸序列,例如,具有缺失的、插入的和/或取代的一個或多個氨基酸,即,重組產生的酶,其為天然氨基酸序列的片段和/或突變體;或由本領域已知的核苷酸改組方法產生的酶。天然酶的意義中包含天然變體,而外源酶的意義中包含通過重組獲得的變體,如通過定向誘變或改組獲得的變體。本發明使用的酶可以是示于本文所述方法的任何形式,如含有或者不含細胞的粗發酵液或基本上純的多肽。酶可為干粉或顆粒、無塵顆粒,液體、穩定化的液體或受保護的酶。顆粒可以通過,例如美國專利No.4,106,991和4,661,452中公開的方法產生,或者可任選地通過本領域已知的方法包覆。可以,例如,根據已確立的方法通過加入穩定劑(如糖、糖醇或另一種多元醇(polyol),和/或乳酸或另一種有機酸)將液體酶制劑穩定化。受保37護的酶可以根據EP238,216中公開的方法制備。具有纖維素分解增強活性的酶和多肽的最適量取決于幾個因素,其包括但不限于,組分纖維素分解酶的混合物、含纖維素底物、含纖維素底物的濃度、含纖維素底物的預處理、溫度、時間、PH和包括發酵生物體(例如,同步糖化和發酵的酵母)。在一個優選的方面,纖維素分解酶對于纖維素材料的有效量是約0.5至約50mg,優選約0.5至約40mg,更優選約0.5至約25mg,更優選約0.75至約20mg,更優選約0.75至約15mg,甚至更優選約0.5至約10mg,并且最優選約2.5至約IOmg每g纖維素材料。在另一個優選的方面,具有纖維素分解增強活性的多肽對于纖維素材料的有效量是約0.01至約50mg,優選約0.5至約40mg,更優選約0.5至約25mg,更優選約0.75至約20mg,更優選約0.75至約15mg,甚至更優選約0.5至約10mg,并且最優選約2.5至約IOmg每g纖維素材料。在另一個優選的方面,具有纖維素分解增強活性的多肽對于纖維素材料的有效量是約0.01至約50.Omg,優選約0.01至約40mg,更優選約0.01至約30mg,更優選約0.01至約20mg,更優選約0.01至約10mg,更優選約0.01至約5mg,更優選約0.025至約1.5mg,更優選約0.05至約1.25mg,更優選約0.075至約1.25mg,更優選約0.1至約1.25mg,甚至更優選約0.15至約1.25mg,并且最優選約0.25至約1.Omg每g纖維素材料。在另一個優選的方面,具有纖維素分解增強活性的多肽對于纖維素分解酶的有效量是約0.005至約1.Og,優選約0.01至約1.Og,更優選約0.15至約0.75g,更優選約0.15至約0.5g,更優選約0.1至約0.5g,甚至更優選約0.1至約0.5g,并且最優選約0.05至約0.2g每g纖維素分解酶。發酵。通過能將糖直接或間接發酵成期望發酵產物的發酵微生物,發酵獲得自預處理和水解的纖維素材料的可發酵糖。“發酵”或“發酵方法”指任何發酵方法或包含發酵步驟的任何方法。發酵方法還包括用于消費品醇工業(例如,啤酒和葡萄酒)、乳品業(例如,發酵乳制品)、皮革業和煙草業的發酵方法。發酵條件依賴于期望的發酵產物和發酵生物體,并且能由本領域的技術人員容易地確定。在發酵步驟中,作為預處理和酶水解步驟的結果從纖維素材料釋放的糖,通過發酵生物體(如酵母)發酵成為產物,例如,乙醇。水解(糖化)和發酵可以是單獨或同時的。這種方法包括,但不限于,單獨的水解和發酵(SHF);同時糖化和發酵(SSF);同時糖化和共發酵(SSCF);混合的水解和發酵(HHF);SHCF(單獨的水解和共發酵)、HHCF(混合的水解和共發酵),和直接微生物轉化(DMC)。在本發明的發酵步驟中可以使用任何合適的含纖維素底物或原材料。通常根據理想的發酵產品(即,要從發酵獲得的物質)和使用的方法來選擇底物,如本領域中所公知。適用于本發明的方法中的底物的實例包括纖維素材料,如木材或植物殘余物或獲得自能夠由發酵微生物代謝的經處理的纖維素材料的低分子量糖DP1-3,所述物質可以通過直接向發酵培養基中加入而提供。術語“發酵培養基”在本文中可理解為指加入發酵微生物之前的培養基,如,由糖化過程產生的培養基,以及同步的糖化和發酵方法(SSF)中使用的培養基。“發酵微生物”指適用于理想的發酵方法產生發酵產物的任何微生物,包括細菌和真菌生物體。發酵生物體可以是(;和/或C5發酵生物體,或它們的組合。C6和C5發酵生物體均在本領域公知。合適的發酵微生物能將糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麥芽糖、甘露糖、半乳糖或寡糖)直接或間接地發酵(即,轉化)成理想的發酵產品。可產生乙醇的細菌和真菌發酵生物體的實例如Lin等,2006,Appl.Microbiol.Biotechnol.69:627_642所述。能發酵C6糖的發酵微生物的實例包括細菌和真菌生物體,如酵母。優選的酵母包括酵母屬菌種,優選釀酒酵母。能發酵C5糖的發酵生物體的實例包括細菌和真菌生物體,如酵母。優選的C5發酵酵母包括畢赤酵母屬,優選樹干畢赤酵母(Pichiastipitis)的菌株,如樹干畢赤酵母CBS5773;念珠菌屬,優選博伊丁念珠菌(Candidaboidinii)、蕓薹念珠菌(Candidabrassicae)、休哈塔念珠菌(Candidasheatae)、迪丹斯念珠菌(Candidadiddensii)、偽熱(Candidapseudotropicalis)(Candidautilis)的其它發酵生物體包括發酵單胞菌屬(Zymomonas),如運動發酵單胞菌(Zymomonasmobilis);漢遜酵母屬,如異常漢遜酵母(Hansenulaanomala);克魯維酵母屬,如脆壁克魯維酵母;裂殖酵母屬,如粟酒裂殖酵母(S.pombe);和大腸桿菌的菌株,特別是已經經過遺傳修飾而提高乙醇產量的大腸桿菌菌株。在一個優選的方面,酵母是酵母屬菌種。在一個更優選的方面,酵母是釀酒酵母。在另一個更優選的方面,酵母是糖化酵母(Saccharomycesdistaticus)0在另一個更優選的方面,酵母是葡萄汁酵母(Saccharomycesuvarum)。在另一個優選的方面,酵母是克魯維酵母屬。在另一個更優選的方面,酵母是馬克斯克魯維酵母(Kluyveromycesmarxianus)0在另一個更優選的方面,酵母是脆壁克魯維酵母。在另一個優選的方面,酵母是念珠菌屬。在另一個更優選的方面,酵母是博伊丁念珠菌。在另一個更優選的方面,酵母是蕓薹念珠菌。在另一個更優選的方面,酵母是迪丹斯念珠菌。在另一個更優選的方面,酵母是假熱帶念珠菌。在另一個更優選的方面,酵母是產朊念珠菌。在另一個優選的方面,酵母是棒孢酵母屬(Clavispora)。在另一個更優選的方面,酵母是葡萄牙棒孢酵母(Clavisporalusitaniae)。在另一個更優選的方面,酵母是Clavisporaopuntiae。在另一個優選的方面,酵母是管囊酵母屬(Pachysolen)。在另一個更優選的方面,酵母是嗜鞣管囊酵母(Pachysolentarmophilus)。在另一個優選的方面,酵母是畢赤酵母屬。在另一個更優選的方面,酵母是樹干畢赤酵母。在另一個優選的方面,酵母是酒香酵母屬(Bretarmomyces)。在另一個更優選的方面,酵母是克勞森酒香酵母(Bretannomycesclausenii)(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanolProductionandUtilization,ffyman,C.E.編,Taylor&Francis,Washington,DC,179-212)。能有效地將己糖和戊糖發酵成乙醇的細菌包括,例如,運動發酵單胞菌和熱纖維梭菌(Clostridiumthermocellum)(Philippidis,1996,見上文)。在一個優選的方面,細菌是發酵單胞菌屬。在更優選的方面,細菌是運動發酵單胞菌。在另一個優選的方面,細菌是梭菌屬。在另一個更優選的方面,細菌是熱纖維梭菌。商業上可得到的適合乙醇產生的酵母包括,例如ETHAN0LRED酵母(可從RedStar/Lesaffre,USA獲得)、FALI(可從Fleischmann,sYeast,BumsPhilpFoodInc.,USA部門獲得)、SUPERSTART和THERM0SACC新鮮酵母(可從EthanolTechnology,WI,USA獲得)、BIOFERMAFT和XR(可從NABC-NorthAmericanBioproductsCorporation,GA,USA獲得)、GERTSTRAND(可從GertStrandAB,Sweden獲得)和FERMIOL(可從DSMSpecialties獲得)。在一個優選的方面,發酵微生物已經經過遺傳修飾,提供發酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。通過將異源基因克隆入多種發酵微生物已經構建了能將己糖和戊糖轉化成乙醇(共發酵)的生物體(Chen禾口Ho,1993,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,Appl.Biochem.Biotechnol.39-40135-147;Ho等,1998,GeneticallyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,Appl.Environ.Microbiol.64:1852-1859;Kotter禾口Ciriacy,1993,XylosefermentationbySaccharomycescerevisiae,Appl.Micrbiol.Biotechnol.38:776_783;Walfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKLlandTALIgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microbiol.61:4184_4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentation:aproofofprinciple,FEMSYeastResearch4655-664;Beall1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoli,Biotech.Bioeng.38296~303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58204~214;Zhang等,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267:240_243;Deanda等,1996,Developmentofanarabinose-fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.624465-4470)。在一個優選的方面,經過遺傳修飾的發酵微生物是釀酒酵母。在另一個優選的方面,經過遺傳修飾的發酵微生物是運動發酵單胞菌。在另一個優選的方面,經過遺傳修飾的發酵微生物是大腸桿菌。在另一個優選的方面,經過遺傳修飾的發酵微生物是產酸克雷伯氏菌(Klebsiellaoxytoca)0本領域中公知的是,上述生物體還能用于產生其它物質,如本文所述。通常向降解的木質纖維素或水解物加入發酵微生物,并進行約8至約96小時,如約24至約60小時發酵。溫度通常為約26°C至約60°C,特別是約32°C或50°C,并且在約pH3至約pH8,如約pH4-5,6或7。在一個優選的方面,對降解的木質纖維素或水解物施用酵母和/或另一種微生物,并進行約12至約96小時,如通常為24-60小時發酵。在一個優選的方面,溫度優選為約20°C至約60°C,更優選約25°C至約50°C,并且最優選約32°C至約50°C,特別是約32°C或50°C,并且pH通常為約pH3至約pH7,優選約pH4_7。然而,一些細菌發酵生物體,例如,具有更高的最適發酵溫度。酵母或另一種微生物優選以約IO5-IO12,優選約IO7-IOltl,特別是約2xl08活細胞計數每ml發酵液的量施用。關于使用酵母進行發酵的進一步指導可以在例如"TheAlcoholTextbook,,(K.Jacques,Τ.P.Lyons禾口D.R.Kelsall編,NottinghamUniversityPress,UnitedKingdom1999)中找到,其通過提述并入本文。本領域最廣泛使用的方法是同步的糖化和發酵(SSF)方法,其中沒有糖化的保持階段,意味著酵母和酶一起添加。對于乙醇生產,在發酵后蒸餾漿料以提取乙醇。根據本發明的方法獲得的乙醇可以用作,例如燃料乙醇;飲料乙醇,即,中性飲料酒,或工業乙醇。發酵刺激劑可以與本文所述的任何酶方法組合使用,以進一步改進發酵工藝,而且特定地,改進發酵微生物的性能,如,速率增加和乙醇得率。“發酵刺激劑”指用于發酵微生物(特別是酵母)生長的刺激劑。優選的用于生長的發酵刺激劑包括維生素和礦物質。維生素的實例包括多種維生素、生物素、泛酸(鹽)、煙酸、內消旋肌醇(meso-inositol)、硫胺素、吡哆醇(pyridoxine)、對氨基苯甲酸、葉酸、核黃素和維生素A、B、C、D禾口E。參見,例如,Alfenore等,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed-batchprocess,Springer-Verlag(2002),其通過提述并入本文。礦物質的實例包括能夠提供營養物的礦物質和礦物質鹽,所述營養物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。發酵產物發酵產物可以是源自發酵的仵何物質。發酵產物可以是,不限于,醇(例如,阿拉伯醇、丁醇、乙醇、甘油、甲醇、1,3_丙二醇、山梨醇和木糖醇);有機酸(例如,乙酸、醋酮酸、己二酸、抗壞血酸、檸檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羥基丙酸、衣康酸、乳酸、蘋果酸、丙二酸、草酸、丙酸、琥珀酸和木糖酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、賴氨酸、絲氨酸和蘇氨酸);和氣體(例如,甲烷、氫氣(H2)、二氧化碳(CO2)和一氧化碳(C0))。發酵產物還可以是作為高價值產品的蛋白質。在一個優選的方面,發酵產物是醇。可理解的是,術語“醇”包括包含一個或多個羥基基團的物質。在更優選的方面,所述醇是阿拉伯醇。在另一個更優選的方面,所述醇是丁醇。在另一個更優選的方面,所述醇是乙醇。在另一個更優選的方面,所述醇是甘油。在另一個更優選的方面,所述醇是甲醇。在另一個更優選的方面,所述醇是1,3_丙二醇。在另一個更優選的方面,所述醇是山梨醇。在另一個更優選的方面,所述醇是木糖醇。參見,例如,Gong,C.S.,Cao,N.J.,Du,J.,禾口Tsao,G.Τ.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.編,Springer-VerlagBerlinHeidelberg,Germany,65207-241;Silveira,Μ.M.,禾口Jonas,R.,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59400-408;Nigam,P.,禾口Singh,D.,1995,Processesforfermentativeproductionofxylitol-asugarsubstitute,ProcessBiochemistry30(2):117_124;Ezeji,T.C.,Qureshi,N.禾口Blaschek,H.P.,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerinckiiBA101andinsiturecoverybygasstripping,WorldJournalofMicrobiologyandBiotechnology19(6):595_603o在另一個優選的方面,所述物質是有機酸。在另一個更優選的方面,所述有機酸是乙酸。在另一個更優選的方面,所述有機酸是醋酮酸。在另一個更優選的方面,所述有機酸是己二酸。在另一個更優選的方面,所述有機酸是抗壞血酸。在另一個更優選的方面,所述有機酸是檸檬酸。在另一個更優選的方面,所述有機酸是2,5-二酮-D-葡糖酸。在另一個更優選的方面,所述有機酸是甲酸。在另一個更優選的方面,所述有機酸是反丁烯二酸。在另一個更優選的方面,所述有機酸是葡糖二酸。在另一個更優選的方面,所述有機酸是葡糖酸。在另一個更優選的方面,所述有機酸是葡糖醛酸。在另一個更優選的方面,所述有機酸是戊二酸。在另一個優選的方面,所述有機酸是3-羥基丙酸。在另一個更優選的方面,所述有機酸是衣康酸。在另一個更優選的方面,所述有機酸是乳酸。在另一個更優選的方面,所述有機酸是蘋果酸。在另一個更優選的方面,所述有機酸是丙二酸。在另一個更優選的方面,所述有機酸是草酸。在另一個更優選的方面,所述有機酸是丙酸。在另一個更優選的方面,所述有機酸是琥珀酸。在另一個更優選的方面,所述有機酸是木糖酸。參見,例如,Chen,R.,禾口Lee,Y.Y.,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63—65:435_4480在另一個優選的方面,所述物質是酮。可理解的是術語“酮”包括含有一個或多個酮基的物質。在另一個更優選的方面,所述酮是丙酮。參見,例如,Qureshi和Blaschek,2003,見上文。在另一個優選的方面,所述物質是氨基酸。在另一個更優選的方面,所述有機酸是天冬氨酸。在另一個更優選的方面,所述氨基酸是谷氨酸。在另一個更優選的方面,所述氨基酸是甘氨酸。在另一個更優選的方面,所述氨基酸是賴氨酸。在另一個更優選的方面,所述氨基酸是絲氨酸。在另一個更優選的方面,所述氨基酸是蘇氨酸。參見,例如,Richard,Α·,禾口Margaritis,Α·,2004,Empiricalmodelingofbachfermentaionkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,BiotechnologyandBioengineering87(4):501_515o在另一個優選的方面,所述物質是氣體。在另一個更優選的方面,所述氣體是甲烷。在另一個更優選的方面,所述氣體是H2。在另一個更優選的方面,所述氣體是C02。在另一個更優選的方面,所述氣體是CO。參見,例如,Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7)41-47;禾口GunaseelanV.N.于BiomassandBioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobicdigestionofbiomassformethaneproduction:Areview。_可以使用本領域已知的任何方法,任選地從發酵培養基回收發酵產物,所述方法包括,但不限于,層析、電泳方法、差示溶解度(例如,硫酸銨沉淀)、蒸餾或提取。例如,通過常規蒸餾方法從發酵的纖維素材料分離并純化醇。可以獲得純度高達約96vol%的乙醇,其能用作,例如,燃料乙醇、飲料乙醇,即,中性飲料酒,或工業乙醇。纖維素分解酶組合物在本發明的方法中,纖維素分解酶組合物可以包含任何酶,所述酶參與將含纖維素材料加工為葡萄糖,或者將半纖維素加工為木糖、甘露糖、半乳糖和阿拉伯糖,它們的聚合物,或者如下所述源自它們的產物。在一個方面,纖維素分解酶組合物包含選自下組的一種或多種酶內切葡聚糖酶、纖維二糖水解酶,和β-葡糖苷酶。在另一個方面,纖維素分解酶組合物進一步包一種或多種其它酶活性,以促進含纖維素材料的降解。優選的其它酶是半纖維素酶、酯酶(例如,脂肪酶、磷脂酶,和/或角質酶)、蛋白酶、漆酶、過氧化物酶,或它們的混合物。纖維素分解酶組合物可以是單成分制備物,例如,內切葡聚糖酶,多成分制備物,例如,內切葡聚糖酶、纖維二糖水解酶,和葡糖苷酶,或多成分和單成分蛋白制備物的組合。纖維素分解蛋白可以具有活性,即,在酸性、中性或堿性PH范圍中水解含纖維素材料。如上所述,本發明中使用的纖維素分解蛋白可以是單成分制備物,即,基本不含其它纖維素分解成分的成分。單成分可以是重組成分,即,通過克隆編碼單成分的DNA序列,然后用所述DNA序列轉化細胞,并在宿主中表達而產生(參見,例如,WO91/17243和WO91/17244)。宿主細胞可以是異源細胞(酶對于宿主是異源的)或者宿主還可以是野生型宿主(酶對于宿主是天然的)。單成分纖維素分解蛋白還可以通過從發酵液純化這種蛋白而制備。本發明使用的酶可以是示于本文所述方法的任何形式,如,例如,含有或者不含細胞的粗發酵液、干粉或顆粒、無塵顆粒、液體、穩定化的液體或受保護的酶。顆粒可以通過,例如美國專利No.4,106,991和4,661,452中公開的方法產生,或者可任選地通過本領域已知的方法包覆。可以,例如,根據已確立的方法通過加入穩定劑(如糖、糖醇或另一種多元醇(polyol),和/或乳酸或另一種有機酸)將液體酶制劑穩定化。受保護的酶可以根據EP238,216中公開的方法制備。本發明具有纖維素酶分解活性的多肽可以是細菌多肽。例如,所述多肽可以是革蘭氏陽性細菌多肽例如芽孢桿菌屬、鏈球菌屬、鏈霉菌屬、葡萄球菌屬、腸球菌屬、乳桿菌屬、乳球菌屬、梭菌屬、地芽孢桿菌屬或海洋芽孢桿菌屬多肽,所述多肽具有纖維素分解酶活性;或革蘭氏陰性細菌多肽,如大腸桿菌、假單胞菌屬、沙門氏菌屬、彎曲桿菌屬、螺桿菌屬、黃桿菌屬、梭桿菌屬、泥桿菌屬、奈瑟氏菌屬或脲原體屬多肽,其具有纖維素分解酶活性。在一個優選方面,所述多肽是具有纖維素分解酶活性的嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環狀芽孢桿菌、克勞氏芽孢桿菌、凝結芽孢桿菌、堅強芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌或蘇云金芽孢桿菌多肽。在另一個優選的方面,所述多肽是具有纖維素分解酶活性的似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌或馬鏈球菌獸瘟亞種多肽。在另一個優選的方面,所述多肽是具有纖維素分解酶活性的不產色鏈霉菌、除蟲鏈霉菌、天藍鏈霉菌、灰色鏈霉菌或淺青紫鏈霉菌多肽。本發明具有纖維素分解酶活性的多肽也可以是真菌多肽,并且更優選酵母多肽如念珠菌屬、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬多肽,其具有纖維素分解酶活性;或更優選絲狀真菌多肽如枝頂孢霉屬、傘菌屬、鏈格孢屬、曲霉屬、短梗霉屬、Botryospaeria、擬M菌屬、毛_殼屬、金包子菌屬、Claviceps>Cochliobolus、鬼傘屬、Coptotermes、棒囊殼屬、隱叢赤殼菌屬、隱球菌屬、色二孢屬、黑耳屬、Filibasidium、鐮孢屬、赤霉屬、全鞭毛蟲屬、腐質霉屬、耙齒菌屬、蘑菇屬、L印tospaeria、梨孢菌屬、Melanocarpus、多孔菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬、瘤胃壺菌屬、Poitrasia、假黑盤菌屬、Pseudotrichonympha、根毛霉屬、裂褶菌屬、柱頂孢屬、踝節菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、木霉屬、長毛盤菌屬、輪枝孢43屬、包腳菇屬或炭角菌屬多肽,其具有纖維素分解酶活性。在一個優選的方面,所述多肽是卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母或卵形酵母多肽,其具有纖維素分解酶活性。在另一個優選的方面,所述多肽是解纖維枝頂孢霉、棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉、米曲霉、嗜角質金孢子菌、Chrysosporiumlucknowense、熱帶金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、粗金抱子菌、Chrysosporiumqueenslandicum>Chrysosporiumzonatum>ffJfe^lftJfeJfe^庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、灰腐質霉、特異腐質霉、疏棉狀腐質霉、白耙齒菌、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、繩狀胄胃、,胃胄胃、胃―胃胃、Thielaviaachromatica>Thielaviaalbomyces>Thielaviaalbopilosa、澳洲梭孢殼(Thielaviaaustraleinsis)、Thielaviafimeti、小孢梭孢殼(Thielaviamicrospora)、卵包梭包殼(Thielaviaovispora)>Thielaviaperuviana、Thielaviaspededonium、^;—;^(Thielaviasetosa)>Thielaviasubthermophila>i生梭孢霉、哈茨木霉、康寧木霉、長枝木霉、里氏木霉、綠色木霉或Trichophaeasaccata多肽,其具有纖維素分解酶活性。還可以使用纖維素分解蛋白的化學修飾或蛋白質工程改造突變體。纖維素酶組合物的一個或多個成分可以是重組成分,S卩,通過克隆編碼單成分的DNA序列,然后用所述DNA序列轉化細胞,并在宿主中表達而產生(參見,例如,WO91/17243和WO91/17244)。宿主細胞優選為異源細胞(酶對于宿主是異源的),但在某些條件下,宿主還可以是同源宿主(酶對于宿主是天然的)。多成分纖維素分解蛋白還可以通過從發酵液純化這種蛋白而制備。適用于本發明的商業纖維素分解蛋白制備物的實例包括,例如,CELLUCLAST(可從NovozymesA/S獲得)和N0V0ZYM188(可從NovozymesA/S獲得)。可以使用的其它包含纖維素酶的商業可提供的制備物包括CELLUZYME、CEREFLO和ULTRAFLO(NovozymesA/S)、LAMINEX禾ΠSPEZYMECP(GenencorInt.)、ROHAMENT7069ff(RohmGmbH),和FIBREZYMELDI、FIBREZYMELBR,或VISCOSTAR150L(DyadicInternational,Inc.,Jupiter,FL,USA)。以固體重量的約0.001%至約5.0%,更優選固體重量的約0.025%至約4.0%,并且最優選固體重量的約0.005%至約2.0%的有效量加入纖維素酶。能用于本發明的方法中的細菌內切葡聚糖酶的實例,包括,但不限于,Acidothermuscellulolyticus內切葡聚糖酶(WO91/05039;WO93/15186;美國專利No.5,275,944;WO96/02551;美國專利No.5,536,655、WO00/70031、WO05/093050);Thermobifidafusca內切葡聚糖酶III(W005/093050)JPThermobifidafusca內切葡聚糖酶V(W005/093050)。可以在本發明的方法中使用的真菌內切葡聚糖酶的實例,包括,但不限于,里氏木霉內切葡聚糖酶I(Penttila等,1986,Gene45:253_263;GENBANK登錄號M15665);里氏木霉內切葡聚糖酶II(Saloheimo等,1988,Gene6311~22;GENBANK登錄號M19373);里氏木霉內切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64555-563;GENBANK登錄號AB003694);里氏木霉內切葡聚糖酶IV(Saloheimo等,1997,44Eur.J.Biochem.249:584_591;GENBANK登錄號Yl1113);和里氏木霉內切葡聚糖酶V(Saloheimo等,1994,MolecularMicrobiology13:219_228;GENBANK登錄號Z33381);棘孢曲霉內切葡聚糖酶(Ooi等,1990,NucleicAcidsResearch18:5884);川地曲霉(Aspergilluskawachii)內切葡聚糖酶(Sakamoto等,1995,CurrentGenetics27435-439);胡蘿卜軟腐歐文氏菌(Erwiniacarotovara)內切葡聚糖酶(Saarilahti等,1990,Gene90:9-14);尖鐮孢內切葡聚糖酶(GENBANK登錄號L29381);灰腐質霉高溫變種(Humicolagriseavar.thermoidea)內切葡聚糖酶(GENBANK登錄號AB003107);Melanocarpusalbomyces內切葡聚糖酶(GENBANK登錄號MAL515703);粗糙脈孢菌內切葡聚糖酶(GENBANK登錄號XM_324477);特異腐質霉內切葡聚糖酶V(SEQIDNO25);嗜熱毀絲霉CBS117.65內切葡聚糖酶(SEQIDNO27);擔子菌CBS495.95內切葡聚糖酶(SEQIDNO29);擔子菌CBS494.95內切葡聚糖酶(SEQIDNO31);土生梭孢霉NRRL8126CEL6B內切葡聚糖酶(SEQIDNO33);土生梭孢霉NRRL8126CEL6C內切葡聚糖酶(SEQIDNO35);土生梭孢霉NRRL8126CEL7C內切葡聚糖酶(SEQIDNO37);土生梭孢霉NRRL8126CEL7E內切葡聚糖酶(SEQIDNO39);土生梭孢霉NRRL8126CEL7F內切葡聚糖酶(SEQIDNO41);CladorrhinumfoecundissimumATCC62373CEL7A內切葡聚糖酶(SEQIDNO43)和里氏木霉菌株VTT-D-80133內切葡聚糖酶(SEQIDNO45;GENBANK登錄號M15665)。上述SEQIDNO25,SEQIDNO27,SEQIDNO29,SEQIDN0:31、SEQIDNO:33、SEQIDNO35,SEQIDNO37,SEQIDNO39,SEQIDN0:41、SEQIDNO:43禾口SEQIDNO45的內切葡聚糖酶分別由SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO42和SEQIDNO44的成熟多肽編碼序列編碼。可以在本發明的方法中使用的纖維二糖水解酶的實例,包括,但不限于,里氏木霉纖維二糖水解酶I(SEQIDNO47);里氏木霉纖維二糖水解酶II(SEQIDNO49);特異腐質霉纖維二糖水解酶I(SEQIDNO51),嗜熱毀絲霉纖維二糖水解酶II(SEQIDNO53和SEQIDNO:55),土生梭孢霉纖維二糖水解酶II(CEL6A)(SEQIDNO57),嗜熱毛殼菌纖維二糖水解酶I(SEQIDNO59)和嗜熱毛殼菌纖維二糖水解酶II(SEQIDNO:61)。上述SEQIDNO47,SEQIDNO49、SEQIDNO:51、SEQIDNO53、SEQIDNO55、SEQIDNO57、SEQIDNO:59禾口SEQIDNO61的纖維二糖水解酶分別由SEQIDNO46,SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO58和SEQIDNO60的成熟多肽編碼序列編碼。可以在本發明的方法中使用的葡糖苷酶的實例,包括,但不限于,米曲霉β-葡糖苷酶(SEQIDNO63);煙曲霉β-葡糖苷酶(SEQIDNO65);巴西青霉IBT20888β-葡糖苷酶(SEQIDNO67);黑曲霉β-葡糖苷酶(SEQIDNO69);和棘孢曲霉β-葡糖苷酶(SEQIDNO71)。上述SEQIDNO:63、SEQIDNO:65、SEQIDNO:657、SEQIDNO69和SEQIDNO71的纖維二糖水解酶分別由SEQIDNO:64、SEQIDNO:66、SEQIDNO68和SEQIDNO70的成熟多肽編碼序列編碼。可以根據WO2002/095014獲得具有β-葡糖苷酶活性的米曲霉多肽。可以根據TO2005/047499獲得具有β-葡糖苷酶活性的煙曲霉多肽。可以根據WO2002/019442獲得具有β-葡糖苷酶活性的巴西青霉多肽。可以根據Dan等,2000,J.Biol.Chem.2754973-4980獲得具有β-葡糖苷酶活性的黑曲霉多肽。可以根據Kawaguchi等,1996,Gene173287-288獲得具有β-葡糖苷酶活性的棘孢曲霉多肽。β-葡糖苷酶可以是融合蛋白。在一個方面,β-葡糖苷酶是SEQIDNO:73的米曲霉β-葡糖苷酶變體BG融合蛋白或SEQIDΝ0:75的米曲霉β-葡糖苷酶融合蛋白。在另一個方面,米曲霉β-葡糖苷酶變體BG融合蛋白由SEQIDNO:72的多核苷酸編碼或者米曲霉β-葡糖苷酶融合蛋白由SEQIDNO74的多核苷酸編碼。使用根據HenrissatB·,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309_316,禾口HenrissatB禾口BairochΑ.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316695-696的分類,在很多糖基水解酶家族中公開了其它內切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。其它可以在本發明中使用的纖維素分解酶在EP495,257、EP531,315、ΕΡ531,372,WO89/09259、WO94/07998、WO95/24471、WO96/11262、W096/29397、WO96/034108、WO97/14804、WO98/08940、WO98/012307、W098/13465、WO98/015619、WO98/015633、WO98/028411、WO99/06574、W099/10481、WO99/025846、WO99/025847、WO99/031255、WO2000/009707,WO2002/050245、WO2002/0076792、WO2002/101078、WO2003/027306、WO2003/052054、WO2003/052055、WO2003/052056、WO2003/052057、W02003/052118,WO2004/016760,WO2004/043980,WO2004/048592,W02005/001065,WO2005/028636、WO2005/093050,WO2005/093073,W02006/074005,WO2006/117432、WO2007/071818,WO2007/071820,W02008/008070,WO2008/008793、美國專利No.4,435,307、美國專禾IjNo.5,457,046、美國專利No.5,648,263、美國專利No.5,686,593、美國專利No.5,691,178、美國專利No.5,763,254和美國專利No.5,776,757中描述。本發明的方法中使用的纖維素分解酶可以使用本領域已知的方法,通過在營養培養基上發酵上述微生物菌株而產生,所述營養培養基包含碳源和氮源和無機鹽(參見,例如,Bennett,J.W.禾口LaSure,L.編,MoreGeneManipulationsinFungi,AcademicPress,CA,1991)。合適的培養基能夠從商業供應商獲得或可以根據公開的組成制備(例如,在美國典型培養物保藏中心的目錄中)。適合于生長和纖維素分解酶產生的溫度范圍和其它條件在本領域中已知(參見,例如,Bailey,J.Ε.和Ollis,D.F.,BiochemicalEngineeringFundamentals,McGraw-HillBookCompany,NY,1986)。發酵可以是導致纖維素分解酶表達或分離的細胞的任何培養方法。因此,發酵可以理解為包括在合適培養基中和允許表達和/或分離所述纖維素分解酶的條件下進行的搖瓶培養,和實驗室或工業發酵罐中的小規模或大規模發酵(包括連續、分批、補料分批或固態發酵)來培養細胞。由上述方法產生的纖維素分解酶可以從發酵培養基中回收,并通過常規方法純化。信號月太本發明還涉及核酸構建體,所述核酸構建體包含編碼蛋白質的基因,其中所述基因與編碼信號肽的核苷酸序列可操作地連接,所述信號肽包含SEQIDN0:2的氨基酸1至17或SEQIDNO:4的氨基酸1至15,或者由SEQIDNO:2的氨基酸1至17或SEQIDN0:4的氨基酸1至15組成,其中基因對于核苷酸序列是外源的。46在一個優選的方面,核苷酸序列包含SEQIDNO1的核苷酸1至51或SEQIDNO3的核苷酸1至45,或者由SEQIDNO1的核苷酸1至51或SEQIDNO3的核苷酸1至45組成。本發明還涉及包含這種核酸構建體的重組表達載體和重組宿主細胞。本發明還涉及用于產生蛋白質的方法,包括(a)在適合于產生所述蛋白質的條件下培養這樣的重組細胞;和(b)回收所述蛋白質。所述蛋白質對于宿主細胞可以是天然的或異源的。術語“蛋白質”在本文的意思不是指特定長度的編碼產物,并且因此包含肽、寡肽和蛋白質。術語“蛋白質”還包含組合以形成編碼產物的兩種或兩種以上多肽。所述蛋白質還包括雜合多肽,其包含部分或全部多肽序列的組合,所述多肽序列從至少兩種不同的蛋白質獲得,其中一個或多個(數個)對于宿主細胞可以是異源或天然的。蛋白質進一步包括上述蛋白質和雜合蛋白質天然存在的等位基因變異和工程的變異。優選蛋白質是激素或其變體、酶、受體或其部分、抗體或其部分,或報告蛋白(r印orter)。在更優選的方面,所述蛋白質是氧化還原酶、轉移酶、水解酶、裂合酶(lyase)、異構酶或連接酶。在更加優選的方面,所述蛋白質是氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α"半乳糖苷酶、β"半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉化酶、漆酶、另外的脂肪酶、甘露糖苷酶、變聚糖酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶或木聚糖酶。基因可以從任何原核、真核或其它來源獲得。通過以下實施例進一步對本發明進行描述,但不應將其理解為對本發明范圍的限制。實施例材料作為緩沖液和底物使用的化學品是至少試劑等級的商業產品。培養基BA培養基由下述物質組成每升IOg玉米漿干物質、IOgNH4NO3UOgKH2P04、0.75gMgSO4·7H20、0.Iml普盧蘭尼克(pluronic)和0.5gCaC03。高壓滅菌前將pH調至6.5。YEG培養基由下述物質組成每升20g右旋糖和5g酵母提取物。基本培養基平板由下述物質組成每升6gNaNO3>0.52gKC1、1.52gKH2P04、ImlCOVE痕量元素溶液、20gNoble瓊脂、20ml50%葡萄糖、2.5mlMgSO4·7Η20和20ml0.02%生物素溶液。Cove痕量金屬溶液由如下物質組成每升0.04gNa2B4O7·10Η20、0·4gCuS04·5Η20、1.2gFeSO4·7Η20、0·7gMnSO4·H20,0.8gNa2MoO2·2H20和IOgZnSO4·7H20。M410培養基由如下物質組成每升50g麥芽糖、50g葡萄糖、2gMgS04·7H20、2gKH2P04、4g無水檸檬酸、8g酵母提取物、2g脲、0.5gCaCl2和0.5mlAMG痕量金屬溶液。AMG痕量金屬由如下物質組成每升14.3gZnSO4·7H20、2.5gCuS04·5H20、0.5gNiCl2·6H20、13.8gFeSO4·7H20、8.5gMnSO4·7H20和3g檸檬酸。實施例1家族61肽的鑒定SDS-PAGE分析。用水以110稀釋商業產品。根據制造商建議的條件,在CRITERION8-16%Tris-HClSDS-PAGE凝膠上分離20μ1(Bio-RadLaboratories,Inc.,Hercules,CA,USA)。使用PRECISIONPLUSPROTEIN標準品(Bio-RadLaboratories,Inc.,Hercules,CA,USA)作為分子量標記。用BIO-SAFE考馬斯染料(Bio-RadLaboratories,Inc.,Hercules,CA,USA)將凝膠染色,并用剃刀片切下可見條帶進行蛋白鑒定分析。為肽測序而進行的多肽的凝膠內消化。使用MultiPROBEII液體處理機器人(PerkinElmerLifeandAnalyticalSciences,Boston,MA,USA)進行凝膠內消化。用50μ1在IOOmM碳酸氫銨ρΗ8.0中的IOmM二硫蘇糖醇(DTT)將包含蛋白的凝膠條帶還原30分鐘。還原后,用50μ1在IOOmM碳酸氫銨ρΗ8.0中的55mM碘乙酰胺將凝膠片烷基化20分鐘。使干燥的凝膠片在25μ1胰蛋白酶消化溶液(eng/μ1測序級胰蛋白酶(Promega,Madison,WI,USA)于50mM碳酸氫銨ρΗ8溶液中)室溫膨脹30分鐘,然后在40°C消化8小時。上述每個反應步驟之后都用合適的溶液,按照制造商的標準規程進行多次洗滌和預洗滌。使用50μ1乙腈在反應之間使凝膠片脫水,并且在各步驟之間將凝膠片風干。用HPLC級水中的1%甲酸/2%乙腈提取肽兩次,共30分鐘。將肽提取溶液轉移至已冷卻至10-15°C的96孔有裙邊PCR型板(ABGene,Rochester,NY,USA),并用96孔板蓋(PerkinElmerLifeandAnalyticalSciences,Boston,MA·USA)覆蓋以防止蒸發。在4°C進一步保存板直至可進行質譜分析。蛋白鑒定。為了通過串聯質譜從頭進行肽測序,使用Q-T0FMICR0(WatersMicromassMSTechnologies,Milford,MA,USA),混合正交四極飛行時間質譜儀進行LC/MS/MS分析。Q-TOFMICRO是使用4.1版MASSLYNX軟件(WatersMicromassMSTechnologies,Milford,MA,USA)完全控制的微處理器。Q-T0FMICRO適合于ULTIMATE毛細管和納米流HPLC系統,其與FAM0S微型自動進樣器和SWITCH0SII柱切換設備(LCPackings/Dionex,Sunnyvale,CA,USA)偶聯,用于濃縮樣品并將其脫鹽。樣品載入保護柱(300μmIDX5cm,PEPMAPC18),其已裝配好注射環并用0.1%甲酸的水溶液以40μ1每分鐘的速度使用SwitchosII泵洗滌2分鐘。使用ΝΑΝ-75校準器(Dionex,Sunnyvale,CA,USA)以來自175μ1/分鐘的分流中的175nl/分鐘的流速,在75μπιIDχ15cm,C18,3μm,100APEPMAP(LCPackings,SanFrancisco,CA,USA)納米流融合毛細管柱上分離肽。在45分鐘的間隔中,使用0.甲酸中的乙腈的分布洗脫梯度。在215nm檢測柱洗脫液,并經由配備納米噴霧接口的電噴霧離子源導入Q-TOFMICRO。以探測掃描模式獲取數據,m/z的質量范圍為400-1990,將針對MS的標準切換至MS/MS以包括高于10.0次計數每秒的離子強度,并且電荷狀態為+2、+3和+4。可以1.9秒的掃描時間和0.1秒的掃描間隔時間獲得多達4種共洗脫物質的分析光譜。通常使用45伏特的錐孔電壓,并且對碰撞能量編程以根據洗脫肽的質量和電荷狀態而變化,并且在10-60伏特的范圍內。合并獲取的光譜,平滑處理,并以自動的方式放在中央,并產生峰列表。使用PR0TEINLYNX全局服務器2.2.05軟件(WatersMicromassMSTechnologies,Milford,MA,USA)和PEAKSStudio4.5版(SPl)(BioinformaticSolutionsInc.,Waterloo,Ontario,Canada)針對所選數據庫搜索峰列表。評價來自PR0TEINLYNX和PEAKSStudio搜索的結果,并進一步通過評價每個目的離子的MS/MS光譜而分析未鑒定蛋白質,并且通過鑒定y和b離子系列和將質量差異與合適的氨基酸相匹配來確定從頭序列。從凝膠內消化的約24kDa多肽凝膠條帶的幾種多電荷離子獲得肽序列。將871.56m/z序列的雙電荷胰蛋白酶肽離子確定為[Leu]-Pro-Ala-Ser-Asn-Ser-Pro-Val-Thr-Asp-Val-Thr-Ser-Asn-Ala-[Leu]-Arg(SEQIDNO:5)。將615.84m/z序列的雙電荷胰蛋白酶肽離子確定為Val-Asp-Asn-Ala-Ala-Thr-Ala-Ser-Pro-Ser-Gly-[Leu]-Lys(SEQIDNO:6)。將715.44m/z序列的雙電荷胰蛋白酶肽離子確定為[Leu]-Pro-Ala-Asp-[Leu]-Pro-Ser-Gly-Asp-Tyr-[Leu]-[Leu]-Arg(SEQIDNO:7)。將988.58m/z序列的雙電荷胰蛋白酶肽離子確定為Gly-Pro-[Leu]-[Gin]-Val-Tyr-[Leu]-Ala-Lys(SEQIDNO:8)。將1272.65m/z序列的雙電荷胰蛋白酶肽離子確定為Val-Ser-Val-Asn-Gly-[Gin]-Asp-[GIn]-Gly-[Gin]-[Leu]-Lys(SEQIDNO:9)。上述的[Leu]可以是lie或Leu,并且上述的[Gin]可以是Gln或Lys,因為它們由于質量相等而無法區分。實施例2嗜熱毀絲霉CBS117.65cDNA匯集物的制備在30°C在200rpm,在200mlBA培養基中培養嗜熱毀絲霉CBS117.65五天。通過用襯有MIRACL0THTM(CalBiOChem,SanDiego,CA,USA)的漏斗過濾內容物而收獲搖瓶培養物的菌絲體。然后將菌絲體夾在兩片MIRACL0TH中間,并用吸水紙巾吸干。然后將菌絲體轉移至塑料離心管,并在液氮中冷凍。將冷凍的菌絲體在-80°C冰箱中保存待用。用硫氰酸胍進行總RNA的提取,然后通過5.7MCsCl緩沖超速離心,并通過oligo(dT)-纖維素親和色譜使用WO94/14953中所述方法進行poly(A)+RNA的分離。通過RNaseH方法(Gubler和Hoffman,1983,Gene25:263_269,Sambrook等,1989,Molecularcloning:Alaboratorymanual,ColdSpringHarborlab.,ColdSpringHarbor,NY,USA),由5μgpoly(A)+RNA合成雙鏈cDNA。將poly(A)+RNA(5μg于5μ1用DEPC(0.焦磷酸二乙酯)處理的水中)在預硅化處理的、不含RNase的EPPENDORF管中在70°C加熱8分鐘,在冰上淬滅,并與反轉錄酶緩沖液組合于終體積50μ1,所述緩沖液由50mMTris-HCl,pH8.3,75mMKCl、3mMMgCl2、IOmM二硫蘇糖醇(DTT)(BethesdaResearchLaboratories,Bethesda,MD,USA)、ImMdATP、dGTP和dTTP,和0.5mM5-甲基_dCTP(GEHealthcare,Piscataway,NJ,USA),40單位人胎盤核糖核酸酶抑制劑(RNasin;Promega,Madison,WI,USA),1.45μg寡聚(dT)18-NotI引物(GEHealthcare,Piscataway,NJ,USA),禾口1000單位SuperScriptIIRNaseH反轉錄酶(BethesdaResearchLaboratories,Bethesda,MD,USA)0通過在45°C將反應混合物溫育1小時而合成第一鏈cDNA。合成后,根據生產商的說明,通過MICR0SPINS-400HR旋轉柱(GEHealthcare,Piscataway,NJ,USA)將mRNA:cDNA雜合混合物凝膠過濾。凝膠過濾后,在250μ1第二鏈緩沖液(20mMTris-HCl,pH7.4,90mMKC1,4.6mMMgCl2,10mM(NH4)2S04,0.16mMNAD)中稀釋雜合物,緩沖液中包含200μM各種dNTP,60單位大腸桿菌DNA聚合酶I(GEHealthcare,Piscataway,NJ,USA),5.25單位RNaseH(Promega,Madison,WI,USA),和15單位大腸桿菌DNA連接酶(BoehringerMannheim,Manheim,Germany)。通過在16°C溫育反應管2小時和在25°C再溫育15分鐘而進行第二鏈cDNA合成。通過加入EDTA至終濃度20mM而停止反應,然后進行苯酚和氯仿提取。通過加入2倍體積的96%乙醇和0.2倍體積的IOM乙酸銨,在-20V沉淀雙鏈cDNA12小時,以13,OOOxg離心回收,在70%乙醇中洗滌,干燥,并重懸于30μ1綠豆核酸酶緩沖液(30mM乙酸鈉pH4.6,300mMNaCl,ImMZnSO4,0.35mMDTT,2%甘油)中,所述緩沖液包49含25單位綠豆核酸酶(GEHealthcare,Piscataway,NJ,USA)通過在30°C溫育反應物30分鐘而剪切單鏈發夾DNA,然后加入70μ1IOmMTris-HCl-ImMEDTApH7.5,苯酚提取,并用2倍體積的96%乙醇和0.1倍體積的3Μ乙酸鈉ρΗ5.2在冰上沉淀30分鐘。通過在13,OOOxg離心而回收雙鏈cDNA,并通過將反應混合物在16°C溫育1小時,而在30μ1Τ4DNA聚合酶緩沖液(20mMTris-乙酸,ρΗ7.9,IOmM乙酸鎂,50mM乙酸鉀,ImMDTT)中進行平端化,所述緩沖液包含0.5mM各種dNTP和5單位T4DNA聚合酶(NewEnglandBiolabs,Ipswich,MA,USA)ο通過加入EDTA至終濃度20mM而停止反應,然后進行苯酚和氯仿提取,并在_20°C通過加入2倍體積的96%乙醇和0.1倍體積的3M乙酸鈉pH5.2而沉淀12小時。在填補反應后,通過在13,OOOxg離心而回收cDNA,在70%乙醇中洗滌,并干燥。實施例3嗜熱毀絲霉CBS202.75和嗜熱毀絲霉CBS117.65的基因組DNA提取使嗜熱毀絲霉CBS202.75和嗜熱毀絲霉CBS117.65菌株在45°C和200rpm,在帶擋板的搖瓶中的100mlYEG培養基中生長2天。使用MIRACLOTH(Calbiochem,LaJolla,CA,USA)通過過濾收獲菌絲體,在去離子水中洗滌兩次,并在液氮下冷凍。通過研缽和杵將冷凍的菌絲體研磨成細粉,并使用DNEASYPlantMaxi試劑盒(QIAGENInc.,Valencia,CA,USA)分離總DNA0實施例4從嗜熱毀絲霉進行家族61基因的分子篩選根據實施例1中所述通過串聯質譜術所獲得的肽序列設計簡并引物,如下所示。引物061562(CI61A有義)5,-GCCTCCAACTCGCCCGTCACNGAYGTNAC-3,(SEQIDNO10)引物061563(CI61A反義)5,-GAGGTAGTCGCCGGANGGGATRTCNGCNGG-3,(SEQIDNO11)在PCR反應中使用CI61A有義和CI61A反義引物各五十皮摩爾,所述反應物在終體積25μ1中包括IOOng嗜熱毀絲霉CBS117.65cDNA匯集物,或者嗜熱毀絲霉CBS117.65基因組DNA,1XADVANTAGEGC-MeItLA緩沖液(ClontechLaboratories,Inc.,MountainView,CA,USA),dATP、dTTP、dGTP和dCTP各0.4mM,和1.25單位ADVANTAGEGC基因組聚合酶混合物(ClontechLaboratories,Inc.,MountainView,CA,USA)。使用EPPENDORFMASTERCYCLER.5333(EppendorfScientific,Inc.,Westbury,NY,USA)進行擴增,程序為94°C1分鐘的1個循環;30個循環,每個循環為94°C30秒,56.5°C30秒,和72°C30秒;然后是72°C5分鐘的最終延伸。在40mMTris堿-20mM乙酸鈉-ImMEDTA二鈉(TAE)緩沖液中,通過1%瓊脂糖凝膠將反應產物分級分離,并切下大于400bp的條帶,根據制造商的說明使用MiniElute凝膠提取試劑盒(QIAGENInc.,Valencia,CA,USA)純化,并使用Τ0Ρ0⑩TA試劑盒(Invitrogen,Carlsbad,CA,USA)亞克隆。從多個大腸桿菌轉化體提取質粒DNA并測序。大腸桿菌克隆的序列分析表明,序列包含家族61基因的編碼區(gh61a)。在不同條件下進行的單獨PCR反應中分離第二種gh61基因。在PCR反應中使用(16認有義和(16認反義引物各三十皮摩爾,所述反應物在終體積3(^1中包括200ng嗜熱毀絲霉CBS202.75基因組DNA,IXTHERM0P0L緩沖液(NewEnglandBioLabs,Ipswich,MA,USA),dATP、dTTP、dGTP和dCTP各0.28mM,和1.0單位TaqDNA聚合酶(NewEnglandBioLabs,Ipswich,MA,USA)。使用R0B0CYCLER40(Strategene,LaJolla,CA,USA)進行擴增,程序為96°C3分鐘的1個循環,72°C3分鐘的1個循環,其間加入DNA聚合酶;30個循環,每個循環為94°C50秒,52°C50秒,和72°C90秒;然后是72°C7分鐘的最終延伸。在40mMTris堿-20mM乙酸鈉-ImMEDTA二鈉(TAE)緩沖液中,通過1%瓊脂糖凝膠將反應產物分級分離,并切下大于400-500bp的條帶,根據制造商的說明使用QIAEXII⑧凝膠提取試劑盒(QIAGENInc.,Valencia,CA,USA)純化,并使用TOPOTA試劑盒(Invitrogen,Carlsbad,CA,USA)亞克隆。從多個大腸桿菌轉化體提取質粒DNA并測序。序列分析表明,幾個克隆包含命名為gh61f的一個家族61基因的編碼區。實施例5從嗜熱毀絲霉CBS202.75分離全長家族61基因(gh61a)根據制造商的說明,使用GEN0MEWALKER通用試劑盒(ClontechLaboratories,Inc.,MountainView,CA,USA)從嗜熱毀絲霉CBS202.75分離全長61家族基因(gh61a)。簡而言之,分別用留下平末端的四種不同的限制酶(DraI,EcoRV,PvuII和StuI)消化嗜熱毀絲霉CBS202.75的總基因組DNA。然后分別將各批消化的基因組DNA連接至GEN0MEWALKER銜接頭(ClontechLaboratories,Inc.,MountainView,CA,USA)以產生四個文庫。然后使用這些文庫作為PCR反應中的模板,所述反應使用對于嗜熱毀絲霉家族61gh61a基因的四個基因特異性引物。根據實施例4中獲得的部分家族gh61a基因序列設計如下所示的引物。上游區域引物MtCel61A-Rl:5,-CCGTTCGGGCCGTCTTGGTAGATCTTGAACC-3,(SEQIDNO12)MtCel61A-R2:5,-CCGATGGAGGGATCCACGCTGAAGGTGAATT-3,(SEQIDNO13)下游區域引物MtCel61A-Fl:5,-CAGGTCAAGGCGGGCTCCCAATTCACCTT-3,(SEQIDNO14)MtCel61A-F2:5,-ACGGCACGGGAGCCGTGTGGTTCAAGATCTA-3,(SEQIDNO15)進行兩次一級PCR擴增,一次分離嗜熱毀絲霉gh61a基因的上游區域,另一次分離下游區域。每個PCR擴增物(25μ1)包括每種文庫各μ(約6ng)作為模板,dATP、dTTP、dGTP和dCTP各0.4mM,IOpmol銜接頭引物1(ClontechLaboratories,Inc.,MountainView,CA,USA),IOpmol引物MtCel61A_Rl或引物MtCel61A_Fl,IXADVANTAGEGC-MeltLA緩沖液,和1.25單位ADVANTAGEGC基因組聚合酶混合物。使用EPPEND0RFMASTERCYCLER.5333進行擴增,程序為94°C預變性1分鐘;7個循環,每個循環為在94°C的變性溫度30秒,在72°C退火和延伸5分鐘;和32個循環,每個循環為在94°C的變性溫度30秒,67°C退火和延伸5分鐘;然后是67V7分鐘的最終延伸。二級PCR擴增物在終體積25μ1中包括一級PCR產物各1μ1作為模板,dATP、dTTP、dGTP和dCTP各0.4mM,IOpmol銜接頭引物2(ClontechLaboratories,Inc.,MountainView,CA,USA),IOpmol引物MtCel61A_R2或引物MtCel61A_F2,IXADVANTAGE(g)GC-MeltLA緩沖液,和1.25單位ADVANTAGEGC基因組聚合酶混合物。使用EPPEND0RFMASTERCYCLER5333進行擴增,程序為94°C預變性1分鐘;5個循環,每個循環為在94°C的變性溫度30秒,在72°C退火和延伸5分鐘;和20個循環,每個循環為在94°C的變性溫度30秒,在67°C退火和延伸5分鐘;然后是67V7分鐘的最終延伸。在TAE緩沖液中,通過1.0%瓊脂糖凝膠電泳分離反應產物,其中從凝膠切下來自EcoRV文庫的1.7kb產物條帶(上游區域)和來自StuI文庫的1.6kb條帶(下游區域),根據制造商的說明使用MiniElute凝膠提取試劑盒(OIAGENInc.,Valencia,CA,USA)純化。將PCR產物直接測序或使用TOPOTA試劑盒(Invitrogen,Carlsbad,CA,USA)亞克隆然后測序。實施例6編碼具有纖維素分解增強活性的家族GH61A多肽的嗜熱毀絲霉CBS202.75基因組序列的表征使用染料-終止子化學(Giesecke等,1992,J.Virol.Methods38:47_60)和引物步移策略,用Perkin-ElmerAppliedBiosystemsModel377XL自動DNA測序儀(Perkin-Elmer/AppliedBiosystems,Inc.,FosterCity,CA,USA)進行PCR片段的DNA測序。審核核苷酸序列數據的質量,并且在PHRED/PHRAP軟件(UniversityofWashington,Seattle,WA,USA)的輔助下,將所有序列互相比較。根據編碼蛋白與來自土生梭孢霉(登錄號GENESEQP:ADM97933,GENESEQP:AEB90517)、球毛殼菌(Chaetomiumglobosum)(UNIPR0TQ2HGH1,UNIPR0T:Q2GW98)和粗糙脈孢菌(UNIPR0T:Q7S439)的同源糖苷水解酶家族61蛋白質的相似性,構建具有纖維素分解增強活性的嗜熱毀絲霉GH61A多肽的基因模型。為了確認獲得的嗜熱毀絲霉gh61a基因的序列信息,使用一對基因特異性引物(如下所示)進行進一步的PCR反應,其包括完整基因。引物MtGH61A_F35'-ACTGGATTTACCATGAAGTTCACCTCGTCCCTCGCT-3'(SEQIDNO16)引物MtGH61A-R35,-tcacctctagttaattaa.tTAGCAAGAGACGGGGGCCG-3,(seqidno:17)黑體字代表編碼序列。其余序列與pAILo2(W02004/099228)的插入位點同源。PCR由PCR反應物中的五十皮摩爾正向和反向引物組成,所述反應物在終體積50μ1中包含IOOng嗜熱毀絲霉CBS202.75基因組DNA,Pfx擴增緩沖液(Invitrogen,Carlsbad,CA,USA),dATP、dTTP、dGTP和dCTP各0.4mM,ImMMgCl2,,禾口2·5單位PfxDNA聚合酶(Invitrogen,Carlsbad,CA,USA)。使用EPPENDORFMASTERCYCLER5333進行擴增,程序為98°C3分鐘的1個循環;和30個循環,每個循環為98°C30秒,60°C30秒,和720C1分鐘;然后是72°C15分鐘的最終延伸。然后使加熱塊進入4°C浸入循環。在TAE緩沖液中通過1.0%瓊脂糖凝膠電泳分離反應產物,并根據制造商的說明使用MiniElute凝膠提取試劑盒(QIAGENInc.,Valencia,CA,USA)純化。為了將PCR片段克隆入pCR.:2·1-T0P0載體(Invitrogen,Carlsbad,CA,USA)中,使用TaqDNA聚合酶(NewEnglandBiolabs,Ipswich,MA,USA)加入3,A-突出部分。使用Τ0Ρ0TA克隆試劑盒將958bp嗜熱毀絲霉gh61a基因片段克隆入pCR2.1-T0P0載體(Invitrogen,Carlsbad,CA,USA)以產生pSMail90(圖2)。通過DNA測序確認嗜熱毀絲霉gh61a插入。將大腸桿菌pSMail90于2007年12月5日保藏在農業研究機構專利培養物保藏中心北區研究中心(Peoria,IL,USA),并指定登錄號B-50083。圖1中顯示了具有纖維素分解增強活性的嗜熱毀絲霉GH61A多肽的核苷酸序列(SEQIDNO1)和推定的氨基酸序列(SEQIDNO:2)。基因組多核苷酸編碼232個氨基酸的多肽,中間插入88和137bp的2個內含子。全長編碼序列和成熟編碼序列的%G+C分別是61.和66.5%。使用SignalP軟件(Nielsen等,1997,ProteinEngineering10:1_6)預測了17個殘基的信號肽。預測的成熟蛋白質包含215個氨基酸,分子量為22.BkDa0使用如EMBOSS的Needle程序中所實施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)及缺口開放罰分10、缺口延伸罰分0.5和EBL0SUM62矩陣來確定氨基酸序列的比較配對全局比對。比對顯示,嗜熱毀絲霉GH61A成熟多肽的推定的氨基酸序列與來自土生梭孢霉的家族61糖基水解酶蛋白的推定的氨基酸序列(GeneSeqP登錄號為ADM97933)具有76.6%的同一性(缺口除外)。實施例7從嗜熱毀絲霉CBS202.75分離全長家族61基因(gh61f)根據制造商的說明,使用GEN0MEWALKER通用試劑盒(ClontechLaboratories,Inc.,MountainView,CA,USA)從嗜熱毀絲霉CBS202.75分離全長家族61基因(gh61f)。簡而言之,分別用留下平末端的四種不同的限制酶(DraI,EcoRV,PvuII和StuI)消化嗜熱毀絲霉CBS202.75的總基因組DNA。然后分別將各批消化的基因組DNA連接至GEN0MEWALKER銜接頭(ClontechLaboratories,Inc.,MountainView,CA,USA)以產生四個文庫。然后使用這些文庫作為PCR反應中的模板,所述反應使用嗜熱毀絲霉家族61基因(gh61f)的基因特異性引物。根據實施例4中獲得的部分家族61gh61f基因序列設計如下所示的引物。上游區域引物MtGH6IF-Rl:5’-CCCTTGTGGCTGGCGTCCATGACATCGTC-3,(SEQIDNO18)MtGH61F-R2:5,-GTGCCTCCAGATGGCCTTGACCGTGGTG-3,(SEQIDNO19)下游區域引物MtGH61F-F6:5’-GGCGGCGAGCACTACATGTGAGCCATTCCT-3’(SEQIDNO20)MtGH61F-F7:5’-TGACGATCTCGCTGACCCGTGCAACAAGTG-3,(SEQIDNO21)進行兩次一級PCR擴增,一次分離嗜熱毀絲霉gh61f基因的上游區域,另一次分離下游區域。每個PCR擴增物(25μ1)包括每種文庫各μ(約6ng)作為模板,dATP、dTTP、dGTP和dCTP各0.4mM,IOpmol銜接頭引物1(ClontechLaboratories,Inc.,MountainView,CA,USA),IOpmol引物MtCel61F_Rl或引物MtCel61F_F6,IXADVANTAGEGC-MeltLA緩沖液,和1.25單位ADVANTAGEGC基因組聚合酶混合物。使用EPPEND0REMASTERCYCLER5333進行擴增,程序為94°C預變性1分鐘;7個循環,每個循環為在94°C的變性溫度30秒,在72°C退火和延伸5分鐘;和32個循環,每個循環為在94°C的變性溫度30秒,67°C退火和延伸5分鐘;然后是67V7分鐘的最終延伸。二級PCR擴增物在終體積25μ1中包括一級PCR產物各1μ1作為模板,dATP、dTTP、dGTP和dCTP各0.4mM,IOpmol銜接頭引物2(ClontechLaboratories,Inc.,MountainView,CA,USA),IOpmol引物MtCel61F_R2或引物MtCel61F_F7,IXADVANTAGEGC-MeltLA緩沖液,和1.25單位ADVANTAGEGC基因組聚合酶混合物。使用EPPEND0RFMASTERCYCLER.5333進行擴增,程序為94°C預變性1分鐘;5個循環,每個循環為在94°C的變性溫度30秒,在72°C退火和延伸5分鐘;和20個循環,每個循環為在94°C的變性溫度30秒,在67°C的退火和延伸5分鐘;然后是67。C7分鐘的最終延伸。在TAE緩沖液中,通過1.0%瓊脂糖凝膠電泳分離反應產物,其中從凝膠切下來自PuvII文庫的1.3kbPCR產物條帶(上游區域)和來自PuvII文庫的1.2kb條帶(下游區域),根據制造商的說明使用MiniElute凝膠提取試劑盒(QIAGENInc.,Valencia,CA,USA)純化。并將PCR產物直接測序或使用TOPOTA試劑盒(Invitrogen,Carlsbad,CA,USA)亞克隆然后測序。實施例8編碼具有纖維素分解增強活性的家族GH61F多肽的嗜熱毀絲霉基因組序列的表征使用染料-終止子化學(Giesecke等,1992,J.Virol.Methods38:47_60)和引物步移策略,用AppliedBiosystemsModel377XL自動DNA測序儀(AppliedBiosystems,FosterCity,CA,USA)進行PCR片段的DNA測序。審核核苷酸序列數據的質量,并且在PHRED/PHRAP軟件(UniversityofWashington,Seattle,WA,USA)的輔助下,將所有序列互相比較。根據編碼蛋白與來自土生梭孢霉(登錄號GENESEQP:ADM97933,GENESEQP:AEB90517)、球毛殼菌(UNIPR0T:Q2HGH1,UNIPR0T:Q2GW98)和粗糙脈孢菌(UNIPR0T:Q7S439)的同源糖苷水解酶家族61蛋白質的相似性,構建具有纖維素分解增強活性的嗜熱毀絲霉GH61F多肽的基因模型。為了確認獲得的嗜熱毀絲霉gh61f基因的序列信息,使用基因特異性引物(如下所示)進行進一步的PCR反應,其包括完整基因。引物MtGH61F_F85,-ACTGGATTTACCATGAAGGCCCTCTCTCTCCTTGCG.-3,(SEQIDNO22)引物MtGH61F_R35'-TCACCTCTAGTTAATTAACTAGCACTTGAAGACGGGCG-3'(SEQIDNO:23)黑體字代表編碼序列。其余序列與pAILo2(W02004/099228)的插入位點同源。PCR由PCR反應物中的五十皮摩爾正向和反向引物組成,所述反應物在終體積50μ1中包含IOOng嗜熱毀絲霉CBS202.75基因組DNA,Pfx擴增緩沖液(Invitrogen,Carlsbad,CA,USA),dATP、dTTP、dGTP和dCTP各0.4mM,ImMMgCl2,,禾口2·5單位PfxDNA聚合酶(Invitrogen,Carlsbad,CA,USA)。使用EPPENDORFMASTERCYCLER5333進行擴增,程序為98°C3分鐘的1個循環;和30個循環,每個循環為98°C30秒,60°C30秒,和720C1分鐘;然后是72°C15分鐘的最終延伸。然后加熱塊進入4°C浸入循環。在TAE緩沖液中通過1.0%瓊脂糖凝膠電泳分離反應產物,并根據制造商的說明使用MiniElute凝膠提取試劑盒(QIAGENInc.,Valencia,CA,USA)純化。為了將PCR片段克隆入pCR2·1-T0P0載體(Invitrogen,Carlsbad,CA,USA)中,使用TaqDNA聚合酶(NewEnglandBiolabs,Ipswich,MA,USA)加入3,A-突出部分。使用Τ0Ρ0TA克隆試劑盒將884bp嗜熱毀絲霉gh61f基因片段克隆入pCR2.1-T0P0載體(Invitrogen,Carlsbad,CA,USA)以產生pSMail92(圖2)。通過DNA測序確認嗜熱毀絲霉gh61f插入。將大腸桿菌pSMail92于2007年12月5日保藏在農業研究機構專利培養物保藏中心北區研究中心(1815UniversityStreet,Peoria,IL,USA),并指定登錄號B-50085。圖1中顯示了具有纖維素分解增強活性的嗜熱毀絲霉GH61F多肽的核苷酸序列(SEQIDNO3)和推定的氨基酸序列(SEQIDNO4)。基因組多核苷酸編碼235個氨基酸的多肽,中間插入62和84bp的2個內含子。全長編碼序列和成熟編碼序列的%G+C分別是64.1%和65.4%。使用SignalP軟件(Nielsen等,1997,ProteinEngineering10:1-6)54預測了15個殘基的信號肽。預測的成熟蛋白質包含220個氨基酸,分子量為23kDa。使用如EMBOSS的Needle程序中所實施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)及缺口開放罰分10、缺口延伸罰分0.5和EBL0SUM62矩陣來確定氨基酸序列的比較配對全局比對。比對顯示,嗜熱毀絲霉GH61F成熟多肽的推定的氨基酸序列與來自球毛殼菌的家族61糖基水解酶蛋白的推定的氨基酸序列(UniProt登錄號Q2HGH1)具有83.8%的同一性(缺口除外)。實施例9米曲霉表達載體的構建,所述載體包含編碼具有纖維素分解增強活性的家族GH61A多肽的嗜熱毀絲霉CBS202.75基因組序列使用Infusion克隆試劑盒(BDBiosciences,PaloAlto,CA,USA),將實施例6中產生的相同的958bp嗜熱毀絲霉gh61aPCR片段克隆入NcoI和PacI消化的pAILo2(W02004/099228),得到pSMail85(圖5),其中嗜熱毀絲霉gh6Ia基因的轉錄在來自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸異構酶的雜合啟動子(NA2_tpi啟動子)的控制下。連接反應物(50μ1)包括IXInFusion緩沖液(BDBiosciences,PaloAlto,CA,USA),IXBSA(BDBiosciences,PaloAlto,CA,USA),1μ1Infusion酶(110稀釋)(BDBiosciences,PaloAlto,CA,USA),IOOng用NcoI和PacI消化的pAILo2,和50ng嗜熱毀絲霉gh61a純化PCR產物。在室溫溫育反應物30分鐘。使用1μ1反應物轉化大腸桿菌XL10S0L0PACKGold超感受態細胞(Stratagene,LaJolla,CA,USA)0通過限制性消化檢測包含pSMail85的大腸桿菌轉化體,并使用BI0R0B0T9600(QIAGENInc.,Valencia,CA,USA)制備質粒DNA。通過DNA測序確認pSMail85中的嗜熱毀絲霉gh61a插入。實施例10米曲霉表達載體的構建,所述載體包含編碼具有纖維素分解增強活性的家族GH61F多肽的嗜熱毀絲霉CBS202.75基因組序列使用Infusion克隆試劑盒(BDBiosciences,PaloAlto,CA,USA),將實施例8中產生的相同的884bp嗜熱毀絲霉gh61fPCR片段克隆入NcoI和PacI消化的pAILo2(TO2004/099228),得到pSMail98(圖6),其中嗜熱毀絲霉gh6If基因的轉錄在來自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸異構酶的雜合啟動子(NA2_tpi啟動子)的控制下。連接反應物(50μ1)包括IXInFusion緩沖液(BDBiosciences,PaloAlto,CA,USA),IXBSA(BDBiosciences,PaloAlto,CA,USA),1μ1Infusion酶(110稀釋)(BDBiosciences,PaloAlto,CA,USA),IOOng用NcoI和PacI消化的pAILo2,和50ng嗜熱毀絲霉gh61f純化PCR產物。在室溫溫育反應物30分鐘。使用1μ1反應物轉化大腸桿菌XL10S0L0PACKGold超感受態細胞(Stratagene,LaJolla,CA,USA)0通過限制性消化檢測包含pSMail98的大腸桿菌轉化體,并使用BI0R0B0T9600(QIAGENInc.,Valencia,CA,USA)制備質粒DNA。通過DNA測序確認pSMail98中的嗜熱毀絲霉gh61f插入。實施例11嗜熱毀絲霉家族61糖基水解酶基因(gh61a和gh61f)分別在米曲霉JaL355中的表達根據Christensen等,1988,Bio/Technology6:1419_1422的方法制備米曲霉JaL355(W02002/40694)原生質體。各自將3ygpSMail85(gh61a)或pSMail98(gh61f)轉化入米曲霉JaL355。從每次轉化實驗分離二十個轉化體到各個基本培養基平板。用5ml0.01%TffEEN20洗滌每個轉化體的匯合的基本培養基平板,并各自接種到125ml玻璃搖瓶中的25mlM410培養基中,并在34°C,250rpm溫育。接種5天后,根據制造商的說明,用CRITERIONCell(Bio-RadLaboratories,Inc.,Hercules,CA,USA)在CRITERION8-16%Tris-HCl凝膠上分析來自每種培養物的5μ1上清。用ΒΙΟ-SAFE考馬斯染料將得到的凝膠染色。培養物的SDS-PAGE譜表明,大多數轉化體具有期望的條帶大小GH61A為23KDa,GH61F為23KDa。用IOml0.01%TffEEN20洗滌各一個高蛋白表達GH61A和GH61F轉化體,并接種到包含500mlM410培養基的2升Fernbach中,產生用于表征蛋白的培養液。在第5天收獲培養物,并使用0.22μmEXPRESSPlus膜(Millipore,Bedford,MA,USA)過濾。實施例12嗜熱毀絲霉GH61A和GH61F多肽對于預處理的玉米秸酶水解的影響如實施例11中所述制備培養液并使用Amicon超濾設備(Millipore,Bedfored,ΜΑ.,IOkDa聚乙醚砜膜,40psi,4°C)濃縮約20倍。通過密度測定然后SDS-PAGE和考馬斯藍染色來估計蛋白濃度。如WO2005/074647所述將玉米秸預處理并制備為測定底物,以產生預處理的玉米秸(PCS)。從里氏木霉菌株SMA135(W02008/057637)制備用于測定增強活性的基礎纖維素酶混合物。使用1.6ml深孔板(Axygen,SantaClara,CA.),使用1.Oml的總反應體積和ImM硫酸鎂_50mM乙酸鈉,pH5.0中50mg/ml的PCS濃度,進行PCS的水解。以基礎纖維素酶混合物的蛋白濃度為0-25%的濃度向基礎纖維素酶混合物加入嗜熱毀絲霉多肽(GH61A和GH61F)。在50°C溫育168小時。實驗進行三次重復。離心等分試樣,并通過使用板式離心機(S0RVALLRT7,ThermoFisherScientific,ffaltham,MA,USA)以3000rpm離心(MULTISCREENHV0.45μm,Millipore,Billerica,MA,USA)10分鐘而過濾上清液。不立即使用時,在-20°C冷凍過濾的水解物等分試樣。在65°C,以0.6ml/分鐘的流Ι/Λ4.6x250mmAMINEXHPX-87Hft(Bio-RadLaboratories,Inc.,Inc.,Hercules,CA,USA)通過包含0.05%w/w苯甲酸的0.005MH2SO4洗脫,然后測定在包含0.05%w/w苯甲酸的0.005MH2SO4中稀釋的樣品的糖濃度,通過積分來自折射率檢測(CHEMSTATI0N_,AGILENT1100HPLC,AgilentTechnologies,SantaClara,CA,USA)的葡萄糖和纖維二糖信號而定量,所述檢測由純糖樣品(AbsoluteStandardsInc.,Hamden,CT,USA)校準。使用得到的當量計算每次反應的纖維素轉化百分比。使用下式計算對葡萄糖加纖維二糖的纖維素轉化率程度(轉化率,%)轉化率(%)=(葡萄糖+纖維二糖xl.053)(mg/ml)xl00xl62/(纖維素(mg/ml)xl80)=(葡萄糖+纖維二糖xl.053)(mg/ml)xlOO/(纖維素(mg/ml)xl.Ill)在這個等式中,因數1.111反映將纖維素轉化成葡萄糖中的重量增加,而因數1.053反映將纖維二糖轉化成葡萄糖中的重量增加。通過有限消化PCS而釋放葡萄糖和纖維二糖,來確定PCS中的纖維素。向基礎纖維素酶混合物中加入漸增量的嗜熱毀絲霉多肽的結果如圖7所示。加入嗜熱毀絲霉GH61A多肽在25%的加入水平提供1.26的刺激因子。在相同的加入百分比,嗜熱毀絲霉GH61F提供1.13的刺激因子。將刺激因子定義為在存在加入的GH61蛋白時觀察到的轉化率與在不存在加入的GH61蛋白時的轉化率的比值。生物材料的保藏權利要求具有纖維素分解增強活性的分離的多肽,其選自下組(a)包含氨基酸序列的多肽,所述氨基酸序列與SEQIDNO2或SEQIDNO4的成熟多肽具有至少60%同一性;(b)由多核苷酸編碼的多肽,所述多核苷酸在至少中嚴緊條件下與以下雜交(i)SEQIDNO1或SEQIDNO3的成熟多肽編碼序列,(ii)包含于SEQIDNO1或SEQIDNO3的成熟多肽編碼序列中的cDNA序列,或(iii)(i)或(ii)的全長互補鏈;(c)由包含核苷酸序列的多核苷酸編碼的多肽,所述核苷酸序列與SEQIDNO1的成熟多肽編碼序列具有至少60%同一性;和(d)SEQIDNO2或SEQIDNO4的成熟多肽的包含取代、缺失和/或插入一個或多個(數個)氨基酸的變體。2.權利要求1的多肽,其包含SEQIDNO2或SEQIDNO4的氨基酸序列或其具有纖維素分解增強活性的片段,或由SEQIDNO:2或SEQIDNO:4的氨基酸序列或其具有纖維素分解增強活性的片段組成。3.權利要求1的多肽,所述多肽由下述質粒中所含的多核苷酸編碼包含在大腸桿菌NRRLB-50083中的質粒pSMai190,或者包含在大腸桿菌NRRLB-50085中的質粒pSMai192。4.分離的多核苷酸,其包含編碼權利要求1-3中任一項的多肽的核苷酸序列。5.核酸構建體,其包含權利要求4的多核苷酸,所述多核苷酸與一個或多個(數個)調控序列可操作地連接,所述調控序列指導多肽在表達宿主中產生。6.重組宿主細胞,其包含權利要求5的核酸構建體。7.用于產生權利要求1-3中任一項的多肽的方法,其包括(a)在有益于所述多肽產生的條件下培養細胞,所述細胞以其野生型形式產生所述多肽;和(b)回收所述多肽。8.用于產生權利要求1-3中任一項的多肽的方法,其包括(a)在有益于所述多肽產生的條件下培養包含核酸構建體的宿主細胞,所述核酸構建體包含編碼所述多肽的核苷酸序列;和(b)回收所述多肽。9.用于產生親本細胞的突變體的方法,所述方法包括破壞或缺失編碼權利要求1-3中任一項的多肽的核苷酸序列,其導致突變體與親本細胞相比產生較少的所述多肽。10.用于產生權利要求1-3中任一項的多肽的方法,其包括(a)在有益于所述多肽產生的條件下培養轉基因植物或植物細胞,所述轉基因植物或植物細胞包含編碼多肽的多核苷酸;和(b)回收所述多肽。11.轉基因植物、植物部分或植物細胞,其已經用編碼權利要求1-3中任一項的多肽的多核苷酸轉化。12.包含權利要求4的多核苷酸的亞序列的雙鏈抑制RNA(dsRNA)分子,其中任選地所述dsRNA是siRNA或miRNA分子。13.用于抑制具有纖維素分解增強活性的多肽在細胞中表達的方法,其包括對所述細胞施用雙鏈RNA(dsRNA)分子,或者在所述細胞中表達雙鏈RNA(dsRNA)分子,其中所述dsRNA包括權利要求4的多核苷酸的亞序列。14.核酸構建體,其包含編碼蛋白質的基因,所述基因與編碼信號肽的核苷酸序列可操作地連接,所述信號肽包含SEQIDNO2的氨基酸1至17或SEQIDNO4的氨基酸1至15,或由SEQIDNO:2的氨基酸1至17或SEQIDNO:4的氨基酸1至15組成,其中所述基因對于所述核苷酸序列是外源的。15.重組表達載體,其包含權利要求14的核酸構建體。16.用于產生蛋白質的方法,其包括(a)在有益于所述蛋白質產生的條件下培養權利要求15的重組宿主細胞;和(b)回收所述蛋白質。17.降解或轉化纖維素材料的方法,其包括在權利要求1-3中任一項的具有纖維素分解增強活性的多肽存在下,用纖維素分解酶組合物處理纖維素材料,其中與不存在具有纖維素分解增強活性的多肽相比,具有纖維素分解增強活性的多肽的存在增加纖維素材料的降解。18.權利要求17的方法,還包括回收已降解的纖維素材料。19.產生發酵產物的方法,其包括(a)在權利要求1-3中任一項的具有纖維素分解增強活性的多肽存在下,用纖維素分解酶組合物糖化纖維素材料,其中與不存在具有纖維素分解增強活性的多肽相比,具有纖維素分解增強活性的多肽的存在增加纖維素材料的降解;(b)用一種或多種發酵微生物發酵步驟(a)的糖化的纖維素材料以產生發酵產物;和(c)從發酵中回收所述發酵嚴物。20.發酵纖維素材料的方法,其包括用一種或多種發酵微生物發酵纖維素材料,其中在權利要求1-3中任一項的具有纖維素分解增強活性的多肽的存在下用纖維素分解酶組合物水解所述纖維素材料,并且與不存在具有纖維素分解增強活性的多肽相比,具有纖維素分解增強活性的多肽的存在增加纖維素材料的水解。全文摘要本發明涉及具有纖維素分解增強活性的分離的多肽和編碼所述多肽的分離的多核苷酸。本發明還涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞,以及用于制備和使用所述多肽的方法。文檔編號C12N9/42GK101952420SQ200880127123公開日2011年1月19日申請日期2008年12月18日優先權日2007年12月19日發明者保羅·哈里斯,蘇欽德拉·梅尤蘭,金伯利·布朗申請人:諾維信公司