專利名稱::具有纖維素分解增強活性的多肽和編碼該多肽的多核苷酸的制作方法
技術領域:
:本發明涉及具有纖維素分解增強活性的分離的多肽和編碼該多肽的分離的多核苷酸。本發明還涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞,以及產生和使用所述多肽的方法。相關技術描述纖維素是單糖葡萄糖通過β-1,4_鍵連接的聚合物。許多微生物產生水解β_連接葡聚糖的酶。這些酶包括內切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。內切葡聚糖酶在隨機位置消化所述纖維素聚合物,使其開放以受到纖維二糖水解酶的攻擊。纖維二糖水解酶按順序自所述纖維素聚合物末端釋放纖維二糖分子。纖維二糖是葡萄糖水溶性的β-1,4-連接二聚體。β-葡糖苷酶將纖維二糖水解為葡萄糖。將木素纖維素原料轉化為乙醇具有如下優點大量原料現成可得,期望避免焚燒或填埋所述材料,以及乙醇燃料的清潔性。木材、農業殘余物、草本作物和城市固體廢物已經被考慮作為供乙醇產生的原料。這些材料主要由纖維素、半纖維素和木質素組成。一旦纖維素轉換為葡萄糖,葡萄糖即容易地由酵母發酵為乙醇。在本領域中,改善轉化纖維素原料的能力應是有利的。WO2005/074647公開了來自土生梭孢霉(Thielaviaterrestris)的具有纖維素分解增強活性的分離的多肽及其多核苷酸。WO2005/074656公開了來自橙色熱子囊菌(Thermoascusaurantiacus)的具有纖維素分解增強活性的分離的多肽及其多核苷酸。WO2007/089290公開了來自里氏木霉(Trichodermareesei)的具有纖維素分解增強活性的分離的多肽及其多核苷酸。本發明涉及具有纖維素分解增強活性的多肽和編碼該多肽的多核苷酸。
發明內容本發明涉及選自下組的具有纖維素分解增強活性的分離的多肽(a)一種多肽,其包含與SEQIDNO2的成熟多肽具有至少60%同一性的氨基酸序列;(b)一種由如下多核苷酸編碼的多肽,所述多核苷酸在至少中等嚴緊條件下與以下雜交(i)SEQIDNO1的成熟多肽編碼序列,(ii)包含于SEQIDNO1的成熟多肽編碼序列中的cDNA序列,或(iii)(i)或(ii)的全長互補鏈;(c)一種由如下多核苷酸編碼的多肽,所述多核苷酸包含與SEQIDN0:1的成熟多肽編碼序列具有至少60%同一性的核苷酸序列;和(d)一種變體,其包含取代、缺失和/或插入一個或多個(幾個)氨基酸的SEQIDNO2的成熟多肽。本發明還涉及選自下組的分離的多核苷酸,其編碼具有纖維素分解增強活性的多肽(a)一種多核苷酸,其編碼包含與SEQIDNO2的成熟多肽具有至少60%同一性的氨基酸序列的多肽;(b)一種多核苷酸,其在至少中等嚴緊條件下與以下雜交(i)SEQIDNO1的成熟多肽編碼序列,(ii)包含于SEQIDNO1的成熟多肽編碼序列中的cDNA序列,或(iii)(i)或(ii)的全長互補鏈;(c)一種多核苷酸,其包含與SEQIDNO=I的成熟多肽編碼序列具有至少60%同一性的核苷酸序列;和(d)一種多核苷酸,其編碼一種變體,該變體包含取代、缺失和/或插入一個或多個(幾個)氨基酸的SEQIDNO2的成熟多肽。本發明還涉及包含所述多核苷酸的核酸構建體、重組表達載體、重組宿主細胞,和產生具有纖維素分解增強活性的多肽的方法。本發明還涉及抑制細胞中多肽表達的方法,包括向所述細胞施用或在所述細胞中表達雙鏈RNA(dsRNA)分子,其中所述dsRNA包含本發明的多核苷酸的亞序列。本發明還涉及這樣的雙鏈抑制性RNA(dsRNA)分子,其中任選地所述dsRNA是siRNA或miRNA分子。本發明還涉及供降解或轉化纖維素材料的方法,包括用纖維素分解酶組合物在具有纖維素分解增強活性的多肽存在下處理所述纖維素材料,其中所述具有纖維素分解增強活性的多肽的存在與該具有纖維素分解增強活性的多肽不存在時相比,增加了纖維素材料的降解。本發明還涉及產生發酵產物的方法,包括(a)用纖維素分解酶組合物在具有纖維素分解增強活性的多肽存在下糖化纖維素材料,其中所述具有纖維素分解增強活性的多肽的存在與該具有纖維素分解增強活性的多肽不存在時相比,增加了纖維素材料的降解;(b)用一種或多種發酵微生物發酵步驟(a)中糖化的纖維素材料以產生所述發酵產物;和(c)自發酵回收所述發酵產物。本發明還涉及發酵纖維素材料的方法,包括用一種或多種發酵微生物發酵所述纖維素材料,其中所述纖維素材料是用纖維素分解酶組合物在本發明的具有纖維素分解增強活性的多肽存在下糖化的,且所述具有纖維素分解增強活性的多肽的存在與該具有纖維素分解增強活性的多肽不存在時相比,增加了所述纖維素材料的降解。本發明還涉及包含編碼具有纖維素分解增強活性的多肽的分離多核苷酸的植物。本發明還涉及產生具有纖維素分解增強活性的多肽的方法,包括(a)在有助于下述多肽產生的條件下,培養轉基因植物或植物細胞,所述轉基因植物或植物細胞包含編碼所述具有纖維素分解增強活性的多肽的多核苷酸;和(b)回收所述多肽。本發明進一步涉及包含編碼蛋白質的基因的核酸構建體,其中所述基因可操作地連接于編碼信號肽的核苷酸序列,所述信號肽包含SEQIDNO:2的氨基酸1到19或由其組成,其中所述基因對所述核苷酸序列是外源的。附圖簡述圖1顯示具有纖維素分解增強活性的嗜熱毀絲霉(Myceliophthorathermophila)CBS202.75GH61J多肽的基因組DNA序列和推導的氨基酸序列(分別為SEQIDNOs1和2)。圖2顯示pSMail87的限制圖譜。圖3顯示pSMail86的限制圖譜。定義纖維素分解增強活性術語“纖維素分解增強活性”在本文中定義為下述生物學活性,即其增強具有纖維素分解活性的蛋白質對纖維素材料的水解。就本發明而言,纖維素分解增強活性通過測定由于纖維素酶蛋白對纖維素材料在下述條件下進行的水解導致的還原糖的增加或總纖維二糖和葡萄糖的增加所確定l_50mg的總蛋白質/gPCS中的纖維素,其中總蛋白質包含80-99.5%w/w纖維素酶蛋白/gPCS中的纖維素和0.2-20%w/w具有纖維素分解增強活性的蛋白質,在50°C下進行1-7日,與下述對照水解相比較,即其具有相等的總蛋白質上樣,但無纖維素分解增強活性(l-50mg的纖維素分解蛋白/gPCS中的纖維素)。在優選的方面,將在3%總蛋白質重量的米曲霉(Aspergillusoryzae)β-葡糖苷酶(根據WO02/095014在米曲霉中重組產生)或3%總蛋白質重量的煙曲霉(Aspergillusfumigatus)β-葡糖苷酶(根據W002/095014的實施例22在米曲霉中重組產生)的纖維素酶蛋白上樣存在下的CELLUCLAST1.5L(NovozymesA/S,Bagsvaerd,Denmark)混合物用作所述纖維素分解活性的來源。具有纖維素分解增強活性的多肽具有SEQIDNO2的成熟多肽的纖維素分解增強活性的至少20%,優選至少40%,更優選至少50%,更優選至少60%,更優選至少70%,更優選至少80%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少100%。所述具有纖維素分解增強活性的多肽通過將達到同等程度所需的水解纖維素分解酶的量減少至少0.1倍,更優選至少0.2倍,更優選至少0.3倍,更優選至少0.4倍,更優選至少0.5倍,更優選至少1倍,更優選至少3倍,更優選至少4倍,更優選至少5倍,更優選至少10倍,更優選至少20倍,甚至更優選至少30倍,最優選至少50倍,且甚至最優選至少100倍來增強具有纖維素分解活性的蛋白質催化的對纖維素材料的水解。纖維素分解活性術語“纖維素分解活性”在本文中定義為水解纖維素材料的生物學活性。纖維素分解蛋白可水解或會水解羧甲基纖維素(CMC),由此減少溫育混合物的粘度。所導致的粘度減少可通過振動粘度計(vibrationviscosimeter)(例如,來自Sofraser,France的MIVI3000)來確定。以CellulaseViscosityUnit(纖維素酶粘度單位)(CEVU)的形式測量纖維素酶活性,是通過測定樣品減少羧甲基纖維素(CMC)溶液粘度的能力來量化存在于該樣品中的催化活性的量。所述分析法在適于所述纖維素分解蛋白與底物的溫度與PH下進行。對于CELLUCLAST(NovozymesA/S,Bagsvaerd,Denmark),該分析法在40°C下在0.IM磷酸鹽pH9.0緩沖液中以CMC作為底物(33.3g/L羧甲基纖維素Hercules7LFD)以及大約3.3-4.2CEVU/ml的酶濃度進行。所述CEVU活性相對于已公知的酶標準,例如CELLUZYMEStandardl7_1194(得自NovozymesA/S,Bagsvaerd,Denmark)來計算。為了本發明的目標,纖維素分解活性通過測定在下述條件下由纖維素分解混合物進行的纖維素材料水解的增加來確定=I-IOmg的纖維素分解蛋白/g的PCS纖維素在50°C下進行5-7日,與未添加纖維素分解蛋白的對照水解相比較。內切葡聚糖酶術語“內切葡聚糖酶”在本文中定義為內-1,4_(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(Ε.C.No.3.2.1.4),其催化纖維素、纖維素衍生物(如羧甲基纖維素和羥乙基纖維素)、地衣淀粉中的1,4-β-D-糖苷聯結,混合型β-1,3-葡聚糖如谷物β-D-葡聚糖或木葡聚糖,以及其它含有纖維素成分的植物材料中β-1,4-鍵的內水解。就本發明而言,內切葡聚糖酶活性使用羧甲基纖維素(CMC)水解根據Ghose,1987,PureandApp1.Chem.59:257_268的方法加以確定。纖維二糖水解酶術語“纖維二糖水解酶”在本文中定義為一種1,4-β-D-葡聚糖纖維二糖水解酶(E.C.3.2.1.91),其催化水解纖維素、纖維寡糖、或任何含β-1,4-連接的葡萄糖的聚合物中1,4-β-D-葡糖苷聯結,從鏈的還原端或非還原端釋放纖維二糖。就本發明而言,纖維二糖水解酶活性是依照Lever等,1972,Anal.Biochem.47:273_279和vanTilbeurgh等,1982,FEBSLettersl49152-156;vanTilbeurgh和Claeyssens,1985,FEBSLetters187:283_288記載的程序加以測定的。在本發明中,所述Lever等的方法用于估計玉米秸稈中纖維素的水解,而vanTilbeurgh等的方法用于依靠熒光性的二糖衍生物來確定纖維二糖水解酶活性。β-葡糖苷酶術語“β-葡糖苷酶”在本文中定義為一種β-D-葡糖苷葡糖水解酶(Ε.C.3.2.1.21),其催化水解末端非還原性β-D-葡萄糖殘基,并釋放β-D-葡萄糖。就本發明而言,β-葡糖苷酶活性是根據Venturi等,2002,J.BasicMicrobiol.42:55_66記載的基本方法來測定的,除非如此處所述使用了不同的條件。一個單位的葡糖苷酶活性定義為在100mM檸檬酸鈉、0.01%TWEEN20中,50°C、pH5條件下每分鐘從作為底物的4mM對硝基苯基-β-D-吡喃葡萄糖苷產生1.0微摩爾對硝基苯酚。家族61糖苷水解酶術語“家族61糖苷水解酶”或“家族GH61”在本文中定義為根據HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309_316,禾口HenrissatB.,andBairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696落入糖苷水解酶家族61的多肽。目前,Henrissat將GH61家族列為未分類的,這指明對屬于該家族的多肽,如機理,催化性親核體/堿,催化性質子供體,以及3D結構等性質尚在未知之數。纖維素材料所述纖維素材料可以是任何含有纖維素的材料。生物質的初生細胞壁中主要的多糖是纖維素,豐度第二高的是半纖維素,第三是果膠。在細胞停止生長后產生的次生細胞壁也含有多糖,并且通過與半纖維素共價交聯的多聚體木質素而加強。纖維素是脫水纖維二糖的均聚物,并因此是一種直鏈i3-(l_4)-D-葡聚糖,而半纖維素包括多種化合物,如木聚糖、木葡聚糖、阿拉伯木聚糖和甘露聚糖,具有復雜的分枝結構和一系列取代基。雖然纖維素一般是無定形的,但植物組織中發現的纖維素主要為由平行葡聚糖鏈構成的不溶性晶體基質。半纖維素通常通過氫鍵鍵合于纖維素以及其他半纖維素上,這有助于細胞壁基質的穩定化。纖維素通常存在于例如植株的莖、葉、果/種殼(hulls)、果/種皮(husks)和穗軸(cobs),或者樹的葉、枝、和木材等之中。纖維素材料可以是,但不限于,草本材料(herbaceousmaterial)、農業殘余物(agriculturalresidues)、林業殘余物(forestryresidues)、城市固體廢物(municipalsolidwastes)、廢紙(wastepaper),以及紙漿和造紙廠殘余物(pulpandpapermillresidue)。纖維素材料可以是任何類型的生物質,包括但不限于木材資源、城市固體廢物、廢紙、作物和作物殘余物(見例如Wiselogel等,1995,《HandbookonBioethanol》(CharlesΕ·Wyman編),第105-118頁,Taylor&Francis,WashingtonD.C.;ffyman,1994,BioresourceTechnology503-16;Lynd,1990,AppliedBiochemistryandBiotechnology24/25695-719;Mosier等,1999,RecentProgressinBioconversionofLignocellulosics,《AdvancesinBiochemicalEngineering/Biotechnology)),T.Scheper總編,第65卷,第23-40頁,Springer-Verlag,NewYork)。在本文中應當理解,纖維素可為木素纖維素的形式,即在混合的基質中包含木質素、纖維素和半纖維素的植物細胞壁材料。在優選的方面,所述纖維素材料是木素纖維素。在一方面,所述纖維素材料為草本材料。在另一方面,所述纖維素材料為農業殘余物。在另一方面,所述纖維素材料為林業殘余物。在另一方面,所述纖維素材料為城市固體廢物。在另一方面,所述纖維素材料為廢紙。在另一方面,所述纖維素材料為紙漿和造紙廠殘余物。在另一方面,所述纖維素材料為玉米秸稈。在另一優選的方面,所述纖維素材料為玉米纖維。在另一方面,所述纖維素材料為玉米穗軸。在另一方面,所述纖維素材料為橙皮。在另一方面,所述纖維素材料為稻稈。在另一方面所述纖維素材料為麥稈。在另一方面,所述纖維素材料為柳枝稷(switchgrass)。在另一方面,所述纖維素材料為芒草(miscanthus)。在另一方面,所述纖維素材料為甘蔗渣。在另一個優選的方面,所述纖維素材料是微晶纖維素。在另一個方面,所述纖維素材料是細菌纖維素。纖維素材料可以直接使用,或者可以使用本文中描述的本領域已知的常規方法對其進行預處理。在優選的方面,所述纖維素材料經預處理。預處理玉米秸稈術語“PCS”或“預處理的玉米秸稈”在本文中定義為通過用熱和稀酸處理從玉米秸稈衍生的纖維素材料。分離的多肽術語“分離的多肽”用于本文中指從來源分離的多肽。在優選的方面,如通過SDS-PAGE測定的,所述多肽為至少純,優選至少5%純,更優選至少10%純,更優選至少20%純,更優選至少40%純,更優選至少60%純,甚至更優選至少80%純,并且最優選至少90%純。基本上純的多肽術語“基本上純的多肽”在本文表示多肽制備物,所述多肽制備物含有按重量計至多10%,優選至多8%,更優選至多6%,更優選至多5%,更優選至多4%,更優選至多3%,甚至更優選至多2%,最優選至多1%,并且甚至最優選至多0.5%的與其天然或重組結合的(associated)其它多肽材料。因此,優選所述基本上純的多肽按存在于制備物中的全部多肽材料的重量計是至少92%純,優選至少94%純,更優選至少95%純,更優選至少96%純,更優選至少96%純,更優選至少97%純,更優選至少98%純,甚至更優選至少99%純,最優選至少99.5%純,并且甚至最優選100%純。本發明的多肽優選是基本上純的形式,即所述多肽制備物基本上(essentially)不含與其天然或重組結合的其它多肽材料。例如,這能夠通過如下實現通過公知的重組方法或通過經典純化方法制備多肽。成熟多肽術語“成熟多肽”在本文中定義為以其在翻譯和任何翻譯后修飾(如N-末端加工、C-末端截短、糖基化、磷酸化等)之后的最終形式存在的多肽。在優選的方面,基于預測SEQIDNO:2的氨基酸1-19是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering101-6),所述成熟多肽是SEQIDNO2的氨基酸20-246。成熟多肽編碼序列術語“成熟多肽編碼序列”在本文中定義為編碼具有纖維素分解增強活性的成熟多肽的核苷酸序列。在優選的方面,基于SignalP程序所述成熟多肽編碼序列是SEQIDNO1的核苷酸58-811,該程序預測SEQIDNO1的核苷酸1_57編碼信號肽。同一性兩個氨基酸序列之間或兩個核苷酸序列之間的相關性由參數“同一性”來描述。就本發明而言,兩個氨基酸序列之間的同一性程度是使用如EMBOSS程序包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16:276_277)(優選版本3.0.0或更新的版本)的Needle程序中執行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443_453)來測定的。使用的可選參數是缺口產生罰分為10,缺口延伸罰分為0.5,和EBL0SUM62(BL0SUM62的EMBOSS版本)取代矩陣。將標記為“最長同一性”的Needle輸出(使用-nobrief選項獲得)用作百分比同一性并且是如下計算的(相同的殘基XlOO)/(比對的長度-比對中的缺口總數)就本發明而言,兩個脫氧核糖核苷酸序列之間的同一性程度使用如EMBOSS程序包(EMBOSSTheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,見上)(優選版本3.0.0或更新的版本)的Needle程序中執行的Needleman-Wunsch算法(Needleman和Wunsch,1970,見上)測定。使用的可選參數是缺口產生罰分為10,缺口延伸罰分為0.5,和EDNAFULL(NCBINUC4.4的EMBOSS版本)取代矩陣。將標記為“最長同一性”的Needle輸出(使用-nobrief選項獲得)用作百分比同一性并且是如下計算的(相同的脫氧核糖核苷酸XlOO)/(比對的長度-比對中的缺口總數)同源序列術語“同源序列”在本文中定義為用SEQIDN0:2的具有纖維素分解增強活性的嗜熱毀絲霉多肽或其成熟多肽,在tfasty檢索(Pearson,W.R.,1999,于BioinformaticsMethodsandProtocols,S.Misener禾口S.A.Krawetz編,185-219頁)中具有小于0.001的E值(或預期分數)的預測蛋白質。多肽片段術語“多肽片段”在本文定義為從SEQIDNO2的成熟多肽或其同源序列的氨基和/或羧基末端缺失了一個或多個(幾個)氨基酸的多肽;其中所述片段具有纖維素分解增強活性。在優選的方面,片段含有SEQIDNO2的成熟多肽或其同源序列的至少195個氨基酸殘基,更優選至少205個氨基酸殘基,并且最優選至少214個氨基酸殘基。亞序列術語“亞序列(subsequence)”在本文中定義為從SEQIDNO1的成熟多肽編碼序列的5'和/或3'端缺失了一個或多個(幾個)核苷酸的核苷酸序列;或其同源序列;其中所述亞序列編碼具有纖維素分解增強活性的多肽片段。在優選的方面,亞序列含有SEQIDNO:1的成熟多肽編碼序列或其同源序列的至少585個核苷酸,更優選至少615個核苷酸,并且最優選至少645個核苷酸。等位變體(allelicvariant)術語“等位變體”在本文中表示占據相同染色體基因座的基因的任何兩種或兩種以上可選形式。等位變異通過突變天然地發生,并且可導致種群內的多態性。基因突變可以是沉默的(在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。分離的多核苷酸術語“分離的多核苷酸”用于本文中指從來源分離的多核苷酸。在優選的方面,如通過瓊脂糖電泳測定的,所述多核苷酸為至少純,優選至少5%純,更優選至少10%純,更優選至少20%純,更優選至少40%純,更優選至少60%純,甚至更優選至少80%純,并且最優選至少90%純。基本上純的多核苷酸術語“基本上純的多核苷酸”用于本文指多核苷酸制備物,其不含其它外來的或不期望的核苷酸,并且處于適合于在遺傳工程蛋白質生產體系中使用的形式。因此,基本上純的多核苷酸含有按重量計至多10%,優選至多8%,更優選至多6%,更優選至多5%,更優選至多4%,更優選至多3%,甚至更優選至多2%,最優選至多1%,并且甚至最優選至多0.5%的與其天然或重組結合的其它多核苷酸材料。然而,基本上純的多核苷酸可以包括天然存在的5’和3’非翻譯區,如啟動子和終止子。優選基本上純的多核苷酸是按重量計至少90%純,優選至少92%純,更優選至少94%純,更優選至少95%純,更優選至少96%純,更優選至少97%純,甚至更優選至少98%純,最優選至少99%,并且甚至最優選至少99.5%純的。本發明的多核苷酸優選為基本上純的形式,即所述多核苷酸制備物基本上(essentially)不含與其天然或重組結合的其它多核苷酸材料。所述多核苷酸可以是基因組、cDNA、RNA、半合成、合成來源的,或它們的任何組合。編碼序列當用于本文時術語“編碼序列”的意思是直接指定其蛋白產物的氨基酸序列的核苷酸序列。編碼序列的邊界通常由開讀框決定,所述開讀框通常以ATG起始密碼子或可供選擇的起始密碼子如GTG和TTG開始,并且以終止密碼子如TAA、TAG和TGA結束。編碼序列可以是DNA、cDNA、合成的或重組的核苷酸序列。cDNA術語“cDNA”在本文中定義為能夠通過反轉錄從得自真核細胞的成熟的、已剪接的mRNA分子制備的DNA分子。cDNA缺少可能存在于相應基因組DNA中的內含子序列。起始的(initial)、初級的RNA轉錄物是mRNA的前體,其通過一系列的步驟加工然后作為成熟的已剪接的mRNA出現。這些步驟包括通過稱為剪接的過程去除內含子序列。因而源自mRNA的cDNA沒有任何內含子序列。核酸構建體術語“核酸構建體”用于本文指單鏈或雙鏈的核酸分子,所述核酸分子分離自天然存在的基因,或將所述核酸分子以本來不存在于(nototherwiseexist)自然界中的方式修飾以含有核酸的區段或所述核酸分子是合成的。當所述核酸構建體含有表達本發明的編碼序列所需的控制序列時,術語核酸構建體與術語“表達盒”同義。控制序列(controlsequence)術語“控制序列”在本文定義為包括對編碼本發明多肽的多核苷酸表達是必需的所有組分。各個控制序列對于編碼所述多肽的核苷酸序列可以是天然的或外源的,或各個控制序列對于彼此可以是天然的或外源的。這些控制序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。最少的情況,控制序列包括啟動子和轉錄和翻譯的終止信號。控制序列可以和目的為引入特異10性限制位點的接頭一起提供,所述特異性限制位點促進控制序列與編碼多肽的核苷酸序列編碼區的連接。可操作地連接術語“可操作地連接”在本文表示這樣的構型,其中將控制序列置于相對于多核苷酸序列的編碼序列的適當位置,使得控制序列指導多肽編碼序列的表達。表達術語“表達”包括涉及多肽產生的任何步驟,其包括但不限于轉錄、轉錄后修飾、翻譯、翻譯后修飾和分泌。表達載體術語“表達載體”在本文定義為線性的或環狀的DNA分子,其包含編碼本發明多肽的多核苷酸,并且所述多核苷酸與提供用于其表達的額外核苷酸可操作地連接。宿主細胞如本文中所使用的術語“宿主細胞”包括任何細胞類型,所述細胞類型對于使用包含本發明多核苷酸的核酸構建體或表達載體的轉化、轉染、轉導等是易感的(susceptible)0修飾術語“修飾”在本文的意思是,對由SEQIDNO2的成熟多肽組成的多肽或其同源序列的任何化學修飾,以及對編碼這樣的多肽的DNA的遺傳操作。所述修飾可以是一個或多個(幾個)氨基酸的取代、缺失和/或插入,以及一個或多個(幾個)氨基酸側鏈的置換。人工變體當用在本文時,術語“人工變體”的意思是具有纖維素分解增強活性的多肽,所述多肽由表達SEQIDNO:1的成熟多肽編碼序列的修飾的多核苷酸序列或其同源序列的生物體產生。所述修飾的核苷酸序列通過人為干預(humanintervention),通過修飾公開于SEQIDNO:1的多核苷酸序列或其同源序列來獲得。發明詳述具有纖維素分解增強活性的多肽在第一個方面,本發明涉及包含下述氨基酸序列的分離的多肽,所述氨基酸序列與SEQIDNO:2的成熟多肽具有優選至少60%,更優選至少65%,更優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少96%、至少97%、至少98%或至少99%的同一性程度,所述多肽具有纖維素分解增強活性(下文中的“同源多肽”)。在優選的方面,所述同源多肽具有的氨基酸序列與SEQIDNO:2的成熟多肽相差十個氨基酸,優選相差五個氨基酸,更優選相差四個氨基酸,甚至更優選相差三個氨基酸,最優選相差兩個氨基酸,并且甚至最優選相差一個氨基酸。本發明的多肽優選包含SEQIDNO2的氨基酸序列或其等位變體;或它們的具有纖維素分解增強活性的片段。在優選的方面,多肽包含SEQIDNO:2的氨基酸序列。在另一優選的方面,多肽包含SEQIDNO:2的成熟多肽。在另一優選的方面,多肽包含SEQIDNO:2的氨基酸20至246,或其等位變體;或它們的具有纖維素分解增強活性的片段。在另一優選的方面,多肽包含SEQIDNO2的氨基酸20至246。在另一優選的方面,多肽由SEQIDNO2的氨基酸序列或其等位變體,或它們的具有纖維素分解增強活性的片段組成。在另一優選的方面,多肽由SEQIDNO:2的氨基酸序列組成。在另一優選的方面,多肽由SEQIDNO2的成熟多肽組成。在另一優選的方面,多肽由SEQIDNO2的氨基酸20至246或其等位變體,或它們的具有纖維素分解增強活性的片段組成。在另一優選的方面,多肽由SEQIDNO2的氨基酸20至246組成。在第二個方面,本發明涉及具有纖維素分解增強活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸在優選極低嚴緊條件、更優選低嚴緊條件、更優選中嚴緊條件、更優選中_高嚴緊條件、甚至更優選高嚴緊條件、和最優選非常高嚴緊條件下與下列雜交(i)SEQIDNO:1的成熟多肽編碼序列,(ii)包含于SEQIDNO:1的成熟多肽編碼序列中的cDNA序列,(iii)(i)或(ii)的亞序列,或(iv)(i)、(ii)或(iii)的全長互補鏈(J.Sambrook,E.F.Fritsch禾口T.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO1的成熟多肽編碼序列的亞序列含有至少100個連續的核苷酸或優選至少200個連續的核苷酸。此外,所述亞序列可以編碼具有纖維素分解增強活性的多肽片段。在優選的方面,所述互補鏈是SEQIDNO1的成熟多肽編碼序列的全長互補鏈。SEQIDNO1的核苷酸序列或其亞序列;以及SEQIDNO2的氨基酸序列或其片段,可用于設計核酸探針,以根據本領域內公知的方法從不同屬或種的菌株鑒定和克隆編碼具有纖維素分解增強活性的多肽的DNA。具體而言,可將這些探針用于根據標準的Southern印跡方法與感興趣的屬或種的基因組或cDNA雜交,以鑒定并從其中分離相應的基因。這些探針可明顯短于完整序列,但長度上應為至少14個,優選至少25個,更優選至少35個,并且最優選至少70個核苷酸。然而,優選所述核酸探針長度上是至少100個核苷酸。例如,所述核酸探針長度上可以是至少200個核苷酸,優選至少300個核苷酸,更優選至少400個核苷酸,或最優選至少500個核苷酸。甚至可以使用更長的探針,例如,長度是優選至少600個核苷酸,更優選至少700個核苷酸,或最優選至少800個核苷酸的核酸探針。DNA和RNA探針二者均可使用。通常將探針標記以探測相應的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)標記)。將這些探針包含于本發明中。因而,可從由這些其它菌株制備的基因組DNA或cDNA文庫中篩選DNA,所述DNA與上述探針雜交并且編碼具有纖維素分解增強活性的多肽。可以通過瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術分離來自這些其它菌株的基因組或其它DNA。可以將來自文庫的DNA或分離的DNA轉移至硝化纖維素(nitrocellulose)或其它合適的載體材料并且固定于其上。為了鑒定與SEQIDNO:1或其亞序列同源的克隆或DNA,將所述載體材料優選用在Sounthern印跡中。就本發明而言,雜交表示核苷酸序列在非常低至非常高的嚴緊條件下與標記的核酸探針雜交,所述核酸探針對應于SEQIDNO:1的成熟多肽編碼序列;包含于SEQIDN01的成熟多肽編碼序列中的cDNA序列;其全長互補鏈;或其亞序列。可使用例如X射線片(X-rayfilm)檢測在這些條件下與核酸探針雜交的分子。在優選的方面,核酸探針是SEQIDNO:1的成熟多肽編碼序列。在另一優選的方面,核酸探針是SEQIDNO:1的核苷酸58-811。在另一優選的方面,核酸探針是編碼SEQIDNO:2的多肽的多核苷酸序列,或其亞序列。在另一優選的方面,核酸探針是SEQIDNO:1。在另一優選的方面,核酸探針是包含在大腸桿菌(E.coli)NRRLB-50087中的質粒pSMail87中含有的多核苷酸序列,其中所述其多核苷酸序列編碼具有纖維素分解增強活性的多肽。在另一優選的方面,核酸探針是包含在大腸桿菌NRRLB-50087中的質粒pSMail87中含有的成熟多肽編碼區。對于長度至少100個核苷酸的長探針,將非常低至非常高的嚴緊條件定義為在42°C,在5XSSPE、0.3%SDS、200yg/ml已剪切并且變性的鮭精DNA中,并且對于非常低和低嚴緊性為25%的甲酰胺、對于中和中-高嚴緊性為35%的甲酰胺、或對于高和非常高嚴緊性為50%的甲酰胺,根據標準的Southern印跡步驟進行預雜交和雜交最佳12至24小時。對于長度為至少100個核苷酸的長探針,使用2XSSC、0.2%SDS優選在45°C(非常低嚴緊性),更優選在50°C(低嚴緊性),更優選在55°C(中嚴緊性),更優選在60°C(中-高嚴緊性),甚至更優選在65°C(高嚴緊性),并且最優選在70°C(非常高嚴緊性)將載體材料最終洗滌三次,每次15分鐘。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將嚴緊條件定義為在比使用根據Bolton和McCarthy計算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)計算得出的Tm低大約5°C至大約10°C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,IXDenhardt溶液,ImM焦磷酸鈉(sodiumpyrophosphate),ImM舞酸二Mi內(sodiummonobasicphosphate),0.ImMATP禾口0.2mg每ml的酵母RNA中,根據標準的Southern印跡步驟進行預雜交、雜交和雜交后洗滌最佳12至24小時。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將所述載體材料在6XSSC加0.1%SDS中洗滌一次15分鐘,并用6XSSC在比計算得出的T1Jg5°C至10°C的溫度洗滌兩次,每次15分鐘。在第三個方面,本發明涉及由如下多核苷酸編碼的具有纖維素分解增強活性的分離的多肽,所述多核苷酸包含與SEQIDNO:1的成熟多肽編碼序列具有優選至少60%、更優選至少65%、更優選至少70%、更優選至少75%、更優選至少80%、更優選至少85%、甚至更優選至少90%、最優選至少95%、并且甚至最優選至少96%、至少97%、至少98%、或至少99%同一性程度的核苷酸序列或由所述核苷酸序列組成,其編碼活性多肽。參見本文多核苷酸部分。在第四個方面,本發明涉及人工變體,所述人工變體包含取代、缺失和/或插入一個或多個(或幾個)氨基酸的SEQIDNO:2的成熟多肽;或其同源序列。優選地,氨基酸改變對性質是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質的折疊和/或活性;通常為1至大約30個氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸殘基;多至大約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延伸,如多組氨酸序列(poly-histidinetract)、抗原表位(antigenicepitope)或結合域(bindingdomain)。保守取代的實例是在以下組之內堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領域已知的,并且由例如H.Neuratt^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu禾口Asp/Gly。除了20個基本氨基酸,非基本氨基酸(如4-羥脯氨酸、6-N-甲基賴氨酸、2_氨基異丁酸、異纈氨酸和α-甲基絲氨酸)可以取代野生型多肽的氨基酸殘基。有限數量的非保守氨基酸、不由遺傳密碼編碼的氨基酸和非天然氨基酸可以取代氨基酸殘基。“非天然氨基酸”在蛋白質合成后已經過修飾,和/或在它們的側鏈具有不同于基本氨基酸的化學結構。非天然氨基酸能夠以化學方法合成,并且優選是商業上可得到的,包括六氫吡啶羧酸(pipecolicacid)、噻唑燒羧酸(thiazolidinecarboxylicacid)、脫氫脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。可供選擇的是,氨基酸改變具有這樣的性質以使多肽的物理化學性質改變。例如,氨基酸改變可改進多肽的熱穩定性,改變底物特異性,改變最適PH等。能夠根據本領域已知的方法,例如定位誘變或丙氨酸分區誘變法(Cunningham和Wells,1989,Science244:1081_1085)來鑒定親本多肽中的必需氨基酸。在后一技術中,將單一丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的生物活性(即,纖維素分解增強活性)以鑒定對于所述分子的活性關鍵的氨基酸殘基。同樣參見Hilton等,1996,J.Biol.Chem.271:4699_4708。酶的活性部位或其它的生物相互作用也能夠通過結構的物理分析而測定,如通過以下這些技術如核磁共振、晶體學、電子衍射或光親和標記,連同推定的接觸位點氨基酸的突變來測定。參見例如deVos等,1992,Science255306-312;Smith等,1992,J.Mol.Biol.224:899_904;Wlodaver等,1992,FEBSLett.30959-64。必需氨基酸的身份(identity)也能夠從與多肽的同一性分析來推斷,所述多肽與根據本發明的多肽相關。能夠使用已知的誘變、重組和/或改組(shuffling)方法,然后是有關的篩選方法,例如那些由Reidhaar-Olson禾ΠSauer,1988,Science241:53_57;Bowie禾ΠSauer,1989,Proc.Natl.Acad.Sci.USA86:2152_2156;WO95/17413;或W095/22625公開的那些方法來進行并測試單個或多個氨基酸取代、缺失、和/或插入。能夠使用的其它方法包括易錯PCR、噬菌體展示(例如,Lowman等,1991,Biochem.30:10832_10837;美國專利5,223,409號;WO92/06204)和區域定向的誘變(Derbyshire等,1986,Gene46145;Ner等,1988,DNA7127)。誘變/改組方法能夠與高通量、自動化的篩選方法組合以檢測由宿主細胞表達的克隆的、誘變的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能夠從宿主細胞回收編碼活性多肽的誘變的DNA分子,并且使用本領域內標準方法快速測序。這些方法允許快速測定感興趣的多肽中單個氨基酸殘基的重要性,并且能夠應用于未知結構的多肽。SEQIDNO:2的成熟多肽的氨基酸取代、缺失和/或插入的總數是10,優選9,更優選8,更優選7,更優選至多6,更優選5,更優選4,甚至更優選3,最優選2,并且甚至最優選1。具有纖維素分解增強活性的多肽的來源本發明的多肽可以獲得自任何屬的微生物。就本發明而言,用于本文與給定的來源有關的術語“獲得自”,意思是核苷酸序列編碼的多肽由所述來源產生,或由其中插入了來自所述來源的核苷酸序列的菌株產生。在優選的方面,獲得自給定來源的多肽是胞外分泌的。本發明具有纖維素分解增強活性的多肽可以是細菌多肽。例如,所述多肽可以是革蘭氏陽性細菌多肽如芽孢桿菌屬(Bacillus)、鏈球菌屬(Str印tococcus)、鏈霉菌屬(Streptomyces)、葡萄球菌屬(Staphylococcus)、腸球菌屬(Enterococcus)>?LIf菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、梭菌屬(Clostridium)、地芽孢桿菌屬(Geobacillus)或海洋芽孢桿菌屬(Oceanobacillus)多肽,所述多肽具有纖維素分解增強活性;或革蘭氏陰性細菌多肽,如大腸桿菌、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)、彎曲桿菌屬(Campylobacter)、螺桿菌屬(Helicobacter)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)>iMlfliiM(Ilyobacter)、奈瑟氏菌屬(Neisseria)或脲原體屬(Ureaplasma)多肽,所述多肽具有纖維素分解增強活性。在優選的方面,所述多肽是具有纖維素分解增強活性的嗜堿芽孢桿菌(Bacillusalkalophilus)、!軍i^^yUfelf胃(Bacillusamyloliquefaciens)^M^^^fM(Bacillusbrevis)、環狀芽孢桿菌(Bacilluscirculans)、克勞氏芽孢桿菌(Bacillusclausii)、凝結芽孢桿菌(Bacilluscoagulms)、堅強芽孢桿菌(Bacillusfirmus)、燦爛芽孢桿菌(Bacilluslautus)、遲緩芽孢桿菌(Bacilluslentus)、地衣芽孢桿菌(Bacilluslicheniformis)、巨大芽孢桿菌(Bacillusmegaterium)、短小芽孢桿菌(Bacilluspumilus)、嗜熱月旨肪芽孢桿菌(Bacillusstearothermophilus)、枯草芽孢桿菌(Bacillussubtilis)或蘇云金芽孢桿菌(Bacillusthuringiensis)多肽。在另一個優選的方面,所述多肽是具有纖維素分解增強活性的似馬鏈球菌(Streptococcusequisimilis)、酉良月農鏈球菌(Streptococcuspyogenes)、乳房鏈球菌(Streptococcusuberis)或馬鏈球菌獸痕亞禾中(Streptococcusequisubsp.Zooepidemicus)多月太。在另一個優選的方面,所述多肽是具有纖維素分解增強活性的不產色鏈霉菌(Streptomycesachromogenes)、除蟲鏈霉菌(Streptomycesavermitilis)、天藍鏈霉菌(Streptomycescoelicolor)、灰色鏈霉菌(Streptomycesgriseus)或淺青紫鏈霉菌(Streptomyceslividans)多月太。本發明具有纖維素分解增強活性的多肽也可以是真菌多肽,并且更優選酵母多肽如假絲酵母屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或西洋蓍霉屬(Yarrowia)多肽,其具有纖維素分解增強活性;或更優選絲狀真菌多肽如枝頂孢霉屬(Acremonium)、傘菌屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、Botryospaeria、擬錯菌屬(Ceriporiopsis)、Chaetomidium、金抱子菌屬(Chrysosporium)、Claviceps、Cochliobolus、Coprinopsis、Coptotermes、Corynascus、Cryphonectria、係急球菌屬(Cryptococcus)、Diplodia、Exidia、Filibasidium、,廉抱屬(Fusarium)、赤霉屬(Gibberella)、Holomastigotoides、腐質毒屬(Humicola)、奉巴菌屬(Irpex)、Lentinula、Leptospaeria、梨抱菌屬(Magnaporthe)、Melanocarpus、多孑L菌屬(Meripilus)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新考瑪脂霉屬(Neocallimastix)、脈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia、假漂盤菌屬(Pseudoplectania)、Pseudotrichonympha>根毛霉屬(Rhizomucor)、裂裙菌屬(Schizophyllum)、柱頂孢屬(Scytalidium)、踝節菌屬(Talaromyces)、熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)(Tolypocladium)(Trichoderma)、Trichophaea、f^|^i包屬(Verticillium)、Volvariella或Xylaria多肽,其具有纖維素分解增強活性。在優選的方面,所述多肽是具有纖維素分解增強活性的卡爾酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一優選的方面,所述多肽是具有纖維素分解增強活性的解纖維枝丁頁抱霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、^^ffiβ(Aspergillusawamori)Λffiβ(Aspergillusfumigatus)、1ffiβ(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、構巢曲霉(Aspergillusnidulans)、漂曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角質金抱子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛChrysosporiumzonatum、桿抱狀德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、庫威,廉抱(Fusariumcrookwellense)、大刀,廉抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、異抱德抱(Fusariumheterosporum)、合歡木德?包(Fusariumnegundi)、尖,廉抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉紅德抱(Fusariumroseum)、接骨木,廉抱(Fusariumsambucinum)、膚色,廉?包(Fusariumsarcochroum)、擬分枝抱,廉抱(Fusariumsporotrichioides)、硫色鐮?包(Fusariumsulphureum)、圓鐮孢(Fusariumtorulosum)、擬絲孢鐮孢(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰腐質霉(Humicolagrisea)、特異腐質霉(Humicolainsolens)、疏棉狀腐質霉(Humicolalanuginosa)、Irpexlacteus、米漂毛霉(Mucormiehei)、粗糖脈抱菌(Neurosporacrassa)、繩狀青霉(Penicilliumfuniculosum)、產紫青霉(Penicilliumpurpurogenum)、黃抱平革菌(Phanerochaetechrysosporium)、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、Thielaviaaustraleinsis、Thielaviafimeti、Thielaviamicrospora、Thielaviaovispora、Thielaviaperuviana、罾包冑(Thielaviaspededonium)Λ(Thielaviasetosa)ΛThielaviasubthermophila、土生梭抱霉(Thielaviaterrestris)、哈茨木霉(Trichodermaharzianum)、康寧木霉(Trichodermakoningii)、長枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或綠色木霉(Trichodermaviride)多月太。在另一優選的方面,所述多肽是具有纖維素分解增強活性的黃褐毀絲霉(Myceliophthorahinnulea)、Myceliophthoralutea、嗜熱毀絲霉、或Myceliophthoravellerea多月太。在一個最優選的方面,所述多肽是具有纖維素分解增強活性的嗜熱毀絲霉多肽。在一個最優選的方面,所述多肽是具有纖維素分解增強活性的嗜熱毀絲霉CBS202.75多肽,例如,包含SEQIDNO2的成熟多肽的多肽。可理解的是對于前述的種,本發明包含完全和不完全階段(perfectandimperfectstates),和其它分類學的等同物(equivalent),例如無性型(anamorph),而無論它們已知的種名。本領域的技術人員會容易地識別適合的等同物的身份(identity)。這些種的菌株在許多培養物保藏機構對于公眾能夠容易地取得,所述保藏機構如美國典型培養物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和細胞培養物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和農業研究機構專利培養物保藏中心北區研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。此外,可以使用上述的探針從其它來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物鑒定和獲得這些多肽。用于從天然生境(habitat)分離微生物的技術是本領域內公知的。隨后可通過相似地篩選這種微生物的基因組或cDNA文庫來獲得所述多核苷酸。一旦用所述探針檢測到編碼多肽的多核苷酸序列,就能夠使用本領域普通技術人員熟知的技術將所述多核苷酸分離或克隆(參見,例如,Sambrook等,1989,見上)。本發明的多肽還包括融合多肽或可切割的融合多肽,其中將另外的多肽融合到所述多肽或其片段的N末端或C末端。通過將編碼另一個多肽的核苷酸序列(或其部分)融合于本發明的核苷酸序列(或其部分)來產生融合的多肽。產生融合多肽的技術是本領域已知的,并包括連接編碼多肽的編碼序列以使它們在閱讀框中,并且使所述融合多肽的表達在相同啟動子和終止子的控制下。融合多肽還可以包括切割位點。一旦分泌了融合多肽,就切割所述位點,從融合蛋白釋放具有纖維素分解增強活性的多肽。切割位點的實例包括,但不限于,編碼二肽Lys-Arg的Kex2位點(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568_76;Svetina,2000,J.Biotechnol.76245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488_3493;Ward等,1995,Biotechnology13:498_503;和Contreras等,1991,Biotechnology9:378-381);Ile_(Glu或Asp)-Gly-Arg位點,其在精氨酸殘基后通過因子Xa蛋白酶切割(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位點,其在賴氨酸后通過腸激酶切割(Collins-Racie等,1995,Biotechnology13:982_987);His-Tyr-Glu位點或His-Tyr-Asp位點,其通過GenenaseI切割(Carter等,1989,ProteinsStructure,Function,andGenetics6:240_248);Leu-Val-Pro-Arg-Gly-Ser位點,其在Arg后通過凝血酶切割(Stevens,2003,DrugDiscoveryWorld435-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位點,其在Gln后通過TEV蛋白酶切割(Stevens,2003,見上);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位點,其在Gln后通過遺傳工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,見上)。多核苷酸本發明還涉及分離的多核苷酸,其包含編碼本發明具有纖維素分解增強活性的多肽的核苷酸序列,或由該核苷酸序列組成。在優選的方面,核苷酸序列包含SEQIDNO1或由SEQIDNO=I組成。在另一更優選的方面,核苷酸序列包含大腸桿菌NRRLB-50087中所含質粒pSMail87中含有的序列,或由該序列組成。在另一優選的方面,核苷酸序列包含SEQIDNO:1的成熟多肽編碼序列或由SEQIDNO:1的成熟多肽編碼序列組成。在另一優選的方面,核苷酸序列包含SEQIDNO1的核苷酸58-811或由SEQIDNO1的核苷酸58-811組成。在另一更優選的方面,核苷酸序列包含大腸桿菌NRRLB-50087中所含質粒pSMail87中含有的成熟多肽編碼序列或由該成熟多肽編碼序列組成。本發明還包含編碼如下多肽的核苷酸序列,所述多肽包含SEQIDNO:2的氨基酸序列或其成熟多肽,或由SEQIDNO:2的氨基酸序列或其成熟多肽組成;由于遺傳密碼的簡并性,所述核苷酸序列不同于SEQIDNO:1或其成熟多肽編碼序列。本發明還涉及SEQIDNO:1的亞序列,所述亞序列編碼具有纖維素分解增強活性的SEQIDNO2的片段。本發明還涉及突變的多核苷酸,其在SEQIDNO1的成熟多肽編碼序列中包含至少一個突變或由具有至少一個突變的SEQIDNO:1的成熟多肽編碼序列組成,其中突變的核苷酸序列分別編碼SEQIDNO2的成熟多肽。用于分離或克隆編碼多肽的多核苷酸的技術是本領域內已知的,且包括從基因組DNA分離,從cDNA制備,或其組合。可通過例如使用熟知的聚合酶鏈式反應(PCR)或表達文庫的抗體篩選來檢測具有共有結構特性的克隆DNA片段,從而實現從這種基因組DNA克隆本發明的多核苷酸。參見,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸擴增方法,如連接酶鏈式反應(LCR)、連接活化轉錄(ligatedactivatedtranscription;LAT)和基于核苷酸序列的擴增(NASBA)。可以從毀絲霉屬菌株,或另外的或相關的生物體克隆所述多核苷酸,并且因此可以是例如所述核苷酸序列的多肽編碼區的等位基因變體或種變體(speciesvariant)。本發明還涉及分離的多核苷酸,其包含下述核苷酸序列或由其組成,所述核苷酸序列與SEQIDNO:1的成熟多肽編碼序列具有優選至少60%,更優選至少65%,更優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少96%、至少97%、至少98%或至少99%的同一性程度,所述多核苷酸編碼具有纖維素分解增強活性的多肽。修飾編碼本發明多肽的核苷酸序列對于合成與所述多肽基本上相似的多肽可為必需的。術語與所述多肽“基本上相似”指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩定性、最適PH等方面不同的人工變體。可以在作為SEQIDNO1的成熟多肽編碼序列存在的核苷酸序列,例如其亞序列的基礎上,和/或通過引入如下核苷酸取代來構建變體序列所述取代不產生由核苷酸序列編碼的多肽的另外的氨基酸序列,但是符合意欲產生酶的宿主生物體的密碼子選擇;或者所述取代可產生不同的氨基酸序列。關于核苷酸取代的概述,參見,例如,Ford等,1991,ProteinExpressionandPurification2一107。對于本領域技術人員顯而易見的是,這些取代能夠在對于分子功能重要的區域之外進行,并且仍然產生活性多肽。對于由本發明的分離的多核苷酸編碼的多肽活性關鍵的并且因此優選不進行取代的氨基酸殘基,可以根據本領域公知的方法,如定位誘變或丙氨酸分區誘變法(參見,例如,Cunningham和Wells,1989,見上)來鑒定。在后一技術中,將突變引入到分子中的每個荷正電的殘基處,并且測試所得突變分子的纖維素分解增強活性,以鑒定對于所述分子的活性關鍵的氨基酸殘基。底物_酶相互作用的位點也能夠通過分析三維結構測定,通過如核磁共振分析、晶體學或光親和標記這樣的技術來測定(參見,例如,deVos等,1992,見上;Smith等,1992,見上;Wlodaver等,1992,見上)。本發明還涉及編碼本發明多肽的分離的多核苷酸,所述分離的多核苷酸在非常低嚴緊條件下,優選低嚴緊條件,更優選中嚴緊條件,更優選中_高嚴緊條件,甚至更優選高嚴緊條件,并且最優選非常高的嚴緊條件下,與以下雜交(i)SEQIDNO:1的成熟多肽編碼序列,()包含于SEQIDNO1的成熟多肽編碼序列中的cDNA序列,或(iii)⑴或()的全長互補鏈,或它們的等位變體和亞序列(Sambrook等,1989,同上),如本文所定義的。在優選的方面,互補鏈是SEQIDNO:1的成熟多肽編碼序列的全長互補鏈。本發明還涉及通過如下獲得的分離的多核苷酸(a)在非常低、低、中、中-高、高或非常高嚴緊條件下,將DNA的群體與以下雜交(i)SEQIDNO:1的成熟多肽編碼序列,()包含于SEQIDNO1的成熟多肽編碼序列中含有的cDNA序列,或(iii)⑴或()的全長互補鏈;和(b)分離雜交的多核苷酸,其編碼具有纖維素分解增強活性的多肽。在優選的方面,所述互補鏈是SEQIDNO1的成熟多肽編碼序列的全長互補鏈。核酸構建體本發明還涉及包含本發明的分離的多核苷酸的核酸構建體,所述分離的多核苷酸與一個或多個(幾個)控制序列可操作地連接,所述控制序列在合適的宿主細胞中在與該控制序列相容的條件下指導編碼序列的表達。可以用許多方式操作編碼本發明多肽的分離的多核苷酸以供多肽的表達。依賴于表達載體,在將多核苷酸的序列插入載體之前對其進行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸序列的技術是本領域熟知的。控制序列可以是適當的啟動子序列,其是由用于表達編碼本發明多肽的多核苷酸的宿主細胞識別的核苷酸序列。啟動子序列含有介導多肽的表達的轉錄控制序列。啟動子可以是在所選的宿主細胞中顯示轉錄活性的任何核苷酸序列,包括突變的、截短的和雜合的啟動子,并且可以從編碼與宿主細胞同源或異源的胞外或胞內多肽的基因獲得。用于指導本發明的核酸構建體轉錄,特別是在細菌宿主細胞中轉錄的合適啟動子的實例是從下述獲得的啟動子大腸桿菌Iac操縱子、天藍鏈霉菌瓊脂糖酶基因(dagA)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌產麥芽淀粉酶基因(amyM)、解淀粉芽孢桿菌α_淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因和原核β-內酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),\)JsRtac(DeBoer1983,ProceedingsoftheNationalAcademyofSciencesUSA80:21—25)。另外的啟動子在〃Usefulproteinsfromrecombinantbacteria"于ScientificAmerican,1980,242:74_94中;和在Sambrook等,1989,見上中描述。用于指導本發明的核酸構建體在絲狀真菌宿主細胞中轉錄的合適啟動子的實例是從下列酶的基因獲得的啟動子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構酶、構巢曲霉乙酰胺酶、鑲片鐮孢淀粉葡糖苷酶(W000/56900)、鑲片鐮孢Daria(WC)00/56900)、鑲片鐮孢Quirm(W000/56900)、尖鐮孢胰蛋白酶樣蛋白酶(W096/00787)、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內切葡聚糖酶I、里氏木霉內切葡聚糖酶II、里氏木霉內切葡聚糖酶III、里氏木霉內切葡聚糖酶IV、里氏木霉內切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi啟動子(來自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸異構酶基因的啟動子的雜合體);和它們的突變的、截短的和雜合的啟動子。在酵母宿主中,有用的啟動子從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母半乳糖激酶(GALl)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)和釀酒酵母3-磷酸甘油酸激酶。對于酵母宿主細胞有用的其它啟動子由Romanos等,1992,Yeast8:423_488描述。控制序列也可以是合適的轉錄終止子序列,其是由宿主細胞識別以終止轉錄的序列。所述終止子序列與編碼所述多肽的核苷酸序列的3’末端可操作地連接。可以將在所選宿主細胞中有功能的任何終止子用在本發明中。對于絲狀真菌宿主細胞優選的終止子從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖鐮孢胰蛋白酶樣蛋白酶。對于酵母宿主細胞優選的終止子從如下酶的基因獲得釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶。對于酵母宿主細胞有用的其它終止子由Romanos等,1992,見上描述。控制序列還可以是合適的前導序列,其是對于宿主細胞的翻譯重要的mRNA非翻譯區。前導序列可操作地連接于編碼多肽的核苷酸序列的5’-末端。可以將在所選宿主細胞中有功能的任何前導序列用在本發明中。對于絲狀真菌宿主細胞優選的前導序列從如下酶的基因獲得米曲霉TAKA淀粉酶和構巢曲霉丙糖磷酸異構酶。對于酵母宿主細胞合適的前導序列從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)。控制序列也可以是聚腺苷酸化序列,其是與核苷酸序列的3,末端可操作地連接的序列,并且在轉錄時,宿主細胞將其識別為向轉錄的mRNA添加聚腺苷殘基的信號。可以將在所選宿主細胞中有功能的任何聚腺苷酸化序列在本發明中使用。對于絲狀真菌宿主細胞優選的聚腺苷酸化序列從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶樣蛋白酶和黑曲霉α-葡糖苷酶。對于酵母宿主細胞有用的聚腺苷酸化序列由Guo和Sherman,1995,MolecularCellularBiology15:5983_5990描述。控制序列還可以是信號肽編碼序列,其編碼與多肽的氨基末端相連的氨基酸序列,并且指導編碼的多肽進入細胞分泌途徑。核苷酸序列的編碼序列5’端可固有地包含信20號肽編碼序列,該信號肽編碼序列與編碼分泌多肽的編碼序列區段一起天然地連接在翻譯閱讀框中。或者,編碼序列5’端可含有對于所述編碼序列為外源的信號肽編碼序列。外源信號肽編碼序列在編碼序列不天然地含有信號肽編碼序列時可為必需的。或者,外源信號肽編碼序列可以簡單地取代天然信號肽編碼序列以增強多肽的分泌。然而,指導表達的多肽進入所選宿主細胞的分泌途徑(即,分泌至培養基中)的任何信號肽編碼序列可在本發明中使用。對于細菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列芽孢桿菌屬NCIB11837產麥芽糖淀粉酶、嗜熱脂肪芽孢桿菌α-淀粉酶、地衣芽孢桿菌枯草蛋白酶(subtilisin)、地衣芽孢桿菌β-內酰胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢桿菌prsA。另外的信號肽由Simonen和Palva,1993,MicrobiologicalReviews57109-137描述。對于絲狀真菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特異腐質霉纖維素酶、特異腐質霉內切葡聚糖酶V和疏棉狀腐質霉脂肪酶。對于酵母宿主細胞有用的信號肽從釀酒酵母α因子和釀酒酵母轉化酶的基因獲得。其它有用的信號肽編碼序列由Romanos等,1992,見上描述。在優選的方面,信號肽包含SEQIDNO2的氨基酸1至19或由SEQIDNO2的氨基酸1至19組成。在另一優選的方面,信號肽編碼序列包含SEQIDNO1的核苷酸1至57或由SEQIDNO1的核苷酸1至57組成。控制序列還可以是前肽編碼序列,其編碼位于多肽氨基末端的氨基酸序列。所得多肽稱為酶原(proenzyme)或前多肽(propolyp印tide)(或在某些情況下稱為酶原(zymogen))0前(多)肽通常是無活性的并且能夠通過從前多肽催化或自催化切割所述前肽而轉化為成熟活性多肽。可以從枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜熱毀絲霉漆酶(W095/33836)的基因獲得前肽編碼區。當信號肽和前肽序列二者均出現在多肽的氨基末端時,使前肽序列的位置緊接著(nextto)多肽氨基末端,并且使信號肽序列的位置緊接著前肽序列的氨基末端。同樣理想的是添加調節序列,其允許相對于宿主細胞的生長來調節多肽的表達。調節系統的實例是引起基因表達響應化學或物理刺激物,包括調節化合物的存在而開啟或關閉的那些系統。原核系統中的調節系統包括lac、tac和trp操縱基因系統。在酵母中,可以使用ADH2系統或GALl系統。在絲狀真菌中,可以使用TAKAα-淀粉酶啟動子、黑曲霉葡糖淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子作為調節序列。調節序列的其它實例是那些允許基因擴增的序列。在真核系統中,這些調節序列包括在氨甲蝶呤(methotrexate)存在下擴增的二氫葉酸還原酶基因,和以重金屬(withheavymetal)擴增的金屬硫蛋白基因。在這些情況下,編碼多肽的核苷酸序列與調節序列可操作地連接。表達載體本發明還涉及重組表達載體,所述重組表達載體包含本發明的多核苷酸、啟動子和轉錄和翻譯終止信號。本文所述的多種核酸和控制序列可以結合在一起以產生重組表達載體,所述表達載體可以包括一個或多個(幾個)方便的限制位點以允許在這些位點插入或取代編碼多肽的核苷酸序列。可供選擇的是,可以通過在適當的用于表達的載體中插入包含所述序列的核苷酸序列或核酸構建體來表達本發明的多核苷酸序列。在制備表達載體的過程中,將編碼序列置于載體中,從而將該編碼序列與適當的表達用控制序列可操作地連接。重組表達載體可以是任何載體(例如,質粒或病毒),其能夠方便地進行重組DNA步驟,并且能夠產生核苷酸序列的表達。載體的選擇將通常依賴于載體與將引入該載體的宿主細胞的相容性。載體可以是線狀或閉合環狀質粒。載體可以是自主復制載體,即,作為染色體外實體(entity)存在的載體,其復制獨立于染色體復制,例如,質粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復制的手段(means)。或者,載體可以是一種當被引入宿主細胞中時,整合到基因組中并且與整合了該載體的染色體一起復制的載體。此外,可以使用單獨的載體或質粒或兩個或更多個載體或質粒,其共同含有待引入宿主細胞基因組的完整DNA(totalDNA),或可以使用轉座子(transposon)。本發明的載體優選地含有一個或多個(幾個)選擇性標記,其允許簡單選擇經轉化、轉染、轉導等的細胞。選擇性標記是基因,其產物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養缺陷型的原養性(prototrophytoauxotrophs)等。細菌選擇性標記的實例是來自枯草芽孢桿菌或地衣芽孢桿菌的dal基因,或賦予抗生素抗性的標記,所述抗生素抗性如氨芐青霉素、卡那霉素、氯霉素或四環素抗性。對于酵母宿主細胞合適的標記是ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于絲狀真菌宿主細胞的選擇性標記包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰基轉移酶)、bar(草銨膦(phosphinothricin)乙酰轉移酶)、hph(潮霉素磷酸轉移酶)、niaD(硝酸還原酶)(nitratereductase)、pyrG(乳清酸核苷-5,-磷酸脫羧酶)(orotidine-5,-phosphatedecarboxylase)、sC(硫酸腺苷酰轉移酶)和trpC(鄰氨基苯甲酸合酶(anthranilatesynthase))以及它們的等價物。優選用在曲霉屬細胞中的是構巢曲霉或米曲霉的amdS和pyrG基因禾口吸水鏈霄菌(Streptomyceshygroscopicus)的bar基因。本發明的載體優選含有元件,其允許載體整合入宿主細胞基因組或允許載體在細胞中獨立于基因組自主復制。為了整合入宿主細胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件。或者,載體可以含有額外的核苷酸序列,用于指導通過同源重組整合入宿主細胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應優選含有足夠數量的核酸,如100至10,000堿基對,優選400至10,000堿基對,并且最優選800至10,000堿基對,其與相應的目標序列具有高度同一性以增強同源重組的概率。整合元件可以是任何序列,其與宿主細胞基因組中的目標序列同源。此外,整合元件可以是非編碼或編碼的核苷酸序列。另一方面,可以將載體通過非同源重組整合到宿主細胞的基因組中。為了自主復制,載體可以還包含復制起點,其使載體能夠在所述的宿主細胞中自主地復制。復制起點可以是介導自主復制的任何質粒復制子(r印licator),其在細胞中發揮功能。術語“復制起點”或“質粒復制子”在本文定義為能夠使質粒或載體體內復制的核苷酸序列。細菌復制起點的實例是允許在大腸桿菌中復制的質粒pBR322、pUC19、pACYC177和pACYC184的復制起點,和允許在芽孢桿菌中復制的質粒pUB110、pE194、pTA1060和ρΑΜβ1的復制起點。用于酵母宿主細胞中的復制起點的實例是2微米復制起點,ARSl,ARS4,ARSl和CEN3的組合,和ARS4和CEN6的組合。在絲狀真菌細胞中有用的復制起點的實例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch159163-9175;WO00/24883)。分離AMAl基因和構建包含該基因的質粒或載體能夠根據公開于WO00/24883中的方法完成。可以將多于一個拷貝的本發明的多核苷酸插入宿主細胞以增加基因產物的產生。多核苷酸拷貝數的增加可通過如下方法獲得將至少一個額外拷貝的序列整合入宿主細胞基因組,或將可擴增的選擇性標記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養細胞來選擇含有選擇性標記基因的擴增拷貝,從而也含有多核苷酸的額外拷貝的細胞。用于連接上述元件以構建本發明的重組表達載體的方法是本領域技術人員熟知的(參見,例如,Sambrook等,1989,見上)。宿主細胞本發明還涉及重組宿主細胞,其包含本發明的分離的多核苷酸,將所述重組宿主細胞有利地用于多肽的重組產生。將包含本發明的多核苷酸的載體引入宿主細胞從而將所述載體作為染色體整合體或作為自復制的染色體外載體保持,如前文所述。術語“宿主細胞”包含親本細胞的任何子代,其因為在復制過程中發生的突變而與該親本細胞不同。宿主細胞的選擇在很大程度上會依賴于編碼多肽的基因及其來源。宿主細胞可以是在本發明的多肽的重組產生中有用的任何細胞,例如,原核或真核細胞。原核宿主細胞可以是任何革蘭氏陽性細菌或革蘭氏陰性細菌。革蘭氏陽性細菌包括但不限于,芽孢桿菌屬、鏈球菌屬、鏈霉菌屬、葡萄球菌屬、腸球菌屬、乳桿菌屬、乳球菌屬、梭菌屬、地芽孢桿菌屬和海洋芽孢桿菌屬。革蘭氏陰性細菌包括但不限于,大腸桿菌、假單胞菌屬、沙門氏菌屬、彎曲桿菌屬、螺桿菌屬、黃桿菌屬、梭桿菌屬、泥桿菌屬、奈瑟氏菌屬和脲原體屬。細菌宿主細胞可以是任何芽孢桿菌細胞。在本發明的實施中有用的芽孢桿菌屬細胞包括但不限于,嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環狀芽孢桿菌、克勞氏芽孢桿菌、凝結芽孢桿菌、堅強芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌細胞。在優選的方面,細菌宿主細胞是解淀粉芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪芽孢桿菌或枯草芽孢桿菌細胞。在更優選的方面,細菌宿主細胞是解淀粉芽孢桿菌細胞。在另一個更優選的方面,細菌宿主細胞是克勞氏芽孢桿菌細胞。在另一個更優選的方面,細菌宿主細胞是地衣芽孢桿菌細胞。在另一個更優選的方面,細菌宿主細胞是枯草芽孢桿菌細胞。細菌宿主細胞還可以是任何鏈球菌屬細胞。在本發明的實施中有用的鏈球菌屬細胞包括但不限于,似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌和馬鏈球菌獸瘟亞種細胞。在優選的方面,細菌宿主細胞是似馬鏈球菌細胞。在另一個優選的方面,細菌宿主細胞是釀膿鏈球菌細胞。在另一個優選的方面,細菌宿主細胞是乳房鏈球菌細胞。在另一個優選的方面,細菌宿主細胞是馬鏈球菌獸瘟亞種細胞。細菌宿主細胞還可以是任何鏈霉菌屬細胞。在本發明的實施中有用的鏈霉菌屬細胞包括但不限于,不產色鏈霉菌、除蟲鏈霉菌、天藍鏈霉菌、灰色鏈霉菌和淺青紫鏈霉菌細胞。在優選的方面,細菌宿主細胞是不產色鏈霉菌細胞。在另一個優選的方面,細菌宿主細胞是除蟲鏈霉菌細胞。在另一個優選的方面,細菌宿主細胞是天藍鏈霉菌細胞。在另一個優選的方面,細菌宿主細胞是灰色鏈霉菌細胞。在另一個優選的方面,細菌宿主細胞是淺青紫鏈霉菌細胞。可通過如下方法實現將DNA引入到芽孢桿菌屬細胞例如原生質體轉化(參見,例如,Chang和Cohen,1979,MolecularGeneralGenetics168:111_115),使用感受態細胞(參見,例如,Young和Spizizen,1961,JournalofBacteriology81:823_829或Dubnau禾口Davidoff-Abelson,1971,JournalofMolecularBiology56:209_221),電穿孑L(參見,例如,Shigekawa禾口Dower,1988,Biotechniques6742-751)或接合(參見,例如,Koehler和Thorne,1987,JournalofBacteriologyl69:5271_5278)。可通過如下方法實現將DNA引入到大腸桿菌細胞例如原生質體轉化(參見,例如,Hanahan,1983,J.Mol.Biol.166557-580)或電穿孑L(參見,例如,Dower等,1988,NucleicAcidsRes.16:6127_6145)。可通過如下方法實現將DNA引入到鏈霉菌屬細胞例如原生質體轉化和電穿孔(參見,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399_405),接合(參見,例如,Mazodier等,1989,J.Bacteriol.171:3583_3585),或轉導(參見,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98=6289-6294)。可通過如下方法實現將DNA引入到假單胞菌屬細胞例如電穿孔(參見,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(參見,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51_57)。可通過如下方法實現將DNA引入到鏈球菌屬細胞例如天然感受態(naturalcompetence)(參見,例如,Perry和Kuramitsu,1981,Infect.Immun.32:1295_1297),原生質體轉化(參見,例如,Catt和Jollick,1991,Microbios.68189-207),電穿孔(參見,例如,Buckley等,1999,Appl.Environ.Microbiol.653800-3804)或接合(參見,例如,Clewell,1981,Microbiol.Rev.45409-436)。然而,可以使用任何本領域已知的將DNA引入宿主細胞的方法。宿主細胞還可以是真核生物,如哺乳動物、昆蟲、植物或真菌細胞。在優選的方面,宿主細胞是真菌細胞。“真菌”用在本文包括以下門子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)禾口接合菌門(Zygomycota)(如由Hawksworth等,于AinsworthandBisby'sDictionaryofTheFungi,第八版,1995,CABInternational,UniversityPress,Cambridge,UK中所定義)以及卵菌門(Oomycota)(如Hawksworth等,1995,見上,171頁中所引用),和所有有絲分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,見上)。在更優選的方面,真菌宿主細胞是酵母細胞。“酵母”用在本文包括產子囊酵母(ascosporogenousyeast)(內抱霉目(Endomycetales))、產擔子酵母(basidiosporogenousyeast)禾口屬于半知菌類(FungiImperfecti)(芽抱綱(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發明而言,會將酵母定義為如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,禾口Davenport,R.R.編,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。在甚至更加優選的方面,酵母宿主細胞是假絲酵母屬、漢遜酵母屬(Hansenula)、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬細胞。在最優選的方面,酵母宿主細胞是卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母或卵形酵母細胞。在另一個最優選的方面,酵母宿主細胞是乳酸克魯維酵母(Kluyveromyceslactis)細胞。在另一個最優選的方面,酵母宿主細胞是解脂西洋蓍霉(Yarrowialipolytica)細胞。在另一個更優選的方面,真菌宿主細胞是絲狀真菌細胞。“絲狀真菌”包括真菌門(Eumycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復雜多糖組成的菌絲體壁。通過菌絲延伸進行營養生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養生長通過單細胞菌體的出芽生殖(budding)進行,而碳分解代謝可以是發酵的。在甚至更優選的方面,絲狀真菌宿主細胞是枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、Ceriporiopsis、金孢子菌屬、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬、Filibasidium、鐮孢屬、腐質霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬、射脈菌屬(Phlebia)、瘤胃壺菌屬、側耳屬(Pleurotus)、裂褶菌屬、踝節菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細胞。在最優選的方面,絲狀真菌宿主細胞是泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉或米曲霉細胞。在另一個最優選方面,絲狀真菌宿主細胞是桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢細胞。在另一個最優選的方面,絲狀真菌宿主細胞是黑刺■i胃(Bjerkanderaadusta)ΛCeriporiopsisaneirina、Ceriporiopsisaneirina、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrufa、Ceriporiopsissubvermispora、口譽角質金抱子菌、Cgrysosporiumlucknowense、熱帶金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌、ChrysosporiumqueenslandicumΛChrysosporiumzonatum、灰蓋鬼傘(Coprinuscinereus)、毛革蓋菌(Coriolushirsutus)、特異腐質霉、疏棉狀腐質霉、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、產紫青霉、黃孢平革菌(Phmerochaetechrysosporium)、福身寸身寸脈菌(Phlebiaradiata)、剌序側耳(Pleurotuseryngii)、土生梭抱霉、Trametesvillosa、Trametesversicolor、哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉細胞。可以將真菌細胞通過涉及原生質體形成、原生質體轉化和細胞壁重建的方法以本身公知的方式轉化。用于轉化曲霉屬和木霉屬宿主細胞的合適方法在EP238023和Yelton^,1984,ProceedingsoftheNationalAcademyofSciencesUSA811470-1474中描述。用于轉化鐮孢屬菌種的合適方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文獻描述的方法轉化酵母=Becker和Guarente,于Abelson,J.N.禾口Simon,Μ.I.編,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,182-187頁,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriology153:163;禾口Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920o產生方法本發明還涉及產生本發明多肽的方法,其包括(a)在有益于產生多肽的條件下培養細胞,所述細胞以其野生型形式產生所述多肽;和(b)回收所述多肽。在優選的方面,所述細胞是毀絲霉屬的。在更優選的方面,所述細胞是嗜熱毀絲霉。在最優選的方面,所述細胞是嗜熱毀絲霉CBS202.75。在另一個最優選的方面,所述細胞是嗜熱毀絲霉CBS117.65。本發明還涉及產生本發明的多肽的方法,其包括(a)在有益于產生多肽的條件下培養如本文所述的重組宿主細胞;和(b)回收所述多肽。本發明還涉及產生本發明的多肽的方法,包括(a)在有益于產生多肽的條件下培養重組宿主細胞,其中所述宿主細胞包含突變核苷酸序列,其在SEQIDNO:1的成熟多肽編碼序列中具有至少一個突變,其中所述突變核苷酸序列編碼多肽,所述多肽包含SEQIDNO2的成熟多肽或由SEQIDNO2的成熟多肽組成,和(b)回收所述多肽。在本發明的產生方法中,使用本領域熟知的方法在適合于產生所述多肽的營養培養基中培養細胞。例如,可以通過在合適培養基中和允許表達和/或分離所述多肽的條件下進行的搖瓶培養,和實驗室或工業發酵罐中的小規模或大規模發酵(包括連續、分批、補料分批或固態發酵)來培養細胞。使用本領域已知的方法在合適的營養培養基中進行培養,所述營養培養基包含碳源和氮源和無機鹽。合適的培養基能夠從商業供應商獲得或可以根據公開的組成制備(例如,在美國典型培養物保藏中心的目錄中)。如果多肽分泌到營養培養基中,該多肽能夠從所述培養基中直接回收。如果多肽不分泌到培養基中,其能夠從細胞裂解物(Iysate)回收。可以使用本領域已知的對于所述多肽是特異性的方法來檢測多肽。這些檢測方法可包括特異性抗體的使用、酶產物的形成或酶底物的消失。例如,酶試驗(enzymeassay)可用于測定如本文所述的多肽的活性。所得多肽可以使用本領域已知的方法回收。例如,多肽可以通過常規方法從營養培養基中回收,所述常規方法包括但不限于離心、過濾、提取、噴霧干燥、蒸發或沉淀。本發明的多肽可以通過多種本領域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(pr印arative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS_PAGE或提取(參見,例如,ProteinPurification,J.-C.Janson禾口LarsRyden編,VCHPublishers,NewYork,1989)。植物本發明還涉及植物,例如,轉基因植物、植物部分或植物細胞,其包含分離的多核苷酸,所述多核苷酸編碼本發明具有纖維素分解增強活性的多肽,從而以可回收的量表達和產生所述多肽。多肽可從植物或植物部分回收。或者,同樣可以將含有該重組多肽的植物或植物部分用于改進食品或飼料的質量,例如,改進營養價值、適口性(palatability)和流變性質(rheologicalproperties),或用于破壞抗營養因子。轉基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實例是草(grasses),如草地早熟禾(meadowgrass)(藍草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperategrass),如Agrostis(剪股穎屬);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。雙子葉植物的實例是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和緊密相關的模型生物體擬南芥(Arabidopsisthaliana)。植物部分的實例是莖(stem)、愈傷組織(callus)、葉(leaf),^(root)、果實(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細胞區室(compartments),如葉綠體(chloroplast)、質夕卜體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)和細胞質(cytoplasm)也被認為是植物部分。此外,任何植物細胞,無論什么組織來源,都被認為是植物部分。同樣地,植物部分,如為了促進本發明的應用而分離的具體組織和細胞也被認為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)0同樣包含于本發明范圍內的還有這些植物、植物部分和植物細胞的子代。表達本發明多肽的轉基因植物或植物細胞可以依照本領域已知方法構建。簡而言之,通過如下方法構建所述植物或植物細胞將編碼本發明多肽的一個或多個(幾個)表達構建體并入植物宿主基因組或葉綠體基因組,并且將所得的修飾植物或植物細胞繁殖為轉基因植物或植物細胞。表達構建體便利地是包含編碼本發明多肽的多核苷酸的核酸構建體,所述多核苷酸與在選擇的植物或植物部分中表達該核苷酸序列所需的適當的調節序列可操作地連接。此外,表達構建體可以包含對于鑒定在其中整合了該表達構建體的宿主細胞有用的選擇性標記和將該構建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。調節序列的選擇,例如啟動子和終止子序列和任選地信號或轉運序列的選擇,舉例來說,基于期望何時、何處以及如何表達多肽而確定。例如,編碼本發明多肽的基因的表達可以是組成型的或誘導型的,或可以是發育、階段或組織特異性的,并且基因產物可以靶向特定的組織或植物部分例如種子或葉。調節序列由例如Tague等,1988,PlantPhysiology86:506所述。對于組成性表達,可以使用35S_CaMV、玉米泛素1和稻肌動蛋白1啟動子(Franck等,1980,Cell21:285_294,Christensen等,1992,PlantMo.Biol.18:675_689;Zhang等,1991,PlantCell3:1155_1165)。器官特異性啟動子可以是例如來自貯藏庫組織(storagesinktissue)例如種子、馬鈴薯塊蓮和果實的啟動子(EdwardsandCoruzzi,1990,Ann.Rev.Genet.24:275_303),或來自代謝庫組織(metabolicsinktissue)例如分生組織的啟動子(Ito等,1994,PlantMol.Biol.24:863_878),種子特異性啟動子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動子(Wu等,1998,PlantandCellPhysiology39:885_889),來自豆球蛋白(Iegumin)B4和蠶豆(Viciafaba)的未知種子蛋白基因的蠶豆啟動子(Conrad等,1998,JournalofPlantPhysiology152:708_711)、來自種子油體蛋白(oilbodyprotein)的啟動子(Chen等,1998,PlantandCellPhysiology39:935_941),來自歐洲油菜(Brassicanapus)的貯藏蛋白napA啟動子,或本
技術領域:
公知的任何其它種子特異性的啟動子,例如,在TO91/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或番茄的rbcs啟動子(Kyozuka等,1993,PlantPhysiology102:991_1000),小球藻病毒(chlorellavirus)腺嘌呤甲基轉移酶(adeninemethyltransferase)基因啟動子(Mitra和Higgins,1994,PlantMolecularBiology26:85_93),或來自稻的aldP基因啟動子(Kagaya等,1995,MolecularandGeneralGenetics248:668_674),或傷口誘導的啟動子,如馬鈴薯pin2啟動子(Xu等,1993,PlantMolecularBiology22:573-588)。同樣地,所述啟動子可通過非生物的處理誘導,所述非生物的處理諸如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動子的物質誘導,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脫落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金屬。啟動子增強子元件也可以用于實現本發明多肽在植物中的較高表達。例如,啟動子增強子元件可以是內含子,其置于啟動子和編碼本發明多肽的核苷酸序列之間。例如Xu等,1993,見上,公開了使用稻肌動蛋白1基因的第一內含子以增強表達。選擇性標記基因和表達構建體的任何其它部分可以選自本領域內可用的那些。將核酸構建體根據本領域已知的常規技術并入植物基因組,所述常規技術包括土壤桿菌屬(Agrobacterium)介導的轉化、病毒介導的轉化、顯微注射(microinjection)、粒子轟擊、生物射彈轉化和電穿孔(Gasser等,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤桿菌(Agrobacteriumtumefaciens)介導的基因轉移(genetransfer),是產生轉基因雙子葉植物的優選方法(為了參考,見Hooykas和Schilperoort,1992,PlantMolecularBiology19:15_38),而且它也可以用于轉化單子葉植物,雖然對于這些植物常常使用其它的轉化方法。目前,產生轉基因單子葉植物的優選的方法,是用粒子(用轉化DNA涂覆的微觀的金或鎢粒子)轟擊胚愈傷組織(embryoniccalli)或發育中的胚(developingembryos)(Christou,1992,PlantJournal2:275-281;Shimamoto,1994,CurrentOpinionBiotechnology5158-162;Vasil等,1992,Bio/Technology10:667_674)。轉化單子葉植物的可供選擇的方法是基于原生質體轉化,如由Omirulleh等,1993,PlantMolecularBiology21:415_428所描述的。轉化之后,根據本領域熟知的方法選擇并入了表達構建體的轉化體并且再生成為完整植株。通常設計轉化方法用于通過如下方法在再生期間或在后續世代中選擇性消除選擇基因例如,使用帶有兩種獨立的T-DNA構建體的共轉化或通過特異性重組酶位點特異性地切除選擇基因。本發明還涉及產生本發明多肽的方法,其包括(a)在有益于產生多肽的條件下培養包含多核苷酸的轉基因植物或植物細胞,所述多核苷酸編碼本發明具有纖維素分解增強活性的多肽;和(b)回收所述多肽。去除或減少纖維素分解增強活性本發明還涉及產生親本細胞突變體的方法,其包括破壞或缺失編碼本發明的多肽的多核苷酸序列或其部分,這導致在相同條件下培養時,與親本細胞相比突變的細胞產生較少的所述多肽。可以使用本領域熟知的方法通過減少或消除編碼本發明多肽的核苷酸序列的表達來構建突變細胞,所述方法例如,插入、破壞、替代或缺失。在優選的方面,所述核苷酸序列是被失活的。待修飾或失活的核苷酸序列可以是,例如,編碼區或其中對活性關鍵的部分,或表達編碼區所需的調節元件。這種調節或控制序列的實例可以是啟動子序列或其功能部分,即,足以影響核苷酸序列表達的部分。用于可能的修飾的其它控制序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、信號肽序列、轉錄終止子和轉錄激活子。核苷酸序列的修飾或失活可以通過向親本細胞施以誘變,并且選擇其中已將所述核苷酸序列的表達減少或消除的突變細胞來進行。誘變可能是特異性的或隨機的,可以通過例如使用合適的物理或化學誘變劑進行,通過使用合適的寡核苷酸進行,或通過將所述DNA序列進行PCR產生的誘變。此外,可以通過使用這些誘變劑的任何組合來進行誘變。適合于本發明目的的物理或化學誘變劑的實例包括紫外線(UV)照射、羥胺、N-甲基-N'-硝基-N-亞硝基胍(MNNG)、0_甲基羥胺、亞硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亞硫酸氫鈉、甲酸和核苷酸類似物。當使用這些試劑時,通常通過如下方法來進行所述誘變在合適條件下存在優選的誘變劑時溫育待誘變的親本細胞,并篩選和/或選擇顯示基因表達減少的或無基因表達的突變體細胞。通過導入、取代或去除基因中的一個或多個(幾個)核苷酸或其轉錄或翻譯所需的調節元件可以實現所述核苷酸序列的修飾或失活。例如,可以插入或去除核苷酸從而導致引入終止密碼子,去除起始密碼子,或改變開放閱讀框。按照本領域已知的方法通過定位誘變或PCR產生的誘變可以實現這種修飾或失活。盡管在理論上所述修飾可以在體內進行,即,直接對表達待修飾核苷酸序列的細胞進行,但優選如下面所示例的那樣在體外進行所述修飾。消除或減少核苷酸序列通過細胞表達的便利方式的例子是基于基因替代,基因缺失,或基因破壞的技術。例如,在基因破壞方法中,將相應于內源核苷酸序列的核酸序列在體外進行誘變以產生缺陷性的核酸序列,隨后將其轉化入親本細胞中以產生缺陷基因。通過同源重組,所述缺陷性核酸序列替代了內源性核苷酸序列。可能理想的是所述缺陷性核苷酸序列還編碼標記,其可用于選擇其中核苷酸序列被修飾或破壞的轉化子。在特別優選的方面,用可選擇的標記(如本文所述的那些)來破壞所述核苷酸序列。或者,可以使用與所述核苷酸序列互補的序列通過確定的反義或RNAi技術來進行所述核苷酸序列的修飾或失活。更具體地,通過導入與所述基因的核苷酸序列互補的序列可以減少或消除所述核苷酸序列通過細胞的表達,所述互補序列可以在細胞中轉錄并且能夠與細胞中產生的mRNA雜交。在允許所述互補反義核苷酸序列與mRNA雜交的條件下,由此減少或消除翻譯的蛋白質的量。本發明進一步涉及親本細胞的突變體細胞,其包含編碼多肽的核苷酸序列或其控制序列的破壞或缺失,這導致與親本細胞相比突變體細胞產生更少的多肽或不產生多肽。這樣生成的多肽缺陷型突變體細胞作為表達天然和/或異源多肽的宿主細胞特別有用。所以,本發明進一步涉及產生天然或異源多肽的方法,其包括(a)在有益于產生多肽的條件下培養突變細胞;和(b)回收所述多肽。術語“異源多肽”在本文中定義為對宿主細胞不是天然的多肽,進行了修飾以改變天然序列的天然蛋白,或作為通過重組DNA技術對宿主細胞操作的結果其表達在量上改變的天然蛋白。在另一方面,本發明涉及通過發酵產生本發明的多肽以及目標蛋白產物的細胞來生產基本上無纖維素分解增強活性的蛋白質產物的方法,通過在發酵之前、之中或發酵完成之后向發酵液(fermentationbroth)中添加有效量的能夠抑制纖維素分解增強活性的試劑,從發酵液中回收目標產物,并且任選地將回收的產物進行進一步純化。在另一方面,本發明涉及如下生產基本上無纖維素分解增強活性的蛋白質產物的方法在允許產物表達的條件下培養細胞,將得到的培養液進行組合的PH和溫度處理以實質上(substantially)減少纖維素分解增強活性,和從發酵液中回收產物。或者,可以將從培養液回收的酶制備物進行組合的PH和溫度處理。所述組合的PH和溫度處理可任選地與內切葡聚糖酶抑制劑處理組合使用。依照本發明的這個方面,可能去除至少60%,優選至少75%,更優選至少85%,還更優選至少95%,并且最優選至少99%的纖維素分解增強活性。可使用此方法獲得纖維素分解增強活性的完全去除。組合的pH和溫度處理優選在2-4或9-11范圍內的pH和至少60_70°C范圍內的溫度進行一段足夠的時間以達到期望的效果,通常30至60分鐘是足夠的。用于培養和純化感興趣的產物的方法可以通過本領域已知的方法進行。本發明用于產生基本上無纖維素分解增強性的產物的方法在真核多肽,特別是真菌蛋白質例如酶的產生中是特別令人有興趣的。所述酶可以選自,例如,淀粉分解酶(anxiolyticenzyme)、脂肪分解酶、蛋白水解酶、纖維素分解酶(cellulolyticenzyme)、氧化還原酶或植物細胞壁降解酶。這些酶的實例包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、幾丁質酶(chitinase)、角質酶(cutinase)、環糊精糖基轉移酶、脫氧核糖核酸酶、內切葡聚糖酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、商素過氧化酶、半纖維素酶、轉化酶、異構酶、漆酶、連接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉移酶、轉谷氨酰胺酶或木聚糖酶。纖維素分解增強缺陷細胞(cellulolyticenhancing-deficientcell)也可以用于表達在制藥上引起興趣的異源蛋白如激素、生長因子、受體等。可理解的是術語“真核多肽”不僅包括天然多肽,也包括通過氨基酸取代、缺失或添加或其它這樣的修飾而被修飾以增強活性、熱穩定性、PH耐受性等的多肽,例如酶。在另外的方面,本發明涉及基本上無纖維素分解增強活性的蛋白質產物,其是通過本發明的方法產生的。抑制多肽表達的方法
技術領域:
:本發明還涉及抑制具有纖維素分解增強活性的多肽在細胞中表達的方法,其包括對所述細胞施用雙鏈RNA(dsRNA)分子或者在所述細胞中表達雙鏈RNA(dsRNA)分子,其中所述dsRNA包含本發明多核苷酸的亞序列。在優選的方面,dsRNA長約15、16、17、18、19、20、21、22、23、24、25或更多的雙鏈體核苷酸。dsRNA優選是小干擾RNA(siRNA)或微RNA(miRNA)。在優選的方面,dsRNA是用于抑制轉錄的小干擾RNA(siRNA)。在另一優選的方面,dsRNA是用于抑制翻譯的微RNA(miRNA)。本發明還涉及這樣的雙鏈RNA(dsRNA)分子,其包含SEQIDNO1成熟多肽編碼序列的部分,用于抑制細胞中的多肽表達。雖然本發明不受限于任何特定作用機制,但dsRNA能進入細胞,并引起相似或相同序列的單鏈RNA(ssRNA)的降解,所述RNA包括內源mRNA。當細胞接觸dsRNA時,來自同源基因的mRNA選擇性地受到稱為RNA干擾(RNAi)的過程的降解。本發明的dsRNA可以用于基因沉默療法。在一個方面,本發明提供使用本發明的dsRNAi選擇性地降解RNA的方法。所述方法可以在體外、回體(exvivo)或在體內進行。在一個方面,dsRNA分子能夠用于在細胞、器官或動物中產生功能喪失突變(loss-of-functionmutation)。制備和使用選擇性降解RNA的dsRNA分子的方法在本領域中公知,參見,例如,美國專利號6,506,559;美國專利號6,511,824;美國專利號6,515,109;和美國專利號6,489,127。組合物本發明還涉及包含本發明的多肽的組合物。優選地,所述組合物富含這種多肽。術語“富含”表示所述組合物的纖維素分解增強活性得到了增加,例如,以至少1.1的富集因數(enrichmentfactor)±曾力口。所述組合物可以包含本發明的多肽作為主要酶成分,例如,單成分組合物。或者,所述組合物可以包含多種酶活性,例如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、鹵素過氧化物酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠分解酶、肽谷氨酰胺酶(ρ印tidoglutaminase)、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶或木聚糖酶。額外的酶可以通過例如屬于以下屬或種的微生物產生曲霉屬,優選棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉或米曲霉;鐮孢屬,優選桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢;腐質霉屬,優選特異腐質霉或疏棉狀腐質霉;或木霉屬,優選哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木毒ο可以依照本領域內已知的方法制備多肽組合物,并且可以是液體或干組合物的形式。例如,所述多肽組合物可以是顆粒(granulate)或微粒(microgranulate)的形式。可以依照本領域內已知方法將包括于所述組合物中的多肽穩定化。下面給出的是本發明多肽組合物的優選用途的實例。本發明的多肽組合物的劑量和使用該組合物的其它條件可以基于本領域內已知的方法確定。纖維素材料的加工本發明還涉及供降解或轉化纖維素材料的方法,包括用纖維素分解酶組合物在本發明的具有纖維素分解增強活性的多肽存在的情況下處理所述纖維素材料。在優選的方面,所述方法進一步包括回收經降解或轉化的纖維素材料。本發明還涉及產生發酵產物的方法,包括(a)用纖維素分解酶組合物在本發明的具有纖維素分解增強活性的多肽存在的情況下糖化纖維素材料;(b)用一種或多種發酵微生物發酵經糖化的步驟(a)的纖維素材料以產生發酵產物;以及(c)從發酵回收發酵產物。本發明還涉及發酵纖維素材料的方法,包括用一種或多種發酵微生物發酵所述纖維素材料,其中將所述纖維素材料用纖維素分解酶組合物在本發明具有纖維素分解增強活性的多肽存在下進行糖化,且所述具有纖維素分解增強活性的多肽的存在與該具有纖維素分解增強活性的多肽不存在時相比較,增加了所述纖維素材料的降解。在優選的方面,所述纖維素材料的發酵產生發酵產物。在另一個優選的方面,所述方法進一步包括從發酵回收所述發酵產物。包含所述具有纖維素分解增強活性的多肽的組合物可以以細胞移除或不移除的粗發酵液的形式,或以經半純化或純化的酶制備物的形式存在,或者所述組合物可包含本發明的宿主細胞在用生物質進行的發酵工藝中作為具有纖維素分解增強活性的多肽的來源。本發明的方法可用于將纖維素材料糖化成為可發酵的糖,并將該可發酵的糖轉化為多種有用的物質,例如,化學品與燃料。自纖維素材料產生所期望的發酵產物通常涉及預處理,酶水解(糖化)與發酵。根據本發明對所述纖維素材料的加工可使用本領域常規方法達成。此外,本發明的方法可使用任何經配置以依照本發明運轉的常規生物質加工設備加以實施。分別或同時的水解(糖化)與發酵包括但不僅限于分別水解與發酵(SHF);同時糖化與發酵(SSF);同時糖化與共發酵(SSCF);混合水解與發酵(HHF);SHCF(分別水解與共發酵);HHCF(混合水解與共發酵(hybridhydrolysisandcofermentation)),以及直接微生物轉化(DMC)。SHF使用分開的過程步驟以首先將木素纖維素酶水解為可發酵的糖,例如,葡萄糖,纖維二糖,纖維三糖與戊糖,并隨即將所述可發酵的糖發酵為乙醇。在SSF中,木素纖維素的酶水解,以及糖發酵為乙醇合并為一步(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,((HandbookonBioethanolProductionandUtilization》,Wyman,C.E.編輯,Taylor&Francis,Washington,DC,179-212)。SSCF涉及多種糖類的共發酵(Sheehan,J.,andHimmel,Μ.,1999,Enzymes,energyandtheenvironment:AstrategicperspectiveontheU.S.DepartmentofEnergy'sresearchanddevelopmentactivitiesforbioethanol,Biotechnol·Prog·15:817_827)。HHF涉及分別的水解分離步驟,并另外涉及同時的糖化與水解步驟,其可在同一個反應器中進行。在HHF過程中的步驟可在不同溫度下進行,亦即,高溫酶糖化繼以在較低的、發酵菌株可容忍的溫度下的SSF。DMC將所有三個過程(酶產生,木素纖維素水解與發酵)合并于一個或多個步驟,其中使用相同生物體來產生酶以供將木素纖維素轉化為可發酵的糖并將所述可發酵的糖轉化為終產物(Lynd,L.R.,ffeimer,P.J.,vanZyl,ff.H.,andPretorius,I.S.,2002,Microbialcelluloseutilization!Fundamentalsandbiotechnology,Microbiol.Mol.Biol.Reviews66:506-577)。在本文中應理解本領域任何包括預處理,酶水解(糖化),發酵或其組合的已知方法可用于實施本發明的方法。常規設備可包括分批補料攪拌反應器(fed-batchstirredreactor),分批攪拌反應器(batchstirredreactor),帶超濾的連續流動攪拌反應器(continuousflowstirredreactorwithultrafiltration)和/或連續的活塞流柱式反應器(continuousplug-flowcolumnreactor)(FernandadeCastilhosCorazza,FlavioFariadeMoraes,GisellaMariaZaninandIvoNeitzel,2003,Optimalcontrolinfed-batchreactorforthecellobiosehydrolysis,ActaScientiarum.Technology25:33_38;Gusakov,A.V.,andSinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose1.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7:346_352),磨胃反(anattritionreactor)(Ryu,S.K.,andLee,J.M.,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.25:53_65),或者帶有由電磁場誘導的劇烈攪拌的反應器(areactorwithintensivestirringinducedbyanelectromagneticfield)(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,0.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,Appl.Biochem.Biotechnol.56:141_153)。其他類型的反應器包括流化床(fluidizedbed)、上流床(upflowblanket)、固定化的以及擠壓器(extruder)類型反應器以供水解和/或發酵。預處理在實施本發明的方法時,本領域已知的任何預處理過程可用于破壞植物細胞壁組分。所述纖維素材料還可在預處理之前使用本領域已知方法對其進行預浸(pre-soaking),潤濕(wetting),或調理(conditioning)。常規預處理包括但不限于,蒸汽預處理(爆炸或不爆炸),稀酸預處理,熱水預處理,石灰預處理,濕氧化,濕爆炸,氨纖維爆炸,有機溶劑預處理以及生物預處理。其它預處理包括超聲,電穿孔,微波,超臨界CO2,超臨界H2O,與氨滲濾預處理。所述纖維素材料可在水解和/或發酵前進行預處理。預處理優選在水解前進行。或者,所述預處理可與水解過程同時進行,例如與用一種或多種纖維素分解酶,或其它酶活性處理纖維素材料同時進行,以釋放可發酵的糖,例如葡萄糖和/或麥芽糖。在多數情況下,所述預處理步驟本身導致生物質部分轉化為可發酵的糖(甚至酶不存在時亦如此)。蒸汽預處理。在蒸汽預處理中,將所述纖維素材料加熱以破壞其植物細胞壁組分,包括木質素,半纖維素與纖維素,以使所述纖維素與其它部分(例如,半纖維素)易受酶作用(accessibletoenzymes)0使所述木素纖維素材料經過或通過反應容器,在該反應容器中注入蒸汽以增加溫度至所需溫度并增加壓力,并在其中保持到所期望的反應時間。蒸汽預處理優選在140-230°C下進行,更優選為160-200°C,且最優選為170-190°C,其中最佳溫度范圍取決于任何化學催化劑的添加。蒸汽預處理的滯留時間優選為1-15分鐘,更優選為3-12分鐘,且最優選為4-10分鐘,其中最佳滯留時間取決于溫度范圍和任何化學催化劑的添加。蒸汽預處理允許相對較高的固體裝載,從而使得所述纖維素材料通常僅在預處理過程中為潮濕的。所述蒸汽預處理常常與預處理之后對所述材料的爆炸性排出(explosivedischarge)組合,其稱為蒸汽爆炸,亦即,所述材料迅速閃露于大氣壓力與33湍流以通過碎裂增加其可接觸表面積(DuffandMurray,1996,BioresourceTechnology8551-33;GalbeandZacchi,2002,Appl.Microbiol.Biotechnol.59:618_628;美國專利申請No.20020164730)。在蒸汽預處理過程中,半纖維素乙酰基團遭剪切,且所得的酸自催化半纖維素部分水解為單糖與寡糖。木質素僅以有限的程度移除。如H2SO4或SO2等的催化劑(通常為0.3到3%w/w)常常在蒸汽預處理前添加,其減少時間與溫度,增加回收,并改善酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132496-508;Varga^,2004,Appl.Biochem.Biotechnol.113-116509-523;Sassner等,2006,EnzymeMicrob.Technol.39:756_762)。化學預處理術語“化學預處理”指任何促進纖維素,半纖維素和/或木質素分離和/或釋放的化學預處理。合適的化學預處理過程的示例包括,例如,稀酸預處理,石灰預處理,濕氧化,氨纖維/冷凍爆炸(ammoniafiber/freezeexplosion,AFEX),氨滲濾(APR)以及有機溶劑預處理。在稀酸預處理中,將所述纖維素材料與稀酸,通常為H2SO4,以及水混合以形成漿料,由蒸汽加熱至所期望的溫度,并在滯留時間后閃露于大氣壓力。所述稀酸預處理可用多種反應器設計來實施,例如,活塞流反應器,逆流反應器(counter-currentreactor)或連續逆、流收縮床反應器(continuouscounter-currentshrinkingbedreactor)(DuffandMurray,1996,見上;Schell等,2004,BioresourceTechnol.91179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93_115)。亦可使用數種堿性條件下的預處理方法。這些堿性預處理包括但不限于,石灰預處理,濕氧化,氨滲濾(APR)與氨纖維/冷凍爆炸(AFEX)。石灰預處理使用碳酸鈣,氫氧化鈉或氨在85-150°C的低溫下以及自1小時到數日的滯留時間下進行(Wyman等,2005,BioresourceTechnol.961959-1966;Mosier等,2005,BioresourceTechnol.96:673_686)。WO2006/110891,WO2006/11899,WO2006/11900與WO2006/110901公開了使用氨的預處理方法。濕氧化為一種熱預處理,其通常在180-200°C下進行5_15分鐘,加以如過氧化S或氧氣超壓(over-pressure)等的氧化劑(SchmidtandThomsen,1998,BioresourceTechnol.64:139—151;Palonen2004,Appl.Biochem.Biotechnol.117:1_17;Varga^,2004,Biotechnol.Bioeng.88567-574;Martin^,2006,J.Chem.Technol.Biotechnol.811669-1677)。該預處理優選以1_40%干物質,更優選2-30%干物質,且最優選5-20%干物質進行,且起始pH常常通過添加堿性物質,例如碳酸鈉來增加。所述濕氧化預處理方法的改進,稱為濕爆炸(合并濕氧化與蒸汽爆炸),可處理多達30%的干物質。在濕爆炸中,氧化劑在預處理過程中一定滯留時間之后導入。所述預處理隨即通過閃露于大氣壓力來終止(W02006/032282)。氨纖維爆炸(AFEX)涉及用液態或氣態氨在中等溫度,例如90-100°C,以及高壓,例如17-20巴下對纖維素材料處理5-10分鐘,其中干物質含量可高達60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.9823-35;Chundawatφ,2007,Biotechnol.Bioeng.96219-231;Alizadeh^,2005,Appl.Biochem.Biotechnol.1211133-1141;Teymouri等,2005,BioresourceTechnol.962014-2018)。AFEX預處理導致纖維素的解聚,以及半纖維素的部分水解。木質素_碳水化合物復合物遭剪切。有機溶劑預處理通過用乙醇水溶液(40-60%乙醇)在160-200°C下提取30_60分鐘來將纖維素材料脫木質化(Pan等,2005,Biotechnol.Bioeng.90:473_481;Pan等,2006,Biotechnol.Bioeng.94:851_861;Kurabi等,2005,Appl.Biochem.Biotechnol.121219-230)。通常添加硫酸作為催化劑。在有機溶劑預處理中,大部分半纖維素得到移除。合適的預處理方法的其它示例由Schell等,2003,Appl.Biochem.andBiotechnol.Vol.105-108,p.69-85與Mosier等,2005,BioresourceTechnology96:673-686,以及公布的美國申請2002/0164730描述。在一方面,所述化學預處理優選作為酸處理來進行,且更優選作為連續性稀酸和/或溫和酸處理進行。所述酸通常為硫酸,但亦可使用其它酸,例如,乙酸,檸檬酸,硝酸,磷酸,酒石酸,琥珀酸,鹽酸或其混合物。溫和酸處理在PH范圍優選為1-5,更優選為1-4,且最優選為1-3下進行。在一方面,所述酸濃度范圍為優選0.01到20wt%的酸,更優選0.05到IOwt%的酸,甚至更優選0.1到5襯%的酸,且最優選0.2到2.Owt%的酸。所述酸與纖維素材料接觸,并保持在范圍優選為160-220°C,且更優選為165-195°C的溫度下數秒至數分鐘范圍的時間段,例如,1秒到60分鐘。在另一方面,預處理作為氨纖維爆炸步驟(AFEX預處理步驟)進行。在另一方面,預處理在水性漿料中進行。在優選的方面,所述纖維素材料在預處理過程中以優選為10-80wt%,更優選為20-70wt%,且最優選為30-60wt%,例如約50wt%的量存在。所述經預處理的纖維素材料可不經洗滌,或使用本領域任何已知方法洗滌,例如,用水洗滌。機械預處理術語“機械預處理”指不同類型的磨碎或碾磨(grindingormilling)(例如,干碾磨,濕碾磨,或振動球碾磨(vibratoryballmilling))。物理預處理術語“物理預處理”指任何改善自纖維素材料分離和/或釋放纖維素,半纖維素和/或木質素的預處理。舉例而言,物理預處理可涉及輻射(例如,微波輻射),汽蒸/蒸汽爆炸,濕熱分解以及其組合。物理預處理可涉及高壓和/或高溫(蒸汽爆炸)。在一方面,高壓意為范圍在優選約300到約600psi,更優選約350到約550psi,且最優選約400到約500psi,例如約450psi的壓力。在另一方面,高溫意為范圍在約100到約300°C,優選約140到約235°C的溫度。在優選方面,機械預處理在分批過程,蒸汽槍水解儀系統中進行,所述系統使用如上所述定義的高壓與高溫,例如,可自SundsDefibratorAB,Sweden獲取的SundsHydrolyzer。物理和化學聯合預處理所述纖維素材料可經物理與化學方法兩者預處理。舉例而言,所述預處理步驟可涉及稀酸或溫和酸處理以及高溫和/或高壓處理。所述物理與化學預處理可視需要順次或同時進行。亦可包含機械預處理。相應的,在優選方面,可對所述纖維素材料進行機械,化學或物理預處理,或其任意組合以促進纖維素,半纖維素和/或木質素的分離和/或釋放。生物預處理術語“生物預處理”指任何促進自纖維素材料分離和/或釋放纖維素,半纖維素和/或木質素的生物預處理。生物預處理技術可涉及施用溶解木質素的微生物(參見,例如,Hsu,Τ·-Α.,1996,Pretreatmentofbiomass,《HandbookonBioethanolProductionandUtilization》,Wyman,C.E.編輯,Taylor&Francis,Washington,DC,179-212;GhoshandSingh,1993,Physicochemicalandbiologicaltreatmentsfor35enzymatic/microbialconversionofcellulosicbiomass,Adv.Appl.Microbiol.39295-333;McMillan,J.D.,1994,Pretreatinglignocellulosicbiomass:areview,《EnzymaticConversionofBiomassforFuelsProduction》,Himmel,Μ.Ε.,Baker,J.0.,andOverend,R.P.編輯,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,chapter15;Gong,C.S.,Cao,N.J.,Du,J.,andTsao,G.Τ.,1999,Ethanolproductionfromrenewableresources,《AdvancesinBiochemicalEngineering/Biotechnology》,Scheper,T.編輯,Springer-VerlagBerlinHeidelberg,Germany,65207-241;OlssonandHahn-Hagerdal,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18:312_331;禾口VallanderandEriksson,1990,Productionofethanolfromlignocellulosicmaterials:Stateoftheart,Adv.Biochem.Eng./Biotechnol.42:63_95)。糖化在亦稱為糖化的水解步驟中,將所沭經預處理的纖維素材料水解以分解纖維素,并且可選地還將半纖維素分解為可發酵的糖,例如葡萄糖,木糖,木酮糖,阿拉伯糖,麥芽糖,甘露糖,半乳糖或可溶性寡糖。所述水解用酶法通過纖維素分解酶組合物進行,所述組合物包含本發明具有纖維素分解增強活性的多肽,其可進一步包含一種或多種分解半纖維素的酶。該組合物的酶亦可順次添加。酶水解優選在合適的含水環境中在本領域技術人員可容易地確定的條件下進行。在優選的方面,水解在適于所述酶活性,亦即,對于所述酶為最佳的條件下進行。所述水解可以按分批補料或連續過程的方式進行,在后者中將經預處理的纖維素材料(底物)逐漸進料至,例如,含有酶的水解溶液。所述糖化通常在攪拌釜式反應器或發酵罐中在受控的pH,溫度和混合條件下進行。合適的過程時間,溫度與PH條件可由本領域技術人員容易地確定。舉例而言,所述糖化可持續長達200小時,但通常優選進行約12到約96小時,更優選約16到約72小時,且最優選約24到約48小時。溫度范圍優選約25°C到約70°C,更優選約30°C到約65°C,且最優選約40°C到60°C,特別是50°C。pH范圍優選約3到約8,更優選約3.5到約7,且最優選約4到約6,特別為約pH5。干物質含量范圍優選約5到約50wt%,更優選約10到約40wt%,且最優選約20到約30wt%。除本發明具有纖維素分解增強活性的多肽之外,所述組合物的纖維素分解酶成分優選是具有內切葡聚糖酶,纖維二糖水解酶與葡糖苷酶活性的酶。在優選的方面,所述纖維素分解酶組合物包含一種或多種(幾種)選自下組的纖維素分解酶纖維素酶、內切葡聚糖酶、纖維二糖水解酶和葡糖苷酶。在另一個優選方面,所述纖維素分解酶制備物補充有一種或多種額外的選自下組的酶活性半纖維素酶,酯酶(例如,脂肪酶,磷脂酶和/或角質酶),蛋白酶,漆酶,過氧化物酶或其混合物。在本發明的方法中,所述額外的酶可在發酵之前或之中添加,包括在發酵微生物繁殖過程之中或之后添加。所述酶可源自或得自任何合適的來源,包括細菌,真菌,酵母,植物或哺乳動物來源。在本文中術語“獲得”意為該酶可分離自天然產生該酶作為天然酶的生物。在本文中術語“獲得”亦意為所述酶可在宿主生物中使用本文所描述的方法重組產生,其中所述重組產生的酶對于所述宿主生物可為天然的或外源的,或具有經修飾的氨基酸序列,例如,缺失,插入和/或取代了一個或多個氨基酸,亦即,該重組產生的酶為天然氨基酸序列的突變體和/或片段,或者其為通過本領域已知的核酸改組過程(nucleicacidshufflingprocess)產生的酶。天然酶含意所涵蓋的范圍包括天然變體,而外源酶含意所涵蓋的范圍包括重組獲得的變體,例如,通過定位誘變或改組得到的變體。用于本發明中的酶可為任何適用于本文所描述的方法中的形式,例如,有或無細胞的粗發酵培養液,或基本上純的多肽。所述酶可為干粉或顆粒,無塵顆粒,液體,穩定化的液體或受保護的酶。顆粒可以,例如,如美國專利Nos.4106991與4661452中公開的來產生,且可任選地通過本領域已知的過程包被。液體酶制備物可,例如,通過添加穩定劑,例如糖,糖醇或其它多元醇,和/或乳酸或另一有機酸根據已經建立的過程加以穩定化。經保護的酶可根據公開于EP238216中的過程加以制備。所述具有纖維素分解增強活性的酶和多肽的最佳量取決于多種因素,包括但不限于,組分纖維素分解酶的混合物,纖維素底物,纖維素底物的濃度,對纖維素底物的預處理,溫度,時間,PH以及發酵生物的包括(例如,供同時糖化與發酵的酵母)。在優選方面,針對纖維素材料的纖維素分解酶的有效量為每g纖維素材料約0.5到約50mg,優選約0.5到約40mg,更優選約0.5到約25mg,更優選約0.75到約20mg,更優選約0.75到約15mg,甚至更優選約0.5到約10mg,且最優選約2.5到約10mg。在另一個優選方面,對于纖維素材料,具有纖維素分解增強活性的多肽的有效量是每克的纖維素材料約0.01到約50mg,優選約0.5到約40mg,更優選約0.5到約25mg,更優選約0.75到約20mg,更優選約0.75到約15mg,甚至更優選約0.5到約10mg,且最優選約2.5到約IOmg0在另一個優選方面,針對纖維素材料具有纖維素分解增強活性的多肽的有效量為每g纖維素材料約0.01到約50.Omg,優選約0.01到約40mg,更優選約0.01到約30mg,更優選約0.01到約20mg,更優選約0.01到約IOmg,更優選約0.01到約5mg,更優選約0.025到約1.5mg,更優選約0.05到約1.25mg,更優選約0.075到約1.25mg,更優選約0.1到約1.25mg,甚至更優選約0.15到約1.25mg,且最優選約0.25到約1.Omgo在另一個優選方面,針對纖維素分解酶的具有纖維素分解增強活性的多肽的有效量為每g纖維素分解酶約0.005到約1.Og,優選約0.01到約1.Og,更優選約0.15到約0.75g,更優選約0.15到約0.5g,更優選約0.1到約0.5g,甚至更優選約0.1到約0.5g,且最優選約0.05到約0.2g。發酵得自所述經預處理與水解的纖維素材料的可發酵的糖可由一種或多種能夠將所述糖直接或間接發酵為所期望的發酵產物的發酵微生物進行發酵。“發酵”或“發酵過程”指任何發酵過程或任何包含發酵步驟的過程。發酵過程亦包括用于醇類消費品工業(例如,啤酒與葡萄酒),乳制品工業(例如,發酵的乳制品),皮革工業與煙草工業的發酵過程。發酵條件取決于所期望的發酵產物以及發酵生物,且可由本領域技術人員簡單地確定。在所述發酵步驟中,作為預處理與酶水解步驟的結果自所述纖維素材料釋放的糖由發酵生物,例如酵母,發酵為產物,例如乙醇。可分別或同時進行水解(糖化)與發酵。上述方法包括但不限于,分別水解與發酵(SHF);同時糖化與發酵(SSF);同時糖化與共發酵(SSCF);混合水解與發酵(HHF);SHCF(分別水解與共發酵);HHCF(混合水解與共發酵),以及直接微生物轉化(DMC)。任何合適的經水解的纖維素材料可在實行本發明時用于所述發酵步驟。所述材料通常基于所期望的發酵產物(即,自發酵獲取的物質),以及所用的過程選擇,如本領域為眾所周知的。適用于本發明方法的底物實例包括纖維素材料,如木材或植物殘余物或得自經處理的纖維素材料的低分子糖DP1-3,所述纖維素材料可由發酵微生物進行代謝,且其可通過直接添加至發酵培養基中進行供應。在本文中術語“發酵培養基”應理解為指在添加發酵微生物之前的培養基,例如,由糖化過程產生的培養基,以及用于同時糖化與發酵過程(SSF)的培養基。“發酵微生物”指任何微生物,包括細菌與真菌生物,其適用于所期望的發酵過程以產生發酵產物。所述發酵生物可為C6和/或C5發酵生物,或其組合。C6與C5發酵生物均在本領域為眾所周知。合適的發酵微生物能夠將糖,例如葡萄糖,木糖,木酮糖,阿拉伯糖,麥芽糖,甘露糖,半乳糖或寡糖直接或間接發酵(即轉化)為所期望的發酵產物。產生乙醇的細菌與真菌發酵生物的示例描述于Lin等,2006,Appl.Microbiol.Biotechnol.69:627_642。可發酵C6糖的發酵微生物的示例包括細菌與真菌生物,例如酵母。優選的酵母包括酵母屬菌禾中(Saccharomycesspp.),優選為酉良酒酵母(Saccharomycescerevisiae)的菌株。可發酵C5糖的發酵生物的示例包括細菌與真菌生物,例如酵母。優選的C5發酵酵母包括畢赤氏酵母屬(Pichia)的菌株,優選為具柄畢赤氏酵母(Pichiastipitis),例如具柄畢赤酵母CBS5773)的菌株;假絲酵母屬(Candida)的菌株,優選為博伊丁氏假絲酵母(Candidaboidinii),蕓薹假絲酵母(Candidabrassicae),休哈塔假絲酵母(Candidashehatae),迪丹氏假絲酵母(Candidadiddensii),假熱帶假絲酵母(Candidapseudotropicalis)或產朊假絲酵母(Candidautilis)的菌株。其它發酵生物包括發酵單胞菌屬(Zymomonas)的菌株,例如運動發酵單胞菌(Zymomonasmobilis);漢遜氏酵母屬(Hansenula)的菌株,例如異常漢遜氏酵母(Hansenulaanomala);克魯維酵母屬(Kluyveromyces)的菌株,例如脆壁克魯維酵母(K.fragilis);裂殖酵母屬(Schizosaccharomyces)的菌株,例如粟酒裂殖酵母(S.pombe);以及大腸桿菌(E.coli),特別是經遺傳修飾而改善了乙醇產量的大腸桿菌菌株。在優選的方面,所述酵母是酵母屬菌種。在更優選的方面,所述酵母為釀酒酵母。在另一個更優選的方面,所述酵母為糖化酵母(Saccharomycesdistaticus)0在另一個更優選的方面,所述酵母為葡萄汁酵母(Saccharomycesuvarum)。在另一個優選的方面,所述酵母屬于克魯維酵母屬。在另一個更優選的方面,所述酵母為馬克斯克魯維酵母(Kluyveromycesmarxianus)0在另一個更優選的方面,所述酵母為脆壁克魯維酵母。在另一個優選的方面,所述酵母屬于假絲酵母屬。在另一個更優選的方面,所述酵母為博伊丁氏假絲酵母。在另一個更優選的方面,所述酵母為蕓薹假絲酵母。在另一個更優選的方面,所述酵母為迪丹氏假絲酵母。在另一個更優選的方面,所述酵母為假熱帶假絲酵母。在另一個更優選的方面,所述酵母為產朊假絲酵母。在另一個優選的方面,所述酵母屬于棍孢屬(Clavispora)。在另一個更優選的方面,所述酵母為葡萄牙棍孢(Clavisporalusitaniae)。在另一個更優選的方面,所述酵母為仙人掌棍孢(Clavisporaopuntiae)。在另一個優選的方面,所述酵母屬于管囊酵母屬(Pachysolen)。在另一個更優選的方面,所述酵母為嗜鞣管囊酵母(Pachysolentannophilus)0在另一個優選的方面,所述酵母屬于畢赤氏酵母屬。在另一個更優選的方面,所述酵母為具柄畢赤氏酵母。在另一個優選的方面,所述酵母屬于酒香酵母屬(Bretarmomyces)。在另一個更優選的方面,所述酵母為克勞森酒香酵母(Bretannomycesclausenii)(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,((HandbookonBioethanolProductionandUtilization)),ffyman,C.E.編輯,Taylor&Francis,Washington,DC,179-212)。可有效將己糖與戊糖發酵為乙醇的細菌包括,例如,運動發酵單胞菌與熱纖維梭菌(Clostridiumthermocellum)(Philippidis,1996,見上)。在優選的方面,所述細菌屬于發酵單胞菌屬。在更優選的方面,所述細菌為運動發酵單胞菌。在另一個優選的方面,所述細菌屬于梭菌屬(Clostridium)。在另一個更優選的方面,所述細菌為熱纖維梭菌。適用于產生乙醇的可市購的酵母包括,例如,ETHANOLRED酵母(可得自Fermentis/Lesaffre,USA),FALI(可得自Fleischmann,sYeast,USA),SUPERSTART與THERMOSACC新鮮酵母(可得自EthanolTechnology,WI,USA),BIOFERMAFT與XR(可得自NABC-NorthAmericanBioproductsCorporation,GA,USA),GERTSTRAND(可得自GertStrandAB,Sweden),以及FERMI0L(可得自DSMSpecialties)。在優選的方面,所述發酵微生物可經遺傳修飾以提供發酵戊糖的能力,例如使用木糖,使用阿拉伯糖以及共同使用木糖與阿拉伯糖的微生物。將異源基因克隆入多種發酵微生物導致能夠將己糖與戊糖轉化為乙醇(共發酵)的生物的構建(ChenandHo,1993,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,Appl.Biochem.Biotechnol.39-40135-147;Ho等,1998,GeneticallyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,Appl.Environ.Microbiol.641852-1859;KotterandCiriacy,1993,XylosefermentationbySaccharomycescerevisiae,Appl.Microbiol.Biotechnol.38:776_783;Walfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKLlandTALIgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microbiol.61:4184_4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentation:aproofofprinciple,FEMSYeastResearch4655-664;Beall1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoli,Biotech.Bioeng.38296~303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58204~214;Zhang等,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267:240_243;Deanda等,1996,Developmentofanarabinose-fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.624465-4470)。在優選的方面,所述經遺傳修飾的發酵微生物為釀酒酵母。在另一個優選的方面,所述經遺傳修飾的發酵微生物為運動發酵單胞菌。在另一個優選的方面,所述經遺傳修飾39的發酵微生物為大腸桿菌。在另一個優選的方面,所述經遺傳修飾的發酵微生物為產酸克雷伯氏菌(Klebsiellaoxytoca)。在本領域眾所周知上述生物亦可用于產生其它物質,如本文所述。所述發酵微生物通常添加至經降解的木素纖維素或水解物,且將所述發酵進行約8到約96小時,例如約24到約60小時。溫度通常為約26°C到約60°C之間,特別是約32°C或50°C,且在約pH3到約pH8,例如約pH4_5,6或7。在優選方面,將所述酵母和/或另一微生物施用于經降解的木素纖維素或水解物,且所述發酵進行約12到約96小時,例如通常24-60小時。在優選方面,溫度優選在約20°C到約60°C之間,更優選約25°C到約50°C,且最優選約32°C到約50°C,特別是約32°C或50°C,且pH通常為約pH3到約pH7之間,優選約pH4_7。然而,其中一些,例如,細菌發酵生物具有較高的最佳發酵溫度。酵母或其它微生物優選以每ml發酵培養液大約IO5到1012,優選大約IO7到101(1,特別是大約2xl08活細胞計數的量施用。關于使用酵母以供發酵的進一步指導可見于,例如“TheAlcoholTextbook”(編輯K.Jacques,Τ.P.LyonsandD.R.Kelsall,NottinghamUniversityPress,UnitedKingdom1999),將其通過提述并入本文中。本領域最廣泛使用的工藝是同時糖化和發酵(SSF)工藝,其中對糖化沒有保持期(holdingstage),說明酵母和酶同時添加。對于乙醇產生,在發酵之后,蒸餾經發酵的漿料以提取乙醇。根據本發明的方法獲得的乙醇可用作,例如,燃料乙醇,飲用乙醇,亦即,可飲用的中性酒精飲料,或工業乙醇。發酵刺激劑(fermentationstimulator)可與任何本文所述的酶方法并用以進一步改善所述發酵過程,并且特別是所述發酵微生物的表現,例如,提高速率與乙醇產量。“發酵刺激劑”指針對所述發酵微生物(具體而言,酵母)生長的刺激劑。優選的針對生長的發酵刺激劑包括維生素與礦物質。維生素的示例包括多種維生素,生物素,泛酸,煙酸,內消旋肌醇,硫胺素,吡哆醇,對氨基苯甲酸,葉酸,核黃素和維生素A,B,C,D及E0參見,例如,Alfenore等,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed-batchprocess,Springer-Verlag(2002),將其通過提述并入本文中。礦物質的示例包括礦物質與無機鹽,其可供應包括P,K,Mg,S,Ca,Fe,Zn,Mn與Cu的營養物。發酵產物發酵產物可為任何源自發酵的物質。所述發酵產物可為,醇(例如,阿拉伯糖醇,丁醇,乙醇,甘油,甲醇,1,3-丙二醇,山梨醇與木糖醇);有機酸(例如,乙酸,醋酮酸,己二酸,抗壞血酸,檸檬酸,2,5-二酮-D-葡萄糖酸,甲酸,富馬酸,葡萄糖二酸,葡萄糖酸,葡糖醛酸,戊二酸,3-羥基丙酸,衣康酸,乳酸,蘋果酸,丙二酸,草酸,丙酸,琥珀酸與木糖酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸,谷氨酸,甘氨酸,賴氨酸,絲氨酸和蘇氨酸);以及氣體(例如,甲烷,氫氣(H2),二氧化碳(CO2)與一氧化碳(CO)),但不僅限于此。所述發酵產物亦可為作為高價值產物的蛋白質。在優選方面,所述發酵產物為醇。應理解術語“醇”涵蓋下述物質,即其包含一個或更多羥基部分(moiety)。在更優選方面,所述醇為阿拉伯糖醇。在另一個更優選方面,所述醇為丁醇。在另一個更優選方面,所述醇為乙醇。在另一個更優選方面,所述醇為甘油。在另一個更優選方面,所述醇為甲醇,在另一個更優選方面,所述醇為1,3_丙二醇。在40另一個更優選方面,所述醇為山梨醇。在另一個更優選方面,所述醇為木糖醇。參見,例如Gong,C.S.,Cao,N.J.,Du,J.,andTsao,G.Τ.,1999,Ethanolproductionfromrenewableresources,((AdvancesinBiochemicalEngineering/Biotechnology)),Scheper,T.編輯,Springer-VerlagBerlinHeidelberg,Germany,65:207_241;Silveira,Μ.M.,andJonas,R.,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59400-408;Nigam,P.,andSingh,D.,1995,Processesforfermentativeproductionofxylitol-asugarsubstitute,ProcessBiochemistry30(2):117_124;Ezeji,T.C.,Qureshi,N.andBlaschek,H.P.,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerinckiiBAlOlandinsiturecoverybygasstripping,WorldJournalofMicrobiologyandBiotechnology19(6):595_603o在另一個優選方面,所述發酵產物為有機酸。在另一個更優選方面,所述有機酸為乙酸。在另一個更優選方面,所述有機酸為醋酮酸。在另一個更優選方面,所述有機酸為己二酸。在另一個更優選方面,所述有機酸為抗壞血酸。在另一個更優選方面,所述有機酸為檸檬酸。在另一個更優選方面,所述有機酸為2,5-二酮-D-葡萄糖酸。在另一個更優選方面,所述有機酸為甲酸。在另一個更優選方面,所述有機酸為富馬酸。在另一個更優選方面,所述有機酸為葡萄糖二酸。在另一個更優選方面,所述有機酸為葡萄糖酸。在另一個更優選方面,所述有機酸為葡糖醛酸。在另一個更優選方面,所述有機酸為戊二酸。在另一個更優選方面,所述有機酸為3-羥基丙酸。在另一個更優選方面,所述有機酸為衣康酸。在另一個更優選方面,所述有機酸為乳酸。在另一個更優選方面,所述有機酸為蘋果酸。在另一個更優選方面,所述有機酸為丙二酸。在另一個更優選方面,所述有機酸為草酸。在另一個更優選方面,所述有機酸為丙酸。在另一個更優選方面,所述有機酸為琥珀酸。在另一個更優選方面,所述有機酸為木糖酸。參見,例如,Chen,R.,andLee,Y.Y.,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63-65:435_448。在另一個優選方面,所述發酵產物為酮。應理解術語“酮”涵蓋含有一個或更多酮部分的物質。在另一個更優選方面,所述酮為丙酮。參見,例如,QureshiandBlaschek,2003,見上。在另一個優選方面,所述發酵產物為氨基酸。在另一個更優選方面,所述有機酸為天冬氨酸。在另一個更優選方面,所述氨基酸為谷氨酸。在另一個更優選方面,所述氨基酸為甘氨酸。在另一個更優選方面,所述氨基酸為賴氨酸。在另一個更優選方面,所述氨基酸為絲氨酸。在另一個更優選方面,所述氨基酸為蘇氨酸。參見,例如,Richard,A.,andMargaritis,Α.,2004,Empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,BiotechnologyandBioengineering87(4):501_515o在另一個優選方面,所述發酵產物為氣體。在另一個更優選方面,所述氣體為甲烷。在另一個更優選方面,所述氣體為H2。在另一個更優選方面,所述氣體為co2。在另一個更優選方面,所述氣體為⑶。參見,例如,Kataoka,N.,A.Miya,andK.Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7)41-47;禾口GunaseelanV.N.《BiomassandBioenergy》,Vol.13(1—2),pp.83—114,1997,Anaerobicdigestionofbiomassformethaneproduction:Areview。Mi^所述發酵產物可任選地自所述發酵培養基使用任何本領域已知方法加以回收,所述方法包括但不僅限于,層析,電泳方法,差示溶解度(differentialsolubility),蒸餾或提取。舉例而言,醇自經發酵的纖維素材料分離并通過常規蒸餾方法純化。可獲取純度高至約96vol.%的乙醇,其可用作,例如,燃料乙醇,飲用乙醇,亦即,可飲用的中性酒精飲料,或工業乙醇。纖維素分解酶組合物在本發明的方法中,所述纖維素分解酶組合物可包含將含纖維素材料加工為葡萄糖,或將半纖維素加工為木糖、甘露糖、半乳糖和阿拉伯糖,其聚合物,或者如下所述由其衍生的產物中涉及的任何蛋白質。一個方面,所述纖維素分解酶組合物包含選自下組的一種或多種酶內切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。在另一個方面,所述纖維素分解酶組合物進一步包含一種或多種額外的酶活性以改善所述含纖維素材料的降解。優選的額外的酶是半纖維素酶、酯酶(例如,脂肪酶、磷脂酶,和/或角質酶(cutinase))、蛋白酶、漆酶、過氧化物酶或其混合物。所述纖維素分解酶組合物可以是單組分制備物,例如,一種內切葡聚糖酶,多組分制備物,例如,一種或多種內切葡聚糖酶、一種或多種纖維二糖水解酶和一種或多種β_葡糖苷酶,或多組分和單組分蛋白質制備物的混合物。所述纖維素分解蛋白可具有活性,亦即,可在酸性、中性或堿性的PH范圍水解所述含纖維素材料。如上所述,本發明所用的纖維素分解蛋白質可以是單組分制備物,亦即,基本上不含其它纖維素分解組分的一種組分。該單獨組分可以是重組組分,亦即,由克隆編碼所述單獨組分的DNA序列并隨即用該DNA序列轉化細胞并在宿主中表達(參見,例如,WO91/17243和WO91/17244)產生。所述宿主細胞可以是異源宿主(酶對宿主是異源的)或該宿主還可以是野生型宿主(酶對宿主是內源的)。單組分纖維素分解蛋白還可以通過自發酵液提純這樣的蛋白質來制備。本發明所用的酶可以是任何適用于本文所描述的方法的形式,如,舉例而言,含或不含細胞的粗發酵液、干粉或顆粒、無粉塵顆粒(non-dustinggranulate)、液體、穩定化的液體或受保護的酶。顆粒可依照,例如,美國專利4106991和4661452的公開來產生,并可視需要通過本領域已知的方法進行包覆。液體酶制備物可以,舉例而言,通過添加穩定劑如糖、糖醇或其它多元醇,和/或乳酸或其它有機酸根據既有方法的進行穩定化。受保護的酶可以根據EP238216中公開的方法進行制備。具有纖維素分解酶活性的多肽可以是細菌多肽。例如,所述多肽可以是革蘭氏陽性細菌多肽如芽孢桿菌屬(Bacillus)、鏈球菌屬(Str印tococcus)、鏈霉菌屬(Streptomyces)、葡萄球菌屬(Staphylococcus)、腸球菌屬(Enterococcus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、梭菌屬(Clostridium)、地芽孢桿菌屬(Geobacillus)或海洋芽孢桿菌屬(Oceanobacillus)多肽,所述多肽具有纖維素分解酶活性;或革蘭氏陰性細菌多肽,如大腸桿菌、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)、彎曲桿菌屬(Campylobacter)、螺桿菌屬(Helicobacter)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)或脲原體屬(Ureaplasma)多肽,所述多肽具有纖維素分解酶活性。在優選的方面,所述多肽是具有纖維素分解酶活性的嗜堿芽孢桿菌(Bacillusalkalophilus)、!軍定^1Ur包!f胃(Bacillusamyloliquefaciens)lif(Bacillusbrevis)、環狀芽孢桿菌(Bacilluscirculans)、克勞氏芽孢桿菌(Bacillusclausii)、凝結芽孢桿菌(Bacilluscoagulans)、堅強芽孢桿菌(Bacillusfirmus)、燦爛芽孢桿菌(Bacilluslautus)、遲緩芽孢桿菌(Bacilluslentus)、地衣芽孢桿菌(Bacilluslicheniformis)、巨大芽孢桿菌(Bacillusmegaterium)、短小芽孢桿菌(Bacilluspumilus)、嗜熱月旨肪芽孢桿菌(Bacillusstearothermophilus)、枯草芽孢桿菌(Bacillussubtilis)或蘇云金芽孢桿菌(Bacillusthuringiensis)多肽。在另一個優選的方面,所述多肽是具有纖維素分解酶活性的似馬鏈球菌(Streptococcusequisimilis)、酉良月農鏈球菌(Streptococcuspyogenes)、乳房鏈球菌(Streptococcusuberis)或馬鏈球菌獸痕亞禾中(Streptococcusequisubsp.Zooepidemicus)多月太。在另一個優選的方面,所述多肽是具有纖維素分解酶活性的不產色鏈霉菌(Streptomycesachromogenes)、除蟲鏈霉菌(Streptomycesavermitilis)、天藍鏈霉菌(Streptomycescoelicolor)、灰色鏈霉菌(Streptomycesgriseus)或淺青紫鏈霉菌(Streptomyceslividans)多月太。本發明具有纖維素分解酶活性的多肽也可以是真菌多肽,并且更優選酵母多肽如假絲酵母屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或西洋蓍霉屬(Yarrowia)多肽,其具有纖維素分解酶活性;或更優選絲狀真菌多肽如枝頂孢霉屬(Acremonium)、傘菌屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、Botryospaeria、擬錯菌屬(Ceriporiopsis)、Chaetomidium、金抱子菌屬(Chrysosporium)、Claviceps、Cochliobolus、Coprinopsis、Coptotermes、Corynascus、Cryphonectria、係急球菌屬(Cryptococcus)、Diplodia、Exidia、Filibasidium、,廉抱屬(Fusarium)、赤霉屬(Gibberella)、Holomastigotoides、腐質毒屬(Humicola)、奉巴菌屬(Irpex)、Lentinula、Leptospaeria、梨抱菌屬(Magnaporthe)、Melanocarpus、多孑L菌屬(Meripilus)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新考瑪脂霉屬(Neocallimastix)、脈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia、假漂盤菌屬(Pseudoplectania)、Pseudotrichonympha、根毛霉屬(Rhizomucor)、裂糟菌屬(Schizophyllum)、柱頂孢屬(Scytalidium)、踝節菌屬(Talaromyces)、熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、Trichophaea、輪枝抱屬(Verticillium)、Volvariella或Xylaria多肽,其具有纖維素分解酶活性。在優選的方面,所述多肽是具有纖維素分解酶活性的卡爾酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一優選的方面,所述多肽是具有纖維素分解酶活性的解纖維枝頂孢霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、煙曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、構巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角質金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛChrysosporiumzonatum、桿抱狀德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、庫威,廉抱(Fusariumcrookwellense)、大刀,廉抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、異抱德抱(Fusariumheterosporum)、合歡木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉紅德抱(Fusariumroseum)、接骨木,廉抱(Fusariumsambucinum)、膚色德抱(Fusariumsarcochroum)、擬分枝抱德抱(Fusariumsporotrichioides)、硫色,廉抱(Fusariumsulphureum)、圓德抱(Fusariumtorulosum)、擬絲抱,廉抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰腐質霉(Humicolagrisea)、特異腐質霉(Humicolainsolens)、疏棉狀腐質霉(Humicolalanuginosa)、Irpexlacteus、米黑毛霉(Mucormiehei)、嗜熱毀絲霉(Myceliophthorathermophila)、粗糙脈孢菌(Neurosporacrassa)、繩狀青霉(Penicilliumfuniculosum)、產紫青霉(Penicilliumpurpurogenum)、黃抱平革菌(Phanerochaetechrysosporium)、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、Thielaviaaustraleinsis、ThielaviafimetiλThielaviamicrospora、Thielaviaovispora、Thielaviaperuviana、瘤抱梭抱殼(Thielaviaspededonium)、€—冑(Thielaviasetosa)ΛThielaviasubthermophila、土生梭抱霉(Thielaviaterrestris)、哈茨木霉(Trichodermaharzianum)、康寧木霉(Trichodermakoningii)、長枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)、綠色木霉(Trichodermaviride)或Trichophaeasaccata多月太。還可以使用纖維素分解蛋白經化學修飾或蛋白質工程改造的突變體。所述纖維素分解酶組合物的一種或多種組分可以是重組組分,亦即,通過克隆編碼所述單獨組分的DNA序列并隨即用該DNA序列轉化細胞并在宿主中表達(參見,例如,W091/17243和W091/17244)產生。所述宿主優選是異源宿主(酶對宿主是異源的),但該宿主在一定條件下也可以是同源宿主(酶對宿主是同源的)。單組分纖維素分解蛋白還可以通過從發酵液中提純這樣的蛋白質來制備。適用于本發明的商業性的纖維素分解蛋白制備物的實例包括,舉例而言,CELLUCLAST(可自NovozymesA/S獲得)和N0V0ZYM188(可自NovozymesA/S獲得)。其它包含纖維素酶的可以使用的可市購的制備物包括CELLUZYME、CEREFL0和ULTRAFLO(NovozymesA/S),LAMINEX和SPEZYMECP(GenencorInt.),R0HAMENT7069ff(RohmGmbH)以及FIBREZYMELDI、FIBREZYMELBR或VISCOSTAR150L(DyadicInternational,Inc.,Jupiter,FL,USA)。所述纖維素酶以從固體的約0.001%到約5.0%wt.,更優選從固體的0.025%到約4.O%wt.,且最優選從固體的約0.005%到約2.O%44wt.的有效量添加。可以用于本發明的方法的細菌內切葡聚糖酶的實例包括但不僅限于,解纖維熱酸菌(Acidothermuscellulolyticus)內切葡聚糖酶(W091/05039;WO93/15186;美國專利5,275,944;W096/02551;美國專利5,536,655,WO00/70031,WO05/093050);Thermobifidafusca內切葡聚糖酶III(W005/093050)JPThermobifidafusca內切葡聚糖酶V(W005/093050)。可以用于本發明的方法的真菌內切葡聚糖酶的實例包括但不僅限于,里氏木霉內切葡聚糖酶I(Penttila等,1986,Gene45:253_263;GENBANK登錄號M15665);里氏木霉內切葡聚糖酶II(Saloheimo等,1988,Gene6311-22;GENBANK登錄號M19373);里氏木霉內切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555_563;GENBANK登錄號AB003694);里氏木霉內切葡聚糖酶IV(Saloheimo等,1997,Eur.J.Biochem.249584-591;GENBANK登錄號Y11113);以及里氏木霉內切葡聚糖酶V(Saloheimo等,1994,MolecularMicrobiology13:219_228;GENBANK登錄號Z33381);棘孢曲霉內切葡聚糖酶(Ooi等,1990,NucleicAcidsResearch18:5884);川地曲霉(Aspergilluskawachii)內切葡聚糖酶(Sakamoto等,1995,CurrentGenetics27:435-439);Erwiniacarotovara內切葡聚糖酶(SaariIahti等,1990,Gene90:9_14);尖鐮孢內切葡聚糖酶(GENBANK登錄號L29381);灰腐質霉thermoidea變種內切葡聚糖酶(GENBANK登錄號AB003107);Melanocarpusalbomyces內切葡聚糖酶(GENBANK登錄號MAL515703);粗糙脈孢菌內切葡聚糖酶(GENBANK登錄號XM_324477);特異腐質霉內切葡聚糖酶V(SEQIDNO17);嗜熱毀絲霉CBS117.65內切葡聚糖酶(SEQIDNO19);擔子菌綱(basidiomycete)CBS495.95內切葡聚糖酶(SEQIDNO21);擔子菌綱CBS494.95內切葡聚糖酶(SEQIDNO23);土生梭孢霉NRRL8126CEL6B內切葡聚糖酶(SEQIDNO25);土生梭孢霉NRRL8126CEL6C內切葡聚糖酶(SEQIDNO27);土生梭孢霉NRRL8126CEL7C內切葡聚糖酶(SEQIDNO29);土生梭孢霉NRRL8126CEL7E內切葡聚糖酶(SEQIDNO31);土生梭孢霉NRRL8126CEL7F內切葡聚糖酶(SEQIDNO33);CladorrhinumfoecundissimumATCC62373CEL7A內切葡聚糖酶(SEQIDNO35);以及里氏木霉菌株VTT-D-80133內切葡聚糖酶(SEQIDNO37;GENBANK登錄號Ml5665)。上述SEQIDNO17,SEQIDNO19,SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDN0:35和SEQIDNO37的內切葡聚糖酶分別由SEQIDN0:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO32,SEQIDNO:34禾口SEQIDNO36的成熟多肽編碼序列所編碼。可用于本發明的方法的纖維二糖水解酶的示例包括但不僅限于,里氏木霉纖維二糖水解酶I(SEQIDNO39);里氏木霉纖維二糖水解酶II(SEQIDNO41);特異腐質霉纖維二糖水解酶I(SEQIDNO43)、嗜熱毀絲霉纖維二糖水解酶II(SEQIDNO45和SEQIDNO47)、土生梭孢霉纖維二糖水解酶II(CEL6A)(SEQIDNO49)、嗜熱毛殼霉(Chaetomiumthermophilum)纖維二糖水解酶I(SEQIDNO51)以及嗜熱毛殼霉纖維二糖水解酶II(SEQIDN0:53)。上述SEQIDNO39、SEQIDNO:41、SEQIDNO43、SEQIDNO45、SEQIDN0:47、SEQIDNO:49、SEQIDNO51和SEQIDNO53的纖維二糖水解酶分別由SEQIDNO38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQID45NO50和SEQIDNO52的成熟多肽編碼序列所編碼。可用于本發明的方法的葡糖苷酶的實例包括但不僅限于米曲霉葡糖苷酶(SEQIDNO55);煙曲霉β-葡糖苷酶(SEQIDNO57);巴西青霉(Penicilliumbrasilianum)IBT20888β-葡糖苷酶(SEQIDNO59);黑曲霉β-葡糖苷酶(SEQIDNO:61);以及棘孢曲霉β-葡糖苷酶(SEQIDΝ0:63)。所述SEQIDNO55、SEQIDNO:57、SEQIDNO59,SEQIDNO:61禾口SEQIDNO:63的β-葡糖苷酶分別由SEQIDNO54、SEQIDNO:56、SEQIDNO:58、SEQIDNO60和SEQIDNO62的成熟多肽編碼序列所編碼。具有β-葡糖苷酶活性的米曲霉多肽可根據WO2002/095014獲取。具有β-葡糖苷酶活性的煙曲霉多肽可根據WO2005/047499獲取。具有β-葡糖苷酶活性的巴西青霉多肽可根據WO2007/019442獲取。具有β_葡糖苷酶活性的黑曲霉多肽可根據Dan等,2000,J.Biol.Chem.275=4973-4980獲取。具有β-葡糖苷酶活性的棘孢曲霉多肽可根據Kawaguchi等,1996,Gene173:287_288獲取。所述β-葡糖苷酶可以是融合蛋白。在一個方面,所述β-葡糖苷酶是SEQIDNO65的米曲霉β-葡糖苷酶變體BG融合蛋白或SEQIDNO:67的米曲霉β-葡糖苷酶融合蛋白。在另一個方面,所述米曲霉β-葡糖苷酶變體BG融合蛋白是由SEQIDΝ0:64的多核苷酸編碼的,或所述米曲霉β-葡糖苷酶融合蛋白是由SEQIDNO:66的多核苷酸編碼的。其它內切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶使用根據HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino—acidsequencesimilarities,Biochem.J.280:309_316禾口HenrissatB.,andBairochΑ.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316695~696的分類公開于許多糖基水解酶家族中。其它可用于本發明的纖維素分解酶描述于EP495,257,EP531,315,EP531,372、WO89/09259、WO94/07998、WO95/24471、WO96/11262、WO96/29397、WO96/034108、WO97/14804、WO98/08940、WO98/012307、WO98/13465、WO98/015619、WO98/015633、WO98/028411、WO99/06574、WO99/10481、WO99/025846、WO99/025847、WO99/031255、WO2000/009707,WO2002/050245、WO2002/0076792、WO2002/101078、WO2003/027306、WO2003/052054,WO2003/052055,WO2003/052056,WO2003/052057,WO2003/052118、WO2004/016760、WO2004/043980、WO2004/048592、WO2005/001065、WO2005/028636、WO2005/093050,WO2005/093073、WO2006/074005,WO2006/117432,WO2007/071818,WO2007/071820、WO2008/008070、WO2008/008793、美國專利4435307、美國專利5457046、美國專禾Ij5648263、美國專利5686593、美國專利5691178、美國專利5763254以及美國專利5776757。可用于本發明方法的纖維素分解酶可以通過在含有合適的碳源和氮源以及無機鹽的營養培養基上,使用本領域已知的步驟,對上面指出的微生物菌株進行發酵而產生(參見,例如,Bennett,J.W.andLaSure,L.編,MoreGeneManipulationsinFungi,AcademicPress,CA,1991)。合適的培養基可從供應商獲取或可根據已公開的組成(例如,公開于美國典型培養物保藏中心的目錄中的)來制備。適于生長和纖維素分解酶產生的溫度范圍和其它條件在本領域是已知的(參見,例如,Bailey,J.Ε.,andOllis,D.F.,BiochemicalEngineeringFundamentals,McGraw-HillBookCompany,NY,1986)。46所述發酵可以是任何其結果為纖維素分解酶的表達或分離的培養細胞的方法。因此,發酵可以理解為包括在合適的培養基中并在允許所述纖維素分解酶得以表達或分離的條件下進行的搖瓶培養,或在實驗室或工業發酵罐中的小-或大規模發酵(包括連續、分批、補料分批或固態發酵)。信號月太本發明還涉及核酸構建體,所述核酸構建體包含編碼蛋白質的基因,其中所述基因與編碼信號肽的核苷酸序列可操作地連接,所述信號肽包含SEQIDNO2的氨基酸1到19,或者由SEQIDNO2的氨基酸1至19組成,其中所述基因對于所述核苷酸序列是外源的。在優選的方面,所述核苷酸序列包含SEQIDNO1的核苷酸1_57或由SEQIDNO1的核苷酸1-57組成。本發明還涉及包含這樣的核苷酸構建體的重組表達載體和重組宿主細胞。本發明還涉及產生蛋白質的方法,包括(a)在適合于產生所述蛋白質的條件下培養這樣的重組宿主細胞;和(b)回收所述蛋白質。所述蛋白質對于宿主細胞可以是天然的或異源的。術語“蛋白質”在本文的意思不是指特定長度的編碼產物,并因此包括肽、寡肽和蛋白質。術語“蛋白質”還包括組合以形成編碼產物的兩種或更多種多肽。所述蛋白質還包括雜合多肽,其包含部分或全部從至少兩種不同的蛋白質獲得的多肽序列的組合,其中一種或多種(幾種)對于宿主細胞可以是異源或天然的。蛋白質進一步包括上述蛋白質和雜合蛋白質天然存在的等位基因變異和工程的變異。蛋白質優選是激素或其變體、酶、受體或其部分、抗體或其部分,或報告蛋白(r印orter)。在更優選的方面,所述蛋白質是氧化還原酶、轉移酶、水解酶、裂合酶(lyase)、異構酶或連接酶。在更加優選的方面,所述蛋白質是氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α"半乳糖苷酶、β"半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉化酶、漆酶、另外的脂肪酶、甘露糖苷酶、變聚糖酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶或木聚糖酶。基因可以獲得自任何原核、真核或其它來源。通過以下實施例進一步對本發明進行描述,但不應將其理解為對本發明范圍的限制。實施例材料用作緩沖液和底物的化學品是至少試劑級的商業產品。菌株使用嗜熱毀絲霉CBS202.75作為編碼具有纖維素分解增強活性的多肽的家族61基因的來源。培養基BA培養基由每升IOg的玉米浸液(cornsteepliquor)干物質、IOg的NH4N03、IOg的ΚΗ2Ρ04、0·75g的MgSO4·7Η20、0·Iml的普流羅尼(pluronic)以及0.5g的CaCO3組成。pH在高壓滅菌前調至6.5。YEG培養基由每升20克的右旋糖(dextrose)和5g的酵母提取物組成。基本培養基由每升6g的NaNO3、0.52g的KCl、1.52g的KH2PO4、Iml的COVE痕量元素溶液、20g的Noble瓊脂、20ml的50%葡萄糖、2.5ml的MgSO4·7H20以及20ml的0.02%生物素溶液組成。COVE痕量金屬溶液由每升0.04g的Na2B4O7·10H20、0.4g的CuSO4·5Η20、1·2g的FeSO4·7Η20、0·7g的MnSO4·H20,0.8g的Na2MoO2·2H20以及IOg的ZnSO4·7H20組成。M410培養基由每升50g的麥芽糖、50g的葡萄糖、2g的MgSO4·7H20、2g的ΚΗ2Ρ04、4g的無水檸檬酸、8g的酵母提取物、2g的尿素、0.5g的CaCl2以及0.5ml的AMG痕量金屬溶液組成。AMG痕量金屬溶液由每升14.3g的ZnSO4·7H20、2.5g的CuSO4·5Η20、0·5g的NiCl2·6Η20、13·8g的FeSO4·7Η20、8·5g的MnSO4·7H20以及3g的檸檬酸組成。實施例1家族61肽的鑒定SDS-PAGE分析商品產物用水按110稀釋。將20μ1在CRITERI0N8_16%Tris-HClSDS-PAGE凝膠上根據生產商建議的條件(Bio-RadLaboratories,Hercules,CA,USA)進行分離。使用PRECISIONPLUSPROTEIN標準品(Bio-RadLaboratories,Hercules,CA,USA)作為分子量標記。所得凝膠用BIO-SAFECoomassieStain(Bio-RadLaboratories,Hercules,CA,USA)進行染色,并用刀片將可見的條帶切出用于蛋白質鑒定分析。為了肽測序進行的多肽膠內消化(in-geldigestion)使用MultiPROBEIILiquidHandlingRobot(PerkinElmerLifeandAnalyticalSciences,Boston,MA,USA)進行膠內消化。含有蛋白質的凝膠條帶用50μ1的溶于IOOmM碳酸氫銨pH8.0中的IOmM二硫蘇糖醇(DTT)還原30分鐘。經還原后,將所述凝膠塊用50μ1的溶于IOOmM碳酸氫銨pH8.0中的55mM碘乙酰胺烷基化20分鐘。允許經干燥的凝膠塊在25μ1(50mM碳酸氫銨pH8.0中6ng/y1)測序級胰蛋白酶(Promega,Madison,WI,USA))的胰蛋白酶消化溶液中在室溫下溶漲(swell)30分鐘,之后是在40°C消化8小時。上述每個反應步驟之后都用合適的溶液遵循生產商的標準規程進行多次洗滌與預洗滌。使用50μ1乙腈以在反應之間使所述凝膠塊脫水,且將所述凝膠塊在步驟之間空氣干燥。用HPLC級水中的1%甲酸/2%乙腈提取肽兩次30分鐘。將肽提取溶液轉移至已經冷卻至10-15°C的96孔有緣的(skirted)PCR型板(ABGene,Rochester,NY,USA),并且用96孔板蓋(PerkinElmerLifeandAnalyticalSciences,Boston,MA,USA)覆蓋以防止蒸發。將板進一步儲藏于4°C直至可進行質譜分析。蛋白質鑒定。為了通過串聯質譜術進行肽的從頭測序,使用Q-T0FMICR0(WatersMicromassMSTechnologies,Milford,MA,USA),一種混合型正交四極飛行時間質譜儀(hybridorthogonalquadrupoletime—of—flightmassspectrometer)用于LC/MS/MS分析。Q-TOFMICRO使用MASSLYNX軟件版本4.1(WatersMicromassMSTechnologies,Milford,MA,USA)完全由微處理器控制。所述Q-TOFMICRO配以ULTIMATE毛細管和納米流(nano-flow)HPLC系統,其與FAM0S微型自動采樣器和SWITCH0SII柱變換裝置(LCPackings/Dionex,Sunnyvale,CA,USA)偶聯用于對樣品進行濃縮與脫鹽。將樣品加載至裝在注入回路(injectionloop)中的保護柱(300μmIDX5cm,PEPMAPC18)上,并用0.甲酸水溶液以每分鐘40μ1用SwitchosII泵洗滌2分鐘。肽在75μmIDχ15cm,C18,3μm,100APEPMAP(LCPackings,SanFrancisco,CA,USA)納米流融合的毛細管柱上以175nl/分鐘的流速,從175μ1/分鐘的分流(splitflow)使用NAN-75校準器(Dionex,Sunnyvale,CA,USA)分離。在45分鐘期間施加0.1%甲酸中5%到80%乙腈的分步洗脫梯度(st印elutiongradient)。在215nm處監視柱洗脫液,并通過裝有納米噴射接Π(nanosprayinterface)的電噴身寸離子源(electrosprayionsource)導入所述Q-T0FMICRO中。以檢查掃描模式(surveyscanmode)并自m/z400到1990的范圍及MS到MS/MS的轉化標準獲取數據,以包括高于每秒10.0計數的離子強度和+2、+3和+4的電荷狀態。用1.9秒的掃描時間和0.1秒的掃描間時間可獲取多至4個同時洗脫物種的分析譜。通常使用45伏特的錐形電壓(conevoltage),而碰撞能量(collisionenergy)編程為根據洗脫肽的質量和電荷狀態而改變,且在10-60伏特的范圍內。所得的譜以自動的方式組合、平滑化(smoothed)并中心化(centered),并產生峰列表(peaklist)。將該峰列表針對所選的數據庫使用PR0TEINLYNXGlobalServer2.2.05軟件(WatersMicromassMSTechnologies,Milford,MA,USA)和PEAKSStudio4.5版本(SPl)(BioinformaticSolutionsInc.,Waterloo,Ontario,Canada)進行搜索。評價由PR0TEINLYNX和PEAKSStudio搜索所得的結果,并進一步通過評價每個目標離子的MS/MS譜來分析未鑒別的蛋白質,并通過鑒定y與b離子系列以及將質量差異與合適的氨基酸匹配來確定從頭序列(denovosequence)0從經所述膠內消化的大約24kDa多肽凝膠條帶的數個帶多電荷的離子獲得肽序列。871.56m/z序列的帶兩個電荷的胰蛋白酶肽離子確定為[Leu]-Pro-Ala-Ser-Asn-Ser-Pro-Val-Thr-Asp-Val-Thr-Ser-Asn-Ala-[Leu]-Arg(SEQIDNO:3)。615.84m/z序列的帶兩個電荷的胰蛋白酶肽離子確定為Val-Asp-Asn-Ala-Ala-Thr-Ala-Ser-Pro-Ser-Gly-[Leu]-Lys(SEQIDNO:4)。715.44m/z序列的帶兩個電荷的胰蛋白酶肽離子確定為[LeuJ-Pro-Ala-Asp-[Leu]-Pro-Ser-Gly-Asp-Tyr-[Leu]-[Leu]-Arg(SEQIDNO:5)。988.58m/z序列的帶兩個電荷的胰蛋白酶肽離子確定為Gly-Pro-[Leu]-[Gin]-Val-Tyr-[Leu]-Ala-Lys(SEQIDNO6)01272.65m/z序列的帶兩個電荷的胰蛋白酶肽離子確定為Val-Ser-Val-Asn-Gly-[Gin]-Asp-[Gin]-Gly-[Gin]-[Leu]-Lys(SEQIDNO:7)。上面的[Leu]可以是lie或Leu,而上面的[Gin]可以是Gln或Lys,這是因為它們質量相同無法區分。實施例2制備嗜熱毀絲霉CBS117.65cDNA匯集嗜熱毀絲霉CBS117.65在200ml的BA培養基中在30°C下以200rpm培養五日。來自搖瓶培養的菌絲體通過用內襯MIRACL0TH(CalBiochem,SanDiego,CA,USA)的漏斗過濾內含物來收獲。然后將菌絲體夾在兩片MIRACL0TH片之間并用吸水紙塔吸干。隨即將菌絲體物質轉移到塑料的離心管中,并在液氮中冷凍。冷凍的菌絲體在-80°C冷凍柜中儲藏直至使用。對總RNA的提取用硫氰酸胍繼以通過5.7MCsCl墊(cushion)的超離心來進行,而多聚(A)+RNA的分離通過寡聚(dT)-纖維素親和層析來進行,其使用描述于WO94/14953中的步驟。雙鏈cDNA自5μg的多聚(A)+RNA通過RNaseH方法(Gubler和Hoffman,1983,Gene25:263-269,Sambrook等,1989,Molecularcloning:Alaboratorymanual,ColdSpringHarborlab.,ColdSpringHarbor,NY,USA)合成。將所述多聚(A)+RNA(5yg在5μ1經DEPC(0.焦碳酸二乙酯)處理的水)在預硅化的、無RNase的EPPEND0RF管中在70°C下加熱8分鐘,在冰上驟冷(quench),并與由50mMTris_HCl,pH8.3、75mMKCl、3mMMgCl2UOmM二硫蘇糖醇(DTT)(BethesdaResearchLaboratories,Bethesda,MD,USA)>ImM的dATP,dGTP和dTTP以及0.5mM5-甲基-dCTP(GEHealthcare,Piscataway,NJ,USA)、40單位的人胎盤核糖核酸酶抑制劑(RNasin;Promega,Madison,WI,USA)U.45μg的寡聚(dT)18-NotI引物(GEHealthcare,Piscataway,NJ,USA)以及1000單位的SuperScriptIIRNaseH逆轉錄酶(BethesdaResearchLaboratories,Bethesda,MD,USA)組成的逆轉錄酶緩沖液合并使終體積為50μ1。第一鏈cDNA通過將反應混合物在45°C下溫育1小時來合成。在合成后,將所得mRNA:cDNA雜交混合物通過MICR0SPINS-400HR離心柱(spincolumn)(GEHealthcare,Piscataway,NJ,USA)根據生產商的指示進行凝膠過濾。在凝膠過濾后,將所得雜交物稀釋于250μ1含有200μM的每種dNTP、60單位的大腸桿菌DNA聚合酶I(GEHealthcare,Piscataway,NJ,USA),5.25單位的RNaseH(Promega,Madison,WI,USA)以及15單位的大腸桿菌DNA連接酶(BoehringerMannheim,Manheim,Germany)的第二鏈緩沖液中(20mMTris_HCl,pH7.4、90mMKCl、4.6mMMgCl2,IOmM(NH4)2SO4^O.16mMNAD)。第二鏈cDNA合成通過將所述反應管在16°C下溫育2小時并在25°C下另行溫育15分鐘來進行。所述反應通過添加EDTA至終濃度為20mM加以終止,繼以苯酚和氯仿的提取。將所述雙鏈cDNA通過添加2體積的96%乙醇和0.2體積的10M乙酸銨在_20°C下沉淀12小時,通過在13000xg下離心來回收,在70%乙醇中洗滌,干燥并重新懸浮于30μ1含有25單位的綠豆核酸酶(GEHealthcare,Piscataway,NJ,USA)的綠豆核酸酶緩沖液(30mM乙酸銨pH4.6、300mMNaCl、lmMZnSO4、0.35mMDTT、2%甘油)中。如下使所得單鏈發夾DNA成夾(clip),即通過將反應物在30°C下溫育30分鐘,繼以添加70μ1的IOmMTris-HCl-ImMEDTAρΗ7.5,苯酚提取,并用2體積的96%乙醇和0.1體積的3Μ乙酸鈉ρΗ5.2在冰上沉淀30分鐘。所得雙鏈cDNA通過在13000xg下離心來回收,并在30μ1含有0.5mM的每種dNTP和5單位的T4DNA聚合酶(NewEnglandBiolabs,Ipswich,MA,USA)的Τ4DNA聚合酶緩沖液(20mMTris-乙酸,pH7.9、IOmM乙酸鎂、50mM乙酸鉀、ImMDTT)中通過將所述反應混合物在16°C下溫育1小時來平端化(blunt-end)。所述反應通過添加EDTA至終濃度為20mM加以終止,繼以苯酚和氯仿提取,并通過添加2體積的96%乙醇和0.1體積的3M乙酸鈉pH5.2在-20°C下沉淀12小時。在所述填補(fill-in)反應后,通過在13000xg下離心,在70%乙醇中洗滌,并干燥來回收所述cDNA。實施例3嗜熱毀絲霉CBS202.75和嗜熱毀絲霉CBS117.65基因組DNA提取將嗜熱毀絲霉CBS202.75和嗜熱毀絲霉CBS117.65菌株在100ml的YEG培養基中在帶擋板的搖瓶(baffledshakeflask)中在45°C下以200rpm培養2天。菌絲體通過使用MIRACLOTH:(Calbiochem,LaJolla,CA,USA)過濾來收獲,在去離子水中洗滌兩次,50并在液氮下冷凍。將冷凍的菌絲體用臼和杵磨成細微的粉末,而總DNA使用DNEASYPlantMaxiKit(QIAGENInc.,Valencia,CA,USA)進行分離。實施例4對來自嗜熱毀絲霉的家族61基因的分子篩選如下所示,基于通過如實施例1中所描述的串聯質譜術(tandemmassspectrometry)獲得的肽序列設計了簡并引物。引物061564(C161B有義)5,-TCTCGGTCAACGGCCAGGAYCARGGNCA-3,(SEQIDNO8)引物061565(C161B反義)5,-GCGAGGCGGTGGCGGCRTTRTCNACYTT-3,(SEQIDNO9)將C161B有義和C161B反義引物各五十皮摩爾用于由IOOng的嗜熱毀絲霉CBS117.65cDNA匯集,IXADVANTAGEGC-MeltLABuffer(ClontechLaboratories,Inc.,MountainView,CA,USA),每種0.4mM的dATP、dTTP、dGTP禾ΠdCTP,以及1.25單位的ADVANTAGEGCGenomicPolymeraseMix(ClontechLaboratories,Inc.,MountainView,CA,USA)組成的最終體積為25μ1的PCR反應。所述擴增使用EPPENDORFMASTERCYCLER.5333(EppendorfScientific,Inc.,ffestbury,NY,USA)來進行,其程序設置為一個循環在94°C下一分鐘,以及30個循環,每個循環為在94°C下30秒,56.5°C下30秒和72°C下30秒,繼以在72°C下5分鐘的最終延伸。所得反應產物通過瓊脂糖凝膠電泳在40mMTris堿_20mM乙酸鈉-ImMEDTA二鈉(TAE)緩沖液中進行分級,并將大于300bp的條帶切出,使用MINELUATEGelExtractionKit(QIAGENInc.,Valencia,CA,USA)根據生產商的指示純化,并使用Τ0Ρ0TAKit(Invitrogen,Carlsbad,CA,USA)進行亞克隆。質粒DNA自多種大腸桿菌轉化體提取并加以測序。所述大腸桿菌克隆的測序分析顯示所述序列包含家族61gh61j基因的編碼區。實施例5自嗜熱毀絲霉CBS202.75分離全長家族61基因(gh61j)來自嗜熱毀絲霉CBS202.75的全長家族61基因(gh61j)使用GEN0MEWALKERUniversalKit(ClontechLaboratories,Inc.,MountainView,CA,USA)根據生產商的指示分離。簡言之,將來自嗜熱毀絲霉CBS202.75的總基因組DNA用四種不同的產生平端的限制性酶(DraI.EcoRV.PvuII和StuI)分別進行消化。將每批經消化的基因組DNA隨即分別連接至GEN0MEWALKERAdaptor(ClontechLaboratories,Inc.,MountainView,CA,USA)以構建四個文庫。這些文庫隨即在使用嗜熱毀絲霉家族61gh61j基因的基因特異性引物的PCR反應中用作模板。如下所示的引物是基于在實施例4中獲得的部分家族61基因序列設計的。上游區域引物MtGH6IJ-Fl:5,-CGCTCCCAACAACAACAACCCCGTGCAGA-3,(SEQIDNO10)MtGH61J-F2:5,-GGCCAGTCGGGATCGACGTCGAACACTATCAT-3,(SEQIDNO11)下游區域引物MtGH6IJ-Rl:5,-CGACTTGGCAATCGGGTTGTCTGGGTCGTT-3,(SEQIDNO12)MtGH61J-R2:5,-CCGACTGGCCGCAGATCATGTCCTGGCT-3,(SEQIDNO13)進行兩個初步的PCR擴增,一個分離嗜熱毀絲霉gh61j基因的上游區域,而另一個分離其下游區域。每個PCR擴增反應物(25μ1)由作為模板的每種Iyl(大約6ng)的文庫,每種0.4mM的dATP、dTTP、dGTP和dCTP,IOpmol的AdaptorPrimer1(ClontechLaboratories,Inc.,MountainView,CA,USA),IOpmol的引物MtGH6IJ-Rl或引物MtGH61J-Fl,IXADVANTAGEGC-MeltLABuffer以及1.25單位的ADVANTAGE;GCGenomicPolymeraseMix組成。所述擴增使用EPPENDORFMASTERCYCLER5333來進行,其程序設置為94°C下預變性1分鐘,7個循環,每個循環為在94°C的變性溫度下進行30秒、在72°C下退火并延伸5分鐘,以及32個循環,每個循環為在94°C的變性溫度下進行30秒、在67°C下退火并延伸5分鐘,繼以67°C下最終延伸7分鐘。二次擴增反應物由作為模板的每種1μ1的初步PCR產物,每種0.4mM的dATP、dTTP、dGTP禾口dCTP,IOpmol的AdaptorPrimer2(ClontechLaboratories,Inc.,MountainView,CA,USA),IOpmol的嵌套引物(nestedprimer)MtGH61J-R2或MtGH61J_F2,IXADVANTAGEGC-MeltLABuffer以及1.25單位的ADVANTAGEGCGenomicPolymeraseMix組成,終體積為25μ1。所述擴增使用EPPENDORFMASTERCYCLER5333來進行,其程序設置為94°C下預變性1分鐘,5個循環,每個循環為在94°C的變性溫度下進行30秒、在72°C下退火并延伸5分鐘,以及20個循環,每個循環為在94°C的變性溫度下進行30秒,在67°C下退火并延伸5分鐘,繼以67°C下最終延伸7分鐘。所得反應產物通過1.0%瓊脂糖凝膠電泳在TAE緩沖液中進行分離,其中將來自StuI文庫的1.3kbPCR產物(上游區域)和來自PvuII文庫的1.4kbPCR片段(下游區域)自所述凝膠切出,使用MINELUTEGelExtractionKit(QIAGENInc.,Valencia,CA,USA)根據生產商的指示進行純化。將所得PCR產物直接測序或使用Τ0Ρ0TAKit亞克隆后再進行測序。實施例6編碼具有纖維素分解增強活性的家族GH61J多肽的嗜熱毀絲霉基因組序列的表征對PCR片段的DNA測序用Perkin-ElmerAppliedBiosystemsModel377XLAutomatedDNASequencer(Perkin-Elmer/AppliedBiosystems,Inc.,FosterCity,CA,USA)使用染料終止化學(Giesecke等,1992,JournalofVirologyMethods38:47_60)和引物步移策略來進行。細查核苷酸序列數據的質量,并在PHRED/PHRAP軟件(UniversityofWashington,Seattle,WA,USA)的協助下將所有序列相互比較。基于編碼的蛋白質與來自土生梭孢霉(登錄號GENESEQP:ADM97933、GENESEQPAEB90517)、球毛殼霉(Chaetomiumglobosum)(UNIPR0T:Q2HGH1,UNIPR0T:Q2GW98)和粗糙脈孢霉(UNIPR0T:Q7S439)的同源糖苷水解酶家族61蛋白質的相似性構建了具有纖維素分解增強活性的嗜熱毀絲霉GH61J多肽的基因模型。為驗證獲取的所述嗜熱毀絲霉gh61j基因的序列信息,使用一對基因特異性引物(如下所示)進行了進一步的PCR反應,所述引物對涵蓋了整個基因。引物MtGH61J_F45,-ACTGGATTTACCATGAAGCTCTCCCTCTTCTC-3,(SEQIDNO14)引物MtGH61J_R35,-TCACCTCTAGTTAATTAATCAGCAGGAGATGGGCGCGG-3,(SEQIDNO15)52粗體字母代表編碼序列。剩余序列與pAILo2(W02004/099228)的插入位點同源。所述PCR由在終體積50μ1中,由IOOng的嗜熱毀絲霉CBS202.75基因組DNA、PfxAmplificationBuffer(Invitrogen,Carlsbad,CA,USA)、禾中0.4mM白勺dATP>dTTP、dGTP禾ΠdCTPUmMMgCl2以及2·5單位的PfxDNA聚合酶(Invitrogen,Carlsbad,CA,USA)組成的PCR反應物中的50皮摩爾的正向和反向引物組成。所述擴增使用EPPEND0RFMASTERCYCLER.5333來進行,其程序設置為1個循環的98°C下3分鐘,以及30個循環,每個循環為在98°C下30秒、60°C下30秒和72°C下1.5分鐘,繼以72°C下最終延伸15分鐘。加熱塊隨即進行4°C的浸泡循環(soakcycle)。所得反應產物通過1.0%瓊脂糖凝膠電泳在TAE緩沖液中進行分離,并使用MINELUTEGelExtractionKit根據生產商的指示進行純化。將844bp的嗜熱毀絲霉gh61j基因片段使用ZEROBLUNTT0P0PCRCloningKit(Invitrogen,Carlsbad,CA,USA)克隆入pCR.4Blunt_T0P0載體以產生pSMail87(圖2)。所得嗜熱毀絲霉gh61j插入物通過DNA測序來確證。大腸桿菌pSMail87在2007年12月5日保藏于農業研究機構專利培養物保藏中心,亦稱農業研究培養物保藏中心(AgriculturalResearchServicePatentCultureCollection),北區石if究中心(NorthernRegionalResearchCenter),Peoria,IL,USA并被指定了登錄號B-50087。具有纖維素分解增強活性的嗜熱毀絲霉GH61J多肽的核苷酸序列(SEQIDN01)和推導的氨基酸序列(SEQIDNO2)示于圖1。所述基因組多核苷酸編碼246個氨基酸的多肽,其由73bp的一個內含子打斷。全長編碼序列和成熟編碼序列的%G+C含量分別為62.0%和62.2%o使用SignalP軟件程序(Nielsen等,1997,ProteinEngineering10:1-6),預測出19個殘基的信號肽。預測的成熟蛋白質含有227個氨基酸,其分子量為24.lkDa。對氨基酸序列的比較性配對全局比對(comparativepairwiseglobalalignment)使用如EMBOSS的Needle程序中所執行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443_453)來確定,使用缺口產生罰分10,缺口延伸罰分0.5以及EBL0SUM62矩陣。所述比對顯示了所述嗜熱毀絲霉GH61J成熟多肽推導的氨基酸序列與來自球毛殼霉的家族61糖苷水解酶蛋白推導的氨基酸序列(UniProt登錄號Q2GW98)分享80.的同一性(排除缺口)。實施例7構建含有編碼具有纖維素分解增強活性的家族GH61J多肽的嗜熱毀絲霉CBS202.75基因組序列的米曲霉表達載體將在實施例6中產生的同一個844bp嗜熱毀絲霉gh61jPCR片段使用InfusionCloningKit(BDBiosciences,PaloAlto,CA,USA)克隆入經NcoI和PacI消化的pAILo2(W02004/099228),得到pSMail86(圖3),其中將嗜熱毀絲霉gh61j基因的轉錄置于來自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸異構酶基因的啟動子的雜合體(NA2-tpi啟動子)控制下。連接反應物(50μ1)由IXInFusionBuffer(BDBiosciences,PaloAlto,CA,USA)、IXBSA(BDBiosciences,PaloAlto,CA,USA)、1μ1的Infusion酶(110稀釋)(BDBiosciences,PaloAlto,CA,USA)、IOOng經NcoI和PacI消化的pAlLo2以及50ng的嗜熱毀絲霉gh61j純化PCR產物組成。所述反應物在室溫下溫育30分鐘。將1μ1的反應物用于轉化大腸桿菌XLlOS0L0PACKGoldSupercompetent細胞(Stratagene,LaJolla,CA,USA)。含有pSMail86的大腸桿菌轉化體通過限制性酶消化檢測出來,并使用BI0R0B0T9600(QIAGENInc.,Valencia,CA,USA)制備了質粒DNA。通過DNA測序確認了pSMail86中的嗜熱毀絲霉gh61j插入物。實施例8在米曲霉JaL355中表達嗜熱毀絲霉家族61糖基水解酶基因(gh61j)米曲霉JaL355(W02002/40694)原生質體根據Christensen等,1988,Bio/Technology61419-1422的方法來制備。將3μg的pSMail86轉化入米曲霉JaL355原生質體。自所述轉化實驗,將二十個轉化體分離到單獨的基本培養基平板上。將每種轉化體的匯合的基本培養基平板用5ml的0.01%TffEEN20進行洗滌,并分別接種入25ml在125ml玻璃搖瓶的M410培養基中,并在34°C下以250rpm溫育。在溫育5天后,對來自每個培養物的5μ1上清在CRITERI0N8-16%Tris-HClSDS-PAGE凝膠上使用CRITERIONCell(Bio-RadLaboratories,Hercules,CA,USA)根據生產商的指示進行分析。所得的凝膠用BIO-SAFECoomassieStain(Bio-RadLaboratories,Hercules,CA,USA)進行染色。所述培養物的SDS-PAGE概貌(profile)顯示大多數轉化體具有期待的24kDa的條帶尺寸。生物材料的保藏依據布達佩斯條約的條款,下述的生物材料已經保藏于農業研究機構專、…一_x^"-^"-·"-·—^~""*>—“―__________—^------------------------ServicePatentCultureCollection),北區研究中心(NorthernRegionalResearchCenter),1815UniversityStreet,Peoria,Illinois,61604,并給予下迷進登錄號大腸桿菌pSMail87NRRLB-500872007年12曰所述菌株于下述條件下保藏確保在本專利申請未決期間,由外國專利法律決定授權的人能夠獲得所述培養物。所述保藏物為所保藏菌株的基本上純的培養物。在提交了題述申請的對應申請或其子申請(progeny)的國家中,依據該外國專利法律的要求,可以獲得所述保藏物。然而,應當理解,保藏物的可獲得性并不構成對實施題述發明的許可,實施題述發明是對政府行為所授予的專利權的侵犯。序列;下雜交本發明進一步由下述編號的段落描述一種具有纖維素分解增強活性的分離的多肽,其選自下組(a)一種多肽,其包含與SEQIDNO:2的成熟多肽具有至少60%同一性的氨基酸(b)一種由如下多核苷酸編碼的多肽,所述多核苷酸在至少中等嚴緊條件下與以(i)SEQIDNO1的成熟多肽編碼序列,(ii)包含于SEQIDNO1的成熟多肽編碼序列中的cDNA序列,或(iii)(i)或(ii)的全長互補鏈;(c)一種由如下多核苷酸編碼的多肽,所述多核苷酸包含與SEQIDN0:1的成熟54多肽編碼序列具有至少60%同一性;和(d)一種變體,其包含取代、缺失和/或插入一個或多個(幾個)氨基酸的SEQIDNO2的成熟多肽。[2]段落1的多肽,基酸序列。[3]段落2的多肽,基酸序列。[4]段落3的多肽,基酸序列。[5]段落4的多肽,基酸序列。[6]段落5的多肽,基酸序列。[7]段落6的多肽,基酸序列。[8]段落7的多肽,基酸序列。[9]段落8的多肽,基酸序列。[10]段落1的多肽,其包含SEQIDNO2的氨基酸序列或其具有纖維素分解增強活性的片段,或者由SEQIDNO:2的氨基酸序列或其具有纖維素分解增強活性的片段組成。[11]段落10的多肽,其包含SEQIDNO2的氨基酸序列,或者由SEQIDNO2的氨基酸序列組成。[12]段落10的多肽,其包含SEQIDNO2的成熟多肽,或者由SEQIDNO2的成熟多肽組成。[13]段落1的多肽,其是由在至少中等嚴緊條件下與以下雜交的多核苷酸編碼的(i)SEQIDNO1的成熟多肽編碼序列,(ii)包含于SEQIDNO1的成熟多肽編碼序列中的cDNA序列,或(iii)⑴或()的全長互補鏈。[14]段落13的多肽,其是由在至少中等嚴緊條件下與以下雜交的多核苷酸編碼的(i)SEQIDNO1的成熟多肽編碼序列,(ii)包含于SEQIDNO1的成熟多肽編碼序列中的cDNA序列,或(iii)⑴或()的全長互補鏈。[15]段落14的多肽,其是由在至少中等嚴緊條件下與以下雜交的多核苷酸編碼的(i)SEQIDNO1的成熟多肽編碼序列,(ii)包含于SEQIDNO1的成熟多肽編碼序列中的cDNA序列,或(iii)⑴或()的全長互補鏈。[16]段落1的多肽,其是由包含與SEQIDNO1的成熟多肽編碼序列具有至少60%同一性的核苷酸序列的多核苷酸編碼的。[17]段落16的多肽,其是由包含與SEQIDNO1的成熟多肽編碼序列具有至少65%同一性的核苷酸序列的多核苷酸編碼的。[18]段落17的多肽,其是由包含與SEQIDNO1的成熟多肽編碼序列具有至少其包含與SEQIDNO2的成熟多肽具有至少60%同一性的氨其包含與SEQIDNO2的成熟多肽具有至少65%同一性的氨其包含與SEQIDNO2的成熟多肽具有至少70%同一性的氨其包含與SEQIDNO2的成熟多肽具有至少75%同一性的氨其包含與SEQIDNO2的成熟多肽具有至少80%同一性的氨其包含與SEQIDNO2的成熟多肽具有至少85%同一性的氨其包含與SEQIDNO2的成熟多肽具有至少90%同一性的氨其包含與SEQIDNO2的成熟多肽具有至少95%同一性的氨70%同一性的核苷酸序列的多核苷酸編碼的。[19]段落18的多肽,其是由包含與SEQIDNO1的成熟多肽編碼序列具有至少75%同一性的核苷酸序列的多核苷酸編碼的。[20]段落19的多肽,其是由包含與SEQIDNO1的成熟多肽編碼序列具有至少80%同一性的核苷酸序列的多核苷酸編碼的。[21]段落20的多肽,其是由包含與SEQIDNO:1的成熟多肽編碼序列具有至少85%同一性的核苷酸序列的多核苷酸編碼的。[22]段落21的多肽,其是由包含與SEQIDNO1的成熟多肽編碼序列具有至少90%同一性的核苷酸序列的多核苷酸編碼的。[23]段落22的多肽,其是由包含與SEQIDNO:1的成熟多肽編碼序列具有至少95%同一性的核苷酸序列的多核苷酸編碼的。[24]段落1的多肽,其是由如下多核苷酸編碼的,所述多核苷酸包含SEQIDNO1的核苷酸序列或其編碼具有纖維素分解增強活性的片段的亞序列,或由SEQIDN0:1或其編碼具有纖維素分解增強活性的片段的亞序列組成。[25]段落24的多肽,其是由如下多核苷酸編碼的,所述多核苷酸包含SEQIDNO1的核苷酸序列,或由SEQIDNO1的核苷酸序列組成。[26]段落24的多肽,其是由如下多核苷酸編碼的,所述多核苷酸包含SEQIDNO1的成熟多肽編碼序列,或由SEQIDNO1的成熟多肽編碼序列組成。[27]段落1的多肽,其中所述多肽是變體,其包含取代、缺失和/或插入一個或多個(幾個)氨基酸的SEQIDNO2的成熟多肽。[28]段落1的多肽,其是由包含于質粒pSMail87中的多核苷酸編碼的,所述質粒pSMail87包含于大腸桿菌NRRLB-50087中。[29]段落1-28任一所述的多肽,其中所述成熟多肽為SEQIDNO2的氨基酸19到323。[30]段落1-29任一所述的多肽,其中所述成熟多肽編碼序列為SEQIDNO1的核苷酸55到1239。[31]一種分離的多核苷酸,其包含編碼段落1-30任一所述的多肽的核苷酸序列。[32]段落31的分離的多核苷酸,其在SEQIDNO1的成熟多肽編碼序列中包含至少一個突變,其中所述突變核苷酸序列編碼SEQIDNO:2的成熟多肽。[33]一種核酸構建體,其包含段落31或32的多核苷酸,所述多核苷酸可操作地連接于一個或多個(幾個)控制序列,所述控制序列在表達宿主中指導該多肽的產生。[34]一種重組表達載體,其包含段落33的核酸構建體。[35]一種重組宿主細胞,其包含段落33的核酸構建體。[36]一種產生段落1-30任一所述多肽的方法,包括(a)在有助于該多肽產生的條件下培養細胞,所述細胞以其野生型形式產生該多肽;和(b)回收所述多肽。[37]一種產生段落1-30任一所述多肽的方法,包括(a)在有助于該多肽產生的條件下培養宿主細胞,所述宿主細胞包含核酸構建體,所述核酸構建體包含編碼該多肽的核苷酸序列;和(b)回收所得多肽。[38]一種產生親本細胞的突變體的方法,包括破壞或缺失編碼段落1-30任一所56述多肽的核苷酸序列,其導致所述突變體與所述親本細胞相比產生較少的該多肽。[39]一種突變體細胞,其是由段落38的方法產生的。[40]段落39的突變體細胞,進一步包含編碼天然或異源蛋白質的基因。[41]一種產生蛋白質的方法,包括(a)在有助于產生所述蛋白質的條件下培養段落40的突變體細胞;和(b)回收該蛋白質。[42]段落31或32所述的分離的多核苷酸,通過下述方法獲取(a)在至少高嚴緊條件下將DNA群體與下述雜交(i)SEQIDNO=I的成熟多肽編碼序列;(ii)包含于SEQIDNO1的成熟多肽編碼序列中的cDNA序列,或(iii)⑴或(ii)的全長互補鏈;和(b)分離所得雜交的多核苷酸,其編碼具有纖維素分解增強活性的多肽。[43]段落42的分離的多核苷酸,其中所述成熟多肽編碼序列為SEQIDNO1的核苷酸55到1239。[44]一種產生包含突變體核苷酸序列的多核苷酸的方法,所述突變體核苷酸序列編碼具有纖維素分解增強活性的多肽,所述方法包括(a)將至少一種突變導入SEQIDNO1的成熟多肽編碼序列中,其中所述突變體核苷酸序列編碼包含SEQIDNO:2的成熟多肽或由SEQIDNO2的成熟多肽組成的多肽;和(b)回收包含所述突變體核苷酸序列的多核苷酸。[45]一種由段落44的方法產生的突變體多核苷酸。[46]一種產生多肽的方法,包括(a)在有助于所述多肽產生的條件下培養包含編碼所述多肽的段落45的突變體多核苷酸的細胞;和(b)回收所述多肽。[47]一種產生段落1-30任一所述多肽的方法,包括(a)在有助于產生所述多肽的條件下培養轉基因植物或植物細胞,所述轉基因植物或植物細胞包含編碼所述多肽的多核苷酸;和(b)回收所述多肽。[48]一種轉基因植物、植物部分或植物細胞,其使用編碼段落1-30任一所述的多肽的多核苷酸轉化的。[49]一種雙鏈抑制性RNA(dsRNA)分子,其包含段落31或32的多核苷酸的亞序列,其中所述dsRNA任選地為siRNA或miRNA分子。[50]段落49的雙鏈抑制性RNA(dsRNA)分子,其在長度上為約15、16、17、18、19、20、21、22、23、24、25或更多個雙鏈核苷酸。[51]一種在細胞中抑制具有纖維素分解增強活性的多肽表達的方法,其包括對所述細胞施用或在所述細胞中表達雙鏈RNA(dsRNA)分子,其中所述dsRNA包含段落31或32的多核苷酸的亞序列。[52]段落51的方法,其中所述dsRNA在長度上為約15、16、17、18、19、20、21、22、23、24、25或更多個雙鏈核苷酸。[53]一種核酸構建體,其包含與編碼信號肽的核苷酸序列可操作地連接的編碼蛋白質的基因,所述信號肽包含SEQIDNO2的氨基酸1到19,或由SEQIDNO2的氨基酸1到19組成,其中所述基因對于所述核苷酸序列為外源的。[54]一種重組表達載體,其包含段落53的核酸構建體。[55]一種重組宿主細胞,其包含段落53的核酸構建體。[56]一種產生蛋白質的方法,包括(a)在有助于產生所述蛋白質的條件下培養段落55所述的重組宿主細胞;和(b)回收所述蛋白質。[57]一種降解或轉化纖維素材料的方法,包括用纖維素分解酶組合物在段落1-30任一所述的具有纖維素分解增強活性的多肽存在下處理所述纖維素材料,其中所述具有纖維素分解增強活性的多肽的存在與所述具有纖維素分解增強活性的多肽不存在時相比增加了纖維素材料的降解。[58]段落57的方法,其中所述纖維素材料是經預處理的。[59]段落57或58的方法,其中所述纖維素分解酶組合物包含一種或多種纖維素分解酶,其選自下組纖維素酶、內切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。[60]段落57-59任一所述的方法,進一步包括用一種或多種選自下組的酶處理所述纖維素材料半纖維素酶、酯酶、蛋白酶、漆酶或過氧化物酶。[61]段落57-60任一所述的方法,進一步包括回收所述降解的纖維素材料。[62]段落61的方法,其中所述降解的纖維素材料是糖。[63]段落62的方法,其中所述糖選自下組葡萄糖、木糖、甘露糖、半乳糖和阿拉伯糖。[64]一種產生發酵產物的方法,包括(a)用纖維素分解酶組合物在段落1-20任一所述的具有纖維素分解增強活性的多肽存在下糖化纖維素材料,其中所述具有纖維素分解增強活性的多肽的存在與所述具有纖維素分解增強活性的多肽不存在時相比增加了纖維素材料的降解;(b)用一種或多種發酵微生物發酵步驟(a)的經糖化的纖維素材料以產生所述發酵產物;和(c)自所述發酵回收所述發酵產物。[65]段落64的方法,其中所述纖維素材料是經預處理的。[66]段落64或65的方法,其中所述纖維素分解酶組合物包含一種或多種選自下組的纖維素分解酶纖維素酶、內切葡聚糖酶、纖維二糖水解酶和β“葡糖苷酶。[67]段落64-66任一所述的方法,進一步包括用一種或多種選自下組的酶處理所述纖維素材料半纖維素酶、酯酶、蛋白酶、漆酶或過氧化物酶。[68]段落64-67任一所述的方法,其中步驟(a)和(b)在同時糖化和發酵中同時進行。[69]段落64-68任一所述的方法,其中所述發酵產物是醇、有機酸、酮、氨基酸或氣體。[70]一種發酵纖維素材料的方法,包括用一種或多種發酵微生物發酵所述纖維素材料,其中將所述纖維素材料用纖維素分解酶組合物在段落1-30任一所述的具有纖維素分解增強活性的多肽的存在下糖化,且所述具有纖維素分解增強活性的多肽的存在與所述具有纖維素分解增強活性的多肽不存在時相比增加了纖維素材料的降解。[71]段落70的方法,其中所述纖維素材料的發酵產生發酵產物。[72]段落71的方法,進一步包括從所述發酵回收所述發酵產物。[73]段落70-72任一所述的方法,其中所述纖維素材料在糖化前經預處理。[74]段落70-73任一所述的方法,其中所述纖維素分解酶組合物包含一種或多種選自下組的纖維素分解酶纖維素酶、內切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。58[75]段落70-74任一所述的方法,其中所述纖維素分解酶組合物進一步包含一種或多種選自下組的酶半纖維素酶、酯酶、蛋白酶、漆酶或過氧化物酶。[76]段落70-75任一所述的方法,其中所述發酵產物是醇、有機酸、酮、氨基酸或氣體。在本文中描述和要求保護的發明在范圍上并不受本文公開的特定方面所限,這是因為這些方面的意圖為說明本發明的數個方面。任何等價的方面應認為在本發明的范圍內。事實上,除本文中顯示和描述的那些之外,數種對本發明的修改從前述的描述而言對本領域技術人員將顯而易見。上述修改亦意欲符合所附權利要求的范圍。在出現沖突的情況下,以包括定義在內的本公開為準。權利要求一種具有纖維素分解增強活性的分離的多肽,其選自下組(a)一種多肽,其包含與SEQIDNO2的成熟多肽具有至少60%同一性的氨基酸序列;(b)一種由如下多核苷酸編碼的多肽,所述多核苷酸在至少中等嚴緊條件下與以下雜交(i)SEQIDNO1的成熟多肽編碼序列,(ii)包含于SEQIDNO1的成熟多肽編碼序列中的cDNA序列,或(iii)(i)或(ii)的全長互補鏈;(c)一種由如下多核苷酸編碼的多肽,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少60%同一性的核苷酸序列;和(d)一種變體,其包含取代、缺失和/或插入一個或多個(幾個)氨基酸的SEQIDNO2的成熟多肽。2.權利要求1的多肽,其包含SEQIDNO:2的氨基酸序列或其具有纖維素分解增強活性的片段,或由SEQIDNO:2的氨基酸序列或其具有纖維素分解增強活性的片段組成。3.權利要求1的多肽,其是由包含于質粒pSMail87中的多核苷酸編碼的,所述質粒pSMail87包含于大腸桿菌NRRLB-50087中。4.一種分離的多核苷酸,其包含編碼權利要求1-3任一所述的多肽的核苷酸序列。5.一種核酸構建體,其包含權利要求4的多核苷酸,所述多核苷酸可操作地連接于一個或多個(幾個)控制序列,所述控制序列在表達宿主中指導該多肽的產生。6.一種重組宿主細胞,其包含權利要求5的核酸構建體。7.—種產生權利要求1-3任一所述多肽的方法,包括(a)在有助于該多肽產生的條件下培養細胞,所述細胞以其野生型形式產生該多肽;和(b)回收所述多肽。8.—種產生權利要求1-3任一所述多肽的方法,包括(a)在有助于該多肽產生的條件下培養宿主細胞,所述宿主細胞包含含有編碼該多肽的核苷酸序列的核酸構建體;和(b)回收所述多肽。9.一種產生親本細胞突變體的方法,包括破壞或缺失編碼權利要求1-3任一所述多肽的核苷酸序列,其導致所述突變體與所述親本細胞相比產生較少的該多肽。10.一種產生權利要求1-3任一所述多肽的方法,包括(a)在有助于產生所述多肽的條件下培養轉基因植物或植物細胞,所述轉基因植物或植物細胞包含編碼所述多肽的多核苷酸;和(b)回收所述多肽。11.一種轉基因植物、植物部分或植物細胞,其是用編碼權利要求1-3任一所述的多肽的多核苷酸轉化的。12.—種雙鏈抑制性RNA(dsRNA)分子,其包含權利要求4的多核苷酸的亞序列,其中所述dsRNA任選地為siRNA或miRNA分子。13.—種在細胞中抑制具有纖維素分解增強活性的多肽表達的方法,包括對所述細胞施用或在所述細胞中表達雙鏈RNA(dsRNA)分子,其中所述dsRNA包含權利要求4的多核苷酸的亞序列。14.一種核酸構建體,其包含與編碼信號肽的核苷酸序列可操作地連接的編碼蛋白質的基因,所述信號肽包含SEQIDNO2的氨基酸1到19,或由SEQIDNO2的氨基酸1到19組成,其中所述基因對于所述核苷酸序列是外源的。15.一種重組宿主細胞,其包含權利要求14的核酸構建體。16.一種產生蛋白質的方法,包括(a)在有助于產生所述蛋白質的條件下培養權利要求15所述的重組宿主細胞;和(b)回收所述蛋白質。17.一種降解或轉化纖維素材料的方法,包括用纖維素分解酶組合物在權利要求1-3任一所述的具有纖維素分解增強活性的多肽存在下處理所述纖維素材料,其中所述具有纖維素分解增強活性的多肽的存在與所述具有纖維素分解增強活性的多肽不存在時相比增加了所述纖維素材料的降解。18.權利要求17的方法,進一步包括回收所述經降解的纖維素材料。19.一種產生發酵產物的方法,包括(a)用纖維素分解酶組合物在權利要求1-3任一所述的具有纖維素分解增強活性的多肽存在下糖化纖維素材料,其中所述具有纖維素分解增強活性的多肽的存在與所述具有纖維素分解增強活性的多肽不存在時相比增加了所述纖維素材料的降解;(b)用一種或多種發酵微生物發酵步驟(a)的經糖化的纖維素材料以產生所述發酵產物;和(c)自所述發酵回收所述發酵產物。20.一種發酵纖維素材料的方法,包括用一種或多種發酵微生物發酵所述纖維素材料,其中在權利要求1-3任一所述的具有纖維素分解增強活性的多肽存在下將所述纖維素材料用纖維素分解酶組合物糖化,并且所述具有纖維素分解增強活性的多肽的存在與所述具有纖維素分解增強活性的多肽不存在時相比增加了所述纖維素材料的降解。全文摘要本發明涉及具有纖維素分解增強活性的分離的多肽和編碼該多肽的分離的多核苷酸。本發明還涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞以及產生和使用所述多肽的方法。文檔編號C12N15/74GK101945889SQ200880127124公開日2011年1月12日申請日期2008年12月17日優先權日2007年12月19日發明者保羅·哈里斯,蘇欽德拉·梅尤蘭,金伯利·布朗申請人:諾維信公司