具有纖維二糖水解酶活性的多肽及編碼該多肽的多核苷酸的制作方法【專利摘要】本發明涉及具有纖維二糖水解酶活性的分離的多肽,以及編碼所述多肽的分離的多核苷酸。本發明還涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞,以及用于制備和使用所述多肽的方法。【專利說明】具有纖維二糖水解酶活性的多肽及編碼該多肽的多核苷酸[0001]對于在聯邦資助的研究和開發下完成的發明的權利的聲明[0002]本發明是部分地在由能源部授予的合作協議(CooperativeAgreement)DE-FC36-08G018080下以政府支持完成的。政府在本發明中具有一定權利。[0003]涉及序列表[0004]本申請包含計算機可讀形式的序列表,其通過提述并入本文。[0005]發明背景【
技術領域:
】[0006]本發明涉及具有纖維二糖水解酶活性的多肽,和編碼所述多肽的多核苷酸。本發明亦涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞,以及產生和使用所述多肽的方法。【
背景技術:
】[0007]纖維素是葡萄糖通過β-1,4-鍵連接的聚合物。許多微生物產生水解β-連接的葡聚糖的酶。這些酶包括內切葡聚糖酶、纖維二糖水解酶和葡糖苷酶。內切葡聚糖酶在隨機位置消化纖維素聚合物,將其打開以受到纖維二糖水解酶攻擊(attack)。纖維二糖水解酶從纖維素聚合物的末端順序地釋放纖維二糖的分子。纖維二糖是水溶性的β-1,4-連接的葡萄糖二聚體。β-葡糖苷酶將纖維二糖水解成葡萄糖。[0008]將含木素纖維素原料(lignocellulosicfeedstock)轉化為乙醇具有以下優勢:大量原料現成可用,避免燃燒或填埋材料的合意性和乙醇燃料的清潔性。木材、農業殘余物、草本作物和城市固體廢物被認為是用于乙醇生產的原料。這些材料主要由纖維素、半纖維素和木質素組成。一旦將纖維素轉化成葡萄糖,葡萄糖容易地由酵母發酵成乙醇。因為葡萄糖容易地由多種酵母發酵為乙醇,而纖維二糖卻不這樣,所以任何在水解終止時殘留的纖維二糖代表乙醇產量的喪失。更重要的是,纖維二糖是內切葡聚糖酶和纖維二糖水解酶的強力抑制劑。在水解過程中纖維二糖的累積對于乙醇產生是不合意的。[0009]本發明提供了具有纖維二糖水解酶活性的多肽和編碼所述多肽的多核苷酸。[0010]根據本發明具有纖維二糖水解酶活性的多肽與來自煙曲霉的預測的GH6家族蛋白(登錄號GENESEQP:ABB80166)的推導的氨基酸序列具有80.4%同一性(排除缺口)。【
發明內容】[0011]本發明涉及具有纖維二糖水解酶活性的分離的多肽,其選自下組:[0012](a)多肽,其與SEQIDNO:2的成熟多肽具有至少81%序列同一性;[0013](b)多肽,其由多核苷酸編碼,所述多核苷酸在低、或中等、或中等-高、或高、或非常高嚴格條件下與以下雜交:(i)SEQIDNO:1的成熟多肽編碼序列,(ii)其cDNA序列,或(iii)(i)或(ii)的全長互補物;[0014](C)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1的成熟多肽編碼序列,或它們的cDNA序列具有至少60%序列同一性;[0015](d)SEQIDNO:2的成熟多肽在一個或多個(例如幾個)位置包含取代、缺失和/或插入的變體;和[0016](e)(a)、(b)、(c)或(d)的多肽的具有纖維二糖水解酶活性的片段。[0017]本發明亦涉及分離的多肽,其包含催化域,所述催化域選自下組:[0018](a)催化域,其與SEQIDNO:2的催化域(例如,SEQIDNO:2的氨基酸105至464)具有至少81%序列同一性;[0019](b)催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:1的催化域編碼序列(例如,SEQIDNO:1的核苷酸460-599,678-931,1001-1138,1210-1470,1541-1782,和1854-1895)具有至少60%序列同一性;[0020](C)SEQIDNO:2的催化域的包含一個或多個(幾個)氨基酸取代、缺失和/或插入的催化域變體;和[0021](d)(a)、(b)或(C)的催化域的具有纖維二糖水解酶活性的片段。[0022]本發明亦涉及編碼本發明的多肽的分離的多核苷酸,包含所述多核苷酸的核酸構建體、重組表達載體、重組宿主細胞;和產生所述多肽的方法。[0023]本發明亦涉及降解纖維素材料的工藝,其包括:在本發明的具有纖維二糖水解酶活性的多肽的存在下用酶組合物處理纖維素材料。在一個方面,所述工藝進一步包括回收經降解或轉化的纖維素材料。[0024]本發明亦涉及產生發酵`產物的工藝,其包括:(a)在本發明的具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化纖維素材料;(b)用一種或多種(例如幾種)發酵微生物發酵經糖化的纖維素材料以產生發酵產物;和(C)從發酵回收發酵產物。[0025]本發明亦涉及發酵纖維素材料的工藝,其包括用一種或多種(例如幾種)發酵微生物發酵所述纖維素材料,其中所述纖維素材料在本發明具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化。在一個方面,纖維素材料的發酵產生發酵產物。在另一個方面,所述工藝進一步包括從發酵回收發酵產物。[0026]本發明亦涉及編碼信號肽的多核苷酸,所述信號肽包含或組成為(consistof)SEQIDNO:2的氨基酸I至18,其可操作地連接于編碼蛋白的基因;包含所述多核苷酸的核酸構建體、表達載體和重組宿主細胞;和產生蛋白的方法。[0027]定義[0028]纖維二糖水解酶:術語“纖維二糖水解酶”意指l,4-13_D-葡聚糖纖維二糖水解酶(I,4-beta-D-glucancellobiohydrolase)(E.C.3.2.1.91),其催化纖維素、纖維寡糖,或任何包含β-1,4-連接的葡萄糖的聚合物中的1,4-β-D-糖苷鍵的水解,從鏈的還原或非還原末端釋放纖維二糖(Teeri,1997,Crystallinecellulosedegradation:Newinsightintothefunctionofcellobiohydrolases,TrendsinBiotechnology15:160-167;Teeri等,1998,Trichodermareeseicellobiohydrolases:whysoefficientoncrystallinecellulose?,Biochem.Soc.Trans.26:173-178)。根據Lever等,1972,Anal.Biochem.47:273-279;vanTilbeurgh等,1982,FEBSLettersl49:152-156;vanTilbeurgh和Claeyssens,1985,FEBSLetters187:283-288;以及Tomme等,1988,Eur.J.Biochem.170:575-581描述的方法確定纖維二糖水解酶活性。在本發明中,Tomme等的方法可用于確定纖維二糖水解酶活性。[0029]在一個方面,本發明的多肽具有SEQIDNO:2的成熟多肽的纖維二糖水解酶活性的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%,或至少100%ο[0030]乙酰木聚糖酯酶:術語“乙酰木聚糖酯酶”意指羧基酯酶(EC3.1.1.72),其催化乙酰基從聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α-萘酯(alpha-napthylacetate)和乙酸對硝基苯酯(p-nitrophenylacetate)的水解。就本發明而言,乙酰木聚糖酯酶活性是使用含有0.01%TWEEN?20(聚氧乙烯山梨聚糖單月桂酸酯)的50mM乙酸鈉pH5.0中的0.5mM乙酸對硝基苯酯作為底物確定的。一個單位的乙酰木聚糖酯酶定義為能夠在pH5,25°C每分鐘釋放I微摩爾對硝基苯酹陰離子(p-nitrophenolateanion)的酶量。[0031]等位變體(allelicvariant):術語“等位變體”意指占據相同染色體基因座的基因的任何兩種或更多種可選形式。等位變異通過突變天然地發生,并且可導致種群內的多態性。基因突變可以是沉默的(在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。[0032]a-L-阿拉伯呋喃糖苷酶:術語“a_L_阿拉伯呋喃糖苷酶”意指a_L_阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC3.2.1.55),其催化對a-L-阿拉伯糖苷中的末端非還原性a-L-阿拉伯呋喃糖苷殘基的水解。該酶對a-L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)_鍵的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也稱為阿拉伯糖苷酶、α-阿拉伯糖苷酶、a-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖a-L-阿拉伯呋喃糖苷酶、a-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或a-L-阿拉伯聚糖酶。就本發明而言,a-L-阿拉伯呋喃糖苷酶活性是使用總體積200μI中的每ml的IOOmM乙酸鈉pH5中5mg的中等粘度小麥阿拉伯木聚糖(MegazymeInternationalIreland,Ltd.,Bray,C0.Wicklow,Ireland)在4CTC進行30分鐘,接著通過AMINEXj?HPX-87H柱層析(Bio-RadLaboratories,Inc.,Hercules,CA,USA)的阿拉伯糖分析來確定的。[0033]α-葡糖醛酸糖苷酶:術語“α-葡糖醛酸糖苷酶”意指a_D_葡糖苷酸葡糖醛酸水解酶(alpha-D-glucosiduronateglucuronohydrolase)(EC3.2.1.139),其催化a-D-葡糖醛酸糖苷水解為D-葡糖醛酸和醇。就本發明而言,α-葡糖醛酸糖苷酶活性是根據deVries,1998,J.Bacteriol.180:243-249確定的。一個單位的α_葡糖醒酸糖苷酶等于能夠在pH5,40°C每分鐘釋放I微摩爾葡糖醛酸或4-0-甲基葡糖醛酸的酶量。[0034]β-葡糖苷酶:術語“β-葡糖苷酶”意指β-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(E.C.N0.3.2.1.21),其催化末端非還原β-D-葡萄糖殘基的水解,并釋放β-D-葡萄糖。就本發明而言,葡糖苷酶根據Venturi等,2002,Extracellularbeta-D-glucosidasefromChaetomiumthermophilumvar.coprophiIum!production,purificationandsomebiochemicalproperties,J.BasicMicrobiol.42:55-66的方法使用對硝基苯基-β_D_葡糖吡喃糖苷作為底物確定。一個單位的β-葡糖苷酶定義為在25°C,pH4.8,在含有0.01%TWEEN:R20的50mM檸檬酸鈉中從作為底物的ImM對硝基苯基-β-D-葡糖吡喃糖苷每分鐘產生1.0微摩爾對硝基苯酚陰離子。[0035]β-木糖苷酶:術語“β-木糖苷酶”意指β-D木糖苷木糖水解酶(β-D-xy1sidexylohydrolase)(E.C.3.2.1.37),其催化短β(I—4)木寡糖(xylooligosaccharide)的外水解以從非還原端去除連續的D-木糖殘基。就本發明而言,一個單位的β_木糖苷酶定義為在40°C,pH5在含有0.01%TWEEN[?20的IOOmM檸檬酸鈉中從作為底物的ImM對硝基苯基-β-D-木糖苷每分鐘產生1.0微摩爾對硝基苯酚陰離子。[0036]cDNA:術語“cDNA”意指能夠通過反轉錄從得自真核或原核細胞的成熟的、已剪接的mRNA分子制備的DNA分子。cDNA缺少通常存在于相應基因組DNA中的內含子序列。起始的(initial)、初級的RNA轉錄物是mRNA的前體,其通過一系列的步驟加工包括剪接,然后作為成熟的已剪接的mRNA出現。[0037]纖維素材料:術語“纖維素材料”意指包含纖維素的任何材料。生物質的初生細胞壁(primarycellwall)中的主要多糖是纖維素,其次最豐富的是半纖維素,而第三是果膠。次生細胞壁(secondarycellwall)在細胞停止生長后產生,其同樣含有多糖并通過共價交聯至半纖維素的聚合木質素而加強。纖維素是脫水纖維二糖的均聚物,并且因此是直鏈i3-(l_4)-D-葡聚糖,而半纖維素包括多種化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的復雜分支結構。盡管通常是多形的,存在于植物組織中的纖維素主要是平行葡聚糖鏈的不溶晶體基質。半纖維素通常與纖維素以及其它半纖維素以氫鍵相連,其幫助穩定細胞壁基質。[0038]纖維素通常見于例如植物的莖、葉、殼、皮和穗軸,或樹的葉、枝和木材。纖維素材料可以是,但不限于,農業殘余物、草本材料(包括能量作物)、城市固體廢物、紙漿與造紙廠殘余物、廢紙和木材(包括林業殘余物)(參見,例如,Wiselogel等,1995,于HandbookonBioethanol(CharlesE.Wyman編),pp.105-118,Taylor&Francis,WashingtonD.C.;Wyman,1994,BioresourceTechnology50:3-16;Lynd,1990,AppliedBiochemistryandBiotechnology24/25:695_719;Mosier等,1999,RecentProgressinBioconversionofLignoceIlulosics,于AdvancesinBiochemicalEngineering/Biotechnology,T.Scheper主編,Volume65,pp.23-40,Springer-Verlag,NewYork)。在本文中應理解的是,纖維素可以是任何形式的木素纖維素,在混合基質中包含木質素、纖維素和半纖維素的植物細胞壁材料。在一個優選的方面,纖維素材料是任何生物質材料。在另一個優選的方面,所述纖維素材料是木素纖維素,其包含纖維素、半纖維素和木質素。[0039]在一個方面,纖維素材料是農業殘余物。在另一個方面,纖維素材料是草本材料(包括能量作物)。在另一個方面,纖維素材料是城市固體廢物。在另一個方面,纖維素材料是紙漿和造紙廠殘余物。在另一個方面,纖維素材料是廢紙。在另一個方面,纖維素材料是木材(包括林業殘余物)。[0040]在另一個方面,纖維素材料是蘆竹(arundo)。在另一個方面,纖維素材料是甘蔗渣。在另一個方面,纖維素材料是竹材。在另一個方面,纖維素材料是玉米穗軸。在另一個方面,纖維素材料是玉米纖維。在另一個方面,纖維素材料是玉米秸桿。在另一個方面,纖維素材料是芒草屬。在另一個方面,纖維素材料是橙皮。在另一個方面,纖維素材料是稻桿。在另一個方面,纖維素材料是柳枝稷(switchgrass)。在另一個方面,纖維素材料是麥桿。[0041]在另一個方面,纖維素材料是白楊。在另一個方面,纖維素材料是桉樹。在另一個方面,纖維素材料是揪樹(fir)。在另一個方面,纖維素材料是松樹。在另一個方面,纖維素材料是楊樹。在另一個方面,纖維素材料是云杉。在另一個方面,纖維素材料是柳樹。[0042]在另一個方面,纖維素材料是藻類纖維素。在另一個方面,纖維素材料是細菌纖維素。在另一個方面,纖維素材料是棉絨(cottonlinter)。在另一個方面,纖維素材料是濾紙。在另一個方面,纖維素材料是微晶纖維素。在另一個方面,纖維素材料是經磷酸處理的纖維素。[0043]在另一個方面,纖維素材料是水生生物質。如用于本文中,“水生生物質”意指在水生環境中由光合作用過程產生的生物質。水生生物質可為藻類、挺水植物(emergentplant)、浮葉植物(floating-leafplant)或沉水植物(submergedplant)。[0044]纖維素材料可以按原樣(asis)使用或進行預處理,使用本領域已知的常規方法,如本文所述。在一個優選的方面,預處理纖維素材料。[0045]纖維素分解酶或纖維素酶:術語“纖維素分解酶”或“纖維素酶”意指一種或多種(例如幾種)水解纖維素材料的酶。此類酶包括內切葡聚糖酶,纖維二糖水解酶,β_葡糖苷酶,或其組合。測量纖維素分解活性的兩種基本方法包括:(I)測量總纖維素分解活性,和(2)測量單獨的纖維素分解活性(內切葡聚糖酶、纖維二糖水解酶和β_葡糖苷酶),如Zhang等,Outlookforcellulaseimprovement:Screeningandselectionstrategies,2006,BiotechnologyAdvances24:452-481所綜述的。總纖維素分解活性通常是使用不溶性底物來測定的,所述底物包括WhatmanN0.1濾紙、微晶纖維素、細菌纖維素、藻類纖維素、棉花、經預處理的木素纖維素等。最常見的總纖維素分解活性測定法是使用WhatmanN0.1濾紙作為底物的濾紙測定法。該測定法是由InternationalUnionofPureandAppliedChemistry(IUPAC)(Ghose,1987,Measurementofcellulaseactivities,PureApp1.Chem.59:257-68)確立的。[0046]就本發明而言,纖維素分解酶活性通過測量在下述條件下由纖維素分解酶進行的纖維素材料水解的增加來確定:l-50mg的纖維素分解酶蛋白/g的PCS中纖維素(或其它經預處理的纖維素材料)在合適`的溫度,例如50°C、55°C或60°C進行3-7日,與未添加纖維素分解酶蛋白的對照水解相比較。通常條件為:Iml反應液,經洗滌或未洗滌的PCS,5%不溶性固形物,50mM乙酸鈉pH5,ImMMnSO4,50°C、55°C或60°C,72小時,通過AMINEXHPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)進行糖分析。[0047]編碼序列:術語“編碼序列”意指直接指定多肽的氨基酸序列的多核苷酸。編碼序列的邊界通常由開放閱讀框決定,所述開放閱讀框以起始密碼子如ATG、GTG或TTG開始,并且以終止密碼子如TAA、TAG或TGA結束。編碼序列可以是基因組DNA、cDNA、合成DNA或其組合。[0048]調控序列(controlsequence):術語“調控序列”意指對編碼本發明的成熟多肽的多核苷酸表達是必需的核酸序列。各個調控序列對于編碼所述成熟多肽的多核苷酸可以是天然的(即,來自同一基因)或外源的(即,來自不同基因),或各個調控序列對于彼此可以是天然的或外源的。這些調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。最少的情況,調控序列包括啟動子和轉錄和翻譯的終止信號。調控序列可以和用于引入特異性限制位點的接頭一起提供,所述特異性限制位點促進調控序列與編碼多肽的多核苷酸編碼區的連接。[0049]內切葡聚糖酶:術語“內切葡聚糖酶”意指內切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(endo-1,4_β-D-glucan4-glucanohydrolase)(E.C.3.2.1.4),其催化纖維素、纖維素衍生物(例如羧甲基纖維素和羥乙基纖維素)、地衣淀粉(Iichenin)中的1,4-β-D-糖苷鍵、混合的β_1,3葡聚糖例如谷類β-D-葡聚糖或木葡聚糖和含有纖維素組分的其它植物材料中的β-1,4鍵的內水解(endohydrolysis)。內切葡聚糖酶活性可通過測量底物粘度的減少或由還原糖測定法(Zhang等,2006,BiotechnologyAdvances24:452-481)確定的還原端增加來確定。就本發明而言,根據Ghose,1987,PureandApp1.Chem.59:257-268的方法,在pH5,40°C使用羧甲基纖維素(CMC)作為底物來確定內切葡聚糖酶活性。[0050]表達:術語“表達”包括涉及多肽產生的任何步驟,其包括但不限于轉錄、轉錄后修飾、翻譯、翻譯后修飾和分泌。[0051]表達載體:術語“表達載體”意指線性的或環狀的DNA分子,其包含編碼多肽的多核苷酸,并且所述多核苷酸與提供用于其表達的調控序列可操作地連接。[0052]家族61糖苷水解酶:術語“家族61糖苷水解酶”或“家族GH61”或“GH61”在本文中定義為根據Henrissat,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309-316,及Henrissat和Bairoch,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696屬于糖苷水解酶家族61的多肽。該家族中的酶原先基于在一個家族成員測量到的非常弱的內切-1,4-β-D葡聚糖酶活性而歸類為糖苷水解酶家族。這些酶的結構和作用模式是非經典的,且它們無法視為真正的(bonafide)糖苷酶。然而,基于當與纖維素酶或纖維素酶的混合物一同使用時,其增強木素纖維素分解的能力,它們被保留在CAZy分類中。[0053]阿魏酸酯酶:術語“阿魏酸酯酶(feruloylesterase)”意指4_羥基_3_甲氧基肉桂酰-糖水解酶(EC3.1.1.73),其催化4-羥基-3-甲氧基肉桂酰(阿魏酰)基團從酯化的糖(其在“天然”底物中通常為阿拉伯糖)的水解,以產生阿魏酸(4-羥基-3-甲氧基肉桂酸)。阿魏酸酯酶也稱作阿魏酸酯酶(ferulicacidesterase)、羥基肉桂酰基酯酶、FAE-1I1、肉桂酸酯水解酶、FAEA,cinnAE、FAE-1或FAE-1I。就本發明而言,阿魏酸酯酶活性是使用50mM乙酸鈉pH5.0中的0.5mM阿魏酸對硝基苯酯作為底物確定的。一個單位的阿魏酸酯酶等于能夠在pH5,25°C每分鐘釋放I微摩爾對硝基苯酚陰離子的酶量。[0054]片段:術語“片段”意指從成熟多肽的氨基和/或羧基末端缺失一個或多個(例如幾個)氨基酸的多肽;其中所述片段具有纖維二糖水解酶。在一個方面,片段包含至少360個氨基酸。更具體而言,在一個實施方案中,片段意指多肽,其包含或組成為SEQIDNO:2的氨基酸105至464。在進一步的實施方案中,片段可包含接頭,SEQIDNO:2的氨基酸56至104,或其一部分。[0055]半纖維素分解酶或半纖維素酶:術語“半纖維素分解酶”或“半纖維素酶”意指一種或多種(例如幾種)水解半纖維素材料的酶。參見,例如Shallom和Shoham(2003)Microbialhemicellulases.CurrentOpinionInMicrobiology,2003,6(3):219-228)。半纖維素酶是植物生物質降解中的關鍵成分。半纖維素酶的實例包括但不限于乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。這些酶的底物,半纖維素,是支化和直鏈多糖的混雜集團,這些多糖通過氫鍵鍵合于植物細胞壁中的纖維素微纖維,將其交聯為魯棒(robust)的網絡。半纖維素亦共價地附于木質素,與纖維素一同形成高度復雜的結構。半纖維素的可變的結構和組織形式需要許多酶的協同作用使其完全降解。半纖維素酶的催化模塊為水解糖苷鍵的糖苷水解酶(GH),或水解乙酸或阿魏酸側基的酯連接的糖酯酶(CE)。這些催化模塊,基于其一級結構的同源性,可指派為GH和CE家族。一些家族,具有總體上類似的折疊,可進一步歸類為宗族(clan),以字母標記(例如,GH-A)。最具信息性和最新的這些和其他糖活性酶的分類可在Carbohydrate-ActiveEnzymes(CAZy)數據庫獲得。半纖維素分解酶活性可根據Ghose和Bisaria,1987,Pure&Appl.Chem.59:1739-1752在合適的溫度,例如50°C、55°C或60°C,和pH,例如5.0或5.5進行測量。[0056]高嚴格條件:術語“高嚴格條件”意指對于長度至少100個核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和50%的甲酰胺中,根據標準的Southern印跡法進行預雜交和雜交12至24小時。使用2XSSC、0.2%SDS在65°C將載體材料最終洗滌三次,每次15分鐘。[0057]宿主細胞:術語“宿主細胞”意指任何細胞類型,所述細胞類型對于使用包含本發明多核苷酸的核酸構建體或表達載體的轉化、轉染、轉導等是易感的(susceptible)。術語“宿主細胞”涵蓋任何親本細胞的后代,其由于在復制中發生的突變而不同于親本細胞。[0058]分離的:術語“分離的”意指以不在自然界出現的形式或環境存在的物質。分離的物質的非限定性實例包括(I)任何非天然存在的物質,(2)任何至少部分地從一種或多種或全部與其天然結合的天然存在的成分移出的物質,包括但不限于任何酶、變體、核酸、蛋白質、肽或輔因子;(3)任何相對于見于自然界的該物質經人工修飾的物質;或(4)任何通過相對于與其自然結合的其他組分增加該物質的量(例如,編碼該物質的基因的多拷貝;比與編碼該物質的基因自然結合的啟動子更強的啟動子的使用)而修飾的物質。分離的物質可在發酵液樣品中存在。[0059]低嚴格條件:術語“低嚴格條件”意指對于長度至少100個核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和25%的甲酰胺中,根據標準的Southern印跡法進行預雜交和雜交12至24小時。使用2XSSC、0.2%SDS在50°C將載體材料最終洗滌三次,每次15分鐘。[0060]成熟多肽:術語“成熟多肽”意指以其在翻譯和任何翻譯后修飾之后的最終形式存在的多肽,所述修飾例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一個方面,根據預測SEQIDNO:2的氨基酸I至18是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineeringlO:1-6),成熟多肽是SEQIDNO:2的氨基酸19至464。在本領域中已知宿主細胞可產生由相同多核苷酸表達的兩種或更多種不同成熟多肽(即具有不同的C端和/或N端氨基酸)的混合物。[0061]成熟多肽編碼序列:術語“成熟多肽編碼序列”意指編碼具有纖維二糖水解酶活性的成熟多肽的多核苷酸。在一個方面,根據預測SEQIDN0:1的核苷酸I至54編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDN0:1的核苷酸55至1895或其cDNA序列。在一個具體實施方案中,所述成熟多肽編碼序列是SEQIDN0:1的核苷酸55-76,146-214,290-599,678-931,1001-1138,1210-1470,1541-1782,1854-1898(包含終止密碼子)。[0062]催化域:術語“催化域”意指含有酶的催化機構(catalyticmachinery)的酶的部分。在一個具體實施方案中,所述催化域是SEQIDNO:2的氨基酸105至464。[0063]纖維素結合域:術語“纖維素結合域”意指介導酶對纖維素底物的無定形區的結合的酶的部分。纖維素結合域(CBD)見于酶的N末端或C末端。CBD亦稱作纖維素結合模塊或CBM。在一個實施方案中,CBM是SEQIDNO:2的氨基酸19至55。CBM與催化域通過接頭序列分隔。在一個實施方案中,所述接頭是SEQIDNO:2的氨基酸56至104。[0064]中等嚴格條件:術語“中等嚴格條件”意指對于長度至少100個核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和35%的甲酰胺中,根據標準的Southern印跡法進行預雜交和雜交12至24小時。使用2XSSC、0.2%SDS在55°C將載體材料最終洗滌三次,每次15分鐘。[0065]中等-高嚴格條件:術語“中等-高嚴格條件”意指對于長度至少100個核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和35%的甲酰胺中,根據標準的Southern印跡法進行預雜交和雜交12至24小時。使用2XSSC、0.2%SDS在60°C將載體材料最終洗滌三次,每次15分鐘。[0066]核酸構建體:術語“核酸構建體”意指單鏈或雙鏈的核酸分子,其分離自天然存在的基因,或其經修飾以本來不存在于(nototherwiseexist)自然界中的方式含有核酸的區段,或其為合成的,其包含一個或多個調控序列。[0067]可操作地連接:術語“可操作地連接”意指這樣的構型,其中將調控序列置于相對于多核苷酸的編碼序列的適當位置,使得調控序列指導編碼序列的表達。[0068]具有纖維素分解增強活性的多肽:術語“具有纖維素分解增強的多肽”意指催化具有纖維素分解活性的酶對纖維素材料的水解的增強的GH61多肽。就本發明而言,通過測量來自由纖維素分解酶在下述條件下水解纖維素材料的還原糖增加或纖維二糖與葡萄糖的總量增加來確定纖維素分解增強活性:l_50mg總蛋白/gPCS中纖維素,其中總蛋白包含50-99.5%w/w的纖維素分解酶蛋白,及0.5-50%w/w的具有纖維素分解增強活性的GH61多肽的蛋白質,在合適的溫度(例如50°C、55°C或60°C)和pH(例如5.0或5.5)歷時1_7天,與用等量的總蛋白加載量而無纖維素分解增強活性(l-50mg纖維素分解蛋白/gPCS中纖維素)所進行的對照水解相比。在一個優選的方面,使用在總蛋白重量的2-3%的米曲霉β-葡糖苷酶(根據WO02/095014在米曲霉中重組產生)或者總蛋白質量的2_3%的煙曲霉葡糖苷酶(如WO2002/095014所述在米曲霉中重組產生)的纖維素酶蛋白加載量存在下的CELLUCLAST1.5L(NovozymesA/S,BagSVffird,Denmark)的混合物作為纖維素分解活性的來源。[0069]具有纖維素分解增強活性的GH61多肽通過降低達到相同水解水平所需的纖維素分解酶的量而增強由具有纖維素分解活性的酶催化的纖維素材料的水解,優選降低至少1.01倍,例如至少1.05倍,至少1.10倍,至少1.25倍,至少1.5倍,至少2倍,至少3倍,至少4倍,至少5倍,至少10倍,或至少20倍。[0070]預處理的玉米秸桿:術語“PCS”或“預處理的玉米秸桿”意指通過用熱和稀硫酸處理、堿預處理或中性預處理的源自玉米秸桿的纖維素材料。[0071]序列同一性:參數“序列同一性”描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關性。[0072]就本發明而言,兩個氨基酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsGenet.16:276-277),優選5.0.0版或更高版本的Needle程序中所執行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)來測定。使用的參數為缺口開放罰分(gapopenpenalty)10,缺口延伸罰分(gapextensionpenalty)0.5和EBL0SUM62(BL0SUM62的EMBOSS版)取代矩陣。使用Needle標記為“最高同一I"生(longestidentity)”的輸出結果(使用-nobrief選項獲得)作為同一丨生百分比,并計算如下:[0073](同樣的殘基X100)/(比對長度一比對中缺口的總數)[0074]就本發明而言,兩個核苷酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,見上文),優選5.0.0版或更高版本的Needle程序中所執行的Needleman-Wunsch算法(Needleman和Wunsch,1970,見上文)來測定。使用的參數為缺口開放罰分10,缺口延伸罰分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩陣。使用Needle標記為“最高同一性”的輸出結果(使用-nobrief選項獲得)作為同一性百分比,并計算如下:[0075](同樣的脫氧核糖核苷酸X100)/(比對長度一比對中缺口的總數)[0076]亞序列:術語“亞序列(subsequence)”意指從成熟多肽編碼序列的5’和/或3’端缺失一個或多個(例如幾個)核苷酸的多核苷酸;其中所述亞序列編碼具有纖維二糖水解酶活性的片段。在一個方面,所述亞序列編碼具有纖維二糖水解酶活性的多肽,例如根據本發明的催化域。在一個實施方案中,亞序列包含或組成為SEQIDNO:1的核苷酸460至1895,且更具體而言包含或組成為SEQIDNO:1的核苷酸460-599,678-931,1001-1138,1210-1470,1541-1782,1854-1895。[0077]變體:術語“變體”意指在一個或多個(例如幾個)位置包含改變,即取代、插入和/或缺失的具有纖維二糖水解酶活性的多肽。取代意指將占據某位置的氨基酸用不同的氨基酸替代;缺失意指去除占據某位置的氨基酸;而插入意指在鄰接并緊接著占據某位置的氨基酸之后添加氨基酸。[0078]非常高嚴格條件:術語“非常高嚴格條件”意指對于長度至少100個核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和50%的甲酰胺中,根據標準的Southern印跡法進行預雜交和雜交12至24小時。使用2XSSC、0.2%SDS在70°C將載體材料最終洗滌三次,每次15分鐘。[0079]非常低嚴格條件:術語“非常低嚴格條件”意指對于長度至少100個核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和25%的甲酰胺中,根據標準的Southern印跡法進行預雜交和雜交12至24小時。使用2XSSC、0.2%SDS在45°C將載體材料最終洗滌三次,每次15分鐘。[0080]含木聚糖材料:術語“含木聚糖材料”意指任何包含含有β-(1-4)連接的木糖殘基骨架的植物細胞壁多糖的材料。陸生植物的木聚糖是具有β-(1-4)-吡喃木糖骨架的雜聚物,其由短的糖鏈分支。它們包含D-葡糖醛酸或其4-0-甲基醚,L-阿拉伯糖和/或多種包含D-木糖、L-阿拉伯糖、D-或L-半乳糖和D-葡萄糖的寡糖。木聚糖類型的多糖可分為均木聚糖(homoxylan)和雜木聚糖(heteroxylan),后者包括葡糖醒酸木聚糖,(阿拉伯)葡糖醛酸木聚糖,(葡糖醛酸)阿拉伯木聚糖,阿拉伯木聚糖和復合雜木聚糖。參見,例如Ebringerova等,2005,Adv.Polym.Sc1.186:1-67。[0081]在本發明的工藝中,可使用任何含有木聚糖的材料。在一個優選的方面,所述含木聚糖材料是木素纖維素。[0082]木聚糖降解活性或木聚糖分解活性:術語“木聚糖降解活性”或“木聚糖分解活性”意指水解含木聚糖材料的生物學活性。兩種測定木聚糖分解活性的基礎方法包括:(I)測定總木聚糖分解活性,和(2)測定單獨的木聚糖分解活性(例如內切木聚糖酶、β_木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醒酸酯酶(a-glucuronylesterase))。最近在木聚糖分解酶測定法的進展總結于幾個公開文獻中,包括Biely和Puchard,Recentprogressintheassaysofxylanolyticenzymes,2006,JournaloftheScienceofFood和Agriculture86(11):1636-1647;Spanikova和Biely,2006,Glucuronoylesterase-NovelcarbohydrateesteraseproducedbySchizophyllumcommune,FEBSLetters580(19):4597-4601;Herrmann,Vrsanska,Jurickova,Hirsch,Biely和Kubicek,1997,Thebeta-D-xylosidaseofTrichodermareeseiisamultifunctionalbeta—D—xylanxylohydrolase,BiochemicalJournal321:375-381。[0083]總木聚糖降解活性可通過確定從多種類型的木聚糖形成的還原糖來測量,所述木聚糖包括例如燕麥小麥(oatspelt)、山毛櫸木(beechwood)和落葉松木(Iarchwood)木聚糖,或者可通過光度法確定從多種共價染色的木聚糖釋放出的染色的木聚糖片段來測量。最常見的總木聚糖分解活性測定法基于從多聚的4-0-甲基葡糖醛酸木聚糖產生還原糖,如Bailey,Biely,Poutanen,1992,Interlaboratorytestingofmethodsforassayofxylanaseactivity,JournalofBiotechnology23(3):257-270中所述。木聚糖酶活性亦可用0.2%AZCL-阿拉伯木聚糖作為底物在37。。在0.01%TRIT0_X-100(4-(I,I,3,3-四甲基丁基)苯基-聚乙二醇)和`200mM磷酸鈉緩沖液pH6中來確定。一個單位的木聚糖酶活性定義為在37°C,pH6在200mM磷酸鈉pH6緩沖液中從作為底物的0.2%AZCL_阿拉伯木聚糖每分鐘產生1.0微摩爾天青蛋白(azurine)。[0084]就本發明而言,木聚糖降解活性是通過測量由木聚糖降解酶在下述通常條件下造成的樺木木聚糖(SigmaChemicalC0.,Inc.,St.Louis,MO,USA)水解的增加來確定的:Iml反應液,5mg/ml底物(總固形物),5mg木聚糖分解蛋白質/g底物,50mM乙酸鈉,pH5,50°C,24小時,如Lever,1972,Anewreactionforcolorimetricdeterminationofcarbohydrates,Anal.Biochem47:273-279所述使用對羥基苯甲酸酸餅(PHBAH)測定法進行糖分析。[0085]木聚糖酶:術語“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(I,4-β-D-xylan-xylohydrolase)(E.C.3.2.1.8),其催化木聚糖中I,4_β-D-木糖苷鍵的內水解。就本發明而言,木聚糖酶活性是使用0.2%AZCL-阿拉伯木聚糖作為底物確定的。一個單位的木聚糖酶活性定義為在37°C,pH6在200mM磷酸鈉pH6緩沖液中從作為底物的0.2%AZCL-阿拉伯木聚糖每分鐘產生1.0微摩爾天青蛋白。[0086]發明詳述[0087]具有纖維二糖水解酶活性的多肽[0088]在一個實施方案中,本發明涉及分離的多肽,其與SEQIDNO:2的成熟多肽具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少87%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性,其具有纖維二糖水解酶活性。本發明的多肽具有SEQIDNO:2的成熟多肽的纖維二糖水解酶活性的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%,和至少100%。[0089]在一個方面,所述多肽與SEQIDNO:2的成熟多肽相差不超過10個氨基酸,例如1,2,3,4,5,6,7,8,或9個氨基酸。[0090]本發明的多肽優選包含或組成為SEQIDNO:2的氨基酸序列或其等位變體;或為其具有纖維二糖水解酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDNO:2的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDNO:2的氨基酸19至464。[0091]在另一個方面,本發明涉及具有纖維二糖水解酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸在中等嚴格條件,或中等-高嚴格條件,或高嚴格條件,或非常高嚴格條件下與以下雜交:(i)SEQIDNO:1的成熟多肽編碼序列,(ii)其cDNA序列,或(iii)(i)或(ii)的全長互補物(Sambrook等,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。[0092]SEQIDNO:1的多核苷酸或其亞序列,以及SEQIDNO:2的多肽或其片段,可用于設計核酸探針,以根據本領域內公知的方法從不同屬或種的菌株鑒定和克隆編碼具有纖維二糖水解酶活性的多肽的DNA。具體而言,根據標準的Southern印跡方法,可將這些探針用于與感興趣的細胞的基因組DNA或cDNA雜交,以鑒定和從其中分離相應的基因。這些探針可明顯短于完整序列,但長度上應為至少15,例如至少25,至少35,或至少70個核苷酸。優選地,所述核酸探針是至少100個核苷酸的長度,例如,至少200個核苷酸,至少300個核苷酸,至少400個核苷酸,至少500個核苷酸,至少600個核苷酸,至少700個核苷酸,至少800個核苷酸,或至少900個核苷酸的長度。DNA和RNA探針二者均可使用。通常將探針標記以探測相應的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)標記)。這些探針涵蓋于本發明中。[0093]可從由這些其它菌株制備的基因組DNA或cDNA文庫中篩選DNA,所述DNA與上述探針雜交并且編碼具有纖維二糖水解酶活性的多肽。可以通過瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術分離來自這些其它菌株的基因組或其它DNA。可以將來自文庫的DNA或分離的DNA轉移至硝化纖維素(nitrocellulose)或其它合適的載體材料并且固定于其上。為了鑒定與SEQIDNO:1或其亞序列雜交的克隆或DNA,將所述載體材料用在Sounthern印跡中。[0094]就本發明而言,雜交表示多核苷酸在中等至非常高的嚴格條件下與標記的核酸探針雜交,所述核酸探針對應于下述:(i)SEQIDNO:1,(ii)SEQIDN0:1的成熟多肽編碼序列,(iii)其cDNA序列;(iV)它們的全長互補物,或(V)它們的亞序列。可使用例如X射線片(X-rayfilm)或其他任何本領域中已知的檢測手段檢測在這些條件下與核酸探針雜交的分子。[0095]在一個方面,所述核酸探針是編碼SEQIDNO:2的多肽,其成熟多肽,或它們的片段的多核苷酸。在另一個方面,所述核酸探針是SEQIDN0:1或其cDNA序列。[0096]在另一個實施方案中,本發明涉及具有纖維二糖水解酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1成熟多肽編碼序列或其cDNA序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。[0097]在另一個實施方案中,本發明涉及SEQIDNO:2的成熟多肽在一個或多個(例如幾個)位置包含取代、缺失和/或插入的變體。在一個實施方案中,導入SEQIDN0:2的成熟多肽的氨基酸取代、缺失和/或插入的數量是不超過10,例如1、2、3、4、5、6、7、8或9。氨基酸改變可為性質上較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質的折疊和/或活性;通常為I至大約30個氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸殘基;多至大約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延伸,如多組氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或結合域(bindingdomain)。[0098]保守取代的實例是在以下組之內:堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領域已知的,并且由例如H.Neuratt^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。[0099]或者,氨基酸改變具有這樣的性質以使多肽的物理化學性質改變。例如,氨基酸改變可改善多肽的熱穩定性,改變底物特異性,改變最適PH等。`[0100]能夠根據本領域已知的方法,例如定位誘變或丙氨酸掃描誘變法(Cunningham和Wells,1989,Science244:1081-1085)來鑒定親本多肽中的必需氨基酸。在后一技術中,將單一丙氨酸突變引入到分子中的每個殘基,并且就纖維二糖水解酶測試所得突變分子以鑒定對于所述分子的活性關鍵的氨基酸殘基。同樣參見Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能夠通過結構的物理分析而測定,如通過以下這些技術:如核磁共振、晶體學、電子衍射或光親和標記,連同推定的接觸位點氨基酸的突變來測定。參見例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份也能夠從與相關多肽的同一性分析來推斷。[0101]可使用已知的誘變、重組和/或改組方法,然后進行相關的篩選過程,如由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sc1.USA86:2152-2156;W095/17413;或者WO95/22625所公開的那些,進行一個或多個氨基酸取代、缺失和/或插入并加以測試。其他可使用的方法包括易錯PCR、卩遼菌體展不(例如Lowman等,1991,Biochemistry30:10832-10837;美國專利號5,223,409;WO92/06204)和區域定向誘變(region-directedmutagenesis)(Derbyshire等,1986,Gene46:145;等,1988,DNA7:127)。[0102]誘變/改組方法可與高通量、自動篩選方法組合以檢測由宿主細胞表達的經克隆、誘變的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。編碼活性多肽的經誘變的DNA分子可自宿主細胞回收并使用本領域標準方法迅速測序。這些方法允許快速確定多肽中單個氨基酸殘基的重要性。[0103]所述多肽可為雜合多肽,其中一個多肽的區域融合于另一個多肽的區域的N端或C端。[0104]所述多肽可為融合多肽或可切割的融合多肽,其中另一個多肽融合于本發明的多肽的N端或C端。通過將編碼另一個多肽的多核苷酸融合于本發明的多核苷酸來產生融合多肽。產生融合多肽的技術是本領域已知的,并包括連接編碼多肽的編碼序列以使它們符合讀框(inframe),并且使融合多肽的表達在相同啟動子和終止子的控制下。融合蛋白亦可使用內蛋白(intein)技術構建,其中融合物在翻譯后產生(Cooper等,1993,EMBOJ.12:2575-2583;Dawson等,1994,Science266:776-779)。[0105]融合多肽還可以在兩個多肽之間包含切割位點。在融合多肽分泌時,就切割所述位點,釋放所述兩個多肽。切割位點的實例包括,但不限于,公開于Martin等,2003,J.1nd.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-ffiIson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381;Eaton等,1986,Biochem.25:505-512);Collins_Racie等,1995,Biotechnology13:982-987;Carter等,1989,Proteins:Structure,Function,andGenetics6:240-248;以及Stevens,2003,DrugDiscoveryWorld4:35-48中的位點。[0106]具有纖維二糖水解酶活性的多肽的來源[0107]本發明的具有纖維二糖水解酶活性的多肽可以獲得自任何屬的微生物。就本發明而言,用于本文與給定的來源有關的術語“獲得自”,意思應為由多核苷酸編碼的多肽由所述來源產生,或由其中插入了來自所述來源的多核苷酸的菌株產生。在一個方面,從給定來源獲得的多肽是胞外分泌的。[0108]在一個方面,所述多肽是踝節菌屬(Talaromyces)多肽。[0109]在另一個方面,所述多肽是TalaromycesIeycettanus多肽,例如從TalaromycesIeycettanus菌株CBS398.68獲得的多妝。[0110]可理解的是對于前述的種,本發明包含完全和不完全階段(perfectandimperfectstates),和其它分類學的等同物(equivalent),例如無性型(anamorph),而無論它們已知的種名。本領域技術人員將容易地識別適合的等同物的身份。[0111]這些種的菌株在許多培養物保藏中心對于公眾能夠容易地取得,所述保藏中心諸如美國典型培養物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和細胞培養物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSMZ)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和農業研究機構專利培養物保藏中心北區研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。[0112]可以使用上述的探針從其它來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物或直接獲得自自然材料(例如,土壤、堆肥、水等)的DNA樣品鑒定和獲得所述多肽。用于直接從天然生境(habitat)分離微生物和DNA的技術是本領域內公知的。隨后可通過相似地篩選另一種微生物的基因組DNA或cDNA文庫或混合的DNA樣品來得到編碼所述多肽的多核苷酸。一旦用探針檢測到編碼多肽的多核苷酸,就可以使用本領域普通技術人員已知的技術將所述多核苷酸分離或克隆(參見,例如,Sambrook等,1989,見上文)。[0113]催化域[0114]本發明亦涉及分離的多肽,其包含催化域,所述催化域選自下組:[0115](a)催化域,其與SEQIDNO:2的催化域(例如SEQIDNO:2的氨基酸105至464)具有至少81%序列同一性;[0116](b)催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:1的催化域編碼序列(例如SEQIDNO:1的核苷酸460-599,678-931,1001-1138,1210-1470,1541-1782,和1854-1895)具有至少60%序列同一性;[0117](C)SEQIDN0:2的催化域的包含一個或多個(例如幾個)氨基酸的取代、缺失和/或插入的催化域變體;和[0118](d)(a)、(b)或(C)的催化域的具有纖維二糖水解酶活性的片段。[0119]所述催化域優選與SEQIDNO:2的催化域具有至少85%,至少90%,至少91%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性程度。在一個方面,所述催化域包含氨基酸序列,所述氨基酸序列與SEQIDNO:2的催化域相差十個氨基酸,例如相差五個氨基酸,相差四個氨基酸,相差三個氨基酸,相差兩個氨基酸,和相差一個氨基酸。[0120]所述催化域優選包含或組成為(consistof)SEQIDNO:2的催化域或其等位變體;或為其具有纖維二糖水解酶活性的片段。在另一個優選方面,所述催化域包含或組成為SEQIDNO:2的氨基酸105至464。[0121]在一個實施方案中,所述催化域可由多核苷酸編碼,所述多核苷酸在中等嚴格條件,或中等-高嚴格條件,或高嚴格條件,或非常高嚴格條件下(如上文定義),與以下雜交:(i)SEQIDNO:1的催化域編碼序列,(ii)包含于SEQIDNO:1的催化域編碼序列中的cDNA序列,或(iii)⑴或(ii)的全長互補物(J.Sambrook等,1989,見上文)。[0122]所述催化域可由多核苷酸編碼,所述多核苷酸與SEQIDNO:1的催化域編碼序列具有至少60%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性程度,其編碼具有纖維二糖水解酶活性的多肽。[0123]在一個方面,編碼催化域的多核苷酸包含或組成為SEQIDNO:1的核苷酸460至1895或其cDNA序列。[0124]特別地,編碼催化域的多核苷酸包含或組成為SEQIDNO:1的核苷酸460-599,678-931,1001-1138,1210-1470,1541-1782,和1854-1895。[0125]多核苷酸[0126]本發明亦涉及編碼如本文中所述的本發明的多肽的分離的多核苷酸。[0127]用于分離或克隆多核苷酸的技術在本領域中是已知的,并包括包括從基因組DNA或cDNA分離,或其組合。可通過例如使用熟知的聚合酶鏈式反應(PCR)或表達文庫的抗體篩選來檢測具有共有結構特性的克隆DNA片段,從而實現從這種基因組DNA克隆多核苷酸。參見,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸擴增方法,如連接酶鏈式反應(LCR)、連接活化轉錄(ligatedactivatedtranscription;LAT)和基于多核苷酸的擴增(NASBA)。可以從踩節菌屬的菌株,或相關生物體克隆所述多核苷酸,因此,例如可為所述多核苷酸的多肽編碼區的等位基因變體或種變體(speciesvariant)。[0128]修飾編碼本發明多肽的多核苷酸對于合成與所述多肽基本上相似的多肽可為必需的。術語與所述多肽“基本上相似”指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩定性、最適PH等方面不同的變體。可以在作為SEQIDNO:1的成熟多肽編碼序列,或其cDNA序列,例如其亞序列呈現的多核苷酸的基礎上和/或通過引入如下核苷酸取代:所述取代不導致多肽氨基酸序列的改變,但是符合意欲產生酶的宿主生物體的密碼子使用;或者通過導入可產生不同的氨基酸序列的核苷酸取代來構建變體。關于核苷酸取代的概述,參見,例如,Ford等,1991,ProteinExpressionandPurification〗:95-107。[0129]核酸構建體[0130]本發明還涉及包含本發明的多核苷酸的核酸構建體,所述多核苷酸與一個或多個調控序列可操作地連接,所述調控序列在合適的宿主細胞中在與該調控序列相容的條件下指導編碼序列的表達。[0131]可以用許多方式操作所述多核苷酸以提供多肽的表達。依賴于表達載體,在將多核苷酸插入載體之前對其進行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸的技術是本領域熟知的。[0132]調控序列可為啟動子,其由用于表達編碼本發明的多肽的多核苷酸的宿主細胞所識別的多核苷酸。啟動子含有介導多肽的表達的轉錄調控序列。啟動子可以是在宿主細胞中顯示轉錄活性的任何多核苷酸`,包括突變的、截短的和雜合的啟動子,并且可以從編碼與宿主細胞同源或異源的胞外或胞內多肽的基因獲得。[0133]用于在細菌宿主細胞中指導本發明的核酸構建體轉錄的合適啟動子的實例是從下述獲得的啟動子:解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌α-淀粉酶基因(amyL)、地衣芽孢桿菌青霉素酶基因(penP)、嗜熱脂肪芽孢桿菌產麥芽淀粉酶基因(amyM)、枯草芽孢桿菌果聚糖鹿糖酶基因(sacB)、枯草芽孢桿菌xylA和xylB基因、蘇云金芽抱桿菌cryIIIA基因(Agaisse和Lereclus,1994,MolecularMicrobiologyl3:97-107)、大腸桿菌Iac操縱子、大腸桿菌trc啟動子(Egon等,1988,Gene69:301-315)、天藍鏈霉菌瓊脂糖酶基因(dagA)和原核β_內酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),以及tac啟動子(DeBoer等,1983,Proc.Natl.Acad.Sc1.USA80:21-25)。另外的啟動子在"Usefulproteinsfromrecombinantbacteria"于Gilbert等,1980,ScientificAmerican,242:74-94中;和在Sambrook等,1989,見上文中描述。串聯啟動子的實例公開于WO99/43835。[0134]用于指導本發明的核酸構建體在絲狀真菌宿主細胞中轉錄的合適啟動子的實例是從下列酶的基因獲得的啟動子:構巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構酶、尖鐮孢胰蛋白酶樣蛋白酶(WO96/00787)、鑲片鐮孢淀粉葡糖苷酶(W000/56900)、鑲片鐮孢Daria(W000/56900)、鑲片鐮孢Quinn(W000/56900)、曼赫根毛霉(Rhizomucormiehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶1、里氏木霉纖維二糖水解酶I1、里氏木霉內切葡聚糖酶1、里氏木霉內切葡聚糖酶I1、里氏木霉內切葡聚糖酶II1、里氏木霉內切葡聚糖酶IV、里氏木霉內切葡聚糖酶V、里氏木霉木聚糖酶1、里氏木霉木聚糖酶I1、里氏木霉β-木糖苷酶,以及NA2_tpi啟動子(一種修飾的啟動子,其來自在曲霉屬中性α-淀粉酶基因,其中未翻譯的前導序列由曲霉屬丙糖磷酸異構酶的基因的未翻譯的前導序列所替代;非限制性實例包括修飾的啟動子,其來自黑曲霉中性α-淀粉酶的基因,其中未翻譯的前導序列由構巢曲霉或米曲霉丙糖磷酸異構酶的基因的未翻譯的前導序列所替代);和它們的突變的、截短的和雜合的啟動子。[0135]在酵母宿主中,有用的啟動子從如下的基因獲得:釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母半乳糖激酶(GALl)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)和釀酒酵母3-磷酸甘油酸激酶。對于酵母宿主細胞其它有用的啟動子由Romanos等,1992,Yeast8:423-488描述。[0136]調控序列也可以是轉錄終止子,其由宿主細胞識別以終止轉錄。所述終止子與編碼所述多肽的多核苷酸的3’末端可操作地連接。在本發明中,可使用在宿主細胞中有功能的任何終止子。[0137]對于細菌宿主細胞優選的終止子從如下的基因獲得:克勞氏芽孢桿菌堿性蛋白酶(aprH)、地衣芽孢桿菌α-淀粉酶(amyL)和大腸桿菌核糖體RNA(rrnB)。[0138]對于絲狀真菌宿主細胞優選的終止子從如下酶的基因獲得:構巢曲霉鄰氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、和尖鐮孢胰蛋白酶樣蛋白酶。[0139]對于酵母宿主細胞優選的終止子從如下酶的基因獲得:釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶。對于酵母宿主細胞其它有用的終止子由Romanos等,1992,見上文描述。[0140]調控序列還可以是啟動子下游和基因的編碼序列上游的mRNA穩定化區,其增加所述基因的表達。[0141]合適的mRNA穩定化區的實例從如下的基因獲得:蘇云金芽孢桿菌cryIIIA基因(W094/25612)和枯草芽抱桿菌SP82基因(Hue等,1995,JournalofBacteriology177:3465-3471)。[0142]調控序列還可以是合適的前導序列,其為對于宿主細胞的翻譯重要的mRNA非翻譯區。前導序列可操作地連接于編碼多肽的多核苷酸的5’-末端。可使用在宿主細胞中有功能的任何前導序列。[0143]對于絲狀真菌宿主細胞優選的前導序列從如下酶的基因獲得:米曲霉TAKA淀粉酶和構巢曲霉丙糖磷酸異構酶。[0144]對于酵母宿主細胞合適的前導序列從如下酶的基因獲得:釀酒酵母烯醇化酶(EN0-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)。[0145]調控序列也可以是聚腺苷酸化序列,其是與多核苷酸的3’末端可操作地連接的序列,并且在轉錄時,宿主細胞將其識別為將聚腺苷殘基添加至轉錄的mRNA的信號。可使用在宿主細胞中有功能的任何聚腺苷酸化序列。[0146]對于絲狀真菌宿主細胞優選的聚腺苷酸化序列從如下酶的基因獲得:構巢曲霉鄰氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖鐮孢胰蛋白酶樣蛋白酶。[0147]對于酵母宿主細胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.15:5983-5990描述。[0148]調控序列還可以是信號肽編碼區,其編碼與多肽的N端相連的信號肽,并指導所述多肽進入細胞分泌途徑。多核苷酸的編碼序列5’端可固有地包含信號肽編碼序列,其與編碼所述多肽的編碼序列的區段一起天然地連接在翻譯閱讀框中。或者,編碼序列5’端可含有對于所述編碼序列外源的信號肽編碼序列。外源信號肽編碼序列在編碼序列不天然地含有信號肽編碼序列時可為必需的。或者,外源信號肽編碼序列可簡單地取代天然信號肽編碼序列以增強多肽的分泌。然而,可使用指導表達的多肽進入宿主細胞的分泌途徑的任何信號肽編碼序列。[0149]對于細菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列:芽孢桿菌屬NCIB11837產麥芽糖淀粉酶、地衣芽孢桿菌枯草桿菌蛋白酶(subtilisin)、地衣芽孢桿菌內酰胺酶、嗜熱脂肪芽孢桿菌α-淀粉酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢桿菌prsA。另外的信號肽由Simonen和Palva,1993,MicrobiologicalReviews57:109-137描述。[0150]對于絲狀真菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特異腐質霉纖維素酶、特異腐質霉內切葡聚糖酶V、疏棉狀腐質霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。[0151]對于酵母宿主細胞有用的信號肽從釀酒酵母α因子和釀酒酵母轉化酶的基因獲得。其它有用的信號肽編碼序列由Romanos等,1992,見上文描述。[0152]調控序列還可以是前肽編碼序列,其編碼位于多肽N端的前肽。所得多肽稱為酶原(proenzyme)或前多肽(propolypeptide)(或在某些情況下稱為酶原(zymogen))。前多肽通常是無活性的,并且能夠通過前肽的催化或自催化切割從前多肽轉化為活性多肽。可以從枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、嗜熱毀絲霉漆酶(W095/33836)、曼赫根毛霉天冬氨酸蛋白酶和釀酒酵母α因子的基因獲得前肽編碼序列。[0153]當信號肽和前肽序列二者均存在時,將前肽序列置于緊接著(nextto)多肽的N端,并且將信號肽序列置于緊接著前肽序列的N端。[0154]同樣理想的是添加調節序列,其相對于宿主細胞的生長來調節多肽的表達。調節系統的實例是引起基因表達響應化學或物理刺激物,包括調節化合物的存在而開啟或關閉的那些系統。原核系統中的調節系統包括lac、tac和trp操縱基因系統。在酵母中,可使用ADH2系統或GALl系統。在絲狀真囷中,可以使用黑曲霉甸糖淀粉酶啟動子、米曲霉TAKAα-淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子。調節序列的其它實例是那些允許基因擴增的序列。在真核系統中,這些調節序列包括在氨甲蝶呤(methotrexate)存在下擴增的二氫葉酸還原酶基因,和以重金屬(withheavymetal)擴增的金屬硫蛋白基因。在這些情況下,編碼多肽的多核苷酸將與調節序列可操作地連接。[0155]表達載體[0156]本發明還涉及重組表達載體,所述重組表達載體包含本發明的多核苷酸,其連接于一個或多個調控序列,例如啟動子和轉錄和翻譯終止信號,所述調控序列指導所述多肽在表達宿主中產生。多種核苷酸和調控序列可以結合在一起以產生重組表達載體,所述表達載體可以包括一個或多個方便的限制位點以允許在這些位點插入或取代編碼多肽的多核苷酸。可供選擇的是,可以通過在適當的用于表達的載體中插入包含所述多核苷酸的核酸構建體或多核苷酸來表達所述多核苷酸。在制備表達載體的過程中,將編碼序列置于載體中,從而將該編碼序列與適當的調控序列可操作地連接以供表達。[0157]重組表達載體可以是任何載體(例如,質粒或病毒),其能夠方便地進行重組DNA步驟,并且能夠產生多核苷酸的表達。載體的選擇將通常依賴于載體與將引入該載體的宿主細胞的相容性。載體可以是線狀或閉合環狀質粒。[0158]載體可以是自主復制載體,即,作為染色體外實體(entity)存在的載體,其復制獨立于染色體復制,例如,質粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復制的手段(means)。或者,載體可以是一種當被引入宿主細胞中時,整合到基因組中并且與整合了該載體的染色體一起復制的載體。此外,可以使用單獨的載體或質粒或兩個或更多個載體或質粒,其共同含有待引入宿主細胞基因組的完整DNA(totalDNA),或可以使用轉座子(transposon)。[0159]所述載體優選地含有一個或多個選擇性標記,其允許簡單選擇經轉化、轉染、轉導等的細胞。選擇性標記是基因,其產物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養缺陷型的原養性(prototrophytoauxotrophs)等。`[0160]細菌選擇性標記的實例是地衣芽孢桿菌或枯草芽孢桿菌dal基因,或賦予抗生素抗性的標記,所述抗生素抗性例如氨芐青霉素、氯霉素、卡那霉素、新霉素、壯觀霉素或四環素抗性。對于酵母宿主細胞合適的標記包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于絲狀真菌宿主細胞的選擇性標記包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰基轉移酶)、bar(草銨膦(phosphinothricin)乙酰轉移酶)、hph(潮霉素磷酸轉移酶)、niaD(硝酸還原酶)(nitratereductase)>pyrG(乳清酸核苷_5’_磷酸脫羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺昔酸轉移酶)和trpC(鄰氛基苯甲酸合酶(anthranilatesynthase))以及它們的等同物。優選用在曲霉屬細胞中的是構巢曲霉或米曲霉amdS和pyrG基因和吸水鏈霉菌(Streptomyceshygroscopicus)bar基因。[0161]所述載體優選含有元件,其允許載體整合入宿主細胞基因組或載體在細胞中獨立于基因組的自主復制。[0162]為了整合入宿主細胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件。或者,載體可以含有額外的多核苷酸,用于指導通過同源重組整合入宿主細胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應含有足夠數量的核酸,如100至10,000堿基對,400至10,000堿基對,和800至10,000堿基對,其與相應的目標序列具有高度序列同一性以增強同源重組的概率。整合元件可為任何序列,其與宿主細胞基因組中的目標序列同源。此外,整合元件可為非編碼或編碼的多核苷酸。另一方面,可以將載體通過非同源重組整合到宿主細胞的基因組中。[0163]為了自主復制,載體可以進一步包含復制起點,其使載體能夠在所述的宿主細胞中自主地復制。復制起點可以是介導自主復制的任何質粒復制子(replicator),其在細胞中發揮功能。術語“復制起點”或“質粒復制子”意指能夠使質粒或載體體內復制的多核苷酸。[0164]細菌復制起點的實例是允許在大腸桿菌中復制的質粒pBR322、pUC19、pACYC177和pACYC184的復制起點,和允許在芽孢桿菌屬中復制的質粒pUBllO、pE194、pTA1060和ρΑΜβI的復制起點。[0165]用于酵母宿主細胞中的復制起點的實例是2微米復制起點,ARSl、ARS4、ARSl和CEN3的組合,和ARS4和CEN6的組合。[0166]在絲狀真菌細胞中有用的復制起點的實例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsRes.15:9163-9175;W000/24883)。分離AMAl基因和構建包含該基因的質粒或載體能夠根據公開于WO00/24883中的方法完成。[0167]可以將多于一個拷貝的本發明的多核苷酸插入宿主細胞以增加多肽的產生。多核苷酸拷貝數的增加可通過如下方法獲得:將至少一個額外拷貝的序列整合入宿主細胞基因組,或將可擴增的選擇性標記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養細胞來選擇含有選擇性標記基因的擴增拷貝,且由此含有多核苷酸的額外拷貝的細胞。[0168]用于連接上述元件以構建本發明的重組表達載體的方法是本領域技術人員熟知的(參見,例如,Sambrook等,1989,見上文)。[0169]宿主細胞[0170]本發明還涉及重組宿主細胞,其包含本發明的多核苷酸可操作地連接于一個或多個指導本發明多肽的產生的調控序列。將包含多核苷酸的構建體或載體導入宿主細胞,使所述構建體或載體如前所述作為染色體整體或者作為自復制的染色體外載體維持。術語“宿主細胞”包括親本細胞的任何后代,其由于復制過程中發生的突變而不同于親本細胞。宿主細胞的選擇將在很大程度上依賴于編碼多肽的基因及其來源。[0171]宿主細胞可以是在本發明的多肽的重組產生中有用的任何細胞,例如,原核或真核細胞。[0172]原核宿主細胞可以是任何革蘭氏陽性或革蘭氏陰性細菌。革蘭氏陽性細菌包括但不限于,芽抱桿菌屬(Bacillus)、梭菌屬(Clostridium)、腸球菌屬(Enterococcus)、地芽抱桿菌屬(Geobacillus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、海洋芽抱桿菌屬(Oceanobacillus)、葡萄球菌屬(Staphylococcus)、鏈球菌屬(Streptococcus)和鏈霉菌屬(Streptomyces)。革蘭氏陰性細菌包括但不限于,彎曲桿菌屬(Campylobacter)、大腸桿菌(E.coli)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、螺桿菌屬(Helicobacter)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)和服原體屬(Ureaplasma)。[0173]細菌宿主細胞可以是任何芽孢桿菌屬細胞,包括但不限于嗜堿芽孢桿菌(Bacillusalkalophilus)、解淀粉芽抱桿菌(Bacillusamyloliquefaciens)、短芽抱桿菌(Bacillusbrevis)、環狀芽抱桿菌(Bacilluscirculans)、克勞氏芽抱桿菌(Bacillusclausii)、凝結芽抱桿菌(Bacilluscoagulans)、堅強芽抱桿菌(Bacillusfirmus)、燦爛芽抱桿菌(Bacilluslautus)、遲緩芽抱桿菌(Bacilluslentus)、地衣芽抱桿菌(Bacilluslicheniformis)、巨大芽抱桿菌(Bacillusmegaterium)、短小芽抱桿菌(Bacilluspumilus)、嗜熱脂肪芽抱桿菌(Bacillusstearothermophilus)、枯草芽抱桿菌(Bacillussubtilis)和蘇云金芽抱桿菌(Bacillusthuringiensis)細胞。[0174]細菌宿主細胞還可以是任何鏈球菌屬細胞,包括但不限于似馬鏈球菌(Streptococcusequisimilis)、酉良月農鏈球菌(Streptococcuspyogenes)、乳房鏈球菌(Streptococcusuberis)和馬鏈球菌獸痕亞種(Streptococcusequisubsp.Zooepidemicus)細胞。[0175]細菌宿主細胞還可以是任何鏈霉菌屬細胞,包括但不限于不產色鏈霉菌(Streptomycesachromogenes)、除蟲鏈霉菌(Streptomycesavermitilis)、天藍鏈霉菌(Streptomycescoelicolor)、灰色鏈霉菌(Streptomycesgriseus)和淺青紫鏈霉菌(StreptomycesIividans)細胞。[0176]可通過如下方法實現將DNA引入到芽孢桿菌屬細胞:原生質體轉化(參見,例如,Chang和Cohen,1979,Mol.Gen.Genet.168:111-115),感受態細胞轉化(參見,例如,Young和Spizizenj1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-AbeIson,1971,J.Mol.Biol.56:209-221),電穿孔(參見,例如,Shigekawa和Dowerj1988,Biotechniques6:742-751)或接合(參見,例如,Koehler和Thornej1987,J.Bacteriol.169:5771-5278)。可通過如下方法實現將DNA引入到大腸桿菌細胞:原生質體轉化(參見,例如,Hanahanj1983,J.Mol.Biol.166:557-580)或電穿孔(參見,例如,Dower等,1988,NucleicAcidsRes.16:6127-6145)。可通過如下方法實現將DNA引入到鏈霉菌屬細胞:原生質體轉化和電穿孔(參見,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399-405),接合(參見,例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或轉導(參見,例如,Burke等,2001,Proc.Natl.Acad.Sc1.USA98:6289-6294)。可通過如下方法實現將DNA引入到假單胞菌屬細胞:電穿孔(參見,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(參見,例如,Pinedo和Smetsj2005,Appl.Environ.Microbiol.71:51-57)。可通過如下方法實現將DNA引入到鏈球菌屬細胞:天然感受態(naturalcompetence)(參見,例如,Perry和Kuramitsu,1981,Infect.1mmun.32:1295-1297),原生質體轉化(參見,例如,Catt和Jollickj1991,Microbios.68:189-207),電穿孔(參見,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(參見,例如,Clewellj1981,Microbiol.Rev.45:409-436)。然而,可以使用本領域已知的將DNA引入宿主細胞的任何方法。[0177]宿主細胞還可以是真核生物,如哺乳動物、昆蟲、植物或真菌細胞。[0178]宿主細胞可為真菌細胞。“真菌”用在本文包括以下門:子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)和接合菌門(Zygomycota)以及卵菌門(Oomycota),和所有有絲分裂抱子真菌(mitosporicfungi)(如由Hawksworth等,于AinsworthandBisby,sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定義)。[0179]真菌宿主細胞可為酵母細胞。“酵母”用在本文包括產子囊酵母(ascospOTogenousyeast)(內抱霉目(Endomycetales))、產擔子酵母(basidiosporogenousyeast)和屬于半知菌類(FungiImperfecti)(芽孢綱(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發明而言,將酵母定義為如BiologyandActivitiesofYeast(Skinner,Passmore,和Davenport編,Soc.App.Bacteriol.SymposiumSeriesN0.9,1980)中所述。[0180]酵母宿主細胞可為假絲酵母屬(Candida)、漢遜酵母屬(Hansenula)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或西洋蓍霉屬(Yarrowia)細胞,如乳酸克魯維酵母(KluyveromycesIactis)、卡爾酵母(Saccharomycescarlsbergensis)、釀酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(Saccharomycesnorbensis)、卵形酵母(Saccharomycesoviformis)或解脂西洋蓍霉(YarrowiaIipolytica)細胞。[0181]真菌宿主細胞可為絲狀真菌細胞。“絲狀真菌”包括真菌門(Eumycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復雜多糖組成的菌絲體壁。通過菌絲延伸進行營養生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養生長通過單細胞菌體的出芽生殖(budding)進行,而碳分解代謝可以是發酵的。[0182]絲狀真菌宿主細胞可為枝頂孢霉屬(Acremonium)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、煙管霉屬(Bjerkandera)、擬錯菌屬(Ceriporiopsis)、金抱子菌屬(Chrysosporium)、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬(Cryptococcus)、Filibasidium、德抱屬(Fusarium)、腐質霉屬(Humicola)、梨抱菌屬(Magnaporthe)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新考瑪脂霉屬(Neocallimastix)、脈抱菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、射脈菌`屬(Phlebia)、瘤胃壺菌屬(Piromyces)、側耳屬(Pleurotus)、裂糟菌屬(Schizophyllum)、踝節菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、栓菌屬(Trametes)或木霉屬(Trichoderma)細胞。[0183]例如,絲狀真菌宿主細胞可為泡盛曲霉(Aspergillusawamori)、煙曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillusjaponicus)、構巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、黑剌煙管菌(Bjerkanderaadusta)、干擬錯菌(Ceriporiopsisaneirina)、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrufa、蟲擬錯菌(Ceriporiopsissubvermispora)、Chrysosporiuminops、嗜角質金抱子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、Chrysosporiummerdarium、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛ熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiumzonatum、灰蓋鬼傘(Coprinuscinereus)、毛革蓋菌(Coriolushirsutus)、桿抱狀德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、庫威德抱(Fusariumcrookwellense)、大刀德抱(FusariumcuImorum)、禾本科德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、異抱德抱(Fusariumheterosporum)、合歡木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉紅德抱(Fusariumroseum)、接骨木德抱(Fusariumsambucinum)、膚色德抱(Fusariumsarcochroum)、擬分枝抱德抱(Fusariumsporotrichioides)、硫色德抱(Fusariumsulphureum)、圓德抱(Fusariumtorulosum)、擬絲抱德抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、特異腐質霉(Humicolainsolens)、疏棉狀腐質霉(Humicolalanuginosa)、米黑毛霉(Mucormiehei)、嗜熱毀絲霉(Myceliophthorathermophila)、粗糖脈抱菌(Neurosporacrassa)、產紫青霉(Penicilliumpurpurogenum)、黃抱平革菌(Phanerochaetechrysosporium)、福射射脈菌(Phlebiaradiata)、剌序側耳(Pleurotuseryngii)、土生梭抱霉(Thielaviaterrestris)、長域毛栓菌(Trametesvillosa)、變色栓菌(Trametesversicolor)、哈茨木霉(Trichodermaharzianum)、康寧木霉(Trichodermakoningii)、長枝木霉(Trichoderma1ngibrachiatum)、里氏木霉(Trichodermareesei)或綠色木霉(Trichodermaviride)細胞。[0184]可以將真菌細胞通過涉及原生質體形成、原生質體轉化和細胞壁再生的方法以本身公知的方式轉化。用于轉化曲霉屬和木霉屬宿主細胞的合適方法在EP238023,Yelton等,1984,Proc.Natl.Acad.Sc1.USA81:1470-1474,和Christensen等,1988,Bio/Technology6:1419-1422中描述。用于轉化鐮孢屬菌種的合適方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文獻描述的方法轉化酵母:Becker矛口Guarente,于Abelson,J.N.矛口Simon,Μ.1.編,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymologyjVolume194,pp182—187,AcademicPress,Inc.,NewYork;Ito等,1983,J.Bacteriol.153:163;和Hinnen等,1978,Proc.Natl.Acad.Sc1.USA75:1920。[0185]產生方法[0186]本發明還涉及用于產生本發明多肽的方法,其包括:(a)在有助于產生多肽的條件下培養細胞,所述細胞以其野生型形式產生所述多肽;和(b)回收所述多肽。在一個優選的方面,所述細胞是踝節菌屬的細胞。在一個更優選的方面,所述細胞是TalaromycesIeycettanus細胞。在一個最優選的方面,所述細胞是TalaromycesIeycettanus菌株CBS398.68。[0187]本發明還涉及用于產生本發明的多肽的方法,其包括:(a)在有助于產生多肽的條件下培養本發明的重組宿主細胞;和(b)回收所述多肽。[0188]所述宿主細胞使用本領域已知的方法在適合于產生所述多肽的營養培養基中培養。例如,可以通過在合適培養基中和允許表達和/或分離所述多肽的條件下的搖瓶培養,或實驗室或工業發酵罐中的小規模或大規模發酵(包括連續、分批、補料分批或固態發酵)來培養細胞。使用本領域已知的方法在合適的營養培養基中進行培養,所述營養培養基包含碳源和氮源和無機鹽。合適的培養基能夠從商業供應商獲得或可以根據公開的組成制備(例如,在美國典型培養物保藏中心的目錄中)。如果多肽分泌到營養培養基中,該多肽能夠從所述培養基中直接回收。如果多肽不分泌,其能夠從細胞裂解物(lysate)回收。[0189]可以使用本領域已知的對于所述多肽是特異性的方法來檢測多肽。這些檢測方法包括但不限于特異性抗體的使用、酶產物的形成或酶底物的消失。例如,酶測定法(enzymeassay)可用于確定多肽的活性。[0190]多肽可以使用本領域已知的方法回收。例如,多肽可以通過常規方法從營養培養基中回收,所述常規方法包括但不限于收集、離心、過濾、提取、噴霧干燥、蒸發或沉淀。[0191]多肽可以通過多種本領域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(preparative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS_PAGE或提取(參見,例如,ProteinPurification,Janson和Ryden編,VCHPublishers,NewYork,1989)。[0192]在另一個方面,不回收多肽,而是使用表達所述多肽的本發明的宿主細胞作為所述多肽的來源。[0193]植物[0194]本發明還涉及分離的植物,例如,轉基因植物、植物部分或植物細胞,其包含本發明的多核苷酸,從而以可回收的量表達和產生所述多肽或域。多肽或域可從植物或植物部分回收。或者,可以按原樣(assuch)將含有該多肽或域的植物或植物部分用于改進食品或飼料的質量,例如,改進營養價值、適口性(palatability)和流變性質(rheologicalproperties),或用于破壞抗營養因子。[0195]轉基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實例是草(grasses),如草地早熟禾(meadowgrass)(藍草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperategrass),如Agrostis(翦股穎屬);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。[0196]雙子葉植物的實例是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜桿(rapeseed)和緊密相關的模型生物體擬南芥(Arabidopsisthaliana)。[0197]植物部分的實例是莖(stem)、愈傷組織(callus)、葉(leaf)、根(root)、果實(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細胞區室(compartments),如葉綠體(chloroplast)、質外體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)和細胞質(cytoplasm)也被認為是植物部分。此外,任何植物細胞,無論什么組織來源,都被認為是植物部分。同樣地,植物部分,如分離以促進本發明的應用的具體組織和細胞也被認為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)。[0198]同樣包含于本發明范圍內的還有這些植物、植物部分和植物細胞的后代。[0199]表達多肽或域的轉基因植物或植物細胞可以依照本領域已知方法構建。簡而言之,通過如下方法構建所述植物或植物細胞:將編碼多肽或域的一個或多個表達構建體并入植物宿主基因組或葉綠體基因組,并且將所得的修飾植物或植物細胞繁殖為轉基因植物或植物細胞。[0200]表達構建體便利地是包含編碼多肽或域的多核苷酸的核酸構建體,所述多核苷酸與在選擇的植物或植物部分中表達該多核苷酸所需的適當的調節序列可操作地連接。此外,表達構建體可以包含對于鑒定植物細胞有用的選擇性標記,在所述植物細胞中整合了表達構建體和將該構建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。[0201]調節序列的選擇,例如啟動子和終止子序列和任選地信號或轉運序列的選擇,舉例來說,基于期望何時、何處以及如何表達多肽或域而確定。例如,編碼多肽或域的基因的表達可以是組成型的或誘導型的,或可以是發育、階段或組織特異性的,并且基因產物可以祀向特定的組織或植物部分如種子或葉。調節序列由例如Tague等,1988,PlantPhysiology86:506所述。[0202]對于組成性表達,可以使用35S_CaMV、玉米泛素I或稻肌動蛋白I啟動子(Franck等,1980,Cell21:285-294,Christensen等,1992,PlantM0.Biol.18:675-689;Zhang等,1991,PlantCell3:1155-1165)。器官特異性啟動子可以是例如來自貯藏庫組織(storagesinktissue)例如種子、馬鈴薯塊莖和果實的啟動子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或來自代謝庫組織(metabolicsinktissue)例如分生組織的啟動子(Ito等,1994,PlantMol.Biol.24:863-878),種子特異性啟動子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動子(Wu等,1998,PlantCellPhysiol.39:885-889),來自豆球蛋白(Iegumin)B4和蠶豆(Viciafaba)的未知的種子蛋白基因的蠶豆啟動子(Conrad等,1998,J.PlantPhysiol.152:708-711)、來自種子油體蛋白(oilbodyprotein)的啟動子(Chen等,1998,PlantCellPhysiol.39:935-941),來自歐洲油菜(Brassicanapus)的忙藏蛋白napA啟動子,或本【
技術領域:
】公知的任何其他種子特異性的啟動子,例如,在WO91/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或番爺的rbcs啟動子(Kyozuka等,1993,PlantPhysiol.102:991-1000),小球藻病毒(chlorellavirus)腺嘌`呤甲基轉移酶(adeninemethyltransferase)基因啟動子(Mitra和Higgins,1994,PlantMol.Biol.26:85-93),來自稻的aldP基因啟動子(Kagaya等,1995,Mol.Gen.Genet.248:668-674),或傷口誘導的啟動子,如馬鈴薯pin2啟動子(Xu等,1993,PlantMol.Biol.22:573-588)。同樣地,所述啟動子可通過非生物的處理誘導,所述非生物的處理諸如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動子的物質誘導,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脫落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金屬。[0203]啟動子增強子元件也可以用于實現多肽或域在植物中的較高表達。例如,啟動子增強子元件可以是內含子,其置于啟動子和編碼多肽或域的多核苷酸之間。例如Xu等,1993,見上,公開了使用稻肌動蛋白I基因的第一內含子以增強表達。[0204]選擇性標記基因和表達構建體的任何其它部分可以選自本領域內可用的那些。[0205]將核酸構建體根據本領域已知的常規技術并入植物基因組,所述常規技術包括土壤桿菌屬(Agrobacterium)介導的轉化、病毒介導的轉化、顯微注射(microinjection)、粒子轟擊、生物射彈轉化和電穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology8:535;Shimamoto等,1989,Nature338:274)。[0206]根癌土壤桿菌(Agrobacteriumtumefaciens)介導的基因轉移(genetransfer),是一種產生轉基因雙子葉植物(其綜述,參見Hooykas和Schilperoort,1992,PlantMol.Biol.19:15-38),和用于轉化單子葉植物的方法,雖然對于這些植物可使用其他的轉化方法。一種產生轉基因單子葉植物的方法是用粒子(用轉化DNA涂覆的微觀的金或鶴粒子)轟擊胚愈傷組織(embryoniccalli)或發育中的胚(developingembryos)(Christou,1992,PlantJ.2:275-281;Shimamoto,1994,Curr.0pin.Biotechnol.5:158-162;Vasil等,1992,Bio/Technology10:667-674)。轉化單子葉植物的可供選擇的方法是基于原生質體轉化,如由Omirulleh等,1993,PlantMol.Biol.21:415-428所描述的。其它轉化方法包括描述于美國專利號6,395,966和7,151,204中的那些(兩者均通過提述以其整體并入本文)。[0207]轉化之后,根據本領域熟知的方法選擇具有并入的表達構建體的轉化體并且再生成為完整植物。通常設計轉化方法用于通過如下方法在再生期間或在后續世代中選擇性消除選擇基因:例如,使用帶有兩個獨立的T-DNA構建體的共轉化或通過特異性重組酶位點特異性地切除選擇基因。[0208]除了直接用本發明的構建體直接轉化具體植物基因型之外,還可通過將具有構建體的植物與缺乏該構建體的第二植物雜交來制備轉基因植物。舉例而言,可將編碼多肽或域的構建體通過雜交而引入特定植物品種,而根本無需直接轉化該給定品種的植物。因此,本發明不僅涵蓋從依照本發明經轉化的細胞直接再生的植物,還包括此類植物的后代(progeny)。如用于本文,后代可指依照本發明制備的親本植物任何世代的后裔(offspring)0此種后代可包含依據本發明制備的DNA構建體。雜交導致轉基因通過將起始種系供體植物種系交叉授粉而引入植物種系。此類步驟的非限制性實例描述于美國專利號7,151,204。[0209]植物通過回交轉化方法生成。舉例而言,該植物包括稱作回交轉化的基因型、種系、近交體(inbred)或雜交體(hybrid)的植物。[0210]可使用遺傳標記以協助本發明的一種或多種轉基因從一個遺傳背景基因滲入(introgression)至另一個。標記協助的選擇提供了相對于常規育種的優勢,在于其可用于避免由表型變異導致的錯誤。進一步,遺傳標記可在特定雜交的個體后代中提供有關良種種質相對程度的數據。舉例而言,當本不(otherwise)具有非農藝學所需的遺傳背景但具有所需性狀的植物與良種親本雜交時,可使用遺傳標記來選擇不僅具有目標性狀,還具有相對較大比例所需種質的后代。以此方式,使一種或多種性狀基因滲入特定遺傳背景所需的世代數得到最小化。[0211]本發明亦涉及產生本發明的多肽或域的方法,其包括:(a)在有助于產生所述多肽或域的條件下培養轉基因植物或植物細胞,所述植物或植物細胞包含編碼多肽或域的多核苷酸;和(b)回收所述多肽或域。[0212]下面給出了本發明的多肽組合物的優選用途。本發明的多肽組合物的劑量和使用所述組合物的其它條件可基于本領域中已知的方法來確定。[0213]本發明還涉及下述使用具有纖維二糖水解酶活性的多肽或其組合物的工藝。[0214]本發明還涉及降解纖維素材料的工藝,其包括:在本發明的具有纖維二糖水解酶活性的多肽的存在下,用酶組合物處理纖維素材料。在一個方面,所述方法進一步包括回收已降解或轉化的纖維素材料。所述纖維素材料的降解或轉化的可溶性產物可使用本領域已知的方法如例如離心、過濾或重力沉降從不溶性纖維素材料分離。[0215]本發明還涉及產生發酵產物的工藝,其包括:(a)在本發明的具有纖維二糖水解酶活性的多肽的存在下,用酶組合物糖化纖維素材料;(b)用一種或多種(例如幾種)發酵微生物發酵經糖化的纖維素材料以產生發酵產物;和(C)從發酵回收發酵產物。[0216]本發明還涉及發酵纖維素材料的工藝,其包括:用一種或多種(例如幾種)發酵微生物發酵纖維素材料,其中所述纖維素材料是在本發明的具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化的。在一個方面,纖維素材料的發酵產生發酵產物。在另一個方面,所述方法進一步包括從發酵回收發酵產物。[0217]本發明的工藝可以用于將纖維素材料糖化成可發酵糖,并且將可發酵糖轉化成很多有用的發酵產物,例如燃料、飲用乙醇和/或平臺化學品(platformchemical)(例如酸、醇、酮、氣體等)。從纖維素材料產生期望的發酵產物通常涉及預處理、酶水解(糖化)和發酵。[0218]根據本發明的纖維素材料的處理可以使用本領域的常規工藝完成。此外,本發明的方法能使用經配置以依照發明操作的任何常規生物質加工設備進行。[0219]水解(糖化)和發酵,分別或同時,包括但不限于,分離的水解和發酵(SHF)、同步糖化和發酵(SSF)、同步糖化和共發酵(SSCF)、混合的水解和發酵(HHF)、分離的水解和共發酵(SHCF)、混合的水解和共發酵(HHCF),和直接微生物轉化(DMC),有時也稱為合并的生物加工(consolidatedbioprocessing,CBP)。SHF使用分離的處理步驟以首先將纖維素材料酶水解為可發酵糖,例如,葡萄糖,纖維二糖和戊糖單體,然后將可發酵糖發酵成為乙醇。在SSF中,纖維素材料的酶水解和糖變為乙醇的發酵在一個步驟中組合(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanol!ProductionandUtilization,Wyman,C.E編,Taylor&Francis,Washington,DC,179-212)oSSCF包括多種糖的共發酵(SheehanJ.和HimmelΜ.,1999,Enzymes,energyandtheenvironment:AstrategicperspectiveontheU.S.DepartmentofEnergy’sresearchanddevelopmentactivitiesforbioethanol,Biotechnol.Prog.15:817-827)。HHF在同步糖化和水解步驟之外,還涉及單獨的水解步驟,所述步驟可以在同一個反應器中進行。HHF過程中的步驟可以在不同的溫度,即,高溫酶法糖化,然后在發酵菌株能夠耐受的較低溫度進行SSF。DMC在一個或多個(例如幾個)步驟中組合了所有三個過程(酶產生、水解和發酵),其中使用相同的生物體產生用于將纖維素材料轉化成可發酵糖并將可發酵糖轉化成終產物的酶(Lynd,L.R.,Weimer,P.J.,vanZyl,W.H.,和Pretorius,1.S.,2002,Microbialcelluloseutilization!Fundamentalsandbiotechnology,Microbiol.Mol.Biol.Reviews66:506-577)。在本文可以理解的是,任何本領域中已知的方法,包括預處理、酶水解(糖化)、發酵,或它們的組合,可用于實施本發明的工藝。[0220]常規設備包括補料批式攪拌反應器、批式攪拌反應器、具有超濾的連續流攪拌反應器和/或連續活塞流柱式反應器(FernandadeCastilhosCorazza,FlavioFariadeMoraes,GisellaMariaZanin和IvoNeitzel,2003,Optimalcontrolinfed—batchreactorforthecellobiosehydrolysis,ActaScientiarum.Technology25:33-38;Gusakov,A.V.和Sinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose:1.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7:346-352)、研磨反應器(Ryu,S.K.和Lee,J.M.,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.25:53-65),或者具有由電磁場引起的強烈攪拌的反應器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,1.Y.,Davydkin,V.Y.,Protasj0.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,Appl.Biochem.Biotechnol.56:141-153)。其它反應器類型包括:流化床、升流層(upflowblanket)、固定化和用于水解和/或發酵的擠出機型的反應器。[0221]預處理。在本發明的工藝的實施中,可以使用本領域已知的任何預處理過程破壞植物細胞壁的纖維素材料組分(Chandra等,2007,Substratepretreatment:Thekeytoeffectiveenzymatichydrolysisoflignocellulosics?Adv.Biochem.Engin./Biotechnol.108:67-93;Galbe和Zacchi,2007,Pretreatmentoflignocellulosicmaterialsforefficientbioethanolproduction,Adv.Biochem.Engin./Biotechnol.108:41-65;Hendriks和Zeeman,2009,Pretreatmentstoenhancethedigestibilityoflignocellulosicbiomass,BioresourceTechnol.100:10-18;Mosier等,2005,Featuresofpromisingtechnologiesforpretreatmentoflignocellulosicbiomass,BioresourceTechnol.96:673-686;Taherzadeh和Karimi,2008,Pretreatmentoflignocellulosicwastestoimproveethanolandbiogasproduction:Areview,Int.J.0fMol.Sc1.9:1621-1651;Yang和Wyman,2008,Pretreatment:thekeytounlockinglow-costcellulosicethanol,BiofuelsBioproductsandBiorefining-Biofpr.2:26-40)。[0222]纖維素材料也可以在預處理之前使用本領域中已知的方法進行粒度減小、篩分、預浸泡、潤濕、洗漆和/或調理(conditioning)。[0223]常規的預處理包括但不限于,蒸汽預處理(伴隨或不伴隨爆炸)、稀酸預處理、熱水預處理、堿性預處理、石灰預處理、濕氧化、濕爆炸、氨纖維爆炸、有機溶劑預處理和生物預處理。其它預處理包括氨滲濾、超聲、電穿孔、微波、超臨界CO2、超臨界!120、臭氧、離子性液體和Y輻射預處理。[0224]可以在水解和/或發酵之前預處理纖維素材料。預處理優選在水解前進行。或者,預處理可以與酶水解同時進行以釋放可發酵糖,如葡萄糖、木糖和/或纖維二糖。在大多數情況下,預處理步驟本身使一些生物質轉化成可發酵糖(甚至在不存在酶的情況下)。[0225]蒸汽預處理。在蒸汽預處理中,加熱纖維素材料以破壞植物細胞壁成分,包括木質素、半纖維素和纖維素,使酶可接觸纖維素和其它級分,例如,半纖維素。將纖維素材料經過或通過反應容器,其中注入蒸汽以增加溫度至需要的溫度和壓力,并且在其中保持期望的反應時間。蒸汽預處理優選在140-250°C,例如160-200°C,或170-190°C進行,其中最優的溫度范圍依賴于任何化學催化劑的添加。蒸汽預處理的停留時間優選1-60分鐘,例如1-30分鐘,1-20分鐘,3-12分鐘,或4-10分鐘,其中最優的停留時間依賴于溫度范圍和化學催化劑的添加。蒸汽預處理允許相對較高的固體加載量,使纖維素材料在預處理過程中通常僅僅變得潮濕。蒸汽預處理經常與預處理后的物質的爆炸放料(explosivedischarge)組合,這稱為蒸汽爆炸,即,快速閃變至大氣壓和物質的湍流,以通過破碎增加可接觸的表面積(Duff和Murray,1996,BioresourceTechnology855:1-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;美國專利申請N0.20020164730)。在蒸汽預處理過程中,切割半纖維素乙酰基團,并且得到的酸自催化半纖維素部分水解成為單糖和寡糖。去除木質素僅至有限的程度。[0226]化學預處理:術語“化學處理”指能促進纖維素、半纖維素和/或木質素分離和/或釋放的任何化學預處理。此種預處理可將晶體纖維素轉化為無定形纖維素。合適的化學預處理工藝的實例包括例如稀酸預處理、石灰預處理、濕氧化、氨纖維/冷凍爆炸(AFEX)、氨滲濾(APR)、離子性液體和有機溶劑預處理。[0227]經常在蒸汽預處理之前加入催化劑如H2SO4或SO2(通常0.3至5%w/w),其可減少時間,降低溫度,增加回收率,并改進酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga等,2004,Appl.Biochem.Biotechnol.113-116:509-523;Sassner等.,2006,EnzymeMicrob.Technol.39:756-762)。在稀酸預處理中,將纖維素材料與稀酸(通常是H2SO4)和水混合以形成漿料,由蒸汽加熱至期望的溫度,并在一段停留時間后閃變至大氣壓。可以用很多反應器設計進行稀酸預處理,例如,活塞流反應器、逆流反應器或連續逆流收縮床反應器(Duff和Murray,1996,supra;Schell等,2004,BioresourceTechnol.91:179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。[0228]還可以使用堿性條件下的幾種預處理方法。這些堿預處理包括,但不限于,氫氧化鈉、石灰、濕氧化、氨滲濾(APR)和氨纖維/冷凍爆炸(AFEX)。[0229]用氧化鈣或氫氧化鈣,在85_150°C的溫度進行石灰預處理,停留時間從I小時到幾天(Wyman等,2005,BioresourceTechnol.96:1959-1966;Mosier等,2005,BioresourceTechnol.96:673-686)。WO2006/110891,WO2006/110899,WO2006/110900和WO2006/110901公開了使用氨的預處理方法。[0230]濕法氧化是熱預處理,通常在180-20(TC進行5-15分鐘,加入氧化劑如過氧化氧或過壓氧(Schmidt和Thomsen,1998,BioresourceTechnol.64:139-151;Palonen等,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等,2004,Biotechnol.Bioeng.88:567-574;Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。預處理以優選1-40%干物質,例如2-30%干物質,或5-20%干物質進行,并且由于加入堿如碳酸鈉,初始PH常常會增加。[0231]濕法氧化預處理方法的修改方法,稱為濕爆炸(濕氧化和蒸汽爆炸的組合),能夠處理高達30%的干物質。在濕爆炸中,在預處理過程中,在一定的停留時間后引入氧化劑。然后通過閃變至大氣壓而結束預處理(W02006/032282)。[0232]氨纖維爆炸(AFEX)涉及在溫和溫度如90-150°C和高壓如17_20bar,用液體或氣體氨將纖維素材料處理5-10分鐘,其中干物質含量可以高達60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96:219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等,2005,BioresourceTechnol.96:2014-2018)。在AFEX預處理過程中,纖維素和半纖維素保持相對完整。木質素-糖復合物受切割。[0233]有機溶劑預處理通過用含水乙醇(40-60%乙醇)在160-200°C提取30_60分鐘而將纖維素材料去木質素化(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,BiotechnoI.Bioeng.94:851-86I;Kurabi等,2005,Appl.Biochem.Biotechnol.121:219-230)。經常加入硫酸作為催化劑。在有機溶劑預處理中,去除大部分半纖維素和木質素。[0234]合適的預處理方法的其他實例如Schell等,2003,Appl.BiochemandBiotechn.105-108:69-85,和Mosier等,2005,BioresourceTechnology96:673-686,和美國公開申請2002/0164730所述。[0235]在一個方面,化學預處理優選作為稀酸處理,并且更優選作為連續稀酸處理進行。酸通常是硫酸,但也可以使用其它酸,如乙酸、檸檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氫或其混合物。弱酸(mildacid)處理在優選1_5,例如1_4,或1-2.5的pH范圍進行。在一個方面,酸濃度在優選0.01至10wt%酸,例如0.05至5wt%酸或0.1至2wt%酸的范圍。將酸與纖維素材料接觸,并在優選140-200°C,例如165-190°C范圍的溫度保持I至60分鐘的時間。[0236]在另一個方面,預處理發生在含水漿料中。在優選的方面,在預處理過程中纖維素材料以優選10-80wt%,例如20-70wt%或30-60wt%,如約40wt%的量存在。預處理的纖維素材料可以不洗滌或者使用本領域任何已知的方法洗滌,例如,用水洗滌。[0237]機械預處理或物理預處理:術語“機械預處理”或“物理預處理”指任何促進顆粒大小減少的預處理。舉例而言,此種預處理可涉及各種類型的磨制(grinding)或粉碎(milling)(例如,干磨、濕磨或振動球磨)。[0238]纖維素材料可經物理(機械)和化學預處理。機械或物理預處理可與下述偶聯:汽蒸/蒸汽爆炸、水熱解(hydrothermolysis)、稀酸或弱酸處理、高溫、高壓處理、福射(例如微波福射),或其組合。在一個方面,高壓指優選約100至約400psi,例如約150至約250psi的范圍的壓強。在另一個方面,高溫指約100至300°C,例如約140至約200°C范圍的溫度。在一個優選的方面,機械或物理預處理在使用利用如上所定義的高溫和高壓的蒸汽槍水解器系統(例如來自SundsDefibratorAB,Sweden的SundsHydrolyzer)的分批過程中進行。所述物理和化學預處理可視需要順序進行或同時進行。[0239]因此,在一個優選的方面,對纖維素材料進行物理(機械)或化學預處理,或者它們的任何組合,以促進纖維素、半纖維素和/或木質素的分離和/或釋放。[0240]生物預處理:術語“生物預處理”指可以促進纖維素、半纖維素和/或木質素從纖維素材料分離和/或釋放的任何生物預處理。生物預處理技術可以包括應用溶解木質素的微生物和/或酶(參見,例如,Hsu,T.-A.,1996,Pretreatmentofbiomass,于HandbookonBioethanol:ProductionandUtilization,Wyman,C.E編,Taylor&Francis,Washington,DC,179-212;Ghosh和Singh,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,Adv.Appl.Microbiol.39:295-333;McMiIlan,J.D.,1994,Pretreatinglignocellulosicbiomass:areview,于EnzymaticConversionofBiomassforFuelsProduction,Himmel,M.E.,Baker,J.0.,和Overend,R.P.,編,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.,編,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Olsson和Hahn-Hagerdal,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18:312-331;和Vallander和Eriksson,1990,Productionofethanolfromlignocellulosicmaterials:Stateoftheart,Adv.Biochem.Eng./Biotechnol.42:63-95)。[0241]趣化。在水解(也稱作糖化)步驟中,將例如經預處理的纖維素材料水解以將纖維素和半纖維素分解成可發酵糖,如葡萄糖、纖維二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶的寡糖。水解由酶組合物以酶法在本發明具有纖維二糖水解酶活性的多肽的存在下進行。組合物的酶還可以同時或順序加入。[0242]酶水解優選在容易由本領域技術人員確定的條件下,在合適的含水環境中進行。在一個方面,水解在適于酶的活性,即對于酶最佳的條件下進行。水解可以以補料分批或連續的過程進行,其中將纖維素材料逐漸補入,例如,含酶的水解溶液中。[0243]糖化通常在攪拌釜反應器或發酵罐中在受控的pH、溫度和混合條件下進行。合適的處理時間、溫度和pH條件可以由本領域技術人員容易地確定。例如,糖化可持續長達200小時,但是通常進行優選約12至約120小時,例如約16至約72小時,或約24至約48小時。溫度在優選約25°C至約70°C,例如約30°C至約65°C,約40°C至約60°C,或約50°C至55°C的范圍。pH在優選約3至約8,例如約3.5至約7,約4至約6,或約5.0至約5.5的范圍。干固體含量在優選約5至約50wt%,例如約10至約40wt%,或約20至約30wt%的范圍。[0244]本發明還涉及包含本發明多肽的酶組合物。優選地,所述組合物富集此種多肽。術語“富集”表明組合物的纖維二糖水解酶活性,例如,以至少1.1的富集因數(enrichmentfactor)增加。`[0245]所述組合物可以包含本發明的多肽作為主要酶成分,例如,單成分組合物。或者,所述組合物可以包含多種酶活性,如一種或多種(幾種)選自下組的酶:纖維素酶、半纖維素酶、棒曲霉素、酯酶、漆酶、木質素分解酶、果膠酶、過氧化物酶、蛋白酶和膨脹素。[0246]在一個優選實施方案中,所述酶組合物包含至少本發明的纖維二糖水解酶,至少一種內切葡聚糖酶,至少一種β-葡糖苷酶,和至少一種具有纖維素分解增強活性的GH61多肽。[0247]可以依照本領域內已知的方法制備多肽組合物,并且可以是液體或干組合物的形式。例如,所述多肽組合物可以是顆粒(granulate)或微粒(microgranulate)的形式。可以依照本領域內已知方法使包含于所述組合物中的多肽穩定化。[0248]酶組合物可包含任何可用于降解纖維素材料的蛋白。[0249]在一個方面,所述酶組合物包含或進一步包含一種或多種(例如幾種)選自下組的蛋白:纖維素酶、具有纖維素分解增強活性的GH61多肽,半纖維素酶、酯酶、棒曲霉素、漆酶、木質素分解酶、果膠酶、過氧化物酶、蛋白酶和膨脹素。在另一個方面,所述纖維素酶為優選一種或多種(例如幾種)選自下組的酶:內切葡聚糖酶、其它纖維二糖水解酶和葡糖苷酶。在另一個方面,所述半纖維素酶為優選一種或多種(例如幾種)選自下組的酶:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。[0250]在另一個方面,所述酶組合物包含一種或多種(例如幾種)纖維素分解酶。在另一個方面,所述酶組合物包含或進一步包含一種或多種(例如幾種)半纖維素分解酶。在另一個方面,所述酶組合物包含一種或多種(例如幾種)纖維素分解酶和一種或多種(例如幾種)半纖維素分解酶。在另一個方面,所述酶組合物包含一種或多種(例如幾種)選自下組的酶:纖維素分解酶和半纖維素分解酶。在另一個方面,所述酶組合物包含內切葡聚糖酶。在另一個方面,所述酶組合物包含纖維二糖水解酶。在另一個方面,所述酶組合物包含β_葡糖苷酶。在另一個方面,所述酶組合物包含具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含內切葡聚糖酶和具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含纖維二糖水解酶和具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含β_葡糖苷酶和具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含內切葡聚糖酶和纖維二糖水解酶。在另一個方面,所述酶組合物包含內切葡聚糖酶和葡糖苷酶。在另一個方面,所述酶組合物包含纖維二糖水解酶和葡糖苷酶。在另一個方面,所述酶組合物包含內切葡聚糖酶、纖維二糖水解酶和具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含內切葡聚糖酶、β-葡糖苷酶和具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含纖維二糖水解酶、β-葡糖苷酶和具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含內切葡聚糖酶、纖維二糖水解酶和葡糖苷酶。在另一個方面,所述酶組合物包含內切葡聚糖酶、纖維二糖水解酶、β-葡糖苷酶和具有纖維素分解增強活性的多肽。[0251]在另一個方面,所述酶組合物包含乙酰甘露聚糖酯酶。在另一個方面,所述酶組合物包含乙酰木聚糖酯酶。在另一個方面,所述酶組合物包含阿拉伯聚糖酶(例如α-L-阿拉伯聚糖酶)。在另一個方面,所述酶組合物包含阿拉伯呋喃糖苷酶(例如a-L-阿拉伯呋喃糖苷酶)。在另一個方面,所述酶組合物包含香豆酸酯酶。在另一個方面,所述酶組合物包含阿魏酸酯酶。在另一個方面,所述酶組合物包含半乳糖苷酶(例如α-半乳糖苷酶和/或半乳糖苷酶)。在另一個方面,所述酶組合物包含葡糖醛酸糖苷酶(例如a-D-葡糖醛酸糖苷酶)。在另一個方面,所述酶組合物包含葡糖醛酸酯酶。在另一個方面,所述酶組合物包含甘露聚糖酶。在另一個方面,所述酶組合物包含甘露糖苷酶(例如甘露糖苷酶)。在另一個方面,所述酶組合物包含木聚糖酶。在一個優選的方面,所述木聚糖酶是家族10木聚糖酶。在另一個方面,所述酶組合物包含木糖苷酶(例如β-木糖苷酶)。[0252]在另一個方面,所述酶組合物包含酯酶。在另一個方面,所述酶組合物包含棒曲霉素。在另一個方面,所述酶組合物包含漆酶。在另一個方面,所述酶組合物包含木質素分解酶。在另一個優選的方面,所述木質素分解酶是錳過氧化物酶。在另一個優選的方面,所述木質素分解酶是木質素過氧化物酶。在另一個優選的方面,所述木質素分解酶是產生H2O2的酶。在另一個方面,所述酶組合物包含果膠酶。在另一個方面,所述酶組合物包含過氧化物酶。在另一個方面,所述酶組合物包含蛋白酶。在另一個方面,所述酶組合物包含膨脹素。[0253]在本發明的方法中,酶可在發酵過程之前或之中,例如在糖化過程中或在發酵微生物的繁殖過程之中或之后添加。[0254]所述酶組合物的一種或多種(例如幾種)組分可為野生型蛋白、重組蛋白或野生型蛋白和重組蛋白的組合。舉例而言,一種或多種(例如幾種)組分可為細胞的天然蛋白,其用作宿主細胞以重組表達酶組合物的一種或多種(例如幾種)其他組分。酶組合物的一種或多種(例如幾種)組分可作為單組分產生,然后將其組合以形成酶組合物。所述酶組合物可為多組分和單組分蛋白制備物的組合。[0255]用于本發明工藝中的酶可為任何適用于如去除或不去除細胞的粗發酵液配制物,含或不含細胞碎片的細胞裂解液,半純化或純化的酶制備物,或宿主細胞,作為酶的來源。所述酶組合物可為干粉或顆粒,無粉塵的顆粒,液體,穩定化液體或穩定化受保護的酶。液體酶制備物可根據確立的工藝,例如通過添加穩定劑如糖、糖醇或其他多元醇,和/或乳酸或其他有機酸來穩定化。[0256]具有纖維二糖水解酶活性的酶和多肽的最適量取決于幾個因素,其包括但不限于,組分纖維素分解酶的混合物、纖維素材料、纖維素材料的濃度、纖維素材料的預處理、溫度、時間、pH和包括發酵生物體(例如,同步糖化和發酵的酵母)。[0257]在一個方面,纖維素分解酶或半纖維素分解酶對于纖維素材料的有效量是約0.5至約50mg,例如約0.5至約40mg,約0.5至約25mg,約0.75至約20mg,約0.75至約15mg,約0.5至約IOmg,或約2.5至約IOmg每g纖維素材料。[0258]在另一個方面,具有纖維二糖水解酶活性的多肽對于纖維素材料的有效量是約0.01至約50.0mg,例如約0.01至約40mg,約0.01至約30mg,約0.01至約20mg,約0.01至約IOmg,約0.01至約5mg,約0.025至約1.5mg,約0.05至約1.25mg,約0.075至約1.25mg,約0.1至約1.25mg,約0.15至約1.25mg,或約0.25至約1.0mg每g纖維素材料。[0259]在另一個方面,具有纖維二糖水解酶活性的多肽對于纖維素分解酶或半纖維素分解酶的有效量是約0.005至約LOg,例如約0.01至約LOg,約(λ15至約(λ75g,約(λ15至約0.5g,約0.1至約0.5g,約0.1至約0.25g,或約0.05至約0.2g每g纖維素分解酶或半纖維素分解酶。`[0260]具有纖維素分解酶活性或半纖維素分解酶活性的多肽,以及任何可用于纖維素材料的降解的蛋白/多肽,例如具有纖維素分解增強活性的GH61多肽(在本文中統稱為具有酶活性的多肽)可源自或獲得自任何合適的來源,包括細菌、真菌、酵母、植物或哺乳動物來源。術語“獲得”在本文中還意指該酶可在宿主生物中使用本文中所述的方法重組產生,其中經重組產生的酶對于宿主生物是天然的或外源的,或具有修飾的氨基酸序列,例如,具有一個或多個(例如幾個)缺失、插入和/或取代的氨基酸,即重組產生的酶,其為天然氨基酸序列的片段和/或突變體或通過本領域已知的氨基酸改組方法產生的酶。天然酶的含義中涵蓋的是天然變體,而外來酶的含義中涵蓋的是重組(如通過定位誘變或重排)獲得的變體。[0261]還可以使用具有酶活性的多肽的經化學修飾或蛋白質工程改造的突變體。[0262]所述纖維素分解酶組合物的一種或多種(例如幾種)組分可以是重組組分,亦即,通過克隆編碼所述單獨組分的DNA序列并隨后用該DNA序列轉化細胞并在宿主中表達(參見,例如,W091/17243和W091/17244)產生。所述宿主優選是異源宿主(酶對宿主是外源的),但該宿主在一定條件下也可以是同源宿主(酶對宿主是天然的)。單組分纖維素分解蛋白還可以通過從發酵液中提純這樣的蛋白質來制備。[0263]在一個方面,所述一種或多種(例如幾種)纖維素分解酶包含商業性纖維素分解酶制備物。適用于本發明的商業的纖維素分解酶制備物的實例包括,例如,CELLIC?Ctec(NovozymesA/S)、CELLIC?CTec2(NovozymesA/S)、CELLUCLAST?(NovozymesA/S)、NOVOZYMtmI88(NovozymesA/S)、CELLUZYME?(NovozymesA/S)、CEREFLO?(NovozymesA/S)和ULTRAFLO?(NovozymesA/S),ACCELERASE?(GenencorInt.),LAMINEX?(GenencorInt.)、SPEZYME?CP(GenencorInt.),FILTRASE;?NL(DSM)、METHAPLUS,?S/L100(DSM),R0HAMENT?7069ff(RohmGmbH),FIBREZYME[φLDI(DyadicInternational,Inc.)、FIBREZYME?LBR(DyadicInternational,Inc.)或VISCOSTARj?150L(DyadicInternational,Inc.)。所述纖維素酶酶以固體的約0.001至約5.0wt%,例如固體的約0.025至約4.0wt%,或固體的約0.005至約2.0wt%的有效量添加。[0264]可以用于本發明的工藝的細菌內切葡聚糖酶的實例包括但不僅限于,解纖維熱酸菌(Acidothermuscellulolyticus)內切葡聚糖酶(W091/05039;W093/15186;美國專利5,275,944;W096/02551;美國專利5,536,655,WO00/70031,WO05/093050);Thermobifidafusca內切葡聚糖酶III(TO05/093050)jPThermobifidafusca內切葡聚糖酶V(W005/093050)。[0265]可以用于本發明的真菌內切葡聚糖酶的實例包括但不僅限于,里氏木霉內切葡聚糖酶KPenttila等,1986,Gene45:253-263,里氏木霉Cel7B內切葡聚糖酶I(GENBANK?登錄號M15665);里氏木霉內切葡聚糖酶II(Saloheimo等,1988,Gene63:11-22),里氏木霉Cel5A內切葡聚糖酶II(GENBANK?登錄號M19373);里氏木霉內切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GENBANK?登錄號AB003694);里氏木霉內切葡聚糖酶V(Saloheimo等,1994,MolecularMicrobiology13:219-228;GENBANK?登錄號Z33381);棘抱曲霉內切葡聚糖酶(Ooi等,1990,NucleicAcidsResearch18:5884);川地曲霉(Aspergilluskawachii)內切葡聚糖酶(Sakamoto等,1995,CurrentGenetics27:435-439);胡蘿卜軟腐歐文氏菌(Erwiniacarotovara)內切葡聚糖酶(Saarilahti^,1990,Gene90:9-14);尖鐮孢內切葡聚糖酶(GENBANK?登錄號L29381);灰腐質霉thermoidea變種內切葡聚糖酶(GENBANK?登錄號AB003107);Melanocarpusalbomyces內切葡聚糖酶(GENBANK?登錄號MAL515703);粗糙脈孢菌內切葡聚糖酶(GENBANK?登錄號XM_324477);特異腐質霉內切葡聚糖酶V;嗜熱毀絲霉CBS117.65內切葡聚糖酶;擔子菌綱(basidiomycete)CBS495.95內切葡聚糖酶;擔子菌綱CBS494.95內切葡聚糖酶;土生梭孢霉NRRL8126CEL6B內切葡聚糖酶;土生梭孢霉NRRL8126CEL6C內切葡聚糖酶;土生梭孢霉NRRL8126CEL7C內切葡聚糖酶;土生梭孢霉NRRL8126CEL7E內切葡聚糖酶;土生梭抱霉NRRL8126CEL7F內切葡聚糖酶;CladorrhinumfoecundissimumATCC62373CEL7A內切葡聚糖酶;以及里氏木霉菌株VTT-D-80133內切葡聚糖酶(GENBANK?登錄號M15665)。[0266]可用于本發明的其它纖維二糖水解酶的實例包括但不僅限于,棘孢曲霉纖維二糖水解酶II(W02011/059740),嗜熱毛殼菌(Chaetomiumthermophilum)纖維二糖水解酶I,嗜熱毛殼菌纖維二糖水解酶II,特異腐質霉纖維二糖水解酶I,嗜熱毀絲霉纖維二糖水解酶II,(W02009/042871),Thielaviahyrcanie纖維二糖水解酶II(W02010/141325),土生梭孢霉纖維二糖水解酶II(CEL6A,WO2006/074435),里氏木霉纖維二糖水解酶I,里氏木霉纖維二糖水解酶II,以及褐孢長毛盤菌纖維二糖水解酶II(WO2010/057086)。[0267]可用于本發明的葡糖苷酶的實例包括但不僅限于來自棘孢曲霉(Kawaguchi等,1996,Gene173:287-288)、煙曲霉(W02005/047499)、黑曲霉(Dan等,2000,J.Biol.Chem.275:4973-4980)、米曲霉(W02002/095014)、巴西青霉IBT20888(W02007/019442和TO2010/088387)、土生梭孢霉(W02011/035029)和褐孢長毛盤菌(W02007/019442)的β-葡糖苷酶。[0268]所述β-葡糖苷酶可以是融合蛋白。在一個方面,所述β-葡糖苷酶是WO米曲霉葡糖苷酶變體BG融合蛋白(W02008/057637)或米曲霉β-葡糖苷酶融合蛋白(2008/057637)。[0269]其它可用的內切葡聚糖酶、纖維二糖水解酶和葡糖苷酶公開于使用根據Henrissat,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309-316和Henrissat和Bairoch,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696的分類的許多糖基水解酶家族中。[0270]其它可用于本發明的纖維素分解酶描述于WO98/13465、WO98/015619、WO98/015633、WO99/06574、WO99/10481、WO99/025847、WO99/031255、WO2002/101078、WO2003/027306,WO2003/052054,WO2003/052055,WO2003/052056,WO2003/052057、WO2003/052118,WO2004/016760,WO2004/043980,WO2004/048592,WO2005/001065、WO2005/028636,WO2005/093050,WO2005/093073,WO2006/074005,WO2006/117432、WO2007/071818、WO2007/071820、WO2008/008070、WO2008/008793、美國專利N0.5,457,046、美國專利N0.5,648,263和美國專利N0.5,686,593。[0271]在本發明的工藝中,可使用任何具有纖維素分解增強活性的GH61多肽。[0272]可用于本發明的工藝的具有纖維素分解增強活性的GH61多肽的實例包括但不限于來自土生梭孢霉(W02005/074647,WO2008/148131和WO2011/035027);桔橙熱子囊菌(W02005/074656和WO2010/065830),里氏木霉(W02007/089290),嗜熱毀絲霉(W02009/085935,WO2009/085859,WO2009/085864,WO2009/085868),煙曲霉(W02010/138754)的GH61多肽,來自嗜松青霉(Penicilliumpinophilum)(W02011/005867),嗜熱子囊菌菌種(W02011/039319),青霉屬菌種(W02011/041397),和Thermoascuscrustaceous(W02011/041504)的GH61多肽。[0273]在一個方面,所述具有纖維素分解增強活性的GH61多肽在WO2008/151043中所述的可溶性活化二價金屬陽離子,例如硫酸錳的存在下使用。[0274]在一個方面,所述具有纖維素分解增強活性的GH61多肽在二氧化合物、二環化合物、雜環化合物、含氮化合物、醌化合物、含硫化合物或從經預處理的纖維素材料(如經預處理的玉米秸桿(PCS))獲得的液體的存在下使用。[0275]所述二氧化合物可包括任何含有兩個或更多氧原子的合適化合物。在一些方面,所述二氧化合物含有如本文中所述的取代的芳基模塊(moiety)。所述二氧化合物可包括一個或多個(幾個)羥基和/或羥基衍生物,但亦包括缺乏羥基和羥基衍生物的取代的芳基模塊。二氧化合物的非限定性實例包括鄰苯二酚或兒茶酚;咖啡酸;3,4-二羥基苯甲酸;4-叔丁基-5-甲氧基-1,2-苯二酚;連苯三酚;沒食子酸;甲基_3,4,5-三羥基苯甲酸;2,3,4-三羥基二苯甲酮;2,6-二甲氧基苯酚;芥子酸;3,5-二羥基苯甲酸;4_氯-1,2-苯二酚;4_硝基-1,2-苯二酚;鞣酸;沒食子酸乙酯;羥乙酸甲酯;二羥基延胡索酸;2_丁炔-1,4-二醇;克酮酸;1,3-丙二醇;酒石酸;2,4-戊二醇;3-乙氧基-1,2-丙二醇;2,4,4’-三羥基二苯甲酮;順-2-丁烯-1,4-二醇;3,4-二羥基-3-環丁烯-1,2-二酮;二羥基丙酮;乙酰丙烯醛(acroleinacetal);甲基_4_羥基苯甲酸;4_羥基苯甲酸;和甲基-3,5-二甲氧基-4-羥基苯甲酸;或它們的鹽或溶劑合物(solvate)。[0276]所述二環化合物可包括任何如本文中所述的合適的取代稠環系統。所述化合物可包含一個或多個(例如幾個)另外的環,且除非另行說明,不限于具體的環數。在一個方面,所述二環化合物是類黃酮。在另一個方面,所述二環化合物是任選取代的異類黃酮(isoflavonoid)。在另一個方面,所述二環化合物是任選取代的花色銲離子(fIavyIiumion),如任選取代的花色素或任選取代的花色苷,或其衍生物。二環化合物的非限定性實例包括表兒茶素(epicatechin);槲皮素(quercetin);楊梅黃酮(myricetin);黃杉素(taxifolin);山奈酌.(kaempferol);桑素(morin);金合歡素(acacetin);柚皮素(naringenin);異鼠李黃素(isorhamnetin);療菜苷配基(apigenin);花青素(cyanidin);花色素苷(cyanin);kuromanin;花青素鼠李葡糖苷(keracyanin);或它們的鹽或溶劑合物。[0277]所述雜環化合物可為任何合適的化合物,如本文中所述的任選取代的包含雜原子的芳環或非芳環。在一個方面,所述雜環是包含任選取代的雜環烷基模塊或任選取代的雜芳基模塊的化合物。在另一個方面,所述任選取代的雜環烷基(heterocycloalkyl)模塊或任選取代的雜芳基模塊是任選取代的五元雜環烷基或任選取代的五元雜芳基模塊。在另一個方面,任選取代的雜環烷基或任選取代的雜芳基模塊是選自如下的任選取代的模塊:批唑基、呋喃基、咪唑基、異噁唑基、噁二唑基、噁唑基、吡咯基、吡啶基、嘧啶基、噠嗪基、噻唑基、三唑基、噻吩基(thienyl)、二氫噻吩-批唑基(dihydrothieno-pyrazolyl)、硫卻基、咔唑基、苯并咪唑基、苯并噻吩基(benzothienyl)、苯并呋喃基、吲哚基、喹啉基、苯并三唑基、苯并噻唑基、苯并噁唑基(benz`ooxazolyl)、苯并咪唑基、異喹啉基、異1?丨哚基、Π丫唳基、苯并異噁唑基(benzoisazolyl)、二甲基乙內酰脲、吡嗪基、四氫呋喃基、吡咯啉基、吡咯烷基、嗎啉基、吲哚基、二氮雜環庚三烯基(diazepinyl)、氮雜環庚三烯基(azepinyl)、硫雜環庚三烯基(thiepinyl)、哌唳基和氧雜環庚三烯基(oxepinyl)。在另一個方面所述任選取代的雜環烷基模塊或任選取代的雜芳基模塊是任選取代的呋喃基。雜環化合物的非限定性實例包括(1,2-二羥乙基)-3,4-二氫呋喃-2(5H)-酮;4-羥基-5-甲基_3_呋喃酮;5-羥基-2(5H)-呋喃酮;[1,2-二羥乙基]呋喃-2,3,4(5!1)-三酮;(1-羥基1-丁內酯;核糖酸Y-內酯;己醒糖酸Y-內酯(aldohexuronicaldohexuronicacidY-lactone);葡糖酸S-內酯;4-羥基香豆素;二氫苯并呋喃;5-(羥甲基)糠醛;糠偶姻(fuiOin);2(5H)_呋喃酮;5,6-二氫-2H-吡喃-2-酮;和5,6-二氫-4-羥基-6-甲基-2H-吡喃-2-酮;或它們的鹽或溶劑合物。[0278]所述含氮化合物可為任何具有一個或多個氮原子的合適化合物。在一個方面,所述含氮化合物包含胺、亞胺、羥胺或氧化亞氮(nitroxide)模塊。含氮化合物的非限定性實例包括丙酮肟;紫尿酸;吡啶-2-醛肟;2_氨基苯酚;1,2-苯二胺;2,2,6,6-四甲基-1-哌啶基氧(piperidinyloxy);5,6,7,8-四氫生物蝶呤;6,7-二甲基-5,6,7,8-四氫蝶呤;和馬來酰胺酸;或它們的鹽或溶劑合物。[0279]所述醌化合物可為任何本文中所述的包含醌模塊的合適的化合物。醌化合物的非限定性實例包括1,4-苯醌;1,4-萘醌;2_羥基-1,4-萘醌;2,3-二甲氧基-5-甲基-1,4-苯醌或輔酶Qtl;2,3,5,6-四甲基-1,4-苯醌或四甲基對苯醌;1,4-二羥基蒽醌;3-羥基-1-甲基-5,6-二氫吲哚二酮或腎上腺色素;4_叔丁基-5-甲氧基-1,2-苯醌;批咯并喹啉醌(pyrroloquinolinequinone);或它們的鹽或溶劑合物。[0280]所述含硫化合物可為任何包含一個或多個硫原子的合適的化合物。在一個方面,所述含硫化合物包含選自如下的模塊:亞硫酰,硫醚,亞磺酰,磺酰,磺酰胺(sulfamide),磺酰胺(sulfonamide),磺酸和磺酸酯。含硫化合物的非限定性實例包括乙硫醇;2-丙硫醇;2_丙烯-1-硫醇;2_巰基乙磺酸;苯硫醇;苯-1,2-二硫醇;半胱氨酸;甲硫氨酸;谷胱甘肽;胱氨酸;或它們的鹽或溶劑合物。[0281]在一個方面此種如上所述的化合物對纖維素材料的有效量,作為對纖維素糖單元的摩爾比例為約10-6至約10,例如約10-6至約7.5,約10-6至約5,約10-6至約2.5,約10-6至約1,約KT5至約1,約I(T5至約KT1,約I(T4至約KT1,約I(T3至約KT1,或約I(T3至約10'在另一個方面,此種如上所述的化合物的有效量為約0.1μM至約1Μ,例如約0.5μΜ至約0.75Μ,約0.75μM至約0.5Μ,約IμM至約0.25Μ,約IμM至約0.1Μ,約5μM至約50mM,約10μM至約25mM,約50μM至約25mM,約10μM至約10mM,約5μM至約5mM,或約0.1mM至約ImM。[0282]術語“液劑(liquor)”意指在本文中所述的條件下,通過處理漿料中的木素纖維素和/或半纖維素材料,或其單糖例如木糖、阿拉伯糖、甘露糖等,所產生的溶液相,即水相、有機相或其組合,及其可溶性內含物。用于GH61多肽的纖維素分解增強的液劑可通過,任選在催化劑例如酸的存在下,任選在有機溶劑的存在下,且任選與所述材料的物理破壞相組合來藉由施加熱和/或壓力來處理纖維素材料或半纖維素材料(或原料),然后將溶液與殘余固體分離來產生。此類條件決定在通過纖維素酶制備物水解纖維素材料過程中,通過液劑和GH61多肽的組合可獲得的纖維素分解增強的程度。所述液劑可使用本領域中的標準方法如過濾、沉積或離心從經處理的材料分離。[0283]在一個方面,所述液劑對纖維素的有效量為約10_6至約IOg每g纖維素,例如約10-6至約7.5g,約10-6至約5,約10-6至約2.5g,約10-6至約Ig,約10-5至約Ig,約10-5至約10、,約I(T4至約10、,約I(T3至約10、,或約I(T3至約10、每g纖維素。[0284]在一個方面,所述一種或多種(例如幾種)半纖維素分解酶包含商業性半纖維素分解酶制備物。適用于本發明的商業性半纖維素分解酶制備物的實例包括,例如SHEARZYME?(NovozymesA/S)、CELLIC?HTec(NovozymesA/S)、CELLIC?Htec2(NovozymesA/S)、VISC0ZYME?(NovozymesA/S)、ULTRAFLO(NovozymesA/S),PULPZYMEI?HC(NovozymesA/S)、MULTIFECT?Xylanase(Genencor)、ACCELLERASE:?XY(Genencor)、ACCELLERASE;?XC(Genencor)、EC0PULPκTX-200A(ABEnzymes)、HSP6000Xylanase(DSM)、DEP0L?333P(BiocatalystsLimit,Wales,UK)、DEP0L?740L(BiocatalystsLimit,Wales,UK)和DEP0L?762P(BiocatalystsLimit,Wales,UK)。[0285]可用于本發明工藝的木聚糖酶的實例包括但不限于來自棘孢曲霉(Aspergillusaculeatus)(GeneSeqP:AAR63790;W094/21785)>煙曲霉(Aspergillusfumigatus)(WO2006/078256)、嗜松青霉(WO2011/041405)、青霉屬菌種(WO2010/126772)、土生梭孢霉(Thielaviaterrestris)NRRL8126(WO2009/079210)和褐孢長毛盤菌GHlO(TO2011/057083)的木聚糖酶。[0286]可用于本發明工藝的木糖苷酶的實例包括但不限于來自粗糙脈孢菌(Neurosporacrassa)(SwissProt登錄號Q7S0W4)、里氏木霉(Trichodermareesei)(UniProtKB/TrEMBL登錄號Q92458)和埃默森踩節菌(Talaromycesemersonii)(SwissProt登錄號Q8X212)的β-木糖苷酶。[0287]可用于本發明工藝的乙酰木聚糖酯酶的實例包括但不限于來自棘孢曲霉(W02010/108918)、球毛殼菌(Chaetomiumglobosum)(Uniprot登錄號Q2GWX4)、細_毛殼菌(Chaetomiumgracile)(GeneSeqP登錄號MB82124)、特異腐質霉(Humicolainsolens)DSM1800(W02009/073709)、紅褐肉座菌(Hypocreajecorina)(W02005/001036)、嗜熱毀絲霉(Wo2010/014880)、粗糙脈孢菌(UniProt登錄號q7s259)、穎枯殼針孢(Phaeosphaerianodorum)(Uniprot登錄號Q0UHJ1)和土生梭孢霉NRRL8126(W02009/042846)的乙酰木聚糖酯酶。[0288]可用于本發明工藝的阿魏酸酯酶的實例包括但不限于來自特異腐質霉DSM1800(W02009/076122)、費希新薩托菌(Neosartoryafischer)(UniProt登錄號A1D9T4)、粗糙脈孢菌(UniProt登錄號Q9HGR3)、橘灰青霉(W02009/127729)和土生梭孢殼(W02010/053838和WO2010/065448)的阿魏酸酯酶。[0289]可用于本發明工藝的阿拉伯呋喃糖苷酶的實例包括但不限于來自黑曲霉(Aspergillusniger)(GeneSeqP登錄號AAR94170)、特異腐質霉(Humicolainsolens)DSM1800(W02006/114094和WO2009/073383)和M.giganteus(W02006/114094)的阿拉伯呋喃糖苷酶。[0290]可用于本發明工藝的α-葡糖醛酸糖苷酶的實例包括但不限于來自棒曲霉(Aspergillusclavatus)(UniProt登錄號alccl2)、煙曲霉(SwissProt登錄號Q4WW45)、黑曲霉(Uniprot登錄號Q96WX9)、土曲霉(Aspergillusterreus)(SwissProt登錄號Q0CJP9)、特異腐質霉(W02010/014706)、橘灰青霉(TO2009/068565)、埃默森踝節菌(UniProt登錄號Q8X211)和里氏木霉(Uniprot登錄號Q99024)的α-葡糖醒酸糖苷酶。[0291]用于本發明工藝的具有酶活性的多肽可通過在含有合適碳源和氮源和無機鹽的營養培養基上,使用本領域已知方法(參見,例如Bennett,J.W.和LaSure,L.(編),MoreGeneManipulationsinFungi,AcademicPress,CA,1991)發酵上述指出的微生物菌株來產生。合適的培養基可從供應商獲得,或可根據已公開組合物制備(例如美國典型培養物保藏中心的目錄)。適于生長和酶產生的溫度范圍和其他條件在本領域是已知的(參見,例如Bailey,J.E.和Ollis,D.F.,BiochemicalEngineeringFundamentals,McGraw-HillBookCompany,NY,1986)。[0292]所述發酵可以是任何其結果為酶或蛋白表達或分離的培養細胞的方法。因此,發酵可以理解為包括在合適的培養基中并在允許所述酶得以表達或分離的條件下進行的搖瓶培養,或在實驗室或工業發酵罐中的小-或大規模發酵(包括連續、分批、補料分批或固態發酵)。通過上述方法產生的所得的酶可從發酵培養基回收并通過常規方法純化。[0293]發醛。可通過一種或多種(例如幾種)能將糖直接或間接發酵成所需發酵產物的發酵微生物發酵自經水解的纖維素材料獲得的可發酵糖。“發酵”或“發酵方法”指任何發酵方法或包含發酵步驟的任何方法。發酵方法還包括用于消費品醇工業(例如,啤酒和葡萄酒)、乳品業(例如,發酵乳產品)、皮革業和煙草業的發酵方法。發酵條件依賴于期望的發酵產物和發酵生物體,并且能由本領域的技術人員容易地確定。[0294]在發酵步驟中,作為預處理和酶水解步驟的結果從纖維素材料釋放的糖,通過發酵生物體(如酵母)發酵成為產物,例如,乙醇。如本文中所述,水解(糖化)和發酵可以是單獨或同時的。[0295]在實施本發明的發酵步驟中可以使用任何合適的經水解的纖維素材料。通常根據所需發酵產品(即,要從發酵獲得的物質)和使用的方法來選擇所述材料,如本領域中所公知的。[0296]術語“發酵培養基”在本文中可理解為指加入發酵微生物之前的培養基,如,由糖化過程產生的培養基,以及同步的糖化和發酵方法(SSF)中使用的培養基。[0297]“發酵微生物”指適用于理想的發酵方法產生發酵產物的任何微生物,包括細菌和真菌生物體。發酵生物體可以是己糖和/或戊糖發酵生物體,或它們的組合。己糖和戊糖發酵生物體均在本領域公知。合適的發酵微生物能將糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麥芽糖、甘露糖、半乳糖和/或寡糖)直接或間接地發酵(即,轉化)成所需的發酵產品。可產生乙醇的細菌和真菌發酵生物體的實例如Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642所述。[0298]能發酵己糖的發酵微生物的實例包括細菌和真菌生物體,如酵母。優選的酵母包括假絲酵母屬、克魯維酵母屬和酵母屬,例如Candidasonorensis、馬克斯克魯維酵母和釀酒酵母的菌株。`[0299]以其天然狀態能發酵戊糖的發酵生物體的實例包括細菌和真菌生物體,如一些酵母。優選的木糖發酵酵母包括假絲酵母屬,優選休哈塔假絲酵母(Candidasheatae)或Candidasonorensis;和畢赤酵母屬,優選樹干畢赤酵母(Pichiastipitis)的菌株,如樹干畢赤酵母CBS5773的菌株。優選的戍糖發酵酵母包括管囊酵母屬(Pachysolen),優選嗜鞋管囊酵母(Pachysolentannophilus)的菌株。不能夠發酵戍糖如木糖和阿拉伯糖的生物通過本領域已知方法可經遺傳修飾而發酵戊糖。[0300]能有效地將己糖和戊糖發酵成乙醇的細菌包括,例如,凝結芽孢桿菌(Bacilluscoagulans)、丙酮丁醇梭菌(Clostridiumacetobutylicum)、熱纖維梭菌(Clostridiumthermocellum)、Clostridiumphytofermentans、地芽抱桿菌屬菌種、解糖熱厭氧桿菌(ThermoanaerobactersaccharoIyticum)和運動發酵單胞菌(Zymomonasmobilis)(Philippidis,1996,見上文)。[0301]其它發酵生物包括芽孢桿菌屬,如凝結芽孢桿菌;假絲酵母屬,如C.sonorensis、C.methanosorbosa、迪丹斯假絲酵母(C.diddensii)、近平滑假絲酵母(C.parapsilosis)、C.naedodendra、C.blanki1、C.entomophilia、蕓薹假絲酵母(C.brassicae)、假熱帶假絲酵母(C.pseudotropicalis)、博伊丁假絲酵母(Candidaboidinii)、產I元假絲酵母(Candidautilis)和休哈塔假絲酵母(C.scehatae);梭菌屬,如丙酮丁醇梭菌、熱纖維梭菌和C.phytofermentans;大腸桿菌,特別是經遺傳修飾以改進乙醇產生的大腸桿菌菌株;地芽孢桿菌屬菌種;漢遜酵母屬,如異常漢遜酵母(Hansenulaanomala);克雷伯氏菌屬(Klebsiella),如產酸克雷伯氏菌(K.0xytoca);克魯維酵母屬,如馬克斯克魯維酵母、乳酸克魯維酵母(K.1actis)、K.thermotoIerans和脆壁克魯維酵母;裂殖酵母屬,如粟酒裂殖酵母(S.pombe);熱厭氧桿菌屬(Thermoanaerobacter),如解糖熱厭氧桿菌,和發酵單胞菌屬(Zymomonas),如運動發酵單胞菌的菌株。[0302]在一個優選的方面,酵母是酒香酵母屬(Bretannomyces)。在一個更優選的方面,酵母是克勞森酒香酵母(Bretannomycesclausenii)。在另一個更優選的方面,酵母是假絲酵母。在另一個更優選的方面,酵母是Candidasonorensis。在另一個更優選的方面,酵母是博伊丁假絲酵母。在另一個更優選的方面,酵母是Candidablankii。在另一個更優選的方面,酵母是蕓薹假絲酵母。在另一個更優選的方面,酵母是迪丹斯假絲酵母。在另一個更優選的方面,酵母是CandidaentomophiIiia0在另一個更優選的方面,酵母是假熱帶假絲酵母。在另一個更優選的方面,酵母是休哈塔假絲酵母。在另一個更優選的方面,酵母是產朊假絲酵母。在另一個優選的方面,酵母是棒孢酵母屬(Clavispora)。在另一個更優選的方面,酵母是葡萄牙棒孢酵母(ClavisporaIusitaniae)。在另一個更優選的方面,酵母是仙人掌棒孢酵母(Clavisporaopuntiae)。在另一個優選的方面,酵母是克魯維酵母。在另一個更優選的方面,酵母是脆壁克魯維酵母。在另一個更優選的方面,酵母是馬克斯克魯維酵母。在另一個更優選的方面,酵母是KluyveromycesthermotoIerans0在另一個優選的方面,酵母是管囊酵母屬(Pachysolen)。在另一個更優選的方面,酵母是嗜鞣管囊酵母。在另一個優選的方面,酵母是畢赤酵母。在另一個更優選的方面,酵母是樹干畢赤酵母。在另一個優選的方面,酵母是酵母屬菌種。在一個優選的方面,酵母是釀酒酵母。在另一個更優選的方面,酵母是糖化酵母(Saccharomycesdistaticus)。在另一個更優選的方面,酵母是葡萄汁酵母(Saccharomycesuvarum)。[0303]在一個優選的方面,細菌是芽孢桿菌屬。在一個更優選的方面,細菌是凝結芽孢桿菌。在另一個更優選的方面,細菌是梭菌屬。在另一個更優選的方面,細菌是丙酮丁醇梭菌。在另一個更優選的方面,細菌是Clostridiumphytofermentans。在另一個更優選的方面,細菌是熱纖維梭菌。在另一個更優選的方面,細菌是地芽孢桿菌屬菌種。在另一個更優選的方面,細菌是熱厭氧桿菌屬。在另一個更優選的方面,細菌是解糖熱厭氧桿菌。在另一個更優選的方面,細菌是發酵單胞菌屬。在另一個更優選的方面,細菌是運動發酵單胞菌。[0304]商業上可得到的適合乙醇產生的酵母包括,例如BIOFERM?AFT和XR(NABC-NorthAmericanBioproductsCorporation,GA,USA),ETHANOLRED?酵母(RedStar/Lesaffre,USA)>FALI?(Fleischmann,sYeast,BurnsPhilpFoodInc.,USA),FERM10L?(DSMSpecialties),GERTSTRAND?(GertStrandAB,Sweden)以及SUPERSTART?和THERMOSACC?新鮮酵母(EthanolTechnology,WI,USA)。[0305]在一個優選的方面,發酵微生物已經經過遺傳修飾,提供發酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。[0306]通過將異源基因克隆入多種發酵微生物已經構建了能將己糖和戊糖轉化成乙醇(共發酵)的生物體(Chen和Ho,1993,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho等,1998,GeneticallyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,Appl.Environ.Microbiol.64:1852-1859;Kotter和Ciriacy,1993,XylosefermentationbySaccharomycescerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKLlandTALIgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentation:aproofofprinciple,FEMSYeastResearch4:655_664;Beall等,1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58:204-214;Zhang等,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267:240-243;Deanda等,1996,Developmentofanarabinose-fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.62:4465-4470;WO2003/062430,xyloseisomerase)。[0307]在一個優選的方面,經過遺傳修飾的發酵微生物是Candidasonorensi。在另一個優選的方面,經過遺傳修飾的發酵微生物是大腸桿菌。在另一個優選的方面,經過遺傳修飾的發酵微生物是產酸克雷伯氏菌。在另一個優選的方面,所述經遺傳修飾的發酵微生物是馬克斯克魯維酵母。在另一個優選的方面,所述經遺傳修飾的發酵微生物是釀酒酵母。在另一個優選的方面,經過遺傳修飾的發酵微生物是運動發酵單胞菌。[0308]本領域中公知的是,上述生物體還能用于產生其它物質,如本文所述。[0309]通常向降解的纖維素材料或水解物加入發酵微生物,并進行約8至約96小時,例如約24至約60小時發酵。溫度通常為約26°C至約60°C,例如約32°C或50°C,并且在約pH3至約pH8,例如約pH4-5,6或7。[0310]在一個方面,對降解的纖維素材料施用酵母和/或另一種微生物,并進行約12至約96小時,如通常為24-60小時發酵。在另一個方面,溫度優選為約20°C至約60°C,例如約25°C至約50°C,并且約32°C至約50°C,約32°C至約50°C,并且pH通常為約pH3至約pH7,例如約pH4至約pH7。然而,一些發酵生物體例如細菌,具有更高的最適發酵溫度。酵母或另一種微生物優選以約IO5-1O12,優選約IO7-1Oltl,特別是約2xl08活細胞計數每ml發酵液的量施用。關于使用酵母進行發酵的進一步指導可見于例如“TheAlcoholTextbook”(K.Jacques,Τ.P.Lyons和D.R.Kelsall編,NottinghamUniversityPress,UnitedKingdom1999),其通過提述并入本文。[0311]對于乙醇產生,在發酵之后,對發酵的漿料進行蒸餾以提取乙醇。根據本發明的工藝獲得的乙醇可用作例如燃料乙醇,飲用乙醇,例如可飲用的中性引用酒(potabIeneutralspritis),或工業乙酉享。[0312]發酵刺激劑可以與本文所述的任何方法組合使用,以進一步改進發酵工藝,而且特定地,改進發酵微生物的性能,如,速率增加和乙醇得率。“發酵刺激劑”指用于發酵微生物(特別是酵母)生長的刺激劑。優選的用于生長的發酵刺激劑包括維生素和礦物質。維生素的實例包括多種維生素、生物素、泛酸(鹽)、煙酸、內消旋肌醇(meso-1nositol)、硫胺素、吡唆醇(pyridoxine)、對氨基苯甲酸、葉酸、核黃素和維生素A、B、C、D和E。參見,例如,Alfenore等,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed—batchprocess,Springer-Verlag(2002),其通過提述并入本文。礦物質的實例包括能夠提供營養物的礦物質和礦物質鹽,所述營養物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。[0313]發酵產物:發酵產物可以是源自發酵的任何物質。發酵產物可以是,不限于,醇(例如,阿拉伯醇、正丁醇、異丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇(丙二醇)、丁二醇、丙三醇、山梨醇和木糖醇);燒烴(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷和十二烷);環烷烴(例如環戊烷、環己烷、環庚烷、和環辛烷);烯烴(例如戊烯、己烯、庚烯和辛烯);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、賴氨酸、絲氨酸和蘇氨酸);氣體(例如,甲烷、氫氣(H2)、二氧化碳(CO2)和一氧化碳(CO));異戊二烯;酮(例如,丙酮);有機酸(例如,乙酸、醋酮酸、己二酸、抗壞血酸、檸檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羥基丙酸、衣康酸、乳酸、蘋果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);和聚酮化合物。發酵產物還可以是作為高價值產品的蛋白質。[0314]在一個優選的方面,發酵產物是醇。可理解的是,術語“醇”包括包含一個或多個羥基模塊的物質。在更優選的方面,所述醇是正丁醇。在另一個更優選的方面,所述醇是異丁醇。在另一個更優選的方面,所述醇是乙醇。在另一個更優選的方面,所述醇是甲醇。在另一個更優選的方面,所述醇是阿拉伯糖醇。在另一個更優選的方面,所述醇是丁二醇。在另一個更優選的方面,所述醇是乙二醇。在另一個更優選的方面,所述醇是丙三醇(glycerin)。在另一個更優選的方面,所述醇是甘油(glycerol)。在另一個更優選的方面,所述醇是1,3-丙二醇。在另一個更優選的方面,所述醇是山梨醇。在另一個更優選的方面,所述醇是木糖醇。參見,例如,Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.編,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Silveira,和Jonas,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam和Singh,1995,Processesforfermentativeproductionofxylitol-asugarsubstitute,ProcessBiochemistry30(2):117-124;Ezeji等,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerinckiiBAlOlandinsiturecoverybygasstripping,WorldJournalofMicrobiologyandBiotechnology19(6):595-603。[0315]在另一個優選的方面,所述發酵產物是烷烴。所述烷烴是未支化或支化的烷烴。在另一個更優選的方面,所述烷烴是戊烷。在另一個更優選的方面,所述烷烴是己烷。在另一個更優選的方面,所述烷烴是庚烷。在另一個更優選的方面,所述烷烴是辛烷。在另一個更優選的方面,所述烷烴是壬烷。在另一個更優選的方面,所述烷烴是癸烷。在另一個更優選的方面,所述烷烴是十一烷。在另一個更優選的方面,所述烷烴是十二烷。[0316]在另一個優選的方面,所述發酵產物是環烷烴。在另一個更優選的方面,所述環烷烴是環戊烷。在另一個更優選的方面,所述環烷烴是環己烷。在另一個更優選的方面,所述環烷烴是環庚烷。在另一個更優選的方面,所述環烷烴是環辛烷。[0317]在另一個優選的方面,所述發酵產物是烯烴。所述烯烴可為未支化或支化的烯烴。在另一個更優選的方面,所述烯烴是戊烯。在另一個更優選的方面,所述烯烴是己烯。在另一個更優選的方面,所述烯烴是庚烯。在另一個更優選的方面,所述烯烴是辛烯。[0318]在另一個優選的方面,所述發酵產物是氨基酸。在另一個更優選的方面,所述有機酸是天冬氨酸。在另一個更優選的方面,所述氨基酸是谷氨酸。在另一個更優選的方面,所述氨基酸是甘氨酸。在另一個更優選的方面,所述氨基酸是賴氨酸。在另一個更優選的方面,所述氨基酸是絲氨酸。在另一個更優選的方面,所述氨基酸是蘇氨酸。參見,例如,Richard和Margaritis,2004,Empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,BiotechnologyandBioengineering87(4):501-515。[0319]在另一個優選的方面,所述物質是氣體。在另一個更優選的方面,所述氣體是甲烷。在另一個更優選的方面,所述氣體是H2。在另一個更優選的方面,所述氣體是CO2O在另一個更優選的方面,所述氣體是CO。參見,例如,Kataoka等,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7):41-47;和GunaseelanV.N.,于BiomassandBioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobicdigestionofbiomassformethaneproduction:Areview。[0320]在另一個優選的方面,所述發酵產物是異戊二烯。[0321]在另一個優選的方面,所述發酵產物是酮。應理解的是,術語“酮”涵蓋了含有一個或多個酮模塊的酮。在另一個更優選的方面,所述酮是丙酮。參見,例如Qureshi和Blaschek,2003,見上文。[0322]在另一個優選的方面,所述發酵產物是有機酸。在另一個更優選的方面,所述有機酸是乙酸。在另一個更優選的方面,所述有機酸是醋酮酸。在另一個更優選的方面,所述有機酸是己二酸。在另一個更優選的方面,所述有機酸是抗壞血酸。在另一個更優選的方面,所述有機酸是檸檬酸。在另一個更優選的方面,所述有機酸是2,5-二酮-D-葡糖酸。在另一個更優選的方面,所述有機酸是甲酸。在另一個更優選的方面,所述有機酸是反丁烯二酸。在另一個更優選的方面,所述有機酸是葡糖二酸。在另一個更優選的方面,所述有機酸是葡糖酸。在另一個更優選的方面,所述有機酸是葡糖醛酸。在另一個更優選的方面,所述有機酸是戊二酸。在另一個優選的方面,所述有機酸是3-羥基丙酸。在另一個更優選的方面,所述有機酸是衣康酸。在另一個更優選的方面,所述有機酸是乳酸。在另一個更優選的方面,所述有機酸是蘋果酸。在另一個更優選的方面,所述有機酸是丙二酸。在另一個更優選的方面,所述有機酸是草酸。在另一個更優選的方面,所述有機酸是丙酸。在另一個更優選的方面,所述有機酸是琥珀酸。在另一個更優選的方面,所述有機酸是木糖酸。參見,例如,Chen和Lee,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63—65:435—448。[0323]在另一個優選的方面,所述物質是聚酮化合物。[0324]可以使用本領域已知的任何方法,任選地從發酵培養基回收發酵產物,所述方法包括,但不限于,層析、電泳方法、差示溶解度、蒸餾或提取。例如,通過常規蒸餾方法從發酵的纖維素材料分離并純化醇。可以獲得純度高達約96vol.%的乙醇,其能用作,例如,燃料乙醇、飲用乙醇(即,可飲用的中性含酒精飲料),或工業乙醇。[0325]信號肽[0326]本發明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDNO:2的氨基酸I至18。所述多核苷酸可進一步包含編碼蛋白的基因,其可操作地連接于信號肽。所述蛋白優選對于所述信號肽是外源的。在一個方面,編碼信號肽的多核苷酸是SEQIDNO:1的核苷酸I至54。[0327]本發明還涉及包含此種多核苷酸的核酸構建體、表達載體和重組宿主細胞。[0328]本發明還涉及用于產生蛋白質的方法,包括:(a)培養包含此種多核苷酸的重組宿主細胞;和(b)回收所述蛋白質。[0329]所述蛋白質對于宿主細胞可以是天然的或異源的。術語“蛋白質”在本文的意思不是指特定長度的編碼產物,并且因此涵蓋肽、寡肽和多肽。術語“蛋白質”還涵蓋經組合以形成編碼產物的兩種以上多肽。所述蛋白質還包括雜合多肽和融合多肽。[0330]優選蛋白質是激素、酶、受體或其部分、抗體或其部分,或報告蛋白(reporter)。例如,所述蛋白質可為水解酶、異構酶、連接酶、裂合酶(Iyase)、氧化還原酶或轉移酶,如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、幾丁質酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、內切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、多酹氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶、木聚糖酶或木糖苷酶。[0331]基因可以從任何原核、真核生物或其它來源獲得。[0332]優選實施方案的列表`[0333]實施方案1.一種具有纖維二糖水解酶活性的分離的多肽,其選自下組:[0334](a)多肽,其與SEQIDNO:2的成熟多肽具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少87%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;[0335](b)多肽,其由多核苷酸編碼,所述多核苷酸在中等嚴格條件,或中等-高嚴格條件,或高嚴格條件,或非常高嚴格條件下與以下雜交:(i)SEQIDN0:1的成熟多肽編碼序列,(ii)其cDNA序列,或(iii)(i)或(ii)的全長互補物;[0336](c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1的成熟多肽編碼序列或它們的cDNA序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;[0337](d)SEQIDNO:2的成熟多肽的在一個或多個位置包含取代、缺失和/或插入的變體;和[0338](e)(a)、(b)、(c)或(d)的多肽的具有纖維二糖水解酶活性的片段。[0339]實施方案2.實施方案I的多肽,其與SEQIDNO:2的成熟多肽具有至少81%,至少82%,至少83%,至少84%,至少85%,至少87%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。[0340]實施方案3.實施方案I或2的多肽,其由多核苷酸編碼,所述多核苷酸在中等嚴格條件,或中等-高嚴格條件,或高嚴格條件,或非常高嚴格條件下與以下雜交:(i)SEQIDNO:1的成熟多肽編碼序列,(ii)其cDNA序列,或(iii)(i)或(ii)的全長互補物。[0341]實施方案4.實施方案1-3任一項的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1的成熟多肽編碼序列或它們的cDNA序列具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。[0342]實施方案5.實施方案1-4任一項的多肽,其包含或組成為SEQIDN0:2,或SEQIDNO:2的成熟多肽。[0343]實施方案6.實施方案5的多肽,其中所述成熟多肽是SEQIDNO:2的氨基酸19至464。[0344]實施方案7.實施方案1-4任一項的多肽,其為SEQIDNO:2的成熟多肽在一個或多個位置包含取代、缺失和/或插入的變體。[0345]實施方案8.實施方案I的多肽,其為SEQIDNO:2的片段,其中所述片段具有纖維二糖水解酶活性。[0346]實施方案9.一種分離的多肽,其包含選自下組的催化域:[0347](a)催化域,其與SEQIDNO:2的催化域具有至少81%序列同一性;[0348](b)催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1的催化域編碼序列具有至少60%序列同一性;[0349](C)SEQIDNO:2的催化域的包含一個或多個(幾個)氨基酸取代、缺失和/或插入的催化域變體;和[0350](d)(a)、(b)或(C)的多肽的具有纖維二糖水解酶活性的片段。[0351]實施方案10.實施方案9的多肽,其包含或組成為SEQIDNO:2的催化域。[0352]實施方案11.實施方案10的多肽,其中所述催化域是SEQIDNO:2的氨基酸105至464。[0353]實施方案12.實施方案9-11任一項的多肽,其進一步包含纖維素結合域。[0354]實施方案13.實施方案1-12任一項的多肽,其由TalaromycesIeycettanus菌株CBS398.68中所含的多核苷酸所編碼。[0355]實施方案14.一種酶組合物,其包含實施方案1-13任一項的多肽。[0356]實施方案15.—種分離的多核苷酸,其編碼實施方案1-13任一項的多肽。[0357]實施方案16.—種核酸構建體或表達載體,其包含實施方案15的多核苷酸,所述多核苷酸可操作地連接于一個或多個調控序列,所述調控序列指導所述多肽在表達宿主中的產生。[0358]實施方案17.—種重組宿主細胞,其包含實施方案15的多核苷酸,所述多核苷酸可操作地連接于一個或多個調控序列,所述調控序列指導多肽的產生。[0359]實施方案18.—種產生實施方案1-13中任一項的多肽的方法,其包括:[0360](a)在有助于所述多肽產生的條件下培養細胞,所述細胞以其野生型形式產生所述多肽;和[0361](b)回收所述多肽。[0362]實施方案19.一種產生具有纖維二糖水解酶活性的多肽的方法,其包括:[0363](a)在有助于所述多肽產生的條件下培養實施方案17的宿主細胞;和[0364](b)回收所述多肽。[0365]實施方案20.—種轉基因植物、植物部分或植物細胞,其用編碼實施方案1-13任一項的多肽的多核苷酸轉化。[0366]實施方案21.—種產生具有纖維二糖水解酶活性的多肽的方法,其包括:[0367](a)在有助于所述多肽的產生的條件下培養實施方案20的轉基因植物或植物細胞;和[0368](b)回收所述多肽。[0369]實施方案22.—種編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDNO:2的氨基酸I至18。[0370]實施方案23.—種核酸構建體或表達載體,其包含編碼蛋白的基因,所述基因可操作地連接于實施方案22的多核苷酸,其中所述基因對于編碼信號肽的多核苷酸是外源的。[0371]實施方案24.—種重組宿主細胞,其包含編碼蛋白的基因,所述基因可操作地連接于實施方案22的多核苷酸,其中所述基因對于編碼信號肽的多核苷酸是外源的。[0372]實施方案25.—種產生蛋白的方法,其包括:[0373](a)在有助于所述蛋白的產生的條件下培養重組宿主細胞,所述重組宿主細胞包含編碼蛋白的基因,所述基因可`操作地連接于實施方案22的多核苷酸,其中所述基因對于編碼信號肽的多核苷酸是外源的;和[0374](b)回收所述蛋白。[0375]實施方案26.—種降解纖維素材料的方法,其包括:在實施方案1-13任一項的具有纖維二糖水解酶活性的多肽存在下用酶組合物處理所述纖維素材料。[0376]實施方案27.實施方案26的方法,其中所述纖維素材料經過預處理。[0377]實施方案28.實施方案26或27的方法,其中所述酶組合物包含一種或多種選自下組的酶:纖維素酶、具有纖維素分解增強活性的GH61多肽、半纖維素酶、酯酶、棒曲霉素、漆酶、木質素分解酶、果膠酶、過氧化物酶、蛋白酶和膨脹素。[0378]實施方案29.實施方案28的方法,其中所述纖維素酶是一種或多種選自下組的酶:內切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。[0379]實施方案30.實施方案28的方法,其中所述半纖維素酶是一種或多種選自下組的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。[0380]實施方案31.實施方案26-30任一項的工藝,進一步包括回收經降解的纖維素材料。[0381]實施方案32.實施方案31的工藝,其中所述經降解的纖維素材料是糖。[0382]實施方案33.實施方案32的工藝,其中所述糖選自下組:葡萄糖、木糖、甘露糖、半乳糖和阿拉伯糖。[0383]實施方案34.—種產生發酵產物的工藝,其包括:[0384](a)在實施方案1-13任一項的具有纖維二糖水解酶活性的多肽存在下,用酶組合物糖化纖維素材料;[0385](b)用一種或多種發酵微生物發酵經糖化的纖維素材料以產生發酵產物;和[0386](c)從發酵回收發酵產物。[0387]實施方案35.實施方案34的工藝,其中所述纖維素材料經過預處理。[0388]實施方案36.實施方案34或35的工藝,其中所述酶組合物包含一種或多種選自下組的酶:纖維素酶、具有纖維素分解增強活性的GH61多肽、半纖維素酶、酯酶、棒曲霉素、漆酶、木質素分解酶、果膠酶、過氧化物酶、蛋白酶和膨脹素。[0389]實施方案37.實施方案36的工藝,其中所述纖維素酶是一種或多種選自下組的酶:內切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。[0390]實施方案38.實施方案36的工藝,其中所述半纖維素酶是一種或多種選自下組的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。[0391]實施方案39.實施方案34-38中任一項的工藝,其中步驟(a)和(b)在同步糖化和發酵中同時進行。[0392]實施方案40.實施方案34-39中任一項的工藝,其中發酵產物是醇、烷烴、環烷烴、烯烴、氨基酸、氣體、異戊二烯、酮、有機酸或聚酮化合物。[0393]實施方案41.一種發酵纖維素材料的工藝,其包括:用一種或多種發酵微生物發酵纖維素材料,其中所述纖維素材料是在實施方案1-13中任一項的具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化的。[0394]實施方案42.實施方案41的工藝,其中所述纖維素材料的發酵產生發酵產物。[0395]實施方案43.實施方案42的工藝,進一步包括從發酵回收發酵產物。[0396]實施方案44.實施方案41-43任一項的工藝,其中纖維素材料在糖化之前經預處理。[0397]實施方案45.實施方案41-44任一項的工藝,其中所述酶組合物包含一種或多種選自下組的酶:纖維素酶、具有纖維素分解增強活性的GH61多肽、半纖維素酶、酯酶、棒曲霉素、漆酶、木質素分解酶、果膠酶、過氧化物酶、蛋白酶和膨脹素。[0398]實施方案46.實施方案45的工藝,其中所述纖維素酶是一種或多種選自下組的酶:內切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。[0399]實施方案47.實施方案45的工藝,其中所述半纖維素酶是一種或多種選自下組的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。[0400]實施方案48.實施方案41-47中任一項的工藝,其中發酵產物是醇、烷烴、環烷烴、烯烴、氨基酸、氣體、異戊二烯、酮、有機酸或聚酮化合物。[0401]本文描述和要求保護的本發明并不局限于本文公開的具體方面的范圍內,因為這些方面旨在作為本發明幾個方面的說明。旨在將任何等同的方面包含于本發明的范圍內。實際上,從前面的說明中,除本文所顯示和描述的之外,本發明的多種修改對于本領域的技術人員來說是顯而易見的。這些修改也旨在落入所附的權利要求的范圍內。在沖突的情況下,將以包括定義部分的本公開為準。實施例[0402]材料[0403]用作緩沖液和底物的化學品是至少試劑級別的商品。[0404]菌株[0405]將TalaromycesIeycettanus菌株CBS398.68用作具有纖維二糖水解酶活性的多肽的來源。將米曲霉MT3568菌株用于表達編碼具有纖維二糖水解酶活性的多肽的TalaromycesIeycettanus基因。米曲霉MT3568是米曲霉JaL355(TO2002/40694)的amdS(乙酰胺酶)破壞的基因衍生物,其中通過破壞米曲霉乙酰胺酶(amdS)基因恢復了PyrG營養缺陷。[0406]培養基和溶液[0407]YP+2%葡萄糖培養基包含1%酵母提取物,2%蛋白胨和2%葡萄糖。[0408]PDA瓊脂平板包含馬鈴薯浸出物(馬鈴薯浸出物如下所述制備:將300g的切片(經洗滌但未經削皮)的馬鈴薯在水中煮沸30分鐘,然后將湯液(broth)傾出或通過干酪包布(cheesecloth)濾過。然后添加蒸懼水直至懸液的總體積為一升,接著添加20g的右旋糖和20g的瓊脂粉。將培養基通過高壓滅菌在15psi滅菌15分鐘(BacteriologicalAnalyticalManual,8thEdition,RevisionA,1998)。[0409]LB平板包含IOg的Bacto-Tryptone,5g的酵母提取物,IOg的氯化鈉,15g的Bacto瓊脂,和去離子水加至I升。將培養基通過高壓滅菌在15psi滅菌15分鐘(BacteriologicalAnalyticalManual,8thEdition,RevisionA,1998)。[0410]COVE蔗糖平板包含342g`蔗糖(SigmaS-9378),20g瓊脂粉,20mlCOVE鹽溶液(26gMgSO4.7H20,26gKCL,26gKH2PO4,50mlCove微量金屬溶液)和去離子水加至I升),和去離子水加至I升。將培養基通過高壓滅菌在15psi滅菌15分鐘(BacteriologicalAnalyticalManual,8thEdition,RevisionA,1998)。將培養基冷卻至60°C并添加IOmM乙酸胺,15mMCsCl,TritonX-100(50μl/500ml))。[0411]Cove微量金屬溶液包含0.04gNa2B4O7.1OH20,0.4gCuSO4.5H20,1.2gFeSO4.7H20,0.7gMnSO4.H20,0.8gNa2MoO4.2H20,IOgZnSO4.7H20,和去離子水加至I升。[0412]Dap_4C培養基包含20g右旋糖,IOg麥芽糖,IlgMgSO4.7H20,IgKH2PO4,2g檸檬酸,5.2gK3PO4.H20,0.5g酵母提取物(Difco),ImlDowfax63N10(DowChemicalCompany),0.5mlKU6微量金屬溶液,2.5gCaCO3,和去離子水加至I升。將培養基通過高壓滅菌在15psi滅菌15分鐘(BacteriologicalAnalyticalManual,8thEdition,RevisionA,1998)。在使用之前,向Dap-4C培養基添加3.5ml滅菌的50%(NH4)2ΗΡ04和5ml滅菌的20%乳酸每150ml培養基。[0413]KU6微量金屬溶液包含0.13gNiCl2,2.5gCuSO4.5H20,13.9gFeS04.7H20,8.45gMnSO4.H20,6.8gZnCl2,3g梓檬酸,和去離子水加至I升。[0414]實施例1:關于TalaromycesIeycettanus菌株CBS398.68的DNA序列信息的來源[0415]基因組序列信息在中國北京市的BeijingGenomeInstitute(BGI)通過IlluminaDNA測序從由TalaromycesIeycettanus菌株CBS398.68分離的基因組DNA生成。基因組的初級匯編(preliminaryassembly)使用Pedant-Pro?SequenceAnalysisSuite(BiomaxInformaticsAG,Martinsried,Germany)進行分析。將由該軟件構建的基因模型用作供在基因組中檢測GH6同源物的起始點。使用多種已知的GH6蛋白序列作為指導,手動構建了更加準確的基因模型。[0416]實施例2:TalaromycesIeycettanus菌株CBS398.68基因組DNA提取[0417]為了生成用于PCR擴增的基因組DNA,將TalaromycesIeycettanus菌株CBS398.68在PDA瓊脂平板上通過在26°C生長7日來進行繁殖。將從PDA平板收獲的孢子用于接種帶隔板的搖瓶中的25ml的YP+2%葡萄糖培養基,并在30°C在85rpm攪拌下溫育72小時。[0418]基因組DNA根據修飾的DNeasyPlantMaxikit實驗方案(QiagenDanmark,Copenhagen,Denmark)進行分離。將來自上述培養物的真菌材料通過在14,OOOxg離心2分鐘來收獲。去除上清,并將0.5g的沉淀與石英砂凍結于液氮,并在經預冷的研缽中磨制至細微粉末。將粉末轉移至15ml離心管,并添加5ml緩沖液APl(預熱至65°C)和10μIRNaseA儲液(100mg/ml),接著進行劇烈的渦旋。在65°C定期倒置試管下溫育10分鐘之后,將1.8ml緩沖液AP2通過輕柔地混合添加至裂解液,接著在冰上溫育10分鐘。然后將裂解液在室溫在3000xg離心5分鐘,并將上清傾入置于50ml收集管的QIAshreddermaxi旋轉柱中。接著,在室溫在3000xg離心5分鐘。將流過物轉移入新的50ml試管,并添加1.5倍體積的緩沖液AP3/E,接著進行渦旋。將15ml的樣品轉移入置于50ml收集管中的DNeasyMaxi旋轉柱,并在室溫在3000xg離心5分鐘。將流過物棄去,并將12ml緩沖液Aff添加至置于50ml收集管中的DNeasyMaxi旋轉柱,并在室溫在3000xg離心10分鐘。在棄去流過物之后,重復離心以棄去剩余的醇。將DNeasyMaxi旋轉柱轉移至新的50ml試管,并添加0.5ml緩沖液AE(預熱至70°C)。在室溫溫育5分鐘之后,將樣品通過在室溫在3000xg離心5分鐘來洗脫。再用0.5ml緩沖液AE重復洗脫,并合并洗脫物。收獲的DNA的濃度通過在260nm的UV分光光度計來測量。[0419]實施例3:含有編碼具有`纖維二糖水解酶活性的家族GH6多肽的TalaromycesIeycettanus菌株CBS398.68基因組序列的米曲霉表達載體的構建[0420]設計了下示的兩個合成的寡核苷酸引物以從實施例2中制備的基因組DNA來PCR擴增TalaromycesIeycettanus菌株CBS398.68P23YSW基因。使用IN-FUS10N?CloningKit(BDBiosciences,PaloAlto,CA,USA)以將片段直接克隆入表達載體pDaul09(TO2005/042735)。[0421]F-P23YSW[0422]5,-ACACAACTGGGGATCCACCATGCGGTCTCTCCTGGCT-3’(SEQIDNO:3)[0423]R-P23YSW[0424]5,-CCCTCTAGATCTCGAGCAGAATGAGGCAGAGTTACGAGA-3’(SEQIDNO:4)[0425]粗體字母代表基因序列。下劃線序列同源于pDaul09的插入位點。[0426]使用MJResearchPTC-200DNA引擎(engine)進行PCR反應。使用PhusionHigh-FidelityPCRKit(FinnzymesOy,Espoo,Finland)進行PCR擴增。PCR反應包含5μI的5XHF緩沖液(Finnzymes0y,Espoo,Finland),各0.5μI的dNTP(IOmM),0.5μI的PhusionI?DNA聚合酶(0.2單位/μI)(FinnzymesOy,Espoo,Finland),IμI的引物F-P23YSff(5μΜ),IμI的引物R_P23YSW(5μΜ),0.5μI的TalaromycesIeycettanus基因組DNA(100ng/y1),和16.5μI的去離子水,總體積為25μI。PCR條件為I個循環,在95°C進行2分鐘,35個循環,每個在98°C進行10秒,60°C進行30秒,和72°C進行2分鐘;和I個循環,在72°C進行10分鐘。然后將樣品保持在12°C,直至從PCR機器移去。[0427]反應產物通過使用40mMTris堿,20mM乙酸鈉,ImMEDTA二鈉鹽(TAE)緩沖液的1.0%瓊脂糖凝膠電泳來分離,其中將1977bp產物條帶從凝膠切出,并使用illustraGFX?PCRDNAandGelBandPurificationKit(GEHealthcareLifeSciences,Brondby,Denmark)根據生產商的指示純化。然后將片段使用IN_FUSION?CloningKit克隆入經BamHI和XhoI消化的pDaul09,得到質粒pP23YSW。將P23YSW基因克隆入經BamH1-XhoI消化的pDaul09使得TalaromycesleycettanusP23YSW基因的轉錄處于NA2_tpi雙重啟動子的調控下。NA-tpi是經修飾的來自編碼黑曲霉中性α-淀粉酶的基因的啟動子,其中未翻譯的前導序列由來自編碼構巢曲霉丙糖磷酸異構酶的基因的未翻譯的前導序列替代。[0428]克隆實驗方案根據IN-FUS10N?CloningKit的指示進行,生成P23YSWGH6構建體。將經處理的質粒和插入物根據生產商的實驗方案轉化入OneShot?TOPIOF'ChemicallyCompetent大腸桿菌細胞(nvitrogen,Carlsbad,CA,USA),并鋪板于補充0.1mg氨芐青霉素每ml的LB平板上。在37°C溫育過夜之后,發現菌落在LB氨芐青霉素平板上的選擇下生長。將四個經P23YSWGH6構建體轉化的菌落在補充0.1mg氨芐青霉素每ml的LB培養基中培養,并用QIAprepSpinMiniprepKit(QIAGENInc.,Valencia,CA,USA)根據生產商的實驗方案分離質粒。[0429]將分離的質粒用載體引物和P23YSW基因特異性引物進行測序以確定不含PCR錯誤的代表性質粒表達克隆。[0430]實施例4:對編碼具有纖維二糖水解酶活性的P23YSWGH6多肽的TalaromycesleycettanusCBS398.68基因組序列的表征[0431]TalaromycesleycettanusCBS398.68P23YSWGH6基因組克隆的DNA測序用AppliedBiosystemsModel3700AutomatedDNASequencer使用版本3.1BIG-DYE?終止子化學(AppliedBiosystems,Inc.,FosterCity,CA,USA)和引物巡查策略來進行。對核苷酸序列就品質進行審視,并在PHRED/PHRAP軟件(UniversityofWashington,Seattle,WA,USA)的協助下將所有序列相互比較。獲得的序列與來自BIG的序列相同。[0432]TalaromycesleycettanusP23YSW基因的核苷酸序列和推導的氨基酸序列分別示于SEQIDN0:1和SEQIDNO:2。編碼序列為1898bp,包含八個內含子和終止密碼子。編碼的預測蛋白為464個氨基酸。使用SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),預測了18個殘基的信號肽。預測的成熟蛋白含有446個氨基酸,具有47kDa的預測分子量和4.41的等電點pH。[0433]氨基酸序列的比較性逐對全局比對使用Needleman和Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)以缺口開放罰分為10,缺口延伸罰分為0.5,和EBL0SUM62矩陣進行。比對顯示編碼具有纖維二糖水解酶活性的P23YSWGH6多肽的Talaromycesleycettanus基因的推導的氨基酸序列與來自煙曲霉、具有纖維二糖水解酶活性的預測的GH6家族蛋白(登錄號GENESEQP:ABB80166)的推導的氨基酸序列具有80.4%同一性(排除缺口)。[0434]實施例5:TalaromycesleycettanusGH6纖維二糖水解酶P23YSW的表達[0435]將表達質粒pP23YSW轉化入米曲霉MT3568。米曲霉MT3568是JaL355(TO2002/40694)的AMDS(乙酰胺酶)破壞的衍生物,其中在米曲霉乙酰胺酶(AMDS)基因的敲除過程中恢復了PyrG營養缺陷。MT3568原生質體根據歐洲專利EP0238023第14至15頁(其通過提述并入本文)的方法制備。[0436]將轉化體在COVE蔗糖選擇平板上通過單個分生孢子進行純化,然后使它們在PDA平板上形成孢子。由轉化體所致的TalaromycesleycettanusGH6多肽的生成根據YP+2%葡萄糖培養基中在30°C的Iml96深孔靜態培養的培養上清進行分析。表達在E-Page8%SDS-PAGE48孔凝膠(Invitrogen,Carlsbad,CA,USA)上通過考馬斯染色進行驗證。選擇一個轉化體進行進一步研究,并將其命名為米曲霉78.2。[0437]對于更大規模的生產,將米曲霉78.2孢子鋪板于PDA平板,并在37°C溫育5日。將匯合的孢子平板用5ml的0.01%TWEEN?A)洗滌兩次以最大化收集的孢子的數量。然后使用孢子懸液接種二十五個含有100ml的Dap-4C培養基的500ml燒瓶。將培養物在30°C在IOOrpm的恒定振蕩下溫育。在接種之后第四日,將培養液通過經由瓶頂(bottletop)MF75SuporMachV0.2μmPES過濾器(ThermosFisherScientific,Roskilde,Denmark)過濾來收集。來自該轉化體的新鮮培養液產生大約70kDa的GH6蛋白的條帶。該條帶作為TalaromycesleycettanusGH6多肽的身份通過肽測序來驗證。[0438]實施例6:用于產生TalaromycesleycettanusGH6纖維素酶P23YSW的其它方法[0439]基于鑒定為SEQIDNO:1的核苷酸序列,可從多個供應商如GeneArt(GENEARTAGBioPark,Josef-Engert-Str.11,93053,Regensburg,Germany)或DNA2.0(DNA2.0,1430O'BrienDrive,SuiteE,MenloPark,CA94025,USA)獲得合成基因。所述合成基因可設計為并入其它DNA序列如限制性位點或同源重組區以便于克隆入表達載體。[0440]使用上述的兩個合成寡核苷酸引物F-P23YSW和F-P23YSW,可使用簡單的PCR反應從合成基因擴增全長開放閱讀框。然后可將基因克隆入表達載體,例如如上所述的表達載體,并在宿王細胞中表達,例如在如上所述的米曲霉中表達。[0441]實施例7:TalaromycesleycettanusGH6纖維二糖水解酶P23YSW的純化[0442]將米曲霉表達菌株78.2的1000ml培養液調整至pH7.0并在0.22μmPES過濾器(ThermoFisherScientific,Roskilde,Denmark)上過濾。接著,向濾過物添加1.8M硫酸銨。將濾過物加載于用1.8M硫酸銨pH7.0,25mMHEPESρΗ7.0平衡的PhenylSepharose?6FastFlow柱(highsub)(GEHealthcare,Piscataway,NJ,USA)(柱體積為60mL)。在加載之后,將用3個柱體積的平衡緩沖液繼以7個柱體積的IM硫酸銨(蛋白保持結合于柱)洗滌柱。此后,用5個柱體積的25mMHEPESpH7.0以15ml/min的流速將蛋白洗脫。收集IOmL的級分,并通過SDS-page分析。將級分匯集并施于在25mMHEPESpH7.0中平衡的SOURCEtmI5Q(GEHealthcare,Piscataway,NJ,USA)柱。將級分施于在25mMHEPESpH7.0(柱體積60mL)中平衡的S0URCE?15Q(GEHealthcare,Piscataway,NJ,USA)柱。在加載之后,將柱用3個柱體積的平衡緩沖液洗滌,并將結合的蛋白在20個柱體積上以O至500mM氯化鈉的線性梯度洗脫。收集IOml的級分,并通過SDS-page分析,且匯集含有蛋白的級分。蛋白濃度通過A280/A260吸光度來確定。[0443]實施例8:預處理的玉米秸桿水解測定[0444]將玉米稻桿在U.S.DepartmentofEnergyNationalRenewableEnergyLaboratory(美國能源部國家可再生能源實驗室)(NREL)使用1.4wt%硫酸在165°C和107psi預處理8分鐘。預處理的玉米秸桿(PCS)中的不溶于水的固體含有56.5%纖維素,4.6%半纖維素和28.4%木質素。通過兩階段硫酸水解,接著通過使用NRELStandardAnalyticalProcedure#002的高效液相色譜分析糖來確定纖維素和半纖維素。木質素在用硫酸水解纖維素和半纖維素級分之后使用NRELStandardAnalyticalProcedure#003以重量分析法確定。[0445]未經磨制、未經洗滌的PCS(全漿料PCS)通過藉由添加10MNaOH與充分混合將PCS的pH調整至5.0,然后在120°C高壓滅菌20分鐘來制備。全漿料PCS的干重量是29%。PCS以未經洗滌或經水洗滌的形式使用。經磨制、未經洗滌的PCS(干重量32.35%)通過在CosmosICMG40濕式多用途研磨機(EssEmmCorporation,TamilNadu,India)中磨制全漿料PCS來制備。經磨制、洗滌的PCS(干重量32.35%)以相同方式制備,并接著用去離子水洗滌和反復傾去上清級分。[0446]PCS的水解使用2.2ml深孔板(Axygen,UnionCity,CA,USA)在1.0ml的總反應體積中進行。水解用50mg的不溶性PCS固體每ml的含有ImM硫酸錳的50mM乙酸鈉pH5.0緩沖液和多種蛋白加載量的多種酶組合物(表示為mg蛋白每克纖維素)進行。制備酶組合物,然后以50μI至200μI范圍的體積同時添加至所有孔,至每個反應中Iml的終體積。然后使用ALPS-300?平板熱密封器(Abgene,Epsom,UnitedKingdom)密封平板,充分混合,并在特定溫度溫育72小時。所有報道的反應重復三次進行。[0447]在水解之后,使用0.45μmMULTISCREEN[?96孔過濾板(Millipore,Bedford,MA,USA)過濾樣品,然后如下所述就糖含量分析濾過物。當不立即使用時,將過濾的等分試樣凍結于_20°C。稀釋于0.005MH2SO4的樣品的糖濃度使用4.6x250mmAMINEX:?HPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)通過在65°C用0.05%w/w苯甲酸-0.005MH9SO4以0.6ml每分鐘的流速洗脫,和通過從由純糖樣品校正的折光率檢測(CHEMSTAT10N?AGILENT?UOOHPLC,AgilentTechnologies,SantaClara,CA,USA)所得的葡萄糖、纖維二糖和木糖信號的積分的定量來進行測量。使用所得的葡萄糖和纖維二糖當量對于每個反應計算纖維素轉化的百分比。[0448]分別測量葡萄糖、纖維二糖和木糖。就合適的稀釋因子調整測得的糖濃度。來自未洗滌的PCS的酶法產生的糖的凈濃度通過就在零時點未洗滌的PCS中相應的背景糖濃度調整測得的糖濃度來確定。所有HPLC數據處理使用MICROSOFTEXCEL?軟件(Microsoft,Richland,WA,USA)進行。[0449]使用下式計算纖維素轉化為葡萄糖的程度:%轉化=(葡萄糖濃度/限制消化中的葡萄糖濃度)x100。為了計算%轉化,基于纖維素酶對照(IOOmg的里氏木霉纖維素酶每克纖維素)設定100%轉化點,并將所有值除以該數值并接著乘以100。將三次重復數據點取平均值,并計算標準偏差。[0450]實施例9:酶組合物的制備[0451]煙曲霉GH7A纖維二糖水解酶I(SEQIDNO:5和SEQIDNO:6)如WO2011/057140中所述在米曲霉中重組制備。將煙曲霉GH7A纖維二糖水解酶I的過濾的培養液使用配有IOkDa聚醚諷膜(PallFiltron,Northborough,MA,USA)的切向流濃縮器(PallFiltron,Northborough,MA,USA)濃縮并用20mMTris-HClpH8.0緩沖液交換。煙曲霉GH7A纖維二糖水解酶I的脫鹽的培養液在20mMTris-HClpH8中的QSEPHAROSE?離子交換層析柱(GEHealthcare,Piscataway,NJ,USA))上以O至IMNaCl線性梯度進行純化。收集級分,并基于8_16%CRITER10Ni?Stain-freeSDS-PAGE(Bio-RadLaboratories,Inc.,Hercules,CA,USA)匯集含有纖維二糖水解酶I纖維素酶的級分。[0452]具有纖維素分解增強活性的青霉屬種(emerSonii)GH61A多肽的制備。所述青霉屬種(emersonii)GH61A多肽(SEQIDN0:7和SEQIDNO:8)根據WO2011/041397重組制備。所述青霉屬種(emersonii)GH61A多肽根據WO2011/041397純化。[0453]里氏木霉GH5內切葡聚糖酶II的制備。里氏木霉GH5內切葡聚糖酶II(SEQIDN0:9和SEQIDN0:10)根據WO2011/057140使用米曲霉作為宿主重組制備。將里氏木霉GH5內切葡聚糖酶II的經過濾的培養液脫鹽并使用切線流(10K膜,PallFiltron,Northborough,MA,USA)根據生產商的指示緩沖液交換入IOmMTrispH8.0。[0454]煙曲霉NN055679GHlO木聚糖酶的制備。煙曲霉GHlO木聚糖酶(xyn3)(SEQIDN0:11和SEQIDN0:12)根據WO2006/078256使用米曲霉BECh2(TO2000/39322)作為宿主來重組制備。將煙曲霉NN055679GHlO木聚糖酶制備。將煙曲霉NN051616GH3β-木糖苷酶的過濾的培養液使用HIPREP1?26/10DesaltingColumn(GEHealthcare,Piscataway,NJ,USA)根據生產商的(xyn3)的經過濾的培養液脫鹽,并使用HIPREP1?26/10DesaltingColumn(GEHealthcare,Piscataway,NJ,USA)根據生產商的指不緩沖液交換入50mM乙酸鈉pH5.0。[0455]煙曲霉NN055679Cel3Aβ-葡糖苷酶的制備。(SEQIDNO:13和SEQIDNO:14)根據WO2005/047499使用米曲霉作為宿主來重組制備。將過濾的培養液用20%乙酸鈉調整至pH8.0,這使得溶液渾濁。為了去除渾濁,將溶液離心(20000xg,20分鐘),并將上清通過0.2μηι過濾單元(Nalgene,Rochester,NY,USA)過濾。將濾過物用去離子水稀釋以達到與50mMTris/HCl,pH8.0相同的電導率。將經調整的酶溶液施于在50mMTris-HCl,pH8.0中平衡的QSEPHAR0SE?FastFlow柱(GEHealthcare,Piscataway,NJ,USA),并用O至500mM氯化鈉的線性梯度洗脫。匯集級分,并用l%(w/v)活性炭處理以去除來自β_葡糖苷酶匯集的顏色。活性炭通過將上清經由0.2μηι過濾單元(Nalgene,Rochester,NY,USA)過濾來去除。將濾過物用20%乙酸調整至pH5.0,并用去離子水稀釋10倍。將經調整的濾過物施于在IOmM琥珀酸pH5.0中平衡的SPSEPHAR0SE?FastFlow柱(GEHealthcare,Piscataway,NJ,USA),并用0至500mM氯化鈉的線性梯度洗脫。[0456]煙曲霉NN051616GH3β-木糖苷酶的制備。煙曲霉GH3β-木糖苷酶(SEQIDΝ0:15和SEQIDNO:16)如WO2011/057140中所述在米曲霉中重組指示脫鹽并緩沖液交換入50mM乙酸鈉pH5.0。[0457]對于每個上述的單組分的蛋白濃度使用MicroplateBCA?ProteinAssayKit(ThermoFischerScientific,Waltham,MA,USA)來確定,其中牛血清白蛋白用作蛋白標樣。用如上所述制備的每種單組分如下所述構成酶組合物:37%煙曲霉Cel7A纖維二糖水解酶I,15%具有纖維素分解增強活性的PenicilliumemersoniiGH61A多肽,10%里氏木霉GH5內切葡聚糖酶II,5%煙曲霉GHlO木聚糖酶,5%煙曲霉β-葡糖苷酶,和3%煙曲霉β-木糖苷酶。該酶組合物在本文中命名為“不含纖維二糖水解酶II的酶組合物”。[0458]實施例10:煙曲霉纖維二糖水解酶II的制備[0459]煙曲霉ΝΝ055679纖維二糖水解酶II的制備。煙曲霉GH6A纖維二糖水解酶II(SEQIDΝ0:17和SEQIDNO:18)在米曲霉中如WO2011/057140中所述重組制備。將煙曲霉GH6A纖維二糖水解酶II經過濾的培養液使用400mlSEPHADEX?G-25柱(GEHealthcare,UnitedKingdom)根據生產商的指示緩沖液交換入20mMTrispH8.0。匯集級分,并將其調整為1.2M硫酸鈉-20mMTrispH8.0。將經平衡的蛋白加載于在含1.2M硫酸銨的20mMTrispH8.0中平衡的PHENYLSEPHAR0SE?6FastFlow柱(highsub)(GEHealthcare,Piscataway,NJ,USA)之上,并將結合的蛋白用不含硫酸銨的20mMTrispH8.0洗脫。匯集級分。蛋白濃度使用MicroplateBCA?ProteinAssayKit以牛血清白蛋白作為蛋白標樣來確定。[0460]實施例11:TalaromycesIeycettanus家族GH6纖維二糖水解酶(P23YSW)對通過酶組合物在50-60°C水解經磨制、未經洗滌的PCS中的作用[0461]將TalaromycesIeycettanus家族GH6纖維二糖水解酶II(P23YSW)在不含纖維二糖水解酶11的酶組合物中在50V,55°C,60V,和65°C使用經磨制、未經洗滌的PCS作為底物進行評估。將不含纖維二糖水解酶II的酶組合物(實施例9)以2.25mg總蛋白每g纖維素添加至PCS水解反應,并將水解結果與對于添加或不添加GH6纖維二糖水解酶II(3.0mg蛋白每g纖維素)的類似的高溫酶組合物的結果進行比較。[0462]測定如實施例8中所述進`行。用經磨制、未經洗滌的PCS(5%不溶性固體)的Iml反應在含有ImM硫酸錳的50mM乙酸鈉pH5.0緩沖液中進行72小時。所有反應進行一式三次,并涉及在水解開始時的單次混合。[0463]如下表1中所示,包含TalaromycesIeycettanus家族GH6纖維二糖水解酶II(P23YSW)的酶組合物與不含纖維二糖水解酶II的酶組合物(2.25mg蛋白/g纖維素和3.0mg蛋白/g纖維素)相比,在50°〇,551:,601:,和65°C性能顯著更佳(因為在50°C,55°C,60°C,和65°C,對于TalaromycesIeycettanus家族GH6纖維二糖水解酶II(P23YSW),纖維素至葡萄糖的轉化程度要高于不含纖維二糖水解酶II的酶組合物)。下表1中的結果,顯示含有TalaromycesIeycettanus家族GH6纖維二糖水解酶II(P23YSW)的酶組合物與含有煙曲霉家族GH6纖維二糖水解酶II的酶組合物相比,在50°C,55°C,60°C,和65°C性能更佳(因為在50°C,55°C,60°C,和65°C,對于TalaromycesIeycettanus家族GH6纖維二糖水解酶II(P23YSW)的纖維素至葡萄糖的轉化程度與含有煙曲霉家族GH6纖維二糖水解酶II的酶組合物相比更高)。[0464]表1【權利要求】1.一種具有纖維二糖水解酶活性的分離的多肽,其選自下組:(a)多肽,其與SEQIDNO:2的成熟多肽具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少87%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在中等嚴格條件,或中等-高嚴格條件,或高嚴格條件,或非常高嚴格條件下與以下雜交:(i)SEQIDNO:1的成熟多肽編碼序列,(ii)其cDNA序列,或(iii)(i)或(ii)的全長互補物;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1的成熟多肽編碼序列或它們的cDNA序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;(d)SEQIDNO:2的成熟多肽的在一個或多個位置包含取代、缺失和/或插入的變體;和(e)(a)、(b)、(C)或(d)的多肽的具有纖維二糖水解酶活性的片段。2.權利要求1的多肽,其與SEQIDNO:2的成熟多肽具有至少81%,至少82%,至少83%,至少84%,至少85%,至少87%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。3.權利要求1或2的多肽,其包含或組成為SEQIDNO:2,或SEQIDNO:2的成熟多肽。4.權利要求3的多`肽,其中所述成熟多肽是SEQIDNO:2的氨基酸19至464。5.權利要求1的多肽,其為SEQIDNO:2的片段,其中所述片段具有纖維二糖水解酶活性。6.一種分離的多肽,其包含選自下組的催化域:(a)催化域,其與SEQIDNO:2的催化域具有至少81%序列同一性;(b)催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1的催化域編碼序列具有至少60%序列同一‘丨生;(c)SEQIDNO:2的催化域的包含一個或多個(幾個)氨基酸取代、缺失和/或插入的催化域變體;和(d)(a)、(b)或(c)的催化域的具有纖維二糖水解酶活性的片段。7.權利要求6的多肽,其包含或組成為SEQIDNO:2的催化域。8.權利要求7的多肽,其中所述催化域是SEQIDNO:2的氨基酸105至464。9.權利要求6-8任一項的多肽,其進一步包含纖維素結合域。10.一種酶組合物,其包含權利要求1-9任一項的多肽。11.一種分離的多核苷酸,其編碼權利要求1-9任一項的多肽。12.—種核酸構建體或表達載體,其包含權利要求11的多核苷酸,所述多核苷酸可操作地連接于一個或多個調控序列,所述調控序列指導所述多肽在表達宿主中的產生。13.—種重組宿主細胞,其包含權利要求11的多核苷酸,所述多核苷酸可操作地連接于一個或多個調控序列,所述調控序列指導所述多肽的產生。14.一種產生具有纖維二糖水解酶活性的多肽的方法,其包括:(a)在有助于所述多肽產生的條件下培養權利要求13的宿主細胞;和(b)回收所述多肽。15.一種編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDNO:2的氨基酸I至18。16.一種重組宿主細胞,其包含編碼蛋白的基因,所述基因可操作地連接于權利要求15的多核苷酸,其中所述基因對于編碼所述信號肽的多核苷酸是外源的。17.—種產生蛋白的方法,其包括:(a)在有助于所述蛋白的產生的條件下培養重組宿主細胞,所述重組宿主細胞包含編碼蛋白的基因,所述基因可操作地連接于權利要求15的多核苷酸,其中所述基因對于編碼信號肽的多核苷酸是外源的;和(b)回收所述蛋白。18.一種降解纖維素材料的工藝,其包括:在權利要求1-9任一項的具有纖維二糖水解酶活性的多肽存在下用酶組合物處理所述纖維素材料。19.權利要求18的工藝,其中所述纖維素材料經過預處理。20.權利要求18或19的工藝,進一步包括回收經降解的纖維素材料。21.權利要求20的工藝,其中所述經降解的纖維素材料是糖。22.—種產生發酵產物的工藝,其包括:(a)在權利要求1-9任一項的具有纖維二糖水解酶活性的多肽存在下,用酶組合物糖化纖維素材料;`(b)用一種或多種發酵微生物發酵經糖化的纖維素材料以產生所述發酵產物;和(c)從發酵回收所述發酵產物。23.權利要求22的工藝,其中步驟(a)和(b)在同步糖化和發酵中同時進行。24.權利要求22或23的工藝,其中所述發酵產物是醇、烷烴、環烷烴、烯烴、氨基酸、氣體、異戊二烯、酮、有機酸或聚酮化合物。25.一種發酵纖維素材料的方法,其包括:用一種或多種發酵微生物發酵纖維素材料,其中所述纖維素材料是在權利要求1-9中任一項的具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化的。【文檔編號】C12N9/42GK103517986SQ201280015346【公開日】2014年1月15日申請日期:2012年1月26日優先權日:2011年1月26日【發明者】N.斯波德斯伯格申請人:諾維信公司,諾維信股份有限公司