專利名稱::一種β-葡萄糖苷酶及其編碼基因與應用的制作方法
技術領域:
:本發明涉及來自水牛瘤胃未培養微生物的一個新的e—葡萄糖苷酶及其編碼基因與應用。
背景技術:
:纖維素主要是植物用二氧化碳和水在太陽能作用下通過光合作用合成的地球上最豐富的可再生的生物質(biomass)資源。纖維素是多個葡萄糖殘基以P-1,4-糖苷鏈連接而成的多聚物,其基本重復單位為纖維二糖。天然纖維素的基本結構是由原纖維構成的微纖維束集合而成。原纖維是由15-40根有結晶區和非結晶區構成的纖維素分子長鏈所組成。纖維素的結晶部分是由纖維素分子進行非常整齊規劃地折迭排列形成。在天然纖維素中,木質素和半纖維素形成牢固結合層,緊密地包圍纖維素。纖維素酶是能將纖維素轉化成葡萄糖的一系列酶的總稱,主要包括內切葡聚糖酶(endo-0-1,4-glucanase,EC3.2.1.4)、外切葡聚糖酶(exoglucanase,又叫纖維二糖水解酶cellobiohydrolase,EC3.2.1.91)和P—葡萄糖苷酶(P-glucosidase,EC3.2.1.21)。內切葡聚糖酶作用于纖維素長鏈分子的內部將長纖維切成短纖維,外切葡聚糖酶作用于纖維素分子的一端,以兩個葡萄糖殘基為單位進行切割生成纖維二糖,0—葡萄糖苷酶切割纖維二糖生成葡萄糖,以及水解一些纖維三糖或纖維寡糖(LyndLR,WeimerPJ,WillemHZ,PretoriusIS.2002.Microbialcelluloseutilization:fundamentalsandbiotechnology.MicrobiolMolBiolRev,66:506-577;ZhangYH,LyndUR.2004.Towardanaggregatedunderstandingofenzymatichydrolysisofcellulose:noncomplexedcellulasesystems.BiotechnologyandBioengineering,88:797-824)。以木質纖維素為原料、用纖維素酶水解纖維素生產酒精,最早的工藝路線是先糖化后發酵(S印arateHydrolysisandFermentation,SHF)工藝,先預處理木質纖維素,再用纖維素酶水解纖維素產生糖,接著再用酵母菌或其它微生物發酵產生酒精,這種工藝的主要缺點是在水解產生的葡萄糖存在的情況下,e-葡萄糖苷酶停止水解纖維二糖,纖維二糖的積累又導致對纖維素降解的終止。這種工藝后來被改進為同步糖化發酵(SimultaneousSaccharificationandFermentation,SSF)工藝,在該工藝中,纖維素酶對纖維素的水解和發酵在同一容器中進行,一邊酶解產生糖,發酵微生物就一邊將糖轉化成酒精。不但減少了反應器,更重要的是避免了產物抑制問題。現在,SSF工藝被改進成同步糖化共發酵(SimultaneousSaccharificationandCofermentation,SSCF)工藝。SSCF工藝就是邊糖化、發酵微生物可以同時邊發酵多種糖底物。該工藝目前存在的主要問題是纖維素酶的酶活低、生產成本高;纖維素酶的作用溫度和常用發酵微生物酵母菌的發酵溫度不匹配。解決的辦法之一是研發酸性中低溫高活力纖維素酶包括0-葡萄糖苷酶(http:〃www1.eere.energy,gov/biomass/process-description.html;OhgrenK,BuraR,LesnickiG,SaddlerJ",ZacchiG.2007.Acomparisonbetweensimultaneoussaccharificationandfermentationandseparatehydrolysisandfermentationusingsteam-pretreatedcornstover.ProcessBiochemistry,42:834-839)。很多微生物包括細菌、放線菌和真菌等都能產生P-葡萄糖苷酶(BhatMK,BhatS.1997.Cellulosedegradingenzymesandtheirpotentialindustrialapplications.BiotechnologyAdvances,15:583-620)。但是目前分離到的e-葡萄糖苷酶主要是從純培養微生物中得到的,而占自然界中微生物種類99%以上的未培養微生物(unculturedmicroorganisms)中蘊藏著豐富的基因資源(AmannRI,UidwigW,SchleiferKH.1995.Phylogeneticidentificationandinsitudetectionofindividualmicrobialcellswithoutcultivation.必.croZ^'a/jeF,59:143-169),已經有較多文獻報道通過構建和篩選環境樣品的未培養微生物宏基因組文庫獲得新基因,如編碼脂肪酶、蛋白酶、幾丁質酶、淀粉酶、抗生素以及纖維素酶等活性物質的基因(StreitWR,DanielR,JaegerKE.2004.Prospectingforbiocatalystsanddrugsinthegenomesofnon—culturedmicroorganisms.Curr0pinBiotechn,15:285-290)。在未培養微生物纖維素酶方面,Rees等人從湖水和湖床沉積物未培養微生物中克隆到2個纖維素酶基因,Genebank登錄號為AJ537595和AJ537596(ReesHC,GrantS'JonesB,GrantWD,HeaphyS.2003.DetectingcellulaseandesteraseenzymeactivitiesencodedbynovelgenespresentinenvironmentalDNAlibraries.Extremophiles:7:415-421.)。Voget等從土壤未培養微生物中克隆到2個纖維素酶基因gnuB禾口uvs080(VogetS,LeggewieC,UesbeckA,RaaschC,JaegerKE,StreitWR.2003.Prospectingfornovelbiocatalystsinasoilmetagenome.ApplEnvironMicrobiol,69:6235-6242)。Walter等人構建鼠大腸未培養微生物的BAC基因文庫,并克隆到一個P—葡萄糖苷酶基因(WalterJ,MangoldM,TannockGW.2005.Construction,analysis,andbeta-glucosidasescreeningofabacterialartificialchromosomelibraryfromthelarge-bowelmicrobiotaofmice.ApplEnvironMicrobiol,71:2347-2354)。Ferrer等人構建了奶牛的瘤胃內容物的宏基因組文庫,從中克隆到包括9個內切-p-i,4-葡聚糖酶基因和i個e-葡萄糖苷酶基因(FerrerM,Golyshina0V,ChernikovaTN,KhachaneAN,Reyes-DuarteD,SantosVA.2005.Novelhydrolasediversityretrievedfromametagenomiclibraryofbovinerumenmicroflora.EnvironMicrobiol,7:1996-2010)。2006年,Voget等人又從土壤未培養微生物中克隆了一個內切葡聚糖酶基因cel5A(VogetS,SteeleHL,StreitWR.2006.Characterizationofametagenome-derivedhalotolerantcellulase.JBiotechnol,126:26-36);Feng等人2007年報道從兔子盲腸未培養微生物中克隆和鑒定了4個內切葡聚糖酶和7個P-葡萄糖苷酶基因(FengY,DuanCJ,PangH,MoXC,WuCF,YuY,WeiJ,Tang幾,FengJX.2007.Cloningandidentificationofnovelcellulasegenesfromunculturedmicroorganismsinrabbitcecumandcharacterizationoftheexpressedcellulases.ApplMicrobiolBiotechnol,75:319-328)。反芻動物能高效利用纖維性食物,與其瘤胃中的微生物能分泌產生高效降解纖維素的纖維素酶是分不開的。瘤胃微生物包括真菌、細菌、原生動物和古細菌。人們通過對瘤胃微生物的研究發現,瘤胃中的微生物有8000多種,其中85%以上是未培養的(KrauseD0,De廳nSE,MackieRI,MorrisonM,RaeAL,AttwoodGT,McSweeneyCS.2003.Opportunitiestoimprovefiberdegradationintherumen:microbiology,ecology,andgenomics.FEMSMicrobiolRev,27:663-693;KamraDN.2005.Rumenmicrobialecosystem.CurrSci89:124-135.),在這些微生物中可能會含有大量的包括纖維素酶基因在內的基因資源。
發明內容本發明的目的是提供一種新的、高酶活的e—葡萄糖苷酶。本發明所提供的e—葡萄糖苷酶,名稱為Umcel3G,來源于水牛瘤胃未培養微生物,是如下(a)或(b)的蛋白質(a)由序列表中序列3所示的氨基酸序列組成的蛋白質;(b)將序列表中序列3的氨基酸序列經過一個或幾個氨基酸殘基的取代和/或缺失和/或添加且具有e—葡萄糖苷酶活性的由(a)衍生的蛋白質。其中,序列表中的序列3由717個氨基酸殘基組成。自氨基末端(N端)第98一387位氨基酸殘基為糖基水解酶家族3的催化功能域(glycosylhydrolase3domain),自氨基末端(N端)第462—705位氨基酸殘基為糖基水解酶家族3C的結構域(glycosylhydrolase3Cterminaldomain)。所述一個或幾個氨基酸殘基的取代和/或缺失和/或添加是指在序列3的上述兩個結構域外進行取代和/或缺失和/或添加。為了使(a)中的Umcel3G便于純化,可在由序列表中序列3所示的氨基酸序列組成的蛋白質的N端或C端連接上如表1所示的標簽。表1.標簽的序列<table>tableseeoriginaldocumentpage6</column></row><table>上述(b)中的Umcel3G可人工合成,也可先合成其編碼基因,再進行生物表達得到。上述(b)中的Umcel3G的編碼基因可通過將序列表中SEQIDNa:l的自5端第661至2814位堿基所示的咖A序列中缺失一個或幾個氨基酸殘基的密碼子,和/或進行一個或幾個堿基對的錯義突變,和/或在其5'端和/或3'端連上表1所示的標簽的編碼序列得到。為了便于蛋白的分泌表達,還可在所述Umcel3G的氨基末端添加上信號肽序列。如添加由序列表中2的自氨基末端第1至23位氨基酸殘基組成的多肽,得到由序列表中2所示的氨基酸序列組成的蛋白。序列表中的序列2由740個氨基酸殘基組成。自氨基末端(N端)第1-23位氨基酸殘基為信號肽(signalp印tide)序列,自氨基末端(N端)第121—410位氨基酸殘基為糖基水解酶家族3的催化功能域(glycosylhydrolase3domain),自氨基末端(N端)第485—728位氨基酸殘基為糖基水解酶家族3C的結構域(glycosylhydrolase3Cterminaldomain)。序列表中序列2所示的Umcel3G與來源于Aaw77^sp.的P—葡萄糖苷酶(Genbank索引號BAA36161)同源性最高,它們的氨基酸序列相似性為73%、一致性為60%。上述P—葡萄糖苷酶的編碼基因也屬于本發明的保護范圍。所述e—葡萄糖苷酶的編碼基因,具體可為如下l)或2)或3)的基因1)其核苷酸序列是序列表中的序列1的自5端第661-2814位脫氧核糖核苷酸所示的DNA分子;2)其核苷酸序列是序列表中的序列1所示的DNA分子;3)在嚴格條件下與1)或2)限定的DNA序列雜交且編碼所述3—葡萄糖苷酶的DNA分子。上述高嚴謹條件可為在0.1XSSPE(或0.1XSSC),0.1%SDS的溶液中,在65°C下雜交并洗膜。序列表中的序列l由3334個脫氧核糖核苷酸組成,自5'端的第592至2814位核苷酸為鵬ceJ3G的開放閱讀框(OpenReadingFrame,ORF),自5,端的第592-594位核苷酸為鵬ce73G的起始密碼子ATG,自5'端的第2812-2814位核苷酸為w歷ceJ3G的終止密碼子TAG。含有本發明基因的重組表達載體、轉基因細胞系及重組菌均屬于本發明的保護范圍。本發明的另一個目的是提供一種表達上述0—葡萄糖苷酶的方法。本發明所提供的表達上述e—葡萄糖苷酶的方法,是將含有上述e—葡萄糖苷酶編碼基因的重組表達載體導入宿主細胞,表達得到e—葡萄糖苷酶。所述宿主可為酵母菌、大腸桿菌、哺乳動物細胞、昆蟲細胞或枯草桿菌等,優選為大腸桿菌。所述酵母菌具體可為巴氏畢赤酵母(尸ic力iap3Wo/^s)。其中,所述巴氏畢赤酵母優選為巴氏畢赤酵母GS115,KM71(可購自美國Invitrogen公司)或SMD1168(可購自美國Invitrogen公司)。所述大腸桿菌具體可為BL21(DE3)pLysS、E.coliJM109,E.coliHB101或E.coliT叩IO等。當所述宿主為酵母菌時,用于構建所述重組表達載體的出發載體可為現有的在上述酵母中表達外源基因的表達載體,如可在巴氏畢赤酵母("c力h中表達的pPIC9、pPIC3、pHIL-Dl、pA0804、pA0815、pPSC3K或pPIC9K。當所述宿主為巴氏畢赤酵母(尸J'c力^P3^0W^)時,需用甲醇進行誘導表達,甲醇的終濃度可為0.5。%(體積百分含量)。當所述宿主為大腸桿菌時,用于構建所述重組表達載體的出發載體可為現有的在上述大腸桿菌中表達外源基因的表達載體,上述重組表達載體均可按照常規方法構建。培養含有本發明的e—葡萄糖苷酶編碼基因的宿主細胞的培養基和培養條件,均可為培養出發宿主的培養基和培養條件。實驗證明,Umcel3G酶促反應的最適pH為6.0-6.5(圖9A),在pH4.5時該酶具有65%的相對酶活;Umcel3G酶促反應的最適溫度為45。C(圖9B),在35。C時該酶具有80%的相對酶活。在最適pH和最適溫度下,純化的重組酶對底物pNPG的比活力為35.4IU/mg。5mmol/L的Ca"可以把Umcel3G的活性提高40%,達到52,5IU/mg。另外,在有5mmol/L的Ca2+存在、pH4.5和35。C條件下,測得該酶的比活力為22.8IU/mg。因此在以纖維素為原料生產燃料酒精的同步糖化共發酵工藝中的發酵微生物酵母菌最適發酵條件下,該酶具有較高的酶活,可以應用于該工藝中以生產燃料酒精。本發明通過構建水牛瘤胃未培養微生物的宏基因組DNA文庫并對文庫克隆進行活性篩選,得到了一個新的e—葡萄糖苷酶基因。可在宿主細胞中大量表達該基因以生產該纖維素酶,用于纖維素的降解。本發明所提供新的e—葡萄糖苷酶及其編碼基因在纖維素的降解中具有廣泛的用途。圖1為從水牛瘤胃內容物中提取的未培養微生物的混合基因組DNA的凝膠電泳圖。圖2為水牛瘤胃未培養微生物基因文庫克隆質粒5aWI酶切分析圖。圖3為水牛瘤胃未培養微生物基因文庫克隆在七葉苷培養基上的活性篩選,陽性克隆EPI100/pGLU64所在的平板圖。圖4為e—葡萄糖苷酶活性的克隆質粒pGLU64的"a/zHI酶切帶型。圖5為初篩獲得的重組質粒pGLU64轉化大腸桿菌后得到的轉化子(右)有P一葡萄糖苷酶活性,而含空載體pWEB::TNC的大腸桿菌沒有活性(左)。圖6為pET30-"/Hce7W重組質粒經JpM和i7wl雙酶切后的電泳圖。圖7為重組大腸桿菌BL21(DE3)pLys/pumcel3G在七葉苷平板上具有活性(右),而含有空載體pET30a(+)的大腸桿菌BL21(DE3)pLys在七葉苷平板上不具有活性(左)。圖8Umcel3G表達、純化及復性產物的電泳圖。圖9為本工作獲得的3—葡萄糖苷酶的最適反應條件。具體實施例方式下述實施例中的實驗方法,如無特殊說明,均為常規方法。下述實施例中的百分含量,如無特殊說明,均為質量百分含量。在本發明的實施例中所用到的材料包括大腸桿菌(Escherichiacoli)株系EPI100(購自Epicentre公司);柯斯質粒載體pWEB::TNC(購自Epicentre公司);文庫制備試劑盒(pWEB::TNCcosmidcloningkit,目錄號WEBC931,購自Epicentre公司);表達載體pET30a(+)(購自Novagen公司);表達菌株BL21(DE3)pLys(購自Novagen公司);限制性內切酶、修飾酶、聚合酶、七葉苷(Esculinhydrate)、檸檬酸高鐵銨(Ammoniumiron(III)citrate)等試齊鵬自Promega,Stratagene,SIGMA。實施例1、P—葡萄糖苷酶Umcel3G及其編碼基因的獲得一、水牛瘤胃未培養微生物宏基因組文庫的構建從南寧市一個屠宰場,采集5個水牛的新鮮且相對比較干燥的水牛瘤胃內容物,于實驗室-2(TC保存待用。分別從每個樣品中稱取水牛瘤胃內容物10g并混在一起,懸浮在100ral的0.18M磷酸鉀緩沖液(pH7.2)中,充分混勻后在BeckmanCoulterAvantiJ-E離心機JA-10轉頭上用2000g離心力離心10分鐘,倒去上清液,沉淀物用100ml提取緩沖液(lOOmMsodiumphosphatepH8.0;lOOmMTirs-HC1pH8.0;lOOmMEDTApH8.0;1.5MNaCl;1%CTAB;2%SDS)懸浮,用攪拌機充分攪碎樣品,并在液氮和65'C水浴反復凍融樣品三次后,加入溶菌酶(20mg/ml,溶于TE溶液)至終濃度2mg/ml,在37°。下作用30分鐘。然后加入蛋白酶K至終濃度O.lmg/ml,在50。C下作用30分鐘。再加入SDS至終濃度1.0%,在75。C下作用10分鐘。8000g離心力離心10分鐘,取上清液,加入兩倍體積的無水乙醇,充分混勻后即見DNA絮狀沉淀析出,挑出DNA絮狀沉淀,用70%乙醇洗2次DNA,干燥后將DNA溶于500jilTE溶液即得DNA粗提物。將DNA粗提物加到含有S印hadexG200和2XPVPP(聚乙烯聚吡咯垸酮,polyvinylpolypyrrolidone)的層析柱(200腿xl0mm)上,用TE緩沖液洗脫,按每組分1ml分部收集洗脫液,每一組分加入100pl的3M醋酸鈉溶液(pH5.2)及lml異丙醇沉淀DNA。合并沉淀出的DNA,溶于TE中得到純化的DNA溶液,然后用電洗脫法回收30kb以上的DNA。由于文庫構建試劑盒(購自Epicentre公司的文庫制備試劑盒pWEB::TNCcosmidcloningkit,目錄號WEBC931)提供的載體(pWEB::TNC)為平頭末端,因此需要首先對回收的DNA片段進行末端修復以產生平末端,具體方法為依次在冰上向新的滅過菌的微量離心管中加入6plIOX末端修復酶緩沖液(330mMTris—醋酸[pH7.8],660mM醋酸鉀,lOOmM醋酸鎂,5mMDTT),6pl2.5raMdNTP混合物(每種2.5mM),6jil10mMATP,40DNA(O.2^ig/|il),2jil末端修復酶混合物(T4DNA聚合酶和T4多聚核苷酸激酶),25'C下進行修復反應,45分鐘后轉移到7(TC水浴鍋10分鐘終止反應,用1.0%低熔點瓊脂糖凝膠回收補平后的30kb—50kb的DNA片段。DNA的提取、純化以及末端修復后的回收電泳圖如圖1所示(泳道M:入DNA(48.5kb);泳道l:粗提總DNA;泳道2:經S印hadexG200凝膠柱純化和電透析回收的DNA片段;泳道3:經末端修復和低熔點膠回收的DNA片段)。依次在冰上向一個新的滅過菌的微量離心管中加入12pl無菌水、2^110倍快速連接酶緩沖液(10XFast-LinkLigationBuffer)、1(il10mMATP、lfilpWEB::TNC載體(0.5pg)、3|il低熔點瓊脂糖凝膠回收的25kb—45kb的DNA(0.1(ig/pl)和快速連接DNA連接酶(Fast-LinkDNALigase,2單位/pl),混勻后在25"C下進行連接反應2個小時,再在7(TC放置10分鐘以終止酶反應。將在冰上剛剛溶化的A包裝提取物(文庫構建試劑盒提供)25pl立即轉移到一個新的滅過菌的微量離心管中并快速置于冰上,再往其中加入10pl連接反應產物,充分混勻后置于3(TC90分鐘后,再往其中加入剩余的25(il溶化的入包裝提取物,充分混勻后置于30°C90分鐘,向其中加入500pl噬菌體稀釋緩沖液(10mMTris-HCl[pH8.3],100mMNaCl,10mMMgCl2)。將560pl包裝反應產物加入到5.6ml的0D6。。=1.0的宿主大腸桿菌EPI100培養液(培養基為LB[每升含胰蛋白胨(Oxoid),10g;酵母浸出粉(Difco),5g;NaCl,5g;PH7.0]+10mMMgS0J中,25。C下放置20分鐘讓入噬菌體吸附和侵染宿主細胞Acoh'EPI100,在含氨芐青霉素(100ug/mL)和氯霉素(12ug/ul)的LA平板(上述LB培養基+1.5。/。瓊脂粉)上篩選轉化子。結果共獲得約14000個轉化子,任意提取15個克隆的質粒DNA,用限制性內切酶^aMH酶切后0.7%瓊脂糖凝膠電泳分析,結果所有質粒除都有一個5.8kb的載體片段外,都含有插入片段,插入片段最大的為48kb,最小的為20.5kb,平均大小為38.2kb,文庫的總容量為5.35X108bp,且沒有發現有兩個質粒具有相同的酶切帶型,說明文庫含有非常隨機的插入DNA片段,文庫的庫容量也基本達到要求。圖2為水牛瘤胃未培養微生物基因文庫克隆質粒5a/dH酶切分析圖。Ml:入/fcoRI(片段大小從大到小依次為21.2kb,7.4kb,5.8kb,5.6kb,4.9kb,3.5kb);M2:lkbladder(片段大小從大到小依次為:10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.0kb,2.5kb,2.0kb,1.5kb,1.0kb,0.75kb);其它泳道分別為經5a/zflI酶切的15個文庫克隆質粒。二、水牛瘤胃未培養微生物宏基因組文庫中表達3-葡萄糖苷酶活性克隆的篩選用平板影印法將文庫原始平板上的克隆(每平板約200個菌落左右)影印到含氨節青霉素(100ug/mL)、0.1%七葉苷(esculinhydrate)和0.2%檸檬酸鐵銨(ferricammoniumcitrate)的活性LA平板(簡稱七葉苷平板)上,將平板倒置于37"C培養箱培養24小時后,菌落周圍出現黑色水解圈的為表達J3-葡萄糖苷酶活性的陽性克隆(稱為EPI100/pGLU64)(圖3)。本發明只涉及其中一個陽性克隆,進一步提取該克隆的質粒DNA并將其命名為pGLU64,用限制性內切酶&ydn完全酶切pGLU64后,進行電泳分析(圖4),結果pGLU64除有一個5.8kb的載體片段外,還給出另外6條^ayzHI片段,大小約為9kb、5.5kb、5kb、2.3kb、2kb和1.3kb,說明pGLU64含有25.3kb的插入片段(泳道M:入A5boRI,片段大小從大到小依次為21.2kb,7.4kb,5.8kb,5.6kb,4.9kb,3.5kb;泳道l:lkbladder,片段大小從大到小依次為10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.Okb,2.5kb,2.0kb,1.5kb,l.Okb,0.75kb,0.5kb泳道2:pGLU64的5a;zHI酶切帶型)。用pGLU64質粒DNA和空載體pWEB::TNC分別轉化£coh'EPI100,在活性七葉苷平板上驗證轉化子,結果空載體pWEB::TNC的轉化子沒有水解圈(圖5左),pGLU64的轉化子周圍有黑色水解圈(圖5右),從而證明重組質粒pGLU64的插入片段上確實含有葡萄糖苷酶基因(圖5)。實施例2、e—葡萄糖苷酶基因的定位采用亞克隆的方法對pGLU64上的e—葡萄糖苷酶基因進行定位。先用限制性內切酶/力oI酶切pGLU64,再自連、轉化、活性檢測、質粒分析,目的基因被定位在14kb的片段上。然后使用^s/dn酶切,最終將目的基因被定位在5.Okb的片段上,把該^s/dH片段寄送大連寶生物工程公司采用雙脫氧核苷酸法對該基因進行雙向雙鏈測序。用軟件DNAStar(DNASTAR公司,版本5)對序列進行拼接,用NCBI(NationalCenterforBiotechnologyInformation,http:〃www.ncbi.nlm.nih.gov)上的軟件Blast(http:〃www.ncbi.nlm.nih.gov/BLAST)對序列進行分析,得到纖維素的編碼基因,該基因具有序列表1的DNA序列,命名為腳ce73G。序列表中序列1的DNA自5,端的第592至2814位核苷酸為柳ce73G的開放閱讀框(OpenReadingFrame,ORF),由2223個核苷酸組成,自5'端的第592-594位核苷酸為咖ce^G的起始密碼子ATG,自5'端的第2812-2814位核苷酸為咖ce73G的終止密碼子TAG。纖維素酶基因咖ce"f編碼一個含740個氨基酸的蛋白質Umcel3G,用DNAStar軟件預測該蛋白質的理論分子量大小為80997.08道爾頓,等電點pl為4.77。用SMART(http:〃smart.embl-heidelberg.de)分析了P—葡萄糖苷酶Umcel3G的組件結構,結果為自N端的第l-23個氨基酸為信號肽(signalp印tide),第121一410位氨基酸為糖基水解酶家族3催化功能域(glycosylhydrolase3domain),第485—728位氨基酸為糖基水解酶家族3C端功能域(glycosylhydrolase3Cterminaldomain)。和Umcel3G催化功能域同源性最高的是來源于"aci77^的e—葡萄糖苷酶(Genebank登錄號BAA36161),它們的氨基酸序列相似性為73%、一致性為60%。實施例3、wzce7JG在大腸桿菌中的表達1、mzcW3G基因表達質粒的構建為了在pET系統中表達咖ce73G,人工合成咖ce73G基因除了信號肽和終止密碼子以外的全部序列(即自序列1的5'端第661-2811位),插入載體pET-30a(+)(購自Novagen公司)的和i7wl位點間,得到重組表達載體pET30-鵬ce73G。起始密碼子和終止密碼子由表達載體pET30a(+)提供。表達產物的N端有一個由表達載體提供的His標簽(6XHisTag)。將pET30-咖ceJ3G轉化到宿主£coh'EPI100中。提取轉化子的質粒,用勤/I和J力ol酶切分析,結果表明重組質粒pET30-Mce73G經f/wl和J力ol雙酶切后釋放出一條5.4kb的載體帶和一條與預期大小相符的外源插入片段。圖6是重組質粒pET30-MBce23G的酶切電泳圖譜,泳道1為lkbladder(片段大小從大到小依次為10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.0kb,2.5kb,2.0kb,1.5kb);泳道2為重組質粒經vf;^I和Wol雙酶切后的電泳圖。并用DNA序列分析試劑盒(美國USB公司產品)對重組載體pET30-w/^e73G進行測序,結果表明該重組載體中的鵬ce73G基因序列是序列表中的序列1的自5'端第661位至2811位脫氧核苷酸。2.^ce力G基因在大腸桿菌中的表達、純化把含有重組表達質粒pET30-咖ce73G的表達宿主BL21(DE3)pLysS接種在含有34ug/mL氯霉素和25ug/ml卡那霉素的上述七葉苷平板上,同時接種只含空載體PET-30a(+)的宿主菌BL21(DE3)pLysS作為對照,37。C培養12小時后,兩種菌落上分別點加10ull.0mM的IPTG,誘導外源蛋白的表達。繼續在37T:下培養6小時,菌體經氯仿熏蒸破壁后再經37"C培養1小時,可以看到含有重組表達質粒pET30-鵬c^3G的宿主菌落周圍有黑色水解圈,而對照菌落周圍無水解圈,結果見附圖7:含有重組表達質粒pET30ne73G的表達宿主BL21(DE3)pLysS有P—葡萄糖苷酶活性(右),而含空載體pET-3Oa(+)的大腸桿菌BL21(DE3)pLysS沒有0—葡萄糖苷酶活性(左)。說明基因鵬ce73G在Acoh'中已經表達出了具有P—葡萄糖苷酶活性的蛋白質產物。該實驗共進行3次重復。將含有pET30-咖ceZ3G的表達宿主BL21(DE3)pLysS稱為BL21(DE3)pLys/pUmcel3G。為了得到表達產物Uracel3G,用IPTG處理表達菌株BL21(DE3)pLys/pUmcel3G和對照菌株即含有空載體pET30a(+)的BL21(DE3)pLys。與含有空載體pET30a(+)的BL21(DE3)pLys給出的蛋白質帶型(圖8泳道1)相比,表達菌株BL21(DE3)pLys/pUmcel3G明顯給出一條額外的約83kD的蛋白質帶(圖8泳道2),其與表達產物預計的分子質量(83902.11Daltons)相似;經過Ni-NTA柱純化后的產物在SDS-PAGE上只顯示出一條主要的蛋白質帶(圖8泳道3),得到的純化產物可以用來進行酶學特性的分析;把凝膠上的純化的表達產物復性后,在七葉苷平板上顯示出P-葡萄糖苷酶活性(圖8泳道4)。實施例4、Uracel3G的活性測定以對-硝基苯酚0-D-葡萄糖醛酸苷(p-nitrophenyl-D-glucopyranoside,pNPG)為底物測定P-葡萄糖苷酶的活性,以每分鐘催化pNPG生成1ymol對-硝基苯酚(p-nitr叩henol)所需的酶量為一個酶活單位(IU)。最適pH測定所用緩沖液為pH3.07.0:檸檬酸-磷酸氫二鈉緩沖液(citrate-phosphatebuffer);p朋.08.0:0.1mol/Lsodium-phosphate(磷酸鈉緩沖液);pH7.09.0:0.lmol/LTris-HC1緩沖液。反應體系為14u125ramol/L的pNPG,10ul適當濃度的酶液,116iU不同pH的緩沖液,37。C反應5分鐘,加入70u10.4mol/L的Na2C03溶液以終止反應,反應后用酶標儀測410nra的吸光值(A楊)(以加入10(TC水浴10分鐘后失活的酶液為空白對照反應)。根據所制作蛋白標準曲線計算出酶液中所含酶量,再根據所制作P-NP曲線(尸3.6094x+0.05595,x代表反應終止后P-NP的濃度,y代表酶標儀測410nm的吸光值)計算出反應終止后p-NP的濃度,最后根據酶活單位定義計算出酶活單位。與上述反應體系及方法相同,在最適pH(6.0)的緩沖液中測定該酶在不同溫度下的相對酶活。圖9A中的相對酶活是指其它pH下的酶活與在p服.0下的酶活的比值;圖9B中的相對酶活是指其它溫度下的酶活與在45'C下的酶活的比值。在酶反應的最適條件下(p朋.O、45°C)測定金屬離子對Umcel3G活性的影響。反應體系為14ul25mmol/L的pNPG,5ul適當濃度的酶液,7ul0.1mol/L的金屬離子溶液(金屬離子均來自其氯化物,反應終濃度為5ramol/L),114ylP朋.0的緩沖液,45。C反應5分鐘,加入70ul0.4mol/L的Na2C03溶液以終止反應,反應后用酶標儀測410nm的吸光值(A41。)。結果顯示,終濃度為5mmol/L的Ca2+對該酶的酶活有顯著的促進作用。上述所有測定中,每個樣品均作三次重復。表2、不同pH下的Umcel3G酶活測定時的吸光值和酶活力pH^410酶活力(IU/mg)<table>tableseeoriginaldocumentpage14</column></row><table>表3、不同溫度下的Umcel3G酶活測定時的吸光值和酶活力<table>tableseeoriginaldocumentpage15</column></row><table>表4最適條件下不同金屬離子對Umcel3G活性的影響<table>tableseeoriginaldocumentpage15</column></row><table>結果如表2、表3和表4所示,測得Umcel3G酶促反應的最適pH為6.0-6.5(圖9中A),在pH4.5時該酶具有65%的相對酶活;Umcel3G酶促反應的最適溫度為45°C(圖9中B),在35"時該酶具有80%的相對酶活。在最適pH和最適溫度下,純化的重組酶Umcel3G對底物pNPG的比活力為35.4IU/mg。5ramol/L的Ca"可以把Umcel3G的活性提高40y。左右,達到52.5IU/mg。另外,在有5mmol/L的Ca"存在、pH4.5和35。C條件下,測得該酶的比活力為22.8IU/mg。如表5所示。表5在有5mmol/L的Ca"存在、pH4.5和35。C條件下的重組酶Umcel3G的比活<table>tableseeoriginaldocumentpage16</column></row><table>序列表<160>3<210〉1<211>3334〈212〉DNA〈213>未知<220>〈223><400>1tcgggggtgagcagcgagaagacgttgcgcggcgtg朋gccgtattcggcgagcagccgg60tcgtcgtcgagcgcgcggtgcaccgtcgcggaatccagcagcagctggctcgcgatcttg120gcggcgatgttgcccttgatgcggagattgcccgtcagggagaggcgcacggggctctgc180cagccgttgttgagcatccgggccacgtacacgctcggattgcccggcgaaacggtatag240tgcccgggcgtgaggtactccgccacctgcttggcccggaagcagcgctccaggctcgcg300cggttgcgcacctgcgccttttccgcgatctcctccagcaccttgttggccgaggcgccc犯Oggatagacgtagatctccgcctgcttgcggaaattgggcagtttgttgtcctgcagccag420ttgtagccgaggaacgccgcgaccgcaagggccgccagcgtcaggatgatgaataccgct480ttcttcatagcggggcaaagataccgatttttgttcaatagtttatcccgatgtgcggga540cgcgcccggattcccgggaaaaagcttacctttacggaaaaccaattacccatgaaacga600ttgatccctttctgcgcactcgtcctgctggccgcctgcggcccccggtggacggaaacg6G0gaagccgacggctaccggctcatcacccagcgcaacggcgccacgctcggcgtcaccagc720gcgcccctgctcgatctgaacggccatatattcaaggacctcaaccgcaacggccgcgtc780gatccctacgaggactggcgcctgcccgcgctgacgcgcgcgcaggacctcgccgcgcag840ctcagcatcgaggaaatcgccggactgatgctctacagcgcgcatcagagcgtgccgacc900cccgagatcacggagcggcagaagaaattcctcgaagaggacaacctccgtgcggtgctc960gtgaccacggtcgggagcccggagatcgccgcccgctggaacaacaacgtgcaggccttc1020gtggaggcgctgggccacggcatcccggccaacaactcttccgacccgcgcaacgaatgt1080agcgccacggccgaattcaacctcggctcgggcggacagatttccctctggcccaccccg1140ctgggcctcgccgcgaccttcgacccggccctcgtggagcagttcgggcggatcgcctcg1200gcggaataccgggccctcggcatcgccacggccctcagcccgcagatcgacctcgccacc1260gagccgcgctggagccgcttcaacggcacgttcggcgaggatcccgagctcgacgtcgcc1320ctggcgcgcgcctacgtggacggcttccagacgacggaagacgccccggacggctggggc1380gcacagagcgtcaacgcgatggtcaagcactggccgtccggcggcccggaagaaggcggc1440cgcgacgcccatttcaactacggcaaatacgccgtctatcccggcggcaacttcgcgacg1500cacctgcgtccgttcaccgaaggcgccttccgcctggacggcggcacgaagagcgcctcg1560gcggtcatgccctactacacgatctcctacggcgtcgatccctccgggaagaacgccggc1620aacagctacaacgaatacatcatcggcgacctgctgcgcggggaatacggcttcgacggc1680gtggtctgcaccgactggggcatcaccgccgacaacgccgctgtctcatccttcgacggc1740aagtgctggggaatggaggagctgagcgtcgcggagcgccactacgcggtcatcaaggcc1800ggcgtggaccagttcggcggcaacaacgacaagggccccgtcctggaggcctacaagatg1860tgggtggcgg組tcggcgagg卿gcgcccgcgcgcgcttcgagcagtccgccgtgcgc1920ctgctgatgaattccttccgcaccggactcttcgagaatccctataccgatccggcggcc1980gccgcggccgtcgtgggcaatccggaatatatggaagcgggcttccaggcgcagcgcaag2040tccatcgtgatgctgaagaaccacggaggcgtcctgccgaacgacagcgccagggtctat2100gtcccgcagcggctgtatccccagacgcccggcatgttcggcctgtcgatggggccggcc2160gcgcactgggactaccccatcgacaaggaactggtcggaaagtacttccagtggaccgag2220gacccggaagcggccgacttcgcgctcgtgatgatccaggagcccttcccgggcgccggc2280tatgacgtgaacgaccgcaaacggggcggcaacggctacgtgcccatcagcctgcagtac2340cggccctacaaggccgaatacgcccgtcccgtgtccatcgcgggcggcgatccgaaagag2400acgttcaccaaccgctcctaccggggcaagaaggtcacgacctacaacgagagcgacctc2460gacctggtcatcgagacgaagcgcaggatgggcgacaagcccgtcgtcgtggtcatcggc2520gtgagccgacccctcgtcctggcggagctggagccgtatgccgacgccatcctcctcacc2580ttcggcgtccagaaccaggcggtgctggacatcctctccggcgcagcggagccgtccggc2640ctgctgccgatgcagctgccggccgatatgcgcaccgtcgaggagcaggccgaggacgtg2700ccgcgcgatatgcgcgtctatgtcgacgccgacggccacgcctacgatttcgcctacggc2760ctcggctgggacggcgtcatcaacgacgcccgcgtgtccatctaccgcagatagaaatta2820gcggaaaagctgctgcgcgaagaccgtcaggtacacgcgccagttgcgccagatgtgccc2880gccttcggattcgtaataggtgacgggataaccgtgcgcgtcgcaataatccttgagcgc2940cagcgaggtgacccgcacgccgtcgtccttgccgacgccgatccaccagagtttcgggcg3000ggcggcgaagacggccgcgatcgcgtcctcatixccttccggcagcgccgcgccggagaa3060cattcccacatagccgaagcgcttcggatagcgcagcgacagctgcgcggactggcgacc3120gcccatcgacaggccggccacggccgtgttggcggcgcccttcgccacgcggtagtgccc3180ctcgatgaactgcatcacgtcggggaagctttcttcgatctcgaccgtggactgggaacg3240gctgttctgcatcgtgggctgg犯cata/ttgacggcggcgccgggcgcggcccggttgaa3300atacacgccgttcggcatcaccacgatcstcggg3334〈210>2<211>740〈212〉PRT〈213〉未知〈220〉<223>〈400〉2MetLysArgLeulieProPheCysAlaLeuValLeuLeuAlaAlaCys151015GlyProArgTrpThrGluThrGluAlaAspGlyTyrArgLeulieThr202530GinArgAsnGlyAlaThrLeuGlyValThrSerAlaProLeuLeuAsp354045LeuAsnGlyHisliePheLysAspLeuAsnArgAsnGlyArgValAsp505560ProTyrGluAspTrpArgLeuProAlaLeuThrArgAlaGinAspLeu65707580AlaAlaGinLeuSerlieGluGlulieAlaGlyLeuMetLeuTyrSer859095AlaHisGinSerValProThrProGlulieThrGluArgGinLysLys100105110PheLeuGluGluAspAsnLeuArgAlaValLeuValThrThrValGly115120125SerProGlulieAlaAlaArgTrpAsnAsnAsnValGinAlaPheVal130135140GluAlaLeuGlyHisGlylieProAlaAsnAsnSerSerAspProArg145150155160AsnGluCysSerAlaThrAlaGluPheAsnLeuGlySerGlyGlyGin165170175lieSerLeuTrpProThrProLeuGlyLeuAlaAlaThrPheAspPro180185190AlaLeuValGluGinPheGlyArglieAlaSerAlaGluTyrArgAla195200205LeuGlylieAlaThrAlaLeuSerProGinlieAspLeuAlaThrGlu210215220ProArgTrpSerArgPheAsnGlyThrPheGlyGluAspProGluLeu225230235240AspValAlaLeuAlaArgAlaTyrValAspGlyPheGinThrThrGlu245250255AspAlaProAspGlyTrpGlyAlaGinSerValAsnAlaMetValLys260265270HisTrpProSerGlyGlyProGluGluGlyGlyArgAspAlaHisPhe275280285AsnTyrGlyLysTyrAlaValTyrProGlyGlyAsnPheAlaThrHis290295300LeuArgProPheThrGluGlyAlaPheArgLeuAspGlyGlyThrLys305310315320SerAlaSerAlaValMetProTyrTyrThrlieSerTyrGlyValAsp325330335ProSerGlyLysAsnAlaGlyAsnSerTyrAsnGluTyrlielieGly340345350AspLeuLeuArgGlyGluTyrGlyPheAspGlyValValCysThrAsp355360365TrpGlylieThrAlaAspAsnAlaAlaValSerSerPheAspGlyLys370375380CysTrpGlyMetGluGluLeuSerValAlaGluArgHisTyrAlaVal385390395400lieLysAlaGlyValAspGinPheGlyGlyAsnAsnAspLysGlyPro405410415ValLeuGluAlaTyrLysMetTrpValAlaGluPheGlyGluGluSer420425430<table>tableseeoriginaldocumentpage22</column></row><table>580585590ProValSerlieAlaGlyGlyA印ProLysGluThrPheThrAsnArg595600605SerTyrArgGlyLysLysValThrThrTyrAsnGluSerAspLeuAsp610615620LeuVallieGluThrLysArgArgMetGlyAspLysProValValVal625630635640VallieGlyValSerArgProLeuValLeuAlaGluLeuGluProTyr645650655AlaAspAlalieLeuLeuThrPheGlyValGinAsnGinAlaValLeu660665670AsplieLeuSerGlyAlaAlaGluProSerGlyLeuLeuProMetGin675680685LeuProAlaAspMetArgThrValGluGluGinAlaGluAspValPro690695700ArgAspMetArgValTyrValAspAlaAspGlyHisAlaTyrAspPhe705710715720AlaTyrGlyLeuGlyTrpAspGlyVallieAsnAspAlaArgValSer725730735<formula>formulaseeoriginaldocumentpage24</formula>ProGlulieThrGluArgGinLysLysPheLeuGluGluAspAsnLeu859095ArgAlaValLeuValThrThrValGlySerProGlulieAlaAlaArg100105110TrpAsnAsnAsnValGinAlaPheValGluAlaLeuGlyHisGlylie115120125ProAlaAsnAsnSerSerAspProArgAsnGluCysSerAlaThrAla130135140GluPheAsnLeuGlySerGlyGlyGinlieSerLeuTrpProThrPro145150155160LeuGlyLeuAlaAlaThrPheAspProAlaLeuValGluGinPheGly165170175ArglieAlaSerAlaGluTyrArgAlaLeuGlylieAlaThrAlaLeu180185190SerProGinlieAspLeuAlaThrGluProArgTrpSerArgPheAsn195200205GlyThrPheGlyGluAspProGluLeuAspValAlaLeuAlaArgAla210215220TyrValAspGlyPheGinThrThrGluAspAlaProAspGlyTrpGly225230235240AlaGinSerValAsnAlaMetValLysHisTrpProSerGlyGlyPro245250255GluGluGlyGlyArgAspAlaHisPheAsnTyrGlyLysTyrAlaVal260265270TyrProGlyGlyAsnPheAlaThrHisLeuArgProPheThrGluGly275280285AlaPheArgLeuAspGlyGlyThrLysSerAlaSerAlaValMetPro290295300TyrTyrThrlieSerTyrGlyValAspProSerGlyLysAsnAlaGly305310315320AsnSerTyrAsnGluTyrlielieGlyAspLeuLeuArgGlyGluTyr325330335GlyPheAspGlyValValCysThrA印TrpGlylieThrAlaAspAsn340345350AlaAlaValSerSerPheAspGlyLysCysTrpGlyMetGluGluLeu355360365SerValAlaGluArgHisTyrAlaVallieLysAlaGlyValAspGin370375380PheGlyGlyAsnAsnAspLysGlyProValLeuGluAlaTyrLysMet385390395400TrpValAlaGluPheGlyGluGluSerAlaArgAlaArgPheGluGin405410415SerAlaValArgLeuLeuMetAsnSerPheArgThrGlyLeuPheGlu420425430AsnProTyrThrAspProAlaAlaAlaAlaAlaValValGlyAsnPro435440445GluTyrMetGluAlaGlyPheGinAlaGinArgLysSerlieValMet450455460LeuLysAsnHisGlyGlyValLeuProAsnAspSerAlaArgValTyr465470475480ValProGinArgLeuTyrProGinThrProGlyMetPheGlyLeuSer485490495MetGlyProAlaAlaHisTrpAspTyrProlieAspLysGluLeuVal500505510GlyLysTyrPheGinTrpThrGluAspProGluAlaAlaAspPheAla515520525LeuValMetlieGinGluProPheProGlyAlaGlyTyrAspValAsn530535540AspArgLysArgGlyGlyAsnGlyTyrValProlieSerLeuGinTyr545550555560ArgProTyrLysAlaGluTyrAlaArgProValSerlieAlaGlyGly565570575AspProLysGluThrPheThrAsnArgSerTyrArgGlyLysLysVal580585590ThrThrTyrAsnGluSerAspLeuAspLeuVallieGluThrLysArg595600605ArgMetGlyAspLysProValValValVallieGlyValSerArgPro610615620LeuValLeuAlaGluLeuGluProTyrAlaAspAlalieLeuLeuThr625630635640PheGlyValGinAsnGinAlaValLeuAsplieLeuSerGlyAlaAla645650655GluProSerGlyLeuLeuProMetGinLeuProAlaAspMetArgThr660665670ValGluGluGinAlaGluAspValProArgAspMetArgValTyrVal675680685AspAlaAspGlyHisAlaTyrAspPheAlaTyrGlyLeuGlyTrpAsp690695700權利要求1、一種β-葡萄糖苷酶,是如下(a)或(b)的蛋白質(a)由序列表中序列3所示的氨基酸序列組成的蛋白質;(b)將序列表中序列3的氨基酸序列經過一個或幾個氨基酸殘基的取代和/或缺失和/或添加且具有β-葡萄糖苷酶活性的由(a)衍生的蛋白質。2、根據權利要求1所述的P—葡萄糖苷酶,其特征在于所述一個或幾個氨基酸殘基的取代和/或缺失和/或添加是指在序列3的自氨基末端第98—387位氨基酸殘基和自氨基末端第462—705位氨基酸殘基外進行取代和/或缺失和/或添加。3、根據權利要求1所述的P—葡萄糖苷酶,其特征在于所述(b)的蛋白質的氨基酸序列如序列表中的序列2所示。4、根據權利要求l、2或3所述的e—葡萄糖苷酶的編碼基因。5、根據權利要求4所述的基因,其特征在于所述e—葡萄糖苷酶編碼基因為如下l)或2)或3)的基因1)其核苷酸序列是序列表中序列1的自5端第661-2814位脫氧核糖核苷酸所示的DNA分子;2)其核苷酸序列是序列表中序列1所示的DNA分子;3)在嚴格條件下與l)或2)限定的DNA序列雜交且編碼所述e—葡萄糖苷酶的DNA分子。6、含有權利要求4或5所述基因的重組表達載體、轉基因細胞系或重組菌。7、一種表達權利要求l、2或3所述的P—葡萄糖苷酶的方法,是將含有權利要求l、2或3所述的e—葡萄糖苷酶編碼基因的重組表達載體導入宿主細胞,表達得到P—葡萄糖苷酶。8、根據權利要求7所述的方法,其特征在于所述宿主為大腸桿菌;所述大腸桿菌優選為BL21(DE3)pLysS;所述重組表達載體為在pET30a(+)的《/wl和酶切位點間插入序列表中的序列1的自5'端第661至2811位脫氧核苷酸得到的重組表達載體pET30-咖ce73G。9、權利要求1、2或3所述的P—葡萄糖苷酶或權利要求4或5所述的P—葡萄糖苷酶編碼基因在纖維素降解中的應用。10、權利要求1、2或3所述的P—葡萄糖苷酶或權利要求4或5所述的e—葡萄糖苷酶編碼基因在酒精生產中的應用。全文摘要本發明公開了一種β-葡萄糖苷酶及其編碼基因與應用。該β-葡萄糖苷酶,是如下(a)或(b)的蛋白質(a)由序列表中序列3所示的氨基酸序列組成的蛋白質;(b)將序列表中序列3的氨基酸序列經過一個或幾個氨基酸殘基的取代和/或缺失和/或添加且具有β-葡萄糖苷酶活性的由(a)衍生的蛋白質。在以纖維素為原料生產燃料酒精的同步糖化共發酵工藝中的發酵微生物酵母菌最適發酵條件下,該酶具有較高的酶活,可以應用于該工藝中以生產燃料酒精。文檔編號C12S3/04GK101100659SQ20071012285公開日2008年1月9日申請日期2007年7月6日優先權日2007年7月6日發明者馮家勛,唐紀良,毅封,段承杰,莫新春,鴻郭申請人:廣西大學