專利名稱:來自木糖氧化無色桿菌的丁醇脫氫酶的制作方法
技術領域:
本發明涉及分子生物學和微生物學領域。更具體地講,該領域與用于在微生物 中生產丁醇的丁醇脫氫酶相關。
背景技術:
丁醇是一種重要的工業化學品,其可用作燃料添加劑、塑料工業中的化學原料 以及食品和香料工業中的食品級萃取劑。每年通過石油化學手段生產100至120億磅的 丁醇,并且對該日用化學品的需求可能還會增加。可對微生物進行工程化以表達生物合成途徑用于丁醇生產。共有的和共同未決 的美國專利申請公布US 20070092957A1公開了對重組微生物進行工程化以用于生產異丁 醇(2-甲基-1-丙醇)。共有的和共同未決的美國專利申請公布US20080182308A1公 開了工程化重組微生物用于生產1-丁醇。共有的和共同未決的美國專利申請公布US 20070259410A1和US 20070292927A1公開了對重組微生物進行工程化以用于生產2- 丁 醇。描述了用于異丁醇和2-丁醇生產的多個途徑。在用于全部三個產物的所有所述途徑 中的最終步驟是通過具有丁醇脫氫酶活性的酶將氧化程度較高的部分還原成醇部分。已 知的醇脫氫酶能夠進行這些轉化。期望具有丁醇脫氫酶活性的附加酶在具有工程化丁醇生物合成途徑的重組宿 主微生物中用于生產丁醇。申請人通過以下方法已經解決了該問題在環境細菌分 離蛋白中發現具有丁醇脫氫酶活性的酶、分離該酶、并且從鑒定的木糖氧化無色桿菌 (Achromobacterxylosoxidans)分離蛋白中鑒定編碼的核酸序列。發明概述本文所述的是具有丁醇脫氫酶活性的新酶以及編碼分離的核酸分子。本發明提供分離的核酸分子,所述分離的核酸分子包含編碼至少約250個氨基 酸的多肽的第一核苷酸序列,所述多肽基于Smith-Waterman比對方法在與具有如SEQ ID NO 2所示的序列的多肽進行比較時具有至少約70%的同一性,或者所述分離的核酸分 子包含所述第一核苷酸序列的互補序列的第二核苷酸序列,其中所述酶具有丁醇脫氫酶 活性。在另一方面,本發明提供編碼丁醇脫氫酶的分離的核酸分子,所述分離的核酸 分子選自a)編碼如SEQ IDNO 2所示的氨基酸序列的分離的核酸分子;b)在如下雜交條件下與(a)雜交的分離的核酸分子0.1XSSC、0.1% SDS, 65°C 以及用 2XSSC、0.1% SDS 洗滌,之后用 0.1XSSC、0.1% SDS 洗滌;或與(a)或(b)互補的分離的核酸分子。此外本發明提供由所述核酸分子以及包含可操作地連接至少一種調控元件的核 酸分子的嵌合基因編碼的多肽,以及包含所述核酸分子的轉化的宿主細胞。在一個實施方案中,本發明提供了生產2-丁醇的方法,所述方法包括a)提供包含本發明的分離的核酸分子的重組微生物生產宿主細胞,所述分離的核酸分子編碼具有丁醇脫氫酶活性的多肽,并且提供2- 丁酮來源;b)使(a)的微生物宿主細胞在表達分離的核酸分子并將2-丁酮轉化成2-丁醇的 條件下生長;以及C)任選地回收所述2-丁醇。在另一個實施方案中,本發明提供了生產異丁醇的方法,所述方法包括a)提供包含本發明的分離的核酸分子的重組微生物生產宿主細胞,所述分離的 核酸分子編碼具有丁醇脫氫酶活性的多肽,并且提供異丁醛來源;b)使(a)的微生物宿主細胞在表達分離的核酸分子并將異丁醛轉化成異丁醇的 條件下生長;以及c)任選地回收所述異丁醇。在另一個實施方案中,本發明提供了生產1-丁醇的方法,所述方法包括a)提供包含本發明的分離的核酸分子的重組微生物生產宿主細胞,所述分離的 核酸分子編碼具有丁醇脫氫酶活性的多肽,并且提供丁醛來源;以及b)使(a)的微生物宿主細胞在中表達分離的核酸分子并將丁醛轉化成1- 丁醇的 條件下生長;c)并且任選地回收所述1- 丁醇。序列描述通過下面的發明詳述、附圖
和隨附的序列描述可以更全面地理解本發明,這些 詳細描述、附圖和序列描述形成了本專利申請的一部分。下面的序列遵照37C.F.R.1.821-1.825 ( "Requirements for Patent Applications Containing Nucleotide Sequences and/or Amino Acid Sequence Disclosures-the Sequence Rules"(對含有核酸序列和/或氨基酸序列公開的專利申請的要求-序列規則)),并且符 合 World Intellectual Property Organization (世界知識產權組織,WIPO) ST.25 標準(1"8)以 及 EPO 和 PCT 的序列清單要求(規則 5.2 和 49.5 (a-bis)以及 Administrative Instructions (行 政指令)的第208節和附錄C)。用于核苷酸和氨基酸序列數據的符號和格式遵循在37C. F.R. § 1.822中示出的規則。SEQ ID NO 1是來自木糖氧化無色桿菌的丁醇脫氫酶(sadB)的鑒定編碼區。SEQ ID NO 2是來自木糖氧化無色桿菌的鑒定的丁醇脫氫酶的蛋白序列。SEQ ID NO 3是木糖氧化無色桿菌丁醇脫氫酶的編碼區,其密碼子經優化以在 啤酒糖酵母(Saccharomycescerevisiae)中表達。SEQ ID NO 4和5是用于菌株BUTCON-516S rRNA的PCR擴增的引物。SEQ ID NO 6 是菌株 BUTCON-5 的 16S rDNA 序列。SEQ ID NO 7是木糖氧化無色桿菌丁醇脫氫酶的N_末端肽序列。SEQIDNO 8 是簡并引物 N331。SEQIDNO 9-26是木糖氧化無色桿菌丁醇脫氫酶編碼區的測序引物。SEQID NO 27和28是用于sadB編碼區的PCR擴增的引物,該編碼區具有用于空隙修復克隆的 延伸部分。SEQ ID NO 29 是酵母 GPM 啟動子。SEQ ID NO 30 是酵母 ADHl 終止子。
SEQ ID NO 31 是乳酸乳球菌(Lactococcus lactis) kivD 編碼區。SEQ ID NO 32 和 33 是用于確認 pRS425::GPM_sadB 的測序引物。SEQ ID NO 34和35是用于增加NheI位點的定點誘變引物。發明詳述本文所述的是從細菌的環境分離蛋白中分離得到的新型丁醇脫氫酶,該細菌經 鑒定為木糖氧化無色桿菌。本發明提供了該蛋白的氨基酸序列和具有至少約70%的氨 基酸同一性并具有丁醇脫氫酶活性的蛋白。此外,提供了編碼這些蛋白的分離的核酸分 子,它們可用于嵌合基因以在微生物中表達丁醇脫氫酶。可使用木糖氧化無色桿菌丁醇 脫氫酶和相關序列的酶在重組微生物中從2- 丁酮中生產2- 丁醇、從異丁醛中生產異丁 醇、或者從丁醛中生產1-丁醇,所述重組微生物具有其中一種這些底物的來源。丁醇是一種具有多種應用的重要工業日用化學品,其中其作為燃料或燃料添加 劑的潛力尤為重要。盡管丁醇僅僅是一種四碳醇,但是其具有與汽油相似的能含量,并 且可以與任何化石燃料共混。丁醇是優選的燃料或燃料添加劑,因為它在標準內燃機中 燃燒時僅生成CO2并且幾乎不產生或根本不產生SOx或NOx。另外,丁醇的腐蝕性不及 乙醇,是目前為止最優選的燃料添加劑。丁醇除了可用作生物燃料或燃料添加劑之外,在新興的燃料電池工業中還具有 影響氫分配問題的潛力。如今,由于氫的運輸和分配存在安全隱患,燃料電池飽受困 擾。可以容易地對丁醇重整其氫含量,并且可以通過現有的加油站以燃料電池或汽車中 的內燃機所需的純度進行分配。以下縮寫和定義將用于說明書和權利要求的判讀。如本文所用,術語“包含”、“由...組成”、“包括”、“涵蓋”、“具有”、
“含有”、“包容”或“容納”或其任何其它變型旨在包括非排他的包含物。例如,包 含一系列元素的組合物、混合物、工藝、方法、制品或設備不必僅限于那些元素,而可 以包括其它未明確列出的元素,或此類組合物、混合物、工藝、方法、制品或設備固有 的元素。此外,除非有相反的明確說明,“或”是指包含性的“或”,而不是指排他性 的“或”。例如,以下任何一種情況均滿足條件A或B: A是真的(或存在的)且B是 假的(或不存在的)、A是假的(或不存在的)且B是真的(或存在的)、以及A和B都 是真的(或存在的)。同樣,涉及元素或組分例證(即出現)次數的位于本發明元素或組分前的不定冠 詞“一個”或“一種”旨在是非限制性的。因此,應將“一個”或“一種”理解為包 括一個或至少一個,并且元素或組分的詞語單數形式也包括復數形式,除非有數字明顯 表示單數。如本文所用,術語“發明”或“本發明”是非限制性的術語,并且不旨在指 本方面的任何單個實施方案,而是涵蓋如說明書和權利要求中所述的所有可能的實施方案。如本文所用,修飾本發明使用的成分或反應物的量的術語“約”是指可以通過 例如以下方式而發生的用數字表示的量的變化在真實世界中用于制備濃縮物或使用溶 液的一般測量和液體處理操作;這些操作中非故意的誤差;用于制備組合物或執行方法 的成分的制造、來源或純度中的差異;等等。術語“約”還包括由于對于起因于特定起始混合物的組合物的不同平衡條件而不同的量。無論是否通過術語“約”來修飾,權利 要求包括量的等同量。在一個實施方案中,術語“約”指在報告數值的10%范圍內,優 選地在報告數值的5%范圍內。 如本文所用,術語“丁醇”指1-丁醇、2-丁醇、異丁醇、或它們的混合物。術語術語
的酶途徑。
‘丁醇生物合成途徑”指制備1-丁醇、2-丁醇、或異丁醇的酶途徑。 ‘1-丁醇生物合成途徑”指從乙酰-輔酶A(乙酰-CoA)中制備1-丁醇
‘2- 丁醇生物合成途徑”指從丙酮酸中制備2- 丁醇的酶途徑。
‘異丁醇生物合成途徑”指從丙酮酸中制備異丁醇的酶途徑。
‘兼性厭氧菌”指既能在有氧環境下生長又能在無氧環境下生長的微生術語術語術語物。術語“碳底物”或“可發酵碳底物”指能夠被本發明的宿主生物體代謝的碳 源,并且特別是選自由下列的碳源單糖、低聚糖、多糖和一碳底物或它們的混合物。術語“基因”指能夠被表達為特定蛋白質的核酸片段,其任選包括編碼序列前 的調節序列(5'非編碼序列)和編碼序列后的調節序列(3'非編碼序列)。“天然基因” 是指天然存在的具有其自己的調控序列的基因。“嵌合基因”是指不是天然基因的任何 基因,包含在天然情況下不是一起存在的調控序列和編碼序列。因此,嵌合基因可包括 源于不同來源的調控序列和編碼序列,或者包括源于同一來源但以不同于天然存在的方 式排列的調控序列和編碼序列。“內源性基因”指位于生物基因組內它的天然位置的天 然基因。“外源”或“異源”基因指通常不存在于宿主生物中的基因,它通過基因轉 移導入宿主生物。外來基因可以包含插入到非天然生物體內的天然基因,或嵌合基因。
“轉基因”是已通過轉化方法導入基因組內的基因。如本文所用的,“分離的核酸片段”或“分離的核酸分子”將可互換使用,并 且將指單鏈或雙鏈的,任選含有合成的、非天然的或改變了的核苷酸堿基的RNA或DNA 聚合物。DNA聚合物形式的分離的核酸片段可由cDNA、基因組DNA或合成DNA的一 個或多個片段構成。當在合適的溫度和溶液離子強度條件下單鏈形式的核酸片段可以退火至另一核 酸片段時,核酸片段“可雜交”至另一核酸片段,例如cDNA、基因組DNA或RNA分 子。雜交條件和洗滌條件是眾所周知的,并在Sambrook,J.,Fritsch, E.F.和Maniatis, T.Molecular Cloning A Laboratory Manual,第 2 版,Cold Spring Harbor Laboratory Cold Spring Harbor, NY(1989)中有舉例說明,尤其是其中的第11章和表11.1 (將其全部內容 以引用的方式并入本文)。溫度和離子強度條件確定了雜交的“嚴格性”。可以調節嚴 格性條件以篩選中度相似的片段(例如來自遠緣生物的同源序列),到篩選高度相似的片 段(例如從近緣生物復制功能性酶的基因)。雜交后的洗滌確定嚴格性條件。一組優選 的條件采用一系列如下洗滌開始采用6X SSC、0.5% SDS在室溫下持續洗滌15分鐘, 然后再使用2XSSC、0.5% SDS在45°C下洗滌30分鐘,最后使用0.2X SSC、0.5% SDS 在50°C下重復洗滌30分鐘兩次。更優選的一組嚴格性條件采用更高的溫度,其中洗滌與 上述洗滌相同,不同的是最后兩次在0.2XSSC、0.5% SDS中洗滌30分鐘時的溫度被增 加到60°C。另一組優選的高嚴格性條件是最后兩次洗滌是在65°C下用0.1X SSC、0.1%SDS進行。例如,另一組嚴格性條件包括在0.1X SSC、0.1% SDS中于65°C下雜交,并 用 2XSSC、0.1% SDS 洗滌,隨后用 0.1XSSC、0.1% SDS 洗滌。雜交需要兩種核酸含有互補序列,但是取決于雜交的嚴格性,堿基之間可能會 發生錯配。用于使核酸雜交的合適嚴格性取決于核酸的長度和互補的程度,所述長度 和互補程度是本領域內所熟知的變量。兩條核苷酸序列之間的相似性或同源性程度越 高,具有那些序列的核酸的雜交體的Tm值就越大。核酸雜交的相對穩定性(對應較高 的Tm)按以下順序依次降低RNA:RNA、DNA:RNA、DNA:DNA。對于長度超過100 個核苷酸的雜交體,已經推導出了用于計算Tm的公式(請參見Sambrook等人,同上, 9.50-9.51)。對于較短核酸(即寡核苷酸)的雜交,錯配的位置變得更重要,而且寡核 苷酸的長度決定了其特異性(參見Sambrook等人,同上,11.7-11.8)。在一個實施方案 中,可雜交核酸的長度為至少約10個核苷酸。優選地,可雜交核酸的最小長度為至少約 15個核苷酸;更優選至少約20個核苷酸;并且最優選地,長度為至少約30個核苷酸。 此外,技術人員將認識到,可根據需要根據諸如探針長度之類的因素來調節溫度和洗滌 溶液鹽濃度。術語“互補的”用于描述核苷酸堿基之間能夠彼此雜交的關系。例如,對于 DNA,腺嘌呤與胸腺嘧啶互補,而胞嘧啶與鳥嘌呤互補。如本領域所熟知的,術語“百分比同一性”是兩條或更多條多肽序列之間或兩 條或更多條多核苷酸序列之間的關系,該關系通過對序列進行比較確定。在本領域中,
“同一性”還表示多肽或多核苷酸序列之間序列關聯的程度,根據具體情況,它由這些 序列的序列串之間的匹配程度確定。“同一性”和“相似性”可容易地通過已知方法計 算出來,所述的方法包括但不限于以下文獻中所描述的那些DComputational Molecular Biology (Lesk, A.M.編輯)Oxford University NY (1988) ; 2.) Biocomputing Informatics and Genome Projects (Smith, D.W.編輯)Academic NY (1993) ; 3.) Computer Analysis of Sequence Data, Part I (Griffin, A.M.和 Griffin,H.G.編輯)Humania NJ (1994) ; 4.) Sequence Analysis in Molecular Biology (von Heinje, G.編輯)Academic (1987);禾口 5.) Sequence Analysis Primer (Gribskov, M.禾口 Devereux, J.編輯)Stockton NY (1991)。設定確定同一性的優選方法來用于給出待測試序列之間的最佳匹配。確定同 一性和相似性的方法在可公開獲得的計算機程序中編成了代碼。序列比對和同一性 百分比計算可以用LASERGENE生物信息學計算軟件包(LASERGENE bioinformatics computing suite(DNASTAR Inc., Madison, WI))中的 MegAlign 程序進行。序 列的多重比對采用包括幾種改變形式的算法在內的“Clustal比對方法”進行,包括
"Clustal V比對方法”,該方法相當于稱為Clustal V(在Higgins和Sharp,CABIOS.5 151-153(1989) ; Higgins, D.G.等人,Comput.AppLBiosci., 8 189-191(1992)),并且 可以在LASERGENE生物信息學計算軟件包(DNASTAR Inc.)中的MegAlign 程序中 找到的比對方法。對于多重比對,默認值對應于缺口罰分(GAP PENALTY) = 10和缺 口長度罰分(GAP LENGTH PENALTY) =10。用Clustal方法進行成對比對和蛋白質 序列的百分比同一性計算的默認參數為KTUPLE = 1、缺口罰分=3、窗口(WINDOW) =5和DIAGONALS SAVED = 5。對于核酸,這些參數為KTUPLE = 2,缺口罰分= 5,窗口 = 4和DIAGONALS SAVED = 4。在用Clustal V程序進行序列比對后,有可能通過觀察相同程序中的“序列距離”表來獲得“百分比同一性”。此外,也可以使用 “Clustal W比對方法”,該方法相當于稱為Clustal W(在Higgins和Sharp, CABIOS.5 151-153(1989) ; Higgins, D.G.等人,Comput.Appl.Biosci.8 189-191(1992)中有所描 述)和可以在LASERGENE生物信息學計算軟件包(DNASTAR Inc.)中的MegAlign v6.1程序中找到的比對方法。用于多重比對的默認參數(缺口罰分=10、缺口長度罰分 =O.2、延遲發散序列(DelayDivergenSeqs) (% ) = 30, DNA 轉換權重(DNATransition Weight) =0.5、蛋白質權重矩陣(ProteinWeightMatrix) = Gonnet 系列和 DNA 權重矩陣 (DNAWeight Matrix) = IUB)。在使用Clustal W程序對序列進行比對之后,可通過查看 同一程序中的“序列距離”表來獲得“百分比同一性”。本領域的技術人員非常清楚,多種程度的序列同一性可用于從其他物種中鑒定 多肽,其中這類多肽具有相同或相似的功能或活性。可用的同一性百分比的實例包括但 不限于70%、75%, 80%, 85%, 90%,或95%、或者從70%至100%的任何整數百 分比都可用于描述本發明,例如70%、71%, 72%, 73%, 74%, 75%, 76%, 77%, 78 79 80 81 82 83 84 85 86 87 88 89 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%或 99%。合適的核酸片段編 碼具有以上同一性并且通常編碼具有至少約250個氨基酸,優選至少300個氨基酸,并且 最優選至少約348個氨基酸的多肽。術語“序列分析軟件”指可用于分析核苷酸或氨基酸序列的任何計算機算法 或軟件程序。“序列分析軟件”可商購獲得或獨立開發。典型的序列分析軟件包括但 不限于1.)GCG 程序包(Wisconsin Package 9.0 版,Genetics Computer Group(GCG), Madison, WI) ; 2.)BLASTP、BLASTN、BLASTX (Altschul 等人,J.Biol., 215 403-410(1990)) ; 3.) DNASTAR (DNASTAR 有限公司,Madison,WI) ; 4.) Sequencher (Gene Codes Corporation, Ann Arbor, MI);禾口 5.)整合了 Smith-Waterman 算 法的 FASTA 程序(W.R.Pearson, Comput.Methods Genome Res.,[Proc.Int.Symp.] (1994), 公開時間1992,111-20.編輯Suhai,Sandor.Plenum New York, NY)。在本專利申 請的上下文中應當理解,使用序列分析軟件進行分析時,除非另外指明,否則分析結果 將基于所參考程序的“默認值”。在此所用的“默認值”將指在首次初始化軟件時軟件 最初加載的任何值或參數集。氨基酸或核苷酸序列的“基本部分”指這樣的部分,該部分包括的多肽的氨 基酸序列或基因的核苷酸序列足以推定鑒定所述多肽或基因,所述鑒定或者可以由本領 域技術人員通過人工評價序列來完成,或者可以利用諸如BLAST (Altschul,S.F.等人, J.Mol.Bio., 215 403-410(1993))之類的算法通過計算機自動化序列比較和鑒定來完 成。一般來講,為了推測鑒定多肽或核酸序列是否與已知的蛋白質或基因同源,需要有 10個或更多鄰接氨基酸或者30個或更多核苷酸的序列。此外,對于核苷酸序列,包含 20-30個鄰接核苷酸的基因特異性寡核苷酸探針可用于序列依賴性的基因鑒定(如DNA 雜交)和基因分離(如細菌菌落或噬斑的原位雜交)的方法中。此外,12-15個堿基的短 寡核苷酸可在PCR中用作擴增引物,以便獲得包含該引物的特定核酸片段。因此,核苷 酸序列的“基本部分”所包含的序列應足以特異性地鑒定和/或分離包含該序列的核酸 片段。本說明書教導了編碼特定醇脫氫酶蛋白的完整的氨基酸和核苷酸序列。利用本文所公開的序列,技術人員現在可以利用本發明所公開序列的全部或基本部分,以用于本 領域技術人員已知的目的。因此,本發明包括如隨附的序列表中所示的完整序列,以及 如上文定義的這些序列的基本部分。本發明涵蓋的不僅僅是具體的示例性序列,因為本領域熟知的是不影響編碼 蛋白的功能特性的氨基酸序列或編碼區中的改變(其中一個化學上等同的氨基酸在給定 位點上被取代)是常見的。為了本發明的目的,取代定義為在下述5組之一內的交換1.小的脂族非極性殘基或微極性的殘基Ala、Ser、Thr(Pro> Gly);2.極性的、帶負電荷的殘基和它們的酰胺Asp、Asn, Glu、Gln ;3.極性的、帶正電荷的殘基His、Arg、Lys ;4.大的脂族非極性殘基Met、Leu、lie、Val(Cys);以及5.大的芳族殘基Phe、Tyr、Trp。因此,關于氨基酸丙氨酸-一種疏水性氨基酸的密碼子可以被編碼另一個疏水 性更弱的殘基(例如甘氨酸)或疏水性更強的殘基(例如纈氨酸、亮氨酸或異亮氨酸)取 代。類似地,導致用一個帶負電荷的殘基替換另一個帶負電荷的殘基(例如天冬氨酸替 代谷氨酸)或者一個帶正電荷的殘基替換另一個帶正電荷的殘基(例如賴氨酸替換精氨 酸)的改變也可以預期產生功能上等價的產物。在許多情況下,導致蛋白質分子的N-末 端和C-末端部分改變的核苷酸變化也預期不改變蛋白質的活性。因此本發明涵蓋具有所 述密碼子變異的編碼區和具有所述氨基酸變異的蛋白。如本文所用,術語“編碼序列”或“CDS”是指編碼特定氨基酸序列的DNA 序列。“合適的調控序列”指位于編碼序列的上游(5'非編碼序列)、中間或下游(3' 非編碼序列)的核苷酸序列,其可影響轉錄、RNA加工或穩定性,或者相關編碼序列的 翻譯。調節序列可包括啟動子、翻譯前導序列、內含子、多腺苷酸化識別序列、RNA加 工位點、效應子結合位點和莖環結構。術語“啟動子”指能夠控制編碼序列或功能性RNA表達的DNA序列。一般來 講,編碼序列位于啟動子序列的3'端。啟動子可整個源于天然基因,或者由源于不同的 天然存在的啟動子的不同元件組成,或者甚至包含合成的DNA片段。本領域內的技術人 員應當理解,不同的啟動子可以在不同的組織或細胞類型中,或者在不同的發育階段, 或者響應不同的環境條件或生理條件而引導基因的表達。導致基因在大部分時間內在大 多數細胞類型中表達的啟動子通常稱為“組成型啟動子”。還應當進一步認識到,由于 在大多數情況下調節序列的確切邊界尚未完全確定,因此不同長度的DNA片段可能具有 相同的啟動子活性。術語“可操作地連接”指單個核酸片段上的核酸序列的關聯,使得其中一個核 酸序列的功能受到另一個核酸序列的影響。例如,當啟動子能夠影響編碼序列的表達 (即,該編碼序列受到該啟動子的轉錄控制)時,則該啟動子與該編碼序列可操作地連 接。編碼序列可以以有義或反義的取向可操作地連接至調節序列。如本文所用,術語“表達”指源于本發明核酸片段的有義RNA(mRNA)或反義 RNA的轉錄和穩定積聚。表達也可指將mRNA翻譯成多肽。如本文所用,術語“轉化”指將核酸片段轉移至宿主生物體內,導致在基因上 穩定遺傳。含有轉化核酸片段的宿主生物被稱為“轉基因”或“重組”或“轉化”生物體。術語“質粒”和“載體”指通常攜帶有不屬于細胞中心代謝的部分的基因的染 色體外元件,并且常常是環狀雙鏈DNA片段的形式。這類元件可為源自任何來源的自主 復制序列、基因組整合序列、噬菌體或單鏈或雙鏈DNA或RNA的核苷酸序列(線性或 環狀),其中多個核苷酸序列已連接或重組進入一種獨特構建體中,該獨特構建體能夠將 所選基因產物的啟動子片段和DNA序列與相應的3'末端非翻譯序列一起引入細胞中。
“轉化載體”指含有外來基因并且除了該外來基因外還含有有利于轉化特定宿主細胞轉 化的元件的特定載體。如本文所用,術語“密碼子簡并性”指允許核苷酸序列在不影響所編碼的多肽 的氨基酸序列的情況下發生變化的遺傳密碼的性質。技術人員非常了解具體宿主細胞在 使用核苷酸密碼子確定給定氨基酸時所表現出的“密碼子偏好性”。因此,當合成基因 用以改善在宿主細胞中的表達時,希望對基因進行設計,使得其密碼子使用頻率接近該 宿主細胞優選的密碼子使用頻率。術語“經密碼子優化的”在其涉及用于轉化不同宿主的核酸分子的基因或編碼 區時是指在不改變由DNA編碼的多肽的情況下,改變核酸分子的基因或編碼區中的密碼 子以反映宿主生物體通常的密碼子使用。本文使用的標準重組DNA和分子克隆技術是本領域熟知的并且已經在如下文 獻中有所描述Sambrook, J., Fritsch, E.F.禾口 Maniatis, T.的 Molecular Cloning A Laboratory Manual,第二版,Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY(1989)(下文稱為 “Maniatis,,);以及 Silhavy,T.J., Bennan, Μ.L.和 Enquist, L.W.,Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1984);以及 Ausubel,F.M.等人,Current Protocols in Molecular Biology, Greene Publishing Assoc.and Wiley-Interscience (1987)。該處使用的附加方法是在 Methods in Enzymology,第 194 卷,Guide to Yeast Genetics and Molecular and Cell Biology (Part A, 2004, Christine Guthrie 禾口 Gerald R.Fink (編輯),Elsevier Academic Press,San Diego, CA)中的方法。通過在包含1-丁醇的培養基上的連續培養富集環境污泥樣本,申請人能分離能 夠利用1-丁醇作唯一碳源的微生物。一種分離蛋白通過其16SrRNA序列鑒定為屬于菌 種木糖氧化無色桿菌。申請人發現該分離蛋白有丁醇脫氫酶活性,它可相互轉化丁醛和 1-丁醇。申請人也發現該丁醇脫氫酶活性也催化異丁醛和異丁醇、以及2-丁酮和2-丁醇 的相互轉化。令人驚訝地是,該酶對替代底物的動力學常數與對用于富集培養基的1-丁 醇底物的動力學常數相當或比其更高。這些結果指示可使用該木糖氧化無色桿菌丁醇脫 氫酶在分別具有丁醛、異丁醛或2-丁酮底物來源的重組微生物宿主細胞中生產1-丁醇、 異丁醇、或2-丁醇。丁醇脫氫酶蛋白和編碼序列在木糖氧化無色桿菌中鑒定的核苷酸序列編碼具有丁醇脫氫酶活性(稱為sadB) 的酶,該序列如SEQ ID NO: 1所示。全長蛋白的氨基酸序列如SEQIDNO : 2所示。 該氨基酸序列與公開數據庫中的序列的比較結果揭示該蛋白具有與已知醇脫氫酶的令人驚訝的低相似性。使用具有計分矩陣BLOSUM62的BLAST,期望臨界值(cutoff)為 10并且定序列長度(word size)為3,測得最相似的已知序列與SEQ ID NO 2在其長度 為348個氨基酸的部分上具有67%的同一性。使用的空位開放罰分為11,空位延伸為 1。發現與腦膜炎奈瑟氏球菌(Neisseria meningitidis) MC58(Accession#AAF41759.1)含鋅 醇脫氫酶的最高相似度為67%的氨基酸同一性,與無乳支原體(Mycoplasma agalactiae) (Accession#A5IY63)含鋅醇脫氫酶的最高相似度為67%的氨基酸同一性。其氨基酸序列 與木糖氧化無色桿菌丁醇脫氫酶的序列(SEQ ID NO: 2)具有大于67%的同一性的蛋白 是本發明的蛋白,它在本文中被鑒定并分離。本發明蛋白的氨基酸序列與SEQ ID NO: 2具有至少約70%-75%,約75%-80%,約80%-85%,或者約85%-90%的同一性, 其中更優選約90% -95%的同一性。最優選的氨基酸序列與SEQ ID NO 2具有至少約 95%的同一性。使用BLAST默認參數與公開序列進行比較時,編碼木糖氧化無色桿菌丁醇 脫氫酶的核酸序列(SEQ ID NO: 1)與編碼腦膜炎奈瑟氏球菌MC58含鋅醇脫氫酶 (Accession#NC003112)的序列具有最高的同一性(約65% )。本發明的核酸分子是那些 能夠編碼至少約250個氨基酸并且具有丁醇脫氫酶活性的多肽,它具有與SEQ ID NO 2至少約70%的同一性。核酸分子可編碼至少約300個氨基酸或者約348個氨基酸的多 肽。核酸分子可編碼與SEQ IDNO 2具有至少約75%-80%、80%-85%、85%-90%、 90% -95%,或95%-100%的同一性的多肽。本發明的附加核酸分子可通過與編碼丁醇脫氫酶的SEQ ID NO 2的核酸分子 在以下條件下雜交進行鑒定0.1XSSC,0.1% SDS, 65°C并且用2X SSC,0.1% SDS洗 滌,隨后用0.1XSSC,0.1%SDS洗滌。在本發明的方面中附加地包括與任何上述核酸分 子互補的核酸分子。最合適的是編碼SEQ ID NO: 2的多肽的核酸分子,其實例是SEQ IDNO 1和3。由于遺傳密碼的簡并性,多個核酸序列可編碼SEQ IDNO 2的多肽, 這是本領域的技術人員熟知的。例如編碼序列可經密碼子優化用于在特定宿主中的最大 化表達,如序列經密碼子經優化以在啤酒糖酵母中表達,即SEQ ID NO: 3。同源物的分離編碼木糖氧化無色桿菌丁醇脫氫酶的核酸分子,例如SEQ ID NO: 1可用于分離 編碼同源蛋白的核酸分子,所述核酸分子與來自相同或其他微生物菌種的這種核酸片段 具有至少 70%-75%、75% -80%, 80% -85%, 85% -90%, 90% -95%,或 95%_100% 的序列同一性。可如下評估編碼的同源蛋白的丁醇脫氫酶活性。使用序列依賴性規程分 離同源物是本領域熟知的。序列依賴型規程的實例包括但不限于核酸雜交方法、DNA和 RNA擴增方法例如核酸擴增技術的多種應用(例如聚合酶鏈反應(PCR),Mullis等人, 美國專利公開 4,683,202 ;連接酶鏈反應(LCR),Tabor, S.等人,Proc.Natl.Acad.Sci.USA 82,1074,(1985 ;或鏈置換擴增反應(SDA),Walker 等人,Proc.Natl.Acad.Sci.U.S.A., 89 392, (1992))。例如,本發明的核酸片段可通過使用所有或部分SEQ ID NO: 1的核酸片段作 為DNA雜交探針,使用本領域的技術人員熟知的方法來篩選來自任何所需細菌的文庫而 得以直接分離。基于SEQ ID NO: 1的特異性,寡核苷酸探針可通過本領域已知的方法 (Maniatis,同上)設計和合成。此外序列可直接用于通過熟練技術人員已知的方法,例如隨機引物DNA標記、切口平移或末端標記技術,來合成DNA探針,或使用可獲得的 體外轉錄體系來合成RNA探針。此外,能設計特異性引物并用于擴增SEQ ID NO: 1 同源物的部分或全長。所得的擴增產物可在擴增反應過程中直接標記或在擴增反應后標 記,并用作探針以在合適的嚴格條件下分離全長的DNA片段。通常在PCR類型的擴增技術中,引物具有不同的序列而且彼此之間不互補。 取決于期望的檢測條件,應當設計引物序列以提供既有效又可靠的靶核酸的復制。 PCR引物設計方法是常見的,并且是本領域熟知的。(Thein和Wallace,"The use of oligonucleotide as specific hybridization probes in the Diagnosis of Genetic Disorders”, Human Genetic Diseases APractical Approach, K.E.Davis 編輯(1986)第 33-50 頁,IRL Press, Herndon, Virginia) ; Rychlik,W. (1993),White, B.A.(編輯),Methodsin Molecular Biology,第 15 卷第 31-39 頁,PCR Protocols Current Methods and Applications. HumaniaPress, Inc., Totowa, NJ。)通常可使用本發明核酸序列的兩個短片段設計引物用于聚合酶鏈反應規程以擴 增較長的核酸片段,該核酸片段編碼來自DNA或RNA的同源編碼區。可使用包含與SEQ IDNO 1同源的核酸序列的任何DNA作模板進行PCR,包括例如用基因組DNA、cDNA 或質粒DNA作模板。當使用克隆cDNA的文庫時,一個引物的序列來源于SEQ ID NO: 1,并且其他引物的序列利用在編碼微生物基因的mRNA前體的3'末端存在的多腺苷酸 片。作為另一種選擇,第二個引物序列可以基于來源于克隆載體的序列。例如技術人員 可按照 RACE 規程,使用 mRNA 作模板(Frohman 等人,Proc.Natl.Acad.Sci.USA,85: 8998(1988)),通過用PCR擴增在轉錄物內單個位點與3 ‘或5'端之間的區域的拷貝來 產生cDNA。以3'和5'方向取向的引物可用本發明的核酸序列設計。使用可商購獲 得的 3' RACE 或 5' RACE 體系(Life Technologies,Rockville, MD),可以分離特異性 的 3'或 5' cDNA 片段(Ohara 等人,Proc.Natl.Acad.Sci.USA 86 5673(1989) ; Loh 等 人,Science 243 217(1989))。作為另外一種選擇,可使用SEQ ID NO: 1的核酸分子或其互補序列作為雜交試 劑用于同源物的鑒定。核酸雜交試驗的基本組成包括探針、懷疑含有目的基因或基因片 段的樣本及特定的雜交方法。本發明的探針通常是與待檢測的核酸序列互補的單鏈核酸 序列。探針與待檢測的核酸序列是“可雜交的”。探針長度可從5個堿基至數萬個堿基 不等,這將取決于具體待完成的測試。通常約15個堿基至約30個堿基的探針長度是合 適的。只需要探針分子的部分與待檢測的核酸序列互補。另外,探針和靶序列之間不需 要完全互補。雜交確實可以在并不完全互補的分子之間發生,結果是雜交區內的一定比 率的堿基未與適當的互補堿基配對。雜交方法是有嚴格規定的。通常探針和樣本必須在允許核酸雜交的條件下混 合。這涉及在適當濃度和溫度條件下在存在無機或有機鹽時使探針和樣品接觸。探針和 樣品核酸必須接觸足夠長的時間,使探針和樣品核酸之間的任何可能的雜交均可發生。 混合物中的探針或標記的濃度將決定雜交發生所需的時間。探針或靶標的濃度越高,所 需的雜交孵育時間就越短。任選地,可以加入離液劑。離液劑通過抑制核酸酶活性來 穩定核酸。此外,離液劑允許短寡核苷酸探針在室溫下的敏感和嚴格雜交(Van Ness和 Chen, NucLAcids Res. 19 5143-5151(1991))。合適的離液劑包括氯化胍、硫氰酸胍、硫氰酸鈉、四氯乙酸鋰、高氯酸鈉、四氯乙酸銣、碘化鉀和三氟乙酸銫等。通常,離液 劑的終濃度將為約3M。如果需要,可以將甲酰胺加入到雜交混合物中,通常為30-50% (ν/ν)ο可以采用多種雜交溶液。通常,這些雜交溶液包含約20%至60%體積,優 選30%體積的極性有機溶劑。通常的雜交溶液采用約30-50% ν/ν甲酰胺、約0.15 至IM氯化鈉、約0.05至0.1Μ緩沖液(如檸檬酸鈉、Tris-HCl、PIPES或HEPES (pH 范圍約6-9))、約0.05至0.2 %的去污劑(如十二烷基硫酸鈉)或0.5-20mM的 EDTA、FICOLL (Pharmacia Inc.)(約 300-500 千道爾頓(kD))、聚乙烯吡咯烷酮(約 250-500kD)、和血清白蛋白。一般的雜交溶液還將包含約0.1至5mg/mL未經標記的載 體核酸、片段化的核酸DNA(如小牛胸腺或鮭精DNA或酵母RNA),以及任選約0.5%至 2%重量/體積的甘氨酸。還可以包含其他添加劑,例如包括多種極性水溶性或可膨脹試 劑如聚乙二醇、陰離子聚合物如聚丙烯酸酯或聚甲基丙烯酸酯和陰離子糖類聚合物如硫 酸葡聚糖在內的體積排阻劑。核酸雜交可適用于多種測定形式。最合適的形式之一是夾心測定形式。夾心測 定尤其適用于在非變性條件下雜交。夾心型測定的主要成分是固體支持體。固體支持 體具有吸附或共價連接至其上的固定核酸探針,該探針未經標記并且與序列的一部分互 補。此外,因為微生物基因組序列迅速變成公開可獲得的,可單獨使用生物信息學 方法鑒定同源物,這是本領域技術人員熟知的。丁醇脫氫酶活性本發明的蛋白與SEQ ID NO: 2具有至少約70%或更高的氨基酸同一性,并且 具有丁醇脫氫酶活性。本發明的核酸分子編碼與SEQIDNO 2具有至少約70%或更高 的氨基酸同一性并具有丁醇脫氫酶活性的蛋白。本領域的技術人員能夠容易地評估蛋白 中的丁醇脫氫酶活性。如下所述在微生物細胞中表達蛋白,并且測定細胞提取物、粗制 酶制劑、或者純化酶制劑中的丁醇脫氫酶活性。例如如本文實施例1所述測定純化酶和 粗制酶制劑。1-丁醇脫氫酶活性的檢測分析法用分光光度計在340nm監控NADH氧化成 NAD+的情況,該檢測法在35°C下,使用在包含50mM 丁醛和0.2mMNADH的50mM磷 酸鉀緩沖液中(PH6.2)的合適量的酶。具有醇底物的替代檢測分析法在35°C下,在pH8.5 的包含3mM NAD+和不同濃度醇的TRIS緩沖液中進行,或者具有酮或醛底物的檢測分析 法在35°C下,在pH6.0的包含200 μ m NADH和不同濃度的酮或醛的50mM MES緩沖液 中進行。通過這些或其他可容易地執行的檢測分析法,將丁醇脫氫酶功能與由分離的核 酸分子編碼的鑒定蛋白的結構相關聯,兩種均具有經鑒定的序列。重組表達本發明的核酸片段可在微生物宿主細胞中表達,如在細菌、藍細菌、絲狀真菌 和酵母中表達,導致表達編碼的丁醇脫氫酶。宿主菌株的實例包括但不限于梭菌屬、 發酵單胞菌屬、埃希氏菌屬、沙門氏菌屬、紅球菌屬、假單胞菌屬、芽孢桿菌屬、乳酸 桿菌屬、腸球菌屬、片球菌屬、產堿桿菌屬、克雷白氏桿菌屬、類芽胞桿菌屬、節桿菌 屬、棒狀桿菌屬、短桿菌屬、假絲酵母屬、漢遜酵母屬、克魯維酵母屬和糖酵母屬。含有引導外來蛋白質高水平表達的調控序列的微生物表達系統和表達載體是本領域技術人員熟知的。可使用任何這些系統和載體來構建嵌合基因,用于生產本發明的 核酸分子編碼的蛋白。然后可以將這些嵌合基因通過轉化導入合適的微生物中以提供酶 的高水平表達。可用于轉化多種宿主細胞的載體是常見的并且可以從一些公司商購獲得,例如 EPICENTRE (Madison, WI)、Invitrogen Corp. (Carlsbad, CA)、Stratagene (LaJolla, CA)和New England Biolabs,Inc. (Beverly, MA)。使用大腸桿菌_酵母穿梭載體克隆嵌
合基因用于酵母表達。通常載體含有選擇標記和允許在期望宿主中自主復制或染色體整 合的序列。此外,合適的載體可包含啟動子區域,該區域包含轉錄啟動控制和轉錄終止 控制區,在它們之間可插入編碼區DNA片段以提供插入編碼區的表達。這兩種控制區均 可來源于與轉化的宿主細胞同源的基因,但是應當理解,這種控制區也可能來源于對被 選擇作生產宿主的特定物種來說是非天然的基因。可用于驅動本發明丁醇脫氫酶編碼區在所需宿主細胞中表達的起始控制區或啟 動子有很多,并且是本領域技術人員熟悉的。合適的啟動子包括但不限于來源于以下基 因的啟動子CYC1、HIS3、GALU GAL10、ADHU PGK、PH05、GAPDH> ADCU TRPU URA3、LEU2、ENO> TPK CUPU FBA、GPD> 和 GPM (用于在糖酵母屬中表 達);AOXl (可用于在畢赤酵母菌屬中的表達);以及lac、ara、tet、trp、IPL> 1PR、 T7、tac、和trc啟動子(用于在大腸桿菌、產堿桿菌、和假單胞菌中表達);amy、apr、 和npr啟動子、以及用于在枯草芽孢桿菌、地衣芽孢桿菌、和浸麻類芽孢桿菌中表達的多 種噬菌體啟動子;nisA(用于在革蘭氏陽性細菌中表達,Eichenbaum等人,Appl.Environ. Microbiol.64(8) 2763-2769(1998));和合成Pll啟動子(用于在植物乳桿菌中表達 (Rud等人,Microbiology 152 1011-1019(2006))。終止控制區也可以源于對優選宿主 天然的多種基因。任選地,終止位點可為非必需的;然而,如果包括則是最優選的。某些載體能夠在廣泛的宿主細菌中復制并可通過接合進行轉移。pRK404和三 個相關載體pRK437、pRK442、和pRK442(H)的完全注解序列是可用的。這些衍生 物已被證明是在革蘭氏陰性菌中進行遺傳操縱的有用工具(Scott等人,Plasmid 50(1) 74-79(2003))。也可獲得廣宿主范圍的Inc P4質粒RSF1010的幾種衍生質粒,其具有在 一系列革蘭氏陰性菌中發揮功能的啟動子。質粒pAYC36和pAYC37具有連同多個克隆 位點一起的活性啟動子,使得在革蘭氏陰性菌中的異源基因能夠表達。適于革蘭氏陽性細菌的載體的一些實例包括ρΑΜ β 1及其衍生物 (Renault 等人,Gene 183 175-182 (1996);和 O,Sullivan 等人,Genel37 227-231 (1993)) ; pMBBl 和 pHW800, pMBBl 的衍生物(Wyckoff 等人,Appl. Environ.Microbiol.62 1481-1486(1996)) ; pMGl,接合質粒(Tanimoto 等人, J.Bacteriol.184 5800-5804(2002)) ; pNZ9520 (Kleerebezem 等人,Appl.Environ. Microbiol.63 4581-4584(1997)) ; pAM401 (Fujimoto 等人,Appl.Environ.Microbiol.67: 1262-1267 (2001));禾Π pAT392 (Arthur 等人,Antimicrob.AgentsChemother.38 1899-1903 (1994))。也已經報道了幾種來源于植物乳桿菌的質粒(van Kranenburg等人, Appl.Environ.Microbiol.71 (3) 1223-1230(2005))。用于酵母中基因表達的方法是本領域已知的(參見例如Enzymology,Volume 194, Guide to Yeast Genetics and Molecular and Cell Biology, PartA, 2004, ChristineGuthrie 禾口 Gerald R.Fink(編輯),ElsevierAcademic Press, San Diego, CA 中的方法)。
酵母中通常使用的質粒是穿梭載體pRS423、pRS424、pRS425、和pRS426 (美國典型培 養物保藏中心,Rockville,MD),它們包含大腸桿菌復制起點(例如pMBl)、酵母2 μ 復制起點、和營養選擇標記。這四個載體的選擇標記是His3(載體pRS423)、Trpl (載體 pRS424)、Leu2 (載體pRS425)和Ura3 (載體pRS426)。用編碼本發明丁醇脫氫酶的嵌 合基因構建表達載體可通過在大腸桿菌中的標準分子克隆技術或通過在酵母中的空隙修 復重組方法進行。這些載體可以在大腸桿菌和酵母菌株中繁殖。本發明的嵌合基因可從穩定復制的質粒中表達,或者可被整合進宿主基因組 中。用于DNA整合的質粒可包括轉座子、與在宿主基因組中的整合靶位點同源的核酸序 列區域、或者參與整合的其他序列。可使用例如可從EPICENTRE 商購獲得的體系轉 座制備其他類型的載體。如何選擇適用于期望靶宿主和期望功能的合適載體是熟知的。 此外,可將編碼本發明的丁醇脫氫酶的核酸分子以可操作地連接的方式鄰近整合進宿主 基因組中的內源啟動子。丁醇微牛物牛產宿主表達本發明的分離的核酸分子提供靶向轉化的重組微生物宿主細胞,它具有丁 醇脫氫酶活性,以此在存在丁醛、異丁醛、或2-丁酮的情況下制備丁醇。這些底物中 的每一種可在宿主細胞中被天然制備,或者作為宿主細胞中的工程化生物合成途徑的 產物而被制備。可在微生物中進行工程化以生產異丁醇、2-丁醇、或1-丁醇的生物 合成途徑在美國專利申請公布20070092957A1、20070259410AU 20070292927AU和 US20080182308A1中進行了描述,它們全文以引用方式并入本文。當忽略每個所述途徑 中的最終步驟時,產物是丁醛、異丁醛、或2-丁酮。因此經工程化具有其中一個這些缺 失最終步驟的所述途徑的重組微生物宿主細胞有丁醛、異丁醛、或2-丁酮來源。本發明 的分離的核酸分子在細胞中的附加表達導致存在丁醇脫氫酶活性,該酶活性將丁醛轉化 成1- 丁醇、將異丁醛轉化成異丁醇、或者將2- 丁酮轉化成2- 丁醇。生長以生產丁醇包含本發明的分離的核酸分子并具有丁醛、異丁醛、或2-丁酮的重組微生物生 產宿主在包含合適碳底物的發酵培養基中生長。合適的底物可包括但不限于單糖, 例如葡萄糖和果糖;低聚糖,例如乳糖或蔗糖;多糖,例如淀粉、纖維素或它們的混合 物;以及來自可再生原料的未純化混合物,例如干酪乳清滲透物、玉米漿、甜菜糖蜜及 大麥麥芽。另外,碳底物也可以為已證明可以被代謝轉化為關鍵生化中間產物的諸如二 氧化碳之類的一碳底物或甲醇。甲基營養生物體也已知可以利用多種其他含碳化合物, 例如甲胺、葡糖胺及用于代謝活動的多種氨基酸。例如,甲基營養酵母已知可利用來自 甲胺的碳來形成海藻糖或甘油(Bellion等人,Microb.Growth ClCompd.,[Int.Symp.], 第 7 界(1993),415-32,編輯Murrell,J.Collin; Kelly, Don P.出版社Intercept, Andover, UK)。類似地,假絲酵母屬的多種物種將會代謝丙氨酸或油酸(Suiter等人, Arch.Microbiol.153 485-489(1990))。因此,預期本發明中所利用的碳源可涵蓋各種含 碳底物并且將僅受限于生物體的選擇。盡管預期所有上述碳底物及它們的混合物都適用于本發明,但優選的碳底物為 葡萄糖、果糖和蔗糖。蔗糖可來源于可再生的糖源如甘蔗、糖用甜菜、木薯、甜高粱、以及它們的混合物。葡萄糖和右旋糖可來源于可再生的谷物來源,經由糖化淀粉基的原 料包括谷物如玉米、小麥、裸麥、大麥、燕麥、以及它們的混合物。此外,可發酵糖可 通過預處理和糖化過程來源于可再生的纖維質或木質纖維質生物質,這在例如共有的和 共同未決的美國專利申請公布2007/0031918A1中進行了描述,該專利以引用方式并入本 文。生物質指任何纖維質或木質纖維質材料,包括包含纖維素的材料,并且任選地還包 含半纖維素、木質素、淀粉、低聚糖和/或單糖的材料。生物質也可包括附加組分如蛋 白質和/或脂質。生物質可來源于單一來源,或者生物質可包括來源于一種以上來源的 混合物;例如,生物質可包括玉米芯和玉米秸稈的混合物,或草和葉片的混合物。生物 質包括但不限于生物能作物、農業殘余物、市政固體垃圾、工業固體垃圾、來自造紙業 的淤渣、庭院垃圾、木材和林業垃圾。生物質的實例包括但不限于玉米粒、玉米芯、 作物殘余如玉米殼、玉米秸稈、草、小麥、小麥秸稈、大麥、大麥秸稈、干草、稻稈、 柳枝稷、廢紙、蔗渣、高粱、大豆、獲取自谷物、樹、枝、根、葉、木屑、鋸末、灌木 及矮樹叢、蔬菜、水果、花、動物糞肥、以及它們的混合物的研磨物的組分。除了合適的碳源外,發酵培養基還必須含有本領域技術人員已知的適于培養物 生長并促進生產2-丁酮所必需的酶途徑的礦物質、鹽、輔因子、緩沖劑及其他組分。培養條件通常,使細胞在約20°C至約40°C的溫度范圍下在合適的培養基中生長。本發明 中的合適培養基是普通的商業制備的培養基,例如Luria Bertani(LB)肉湯、沙氏葡萄糖 肉湯(SD)肉湯、酵母培養基(YM)肉湯、或者包括酵母氮基、硫酸銨、和右旋糖(作為 碳源/能源)的肉湯或YPD培養基,它是蛋白胨、酵母提取物、和右旋糖的最佳比例共 混物,用于培養啤酒糖酵母菌株。也可以使用其他確定的或合成的生長培養基,微生物 學或發酵科學領域的技術人員將知道用于具體微生物生長的合適培養基。已知可以直接 或間接調節分解代謝物阻遏的試劑,如環腺苷酸2',3'-單磷酸,也可以摻入發酵培 養基中。適于酵母發酵的pH范圍介于pH 5.0至pH 9.0之間,其中優選將pH6.0至pH 8.0
作為初始生長條件的范圍。適于其他微生物發酵的pH范圍介于pH 3.0至pH 7.5之間, 其中優選將pH 4.5.0至pH 6.5作為初始生長條件的范圍。發酵可以在有氧或厭氧條件下進行,厭氧或微氧條件是優選的。工業分批發酵和連續發酵發酵可為分批發酵方法。經典的分批發酵是封閉系統,其中培養基的組成在發 酵開始時設定并且在發酵過程中不進行人工改變。因此在發酵開始時,用所需生物體對 培養基進行接種,在不向系統添加任何物質的情況下進行發酵。然而,通常來說,“分 批”發酵是指碳源的添加是成批的,但經常試圖控制諸如pH和氧濃度之類的因素。在 分批發酵系統中,代謝產物和生物質組成持續改變直至發酵結束時。在分批培養物內, 細胞緩慢通過靜態延滯期到達高速生長對數期,并最后達到穩定期,此時生長速率減緩 或終止。如果不加以處理,穩定期中的細胞將最終死亡。通常,對數期中的細胞負責產 生大部分終產物或中間產物。標準分批式系統的一種變型是補料分批系統。_補料分批發酵工藝也適用于本 發明,并且包括典型的分批式系統,不同的是隨著發酵進程遞增地添加底物。在代謝產物往往抑制細胞的代謝作用,以及其中期望培養基中具有有限量的底物時,補料-分批 式系統是有用的。補料分批式系統中的實際底物濃度難于測量并因而可根據一些可測量 因素(例如pH、溶解的氧以及廢氣例如CO2的分壓)進行評估。分批發酵和補料-分 批發酵在本領域內是常用的且眾所周知,并且實例可見于如下文獻Thomas D.Brock, Biotechnology A Textbook of Industrial Microbiology,第二版,Sinauer Associates, Inc., Sunderland, MA(1989)或 Deshpande,Mukund V., Appl.Biochem.Biotechnol.36 227, (1992),該文獻以引用方式并入本文。發酵培養物可適應連續發酵方法。連續發酵是一種開放式系統,其中將設定好 的發酵培養基連續加入生物反應器中,并同時移出等量條件培養基用于加工。連續發酵 一般保持恒定高密度的培養物。連續發酵允許調節一種因素或任意數目的因素,這些因素影響細胞生長或終產 物濃度。例如,一種方法將以固定的速率維持限制性營養物質例如碳源或氮水平并且允 許所有其他參數適度。在其他系統中,影響生長的許多因素可以連續改變,而通過培養 基濁度測量的細胞濃度保持不變。連續系統力求維持穩態的生長條件,并因而在發酵過 程中由于培養基被取出而導致的細胞損失必須與細胞的生長率保持平衡。用于調節連續 發酵工藝中的營養物質和生長因子的方法以及使產物形成速率保持最高水平的方法是工 業微生物領域眾所周知的,并且多種方法已由Brack(同上)詳細描述。預期分批、補料-分批、連續方法、或任何已知模式的發酵適于所述的重組微 生物宿主細胞的生長。另外,預期可以將細胞固定在底物上而作為完整的細胞催化劑并 讓其經受發酵條件以生產2- 丁醇。可使用發酵領域已知的方法如ABE從發酵培養基中分離生物生產的丁醇(參 見例如 Durre,Appl.Microbiol.Biotechnol.49 639-648(1998),Groot 等人,Process Biochem.27 61-75(1992),以及本文參考)。例如,可通過離心、過濾、潷析等方法從
發酵培養基中移除固體。然后,可使用諸如蒸餾、共沸蒸餾、液液萃取、吸附、汽提、 膜蒸發、或全蒸發的方法從發酵培養基中分離丁醇。因為丁醇與水形成低沸點的共沸混合物,可使用蒸餾分離混合物及其共沸組合 物。可將蒸餾與另一種分離方法聯合使用以分離共沸物。可與蒸餾聯合使用以分離并 純化丁醇的方法包括但不限于潷析、液液萃取、吸附、和基于膜的技術。此外,可使 用共沸蒸餾,用夾帶劑(參見例如 Doherty 和 Malone,Conceptual Design of Distillation Systems, McGraw Hill, New York, 2001)分離丁醇。丁醇-水混合物形成非均相共沸物,以便蒸餾可與潷析聯合使用以分離并純化 丁醇。用這種方法,將包含發酵液的丁醇蒸餾至接近共沸組合物。然后冷凝共沸混合 物,并且通過潷析從發酵培養基中分離丁醇。可將潷析的含水相作為回流返回第一蒸餾 塔。可在第二蒸餾塔中通過蒸餾進一步純化富含丁醇的潷析有機相。也可聯合使用液-液萃取和蒸餾從發酵培養基中分離丁醇。用這種方法,用合 適的溶劑通過液_液萃取從發酵液中提取丁醇。然后蒸餾包含丁醇的有機相以從溶劑中 分離丁醇。也可組合使用蒸餾和吸附以從發酵培養基中分離丁醇。用這種方法,將包含丁醇的發酵液蒸餾至接近共沸組合物,然后使用吸附劑除去剩余的水如分子篩(Aden等 人,Lignocellulosic Biomass to Ethanol Process Design and Economics Utilizing Co-Current Dilute Acid Prehydrolysis and Enzymatic Hydrolysis for Corn Stover, Report NREL/ TP-510-32438,National Renewable Energy Laboratory, 2002 年 6 月)。此外,蒸餾與全蒸發聯合使用可從發酵培養基中分離并純化丁醇。用這種方 法,將包含丁醇的發酵液蒸餾至接近共沸組合物,然后通過全蒸發用親水膜除去剩余的 水(Guo 等人,J.Membr.Sci.245,199-210(2004))。
實施例本發明將在下面的實施例中進一步限定。應該理解,這些實施例盡管說明了本 發明的優選實施方案,但僅是以例證的方式給出的。根據上面的論述和這些實施例,本 領域的技術人員能確定本發明的基本特征,并在不脫離本發明的精神和范圍的情況下, 能夠對本發明做出多種改變和修飾,以使其適用于多種用法和條件。一般方法實施例中所述的標準重組DNA技術和分子克隆技術在領域內是眾所周知的, 并且在下列文獻中有所描述Sambrook,J.,Fritsch, E.F.和 Maniatis,T.Molecular Cloning A Laboratory Manual ; Cold Spring Harbor Laboratory Press Cold Spring Harbor, NY, (1989) (Maniatis)禾Π T.J.Silhavy, M丄.Bennan 禾Π L.W.Enquist,Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1984) 以及 Ausubel,F.M 等人,Current Protocols in Molecular Biology,出版Greene Publishing Assoc.and Wiley-Interscience (1987),以及 Methods in Yeast Genetics,2005, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY適合細菌培養物維持及生長的材料和方法在本領域內是眾所周知的。適用于 下面實施例的技術可參見 Manual of Methods for General Bacteriology (Phillipp Gerhardt, R.G.E.Murray, Ralph N.Costilow, Eugene W.Nester, Willis A.Wood, Noel R.Krieg 禾口 G.Briggs Phillips 編輯),American Society for Microbiology, Washington, DC. (1994)), 或者 Thomas D.Brock, Biotechnology A Textbook of Industrial Microbiology,第二版, SinauerAssociates, Inc., Sunderland, MA(1989)。除非另外指明,使用的用于細菌細 胞生長和維持的所有試劑、限制性內切酶和材料均得自Aldrich Chemicals (Milwaukee, WI) > BD Diagnostic Systems (Sparks, MD)、Life Technologies (Rockville, MD)或 Sigma Chemical Company (St.Louis, MO)。除非另外指明,微生物菌株獲取自美國典型培養物保藏中心(ATCC), Manassas, VA。縮寫的含義如下“S”指秒,“min”指分鐘,“h”指小時,“psi”指磅每 平方英寸,“nm”指納米,“d”指天,“PL”指微升,“mL”指毫升,“L”指 升,“mm”指毫米,“nm”指納米,“mM”指毫摩爾每升,“ μ M”指微摩爾的,
“Μ”指摩爾的,“mmol”指毫摩爾,“ μ mol”指微摩爾,“g”指克,“ μ g”指 微克而“ng”指納克,“PCR”指聚合酶鏈反應,“OD”指光密度,“OD_”指在 600nm波長下測量的光密度,“kDa”指千道爾頓,“g”指引力常數,“bp”指堿基對,“kbp”指千堿基對,H指重量/體積百分比,“%v/v”指體積/體積 百分比,“HPLC”指高效液相色譜,“GC”指氣相色譜。術語“摩爾選擇性”是消 耗的每摩爾糖底物制備的產物摩爾數,用百分比表示。"Km"是在給定酶濃度的酶反應中導致產物生產速率等于Vmax的二分之一的底 物濃度。"Vmax”是在給定酶濃度的酶反應中生產產物的最大速率。一般單位是產物微 摩爾數每分鐘反應時間。實施例1從木糖氧化無餼桿菌的環境分離蛋白中分離并表征丁醇脫氫酶使用富集方法以測定從環境廢水污泥樣本中分離能夠利用1-丁醇作為唯一碳 源的微生物是否是可能的。通過以下方法獲取富集培養物將ImL活化污泥接種到 10mLS12 培養基中(0.01M硫酸銨,0.05M 磷酸鉀,pH7.0, 2mM MgCl2, OJmMCaCl2, 50 μ M MnCl2, 1 μ M FeCl3, 1 μ M ZnCl2, 1.72 μ M CuSO4, 2.53 μ M CoCl2, 2.42 μ M Na2MoO4, 2 μ M硫胺素鹽酸鹽),該培養基在125mL錐形瓶中包含酵母提取物(終濃度 0.001% )禾Π 0.1 % (w/v)的1- 丁醇。從DuPont廢水處理設備中獲取活化污泥。富集培 養物在37°C下往復振蕩培養。培養物最初每隔1至2天通過用9mL的培養基置換相同體 積的培養物來稀釋培養物。隨后,將更高的稀釋液轉入包含0.1-0.4% (w/v)的初始1-丁 醇濃度的相同培養基中導致生長速率(34°C,250rpm)接近Ο.δδ!^1。將富集培養物的樣本(IOyL)平鋪在LB瓊脂或胰酪胨大豆瓊脂上,并且在35°C 培養大約20小時。通過在相同培養基上劃線接種并在35°C培養該培養物純化代表性的菌 落。選擇分離物進行進一步檢查。將一個分離物命名為BUTCON-5。通過rRNA表征 分析BUTCON-5菌株的同一性。通過PCR擴增菌株BUTC0N-5的16S rRNA并如下進行分析。菌株BUTC0N-5 在LB中,在37 °C下振蕩生長16小時。使用Ultracleiin Microbial DNA分離試劑盒 (MoBio, part#12224),按照制造商的說明書從菌株BUTCON-5中提取DNA。 使用 商購獲得的試劑盒,按照制造商的說明書(Perkin Elmer,Norwalk, CT),通過PCR擴 增 16S rRNA 基因序列,引物為 JCR14(ACGGGCGGTGTGTAC ; SEQ ID NO 4)和 JCRl5 (GCCAGCAGCCGCGGTA ; SEQ ID NO 5)。在 Perkin Elmer GeneAmp 9600 中 進行PCR。樣本在94°C下培養2分鐘,然后如下循環30次在94°C下1分鐘,接著在 55°C下1分鐘,72°C下1分鐘,并在72°C下保持5分鐘。使用商購獲得的試劑盒,按照 制造商的說明書(QIAquick PCR Purification Kit,Valencia, CA)純化擴增的 16S rRNA 序 列片段,并且在自動ABI測序儀(Applied Biosystems,Foster City, CA)上測序。測序 反應的起始引物是 JCR14 (SEQ ID NO 4)禾Π JCRl5 (SEQ ID NO 5)。用 16S rRNA 基 因序列作為查詢序列進行GenBank中可利用序列的BLAST搜索(Altschul等人,Nucleic Acids Res.25 3389-3402 (1997))以獲取相似序列。來自菌株 BUTCON-5 (SEQ IDNO 6)的16S rRNA基因序列與若干個屬于菌種木糖氧化無色桿菌的細菌16S rRNA基因序列 具有高序列同一性。BUTC0N-5序列與從木糖氧化無色桿菌菌株NFRI-Al (GenBank登 陸號AB161691)中分離的16SrRNA基因序列具有最高的同一性(99% )。 純化來自木糖氧化無色桿菌的丁醇脫氧酶活性
來自木糖氧化無色桿菌BUTCON-5菌株的丁醇脫氫酶的純化從在上述培養 基中生長菌株的500mL過夜培養物開始進行。沉淀細胞(Sorvall RC5B,FlO轉子, 6000RPM, 20分鐘,10°C)并用pH7.0的25mL20mM磷酸鉀洗滌兩次。將洗滌后的沉 淀物重懸在pH7.0的30mL20mM磷酸鉀中,并且在冰上冷凍。超聲波降解(Heat Systems Ultrasonics, Cell Disrupter model W375,Power level 50, Pulsed Mode, 70% 占空比,5 分鐘)細胞。通過離心(Sorvall RC5B,SS34轉子,18000RPM,20分鐘,10°C )細胞 降解產物制備細胞游離提取物。將上清液以等分試樣貯存在-80°C。解凍兩份等分試 樣(9.12mL),將它們混合并用硫酸魚精蛋白沉淀。在15分鐘內四次逐滴加入IOOyL 的50mg/mL硫酸魚精蛋白溶液(總計15% w/w蛋白)。離心(Beckman冷凍離心機, 20,000RCF,4°C, 10分鐘)移除沉淀。Superdexprep 200 柱用 20mM 磷酸鉀,20mM KCl,pH7.0 平衡。用 Centriprep
濃縮機將來自硫酸魚精蛋白沉淀的上清液濃縮至約1.3mL,裝入柱中并用相同緩沖液以 l.OOmL/分鐘等度洗脫。收集組分并測定1-丁醇脫氫酶活性。該檢測分析法用分光光 度計在340nm監控NADH氧化成NAD+的情況,該檢測法在35°C下,使用在包含50mM 丁醛和0.2mMNADH的50mM磷酸鉀緩沖液中(pH6.2)的合適量的酶。收集具有高比活 性的組分并濃縮以提供高純度組分,該組分具有19μιη01/分鐘/毫克蛋白的比活性。來自木糖氧化無餼桿菌的分離丁醇脫氫酶的活件染餼使用非變性聚丙烯酰胺凝膠(8-16% Tris-甘氨酸梯度凝膠,Invitrogen)對純化酶 和分子量標準品進行電泳。在電泳后,除去凝膠并對其進行蛋白染色(Simply Blue Protein Stain, Invitrogen)或活性染色,染色通過耦合1_ 丁醇加NAD+變成丁醛加NADH的轉化 與3[4,5-二甲基-2-噻唑基|-2,5-二苯基四氮唑溴鹽(MTT)變成深色甲臜(formazan) 的轉化進行,使用吩嗪硫酸二甲酯(PMS)作調節劑(Tang等人,等人,J.Bacteriol.140, 182(1997))。活性溶液包含 0.5mgPMS,5mg MTT, 20mg NAD+和 ImL 1_ 丁醇,總體 積為25mL。所得活性染色與介于B-藻紅蛋白(242千道爾頓)和乳酸脫氫酶(146千道 爾頓)蛋白標準品之間的中間條帶一起遷移。隨后使用2- 丁醇(生成2- 丁酮)或異丁 醇(生成異丁醛)進行的活性染色生成具有相同分子量的條帶,指示相同蛋白對這些丁醇 異構體具有活性。來自木_氧補,于肩,桿菌的丁醇脫顏j 的云力力學表征用1-丁醇、2-丁醇、丁醛、2-丁酮(甲基乙基酮)、和異丁醛作底物測定還 原(酮和醛)或氧化(醇)的木糖氧化無色桿菌丁醇脫氫酶動力學參數。用醇底物進 行的反應在35°C的TRIS緩沖液中進行,該緩沖液pH8.5,包含3mM NAD+和不同濃度 的醇。用酮或醛底物進行的反應在35°C用pH6.0的50mM MES緩沖,200 μ m NADH 和不同濃度的酮或醛進行。使用獲取自木糖氧化無色桿菌或重組大腸桿菌菌株Machl/ pTrc99a::sadB(如下文實施例3所述)的粗制酶制劑。根據結果計算每種底物的Vmax和 Km,這些數據在表1中提供。表1氧補,于肩,fflTTgS脫顏的云力力學常數。
權利要求
1.分離的核酸分子,所述分離的核酸分子包含編碼至少約250個氨基酸的多肽的第一 核苷酸序列,所述多肽基于Smith-Waterman比對方法在與具有如SEQ ID NO 2所示序 列的多肽進行比較時具有至少約70%的同一性,或者所述分離的核酸分子包含第二核苷 酸序列,所述第二核苷酸序列包含第一核苷酸序列的互補序列,其中所述酶具有丁醇脫 氫酶活性。
2.編碼丁醇脫氫酶的分離的核酸分子,所述分離的核酸分子選自a)編碼如SEQID NO 2所示的氨基酸序列的分離的核酸分子;b)在如下所述的雜交條件下與(a)雜交的分離的核酸分子0.1XSSC、0.1%SDS, 65°C 以及用 2XSSC、0.1% SDS 洗滌,之后用 0.1XSSC、0.1% SDS 洗滌;或與(a)或(b)互補的分離的核酸分子。
3.權利要求1或2的分離的核酸分子,所述分離的核酸分子具有選自SEQIDNO 1 和SEQ ID NO: 3的序列。
4.具有如SEQID NO 2所示的氨基酸序列的多肽。
5.包含權利要求1或2的分離的核酸分子的嵌合基因,所述分離的核酸分子可操作地 連接至合適的調控序列。
6.包含權利要求1或2的核酸分子的轉化的宿主細胞。
7.權利要求6的轉化的宿主細胞,其中所述宿主細胞選自細菌、藍細菌、絲狀真菌和 酵母。
8.權利要求7的轉化的宿主細胞,其中所述宿主細胞為選自下組的屬的成員梭菌 屬、發酵單胞菌屬、埃希氏菌屬、沙門氏菌屬、紅球菌屬、假單胞菌屬、芽孢桿菌屬、 乳桿菌屬、腸球菌屬、產堿桿菌屬、克雷伯氏菌屬、類芽胞桿菌屬、節桿菌屬、棒狀桿 菌屬、短桿菌屬、畢赤酵母屬、假絲酵母屬、漢遜酵母屬、克魯維酵母屬和糖酵母屬。
9.生產2-丁醇的方法,所述方法包括a)提供包含權利要求1或2中任一項的分離的核酸分子的重組微生物生產宿主細胞, 所述分離的核酸分子編碼具有丁醇脫氫酶活性的多肽,并且提供2-丁酮來源;b)使(a)的微生物宿主細胞在表達所述分離的核酸分子并將所述2-丁酮轉化成2-丁 醇的條件下生長;以及C)任選地回收所述2-丁醇。
10.生產異丁醇的方法,所述方法包括a)提供包含權利要求1或2中任一項的分離的核酸分子的重組微生物生產宿主細胞, 所述分離的核酸分子編碼具有丁醇脫氫酶活性的多肽,并且提供異丁醛來源;b)使(a)的微生物宿主細胞在表達所述分離的核酸分子并將所述異丁醛轉化成異丁 醇的條件下生長;以及c)任選地回收所述異丁醇。
11.生產1-丁醇的方法,所述方法包括a)提供包含權利要求1或2中任一項的分離的核酸分子的重組微生物生產宿主細胞, 所述分離的核酸分子編碼具有丁醇脫氫酶活性的多肽,并且提供丁醛來源;以及b)使(a)的微生物宿主細胞在表達所述分離的核酸分子并將所述丁醛轉化成1-丁醇 的條件下生長;C)并且任選地回收所述1-丁醇。
12.根據權利要求9、10、或11的方法,其中(a)的重組微生物宿主細胞選自細菌、 藍細菌、絲狀真菌和酵母。
13.根據權利要求12的方法,其中所述重組微生物宿主細胞為選自下組的屬的成員 梭菌屬、發酵單胞菌屬、埃希氏菌屬、沙門氏菌屬、紅球菌屬、假單胞菌屬、芽孢桿菌 屬、乳桿菌屬、腸球菌屬、產堿桿菌屬、克雷伯氏菌屬、類芽胞桿菌屬、節桿菌屬、棒 狀桿菌屬、短桿菌屬、畢赤酵母屬、假絲酵母屬、漢遜酵母屬、克魯維酵母屬和糖酵母 jM ο
全文摘要
從分離自環境樣本的細菌菌株中,在包含1-丁醇作碳源的培養基中富集后,鑒定了具有丁醇脫氫酶活性的新酶。該酶能夠將丁醛轉化成1-丁醇、將異丁醛轉化成異丁醇、以及將2-丁酮轉化成2-丁醇,并且因此對在生產這些底物的重組微生物宿主中的丁醇生物合成是有用的。從經鑒定為木糖氧化無色桿菌的分離蛋白的菌株中分離稱為sadB的編碼基因。
文檔編號C12P7/16GK102016013SQ200980114986
公開日2011年4月13日 申請日期2009年4月28日 優先權日2008年4月28日
發明者A·C·埃利奧特, C·E·納卡穆拉, L·A·馬吉奧-霍爾, M·G·布拉穆奇 申請人:布特馬斯先進生物燃料公司