專利名稱::提高脂肪酸衍生物的產量的制作方法
技術領域:
:本發明提供基因工程細胞和^f斂生物以及它們的使用方法,所述微生物產生來自脂肪酸生物合成途徑的產物(即脂肪酸衍生物)。這類產物特別適合作為生物燃料。相關申請的交叉引用本申請要求享有2007年3月28日提交的美國臨時申請序列號60/908,547、2007年11月21日提交的美國臨時申請序列號60/989,798以及2007年5月18號提交的PCT申請PCT/US2007/011923的優先權,將這些申"i青均通過引用全文并入本文。
背景技術:
:隨著技術的發展,與之相伴的是對燃料來源的依賴性的增加。這類燃料來源正變得日益有限和難以獲得。隨著化石燃料以空前的速度被燒掉,世界上的燃料需求可能不久以后就將超過目前的燃料供給。因此,現在致力于利用可再生能源,諸如日光、水、風和生物質(biomass)。利用生物質產生非石油來源的新的燃料資源(即生物燃料)已成為一種可供選擇的方案。生物燃料是一種由烷烴和酯類構成的可生物降解的、清潔燃燒的燃料。生物柴油即是一種示例性的生物燃料。生物柴油可以采用純的形式(被稱為"純,,生物柴油),或者以任何濃度與常規的石化柴油混合用于大部分內燃柴油發動機中。與基于石油的柴油相比,生物柴油提供了包括燃燒過程中排放量(例如,一氧化碳、硫、芳香烴、煙灰顆粒)下降在內的許多有趣和有吸引力的有益特點。因其基于可再生的生物材料,生物柴油還能維持平衡的二氧化碳循環。生物柴油無毒、可完全生物降解,而且因為燃點高,易燃性低因此非常安全。此外,生物柴油提供良好的潤滑性能,24/人而減少發動才幾的磨損。目前生產生物柴油的方法涉及將來自植物油原料的三酰甘油進行酯交換,植物油原料,比如在歐洲是油菜,在北美是大豆,在東南亞是棕櫚油。因此工業規模的生物柴油生產在地理和季節上局限于植物油原料的產地。酯交換過程產生脂肪酯(fattyesters)混合物,其可以作為生物柴油。酯交換過程中的一種不希望的副產品是甘油。要作為生物柴油使用,必須從上述異質產物中進一步純化脂肪酯。這最終會增加生物柴油的產量,但增加了脂肪酯生產的成本和所需能量。而且,植物油原料不是高效的能量來源,因為它們需要廣大的種植面積。例如,因為只有菜子油產生用于生物柴油,油菜生物質的其他部分不被使用,從油菜產生生物柴油的產量僅有1300L/公項。此外,某些植物油原料,比如油菜和大豆的種纟直需要經常進行農作物輪種以防止土地養分耗盡。因此,需要在經濟和能量方面高效的生物燃料,以及由可再生能量來源比如生物質生產所述生物柴油的方法。發明概述本發明涉及從重組細胞中產生脂肪酸衍生物。通常,通過表達或超表達編碼脂肪酸衍生物酶的至少一個基因來產生脂肪酸衍生物。此外,可以對重組細胞中編碼酰基輔酶A(CoA)脫氬酶的基因進行修飾,從而使該基因的表達弱化。本發明的一個方面提供了重組細胞,所述重組細胞包含至少下述之一(a)至少一個編碼脂肪酸衍生物酶的基因,修飾該基因,從而使其超表達;和(b)編碼酰基輔酶A脫氬酶的基因,修飾該基因,從而使其表達弱化。所述修飾的編碼脂肪酸衍生物酶的基因可以是編碼酰基輔酶A合酶、好u酯酶、酯合酶、醇酰基轉移酶、醇脫氬酶、酰基輔酶A還原酶或脂肪醇形成酰基輔酶A還原酶的基因。在一個實施方案中,修飾的基因編碼酰基輔酶A合酶、-琉酯酶和酯合酶。在某些實施方案中,酰基輔酶A合酶和硫酯酶以及/或者酯合酶是修飾的。在某些實施方案中,細胞還包含編碼轉運蛋白的基因。本發明的重組或宿主細胞可以是S良酒酵母(Sflcc/^ramyc&scwevWae)、解脂假絲酵母(C朋fiWa/*o/_y"ca)、大腸桿菌(五.co//)、節桿菌(J^r/2ra6"c妙)、粘紅酵母(iAodotora/(2g7w〃m."力、不動桿菌(v4cz7^由c—、解月旨假絲酵母、布朗葡萄藻(5o,,coc價6聽m》、弗尼斯氏弧菌(H力n.o/wrmh")、藤黃微球菌(M/cracocciw/wtew力、嗜麥芽窄食單胞菌OS^wofrapAowowwma/Zo//7/a)或者枯草芽孢桿菌(5acz7/wwZj"/z';y)細月包,例如節桿菌AK19、不動桿菌G4c/"e/oZ^"wsp.)菌才朱M-1、大腸桿菌B、大腸桿菌C、大腸桿菌K或者大腸桿菌W細胞。在其他實施方案中,重組細胞是藍細菌(Cy朋oZj""er/力細胞,例如集胞藍菌(5^wec/oqyW^sp.)PCC6803或細長聚3求菌0S^zec/jococcwe/o"gWi)PCC7942細胞。還有一些實施方案中,重組細胞是植物、動物或人細胞。可選地,重組細胞是來自細菌、酵母或絲狀真菌的孩吏生物細月包。本發明第二方面提供了能產生脂肪酸衍生物的重組細胞,其中所述細胞經修飾從而包括至少一個編碼脂肪酸衍生物酶的外源核酸序列。所述外源核酸序列可以編碼酰基輔酶A合酶、石危酯酶、酯合酶、醇酰基轉移酶、醇脫氫酶、酰基輔酶A還原酶或脂肪醇形成酰基輔酶A還原酶。在某些實施方案中,細胞經修飾從而包括至少兩個編碼脂肪酸書f生物酶的外源核酸序列,例如第一外源核酸序列編碼酰基輔酶A合酶,第二外源核酸序列編碼硫酯酶或酯合酶。在其他實施方案中,編碼脂肪酸衍生物酶的基因經修飾從而優化用于在重組細胞內表達的密碼子。在一個實施方案中,重組細胞包含修飾的編碼酰基輔酶A合酶的基因,如/adi)、/adi:、5Z^/0丄_y//I、尸/7-WW、£^W50W、/adZ)/、/aJi)2、iPC/074、/adZXD35、/adDD"、/adp,或編碼蛋白質ZP一01644857的基因。酰基輔酶A合酶基因的實例有來自結核分枝桿菌(M/^wc"/ow、)HR7Rv的fadDD35[NP—217021]、來自枯草芽孢桿菌的yhfL[NP—388908]、來自銅綠々支單胞菌(尸.aen^'"o^/)PA01的fadDl[NP_251989]、來自嗜麥芽窄食單胞菌R551-3的編碼蛋白質ZP—01644857的基因或者來自釀酒酵母的/aa^[NP—012257]。在第二個實施方案中,重組細胞包含修飾的編碼硫酯酶的基因,如/e"、'&"、ZesB、、/a,52、、/"M"/7、/a"或/a"/。在第三個實施方案中,重組細胞包含修飾的編碼酯合酶的基因,如獲得自不動桿菌(fwe勵ac/erspp.)、博克島食烷菌(襲聽'voraxZo^:wmeww^)、才以南芥(y4ra6zV/o/wiZ力a"awa)、酉良酒酵母、智人(77omo■sa/^eAw)、西蒙^尋木(57m附ow^sz.(3cAz.weww's)、高山#皮孑包審(A/oW/ere〃aa/p/we)、彎曲隱球菌(Oy/7/ococcMScwrrato)、J/cam.vomx:ya^W7'51、博克島食烷菌、不動桿菌(v4c/"^o^c/ersp.)HOl-N或混濁紅球菌(i/zo^cocciwo;aci^)的酯合酶基因。酯合酶基因的實例包括wflx/Wga"即來自西蒙得木、不動桿菌菌抹ADP1、博克島食烷菌、銅綠假單胞菌、Fww礎a"e/v'ade"^、擬南芥或真養產械軒菌(^4儀"/—"^ew加j!7/ms)的雙功能酯合酶/酰基輔酶A:二酰甘油酰基轉移酶。在一個實施方案中,本發明的重組細胞還包含;^A、;咖i:、aceEF、/a6"、/aW)、/aK、ac/7P和/a6F基因中的至少一個,基因經過修飾以便表達或超表達。在第二個實施方案中,重組細胞還包含fadE、gpsA、ldhA、pflB、adhE、pta、poxB、ackA和ackB基因中的至少一個,基因經修飾,其表達弱化。在第三個實施方案中,重組細胞還包含plsB和sfa的至少一個〗務飾的基因。在其他實施方案中,編碼酰基輔酶A脫氫酶的基因缺失。本發明的重組細胞相對非重組細胞,例如否則相同的非重組細胞或者種系和表型類似的細胞,產生更多的酰基輔酶A。本發明還提供了本文公開的重組細胞所產生的組合物。包含由重組細胞產生的脂肪酸衍生物的組合物包含少于或者等于約50ppm的砷,約30ppm、約25ppm,或者在約10-50ppm的砷;少于或等于約200ppm的鈣、約150ppm的鉤、約119ppm的4丐或者約50-200ppm的鈣;少于或等于約200ppm的氯、約150ppm的氯、約119ppm的氯或者在約50-200ppm的氯;少于或等于約50ppm的銅、約30ppm的銅、約23ppm或者約10-50ppm的銅;少于或等于約300ppm的鐵、約200ppm的鐵、約136ppm的鐵或者約50-250ppm的鐵;少于或等于約50ppm的鉛、約25ppm的鉛或者約10-50ppm的鉛;少于或等于約50ppm的錳、約30ppm的錳、約23ppm的錳或者約10-50ppm的錳;少于或等于約50卯m的鎂、約30ppm鎂、約23ppm的鎂或者約10-50ppm的鎂;少于或等于約0.5ppm的汞、約O.lppm的汞、約0.06ppm的汞或者約0.01-0.2ppm的汞;少于或等于約50ppm的鉬、約30ppm的鉬、約Mppm的鉬或者約10-50ppm的鉬;少于或等于約2%的氮;約1%的氮、約0.5%的氮或者約0.1-1%的氮;少于或等于約200ppm的鉀、約150ppm的鉀、約103卯m或者約50-200卯m的鉀;少于或等于約300ppm的鈉、約200ppm的鈉、約140ppm的鈉或者約50-300ppm的鈉;少于或等于約1ppm的碌"少于或等于約1%的>5克,約0.14%的硫或者約0.05-0.3%的硫;少于或等于約50ppm的鋅、約30ppm的鋅、約23ppm的鋅或者約10-50ppm的鋅;或者少于或等于約700ppm的磷、約500ppm的磷、約350ppm的磷或者約100:00ppm的磷。在一個方面,由本發明的重組細胞產生的組合物所包含的脂肪酸,在碳鏈中從所述脂肪酸書f生物還原末端的7位(在C;和Cs之間)有雙鍵。在某些實施方案中,組合物包含Cs-C25脂肪酯,或d。-C2。脂肪酯,或者C!2-C!8脂肪酯。在其他實施方案中,所述脂肪酸衍生物包含直鏈脂肪酸書f生物、支鏈脂肪酸衍生物和環狀部分。仍然在一些實施方案中,脂肪酸衍生物是不飽和(例如單不飽和)或飽和的。在其他方面,組合物包含由醇和酰基輔酶A產生的脂肪酯,其中所述醇的長度為至少約1個、約2個、約3個、約4個、約5個、約6個、約7個、約8個、約10個、約12個、約14個、約16個或約18個碳;酰基輔酶A的長度為至少約2個、約4個、約6個、約8個、約10個、約12個、約14個、約16個、約18個、約20個、約22個、約24個或約26個碳。在某些實施方案中,產生脂肪酯的醇和酰基輔酶A差別約2個、約4個、約6個、約8個、約10個、約12個或約14個碳原子。在一個實施方案中,由本發明的重組細胞產生的組合物其現代>5友分婆史(fractionofmoderncarbon)為約1.003到約1.5。本發明的其他方面提供了在重組細胞中產生脂肪酸衍生物的方法,所述方法包括a)獲得重組細胞;b)培養重組細胞,以及c)產生脂肪酸衍生物。本發明的其他方面提供了提高重組細胞中脂肪酸衍生物產量的方法,所述方法包括將編碼脂肪酸書f生物酶的外源核酸導入重組細胞,表達所述外源核酸,其中該核酸在重組細胞內的表達使脂肪酸衍生物的產量相對非重組細胞得以提高,所述非重組細胞如,否則相同的非重組細胞或具有類似譜系和表現型的細胞。在某些實施方案中,所述外源核酸編碼酰基輔酶A合酶、石克酯酶或酯合酶。在其他實施方案中,將編碼酰基輔酶A合酶、辟b酯酶和酯合酶的外源核酸導入重組細胞。在其他實施方案中,提供了在重組細胞中提高脂肪酸衍生物產生水平的方法,所述方法包括將核酸構建體導入宿主細胞,所述核酸構建體包含a)編碼核酸衍生物酶的核酸序列SEQIDNO:2、SEQIDNO:3、SEQIDNO:6、SEQIDNO:9或SEQIDNO:13,和b)用于所述核酸序列表達的調節序列;表達所述核酸序列;以及獲得脂肪酸衍生物。本發明仍然在其方面提供了包含編碼脂肪酸衍生物酶的核酸序列的重組構建體,其中所述核酸序列經修飾超表達所述編碼脂肪酸衍生物酶的基因。在一個實施方案中,核酸序列經修飾超表達編碼酰基輔酶A合酶、硫酯酶或酯合酶的基因。在第二個實施方案中,核酸序列經修飾超表達(l)編碼酰基輔酶A的基因,和(2)編碼硫酯酶或酯合酶的基因。在第三個實施方案中,核酸序列經修飾超表達編碼(l)酰基輔酶A、(2)硫酯酶和(3)酯合酶的基因。在第四個實施方案中,構建體還包含編碼酰基輔酶A脫氫酶的核酸序列,該核酸序列經^修飾使酰基輔酶A脫氫酶的表達弱化。本發明還提供了包含這些重組構建體的載體。在某些實施方案中,所述載體還包含結構基因以便對轉化的細胞進行選擇。本發明另一方面提供了提高宿主細胞中脂肪酸衍生物產量的方法,所述方法包含用核苷酸序列轉化宿主細胞,從而宿主細胞表達或超表達脂肪酸衍生物酶基因,其中宿主細胞內的脂肪酸衍生物產量相對未經轉化的細胞得以提高。在這樣的方法中,可以收獲宿主細胞并裂解以獲得所產生的脂肪酸衍生物。可選地,用編碼轉運蛋白的核苷酸序列轉化宿主細胞,宿主細胞將脂肪酸衍生物釋放到胞外。29本發明的再一方面提供了包含編碼脂肪酸衍生物酶的核酸序列的載體,其中所述核酸序列可操縱地連接于能在宿主細胞中發揮作用的啟動子,該核酸序列包含編碼酰基輔酶A合酶的第一核酸序列和編碼硫酯酶或酯合酶的第二核酸序列。所述載體還可以包含編碼轉運蛋白的核酸序列。在一個實施方案中,第二核酸序列編碼硫酯酶,且載體還包含編碼酯合酶的第三核酸序列。在第二個實施方案中,載體還包含編碼轉運蛋白的核酸序列。本發明還有一方面提供了產生脂肪酸衍生物的方法,包括(a)提供包含本發明的載體的宿主細胞;和(b)培養宿主細胞以產生脂肪酸衍生物。在某些實施方案中,由宿主細胞培養物收集上清液從而獲得已產生的脂肪酸衍生物。本發明也提供了通過此類方法產生的脂肪酸衍生物。一方面,根據本發明產生的脂肪酸衍生物可以用作生物燃料組合物。所述脂肪酸衍生物可以用作生物柴油、脂肪醇、脂肪酯、三酰甘油、汽油或噴氣燃料(jetfuel)。另一方面,本發明的重組細胞所產生的組合物包含脂肪酯或游離脂肪酸。例如,在一個實施方案中,游離脂肪酸的重量百分比是至少約1%、約2%、約3%、約4%、約5%、約6%、約7°/。、約8%、約9%、約10%、約15%、約20%或者約25%。在另一個實施方案中,所產生的脂肪酯的重量百分比是至少約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%或約90%。在另一個實施方案中,脂肪酯與游離脂肪酸的比率是約10:1、約9:1、約8:1、約7:1、約5:1、約2:1或約1:1。在一個實施方案中,根據本發明所產生的組合物包括脂肪酯,其中所述脂肪酯是十二酸乙酯、十三酸乙酯、十四酸乙酯、十五酸乙酯、順式-9-十六烯酸乙酯、十六酸乙酯、十七酸乙酯、順式-ll-十八烯酸乙酯、十八酸乙酯或者其組合中的至少一種。在第二個實施方案中,根據本發明所產生的組合物包括游離脂肪酸,其中所述游離脂肪酸是十二酸、十四酸、十五酸、順式-9-十六烯酸、十六酸、順式-ll-十八烯酸或者其的組合中的至少一種。這些實施方案的組合物還可以用作生物燃料,例如,作為生物柴油、脂肪醇、脂肪酯、三酰甘油、汽油或噴氣燃料。在某些實施方案中,本文公開的組合物含有的d2游離脂肪酸相對全部游離脂肪酸的重量百分比是至少約5%、10%或15%。在其他實施方案中,本文公開的組合物含有的c14游離脂肪酸相對全部游離脂肪酸的重量百分比是至少約20%、30%或40%。在其他實施方案中,本文公開的組合物含有的C15游離脂肪酸相對全部游離脂肪酸的重量百分比是至少約1%或2%。在其他實施方案中,本文/>開的組合物含有的(:16游離脂肪酸相對全部游離脂肪酸的重量百分比是至少約20%、30%或40%。在其他實施方案中,本文公開的組合物含有的ds游離脂肪酸相對全部游離脂肪酸的重量百分比是至少約15%、20%或25%。在某些實施方案中,本文公開的組合物含有的d2脂肪酯相對全部脂肪酯的重量百分比是至少約1%、2%或3%。在其他實施方案中,本文公開的組合物含有的C14脂肪酯相對全部脂肪酯的重量百分比是至少約10%、15%或20%。在其他實施方案中,本文^S開的組合物含有的C^脂肪酯相對全部脂肪酯的重量百分比是至少約30%、40%或50%。在其他實施方案中,本文公開的組合物含有的ds脂肪酯相對全部脂肪酯的重量百分比是至少約20%、30%或40%。附圖簡述圖1是鑒定可以超表達或弱化從而使脂肪酸衍生物產量增加的各種基因的表格。這個表格還鑒定了可以經調節從而改變脂肪酸衍生物產物結構的各種基因。這些基因中的某些用于改變脂肪酸衍生物結構的基因,也能增加脂肪酸衍生物的產生。圖2是說明FAS生物合成途徑的圖示。圖3是說明p氧化途徑的圖示,包括由以下酶催化的步驟(1)酰基輔酶A合酶(EC6.2.1-);(2)酰基輔酶A脫氬酶(EC1.3.99.3);(3)烯酰-輔酶A水合酶(EC4.2.1.17);(4)3-羥丁酰輔酶A差向異構酶(EC5丄2.3);和(5)3-酮脂酰-輔酶A硫解酶(EC2.3.1.16)。這個(3氧化途徑的最后反應釋放乙酰輔酶A和短了兩個碳的酰基輔酶A脂肪酸,準31備好再進行P氧化反應。圖4的示意圖顯示根據所提供的底物產生脂肪酯的生物合成途徑。圖5的示意圖顯示產生脂肪醇的生物合成途徑。圖6的示意圖顯示產生脂肪酯的生物合成途徑。圖7描述了實施例5描述的菌林的脂肪醇產生,所述菌林共轉化有pCDFDuet-l-fadD-acrl和含有各種硫酯酶基因的質粒。鑒定了飽和的C1()、C12、C14、C!6和ds脂肪醇。困8描述了脂肪醇從生產菌林(productionstrain)的釋放。當菌抹培養在37^,約50%所產生的脂肪醇從細胞中釋放。圖9A-D描述了表達醇乙酰轉移酶(AATs,EC2.3.1.84)的生產宿主(productionhost)和表達酯合酶(EC2.3.1.20、2.3.1.75)的生產宿主產生的辛酸辛酯(CsC8)的GS-MS譜。圖9A顯示菌抹C41(DE3,A/afi五/pHZ1.43)/pRSETB+pAS004.114B)的乙酰乙酯提取物的GC-MS鐠,其中pHZ1.43質粒表達ADP1酯合酶(EC2.3.1.20、EC2.3.1.75)。圖9B顯示菌抹C41(DE3,A/W£/pHZ1.43)/pRSETB+pAS004.114B)的乙酰乙酸酯提取物的GC-MS譜,其中pHZI.43質粒表達SAAT。圖9C顯示菌抹C41(DE3,A/^/五/pHZ1.43)/pRSETB+pAS004.114B)的乙酰乙酯提取物的GC-MS譜,其中pHZ1.43質粒不含有ADP1(酯合酶)或者SAAT。圖9D顯示C41(DE3,z//"6ffi/pHZ1.43)/pRSETB+pAS004.114B)所產生的QC8的質譜和裂解模式(fragmentationpattern),其中pHZ1.43質粒表達SAAT。圖10顯示當來自不動桿菌ADPl(WSadpl)的酯合酶與來自萼距花(Cw;A^AooA^/a"a)的硫酯酶基因在生產宿主中共表達時,產生的乙酯的分布。圖11描述了各種酯合酶在25。C產生的乙酯。所述乙酯由攜帶各種酯合酶的重組大腸桿菌菌林產生。重組菌抹是1.C41(DE3,4/^fi^4/^^)/pETDuet-l-/wA+pCDFDuet-l-fadD以及lpHZ1.43;2.pHZ1,97—377;3.pHZ1.97—atfA2;4.pHZ1.97—376;5.pHZl.97一atfAl;6.沒有質粒(對照)。圖12描述了各種大腸桿菌菌抹產生的脂肪酸乙酯(FAEE)的酰基組成。所述重組菌4朱是1.C41(DE3,4^^E4/^i)/pETDuet-l-^sA+pCDFDuet-l-fadD以及lpHZ1.43;2.pHZ1,97—377;3.pHZ1.97—atfA2;4.pHZ1.97—376;5.pHZ1.97一atfAl;6.沒有質粒(對照)。圖13描述了各種酯合酶在37。C制備的乙酯。乙酯是由攜帶各種酯合酶基因的重組大腸桿菌菌抹產生的。所述重組菌抹是1.C41(DE3,4/^^4A^i)/pETDuet-l-^A+pCDFDuet-l隱fadD以及lpHZ1.43;2.pHZl,97—377;3.pHZ1.97—atfA2;4.pHZl.97—376;5.pHZ1.97—atfAl;6.沒有質粒(對照)。圖14顯示了轉化體C41(DE3,4/^/£4/^")/pETDuet-1國&sA+pCDFDuet-1-fadD+pHZ1.97—atfA2t的三個單菌落產生的游離脂肪酸(FFA)和脂肪酸乙酯(FAEE)的濃度。FFA被轉化為脂肪酸乙酯(FAEE),經GC/MS定量。圖15的示意圖顯示了FabA和FabB的對照區。FadR和FabR共有結合部位用粗體顯示。垂直箭頭指示可以進行突變從而改變/a^4表達的位點。括弧指出了每個位點建議的堿基。構成典型大腸桿菌啟動子-35和-10區的兩個區域如括弧所示。還顯示了使啟動子與共有啟動子序列更接近的建議突變。圖16A和16B是GC/MS分析的色譜。圖16A描述轉化了質粒pCDFDuet-l畫fadD-WSadpl、pETDuet-l-,tesA的大腸桿菌菌4朱LS9001培養物的乙基4是取物色譜。圖16B顯示用作參照的棕櫚酸乙酯和油酸乙酯的色譜。圖17是質粒pOP-80的圖譜。圖18是SEQIDNO:l,pOP-80質粒的的全長DNA序列。圖19是SEQIDNO:2,大腸桿菌密碼子優化的y^/Z)"基因(登錄號NP—217021)的DNA序列。圖20是SEQIDNO:3,大腸桿菌密碼子優化的/^/ZX基因(登錄號NP—251989)的DNA序列。圖21是SEQIDNO:4,基于保存在NCBI的登錄號為NC一000964的DNA序列的BsyhfLBspHIF引物。圖22是SEQIDNO:5,基于保存在NCBI的登錄號為NC—000964的DNA序列的BsyhfLEcoR引物。圖23是SEQIDNO:6,來自枯草芽孢桿菌的基因的DNA序列。圖24是SEQIDNO:7,基于保存在NCBI的登錄號為NC—001141的DNA序列的Scfaa3pPciF引物。圖25是SEQIDNO:8,基于保存在NCBI的登錄號為NC—001141的DNA序列的Scfaa3pPcil引物。圖26是SEQIDNO:9,來自釀酒酵母FAA3基因的DNA序列(NP—012257)。圖27是SEQIDNO:10,基于保存在NCBI的登錄號為NZ—AAVZ01000044的DNA序列的Smprk59BspF引物。圖28是SEQIDNO:ll,基于保存在NCBI的登錄號為NZ—AAVZ01000044的DNA序列的Smprk59HindR引物。圖29是SEQIDNO:12,PrkBsp引物。圖30是SEQIDNO:13,編碼來自嗜麥芽窄食單胞菌R551-3的ZP—01644857蛋白質序列的DNA序列。圖31是SEQIDNO:14,來自嗜麥芽窄食單胞菌ATCC17679的ZP—01644857的蛋白質序列。縮寫和術i吾提供下列關于術語和方法的解釋是為了更好的描述本發明,并指導本領域普通技術人員實施本發明。本文使用的單數形式"一種(a或an)"或者"這種(the)"包括復數含義,除非上下文明確的另外指出。例如,提及"一種細胞"或"這種細胞"包括一個或多數個這類細胞。措辭"或除非上下文明確的另外指出。例如短語"硫酯酶活性或者脂肪醇形成酰基輔酶A還原酶活性"是指硫酯酶活性、脂肪醇形成酰基輔酶A還原酶活性或者脂肪醇形成酰基輔酶A還原酶活性和硫酯酶活性兩者的組合。此外,貫穿本說明書,可以以基因或酶的縮寫名稱來提及基因或酶,但應當理解為這種縮寫的基因或酶名稱代表一類基因或酶。例如,"/a《W是指編碼酶"FadD"的基因,以及編碼酰基輔酶A合酶(EC6.2.1,)的基因。這種基因名稱包括所有編碼相同肽和具有相同生理功能的同源酶的基因。這種酶名稱包括所有催化相同基本化學反應或者有相同活性的肽。圖1提供了各種縮寫的基因和肽名稱、對其活性的描述、以及它們的酶學分類號。這些可用于鑒定具有相關活性的該類酶的其他成員及其相關基因,以用于產生脂肪酸衍生物。除非另外解釋,所有本文使用的技術和科學術語與本發明所屬領域的普通技術人員通常的理解具有相同的含義。盡管與本文描述的類似或者等同的方法和材料可用于本發明的實施或者試驗,但下文描述了適合的方法和材料。所述材料、方法和實例只是說明性的,而不是用于限制。根據下面的發明詳述和權利要求,本發明的其他特征是明顯的。登錄號貫穿本說明書的登錄號來源于美國國立衛生研究院維護的NCBI數據庫(國立生物技術信息中心)。所述登錄號如該數據庫在2007年3月27日提供的。酶學分類號(EC):EC編號由國際生物化學與分子生物學聯合會命名委員會(NC-IUBMB,http:〃www.chem.qmu1.ac.uk/iubmb/enzyme)建立。本文提供的EC編號來自京都基因與基因組百科全書(KyotoEncyclopediaofGenesandGenomics)維護的KEGGLigand數據庫,該數據庫由東京大學部分資助。所述EC編號是2007年3月27日由該數據庫提供的。弱化減弱、減少或消除。在一個實例中,降低特定的酶對不是饋)的;靈敏度:從而使得所述酶活性不受化:物存在的影響。在另一個實例中,/flW/基因的表達是溫度敏感的,可以改變其序列從而降低對溫度波動的敏感性。當需要支鏈氨基酸時,可以將/aW/基因的表達弱化。在另一個實例中,經過修飾活性更低的酶可以稱作弱化的。可以利用對編碼酶的序列進行功能性修飾來弱化該酶的表達。序列修飾可以包括例如將基因序列或控制該基因序列的轉錄或翻譯的序35列突變、缺失或插入一或多個核苷酸,所述修飾減少或者抑制基因產物的產生,或者導致基因產物沒有功能。例如,大腸桿菌中/flW的功能性缺失減輕了脂肪酸生物合成途徑的抑制,允許大腸桿菌產生更多的不飽和脂肪酸(UFAs)。在某些情況下,功能性缺失被描述成敲除突變還有其他方法可以弱化酶的表達。例如,弱化可以通過以下技術實現:修飾編碼如上所述基因的序列;將基因置于活性較低的啟動子的控制下;表達針對目的基因的干擾RNA、核酶或反義序列;通過改變物理或化學環境,比如溫度、pH或溶液濃度,從而使得基因或基因產物不能達到最佳活性;或者通過本領域已知的任何其他技術。。生物燃料術語"生物燃料"是指來源于生物質的任何燃料。生物質是可以轉化為生物燃料的生物材料。生物質的一個示例性來源是植物材料。例如,玉米、甘蔗和柳枝稷可以作為生物質。生物質的另一個非限制性實例是動物材料,例如牛糞。生物質還包括工業、農業、林業和家庭廢料。這類可以作為生物質的廢料的實例是發酵廢料、稻草、木材、污水、垃圾和剩飯。生物質還包括碳源,比如碳水化合物(例如糖)。生物燃料可以取代基于石油的燃料。例如,生物燃料包括在運輸燃料(例如汽油、柴油、噴氣燃料等)、加熱燃料以及發電燃料之內。生物燃料是一種可再生能源。生物燃料的非限制性實例是來源于生物質的生物柴油、烴(例如烷烴、烯烴、炔或芳香烴)、以及醇。生物柴油生物柴油是一種生物燃料。生物柴油可以作為來源于石油的柴油的替代品。生物柴油可以采用純的形式(被稱為"純"生物柴油),或者以任何濃度與常規的石化柴油混合用于內燃柴油發動機中。生物柴油可以由烴或酯類構成。在一個實施方案中,生物柴油由脂肪酯,比如脂肪酸曱酯(FAME)或脂肪酸乙酯(FAEE)構成。在優選的實施方案中,構成這些FAME和FAEE的脂酰部分的碳鏈長度為約8-20、10-18或者12-16個^_。用作生物柴油的脂肪酯可能含有飽和或不飽和的碳鏈。生物原油(biocrude):生物原油是一種生物燃沖+。生物原油可以作為來源于石油的燃料的替代品。此外,生物原油和石油原油一樣,均可以轉化為其他燃料,例如汽油、柴油、噴氣燃料或燃料油(heatingoil)。而且,生物原油與石油原油一樣,可以轉化為其他工業上有用的化學品,用于例如制藥、化妝品、消費品、工業加工等。生物原油可以包括例如烴、烴產品、脂肪酯以及/或者脂肪族酮。在優選的實施方案中,生物原油由烴,例如脂肪(例如,烷烴、烯烴、炔)或芳香烴構成。碳源通常指適合作為原核或者簡單真核細胞生長的碳源的底物或者化合物。碳源可以是各種形式,包括但不限于多聚體、碳水化合物、酸、醇、醛、酮、氨基酸、肽、氣體(例如CO和C02)等。這些包括,例如,各種單糖,如葡萄糖、果糖、甘露糖和半乳糖;寡糖,如果糖-寡糖和半乳糖-寡糖;多糖,如木糖和阿拉伯糖;二糖,如蔗糖、麥芽糖和松二糖;纖維素物質,如甲基纖維素和羧曱基鈉纖維素;飽和或者不飽和的脂肪酸酯,如琥珀酸酯、乳酸酯和乙酸酯;醇,如乙醇等,或者它們的混合物。此外,碳源還可以是光合作用產物,包括但不限于葡萄糖。流體濁點在該溫度,溶解的固體不再完全可溶,聚集為第二相,使流體看上去渾濁。這個術語與結果不同的幾種應用有關。在石油工業中,濁點指的的是這樣的溫度,在該溫度下,蠟或其他重烴在原油、提煉油或燃料中結晶,形成渾濁的外觀。固化蠟的存在會影響流體的流動性能、堵塞濾清器/噴射器等的傾向、蠟在涼的表面上的沉積(例如管道或熱交換器污垢),甚至與水的乳化特性。濁點是在冷的操作溫度時,油堵塞濾清器或小孔的趨勢的指標。非離子表面活性劑或乙二醇溶液的濁點是混合物開始分相并出現兩個相,因此變得渾濁的溫度。這一性態是含有聚環氧乙烷鏈的非離子表面活性劑的特性,聚環氧乙烷鏈在水中表現出相對溫度性態的反向溶解,因此隨著溫度提高在某個點會"變濁(cloudout)"。表現這一性態的乙二醇被稱為"濁點乙二醇",并用作頁巖抑制劑。鹽度會影響濁點,在鹽分越高的流體中濁點通常越低。降^f氐濁點的添加劑可以加入組合物使如上所述的溶液的濁點降37低或下降的添加劑。可檢測的其存在(existence或presence)能夠得以確定的。例如,利用以下提供的方法,來自反應物的產物的產生(例如ds脂肪酸的產生)是可檢測的。內源的用于本文提及核酸分子和特定的細胞或者孩史生物時,"內源的"是指位于細胞內的且不是利用重組工程技術導入細胞的核酸序列或者肽。例如,當細胞最初從自然界分離時,已經存在于所述細胞中的基因。即使調控序列,諸如能夠激活轉錄或者翻譯的啟動子或者增強子序列已經通過重組技術被改變,基因仍被認為是內源的。酯合酶酯合酶是能夠產生脂肪酯的肽。更具體地說,酯合酶是能夠將硫酯轉化為脂肪酯的肽。在優選的實施方案中,酯合酶將硫酯、酰基輔酶A轉化為脂肪酯。在可選的實施方案中,酯合酶利用硫酯和醇作為底物產生脂肪酯。酯合酶能夠利用短鏈和長鏈酰基輔酶A作為底物。此外,酯合酶能夠利用短鏈和長鏈醇作為底物。酯合酶的非限制性實例是蠟合酶、蠟-酯合酶、酰基輔酶A:醇轉酰基酶、酰基轉移酶和脂酰輔酶A:脂肪醇酰基轉移酶。示例性的酯合酶分類到酶分類號EC2.3.1.75中。圖l提供了示例性的GenBank登錄號。外源的用于本文提及核酸分子和特定的細胞時,"外源的"是指不是來源于自然界發現的特定細胞的任意核酸分子。例如,"外源DNA"可以指插入樣i生物基因組DNA序列的DNA序列,或者導入孩l生物的染色體外核酸序列。因此,一旦非天然存在的核酸分子被導入細胞,則其凈皮認為是外源的。對特定細胞來說,天然存在的核酸分子也可以是外源的。例如,一旦從大腸桿菌DH5ct細胞分離的完整編碼序列被導入第二個大腸桿菌DH5ot細胞,則該編碼序列對于第二個細胞來說是外源核酸,即使它們都是DH5a細胞。表達基因中的可遺傳信息,諸如DNA序列被轉變為功能性基因產物,諸如蛋白或RNA的過程。基因表達過程中的多個步驟可以被調節,包括轉錄步驟、翻譯步驟以及所產生的蛋白質的翻譯后修飾。基因調控使細胞能夠控制其結構和功能,是任何生物細胞分化、形態發生和多樣性以及適應性的基礎。基因調控還可以作為進化改變的基礎,因為對基因表達的時機、位置和量的控制對生物中基因的功能(作用)有深遠的影響。表達的基因包括被轉錄為信使RNA(mRNA)然后被翻譯為蛋白質的基因,以及被轉錄為RNA類型的基因,所述RNA類型如不被翻譯為蛋白質的轉移RNA(tRNA)、核醣體RNA(rRNA)和調節RNA)。脂肪酯脂肪酯屬于酯類。在優選實施方案中,脂肪酯是任何由脂肪酸制備的酯,例如脂肪酸酯。在一個實施方案中,脂肪酯含有A側(即連接在羧酸氧上的碳鏈)和B側(即包含親本羧酸酯的碳鏈)。在優選實施方案中,當脂肪酯來源于脂肪酸生物合成途徑時,A側來自醇,B側來自脂肪酸。任何醇都可以用于形成脂肪酯的A側。例如,醇可以來源于脂肪酸生物合成途徑。可選地,可以通過非脂肪酸生物合成途徑來產生醇。而且,醇可以是外源提供的。例如在脂肪酯是由生物產生的情況下,醇可以在發酵液中提供。可選地,在脂肪酯是由同時能產生醇的生物產生的情況下,可以提供外源的羧酸,諸如脂肪酸或乙酸u包含A側或B側的碳鏈可以是任意長度。在一個實施方案中,酯的A側在長度上為至少約1、2、3、4、5、6、7、8、10、12。、14、16或18個碳。酯的B側在長度上為至少約4、6、8、10、12、14、16、18、20、22、24或26個碳。A側和/或B側可以是直鏈或支t連。支鏈可以有一或多個分支點。此外,支鏈可以包括環形分支。再者,A側和/或B側可以是々包和或不々包和的。如果是不々包和的,A側和/或B側可以有一或多個不々包和位點。在一個實施方案中,脂肪酯是通過生物合成制備的。在這個實施方案中,首先脂肪酸被"激活"。"激活的"脂肪酸的非限制性實例是酰基輔酶A、酰基-ACP和酰基磷酸酯。酰基輔酶A可以是脂肪酸生物合成或降解的直接產物。此外,可以由游離脂肪酸、輔酶A和腺香核苷酸三磷酸(ATP)合成酰基輔酶A。產生酰基輔酶A的酶的實例是酰基輔酶A合酶。脂肪酸;波激活后,可以容易地轉移到受體親核分子上。示例性的200880009283.9說明書第17/96頁親核分子是醇、巰醇或磷酸酯。在另一個實施方案中,所述脂肪酯可以來源于脂酰基硫酯和醇。在一個實施方案中,所述脂肪酯是蠟。蠟可以來源于長鏈醇和長鏈脂肪酸。另一個實施方案中,脂肪酯是脂肪酸硫酯,例如脂酰輔酶A。在其他實施方案中,所述脂肪酸酯是脂肪酰基泛酸酯、酰基載體蛋白(ACP)或者脂肪磷酸酯。脂肪酯有很多用途。例如,脂肪酯可以用作生物燃料或表面活性劑。脂肪酸衍生物術語"脂肪酸衍生物"包括部分由生產宿主生物的脂肪酸生物合成途徑產生的產物。"脂肪酸衍生物"還包括部分由酰基-ACP或酰基-ACP衍生物產生的產物。脂肪酸生物合成途徑包括脂肪酸合酶,其可以按照本文的描述進行工程改造產生脂肪酸衍生物,以及在一些實例中其可以與其他酶一起表達,產生具有所需碳鏈特性的脂肪酸衍生物。示例性的脂肪酸衍生物包括例如短鏈和長鏈醇、烴以及脂肪醇和酯,包括蠟、脂肪酸酯或脂肪酯。脂肪酸衍生物酶(fattyacidderivativeenzymes):在脂肪酸衍生物產生過程中表達或超表達的所有酶在文中均統稱為脂肪酸衍生物酶。這些酶可以是脂肪酸生物合成途徑的一部分。脂肪酸衍生物合酶的非限制性實例包括脂肪酸合酶、硫酯酶、酰基輔酶A合酶、酰基輔酶A還原酶、醇脫氫酶、醇乙酰轉移酶、脂肪醇形成酰基輔酶A還原酶以及酯合酶。脂肪酸衍生物酶將底物轉化為脂肪酸衍生物。在某些實例中,底物可以是脂肪酸衍生物,脂肪酸衍生物酶將其轉化為不同的脂肪酸AT生物。脂肪醇形成肽能夠催化酰基輔酶A轉化為脂肪醇的肽,包括脂肪醇形成酰基輔酶A還原酶(FAR,EC1.1.1*)、酰基輔酶A還原酶(EC1.2.1.50)或者醇脫氫酶(EC1.1.1.1)。此外,本領域普通技術人員應當理解某些脂肪醇形成肽也能催化其他反應。例如,某些酰基輔酶A還原酶肽除了脂肪酸以外,也接受其他底物。因此,這類非特異性的肽也包括在內。編碼脂肪醇形成肽的核酸序列在本領域內是已知的,公眾可以獲取這類肽。圖1中提供了示例性的GenBank登錄號。40現代碳分數現代碳分數(fM)是由國家標準和技術研究院(NIST)標準參考物質(SRMs)4990B和4990C定義的,分別稱為草酸標準HOxI和HOxII。基本概念涉及14C/12CA同位素比率HOxI(參考AD1950)的0.95倍。這大概等同于經衰變修正的前工業革命時代的木頭。對于當前的生物圈(植物材料)而言,fM約為1.1。烴包括含有碳(C)元素和氫(H)元素的化合物。所有爛均由碳骨架以及該骨架上連接的氫原子構成。有時,該術語被用作術語"脂肪烴"的簡稱。基本上存在3種類型的烴(l)芳香烴,其具有至少約一個芳香環;(2)飽和烴,亦稱為烷,其缺少雙鍵、三鍵或者芳香鍵;和(3)不飽和烴,其在碳原子之間具有一個或者多個雙鍵或者三鍵,包括烯烴(例如二烯)和炔。分離的"分離的"生物學組分(諸如核酸分子、蛋白或者細胞)是已經基本上與該組分天然存在的其他生物學組分中分離或者純化出來的生物學組分,如其他染色體和染色體外DNA序列;染色體和染色體外RNA;以及蛋白質。已經被"分離的,,核酸分子和蛋白包括通過標準純化方法純化的核酸分子和蛋白。該術語還包含在生產宿主細胞中通過重組表達制備的核酸分子和蛋白,以及化學合成的核酸分子和蛋白。在一個實例中,分離的是指這樣的天然存在的核酸分子,該核酸序列和3'端的序列)不再相鄰。微生物包括來自古細菌域、細菌域和真核生物域的原核和真核微生物物種,后者包括酵母和絲狀真菌、原生動物、藻類或者更高等的原生生物。術語"微生物細胞"和"微生物(microbes)"可以與名詞微生物(microorganism)互換使用。核酸分子涵蓋RNA和DNA序列,其包括但不限于cDNA、基因組DNA和mRNA。該名詞包括合成的核酸分子,諸如那些化學合成或者重組產生的核酸分子。核酸分子可以是雙鏈或者單鏈的。單鏈時,核酸分子可以是有義鏈或者反義鏈。此外,核酸分子可以是環狀或者線性的。可操作地連接當第一核酸序列與第二核酸序列具有功能關系時,第一核酸序列即是可操作地連接第二核酸序列。例如,如果啟動子處于能夠影響編碼序列的轉錄或者表達的位置,則所述啟動子是可操作地連接所述編碼序列。通常,可操作地連接的DNA序列是相鄰的,并且將兩個蛋白編碼區連接到相同的閱讀框內。轉錄為串聯的單個信使RNA的分離基因的結構用操縱子表示。例如在質粒載體中,將基因緊鄰地置于單個啟動子的轉錄調節下,則構成合成操縱子。ORF(可讀框)不含任何終止密碼子的一系列編碼氨基酸的核普酸三聯體(即密碼子)。這些序列通常^c翻譯為肽。超表達當肽在重組宿主細胞中的濃度比它在相同物種的非重組宿主細胞中的濃度高時。利用本領域已知的任何方法均可以實現超表達。例如,引起超表達可以通過改變宿主細胞基因組DNA序列的調控序列、向基因組DNA序列導入一或多個編碼序列、改變與基因表達的調控有關的一或多個基因(例如,使阻抑物基因缺失或者產生活躍的激活劑)、導入染色體外核酸序列、通過導入穩定序列來增加轉錄的RNA的穩定性,以及這些方法的組合。過量產生肽的重組微生物的實例包括表達編碼酰基輔酶A合酶9(EC6.2.1,)的核酸序列的孩i生物。其他實例包括在硫酯酶肽(EC3.1.2,)的內源編碼序列上游導入了外源啟動子序列的微生物。超表達還包括基因的翻譯速率高于該基因的內源翻譯速率。4會測超表達的方法在本領域內公知的。例如可以利用rtPCR來評價轉錄的RNA水平,以及利用SDS-PAGE凝膠分析來評價蛋白水平。分配系數分配系數P定義為化合物在有機相中的平衡濃度除以平衡時水相(例如發酵液)中的濃度。在本文描述的兩相系統的一個實施方案中,有機相由產生過程中的脂肪酸衍生物形成。但是在某些實例中,可以比如通過提供一層辛烷來促進產物的分離提供有機相。描述兩相系統時,分配系數P通常以logP來討論。logP為1的化合物將以10:1分配到有機相中。logP為-l的化合物將以1:10分配到有才幾相中。通過選4奪合適的發酵液和有機相,高logP值的脂肪酸衍生物即使在發酵罐中的濃度非常低,也會分離到有機相中。生產宿主生產宿主是用于產生本文所述產品的細胞。正如本文所公開的,生產宿主經修飾從而表達或超表達所選基因,或者所選基因的表達被弱化。生產宿主的非限制性實例包括植物、動物、人、細菌、酵母或絲狀真菌細胞。啟動子和增強子真核生物中的轉錄調控信號包含"啟動子"和"增強子"元件。啟動子和增強子由短的DNA序列構成,這些序列與參與轉錄的細胞蛋白特異性地相互作用(Maniatis"a/.,Scz'ewce236:1237,1987)。已經從包括酵母、昆蟲、哺乳動物和植物細胞的基因的大量真核生物來源分離到了啟動子和增強子元件。還從病毒中分離到啟動子和增強子元件。在原核生物中也發現了類似的控制元件,比如啟動子和增強子。選擇特定啟動子和增強子取決于用于表達目的蛋白的細胞類型。某些真核和原核啟動子和增強子的生產宿主范圍廣范,而其他的〗又在有限的生產宿主細^^中有功能(參見例如,Voss&a/.,7Vew心所oc/^m.Sc/"11:287,1986以及Maniatis等,1987,同前)。術語"啟動子元件"、"啟動子"或者"啟動子序列"是指象開關一樣激活基因的表達的DNA序列。如果基因被活化,就說它被轉錄或者參與轉錄。轉錄涉及由基因合成mRNA。因此,啟動子充當轉錄控制元件,并且為基因轉錄為mRNA提供起始位點。純化的名詞"純化的"是指通過例如提取或分離從自然環境中移走的分子。"基本上純的"分子60%不含至少約、優選不含至少約75%,更優選不含至少約卯°/。與其天然結合的其他成分。本文中使用的術語"純化的"或者"純化"也指從樣品中除去污染物。例如,除去污染物可以導致樣品中目的脂肪酸衍生物的百分比提高。例如,在植物、細菌、酵母或哺乳動物生產宿主細胞中表達脂肪酸衍生物之后,通過除去生產宿主細胞蛋白質使脂肪酸衍生物得以純化。純化后,提高了樣品中脂肪酸的百分比。術語純化的并不要求絕對的純;它只是作為一個相對的名詞。因此,例如,純化的脂肪酸衍生物制品是指其中的產物比位于其細胞環境內的產物濃度更高的制品。例如,純化的脂肪酯是指和與之相伴的細胞組分(例如,核酸、脂、糖和其他肽)基本上分離的脂肪酯。在另一個實例中,純化的脂肪酯制品是指基本上不含污染物(諸如那些發酵后可能存在的污染物)的脂肪酯制品。例如,當按重量計至少約50%的樣品由脂肪酯組成時,脂肪酯是純化的。在另一個實例中,當至少約60%、70%、80%、85%、90%、92%、95%、98%或者99%或者更高重量比的樣品由脂肪酯組成時,脂肪酯是純化的。重組體重組核酸分子具有非天然存在的序列,具有將兩個否則是分開的序列片段通過人工組合制備的序列,或者以上兩者。例如可以通過化學合成或者通過諸如遺傳工程技術人工操作核酸分子的分離片段,實現這種人工組合。重組體還用于描述這樣的核酸分子,這些核酸分于已進行過人工操作,但包含的調控序列和編碼區與分離所述核酸的生物中見到的相同。重組蛋白是來源于重組核酸分子的蛋白質。重組或轉化細胞是通過例如分子生物學技術導入了重組核酸分子,諸如酰基輔酶A合酶編碼核酸序列的細胞。轉化涵蓋將核酸分子導入比如細胞的所有技術,包括但不限于用病毒載體進行轉染、接合、用質粒載體進行轉化,以及通過電穿孔、脂質體轉染和微粒槍轟擊(particlegunaccelemtion沐導入棵DNA。序列同一性用序列間共有的序列同一性來表示兩個核酸序列或者兩個氨基酸序列之間的相似性。序列同一性一般以同一性百分比來表示。同一性百分比越高,兩個序列越相似。用于本發明,術語"同一性"和"相似性,,可以互換。比對序列以進行比較的方法是本領域公知的。各種程序和比對算法描述于Smith&Waterman,力dv.^p;/.Tl/aA.2:482,1981;Needleman&Wunsch,Afo/.丑/o厶48:443,1970;Pearson&Lipman,iVoc.TVaf/.顛AScZ腦85:2444,1988;Higgins&Sharp,G匿73:237244,1988;Higgins&Sharp,G"/OS5:151-153,1989;Corpetetal,M/c/dc爿c^We廳Ar/z16:10881-10890,1988;Huangetal.,05/058:155-165,1992;以及Pearsonetal"Me/Zzot^&飾/ecw/a^5油gy24:307-331,1994中。Altschuletal"Mo/,腸/.215:403-410,1990提供了對序列表達方法和同源性計算的詳細考慮。200880009283.9說明書第22/96頁NCBI基礎局部序列比對搜索工具(BasicLocalAlignmentSearchTool,BLASTTM;Altschuletal.,Mo/.215:403-410,1990)可以從包括國家生物技術信息中心(NCBI,Bethesda,MD)在內的多個來源獲取,與序列分析程序blastp、blastn、blastx、tblastn和tblastx4關用。BLASTTM可以由互聯網上的NCBI網址接入。如本文所用的,序列同一性通常是用設定為默認參數BLASTTM軟件的確定。例如,可以利用blasto(2.0版本)軟件,使用默認參數(例如,期望值=10,矩陣=BLOSUM62,篩選(filter)=DUST(TatusovandLipmann,inpreparationasofDecember1,1999;和HancockandArmstrong,Compiit.Appl.Biosci.10:67-70,1994),缺口存在罰分(gapexistencecost)=ll,每殘基缺口罰分(perresiduegapcost)=1,以及人比率=0.85)。比較兩個多肽時,可以使用blastp(2.0版本)軟件,默認參數(例如,期望值=10,篩選=SEG(WoottonandFederhen,Com/w/^sz'wC7em旨jK17:149-163,1993),矩陣-BLOSUM62,缺口存在罰分=11,每殘基缺口罰分=1,1=0.85)來確定兩個核酸序列之間的序列同一性。對于核酸序列的比較,采用RT,ASTtm程序的"Blast2序列"功能(Blastn),使用設定為默認參數(打開缺口的罰分(costtoopenagap)[默認值=11];延伸缺口罰分[默認值=1];期望值(E)[默認值=10.0];字長[默認值=11];單線描述值(numberofone-linedescriptions)(V)[默認值=100];顯示的比對數(B)[默認值=100])的默認的BLOSUM62矩陣。當用這個方法進行評價時,與參照序列相似性越高的核酸序列會顯示增加的序列同一性百分比,如至少約45%,至少約60%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%或至少約98%,或至少約99%的序列同一性。對于超過約30個氨基酸的氨基酸序列的比較,采用BLASTtm程序的"Blast2序列"功能,使用設定為默認參數(例如,缺口存在罰分為11,以及每殘基缺口罰分為1)的默認BLOSUM62矩陣。當比對短肽(例如,少于約30個氨基酸)時,比對應當利用Blast2序列功能,采用設定為默認參數(例如,打開缺口罰分為9,延伸缺口罰分為l)的PAM30矩陣進行。當用這個方法進行評價時,與參照序列相似性越高的蛋白45質會顯示增加的同一性百分比,如至少約35%、至少約45%、至少約50%、至少約60%、至少約80%、至少約85%、至少約90%、至少約95%或至少約98%,或至少約99%的序列同一性。表面活性劑能夠降低溶解有該物質的液體之表面張力的物質。它們通常由水溶性的頭部和烴鏈或尾部組成。水溶性頭部是親水性的,可以是離子的或者非離子性的。烴鏈是疏水性的。表面活性劑被用于大量產品,包括去污劑和清潔劑,還可用作紡織品、皮革和紙的輔劑,用于化工工藝、化妝品和藥物、食品業以及農業。此外,它們還可以用于輔助提取和分離處于難以接近環境的原油或者作為水乳膠。根據用途的不同有4類表面活性劑。陰離子表面活性劑具有去污劑樣活性,通常用于清潔用途。陽離子表面活性劑包含長鏈烴,通常被用于處理蛋白和合成的多聚體或者作為織物柔軟劑和護發素的成分。兩性表面活性劑也包含長鏈經,一般用于洗發劑。非離子型表面活性劑通常用于清潔產品。合酶合酶是催化合成過程的酶。本文所用該術語包括合酶和合成酶。轉運蛋白協助一或多個化合物進和/或出生物或者細胞器的運動的蛋白質。在某些實施方案中,生產宿主功能性地表達編碼ATP結合盒(ABC)轉運蛋白的外源DNA序列,從而所述生產宿主將脂肪酸衍生物運輸到培養基中。許多生物中都有ABC轉運蛋白,諸如秀麗隱桿線蟲(Caewor/za6d"^e/egaws)、才以南芥、真養產石成4干菌(J/ca/Zgew&sew《,/ms)(后來重新命名為i"/Wom.flew的//zfl)或紅平紅球菌(i^odococc^eo^Ara;o//s)。ABC轉運蛋白的非限制性實例包括CER5、AtMRP5、AmiS2和AtPGPl。在優選實施方案中,ABC轉運蛋白是CER5(例如AY734542).在其他實施方案中,所述轉運蛋白是選自下述的外排蛋白來自大腸4干菌的AcrAB、ToIC、或AcrEF或者來自77^nwoj7"ec/ococa^e/owg^t^BP誦I的t111618、till619和t1110139。在其他實施方案中,轉運蛋白是選自黑腹果蠅CDm^;/n7flme/awoga^w)、秀麗隱桿線蟲、結核分枝桿菌或酉良酒酵母或任何本領46域/〉知的任一哺乳動物FATPs的脂肪酸轉運蛋白(FATP)。在允許產生產物的條件下允許生產宿主產生所需產物的任何發酵條件,所述產物如酰基輔酶A,或脂肪酸衍生物,如脂肪酸、烴、脂肪醇、蠟或者脂肪酯。發酵條件通常包含許多參數。示例性的條件包括但不限于,溫度范圍、通氣水平和培養基成分。上述條件的每一項單獨和組合時允許生產宿主生長。示例性的培養基包括培養液或者凝膠。通常,培養基包括可以被微生物直接代謝的碳源,如葡萄糖、果糖、纖維素等等。此外,可以在培養基中可以使用促進碳源的流通(例如,將淀粉或纖維素解聚成可發酵的糖)及隨后的代謝的酶。為了確定培養條件是否允許產物生成,將生產宿主培養約4、8、12、24、36或者48小時。在培養過程中或者培養后,收集并分析樣品以確定培養條件是否允許產物生成。例如,可以檢測培養生產宿主的樣品或者培養基中的生產宿主是否存在所需產物。當分析產物是否存在時,可以使用諸如但不限于TLC、HPLC、GC/FID、GC/MS、LC/MS、MS以及以下實例提供的測定。載體被導入細胞從而產生轉化細胞的核酸分子。載體可以包括允許其在細胞中復制的核酸序列,諸如復制原點。載體還可以包括一種或多種選擇性記基因和本領域已知的其他基因元件。蠟蠟由脂肪酯構成。在優選實施方案中,脂肪酯含有由中到長》1鏈構成的A側和B側。除了脂肪酯以外,蠟可以包含其他成分。例如,蠟也可以包含烴、甾醇酯、脂肪醛、醇、酮、p-二酮、三酰甘油等。發明詳述許多細胞或微生物可以利用脂肪酸作為能量來源,因此含有代謝脂肪酸產生能量的p-氧化途徑。令人驚訝的是,發現超表達具有酰基輔酶A合酶活性(p-氧化途徑中第一個發現的酶活性)的肽,和/或弱化(3-氧化途徑中的其他基因,會在維持細胞或微生物的生存力的同時,提高所產生的酰基輔酶A的量。同樣,超表達具有酰基輔酶A合酶活47性的肽,結合超表達形成脂肪酸衍生物的肽,可以提高脂肪酸衍生物的產量。脂肪酸衍生物可用作生物燃料和特種化學品(specialtychemicals),后者可以用于制備其他產品,諸如營養補充劑、多聚體、石蠟替代品和個人護理用品。此外,本文公開的教導使得可以產生具有特定分枝點、飽和度以及碳鏈長度的脂肪酸衍生物。可以用作生產宿主來產生脂肪酸衍生物的微生物的非限制性實例包括細菌、酵母菌或絲狀真菌。其他合適的生產宿主的非限制性實例包括植物、動物或人細胞。可以由本文所述的生產宿主來產生醇(短鏈、長鏈、支鏈或不飽和的)。這些醇可以直接作為燃料或者可以用于產生脂肪酯。脂肪酯單獨或者與本文描述的其他脂肪酸衍生物組合作為燃料。同樣,由本文所述的生產宿主產生的烴可以作為生物燃料。這些烴基燃料可以設計成含有分枝點、限定的飽和度和特定的碳鏈長度。當單獨用作生物燃津+或者與其他脂肪酸衍生物組合時,烴可以與添加劑或其他傳統燃料(例如,醇、來源于三甘油酯的柴油和基于石油的燃料)組合。Knothe,Fwe/iVoc簡72g7fec/mo/ogy86:1059-1070,2005中描述了各種脂肪酸酯的十六烷值(CN)、粘度、熔點和燃燒熱,該文獻通過引用全文并入本文。利用本文提供的教導,可以將生產宿主工程改造為產生Knothe所述的任何脂肪酯。I.脂肪酸衍生物的制備和提高產量的修飾可以將用于產生酰基輔酶A和/或脂肪酸衍生物的生產宿主進行重組修飾從而包括超表達肽的核酸序列。例如,可以修飾生產宿主來提高酰基輔酶A的產量,減少脂肪酸衍生物和脂肪酸生物合成途徑中的中間體如酰基輔酶A的代謝,或者減少脂肪酸生物合成途徑中特定點的反饋抑制。除了修飾本文描述的基因外,也可以將其他細胞資源轉為過量產生脂肪酸,例如可以弱化乳酸酯、琥珀酸酯和/或乙酸酯途徑,而過超表達乙酰輔酶A羧化酶(acc)。對本文描述的生產宿主的修飾可以通過基因組改變、添加重組表達系統或者其組合來實現。圖2-圖6展示了所涉及的脂肪酸生物合成途徑。以下A-G部分描述了這些途徑中的步驟。途徑中的不同步驟由不同酶催化。每個步驟都是超表達基因產生更多酶,從而驅使產生更多脂肪酸和脂肪酸衍生物的潛在位點。該途徑所需的編碼酶的基因也可以重組加入缺乏該基因的生產宿主。最后,為了提高目的產品的產量,可以弱化或阻斷會與產生脂肪酸和脂肪酸衍生物的途徑竟爭的步驟。A.乙酰輔酶A-丙二酰輔酶A到酰基-ACP脂肪酸合酶(FAS)是一組催化酰基鏈起始和延伸的肽(Marrakchiafl/.'歷oc/^抓'ca/Soc/W乂30:1050-1055,2002)。酰基載體蛋白(ACP)與FAS途徑中的酶一起控制所產生的脂肪酸的長度、飽和度和分支情況。該途徑中的步驟由脂肪酸生物合成(/a的和乙酰輔酶A羧化酶(flcc)基因家族的酶催化。根據期望的產物,可以弱化或者超表達這些基因中的一或多個(有關每個酶的酶活性的詳細描述及其酶學分類號,參見圖1)。1.脂肪酸生物合成途徑乙酰輔酶A或丙二酰輔酶A到酰基ACP生產宿主中的脂肪酸生物合成途徑4吏用前體乙酰輔酶A和丙二酰輔酶A(圖1)。該途徑中的步驟由脂肪酸生物合成(/^>)和乙酰輔酶A羧化酶(acc)基因家族的酶催化。HeathW/Vog.丄—40(6):467-97(2001)中描述了這個途徑,在此將該文獻通過引用全文并入。乙酰輔酶A^皮乙酰輔酶A羧4b酶(Acc,由四個分開的基因ac^5CD編碼的多亞基酶)羧化,形成丙二酰輔酶A。丙二酸基團由丙二酸-輔酶A:ACP轉酰基酶(FabD)轉移給ACP形成丙二酰ACP。然后發生縮合反應,丙二酰ACP與乙酰輔酶A結合形成p-酮脂酰ACP。卩-酮脂酰ACP合酶III(FabH)啟動FAS循環,而P-酮脂酰ACP合酶I(FabB)和P-酮脂酰ACP合酶II(FabF)參與隨后的循環。接下來重復這一輪步驟,直到制成合適長度的飽和脂肪酸。首先p-酮脂酰ACP被NADPH還原形成P-羥酰ACP。這個步驟由P-酮脂酰ACP還原酶(FabG)催化。然后|3-羥酰ACP脫水形成反式-2-烯酰-ACP。(3-羥酰ACP脫水酶/異構酶(FabA)或(3-羥酰ACP脫水酶(FabZ)催化這個步驟。NADPH依賴性反式-2-烯酰-ACP還原酶I、II或III(分別為Fabl、FabK和FabL)還原反式-2-烯酰-ACP,形成酰基ACP。(3-酮脂酰-ACP合酶I或P-酮脂酰-ACP合酶II(分別為FabB和FabF)催化的丙二酰-ACP和酰基-ACP的縮合起始隨后的循環。2.修飾脂肪酸生物合成途徑以提高酰基ACP產量可以對生產宿主生物進行工程改造以過量產生乙酰輔酶A和丙二酰輔酶A。這類生產宿主生物包括植物、動物或人細胞。微生物,如細菌、酵母菌或絲狀真菌,可以用作生產宿主。可以作為生產宿主的微生物的非限制性實例包括大腸桿菌、釀酒酵母、解脂假絲酵母、大腸桿菌、節桿菌AK19、粘紅酵母、不動桿菌(A7'"^^fl"wsp.)菌林M-l、解脂假絲酵母和其他產油微生物。可以對生產宿主組合或者單獨地進行幾種不同的修飾以實現乙酰輔酶A/丙二酰輔酶A/脂肪酸和脂肪酸衍生物產量的提高。例如,為了提高乙酰輔酶A產量,可以在生產宿主中表達以下基因中的一或多個/^/、p朋^:、ace五F(編碼丙酮酸鹽和酮戊二酸脫氫酶復合體中的Elp脫氳酶成分和E2p二氫石克辛酰胺酰基轉移酶成分)、/aW/、/aW)、/a6G、acpP,/a6F。在其他實例中,可以在生產宿主中表達其他編碼脂肪酰輔酶A還原酶和醛脫羰基酶的DNA序列。本領域公知的是,可以構建含有一或多個以上提及的基因的質粒,其中,這些基因受到組成型或者否則是可調控的啟動子的控制。這些基因的示例性GenBank登錄號是pW(BAB34380,AAC73227,AAC73226)、;aw^:(又稱為coaA,AAC76952)、(AAC73227,AAC73226)、/aW/(AAC74175)、/WD(AAC74176)、/a6G(AAC74177)、(AAC74178)、/"6尸(AAC74179)。此外,可以通過用條件復制的或者不復制的質粒轉化,所述質粒含有相應基因的無效突變或者缺失突變,或者通過取代啟動子或增強子序列,可以降低或者敲除工程微生物中/加五、gp^、W/l4、p/7Z)、ad/^、;/a、;ox8、acL4和/或acA:5的表達水平。這些基因的示例性GenBank登錄號是(AAC73325)、gM」(AAC76632)、W/l4(AAC74462)、;j76(AAC73989)、fl^五(AAC74323)、pM(AAC75357)、尸ox8(AAC73958)、ac^(AAC75356)和acA:S(BAB81430)。所得到的50工程生產宿主在合適的環境下生長時,乙酰輔酶A產量水平增加。而且,通過用全新合成的質粒中包括的accvl&0)(例如登錄號AAC73296,EC6.4.1.2)工程改造生產宿主,可以影響丙二酰輔酶A的過量產生。在全新合成的質粒中再包含編碼酯酶的DNA序列(例如,登錄號CAA89087、CAA98876)可以實現脂肪酸的過量產生。結果,在某些實例中,乙酰輔酶A羧化酶被超表達使得其胞內濃度相對天然表達水平提高至少約2倍,優選至少約5倍,或者更優選至少約10倍。此外,可以利用p&5(例如,登錄號AAC77011)D311E突變提高可用的酰基輔酶A的量。此外,可以在生產宿主中包含sfa基因(FabA的抑制基因,例如登錄號AAN79592)的過超達以提高單不飽和脂肪酸的產量(Rockda/.,丄5a"en'o/ogy178:5382-5387,1996)。B.酰基-ACP到脂肪酸1.脂肪酸生物合成途徑酰基ACP到脂肪酸如上文所述,乙酰輔酶A和丙二酰輔酶A經過幾個步驟的加工形成酰基ACP鏈。酶sw-甘油-3-磷酸酰基轉移酶(PlsB)催化酰基基團從酰基ACP或酰基輔酶A到甘油-3-磷酸的sn-1位點的轉移。因此,PlsB是磷脂合成即脂肪酸途徑的一部分中的關鍵調節酶。抑制PlsB會導致長鏈酰基ACP水平增加,這個反饋將抑制該途徑中的早期步驟(例如,accABCD、fabH和fabl)。通過例如斬u酯酶超表達將這個調控解偶聯,使得脂肪酸產量增加。^s和/W基因家族表達硫酯酶。Fabl在體外也被長鏈酰基輔酶A抑制。2.修飾脂肪酸生物合成途徑產生需要的脂肪酸為了工程改造產生均質脂肪酸衍生物群體的生產宿主,可以使一或多個內源基因弱化或功能性缺失,結果,可以表達一或多種硫酯酶。例如,可以通過弱化使用C1S:I-ACP的硫酯酶ds(例如,登錄號AAC73596和P0ADA1)并表達使用d。-ACP的硫酯酶C,。(例如,登錄號Q39513)來產生do脂肪酸衍生物。這樣產生相對均質的、碳鏈長度為10的脂肪酸衍生物群體。在另一個實例中,可以通過弱化產生非C14脂肪酸的內源硫酯酶并表達登錄號Q39473的硫酯酶(其使用Cw-ACP)來產生Cm脂肪酸衍生物。仍然在另一個實例中,通過表達使用C12-ACP的硫酯酶(例如登錄號Q41635)并弱化產生非C,2脂肪酸的硫酯酶來產生Cu脂肪酸衍生物。利用本領域已知的方法,例如在細胞裂解后利用i文射性前體、HPLC和GC-MS,可以-瞼證乙酰輔酶A、丙二酰輔酶A和脂肪酸的過量產生。表1列出了可用于請求保護的方法和生產宿主的疏酯酶的非限制性實例。表l:>琉酯酶<table>tableseeoriginaldocumentpage52</column></row><table>承Mayer"a/"皿C尸/贈5油gy7:1-11,2007.C.脂肪酸到酰基輔酶A1.脂肪酸轉化為酰基輔酶A酰基輔酶A合酶(ACS)通過一個兩步機制將游離脂肪酸酯化成酰基輔酶A。游離脂肪酸首先借助ATP焦磷酸解作用轉化成酰基AMP中間體(腺香酸)。然后腺苷酸中被活化的羰基碳與輔酶A的巰基偶合,釋放出AMP和酰基輔酶A終產物。參見ShockeyWa/,尸/a欣尸/o^zV/.129:1710-1722,2002。大腸桿菌ACS酶FadD和脂肪酸轉運蛋白FadL是脂肪酸攝取系統的關鍵成分。FadL介導脂肪酸向細菌細胞內的運輸,FadD介導酰基輔酶A酯的形成。當沒有其他碳源可以利用時,細菌攝取外源脂肪酸,將其轉化為酰基輔酶A酯,該物質與轉錄因子FadR結合,抑制fad基因的表達,這類基因編碼負責脂肪酸轉運(FabL)、激活(FadD)和p氧化(FadA、FadB、FadE和FadH)的蛋白。當有替代的碳源可以利用時,細菌合成脂肪酸作為酰基ACP,用于磷脂的合成,但它們不是P氧化的底物。因此,酰基輔酶A和酰基ACP均為脂肪酸的獨立來源,會產生不同的終產物。參見Cavigliadfl/.,J.C&m.279(12):1163-1169,2004。2.提高脂肪酸轉化為酰基輔酶A的修飾可以利用已知的肽工程改造生產宿主來產生各種長度的可以轉化為酰基輔酶A的脂肪酸。一種制備脂肪酸的方法涉及增加一種或者多種酰基輔酶A合酶肽(EC6.2.1,)的表達或者表達它們更具活性的形式。表2列出了能夠被表達從而產生酰基輔酶A和脂肪酸衍生物的酰基輔酶A合酶。這些酰基輔酶A合酶經檢—險能夠優化使用脂肪酰輔酶A作為底物的任何途徑。利用生物信息學和合成基因,在生產菌抹中表達了異源/fl^D基因,并評價了它們產生生物柴油和可能的生物原油的能力。表2:酰基輔酶A合酶<table>tableseeoriginaldocumentpage54</column></row><table>根據它們與大腸桿菌FadD的相似性,選擇以下同源基因進行合成和評價來自結核分枝桿菌H37Rv的/adDZ)35[NP—217021],來自枯草芽孢桿菌的y//I[NP—388908]、來自銅綠假單胞菌PAOl的/a,[NP一251989],來自釀酒酵母的/a^D同源物Faa3p[NP—012257]。可以用于產生酰基輔酶A以及脂肪酸衍生物的其他來自真核生物的脂肪酸酰基輔酶A合酶包括Shockeyda/.,P/aW.P/^w'o/.129:1710-1722,2002(擬南芥)、Caviglia&a/.,丄編.CTz亂279:1163-1169,2004(鼠)以及Knoll"fl/.,丄編.CA亂269(23):16348-56,1994(酵母)中描述的那些。編碼這些合酶的基因序列是本領域已知的。參見例如Johnson&a/.,丄Szo/.CAem.269:18037-18046,1994;Shockeya/.,尸/flwA尸力;as/0/.129:1710-1722,2002jBlack&a/.,丑Zo/CAem.267:25513-25520,1992。這些真核酰基輔酶A合酶盡管與大腸桿菌/a^)序列沒有高同源性,^f旦在/^/Z)敲除的大腸桿菌中可以補充FadD活性。D.酰基輔酶A到脂肪醇1.酰基輔酶A到脂肪醇的轉化酰基輔酶A被NADH依賴性酰基輔酶A還原酶(例如,Acrl)還原為脂肪醛。然后脂肪醛^皮NADPH依賴性醇脫氬酶(例如,YqhD)還原為脂肪醇。可選地,脂肪醇形成酰基輔酶A還原酶(FAR)催化酰基輔酶A還原為脂肪醇和CoASH。FAR使用NADH或NADPH作為這個四電子還原反應中的輔助因子。盡管產醇FAR反應經由醛中間體進行,但并不釋放游離醛。因此,生醇FAR與執行酰基輔酶A的二電子反應并產生游離脂肪醛作為產物的那些酶完全不同(參見ChengandRussell,J.Chem.,279(36):37789—37797,2004;MetzWa/"戶/^w'o/.,122:635-644,2000)。2.提高酰基輔酶A轉化為脂肪醇的修飾可以利用已知的多肽工程改造生產宿主以便由酰基輔酶A產生脂肪醇。一種制備脂肪醇的方法涉及增加脂肪醇形成酰基輔酶A還原酶(由基因如來自FAR的acrl,EC1.2.1.50/1.1.1編碼)或者酰基輔酶A還原酶(EC1.2.1.50)和醇脫氫酶(ECl.l.l.l)的表達或者表達它們更具活性的形式。圖1提供了示例性的GenBank登錄號。可以將脂肪醇描述為烴基表面活性劑。為了產生表面活性劑,修飾生產宿主使得它能由可再生碳源產生表面活性劑。這類生產宿主包括第一外源DNA序列和第二外源DNA序列,所述第一外源DNA序列編碼能夠將脂肪酸轉化為脂肪醛的蛋白,所述第二外源DNA序列編碼能夠將脂肪醛轉化為醇的蛋白。在某些實例中,第一外源DNA序列編碼脂肪酸還原酶。在一個實施方案中,第二外源DNA序列編碼哺乳動物微粒體的醛還原酶或者長鏈醛脫氫酶。在另一個實例中,第一和第二外源DNA序列來自于節桿菌04w/iraZ^"wK^"、粘紅酵母、不動桿菌C4c7'""oZ)flc化rsp.)菌抹M-l或者解脂假絲酵母。在一個實施方案中,第一和第二異源DNA序列都來自于不動桿菌(Jc/"Wo^"ersp.)菌抹M-l抹或者解脂假絲酵母的多酶復合物。編碼將脂肪酸轉化為長鏈醇且,可用于表面活性劑制備的蛋白的異源DNA序列的其他來源包括但不限于,高山被孢霉(ATCC32222)、彎曲1%3求菌(CVj^ococcwsci/n^^ws,又牙爾為j/n.ofn'cw/wcwnY^WAM)、J/cfl"/voraxya&"ws(T9T=DSM12718-ATCC700854)、不動桿菌(^c/"e/o6a"wsp.)HOl-N(ATCC14987)和混濁紅J求菌(PD630DSMZ44193)。在一個實例中,脂肪酸衍生物是飽和的或者不飽和的表面活性劑產物,其碳鏈長度為約6個到約36個碳原子、約8個到約30個碳原子、約10到約26個碳原子、約12到約20個碳原子或者約12到約16個碳原子。在另一個實例中,表面活性劑產物的碳鏈長度為約10到約18個碳原子或者約12到約14個碳原子。用于產生表面活性劑的合適宿主可以是真核或者原核微生物。示例性的宿主包括已被工程改造表達乙酰輔酶A羧化酶的節桿菌(^W/^o6flc&。JA:19、粘紅酵母、不動桿菌(」c/"e/o6a"ersp.)菌才朱M-l、擬南芥、解脂假絲酵母,釀酒酵母和大腸桿菌。也可以使用先天具有合成高水平的脂和油形式的表面活性劑前體的宿主,如經工程改造表達乙酰輔酶A羧化酶的混濁紅球菌、節桿菌j〖19、粘紅酵母和大腸桿菌,以及其他油質細菌、酵母和真菌。E.脂肪醇到脂肪酯可以利用已知的多肽工程改造生產宿主以產生各種長度的脂肪酯。一種制備脂肪酯的方法包括增加一種或者多種醇O-乙酰基轉移酶肽(EC2.3丄84)的表達或者表達其更具活性的形式。這些肽通過將乙酰輔酶A和醇轉化為輔酶A和酯催化醇的乙酰化。在某些實例中,醇O-乙酰基轉移酶肽可以與選定的硫酯酶肽、FAS肽和脂肪醇形成肽聯合表達,從而可以控制碳鏈長度、飽和度和分枝度。在某些情況下,可以共表達Md操縱子以便產生支鏈脂肪酸前體。本文使用的醇O乙'酰基轉移酶肽包括屬于酶分類號EC2.3.1.84的肽,以及能夠催化乙酰輔酶A和醇轉化形成輔酶A和酯的任意其他肽。此外,本領域普通技術人員理解醇O-乙酰基轉移酶肽能催化其他反應。例如,某些醇(9-乙酰基轉移酶肽除了脂肪醇或者乙酰輔酶A硫酯外,還會接受其他底物,諸如其他醇和其他酰基輔酶A硫酯。因此這類非特異性或者特異性不同的醇O-乙酰基轉移酶肽也包括在內。醇(9-乙酰基轉移酶肽的序列是公開提供的。圖1提供了示例性的GenBank登錄號。用于表征具體醇(9-乙酰基轉移酶肽活性的測定是本領域公知的。還可以對O-乙酰基轉移酶進行工程改造,-使它們具有新的活性以及對供體酰基基團或者受體醇部分的新的特異性。可以通過本領域記載的合理的進化方法產生工程酶。F.酰基輔酶A到脂肪酯1.脂肪酯的產生脂肪酯由酰基輔酶A:脂肪醇酰基轉移酶(例如酯合酶)合成,該酶將長鏈脂肪醇經由酯鍵與脂酰輔酶A連接。已知酯合酶及其編碼基因可以來自希蒙得木植物和細菌不動桿菌菌4朱ADP1(以前稱為醋酸4丐不動桿菌04c/"Wo6ac&rca/coace"cw"ADP1)。細菌酯合酶是雙功能酶,顯示出酯合酶活性以及由二酰甘油底物和脂酰輔酶A形成三酰甘油的能力(酰基輔酶A:二甘油酰基轉移酶(DGAT)活性)。基因wflxA/ga"扁碼酯合酶和DGAT。參見Chengefl/.,《/.所o/.C/2em.279(36):37798—37807,2004;KalscheuerandSteinbuchel,丄所o/.C/z縫278:8075-8082,2003。酯合酶還可以用于產生本文所述的某些能夠作為燃料如生物柴油的脂肪酯。2.產生脂肪酯的修飾可以利用已知的多肽,對由酰基輔酶A和醇產生包括蠟在內的脂肪酯進行工程改造。一種制備脂肪酯的方法包括提高一或多種酯合酶(EC2.3.1.20,2.3.1.75)的表達,或者是表達其更具活性的形式。公眾可獲得酯合酶肽序列。圖1中提供了示例性的GenBank登錄號。美國專利第7118896號中提供了鑒定酯合酶活性的方法,在此將該專利通過引用全文并入。在具體實例中,如果需要的產物是酯基生物燃料,則修飾生產宿主從而其由可再生能源產生酯。這類生產宿主包括編碼酯合酶的外源DNA序列,其被表達即賦予所述生產宿主由可再生能源合成飽和的、不飽和的或者支鏈脂肪酯的能力。在某些實施方案中,生物還可以表達編碼以下示例性蛋白的DNA序列脂肪酸延伸酶、酰基輔酶A還原酶、酰基轉移酶、酯合酶、脂酰轉移酶、二酰甘油酰基轉移酶、酰基輔酶A蠟醇酰基轉移酶。在可選的實施方案中,所述生物表達編碼雙功能酯合酶/酰基輔酶A:二酰甘油酰基轉移酶的DNA序列。例如,所述雙功能酯合酶/酰基輔酶A:二酰甘油酰基轉移酶可以選自來自西蒙得木、不動桿菌菌4朱ADP1(以前稱為醋酸鈣不動桿菌ADP1)、博克島食烷菌、銅綠假單胞菌、i^m/z'Z)acte/v'a&"Ws、擬南芥或真養產堿桿菌(后重新命名為ia/Wom'fle^ra;/ia)的多酶復合體。在一個實施方案中,脂肪酸延伸酶、酰基輔酶A還原酶或者蠟合酶來自真養產堿桿菌(后重新命名為ia/Wom'aew/ra//(3)或其他在文獻中已知能產生酯諸如蠟或脂肪酯的生物的多酶復合體。編碼可用于產生脂肪酯的酯合成蛋白的異源DNA序列的另外來源包括,但不限于高山被孢霉(例如,ATCC32222)、彎曲隱球菌(又稱為4pz'ofn'cwwicwrra^附)、J/cam'vonwc乂a^ewsz》(侈'H口T9T=DSM12718=ATCC700854)、不動4干菌菌才朱HOl-N(例如ATCC14987)和混濁紅J求菌(例如PD630,DSMZ44193)。用于產生脂肪酯的有用生產宿主可以是真核或者原核微生物。產生脂肪酯的生產宿主的非限制性實例包括釀酒酵母、解脂假絲酵母、大腸桿菌、節桿菌爿尤79、粘紅酵母、不動桿菌菌抹M-1、解脂假絲酵母和其他產油微生物。在一個實例中,使用來自不動桿菌ADP1基因座AA017391的酯合酶(在Kalscheuer和Steinbuchel,Sw/.C/zem.278:8075-8082,2003中有描述,在此將該文獻通過引用并入)。在另一個實例中,使用來自希蒙得木基因座AAD38041的酯合酶。任選地,使用酯輸出蛋白(exporter),如FATP家族的成員,可以用來協助酯釋放入胞外環境。可以使用的酯輸出蛋白的非限制性實例是來自黑腹果蠅基因座NP—524723的脂肪酸(長鏈)轉運蛋白CG7400-PA同種型A。G.酰基ACP、酰基輔酶A到烴1.來自特定微生物的烴已知多種微生物產生烴,如烷、烯烴和類異戊二烯。這些烴中許多來源于脂肪酸生物合成。通過控制天然生產宿主中與脂肪酸生物合成相關的基因,可以控制這些烴的產生。例如,在布朗葡萄藻中,經由脂肪醛的脫羰作用可以實現烴的生物合成。脂肪醛由脂酰輔酶A還原酶還原脂酰硫酯產生。因此,通過工程改造布朗葡萄藻表達特定基因,如控制脂肪酸的鏈長的硫酯酶,所述脂肪酸進入烷生物合成途徑,可以控制烷終產物的結構。在布朗葡萄藻中表達產生支鏈脂肪酸生物合成的酶將產生支鏈烷。導入影響脂肪酸去飽和的基因將產生烯烴。這些基因的組合還可以進一步控制生成的烴的最終結構。為了產生更高水平的天然或者工程改造的烴,可以表達、超表達或者弱化參與脂肪酸及其前體生物合成或者降解為其他產物的基因。這些方法中的每一種都可用于在弗尼斯弧菌(h力n'oy^m'sw'0Ml和其他通過脂肪醇的還原產生烷的弗尼斯弧菌菌抹中產生烷。除了弗尼斯弧菌外,可以使用其他利用脂肪酸途徑的產烷生物。這些方法中的每一種還可用于由藤黃微球菌、嗜麥芽窄食單胞菌、/eogfl/kocc^s(ATCC8456)和相關微生物的許多菌抹產生烯烴。這些微生物產生來源于脂肪酸前體頭對頭縮合的長鏈烯烴。利用本文描述的方法控制脂肪酸前體的結構和水平將形成不同鏈長、分支和飽和水平的烯烴。還可以利用藍細菌作為生產宿主產生脂肪酸衍生物,如脂肪醇、脂肪酸酯和烴。例如集胞藍菌PCC6803和細長聚球菌PCC7942可以作為生產宿主,并且可以利用常規的分子生物學技術進行工程改造(Thiel,awa/拜^o/c"woZ)a"en'a,1TheMolecularBiologyofGyanobacteria,AdvancesinPhotosynthesisandRespiration581-611(KluwerAcademicPublishers1994》Koksharova&Wolk,4pp厶M/cra^o/.5/o&c/mo/.,58:123-137,2002)。可以在這些生物中容易地鑒定分離到脂肪酸生物合成基因(參見表18)。并且,許多藍細菌是烴如十七烷的天然生產者,因此含有可以被解除調控和超表達的烴生物合成基因,結合對其脂肪酸生物合成基因的操做,從而提高烴產量。與其他細菌不同,某些藍細菌(例如,集胞藍菌PCC6803)的酯中含有多不飽和的脂肪酸(Mumta,尸/fl""e〃尸/o^'o/.,33:933-941,1992),因此具有產生多不飽和的脂肪酸衍生物的固有能力。最重要的是,藍細菌是光合生物,通過采集陽光和固定二氧化碳來合成其全部細胞碳。所以,藍細菌中產生的脂肪酸衍生物直接來源于co2。2.來自伯醇還原的烴還可以利用還原伯醇的進化氧化還原酶產生烴。已知脂肪伯醇可用于在樣史生物如弗尼斯弧菌Ml(Park,/5a"enW.,187:1426-1429,2005)中產生烷。可以用于由脂肪醇產生烴的氧化還原酶的一個實例是NAD(P)H依賴性氧化還原酶。合成的NAD(P)H依賴性氧化還原酶可以利用進化工程產生,并在生產宿主中表達以產生脂肪酸衍生物。使脂肪醇還原酶"進化"從而具有所需活性的過程是公知的(KolkmanandStemmer,旭/5/o化c/mo/.19:423-8,2001;NessWa/"yUv/Voto'wCTem.55:261-92,2000;MinshullandStemmer,CwrrQp/C7emSzo/.3:284-90,1999;HuismanandGray,CwrrOpzwAug;13:352-8,2002;以及美國專利發明者胡志浩,費爾南多·瓦勒申請人:Ls9公司