適合含油酵母內的基因表達的甘油醛－3－磷酸脫氫酶和磷酸甘油酸變位酶啟動子的制作方法

文檔序號：426498閱讀：1898來源：國知局

專利名稱：適合含油酵母內的基因表達的甘油醛－3－磷酸脫氫酶和磷酸甘油酸變位酶啟動子的制作方法
技術領域：
本發明屬于生物技術領域。更具體而言，本發明涉及從解脂耶氏酵母(Yarrowia lipolytica)中分離獲得的有助于含油酵母內的基因表達的啟動子區。
背景技術：
含油酵母的定義是能夠自然合成和累積油的生物，其中油累積范圍是占細胞干重的至少大約25％直到大約80％。被鑒定為含油酵母的屬典型地包括，但不限于耶氏酵母屬、假絲酵母屬、紅酵母屬、紅冬孢屬、隱球酵母屬、絲孢酵母屬和油脂酵母屬耶氏酵母、假絲酵母、紅酵母、紅冬孢、隱球酵母、絲孢酵母和油脂酵母。更具體而言，例證性的油合成酵母包括類酵母紅冬孢、斯達氏油脂酵母、產油油脂酵母、Candida revkaufi、鐵紅假絲酵母、熱帶假絲酵母、產朊假絲酵母、Trichosporon pullans、皮狀絲孢酵母、膠粘紅酵母、R.graminis和解脂耶氏酵母(曾被分類為解脂假絲酵母)。
培養高含油量的含油酵母的技術已充分完善(例如參見EP 0 005277B1；Ratledge，C.，Prog.Ind.Microbiol.16119-206(1982))。且上述生物在過去便已被應用于多種工業用途。例如，有多種解脂耶氏酵母菌株曾被用于生產和制備異檸檬酸裂合酶(DD259637)；脂酶(SU1454852、WO2001083773、DD279267)；多羥基鏈烷酸(WO2001088144)；檸檬酸(RU2096461、RU2090611、DD285372、DD285370、DD275480、DD227448、PL160027)；赤蘚糖醇(EP770683)；2-氧化戊二酸(DD2667999)；γ-十內酯(U.S.6,451,565、FR2734843)；γ-十二內酯(EP578388)和丙酮酸(JP09252790)。但最近，業已通過遺傳工程方面的進展提高了含油酵母的自然能力，獲得了能夠生成多不飽和脂肪酸(“PUFAs”)的生物。具體而言，Picataggio等人已證實，可通過導入和表達ω-3/ω-6生物合成途徑的編碼基因改造解脂耶氏酵母，用于生成ω-3和ω-6脂肪酸(共同待決的美國專利申請10/840579)。
所有異源蛋白的重組生成通常均是通過構建特定表達組件而得以實現的，該表達組件中的目標蛋白編碼DNA受到了與宿主細胞相適的啟動子的控制。接著將該表達組件導入宿主細胞(通常通過質粒介導的轉化或定向整合進入宿主基因組)，并通過在該表達組件所含啟動子可正常發揮功能所必需的條件下培養轉化宿主細胞，便可實現異源蛋白的生成。因此，對用于重組生成蛋白的新宿主細胞(例如含油酵母)的研發通常要求適合控制宿主細胞內的目標蛋白表達的啟動子具有有效性。
業已從釀酒酵母中分離出多種有助于酵母內的異源基因表達的強啟動子。例如，Bitter，G.A.和K.M.Egan描述的甘油醛-3-磷酸脫氫酶(GPD)啟動子(Gene 32(3)263-274(1984))；和Rodicio，R.等人所研究的磷酸甘油酸變位酶(GPM1)啟動子(Gene 125(2)125-133(1993))。從解脂耶氏酵母中還分離出了若干種適合重組表達蛋白的啟動子。例如，U.S.4,937,189和EP220864(Davidow等人)公開的用于異源蛋白表達的XPR2基因序列(編碼可誘導堿性胞外蛋白酶)和上游啟動子區。但該啟動子僅在缺乏優選碳和氮源且pH高于6.0的培養基上具有活性；且完全誘導需要培養基中存在高水平的蛋白胨。Blanchin-Roland，S.等人對該XPR2啟動子序列的后續分析(EP832258；Mol.Cell Biol.14(1)327-338(1994))確定僅含部分XPR2啟動子序列的雜合啟動子可被用于獲得在耶氏酵母內的高水平表達，而沒有因利用該完整啟動子序列所造成的局限性。
U.S.6,265,185(Muller等人)描述了解脂耶氏酵母來源的用于翻譯延伸因子EF1-α(TEF)蛋白和核糖體蛋白S7的酵母啟動子，適合在酵母內的表達克隆和蛋白的異源表達。當在生長平板上檢測酵母啟動子活性(實施例9，U.S.6,265,185)并以上述啟動子和XPR2啟動子在4-11pH范圍內的活性為基礎時，發現上述啟動子與XPR2啟動子相比被改良了。
不過，即使可以利用上述已知啟動子，還仍然需要新的改良酵母啟動子，用于酵母(含油和非含油的)的代謝改造和控制異源基因在酵母內的表達。此外，具有一套在酵母內多種自然生長和誘導條件下可調的啟動子將在工業方面具有重要作用，其中需要在所述宿主內以工業量表達異源多肽，以經濟地生產那些多肽。因此，本發明的一個目標是提供這種有助于在多種酵母培養物中的基因表達的啟動子，優選耶氏酵母種培養物及其它含油酵母。
申請人通過鑒定解脂耶氏酵母來源的甘油醛-3-磷酸脫氫酶(GPD)和磷酸甘油酸變位酶(GPM)編碼基因和負責驅動這兩種天然基因表達的啟動子，解決了上述難題。這兩種啟動子有助于異源基因在耶氏酵母內的表達，且活性比TEF啟動子提高了。
發明概述本發明提供了利用甘油醛-3-磷酸脫氫酶(gpd)或磷酸甘油酸變位酶(gpm)基因在轉化的酵母細胞內表達目標編碼區的方法。本發明相應提供了在轉化的酵母細胞內表達目標編碼區的方法，包括a)提供具有嵌合基因的轉化的酵母細胞，該嵌合基因含有(i)選自gpm基因和gpd基因的耶氏酵母基因的啟動子區；和(ii)可在該酵母細胞內表達的目標編碼區；其中所述啟動子區與目標編碼區可操作連接；并b)在表達步驟(a)所述的嵌合基因的條件下培養步驟(a)所述的轉化的酵母細胞。
在一種優選實施方案中，本發明提供了生成ω-3或ω-6脂肪酸的方法，包括a)提供具有嵌合基因的轉化的含油酵母，該嵌合基因含有(i)選自gpm基因和gpd基因的耶氏酵母基因的啟動子區；和(ii)編碼ω-3/ω-6脂肪酸生物合成途徑中的至少一種酶的編碼區；其中所述啟動子區和編碼區可操作連接；并b)在表達ω-3/ω-6脂肪生物合成途徑的至少一種酶并生成ω-3或ω-6脂肪酸的條件下培養步驟(a)所述的轉化的含油酵母；并c)任選地回收ω-3或ω-6脂肪酸。
本發明還提供了含有選自SEQ ID NO23、SEQ ID NO24和SEQID NO43的gpd啟動子的分離核酸分子。
本發明同樣還提供了含有選自SEQ ID NO27、SEQ ID NO28和SEQ ID NO44的gpm啟動子的分離核酸分子。
附圖簡述和序列說明

圖1A和1B所示為釀酒酵母(GenBank編號CAA24607)、粟酒裂殖酵母(GenBank編號NP_595236)、米曲霉(GenBank編號AAK08065)、牙鲆(GenBank編號BAA88638)、非洲爪蟾(GenBank編號P51469)和原雞(GenBank編號DECHG3)來源的已知甘油醛-3-磷酸脫氫酶(GPD)蛋白的序列對比，被用于鑒定該序列對比范圍內的兩個保守區。
圖2所示為編碼解脂耶氏酵母、粟酒裂殖酵母、原雞和非洲爪蟾來源GPD蛋白的若干部分的氨基酸序列的對比。
圖3所示為解脂耶氏酵母和釀酒酵母來源的磷酸甘油酸變位酶(GPM)蛋白的序列對比。
圖4圖解了與解脂耶氏酵母內的甘油醛-3-磷酸脫氫酶(GPD)均相關的SEQ ID NOs11、12、23-26和43之間的關系。
圖5圖解了與解脂耶氏酵母內的磷酸甘油酸變位酶(GPM)均相關的SEQ ID NOs14-16、27、28和44之間的關系。
圖6所示為質粒載體pY5-4的構建。
圖7A、7B、7C和7D分別提供了pY5-10、pY5-30、pYZGDG和pYZGMG的質粒圖譜。
圖8A所示為細胞培養物的圖象，比較了通過組織化學染色測定的TEF和GPD在解脂耶氏酵母內的啟動子活性。圖8B為細胞培養物的圖象，比較了通過組織化學染色測定的TEF和GPM在解脂耶氏酵母內的啟動子活性。
圖9A為比較了熒光法所測TEF和GPD的啟動子活性的坐標圖。圖9B為比較了熒光法所測TEF和GPM的啟動子活性的坐標圖。
圖10所示為ω-3/ω-6脂肪酸生物合成途徑。
通過下文詳述和構成本發明一部分的附帶序列說明，可以更充分地理解本發明。
下列序列遵循37C.F.R.§1.821-1.825(“對含有核苷酸序列和/或氨基酸序列公開內容的專利申請的要求---序列規則”)，并符合世界知識產權組織(WIPO)標準ST.25(1998)以及EPO和PCT的序列表要求(管理細則的規則5.2和49.5(a-bis)，以及第208節和附錄C)。應用于核苷酸和氨基酸序列信息的符號和格式遵循37C.F.R.§1.822所述規則。
SEQ ID NOs1-6分別對應于釀酒酵母(GenBank編號CAA24607)、粟酒裂殖酵母(GenBank編號NP_595236)、米曲霉(GenBank編號AAK08065)、牙鲆(GenBank編號BAA88638)、非洲爪蟾(GenBank編號P51469)和原雞(GenBank編號DECHG3)的GPD氨基酸序列。
SEQ ID NOs7和8對應于GPD蛋白的保守氨基酸區。
SEQ ID NOs9和10分別對應于簡并引物YL193和YL194，被用于分離解脂耶氏酵母GPD基因的內部片段。
SEQ ID NO11編碼解脂耶氏酵母GPD基因內長為507bp的內部片段，SEQ ID NO12為其對應氨基酸序列。
SEQ ID NO13對應于釀酒酵母GPM蛋白(GenBank編號NP_012770)。
SEQ ID NO14對應于重疊群2217，包括解脂耶氏酵母GPM蛋白的完整核苷酸編碼序列。
SEQ ID NO15對應于解脂耶氏酵母GPM編碼區的推導核苷酸序列，SEQ ID NO16則對應于其氨基酸序列。
SEQ ID NOs17-22分別對應于引物YL206、YL196、YL207、YL197、YL208和YL198，被用于基因組步查。
SEQ ID NO23對應于被命名為“GPDP”的長為1848bp的片段，包括解脂耶氏酵母內GPD基因上游長為1525bp的片段和代表GPD基因5’部分的長為323bp的片段。
SEQ ID NO24對應于裝配的長為2316bp的DNA重疊群，相當于GPD基因內-1525到+791號位的區域，其中‘ATG’翻譯起始密碼子的‘A’位被指定為+1號位。
SEQ ID NO25對應于編碼解脂耶氏酵母GPD基因的部分cDNA序列，SEQ ID NO26則對應于其氨基酸序列。
SEQ ID NO27對應于被命名為“GPML”的長為953bp的片段，相當于GPM基因內-875到+78號位的區域，其中‘ATG’翻譯起始密碼子的‘A’位被指定為+1號位。
SEQ ID NO28對應于裝配的長為1537bp的DNA重疊群，相當于GPM基因內-875到+662號位的區域，其中‘ATG’翻譯起始密碼子的‘A’位被指定為+1號位。
SEQ ID NOs29和30分別對應于引物YL33和YL34，被用于擴增報道基因GUS。
SEQ ID NOs31和32分別對應于引物TEF5’和TEF3’，被用于分離TEF啟動子。
SEQ ID NOs33和34分別對應于引物XPR5’和XPR3’，被用于分離XPR2轉錄終止子。
SEQ ID NOs35-42分別對應于引物YL1、YL2、YL3、YL4、YL23、YL24、YL9和YL10，被用于pY5-10質粒構建期間進行的定點誘變。
SEQ ID NO43對應于被命名為“GPDPro”的長為971bp的片段，本文將其視為解脂耶氏酵母內的推定GPD啟動子。該片段對應于GPD基因內-968到+3號位的區域，其中‘ATG’翻譯起始密碼子的‘A’位被指定為+1號位。
SEQ ID NO44對應于被命名為“GPMLPro”的長為878bp的片段，本文將其視為解脂耶氏酵母內的推定GPM啟動子。該片段對應于GPM基因內-875到+3號位的區域，其中‘ATG’翻譯起始密碼子的‘A’位被指定為+1號位。
SEQ ID NOs45和46分別對應于引物YL211和YL212，被用于擴增上述推定GPD啟動子。
SEQ ID NOs47和48分別對應于引物YL203和YL204，被用于擴增上述推定GPM啟動子。
SEQ ID NOs49-54分別對應于引物YL5、YL6、YL7、YL8、YL61和YL62，被用于構建質粒pY5-13。
SEQ ID NOs55和56分別對應于引物GPD有義和GPD反義，被用于擴增GPDPro。
SEQ ID NO57對應于串珠鐮孢菌株M-8114 Δ15去飽和酶編碼區的核苷酸序列，SEQ ID NO58則對應于其氨基酸序列。
SEQ ID NOs59和60分別對應于引物P192和P193，被用于擴增串珠鐮孢Δ15去飽和酶。
發明詳述申請人根據本發明描述了含油酵母解脂耶氏酵母來源的啟動子和基因的分離和特征。這些啟動子區，即甘油醛-3-磷酸脫氫酶(GPD)和磷酸甘油酸變位酶(GPM)基因的分離上游區域有助于在解脂耶氏酵母及其它用于生成異源多肽的酵母內所進行的遺傳改造。
本發明的優選異源多肽是參與微生物油，尤其是多不飽和脂肪酸(PUFAs)的合成的那些多肽。通過本文所述方法制備的PUFAs或其衍生物可具有多種應用。例如，PUFAs可作為膳食替代品或補充劑，尤其是嬰兒配方的補充劑，被應用于接受靜脈攝食的患者，或被用于預防或治療營養失調。可選地，純化PUFAs(或其衍生物)可被摻入烹調用油、脂肪或人造黃油配方中，使受者可通過正常渠道接受膳食補充所需量的PUFAs。PUFAs還可被摻入嬰兒配方、營養補充劑或其它食品中，可發現其作為抗炎癥劑或降膽固醇劑的用途。任選地，所述組合物可被用作藥物(人用或獸用)。在該情況中，PUFAs通常被口服，但也可通過任意的可使其被成功吸收的途徑施用，例如腸胃外(例如皮下、肌內或靜脈內)、直腸、陰道或體表(例如作為皮膚用軟膏或洗液)。
因此，本發明通過提供使目標編碼區在轉化酵母內表達的方法發展了該領域，所述方法包括a)提供具有特定嵌合基因的轉化的酵母細胞，該嵌合基因含有(i)gpd基因或gpm基因的啟動子區；和(ii)可在所述宿主細胞內表達的目標編碼區，其中所述啟動子區與目標編碼區可操作連接；和b)在可發酵碳源存在條件下培養步驟(a)的轉化的酵母細胞，其中表達了所述嵌合基因，并任選地將其從培養基中分離出來。在優選實施方案中，所述啟動子區包括選自SEQ IDNOs23、24、27、28、43和44的序列。
定義在本發明公開內容中，應用了大量術語和縮寫詞。相關定義如下所述。
“甘油醛-3-磷酸脫氫酶”縮寫為GPD。
“磷酸甘油酸變位酶”縮寫為GPM。
“可讀框”縮寫為ORF。
“聚合酶鏈反應”縮寫為PCR。
“多不飽和脂肪酸”縮寫為PUFA(s)。
術語“含油的”指那些傾向于儲備脂質形式的能量源的生物(Weete，InFungal Lipid Biochemistry，2nded.，Plenum，1980)。這些微生物的細胞PUFA含量通常符合S形曲線，其中脂質濃度升高至對數期晚期或生長穩定期早期達到最大，并在穩定期晚期和死亡期期間逐漸降低(Yongmanitchai and Ward，Appl.Environ.Microbiol.57419-25(1991))。
術語“含油酵母”指那些被歸類為酵母并可累積占其干細胞重量至少25％的油的微生物。含油酵母的實例包括(但不限于)下列屬耶氏酵母屬、假絲酵母屬、紅酵母屬、紅冬孢屬、隱球酵母屬、絲孢酵母屬和油脂酵母屬。
術語“可發酵碳源”指可被微生物代謝并使其獲得能量的碳源。適用于本發明的典型碳源包括，但不限于單糖、寡糖、多糖、鏈烷、脂肪酸、脂肪酸的酯、甘油單酯、甘油二酯、甘油三酯、二氧化碳、甲醇、甲醛、甲酸和含碳的胺。
術語“GPD”指甘油醛-3-磷酸脫氫酶(E.C.1.2.1.12)，該酶由gpd基因編碼并可在糖酵解期間將D-甘油醛-3-磷酸轉化為3-磷-D-甘油酰磷酸。分離自解脂耶氏酵母的代表性gpd基因的部分編碼區如SEQ IDNOs25和26所示；具體而言，其序列缺少編碼該基因C-末端的約115個氨基酸(基于與其它已知gpd序列的對比)。
術語“GPD啟動子”或“GPD啟動子區”指在GPD的‘ATG’翻譯起始密碼子之前的5’上游未翻譯區，是實現表達所必須的區域。合適GPD啟動子區的實例如SEQ ID NOs23和43所示，但不僅限于此。
術語“GPM”指磷酸甘油酸變位酶(EC 5.4.2.1)，該酶由gpm基因編碼，并在糖酵解期間負責3-磷酸甘油酸與2-磷酸甘油酸的相互轉換。釀酒酵母來源的代表性gpm基因是GenBank編號NP_012770(SEQID NO13)；分離自解脂耶氏酵母的gpm基因如SEQ ID NO15所示。
術語“GPM啟動子”或“GPM啟動子區”指在GPM的‘ATG’翻譯起始密碼子之前的5’上游未翻譯區，是實現表達所必須的區域。合適GPM啟動子區的實例如SEQ ID NOs27和44所示，但不僅限于此。
術語“啟動子活性”指對啟動子轉錄效率的評估。該活性可通過，例如測定由該啟動子轉錄的mRNA量而得以直接確定(例如通過RNA印跡法或引物延伸法)，或者通過測定由該啟動子表達的基因產物量而得以間接確定。
本文所用“分離核酸分子”指單或雙鏈形式并任選地含有合成、非天然或改變的核苷酸堿基的RNA或DNA聚合體。DNA聚合體形式的分離核酸分子可包括cDNA、基因組DNA或合成DNA的一個或多個片段。
當單鏈形式的核酸分子可在合適的溫度和溶液離子強度條件下退火至另一個核酸分子時，該核酸分子與所述另一個核酸分子，諸如cDNA、基因組DNA或RNA分子是“可雜交的”。雜交和洗滌條件眾所周知，實例參見由Cold Spring Harbor LaboratoryCold SpringHarbor，NY(1989)出版Sambrook，J.，Fritsch，E.F.和Maniatis，T.編輯的第二版Molecular CloningA Laboratory Manual，尤其是其中的第11章和表11.1(完整引入本文作為參考)。溫度和離子強度的條件決定了雜交的“嚴格性”。可調節嚴格條件，以篩選中度相似片段(諸如遠緣相關生物來源的同源序列)，乃至高度相似片段(諸如可復制近緣相關生物來源的功能酶的基因)。雜交后的洗滌決定了嚴格條件。一組優選條件采用了系列洗滌步驟，首先于室溫用6X SSC、0.5％SDS洗滌15分鐘，接著于45℃用2X SSC、0.5％SDS重復洗滌30分鐘，再于50℃用0.2X SSC、0.5％SDS洗滌30分鐘并重復2次。更優選的一組嚴格條件采用了較高溫度，其中的洗滌步驟除了最后兩次用0.2XSSC、0.5％SDS洗滌30分鐘的溫度提高至60℃外，其它條件與上述一致。另一組優選的高度嚴格條件所采用的最后兩次洗滌是于65℃在0.1X SSC、0.1％SDS中進行。另一組嚴格條件包括例如，于65℃在0.1XSSC、0.1％SDS中進行雜交，和相繼用2X SSC、0.1％SDS和0.1X SSC、0.1％SDS洗滌。
雜交要求兩個核酸含有互補序列，但根據雜交的嚴格性，堿基之間仍然可能出現錯配。使核酸雜交所需的合適嚴格性取決于雜交核酸的長度和互補程度，這些變量是本領域所熟知的。兩個核苷酸序列之間的相似性或同源性程度越高，含有這些序列的核酸雜合體的Tm值越高。核酸雜交的相對穩定性(對應于較高Tm)按照下列次序降低RNARNA、DNARNA、DNADNA。業已推導出計算長度大于100個核苷酸的雜合體的Tm的方程式(參見Sambrook et al.，同上，9.50-9.51)。錯配位置對較短核酸，即寡核苷酸的雜交而言更為重要，且該寡核苷酸的長度決定了其特異性(參見Sambrook et al.，同上，11.7-11.8)。在一種實施方案中，可雜交核酸的長度至少為大約10個核苷酸。可雜交核酸的優選最小長度是至少大約15個核苷酸；更優選的是至少大約20個核苷酸；最優選長度是至少大約30個核苷酸。此外，技術人員應認識到的是，可根據諸如探針長度等因素的需要調節溫度和洗滌液的鹽濃度。
氨基酸或核苷酸序列的“重要部分”指包括了多肽的特定氨基酸序列或基因的特定核苷酸序列的部分，通過本領域技術人員對這些特定序列的人工評估，或者通過利用諸如BLAST的算法進行的計算機自動序列對比和鑒定，便足以根據這些特定序列推斷上述多肽或基因的同一性(Basic Local Alignment Search Tool；Altschul，S.F.，et al.，J.Mol.Biol.215403-410(1993))。通常，為了推定多肽或核酸序列與已知蛋白或基因的同源性，序列必須包括10個或以上的相鄰氨基酸或30個或以上的核苷酸。此外，就核苷酸序列而言，包括20-30個相鄰核苷酸的基因特異性寡核苷酸探針可被應用在基因鑒定(例如DNA雜交)和分離(例如細菌菌落或噬斑的原位雜交)的序列依賴性方法中。還可將具有12-15個堿基的短寡核苷酸作為擴增引物應用于PCR，以獲得包括該引物的特定核酸分子。相應地，核苷酸序列的“重要部分”包括特定序列，根據該特定序列便足以特異性地鑒定和/或分離包括該序列的核酸分子。
本說明書描述了編碼一種或多種特定微生物蛋白和啟動子的部分或完整氨基酸和核苷酸序列。了解本文所報道序列優勢的技術人員可將全部公開序列或其重要部分應用在本領域技術人員已知的許多方面。本發明相應包括附帶序列表所提供的完整序列，以及上述序列的重要部分。
術語“寡核苷酸”指通常具有至少18個核苷酸并可與基因組DNA分子、cDNA分子或mRNA分子雜交的核酸。在一種實施方案中，可將標記寡核苷酸作為“探針”用于檢測本發明所述核酸的存在。因此，術語“探針”指可與互補單鏈靶核酸堿基配對形成雙鏈分子的單鏈核酸分子。術語“標記”指所有易于與mRNA或DNA連接并產生一定強度的可檢測信號的常規分子，其中所述強度可說明被標記探針與所述DNA片段的雜交量。
術語“互補”被用于描述能夠彼此雜交的核苷酸堿基之間的關系。例如，就DNA而言，腺苷與胸腺嘧啶互補，胞嘧啶與鳥嘌呤互補。本發明還相應包括與附帶序列表所報道的完整序列互補的分離核酸分子，以及那些基本相似的核酸序列。
正如本領域所知，術語“同一性百分率”指兩個或以上的多肽序列或兩個或以上的多核苷酸序列之間的關系，是通過對這些序列進行比較而得以確定的。在本領域中，“同一性”還指多肽或多核苷酸序列之間的序列相關性程度，在該情況中，可根據這些序列的若干部分之間的匹配情況得以確定。通過已知方法，包括但不限于1.)Computational Molecular Biology(Lesk，A.M.，Ed.)Oxford UniversityNY(1988)；2.)BiocomputingInformatics and Genome Projects(Smith，D.W.，Ed.)AcademicNY(1993)；3.)Computer Analysis of SequenceData，Part I(Griffin，A.M.，and Griffin，H.G.，Eds.)HumanaNJ(1994)；4.)Sequence Analysis in Molecular Biology(von Heinje，G.，Ed.)Academic(1987)；以及5.)Sequence Analysis Primer(Gribskov，M.andDevereux，J.，Eds.)StocktonNY(1991)中所描述的那些方法，可快速計算“同一性”和“相似性”。確定同一性的優選方法被設計用于提供受檢序列之間的最佳匹配。確定同一性和相似性的方法被編成了公用計算機程序。序列對比和同一性百分率計算可利用LASERGENE生物信息處理系統(DNASTAR Inc.，Madison，WI)的Megalign程序進行。序列多重對比是利用Clustal對比法(Higgins and Sharp，CABIOS.5151-153(1989))并采用默認參數(GAP PENALTY＝10，GAP LENGTHPENALTY＝10)進行。利用Clustal法進行兩兩對比的默認參數是KTYPLE 1、GAP PENALTY＝3、WINDOW＝5和DIAGONALSSAVED＝5。
合適的核酸分子(本發明所述分離多核苷酸)編碼與本文所報道氨基酸序列具有至少大約70％同一性，優選至少大約75％同一性，更優選至少大約80％同一性的多肽。優選的核酸分子編碼與本文所報道氨基酸序列具有大約85％同一性的氨基酸序列。更優選的核酸分子編碼與本文所報道氨基酸序列具有至少大約90％同一性的氨基酸序列。最優選的核酸片段則編碼與本文所報道氨基酸序列具有至少大約95％同一性的氨基酸序列。合適的核酸片段不僅具有上述同源性，還典型地編碼具有至少50個氨基酸的多肽，該多肽優選地具有至少100個氨基酸，更優選地具有至少150個氨基酸，還要更優選地具有至少200個氨基酸，最優選地具有至少250個氨基酸。
同樣，合適的啟動子區(本發明所述分離多核苷酸)編碼與本文所報道核苷酸序列具有至少大約70％同一性，優選至少大約75％同一性，更優選至少大約80％同一性的啟動子區。優選的核酸分子與本文所報道核苷酸序列具有大約85％同一性。更優選的核酸分子與本文所報道核苷酸序列具有至少大約90％同一性，最優選的核酸分子則與本文所報道核苷酸序列具有至少大約95％同一性。合適的啟動子區不僅具有上述同源性，還典型地具有至少50個核苷酸的長度，更優選地具有至少100個核苷酸的長度，更優選地具有至少250個核苷酸的長度和更優選地具有至少500個核苷酸的長度。
“密碼子簡并”指遺傳密碼允許核苷酸序列變異而不影響被編碼多肽的氨基酸序列的特性。本發明相應涉及編碼特定氨基酸序列的全部或其重要部分的所有核酸分子，其中所述特定氨基酸序列編碼本發明所述微生物多肽，如SEQ ID NOs16和26所示。技術人員熟知特定宿主細胞在選擇核苷酸密碼子方面所表現的“密碼子偏倚性”，用于確定特定氨基酸。因此，當合成一種基因，使其提高在宿主細胞內的表達時，理想的方法是對該基因進行設計，使其密碼子選擇頻率接近該宿主細胞的優選密碼子選擇頻率。
與DNA序列相關的“化學合成的”指在體外裝配組分核苷酸。DNA的人工化學合成可通過已完善的方法實現；或者可以利用許多可通過商業渠道獲得的儀器進行自動化學合成。“合成基因”可從本領域技術人員利用已知方法化學合成的寡核苷酸構件裝配而得。將這些構件連接并使它們退火形成可繼續通過酶促方法被裝配并構建成完整基因的基因片段。可以在優化核苷酸序列以反映宿主細胞密碼子偏倚性的基礎上，對所述基因進行相應調整，使其實現最佳的基因表達。技術人員知道當密碼子選擇偏向宿主所偏愛的那些密碼子時基因表達成功的可能性。可根據對來源于特定宿主細胞且序列信息已知的基因所做的研究確定優選密碼子。
“基因”指可表達特定蛋白的核酸分子，包括在編碼序列之前(5’非編碼序列)和之后(3’非編碼序列)的調節序列。“天然基因”指被發現存在于自然界中并具有自身調節序列的基因。“嵌合基因”指所有并非天然基因且包括被發現無法同時存在于自然界中的調節和編碼序列的基因。嵌合基因可相應包括不同來源的調節序列和編碼序列，或來源相同但排列方式不同于在自然界中所發現方式的調節序列和編碼序列。本發明所述嵌合基因典型地包括與目標編碼區可操作連接的GPD或GPM啟動子區。“內源基因”指位于生物基因組內的自然位置上的天然基因。“外源”基因指通常不存在于宿主生物內，而是通過基因轉移被導入該宿主生物內的基因。外源基因可包括被插入非天然生物內的天然基因，或嵌合基因。“轉基因”指通過轉化方法已被導入基因組內的基因。“密碼子最優化基因”指所具有的密碼子選擇頻率經過設計后模擬了宿主細胞的優選密碼子選擇頻率的基因。
“編碼序列”指編碼用于特定氨基酸序列的DNA序列。
“合適的調節序列”指位于編碼序列上游(5’非編碼序列)、內部或下游(3’非編碼序列)并影響關聯編碼序列的轉錄、RNA加工或穩定性或翻譯的轉錄和翻譯核苷酸序列。調節序列可包括啟動子、翻譯前導序列、內含子、多腺苷酸化識別序列、RNA加工位點、效應子結合位點和莖-環結構。
“啟動子”指能夠控制編碼序列或功能RNA的表達的DNA序列。編碼序列通常位于啟動子序列的3’端。啟動子可能全部來源于天然基因，或者由來源于自然界存在的不同啟動子的不同元件構成，或者甚至包括合成的DNA片段。本領域技術人員應理解的是，不同啟動子可引導基因在處于不同發育期或對不同環境或生理條件反應的不同組織或細胞類型內的表達。可使基因在大部分細胞類型中的大部分時間內表達的啟動子通常被稱為“組成型啟動子”。應進一步認同的是，由于大多數情況下，調節序列的準確邊界尚未被完整定義，因此，不同長度的DNA片段可能具有相同的啟動子活性。
術語“突變啟動子”在本文被定義為相對于親本啟動子而言具有包括了一個或多個核苷酸的置換、缺失和/或插入的特定核苷酸序列的啟動子，其中該突變啟動子的啟動子活性高于或低于其對應親本啟動子。術語“突變啟動子”包括天然變體和利用本領域所熟知方法體外生成的變體(例如經典誘變、定點誘變和“DNA改組”)。
術語“3’非編碼序列”或“轉錄終止子”指位于編碼序列下游的DNA序列。該術語包括多腺苷酸化識別序列及其它編碼特定調節信號的序列，該調節信號能夠影響mRNA加工或基因表達。多腺苷酸化信號的特征通常在于可影響mRNA前體3’末端添加聚腺苷酸束。該3’區可影響關聯編碼序列的轉錄、RNA加工或穩定性或翻譯。
“RNA轉錄物”指DNA序列在RNA聚合酶催化下轉錄的產物。當RNA轉錄物是所述DNA序列的完全互補拷貝時，它被稱為初級轉錄物，或者當其可能是所述初級轉錄物的轉錄后加工衍生的RNA序列時，則被稱為成熟RNA。“信使RNA”或“mRNA”指無內含子并且可被細胞翻譯成蛋白的RNA。“cDNA”指與mRNA互補和由其衍生的雙鏈DNA。“有義”RNA指包括上述mRNA并因此可被細胞翻譯成蛋白的RNA轉錄物。“反義RNA”指與靶初級轉錄物或mRNA的全部或一部分互補并可阻斷靶基因表達的RNA轉錄物(U.S.5,107,065；WO99/28508)。反義RNA可能與特定基因轉錄物的任意部分，即5’非編碼序列、3’非編碼序列或編碼序列均具有互補性。“功能RNA”指反義RNA、核糖酶RNA或其它不被翻譯但仍然影響細胞過程的RNA。
術語“可操作連接的”指核酸序列與單個核酸分子的連接使二者之一的功能受另一方的影響。例如，當啟動子與所述編碼序列連接并能夠影響該編碼序列的表達時，該啟動子與該編碼序列是可操作連接的(即該編碼序列受該啟動子的轉錄控制)。編碼序列可與調節序列按有義或反義方向可操作連接。
本文所用術語“表達”指來源于編碼序列的有義(mRNA)或反義RNA的轉錄和穩定累積。表達還可指mRNA翻譯成多肽。
“內含子”是存在于大部分真核細胞的基因序列中的非編碼DNA序列(或者存在于編碼區、5’非編碼區或3’非編碼區)。它們的完整功能尚未知；不過，某些增強子位于這些內含子中(Giacopelli F.et al.，Gene Expr.1195-104(2003))。這些內含子序列被轉錄后，卻在所述mRNA被翻譯為蛋白質之前從上述前mRNA轉錄物中被去除。該內含子去除過程是通過該內含子任意一側序列(外含子)的自剪接而得以發生的。
術語“改變的生物學活性”指與核苷酸序列編碼的蛋白有關并可通過分析方法測定的活性，且該活性高于或低于天然序列的相關活性。“增強的生物學活性”指經過改變后比天然序列的相關活性高的活性。“降低的生物學活性”指經過改變后比天然序列的相關活性低的活性。
“轉化”指將核酸分子轉移進宿主生物內，獲得在基因方面穩定的遺傳。該核酸分子可能是質粒，例如自主復制質粒；或者可以整合進宿主生物的基因組內。含有該轉化核酸分子的宿主生物被稱為“轉基因”或“重組”或“轉化”生物。
術語“質粒”、“載體”和“組件”指通常攜帶了不屬于細胞中樞代謝部分的基因，并且通常為環狀雙鏈DNA片段形式的額外染色體元件。這種元件可能是任意來源的自主復制序列、基因組整合序列、噬菌體或核苷酸序列、線型或環狀的單或雙鏈DNA或RNA，其中的許多核苷酸序列已被加入或重組進特定的獨特結構中，該獨特結構能夠將用于特定基因產物的啟動子片段和DNA序列連同合適的3’未翻譯序列一起導入細胞。“轉化組件”指除了含有外源基因之外還含有有利于轉化特定宿主細胞的其它元件的特異性載體。“表達組件”指除了含有外源基因之外還含有可增強該基因在外源宿主內的表達的其它元件的特異性載體。
術語“序列分析軟件”指所有有助于分析核苷酸或氨基酸序列的計算機算法或軟件程序。“序列分析軟件”可通過商業渠道或自主研發獲得。典型的序列分析軟件包括但不限于1.)GCG系列程序(Wisconsin Package Version 9.0，Genetics Computer Group(GCG)，Madison，WI)；2.)BLASTP、BLASTN、BLASTX(Altschul et al.，J.Mol.Biol.215403-410(1990))；3.)DNASTAR(DNASTAR，Inc.Madison，WI)；以及4.)編入Smith-Waterman算法的FASTA程序(W.R.Pearson，Comput.Methods Genome Res.，[Proc.Int.Symp.](1994)，Meeting Date1992，111-20.Editor(s)Suhai，Sandor.PlenumNew York，NY)。應當理解的是，在本申請的上下文中，如無另外指明，序列分析軟件均被用于分析，且分析結果將基于上述程序的“默認值”。本文所用的“默認值”指軟件最初在首次初始化時便加載的所有數值或參數組。
本文所用的標準重組DNA和分子克隆技術是本領域熟知的，參見由Cold Spring Harbor LaboratoryCold Spring Harbor，NY(1989)出版Sambrook，J.，Fritsch，E.F.和Maniatis，T.編輯的第2版MolecularCloningA Laboratory Manual(下文參見“Maniatis”)；由Cold SpringHarbor LaboratoryCold Spring Harbor，NY(1984)出版Silhavy，T.J.，Bennan，M.L.和Enquist，L.W.編輯的Experiments with GeneFusions；以及由Greene Publishing Assoc.和Wiley-Interscience(1987)出版Ausubel，F.M.等人編輯的Current Protocols in MolecularBiology。
對解脂耶氏酵母內gpd和gpm基因的鑒定本發明鑒定了解脂耶氏酵母基因組內所含甘油醛-3-磷酸脫氫酶(gpd)基因的部分序列(其中編碼蛋白C末端約115個氨基酸未在本文中公開)和磷酸甘油酸變位酶(gpm)基因的全部序列。
利用Smith-Waterman序列對比算法(W.R.Pearson，同上)對部分gpd核苷酸堿基及其推導氨基酸序列(SEQ ID NOs25和26)和公開數據庫比較的結果表明，對比長度超過215個氨基酸時，大部分相似的已知序列與本文所報道gpd的氨基酸序列具有大約81％的同一性。優選氨基酸片段與本文所述序列具有至少大約70％-80％的同一性，同一性為85％-90％的那些序列尤其優選，具有大約95％同一性的那些序列最為優選。同樣，與本發明所述ORF對應的優選gpd編碼核酸序列是與本文所報道gpd核酸序列具有至少大約70％-80％同一性并編碼活性蛋白的那些序列，同一性為85％-90％的那些序列尤其優選，具有大約95％同一性的那些序列最為優選。
利用Smith-Waterman序列對比算法(W.R.Pearson，同上)對gpm核苷酸堿基及其推導氨基酸序列(SEQ ID NOs15和16)和公開數據庫比較的結果表明，對比長度超過216個氨基酸時，大部分相似的已知序列與本文所報道gpm的氨基酸序列具有大約71％的同一性。優選氨基酸片段與本文所述序列具有至少大約70％-80％的同一性，同一性為85％-90％的那些序列尤其優選，具有大約95％同一性的那些序列最為優選。同樣，與本發明所述ORF對應的優選gpm編碼核酸序列是與本文所報道gpm核酸序列具有至少大約70％-80％同一性并編碼活性蛋白的那些序列，同一性為85％-90％的那些序列尤其優選，具有大約95％同一性的那些序列最為優選。
對解脂耶氏酵母內天然啟動子區的鑒定本發明還鑒定了可自然調節解脂耶氏酵母內的GPD和GPM的推定啟動子區。業已確定這些推定啟動子區有助于驅動所有合適的目標編碼區在轉化的酵母細胞內的表達。
在本發明的上下文中，適用于含油酵母的啟動子應符合下列標準1.)強度。強酵母啟動子是高表達水平的必要前提，且當以解脂耶氏酵母作為宿主生物時，被整合進基因組內的以低拷貝數ars18(Fournier，P.et al.Yeast 725-36(1991))為基礎的表達載體或嵌合基因使該要求變得尤為重要。
2.)在適合表達目標編碼區的培養基中的活性，和該目標編碼區的高酶活性。
3.)pH耐受性。如果已知目標編碼區僅在例如，酸性環境中生成，則與該目標編碼區可操作連接的啟動子必須能在適當pH條件下發揮功能。當然，pH耐受性受限于宿主生物的耐受性。
4.)可誘導性。密調節酵母啟動子可能有助于將生長期和表達期分開，從而使已知將抑制細胞生長的產物實現表達。
5.)在含油酵母宿主的生長穩定期間累積PUFAs的活性。
此外，使新型酵母啟動子在與已知解脂耶氏酵母TEF和/或XPR2啟動子有關的活性方面具有差異是可取的(U.S.4,937,189；EP220864；EP832258；U.S.6,265,185)。本發明對TEF啟動子與GPD和GPM啟動子的對比研究如實施例7所述。該研究結果表明，與TEF啟動子相比，本發明所述酵母啟動子的活性提高了。本發明所述GPD基因的啟動子區被包含在若干種核酸分子內，具體而言，即SEQ ID NOs23、24和43。在一種實施方案中，GPD啟動子包括SEQ ID NO43中從-500到+1號位的核苷酸(其中‘ATG’翻譯起始密碼子的‘A’位被指定為+1號位)，從而具有了相對強的啟動子活性；在可選實施方案中，SEQ ID NO43中從-100到+1號位的區域足以滿足該啟動子的基礎活性。
本發明的GPM啟動子區被包含在本文所公開的若干種核酸分子中，包括SEQ ID NOs27、28和44。在一種實施方案中，GPM啟動子包括SEQ ID NO44中從-500到+1號位的核苷酸(其中‘ATG’翻譯起始密碼子的‘A’位被指定為+1號位)，從而具有了相對強的啟動子活性；可選地，SEQ ID NO44中從-100到+1號位的區域足以滿足該啟動子的基礎活性。
本發明所述啟動子區可能除了上述核苷酸外還包括其它核苷酸。例如，可基于SEQ ID NO23或SEQ ID NO27(SEQ ID NOs43和44分別為它們的子序列)所示DNA序列構建本發明的啟動子序列。應認同的是，由于調節序列的準確邊界尚未被完整定義，因此，具有不同縮減長度的啟動子片段可能具有相同的啟動子活性。
在可選實施方案中，可構建突變啟動子，其中該啟動子的DNA序列具有一個或多個核苷酸置換(即序列中一個或多個核苷酸的缺失、插入、置換或添加)，但不影響(尤其是削弱)該酵母啟動子活性。可通過缺失研究鑒定可被改變但不顯著影響所述酵母啟動子活性的區域。本發明所述突變啟動子的啟動子活性是SEQ ID NOs43和44所示GPD或GPM啟動子區的啟動子活性的至少大約20％、優選至少大約40％、更優選至少大約60％、更優選至少大約80％、更優選至少大約90％、更優選至少大約100％、更優選至少大約200％、更優選至少大約300％和最優選至少大約400％。
誘變法是本領域所熟知的，適用于生成突變啟動子。例如，可應用體外誘變和篩選、基于PCR的隨機誘變、定點誘變或其它方法使本發明所述天然存在的啟動子和基因實現突變。這將可能獲得在宿主細胞內具有更理想的啟動子活性水平的推定啟動子，或者獲得在宿主細胞內具有更理想的功能所需物理和動力學參數的多肽。
如需要，可通過常規誘變、所獲突變啟動子或多肽的表達和對它們活性的測定，以分別確定對啟動子或酶活性具有重要作用的目標核苷酸區域。突變體可包括缺失、插入和點突變，或它們的組合。典型的功能分析首先是缺失誘變，以確定1.)所述推定啟動子中對活性而言所必需的最小部分；或2.)所述蛋白中對功能而言所必需的N-和C-末端界限。接著是進行內部缺失、插入或點突變，以進一步確定對功能而言所必需的區域。還可采用其它技術，諸如組件誘變或全合成。
編碼序列的缺失誘變是通過例如，利用外切核酸酶序貫去除5’或3’編碼區而得以實現的。有試劑盒可應用于這種技術。實現缺失后，通過將含有起始或終止密碼子的寡核苷酸分別與5’或3’缺失后獲得的缺失編碼區連接，使該編碼區完整。可選地，可通過包括定點誘變、誘變PCR在內的多種方法，將編碼起始或終止密碼子的寡核苷酸插入所述編碼區中，或者通過連接方法，使其連接到在既有限制位點處被消化過的DNA上。
同樣，可通過多種方法，包括利用DNA內的既有限制位點、利用誘變引物進行定點誘變或誘變PCR，以在推定啟動子區或編碼序列內實現內部缺失。插入可通過諸如接頭分區誘變、定點誘變或誘變PCR的方法實現，而點突變則可通過諸如定點誘變或誘變PCR的技術實現。
還可采用化學誘變法鑒定推定啟動子區或多肽內對活性而言具有重要作用的區域。即表達突變構建體，并分別測定所獲已變更啟動子或蛋白質的能力。這種結構-功能分析法可確定哪一個區域可以被缺失、哪一個區域耐受插入以及哪一種點突變可使突變啟動子或蛋白質以與天然啟動子或蛋白質基本相同的方式發揮功能。所有這樣的突變啟動子和編碼本文所述啟動子和基因來源的多肽的核苷酸序列均屬于本發明范疇。
對gpd和gpm基因和推定啟動子區的同源物的分離本領域技術人員應當理解的是，本發明所述啟動子區和基因在多種酵母種內均有同源物；且用于異源基因表達的啟動子和基因的應用不僅限于那些來源于解脂耶氏酵母的啟動子和基因，還可擴展至它們在其它酵母種內的同源物。例如，本發明包括來源于含油屬，包括但不限于耶氏酵母屬、假絲酵母屬、紅酵母屬、紅冬孢屬、隱球酵母屬、絲孢酵母屬和油脂酵母屬的同源物；在這些屬中，優選種的實例包括類酵母紅冬孢、斯達氏油脂酵母、產油油脂酵母、Candidarevkaufi、鐵紅假絲酵母、熱帶假絲酵母、產朊假絲酵母、Trichosporonpullans、皮狀絲孢酵母、膠粘紅酵母和R.graminis。
同源性典型地通過利用序列分析軟件而得以測定，其中術語“序列分析軟件”指所有有助于分析核苷酸或氨基酸序列的計算機算法或軟件程序(可通過商業渠道或自主研發獲得)。通常，這種計算機軟件是通過對多種置換、缺失及其它修飾的同源性程度賦值，以匹配相似序列。
正如本領域所熟知的，采用序列依賴型方案對同源啟動子區或基因的分離可通過多種技術快速實現。序列依賴型方案的實例包括，但不限于1.)核酸雜交法；2.)可通過核酸擴增技術的多種應用進行說明的DNA和RNA擴增法[例如聚合酶鏈反應(PCR)，Mullis et al，U.S.Patent 4,683,202；連接酶鏈反應(LCR)，Tabor，S.et al.，Proc.Acad.Sci.USA 821074(1985)；或鏈置換擴增(SDA)，Walker，et al.，Proc.Natl.Acad.Sci.U.S.A.，89392(1992)]，以及3.)文庫構建和互補篩選法。
例如，可通過本領域技術人員熟知的方法，采用本發明所述核酸分子的全部或其部分作為DNA雜交探針篩選任意目標微生物來源的文庫，以直接分離編碼與本發明所述蛋白或多肽相似的蛋白或多肽的推定啟動子區或基因。可通過本領域熟知的方法設計并合成以本發明所述核酸序列為基礎的特異性寡核苷酸探針(Maniatis，同上)。此外，還可通過技術人員已知的方法，利用所述完整序列直接合成DNA探針(例如隨機引物DNA標記、切口平移或末端標記技術)，或者利用有效的體外轉錄系統直接合成RNA探針。此外，還可設計特異性引物，用于擴增本發明所述序列的一部分(或全長)。可于擴增反應期間直接標記擴增所獲的產物，或在擴增反應后進行標記，并以其作為探針，在合適的嚴格性條件下分離全長DNA片段。
在PCR型擴增技術中，引物典型地具有不同序列，并且彼此不互補。根據預期的試驗條件，應對引物序列進行設計，以有效并可靠地復制靶核酸。PCR引物的設計方法是本領域技術人員常用并熟知的(Thein和Wallace在由IRLHerndon，VA出版K.E.Davis編輯(1986)的Human Genetic DiseasesA Practical Approach第33-50頁發表的“The use of oligonucleotide as specific hybridization probes inthe Diagnosis of Genetic Disorders”；以及Rychlik，W.在由HumaniaTotowa，NJ出版White，B.A.編輯的Methods in Molecular Biology(1993)Vol.15第31-39頁發表的PCR ProtocolsCurrent Methods andApplications)。
本發明所述序列的兩個短片段通常可被應用在聚合酶鏈反應方案中，以擴增編碼DNA或RNA來源的同源多核苷酸的較長核酸分子。聚合酶鏈反應還可基于已克隆核酸分子文庫進行，其中一種引物的序列來源于本發明所述核酸分子，另一種引物的序列則利用了編碼微生物基因的mRNA前體的3’末端存在的聚腺苷酸束。
可選地，本發明所述序列可作為雜交試劑應用于同源物的鑒定。核酸雜交試驗的基本組分包括探針、疑似含有目標核苷酸序列的樣品和特異性雜交方法。本發明所述探針典型地是與待檢核酸序列互補的單鏈核酸序列。探針與待檢核酸序列是“可雜交的”。探針長度的變化范圍是5個到數萬個堿基，這將取決于待進行的特定實驗。合適的探針長度典型地為大約15到大約30個堿基。該探針分子只需要一部分與待檢核酸序列互補。此外，探針與靶序列之間無需完全互補。不完全互補分子之間雜交的結果是雜交區內某一部分的堿基與正確互補堿基不配對。
業已明確定義了雜交方法。探針和樣品典型地必須在允許核酸雜交的條件下混合。這包括使探針和樣品在合適的溫度和合適濃度的無機或有機鹽存在條件下接觸。探針和樣品核酸必須接觸足夠長的時間，以使該探針和樣品核酸之間所有可能的雜交均可發生。混合物中的探針或靶的濃度決定了發生雜交所需的時間。探針或靶的濃度越高，所需的雜交溫育時間越短。可任選地加入離液劑。離液劑通過抑制核酸酶活性使核酸穩定。此外，離液劑可使短寡核苷酸探針在室溫下實現靈敏和嚴格雜交(Van Ness and Chen，Nucl.Acids Res.195143-5151(1991))。合適的離液劑包括氯化胍、硫氰酸胍、硫氰酸鈉、四氯乙酸鋰、高氯酸鈉、四氯乙酸銣、碘化鉀和三氟乙酸銫等。離液劑的終濃度典型地為大約3M。如果需要，可將甲酰胺加入雜交混合物中，其濃度典型地為30-50％(v/v)。
可應用多種雜交溶液。這些溶液典型地包括大約20-60％體積，優選30％體積的極性有機溶劑。常用雜交溶液應用了大約30-50％v/v甲酰胺，大約0.15-1M氯化鈉、大約0.05-0.1M緩沖劑(例如檸檬酸鈉、Tris-HCl、PIPES或HEPES(pH范圍是大約6-9))、大約0.05-0.2％去污劑(例如十二烷基硫酸鈉)，或0.5-20mM EDTA、FICOLL(Pharmacia Inc.)(大約300-500kdal)、聚乙烯吡咯烷酮(大約250-500kdal)和血清白蛋白。典型雜交溶液還可包括大約0.1-5mg/mL的未標記載體核酸、片段化核DNA(例如小牛胸腺或鮭精DNA或酵母RNA)，并任選地含有重量體積比約為0.5-2％的甘氨酸。還可包括其它添加劑，諸如體積排阻劑，包括多種極性水溶性或可膨脹劑(例如聚乙二醇)、陰離子聚合物(例如聚丙烯酸酯或聚甲基丙烯酸酯)和陰離子糖聚合物(例如葡聚糖硫酸酯)。
酵母內的重組表達有助于驅動目標編碼基因在目標宿主細胞內的表達的起始控制區或啟動子區選自那些來源于gpd和gpm基因(分別為SEQ ID NOs25和15)上游部分的區域。可根據常用方法，從gpd和gpm基因以及它們的同源物的上游序列中鑒定出上述啟動子區，并將其分離(Maniatis，同上)。一旦鑒定并分離出該啟動子區，便可使其與將在合適表達載體內表達的目標編碼區可操作連接。這些嵌合基因從而得以在天然宿主細胞和異源宿主細胞，尤其是在含油酵母宿主的細胞內表達。因此，本發明的一個方面是提供含有本發明所述酵母啟動子的重組表達載體。
在進一步的方面中，本發明提供了在轉化的酵母細胞內表達目標編碼區的方法，其中的轉化細胞具有特定嵌合基因，該嵌合基因含有(i)GPD或GPM啟動子區和(ii)可在所述宿主內表達的目標編碼區，其中該啟動子區與目標編碼區可操作地連接；且所述轉化細胞在表達上述嵌合基因的條件下生長。可任選地從培養物中回收由上生成的多肽。
微生物表達系統和表達載體是本領域技術人員所熟知的。它們均可被用于構建含有gpm和gpd基因來源的啟動子區的嵌合基因，以生成適合在理想酵母宿主細胞內表達的任意一種特異性的目標編碼區。這些嵌合基因接著可以通過整合和轉化法被導入合適的微生物內，并在誘導的基礎上獲得高水平表達的酶。可選地，可將所述啟動子克隆進能夠轉化優選酵母宿主細胞并在其中復制自身的質粒內。接著可將待表達的目標編碼區克隆在該啟動子下游。一旦獲得重組宿主，便可通過在合適的條件下培養細胞，以實現基因表達(如下所述)。
合適的目標編碼區有用的嵌合基因包括與將在優選宿主細胞內表達的合適目標編碼區可操作連接的本文所述gpd和gpm基因的啟動子區或其突變啟動子。
將于重組酵母宿主內表達的目標編碼區可能是該宿主內生的，也可能與其異源，但必須與該宿主生物相容。具有經濟價值的蛋白的編碼基因尤其適用于表達。例如，合適的目標編碼區可包括(但不限于)病毒、細菌、真菌、植物、昆蟲的目標編碼區，或脊椎動物的目標編碼區，包括哺乳動物多肽。此外，這些目標編碼區可能是例如，結構蛋白、酶(例如氧化還原酶、轉移酶、水解酶、裂合酶、異構酶、連接酶)或肽。非限制性實例包括編碼諸如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、殼多糖酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-葡聚糖酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉化酶、漆酶、脂酶、甘露糖苷酶、齒斑葡聚糖酶、氧化酶、果膠分解酶、過氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶和木聚糖酶的酶的基因。
本發明的某些實施方案優選參與包括ω-6和ω-3脂肪酸在內的微生物油生成的酶的編碼區。包括藻類、細菌、霉菌和酵母在內的許多微生物可以在普通的細胞代謝過程中合成PUFAs和ω脂肪酸。被著重深入研究的是真菌，包括Schizochytrium aggregatm、破囊壺菌屬和高山被孢霉屬的種。此外，還有許多腰鞭毛蟲(甲藻綱)可自然生成高濃度PUFAs。同樣，業已通過遺傳方法鑒定了多種參與油生成的基因，在這些基因中，有若干個基因的DNA序列已公開(例如，參見GenBank編號中的AY131238、Y055118、AY055117、AF296076、AF007561、L11421、NM_031344、AF465283、AF465282、AF465281、AF110510、AF419296、AB052086、AJ250735、AF126799、AF126798、AF199596、AF226273、AF320509、AB072976、AF489588、AJ510244、AF419297、AF07879、AF067654、AB022097、AF489589.1、AY332747、AAG36933、AF110509、AB020033、AAL13300、AF417244、AF161219、X86736、AF240777、AB007640、AB075526、AP002063、NP_441622、BAA18302、BAA02924、AAL36934、AF338466、AF438199、E11368、E11367、D83185、U90417、AF085500、AY504633、NM_069854、AF230693、AX464731、NM_119617、NM_134255、NM_134383、NM_134382、NM_068396、NM_068392、NM_070713、NM_068746和NM_064685)。此外，專利文獻還提供了其它許多參與油生成的基因的DNA序列(和/或與上述若干基因及它們的分離方法相關的細節)。參見例如，被完整引入本文作為參考的U.S.5,968,809(Δ6去飽和酶)；U.S.5,972,664和U.S.6,075,183(Δ5去飽和酶)；WO 91/13972和U.S.5,057,419(Δ9去飽和酶)；WO 93/11245(Δ15去飽和酶)；WO 94/11516、U.S.5,443,974和WO 03/099216(Δ12去飽和酶)；U.S.2003/0196217A1(Δ17去飽和酶)；WO 00/12720和U.S.2002/0139974A1(延伸酶)。
載體/DNA組件的組成有助于轉化合適宿主細胞的載體或DNA組件是本領域所熟知的。對所述構建體內存在的序列的特定選擇取決于目標表達產物(同上)、宿主細胞的特性和擬采用的將轉化細胞與未轉化細胞分離的方法。不過，所述載體或組件典型地含有引導相關基因轉錄和翻譯的序列、可選擇標記和允許自主復制或染色體整合的序列。合適的載體包括控制轉錄起始的基因的5’區和控制轉錄終止的DNA片段的3’區。雖然這種控制區域被認為無需來源于被選定作為生產宿主的特定宿主種類的天然基因，但最優選的仍然是這兩個控制區域均來源于轉化宿主細胞的基因。
業已發現翻譯起始密碼子‘ATG’周圍的核苷酸序列可影響酵母細胞內的表達。如果目標多肽在酵母內的表達不足，可修飾外源基因的核苷酸序列，使其包括有效的酵母翻譯起始序列基序，從而獲得最佳基因表達。通過定點誘變低效表達基因，使其包括有利的翻譯起始基序，便可使其實現在酵母內的表達。
終止區可來源自獲得起始區的基因的3’區或者來源自不同基因。有大量終止區是已知的，并且可以在多種宿主內良好地發揮功能(當被利用在其來自的相同和不同屬和種時)。通常是考慮方便的因素而對終止區進行選擇，而不考慮任何特定屬性。該終止區優選地來源自酵母基因，尤其是酵母、裂殖酵母、假絲酵母、耶氏酵母或克魯維酵母菌。還已知編碼γ-干擾素和α-2干擾素的哺乳動物基因的3’區可在酵母內發揮功能。終止控制區還可來源自優選宿主的多種天然基因。任選地，終止位點可能并非必要；但最優選的仍是將其包括在內。
就本領域技術人員所知，僅將嵌合基因插入克隆載體并不能保證其能夠以要求的水平成功表達。為了滿足高表達率的需要，業已通過操縱許多可控制轉錄、翻譯、蛋白質穩定性、氧限度和宿主細胞分泌方面的不同遺傳元件，構建了許多專用表達載體。更具體而言，已被操縱用于控制基因表達的若干分子特征包括1.)相關轉錄啟動子和終止序列的性質；2.)克隆基因的拷貝數量和該基因是質粒所具有的還是被整合進宿主細胞內的；3.)合成外源蛋白的最終細胞定位；4.)在宿主生物內的翻譯效率；5.)克隆基因蛋白在宿主細胞內的固有穩定性；和6.)該克隆基因內的密碼子選擇，可使其頻率接近宿主細胞的優選密碼子選擇頻率。這些修飾類型均被包括在本發明中，被用于進一步優化包括本文所述gpd和gpm基因的啟動子區或其突變啟動子在內的嵌合基因的表達，其中所述啟動子區與合適的目標編碼區可操作連接。
酵母細胞的轉化一旦構建出適合在酵母細胞內表達的合適嵌合基因，便可將其置入能夠在宿主細胞內自主復制的質粒載體內，或者將其直接整合進該宿主細胞的基因組內。表達組件的整合可隨機發生在宿主基因組內，或者可以通過利用含有特定區域的構建體而被導向，該特定區域與宿主基因組同源并足以導向該宿主位點內的重組。構建體被導向內源位點的情況中，全部或部分的轉錄和翻譯調節區可由該內源位點提供。
當兩個或多個基因是從分離的復制載體中表達時，各載體需要具有不同的選擇方式，并應缺乏與另一個構建體的同源性，以維持穩定表達并避免元件在構建體中的重配。調節區的明智選擇、選擇方法和導入構建體的增殖方法可通過試驗確定，使所有導入基因均以必需水平表達，以實現目標產物的合成。
含有目標編碼區的構建體可通過任意標準技術被導入宿主細胞內。這些技術包括轉化(例如乙酸鋰轉化[Methods in Enzymology，194186-187(1991)])、原生質體融合、基因槍沖擊、電穿孔、微量注射或其它所有可將目標基因導入宿主細胞內的方法。可應用于含油酵母(即解脂耶氏酵母)的更多具體學說包括美國專利4,880,741和5,071,764以及Chen，D.C.等人的學說(Appl Microbiol Biotechnol.48(2)232-235-(1997))。
為方便起見，已通過任意方法被操縱并獲得DNA序列(例如表達組件)的宿主細胞在本文中被稱為“轉化的”或“重組的”。該轉化宿主應具有至少一個拷貝的表達構建體，根據所述基因是被整合進基因組的、擴增的還是存在于具有多重拷貝數的染色體外元件上的，則可具有兩個或多個拷貝的表達構建體。可通過對導入構建體所含標記的選擇鑒定轉化的宿主細胞。可選地，由于許多轉化技術可將多個DNA分子導入宿主細胞中，因此可用目標構建體共轉化單個標記構建體。對轉化宿主的選擇典型地基于它們在選擇性培養基上生長的能力。選擇性培養基可摻入抗生素或者缺乏未轉化宿主生長所必需的因子，諸如營養或生長因子。導入的標記基因可具有抗生素抗性或編碼必需生長因子或酶，從而當其在轉化宿主內被表達時能夠允許宿主在選擇性培養基中的生長。當被表達的標記蛋白可被直接或間接檢測時，也可實現對轉化宿主的選擇。該標記蛋白可以單獨或與另一種蛋白融合的形式表達。該標記蛋白可通過1.)其酶活性(例如β-半乳糖苷酶可將底物X-gal[5-溴-4-氯-3-吲哚-β-D-吡喃糖苷半乳糖]轉化為有色產物；熒光素酶可將蟲熒光素轉化為發光產物)；或者2.)其產生或改變光的特征(例如當用藍光照射維多利亞水母時，其綠色熒光蛋白將發出熒光)。可選地，可采用抗體檢測標記蛋白或位于例如，目標蛋白上的分子標記。可通過例如，直觀或諸如FACS或利用抗體淘選等技術選擇可表達上述標記蛋白或標記的細胞。對酵母轉化體的選擇而言，任何可在酵母內發揮功能的標記均可被采用。本文優選的是對卡那霉素、潮霉素和氨基糖苷G418的抗性，以及在缺乏尿嘧啶或亮氨酸的培養基上的生長能力。
正調節含有與目標編碼區可操作連接的GPD或GPM啟動子的嵌合基因表達的技術特定目標編碼區(與本發明所述啟動子可操作連接)的其它拷貝可被導入所述宿主內，以提高表達。還可通過使所述mRNA或編碼蛋白除去/缺失失穩序列，或者通過將穩定化序列加入所述mRNA中，以提高目標編碼區的表達(U.S.4,910,141)。
另一種可提高目標編碼區的表達的方法是通過將天然基因內的密碼子置換為可在選定宿主微生物內實現最佳表達的基因所用的密碼子，從而提高編碼mRNAs的翻譯效率。本領域技術人員應當意識到，利用宿主優選密碼子可充分增強編碼所述多肽的外源基因的表達。通常，通過在特定目標宿主種類內檢驗蛋白質(優選表達量最大的那些蛋白質)的密碼子選擇，并確定哪一個密碼子被選用的頻率最高，便可確定宿主優選密碼子。接著，便可利用該宿主種類優選的密碼子完整或部分地合成目標多肽的編碼序列。
優選宿主在本文中，適用于表達本發明所述基因和與本發明所述啟動子分子可操作連接的目標編碼區的優選宿主細胞為酵母細胞(當目的是生成微生物油時最優選含油酵母，如下所述)。含油酵母能夠自然合成并累積油，其中的油含量可大于細胞干重的大約25％，更優選地大于細胞干重的大約30％，最優選地大于細胞干重的大約40％。被鑒定為含油酵母的屬典型地包括，但不限于耶氏酵母屬、假絲酵母屬、紅酵母屬、紅冬孢屬、隱球酵母屬、絲孢酵母屬和油脂酵母屬。更具體而言，例證性的油合成酵母包括類酵母紅冬孢、斯達氏為油脂酵母、產油油脂酵母、Candida revkaufi、鐵紅假絲酵母、熱帶假絲酵母、產朊假絲酵母、Trichosporon pullans、皮狀絲孢酵母、膠粘紅酵母、R.graminis和解脂耶氏酵母(曾被劃分為解脂假絲酵母)。
最優選的是含油酵母解脂耶氏酵母；在進一步的實施方案中，最優選的是被命名為ATCC#20362、ATCC#8862、ATCC#18944、ATCC#76982和/或LGAM S(7)1的解脂耶氏酵母菌株(Papanikolaous S.和Aggelis G.，Bioresour.Technol.82(1)43-9(2002))。被命名為ATCC#76982的解脂耶氏酵母菌株是本文所述用來分離GPD和GPM啟動子和基因的特定菌株。
利用可表達合適目標編碼區的轉化酵母進行的工業生產可被最優化用于高水平表達特定目標編碼區的培養基條件通常包括碳源的類型和數量、氮源的類型和數量、碳-氮比率、氧水平、生長溫度、pH、生物量生產期的長度和細胞收獲時間。諸如含油酵母的目標微生物生長在復合培養基(例如酵母提取物-蛋白胨-葡萄糖液體培養基(YPD))或缺乏生長必需組分并因而迫使選擇預期表達組件的確定成分的基本培養基(例如酵母氮源(DIFCO Laboratories，Detroit，MI))。
本發明所用發酵培養基必須含有合適的碳源。合適的碳源包括，但不限于單糖(例如葡萄糖、果糖)、二糖(例如乳糖、蔗糖)、寡糖、多糖(例如淀粉、纖維素或它們的混合物)、糖醇(例如甘油)或可再生原料的混合物(例如干酪乳清透過物、玉米漿、甜菜糖漿、大麥芽)。碳源還可包括鏈烷、脂肪酸、脂肪酸的酯、甘油單酯、甘油二酯、甘油三酯、磷脂和多種商業來源的脂肪酸，包括植物油(例如豆油)和動物脂肪。碳底物還可包括已被證實可被代謝轉化為關鍵生化中間產物的單碳源(例如二氧化碳、甲醇、甲醛、甲酸、含碳的胺)。因此，應用于本發明的碳源被認為可包括廣泛多種的含碳源，并僅受限于宿主生物的選擇。盡管上述所有碳源和它們的混合物均被認為適用于本發明，優選碳源仍然是糖和/或脂肪酸。最優選的是葡萄糖和/或含有10-22個碳的脂肪酸。
氮可由無機(例如(NH4)2SO4)或有機來源(例如尿素或谷氨酸)提供。除了合適的碳和氮源外，發酵培養基還必須含有合適的無機物、鹽、輔因子、緩沖劑、維生素及本領域技術人員已知適合微生物生長的其它組分。
本發明中的優選生長培養基是通用的商業制備培養基，諸如酵母氮源(DIFCO Laboratories，Detroit，MI)。也可利用其它成分明確的或合成的生長培養基，而適用于特定微生物生長的合適培養基是微生物學或發酵學領域的技術人員已知的。對發酵而言合適的pH范圍典型地為大約pH4.0-pH8.0，其中優選pH5.5-pH7.0作為初始生長條件適用的范圍。該發酵可在需氧或厭氧條件下進行，其中優選微好氧條件。
可采用本領域已知的方法培養含有與本發明所述啟動子可操作連接的合適目標編碼區的宿主細胞。例如，可通過在允許表達所述目標編碼區的條件下，在合適的培養基中進行的搖瓶培養、在實驗室或工業發酵罐中進行的小規模或大規模發酵，以培養所述細胞。
需要工業生產以本發明所述遺傳嵌合體為基礎的產物時，可應用多種培養方法。例如，可通過分批、補料分批或連續發酵方法大規模生產重組宿主過量表達的特定基因產物。
分批發酵方法是封閉系統，其中的培養基組成在該過程之初便固定，除了在該過程期間為維持pH和氧水平所必需的添加之外不再進行其它添加。因此，在該培養過程之初，用指定生物接種培養基，并在不向該培養基添加其它物質(即碳和氮源)的條件下使該生物生長或具有代謝活性。在分批方法中，系統的代謝產物和生物量組成穩定地發生變化，直到培養結束。在典型的分批方法中，細胞經歷了靜態遲滯期、快速生長對數期和最終的穩定期，其中穩定期的生長速率是降低或停止的。不加處理的話，穩定期的細胞將最終死亡。標準分批方法的變化是補料分批方法，其中底物是在該發酵過程期間被連續加入發酵罐中。補料分批方法也適用于本發明。當分解代謝物抑制傾向于抑制細胞代謝或者需要使培養基中的底物量在任意時刻均受限時，補料分批方法是有用的。由于補料分批系統的底物濃度難以測定，所以可基于可測因素，諸如pH、溶解氧和廢氣(例如CO2)分壓的變化進行估計。分批和補料分批培養方法是本領域常用并熟知的，實例可參見被引入本文作為參考的Thomas D.Brock在Sinauer AssociatesSunderland，MA(1989)出版的第二版BiotechnologyA Textbook ofIndustrial Microbiology中所述的相關內容或Deshpande，Mukund V.，Appl.Biochem.Biotechnol.，36227(1992)。
工業生產還可通過連續發酵方法實現，其中成分確定的培養基被連續加入生物反應器內，同時取出等量的培養體積用于產物回收。連續培養通常使細胞維持在對數生長期且細胞密度恒定。連續或半連續培養方法允許調節可影響細胞生長或終產物濃度的一種或任意多種因素。例如，一種方法可能限制碳源，但不限定其它所有可調節代謝的參數。在另一些系統中，影響生長的許多因素可被連續改變，而通過培養基濁度測定的細胞濃度則保持恒定。連續系統需要維持穩態生長，因此必須平衡細胞生長率，以補償因為培養期間取出了培養基所造成的細胞損失。調節連續培養過程所需營養物和生長因子的方法，以及最大化產物形成速率的技術均是工業微生物學領域所熟知的，多種方法的詳述參見上述Brock的文獻資料。
優選實施方案詳述盡管本發明所述啟動子適合所有合適的目標編碼區在含油酵母內的表達，但在一種優選實施方案中，本發明所述啟動子則被應用于研發可累積富含PUFAs的油的含油酵母。為實現該目標，就必須導入并表達例如，可被用于合成并累積ω-3和/或ω-6脂肪酸的去飽和酶和延伸酶。
術語“脂肪酸”指鏈長度變化范圍是大約C12到C22的長鏈脂肪族酸(鏈烷酸)(但已知也有更長和更短鏈長度的酸)。大部分鏈長度介于C16和C22之間。脂肪酸的結構由簡單的符號方法“X:Y”表示，其中X是碳(C)原子的總數量，Y是雙鍵數量。
脂肪酸通常被劃分為飽和或不飽和兩種。術語“飽和脂肪酸”指那些碳主鏈之間無“雙鍵”的脂肪酸。與之相反，“不飽和脂肪酸”是沿其碳主鏈具有“雙鍵”的順式異構體。“單不飽和脂肪酸”沿碳主鏈僅具有一個“雙鍵”(例如對棕櫚油酸(16:1)和油酸(18:1)而言通常位于第9和第10個碳原子之間)，而“多不飽和脂肪酸”(或“PUFAs”)沿碳主鏈具有至少2個雙鍵(例如，對亞油酸(18:2)而言是位于第9和第10個碳原子之間和第12和第13個碳原子之間；對α亞麻酸(18:3)而言則位于第9和第10個碳原子之間、第12和第13個碳原子之間和第15和第16個碳原子之間)。
“PUFAs”可被劃分為兩大類(取決于距脂肪酸碳鏈甲基末端最近處的第一個雙鍵位置(n))。因此，“ω-6脂肪酸”(ω-6或n-6)在距其分子ω(甲基)末端的第6個碳原子處具有第一個不飽和雙鍵，并另外具有共計2個或以上的特定雙鍵，后續的每一次不飽和均發生在接近該分子羧基末端的另外3個碳原子處。與之相反，“ω-3脂肪酸”(ω-3或n-3)在距其分子ω末端的第3個碳原子處具有第一個不飽和雙鍵，并另外具有共計3個或以上的雙鍵，后續的每一次不飽和均發生在接近該分子羧基末端的另外3個碳原子處。
就本公開內容的目的而言，ω-參考系被用于說明從ω碳開始記數(就該目的而言，將其編號為1)的碳數量、雙鍵數量和最接近該ω碳的雙鍵位置。該命名法如下表1中的“簡化符號”一欄所示。該表還概括了ω-3和ω-6脂肪酸的通用名、本說明書通篇將用到的縮寫詞和各化合物的化學名稱。
表1多不飽和脂肪酸命名
肪酸的微生物生物合成含油微生物內的脂質累積通常是在響應培養基的總體碳氮比時被引發的。當細胞耗盡可利用的氮源時(例如當碳氮比大于大約40時)，細胞腺苷酸(AMP)的耗盡導致線粒體中的AMP-依賴性異檸檬酸脫氫酶活性終止和檸檬酸的累積，檸檬酸被轉運進細胞溶膠中，并隨后被ATP-檸檬酸裂解酶裂解生成乙酰輔酶A和草酰乙酸。乙酰輔酶A是重新生物合成脂肪酸所需的主要構件。脂肪酸生物合成的第一個關鍵步驟是通過乙酰輔酶A的羧化而合成丙二酰輔酶A。脂肪酸合成由多酶脂肪酸合酶復合物催化，并通過8個雙碳片段(來源于乙酰輔酶A的乙酰基)的縮聚，形成16-碳飽和脂肪酸，即棕櫚酸。
棕櫚酸是較長鏈的飽和和不飽和脂肪酸(例如硬脂酸(18:0)、棕櫚油酸(16:1)和油酸(18:1))通過內質網膜中存在的延伸酶和去飽和酶作用的前體。棕櫚酸和硬脂酸在Δ9去飽和酶的作用下分別轉化為它們的不飽和衍生物，棕櫚油酸(16:1)和油酸(18:1)。
ω-3和ω-6脂肪酸的生物合成簡言之，將LA轉化為GLA、DGLA和ARA(ω-6途徑)和將ALA轉化為STA、ETA、EPA和DHA(ω-3途徑)的代謝過程包括碳鏈通過加入碳原子而獲得的延長和所述分子通過加入雙鍵而實現的去飽和。這需要一系列存在于內質網膜內的特定去飽和酶和延伸酶的參與，下文將這些酶稱為“PUFA生物合成途徑酶”。
更具體而言，“PUFA生物合成途徑酶”指與PUFA的生物合成相關的下述任意一種酶(和編碼該酶的基因)，包括Δ4去飽和酶、Δ5去飽和酶、Δ6去飽和酶、Δ12去飽和酶、Δ15去飽和酶、Δ17去飽和酶、Δ9去飽和酶和/或延伸酶。為進一步闡明本公開內容，術語“去飽和酶”指多酶復合物中可使一種或多種脂肪酸去飽和生成單或多不飽和脂肪酸或目標前體的多肽組分。盡管本說明書就特定脂肪酸而言采用了ω-參考系，但通過利用Δ系從所述底物羧基末端開始記數更易于說明去飽和酶的活性。例如，Δ17去飽和酶可在所述分子中從羧基末端開始編號為第17和第18的碳原子之間實現去飽和并且可以例如，催化從ARA到EPA和/或DGLA到ETA的轉化。與之相反，術語“延伸酶”指多酶復合物中可使脂肪酸碳鏈延伸生成比其作用的脂肪酸底物多2個碳的單或多不飽和脂肪酸的多肽組分。該延伸過程發生在與脂肪酸合酶相關的多步機制中，其中的輔酶A為酰基載體(Lassner etal.，The Plant Cell 8281-292(1996))。簡言之，用長鏈酰基輔酶A縮聚丙二酰輔酶A，產生CO2和β-酮酰基輔酶A(其中該酰基部分已延伸2個碳原子)。后續反應包括還原為β-羥酰基輔酶A、脫水為烯酰基輔酶A并第二次還原生成延伸的酰基輔酶A。
ω-6脂肪酸的合成以下述方式進行油酸(第一種ω-6脂肪酸)在Δ12去飽和酶作用下轉化為LA(18:2)(圖10)。后續ω-6脂肪酸的生成步驟如下1.)LA在Δ6去飽和酶活性作用下轉化為GLA；2.)GLA在延伸酶作用下轉化為DGLA；和3.)DGLA在Δ5去飽和酶作用下轉化為ARA。與之相比，ω-3脂肪酸則全部來源于亞油酸(LA)。具體而言1.)LA在Δ15去飽和酶作用下轉化為ALA；2.)ALA在Δ6去飽和酶活性作用下轉化為STA；3.)STA在延伸酶活性作用下轉化為ETA；和4.)ETA在Δ5去飽和酶活性作用下轉化為EPA。可選地，ETA和EPA可以是DGLA和ARA在Δ17去飽和酶活性作用下分別生成的。EPA可在延伸酶和Δ4去飽和酶活性作用下進一步轉化為DHA。
PUFAs的生成對本領域技術人員而言顯而易見的是，為生成特定PUFA終產物而需被導入宿主生物內的特定功能性將取決于宿主細胞(及其天然PUFA分布圖和/或去飽和酶分布圖)、底物的有效性及目標終產物。如圖10所示，通過導入下述PUFA酶功能性的多種組合Δ4去飽和酶、Δ5去飽和酶、Δ6去飽和酶、Δ12去飽和酶、Δ15去飽和酶、Δ17去飽和酶、Δ9去飽和酶和/或延伸酶，便可在含油酵母內生成LA、GLA、DGLA、ARA、ALA、STA、ETA、EPA、DPA和DHA。本領域技術人員根據公開的文獻資料(例如GenBank)、專利文獻和對具有PUFAs生成能力的微生物的試驗分析，應該能夠鑒定編碼上述任意酶的不同候選基因。因此，有多種去飽和酶和延伸酶均適合作為目標編碼區應用在本發明中。這些目標編碼區均可通過本領域技術人員所熟知的技術與本發明所述GPD和/或GPM啟動子或它們的突變啟動子可操作連接，并作為嵌合基因被用于表達多種ω-6和ω-3脂肪酸(參見例如被完整引入本文作為參考的共同待決的美國專利申請10/840579)。同樣，本發明提供了ω-3和/或ω-6脂肪酸的生成方法，包括
a)提供具有特定嵌合基因的轉化的含油酵母宿主細胞，該嵌合基因含有1)特定基因的啟動子區，選自gpm基因的啟動子區和gpd基因的啟動子區；和2)可在所述含油酵母內表達的編碼功能性ω-3/ω-6脂肪酸生物合成途徑酶的目標編碼區；其中所述啟動子區與編碼區是可操作連接的；以及b)在合適的生長條件下培養步驟(a)的宿主細胞，以生成一種或多種ω-3或ω-6脂肪酸。
在優選實施方案中，所述啟動子區的核酸序列選自SEQ IDNOs23、27、43和44，以及它們的亞序列和突變啟動子；所述目標編碼區則是適合在所述含油酵母內表達生成ω-3或ω-6脂肪酸的任意去飽和酶或延伸酶。
為了以最經濟方式最大產量地生產PUFAs，需在特定條件下培養已轉化的含油酵母宿主細胞，該條件可通過優化本發明所述嵌合基因的表達從而優化去飽和酶和延伸酶活性，其中這些嵌合基因包括gpm或gpd基因的啟動子區，以及編碼PUFA生物合成途徑酶的目標編碼區。
在發酵培養基中，尤其需要注意的是若干種可促進脂質和PUFAs合成的金屬離子(例如Mn+2、Co+2、Zn+2、Mg+2)(Nakahara，T等人在D.J.Kyle和R.Colin編輯的Ind.Appl.Single Cell Oils(1992)第61-97頁所述相關內容)。
可表達多種ω-6和ω-3脂肪酸的含油酵母的生產優選的“可發酵碳源”包括但不限于單糖、寡糖、多糖、鏈烷、脂肪酸、脂肪酸的酯、甘油單酯、甘油二酯、甘油三酯、二氧化碳、甲醇、甲醛、甲酸和含碳的胺。
PUFAs在含油酵母細胞內的高水平累積典型地需要兩個階段的過程，因為代謝狀態必須在生長和脂肪的合成/貯藏之間獲得“平衡”。因此，含油酵母內的PUFAs生成最優選地必需兩個階段的發酵過程。在該方法中，發酵的第一個階段是生成并累積細胞物質，其特征在于快速的細胞生長和細胞分裂。在發酵的第二個階段中，可優選的是在培養中建立脫氮條件，以促進高水平的脂質累積。該脫氮的作用是降低AMP在細胞內的有效濃度，從而降低線粒體的NAD-依賴性異檸檬酸脫氫酶活性。脫氮發生時將累積檸檬酸，從而在胞質內形成大量乙酰輔酶A，并引發脂肪酸合成。因此，該階段的特征在于細胞分裂的終止及其后發生的脂肪酸合成和油累積。盡管細胞典型地生長在大約30℃的條件下，仍有若干研究顯示較低的溫度可提高不飽和脂肪酸的合成(Yongmanitchai and Ward，Appl.Environ.Microbiol.57419-25(1991))。根據過程經濟學，該溫度變動很可能發生在上述兩階段發酵的第一個階段之后，即大部分生物開始生長時。
PUFAs的純化PUFAs可以諸如酰基甘油、磷脂、硫脂或糖脂的游離脂肪酸或酯化形式在宿主微生物中生成，可通過本領域熟知的多種方法將其從宿主細胞中提取出來。Z.Jacobs綜述了針對酵母脂質而言的提取技術、性質分析和可接受性標準(Critical Reviews in Biotechnology12(5/6)463-491(1992))。有關下游加工的簡述可參見A.Singh和O.Ward所著文獻(Adv.Appl.Microbiol.45271-312(1997))。
通常，PUFAs的純化方法可包括用有機溶劑提取、超聲處理、超臨界流體提取(例如利用二氧化碳)、皂化和諸如壓力的物理方法，或這些方法的組合。尤為關注的方法是在水存在條件下，用甲醇和氯仿進行的提取(E.G.Bligh & W.J.Dyer，Can.J.Biochem.Physiol.37911-917(1959))。需要時，水層可被酸化為帶負電荷的質子化部分，并從而使分配進入有機層的目標產物增多。提取結束后，可通過在氮氣流條件下進行的蒸發，除去有機溶劑。當產物以共軛形式被分離時，可通過酶促或化學法將其裂解，以釋放游離脂肪酸或被關注的較不復雜的共軛物，并可對其進行進一步的操作，以獲得目標終產物。用氫氧化鉀可理想地裂解脂肪酸的共軛形式。
如需要進一步的純化，可采用標準方法。這些方法可包括提取、尿素處理、分部結晶、HPLC、分部蒸餾、硅膠層析、高速離心或蒸餾，或這些技術的組合。對諸如酸或烯烴基的反應基的保護可通過已知技術(例如烷基化或碘化)在任意步驟進行。所用方法包括對脂肪酸的甲基化，以獲得甲基酯。同樣，可在任意步驟除去保護基。對含有GLA、STA、ARA、DHA和EPA的部分的純化可通過尿素處理和/或分部蒸餾而理想地實現。
實施例下述實施例進一步定義了本發明。應當理解的是，這些實施例雖然指出了本發明的優選實施方案，但僅用于例證。通過上文的論述和這些實施例，本領域技術人員可確定本發明的基本特征，并且在不背離本發明精神和范疇的前提下，可對其進行多種改變和改進，使其適用于多種用途和條件。
常規方法應用在實施例中的標準重組DNA和分子克隆技術是本領域熟知的，相關描述可參見1.)由Cold Spring Harbor Laboratory；ColdSpring Harbor，NY(1989)出版Sambrook，J.、Fritsch，E.F.和Maniatis，T.所著的Molecular CloningA Laboratory Manual(下文參見“Maniatis”)；2.)由Cold Spring Harbor LaboratoryCold SpringHarbor，NY(1984)出版T.J.Silhavy、M.L.Bennan和L.W.Enquist所著的Experiments with Gene Fusions；以及3.)由Greene PublishingAssoc.and WileyInterscience(1987)出版Ausubel，F.M等人所著的Current Protocols in Molecular Biology。
適用于微生物培養的維持和生長的材料和方法是本領域熟知的。適用于下述實施例的技術可參見American Society for MicrobiologyWashington，D.C.(1994)出版的Manual of Methods for GeneralBacteriology(由Phillipe Gerhardt、R.G.E.Murray、Ralph N.Costilow、Eugene W.Nester、Willis A.Wood、Noel R.Krieg和G.BriggsPhillips編輯)；或Thomas D.Brock在Sinauer AssociatesSunderland，MA(1989)出版的第二版BiotechnologyA Textbook of IndustrialMicrobiology中所述的相關內容。如無另外指明，用于微生物細胞的生長和維持的所有試劑、限制酶和材料獲自Aldrich Chemicals(Milwaukee，WI)、DIFCO Laboratories(Detroit，MI)、GIBCO/BRL(Gaithersburg，MD)或Sigma Chemical Company(St.Louis，MO)。
解脂耶氏酵母的亮氨酸自養菌株購自美國模式培養物保藏所(Rockville，MD；ATCC#76982)，被用于功能性測定。解脂耶氏酵母菌株通常于28℃生長在YPD瓊脂(1％酵母提取物、2％細菌用蛋白胨、2％葡萄糖、2％瓊脂)上。為選擇轉化體，采用了基本培養基(不含硫酸銨或氨基酸的0.17％酵母氮源(NIFCO Laboratories)、2％葡萄糖、0.1％脯氨酸、pH6.1)。所加入的補充腺嘌呤、亮氨酸、賴氨酸和/或尿嘧啶的終濃度為0.01％。
常規分子克隆是根據標準方法進行的(Sambrook et al.，同上)。寡核苷酸由Sigma-Genosys(Spring，TX)合成。定點誘變是利用Stratagene的QuikChangeTM定點誘變試劑盒(San Diego，CA)并遵循生產商的用法說明書進行的。當亞克隆包括聚合酶鏈反應(PCR)或定點誘變時，需對構建體測序，以確定其序列中未導入差錯。PCR產物被克隆進Promega的pGEM-T-easy載體(Madison，WI)中。
對遺傳序列的操縱是利用一套可獲自Genetics Computer GroupInc.的程序(Wisconsin Package Version 9.0，Genetics Computer Group(GCG)，Madison，WI)實現的。該GCG程序“Pileup”所用的缺口產生默認值為12，缺口延伸默認值為4。GCG“Gap”或“Bestfit”程序所用的默認缺口產生罰分為50，默認的缺口延伸罰分為3。如無另外指出，其它所有情況均采用了GCG程序的默認參數。
縮寫詞的意義如下“sec”指秒、“min”指分鐘、“h”指小時、“d”指天、“μL”指微升、“mL”指毫升、“L”指升、“μM”指微摩爾、“mM”指毫摩爾、“M”指摩爾、“mmol”指毫摩爾、“μmole”指微摩爾、“g”指克、“μg”指微克、“ng”指納克、“U”指單位、“bp”指堿基對，“kB”指千堿基。
實施例1解脂耶氏酵母GPD部分的分離本實施例描述了通過利用其它GPD序列保守區來源的引物鑒定解脂耶氏酵母基因中編碼GPD的部分(SEQ ID NOs11和12)的方法。
對來源于釀酒酵母(GenBank編號CAA24607；SEQ ID NO1)、粟酒裂殖酵母(GenBank編號NP_595236；SEQ ID NO2)、米曲霉(GenBank編號AAK08065；SEQ ID NO3)、牙鲆(GenBank編號BAA88638；SEQ ID NO4)、非洲爪蟾(GenBank編號P51469；SEQ IDNO5)和原雞(GenBank編號DECHG3；SEQ ID NO6)的編碼GPD基因的不同蛋白質序列所作的比較顯示這6種不同生物存在若干段保守氨基酸序列(圖1A和1B)。由此設計了分別對應于保守‘KYDSTHG’(SEQ ID NO7)和‘TGAAKAV’(SEQ ID NO8)氨基酸序列的兩種簡并寡核苷酸(如下所示)，并用于擴增解脂耶氏酵母來源GPD編碼區的一部分簡并寡核苷酸YL193(SEQ ID NO9)AAGTACGAYTCBACYCAYGG簡并寡核苷酸YL194(SEQ ID NO10)ACRGCCTTRGCRGCDCCRGT[注SEQ ID NOs9和10所用的核酸簡并密碼為R＝A/G；Y＝C/T；B＝C/G/T；和D＝A/G/T]基于圖1所示GPD序列的全長序列，猜測如上所述擴增的解脂耶氏酵母GPD基因的N-末端將缺失約50個氨基酸，C-末端將缺失大約約115個氨基酸。
PCR擴增在總體積為50μl并包括PCR緩沖液(含有10mM KCl、10mM(NH4)2SO4、20mM Tris-HCl(pH8.75)、2mM MgSO4、0.1％TritonX-100)、100μg/mL BSA(終濃度)、均為200μM的各種脫氧核苷三磷酸、均為10pmol的各種引物、50ng解脂耶氏酵母(ATCC#76982)基因組DNA和1μl Taq DNA聚合酶(Epicentre Technologies)的混合物中進行。熱循環儀的條件被設定為35個循環，每個循環包括95℃1分鐘、56℃30秒和72℃1分鐘，接著于72℃進行10分鐘的最終延伸。
利用Qiagen PCR純化試劑盒(Valencia，CA)純化PCR產物，并接著通過1％(w/v)瓊脂糖凝膠電泳將其進一步純化。隨后將該PCR產物克隆進pGEM-T-easy載體(Promega，Madison，WI)中。將連接的DNA用于轉化大腸桿菌DH5α的細胞，并在含有氨芐青霉素(100μg/mL)的LB上篩選轉化體。對一種轉化體來源的質粒DNA的分析證實存在預期大小的質粒，將其命名為“pT-GPD”。
序列分析顯示pT-GPD含有一個長為507bp的片段(SEQ IDNO11)。通過運行BLAST(Basic Local Alignment Search Tool；Altschul，S.F.，et al.，J.Mol.Biol.215403-410(1993))搜索該序列與BLAST“nr”數據庫(包括所有非冗余GenBank CDS翻譯、3維結構Brookhaven Protein Data Bank來源的序列、SWISS-PROT蛋白質序列數據庫、EMBL和DDBJ數據庫)中所含序列的相似性，可確定該序列的同一性。利用國立生物技術信息中心(NCBI)提供的BLASTN算法可確定與“nr”數據庫中所含所有公開DNA序列的相似性。翻譯所有可讀框內的DNA序列，并利用NCBI提供的BLASTX算法(Gish，W.和States，D.J.Nature Genetics 3266-272(1993))比較其與“nr”數據庫所含所有公開蛋白質序列的相似性。概括了與SEQ ID NO11具有最大相似性的序列的BLAST對比結果是依照％同一性、％相似性和期望值發布的。“％同一性”的定義是兩種蛋白質之間相同氨基酸所占的百分比。“％相似性”的定義是兩種蛋白質之間相同或保守氨基酸所占的百分比。“期望值”估計了匹配的統計顯著性，是用特定分數表示在完全隨機搜索特定大小的數據庫時所期望的匹配數量。
上述長為507bp的pT-GPD被發現編碼169個氨基酸(SEQ IDNO12)。該氨基酸片段與裂殖酵母(GenBank編號NP_595236)的GPD蛋白質序列具有77％同一性和84％相似性(圖2)，期望值為6e-68。該耶氏酵母序列在N-和C-末端分別具有‘KYDSTHG’(SEQID NO7)和‘TGAAKAV’(SEQ ID NO8)氨基酸序列(與被用于擴增該片段的簡并引物對應)。對該部分GPD序列進一步的序列對比結果證實其與小雞(GenBank編號DECHG3)和蛙(GenBank編號P51469)來源的GPD蛋白質分別具有大約72％和74％的同一性(圖2)。
實施例2對解脂耶氏酵母GPM的鑒定本實施例描述了以釀酒酵母GPM蛋白質序列為查詢序列搜索解脂耶氏酵母基因組數據庫，以鑒定解脂耶氏酵母的GPM編碼基因的方法。
具體而言，在運行BLAST(如實施例1所述)搜索“Yeast projectGenolevures”的公開解脂耶氏酵母數據庫(Center for Bioinformatics，LaBRI，Talence Cedex，France)時應用了釀酒酵母GPM蛋白質序列(GenBank編號NP_012770；SEQ ID NO13)。
一個重疊群(“重疊群2217”；SEQ ID NO14)被鑒定編碼解脂耶氏酵母中的GPM。重疊群2217的長度為1049bp，但有5個核苷酸位置的序列不確定(1020號核苷酸位為“n”、39、62、331號位為“y”；以及107號位為“m”)。翻譯所有可讀框內的重疊群2217的DNA序列，并利用BLASTX算法(如實施例1所述)比較其與“nr”數據庫所含所有公開蛋白質序列的相似性。基于這些DNA和蛋白質序列分析結果，證實
●GPM翻譯起始密碼子‘ATG’位于SEQ ID NO14的388bp處；因此，重疊群2217相對于該‘ATG’密碼子具有大約388bp長的上游序列；和●重疊群2217在470號核苷酸位處缺失一個堿基，導致移碼。
GPM中與重疊群2217對應的推導編碼區序列的長度為651bp(SEQ ID NO15)，其蛋白質序列由SEQ ID NO16編碼。該蛋白質具有216個氨基酸，與釀酒酵母(GenBank編號NP_012770；Goffeau，A.，et al.，Science 274(5287)546(1996))的GPM蛋白質序列具有71％同一性、82％相似性，期望值為3e-81(圖3)。
實施例3對解脂耶氏酵母來源gpd和gpm基因的5’上游區的分離為分離實施例1和2中所鑒定基因的GPD和GPM啟動子區，應用了基因組步查技術(TOPOWalker Kit，Invitrogen，CA)。
簡言之，分別用Kpnl、Sacl、Sphl或Pacl消化解脂耶氏酵母的基因組DNA，并用牛小腸堿性磷酸酶(CIP)將其去磷酸化。接著以去磷酸化DNA為模板并以下述一種寡核苷酸為引物分別進行引物延伸反應，所述引物即對GPD而言采用YL206(SEQ ID NO17)，對GPM而言采用YL196(SEQ ID NO18)。用TOPO接頭連接引物延伸產物，并以其為模板和以LinkAmp引物1和第二種合適的寡核苷酸為引物進行第一次PCR反應。具體而言，在PCR反應中，以YL207(SEQ IDNO19)作為導向GPD上游啟動子區的第二種引物，以YL197(SEQ IDNO20)作為導向GPM上游啟動子區的第二種引物。PCR擴增在總體積為50μl并包括PCR緩沖液(含有10mM KCl、10mM(NH4)2SO4、20mM Tris-HCl(pH8.75)、2mM MgSO4、0.1％Triton X-100)、100μg/mLBSA(終濃度)、均為200μM的各種脫氧核苷三磷酸、均為10pmol的各種引物和1μl Taq DNA聚合酶(Epicentre Technologies)的混合物中進行。熱循環儀的條件被設定為35個循環，每個循環包括95℃1分鐘、56℃30秒和72℃1分鐘，接著于72℃進行10分鐘的最終延伸。
接著以第一個PCR產物為模板并以LinkAmp引物2和合適的寡核苷酸為引物進行第二次PCR反應。具體而言，在包括LinkAmp引物2和YL208(SEQ ID NO21)的反應中所用模板是對GPD而言的第一個PCR產物；與之相比，在包括LinkAmp引物2和YL198(SEQ IDNO22)的反應中所用模板是對GPM而言的第一個PCR產物。該PCR擴增如上所述方法進行。
相繼利用Qiagen PCR純化試劑盒和1％(w/v)瓊脂糖凝膠電泳單獨純化分別含有GPD和GPM基因5’上游區的PCR產物。接著將產物克隆進pGEM-T-easy載體(Promega，Madison，WI)中。將連接的DNA用于轉化大腸桿菌DH5α，并在含有氨芐青霉素(100μg/mL)的LB瓊脂上篩選轉化體。
對一種含有gpd基因5’上游區的轉化體來源的質粒DNA所作的分析證實存在預期質粒，將其命名為“pT-GPDP”。序列分析顯示pT-GPDP含有一個長為1848bp的片段(SEQ ID NO23)，該片段包括從GPD基因的翻譯起始密碼子‘ATG’的核苷酸‘A’(被指定為+1號位)開始長為1525bp的5’上游序列。完整裝配重疊SEQ ID NOs23和11可獲得包括GPD起始密碼子上游長為1525bp的片段和該基因中長為791bp的片段的單重疊群(SEQ ID NO24；圖4)。對部分基因序列(+1-+791)的進一步分析表明存在內含子(堿基對+49-+194)。因此，編碼解脂耶氏酵母中GPD基因的部分cDNA序列的長度僅為645bp(SEQ ID NO25)，其對應蛋白質序列(SEQ ID NO26)具有215個氨基酸。通過BLAST分析比較該蛋白與所有公開蛋白質序列的相似性(如實施例1所述)。基于該分析結果確定上述部分GPD蛋白與Cryotococcus cyrvatus(GenBank編號Q9Y796和AAD25080)的GPD最相似(81％同一性)。
對一種含有gpm基因5’上游區的轉化體來源的質粒DNA所作的分析證實存在預期質粒，將其命名為“pT-GPML”。序列分析顯示pT-GPML含有一個長為953bp的片段(SEQ ID NO27)。該克隆具有從GPM基因的翻譯起始密碼子開始長為875bp的5’上游序列。裝配與重疊SEQ ID NOs27和15對應的DNA，可獲得如SEQ ID NO28所示的單DNA重疊群(圖5)。因此，該重疊群含有GPM基因中從-875到+662號位的區域，其中‘ATG’翻譯起始密碼子的‘A’位被指定為+1號位。
實施例4pY5-30的合成本實施例描述了合成含有TEF∷GUS∷XPR嵌合基因的pY5-30的方法。該合成是考查TEF、GPD和GPM啟動子活性的對比研究所必需的，其中制備了含有各啟動子和報道基因的構建體，并對它們進行了分析(實施例5-7)。具體而言，報道基因為大腸桿菌的β-葡糖醛酸糖苷酶編碼基因(GUS；Jefferson，R.A.Nature.342(6251)837-838(1989))。
GUS編碼區的擴增以pBI101(Jefferson，R.A.et al.，EMBO J.63901-3907(1987))為模板和以寡核苷酸YL33(SEQ ID NO29)和YL34(SEQ ID NO30)為引物擴增GUS編碼區。該PCR擴增在總體積為50μl并包括PCR緩沖液(含有10mM KCl、10mM(NH4)2SO4、20mM Tris-HCl(pH8.75)、2mM MgSO4、0.1％Triton X-100)、100μg/mL BSA(終濃度)、均為200μM的各種脫氧核苷三磷酸、均為10pmol的各種引物和1μl Pfu DNA聚合酶(Stratagene，San Diego，CA)的混合物中進行。熱循環儀的條件被設定為35個循環，每個循環包括95℃1分鐘、56℃30秒、72℃1分鐘，接著于72℃進行10分鐘的最終延伸。用Ncol和Pacl消化該PCR產物。
質粒pY5-10的合成質粒pY5是pINA532(由Insitut National Agronomics，Centre debioteehnologie AgroIndustrielle，laboratoire de Genetique Moleculaireet Cellularie INRACNRS，F-78850 Thiverval-Grignon，France的Dr.Claude Gaillardin所贈)的衍生物，被構建用于在解脂耶氏酵母內表達異源基因，如圖6所示。將含有pINA532的ARS18序列和LEU2基因并經過部分消化的長為3598bp的EcoRI片段亞克隆進pBluescript(Strategene，San Diego，CA)的EcoRI位點，可生成pY2。
通過以TEF5’(SEQ ID NO31)和TEF3’(SEQ ID NO32)為引物進行的PCR，由解脂耶氏酵母基因組DNA擴增TEF啟動子(MullerS.，et al.，Yeast，141267-1283(1998))。該PCR擴增在總體積為50μl并包括100ng耶氏酵母基因組DNA、PCR緩沖液(含有10mM KCl、10mM(NH4)2SO4、20mM Tris-HCl(pH8.75)、2mM MgSO4、0.1％TritonX-100)、100μg/mL BSA(終濃度)、均為200μM的各種脫氧核苷三磷酸、均為10pmol的各種引物和1μl Pfu Turbo DNA聚合酶(Stratagene，San Diego，CA)的混合物中進行。擴增步驟如下95℃初始變性3分鐘，接著進行35個循環，每個循環包括95℃1分鐘、56℃30秒、72℃1分鐘。最終的延伸循環于72℃進行10分鐘，接著于4℃終止反應。將長為418bp的PCR產物連接進pCR-Blunt中，生成pIP-tef。將pIP-tef的BamHI/EcoRV片段亞克隆進pY2的BamHI/Smal位點，可生成pY4。
XPR2轉錄終止子是通過以pINA532為模板，以XPR5’(SEQ IDNO33)和XPR3’(SEQ ID NO34)為引物進行PCR而得以擴增的。該PCR擴增是在總體積為50μl的反應混合物中進行，采用了上述組分和條件。用SacII消化長為179bp的PCR產物后，將其連接進pY4的SacII位點，可生成pY5。因此，pY5(如圖6所示)含有耶氏酵母自主復制序列(ARS18)、ColE1質粒復制起點、用于在大腸桿菌內進行選擇的氨芐青霉素抗性基因(AmpR)、用于在耶氏酵母內進行選擇的編碼異丙基蘋果酸異構酶的耶氏酵母LEU2基因、用于耶氏酵母內的異源基因表達的翻譯延伸啟動子(“TEF P”)，和在耶氏酵母內用于轉錄終止異源基因表達的胞外蛋白酶基因終止子(XPR2)。
質粒pY5-10(圖7A)是由pY5構建而得的衍生物。首先，通過3輪以pY5為模板進行的定點誘變構建pY5-4(圖6)。利用寡核苷酸YL1和YL2(SEQ ID NOs35和36)除去pY5中位于LEU2報道基因內的Ncol位點，可生成pY5-1。通過利用寡核苷酸YL3和YL4(SEQID NO37和38)進行的定點誘變，將Ncol位點導入pY5-1中的TEF啟動子和XPR轉錄終止子之間，可生成pY5-2。接著利用寡核苷酸YL23和YL24(SEQ ID NO39和40)，將Pacl位點導入pY5-2中的TEF啟動子和XPR轉錄終止子之間，可生成pY5-4。最后，通過以寡核苷酸YL9(SEQ ID NO41)和YL10(SEQ ID NO42)為引物進行的定點誘變，將Sall位點導入pY5-4中的TEF啟動子和LEU2基因之間，可生成pY5-10(圖7A)。
質粒pY5-30的合成含有TEF∷GUS∷XPR嵌合基因的質粒pY5-30(圖7B)是通過將含有GUS編碼區(同上)的Ncol/Pacl PCR產物插入經由Ncol/Pacl消化的pY5-10中而得以合成的。
實施例5DYZGDG和pYZGMG的合成本實施例描述了pYZGDG(含有GPD∷GUS∷XPR嵌合基因)和pYZGMG(含有GPM∷GUS∷XPR嵌合基因)的合成方法。合成這兩種質粒首先需要鑒定和擴增推定GPD和GPM啟動子區。接著將各推定啟動子區克隆進pY5-30的衍生物中。
推定啟動子區的鑒定和擴增通過基因組步查分離GPD和GPM基因的5’上游序列后，通過查找翻譯起始密碼子‘ATG’周圍的共有基序，并將耶氏酵母GPD和GPM基因的翻譯編碼區分別與其它生物來源的GPD和GPM基因做比較，便可確定翻譯起始位點。這兩種基因的‘ATG’起始位點的上游區域被用于鑒定推定啟動子區。
因此，可確定在GPD基因中(其中‘ATG’翻譯起始密碼子的‘A’核苷酸被指定為+1號位)，介于-968號位和‘ATG’翻譯起始位點之間的核苷酸區域含有所述推定啟動子區(“GPDPro”，如SEQ ID NO43所示)。同樣可確定在GPM基因中，介于-875號位與‘ATG’翻譯起始位點之間的核苷酸區域含有所述推定啟動子區(“GPMLPro”，如SEQ ID NO44所示)。
如上述方法鑒定的推定啟動子區是通過PCR擴增的。具體而言，以寡核苷酸YL211(SEQ ID NO45)和YL212(SEQ ID NO46)為引物和以pT-GPDP(實施例3)為模板擴增GPDPro。以寡核苷酸YL203(SEQ ID NO47)和YL204(SEQ ID NO48)為引物和以pT-GPML(實施例3)為模板擴增GPMLPro。這些PCR擴增均在總體積為50μl并包括PCR緩沖液(含有10mM KCl、10mM(NH4)2SO4、20mMTris-HCl(pH8.75)、2mM MgSO4、0.1％Triton X-100)、100μg/mLBSA(終濃度)、均為200μM的各種脫氧核苷三磷酸、均為10pmol的各種引物和1μl Pfu DNA聚合酶(Stratagene，San Diego，CA)的混合物中進行。熱循環儀的條件被設定為35個循環，每個循環包括95℃1分鐘、56℃30秒、72℃1分鐘，接著于72℃進行10分鐘的最終延伸。
接著利用Qiagen PCR純化試劑盒純化PCR產物，并對其進行下述限制酶切消化和連接反應
●用Sall完全消化GPDPro后，用Ncol對其進行部分消化。通過1％(w/v)瓊脂糖凝膠電泳純化由上所獲的Sall/Ncol片段，將其連接進經由Ncol/Sall消化的pY5-30載體(實施例4)中(其中Ncol/Sall消化切除了pY5-30載體主鏈上的TEF啟動子)。
●于37℃用Ncol和Sall消化GPMLPro 1小時，接著通過1％(w/v)瓊脂糖凝膠電泳對其進行純化。將經由Ncol/Salll消化的PCR產物連接進經由Ncol/Sall消化的pY5-30載體中。
接著將各反應所獲的連接DNA用于單獨轉化大腸桿菌DH5α。在含有氨芐青霉素(100μg/mL)的LB瓊脂上篩選轉化體。
對一個含有GPDPro的轉化體來源的質粒DNA所作的分析證實存在被命名為“pYZGDG”的預期質粒(圖7C)。因此，該質粒含有包括GPD啟動子、GUS報道基因和XPR終止子在內的嵌合基因。
對一個含有GPMLPro的轉化體來源的質粒DNA所作的分析證實存在被命名為“pYZGMG”的預期質粒，該質粒含有GPM∷GUS∷XPR嵌合基因(圖7D)。
實施例6用pY5-30、pYZGDG和pYZGMG對解脂耶氏酵母的轉化根據Chen，D.C.等人所述方法(Appl.Microbiol Biotechnol.48(2)232-235(1997))，分別將質粒pY5-30(實施例4；含有TEF∷GUS∷XPR嵌合基因)、pYZGDG(實施例5；含有GPD∷GUS∷XPR嵌合基因)和pYZGMG(實施例5；含有GPM∷GUS∷XPR嵌合基因)單獨轉化進解脂耶氏酵母ATCC#76982中。
簡言之，將耶氏酵母的亮氨酸營養缺陷體劃線接種至YPD平板上，并于30℃培養大約18小時。從平板上刮取若干次大菌環量的細胞，重懸浮于1mL含有下述物質的轉化緩沖液中●2.25mL 50％PEG，平均MW3350；●0.125mL的2M乙酸鋰，pH6.0；●0.125mL的2M DTT；以及●50μg剪切的鮭精DNA。
將大約500ng質粒DNA溫育在100μl重懸浮細胞中，并于39℃每15分鐘渦旋混合一次，保持1小時。將細胞接種至缺乏亮氨酸的基本培養基平板上，并于30℃溫育2到3天。
利用該技術可分別獲得含有pY5-30、pYZGDG和pYZGMG的轉化體。
實施例7對解脂耶氏酵母內TEF、GPD和GPM啟動子活性的對比分析TEF、GPD和GPM啟動子的活性是在含有pY5-30、pYZGDG和pYZGMG構建體的解脂耶氏酵母內測定的，其中所述三種構建體均具有GUS報道基因和XPR終止子。各表達構建體內的GUS活性是通過組織化學和熒光測定法測定的(Jefferson，R.A.Plant Mol.Biol.Reporter 5387-405(1987))。
通過組織化學試驗測定的GUS活性具體而言，于30℃條件下，在3mL基本培養基(20g/L葡萄糖、1.7g/L不含氨基酸的酵母氮源、1g/L L-脯氨酸、0.1g/L L-腺嘌呤、0.1g/LL-賴氨酸，pH6.1)中，從單菌落開始分別培養含有質粒pY5-30的兩個解脂耶氏酵母菌株、含有質粒pYZGDG的兩個解脂耶氏酵母菌株和含有質粒pYZGMG的兩個解脂耶氏酵母菌株，直至OD600約1.0。接著通過離心收集100μl細胞，將其重懸浮于100μl組織化學染色緩沖液中，并于30℃溫育。[染色緩沖液的制備方法為將5mg 5-溴-4-氯-3-吲哚葡糖苷酸(X-Gluc)溶解在50μl二甲基甲酰胺中，接著加入5mL50mM NaPO4，pH7.0。]組織化學染色結果顯示構建體pY5-30中的TEF啟動子、構建體pYZGDG中的GPD啟動子和構建體pYZGMG中的GPM啟動子均具有活性。GPD啟動子似乎比TEF啟動子強得多(圖8A)，而GPM啟動子則與TEF啟動子至少一樣強(圖8B)。
通過熒光測定法測定的GUS活性還可通過熒光法測定由對應底物β-葡糖苷酸生成的4-甲基傘形酮，以分析GUS活性(Jefferson，R.A.，同上)。
于30℃條件下，在3mL基本培養基(如上所述)中，從單菌落開始分別培養含有質粒pY5-30、pYZGDG和pYZGMG的解脂耶氏酵母菌株，直至OD600約1.0。接著分別將這些3mL培養物加入含有50mL基本培養基的500mL搖瓶中，于30℃震蕩培養箱中培養大約24小時。通過離心收集細胞，重懸浮于Promega細胞裂解緩沖液中，并利用BIO101Biopulverizer系統(Vista，CA)裂解。離心后，取出上清液，保存在冰上。
每一次熒光測定均是將100μl提取液加入700μl GUS測定緩沖液(由2mM 4-甲基傘形酮-β-D-葡糖苷酸(“MUG”)在提取緩沖液中所形成的)中，并置于37℃。分別于0、30和60分鐘時間點取出100μl等分試樣，加入900μl終止緩沖液(1M Na2CO3)中。利用激發波長被設定為360nm，發射波長被設定為455nm的熒光計(CytoFluorR Series4000，Framingham，MA)對各時間點樣品讀數。用10μl提取液和200μlBioRad Bradford試劑確定各樣品中的總蛋白質濃度(Bradford，M.M.Anal.Biochem.72248-254(1976))。GUS活性被表達為納摩爾4-MU/分鐘/毫克蛋白質。
這些熒光測定的結果如圖9所示。具體而言，圖9A所示為在解脂耶氏酵母內，GPD啟動子的強度是基準標記TEF啟動子的3倍；與之相比，圖9B所示為GPM啟動子的GUS活性約為基準標記TEF啟動子的110％。
實施例8GPD啟動子在解脂耶氏酵母內的Δ15去飽和酶表達方面的用途本實施例描述了含有GPD啟動子、真菌Δ15去飽和酶和XPR終止子的嵌合基因的構建，以及該基因在解脂耶氏酵母內的表達。由于轉化的宿主細胞均能夠生成ALA(雖然野生型解脂耶氏酵母不具有任何Δ15去飽和酶活性)，這證實GPD啟動子在諸如解脂耶氏酵母的含油酵母細胞內具有可驅動異源PUFA生物合成途徑酶表達的能力。
含有GPD∷Fm1∷XPR嵌合基因的質粒pY34的構建首先，由pY5衍生構建質粒pY5-13(實施例4)。具體而言，通過以pY5為模板進行6輪定點誘變，構建pY5-13。通過利用寡核苷酸YL5和YL6(SEQ ID NOs49和50)進行的定點誘變，除去pY5中的Sall和Clal位點，可生成pY5-5。通過利用寡核苷酸YL9和YL10(SEQID NOs41和42)進行的定點誘變，將Sall位點導入pY5-5中的LEU2基因和TEF啟動子之間，可生成pY5-6。通過利用寡核苷酸YL7和YL8(SEQ ID NOs51和52)進行的定點誘變，將Pacl位點導入pY5-6中的LEU2基因和ARS18之間，可生成pY5-8。通過利用寡核苷酸YL3和YL4(SEQ ID NOs37和38)，將Ncol位點導入pY5-8中TEF啟動子的翻譯起始密碼子周圍，可生成pY5-9。利用YL1和YL2寡核苷酸(SEQ ID NOs35和36)除去pY5-9中LEU2基因內的Ncol位點，可生成pY5-12。最后，利用寡核苷酸YL61和YL62(SEQ ID NOs53和54)，將BsiWI位點導入pY5-12中的ColEI和XPR區之間，可生成pY5-13。
將含有GPDPro(獲自實施例5)的純化Sall/Ncol片段連接進經由Ncol/Sall消化的pY5-13載體(其中Ncol/Sall消化已將pY5-13載體主鏈的TEF啟動子切除)中，可獲得“pY5-13GPD”。因此，pY5-13GPD含有GPD啟動子∷XPR終止子表達組件。
將pY5-13GPD中位于啟動子片段3’末端的Ncol位點轉化為Notl位點，可獲得“pY5-13GPDN”。對該轉化而言，是通過利用具有Notl位點的GPD有義(SEQ ID NO55)和GPD反義(SEQ ID NO56)引物進行的PCR再次擴增GPD啟動子。用Sall和Notl消化由上所獲的啟動子片段，將其克隆進pY5-13的Sall/Notl位點(從而除去TEF啟動子)，可獲得pY5-13GPDN。
編碼串珠鐮孢菌株M-8114Δ15去飽和酶(SEQ ID NO57；參見共同待決的美國臨時申請60/519191)的ORF是通過以含有全長cDNA的cDNA克隆ffm1c.pK001.g23(E.I.du Pont de Nemours and Co.，Inc.，Wilmington，DE)為模板和采用上和下引物P192(SEQ ID NO59)和P193(SEQ ID NO60)進行的PCR而得以擴增的。該PCR是利用Eppendorf Mastercycler Gradient Cycler和Pfu聚合酶，并遵照生產商的推薦方法進行的。擴增步驟如下95℃初始變性1分鐘，接著進行30個循環，每個循環包括95℃變性30秒、58℃退火1分鐘和72℃延伸1分鐘。最終的延伸循環于72℃進行10分鐘，接著于4℃終止反應。
利用Qiagen DNA純化試劑盒從瓊脂糖凝膠上純化獲得正確大小(約1240bp)的片段，用Notl消化后，將其克隆進質粒pY5-13GPDN中位于GPD啟動子和XPR終止子之間的Notl位點。可生成含有GPD∷Fm1∷XPR嵌合基因的質粒“pY34”。
質粒pY34(GPD∷Fm1∷XPR)在解脂耶氏酵母內的表達采用實施例6所述轉化方法，將pY5(載體克隆對照，獲自實施例4)和pY34(GPDP∷Fm1∷XPR)分別地單獨轉化進野生型(WT)解脂耶氏酵母ATCC#76892中，并在Bio101 DOB/CSM-Leu平板上進行篩選。
于30℃條件下，在3mL基本培養基(配方/L20g葡萄糖、1.7g酵母氮源、1g L-脯氨酸、0.1g L-腺嘌呤、0.1g L-賴氨酸，pH6.1)中分別培養野生型和轉化細胞的單菌落，直至OD600約1.0。收獲細胞，用蒸餾水洗滌，真空離心蒸發濃縮干燥后，將其直接轉酯化，并進行GC分析。具體而言，為了分析脂肪酸，是通過離心收集細胞，并如Bligh，E.G.&Dyer，W.J.所述方法提取脂質(Can.J.Biochem.Physiol.37911-917(1959))。脂肪酸甲基酯是通過用甲氧基鈉使脂質提取物轉酯(Roughan，G.和Nishida I.Arch Biochem Biophys.276(1)38-46(1990))而得以制備，接著用裝配有30-m X 0.25mm(內徑)HP-INNOWAX(Hewlett-Packard)柱的Hewlett-Packard 6890GC對其進行分析。爐溫以3.5℃/分鐘的速度從170℃(保持25分鐘)上升至185℃。
為了直接進行堿基轉酯，先收獲耶氏酵母培養物(3mL)，在蒸餾水中洗滌一次，并在Speed-Vac內的真空條件下干燥5-10分鐘。向樣品中加入甲氧基鈉(100μl，1％)，接著渦旋并振搖樣品20分鐘。加入3滴1M NaCl和400μl己烷后，渦旋并離心樣品。移出上層并如上所述通過GC對其進行分析。
野生型耶氏酵母和各轉化體的脂肪酸分布圖如下表2所示。對脂肪酸的鑒定結果為16:0(棕櫚酸)、16:1(棕櫚油酸)、18:0、18:1(油酸)、18:2(LA)和18:3(ALA)；各脂肪酸組成均以在總脂肪酸中所占百分比的形式表示。
表2鐮孢Δ15去飽和酶在解脂耶氏酵母內的表達
上述結果證實GPD啟動子適合在耶氏酵母內驅動Δ15去飽和酶的表達，從而生成ALA。
序列表<110>E.I.duPont de Nemours&Co.，Inc.
<120>適合含油酵母內的基因表達的甘油醛-3-磷酸脫氫酶和磷酸甘油酸變位酶啟動子<130>CL2299 PCT<160>60<170>PatentIn version 3.2<210>1<211>332<212>PRT<213>釀酒酵母(Genbank編號CAA24607)<400>1Met Val Arg Val Ala Ile Asn Gly Phe Gly Arg Ile Gly Arg Leu Val1 5 10 15Met Arg Ile Ala Leu Ser Arg Pro Asn Val Glu Val Val Ala Leu Asn20 25 30Asp Pro Phe Ile Thr Asn Asp Tyr Ala Ala Tyr Met Phe Lys Tyr Asp35 40 45Ser Thr His Gly Arg Tyr Ala Gly Glu Val Ser His Asp Asp Lys His50 55 60Ile Ile Val Asp Gly Lys Lys Ile Ala Thr Tyr Gln Glu Arg Asp Pro65 70 75 80Ala Asn Leu Pro Trp Gly Ser Ser Asn Val Asp Ile Ala Ile Asp Ser85 90 95Thr Gly Val Phe Lys Glu Leu Asp Thr Ala Gln Lys His Ile Asp Ala100 105 110Gly Ala Lys Lys Val Val Ile Thr Ala Pro Ser Ser Thr Ala Pro Met115 120 125Phe Val Met Gly Val Asn Glu Val Lys Tyr Thr Ser Asp Leu Lys Ile130 135 140Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys145 150 155 160
Val Ile Asn Asp Ala Phe Gly Ile Glu Glu Gly Leu Met Thr Thr Val165 170 175His Ser Leu Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser His Lys180 185 190Asp Trp Arg Gly Gly Arg Thr Ala Ser Gly Asn Ile Ile Pro Ser Ser195 200 205Thr Gly Ala Ala Lys Ala Val Gly Lys Val Leu Pro Glu Leu Gln Gly210 215 220Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Val Asp Val Ser Val225 230 235 240Val Asp Leu Thr Val Lys Leu Asp Lys Glu Thr Thr Tyr Asp Glu Ile245 250 255Lys Lys Val Val Lys Ala Ala Ala Glu Gly Lys Leu Lys Gly Val Leu260 265 270Gly Tyr Thr Glu Asp Ala Val Val Ser Ser Asp Phe Leu Gly Asp Ser275 280 285His Ser Ser Ile Phe Asp Ala Ser Ala Gly Ile Gln Leu Ser Pro Lys290 295 300Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Tyr Gly Tyr Ser Thr305 310 315 320Arg Val Val Asp Leu Val Glu His Ile Ala Lys Ala325 330<210>2<211>335<212>PRT<213>粟酒裂殖酵母(Genbank編號NP_595236)<400>2Met Ala Ile Pro Lys Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg1 5 10 15Ile Val Leu Arg Asn Ala Ile Leu Thr Gly Lys Ile Gln Val Val Ala20 25 30
Val Asn Asp Pro Phe Ile Asp Leu Asp Tyr Met Ala Tyr Met Phe Lys35 40 45Tyr Asp Ser Thr His Gly Arg Phe Glu Gly Ser Val Glu Thr Lys Gly50 55 60Gly Lys Leu Val Ile Asp Gly His Ser Ile Asp Val His Asn Glu Arg65 70 75 80Asp Pro Ala Asn Ile Lys Trp Ser Ala Ser Gly Ala Glu Tyr Val Ile85 90 95Glu Ser Thr Gly Val Phe Thr Thr Lys Glu Thr Ala Ser Ala His Leu100 105 110Lys Gly Gly Ala Lys Arg Val Ile Ile Ser Ala Pro Ser Lys Asp Ala115 120 125Pro Met Phe Val Val Gly Val Asn Leu Glu Lys Phe Asn Pro Ser Glu130 135 140Lys Val Ile Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu145 150 155 160Ala Lys Val Ile Asn Asp Thr Phe Gly Ile Glu Glu Gly Leu Met Thr165 170 175Thr Val His Ala Thr Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser180 185 190Lys Lys Asp Trp Arg Gly Gly Arg Gly Ala Ser Ala Asn Ile Ile Pro195 200 205Ser Ser Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Ala Leu210 215 220Asn Gly Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asp Val225 230 235 240Ser Val Val Asp Leu Thr Val Lys Leu Ala Lys Pro Thr Asn Tyr Glu245 250 255
Asp Ile Lys Ala Ala Ile Lys Ala Ala Ser Glu Gly Pro Met Lys Gly260 265 270Val Leu Gly Tyr Thr Glu Asp Ser Val Val Ser Thr Asp Phe Cys Gly275 280 285Asp Asn His Ser Ser Ile Phe Asp Ala Ser Ala Gly Ile Gln Leu Ser290 295 300Pro Gln Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Trp Gly Tyr305 310 315 320Ser His Arg Val Val Asp Leu Val Ala Tyr Thr Ala Ser Lys Asp325 330 335<210>3<211>338<212>PRT<213>米曲霉(Genbank編號AAK08065)<400>3Met Ala Thr Pro Lys Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg1 5 10 15Ile Val Phe Arg Asn Ala Ile Ala Ser Gly Asp Val Asp Val Val Ala20 25 30Val Asn Asp Pro Phe Ile Glu Thr His Tyr Ala Ala Tyr Met Leu Lys35 40 45Tyr Asp Ser Thr His Gly Arg Phe Gln Gly Thr Ile Glu Thr Tyr Asp50 55 60Glu Gly Leu Ile Val Asn Gly Lys Lys Ile Arg Phe Phe Ala Glu Arg65 70 75 80Asp Pro Ala Ala Ile Pro Trp Gly Ser Ala Gly Ala Ala Tyr Ile Val85 90 95Glu Ser Thr Gly Val Phe Thr Thr Thr Glu Lys Ala Ser Ala His Leu100 105 110Lys Gly Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ser Ala Asp Ala115 120 125
Pro Met Phe Val Met Gly Val Asn Asn Lys Glu Tyr Lys Thr Asp Ile130 135 140Asn Val Leu Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu145 150 155 160Ala Lys Val Ile Asn Asp Asn Phe Gly Leu Val Glu Gly Leu Met Thr165 170 175Thr Val His Ser Tyr Thr Ala Thr Gln Lys Thr Val Asp Ala Pro Ser180 185 190Ala Lys Asp Trp Arg Gly Gly Arg Thr Ala Ala Gln Asn Ile Ile Pro195 200 205Ser Ser Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Ser Leu210 215 220Asn Gly Lys Leu Thr Gly Met Ser Met Arg Val Pro Thr Ala Asn Val225 230 235 240Ser Val Val Asp Leu Thr Cys Arg Thr Glu Lys Ala Val Thr Tyr Glu245 250 255Asp Ile Lys Lys Thr Ile Lys Ala Ala Ser Glu Glu Gly Glu Leu Lys260 265 270Gly Ile Leu Gly Tyr Thr Glu Asp Asp Ile Val Ser Thr Asp Leu Ile275 280 285Gly Asp Ala His Ser Ser Ile Phe Asp Ala Lys Ala Gly Ile Ala Leu290 295 300Asn Glu His Phe Ile Lys Leu Val Ser Trp Tyr Asp Asn Glu Trp Gly305 310 315 320Tyr Ser Arg Arg Val Val Asp Leu Ile Ala Tyr Ile Ser Lys Val Asp325 330 335Gly Gln<210>4
<211>333<212>PRT<213>牙鲆(Genbank編號BAA88638)<400>4Met Val Lys Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg Leu Val1 5 10 15Thr Arg Ala Ala Phe Thr Ser Lys Lys Val Glu Ile Val Ala Ile Asn20 25 30Asp Pro Phe Ile Asp Leu Glu Tyr Met Val Tyr Met Phe Lys Tyr Asp35 40 45Ser Thr His Gly Arg Phe Lys Gly Glu Val Lys Ile Glu Gly Asp Lys50 55 60Leu Val Ile Asp Gly His Lys Ile Thr Val Phe His Glu Arg Asp Pro65 70 75 80Thr Asn Ile Lys Trp Gly Asp Ala Gly Ala His Tyr Val Val Glu Ser85 90 95Thr Gly Val Phe Thr Thr Ile Glu Lys Ala Ser Ala His Leu Lys Gly100 105 110Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ser Ala Asp Ala Pro Met115 120 125Phe Val Met Gly Val Asn His Glu Lys Tyr Asp Lys Ser Leu Gln Val130 135 140Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys145 150 155 160Val Ile Asn Asp Asn Phe Gly Ile Ile Glu Gly Leu Met Ser Thr Val165 170 175His Ala Ile Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser Gly Lys180 185 190Leu Trp Arg Asp Gly Arg Gly Ala Ser Gln Asn Ile Ile Pro Ala Ser195 200 205
Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Glu Leu Asn Gly210 215 220Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asn Val Ser Val225 230 235 240Val Asp Leu Thr Val Arg Leu Glu Lys Pro Ala Ser Tyr Glu Asn Ile245 250 255Lys Lys Val Val Lys Ala Ala Ala Glu Gly Pro Met Lys Gly Tyr Leu260 265 270Ala Tyr Thr Glu His Gln Val Val Ser Thr Asp Phe Asn Gly Asp Thr275 280 285His Ser Ser Ile Phe Asp Ala Gly Ala Gly Ile Ala Leu Asn Asp His290 295 300Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Phe Ala Tyr Ser Asn305 310 315 320Arg Val Cys Asp Leu Met Ala His Met Ala Ser Lys Glu325 330<210>5<211>333<212>PRT<213>非洲爪蟾(Genbank編號P51469)<400>5Met Val Lys Val Gly Ile Asn Gly Phe Gly Cys Ile Gly Arg Leu Val1 5 10 15Thr Arg Ala Ala Phe Asp Ser Gly Lys Val Gln Val Val Ala Ile Asn20 25 30Asp Pro Phe Ile Asp Leu Asp Tyr Met Val Tyr Met Phe Lys Tyr Asp35 40 45Ser Thr His Gly Arg Phe Lys Gly Thr Val Lys Ala Glu Asn Gly Lys50 55 60Leu Ile Ile Asn Asp Gln Val Ile Thr Val Phe Gln Glu Arg Asp Pro65 70 75 80
Ser Ser Ile Lys Trp Gly Asp Ala Gly Ala Val Tyr Val Val Glu Ser85 90 95Thr Gly Val Phe Thr Thr Thr Glu Lys Ala Ser Leu His Leu Lys Gly100 105 110Gly Ala Lys Arg Val Val Ile Ser Ala Pro Ser Ala Asp Ala Pro Met115 120 125Phe Val Val Gly Val Asn His Glu Lys Tyr Glu Asn Ser Leu Lys Val130 135 140Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys145 150 155 160Val Ile Asn Asp Asn Phe Gly Ile Val Glu Gly Leu Met Thr Thr Val165 170 175His Ala Phe Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser Gly Lys180 185 190Leu Trp Arg Asp Gly Arg Gly Ala Gly Gln Asn Ile Ile Pro Ala Ser195 200 205Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Glu Leu Asn Gly210 215 220Lys Ile Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asn Val Ser Val225 230 235 240Val Asp Leu Thr Cys Arg Leu Gln Lys Pro Ala Lys Tyr Asp Asp Ile245 250 255Lys Ala Ala Ile Lys Thr Ala Ser Glu Gly Pro Met Lys Gly Ile Leu260 265 270Gly Tyr Thr Gln Asp Gln Val Val Ser Thr Asp Phe Asn Gly Asp Thr275 280 285His Ser Ser Ile Phe Asp Ala Asp Ala Gly Ile Ala Leu Asn Glu Asn290 295 300Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Cys Gly Tyr Ser Asn
305 310 315 320Arg Val Val Asp Leu Val Cys His Met Ala Ser Lys Glu325 330<210>6<211>333<212>PRT<213>原雞(Genbank編號DECHG3)<400>6Met Val Lys Val Gly Val Asn Gly Phe Gly Arg Ile Gly Arg Leu Val1 5 10 15Thr Arg Ala Ala Val Leu Ser Gly Lys Val Gln Val Val Ala Ile Asn20 25 30Asp Pro Phe Ile Asp Leu Asn Tyr Met Val Tyr Met Phe Lys Tyr Asp35 40 45Ser Thr His Gly His Phe Lys Gly Thr Val Lys Ala Glu Asn Gly Lys50 55 60Leu Val Ile Asn Gly His Ala Ile Thr Ile Phe Gln Glu Arg Asp Pro65 70 75 80Ser Asn Ile Lys Trp Ala Asp Ala Gly Ala Glu Tyr Val Val Glu Ser85 90 95Thr Gly Val Phe Thr Thr Met Glu Lys Ala Gly Ala His Leu Lys Gly100 105 110Gly Ala Lys Arg Val Ile Ile Ser Ala Pro Ser Ala Asp Ala Pro Met115 120 125Phe Val Met Gly Val Asn His Glu Lys Tyr Asp Lys Ser Leu Lys Ile130 135 140Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys145 150 155 160Val Ile His Asp Asn Phe Gly Ile Val Glu Gly Leu Met Thr Thr Val165 170 175
His Ala Ile Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser Gly Lys180 185 190Leu Trp Arg Asp Gly Arg Gly Ala Ala Gln Asn Ile Ile Pro Ala Ser195 200 205Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Glu Leu Asn Gly210 215 220Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asn Val Ser Val225 230 235 240Val Asp Leu Thr Cys Arg Leu Glu Lys Pro Ala Lys Tyr Asp Asp Ile245 250 255Lys Arg Val Val Lys Ala Ala Ala Asp Gly Pro Leu Lys Gly Ile Leu260 265 270Gly Tyr Thr Glu Asp Gln Val Val Ser Cys Asp Phe Asn Gly Asp Ser275 280 285His Ser Ser Thr Phe Asp Ala Gly Ala Gly Ile Ala Leu Asn Asp His290 295 300Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Phe Gly Tyr Ser Asn305 310 315 320Arg Val Val Asp Leu Met Val His Met Ala Ser Lys Glu325 330<210>7<211>7<212>PRT<213>人工序列<220>
<223>GPD中的保守蛋白基序<400>7Lys Tyr Asp Ser Thr His Gly1 5<210>8<211>7<212>PRT<213>人工序列
<220>
<223>GPD內的保守蛋白基序<400>8Thr Gly Ala Ala Lys Ala Val1 5<210>9<211>20<212>DNA<213>人工序列<220>
<223>簡并引物YL193<400>9aagtacgayt cbacycaygg20<210>10<211>20<212>DNA<213>人工序列<220>
<223>簡并引物YL194<400>10acrgccttrg crgcdccrgt20<210>11<211>507<212>DNA<213>解脂耶氏酵母<400>11aagtacgact ccacccacgg ccgattcaag ggcaaggtcg aggccaagga cggcggtctg60atcatcgacg gcaagcacat ccaggtcttc ggtgagcgag acccctccaa catcccctgg120ggtaaggccg gtgccgacta cgttgtcgag tccaccggtg tcttcaccgg caaggaggct180gcctccgccc acctcaaggg tggtgccaag aaggtcatca tctccgcccc ctccggtgac240gcccccatgt tcgttgtcgg tgtcaacctc gacgcctaca agcccgacat gaccgtcatc300tccaacgctt cttgtaccac caactgtctg gctccccttg ccaaggttgt caacgacaag360tacggaatca ttgagggtct catgaccacc gtccactcca tcaccgccac ccagaagacc420gttgacggtc cttcccacaa ggactggcga ggtggccgaa ccgcctctgg taacatcatc480ccctcttcca ccggagccgc caaggct507
<210>12<211>169<212>PRT<213>解脂耶氏酵母<400>12Lys Tyr Asp Ser Thr His Gly Arg Phe Lys Gly Lys Val Glu Ala Lys1 5 10 15Asp Gly Gly Leu Ile Ile Asp Gly Lys His Ile Gln Val Phe Gly Glu20 25 30Arg Asp Pro Ser Asn Ile Pro Trp Gly Lys Ala Gly Ala Asp Tyr Val35 40 45Val Glu Ser Thr Gly Val Phe Thr Gly Lys Glu Ala Ala Ser Ala His50 55 60Leu Lys Gly Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ser Gly Asp65 70 75 80Ala Pro Met Phe Val Val Gly Val Asn Leu Asp Ala Tyr Lys Pro Asp85 90 95Met Thr Val Ile Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro100 105 110Leu Ala Lys Val Val Asn Asp Lys Tyr Gly Ile Ile Glu Gly Leu Met115 120 125Thr Thr Val His Ser Ile Thr Ala Thr Gln Lys Thr Val Asp Gly Pro130 135 140Ser His Lys Asp Trp Arg Gly Gly Arg Thr Ala Ser Gly Asn Ile Ile145 150 155 160Pro Ser Ser Thr Gly Ala Ala Lys Ala165<210>13<211>245<212>PRT<213>釀酒酵母(GenBank Accesssion No.NP_012770)<400>13
Met Pro Lys Leu Val Leu Val Arg His Gly Gln Ser Glu Trp Asn Glu1 5 10 15Lys Asn Leu Phe Thr Gly Trp Val Asp Val Lys Leu Ser Ala Lys Gly20 25 30Gln Gln Glu Ala Ala Arg Ala Gly Glu Leu Leu Lys Glu Lys Lys Val35 40 45Tyr Pro Asp Val Leu Tyr Thr Ser Lys Leu Ser Arg Ala Ile Gln Thr50 55 60Ala Asn Ile Ala Leu Glu Lys Ala Asp Arg Leu Trp Ile Pro Val Asn65 70 75 80Arg Ser Trp Arg Leu Asn Glu Arg His Tyr Gly Asp Leu Gln Gly Lys85 90 95Asp Lys Ala Glu Thr Leu Lys Lys Phe Gly Glu Glu Lys Phe Asn Thr100 105 110Tyr Arg Arg Ser Phe Asp Val Pro Pro Pro Pro Ile Asp Ala Ser Ser115 120 125Pro Phe Ser Gln Lys Gly Asp Glu Arg Tyr Lys Tyr Val Asp Pro Asn130 135 140Val Leu Pro Glu Thr Glu Ser Leu Ala Leu Val Ile Asp Arg Leu Leu145 150 155 160Pro Tyr Trp Gln Asp Val Ile Ala Lys Asp Leu Leu Ser Gly Lys Thr165 170 175Val Met Ile Ala Ala His Gly Asn Ser Leu Arg Gly Leu Val Lys His180 185 190Leu Glu Gly Ile Ser Asp Ala Asp Ile Ala Lys Leu Asn Ile Pro Thr195 200 205Gly Ile Pro Leu Val Phe Glu Leu Asp Glu Asn Leu Lys Pro Ser Lys210 215 220Pro Ser Tyr Tyr Leu Asp Pro Glu Ala Ala Ala Ala Gly Ala Ala Ala
225 230 235 240Val Ala Asn Gln Gly245<210>14<211>1049<212>DNA<213>解脂耶氏酵母<220>
<221>綜合特征<222>(1020)..(1020)<223>n為a、c、g、或t<400>14caattgagtg cgagcgacac aattgggtgt cacgtgccyt aattgacctc ggatcgtgga60gyccccagtt atacagcaac cacgaggtgc atgagtagga gacgtcmcca gacaataggg120tttttttgga ctggagaggg tagggcaaaa gcgctcaacg ggctgtttgg ggagctatgg180gggaggaatt ggcgatattt gtgaggttga cggctccgat ttgcgtgttt tgtcgcttct240gcatctcccc atacccatat cttccctccc cacctctttc cacgataatt ttacggatca300gcaataaggt tccttctcct agtttccacg yccatatata tctatgctgc gtcgtccttt360tcgtgacatc accaaaacac atacaaaaat gcctaaactg attctgctgc gacacggcca420gtccgactgg aacgagaaga acctgttcac cggatgggtc gacgtcaagt ctccgagctc480ggccacaccg aggccaagcg agccggtact ctgctcaagg agtccggtct caagccccag540attctctaca cctccgagct ctctcgagcc atccagaccg ccaacattgc tctggatgag600gccgaccgac tgtggatccc caccaagcga tcgtggcgac tcaacgagcg acactacggc660gctctgcagg gcaaggacaa ggccgccact ctcgccgagt acggccccga gcagttccag720ctctggcgac gatcttttga cgtccctcct ccccctatcg ctgacgacga caagtggtct780cagtacaacg acgagcgata ccaggacatc cccaaggata ttctgcccaa gaccgagtct840ctgaagctcg tgattgaccg actccttcct tactacaact ccgacattgt ccccgacctt900aaggccggca agaccgtcct cattgctgcc cacggaaact ccctccgagc tctcgtcaag960cacctcgacg gtatctccga tgacgatatc gccgccctta acatccccac cggtatcccn1020ctcgtgctac gaccttgatg acaacctca 1049<210>15<211>651
<212>DNA<213>解脂耶氏酵母<220>
<221>綜合特征<222>(633)..(633)<223>n為a、c、g、或t<400>15atgcctaaac tgattctgct gcgacacggc cagtccgact ggaacgagaa gaacctgttc60accggatggg tcgacgtcaa gctctccgag ctcggccaca ccgaggccaa gcgagccggt120actctgctca aggagtccgg tctcaagccc cagattctct acacctccga gctctctcga180gccatccaga ccgccaacat tgctctggat gaggccgacc gactgtggat ccccaccaag240cgatcgtggc gactcaacga gcgacactac ggcgctctgc agggcaagga caaggccgcc300actctcgccg agtacggccc cgagcagttc cagctctggc gacgatcttt tgacgtccct360cctcccccta tcgctgacga cgacaagtgg tctcagtaca acgacgagcg ataccaggac420atccccaagg atattctgcc caagaccgag tctctgaagc tcgtgattga ccgactcctt480ccttactaca actccgacat tgtccccgac cttaaggccg gcaagaccgt cctcattgct540gcccacggaa actccctccg agctctcgtc aagcacctcg acggtatctc cgatgacgat600atcgccgccc ttaacatccc caccggtatc ccnctcgtgc tacgaccttg a 651<210>16<211>216<212>PRT<213>解脂耶氏酵母<400>16Met Pro Lys Leu Ile Leu Leu Arg His Gly Gln Ser Asp Trp Asn Glu1 5 10 15Lys Asn Leu Phe Thr Gly Trp Val Asp Val Lys Leu Ser Glu Leu Gly20 25 30His Thr Glu Ala Lys Arg Ala Gly Thr Leu Leu Lys Glu Ser Gly Leu35 40 45Lys Pro Gln Ile Leu Tyr Thr Ser Glu Leu Ser Arg Ala Ile Gln Thr50 55 60Ala Asn Ile Ala Leu Asp Glu Ala Asp Arg Leu Trp Ile Pro Thr Lys65 70 75 80
Arg Ser Trp Arg Leu Asn Glu Arg His Tyr Gly Ala Leu Gln Gly Lys85 90 95Asp Lys Ala Ala Thr Leu Ala Glu Tyr Gly Pro Glu Gln Phe Gln Leu100 105 110Trp Arg Arg Ser Phe Asp Val Pro Pro Pro Pro Ile Ala Asp Asp Asp115 120 125Lys Trp Ser Gln Tyr Asn Asp Glu Arg Tyr Gln Asp Ile Pro Lys Asp130 135 140Ile Leu Pro Lys Thr Glu Ser Leu Lys Leu Val Ile Asp Arg Leu Leu145 150 155 160Pro Tyr Tyr Asn Ser Asp Ile Val Pro Asp Leu Lys Ala Gly Lys Thr165 170 175Val Leu Ile Ala Ala His Gly Asn Ser Leu Arg Ala Leu Val Lys His180 185 190Leu Asp Gly Ile Ser Asp Asp Asp Ile Ala Ala Leu Asn Ile Pro Thr195 200 205Gly Ile Pro Leu Val Leu Arg Pro210 215<210>17<211>26<212>DNA<213>人工序列<220>
<223>引物YL206<400>17ccttgccggt gaagacaccg gtggac 26<210>18<211>25<212>DNA<213>人工序列<220>
<223>引物YL196
<400>18gacgtcgacc catccggtga acagg 25<210>19<211>28<212>DNA<213>人工序列<220>
<223>引物YL207<400>19gaagacctgg atgtgcttgc cgtcgatg 28<210>20<211>23<212>DNA<213>人工序列<220>
<223>引物YL197<400>20gagcagagta ccggctcgct tgg23<210>21<211>24<212>DNA<213>人工序列<220>
<223>引物YL208<400>21gaccttgccc ttgaatcggc cgtg 24<210>22<211>25<212>DNA<213>人工序列<220>
<223>引物YL198<400>22gaatctgggg cttgagaccg gactc 25<210>23<211>1848<212>DNA<213>解脂耶氏酵母<400>23
gtgattgcct ctgaatactt tcaacaagtt acacccttcg cggcgacgat ctacagcccg60atcacatgaa ctttggccga gggatgatgt aatcgagtat cgtggtagtt caatacgtac120atgtacgatg ggtgcctcaa ttgtgcgata ctactacaag tgcagcacgc tcgtgcccgt180accctacttt gtcggacgtc cctgctccct cgttcaacat ctcaagctca acaatcagtg240ttggacactg caacgctagc agccggtacg tggctttagc cccatgctcc atgctccatg300ctccatgctc tgggcctatg agctagccgt ttggcgcaca tagcatagtg acatgtcgat360caagtcaaag tcgaggtgtg gaaaacgggc tgcgggtcgc caggggcctc acaagcgcct420ccaccgcaga cgcccacctc gttagcgtcc attgcgatcg tctcggtaca tttggttaca480ttttgcgaca ggttgaaatg aatcggccga cgctcggtag tcggaaagag ccgggaccgg540ccggcgagca taaaccggac gcagtaggat gtcctgcacg ggtctttttg tggggtgtgg600agaaaggggt gcttggagat ggaagccggt agaaccgggc tgcttgtgct tggagatgga660agccggtaga accgggctgc ttggggggat ttggggccgc tgggctccaa agaggggtag720gcatttcgtt ggggttacgt aattgcggca tttgggtcct gcgcgcatgt cccattggtc780agaattagtc cggataggag acttatcagc caatcacagc gccggatcca cctgtaggtt840gggttgggtg ggagcacccc tccacagagt agagtcaaac agcagcagca acatgatagt900tgggggtgtg cgtgttaaag gaaaaaaaag aagcttgggt tatattcccg ctctatttag960aggttgcggg atagacgccg acggagggca atggcgccat ggaaccttgc ggatatcgat1020acgccgcggc ggactgcgtc cgaaccagct ccagcagcgt tttttccggg ccattgagcc1080gactgcgacc ccgccaacgt gtcttggccc acgcactcat gtcatgttgg tgttgggagg1140ccacttttta agtagcacaa ggcacctagc tcgcagcaag gtgtccgaac caaagaagcg1200gctgcagtgg tgcaaacggg gcggaaacgg cgggaaaaag ccacgggggc acgaattgag1260gcacgccctc gaatttgaga cgagtcacgg ccccattcgc ccgcgcaatg gctcgccaac1320gcccggtctt ttgcaccaca tcaggttacc ccaagccaaa cctttgtgtt aaaaagctta1380acatattata ccgaacgtag gtttgggcgg gcttgctccg tctgtccaag gcaacattta1440tataagggtc tgcatcgccg gctcaattga atcttttttc ttcttctctt ctctatattc1500attcttgaat taaacacaca tcaacatggc catcaaagtc ggtattaacg gattcgggcg1560aatcggacga attgtgagta ccatagaagg tgatggaaac atgacccaac agaaacagat1620gacaagtgtc atcgacccac cagagcccaa ttgagctcat actaacagtc gacaacctgt1680cgaaccaatt gatgactccc cgacaatgta ctaacacagg tcctgcgaaa cgctctcaag1740
aaccctgagg tcgaggtcgt cgctgtgaac gaccccttca tcgacaccga gtacgctgct1800tacatgttca agtacgactc cacccacggc cgattcaagg gcaaggtc 1848<210>24<211>2316<212>DNA<213>解脂耶氏酵母<400>24gtgattgcct ctgaatactt tcaacaagtt acacccttcg cggcgacgat ctacagcccg60atcacatgaa ctttggccga gggatgatgt aatcgagtat cgtggtagtt caatacgtac120atgtacgatg ggtgcctcaa ttgtgcgata ctactacaag tgcagcacgc tcgtgcccgt180accctacttt gtcggacgtc cctgctccct cgttcaacat ctcaagctca acaatcagtg240ttggacactg caacgctagc agccggtacg tggctttagc cccatgctcc atgctccatg300ctccatgctc tgggcctatg agctagccgt ttggcgcaca tagcatagtg acatgtcgat360caagtcaaag tcgaggtgtg gaaaacgggc tgcgggtcgc caggggcctc acaagcgcct420ccaccgcaga cgcccacctc gttagcgtcc attgcgatcg tctcggtaca tttggttaca480ttttgcgaca ggttgaaatg aatcggccga cgctcggtag tcggaaagag ccgggaccgg540ccggcgagca taaaccggac gcagtaggat gtcctgcacg ggtctttttg tggggtgtgg600agaaaggggt gcttggagat ggaagccggt agaaccgggc tgcttgtgct tggagatgga660agccggtaga accgggctgc ttggggggat ttggggccgc tgggctccaa agaggggtag720gcatttcgtt ggggttacgt aattgcggca tttgggtcct gcgcgcatgt cccattggtc780agaattagtc cggataggag acttatcagc caatcacagc gccggatcca cctgtaggtt840gggttgggtg ggagcacccc tccacagagt agagtcaaac agcagcagca acatgatagt900tgggggtgtg cgtgttaaag gaaaaaaaag aagcttgggt tatattcccg ctctatttag960aggttgcggg atagacgccg acggagggca atggcgccat ggaaccttgc ggatatcgat1020acgccgcggc ggactgcgtc cgaaccagct ccagcagcgt tttttccggg ccattgagcc1080gactgcgacc ccgccaacgt gtcttggccc acgcactcat gtcatgttgg tgttgggagg1140ccacttttta agtagcacaa ggcacctagc tcgcagcaag gtgtccgaac caaagaagcg1200gctgcagtgg tgcaaacggg gcggaaacgg cgggaaaaag ccacgggggc acgaattgag1260gcacgccctc gaatttgaga cgagtcacgg ccccattcgc ccgcgcaatg gctcgccaac1320gcccggtctt ttgcaccaca tcaggttacc ccaagccaaa cctttgtgtt aaaaagctta1380acatattata ccgaacgtag gtttgggcgg gcttgctccg tctgtccaag gcaacattta1440
tataagggtc tgcatcgccg gctcaattga atcttttttc ttcttctctt ctctatattc1500attcttgaat taaacacaca tcaacatggc catcaaagtc ggtattaacg gattcgggcg1560aatcggacga attgtgagta ccatagaagg tgatggaaac atgacccaac agaaacagat1620gacaagtgtc atcgacccac cagagcccaa ttgagctcat actaacagtc gacaacctgt1680cgaaccaatt gatgactccc cgacaatgta ctaacacagg tcctgcgaaa cgctctcaag1740aaccctgagg tcgaggtcgt cgctgtgaac gaccccttca tcgacaccga gtacgctgct1800tacatgttca agtacgactc cacccacggc cgattcaagg gcaaggtcga ggccaaggac1860ggcggtctga tcatcgacgg caagcacatc caggtcttcg gtgagcgaga cccctccaac1920atcccctggg gtaaggccgg tgccgactac gttgtcgagt ccaccggtgt cttcaccggc1980aaggaggctg cctccgccca cctcaagggt ggtgccaaga aggtcatcat ctccgccccc2040tccggtgacg cccccatgtt cgttgtcggt gtcaacctcg acgcctacaa gcccgacatg2100accgtcatct ccaacgcttc ttgtaccacc aactgtctgg ctccccttgc caaggttgtc2160aacgacaagt acggaatcat tgagggtctc atgaccaccg tccactccat caccgccacc2220cagaagaccg ttgacggtcc ttcccacaag gactggcgag gtggccgaac cgcctctggt2280aacatcatcc cctcttccac cggagccgcc aaggct 2316<210>25<211>645<212>DNA<213>解脂耶氏酵母<400>25atggccatca aagtcggtat taacggattc gggcgaatcg gacgaattgt cctgcgaaac60gctctcaaga accctgaggt cgaggtcgtc gctgtgaacg accccttcat cgacaccgag120tacgctgctt acatgttcaa gtacgactcc acccacggcc gattcaaggg caaggtcgag180gccaaggacg gcggtctgat catcgacggc aagcacatcc aggtcttcgg tgagcgagac240ccctccaaca tcccctgggg taaggccggt gccgactacg ttgtcgagtc caccggtgtc300ttcaccggca aggaggctgc ctccgcccac ctcaagggtg gtgccaagaa ggtcatcatc360tccgccccct ccggtgacgc ccccatgttc gttgtcggtg tcaacctcga cgcctacaag420cccgacatga ccgtcatctc caacgcttct tgtaccacca actgtctggc tccccttgcc480aaggttgtca acgacaagta cggaatcatt gagggtctca tgaccaccgt ccactccatc540accgccaccc agaagaccgt tgacggtcct tcccacaagg actggcgagg tggccgaacc600
gcctctggta acatcatccc ctcttccacc ggagccgcca aggct645<210>26<211>215<212>PRT<213>解脂耶氏酵母<400>26Met Ala Ile Lys Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg Ile1 5 10 15Val Leu Arg Asn Ala Leu Lys Asn Pro Glu Val Glu Val Val Ala Val20 25 30Asn Asp Pro Phe Ile Asp Thr Glu Tyr Ala Ala Tyr Met Phe Lys Tyr35 40 45Asp Ser Thr His Gly Arg Phe Lys Gly Lys Val Glu Ala Lys Asp Gly50 55 60Gly Leu Ile Ile Asp Gly Lys His Ile Gln Val Phe Gly Glu Arg Asp65 70 75 80Pro Ser Asn Ile Pro Trp Gly Lys Ala Gly Ala Asp Tyr Val Val Glu85 90 95Ser Thr Gly Val Phe Thr Gly Lys Glu Ala Ala Ser Ala His Leu Lys100 105 110Gly Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ser Gly Asp Ala Pro115 120 125Met Phe Val Val Gly Val Asn Leu Asp Ala Tyr Lys Pro Asp Met Thr130 135 140Val Ile Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala145 150 155 160Lys Val Val Asn Asp Lys Tyr Gly Ile Ile Glu Gly Leu Met Thr Thr165 170 175Val His Ser Ile Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser His180 185 190
Lys Asp Trp Arg Gly Gly Arg Thr Ala Ser Gly Asn Ile Ile Pro Ser195 200 205Ser Thr Gly Ala Ala Lys Ala210 215<210>27<211>953<212>DNA<213>解脂耶氏酵母<400>27gcctctgaat actttcaaca agttacaccc ttcattaatt ctcacgtgac acagattatt60aacgtctcgt accaaccaca gattacgacc cattcgcagt cacagttcac tagggtttgg120gttgcatccg ttgagagcgg tttgttttta accttctcca tgtgctcact caggttttgg180gttcagatca aatcaaggcg tgaaccactt tgtttgagga caaatgtgac acaaccaacc240agtgtcaggg gcaagtccgt gacaaagggg aagatacaat gcaattactg acagttacag300actgcctcga tgccctaacc ttgccccaaa ataagacaac tgtcctcgtt taagcgcaac360cctattcagc gtcacgtcat aatagcgttt ggatagcact agtctatgag gagcgtttta420tgttgcggtg agggcgattg gtgctcatat gggttcaatt gaggtggcgg aacgagctta480gtcttcaatt gaggtgcgag cgacacaatt gggtgtcacg tggcctaatt gacctcgggt540cgtggagtcc ccagttatac agcaaccacg aggtgcatgg gtaggagacg tcaccagaca600atagggtttt ttttggactg gagagggttg ggcaaaagcg ctcaacgggc tgtttgggga660gctgtggggg aggaattggc gatatttgtg aggttaacgg ctccgatttg cgtgttttgt720cgctcctgca tctccccata cccatatctt ccctccccac ctctttccac gataatttta780cggatcagca ataaggttcc ttctcctagt ttccacgtcc atatatatct atgctgcgtc840gtccttttcg tgacatcacc aaaacacata caaaaatgcc taaactgatt ctgctgcgac900acggccagtc cgactggaac gagaagaacc tgttcaccgg atgggtcgac gtc 953<210>28<211>1537<212>DNA<213>解脂耶氏酵母<220>
<221>綜合特征<222>(1507)..(1507)<223>n為a、c、g、或t
<400>28gcctctgaat actttcaaca agttacaccc ttcattaatt ctcacgtgac acagattatt60aacgtctcgt accaaccaca gattacgacc cattcgcagt cacagttcac tagggtttgg120gttgcatccg ttgagagcgg tttgttttta accttctcca tgtgctcact caggttttgg180gttcagatca aatcaaggcg tgaaccactt tgtttgagga caaatgtgac acaaccaacc240agtgtcaggg gcaagtccgt gacaaagggg aagatacaat gcaattactg acagttacag300actgcctcga tgccctaacc ttgccccaaa ataagacaac tgtcctcgtt taagcgcaac360cctattcagc gtcacgtcat aatagcgttt ggatagcact agtctatgag gagcgtttta420tgttgcggtg agggcgattg gtgctcatat gggttcaatt gaggtggcgg aacgagctta480gtcttcaatt gaggtgcgag cgacacaatt gggtgtcacg tggcctaatt gacctcgggt540cgtggagtcc ccagttatac agcaaccacg aggtgcatgg gtaggagacg tcaccagaca600atagggtttt ttttggactg gagagggttg ggcaaaagcg ctcaacgggc tgtttgggga660gctgtggggg aggaattggc gatatttgtg aggttaacgg ctccgatttg cgtgttttgt720cgctcctgca tctccccata cccatatctt ccctccccac ctctttccac gataatttta780cggatcagca ataaggttcc ttctcctagt ttccacgtcc atatatatct atgctgcgtc840gtccttttcg tgacatcacc aaaacacata caaaaatgcc taaactgatt ctgctgcgac900acggccagtc cgactggaac gagaagacct gttcaccgga tgggtcgacg tcaagctctc960cgagctcggc cacaccgagg ccaagcgagc cggtactctg ctcaaggagt ccggtctcaa1020gccccagatt ctctacacct ccgagctctc tcgagccatc cagaccgcca acattgctct1080ggatgaggcc gaccgactgt ggatccccac caagcgatcg tggcgactca acgagcgaca1140ctacggcgct ctgcagggca aggacaaggc cgccactctc gccgagtacg gccccgagca1200gttccagctc tggcgacgat cttttgacgt ccctcctccc cctatcgctg acgacgacaa1260gtggtctcag tacaacgacg agcgatacca ggacatcccc aaggatattc tgcccaagac1320cgagtctctg aagctcgtga ttgaccgact ccttccttac tacaactccg acattgtccc1380cgaccttaag gccggcaaga ccgtcctcat tgctgcccac ggaaactccc tccgagctct1440cgtcaagcac ctcgacggta tctccgatga cgatatcgcc gcccttaaca tccccaccgg1500tatcccnctc gtgctacgac cttgatgaca acctcaa 1537<210>29<211>33<212>DNA<213>人工序列
<220>
<223>引物YL33<400>29tttccatggt acgtcctgta gaaaccccaa ccc 33<210>30<211>36<212>DNA<213>人工序列<220>
<223>引物YL34<400>30cccttaatta atcattgttt gcctccctgc tgcggt 36<210>31<211>19<212>DNA<213>人工序列<220>
<223>引物TEF5’<400>31agagaccggg ttggcggcg 19<210>32<211>30<212>DNA<213>人工序列<220>
<223>引物TEF3’<400>32ttggatcctt tgaatgattc ttatactcag 30<210>33<211>29<212>DNA<213>人工序列<220>
<223>引物XPR5’<400>33tttccgcggc ccgagattcc ggcctcttc 29<210>34<211>31
<212>DNA<213>人工序列<220>
<223>引物XPR3’<400>34tttccgcgga cacaatatct ggtcaaattt c 31<210>35<211>30<212>DNA<213>人工序列<220>
<223>引物YL1<400>35cagtgccaaa agccaaggca ctgagctcgt 30<210>36<211>31<212>DNA<213>人工序列<220>
<223>引物YL2<400>36gacgagctca gtgccttggc ttttggcact g 31<210>37<211>36<212>DNA<213>人工序列<220>
<223>引物YL3<400>37gtataagaat cattcaccat ggatccacta gttcta 36<210>38<211>36<212>DNA<213>人工序列<220>
<223>引物YL4<400>38tagaactagt ggatccatgg tgaatgattc ttatac 36
<210>39<211>36<212>DNA<213>人工序列<220>
<223>引物YL23<400>39atggatccac tagttaatta actagagcgg ccgcca 36<210>40<211>36<212>DNA<213>人工序列<220>
<223>引物YL24<400>40tggcggccgc tctagttaat taactagtgg atccat 36<210>41<211>35<212>DNA<213>人工序列<220>
<223>引物YL9<400>41tggtaaataa atgatgtcga ctcaggcgac gacgg 35<210>42<211>35<212>DNA<213>人工序列<220>
<223>引物YL10<400>42ccgtcgtcgc ctgagtcgac atcatttatt tacca 35<210>43<211>971<212>DNA<213>解脂耶氏酵母<400>43gacgcagtag gatgtcctgc acgggtcttt ttgtggggtg tggagaaagg ggtgcttgga60gatggaagcc ggtagaaccg ggctgcttgt gcttggagat ggaagccggt agaaccgggc120
tgcttggggg gatttggggc cgctgggctc caaagagggg taggcatttc gttggggtta180cgtaattgcg gcatttgggt cctgcgcgca tgtcccattg gtcagaatta gtccggatag240gagacttatc agccaatcac agcgccggat ccacctgtag gttgggttgg gtgggagcac300ccctccacag agtagagtca aacagcagca gcaacatgat agttgggggt gtgcgtgtta360aaggaaaaaa aagaagcttg ggttatattc ccgctctatt tagaggttgc gggatagacg420ccgacggagg gcaatggcgc catggaacct tgcggatatc gatacgccgc ggcggactgc480gtccgaacca gctccagcag cgttttttcc gggccattga gccgactgcg accccgccaa540cgtgtcttgg cccacgcact catgtcatgt tggtgttggg aggccacttt ttaagtagca600caaggcacct agctcgcagc aaggtgtccg aaccaaagaa gcggctgcag tggtgcaaac660ggggcggaaa cggcgggaaa aagccacggg ggcacgaatt gaggcacgcc ctcgaatttg720agacgagtca cggccccatt cgcccgcgca atggctcgcc aacgcccggt cttttgcacc780acatcaggtt accccaagcc aaacctttgt gttaaaa gc ttaacatatt ataccgaacg840taggtttggg cgggcttgct ccgtctgtcc aaggcaacat ttatataagg gtctgcatcg900ccggctcaat tgaatctttt ttcttcttct cttctctata ttcattcttg aattaaacac960acatcaacat g 971<210>44<211>878<212>DNA<213>解脂耶氏酵母<400>44gcctctgaat actttcaaca agttacaccc ttcattaatt ctcacgtgac acagattatt60aacgtctcgt accaaccaca gattacgacc cattcgcagt cacagttcac tagggtttgg120gttgcatccg ttgagagcgg tttgttttta accttctcca tgtgctcact caggttttgg180gttcagatca aatcaaggcg tgaaccactt tgtttgagga caaatgtgac acaaccaacc240agtgtcaggg gcaagtccgt gacaaagggg aagatacaat gcaattactg acagttacag300actgcctcga tgccctaacc ttgccccaaa ataagacaac tgtcctcgtt taagcgcaac360cctattcagc gtcacgtcat aatagcgttt ggatagcact agtctatgag gagcgtttta420tgttgcggtg agggcgattg gtgctcatat gggttcaatt gaggtggcgg aacgagctta480gtcttcaatt gaggtgcgag cgacacaatt gggtgtcacg tggcctaatt gacctcgggt540cgtggagtcc ccagttatac agcaaccacg aggtgcatgg gtaggagacg tcaccagaca600atagggtttt ttttggactg gagagggttg ggcaaaagcg ctcaacgggc tgtttgggga660
gctgtggggg aggaattggc gatatttgtg aggttaacgg ctccgatttg cgtgttttgt720cgctcctgca tctccccata cccatatctt ccctccccac ctctttccac gataatttta780cggatcagca ataaggttcc ttctcctagt ttccacgtcc atatatatct atgctgcgtc840gtccttttcg tgacatcacc aaaacacata caaaaatg878<210>45<211>30<212>DNA<213>人工序列<220>
<223>引物YL211<400>45tttgtcgacg cagtaggatg tcctgcacgg 30<210>46<211>34<212>DNA<213>人工序列<220>
<223>引物YL212<400>46tttccatggt tgatgtgtgt ttaattcaag aatg34<210>47<211>33<212>DNA<213>人工序列<220>
<223>引物YL203<400>47tttccatggt tgtatgtgtt ttggtgatgt cac 33<210>48<211>33<212>DNA<213>人工序列<220>
<223>引物YL204<400>48tttgtcgacc gtttaagcgc aaccctattc agc 33
<210>49<211>39<212>DNA<213>人工序列<220>
<223>引物YL5<400>49cccccctcga ggtcgatggt gtcgataagc ttgatatcg 39<210>50<211>39<212>DNA<213>人工序列<220>
<223>引物YL6<400>50cgatatcaag cttatcgaca ccatcgacct cgagggggg 39<210>51<211>37<212>DNA<213>人工序列<220>
<223>引物YL7<400>51caaccgattt cgacagttaa ttaataattt gaatcga 37<210>52<211>37<212>DNA<213>人工序列<220>
<223>引物YL8<400>52tcgattcaaa ttattaatta actgtcgaaa tcggttg 37<210>53<211>33<212>DNA<213>人工序列<220>
<223>引物YL61<400>53acaattccac acaacgtacg agccggaagc ata 33
<210>54<211>33<212>DNA<213>人工序列<220>
<223>引物YL62<400>54tatgcttccg gctcgtacgt tgtgtggaat tgt 33<210>55<211>18<212>DNA<213>人工序列<220>
<223>引物GPD有義<400>55atacgagatc gtcaaggg 18<210>56<211>26<212>DNA<213>人工序列<220>
<223>引物GPD反義<400>56gcggccgcgg attgatgtgt gtttaa 26<210>57<211>1209<212>DNA<213>串珠鐮孢<400>57atggcgactc gacagcgaac tgccaccact gttgtggtcg aggaccttcc caaggtcact60cttgaggcca agtctgaacc tgtgttcccc gatatcaaga ccatcaagga tgccattccc120gcgcactgct tccagccctc gctcgtcacc tcattctact acgtcttccg cgattttgcc180atggtctctg ccctcgtctg ggctgctctc acctacatcc ccagcatccc cgaccagacc240ctccgcgtcg cagcttggat ggtctacggc ttcgtccagg gtctgttctg caccggtgtc300tggattctcg gccatgagtg cggccacggt gctttctctc tccacggaaa ggtcaacaat360gtgaccggct ggttcctcca ctcgttcctc ctcgtcccct acttcagctg gaagtactct420
caccaccgcc accaccgctt caccggccac atggatctcg acatggcttt cgtccccaag480actgagccca agccctccaa gtcgctcatg attgctggca ttgacgtcgc cgagcttgtt540gaggacaccc ccgctgctca gatggtcaag ctcatcttcc accagctttt cggatggcag600gcgtacctct tcttcaacgc tagctctggc aagggcagca agcagtggga gcccaagact660ggcctctcca agtggttccg agtcagtcac ttcgagccta ccagcgctgt cttccgcccc720aacgaggcca tcttcatcct catctccgat atcggtcttg ctctaatggg aactgctctg780tactttgctt ccaagcaagt tggtgtttcg accattctct tcctctacct tgttccctac840ctgtgggttc accactggct cgttgccatt acctacctcc accaccacca caccgagctc900cctcactaca ccgctgaggg ctggacctac gtcaagggag ctctcgccac tgtcgaccgt960gagtttggct tcatcggaaa gcacctcttc cacggtatca ttgagaagca cgttgttcac1020catctcttcc ctaagatccc cttctacaag gctgacgagg ccaccgaggc catcaagccc1080gtcattggcg accactactg ccacgacgac cgaagcttcc tgggccagct gtggaccatc1140ttcggcacgc tcaagtacgt cgagcacgac cctgcccgac ccggtgccat gcgatggaac1200aaggactag1209<210>58<211>402<212>PRT<213>串珠鐮孢<400>58Met Ala Thr Arg Gln Arg Thr Ala Thr Thr Val Val Val Glu Asp Leu1 5 10 15Pro Lys Val Thr Leu Glu Ala Lys Ser Glu Pro Val Phe Pro Asp Ile20 25 30Lys Thr Ile Lys Asp Ala Ile Pro Ala His Cys Phe Gln Pro Ser Leu35 40 45Val Thr Ser Phe Tyr Tyr Val Phe Arg Asp Phe Ala Met Val Ser Ala50 55 60Leu Val Trp Ala Ala Leu Thr Tyr Ile Pro Ser Ile Pro Asp Gln Thr65 70 75 80Leu Arg Val Ala Ala Trp Met Val Tyr Gly Phe Val Gln Gly Leu Phe85 90 95
Cys Thr Gly Val Trp Ile Leu Gly His Glu Cys Gly His Gly Ala Phe100 105 110Ser Leu His Gly Lys Val Asn Asn Val Thr Gly Trp Phe Leu His Ser115 120 125Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His His Arg His130 135 140His Arg Phe Thr Gly His Met Asp Leu Asp Met Ala Phe Val Pro Lys145 150 155 160Thr Glu Pro Lys Pro Ser Lys Ser Leu Met Ile Ala Gly Ile Asp Val165 170 175Ala Glu Leu Val Glu Asp Thr Pro Ala Ala Gln Met Val Lys Leu Ile180 185 190Phe His Gln Leu Phe Gly Trp Gln Ala Tyr Leu Phe Phe Asn Ala Ser195 200 205Ser Gly Lys Gly Ser Lys Gln Trp Glu Pro Lys Thr Gly Leu Ser Lys210 215 220Trp Phe Arg Val Ser His Phe Glu Pro Thr Ser Ala Val Phe Arg Pro225 230 235 240Asn Glu Ala Ile Phe Ile Leu Ile Ser Asp Ile Gly Leu Ala Leu Met245 250 255Gly Thr Ala Leu Tyr Phe Ala Ser Lys Gln Val Gly Val Ser Thr Ile260 265 270Leu Phe Leu Tyr Leu Val Pro Tyr Leu Trp Val His His Trp Leu Val275 280 285Ala Ile Thr Tyr Leu His His His His Thr Glu Leu Pro His Tyr Thr290 295 300Ala Glu Gly Trp Thr Tyr Val Lys Gly Ala Leu Ala Thr Val Asp Arg305 310 315 320
Glu Phe Gly Phe Ile Gly Lys His Leu Phe His Gly Ile Ile Glu Lys325 330 335His Val Val His His Leu Phe Pro Lys Ile Pro Phe Tyr Lys Ala Asp340 345 350Glu Ala Thr Glu Ala Ile Lys Pro Val Ile Gly Asp His Tyr Cys His355 360 365Asp Asp Arg Ser Phe Leu Gly Gln Leu Trp Thr Ile Phe Gly Thr Leu370 375 380Lys Tyr Val Glu His Asp Pro Ala Arg Pro Gly Ala Met Arg Trp Asn385 390 395 400Lys Asp<210>59<211>36<212>DNA<213>人工序列<220>
<223>引物P192<400>59aaatatgcgg ccgcacaatg gcgactcgac agcgaa 36<210>60<211>34<212>DNA<213>人工序列<220>
<223>引物P193<400>60tttatagcgg ccgcctagtc cttgttccat cgca3權利要求
1.在轉化的酵母細胞內表達目標編碼區的方法，包括a)提供具有嵌合基因的轉化的酵母細胞，該嵌合基因含有(i)選自gpm基因和gpd基因的耶氏酵母基因的啟動子區；和(ii)可在該酵母細胞內表達的目標編碼區；其中的啟動子區與目標編碼區可操作連接；并b)在表達步驟(a)所述的嵌合基因的條件下培養步驟(a)的轉化的酵母細胞。
2.權利要求1的方法，其中耶氏酵母基因分離自解脂耶氏酵母。
3.權利要求1的方法，其中gpm基因的啟動子區被包含在選自SEQ ID NO27、SEQ ID NO28和SEQ ID NO44的核酸片段內。
4.權利要求1的方法，其中gpd基因的啟動子區被包含在選自SEQID NO23、SEQ ID NO24和SEQ ID NO43的核酸片段內。
5.權利要求3或4的方法，其中所述啟動子區含有至少一個突變，該突變并未降低其啟動子活性。
6.權利要求5的方法，其中所述啟動子活性為野生型啟動子活性的至少大約20％到至少大約400％。
7.權利要求1的方法，其中轉化的酵母細胞為含油酵母。
8.權利要求7的方法，其中的含油酵母為選自耶氏酵母屬、假絲酵母屬、紅酵母屬、紅冬孢屬、隱球酵母屬、絲孢酵母屬和油脂酵母屬的屬的成員。
9.權利要求8的方法，其中的含油酵母選自解脂耶氏酵母ATCC#20362、解脂耶氏酵母ATCC#8862、解脂耶氏酵母ATCC#18944、解脂耶氏酵母ATCC#76982和解脂耶氏酵母LGAMS(7)1。
10.權利要求1的方法，其中所述目標編碼區編碼選自去飽和酶、延伸酶、氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、殼多糖酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡聚糖酶、β-葡糖苷酶、轉化酶、漆酶、脂酶、甘露糖苷酶、齒斑葡聚糖酶、氧化酶、果膠分解酶、過氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶和木聚糖酶的多肽。
11.生成ω-3或ω-6脂肪酸的方法，包括a)提供具有嵌合基因的轉化的含油酵母，該嵌合基因含有(i)選自gpm基因和gpd基因的耶氏酵母基因的啟動子區；和(ii)編碼ω-3/ω-6脂肪酸生物合成途徑中的至少一種酶的編碼區；其中的啟動子區和編碼區可操作連接；并b)在表達ω-3/ω-6脂肪生物合成途徑的至少一種酶并生成ω-3或ω-6脂肪酸的條件下培養步驟(a)的轉化的含油酵母；c)任選地回收ω-3或ω-6脂肪酸。
12.權利要求11的方法，其中的耶氏酵母基因分離自解脂耶氏酵母。
13.權利要求11的方法，其中gpm基因的啟動子區被包含在選自SEQ ID NO27、SEQ ID NO28和SEQ ID NO44的核酸片段內。
14.權利要求11的方法，其中gpd基因的啟動子區被包含在選自SEQ ID NO23、SEQ ID NO24和SEQ ID NO43的核酸片段內。
15.權利要求11的方法，其中所述目標編碼區編碼選自去飽和酶和延伸酶的多肽。
16.權利要求15的方法，其中所述去飽和酶選自Δ9去飽和酶、Δ12去飽和酶、Δ6去飽和酶、Δ5去飽和酶、Δ17去飽和酶、Δ15去飽和酶和Δ4去飽和酶。
17.權利要求11的方法，其中所述含油酵母是選自耶氏酵母屬、假絲酵母屬、紅酵母屬、紅冬孢屬、隱球酵母屬、絲孢酵母屬和油脂酵母屬的屬的成員。
18.權利要求17的方法，其中所述含油酵母為解脂耶氏酵母。
19.權利要求18的方法，其中所述解脂耶氏酵母為選自解脂耶氏酵母ATCC#20362、解脂耶氏酵母ATCC#8862、解脂耶氏酵母ATCC#18944、解脂耶氏酵母ATCC#76982和解脂耶氏酵母LGAMS(7)1的菌株。
20.權利要求11的方法，其中所述ω-3或ω-6脂肪酸選自亞油酸、α-亞麻酸、γ-亞麻酸、十八碳四烯酸、二同-γ-亞麻酸、二十碳四烯酸、花生四烯酸、二十碳五烯酸、二十二碳五烯酸和二十二碳六烯酸。
21.含有選自SEQ ID NO23、SEQ ID NO24和SEQ ID NO43的gpd啟動子的分離核酸分子。
22.含有選自SEQ ID NO27、SEQ ID NO28和SEQ ID NO44的gpm啟動子的分離核酸分子。
全文摘要
業已發現與解脂耶氏酵母甘油醛－3－磷酸脫氫酶(gpd)和磷酸甘油酸變位酶(gpm)基因相連的啟動子區對含油酵母內的異源基因表達尤其有效。本發明所述啟動子區已被證實可驅動參與生成ω－3和ω－6脂肪酸的基因的高水平表達。
文檔編號C12N15/74GK1842598SQ200480024629
公開日2006年10月4日申請日期2004年6月23日優先權日2003年6月25日
發明者S·K·皮卡塔吉奧, Q·朱申請人:納幕爾杜邦公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：S.K.皮卡塔吉奧;Q.朱
技術所有人：納幕爾杜邦公司
我是此專利的發明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.食品功能因子基因工程菌種的構建、智能高通量進化篩選 2.發酵工藝優化
2、馬老師：1.酶工程與生物催化 2.釀造技術與風味分析 3.生物質資源綜合利用
3、林老師：1.釀造微生物育種及關鍵釀造工藝開發 2. 真菌基因功能及調控網絡解析 3.精細化學品、蛋白真菌細胞底盤開發
4、張老師：1.發酵食品安全：危害物相關基因的篩選，危害物產生菌的快速檢測，危害物的預警和發酵過程控制 2.真菌次級代謝與調控 3.釀造酒相關研究
5、郭老師：1.現代釀造技術與食品安全 2. 酵母生物學 3.生物基化學品與合成生物學
如您是高校老師，可以點此聯系我們加入專家庫。

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！