<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

被工程化為過表達輔助蛋白的重組宿主細胞的制作方法

文檔序號:11109332閱讀:857來源:國知局
被工程化為過表達輔助蛋白的重組宿主細胞的制造方法與工藝

本發明屬于重組生物技術領域,特別屬于蛋白質表達領域。本發明一般涉及一種從宿主細胞中表達目標蛋白(POI)的方法。本發明特別涉及改善宿主細胞表達和/或分泌目標蛋白的能力,和宿主細胞在蛋白質表達中的用途。本發明還涉及細胞培養技術,更具體地涉及培養細胞以生產用于醫學目的或食品的所需分子。



背景技術:

已經采用原核和真核宿主完成了目標蛋白(POI)的成功生產。最突出的實例是如大腸桿菌(Escherichia coli)的細菌,如釀酒酵母(Saccharomyces cerevisiae)、巴斯德畢赤酵母(Pichia pastoris)或多形漢森酵母(Hansenula polymorpha)的酵母菌,如泡盛曲霉(Aspergillus awamori)或里氏木霉(Trichoderma reesei)的絲狀真菌,或如CHO細胞的哺乳動物細胞。雖然一些蛋白質的產量容易以高效率實現,但是很多其它蛋白質僅以相對低的水平生產。

為了提高重組蛋白的分泌,一種策略是針對涉及蛋白質折疊和加工的宿主分泌途徑。

在WO 93/25676中首次建議將編碼蛋白質二硫鍵異構酶(PDI)的cDNA和編碼異源二硫鍵鍵合蛋白質的cDNA的共表達作為增加異源蛋白產量的方法。WO 93/25676報道了通過與PDI共表達可以提高安逖斯塔辛(antistasin)和蜱抗凝血蛋白的重組表達。

WO 94/08012提供了通過增加Hsp70伴侶蛋白(即KAR2/BiP,或PDI伴侶蛋白質)的表達來提高酵母菌中過表達的蛋白質的分泌的方法。

WO 05/0617818和WO 06/067511提供了通過采用基于2μm的表達質粒在酵母菌中生產所需的異源蛋白的方法。已證明,當一個或多個伴侶蛋白與異源蛋白的基因在同一質粒上共表達時,異源蛋白的產量顯著提高。

WO 2008/128701A2描述了通過利用蛋白質BMH2、BFR2、COG6、COY1、CUP5、IMH1、KIN2、SEC31、SSA4和SSE1中的一個來增加POI從真核細胞中的分泌的表達系統。

另一種增加蛋白質生產的方法基于激活未折疊蛋白反應(UPR)的轉錄因子HAC1的過表達。轉錄分析表明超過330個基因受HAC1的調控,這些基因中的多數涉及分泌細胞器的分泌或生物發生(biogenesis)。WO 01/72783描述了通過誘導升高的未折疊蛋白反應(UPR)來增加從真核細胞中分泌的異源蛋白質的量的方法,其中所述UPR受選自HAC1、PTC2和IRE1的蛋白質的共表達的調節。

Wentz等利用釀酒酵母的酵母菌表面展示基因文庫,以通過應用合適的選擇壓力來鑒定分泌改善的菌株。發現酵母菌cDNA CCW12、SED1、CWP2、RPP0以溫度依賴的方式增強scTCR展示。當在20℃下誘導時,ERO1增強蛋白分泌(Wentz等,Appl.Environ.Microbiol.(2007)73(4):1189-1198)。

Liu等(Biotechnol.Prog.(2006),22:1090-1095)證明在巴斯德畢赤酵母中Kar2的共過表達使rhG-CSF表達增加了5.6倍。將KAR2與Sec63、PDI1和YDJ1組合實現了2.8倍、6.5倍和5.94倍的增加。在Blatt等實施的實驗中,KAR2(BiP)的共過表達使A33scFv在畢赤酵母中的表達增加了兩倍。將KAR2與PDI1組合幾乎消除了積極KAR2作用(Blatt等,Appl.Microbiol.Biotechnol.,2007,74:381-389)。

Guerfall等探討了在巴斯德畢赤酵母(P.pastoris.)中過表達內源性HAC1的作用。此外,HAC1被組成型地和誘導型地過表達。在所有的例子中,證實了誘導的UPR的結果是增加的KAR2表達。全長HAC1的組成型過表達有很小或沒有作用,而在四分之一的例子中,HAC1的誘導形式的過表達導致了蛋白質分泌的增加,在四分之三的例子中,HAC1的誘導形式的過表達導致了蛋白質分泌的降低(Guerfall等,Microbial Cell Factories,(2010),9:49)。

Sleep等證明LHS1的共過表達增加了rHA的濃度。LHS1與SIL1、JEM1和SCJ1組合,但效價(titer)低于單獨與Jem1共過表達。在相同的時間,SIL1、LHS1和JEM1的共過表達使GM-CSF表達提高了1.45倍,而使rHA表達提高了近1.1和2倍,這取決于培養基(Sleep等,Applied and Environmental Microbiology,(2008)74(24):7759-7766)。

US 2009221030 A1描述了多種輔助蛋白(特別是BiP1)單獨地和與其它輔助蛋白(特別是LHS1)組合在里氏木霉中的共表達。單獨BiP1獲得了最高表達值,而BiP1與LHS1的組合導致了分泌的蛋白效價降低8%。

US 8,440,456提供了巴斯德畢赤酵母的基因組序列,并公開了編碼單一肽、分子伴侶和啟動子的核酸序列。其公開了包含核酸序列的表達載體和能夠過表達14種分子伴侶的遺傳工程化的酵母菌。具體選擇ROT1、SHR3和SIL1來試驗,然而,SIL1未觀察到表達,且ROT1或SHR3的過表達未能引起異源蛋白質分泌的任何顯著增強。

在宿主細胞中高水平的蛋白產量可被一個或多個不同步驟,如折疊、二硫鍵的形成、糖基化、在細胞內轉運或自細胞中釋放限制。基于目前本領域最先進的知識,甚至當宿主生物體的全部基因組的DNA序列可獲得時,許多涉及的機制仍然不能被完全理解且不能預測。

仍然需要改善宿主細胞生產和/或分泌目標蛋白的能力的方法。本發明的一個目的是提供提高重組蛋白質在宿主細胞中的產量的新方法,所述方法是簡單且有效的并適用于工業方法。本發明的另一目的是提供實現上述目的的宿主細胞。又一目的是識別可用于提供所述宿主細胞的新的輔助蛋白及編碼該輔助蛋白的序列。

必須指出的是,除非上下文另有明確指示,本文所用單數形式“一(a)”、“一種(an)”和“所述/該(the)”包括所提及的復數且反之亦然。因此,例如,提及的“一種宿主細胞”或“一種方法”分別包括一種或多種所述宿主細胞或方法,并且提及的“所述方法”包括本領域普通技術人員已知的可被修飾或置換的等效步驟和方法。類似地,例如,提及的“方法(methods)”或“宿主細胞(host cells)”分別包括“一種宿主細胞”或“一種方法”。

除非另有說明,一系列元素之前的術語“至少”將被理解為是指該系列中的每一元素。本領域技術人員將承認或采用常規實驗能夠確定,本文所述的本發明的具體實施方案的許多等價方案。這種等價方案意圖被本發明所涵蓋。

術語“和/或”無論在本文何處使用均包括“和”、“或”和“由所述術語連接的元素的全部或任意其它組合”的含義。例如,A、B和/或C的含義是A、B、C,A+B、A+C、B+C和A+B+C。

本文所用術語“約(about)”或“大約(approximately)”的含義是在給定值或范圍的20%內,優選地10%內,和更優選地5%內。其還包括具體數目,如,約20包括20。

術語“少于”、“多于”或“大于”包括具體數目。例如,少于20的含義是≤20,多于20的含義是≥20。

本說明書及權利要求或項目全文中,除非上下文有其它要求,詞語“包括/包含(comprise)”以及變形詞語諸如“包括/包含(comprises)”和“包括/包含(comprising)”將被理解為意指包括陳述的整數(或步驟)、或整數(或步驟)的集合。其并不排除任何其它的整數(或步驟)、或整數(或步驟)的集合。當本文使用時,術語“包括/包含(comprising)”能夠以術語“含有(containing)”、“由…組成(composed of)”、“包含(including)”、“具有(having)”或“攜帶(carrying)”替代。當本文使用時,“由…組成”排除了未在權利要求/項目中規定的任何整數或步驟。當本文使用時,“本質上由…組成”并不排除實質上不影響權利要求/項目的基本特征的和新特征的整數或步驟。本文的每一個實例中,術語“包括/包含”、“本質上由…組成”和“由…組成”中任意一個可被其它兩個術語中的任意一個替代。

另外,在描述本發明的代表性實施方案時,本說明書可能將本發明的方法和/過程體現為特定的步驟順序。然而,就方法或過程并不依賴于本文所陳述的特定步驟順序來說,該方法或過程不應限于所描述的特定步驟順序。本領域的普通技術人員能夠理解,其他步驟的順序也是可能的。因此,在本說明書中所描述的步驟的具體順序不應被解釋為對權利要求的限制。此外,涉及本發明的方法和/或過程的權利要求也不應被限制于字面所記載的其步驟的操作,而且本領域的技術人員能夠容易地理解,這些順序可以是變化的并且仍然被包含在本發明的精神和范圍之內。

應該理解的是,本發明并不限于本文所述的具體的方法學、方案、材料、試劑和物質等。本文所使用的名詞只用于描述特定實施方案的目的,其并不意在限定本發明的范圍,本發明的范圍僅由權利要求/項目限定。

本說明書全文所引用的所有的出版物和專利(包括所有的專利、專利申請、科學出版物、制造商的說明書、指導書等),無論在前還是在后,均以其全文并入本文。本文無任何內容能被解釋為承認由于在先發明,本發明不早于這樣的公開內容。就通過引入并入的材料與本說明書矛盾或不一致來說,本說明書將取代任何這樣的材料。

發明概述

本發明部分地基于對多核苷酸序列(“本發明的多核苷酸”)的驚人的發現,該多核苷酸的表達、優選地過表達使得目標蛋白(POI)的產量增加。這一公開提供了這樣的方法和材料:所述方法和材料可用于通過將宿主細胞工程化使得其能夠過表達一種或多種新鑒定的多核苷酸序列以編碼一種或多種輔助蛋白,改善POI的產量。

術語“產量”是指本文所述的POI或模型蛋白,特別是SDZ-Fab(SEQ ID NO:25和26)和HyHEL-Fab(SEQ ID NO:29和30)的量,其分別是例如從工程化宿主細胞中收獲的,并且增加的產量可歸因于宿主細胞生產或分泌的POI的量增加。產量可以以mg POI/g生物質(以干細胞重量或濕細胞重量來度量)的宿主細胞呈現。當本文使用時,術語“效價”同樣地指生產的POI或模型蛋白的量,以mg POI/L培養上清液呈現。當從工程化宿主細胞中獲得的產量與從工程化之前的宿主細胞(即未工程化的宿主細胞)中獲得的產量相比較時,可以測定產量的增加。

優選地,當將“產量”用于本文所述的模型蛋白的上下文中時,其是按照實施例5c的描述測定的。因此,當將所述“產量”用于本文所述的模型蛋白的上下文中時,其還指“Fab產量”或“Fab效價”。Fab效價以mg/L表示,Fab產量以mg/g生物質(以干細胞重量或濕細胞重量來度量)表示。

簡言之,用編碼本文所述的輔助蛋白或其功能同系物的多核苷酸工程化分別表達模型蛋白HyHEL-Fab和SDZ-Fab的巴斯德畢赤酵母菌株CBS7435mutS pPM2d_pAOX HyHEL和/或CBS7435mutS pPM2d_pAOX SDZ(它們的產生參見實施例1)。對于共過表達,將編碼輔助蛋白的基因克隆在巴斯德畢赤酵母GAP啟動子的控制下,然后轉化至實施例4中所述的生產Fab的菌株中。對于低表達,將編碼KO靶標或其功能同系物的基因從生產Fab的菌株的基因組中敲除(參見實施例6)。在25℃下,將工程化的細胞于含有10g/L甘油和50μg/mL博來霉素(Zeocin)的YP-培養基中生長過夜(參見實施例5a)。將這種培養物的等分試樣(對應終OD600為2.0)轉移至包含20g/L葡萄糖和葡萄糖料片的合成培養基M2中(描述于實施例5a),并在25℃下培養25小時。將培養物洗滌并重懸浮于合成培養基M2中,并將等分試樣(對應終OD600為4.0)轉移至用5g/L甲醇補充的合成培養基M2中。每12小時再添加3次的甲醇(5g/L)。48小時后,通過離心收獲細胞。通過測量源于1mL細胞懸浮液的細胞團塊的重量來測定生物質。所述上清液用于通過ELISA的SDZ-Fab或HyHEL-Fab的相應地定量(描述于實施例5c)。具體而言,抗-人IgG抗體(如ab7497,Abcam)用作包被抗體,如山羊抗-人IgG(Fab特異性)抗體(如堿性磷酸酶綴合的Sigma A8542)用作檢測抗體。將商業的人Fab/κ,IgG片段用作起始濃度為100ng/mL的標準品,相應地稀釋上清液樣品。基于細胞被工程化為過表達多肽之前和之后的POI產量的比較,可測定產量的增加。示于實施例中的與模型蛋白SDZ-Fab和/或HyHEL-Fab相關的標準試驗可以用于確定產量差異。

第一方面,本發明涉及一種或多種新發現的輔助蛋白及它或它們提高POI產量的用途。本發明基于、但不限于輔助蛋白HP1、HP2、HP3、HP4、HP5、HP6、HP7、HP8、HP9或HP10或其功能同系物。功能同系物的定義在本申請的后面部分限定。輔助蛋白HP1至HP9的氨基酸序列分別列于SEQ ID NO:1-9和162。本文使用的這種蛋白是指在本發明中,其復數形式或單數形式可互換,但是除非另有明確規定外,應當理解為單數形式。

本發明還涉及編碼所述輔助蛋白的多核苷酸(以下稱為“本發明的多核苷酸)和它們提高POI產量的單獨的或組合的用途。可將所述多核苷酸引入宿主細胞,或若已經存在于所述細胞中,以使得該多核苷酸被過表達的方式操作它們。本發明的多核苷酸編碼SEQ ID NO:1、2、3、4、5、6、7、8、9或162或其功能同系物中的任一個。所述多核苷酸序列的實例示于SEQ ID NO:13、14、15、16、17、18、19、20、21或163。

本發明提供一種分離的多核苷酸序列,所述多核苷酸序列包含以下、本質上由以下組成或由以下組成:SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21或SEQ ID NO:163,并且可選地,所述多核苷酸可操作地連接至與該多核苷酸序列可為異源的啟動子。此外,本發明提供分離的多核苷酸序列,所述多核苷酸序列編碼包含SEQ ID NO:1-9或162中任一個的多肽序列或其功能同系物。優選地,本發明提供分離的多核苷酸序列,所述多核苷酸序列編碼包含SEQ ID NO:1的多肽序列或其功能同系物。優選地,本發明提供分離的多核苷酸序列,所述多核苷酸序列編碼包含SEQ ID NO:2的多肽序列或其功能同系物。優選地,本發明提供分離的多核苷酸序列,所述多核苷酸序列編碼包含SEQ ID NO:3的多肽序列或其功能同系物。優選地,本發明提供分離的多核苷酸序列,所述多核苷酸序列編碼包含SEQ ID NO:4的多肽序列或其功能同系物。優選地,本發明提供分離的多核苷酸序列,所述多核苷酸序列編碼包含SEQ ID NO:5的多肽序列或其功能同系物。優選地,本發明提供分離的多核苷酸序列,所述多核苷酸序列編碼包含SEQ ID NO:6的多肽序列或其功能同系物。優選地,本發明提供分離的多核苷酸序列,所述多核苷酸序列編碼包含SEQ ID NO:7的多肽序列或其功能同系物。優選地,本發明提供分離的多核苷酸序列,所述多核苷酸序列編碼包含SEQ ID NO:8的多肽序列或其功能同系物。優選地,本發明提供分離的多核苷酸序列,所述多核苷酸序列編碼包含SEQ ID NO:9的多肽序列或其功能同系物。優選地,本發明提供分離的多核苷酸序列,所述多核苷酸序列編碼包含SEQ ID NO:162的多肽序列或其功能同系物。在一些實施方案中,本發明提供一種分離的多核苷酸序列,所述多核苷酸序列與選自SEQ ID NO:13、14、15、16、17、18、19、20、21或163的多核苷酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。更優選地,所述分離的多核苷酸序列與SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21或SEQ ID NO:163具有100%的序列同一性。

本發明提供根據本發明的多核苷酸序列在其染色體中或以質粒、微型質粒、YAC、BAC、黏粒或其它任何載體等整合至宿主細胞中的用途。所述根據本發明的多核苷酸序列可以通過如轉化或轉染引入至宿主細胞中。另外,本發明提供這種多核苷酸序列在宿主細胞中制備目標蛋白的用途。

此外,本發明提供分離的多肽,所述多肽包含SEQ ID NO:1-9或162中任一個的多肽序列或其功能同系物。優選地,本發明提供分離的多肽,所述多肽包含SEQ ID NO:1的多肽序列或其功能同系物。優選地,本發明提供分離的多肽,所述多肽包含SEQ ID NO:2的多肽序列或其功能同系物。優選地,本發明提供分離的多肽,所述多肽包含SEQ ID NO:3的多肽序列或其功能同系物。優選地,本發明提供分離的多肽,所述多肽包含SEQ ID NO:4的多肽序列或其功能同系物。優選地,本發明提供分離的多肽,所述多肽包含SEQ ID NO:5的多肽序列或其功能同系物。優選地,本發明提供分離的多肽,所述多肽包含SEQ ID NO:6的多肽序列或其功能同系物。優選地,本發明提供分離的多肽,所述多肽包含SEQ ID NO:7的多肽序列或其功能同系物。優選地,本發明提供分離的多肽,所述多肽包含SEQ ID NO:8的多肽序列或其功能同系物。優選地,本發明提供分離的多肽,所述多肽包含SEQ ID NO:9的多肽序列或其功能同系物。優選地,本發明提供分離的多肽,所述多肽包含SEQ ID NO:162的多肽序列或其功能同系物。另一方面,本發明提供一種分離的多肽,所述多肽具有的多肽序列與選自SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

第二方面,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:2的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:2的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:3的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:3的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:4的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:4的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:5的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:5的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:6的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:6的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:7的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:7的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:8的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:8的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:9的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:9的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:162的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

在優選的實施方案中,與工程化為過表達所述輔助蛋白之前的宿主細胞相比,所述輔助蛋白,優選地當過表達時,可以使宿主細胞中模型蛋白SDZ-Fab(重鏈SEQ ID NO:25和輕鏈SEQ ID NO:26;圖2)或HyHEL-Fab(重鏈SEQ ID NO:29和輕鏈SEQ ID NO:30;圖2)的產量增加至少1%,如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或至少200%。工程化之前的宿主細胞不會過表達本發明的輔助蛋白,而工程化之后的宿主細胞在適宜的培養條件下能夠過表達所述輔助蛋白。已驚奇地發現,在實施例中描述的示例性重組細胞都能夠使模型蛋白SDZ-Fab或HyHEL-Fab產量增加至少20%(1.2倍改變)。在一些情況下,產量增加140%,如實施例7所示。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:1具有至少30%的序列同一性,其中,與工程化之前的宿主細胞相比,所述輔助蛋白,優選地當過表達時,可以使宿主細胞中模型蛋白SDZ-Fab或HyHEL-Fab的產量增加至少1%,如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或至少200%。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:2的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:2具有至少30%的序列同一性,其中,與工程化之前的宿主細胞相比,所述輔助蛋白,優選地當過表達時,可以使宿主細胞中模型蛋白SDZ-Fab或HyHEL-Fab的產量增加至少1%,如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或至少200%。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:3的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:3具有至少30%的序列同一性,其中,與工程化之前的宿主細胞相比,所述輔助蛋白,優選地當過表達時,可以使宿主細胞中模型蛋白SDZ-Fab或HyHEL-Fab的產量增加至少1%,如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或至少200%。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:4的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:4具有至少30%的序列同一性,其中,與工程化之前的宿主細胞相比,所述輔助蛋白,優選地當過表達時,可以使宿主細胞中模型蛋白SDZ-Fab或HyHEL-Fab的產量增加至少1%,如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或至少200%。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:5的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:5具有至少30%的序列同一性,其中,與工程化之前的宿主細胞相比,所述輔助蛋白,優選地當過表達時,可以使宿主細胞中模型蛋白SDZ-Fab或HyHEL-Fab的產量增加至少1%,如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或至少200%。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:6的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:6具有至少30%的序列同一性,其中,與工程化之前的宿主細胞相比,所述輔助蛋白,優選地當過表達時,可以使宿主細胞中模型蛋白SDZ-Fab或HyHEL-Fab的產量增加至少1%,如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或至少200%。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:7的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:7具有至少30%的序列同一性,其中,與工程化之前的宿主細胞相比,所述輔助蛋白,優選地當過表達時,可以使宿主細胞中模型蛋白SDZ-Fab或HyHEL-Fab的產量增加至少1%,如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或至少200%。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:8的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:8具有至少30%的序列同一性,其中,與工程化之前的宿主細胞相比,所述輔助蛋白,優選地當過表達時,可以使宿主細胞中模型蛋白SDZ-Fab或HyHEL-Fab的產量增加至少1%,如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或至少200%。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:9的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:9具有至少30%的序列同一性,其中,與工程化之前的宿主細胞相比,所述輔助蛋白,優選地當過表達時,可以使宿主細胞中模型蛋白SDZ-Fab或HyHEL-Fab的產量增加至少1%,如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或至少200%。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:162具有至少30%的序列同一性,其中,與工程化之前的宿主細胞相比,所述輔助蛋白,優選地當過表達時,可以使宿主細胞中模型蛋白SDZ-Fab或HyHEL-Fab的產量增加至少1%,如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或至少200%。

第三方面,本發明提供所述工程化宿主細胞在制備目標蛋白中的用途。所述宿主細胞可有利地用來引入編碼一種或多種POI的多核苷酸,然后可以將該宿主細胞在適宜條件下培養以表達所述POI。

第四方面,本發明提供一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%的序列同一性。

優選地,所述方法包括:過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:1具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,所述方法包括:過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:2的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:2具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,所述方法包括:過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:3的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:3具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,所述方法包括:過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:4的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:4具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,所述方法包括:過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:5的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:5具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,所述方法包括:過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:6的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:6具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,所述方法包括:過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:7的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:7具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,所述方法包括:過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:8的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:8具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,所述方法包括:過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:9的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:9具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

優選地,所述方法包括:過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與SEQ ID NO:162具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

第五方面,本發明提供一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:

—將宿主細胞工程化為過表達由多核苷酸編碼的輔助蛋白,所述多核苷酸編碼具有示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%的序列同一性;

—在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸;和

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或功能同系物和一種或多種所述目標蛋白。

在用于增加蛋白產量的方法的上下文中,所述“工程化步驟”和“重組步驟”的順序可以互換,使得“重組步驟”位于“工程化步驟”之前。尤其,如本文所述,當輔助蛋白過表達和/或KO蛋白低表達時,目標蛋白的產量增加。

優選地,本發明提供一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:

—將宿主細胞工程化為過表達由多核苷酸編碼的輔助蛋白,所述多核苷酸編碼具有示于SEQ ID NO:1的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性;

—在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸;和

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或所述功能同系物和一種或多種所述目標蛋白。

優選地,本發明提供一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:

—將宿主細胞工程化為過表達由多核苷酸編碼的輔助蛋白,所述多核苷酸編碼具有示于SEQ ID NO:2的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:2的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性;

—在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸;和

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或所述功能同系物和一種或多種所述目標蛋白。

優選地,本發明提供一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:

—將宿主細胞工程化為過表達由多核苷酸編碼的輔助蛋白,所述多核苷酸編碼具有示于SEQ ID NO:3的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:3的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性;

—在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸;和

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或所述功能同系物和一種或多種所述目標蛋白。

優選地,本發明提供一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:

—將宿主細胞工程化為過表達由多核苷酸編碼的輔助蛋白,所述多核苷酸編碼具有示于SEQ ID NO:4的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:4的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性;

—在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸;和

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或所述功能同系物和一種或多種所述目標蛋白。

優選地,本發明提供一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:

—將宿主細胞工程化為過表達由多核苷酸編碼的輔助蛋白,所述多核苷酸編碼具有示于SEQ ID NO:5的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:5的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性;

—在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸;和

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或所述功能同系物和一種或多種所述目標蛋白。

優選地,本發明提供一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:

—將宿主細胞工程化為過表達由多核苷酸編碼的輔助蛋白,所述多核苷酸編碼具有示于SEQ ID NO:6的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:6的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性;

—在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸;和

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或所述功能同系物和一種或多種所述目標蛋白。

優選地,本發明提供一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:

—將宿主細胞工程化為過表達由多核苷酸編碼的輔助蛋白,所述多核苷酸編碼具有示于SEQ ID NO:7的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:7的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性;

—在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸;和

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或所述功能同系物和一種或多種所述目標蛋白。

優選地,本發明提供一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:

—將宿主細胞工程化為過表達由多核苷酸編碼的輔助蛋白,所述多核苷酸編碼具有示于SEQ ID NO:8的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:8的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性;

—在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸;和

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或所述功能同系物和一種或多種所述目標蛋白。

優選地,本發明提供一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:

—將宿主細胞工程化為過表達由多核苷酸編碼的輔助蛋白,所述多核苷酸編碼具有示于SEQ ID NO:9的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:9的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性;

—在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸;和

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或所述功能同系物和一種或多種所述目標蛋白。

優選地,本發明提供一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:

—將宿主細胞工程化為過表達由多核苷酸編碼的輔助蛋白,所述多核苷酸編碼具有示于SEQ ID NO:162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:162的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性;

—在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸;和

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或所述功能同系物和一種或多種所述目標蛋白。

第六方面,本發明提供一種在宿主細胞中制備目標蛋白的方法,所述方法包括:

—提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%的序列同一性,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白和表達目標蛋白。

優選地,本發明提供一種在宿主細胞中制備目標蛋白的方法,所述方法包括:

—提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白和表達目標蛋白。

優選地,本發明提供一種在宿主細胞中制備目標蛋白的方法,所述方法包括:

—提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:2的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:2的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白和表達目標蛋白。

優選地,本發明提供一種在宿主細胞中制備目標蛋白的方法,所述方法包括:

—提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:3的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:3的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白和表達目標蛋白。

優選地,本發明提供一種在宿主細胞中制備目標蛋白的方法,所述方法包括:

—提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:4的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:4的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白和表達目標蛋白。

優選地,本發明提供一種在宿主細胞中制備目標蛋白的方法,所述方法包括:

—提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:5的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:5的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白和表達目標蛋白。

優選地,本發明提供一種在宿主細胞中制備目標蛋白的方法,所述方法包括:

—提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:6的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:6的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白和表達目標蛋白。

優選地,本發明提供一種在宿主細胞中制備目標蛋白的方法,所述方法包括:

—提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:7的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:7的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白和表達目標蛋白。

優選地,本發明提供一種在宿主細胞中制備目標蛋白的方法,所述方法包括:

—提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:8的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:8的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白和表達目標蛋白。

優選地,本發明提供一種在宿主細胞中制備目標蛋白的方法,所述方法包括:

—提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:9的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:9的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白和表達目標蛋白。

優選地,本發明提供一種在宿主細胞中制備目標蛋白的方法,所述方法包括:

—提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:162的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白和表達目標蛋白。

附圖說明

圖1示出了HP1、HP2、HP3、HP4、HP5、HP6、HP7、HP8、HP9、HP10、KO1、KO2和KO3的氨基酸和多核苷酸序列。

圖2示出了模型蛋白SDZ-Fab和HyHEL-Fab各自的重鏈和輕鏈的氨基酸和多核苷酸序列。

本發明的項目

1)一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%的序列同一性。

2)項目 1的宿主細胞,其中與工程化之前的宿主細胞相比,所述輔助蛋白或所述其功能同系物,優選地當過表達時,使模型蛋白SDZ-Fab(SEQ ID NO.25和26)和/或HyHEL-Fab的產量增加,優選地至少20%(SEQ ID NO.29和30)。

3)前述項目中任一項的宿主細胞,其中所述過表達通過在所述宿主細胞中具有1、2、3、4或更多個拷貝的所述編碼輔助蛋白或其功能同系物的多核苷酸實現。

4)前述項目中任一項的宿主細胞,其中所述多核苷酸整合在所述宿主細胞的基因組中。

5)項目4的宿主細胞,其中所述整合是異位地和/或在天然基因座上。

6)項目5的宿主細胞,其中至少一種所述多核苷酸被整合在所述宿主細胞基因組的AOX1、GAP、ENO1、TEF、HIS4、TYR1、HIS3、LEU2、URA3、LYS2、ADE2、TRP1、GAL1或ADH1基因座上。

7)項目1、2或3的宿主細胞,其中所述多核苷酸包含在載體或質粒中。

8)項目7的宿主細胞,其中所述載體為YIp型載體、YEp型載體、YRp型載體、YCp型載體、pGPD-2、pAO815、pGAPZ、pGAPZα、pHIL-D2、pHIL-S1、pPIC3.5K、pPIC9K、pPICZ、pPICZα、pPIC3K、pHWO10、pPUZZLE或2μm質粒。

9)前述項目中任一項的宿主細胞,其中所述過表達通過采用驅動所述多核苷酸表達的重組啟動子實現。

10)項目9的宿主細胞,其中所述啟動子為PAOX1、PTPI、PPGK、PGAPDH、PLAC、PGAL、PPGI、PGAP、PTEF、PENO1、PTPI、PRPS2、PRPS7、PRPS31、PRPL1、PFLD、PICL、PTHI、PSSA1、PHSP90、PKAR2、PGND1、PGPM1、PTKL1、PPIS1、PFET3、PFTR1、PPHO8、PNMT1、PMCM1、PUBI4、PRAD2、PPET9、PFMD、PGAL1、PADH1、PADH2/GAP、PCUP1或PMAL。

11)項目9的宿主細胞,其中所述多核苷酸的過表達通過采用增強子以增強所述啟動子的活性來實現。

12)項目11的宿主細胞,其中所述增強子為酵母菌上游激活序列UAS/GAL。

13)前述項目中任一項的宿主細胞,其中所述宿主細胞為巴斯德畢赤酵母(Pichia pastoris)、多形漢森酵母(Hansenula polymorpha)、里氏木霉(Trichoderma reesei)、釀酒酵母(Saccharomyces cerevisiae)、乳酸克魯維酵母(Kluyveromyces lactis)、解脂耶氏酵母(Yarrowia lipolytica)、甲醇畢赤酵母(Pichia methanolica)、博伊丁假絲酵母(Candida boidinii)、和Komagataella和粟酒裂殖酵母(Schizosaccharomyces pombe)。

14)前述項目中任一項的宿主細胞,其中2、3、4、5、6、7、8、或更多個選自SEQ ID NO:1、2、3、4、5、6、7、8、9、162或其功能同系物的輔助蛋白過表達。

15)前述項目中任一項的宿主細胞,其中所述宿主細胞被工程化為低表達編碼蛋白的多核苷酸,所述蛋白具有與示于SEQ ID NO:10、11或12的氨基酸序列具有至少50%的序列同一性的氨基酸。

16)前述項目中任一項的宿主細胞,所述宿主細胞包含編碼所述目標蛋白的異源多核苷酸序列。

17)項目16的宿主細胞,其中所述目標蛋白為酶、治療性蛋白、食品添加劑或飼料添加劑,優選地為解毒酶。

18)項目17的宿主細胞,其中所述治療性蛋白包括抗體或抗體片段。

19)前述項目中任一項的宿主細胞,其中過表達通過修飾可操作地連接至所述多核苷酸的調控序列實現,所述多核苷酸編碼輔助蛋白或其功能同系物。

20)前述項目中任一項的宿主細胞,其中所述宿主細胞被工程化為:

(i)過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:4的氨基酸序列或其功能同系物和示于SEQ ID NO:2的氨基酸序列或其功能同系物的輔助蛋白;

(ii)過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:162的氨基酸序列或其功能同系物和示于SEQ ID NO:2的氨基酸序列或其功能同系物的輔助蛋白;

(iii)過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1的氨基酸序列或其功能同系物和示于SEQ ID NO:2的氨基酸序列或其功能同系物的輔助蛋白,并進一步被工程化為低表達編碼具有示于SEQ ID NO:10的氨基酸或其功能同系物的蛋白質的多核苷酸,或

(iv)過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:4的氨基酸序列或其功能同系物和示于SEQ ID NO:1的氨基酸序列或其功能同系物的輔助蛋白,并進一步被工程化為低表達編碼具有示于SEQ ID NO:10的氨基酸或其功能同系物的蛋白質的多核苷酸。

21)前述項目中任一項的宿主細胞在制備目標蛋白中的用途。

22)增加宿主細胞中目標蛋白的產量的方法,所述方法包括:過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%的序列同一性。

23)一種增加宿主細胞中目標蛋白的產量的方法,所述方法包括:

—將宿主細胞工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%的序列同一性;

—在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或其功能同系物和所述目標蛋白,和可選地

—從細胞培養物中分離目標蛋白。

24)一種在宿主細胞中制備目標蛋白的方法,所述方法包括:

—提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%的序列同一性,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;

—在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白或其功能同系物,和表達目標蛋白,和可選地

—從細胞培養物中分離目標蛋白。

25)項目22-24中任一項的方法,其中所述宿主細胞被工程化為低表達至少一種多核苷酸,所述多核苷酸編碼蛋白質,所述蛋白質具有與示于SEQ ID NO:10、11和/或12的氨基酸序列具有至少50%的序列同一性的氨基酸。

26)項目25的方法,其中所述低表達通過以下實現:

a)修飾SEQ ID NO:10、11和/或12的啟動子或其它基因調控序列,和/或

b)修飾SEQ ID NO:10、11和/或12的編碼序列,從而降低由所述SEQ ID編碼的蛋白質的體內半衰期/穩定性。

27)項目22-25中任一項的方法,其中,所述過表達通過在所述宿主細胞中具有1、2、3、4或更多個拷貝的所述編碼輔助蛋白或其功能同系物的多核苷酸實現。

28)項目22-26中任一項的方法,其中所述多核苷酸整合在所述宿主細胞的基因組中。

29)項目28的方法,其中所述整合是異位地或在天然基因座上。

30)項目28的方法,其中所述多核苷酸被整合在所述宿主細胞基因組的AOX1、GAP、ENO1、TEF、HIS4、TYR1、HIS3、LEU2、URA3、LYS2、ADE2、TRP1、GAL1或ADH1基因座上。

31)項目22至27中任一項的方法,其中所述多核苷酸包含在載體或質粒中。

32)項目31的方法,其中所述載體為YIp型載體、YEp型載體、YRp型載體、YCp型載體、pGPD-2、pAO815、pGAPZ、pGAPZα、pHIL-D2、pHIL-S1、pPIC3.5K、pPIC9K、pPICZ、pPICZα、pPIC3K、pHWO10、或2μm質粒。

33)項目22至32中任一項的方法,其中所述過表達通過采用驅動所述多核苷酸表達的重組啟動子實現。

34)項目33的方法,其中所述啟動子為PAOX1、PTPI、PPGK、PGAPDH、PLAC、PGAL、PPGI、PGAP、PTEF、PENO1、PTPI、PRPS2、PRPS7、PRPS31、PRPL1、PFLD、PICL、PTHI、PSSA1、PHSP90、PKAR2、PGND1、PGPM1、PTKL1、PPIS1、PFET3、PFTR1、PPHO8、PNMT1、PMCM1、PUBI4、PRAD2、PPET9、PFMD、PGAL1、PADH1、PADH2/GAP、PCUP1或PMAL。

35)項目33的方法,其中所述多核苷酸的過表達通過采用增強子以增強所述啟動子的活性來實現。

36)項目35的方法,其中所述增強子為酵母菌上游激活序列UAS/GAL。

37)項目22至26中任一項的方法,其中所述宿主細胞為巴斯德畢赤酵母(Pichia pastoris)、多形漢森酵母(Hansenula polymorpha)、里氏木霉(Trichoderma reesei)、釀酒酵母(Saccharomyces cerevisiae)、乳酸克魯維酵母(Kluyveromyces lactis)、解脂耶氏酵母(Yarrowia lipolytica)、甲醇畢赤酵母(Pichia methanolica)、博伊丁假絲酵母(Candida boidinii)、和Komagataella和粟酒裂殖酵母(Schizosaccharomyces pombe)。

38)項目22至37中任一項的方法,其中2、3、4、5、6、7、8、或更多個選自SEQ ID NO:1、2、3、4、5、6、7、8、9、162或其功能同系物的輔助蛋白過表達。

39)項目22至38中任一項的方法,其中所述目標蛋白為酶、治療性蛋白、食品添加劑或飼料添加劑,優選地為解毒酶。

40)項目39的方法,其中所述治療性蛋白包括抗體或抗體片段。

41)項目22至40中任一項的方法,其中與工程化之前的宿主細胞相比,所述輔助蛋白,優選地當過表達時,使模型蛋白SDZ-Fab和/或HyHEL-Fab的產量增加至少20%。

42)一種分離的多核苷酸序列,所述分離的多核苷酸序列編碼具有示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%的序列同一性。

43)項目42的分離的多核苷酸,其與SEQ ID NO:13、14、15、16、17、18、19、20、21或163中任一核苷酸序列具有100%的序列同一性。

44)根據項目42或43的分離的多核苷酸序列在整合至宿主細胞中的用途。

45)一種分離的多肽,所述分離的多肽包含與選自SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%的序列同一性的多肽序列。

46)根據項目45的分離的多肽在制備目標蛋白中的用途。

47)根據項目42或43的多核苷酸在制備目標蛋白中的用途。

48)根據項目42或43的多核苷酸在制備宿主細胞中的用途。

49)一種組合物,所述組合物包括至少10%、20%、30%、40%或50%的目標蛋白和根據項目42或43的多核苷酸,其中所述多核苷酸可操作地與異源啟動子連接。

發明詳述

本發明部分地基于對輔助蛋白HP1、HP2、HP3、HP4、HP5、HP6、HP7、HP8、HP9和HP10的表達能增加目標蛋白的分泌這一驚人的發現。每一輔助蛋白的氨基酸序列及其在實施例中對應的命名列于下表1:

表1

特別地,在對巴斯德畢赤酵母中的分泌輔助因子的篩選中,鑒定了55個候選基因,通過濕-室表達實驗(wet-lab expression experiment)驗證這些候選基因以便選擇最佳候選基因。最佳候選基因是這樣的候選基因:與未過表達所述最佳候選基因的巴斯德畢赤酵母菌株(即,如本文所述的工程化之前的宿主細胞)相比,最佳候選基因使本文所描述的兩種模型蛋白SDZ-Fab#9和/或HyHEL-Fab#8的產量增強20%或更高程度。為此,從55個基因中鑒定了9個最佳候選基因。當過表達時,分別地,4個最佳候選基因即PP7435_Chr3-0607、PP7435_Chr3-0933、PP7435_Chr2-0220(SBH1)、PP7435_Chr3-0639(CPR6)對模型蛋白SDZ-Fab和HyHEL Fab都顯示出了大于20%的分泌和/或表達增強,另外5個候選基因(PP7435_Chr4-0108(MXR2)、PP7435_Chr1-1232、PP7435_Chr1-1225(MDR1)、PP7435_Chr1-0667、PP7435_Chr4-0448)對兩種模型蛋白SDZ-Fab和HyHEL Fab中的一種顯示出了>20-30%分泌產量增強。

然而,進一步鑒定了3個候選基因,即KO1(FLO8)、KO2(HCH1)、KO3(SCJ1),為了增強分泌和/或表達,這3個候選基因的表達必須如通過敲除來降低或優選地消除,由此deltaKO1增強了兩種模型蛋白的產量,deltaKO3和deltaKO2增強了HyHEL-Fab的產量。

篩選的依據是巴斯德畢赤酵母生產菌株與巴斯德畢赤酵母非生產菌株的轉錄譜之間的直接比較,這導致55個基因的鑒定。這些基因屬于多種代謝途徑并具有不同的功能,或甚至可具有未知功能。因此,從基因或由其編碼的蛋白中沒有明顯針對由此獲得的輔助因子的性質的教導。因此,為了驗證潛在分泌輔助因子是否確實是實際條件下的輔助因子,必須進行試驗。然而,顯然潛在輔助因子確實是輔助因子并不是顯而易見的,僅僅因為其是通過在生產菌株中增強的轉錄表現來確定的。事實上,潛在輔助因子對蛋白分泌可能沒有積極作用或可能甚至具有負面作用。發明人確實觀察到了上述事實,因為從55個基因中鑒定的兩個編碼伴侶蛋白的基因(SCJ1、HCH1)本應可以合理預期增強分泌,但卻是相反的。因此,針對每一基因進行試驗是必須的,且不存在由所述約60個基因中的任一個編碼的蛋白確實是分泌輔助因子的教導。

因此,“真正的”分泌輔助因子的發現不是簡單的事,而是創造性選擇,因為僅從本發明的發明人自篩選中鑒定的蛋白的基因/蛋白序列或功能,無可獲得的教導或所述教導不是顯而易見的。

關于本文描述的必須過表達的最佳候選基因的其它不尋常之處在于,這些最佳候選基因不是典型的分泌輔助因子,即,其編碼的蛋白所具有的功能不被視為在蛋白質分泌中發揮作用或甚至具有未知功能的基因。

對于必須從伴侶蛋白(KO2、KO3)中敲除的基因,人們曾預料過表達是有益的,但事實上,是所述缺失具有積極作用。對于在面包酵母(baker’syeast)中的絮凝中起作用的KO1,人們不曾預料其缺失增強了蛋白質分泌。面包酵母中的絮凝是當二倍體面包酵母絲狀生長或當單倍體細胞擴散性生長時,然后這些細胞聚集的一種現象。然而,技術人員很可能不會假設敲除絮凝基因會增強蛋白質分泌。

本發明所用“輔助蛋白”是指增強目標蛋白的產量的蛋白。這一術語應被廣泛理解且不應被局限于伴侶蛋白或伴侶樣蛋白。本發明的公開內容明顯呈現出,本發明的輔助蛋白的功能是變化的。本發明的輔助蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8或9中任一個的氨基酸序列或其功能同系物。本發明的輔助蛋白還可包含SEQ ID NO:162的氨基酸序列。本發明的輔助蛋白可以分別是由SEQ ID NO:13、14、15、16、17、18、19、20或21編碼的,或者是由編碼SEQ ID NO:1、2、3、4、5、6、7、8或9的功能同系物的SEQ ID NO:13、14、15、16、17、18、19、20或21的變體中任一個的核苷酸序列編碼的。本發明的輔助蛋白還可以是由SEQ ID NO:163或者編碼SEQ ID NO:162的功能同系物的SEQ ID NO:163的變體的核苷酸序列編碼的。對于本發明的目的,術語“輔助蛋白”還旨在分別包括HP1、HP2、HP3、HP4、HP5、HP6、HP7、HP8、HP9和HP10的功能同系物。例如,輔助蛋白HP1包含編碼SEQ ID NO:4或編碼SEQ ID NO:4的功能同系物的氨基酸序列。本發明提供分離的多核苷酸序列,所述多核苷酸序列編碼具有示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%的序列同一性。

如本文所用,多肽的“同系物”或“功能同系物”是指在其一級、二級或三級結構的對應位置具有相同或保守性殘基的多肽。該術語還延伸至兩個或更多個編碼同源多肽的核苷酸序列。特別地,與本發明的輔助蛋白同源的多肽對于全長天然序列或其任何片段具有至少約30%的氨基酸序列同一性。優選地,同源多肽與天然化合物或全長化合物的任何其它具體限定的片段具有至少約35%的氨基酸序列同一性,更優選地至少約40%的氨基酸序列同一性,更優選地至少約45%的氨基酸序列同一性,更優選地至少約50%的氨基酸序列同一性,更優選地至少約55%的氨基酸序列同一性,更優選地至少約60%的氨基酸序列同一性,更優選地至少約65%的氨基酸序列同一性,更優選地至少約70%的氨基酸序列同一性,更優選地至少約75%的氨基酸序列同一性,更優選地至少約80%的氨基酸序列同一性,更優選地至少約85%的氨基酸序列同一性,更優選地至少約90%的氨基酸序列同一性,如91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸序列同一性,更優選地至少約95%的氨基酸序列同一性。當這種同系物作為輔助蛋白的功能被驗證時,該同系物稱為“功能同系物”。功能同系物與其所源自的輔助蛋白履行相同或基本相同的功能,即該功能同系物使本文描述的模型蛋白SDZ-Fab和/或HyHEL-Fab的產量增加。所述功能可以通過本領域已知的實驗,或優選地用如實施例7或實施例5C描述的,特別是在上文“Fab效價”或“Fab產量”的上下文中描述的,采用模型蛋白的實驗測定。本發明提供的多核苷酸序列編碼SEQ ID NO:1、2、3、4、5、6、7、8、9或162或SEQ ID NO:1、2、3、4、5、6、7、8、9或162的功能同系物。

一般而言,可采用本領域已知的任何突變程序,如定點突變、合成基因構建、半合成基因構建、隨機突變、改組(shuffling)等等,來制備同系物。定點突變是一項在編碼親本的多核苷酸上的一個或多個限定的位點引入一個或多個(如若干)突變的技術。可以通過涉及包含所需突變的寡核苷酸引物的應用的PCR在體外完成定點突變。還可通過盒式突變在體外來實施定點突變,所述盒式突變涉及通過限制性酶在包含編碼親本的多核苷酸的質粒的位點上的切割和隨后在該多核苷酸上的包含所述突變的寡核苷酸的連接。通常,消化所述質粒和所述寡核苷酸的限制性酶是相同的,從而允許質粒的粘性末端和插入物彼此相連。參見,如Scherer和Davis,1979,Proc.Natl.Acad.Sci.USA 76:4949-4955;和Barton等,1990,Nucleic Acids Res.18:7349-4966。還可通過本領域已知的方法在體內完成定點突變。參見,如美國專利申請公開文本No.2004/0171 154;Storici等,2001,Nature Biotechnol.19:773-776;Kren等,1998,Nat.Med.4:285-290;和Calissano和Macino,1996,Fungal Genet.Newslett.43:15-16。合成基因構建需要體外合成設計的多核苷酸分子來編碼目標多肽。可利用多種技術,如由Tian等(2004,Nature 432:1050-1054)描述的基于多路微芯片的技術及其中將寡核苷酸合成并裝配至電流可編程的微流體芯片(photo-programmable microfluidic chip)上的類似技術來實施基因合成。采用已知的突變、重組和/或改組的方法,隨后是相關的篩選程序,如由Reidhaar-Olson和Sauer,1988,Science 241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413或WO 95/22625公開的那些,可以完成并測定單個或多個氨基酸置換、缺失和/或插入。其它可用的方法包括易出錯(error-prone)PCR、噬菌體展示(如,Lowman等,1991,Biochemistry 30:10832-10837;美國專利No.5,223,409;WO 92/06204)和定區域突變(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA 7:127)。可以將突變/改組方法與高通量、自動篩選方法組合,以檢測由宿主細胞表達的克隆的、突變的多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。可自宿主細胞中回收編碼活性多肽的突變的DNA分子并采用本領域已知的標準方法對其快速測序。這些方法允許快速確定單個氨基酸殘基在多肽中的重要性。通過將合成基因構建、和/或定點突變、和/或隨機突變、和/或改組的各個方面組合來完成半合成基因構建。半合成構建以利用合成的多核苷酸片段的過程與PCR技術組合為特征。因此,限定區域的基因可以被從頭合成,而其它區域可以采用位點特異性突變引物擴增,而還有其它區域可以經受易出錯PCR或無錯PCR擴增。然后,將多核苷酸子序列改組。可選地,可以從自然來源,如通過篩選近親或遠親微生物的cDNA文庫獲得同系物。

可通過提供已經插入了同源序列的表達盒,轉化攜帶編碼測試蛋白如用于實施例部分的模型蛋白的一種或特定POI的序列的宿主細胞,和測定在相同條件下模型蛋白或POI的產量差異,來測試SEQ ID NO:1、2、3、4、5、6、7、8、9或162的同系物的功能。

功能同系物還可以是所述輔助蛋白的生物活性片段。通常,一種蛋白的生物活性片段是指與全長蛋白發揮類似的或相當的生物作用的片段。可以通過如氨基-和或羧基-端缺失以及內部缺失生產這種片段或變體。

第一方面,本發明提供分離的多核苷酸序列,所述分離的多核苷酸序列編碼SEQ ID NO:1、2、3、4、5、6、7、8、9或162或者SEQ ID NO:1、2、3、4、5、6、7、8、9或162的功能同系物。所述分離的多核苷酸序列可以包含SEQ ID NO:13、14、15、16、17、18、19、20、21或163中的任一個。優選地,所述分離的多核苷酸序列由SEQ ID NO:13、14、15、16、17、18、19、20、21或163中任一個核苷酸序列組成。

另一方面,本發明提供一種分離的多肽,所述分離的多肽序列包含與選自SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。

術語“分離的”是指處于自然界中未出現的形式或環境的物質。分離的物質的非限制性實例包括:(1)任何非天然存在的物質;(2)至少部分地從自然界中與其相關的天然存在的成分的一種或多種或全部中取出的任何物質,包括但不限于,任何酶、變體、核酸、蛋白質、肽或輔助因子;(3)相對于自然界中發現的物質,經由人工修飾的任何物質;或(4)通過相對于與其天然相關的其他組分增加物質的量來修飾的任何物質(如,在宿主細胞中的重組生產;編碼所述物質的基因的多個拷貝;和使用與編碼所述物質的基因天然相關的啟動子相比更強的啟動子)。

本發明提供上述分離的多核苷酸中的任一個在整合至宿主細胞中的用途。可選地,若一種或多種所述多核苷酸已經存在于所述宿主細胞中,可以以使得其過表達的方式操作該宿主細胞,如稍后所描述的。再一方面,本發明涉及所述多核苷酸在增加宿主細胞中的POI產量中的用途,其中所述編碼POI的核苷酸序列與所述多核苷酸共表達。

“序列同一性”或“%同一性”是指使用標準化算法比對的至少兩個多肽或多核苷酸序列之間的殘基匹配的百分數。為了使得兩條序列之間的比對最佳,這種算法可以以標準化的和可重現的方式在比較的序列中插入間隙(gap),由此達到兩條序列的更加有意義的比較。對于本發明的目的,采用NCBI BLAST程序2.2.29版本(2014年1月6日)(Altschul等,Nucleic Acids Res.(1997)25:3389-3402)測定兩條氨基酸序列或核苷酸之間的序列同一性。可以采用設定如下參數的blastp測定兩條氨基酸序列的序列同一性:矩陣:BLOSUM62,字長:3;期望值:10;空位權重:存在=11,延伸=1;過濾=低復雜性激活的;過濾字符串:L;組合調整(Compositional adjustments):有條件的組合評分矩陣調整。對于本發明的目的,采用設定如下示例性參數的blastn的NCBI BLAST程序2.2.29版本(2014年1月6日)測定兩條核苷酸序列的序列同一性:字長:11;期望值:10;空位權重:存在=5,延伸=2;過濾=低復雜性激活的;匹配/失配得分:2,-3;過濾字符串:L;m。

第二方面,本發明提供一種工程化為過表達編碼本發明的輔助蛋白的多核苷酸的宿主細胞。所述輔助蛋白分別包括HP1至HP9(SEQ ID NO:1-9)和HP10(SEQ ID NO:162)中的任一個或其功能同系物。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,該多核苷酸編碼具有與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162具有至少30%的序列同一性的氨基酸的輔助蛋白。

術語“表達多核苷酸”是指當將多核苷酸轉錄成mRNA且將mRNA翻譯成多肽時。術語“過表達”通常是指大于或等于參考標準品顯示的表達水平的任何量。在本發明中術語“過表達(的)”是指基因產物或多肽以高于宿主細胞遺傳改變之前的或在限定條件下未被遺傳改變的相當的宿主中的相同基因產物或多肽的表達的水平表達。若宿主細胞不包含給定基因產物,將該基因產物引入所述宿主細胞用于表達是可能的;在這種情況下,術語“過表達”包括任何可檢測的表達。

如本文所用,術語“工程化的”宿主細胞為已經用遺傳工程(即,通過人為干預)操作了的宿主細胞。當宿主細胞被“工程化為過表達”給定蛋白時,操作該宿主細胞從而使該宿主細胞具有表達、優選地過表達輔助蛋白或其功能同系物的能力,由此與操作之前的相同條件下的宿主細胞相比,給定蛋白如POI或模型蛋白的表達增加。

當將“工程化之前”用于本發明的宿主細胞的上下文中時,是指這種宿主細胞沒有被編碼輔助蛋白或其功能同系物的多核苷酸工程化。因此,該術語還指不過表達編碼輔助蛋白或其功能同系物的多核苷酸的宿主細胞或沒有被工程化為過表達編碼輔助蛋白或其功能同系物的多核苷酸的宿主細胞。

本文所用術語“重組”是指用編碼目標蛋白的異源多核苷酸裝備本發明的宿主細胞,即,本發明的宿主細胞被工程化為包含編碼目標蛋白的異源多核苷酸。這可以通過如轉化或轉染或用于將多核苷酸引入宿主細胞的任何其它本領域已知的適宜技術來實現。

過表達

正如將在后面詳細描述的,以本領域技術人員已知的任何方式都可實現過表達。一般而言,可通過提高基因的轉錄/翻譯,如通過提高所述基因的拷貝數或者改變或修飾與基因表達相關的調控序列或位點來實現過表達。例如,通過引入可操作地連接至調控序列(如啟動子)的編碼輔助蛋白或功能同系物的多核苷酸的一個或多個拷貝來實現過表達。例如,為了達到高表達水平,可將所述基因可操作地連接至強的組成型啟動子和/或強的廣譜表達型(ubiquitous)啟動子。這種啟動子可以是內源性啟動子或重組啟動子。可選地,可以將調控序列移除從而使表達變為組成型的。人們可以用增加給定基因表達的或導致給定基因組成型表達的異源啟動子替換給定基因的天然啟動子。例如,與工程化之前的并在相同條件下培養的宿主細胞相比,所述宿主細胞可以過表達所述輔助蛋白大于10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%或大于300%。額外地使用誘導型啟動子可使宿主細胞培養過程中的表達增加。此外,還可通過以下方式實現過表達,例如修飾特定基因的染色體位置;改變與特定基因相鄰的核酸序列,所述特定基因如核糖體結合位點或轉錄終止子;修飾與所述基因轉錄和/或與所述基因產物的翻譯相關的蛋白(如,調控蛋白、抑制子、增強子、轉錄激活因子等等);或任何其它本領域常規的使特定基因表達失調的常規技術(包括但不限于,反義核苷酸分子的應用,例如以阻斷阻遏蛋白的表達,或者缺失或突變通常抑制需要過表達的基因的表達的轉錄因子的基因。延長mRNA的壽命也可提高表達水平。例如,某些終止子區可用于延長mRNA的半衰期(Yamanishi等,Biosci.Biotechnol.Biochem.(2011)75:2234和US 2013/0244243)。若包括多個拷貝的基因,這些基因既可以位于可變拷貝數的質粒中,也可以是在染色體中整合并擴增的。若所述宿主細胞不包含編碼輔助蛋白的基因產物,則可以將基因產物引入宿主細胞用于表達。此時,“過表達”是指采用本領域技術人員已知的任何方法表達所述基因產物。

本領域技術人員將在Martin等(Bio/Technology 5,137-146(1987))、Guerrero等(Gene 138,35-41(1994))、Tsuchiya和Morinaga(Bio/Technology 6,428-430(1988))、Eikmanns等(Gene 102,93-98(1991))、EP 0 472 869、US 4,601,893、Schwarzer和(Bio/Technology 9,84-87(1991))、Reinscheid等(Applied and Environmental Microbiology 60,126-132(1994))、LaBarre等(Journal of Bacteriology 175,1001-1007(1993))、WO 96/15246、Malumbres等(Gene 134,15-24(1993))、JP-A-10-229891、Jensen和Hammer(Biotechnology and Bioengineering 58,191-195(1998))和Makrides(Microbiological Reviews 60,512-538(1996))中,特別是在公知的遺傳和分子生物教科書中發現相關說明。

輔助蛋白

本發明的輔助蛋白最初是從巴斯德畢赤酵母CBS7435菌株中分離的。該甲基營養型酵母畢赤酵母(Pichia pastoris)(Komagataella phaffii)CBS7435菌株是常用的畢赤酵母重組蛋白生產宿主的親本菌株。其完整的基因組序列描述于Küberl等(J Biotechnol.(2011)154(4):312-20)中。編碼本文所鑒定的輔助蛋白的這些基因迄今尚未與對蛋白質產量的有益作用相關聯。

由于輔助蛋白在其它微生物中的存在,因此,設想其能夠在廣泛的宿主細胞中過表達。因此,輔助蛋白的序列可取自或源自其它原核或真核生物體,而不是采用對于其種或屬而言為天然的序列。可以從多種來源,如從植物、昆蟲、真菌或哺乳動物物種,優選地從酵母綱,優選地從酵母目,優選地從酵母科,優選地從Komagataella屬中獲得編碼輔助蛋白的外源(foreign)DNA序列。

HP1-HP10

特別地,本發明涉及一種基因修飾的宿主細胞,該宿主細胞能夠過表達輔助蛋白HP1、HP2、HP3、HP4、HP5、HP6、HP7、HP8、HP9或HP10或它們的組合,或者HP1、HP2、HP3、HP4、HP5、HP6、HP7、HP8、HP9或HP10或它們的組合的功能同系物。在一個優選的實施方案中設想了被工程化為反映這種組合的宿主細胞。優選地將這些宿主細胞用于本文描述的方法和用途中。該組合包括選自HP1、HP2、HP3、HP4、HP5、HP6、HP7、HP8、HP9、HP10的2種或更多種,如2、3、4、5、6、7、8或更多種輔助蛋白或功能同系物。

同樣地,該組合包括一種或多種選自HP1、HP2、HP3、HP4、HP5、HP6、HP7、HP8、HP9、HP10或其功能同系物的輔助蛋白與選自KO1、KO2、KO3的KO蛋白的組合。在一個優選的實施方案中設想了被工程化為反映這種組合的宿主細胞。優選地將這些宿主細胞用于本文描述的方法和用途中。“反映”是指根據本發明的教導,本領域技術人員知道輔助蛋白過表達,而KO蛋白低表達。

然而,輔助蛋白HP3(SEQ ID NO:2)或其功能同系物與HP1(SEQ ID NO:4)或其功能同系物,或者輔助蛋白HP10(SEQ ID NO:162)或其功能同系物與HP3(SEQ ID NO:2)或其功能同系物的具體組合是優選地用于本發明的方法和用途中的本發明的宿主細胞的優選的實施方案。

此外,輔助蛋白HP2(SEQ ID NO:1)或其功能同系物與HP3(SEQ ID NO:2)或其功能同系物和KO蛋白KO1(SEQ ID NO:10),或者輔助蛋白HP2(SEQ ID NO:1)或其功能同系物與HP1(SEQ ID NO:4)或其功能同系物和KO蛋白KO1(SEQ ID NO:10)的具體組合是優選地用于本發明的方法和用途中的本發明的宿主細胞的優選的實施方案。

優選地,本發明提供一種用于制備目標蛋白的重組宿主細胞,其中所述宿主細胞被工程化為過表達多核苷酸,該多核苷酸編碼具有與SEQ ID NO:1具有至少40%的序列同一性、與SEQ ID NO:2具有至少45%的序列同一性、與SEQ ID NO:3具有至少50%的序列同一性、與SEQ ID NO:4具有至少45%的序列同一性、與SEQ ID NO:5具有至少50%的序列同一性、與SEQ ID NO:6具有至少45%的序列同一性、與SEQ ID NO:7具有至少40%的序列同一性、與SEQ ID NO:8具有至少40%的序列同一性、與SEQ ID NO:9具有至少40%的序列同一性或與SEQ ID NO:162具有至少45%的序列同一性的氨基酸的輔助蛋白。這種宿主細胞用于本文所述的方法和用途中。

目標蛋白

本文所用術語“目標蛋白”(POI)是指在宿主細胞中通過重組技術生產的蛋白。更具體地,所述蛋白既可以是非天然地存在于宿主細胞中的多肽,即異源蛋白,也可以是對于所述宿主細胞而言天然的,即是宿主細胞的同源蛋白,但通過例如用含有編碼POI的核酸序列的自我復制載體的轉化、或通過重組技術將編碼POI的核酸序列的一個或多個拷貝整合至宿主細胞的基因組、或通過控制編碼POI的基因表達的一個或多個調控序列(如啟動子序列)的重組修飾而生產的。一般而言,可以通過本領域技術人員熟知的重組表達方法生產本文提及的目標蛋白。

宿主細胞

如本文所用,“宿主細胞”是指一種能夠表達蛋白和可選地分泌蛋白的細胞。這種宿主細胞用于本發明的方法。針對使宿主細胞表達一種多肽這一目的,使編碼該多肽的核苷酸序列存在于該細胞或將其引入該細胞。本發明提供的宿主細胞可以是原核生物或真核生物。如本領域技術人員所理解的,原核細胞無核膜,而真核細胞具有核膜。真核細胞的實例包括但不限于:脊椎動物細胞、哺乳動物細胞、人細胞、動物細胞、無脊椎動物細胞、植物細胞、線蟲細胞、昆蟲細胞、干細胞、真菌細胞或酵母細胞。

酵母細胞的實例包括但不限于:酵母屬(如釀酒酵母、克魯維酵母(Saccharomyces kluyveri)、葡萄汁酵母菌(Saccharomyces uvarum))、Komagataella屬(Komagataella pastoris、Komagataella pseudopastoris或Komagataella phaffii)、克魯維酵母屬(如乳酸克魯維酵母、馬克思克魯維酵母(Kluyveromyces marxianus))、假絲酵母屬(如產朊假絲酵母(Candina utilis)、可可假絲酵母(Candida cacaoi))、地霉屬(如,發酵地霉(Geotrichum fermentans))、以及多形漢森酵母和解脂耶氏酵母。

畢赤酵母屬是特別感興趣的。畢赤酵母屬包含許多種,包括巴斯德畢赤酵母(Pichia pastoris)種、甲醇畢赤酵母(Pichia methanolica)種、克魯維畢赤酵母(Pichia kluyveri)種和安格斯畢赤酵母(Pichia angusta)種。最優選的是巴斯德畢赤酵母種。

已將前種巴斯德畢赤酵母分類并重新命名為Komagataella pastoris和Komagataella phaffii。因此巴斯德畢赤酵母與Komagataella pastoris和Komagataella phaffii是同義詞。

用于本發明的巴斯德酵母菌株的實例是X33及其亞型GS115、KM71、KM71H;CBS7435(mut+)及其亞型CBS7435muts、CBS7435mutsΔArg、CBS7435mutsΔHis、CBS7435mutsΔArg、ΔHis、CBS7435muts PDI+、CBS 704(=NRRL Y-1603=DSMZ 70382)、CBS 2612(=NRRL Y-7556)、CBS 9173-9189和DSMZ 70877及其突變體。

大腸桿菌的實例包括源自大腸桿菌K12菌株的那些,具體為,HMS 174、HMS174(DE3)、NM533、XL1-Blue、C600、DH1、HB101、JM109,以及源自B-菌株的那些,具體為BL-21、BL21(DE3)等。

根據進一步優選的實施方案,所述宿主細胞是巴斯德畢赤酵母、多形漢森酵母(Hansenula polymorpha)、里氏木霉(Trichoderma reesei)、釀酒酵母(Saccharomyces cerevisiae)、乳酸克魯維酵母(Kluyveromyces lactis)、解脂耶氏酵母(Yarrowia lipolytica)、甲醇畢赤酵母(Pichia methanolica)、博伊丁假絲酵母(Candida boidinii)、和Komagataella和粟酒裂殖酵母(Schizosaccharomyces pombe)。其也可以是來自玉蜀黍黑粉菌(Ustilago maydis)的宿主細胞。

優選地,所述由宿主細胞表達的輔助蛋白是來自相同的細胞或是由相同的種、屬或科的細胞重組的。如本文所用,“重組(的)”是指通過人為干預的遺傳材料的改變。通常,重組是指通過分子生物(重組DNA技術)方法(包括克隆和重組)對病毒、細胞、質粒或載體中DNA或RNA的操作。借助參考重組細胞、多肽或核酸與天然存在的對應物(“野生型”)的區別來描述重組細胞、多肽或核酸。“重組細胞”或“重組宿主細胞”是指這樣一種細胞或宿主細胞,所述細胞或宿主細胞已經被遺傳改變從而包含了對所述細胞而言為非天然的核酸序列。

本文所用術語“制備”是指目標蛋白表達的過程。“用于制備目標蛋白的宿主細胞”是指可引入編碼目標蛋白的核酸序列的宿主細胞。本發明中的重組宿主細胞并不一定包含編碼目標蛋白的核酸序列。本領域技術人員理解,可以例如在試劑盒中提供所述宿主細胞,用于將所需核苷酸序列插入該宿主細胞中。

本文所用術語“核苷酸序列”或“核酸序列”是指DNA或RNA。“核酸序列”或“多核苷酸序列”或簡單地“多核苷酸”是指從5’至3’端讀出的脫氧核糖核苷酸或核糖核苷酸堿基的單鏈或雙鏈聚合物。其包括自復制質粒、DNA或RNA的感染性聚合物和非功能DNA或RNA。

術語“氨基酸”是指天然存在的和合成的氨基酸,以及以與天然存在的氨基酸類似的方式發揮作用的氨基酸類似物(analog)和氨基酸模擬物(mimetic)。天然存在的氨基酸是由遺傳密碼編碼的那些,以及之后修飾的那些氨基酸,如羥脯氨酸、γ-羧基谷氨酸和O-磷酸絲氨酸。氨基酸類似物是指與天然存在的氨基酸具有相同的基礎化學結構的化合物,即,將碳連接至氫、羰基、氨基和R基,如高絲氨酸、正亮氨酸、蛋氨酸亞砜、蛋氨酸的甲基锍。這些類似物具有修飾的R基(如正亮氨酸)或修飾的肽骨架,但是保留與天然存在的氨基酸相同的基礎化學結構。氨基酸模擬物是指具有與氨基酸的一般化學結構不同的結構,但是以與天然存在的氨基酸類似的方式發揮功能的化學化合物。

術語“多肽”與“蛋白”互換使用。術語“多肽”是指一種含有兩個或更多個氨基酸,典型地至少3個,優選地至少20個,更優選地至少30個,諸如至少50個氨基酸的蛋白或肽。因此,多肽包含氨基酸序列,和因此,有時包含氨基酸序列的多肽在本文中稱為“包含多肽序列的多肽”。因此,本文中術語“多肽序列”與術語“氨基酸序列”互換使用。如所提及的,可通過插入一個或大于一個額外的所選輔助蛋白的拷貝來實現過表達。根據優選的實施方案,編碼輔助蛋白的多核苷酸可以以每個細胞中單一拷貝或多個拷貝的形式呈現。這些拷貝可以是彼此毗鄰的或彼此遠離的。根據另一個優選的實施方案,本發明的方法使用編碼輔助蛋白的重組核苷酸序列,所述重組核苷酸序列以每個細胞中單一拷貝或多個拷貝的形式提供在一個或多個適于整合入宿主細胞基因組的質粒中。這些拷貝可以是彼此毗鄰的或彼此遠離的。在一個實施方案中,可以通過每個宿主細胞表達多核苷酸的一個或多個拷貝,如2、3、4、5、6或更多個所述多核苷酸的拷貝來實現過表達。優選地,所述多核苷酸可操作地連接至在宿主細胞中提供多肽表達的轉錄和翻譯調控序列。本文所用術語“轉錄調控序列”是指與基因核酸序列有關的并調控該基因轉錄的核苷酸序列。本文所用術語“翻譯調控序列”是指與基因核酸序列有關的并調控該基因翻譯的核苷酸序列。轉錄和/或翻譯調控序列既可以位于質粒或載體中,也可以整合至宿主細胞的染色體。轉錄和/或翻譯調控序列可以位于該序列所調控的基因的相同的核酸分子中。優選地,可以通過在每個宿主細胞中具有1、2、3、4或更多個編碼HP1或其功能同系物的多核苷酸的拷貝來實現過表達。

優選地,可以通過在每個宿主細胞中具有1、2、3、4或更多個編碼HP2或其功能同系物的多核苷酸的拷貝來實現過表達。

優選地,可以通過在每個宿主細胞中具有1、2、3、4或更多個編碼HP3或其功能同系物的多核苷酸的拷貝來實現過表達。

優選地,可以通過在每個宿主細胞中具有1、2、3、4或更多個編碼HP4或其功能同系物的多核苷酸的拷貝來實現過表達。

優選地,可以通過在每個宿主細胞中具有1、2、3、4或更多個編碼HP5或其功能同系物的多核苷酸的拷貝來實現過表達。

優選地,可以通過在每個宿主細胞中具有1、2、3、4或更多個編碼HP6或其功能同系物的多核苷酸的拷貝來實現過表達。

優選地,可以通過在每個宿主細胞中具有1、2、3、4或更多個編碼HP7或其功能同系物的多核苷酸的拷貝來實現過表達。

優選地,可以通過在每個宿主細胞中具有1、2、3、4或更多個編碼HP8或其功能同系物的多核苷酸的拷貝來實現過表達。

優選地,可以通過在每個宿主細胞中具有1、2、3、4或更多個編碼HP9或其功能同系物的多核苷酸的拷貝來實現過表達。

優選地,可以通過在每個宿主細胞中具有1、2、3、4或更多個編碼HP10或其功能同系物的多核苷酸的拷貝來實現過表達。

優選地,將編碼輔助蛋白的多核苷酸和/或編碼POI的多核苷酸整合至宿主細胞的基因組中。術語“基因組”通常是指以DNA(或對于某些病毒物種以RNA)編碼的生物體的全部遺傳信息。基因組可存在于染色體中、質粒或載體中或兩者兼有。優選地,將編碼輔助蛋白的多核苷酸整合至所述細胞的染色體中。

可以將編碼輔助蛋白或其功能同系物的多核苷酸整合在其天然基因座上。“天然基因座”是指在特定染色體上的位置,其中編碼輔助蛋白的多核苷酸位于例如如表1所示HP1至10的天然基因座。然而,在另一個實施方案中,存在于宿主細胞的基因組中的編碼輔助蛋白的多核苷酸未在它們的天然基因座上,而是被異位地整合。術語“異位的整合”是指在微生物基因組中不是其通常染色體基因座的位點的核酸的插入,即預定的或隨機的整合。可選地,可以將所述編碼輔助蛋白或其功能同系物的多核苷酸整合在其天然基因座上和異位地整合。

對于酵母細胞,可以將編碼輔助蛋白的多核苷酸和/或編碼POI的多核苷酸插入所需的基因位,如AOX1、GAP、ENO1、TEF、HIS4(Zamir等,Proc.NatL Acad.Sci.USA(1981)78(6):3496-3500)、HO(Voth等,Nucleic Acids Res.2001June 15;29(12):e59)、TYR1(Mirisola等,Yeast 2007;24:761–766)、His3、Leu2、Ura3(Taxis等,BioTechniques(2006)40:73-78)、Lys2、ADE2、TRP1、GAL1、ADH1或在5S核糖體RNA基因的整合上。

在其它實施方案中,可以將編碼輔助蛋白的多核苷酸和/或編碼POI的多核苷酸整合在質粒或載體中。術語“質粒”和“載體”包括自主復制的核苷酸序列以及基因組整合的核苷酸序列。技術人員能夠依據所使用的宿主細胞選用適宜的質粒或載體。

優選地,所述質粒是真核表達載體,優選為酵母表達載體。

質粒可用于在適宜的宿主生物體中克隆的重組核苷酸序列(即重組基因)的轉錄和它們mRNA的翻譯。質粒還可用于通過本領域已知的方法,如J.Sambrook等,Molecular Cloning:A Laboratory Manual(3rd edition),Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,New York(2001)描述的方法,將靶多核苷酸整合至宿主細胞基因組中。“質粒”通常包括用于在宿主細胞中自主復制的起點、選擇標記、多個限制性酶切割位點、適宜的啟動子序列和轉錄終止子,所述組份可操作地連接在一起。將編碼多肽的目標序列可操作地連接至在宿主細胞中提供多肽表達的轉錄和翻譯調控序列。

當核酸被置于與相同核酸分子上的另一核酸序列的功能關系中時,該核酸是“可操作地連接”的。例如,當啟動子能夠作用于重組基因的編碼序列的表達時,該啟動子與該重組基因的編碼序列是可操作地連接的。

在每個細菌細胞中,大多數質粒以僅一個拷貝存在。但是,一些質粒以較多拷貝數存在。例如,對于大腸桿菌的每條染色體,質粒ColE1通常以10至20個質粒拷貝存在。如果質粒中包含本發明的核苷酸序列,則每個宿主細胞中,該質粒可具有20-30、30-100或更多的拷貝數。使用高拷貝數的質粒,可以通過細胞過表達輔助蛋白。

本領域技術人員已知大量適宜的質粒或載體,并且很多質粒或載體是商購可獲得的。Sambrook等編輯,Molecular Cloning:A Laboratory Manual(2nd Ed.),Vols.1-3,Cold Spring Harbor Laboratory(1989),和Ausubel等編輯,Current Protocols in Molecular Biology,John Wiley&Sons,Inc.,New York(1997)提供了適宜的載體的實例。

本發明的載體或質粒涵蓋包含端粒(telomeric)、著絲粒(centromeric)和復制的起點(復制起點)序列的酵母人工染色體,所述酵母人工染色體是指可以被遺傳修飾為含有異源DNA序列(如,大到3000kb的DNA序列)的DNA構建體。

本發明的載體或質粒還涵蓋包含復制的起點序列(Ori)并可包含一個或多個解旋酶(如parA、parB和parC)的細菌人工染色體(BAC),所述細菌人工染色體是指可以被遺傳修飾為含有異源DNA序列(如,大到300kb的DNA序列)的DNA構建體。

將酵母作為宿主的質粒的實例包括YIp型載體、YEp型載體、YRp型載體、YCp型載體、pGPD-2、pAO815、pGAPZ、pGAPZα、pHIL-D2、pHIL-S1、pPIC3.5K、pPIC9K、pPICZ、pPICZα、pPIC3K、pHWO10、pPUZZLE和2μm質粒。這些載體是已知的,并且例如,這些載體描述在Cregg等,Mol Biotechnol.(2000)16(1):23-52中。

將大腸桿菌作為其宿主的質粒的實例包括pBR322、pUC18、pUC19、pUC118、pVC119、pSP64、pSP65、pTZ-18R/-18U、pTZ-19R/-19U、pGEM-3、pGEM-4、pGEM-3Z、pGEM-4Z、pGEM-5Zf(-)和pBluescript KSTM(Stratagene)。適于在大腸桿菌中表達的質粒的實例包括pAS、pKK223(Pharmacia)、pMC1403、pMC931和pKC30。

啟動子

可通過修飾轉錄和翻譯調控序列,包括例如提供宿主細胞中多核苷酸序列表達的啟動子、增強子、多腺苷酸化信號、轉錄終止子、內核糖體進入位點(IRES)等等,來實現重組細胞中內源多肽的過表達。這種序列特異性地與涉及轉錄的細胞蛋白相互作用(Maniatis等,Science,236:1237-1245(1987))。示例性序列描述于,例如Goeddel,Gene Expression Technology:Methods in Enzymology,Vol.185,Academic Press,San Diego,Calif.(1990)。

例如,可通過修飾啟動子來實現重組細胞中內源性輔助蛋白的過表達,例如,為了實現高表達水平,通過用另一個更強的啟動子替換可操作地連接至輔助蛋白的內源性啟動子。這種啟動子可以是誘導型的或組成型的。可以通過采用本領域已知的方法的突變或同源重組來實施內源性啟動子的修飾。

可通過本領域已知的其它方法,例如通過如Marx等,2008(Marx,H.,Mattanovich,D.和Sauer,M.Microb Cell Fact 7(2008):23)和Pan等,2011(Pan等,FEMS Yeast Res.(2011)May;(3):292-8.)描述的遺傳修飾輔助蛋白的內源性調控區域來實現編碼輔助蛋白的多核苷酸的過表達,這種方法包括,例如增加輔助蛋白表達的重組啟動子的整合。轉化描述于Cregg等,(1985)Mol.Cell.Biol.5:3376-3385。“重組”啟動子是指針對其驅動表達的序列。如本文所用,重組啟動子的含義是,當該啟動子對于給定序列而言不是天然啟動子時,即,當該啟動子與天然存在的啟動子(“天然啟動子”)不同時。有時這種啟動子在本文中還稱為異源啟動子。

文本所用術語“啟動子”是指有助于特定基因轉錄的區域。與無啟動子存在時所表達的重組產物的量相比,啟動子通常使從核苷酸序列表達的重組產物的量增加。可利用源自一個生物體的啟動子來增強從源自另一生物體的序列的重組產物表達。可以通過采用本領域已知的方法的同源重組來將啟動子整合至宿主細胞染色體中(如,Datsenko等,Proc.Natl.Acad.Sci.U.S.A.,97(12):6640-6645(2000))。此外,一個啟動子元件能夠增加串聯連接的多條序列所表達的產物的量。因此,一個啟動子元件能夠增強一種或多種重組產物的表達。

可以通過啟動子的轉錄效率來評估啟動子活性。可通過測量從該啟動子的mRNA轉錄的量來直接地測定啟動子活性,如通過RNA印跡法、定量PCR,或通過測量自該啟動子表達的基因產物的量來間接地測定啟動子活性。

啟動子可以是“誘導型啟動子”或“組成型啟動子”。“誘導型啟動子”是指可以被某些因子的存在或缺少誘導的啟動子,“組成型啟動子”是指允許啟動子的一種或多種相關基因連續轉錄的不受調控的啟動子。

在優選的實施方案中,編碼輔助蛋白和POI的核苷酸序列都被誘導型啟動子驅動。在另一個優選的實施方案中,編碼輔助蛋白和POI的核苷酸序列都被組成型啟動子驅動。在又一個優選的實施方案中,編碼輔助蛋白的核苷酸序列被組成型啟動子驅動,編碼POI的核苷酸序列被誘導型啟動子驅動。在再一個優選的實施方案中,編碼輔助蛋白的核苷酸序列被誘導型啟動子驅動,編碼POI的核苷酸序列被組成型啟動子驅動。例如,HP可以被組成型GAP啟動子驅動,POI可以被誘導型AOX1啟動子驅動。在一個實施方案中,編碼輔助蛋白和POI的核苷酸序列被相同啟動子或就啟動子活性和/或表達行為而言的相似啟動子驅動。

本領域已知很多誘導型啟動子。在Gatz,Curr.Op.Biotech.,7:168(1996)(還參見Gatz,Ann.Rev.Plant.Physiol.Plant Mol.Biol.,48:89(1997))的綜述中描述了許多誘導型啟動子。實例包括四環素抑制子系統(tetracycline repressor system)、Lac抑制子系統、銅誘導系統、水楊酸誘導系統(如PR1系統)、糖皮質激素誘導型(Aoyama等,1997)、醇誘導系統(如AOX啟動子)和蛻皮激素誘導系統(ecdysome-inducible system)。還包括苯磺酰胺誘導型(美國專利No.5,364,780)和醇誘導型系統(WO 97/06269和WO 97/06268)以及谷胱甘肽S-轉移酶啟動子。

在Mattanovich等,Methods Mol.Biol.(2012)824:329-58中描述了與酵母宿主細胞一起使用的適宜的啟動子序列,包括如磷酸丙糖異構酶(TPI)、磷酸甘油酸激酶(PGK)、甘油醛-3-磷酸脫氫酶(GAPDH或GAP)的糖酵解酶及其變體、乳糖酶(LAC)和半乳糖苷酶(GAL)、巴斯德酵母(P.pastoris)葡萄糖-6-磷酸異構酶啟動子(PPGI)、3-磷酸甘油酸激酶啟動子(PPGK)、甘油醛磷酸脫氫酶啟動子(PGAP)、翻譯延伸因子啟動子(PTEF)和巴斯德酵母烯醇酶1啟動子(PENO1)、丙糖磷酸異構酶(PTPI)、核糖體亞基蛋白(PRPS2、PRPS7、PRPS31、PRPL1)、醇氧化酶啟動子(PAOX)或其具有修飾特性的變體、甲醛脫氫酶啟動子(PFLD)、異檸檬酸裂合酶啟動子(PICL)、α-酮異己酸脫羧酶啟動子(PTHI)、熱休克蛋白家族成員的啟動子(PSSA1、PHSP90、PKAR2)、6-磷酸葡糖酸脫氫酶(PGND1)、磷酸甘油酸變位酶(PGPM1)、轉酮酶(PTKL1)、磷脂酰肌醇合成酶(PPIS1)、鐵-O2-氧化還原酶(ferro-O2-oxidoreductase)(PFET3)、高親和力鐵通透酶(PFTR1)、抑制性堿性磷酸酶(PPHO8)、N-肉豆蔻酰基轉移酶(PNMT1)、信息素應答轉錄因子(PMCM1)、泛素(PUBI4)、單鏈DNA核酸內切酶(PRAD2)、線粒體內膜的主要ADF/ATP載體的啟動子(PPET9)(WO2008/128701)和甲酸脫氫酶(FMD)啟動子。GAP啟動子、AOX啟動子或源自GAP或AOX啟動子的啟動子是特別優選的。AOX啟動子可被甲醇誘導和例如被葡萄糖抑制。

適宜的啟動子的進一步實例包括釀酒酵母烯醇化酶(ENO-1)、釀酒酵母半乳糖激酶(GAL1)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1、ADH2/GAP)、釀酒酵母丙糖磷酸異構酶(TPI)、釀酒酵母金屬硫蛋白(CUP1)、和釀酒酵母3-磷酸甘油酸激酶(PGK)、和麥芽糖酶基因啟動子(MAL)。

Romanos等,1992,Yeast 8:423-488描述了酵母宿主細胞的其它有用啟動子。

與大腸桿菌一起使用的適宜的啟動子序列包括質粒中的T7啟動子、T5啟動子、色氨酸(trp)啟動子、乳糖(lac)啟動子、色氨酸/乳糖(tac)啟動子、脂蛋白(lpp)啟動子和λ噬菌體PL啟動子。

優選地,相對于輔助基因的啟動子而言,驅動編碼輔助蛋白的多核苷酸表達的啟動子不是內源性的。優選地,采用重組啟動子而不是輔助蛋白基因的內源性啟動子。

增強子

在優選的實施方案中,通過采用增強子來增強驅動輔助蛋白表達的啟動子活性來實現過表達。轉錄增強子相對不依賴于方向和位置,已在轉錄單位的5’和3’、內含子中以及其自身的編碼序列中發現了轉錄增強子。增強子可以在編碼序列的5’或3’位置被剪接入表達載體,但是優選位于啟動子的5’位。大多數酵母基因含有僅一個UAS,其通常位于帽位的幾百個堿基對中,并且當位于啟動子的3’時,大多數酵母增強子(UAS)無法發揮功能,但是高等真核生物中的增強子在啟動子的5’和3’都能發揮功能。

目前已知很多增強子序列來自于哺乳動物基因(球蛋白、RSV、SV40、EMC、彈性蛋白酶、白蛋白、α-胎蛋白和胰島素)。人們也可使用來自于真核細胞病毒的增強子,如SV40晚期增強子、巨細胞病毒早期啟動子增強子、多瘤病毒復制起點晚期一側的增強子和腺病毒增強子。酵母增強子,也稱為上游激活序列(UAS),如來自于釀酒酵母的UAS/Gal系統,可有利地與酵母啟動子一起使用(描述于歐洲專利No.0317254和Rudoni等,TheInternational Journal of Biochemistry and Cell Biology,(2000),32(2):215-224)。

在優選的實施方案中,本發明公開的2、3、4、5、6、7、8、9或更多類型的輔助蛋白過表達。例如,宿主細胞可被工程化為過表達2、3、4、5、6、7、8、9或更多個選自SEQ ID NO:1、2、3、4、5、6、7、8、9或162或其功能同系物的輔助蛋白,其中其功能同系物具有與SEQ ID NO:1、2、3、4、5、6、7、8、9或162具有至少30%的序列同一性的氨基酸。

目標蛋白

設想可以將宿主細胞培養在對于輔助蛋白和目標蛋白的共表達適宜的條件下,該宿主細胞將表達目標蛋白并過表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列或其功能同系物的輔助蛋白,其中所述功能同系物與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162中任一個的氨基酸序列具有至少30%的序列同一性。

本文所用術語“目標蛋白”(POI)是指在宿主細胞中通過重組技術生產的蛋白。更具體地,所述蛋白既可以是非天然地存在于宿主細胞中的多肽,即異源蛋白,也可以是對于所述宿主細胞而言天然的,即是宿主細胞的同源蛋白,但通過例如用含有編碼POI的核酸序列的自我復制載體的轉化、或通過重組技術將編碼POI的核酸序列的一個或多個拷貝整合至宿主細胞的基因組、或通過控制編碼POI的基因表達的一個或多個調控序列(如啟動子序列)的重組修飾而生產的。一般而言,可以通過本領域技術人員熟知的重組表達方法生產本文提及的目標蛋白。

本文對目標蛋白(POI)沒有限制。通常,POI是真核或原核多肽,其變體或衍生物。POI可以是任何真核或原核蛋白。Schmidt,Appl.Microbiol.Biotechnol.(2004),65:363-372或Kirk等,Curr.Opin.Biotechnol.(2002),13:345-351中描述了POI的實例。Schmidt的表1和表2中以及Kirk等的表1中提到的任何蛋白都涵蓋在本文所用術語“POI”中。所述蛋白可以是天然分泌蛋白,也可以是細胞內蛋白(即非天然分泌的蛋白)。本發明還包括蛋白的生物活性片段。在另一個實施方案中,POI可以是氨基酸鏈或以復合物如二聚體、三聚體、異-二聚體、多聚體或寡聚體存在。

目標蛋白可以是用作營養的、膳食的(dietary)、消化的、補充劑的蛋白,如用在食品、飼料或化妝品中。所述食品可以是,例如,肉湯、甜點、谷物棒、糕餅(confectionery)、運動飲料、膳食產品或其他營養產品。優選地,所述目標蛋白是食品添加劑。

在另一個實施方案中,目標蛋白可用在動物飼料中。所述POI可以是如真菌毒素(mycotoxin)降解酶的解毒酶。解毒酶是指分解毒素,如降低其毒性的酶。真菌毒素是由容易定殖于作物的真菌產生的有毒次級代謝產物,并且真菌毒素經常以能夠傷害作物并引起人和動物的健康難題為特征。真菌毒素降解酶包括黃曲霉毒素降解酶、玉米赤霉烯酮酯酶(zearalenone esterase)、玉米赤霉烯酮內酯酶(zearalenone lactonase)、玉米赤霉烯酮水解酶(zearalenone hydrolase)、伏馬菌素羧酸酯酶(fumonisin carboxylesterase)、伏馬菌素轉氨酶(fumonisin aminotransferase)、氨基多元醇胺氧化酶(aminopolyol amine oxidase)、脫氧雪腐鐮刀菌醇環氧化物水解酶(deoxynivalenol expoxide hydrolase)。所述POI還可以是降解赭曲霉毒素衍生物或麥角生物堿的酶。赭曲霉毒素是由曲霉或青霉家族的幾種真菌作為次級代謝產物而產生的一組霉菌毒素,是由異香豆素的衍生物組成的弱有機酸。有三種公認的赭曲霉毒素,指定為A、B和C。赭曲霉毒素A是赭曲霉毒素家族最豐富的成員,并且因此是最常檢測到的,但也是毒性最大的。赭曲霉毒素A(ochratoxin A)是存在于谷物及其它富含淀粉的食物中的腎毒性、致畸性、肝毒性和致癌性霉菌毒素。麥角生物堿是含有酰胺鍵的化合物,并包括,例如,麥角柯寧堿(ergocornine)、麥角異柯寧堿(ergocorninine)、麥角克堿(ergocristine)、麥角異克堿(ergocristinine)、麥角隱亭(ergocryptine)、麥角隱寧堿(ergocryptinine)、麥角新堿(ergometrine)、麥角辛(ergosine)、麥角胺(ergotamine)和麥角異胺(ergotaminine)。這些化合物對包括人和農場動物的活的生物體是有毒性的。這些酶的實例包括赭曲霉毒素酰胺酶、麥角胺水解酶、麥角胺淀粉酶。動物飼料中的真菌毒素降解酶對控制飼料的真菌毒素污染是有用的。

POI的進一步實例包括抗微生物蛋白,如乳鐵蛋白、溶菌酶、乳鐵素(lactoferricin)、lactohedrin、κ-酪蛋白、咕啉結合蛋白(haptocorrin)、乳過氧化物酶、牛奶蛋白、急性期蛋白(例如在生產動物中響應感染而正常產生的蛋白)和如溶菌酶和乳鐵蛋白的小抗微生物蛋白。其它實例包括抗菌蛋白、抗病毒蛋白、急性期蛋白(在生產動物中響應感染而誘導的)、益生菌蛋白、抑菌蛋白和陽離子抗微生物蛋白。

“飼料”是指旨在或適合用于非人動物食用、攝入、消化的任何天然或人工飲食、膳食等或這些膳食的組份。“飼料添加劑”通常是指添加在飼料中的物質。飼料添加劑通常包括如維生素、礦物質、酶和合適的載體和/或賦形劑的一種或多種化合物。對于本發明而言,食品添加劑可以是酶或其它蛋白。可用作飼料添加劑的酶的實例包括植酸酶、木聚糖酶和β-葡聚糖酶。“食品”是指旨在或適合用于人食用、攝入、消化的任何天然或人工飲食膳食等或這些膳食的組份。

“食品添加劑”通常是指添加在食物中的物質。食品添加劑通常包括如維生素、礦物質、酶和合適的載體和/或賦形劑的一種或多種化合物。對于本發明而言,食品添加劑可以是酶或其他蛋白質。可用作食品添加劑的酶的實例包括蛋白酶、脂酶、乳糖酶、果膠甲基酯酶(pectin methyl esterase)、果膠酶、谷氨酰胺轉移酶、淀粉酶、β-葡聚糖酶、乙酰乳酸脫羧酶和漆酶。

在一些實施方案中,所述食品添加劑是抗微生物蛋白,所述抗微生物蛋白包括:例如,(i)抗微生物牛奶蛋白(人或非人)乳鐵蛋白、溶菌酶、乳鐵素(lactoferricin)、lactohedrin、κ-酪蛋白、咕啉結合蛋白(haptocorrin)、乳過氧化物酶、α-1-抗胰蛋白酶和如IgA的免疫球蛋白;(ii)急性期蛋白,如C-反應蛋白(CRP)、乳鐵蛋白、溶菌酶、血清淀粉樣蛋白A(SAA)、鐵蛋白、結合珠蛋白(Hp)、補體(complement)2-9(特別是補體-3)、血清粘蛋白、銅藍血漿蛋白(Cp)、15-酮-13,14-二氫-前列腺素F2α(PGFM)、纖維素原(Fb)、α(1)-酸性糖蛋白(AGP)、α(1)-抗胰蛋白酶、甘露糖結合蛋白、脂多糖結合蛋白(lipoplysaccharide binding protein)、α-2巨球蛋白和各種防御素;(iii)抗微生物肽,如殺菌肽、爪蟾抗菌肽(magainin)、防御素、速普肽(tachyplesin)、parasin l.buforin I、PMAP-23、moronecidin、anoplin、gambicin和SAMP-29;和(iv)其它抗微生物蛋白,包括CAP37、粒溶蛋白、分泌型白細胞蛋白酶抑制劑、CAP18、ubiquicidin、牛抗微生物蛋白-1、Ace-AMP1、速普肽(tachyplesin)、大防御素(big defensin)、Ac-AMP2、Ah-AMP1和CAP18。

酶:

POI可以是酶。優選的酶是可用于如制備洗滌劑、淀粉、燃料、紡織品、紙漿和紙、油、個人護理產品,或烘烤、有機合成等工業應用的那些。這些酶的實例包括用于污漬去除和清潔的蛋白酶、淀粉酶、脂酶、甘露聚糖酶和纖維素酶(cellulose);用于淀粉液化和糖化的支鏈淀粉酶淀粉酶和淀粉葡糖苷酶;用于葡萄糖向果糖轉化的葡萄糖異構酶;用于環糊精生產的環糊精-糖基轉移酶;用于燃料和淀粉中粘度降低(xiscosity reduction)的木聚糖酶;用于烘烤中面團的穩定性和調整的淀粉酶、木聚糖酶、脂酶、磷脂酶、葡萄糖酶(glucose)、氧化酶、脂氧合酶、谷氨酰胺轉移酶;在紡織品制備中用于牛仔布整理和棉花軟化的纖維素酶;用于紡織品的脫漿的淀粉酶;用于精練的果膠裂解酶;用于漂白終止的過氧化氫酶;用于漂白的漆酶;用于過量染料去除的過氧化物酶;用在紙漿和紙制造中的脂酶、蛋白酶、淀粉酶、木聚糖酶、纖維素酶(cellulose);用于酯交換反應的脂酶和用于脂肪和油的脂肪加工時脫膠的磷脂酶;用于有機合成中手性醇和酰胺的分辨的脂酶;用于半合成青霉素的合成的酰基轉移酶,用于對應異構體羧酸的合成的腈水解酶;用于皮革生產的蛋白酶和脂酶;用于制備個人護膚品的淀粉葡萄糖苷酶、葡萄糖氧化酶和過氧化物酶(參見Kirk等,Current Opinion in Biotechnology(2002)13:345-351)。

治療性蛋白

POI可以是治療性蛋白。如本文更詳細的描述,POI可以是但不限于,適合作為如抗體或抗體片段、生長因子、激素、酶、疫苗等的生物制藥物質的蛋白。

所述POI可以是天然分泌的蛋白或細胞內蛋白(即非天然分泌的蛋白)。本發明還提供天然分泌或非天然分泌的蛋白的功能同系物、功能等價變體、衍生物和生物活性片段的重組生產。優選地,功能同系物是與序列相同或相應的并具有序列的功能特征。

所述POI可以與天然蛋白結構類似,和可以通過在C-和/或N-末端或者天然蛋白的側鏈上添加一個或多個氨基酸,在天然氨基酸序列上置換一個或數個不同位點的一個或多個氨基酸,在天然蛋白的任一個或兩個末端或者在氨基酸序列的一個或若干位點上缺失一個或多個氨基酸,或在天然氨基酸序列的一個或多個位點上插入一個或多個氨基酸,從天然蛋白質衍生。上述若干蛋白質的這些修飾是熟知的。

優選地,所述目標蛋白是哺乳動物多肽,或甚至更優選地是人多肽。特別優選的治療性蛋白是指可施用于哺乳動物的任何多肽、蛋白、蛋白質變體、融合蛋白和/或其片段。設想但不是必須的,根據本發明的治療性蛋白是細胞異源的。可通過本發明的細胞生產的蛋白的實例是但不限于,酶、調控蛋白、受體、肽激素、生長因子、細胞因子、支架結合蛋白(如anticalin)、結構蛋白、淋巴因子、粘附分子、受體、膜或轉運蛋白,和可作為激動劑或拮抗劑和/或具有治療或診斷用途的任何其他多肽。此外,所述目標蛋白可以是用于接種的抗原、疫苗、抗原結合蛋白、免疫刺激蛋白。其還可以是可包括本領域已知的任何合適的抗原結合抗體片段的抗體的抗原結合片段。例如,抗體片段可包括但不限于:Fv(一種包含VL和VH的分子)、單鏈Fv(scFV)(一種包含由肽連接子連接的VL和VH的分子)、Fab、Fab'、F(ab')2、單結構域抗體(sdAb)(包含單可變結構域和3CDR的分子)和他們的多價呈現形式(presentation)。所述抗體或其片段可以是鼠、人、人源化或嵌合的抗體或其片段。治療性蛋白的實例包括抗體、多克隆抗體、單克隆抗體、重組抗體、抗體片段,如Fab'、F(ab')2、Fv、scFv、di-scFv、bi-scFv、串聯scFv、雙特異性串聯scFv、sdAb、納米抗體、VH和VL,或人抗體、人源化抗體、嵌合抗體、IgA抗體、IgD抗體、IgE抗體、IgG抗體、IgM抗體、胞內抗體、微抗體或單抗體(monobody)。

這些治療性蛋白包括但不限于:胰島素、胰島素樣生長因子、hGH、tPA、細胞因子,例如如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18的白細胞介素、干擾素(IFN)α、IFNβ、IFNγ、IFNω或IFNτ、腫瘤壞死因子(TNF)TNFα和TNFβ、TRAIL;G-CSF、GM-CSF、M-CSF、MCP-1和VEGF。

在優選的實施方案中,所述蛋白是抗體。術語“抗體”旨在包括含有具有適合并識別表位的特異性形狀的分子結構的任何多肽鏈,其中一個或多個非共價結合相互作用穩定該分子結構與所述表位之間的復合物。原型的抗體分子是免疫球蛋白,且來自所有來源(如人、嚙齒動物、兔、牛、羊、豬、狗、其它哺乳動物、雞、其它禽類等)的所有類型的免疫球蛋白(IgG、IgM、IgA、IgE、IgD等)都被認為是“抗體”。已經描述了多個編碼抗體的序列;其它抗體可通過本領域熟知的方法提出。

例如,可通過本領域已知的方法生產抗體或抗原結合片段。通常抗體生產細胞對所需抗原或免疫原敏感。從抗體生產細胞中分離的信使RNA用作采用PCR擴增制備cDNA的模板。通過將擴增的免疫球蛋白cDNA的合適區段插入表達載體中來生產載體文庫,其中每一個載體含有保留了原始抗原特異性的一個重鏈基因和一個輕鏈基因。通過將重鏈基因文庫與輕鏈基因文庫組合構建組合文庫。這得到了共表達重鏈和輕鏈(類似于抗體分子的Fab片段或抗原結合片段)的克隆文庫。將攜帶這些基因的載體共轉染至宿主細胞。當在轉染的宿主中誘導抗體基因合成時,所述重鏈和輕鏈蛋白自組裝以生產能夠通過用抗原或免疫原篩選而檢測的活性抗體。

編碼抗體的目標序列包括由天然序列編碼的那些,以及借助于遺傳密碼的簡并性在序列上與已公開的核酸不同的核酸和它們的變體。變體多肽可包括氨基酸(aa)置換、添加或缺失。所述氨基酸置換可以是保守性氨基酸置換或消除非必須氨基酸的置換,例如以改變糖基化位點,或通過置換或缺失一個或多個對功能而言非必需的半胱氨酸殘基來使錯誤折疊最少。可對變體進行設計從而使其保留或具有蛋白特定區域(如,功能結構域、起催化作用的氨基酸殘基等)的增強的生物活性。變體還包括本文所公開的多肽的片段,特別是生物活性片段和/或對應于功能結構域的片段。克隆基因的體外誘變技術是已知的。本發明的主題還包括采用一般分子生物技術修飾從而改善了它們對蛋白質降解的抵抗的或優化了溶解性能的或使它們更適合作為治療劑的多肽。

可通過將可變輕鏈和重鏈區(VK和VH)組合的重組方式來制備嵌合的抗體,所述可變輕鏈和重鏈區從一個物種的抗體生產細胞中獲得,而恒定輕鏈和重鏈區來自另一物種。通常,為了生產主要是人結構域的抗體,嵌合的抗體利用嚙齒動物或兔可變區和人恒定區。這些嵌合的抗體的生產是本領域熟知的,并且可通過標準手段實現(如,例如在美國專利No.5,624,659中所描述的)。

人源化抗體被工程化為含有甚至更多人樣免疫球蛋白結構域,并僅結合(incorporate)動物來源抗體的互補決定區。這一過程通過仔細檢查單克隆抗體的可變區的高變環序列,并使這些高變環序列與人抗體鏈的結構相裝配來完成。盡管從表面上看是復雜的,但是這一過程已被直接實踐。參見例如美國專利No.6,187,287。

除了完整的免疫球蛋白(或它們的重組對應物),可合成包含表位結合位點(如Fab’、F(ab’)2或其他片段)的免疫球蛋白片段。可利用重組免疫球蛋白技術設計“片段”或最小免疫球蛋白。比如可通過合成可變輕鏈區和可變重鏈區生產本發明所用的“Fv”免疫球蛋白。還對抗體的組合感興趣,如包含兩個不同Fv特異性的雙抗體。

可在翻譯后修飾免疫球蛋白,如添加化學連接子、可檢測部分(例如熒光染料)、酶、作用物(substrate)、化學發光部分等,或在本發明的方法和組合物中使用特異性結合部分,例如鏈霉親和素、抗生物素蛋白或生物素等。

治療性蛋白的進一步實例包括凝血因子(VII、VIII、IX)、鐮刀菌屬堿性蛋白酶、降鈣素、CD4受體達貝泊汀(darbepoetin)、DNA酶(囊性纖維化)、促紅細胞生成素、eutropin(人生長激素衍生物)、促卵泡激素(促濾泡素)、明膠、胰高血糖素、葡糖腦苷脂酶(戈謝病)、源自黑曲霉(A.niger)的葡糖淀粉酶、源自黑曲霉的葡萄糖氧化酶、促性腺激素、生長因子(GCSF、GMCSF)、生長激素(生長激素(somatotropine))、乙肝疫苗、水蛭素、人抗體片段、人載脂蛋白AI、人降鈣素前體、人膠原酶IV、人表皮生長因子、人胰島素樣生長因子、人白細胞介素6、人層粘連蛋白、人前脫脂蛋白AI、人血清白蛋白胰島素、胰島素和突變蛋白、胰島素、干擾素α和突變蛋白、干擾素β、干擾素γ(突變蛋白)、白細胞介素2、促黃體生成激素、單克隆抗體5T4、小鼠膠原蛋白、OP-1(成骨的,神經保護因子)、奧普瑞白介素(白細胞介素11-激動劑)、有機磷酸水解酶(organophosphohydrolase)、PDGF-激動劑、肌醇六磷酸酶、血小板衍化生長因子(PDGF)、重組血纖溶酶原激活劑G、葡萄球菌激酶、干細胞因子、破傷風毒素片段C、組織型纖溶酶原激活物和腫瘤壞死因子(參見Schmidt,Appl Microbiol Biotechnol(2004)65:363-372)。

前導序列

可將目標蛋白與引發POI自宿主細胞中分泌的前導序列連接。當旨在重組表達和分泌的POI是這樣一種蛋白時,即其是非天然分泌的并因此缺乏天然分泌前導序列,或其核苷酸序列已經被克隆而不含其天然分泌前導序列時,使所述分泌前導序列存在于表達載體中是必須的。一般而言,任何對引發POI自宿主細胞中分泌有效的分泌前導序列均可用于本發明中。所述分泌前導序列可以來自于酵母源(如來自如釀酒酵母的MFa的酵母α-因子,或酵母磷酸酶),來自于哺乳動物或植物源,或其它。對技術人員而言,適宜的分泌前導序列的選擇是顯而易見的。可選地,可以在將核苷酸序列克隆在表達載體中之前,通過技術人員已知的常規克隆技術,將所述分泌前導序列融合至編碼旨在重組表達的POI的核苷酸序列,或者將包含天然分泌前導序列的編碼POI的核苷酸序列克隆在表達載體中。在這些情況下,無需使表達載體中存在分泌前導序列。

也可以以每個細胞單一拷貝或多拷貝形式在一個或多個自主復制質粒中提供所述編碼一種或多種POI的重組核苷酸序列,以及編碼輔助蛋白的重組核苷酸序列。

可選地,所述編碼POI的重組核苷酸序列和編碼輔助蛋白的重組核苷酸序列以每個細胞單一拷貝或多拷貝的形式存在于相同質粒中。

KO蛋白的低表達

發明人還鑒定了幾種所觀察到的表達對自宿主細胞中POI的產量具有負面作用的蛋白(本文稱為敲除(KO)蛋白,包括KO1、KO2、KO3及其功能同系物)。KO蛋白是指具有SEQ ID NO 10、11或12的氨基酸序列或其功能同系物的蛋白,其中所述功能同系物與示于SEQ ID NO 10、11或12的氨基酸序列具有至少30%,如至少31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%的序列同一性。此外,已經發現,編碼KO蛋白的基因的修飾(如突變或缺失)能夠增加POI的產量。這一發現提供了通過將宿主細胞工程化為使得其低表達由發明人鑒定的基因來可用于進一步改善POI產量的方法和材料。若宿主細胞中存在KO1、KO2、KO3基因或功能同系物,則可將它們進行修飾以改善POI的產量。基于本文提供的序列,可采用本領域已知的任何方法來鑒定KO蛋白的存在。

所述蛋白列于表2:

表2

優選地,所述宿主細胞可被工程化為低表達多核苷酸,所述多核苷酸編碼具有示于SEQ ID NO 10、11或12的氨基酸序列或其功能同系物的KO蛋白,其中所述功能同系物與示于SEQ ID NO 10、11或12的氨基酸序列具有至少30%的序列同一性。例如,所述宿主細胞被工程化為低表達多核苷酸,該多核苷酸編碼具有與示于SEQ ID NO 10的氨基酸序列具有至少30%的序列同一性的氨基酸的蛋白質。例如,所述宿主細胞可被工程化為低表達多核苷酸,該多核苷酸編碼具有與示于SEQ ID NO 11的氨基酸序列具有至少30%的序列同一性的氨基酸的蛋白質。例如,所述宿主細胞可被工程化為低表達多核苷酸,該多核苷酸編碼具有與示于SEQ ID NO 12的氨基酸序列具有至少30%的序列同一性的氨基酸的蛋白質。

優選地,與工程化為低表達KO蛋白之前的宿主細胞相比,當低表達KO1、KO2和/或KO3時,宿主細胞中模型蛋白SDZ-Fab或HyHEL-Fab的產量可以增加至少1%,如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290或至少300%。

術語“低表達”通常是指小于參考標準顯示的表達水平的任何量,所述參考標準是工程化為低表達KO蛋白之前的宿主細胞。本發明的術語“低表達(的)”是指基因產物或多肽以小于宿主細胞遺傳改變之前的或未經遺傳改變的可比宿主中的相同基因產物或多肽的表達的水平表達。所述術語“低表達”還涵蓋基因產物或多肽的無表達。

可通過阻止KO1、KO2和KO3或其功能同系物中一個或多個的功能表達的任何方法來實施低表達。低表達的結果是不能發揮其功能。低表達的手段可包括基因沉默(如,RNAi基因反義)、敲除、改變表達水平、改變表達形式、通過誘變基因序列、破壞(disrupt)序列、插入、添加、突變、修飾表達調控序列等。

優選地,通過敲除宿主細胞中編碼KO蛋白的多核苷酸來實現低表達。可通過缺失全部或部分編碼序列來敲除基因。本領域已知使基因敲除的方法,如參見Kuhn和Wurst(Eds.)Gene Knockout Protocols(Methods in Molecular Biology)Humana Press(March 27,2009)。還可通過移除所述基因序列的部分或全部來敲除基因。可選地,通過如抗性基因的核苷酸序列的插入來敲除或滅活基因。可選地,通過滅活基因的啟動子可使該基因敲除或滅活。

在一個實施方案中,通過破壞宿主細胞中編碼所述基因的多核苷酸來實現低表達。

“破壞”是一種在核苷酸或氨基酸序列中的改變,與破壞之前的原始序列相比,其導致一個或多個核苷酸或氨基酸殘基的添加、缺失或置換。

“插入”或“添加”是一種在核酸或氨基酸序列中的改變,與破壞之前的原始序列相比,所述核酸或氨基酸序列中加入了一個或多個核苷酸或氨基酸殘基。

“缺失”定義為一種在核苷酸或氨基酸序列中的改變,在所述核苷酸或氨基酸序列中相應地移除(即,缺失)了一個或多個核苷酸或氨基酸殘基。缺失涵蓋了全部序列的缺失、所述編碼序列的部分的缺失或者單一核苷酸或氨基酸殘基的缺失。

“置換”通常是指核苷酸或氨基酸殘基被其它核苷酸或氨基酸殘基替代。可通過定點突變、隨機突變的產生和缺口雙鏈體方法(gapped-duplex approach)(參見,如美國專利No.4,760,025;Moring等,Biotech.(1984)2:646;和Kramer等,Nucleic Acids Res.,(1984)12:9441)來實施“置換”。

優選地,破壞導致了移碼突變、早期終止密碼(early stop codon)、關鍵殘基的點突變、無義的翻譯或其它非功能蛋白產物。

在另一個實施方案中,通過破壞可操作地與所述多肽連接的啟動子來實現低表達。啟動子指導下游基因的轉錄。所述啟動子是必須的,其與其他表達控制序列如增強子、核糖體結合位點、轉錄起始和終止序列、翻譯起始和終止序列以及增強子或激活子序列一起表達給定基因。因此,還可以破壞任何所述表達控制序列以阻礙所述多肽的表達。

在另一個實施方案中,通過轉錄后基因沉默(PTGS)來實現低表達。作為本領域常用的技術,PTGS通過異源RNA序列(對需要破壞的基因而言,往往是反義的)的表達降低基因的表達水平(Lechtreck等,J.Cell Sci(2002).115:1511-1522;Smith等,Nature(2000).407:319-320;Furhmann等,J.Cell Sci(2001).114:3857-3863;Rohr等,Plant J(2004).40(4):611-21)。

可通過本領域已知的減少基因表達的任何技術來實現“低表達”。例如,與所述多肽可操作地連接的啟動子可被具有較低啟動子活性的另一啟動子替代。可以通過啟動子的轉錄效率來評估啟動子活性。可通過測量從該啟動子的mRNA轉錄的量來直接地測定啟動子活性,如通過RNA印跡法、定量PCR,或通過測量自該啟動子表達的基因產物的量來間接地測定啟動子活性。在另一個實施方案中,通過干預表達的KO蛋白的折疊,從而使該KO蛋白不能正確折疊成為功能性蛋白來實現低表達。例如,可引入突變以移除所述KO蛋白的二硫鍵的形成或破壞α螺旋和β折疊的形成。

又一方面,本發明提供所述工程化宿主細胞在制備目標蛋白中的用途。所述宿主細胞可有利地用于引入編碼一種或多種POI的多肽,之后可將該宿主細胞在適宜的條件下培養以表達所述POI。在之后的關于本發明的方法部分描述了這一用途的細節。

可以通過將相關基因各自連接(ligating)至一個載體中,使編碼輔助蛋白和POI的多核苷酸重組于所述宿主細胞中。可以構建攜帶所述基因的單一載體,或兩個獨立的載體,其中一個攜帶輔助蛋白基因而另一個攜帶POI基因。可通過采用一種或多種所述載體轉化宿主細胞,將這些基因整合至所述宿主細胞的基因組中。在一些實施方案中,將編碼POI的基因整合至所述基因組中,而將編碼輔助蛋白的基因整合至質粒或載體中。在一些實施方案中,將編碼輔助蛋白的基因整合至所述基因組中,而將編碼POI的基因整合至質粒或載體中。在一些實施方案中,將編碼POI和輔助蛋白的基因均整合至所述基因組中。在一些實施方案中,將編碼POI和輔助蛋白的基因整合至質粒或載體中。若采用編碼POI的多個基因,則將編碼POI的一些基因整合至所述基因組中,而將另一些基因整合至相同或不同的質粒或載體中。若采用編碼輔助蛋白的多個基因,則將編碼輔助蛋白的一些基因整合至所述基因組中,而將另一些基因整合至相同或不同的質粒或載體中。可在本申請的以下部分找到更多教導。

通常,可采用重組宿主細胞,通過在合適的培養基中培養該宿主細胞,自培養物中分離表達的POI,并通過適合表達產物的方法將POI純化,特別是將POI自細胞中分離,生產目標蛋白。

又一方面,本發明涉及增加宿主細胞中目標蛋白的產量的方法,所述方法包括過表達本發明的多核苷酸。所述多核苷酸編碼具有與示于SEQ IDNO:1、2、3、4、5、6、7、8、9或162中任一個的氨基酸序列具有至少30%的序列同一性的氨基酸的輔助蛋白。

如本文所用,術語“增加宿主細胞中目標蛋白的產量”是指與在相同培養條件下表達相同POI但是編碼輔助蛋白的多核苷酸未過表達的相同細胞相比,目標蛋白的產量增加了。

本領域技術人員將理解,本發明的輔助蛋白的過表達已經表明增加了POI的產物產量。因此,對于表達具有應當被增加的水平的POI的給定宿主細胞,如果輔助蛋白不存在于該宿主細胞中,則可通過在該宿主細胞中表達任一種或若干種輔助蛋白而應用本發明,或者如果編碼輔助蛋白的基因已經存在于該宿主細胞中,則可通過進一步增加該宿主細胞中輔助蛋白的表達水平而應用本發明。

再一方面,本發明提供一種增加宿主細胞中目標蛋白的產量的方法。所述方法包括(i)將宿主細胞工程化為表達或過表達輔助蛋白,(ii)在所述宿主細胞中重組編碼目標蛋白的異源多核苷酸,和(iii)在適宜條件下培養所述宿主細胞以表達所述輔助蛋白和目標蛋白。應當注意,在(i)和(ii)中所述的步驟無需按照所述的順序實施。可以首先實施(ii)中所述的步驟然后實施(i)中所述的步驟。在步驟(i)中,所述宿主細胞可被工程化為過表達多核苷酸,所述多核苷酸編碼具有與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162中任一個的氨基酸序列具有至少30%的序列同一性的氨基酸的輔助蛋白。

本領域技術人員熟知用于操作如編碼輔助蛋白和/或POI的多核苷酸序列、啟動子、增強子、前導區(leader)等的程序,如J.Sambrook等,Molecular Cloning:A Laboratory Manual(3rd edition),Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,New York(2001)描述的。

可通過多種手段,如通過同源重組或通過采用特異性靶向在整合位點的序列的混合重組酶(hybrid recombinase),將外源或靶多核苷酸(如編碼輔助蛋白或POI的多核苷酸)插入染色體中。典型地,所述外源或靶多核苷酸存在于載體(“插入載體”)中。典型地,在用于同源重組之前,這些載體是環狀的和線性的。作為一種選擇,所述外源或靶多核苷酸可以是稍后被重組至宿主細胞中的通過融合PCR連接的DNA片段或合成構建的DNA片段。除了同源臂之外,載體還含有適于選擇或篩選的標記、復制起點和其它元件。還可以采用導致隨機或非靶向整合的異源重組。異源重組是指DNA分子與顯著不同的序列之間的重組。本領域已知重組的方法,例如在Boer等,Appl Microbiol Biotechnol(2007)77:513–523中所描述的。對于酵母細胞的遺傳操作還可參考Primrose和Twyman的Principles of Gene Manipulation and Genomics(第七版,Blackwell Publishing 2006)。

編碼輔助蛋白和/或POI的多核苷酸還可存在于表達載體上。這些載體是本領域已知的并已經在上文描述過。在表達載體中,啟動子置于編碼異源蛋白的基因的上游,并調控所述基因的表達。由于多克隆載體的多克隆位點,其是特別有用的。對于表達,通常將啟動子置于多克隆位點的上游。既可通過首先制備含有編碼輔助蛋白和/或POI的完整DNA序列的DNA構建體,并隨后將這一構建體插入適宜的表達載體中,也可以通過順序地插入含有個體元件(如,前導序列、靶DNA序列)遺傳信息的DNA片段,然后連接,來構建用于編碼輔助蛋白和/或POI的多核苷酸的整合的載體。作為片段的限制和連接的替代,可把基于附著位點(att)的重組方法和重組酶用于將DNA序列插入載體中。這些方法由例如Landy(1989)Ann.Rev.Biochem.58:913-949描述,并是本領域技術人員已知的。

可通過將包含靶多核苷酸序列的載體或質粒引入細胞來獲得根據本發明的宿主細胞。本領域熟知用于轉染或轉化真核細胞或者轉化原核細胞的技術。這些技術可以包括脂囊泡介導的攝取、熱休克介導的攝取、磷酸鈣介導的轉染(磷酸鈣/DNA共沉淀)、病毒感染(特別是使用經修飾的病毒諸如例如經修飾的腺病毒)、顯微注射和電穿孔。對于原核轉化,技術可以包括熱休克介導的攝取、與完整細胞的細菌原生質體融合、顯微注射和電穿孔。用于植物轉化的技術包括土壤桿菌(Agrobacterium)介導的轉移(諸如通過根瘤土壤桿菌(A.tumefaciens)實現的)、被快速推進的鎢或金微彈、電穿孔、顯微注射和聚乙二醇介導的攝取。DNA可以是單鏈的或雙鏈的、線性的或環狀的、松弛的或超螺旋的DNA。對于用于轉染哺乳動物細胞的多種技術,參見例如Keown等(1990)Processes in Enzymology185:527-537。

又一方面,本發明提供一種在宿主細胞中制備目標蛋白的方法,所述方法包括(i)提供宿主細胞,所述宿主細胞被工程化為過表達多核苷酸,所述多核苷酸編碼具有與示于SEQ ID NO:1、2、3、4、5、6、7、8、9或162的氨基酸序列具有至少30%的序列同一性的氨基酸的輔助蛋白,其中所述宿主細胞包含編碼目標蛋白的異源多核苷酸;和(ii)在適宜條件下培養所述宿主細胞以過表達所述輔助蛋白和表達目標蛋白。

應當理解,本文公開的方法可進一步包括在允許所述POI和輔助蛋白表達的條件下培養所述重組宿主細胞。然后,根據表達系統和表達的蛋白的性質,例如所述蛋白能否融合為單一肽和所述蛋白是可溶的還是膜結合的,可以從細胞或細胞培養基中分離重組生產的POI。本領域技術人員將理解,根據包括宿主細胞(特別是所采用的表達載體)的類型的因素,培養條件將改變。通常,信號肽含有帶正電的N-末端,隨后是疏水內核,隨后是用于稱為信號肽酶的酶的識別位點。在易位期間,這種酶從所述蛋白切割信號肽。將所述蛋白質從內質網轉運至高爾基體,然后根據該蛋白質的性質進行分泌途徑中多個路線的一個。所述蛋白可分泌至培養基中或可例如保留在細胞表面。某些包含胞外、跨膜和胞質結構域的受體是可被保留在細胞膜上的蛋白的實例,其中僅胞外結構域位于細胞外。某些分泌的蛋白的前導序列包含位于信號肽C-末端的肽,并在信號肽的切割后自成熟目標蛋白加工。這種前導區常常是指前原肽(prepro peptide),其中前區(pre region)是信號序列,原區(pro region)是指前導區的剩余部分。

一個實例是酵母α-因子前導區,其含有信號肽(包括C-末端信號肽酶識別位點AlaLeuAla),隨后是含有構成KEX2蛋白酶加工位點的堿性氨基酸對LysArg的原區,緊隨其后的是在原區的C-末端的肽GluAlaGluAla。這一前導區的加工涉及通過信號肽酶的信號肽的移除,隨后是KEX2蛋白酶對Lys和Arg殘基之間的切割。之后,通過是STE13基因的產物的肽酶將GluAlaGluAla殘基移除(Julius等,Cell(1983)32:839)。在美國專利4,546,082中描述了所述酵母α-因子前導區。已經在用于酵母中異源蛋白的生產的重組表達系統中應用了衍生自由酵母細胞天然分泌的蛋白的信號肽。盡管某些哺乳動物信號肽在促進酵母中異源蛋白的分泌方面不是有效的,但是也已經報道了哺乳動物信號肽在酵母表達系統中的應用。

短語“在適宜的條件下培養,使得所需多肽表達”是指在適合或足夠獲得所需化合物的生產或獲得所需多肽的條件(如溫度、壓力、pH、持續時間等)下維持和/或生長(growing)微生物。

通過用一種或多種輔助蛋白基因和/或POI基因轉化獲得的根據本發明的宿主細胞可優選首先在這樣的條件下培養,所述條件允許宿主細胞在沒有表達異源蛋白的負擔下高效生長至大的細胞數量。當細胞準備進行POI表達時,選擇并優化適宜的培養條件以產生POI。

作為示例,使用針對一種或多種輔助基因和/或一種或多種POI的不同啟動子和/或拷貝和/或整合位點,可關于與一種或多種POI的表達有關的時間點和誘導強度來控制輔助基因的表達。例如,在POI表達的誘導之前,可首先表達一種或多種輔助蛋白。這樣做具有如下優勢:在POI翻譯開始時所述一種或多種輔助蛋白已經存在。可選地,可在同一時間誘導一種或多種輔助蛋白和一種或多種POI。

一旦施加誘導刺激就會被激活的誘導型啟動子可用于在該啟動子控制下的基因的直接轉錄。在有誘導刺激的生長條件下,細胞通常比在正常條件下生長得慢,但因為培養物已經在前一階段生長至大的細胞數量,培養系統整體產生大量的異源蛋白。誘導刺激優選是適當試劑(如針對AOX-啟動子的甲醇)的添加或適當營養物(如針對MET3-啟動子的甲硫氨酸)的消耗。此外,乙醇、甲胺、鎘或銅的添加以及熱或滲透壓增加劑也可誘導表達。

優選將根據本發明的宿主在生物反應器中在優化的生長條件下培養以獲得至少1g/L、更優選至少10g/L細胞干重、更優選至少50g/L細胞干重的細胞密度。不僅在實驗室規模中,而且在中試或工業規模中,實現這樣的生物分子產量是有益的。

根據本發明,由于輔助蛋白的共表達,即使在生物質保持較低的情況下都可高產量地獲得POI。因此,在實驗室、中試和工業規模中達到高單位產量(specific yield)是可行的,其中單位產量以mg POI/g干生物質衡量,可以在1至200的范圍,如50至200,如100至200。當與無輔助蛋白過表達情況下的產物表達相比時,根據本發明的生產宿主的單位產量優選提供至少1.1倍,更優選至少1.2倍,至少1.3或至少1.4倍的增加,在一些情況下,可以顯示超過2倍的增加。

根據本發明的宿主細胞可通過以下標準試驗來測試其表達/分泌能力或產量:如ELISA、活性檢驗、HPLC、表面等離子體共振(Biacore)、蛋白質印跡法、毛細管電泳(Caliper)或SDS-Page。

優選將細胞培養在含有合適碳源的礦物質培養基中,由此進一步顯著地簡化分離過程。作為示例,所述礦物質培養基含有可利用碳源(例如葡萄糖、甘油、乙醇或甲醇)、含有常量元素(鉀、鎂、鈣、銨、氯化物、硫酸鹽、磷酸鹽)和痕量元素(銅、碘、錳、鉬酸鹽、鈷、鋅和鐵鹽以及硼酸)的鹽。

在酵母細胞的情況下,可以用上述一種或多種表達載體的一種或多種轉化所述細胞,使這些細胞交配(mated)以形成二倍體菌株,并在被修飾為適合誘導啟動子、選擇轉化子或擴增編碼所需序列的基因的常規營養培養基中培養。本領域已知許多適于酵母菌生長的最低限度培養基。根據需要,可向這些培養基的任一種中補充鹽(如氯化鈉、鈣、鎂和磷酸鹽)、緩沖液(如HEPES、檸檬酸和磷酸鹽緩沖液)、核苷(如腺嘌呤和胸腺嘧啶)、抗生素、痕量元素、維生素和葡萄糖或等效能源。還可包括以適當濃度的任何其它必須的補充物,這是本領域技術人員已知的。所述培養條件(如溫度、pH等)是之前選擇用于宿主細胞表達的條件,這是普通技術人員已知的。針對其它類型宿主細胞的細胞培養條件也是已知的并可由技術人員容易地確定。對各種微生物的培養基的描述例如涵蓋在美國微生物學會(American Society for Bacteriology)的“一般細菌學方法手冊”的指南(華盛頓D.C,USA,1981)中。

可以通過常規的培養方法,例如靜止培養、試管培養、振蕩培養(例如旋轉振蕩培養,搖瓶培養等)、摻氣旋動培養(aeration spinner culture)或發酵,優選地連續或間歇地在液體培養基中培養(例如維持和/或生長)細胞。在一些實施方案中,在搖瓶或深孔板中培養細胞。在另一些實施方案中,在生物反應器(例如在生物反應器培養過程)中培養細胞。培養過程包括、但不限于,分批培養、進料分批培養和連續方法培養。術語“分批過程”和“分批培養”是指一個封閉的系統,該系統中的培養基組成、營養物、補充添加劑等在培養開始時已設定,并在培養期間不經受改變;但是,可嘗試控制如pH和氧濃度的因素來阻止過度培養基酸化和/或細胞死亡。術語“進料分批過程”和“進料分批培養”是指具有以下例外的一種分批培養:隨著培養的進行,添加(例如,以增量或連續方式添加)一種或多種底物或補充物。術語“連續過程”和“連續培養”是指一種系統,在該系統中將限定的培養基連續地添加至生物反應器,并同時將等量的所采用的或“條件化”的培養基移除,例如用于回收所需產物。已經開發了多種這樣的過程并且這些過程是本領域熟知的。

在一些實施方案中,將細胞培養約12至24小時,在另一些實施方案中,將細胞培養約24至36小時,約36至48小時,約48至72小時,約72至96小時,約96至120小時,約120至144小時,或培養持續時間大于144小時。在又一些實施方案中,培養持續一段足以達到POI的所需生產產量的時間。

上述提及的方法可進一步包括分離表達的POI的步驟。若所述POI是從細胞中分泌出來的,則該POI可采用現有技術從培養基中分離并純化。POI從細胞中分泌出來通常是優選的,因為可以從培養上清液中回收產物,而不是從當細胞被破壞以釋放胞內蛋白時產生的復雜蛋白混合物中回收。蛋白酶抑制劑,如苯基甲基磺酰氟(PMSF),在抑制純化過程中的蛋白質降解可能是有益的,且可包括抗生素以阻止外來污染物的生長。可采用本領域已知的方法將組合物濃縮、過濾、透析等。可選地,培養的宿主細胞也可以通過超聲波或機械法、酶法或化學法來破裂以得到含有所需POI的細胞提取物,從該細胞提取物中可以分離和純化到POI。

對于獲得POI的分離和純化方法,可以使用利用溶解度差異的方法,比如鹽析和溶劑沉淀;利用分子量差異的方法,比如超濾和凝膠電泳;利用電荷差異的方法,比如離子交換層析;利用特異親和性的方法,比如親和層析;利用疏水性差異的方法,比如反相高效液相層析;以及利用等電點差異的方法,比如等電點聚集。優選采用特異的純化步驟來移除同時表達的并會對POI制品造成污染的任何輔助蛋白。

分離和純化的POI可以通過常規方法,比如蛋白質印跡法或對其活性的特異性檢驗來鑒定。純化POI的結構可以通過氨基酸分析、氨基-末端分析、一級結構分析等來定義。優選可以大量和高純度水平獲得POI,這樣即可滿足作為藥物組合物中的活性成分或者作為飼料或食品添加劑的必要要求。

應當理解,本發明不受描述的特殊方法、規程、細胞系、動物的種或屬、構建體和試劑限制,因為它們當然可以變化。也理解的是本文使用的術語只是用于描述特定實施方案,并不意欲限制本發明的范圍,本發明的范圍僅由所附權利要求限定。

除非另有說明,本文所使用的所有科技術語具有本發明所屬技術領域的普通技術人員所通常理解的相同含義。盡管與本文所述的那些類似或等同的任何方法、裝置和材料都可用于本發明的實踐或試驗中,但是目前描述了優選的方法、裝置和材料。

本文所提及的所有公開文本都用于描述和披露公開文本中所描述并且可能與目前描述的本發明結合使用的例如細胞系、構建體和方法的目的。上面以及本文全文討論的公開文本單獨提供,因為它們的公開早于本申請的申請日。本文無任何內容能被解釋為承認由于在先發明,本發明不早于這樣的公開內容。

提出下述實施例以向本領域普通技術人員提供如何制備和使用本發明的完整公開和描述,并且不是要限制權利要求中的被認為是本發明的且限定的范圍。已經嘗試保證所使用的數字(例如量、溫度、濃度等)的準確性,但應該允許一些實驗誤差和偏差。除非另外說明,份是重量份,分子量是平均分子量,溫度是攝氏度,并且壓力是大氣壓或接近大氣壓。

實施例

以下實施例將證明,基于重組蛋白的過表達,新鑒定的輔助蛋白分別增加了重組蛋白的效價(以mg/L表示的每體積的產物)和產量(以mg/g生物質表示的每生物質的產物,生物質以干細胞重量或濕細胞重量來度量)。作為實例,在巴斯德畢赤酵母中重組抗體Fab片段和重組酶的產量增加。在振蕩培養(在搖瓶或深孔板中進行)和實驗室規模的進料-分批培養中顯示出了積極作用。

實施例1 巴斯德畢赤酵母生產菌株的產生

a)分泌抗體Fab片段HyHEL的巴斯德畢赤酵母菌株的構建

將巴斯德畢赤酵母CBS7435(CBS,由Küberl等,2011對其基因組測序)muts變體用作宿主菌株。pPM2d_pGAP和pPM2d_pAOX表達載體是WO2008/128701A2中描述的pPuzzle_ZeoR載體骨架的衍生物,其包含pUC19細菌復制起點和博來霉素(Zeocin)抗生素抗性盒。異源基因的表達分別由巴斯德畢赤酵母甘油醛-3-磷酸脫氫酶(GAP)啟動子或醇氧化酶(AOX)啟動子和釀酒酵母CYC1轉錄終止子介導。采用表3中HyHEL-HC和HyHEL-LC的引物,將抗體Fab片段HyHEL(圖2)的輕鏈(LC)和重鏈(HC)從載體DNA模板(攜帶具有N-末端釀酒酵母α交配因子信號前導序列的目的基因)中擴增,并且將每一條鏈都連接到由SbfI和SfiI消化的載體pPM2d_pGAP和pPM2d_pAOX上。將所述LC片段連接到pPM2d_pGAP和pPM2d_pAOX變體上,其中啟動子區中的一個限制性酶位點被換為另一個,以允許隨后的線性化(在pPM2d_pGAP中是NdeI而不是AvrII,在pPM2d_pAOX中是Bsu36I而不是Bpu1102I);將所述HC片段連接到所述載體的未修飾版本中。在LC和HC的序列驗證之后,通過采用相容性限制性酶MreI和AgeI將兩條鏈的表達盒組合到一個載體上。

在電穿孔(采用描述于Gasser等,2013.Future Microbiol.8(2):191-208中的標準的轉化方案)至巴斯德畢赤酵母中之前,分別采用NdeI限制性酶(針對pPM2d_pGAP)或Bsu36I限制性酶(針對pPM2d_pAOX)將質粒線性化。在含有50μg/mL博來霉素(Zeocin)的YPD板(每升:10g酵母提取物、20g蛋白胨、20g葡萄糖、20g瓊脂)上實施陽性轉化體的篩選。使用菌落PCR(Colony PCR)來確保轉化的質粒的存在。因此,通過將巴斯德畢赤酵母菌落蒸煮(cook)和冷凍各5分鐘獲得基因組DNA,并將其直接用于采用適當引物的PCR。

b)分泌抗體Fab片段SDZ的巴斯德畢赤酵母菌株的構建

采用表3中SDZ-HC和SDZ-LC的引物,將抗體Fab片段SDZ(圖2)的輕鏈(LC)和重鏈(HC)從載體DNA模板(攜帶具有N-末端α交配因子信號前導序列的目的基因)中擴增,并且將每一條鏈都連接到分別由SbfI和SfiI消化的pPM2d_pAOX或具有Bsu36I限制性位點的pPM2d_pAOX的變體上。在LC和HC的序列驗證之后,通過采用相容性限制性酶MreI和AgeI將兩條鏈的表達盒組合到一個載體上。

在電穿孔(采用描述于Gasser等,2013.Future Microbiol.8(2):191-208中的標準的轉化方案)至巴斯德畢赤酵母中之前,采用Bsu36I限制性酶將質粒線性化。在含有50μg/mL博來霉素(Zeocin)的YPD板(每升:10g酵母提取物、20g蛋白胨、20g葡萄糖、20g瓊脂-瓊脂)上實施陽性轉化體的篩選。使用菌落PCR(Colony PCR)來確保轉化的質粒的存在。因此,通過將巴斯德畢赤酵母菌落蒸煮(cook)和冷凍各5分鐘獲得基因組DNA,并將其直接用于采用適當引物的PCR。

表3示出了HyHEL LC和HC以及SDZ LC和HC的PCR擴增的寡核苷酸引物(α-交配因子_上游是所有Fab鏈的擴增的上游引物)。

表3

實施例2 恒化器(chemostat)培養用最大工作容積為1.0L的1.4LDASGIP反應器(Eppendorf,德國)實施培養。

采用了如下培養基:

PTM1痕量鹽儲備溶液(每升)含有:6.0g CuSO4·5H2O、0.08g NaI、3.36g MnSO4·H2O、0.2g Na2MoO4·2H2O、0.02g H3BO3、0.82g CoCl2、20.0g ZnCl2、65.0g FeSO4·7H2O和5.0mL H2SO4(95%-98%)。

甘油分批培養基(每升)含有:2g檸檬酸一水合物(C6H8O7·H2O)、39.2g甘油、20.8g NH4H2PO4、0.5g MgSO4·7H2O、1.6g KCl、0.022g CaCl2·2H2O、0.8mg生物素和4.6mL PTM1痕量鹽儲備溶液。加入HCl以將pH設定至5。

葡萄糖恒化器培養基(每升)含有:2.5g檸檬酸一水合物(C6H8O7·H2O)、55.0g葡萄糖一水合物、21.8g NH4H2PO4、1.0g MgSO4·7H2O、2.5g KCl、0.04g CaCl2·2H2O、4.0mg生物素和2.43mL PTM1痕量鹽儲備溶液。加入HCl以將pH設定至5。

甲醇/甘油恒化器培養基(每升)含有:2.5g檸檬酸一水合物(C6H8O7·H2O)、8.5g甲醇、50.0g甘油、21.8g NH4H2PO4、1.0g MgSO4·7H2O、2.5g KCl、0.04g CaCl2·2H2O、4.0mg生物素和2.43mL PTM1痕量鹽儲備溶液。加入HCl以將pH設定至5。

通過攪拌器速度(400-1200rpm)和通氣率(12-72標準升/小時(sL/h))空氣將溶解氧控制在DO=20%,將溫度控制在25℃和通過NH4OH(25%)的添加來控制pH設定值為5。根據需要通過消泡劑(5%Glanapon 2000)的添加來控制起泡。

為了開始培養,將0.4L的分批培養基無菌過濾并轉移到無菌工作臺下的發酵罐中,并以1的起始光密度(OD600)接種(從在含有50μg/mL博來霉素(Zeocin)的、180rpm、28℃的YPG的巴斯德畢赤酵母過夜預先培養物中)。約24h的分批階段達到了約20g/L的干生物質濃度,然后用恒化器培養基以40mL/h(μ=D=0.1/h)恒定進料,同時恒定地移除培養物以保持總體積恒定。在7次停留時間(70小時)后達到約25g/L的干生物質濃度,此時取用于微陣列實驗的樣品并終止培養。對每種生產菌株(采用葡萄糖恒化器培養基的CBS7435pGAP HyHEL-Fab和采用甲醇/甘油恒化器培養基的CBS7435mutS pAOX HyHEL-Fab)和非生產性野生型對照菌株(分別為CBS7435pGAP對照和CBS7435mutS pAOX對照)實施該恒化器培養三次,從而獲得可靠的微陣列分析所需的生物學復制品。

在恒化器的穩態條件下約70小時后取樣。在每一培養過程中進行常規取樣作為光密度或酵母干質量的測定,定性顯微鏡檢查和細胞活力分析。對于微陣列分析,按照如下取樣并處理:為了最佳淬滅,將9mL細胞培養液(broth)立即與4.5mL冰冷的5%苯酚(Sigma)溶液(在無水乙醇中)混合,并等分。將每2mL在預冷卻的收集管(GE healthcare,NJ)中離心(13,200rpm 1分鐘),完全移除上清液并將含有細胞沉淀的試管保存在-80℃直至RNA分離。

實施例3 轉錄組實驗的微陣列&數據評估

a)RNA分離及用于微陣列雜交的樣品制備

采用TRI試劑,根據供應商的說明(Ambion,US),自恒化器樣品細胞中分離RNA。將細胞沉淀物重懸浮于TRI試劑中并采用FastPrep 24(M.P.Biomedicals,CA)以5m s-1用玻璃珠勻化40秒。添加氯仿后,離心樣品,并通過加入異丙醇從水相中沉淀出總RNA。將團塊用70%乙醇洗滌,干燥并重懸浮于無RNA酶的水中。通過使用Nanodrop 1000分光光度計(NanoDrop products,DE)測量OD260來測定RNA濃度。使用無DNA試劑盒(Ambion,CA)從樣品中移除剩余的DNA。將等于10μg RNA的樣品體積在無RNA酶的水中稀釋至50μL,然后加入DNA酶緩沖液I和rDNA酶I,并在37℃下溫育30分鐘。在加入DNA酶滅活試劑后,將樣品離心并將上清液轉移至新的試管中。如上所述再次測定RNA濃度。此外,采用RNA納米芯片(Agilent)分析RNA的完整性。為了監測從擴增和標記到樣品雜交的微陣列工作流程,使用Spike In Kit(Agilent,產品編號:5188-5279)作為陽性對照。它包含來自腺病毒的10種不同的聚腺苷酸化轉錄物,這些聚腺苷酸化轉錄物與自身RNA樣品一起擴增、標記和共雜交。采用Quick Amp標記試劑盒(Agilent,產品編號5190-0444)用Cy 3和Cy 5標記樣品。因此,將500ng純化的樣品RNA在8.3μL無RNA酶的水中稀釋,加入2μL Spike A或B和1.2μL T7啟動子引物。將混合物在65℃下變性10分鐘,并在冰上保持5分鐘。然后加入8.5μL cDNA mastermix(每個樣品:4μL 5×第一鏈緩沖液、2μL 0.1M DTT、1μL 10mM dNTP mix、1μL MMLV-RT、0.5μL RNA酶out),在40℃下溫育2小時,然后轉移至65℃溫育15分鐘,并置于冰上5分鐘。制備轉錄mastermix(每個樣品:15.3μL無核酸酶水、20μL轉錄緩沖液、6μL 0.1M DTT、6.4μL 50%PEG,0.5μL RNA酶抑制劑、0.6μL無機磷酸酶、0.8μL T7RNA聚合酶、2.4μL花青素苷3或花青素苷5)并將其加至每一試管中,然后在40℃下溫育2小時。為了純化獲得的被標記cRNA,采用RNeasy Mini試劑盒(Qiagen,貨號74104)。在-80℃下保存樣品。在Nanodrop分光光度計上進行cRNA濃度和標記效率的定量。

b)微陣列分析

將基因表達雜交試劑盒(Agilent,貨號5188-5242)用于被標記樣品cRNA的雜交。為了制備雜交樣品,用無核酸酶水將每300ng cRNA(Cy3和Cy5)和6μL 10倍封閉劑稀釋至最終體積為24μL。加入1μL 25倍片段化緩沖液(fragmentation buffer)后,將混合物在60℃下溫育30分鐘。然后加入25μL GEx雜交緩沖液HI-RPM來停止反應。采用13,200rpm離心1分鐘后,將樣品在冰上冷卻并立即用于雜交。使用內部設計的巴斯德畢赤酵母特異性寡核苷酸陣列(AMAD-ID:034821,8x15K定制陣列,Agilent)。根據微陣列雜交腔室用戶指南(Agilent G2534A)進行微陣列雜交。首先,將襯墊載玻片(gasket slide)打開并放在腔室底座上,Agilent標簽面朝上。將樣品(每個陣列40μL)裝載在8個方格中的每一個的中間。然后將微陣列載玻片仔細放置到襯墊載玻片上(Agilent標簽面朝下)并放上腔室蓋然后用夾具固定。所有樣品以染料交換方式與參考池樣品雜交。所述池RNA樣品是通過將來自各種培養物的RNA等量混合產生的。在雜交爐中于65℃下雜交17小時。掃描前,洗滌微陣列芯片。因此,將腔室拆開,并將夾心載玻片(sandwich slide)彼此分離,同時浸沒在洗滌緩沖液1中。將微陣列直接轉移到另一個具有洗滌緩沖液1的器皿中,洗滌1分鐘,轉移到洗滌緩沖液2(溫度至少30℃)中并再洗滌1分鐘。通過用紙巾接觸載玻片邊緣使微陣列載玻片干燥后,將其放入載玻片保持器(Agilent,標簽面朝上)中。將載玻片保持器放入轉盤(carousel)中并開始掃描。

c)微陣列數據的數據采集和統計評價

使用G2565AA微陣列掃描儀(Agilent)以50nm的分辨率掃描圖像,并將這些圖像導入Agilent Feature Extraction 9.5軟件。Agilent Feature Extraction 9.5用于定量點強度。然后將原始平均點強度數據導入開源軟件R中,用于進一步標準化和數據分析。

在計算差異表達值之前,將強度數據進行標準化(無背景校正,采用載玻片內標準化方法Loess和載玻片間標準化方法Aquantile)。使用線性模型擬合(limma R package)來計算與差異表達值相關聯的p值,隨后使用Benjamini和Yekutieli的方法(limma R package的BY方法)針對多重檢驗調整p值。對于HyHEL-Fab生產菌株與其各自對照相比,計算Log2倍的變化。

瀏覽微陣列數據以獲得產生HyHEL-Fab的CBS7435和其非生產性宿主對照的一式三份的恒化組之間的表達水平(倍數改變>1.5)上的顯著差異(調整的p值<0.05)。

表4顯示了來自生產HyHEL-Fab的巴斯德畢赤酵母的微陣列分析的上調基因。

表4

實施例4 過表達鑒定的基因的菌株的產生

為了研究對Fab分泌的陽性效應,在兩種不同的Fab生產菌株中過表達所鑒定的基因:CBS7435pPM2d_pAOX HyHEL,其是微陣列數據的來源(參見實施例3)和CBS7435pPM2d_pAOX SDZ(產生參見實施例1)。

a)所鑒定的潛在分泌輔助基因的擴增和向pPM2aK21表達載體中的克隆

采用示于表5的引物,通過PCR(Phusion Polymerase,New England Biolabs)從起始到終止密碼子擴增在實施例3中鑒定的基因。將序列克隆至具有兩個限制性酶SbfI和SfiI的pPM2aK21表達載體的MCS中。pPM2aK21是pPM2d(描述于實施例1a)的衍生物,其包含AOX終止子序列(用于整合入天然AOX終止子基因座)、大腸桿菌的復制起點(pUC19)、用于大腸桿菌和酵母中選擇的抗生素抗性盒(kanMX,賦予對卡那霉素和G418的抗性)、用于目標基因(GOI)的表達盒,其由GAP啟動子、多克隆位點(MCS)和釀酒酵母CYC1轉錄終止子組成。通過Sanger測序驗證基因序列。

表5

b)鑒定的基因在巴斯德畢赤酵母Fab生產菌株中的共-過表達

將巴斯德畢赤酵母Fab過生產菌株CBS7435mutS pAOX HyHEL-Fab和CBS7435mutSpAOX SDZ-Fab用作宿主菌株以進行在實施例3中鑒定的和在實施例4a中克隆的基因的共-過表達。在轉化至Fab生產菌株之前,所述含有在實施例3中鑒定的分泌輔助基因的pPM2aK21載體在AOX終止子序列中用限制性酶AscI線性化。在含有G418的YPD瓊脂平板上選擇陽性轉化體。

實施例5 Fab表達的篩選

在小規模篩選中,與非工程化的親本宿主相比,測試每個分泌輔助基因的8至12個轉化體,并基于它們對細胞生長、Fab效價和Fab產量的影響進行排名。在所有測試的克隆中,發現PP7435_Chr3-0933、PP7435_Chr2-0220、PP7435_Chr3-0639、PP7435_Chr1-1232、PP7435_Chr1-1225、PP7435_Chr3-0607、PP7435_Chr4-0448、PP7435_Chr4-0108、PP7435_Chr1-0667顯示最好的結果(使Fab效價或Fab產量增加至少1.2倍)。

在實施例7中,之后將所有這些克隆(除了PP7435_Chr1-0667)在生物反應器中培養以驗證在受控生產過程中菌株的改進。

a)巴斯德畢赤酵母Fab生產菌株的小規模培養

將巴斯德畢赤酵母菌株的單一菌落接種于2mL含有10g/L甘油和50μg/mL博來霉素(Zeocin)的YP-培養基(10g/L酵母提取物,20g/L蛋白胨),并在25℃下生長過夜。將這些培養物的等分試樣(對應于終OD600為2.0)轉移到2mL補充有20g/L葡萄糖和葡萄糖飼料片(Kuhner,Switzerland;CAT#SMFB63319)的合成篩選培養基M2(在下面給出該培養基的組成)中,并于25℃下,以170rpm在24深孔板中溫育25小時。通過離心洗滌培養物一次,然后將沉淀重懸于合成篩選培養基M2中,將等分試樣(對應于終OD600為4.0)轉移到新鮮24深孔板中的2mL合成篩選培養基M2中。每12小時重復加入甲醇(5g/L)共48小時,然后在室溫下以2500xg離心10分鐘而收獲細胞并準備用于分析。通過測量1mL細胞懸浮液的細胞重量來測定生物質,而在上清液中重組分泌蛋白的測定在以下實施例5b-6c中描述。

每升合成篩選培養基M2含有:22.0g檸檬酸一水合物、3.15g(NH4)2PO4、0.49g MgSO4*7H2O、0.80g KCl、0.0268g CaCl2*2H2O、1.47mL PTM1痕量金屬、4mg生物素;用KOH(固體)將pH設定至5。

b)SDS-PAGE&蛋白質印跡分析

采用Bis-Tris系統進行蛋白質凝膠分析,其使用12%Bis-Tris或4-12%Bis-Tris凝膠和MOPS運行緩沖液(均來自Invitrogen)。電泳后,蛋白質或是通過銀染色而顯色,或是被轉移至硝酸纖維素膜用于蛋白質印跡分析。因此,采用用于濕(槽(tank))轉移的XCell IITM印跡模塊(Invitrogen),根據制造商的說明,將蛋白質電印跡至硝酸纖維素膜上。在封閉后,用以下抗體探測蛋白質印跡:對于Fab輕鏈:抗-人κ輕鏈(結合的和游離的)-堿性磷酸酶(AP)綴合的抗體,Sigma A3813(1:5,000);對于Fab重鏈:以1:1,000稀釋的小鼠抗人IgG抗體(Ab7497,Abcam)和以1:5,000稀釋的在山羊中產生的抗小鼠IgG(Fc特異性)-堿性磷酸酶抗體(A1418,Sigma)作為第二抗體。

基于用于AP-綴合物的NBT/BCIP系統或用于HRP綴合物的化學發光Super Signal West Chemiluminescent Substrate(Thermo Scientific),使用比色AP檢測試劑盒(BioRad)進行檢測。

c)通過ELISA的Fab的定量

采用抗-人IgG抗體(ab7497,Abcam)作為包被抗體和山羊抗-人IgG(Fc特異性)-堿性磷酸酶綴合的抗體(Sigma A8542)作為檢測抗體,通過ELISA進行完整Fab的定量。人Fab/κ、IgG片段(Bethyl P80-115)用作標準品,起始濃度為100ng/mL,相應地稀釋上清液樣品。用pNPP(Sigma S0942)進行檢測。包被-、稀釋-和洗滌緩沖液是基于PBS(2mM KH2PO4、10mM Na2HPO4.2H2O、2.7mM g KCl、8mM NaCl,pH 7.4)的,并相應地用BSA(1%(w/v))和/或吐溫20(0.1%(v/v))來完成。

實施例6 低表達所選擇的鑒定的基因的菌株的產生

一些在實施例3中鑒定的基因在生產HyHEL-Fab的巴斯德畢赤酵母宿主菌株中過表達時導致了較少分泌的Fab(實施例4和5中)。這些基因中的兩個編碼伴侶蛋白,即胞質伴侶蛋白PP7435_Chr3-1062(KO2)和ER-定位的伴侶蛋白PP7435_Chr1-0176(KO3)。由于通常認為伴侶蛋白具有表達/分泌增強作用,因此,上述這一發現是非常令人驚奇的。令發明人驚奇的是,PP7435_Chr1-0176的過表達是不利的,其使Fab的效價和產量降低至小于親本非工程化的HyHEL-Fab或SDZ-Fab生產菌株的80%。PP7435_Chr3-1062的過表達也使HyHEL Fab的效價和產量降低至小于親本非工程化菌株的80%。因此,在兩種宿主菌株中,這些基因(PP7435_Chr1-0176/SCJ1、PP7435_Chr3-1062/HCH1)被破壞。在轉錄組學實驗(實施例3)中發現許多絮凝相關基因被強烈下調(倍數變化<0.66)之后,另外選擇絮凝轉錄因子PP7435_Chr4-0252/FLO8作為敲除靶標。

將巴斯德畢赤酵母Fab過生產菌株CBS7435mutS pAOX HyHEL-Fab和CBS7435mutSpAOX SDZ-Fab用作宿主菌株。按照Heiss等(2013)[Appl Microbiol Biotechnol.97(3):1241-9.]所描述的,采用分裂標記盒方法來產生具有被破壞基因座的轉化體。使用能夠在G418上生長的轉化體的基因組DNA和在破壞盒外的引物(表6),通過PCR進行陽性敲除菌株的驗證。

表6列出了所有用于敲除盒(每個敲除靶標2個重疊的分裂標記盒)的構建的引物:通過PCR(Phusion聚合酶,New England Biolabs),將引物對A_正向/A_反向、B_正向/B_反向、C_正向/C_反向、D_正向/D_反向用于擴增片段A、B、C和D。片段A從巴斯德畢赤酵母基因組DNA擴增,在相應ATG(靶基因的)的5起始(prime)方向上的1700bp開始,直到ATG的5起始方向的200bp。片段D從巴斯德畢赤酵母基因組DNA擴增,在相應ATG(靶基因的)的3起始方向上的200bp開始,直到ATG的3起始方向的1700bp。片段B由KanMX選擇標記盒的前三分之二組成,并從pPM2aK21載體DNA模板中擴增。片段B由KanMX選擇標記盒的后三分之二組成,并從pPM2aK21載體DNA模板中擴增。采用引物A_正向和B_反向通過重疊PCR使片段A和B退火在一起(AB)。采用引物C_正向和D_反向通過重疊PCR使片段C和D退火在一起(CD)。為了產生敲除菌株,用總共0.5μg的片段AB和CD的DNA轉化生產Fab的宿主菌株,其中片段AB和CD也是重疊的。在含有500μg/mL G418的YPD瓊脂平板上選擇細胞。通過PCR,采用引物對檢驗(check)_正向(在靠近引物序列A_正向的5起始區域上結合)和檢驗_反向(在靠近引物序列D_反向的3起始區域上結合)驗證陽性敲除克隆。由于用KanMX盒替代了400bp區域(ATG周圍),陽性敲除菌株的PCR產物條帶(band)比野生型序列的PCR產物條帶大。

表6

實施例7 進料分批培養

在進料分批生物反應器培養中分析在小規模培養中具有最佳性能(使模型蛋白的產量增加了至少1.2倍改變)的實施例5和6的輔助因子工程化菌株,用于驗證生產宿主菌株的改進。使用了兩種方案。

a)進料分批方案A

在具有1.0L的最大工作體積的1.4L DASGIP反應器(Eppendorf,Germany)中進行進料分批。培養溫度控制在25℃,通過25%的氫氧化銨的添加將pH控制在5.0,通過控制攪拌器速度在400至1200rpm之間和空氣流量在24至72sL/h之間將溶解氧濃度維持在20%飽和度以上。

將用于進料分批培養的接種物在含有100mL的YP培養基的搖瓶中培養,并在28℃和108rpm下溫育約24小時,所述YP培養基含有20g/L甘油和50μg/mL博來霉素(Zeocin)。將培養物用于接種生物反應器中0.4L的起始體積至1.0的起始光密度(600nm)。在約24小時后完成分批,并給出第一(10mL)鹽液(salt shot)。

然后將甘油進料分批溶液以5mL/h的恒定速率進料5小時。然后,向培養物中給予甲醇脈沖(2g)和鹽液(10mL)。在通過培養物中溶解氧濃度的增加指示甲醇脈沖消耗后,以1.0g/h的進料速率開始用甲醇進料分批溶液的恒定進料。每10g新形成的生物質給出10mL的鹽液,其對應于~43g甲醇進料培養基。隨著生物質濃度的增加,當短時間關閉甲醇進料時培養物中溶解氧突然增加而導致甲醇累計能夠被消除時,甲醇進料速率適當地增加。最終甲醇進料速度為2.5g/h。

經常采集樣品用于生物質的測定和Fab的定量(如實施例6中所述)。在約100小時后,當細胞密度達到大于100g/L細胞干重時收獲培養物。

培養基如下:

分批培養基(每升)含有:2g檸檬酸、12.4g(NH4)2HPO4、0.022g CaCl2·2H2O、0.9g KCl、0.5g MgSO4·7H2O、40g甘油、4.6mL PTM1痕量鹽儲備溶液。用25%的HCl將pH設定至5。

甘油進料分批溶液(每升)含有:623g甘油、12mL PTM1痕量鹽儲備溶液和40mg生物素。PTM1的組成在實施例1中給出。

純甲醇的甲醇進料分批溶液(每升)含有:12mL PTM1痕量鹽儲備溶液和40mg生物素。

鹽液溶液(每升)含有:20.8g MgSO4·7H2O、41.6KCl、1.04g CaCl2·2H2O

b)進料分批方案B

將相應的菌株接種到裝有50mL YPhyG的寬頸、帶擋板(baffled)、有蓋的300mL振蕩搖瓶中,并在28℃下以110rpm振蕩過夜(預培養物1)。從預培養物1中以OD600(在600nm處測量的光密度)在下午晚些時候(倍增時間:約2小時)達到約20(針對YPhyG培養基測量)的方式接種預培養物2(寬頸、帶擋板、有蓋的1000mL振蕩搖瓶中的100mL YPhyG)。預培養物2的溫育也在28℃,110rpm下進行。

進料分批在1.0L工作體積的生物反應器(Minifors,Infors,Switzerland)中進行。將所有生物反應器(裝有400mL pH約為5.5的BSM-培養基)從預培養2分別接種至OD600為2.0。一般而言,巴斯德畢赤酵母在甘油上生長以產生生物質,并且所述培養物隨后經受甘油進料,隨后是甲醇進料。

在初始分批階段,將溫度設定為28℃。在開始生產階段之前的最后一小時期間,將其降至25℃并在整個剩余過程中保持在該水平,同時pH降至5.0并保持在該水平。將整個過程(級聯控制:攪拌器,流量,氧補充)的氧飽和度設定為30%。以700至1200rpm施加攪拌并選擇1.0-2.0L/min的流量范圍(空氣)。使用25%銨實現pH在5.0的控制。根據需要通過加入消泡劑Glanapon 2000控制發泡。

在分批階段,生成生物質(μ~0.30/h)直至約110-120g/L的濕細胞重量(WCW)。經典的分批階段(生物質產生)將持續約14小時。在11小時后開始以6g/(L*h)的恒定甘油進料,并持續5小時。第一取樣點選為16小時(在下文中稱為誘導時間的“0小時”)。

在約95小時的時間內供應總共290g的甲醇(其具有由方程1+0.04*t(g/L)定義的線性增加的進料速率)。

采用以下程序,在多個時間點取樣:將取樣的培養液(broth)的第一個3mL(用注射器)棄去。將1mL的新鮮采集樣品(3-5mL)轉移至1.5mL離心管中,并在13,200rpm(16,100g)下旋轉5分鐘。將上清液迅速轉移至一個單獨的小瓶中。

將1mL的培養液在稱量去皮的Eppendorf小瓶中以13,200rpm(16,100g)離心5分鐘,然后將所得的上清液準確地移除。將小瓶稱重(精確度0.1mg),并減去空瓶的皮重以獲得濕細胞重量。

培養基如下:

YPhyG預培養基(每升)含有:20g植物蛋白胨、10g細菌酵母提取物、20g甘油

分批培養基:修飾的基礎鹽培養基(BSM)(每升)含有:13.5mL H3PO4(85%)、0.5g CaCl·2H2O、7.5g MgSO4·7H2O、9g K2SO4、2g KOH、40g甘油、0.25g NaCl、4.35mL PTM1、8.7mg生物素、0.1mL Glanapon 2000(消泡劑)

進料-溶液甘油(每kg)含有:600g甘油、12mL PTM1

進料-溶液甲醇含有:純甲醇。

c)結果

表7列出了一些基因,與未工程化Fab生產對照菌株相比,這些基因的過表達顯示出增加在進料分批生產過程中的巴斯德畢赤酵母中的Fab分泌。所述Fab產物效價通過ELISA定量(實施例5c)。生物質被測定為濕細胞重量或干細胞重量。產物效價和產量的改變以相對于相應對照菌株的倍數改變值表示。相對于平行地生長和取樣的用于直接比較的AOX HyHEL和AOX SDZ親本宿主,進料分批生產過程的倍數改變值表明了效價和產物產量的改善。

表7

如上所示,所有所列的基因在過表達后都成功地使模型蛋白SDZ-Fab或HyHEL-Fab的產量(mg/生物質)增加了至少20%(倍數改變>1.2)。

表8列出了一些基因,與未工程化Fab生產對照菌株相比,這些基因的缺失顯示出增加在進料分批生產過程中的巴斯德畢赤酵母中的Fab分泌。所述Fab產物通過ELISA定量(實施例5c)。產物效價和產量的改變以相對于相應對照菌株的倍數改變值表示。

表8

如上所示,所有所列的基因在低表達時能夠使模型蛋白SDZ-Fab或HyHEL-Fab的Fab效價(mg/L)或Fab生產(mg/生物質)的產量增加至少28%(倍數改變>1.28)。

實施例8:HP和HP與KO蛋白的組合

對于過表達靶標的組合,使用在組成型pGAP啟動子(如實施例4a和b中描述的方法產生)控制下的過表達HP3(‘3’)或HP10(‘34’)的CBS7435mutS pAOX SDZ-Fab菌株。對于過表達與低表達靶標的組合,使用具有破壞的KO1基因座的CBS7435mutS pAOX SDZ-Fab菌株(在實施例6中描述)。在所有這些菌株中,編碼模型蛋白SDZ-Fab的質粒基于博來霉素(Zeocin)作為選擇標記,而共表達HP的質粒或盒用于攜帶兩側為共定向loxP識別位點的KanMX抗性盒的KO基因座的破壞。

在用另外的HP或KO盒轉化之前,Cre重組酶再循環標記基因表達盒(KanMX–兩側為loxP位點)。因此,用附加型pTAC_Cre_HphMX4質粒轉化背景菌株,該附加型pTAC_Cre_HphMX4質粒在釀酒酵母TPI啟動子的控制下表達Cre重組酶,并且只要培養基中存在潮霉素(Hyg)的選擇壓力,該質粒就短暫地保持在巴斯德畢赤酵母中。在28℃下,將轉化體在YPD/Zeo/Hyg瓊脂平板上生長2天,然后在選擇性瓊脂平板上復印平板并在28℃下再生長2天。僅選擇那些在2-3涂板輪次后喪失了在G418和Hyg上生長的能力的克隆用于24深孔板(DWP)篩選(在實施例5a中描述)。按照實施例5c中的描述測定Fab的效價和產量。用另一過表達HP蛋白(在實施例4a和b中描述)的質粒轉化Fab產量和/或效價最佳的菌株。在選擇性瓊脂平板(含有Zeo和G418)上選擇具有兩個組合的HP或KO的轉化體,并按照實施例5中的描述篩選Fab分泌。對于進一步的組合步驟,重復上述程序,從而得到具有三種組合等等的菌株。在所有篩選實驗中,親本(=前)菌株用作參照。

結果如下—表9:

“起源菌株”是指相應地無HP或無敲除的巴斯德畢赤酵母菌株pAOX-SDZ-Fab#9。

“親本菌株”是指表達SDZ-Fab的巴斯德畢赤酵母菌株,其作為宿主菌株用于分別用下一HP或KO的轉化(例如,僅過表達HP3的菌株用于HP3和HP1的組合、過表達HP2的具有KO1敲除的菌株用于KO1HP2與HP3或HP1的組合)。可以看出,無論是與起源菌株相比還是與親本菌株相比,每一組合都導致了模型蛋白SDZ-Fab的Fab效價的增加。與親本菌株相比,Fab效價的增加表明HP或HP和KO蛋白的組合甚至可以進一步提高由模型蛋白SDZ-Fab例示的POI的產量。

序列表

<110> 貝林格爾·英格海姆RCV兩合公司

山德士股份公司

VTU技術股份有限公司

隆薩有限公司

<120> 被工程化為過表達輔助蛋白的重組宿主細胞

<130> LC16310017P

<150> EP14165186.9

<151> 2014-04-17

<160> 163

<170> PatentIn version 3.5

<210> 1

<211> 95

<212> PRT

<213> 巴斯德畢赤酵母

<400> 1

Met Leu Asn Lys Leu Phe Ile Ala Ile Leu Ile Val Ile Thr Ala Val

1 5 10 15

Ile Gly Glu Thr Thr Thr Ser Ser Thr Thr Ala Ser Leu Ser Glu Ser

20 25 30

Pro Thr Leu Val Trp Val Thr Gly Thr Asp Ala Ser Gly Arg Leu Ala

35 40 45

Thr Thr Gln Ser Ala Tyr Thr Gln Gln Phe Ser Gln Leu Tyr Ser Ser

50 55 60

Ile Ala Ser Pro Ser Ser Gly Ser Ile Gly Leu Gly Thr Ile Gln Gly

65 70 75 80

Thr Val Gly Ile Val Arg Thr Tyr Glu Thr Ile Thr Leu Ala Ser

85 90 95

<210> 2

<211> 86

<212> PRT

<213> 巴斯德畢赤酵母

<400> 2

Met Ser Thr Ala Ile Pro Gly Gly Gln Arg Thr Leu Ala Lys Arg Arg

1 5 10 15

Ala Ala Asn Leu Asp Lys Lys Gln Asp Glu Pro Thr Ser Ala Arg Ser

20 25 30

Ala Gly Ala Gly Gly Ser Ser Ser Thr Met Leu Lys Leu Tyr Thr Asp

35 40 45

Glu Ala Gln Gly Leu Lys Val Asp Pro Leu Ile Val Leu Val Leu Ala

50 55 60

Val Gly Phe Ile Phe Ser Val Ile Gly Leu His Val Val Ala Lys Leu

65 70 75 80

Thr Gly Lys Leu Ile Asn

85

<210> 3

<211> 361

<212> PRT

<213> 巴斯德畢赤酵母

<400> 3

Met Thr Pro Arg Ser His Ile Phe Phe Asp Ile Ser Ile Asn Asn Gln

1 5 10 15

Pro Ala Gly Arg Ile Ile Phe Glu Leu Phe Asn Asp Ile Val Pro Lys

20 25 30

Thr Ala Glu Asn Phe Arg Ala Leu Ser Thr Gly Glu Lys Gly Ile Gly

35 40 45

Lys Ser Gly Lys Pro Leu His Tyr Lys Gly Ser Thr Phe His Arg Ile

50 55 60

Ile Lys Asp Phe Met Val Gln Gly Gly Asp Phe Thr Asn Gly Asn Gly

65 70 75 80

Thr Gly Gly Glu Ser Ile Tyr Gly Glu Lys Phe Glu Asp Glu Asn Phe

85 90 95

Gln Leu Thr His Asp Lys Pro Phe Leu Leu Ser Met Ala Asn Ala Gly

100 105 110

Pro Gly Thr Asn Gly Ser Gln Phe Phe Ile Thr Thr Val Pro Thr Pro

115 120 125

His Leu Asp Asn Lys His Val Val Phe Gly Lys Val Ile Ala Gly Lys

130 135 140

Ala Thr Val Arg Lys Ile Glu Arg Asn Ser Glu Gly Glu Ala Pro Ile

145 150 155 160

Glu Pro Val Val Ile Glu Asp Cys Gly Glu Leu Pro Glu Asp Ala Asp

165 170 175

Leu Thr Ile Ser Asp Glu Thr Gly Asp Lys Tyr Glu Glu Val Leu Lys

180 185 190

Asp Asn Glu Asn Ile Asp Ile Asp Asp Phe Glu Gln Val Tyr Gln Ala

195 200 205

Ile Thr Glu Ile Lys Glu Leu Gly Thr Lys Tyr Phe Lys Asn Gly Asp

210 215 220

Thr Lys Ile Ala Phe Glu Lys Tyr Gln Lys Ala Ala Asn Tyr Leu Leu

225 230 235 240

Glu Tyr Ile Pro Ser Asp Leu Ser Glu Glu Gln Ser Ser Lys Leu Glu

245 250 255

Leu Leu Lys Thr Ser Val Phe Ser Asn Val Ala Leu Ala Gly Leu Lys

260 265 270

Val Ser Lys Phe Lys Asp Thr Ile Lys Tyr Ala Thr Leu Val Ile Glu

275 280 285

Asp Glu Ser Ala Asp Ala Lys Ala Lys Ser Lys Gly Tyr Tyr Arg Arg

290 295 300

Gly Ser Ala Tyr Ser Ser Leu Lys Asp Glu Asp Ser Ala Ile Ser Asp

305 310 315 320

Phe Gln Lys Ala Leu Glu Leu Ser Pro Gly Asp Pro Ala Ile Ser Gln

325 330 335

Ser Leu Gln Arg Thr Thr Lys Ala Arg Lys Asp Arg Leu Ala Lys Glu

340 345 350

Lys Ala Ala Leu Ser Lys Phe Phe Glu

355 360

<210> 4

<211> 274

<212> PRT

<213> 巴斯德畢赤酵母

<400> 4

Met Ser Ser Asp Ala Val Glu Gln Leu Glu Asn Phe Gln Leu Ile Lys

1 5 10 15

Phe Asp Arg Phe Asp Pro Ser Thr Gln Ser Thr Ile Arg Ile Ala Arg

20 25 30

Ser Pro Lys Pro Ile Pro Val Lys Val Val Ile Val Gly Asp Gly Gly

35 40 45

Cys Gly Lys Thr Cys Leu Leu Asn Val Phe Ala Thr Gly Thr Phe Pro

50 55 60

Glu Ala Tyr Val Pro Thr Ile Ile Glu Asn Val Val Ile Thr Leu Val

65 70 75 80

Thr Pro Thr Gly Gln Ile Ala Ala Val Thr Leu Trp Asp Thr Ala Gly

85 90 95

Gln Glu Glu Tyr Asp Arg Leu Arg Pro Leu Ser Tyr Ser Asp Val Asp

100 105 110

Val Val Leu Leu Cys Tyr Ser Ile Asp Asn Leu Ser Thr Phe His Asn

115 120 125

Val Ala Asp Lys Trp Tyr Pro Glu Val Ala His Phe Cys Pro Asn Thr

130 135 140

Pro Ile Ile Leu Val Gly Thr Lys Ser Asp Met Arg Arg His Gln Lys

145 150 155 160

Ser Gln Pro His Phe Val Ser Pro Gln Asp Ser Ser Gln Leu Ala Arg

165 170 175

Gln Met Gly Ala Val Met Asn Ile Glu Cys Ser Ala Lys Glu Val Ser

180 185 190

Asn Val Asn Ile Val Phe Asp Ala Ala Val Ser Tyr Cys Leu Ser Asn

195 200 205

Ser Arg Pro Lys Thr Arg Gly Asp Asn Asp Asn Asn Arg Ser Asn Arg

210 215 220

Arg Leu Ser Arg Ala Lys Arg Ala Ser Met Phe Ile Arg Gly Lys Asp

225 230 235 240

Val Ser Ser Thr Ser Gly Asn Ser Arg Glu Glu Leu Val Glu Tyr Asp

245 250 255

Gln Asp Gly Leu Ala Ile Ile Pro Asp Arg Lys Lys Arg Lys Cys Ser

260 265 270

Ile Ile

<210> 5

<211> 127

<212> PRT

<213> 巴斯德畢赤酵母

<400> 5

Met Thr Asn Trp Lys Ala Ile Leu Thr Pro Ala Gln Tyr Gln Val Leu

1 5 10 15

Arg Leu Gly Gly Thr Glu Arg Pro Tyr Thr Gly Gln Tyr Val Asn Phe

20 25 30

Lys Lys Asn Gly Thr Tyr Leu Cys Ser Gly Cys Gln Thr Pro Leu Tyr

35 40 45

Lys Ser Gly Thr Lys Phe Asp Ser Ser Cys Gly Trp Pro Ala Phe Tyr

50 55 60

Glu Ala Leu Pro Gly Ala Val Lys Arg Ile Glu Asp Asn Ser Leu Gly

65 70 75 80

Met Arg Arg Ile Glu Ile Arg Cys Ser Lys Cys Asp Gly His Leu Gly

85 90 95

His Val Phe Glu Gly Glu Gly Phe Asp Thr Pro Thr Asp Ser Arg His

100 105 110

Cys Val Asn Ser Ile Ser Leu Lys Phe Gln Gly Glu Glu Glu Asn

115 120 125

<210> 6

<211> 1027

<212> PRT

<213> 巴斯德畢赤酵母

<400> 6

Met Thr Thr Asn Gly Gln Lys Arg Gln Lys Thr Arg Lys Pro Leu Leu

1 5 10 15

Ile Asn Ala Phe Val Met Gly Cys Ala Gly Leu Gln Asn Pro Gly Leu

20 25 30

Trp Lys His Pro Lys Asp Ser Ser His Arg Phe Asn Gln Ile Asp His

35 40 45

Trp Thr Tyr Leu Ala Lys Leu Ala Glu Lys Gly Lys Phe Asn Ala Leu

50 55 60

Phe Ile Ala Asp Val Leu Gly Gly Tyr Asp Val Tyr Lys Gly Pro Glu

65 70 75 80

Asn Leu Ala Thr Pro Ala Val Ala Gly Ala Gln Trp Pro Val Thr Glu

85 90 95

Pro Ser Ala Val Val Ser Ala Met Ala Ala Val Thr Thr Asn Leu Ala

100 105 110

Phe Gly Val Thr Phe Ser Thr Ile Ser Glu Ala Pro Tyr His Phe Ala

115 120 125

Arg Arg Leu Ser Thr Leu Asp His Leu Thr Lys Gly Arg Ile Gly Trp

130 135 140

Asn Val Val Ser Ser Tyr Leu Glu Ser Ala Ala Arg Asn Leu Leu Asn

145 150 155 160

Gly Glu Lys Leu Asp Glu His Asp Gln Arg Tyr Leu Lys Ala Glu Glu

165 170 175

Tyr Ile Gln Ile Val Tyr Glu Leu Leu Leu Ser Ser Trp Arg Asp Asp

180 185 190

Ala Val Val Leu Asp Lys Lys Ala Gly Val Tyr Thr Asp Pro Thr Arg

195 200 205

Phe Arg Lys Ile Asn Phe Glu Gly Lys Phe Phe Lys Val Pro Gly Pro

210 215 220

His Ile Val Asp Pro Thr Pro Gln Arg Leu Pro Val Ile Leu Gln Ala

225 230 235 240

Gly Thr Ser Lys Val Gly Lys Glu Phe Ala Ala Lys His Ala Glu Ile

245 250 255

Val Phe Val Ile Ser Phe Ser Pro Asp Asp Leu Lys Pro Lys Ile Ala

260 265 270

Glu Val Arg Gln Leu Ala Lys Glu Lys Phe Gly Arg Asn His Asp Asp

275 280 285

Ile Lys Phe Val Ala Leu Ala Thr Pro Val Ile Gly Ala Thr His Glu

290 295 300

Leu Ala Glu Glu Lys Tyr Gln Glu Leu Leu Ser Tyr Gly Asp Ile Glu

305 310 315 320

Gly Ala Gln Ala Leu Phe Gly Gly Trp Thr Gly Ile Asp Leu Ser Gln

325 330 335

Tyr Gly Glu Asp Glu Glu Leu Gly Asn Val Ser Ser Asn Ala Met Arg

340 345 350

Gly Ala Val Gln Asn Trp Thr Lys Ala Ile Pro Asn Glu Lys Arg Trp

355 360 365

Thr Arg Lys Val Ile Ala Lys Gln Ile Thr Val Gly Gly Leu Gly Pro

370 375 380

Ala Phe Val Gly Thr Pro Glu Glu Ile Ala Asp Glu Leu Glu His Trp

385 390 395 400

Ser Asp His Ala Gly Leu Asp Gly Phe Asn Phe Thr Tyr Ala Val Asn

405 410 415

Pro Leu Ser Phe Glu Glu Ile Val Glu Asp Leu Ile Pro Val Leu Gln

420 425 430

Arg Arg Gly Leu Ala Gln Lys Glu Tyr Pro Asn Pro Glu Thr Gly Ser

435 440 445

Thr Phe Arg Lys Asn Leu Phe Gly Thr Asp Phe Val Pro Ser Thr His

450 455 460

Pro Ala Tyr Asn Leu Arg Trp Arg Ala Gly Val Ser Lys Glu Glu Phe

465 470 475 480

Glu Lys Ser Leu Asn Ala Thr Thr Asn Trp Tyr Ser Ser Phe Ala Arg

485 490 495

Ser Gly Ala Leu Gly Glu Leu His Asn Thr Cys Arg Ile Leu Tyr Leu

500 505 510

Gln Ile Val Lys Tyr Lys Tyr Arg Leu Arg Val Arg Ser Glu Gly Asn

515 520 525

Ser Ile Pro Phe Ala Lys Met Thr Lys Glu Asn Glu Ala Lys Arg Gln

530 535 540

Lys Thr Ser Gln Pro Lys Ala Lys Lys Gln Leu Ile Ile Asn Ala Phe

545 550 555 560

Met Ser Gly Ser Ser Gly Asn Gln Ser Pro Gly Leu Trp Ser Tyr Pro

565 570 575

Gly Asp Lys Ser Thr Glu Tyr Thr Thr Leu Asp Tyr Trp Val Glu Leu

580 585 590

Ala Gln Lys Leu Glu Lys Ala Lys Phe His Ser Ile Phe Ile Ala Asp

595 600 605

Val Leu Gly Gly Tyr Asp Val Tyr Asn Gly Pro Gly Asn Tyr Ser Ala

610 615 620

Ala Ala Lys Ser Gly Ala Gln Phe Pro Met Ile Glu Pro Ser Ala Ala

625 630 635 640

Val Thr Ala Met Ala Ala Ala Thr Lys Ser Ile Thr Phe Gly Val Thr

645 650 655

Phe Ser Thr Ile Ser Glu Ala Pro Tyr His Phe Ala Arg Arg Leu Gly

660 665 670

Thr Leu Asp Leu Leu Thr Asn Gly Arg Val Gly Trp Asn Ile Val Ser

675 680 685

Ser Tyr Leu Asp Ser Ala Ala Arg Asn Leu Leu Asn Gly Glu Pro Leu

690 695 700

Pro Leu His Ala Asp Arg Tyr Lys Arg Ala Glu Glu Phe Leu Gln Val

705 710 715 720

Val Tyr Arg Leu Phe Leu Ser Ser Trp Arg Asp Asp Ala Tyr Lys Leu

725 730 735

Asp Lys Lys Thr Arg Thr Phe Ala Asp Pro Lys Leu Ile Arg Thr Ile

740 745 750

Asp His Val Gly Glu Phe Phe Asn Val Pro Gly Pro Gln Phe Leu Pro

755 760 765

Pro Thr Pro Gln Arg Leu Pro Leu Ile Leu Gln Ala Gly Thr Ser Lys

770 775 780

Val Gly Met Asp Tyr Ala Ala Lys His Ala Glu Val Val Phe Leu Ala

785 790 795 800

Ser Phe Asp Pro Glu Ser Leu Gln Glu Lys Ile Lys Thr Val Arg Asp

805 810 815

Ile Ala Glu Thr Lys Tyr Asn Arg Pro Arg Asp Ser Ile Lys Phe Leu

820 825 830

Ile Leu Ile Thr Val Val Ile Ala Asp Thr His Glu Asp Ala Val Lys

835 840 845

Arg Tyr Glu Asp Leu Ala Ser Tyr Ala Asp Leu Glu Gly Ala Gln Ala

850 855 860

Leu Phe Ser Gly Trp Thr Gly Ile Asp Ile Gly Lys Tyr Gly Glu Asp

865 870 875 880

Glu Pro Leu Glu His Val Glu Ser Asn Ala Ile Lys Ser His Val Lys

885 890 895

Asn Trp Thr Lys Phe Lys Asp Asn Lys Pro Arg Ala Arg Lys Asp Ile

900 905 910

Ala Lys Gln Ile Gly Val Gly Gly Ser Gly Pro Leu Leu Val Gly Ser

915 920 925

Val Gln Glu Ile Ala Asp Glu Leu Glu Arg Trp Ala Glu Val Ser Asp

930 935 940

Leu Asp Gly Phe Asn Phe Ala Tyr Ala Asp Tyr Pro Gln Thr Phe Asp

945 950 955 960

Asp Ile Ile Glu Lys Leu Leu Pro Glu Leu Asn Lys Arg Gly Val Phe

965 970 975

Trp Asp Asp Tyr Lys Ile Pro Gly Gly Thr Phe Arg Glu Ser Val Phe

980 985 990

Gly Arg Lys Phe Val Asp Lys Asp His Pro Ala Tyr Asp Leu Arg Trp

995 1000 1005

Arg Ser Asp Gln Thr Arg Glu Glu Phe Glu Lys Lys Leu Ala Glu

1010 1015 1020

Leu Glu Lys Lys

1025

<210> 7

<211> 546

<212> PRT

<213> 巴斯德畢赤酵母

<400> 7

Met Ser His Leu Leu Leu Arg Asp Ser Phe Trp Gly Arg Thr Ile Tyr

1 5 10 15

His Leu Ser Lys His Arg Tyr Phe Ser Phe Pro Glu Glu Lys Asp Gly

20 25 30

Phe Ile Ala Pro Glu Lys Tyr Tyr Leu Asn Met Asp Gln Val Ser Ile

35 40 45

His Ala Glu Ser Glu Lys Asn Ile Val Glu Gly Leu Val Asp Thr Ser

50 55 60

Asn Ser Ser Leu Glu Glu Val Lys Thr Thr Arg Val Ile Val Asp Trp

65 70 75 80

Asp Glu Tyr Asp Gln Lys Glu Asn Pro Gln Asn Trp Ser Ser Leu Leu

85 90 95

Lys Cys Phe Val Val Phe Glu Val Gly Ile Leu Thr Val Ala Val Tyr

100 105 110

Met Gly Ser Ala Ile Tyr Thr Pro Gly Ile Glu Asp Ile Met Arg Asp

115 120 125

Leu Asn Val Ser Arg Thr Val Ala Thr Leu Pro Leu Thr Leu Phe Val

130 135 140

Ile Gly Tyr Ala Val Gly Pro Met Ile Phe Ser Pro Met Ser Glu His

145 150 155 160

Pro Ala Ile Gly Arg Thr Thr Ile Tyr Val Trp Thr Leu Phe Ile Phe

165 170 175

Ala Ile Leu Gln Ile Pro Thr Ala Leu Thr Thr Asn Ile Ala Gly Phe

180 185 190

Cys Ile Leu Arg Phe Ile Gly Gly Phe Phe Ala Ser Pro Ala Leu Ala

195 200 205

Thr Gly Pro Ala Ser Val Gly Asp Val Ile Ala Ile Pro His Leu Pro

210 215 220

Val Gly Leu Gly Leu Trp Ser Ile Cys Ala Val Cys Gly Pro Ser Leu

225 230 235 240

Gly Pro Leu Phe Gly Ala Ile Phe Ser Gln Leu Val Ser Trp Arg Trp

245 250 255

Cys Phe Trp Phe Leu Leu Ile Thr Ser Gly Thr Leu Phe Ile Val Leu

260 265 270

Gly Phe Thr Leu Pro Glu Thr Tyr Val Pro Thr Leu Leu Tyr Arg Lys

275 280 285

Ala Arg Arg Leu Arg Ala Leu Thr Lys Asn Glu Leu Ile Ile Ser Lys

290 295 300

Gly Glu Leu Asp Ile Gln Asp Arg Thr Ala Lys Glu Val Leu Ile Glu

305 310 315 320

Cys Leu Trp Arg Pro Val Asp Ile Ser Phe Arg Asp Pro Val Val Leu

325 330 335

Met Ile Asn Leu Tyr Ile Ser Met Val Tyr Ser Ile Trp Tyr Ile Trp

340 345 350

Phe Glu Ala Phe Pro Ile Val Phe Leu Glu Ile Tyr Gly Phe Ser Leu

355 360 365

Ile Gly Met Gly Ala Ser Phe Ala Gly Ile Leu Ile Gly Val Leu Ile

370 375 380

Cys Ser Ala Cys Tyr Cys Tyr Ala Cys His Val Thr Phe Ala Arg Arg

385 390 395 400

Ile Ile Ala Asn Glu Thr Ile His Pro Glu Phe Phe Val Pro Gly Ala

405 410 415

Ile Ile Gly Gly Cys Ile Met Pro Thr Gly Ile Phe Ile Leu Gly Trp

420 425 430

Thr Ala Thr Lys Ser Val His Trp Ile Val Pro Ile Ile Gly Ser Gly

435 440 445

Leu Phe Ala Ala Gly Gly Tyr Leu Ile Phe Gln Thr Leu Phe Asn Tyr

450 455 460

Leu Ala Met Ser Phe Pro Arg Tyr Met Ala Ser Ala Phe Ala Gly Asn

465 470 475 480

Asp Leu Phe Arg Ser Phe Ser Ala Ser Val Phe Pro Leu Phe Gly His

485 490 495

Ala Leu Tyr Ala Asn Leu Gly Ser Glu Lys Phe Pro Val Gly Trp Gly

500 505 510

Ser Ser Val Leu Gly Phe Ile Thr Val Ala Met Ile Ala Ile Pro Val

515 520 525

Thr Phe Met Arg Tyr Gly Pro Arg Leu Arg Ala Asn Ser Arg Tyr Ala

530 535 540

Gly Pro

545

<210> 8

<211> 355

<212> PRT

<213> 巴斯德畢赤酵母

<400> 8

Met Thr Asp Tyr Val Thr Ser Lys Arg Pro Asp Asn Val Leu Asn Trp

1 5 10 15

Thr Ser Ile His Val Ser Ser Trp Ile Gly Glu Thr Ile Pro Glu Ile

20 25 30

Asp Pro Ser Leu Leu Gln Asn Phe Leu Glu His Asp Ile Ala Gly Asp

35 40 45

Val Leu Pro Tyr Leu Lys Ser Glu Asp Leu Lys Glu Ile Gly Ile Asn

50 55 60

Glu Leu Lys His Arg Ile Ser Ile Lys Lys Asn Ile His Glu Leu Leu

65 70 75 80

Val Ser Asn Glu Lys His Ile Asp Thr Ser Ile Leu Ser Asp Thr Ala

85 90 95

Thr Glu Leu Gly Thr Leu Ile Leu Thr Asn Lys Phe Ile Thr Gln Met

100 105 110

Ala Asn Arg Lys Asn Val Val Asp Asp Ser Thr His His Ser Asn Asn

115 120 125

Arg Arg Leu Thr Glu Gln Phe Asn Lys Leu Arg Lys Asp Leu Leu Pro

130 135 140

Ile Phe Lys Trp Ile Lys Glu Thr Gln Pro Leu Pro Thr Pro Glu Asn

145 150 155 160

Thr His Phe Ala Asn Met Gly Ser Val Pro Ala Ser Pro Val Glu His

165 170 175

Thr Ser Gly Glu Ser Thr Leu Ser Asn Pro Ser Leu Ser Thr Ile Asn

180 185 190

Ala Gly Glu Gly Val Asn Ser Ala Val Ala Gly Gln Ser Leu Gly Arg

195 200 205

Lys Pro Thr Leu Ser Ser Arg Arg Gln Ser His Ala Leu Ser Pro Thr

210 215 220

Gly Glu His Leu Asn Val Ser Ser Ser Ser Pro Ser Thr Gly Asn Phe

225 230 235 240

Glu Thr Leu Asn Gly Glu Arg Pro Asn Leu Arg Ser Ala Ser Ser Gly

245 250 255

Ser Gln Glu His Thr Glu Asn Glu Leu Leu Lys Pro Leu Arg Val Lys

260 265 270

Ala Asp Glu Pro Cys Tyr Lys Val Ile Gln Asn Ala Met Lys Arg His

275 280 285

Gly Leu Ser Val Asp Asp Trp Arg Lys Tyr Ala Leu Val Ile Cys Tyr

290 295 300

Gly Asp Glu Glu Arg Val Leu Gly Leu His Glu Lys Pro Gly Ser Ile

305 310 315 320

Phe Lys Glu Leu Lys Asp Gln Lys Gln Asn Pro Ala Ile Met Leu Arg

325 330 335

Gln Ile Asp Thr Asn Asn Asp Asp Gln Asn His Ile Glu Thr Pro Gly

340 345 350

Gly Arg Leu

355

<210> 9

<211> 194

<212> PRT

<213> 巴斯德畢赤酵母

<400> 9

Met Arg Phe Ser Asn Val Val Leu Thr Ala Ile Ala Ala Ala Gly Val

1 5 10 15

Gln Ala Asp Glu Ala Leu Tyr Thr Val Phe Tyr Asn Asp Val Thr Glu

20 25 30

Asn Ala Gln Glu Tyr Leu Ser Tyr Ile Gln Ala Asn Thr Ala Ala Gly

35 40 45

Phe Thr Asp Leu Leu Ser Leu Tyr Thr Glu Leu Ala Thr Tyr Thr Asp

50 55 60

Asp Ser Tyr Thr Ser Ile Phe Thr Glu Glu Asp Phe Pro Ala Ser Glu

65 70 75 80

Leu Ser Ser Phe Val Val Asn Leu Pro Trp Tyr Ser Ser Arg Ile Glu

85 90 95

Pro Gln Val Ala Ala Ala Glu Thr Gly Glu Ser Glu Glu Glu Ser Glu

100 105 110

Thr Gly Glu Ser Glu Glu Glu Ser Glu Thr Gly Glu Glu Thr Glu Thr

115 120 125

Glu Thr Gly Ser Glu Ser Glu Ser Glu Ser Glu Ser Glu Thr Ser Ala

130 135 140

Thr Gly Thr Gly Thr Gly Thr Ser Ala Ser Glu Ser Ala Glu Thr Glu

145 150 155 160

Thr Ser Thr Asp Ala Ala Val Ser Ile Asp His Pro Lys Ser Thr Leu

165 170 175

Leu Met Gly Leu Thr Ala Ala Val Val Ser Ile Thr Phe Gly Val Phe

180 185 190

Ala Leu

<210> 10

<211> 806

<212> PRT

<213> 巴斯德畢赤酵母

<400> 10

Met Asn Lys Pro Asn Gly Ser Glu Gln Gln Pro Pro Ser Arg Gly Met

1 5 10 15

Lys Gln Glu Ser Gly Gly Pro Val Thr Ser Ser Thr Thr Pro Gly Thr

20 25 30

Asn Thr Gly Leu Glu Asn Ser His Ser Met Gly Ala Asp Met Glu Pro

35 40 45

Asp Val Gly Ala Thr Ser Pro Arg His Leu Leu Asn Gly Tyr Ile Tyr

50 55 60

Asp Tyr Leu Val Lys Ser Asn Met Gln Asn Leu Ala Asp Gln Phe Ala

65 70 75 80

Gln Glu Thr Glu Leu Leu Glu Thr Asp Leu Thr Val Pro Met Asp Thr

85 90 95

Pro Ser Gly Tyr Leu Leu Glu Trp Trp Met Val Phe Trp Asp Leu Phe

100 105 110

Asn Ala Arg Leu Lys Gln Arg Gly Ser Gln Lys Ala His Gln Tyr Ile

115 120 125

Gln Leu Asn Met Leu Arg Gln Gln Gln Gln Arg Thr Met Arg Asn Thr

130 135 140

Ala Arg Val Gln Lys Val Pro Leu Arg Pro His Thr Gln Ser Ser Pro

145 150 155 160

Ser Met Ser Gln Thr Phe Ile Pro Gln Gln Pro Gln Gln Gln Ala Gln

165 170 175

Gly Gln Gln His Ala Gln Ala Gln Ala Gln Val Gln Ala His Gln Gln

180 185 190

Ala Gln His His Ala Gln Ala Gln Val Pro Val Gln Pro Gln Gln His

195 200 205

Gln Leu Gly Gly Gln Thr Gln Gln Gln Gln Ser Ile Asn Thr Gly Ser

210 215 220

Pro Ala Gly Pro Asn Ala Ile Asn Ser Arg Val Gln His Leu Ala Gln

225 230 235 240

Gln Gln Met Asn His Leu Arg Gln Gln Ala Thr Ala Thr Thr Gln Gln

245 250 255

Pro Ile Pro Gln Gln Asn Ile Pro Ser Asn Gln Gln Gly Pro Thr Gly

260 265 270

Pro Tyr Pro Thr Ser Pro Ser Arg Arg Pro Arg Leu Leu Ser Asn Glu

275 280 285

Ser Gly Ala Ser Ala Pro Ser Val Met Thr Lys Ser Gln Leu Gln Gly

290 295 300

Val Pro Pro Ser Gln Gln Pro His Gln Gln Gln Gly Gln Gln Val Gly

305 310 315 320

Pro Pro Asn Gln His Gln Gly Gln Ser Ser Ser Phe Tyr Ser Gly Met

325 330 335

Pro Pro Gln Gly Val Val Val Pro His Gln Phe Asn Pro Gln Gln Tyr

340 345 350

Ala Asn Met Leu Ala Arg Gln Gln His Val Gln Ala Gln Gln Gln Val

355 360 365

Gln Leu Gln Gln Val Gln His Val Gln Gln Arg Gln Gln Gln Asp Gln

370 375 380

Gln Gln His Arg Leu Ser Ala Gly Ser Pro Gly His Pro Ser Phe Gly

385 390 395 400

Val Phe Gln Gln Pro Pro Pro Met Ser Asn His Asn Gln Val Met Ile

405 410 415

Asn Gln Gln Gly Glu Thr Phe Phe Asp Pro His Ser Pro Tyr Ala Gln

420 425 430

Pro Asn Gly Tyr Pro Gln Pro Gln Gln Gln Gln Gln Gln Gln Gln Gln

435 440 445

Gln Gln Gln Gln Gln Gln Pro Gln Gln Gln Gln Gln Gln Gln Gln Gln

450 455 460

Gln Lys Gln Gln Pro Pro Pro Pro Pro Arg Gln Pro Gln Arg Gln Gln

465 470 475 480

Ala Met Ala Met Ala Pro Leu Pro His Ser Thr Ser Ala Ala Gly Thr

485 490 495

Pro His Ser Ser Thr Thr Pro Arg Phe Ser Gln Pro Gly Pro Val Tyr

500 505 510

Gln Gln Pro Leu Pro Ala Ser Gln Pro Gln His Ser Pro Pro Ser Ser

515 520 525

Ile Gln Gln Pro Glu Leu Val Pro Thr Pro Gly Ser Gln His Gln Gln

530 535 540

Ile Ala Gln Pro Gln Ser Gln Ser Gln His Gln Gln Ser Gln Gln Ser

545 550 555 560

Gln Ser Ser Ala Ser Lys Ile Val Gly Ile Gln Glu Tyr Gln Lys Glu

565 570 575

Leu Met Met Leu Glu Lys Gln Asn Lys Gln Arg His Asp Met Ala Cys

580 585 590

Lys Lys Gly Ser Gly His Phe Ser Asn Phe Asp Pro Ile Pro Glu His

595 600 605

Thr Pro Pro Glu Pro Lys Phe Asn Val Asn Val Met Leu Pro Pro Gln

610 615 620

Asn Ser Ala Val Val Thr Lys Asn Thr Pro Gly Thr Ser Pro Gly Thr

625 630 635 640

Gln Thr Gln Asn Thr Ala His Ser Thr Gly Asn Thr Ser Ala Gly Ser

645 650 655

Thr Pro Asn Asn Val Ala Pro Val Arg Lys Lys Lys Glu Pro Ala Lys

660 665 670

Lys Lys Ala Lys Lys Ala Thr Glu Pro Pro Thr Pro Thr Thr Pro Gln

675 680 685

Thr Pro Ile Ala Ala Arg Thr His Gln Asn Ser Thr Gly Gly Ile Pro

690 695 700

Gly Asn Asn Ala Ala Thr Lys Arg Arg Lys Arg Glu Pro Leu Val Asp

705 710 715 720

Gln Thr Val Ser Pro Asn Leu Asn Glu Ala Ser Lys Ser Thr Lys Thr

725 730 735

Gly Lys Ile Ser Ser Gln Thr Asp Phe Thr Gly Ser Asp Asn Gly Phe

740 745 750

Leu Gln Asp Phe Gly Asp Gly Thr Gly Pro Pro Thr Gly Thr Asp Asp

755 760 765

Met Glu Phe Asp Phe Asn Ser Phe Leu Asn Asn Glu Thr Gly Glu Pro

770 775 780

Asn Ser Ser Thr Ile His Phe Asp Asn Val Phe Asn Trp Gly Glu Gly

785 790 795 800

Thr Glu Ala Gly Asp Leu

805

<210> 11

<211> 149

<212> PRT

<213> 巴斯德畢赤酵母

<400> 11

Met Val Val His Asn Pro Asn Asn Trp His Trp Val Asp Lys Asn Cys

1 5 10 15

Leu Pro Trp Ala Lys Ser Tyr Phe Gln Glu Val Leu Pro Asn Thr Thr

20 25 30

Gln Lys Asn Asp Ala Tyr Glu Ile Val Val Thr Ser Val Asp Leu Val

35 40 45

Asp Gly Asp Cys Asp Val Thr Gln Arg Lys Gly Val Thr Lys Cys Ile

50 55 60

Phe Asp Leu Lys Ile Gln Val Ser Ala Thr Val Lys Val Asn Thr Asn

65 70 75 80

Ser Glu Val Glu Glu Ile Ser Tyr Thr Val Thr Leu Pro Glu Leu Val

85 90 95

His Asp Gln Asp Glu Asp Glu Tyr Glu Tyr Val Ile Glu Gly Asn Leu

100 105 110

Asp His Lys Ser Gln Ile Arg Lys Leu Leu Thr Pro Leu Leu Thr Glu

115 120 125

Lys Leu Ser Lys Phe Gln Gln Ala Leu Ile Asp Ala His Thr Gln Asp

130 135 140

Val Gln His Ser Thr

145

<210> 12

<211> 354

<212> PRT

<213> 巴斯德畢赤酵母

<400> 12

Met Lys Ile Trp Leu Val Leu Leu Leu Val Phe Ala Thr Val Phe Ala

1 5 10 15

Glu Thr Asp Tyr Tyr Lys Val Leu Gly Val Ala Lys Asn Ala Asp Glu

20 25 30

Lys Asp Ile Lys Lys Ala Tyr Arg Ser Leu Ser Lys Lys Phe His Pro

35 40 45

Asp Lys Asn Pro Gly Asp Asp Glu Ala Ala Gln Lys Phe Ile Gln Val

50 55 60

Gly Glu Ala Tyr Asp Val Leu Gly Asp Pro Glu Lys Arg Gln Arg Tyr

65 70 75 80

Asp Arg Phe Gly Ala Glu Gly Leu Asp Ser Arg Gln Glu Gln Phe His

85 90 95

Asp Pro Phe Asp Met Phe Gln Gln Phe Phe Gly Gly Gly Gly Gln Gln

100 105 110

His Arg Gly Lys Pro Lys Gly Lys Ser Ser Leu Leu His Leu Glu Phe

115 120 125

Ser Leu Gln Asp Phe Tyr Asn Gly Ala Ser Asn Asp Phe Arg Ile Glu

130 135 140

Met Gln Asn Ile Cys Glu Thr Cys Ser Gly Ser Gly Ser Gln Asp Gly

145 150 155 160

Lys Val His Gln Cys Asp Thr Cys Lys Gly His Gly Arg Val Val Gln

165 170 175

Thr Arg Gln Phe Gly Gly Gly Met Gln Gln Arg Phe Glu Thr Ile Cys

180 185 190

Pro Lys Cys Ser Gly Thr Gly Asn Leu Ile Thr His Lys Cys Lys Lys

195 200 205

Cys Gln Gly Asn Arg Val Val Arg Gly Pro Arg Ile His Asn Val His

210 215 220

Leu Gly Ala Gly Thr Ser Arg Asn His Val Glu Ile Leu Glu Gly Gln

225 230 235 240

Gly Asp Gln Ser Pro Asp Trp Ile Ala Gly Asp Leu Gln Ile Met Phe

245 250 255

Lys Glu Lys Ala Glu Gly Asn Met Gly Tyr Arg Arg Ile Gly Asn Asn

260 265 270

Leu Tyr Arg Asp Glu Ala Leu Thr Leu Lys Glu Ala Leu His Gly Gly

275 280 285

Trp Glu Arg Gln Ile Ala Phe Leu Asp Lys Ile Glu Asn Thr Ile Thr

290 295 300

Leu Ser Lys Lys Lys Gly Glu Val Val Val Asp Gly Gln Val Asp Thr

305 310 315 320

Ile Lys Gly Arg Gly Met Pro Leu His Asp His Tyr Asp Glu His Gly

325 330 335

Asp Leu Phe Ile Lys Tyr His Ile Ile Tyr Pro Gln Gln Ile Arg Asp

340 345 350

Glu Leu

<210> 13

<211> 288

<212> DNA

<213> 巴斯德畢赤酵母

<400> 13

atgttaaaca agctgttcat tgcaatactc atagtcatca ctgctgtcat aggcgagacg 60

actacgtcat ctaccactgc cagtctctcc gaaagcccta ctctggtttg ggtgactggc 120

actgatgcaa gtgggagatt ggcaactaca cagtctgctt acactcaaca gttttcacag 180

ttatactcat ccatagcatc tccatcaagt ggtagcatag gcctgggtac tatccagggg 240

actgttggaa ttgtcagaac atatgagaca attacccttg ccagctaa 288

<210> 14

<211> 261

<212> DNA

<213> 巴斯德畢赤酵母

<400> 14

atgtctacag caattccagg aggacagaga acgttagcta aaagaagagc agcaaacttg 60

gataagaaac aggatgaacc aacctccgcc agatctgccg gtgctggagg ttcttcgtct 120

accatgctaa agttgtacac agacgaggcc caaggtttga aagttgatcc tttaattgtt 180

cttgttcttg ctgttggttt cattttcagt gtcattggtt tgcacgttgt tgctaagctg 240

acaggaaagt tgatcaacta a 261

<210> 15

<211> 1086

<212> DNA

<213> 巴斯德畢赤酵母

<400> 15

atgactcccc gttctcatat tttctttgac atctccatca acaaccagcc agctggcaga 60

ataatctttg agctcttcaa tgacattgtt cctaagacag cagagaattt tagagcttta 120

tctactggtg agaaaggtat aggtaagtct gggaaaccat tgcactacaa gggttctact 180

ttccatagga tcattaagga ttttatggta caaggtggtg actttaccaa cggtaacggt 240

actggaggcg aatccatata tggagaaaaa tttgaagatg aaaatttcca attgactcat 300

gacaaaccgt tccttctctc tatggcaaac gctggaccag gaactaatgg atcccagttt 360

tttatcacca ccgttcctac tcctcatctg gataacaagc atgtagtgtt tggaaaagta 420

attgctggta aagccacagt tagaaagatt gaaagaaact ccgaaggtga agctccaatt 480

gaacccgttg tcattgagga ctgtggtgaa cttccagaag acgcagattt gaccatctcc 540

gacgagactg gagacaagta tgaggaagtt ctgaaagata atgagaacat agacatcgat 600

gactttgaac aggtctacca ggccatcact gaaatcaaag aattgggtac aaagtatttc 660

aaaaatggtg acaccaaaat cgccttcgaa aagtatcaaa aggctgctaa ttatttgctg 720

gaatacatac catcagattt atcagaggaa cagagctcta agttggagct gctaaaaaca 780

tctgtcttct ccaacgtggc attggctgga ctgaaagttt ccaagttcaa agacacgatt 840

aagtatgcca cattggtcat tgaggatgaa tctgcggatg caaaggccaa gtccaaaggc 900

tactaccgta gaggaagtgc ttacagctca ctgaaagacg aagattcagc catctcagat 960

ttccagaaag cacttgaatt atccccaggt gatcctgcaa ttagccaatc tctacaaaga 1020

accacgaagg ccagaaaaga ccgtcttgcc aaagagaaag ctgctttgtc taagttcttt 1080

gagtag 1086

<210> 16

<211> 825

<212> DNA

<213> 巴斯德畢赤酵母

<400> 16

atgtcgtctg atgctgtgga gcaacttgaa aacttccagt tgatcaagtt cgacagattc 60

gatccttcaa cgcaatcgac tatcagaata gcgcgatctc ccaaaccaat tccagtcaag 120

gttgtgatag tgggagatgg tggatgtgga aagacatgtc ttctcaatgt ctttgccact 180

ggaacgtttc ctgaggcgta tgtccccaca atcatagaaa atgtggttat tacattggtg 240

accccaactg gccagatagc tgccgttact ctgtgggata ctgcagggca agaagagtac 300

gacagattga gacccctaag ctactccgac gttgacgtgg tcttgctgtg ctacagcata 360

gacaatctgt ccacctttca taatgtggcc gacaaatggt acccagaagt ggcacatttt 420

tgtccaaaca caccgatcat cttggtaggt accaaatctg atatgcggcg tcatcagaag 480

agtcagccgc actttgtatc tccccaggat tcgtcgcagt tggcaaggca gatgggggca 540

gtgatgaaca tcgagtgttc tgcgaaggag gtttcaaacg tcaatatcgt ttttgatgct 600

gctgtgtcgt actgtttgag taacagcagg cccaagacca gaggggataa tgacaacaat 660

aggagtaaca gacggctaag tagagccaag cgagccagca tgtttataag gggtaaggat 720

gttagctcaa cgtcaggaaa ctctcgggaa gaacttgttg aatacgatca agatgggttg 780

gcaataatac cggacagaaa gaaacgcaaa tgtagcatta tttga 825

<210> 17

<211> 384

<212> DNA

<213> 巴斯德畢赤酵母

<400> 17

atgactaact ggaaagcgat attgactccc gctcaatacc aagtcctccg tttgggcgga 60

acagaaagac cgtataccgg acagtatgtg aacttcaaga aaaatggaac ctacttgtgt 120

agtgggtgtc aaactccgct ttacaaaagt ggcacaaaat ttgattcatc ttgtggttgg 180

cctgcattct atgaagcatt acctggagca gttaaacgaa tagaagacaa ttcgcttgga 240

atgcgaagaa tagaaatcag atgctccaaa tgtgatggac atcttggcca tgtttttgag 300

ggtgagggat ttgacactcc aacagattcc agacattgtg tcaacagcat cagcctaaaa 360

tttcaaggtg aagaagagaa ctaa 384

<210> 18

<211> 3084

<212> DNA

<213> 巴斯德畢赤酵母

<400> 18

atgactacaa acggccagaa aagacaaaaa actcgcaaac cacttttgat caacgcattt 60

gtcatgggat gtgctgggtt acagaatcct ggtttatgga agcatcccaa ggactcatcc 120

catagattta atcagattga tcactggact tatttggcca agttagccga aaaggggaag 180

tttaatgcgc tcttcattgc cgacgtcttg ggtggctatg atgtctacaa aggacctgag 240

aatttagcca ctcctgctgt ggctggagcc cagtggcctg tcaccgagcc cagtgctgtg 300

gtctccgcca tggctgcagt cacaactaac ttggcgtttg gagtgacgtt ctctactatc 360

agcgaagccc cctatcattt tgccagaaga ctgtccactt tagaccactt gaccaagggt 420

agaataggat ggaatgttgt ttcatcttac ttggagagtg ctgctcgtaa cctcttgaat 480

ggtgaaaaat tggacgagca tgaccaaaga tacttgaaag ctgaagagta cattcaaata 540

gtttatgagc tgttgttatc gtcttggaga gatgatgcag tagttttaga caagaaagct 600

ggtgtttata ctgacccaac aagatttcga aagatcaact ttgaaggtaa atttttcaaa 660

gttccgggac cacatattgt tgaccccacc cctcaaagac tgcctgtgat tcttcaagct 720

ggtacttcta aagttggtaa ggagtttgct gctaagcatg ccgagattgt gtttgtcatt 780

tcattttctc cagatgattt gaaacccaag attgcagaag ttcgtcaact ggccaaagaa 840

aagtttggta gaaaccacga cgatattaag tttgttgccc ttgcaacccc tgttattgga 900

gccacacatg aactagctga agaaaagtac caagagttac taagttatgg tgatattgaa 960

ggtgctcaag ccttatttgg agggtggact ggcattgacc tctctcaata tggcgaagat 1020

gaagaactag gaaatgttag ttccaatgct atgcgtggcg ctgtacaaaa ctggactaaa 1080

gcaattccaa atgagaagcg ttggacacgt aaggttattg ctaaacagat taccgttggt 1140

ggtctaggtc cagctttcgt tggaacccca gaagaaatcg ccgatgagct ggaacactgg 1200

tccgaccacg ctggtttgga cggattcaac ttcacttatg ctgtcaaccc gctttctttc 1260

gaagagatag tggaagactt gattccagtt cttcagcgaa gagggttggc ccaaaaggaa 1320

tacccaaatc cagaaactgg aagcacattc cgtaaaaacc tttttggaac agactttgta 1380

ccatctaccc acccagctta taacttaaga tggagggctg gtgtgtccaa ggaagaattc 1440

gaaaagtccc taaacgccac aacaaattgg tattccagtt tcgctaggtc aggtgctcta 1500

ggtgaattgc ataatacatg caggattctc tatctccaaa tagtgaaata taaatatagg 1560

cttcgagtcc gttcagaagg gaatagcatc cccttcgcca aaatgaccaa ggaaaatgaa 1620

gccaagaggc agaaaacctc tcaaccaaaa gcgaagaagc aattgattat caatgctttc 1680

atgtcaggct cttcgggtaa ccaatcgcca ggactgtggt cgtaccctgg agacaaatca 1740

acagagtata ctaccctaga ttactgggtg gagttagctc aaaagctgga aaaggccaaa 1800

ttccattcta tcttcattgc cgatgttctg ggtggatatg acgtttacaa tggacctgga 1860

aactacagtg ctgctgcaaa atctggtgcc caatttccaa tgattgaacc aagtgctgca 1920

gttactgcca tggctgctgc taccaagtca ataacgttcg gagtgacttt ttccactata 1980

agtgaggcac cttatcattt tgcaagaaga ttgggaactt tagatctgct gacaaacgga 2040

agagtcggct ggaatatcgt ctcttcgtat cttgacagtg ccgccagaaa tcttttgaat 2100

ggagaaccac tccctctcca tgcagaccgt tataagagag ccgaagaatt cctacaagtt 2160

gtatatcggt tattcctttc ttcatggaga gacgatgctt ataaattgga taagaaaacc 2220

agaacctttg ctgacccaaa acttattaga actatcgacc acgttggaga gttcttcaat 2280

gtcccaggcc cccagttcct accacccact cctcagagac taccgctgat tttgcaggct 2340

ggtacttcca aggttggtat ggattatgct gcaaaacatg cagaggttgt ctttttagct 2400

tcatttgacc cagagtcact ccaagaaaaa atcaaaacag tgagagatat cgctgaaacc 2460

aagtacaaca gaccaagaga ttcaatcaaa ttcttaattt tgataacagt agtcatagct 2520

gatacacacg aagatgccgt gaagagatac gaagatctcg ccagttatgc tgatctggaa 2580

ggggcccaag cactgttcag tggttggact ggaatagata ttggaaagta tggtgaagat 2640

gaacctcttg agcatgtgga atctaacgct attaagagcc atgttaagaa ctggactaag 2700

ttcaaggaca ataagcctag agccagaaaa gatatcgcta aacagattgg agttggaggc 2760

tcaggtccct tacttgttgg atctgtacaa gagatagccg acgagcttga gagatgggca 2820

gaagtctctg acctcgatgg ctttaacttc gcttacgcag attaccccca aacttttgat 2880

gatatcattg aaaaactgct tccagagttg aacaagagag gtgtgttctg ggatgattat 2940

aaaattccag gtggaacctt cagagagagc gtgtttggaa gaaagttcgt tgataaggat 3000

catcctgctt atgatctgag atggagaagt gaccaaacta gggaggagtt tgaaaagaaa 3060

ctggctgaat tggagaaaaa ataa 3084

<210> 19

<211> 1641

<212> DNA

<213> 巴斯德畢赤酵母

<400> 19

atgtctcatc tattactgcg tgacagcttt tggggaagga ccatctacca tctgagtaaa 60

cacaggtatt tctcttttcc tgaagagaaa gatggtttca ttgctcctga aaagtactac 120

ctgaatatgg accaagtatc gatacatgct gaatctgaga aaaatatagt ggaaggtttg 180

gtagacactt caaattcttc gttggaggaa gtaaagacca ctagagtcat agtcgactgg 240

gatgaatatg atcagaaaga aaatccccaa aactggagct cgcttttaaa gtgcttcgtt 300

gtttttgaag tgggaatctt aaccgtagct gtttatatgg gatctgcaat ttacactccc 360

ggtatagaag atattatgag agatctcaat gttagcagaa cggtggcaac acttccatta 420

accttgtttg tgattggata cgctgtgggt ccaatgatat tctcccccat gtctgagcat 480

cccgctatcg gaaggacaac gatatatgtg tggaccctgt tcatatttgc tatactacaa 540

atcccaacgg ccctgaccac taacattgct ggattttgca ttttgaggtt tattggaggg 600

ttttttgcgt caccagcatt agctacaggt ccagcttctg taggtgatgt tattgcaatc 660

ccgcacttgc ctgtagggtt aggcctttgg agtatctgtg ctgtttgtgg tccttctcta 720

ggaccacttt ttggagccat attttcccaa cttgtgagtt ggaggtggtg cttctggttt 780

ctgttaatta cctctgggac actatttata gttcttggct tcactttacc agaaacgtat 840

gtaccaaccc ttctttacag aaaggctagg aggctacgag cattaacaaa aaacgaactg 900

attatcagca aaggggagtt agatattcag gacagaactg ccaaggaagt tttgattgaa 960

tgcttatgga ggccagtcga catatcattc agagaccccg ttgtcttgat gataaatctt 1020

tacatttcaa tggtttattc tatttggtac atttggtttg aagcgtttcc tattgtattc 1080

ttagagatat atggattcag ccttattgga atgggagcta gttttgccgg aatcttaatt 1140

ggtgtcttaa tatgctctgc gtgctattgc tatgcgtgtc atgttacttt tgcaagaaga 1200

ataattgcaa acgaaaccat tcatcctgag ttctttgtac cgggcgctat tattggaggt 1260

tgcataatgc ccactggaat ctttattttg ggatggactg ccaccaaaag tgtccactgg 1320

attgtaccta taataggtag cggtttattt gctgctggtg gttatctcat tttccagaca 1380

ctcttcaact accttgcaat gtctttccct agatacatgg catcagcttt tgccggaaat 1440

gatcttttca ggtccttttc tgccagtgtt ttcccactgt ttggacatgc actatatgcc 1500

aacttgggat ccgaaaagtt ccctgttggt tggggttctt ctgtactggg gttcatcact 1560

gttgcaatga tcgcaattcc agtaactttc atgagatatg gtccaagatt gcgtgcaaat 1620

tctagatatg ccgggccatg a 1641

<210> 20

<211> 1068

<212> DNA

<213> 巴斯德畢赤酵母

<400> 20

atgacggact atgtcacttc taagcggcca gataacgtgc tcaattggac aagtattcat 60

gtatcgtcct ggatagggga gactattcct gagatcgatc caagtctact ccaaaatttt 120

ttagaacatg acattgcggg agatgttcta ccctacttga agtctgaaga tctgaaggaa 180

attgggatca acgagctcaa gcacagaatc tctataaaaa agaacattca tgaacttctt 240

gtgagcaatg aaaagcacat tgataccagt attctatcag acaccgctac cgagctagga 300

actttgatac tgactaataa attcataacc cagatggcga acagaaagaa tgttgtagat 360

gattccactc atcattcgaa taacagaagg ctcactgaac agtttaataa gcttcgcaaa 420

gatcttttgc cgatattcaa atggatcaag gagacccaac cattacccac tccagagaat 480

acacatttcg caaatatggg ttcagtacca gcatctcctg tggagcatac ttcaggtgag 540

tcaacattgt ctaaccccag tctaagcacc atcaatgctg gcgaaggagt gaactctgca 600

gttgcagggc aatctctcgg gaggaaacct acattatcct ccagaagaca atcacatgct 660

ttgtctccaa ctggtgaaca cctgaatgtg tcatcatcat ctccttcgac ggggaatttt 720

gaaactctga atggagaaag acccaatctt agatctgctt cgtcaggatc acaggaacat 780

actgagaacg aactattgaa gccgttgaga gttaaagcag atgagccttg ctataaggtg 840

attcagaatg ccatgaaaag acatggctta tcggtagatg attggcgcaa gtatgctttg 900

gtcatctgct atggagatga agaacgagta ctaggcttac atgaaaaacc tgggagtatc 960

ttcaaggaac tcaaagatca gaaacagaat cctgcaatca tgcttcgtca aattgacact 1020

aataatgacg atcagaacca tattgaaacc cctggaggga gattatga 1068

<210> 21

<211> 585

<212> DNA

<213> 巴斯德畢赤酵母

<400> 21

atgagatttt ctaacgtcgt tttaactgca attgccgctg ccggcgtaca ggcagatgaa 60

gccctttaca ctgtgttcta caatgatgtc actgagaacg cccaagagta tctgtcttac 120

atccaggcca atactgcggc tggtttcact gacctcttga gtctgtacac tgaactggcc 180

acttacaccg acgattctta cacaagtatc tttactgagg aggatttccc tgcgagcgaa 240

ctttcatcgt tcgttgttaa cctgccatgg tattcctcca gaattgagcc acaagttgcg 300

gctgctgaaa ctggtgaaag tgaggaggaa tcagagactg gtgaaagtga ggaagaatca 360

gagactggtg aggagacaga aactgagact ggatctgagt ctgaatctga gtctgaatcg 420

gagacctccg ctactggcac tggcactggc acctccgcct ctgagagcgc ggagactgaa 480

acttctaccg acgctgctgt gtctatcgat cacccaaagt ccaccttatt gatgggtttg 540

actgccgcag ttgtcagtat cactttcgga gtctttgcct tgtaa 585

<210> 22

<211> 2421

<212> DNA

<213> 巴斯德畢赤酵母

<400> 22

atgaacaagc caaacgggtc tgaacaacaa ccaccgtcac gcggaatgaa gcaagagtca 60

ggaggcccag ttacttcatc tacgacgccg ggtaccaata ctggcctaga aaactctcat 120

tccatggggg cggatatgga gcctgatgtt ggtgctacct ctcctcgcca tcttcttaat 180

gggtacattt acgattattt agtcaaatct aacatgcaaa atttggctga tcaatttgcc 240

caagagacgg agctcttaga aacagacttg acagtaccaa tggatacgcc ttcaggctat 300

cttctagaat ggtggatggt attctgggac cttttcaatg cccgcctaaa gcaacggggt 360

tcacagaagg cccaccagta tattcagttg aacatgctac gacaacagca acagaggacc 420

atgcgaaata cagcccgtgt tcaaaaagtc ccgttgaggc cacacaccca atcatctcct 480

tcaatgtcac agacttttat tccacagcag cctcaacagc aagcacaggg acaacagcac 540

gcccaggctc aagcccaagt gcaagcacat cagcaagccc aacaccacgc gcaggcacaa 600

gtgccagtgc aaccgcaaca gcaccagcta ggaggccaaa ctcaacagca gcaatccatt 660

aacactgggt ctcctgcggg tccaaatgct atcaactcgc gtgttcaaca cttagcacaa 720

caacagatga atcaccttcg ccagcaggcg actgccacta cgcaacaacc tatcccgcaa 780

cagaatatcc catcaaacca acagggtcct acaggccctt atcctacttc cccttcaaga 840

agaccgagat tactgtctaa cgaatcgggt gcaagtgcac cctctgtaat gacaaagtca 900

cagctccaag gagtccctcc ctcacaacaa ccacaccagc agcaaggtca gcaggtaggc 960

ccccctaatc aacatcaagg tcaatcttct tccttttatt cgggcatgcc tcctcaaggg 1020

gtcgtggttc ctcatcagtt caatcctcag cagtatgcca atatgctagc aagacaacag 1080

catgtacaag ctcaacaaca ggttcagtta caacaggtcc aacatgtaca acagagacaa 1140

cagcaagacc aacaacaaca ccgcctgtcc gccggttcac cggggcaccc ttcatttggc 1200

gtttttcaac aacctcctcc gatgtcaaac cataatcagg tcatgatcaa tcagcaggga 1260

gaaacttttt ttgatccaca ttctccatat gctcaaccta acgggtaccc ccagccacag 1320

caacaacaac aacaacagca acaacaacaa caacagcagc aaccgcaaca gcagcagcag 1380

cagcagcagc aacagaagca gcaaccacca ccaccaccac gacagcctca gcgccaacaa 1440

gcgatggcca tggctcctct gcctcactct acttctgccg ccggtactcc tcactcgtcc 1500

accacaccta gattctcgca acctggtcct gtttatcagc agcctttacc tgcatctcaa 1560

ccgcaacatt ctccgccttc ttctattcag cagccggagc tagttccaac tccagggtca 1620

caacatcagc aaatagcaca accacaatca cagagccaac accagcaatc gcaacagtct 1680

caatcaagtg cttctaaaat tgtaggtata caggagtatc agaaagagct aatgatgctt 1740

gagaaacaga acaaacagcg tcatgacatg gcatgtaaga agggaagcgg gcatttttct 1800

aactttgatc caattccaga gcacacaccg cccgaaccaa aatttaatgt gaatgtaatg 1860

ctccctcccc agaactctgc agtggtcacg aagaatactc ccggaacttc acctggtaca 1920

caaactcaaa acactgcaca tagtactggt aacacttctg cggggtctac accaaataat 1980

gtcgcacctg tacgaaagaa aaaggagcca gctaaaaaga aggcaaagaa agctactgag 2040

cccccgactc ccactactcc acagactcca attgcagcta ggacacatca aaactctaca 2100

ggcggcattc ctggtaataa tgctgctact aagcgacgaa aacgggagcc gctggttgat 2160

caaactgttt cacctaacct taacgaagct tccaagtcaa caaagaccgg aaaaatttca 2220

tctcaaactg actttacagg ttctgacaat ggattcttac aggattttgg cgatggaact 2280

ggtcctccca ctggaaccga tgatatggaa tttgatttta acagttttct taataacgaa 2340

actggcgaac ctaatagttc aaccattcat tttgacaatg tattcaattg gggagaaggt 2400

accgaagccg gagatttata g 2421

<210> 23

<211> 450

<212> DNA

<213> 巴斯德畢赤酵母

<400> 23

atggtggtgc acaaccctaa taactggcac tgggtcgaca agaactgcct tccttgggcc 60

aaaagctact ttcaggaagt ccttccaaac accactcaga agaatgacgc ctatgaaata 120

gtggtaacat ctgtggacct tgtagatgga gactgcgatg tcactcaacg taaaggtgtt 180

accaaatgta tttttgatct gaagatacag gtatctgcaa ccgtcaaagt caacacgaac 240

agtgaagtag aggagatcag ttatacagtg acattacctg aactggtgca cgaccaggac 300

gaggatgaat atgaatacgt aatagaggga aatttggatc acaagtctca aattagaaag 360

ctactcactc ctctgttgac cgagaagtta tcaaagtttc aacaagcttt gatagacgct 420

catactcagg atgttcagca tagtacctag 450

<210> 24

<211> 1065

<212> DNA

<213> 巴斯德畢赤酵母

<400> 24

atgaagatat ggctggtact tcttttagtt tttgccacgg tgtttgccga gacagattat 60

tataaagttc ttggagtagc taaaaatgcg gatgaaaaag atatcaagaa ggcctacaga 120

tcgttgagta agaagtttca tccagataag aacccgggtg atgatgaagc cgctcaaaag 180

ttcattcaag ttggagaagc ttatgatgtg cttggtgatc ccgagaagcg tcaaaggtat 240

gacagatttg gagcagaagg actggactca agacaggaac aattccatga tccatttgac 300

atgtttcaac agttcttcgg aggaggtgga cagcaacaca gaggcaaacc aaagggtaag 360

agttccttgt tacatttaga attcagtcta caagactttt acaatggtgc tagtaacgac 420

tttagaatcg aaatgcagaa tatctgtgaa acttgttctg gatcaggttc acaagacggg 480

aaagttcatc aatgtgacac ttgcaaaggg cacgggcgtg ttgttcaaac gagacagttt 540

ggtggtggca tgcaacagag gtttgaaaca atttgcccaa aatgttcagg aacaggaaat 600

ctgatcactc acaagtgtaa gaaatgccaa ggaaaccgtg tagttagagg acccagaatt 660

cacaatgtgc atttgggggc gggaactagt aggaaccatg ttgagatcct ggaaggtcag 720

ggagaccagt ctccagactg gattgcaggt gatctacaaa tcatgttcaa ggagaaagcc 780

gaaggcaaca tggggtatag aagaatagga aacaacctgt acagagacga agcattaacg 840

ctgaaagagg cattgcatgg tggctgggag agacaaattg cgtttttgga taaaatagag 900

aacacgatta ctctttccaa gaagaaagga gaggtggtag ttgacggcca agtagacacc 960

atcaagggta gagggatgcc attacatgac cactatgacg aacatggtga tctctttatc 1020

aagtaccata tcatttaccc gcaacaaatt agagacgaat tgtga 1065

<210> 25

<211> 312

<212> PRT

<213> 人工

<220>

<223> 合成的構建體

<400> 25

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe

35 40 45

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

Ser Leu Glu Lys Arg Glu Val Gln Leu Val Gln Ser Gly Gly Gly Leu

85 90 95

Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe

100 105 110

Thr Phe Ser His Tyr Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys

115 120 125

Gly Leu Glu Trp Val Ala Asn Ile Glu Gln Asp Gly Ser Glu Lys Tyr

130 135 140

Tyr Val Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala

145 150 155 160

Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr

165 170 175

Ala Val Tyr Phe Cys Ala Arg Asp Leu Glu Gly Leu His Gly Asp Gly

180 185 190

Tyr Phe Asp Leu Trp Gly Arg Gly Thr Leu Val Thr Val Ser Ser Ala

195 200 205

Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser

210 215 220

Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe

225 230 235 240

Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly

245 250 255

Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu

260 265 270

Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr

275 280 285

Thr Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg

290 295 300

Val Glu Ser Lys Tyr Gly Pro Pro

305 310

<210> 26

<211> 299

<212> PRT

<213> 人工

<220>

<223> 合成的構建體

<400> 26

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe

35 40 45

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

Ser Leu Glu Lys Arg Ala Ile Gln Leu Thr Gln Ser Pro Ser Ser Leu

85 90 95

Ser Ala Ser Val Gly Asp Arg Val Ile Leu Thr Cys Arg Ala Ser Gln

100 105 110

Gly Val Ser Ser Ala Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala

115 120 125

Pro Lys Leu Leu Ile Tyr Asp Ala Ser Ser Leu Glu Ser Gly Val Pro

130 135 140

Ser Arg Phe Ser Gly Ser Gly Ser Gly Pro Asp Phe Thr Leu Thr Ile

145 150 155 160

Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Phe Cys Gln Gln Phe

165 170 175

Asn Ser Tyr Pro Leu Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys

180 185 190

Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu

195 200 205

Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe

210 215 220

Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln

225 230 235 240

Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser

245 250 255

Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu

260 265 270

Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser

275 280 285

Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys

290 295

<210> 27

<211> 939

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 27

atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggctgcc 60

cctgttaaca ctaccactga agacgagact gctcaaattc cagctgaagc agttatcggt 120

tactctgacc ttgagggtga tttcgacgtc gctgttttgc ctttctctaa ctccactaac 180

aacggtttgt tgttcattaa caccactatc gcttccattg ctgctaagga agagggtgtc 240

tctctcgaga agagagaggt ccaattggtc caatctggtg gaggattggt tcaaccaggt 300

ggatctctga gattgtcttg tgctgcttct ggtttcacct tctctcacta ctggatgtca 360

tgggttagac aagctcctgg taagggtttg gaatgggttg ctaacatcga gcaagatgga 420

tcagagaagt actacgttga ctctgttaag ggaagattca ctatttcccg tgataacgcc 480

aagaactcct tgtacctgca aatgaactcc cttagagctg aggatactgc tgtctacttc 540

tgtgctagag acttggaagg tttgcatggt gatggttact tcgacttatg gggtagaggt 600

actcttgtca ccgtttcatc tgcctctacc aaaggacctt ctgtgttccc attagctcca 660

tgttccagat ccacctccga atctactgca gctttgggtt gtttggtgaa ggactacttt 720

cctgaaccag tgactgtctc ttggaactct ggtgctttga cttctggtgt tcacaccttt 780

cctgcagttt tgcagtcatc tggtctgtac tctctgtcct cagttgtcac tgttccttcc 840

tcatctcttg gtaccaagac ctacacttgc aacgttgacc ataagccatc caataccaag 900

gttgacaaga gagttgagtc caagtatggt ccaccttaa 939

<210> 28

<211> 900

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 28

atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggctgcc 60

cctgttaaca ctaccactga agacgagact gctcaaattc cagctgaagc agttatcggt 120

tactctgacc ttgagggtga tttcgacgtc gctgttttgc ctttctctaa ctccactaac 180

aacggtttgt tgttcattaa caccactatc gcttccattg ctgctaagga agagggtgtc 240

tctctcgaga agagagctat ccagttgact caatcaccat cctctttgtc tgcttctgtt 300

ggtgatagag tcatcctgac ttgtcgtgca tctcaaggtg tttcctcagc tttagcttgg 360

taccaacaaa agccaggtaa agctccaaag ttgctgatct acgacgcttc atcccttgaa 420

tctggtgttc cttcacgttt ctctggatct ggatcaggtc ctgatttcac tctgactatc 480

tcatcccttc aaccagaaga ctttgctacc tacttctgtc aacagttcaa ctcttaccct 540

ttgacctttg gaggtggaac taagttggag atcaagagaa ctgttgctgc accatcagtg 600

ttcatctttc ctccatctga tgagcaactg aagtctggta ctgcatctgt tgtctgctta 660

ctgaacaact tctacccaag agaagctaag gtccaatgga aggttgacaa tgccttgcaa 720

tctggtaact ctcaagagtc tgttactgag caagactcta aggactctac ttactccctt 780

tcttccacct tgactttgtc taaggctgat tacgagaagc acaaggttta cgcttgtgag 840

gttactcacc aaggtttgtc ttctcctgtt accaagtctt tcaacagagg tgaatgctaa 900

<210> 29

<211> 303

<212> PRT

<213> 人工

<220>

<223> 合成的構建體

<400> 29

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe

35 40 45

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

Ser Leu Glu Lys Arg Asp Val Gln Leu Gln Glu Ser Gly Pro Ser Leu

85 90 95

Val Lys Pro Ser Gln Thr Leu Ser Leu Thr Cys Ser Val Thr Gly Asp

100 105 110

Ser Ile Thr Ser Asp Tyr Trp Ser Trp Ile Arg Lys Phe Pro Gly Asn

115 120 125

Arg Leu Glu Tyr Met Gly Tyr Val Ser Tyr Ser Gly Ser Thr Tyr Tyr

130 135 140

Asn Pro Ser Leu Lys Ser Arg Ile Ser Ile Thr Arg Asp Thr Ser Lys

145 150 155 160

Asn Gln Tyr Tyr Leu Asp Leu Asn Ser Val Thr Thr Glu Asp Thr Ala

165 170 175

Thr Tyr Tyr Cys Ala Asn Trp Asp Gly Asp Tyr Trp Gly Gln Gly Thr

180 185 190

Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro

195 200 205

Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly

210 215 220

Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn

225 230 235 240

Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln

245 250 255

Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser

260 265 270

Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser

275 280 285

Asn Thr Lys Val Asp Lys Arg Val Glu Pro Lys Ser Cys Asp Lys

290 295 300

<210> 30

<211> 299

<212> PRT

<213> 人工

<220>

<223> 合成的構建體

<400> 30

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe

35 40 45

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

Ser Leu Glu Lys Arg Asp Ile Val Leu Thr Gln Ser Pro Ala Thr Leu

85 90 95

Ser Val Thr Pro Gly Asn Ser Val Ser Leu Ser Cys Arg Ala Ser Gln

100 105 110

Ser Ile Gly Asn Asn Leu His Trp Tyr Gln Gln Lys Ser His Glu Ser

115 120 125

Pro Arg Leu Leu Ile Lys Tyr Ala Ser Gln Ser Ile Ser Gly Ile Pro

130 135 140

Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Ser Ile

145 150 155 160

Asn Ser Val Glu Thr Glu Asp Phe Gly Met Tyr Phe Cys Gln Gln Ser

165 170 175

Asn Ser Trp Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys

180 185 190

Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu

195 200 205

Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe

210 215 220

Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln

225 230 235 240

Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser

245 250 255

Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu

260 265 270

Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser

275 280 285

Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys

290 295

<210> 31

<211> 915

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 31

atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggctgcc 60

cctgttaaca ctaccactga agacgagact gctcaaattc cagctgaagc agttatcggt 120

tactctgacc ttgagggtga tttcgacgtc gctgttttgc ctttctctaa ctccactaac 180

aacggtttgt tgttcattaa caccactatc gcttccattg ctgctaagga agagggtgtc 240

tctctcgaga agagagacgt tcaattgcaa gaatctggtc catccttggt taagccatcc 300

cagactttgt ccttgacttg ttccgttact ggtgactcca tcacttctga ctactggtcc 360

tggatcagaa agttcccagg taacagattg gagtacatgg gttacgtttc ttactccggt 420

tccacttact acaacccatc cttgaagtcc agaatctcca tcactagaga cacttccaag 480

aaccagtact acttggactt gaactccgtt actactgagg acactgctac ttactactgt 540

gctaactggg acggtgacta ttggggtcaa ggtactttgg ttactgtttc ctccgcttcc 600

actaagggtc catctgtttt tccattggct ccatcctcca agtctacttc aggtggtact 660

gctgctttgg gttgtttggt taaggactac ttcccagagc cagttactgt ttcttggaac 720

tccggtgctt tgacttccgg tgttcacact ttcccagctg tcttgcaatc ctccggtctg 780

tactccttgt cctccgttgt tactgttcct tcttcctcct tgggtactca aacttacatc 840

tgtaacgtta accacaagcc atccaacact aaggttgaca agagagttga gccaaagtcc 900

tgtgacaagt aatag 915

<210> 32

<211> 903

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 32

atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggctgcc 60

cctgttaaca ctaccactga agacgagact gctcaaattc cagctgaagc agttatcggt 120

tactctgacc ttgagggtga tttcgacgtc gctgttttgc ctttctctaa ctccactaac 180

aacggtttgt tgttcattaa caccactatc gcttccattg ctgctaagga agagggtgtc 240

tctctcgaga agagagacat cgttttgact caatccccag ctactttgtc cgttactcca 300

ggtaactccg tttccttgtc ctgtagagct tcccagtcca tcggtaacaa cttgcactgg 360

tatcagcaga agtctcacga gtccccaaga ctgttgatca agtacgcttc ccaatccatc 420

tccggtatcc catctagatt ctctggttct ggttccggta ctgacttcac tttgtccatc 480

aactccgttg agactgagga cttcggtatg tacttctgtc agcaatccaa ctcctggcca 540

tacacttttg gtggtggtac taagttggag atcaagagaa ctgttgctgc tccatccgtt 600

ttcatcttcc caccatctga cgagcagttg aagtctggta ctgcttccgt tgtttgtttg 660

ttgaacaact tctacccaag agaagctaag gttcagtgga aggttgacaa cgccttgcaa 720

tccggtaact cccaagagtc cgttactgaa caagactcca aggactctac ttactccttg 780

tcctccactt tgactttgtc caaggctgac tacgagaagc acaaggttta cgcttgtgag 840

gttactcacc agggtttgtc ctccccagtt actaagtcct tcaacagagg tgagtgttaa 900

tag 903

<210> 33

<211> 33

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 33

actacctgca ggcgaaacga tgagattccc atc 33

<210> 34

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 34

tcatggccga ggcggcccta ttacttgtca caggactttg gctc 44

<210> 35

<211> 39

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 35

ctatggccga ggcggcccta ttaacactca cctctgttg 39

<210> 36

<211> 39

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 36

tatcggccga ggcggcccta ttacttacct ggggacaag 39

<210> 37

<211> 39

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 37

ctatggccga ggcggcccta ttaacactca cctctgttg 39

<210> 38

<211> 32

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 38

cttgcctgca ggatgctaac ggccagttgg tc 32

<210> 39

<211> 40

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 39

gatcggccga ggcggcctca gcagtattcc caccagaatc 40

<210> 40

<211> 38

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 40

cttgcctgca ggatgtcagt tcatttcgtt atagcagc 38

<210> 41

<211> 52

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 41

gatcggccga ggcggcctca tataaaaggt ttatcataat tctcatcctc ag 52

<210> 42

<211> 43

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 42

gaaacctgca ggatgtctga atttgttgct aaaattaaca ttc 43

<210> 43

<211> 36

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 43

gatcggccga ggcggcctta ggcggttgga acgttc 36

<210> 44

<211> 39

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 44

gaaacctgca ggatgtctca tctattactg cgtgacagc 39

<210> 45

<211> 37

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 45

gatcggccga ggcggcctca tggcccggca tatctag 37

<210> 46

<211> 43

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 46

gacacctgca ggatgtctga atcctccagt atctctctag ttg 43

<210> 47

<211> 42

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 47

gatcggccga ggcggcccta gatacatccc aaaagtgcac cg 42

<210> 48

<211> 34

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 48

gatacctgca ggatgatcct gggttcagtt tggg 34

<210> 49

<211> 43

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 49

gatcggccga ggcggcccta aaagtttgct gcagcatttg aag 43

<210> 50

<211> 37

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 50

cttgcctgca ggatgggttg ctttagattt tgtctgg 37

<210> 51

<211> 42

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 51

gatcggccga ggcggcccta tttgtatacg tgctgtggag cc 42

<210> 52

<211> 42

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 52

cttgcctgca ggatgttaaa caagctgttc attgcaatac tc 42

<210> 53

<211> 41

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 53

gatcggccga ggcggcctta gctggcaagg gtaattgtct c 41

<210> 54

<211> 33

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 54

gacacctgca ggatggctcc tcaaacacca agg 33

<210> 55

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 55

gatcggccga ggcggcctca aaaaaacaat ctcaaaatct ccag 44

<210> 56

<211> 33

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 56

gtaccctgca ggatgaccaa ggaaaatgaa gcc 33

<210> 57

<211> 41

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 57

gatcggccga ggcggcctta ttttttctcc aattcagcca g 41

<210> 58

<211> 40

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 58

gaaacctgca ggatgctgtt gtcacatacc atgatacttc 40

<210> 59

<211> 43

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 59

gatcggccga ggcggcctta agattgcttc tttttgagat tgg 43

<210> 60

<211> 38

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 60

gaaacctgca ggatgacgga ctatgtcact tctaagcg 38

<210> 61

<211> 37

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 61

gatcggccga ggcggcctca taatctccct ccagggg 37

<210> 62

<211> 33

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 62

gaaacctgca ggatgtcgtc tgatgctgtg gag 33

<210> 63

<211> 46

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 63

gatcggccga ggcggcctca aataatgcta catttgcgtt tctttc 46

<210> 64

<211> 39

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 64

cttgcctgca ggatgtctta tacgtcggac aacaaagag 39

<210> 65

<211> 42

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 65

gatcggccga ggcggcctta cgtgtatccg cttcctctgt ac 42

<210> 66

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 66

gatacctgca ggatgaactt gtacctaatt acattactat tcgc 44

<210> 67

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 67

gatcggccga ggcggcctta gaacccacat tgatttggat actg 44

<210> 68

<211> 37

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 68

gaaacctgca ggatgtcgtt atcaaccttt ctaggcg 37

<210> 69

<211> 47

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 69

gatcggccga ggcggcctca gactctactc atcattttgt cttcctc 47

<210> 70

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 70

gaaacctgca ggatgatgta caggaactta ataattgcta ctgc 44

<210> 71

<211> 48

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 71

gatcggccga ggcggcccta acactctatg aggtctacaa tgtccaac 48

<210> 72

<211> 37

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 72

catgcctgca ggatgtctac agcaattcca ggaggac 37

<210> 73

<211> 46

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 73

gatcggccga ggcggcctta gttgatcaac tttcctgtca gcttag 46

<210> 74

<211> 39

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 74

gacacctgca ggatgagtgg tgaccataag agctttacg 39

<210> 75

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 75

gatcggccga ggcggcctta ctgtgtacca taccgatcca atcc 44

<210> 76

<211> 41

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 76

cttgcctgca ggatgactaa ctggaaagcg atattgactc c 41

<210> 77

<211> 49

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 77

gatcggccga ggcggcctta gttctcttct tcaccttgaa attttaggc 49

<210> 78

<211> 37

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 78

gcaacctgca ggatgtctta tcgccctcag tttcaac 37

<210> 79

<211> 51

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 79

gatcggccga ggcggcctca atagatcttt ttcttttcat caaaactcaa c 51

<210> 80

<211> 36

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 80

gatacctgca ggatggtggt gcacaaccct aataac 36

<210> 81

<211> 49

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 81

gatcggccga ggcggcccta ggtactatgc tgaacatcct gagtatgag 49

<210> 82

<211> 41

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 82

gaaacctgca ggatgagatt ttctaacgtc gttttaactg c 41

<210> 83

<211> 42

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 83

gatcggccga ggcggcctta caaggcaaag actccgaaag tg 42

<210> 84

<211> 38

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 84

gacacctgca ggatgactgt gcctgatctg aaagaaac 38

<210> 85

<211> 33

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 85

gatcggccga ggcggcctca ggccagcgca acg 33

<210> 86

<211> 46

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 86

cttgcctgca ggatgaagat atggctggta cttcttttag tttttg 46

<210> 87

<211> 43

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 87

gatcggccga ggcggcctca caattcgtct ctaatttgtt gcg 43

<210> 88

<211> 31

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 88

cttgcctgca ggatggagca ggttccagtc g 31

<210> 89

<211> 47

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 89

gatcggccga ggcggcctta ttcatcataa acttcttcta tggtggc 47

<210> 90

<211> 38

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 90

cttgcctgca ggatggatcc tttttcaatt cttctcac 38

<210> 91

<211> 47

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 91

gatcggccga ggcggcccta ctttggagac agatcttcca ccttaac 47

<210> 92

<211> 37

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 92

gaaacctgca ggatgaccag tcaaggattt ttggatc 37

<210> 93

<211> 49

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 93

gatcggccga ggcggcccta tatgctatca accatctcca tcaaataac 49

<210> 94

<211> 36

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 94

gacacctgca ggatgactcc ccgttctcat attttc 36

<210> 95

<211> 50

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 95

gatcggccga ggcggcccta ctcaaagaac ttagacaaag cagctttctc 50

<210> 96

<211> 29

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 96

gatccctgca ggatggcaga agaagaacc 29

<210> 97

<211> 54

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 97

gatcggccga ggcggcccta attagtaata cttgcttcta tttcctggta caac 54

<210> 98

<211> 40

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 98

gaaccctgca ggatgatttt gagcaagctg tcgtttagac 40

<210> 99

<211> 51

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 99

gatcggccga ggcggcctta tttattaaca atgacatcat cttcaaactc g 51

<210> 100

<211> 30

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 100

cttgcctgca ggatgggtgc cattggaatg 30

<210> 101

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 101

gatcggccga ggcggcccta ttgcagaaca ttcgatatcc aatc 44

<210> 102

<211> 36

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 102

gatacctgca ggatgctacc attttcgtac gacgtg 36

<210> 103

<211> 45

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 103

gatcggccga ggcggcccta taactctcca ttctcctcgt cgatc 45

<210> 104

<211> 47

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 104

gatccctgca ggatgaaaat attaagtgca ttgcttcttc tttttac 47

<210> 105

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 105

gatcggccga ggcggcctta tagctcttgg tgtaataact gggg 44

<210> 106

<211> 42

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 106

cttgcctgca ggatgtctaa accctacaag ctgataggtg ag 42

<210> 107

<211> 45

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 107

gatcggccga ggcggcctta atcttctcca gcaggtatct catcc 45

<210> 108

<211> 45

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 108

cttgcctgca ggatgaatca attttctcta gcttcacaag taaac 45

<210> 109

<211> 41

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 109

gatcggccga ggcggcccta ctcggttaat ggtccgagtg c 41

<210> 110

<211> 42

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 110

gacacctgca ggatgagtta taggaaagac aacaaacaaa ag 42

<210> 111

<211> 39

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 111

gatcggccga ggcggcctta gaaggcagct tcatcatcg 39

<210> 112

<211> 40

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 112

cttgcctgca ggatgagcag cttcagagtt ctagacttgg 40

<210> 113

<211> 35

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 113

gatcggccga ggcggcctta cagatcaacg aatcc 35

<210> 114

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 114

gatacctgca ggatgaacat ctttagaatc ctaggtaagt ttcc 44

<210> 115

<211> 39

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 115

gatcggccga ggcggcctca ttctggcagc ttgaatttc 39

<210> 116

<211> 45

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 116

cttgcctgca ggatgtccac aactactaag aaaaacaaga acagg 45

<210> 117

<211> 39

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 117

gatcggccga ggcggcctta ccatgcaccc tttcctctc 39

<210> 118

<211> 40

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 118

cttgcctgca ggatgtcaga ggagtaagaa ccacaaacag 40

<210> 119

<211> 45

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 119

gatcggccga ggcggcctca atttattcta ggttttttgg ttcgg 45

<210> 120

<211> 31

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 120

gtaccctgca ggatgatggc aagtccaacc g 31

<210> 121

<211> 34

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 121

gatcggccga ggcggcccgc aacaacgctg gttg 34

<210> 122

<211> 42

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 122

cttgcctgca ggatgagtaa ccagtataat ccgtatgagc ag 42

<210> 123

<211> 40

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 123

gatcggccga ggcggcccta tcttccccag tttccgacac 40

<210> 124

<211> 43

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 124

gttacctgca ggatgtctac agagaacaaa gcagagacaa aac 43

<210> 125

<211> 41

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 125

gatcggccga ggcggcccta tttctttgct tcagcgtttg c 41

<210> 126

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 126

cttgcctgca ggatgttaaa cttaatatcc acaataagtg ggtg 44

<210> 127

<211> 41

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 127

gatcggccga ggcggcctta agcaggagca gataaccaag c 41

<210> 128

<211> 42

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 128

cttgcctgca ggatgggtag aaggaaaata gagataaatc cg 42

<210> 129

<211> 43

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 129

gatcggccga ggcggcctca gctcttctta gtcacactgc ttg 43

<210> 130

<211> 40

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 130

cttgcctgca ggatgtcact tcaactgtcc attatcttcg 40

<210> 131

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 131

gatcggccga ggcggcccta ctcgtccttc ttgttgctct tctc 44

<210> 132

<211> 22

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 132

cgaacatcca tcaccaaaac ac 22

<210> 133

<211> 37

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 133

gttgtcgacc tgcagcgtac ggtgttgccg cgaaatg 37

<210> 134

<211> 37

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 134

catttcgcgg caacaccgta cgctgcaggt cgacaac 37

<210> 135

<211> 24

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 135

cggtgagaat ggcaaaagct tatg 24

<210> 136

<211> 21

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 136

aagcccgatg cgccagagtt g 21

<210> 137

<211> 41

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 137

cgtctcttgg gcaaattgat cagtggatct gatatcacct a 41

<210> 138

<211> 41

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 138

taggtgatat cagatccact gatcaatttg cccaagagac g 41

<210> 139

<211> 20

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 139

gactgttgcg attgctggtg 20

<210> 140

<211> 21

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 140

atccaggaca cgctcatcaa g 21

<210> 141

<211> 22

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 141

gtgtgtgctc tggaattgga tc 22

<210> 142

<211> 23

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 142

agaggaggtt gaatgcgaag aag 23

<210> 143

<211> 49

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 143

gttgtcgacc tgcagcgtac ttctggtgag cttatatggc agtagttac 49

<210> 144

<211> 49

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 144

gtaactactg ccatataagc tcaccagaag tacgctgcag gtcgacaac 49

<210> 145

<211> 24

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 145

cggtgagaat ggcaaaagct tatg 24

<210> 146

<211> 21

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 146

aagcccgatg cgccagagtt g 21

<210> 147

<211> 39

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 147

ctcgggatca ccaagcacaa gtggatctga tatcaccta 39

<210> 148

<211> 39

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 148

taggtgatat cagatccact tgtgcttggt gatcccgag 39

<210> 149

<211> 23

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 149

tcaaagtatg ctgggaagaa tgg 23

<210> 150

<211> 18

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 150

tggattgtct cggaggcg 18

<210> 151

<211> 26

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 151

tactatgact atgggagacc tgggtg 26

<210> 152

<211> 19

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 152

tgaagcatcc cacccactg 19

<210> 153

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 153

gttgtcgacc tgcagcgtac ccttcgcaga ctgtaattat tggc 44

<210> 154

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 154

gccaataatt acagtctgcg aagggtacgc tgcaggtcga caac 44

<210> 155

<211> 24

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 155

cggtgagaat ggcaaaagct tatg 24

<210> 156

<211> 21

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 156

aagcccgatg cgccagagtt g 21

<210> 157

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 157

gttgactttg acggttgcag atacagtgga tctgatatca ccta 44

<210> 158

<211> 44

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 158

taggtgatat cagatccact gtatctgcaa ccgtcaaagt caac 44

<210> 159

<211> 27

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 159

ttctctcctt gattatcggt ctctttc 27

<210> 160

<211> 21

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 160

tggcagatga cttcacaaac g 21

<210> 161

<211> 25

<212> DNA

<213> 人工

<220>

<223> 合成的構建體

<400> 161

gtggcatctt tcataacgac atctc 25

<210> 162

<211> 478

<212> PRT

<213> 巴斯德畢赤酵母

<400> 162

Met Ser Ser Phe Arg Val Leu Asp Leu Val Lys Pro Phe Thr Pro Phe

1 5 10 15

Leu Pro Glu Val Ile Ser Pro Glu Arg Lys Val Pro Phe Gln Gln Lys

20 25 30

Leu Met Trp Thr Gly Val Thr Leu Leu Ile Phe Leu Val Met Ser Glu

35 40 45

Ile Pro Leu Tyr Gly Ile Thr Ser Ser Asp Ser Ser Asp Pro Leu Phe

50 55 60

Trp Leu Arg Met Met Leu Ala Ser Asn Arg Gly Thr Leu Met Glu Leu

65 70 75 80

Gly Ile Ser Pro Ile Val Thr Ser Gly Met Val Phe Gln Leu Leu Gln

85 90 95

Gly Ile Gln Ile Leu Asp Val Asn Met Glu Asn Lys Ala Asp Arg Glu

100 105 110

Leu Phe Gln Thr Ala Gln Lys Val Phe Ala Ile Leu Leu Ser Ile Gly

115 120 125

Gln Ala Thr Val Tyr Val Leu Thr Gly Met Tyr Gly Pro Pro Gly Glu

130 135 140

Leu Gly Val Gly Val Cys Leu Leu Leu Val Leu Gln Leu Val Phe Ala

145 150 155 160

Gly Ile Val Val Ile Leu Leu Asp Glu Leu Leu Gln Lys Gly Tyr Gly

165 170 175

Leu Gly Ser Gly Ile Ser Leu Phe Met Ala Thr Asn Ile Cys Glu Gln

180 185 190

Ile Phe Trp Lys Thr Phe Ala Pro Thr Thr Val Asn Arg Gly Arg Gly

195 200 205

Lys Glu Phe Glu Gly Ala Phe Ile Ser Phe Phe His Leu Ile Leu Thr

210 215 220

Lys Lys Asp Lys Lys Arg Ala Leu Leu Glu Ser Phe Tyr Arg Asp Asn

225 230 235 240

Ala Pro Asn Met Phe Gln Val Ile Ala Thr Leu Val Val Phe Phe Thr

245 250 255

Val Val Tyr Leu Gln Gly Phe Arg Leu Glu Ile Pro Val Lys Ser Thr

260 265 270

Arg Gln Arg Gly Pro Tyr Gly Thr Tyr Pro Ile Arg Leu Phe Tyr Thr

275 280 285

Ser Asn Met Pro Ile Met Leu Gln Ser Ala Leu Thr Ser Asn Ile Phe

290 295 300

Ile Ile Ser Gln Met Leu Tyr Ser His Phe Pro Asp Asn Ala Phe Val

305 310 315 320

Lys Leu Ile Gly Thr Trp Glu Ala Gln Pro Gly Ser Ala Gln Leu Phe

325 330 335

Ala Ala Ser Gly Leu Ala Tyr Tyr Met Gln Pro Pro Met Ser Leu Ser

340 345 350

Gln Ala Leu Leu Asp Pro Ile Lys Thr Val Val Tyr Val Val Phe Val

355 360 365

Leu Thr Thr Cys Ala Ile Phe Ser Lys Thr Trp Ile Glu Ile Ser Gly

370 375 380

Ser Ser Pro Arg Asp Val Ala Lys Gln Phe Lys Asp Gln Gly Leu Val

385 390 395 400

Ile Ala Gly His Arg Asp Ala Thr Val Tyr Lys Glu Leu Lys Lys Ile

405 410 415

Ile Pro Thr Ala Ala Ala Phe Gly Gly Ala Thr Ile Gly Ala Leu Ser

420 425 430

Val Val Ser Asp Leu Leu Gly Thr Leu Gly Ser Gly Thr Ser Ile Leu

435 440 445

Leu Ala Val Thr Thr Ile Tyr Gly Tyr Tyr Glu Leu Ala Val Lys Glu

450 455 460

Gly Gly Phe Ser Lys Gly Gly Pro Ser Gly Phe Val Asp Leu

465 470 475

<210> 163

<211> 1437

<212> DNA

<213> 巴斯德畢赤酵母

<400> 163

atgagcagct tcagagttct agacttggta aagcccttta ccccatttct gcctgaggtt 60

atctctccag agagaaaggt cccctttcaa cagaagttga tgtggactgg agtcactctt 120

ctgatcttct tggtcatgag tgaaattccc ctgtatggta tcacttcaag tgactcctct 180

gaccctttgt tttggctgcg tatgatgttg gcctctaaca gaggaacgct gatggagtta 240

ggtatctctc ctattgtcac ttctggaatg gtgttccaac tgttgcaggg aatccaaatc 300

ttggacgtga acatggaaaa caaagcagac agagagttgt tccaaactgc tcaaaaagtg 360

ttcgccattt tgctgagtat cggacaagct actgtttatg ttttaactgg aatgtatggc 420

ccccctggtg aactaggagt tggtgtctgt cttttgttgg ttcttcaatt ggtgtttgca 480

ggtattgtgg tcattttgtt ggatgaactc ttacaaaaag gttacggttt aggaagtgga 540

atttctcttt tcatggccac caacatttgt gagcagattt tttggaagac ttttgctcct 600

accaccgtta accgtggaag aggtaaggaa tttgaaggag ctttcatttc tttctttcac 660

ctgatcttga ccaagaagga caagaagaga gctctgttgg aatcatttta cagagacaac 720

gctccaaaca tgttccaagt tattgctact cttgtcgtct ttttcaccgt tgtctatctt 780

cagggcttcc gtttggagat tccagttaag tctacccgtc aaagaggtcc ttacggaact 840

tacccaatca gattgttcta cacatccaac atgccaatca tgttacaatc cgctttgacc 900

tcaaacattt tcattatttc ccagatgttg tattcacact tccctgacaa tgcctttgtt 960

aagctcattg gaacttggga agctcaacct ggttcagcac aactgtttgc tgcctcggga 1020

ttagcctact acatgcagcc tccaatgtcc ctgagtcaag ctttattaga ccctatcaag 1080

actgtcgtct acgttgtgtt tgttttgacc acttgtgcca tcttctccaa gacatggatt 1140

gagatttcgg gatcttcccc aagagacgtt gctaagcaat tcaaagacca aggattggtt 1200

attgctggac acagagatgc tactgtttac aaggagttga agaagattat accaacagcc 1260

gctgcatttg gaggtgccac aattggtgca ctttccgttg tttccgacct tttgggtact 1320

ttaggttcgg gaacctccat ccttttggct gttacaacca tctatggtta ctacgagttg 1380

gctgttaagg aaggtggttt ttcaaagggt ggaccctctg gattcgttga tctgtaa 1437

當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影