<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

蛋白質和多肽的制備的制作方法

文檔序號:3571115閱讀:525來源:國知局
專利名稱:蛋白質和多肽的制備的制作方法
技術領域
本發明涉及制備蛋白質和多肽,且更具體地涉及制備蜘蛛絲蛋白(拖絲蛋白)和其他非拖絲蛋白的蛋白質和多肽的領域。本發明提供了制備期望的蛋白質的方法,該期望的蛋白質可以是拖絲蛋白的蛋白質/多肽或非拖絲蛋白的蛋白質/多肽。還提供了用于制備期望的蛋白質和多肽的新型融合蛋白中間體以及編碼這些中間體的多核酸(polynucleic acid)分子。
背景技術
由DNA制備蛋白質和多肽可在多種宿主中實現,但常見的問題是不溶性蛋白質/ 多肽聚集體的形成。這可嚴重地妨礙或甚至阻止功能性蛋白質/多肽的產生。針對該問題的一個解決方案是將期望的蛋白質或多肽與提供所需要的溶解度的蛋白質或多肽表達成融合蛋白。該融合蛋白可被裂解,從而分離期望的蛋白質。對于低溶解度蛋白質和多肽例如膜相關蛋白質和多肽,該問題通常加重。例如,肺表面活性蛋白C(SP-C ;表6)是由肺泡II型細胞產生的跨膜蛋白并且是防止肺泡在呼氣結束時萎陷所需要的表面活性物質的成分。新生兒經常因表面活性物質的量不足而患呼吸窘迫。如今,用從動物的肺部提取的表面活性物質制劑治療該病癥。SP-C-33是SP-C的變體,其中跨膜螺旋中的殘基(通常主要是纈氨酸)被換成亮氨酸。SP-C-33保留了天然SP-C的功能,包括在膜中的適當插入,但是不太易于聚集且因此大量生產用于開發合成的表面活性物質制劑是可行的。因為迄今為止由DNA制備SP-C-33是不可能的,所以如今通過化學合成來制造。當由重組DNA表達時遇到困難的蛋白質和多肽的其他實例是A β -肽、IAPP、PrP、α-突觸核蛋白、降鈣素、催乳素、半胱氨酸蛋白酶抑制劑、ATF和肌動蛋白;SP_B、α -防衛素和β -防衛素;Α-Η類載脂蛋白;LL-37、SP-C, SP_C33Leu、Brichos, GFP、神經絲抑蛋白;激素,包括EPO和GH,及生長因子包括IGF-I和IGF-II ;親和素和鏈霉親和素;和蛋白酶3C。發明概沭本發明的目的是提供用于制備蛋白質和多肽,且特別是非拖絲蛋白的蛋白質和多肽的新型手段和方法。提供用于制備在水中具有低的溶解度的蛋白質和多肽,且特別是非拖絲蛋白的蛋白質和多肽,例如當由重組DNA產生時易于聚集的蛋白質和多肽、膜蛋白和多肽及淀粉樣形態(amyloid-forming)的蛋白質和多肽的新型手段和方法也是本發明的目的。本發明的另一個目的是提供用于制備蛋白質或多肽藥物及藥靶的替代手段和方法。本發明的目的是提供用于制備含二硫鍵的蛋白質和多肽的新型手段和方法。提供用于制備載脂蛋白的新型手段和方法也是本發明的目的。為了這些目的和從以下說明書中將明顯的其他目的,本發明提供了根據第一方面的在生產期望的蛋白質或多肽的方法中有用的融合蛋白。融合蛋白本身可能是有用的,或其可被裂解以獲得分離形式的期望的蛋白質或多肽。根據本發明的融合蛋白包含(i)衍生自蜘蛛絲蛋白的N端(NT)片段的至少一個溶解度增強部分;和(ii)是期望的蛋白質或多肽的至少一個部分;其中每個溶解度增強部分與期望的蛋白質或多肽部分直接或間接連接。在融合蛋白的某些實施方式中,每個溶解度增強部分與SEQ ID NO 6具有至少80%的同一性或與SEQ ID NO 8具有至少50%的同一性。在融合蛋白的特定實施方式中,每個溶解度增強部分包含100至160個氨基酸殘基。在一個實施方式中,融合蛋白受制于如下條件當融合蛋白包含衍生自蜘蛛絲蛋白的N端(NT)片段的單一溶解度增強部分時,則期望的蛋白質或多肽是非拖絲蛋白的蛋白質或多肽。在優選的實施方式中,期望的蛋白質或多肽是非拖絲蛋白的蛋白質或多肽。在一些實施方式中,期望的蛋白質或多肽與SEQ ID NO :6-10中的任何一個具有小于30%的同 一性。在某些實施方式中,融合蛋白包含至少兩個溶解度增強部分,所述溶解度增強部分的每一個衍生自蜘蛛絲蛋白的N端(NT)片段。在特定實施方式中,融合蛋白包含至少兩個連續的溶解度增強部分,所述溶解度增強部分的每一個衍生自蜘蛛絲蛋白的N端(NT)片段。在融合蛋白的一些實施方式中,至少一個溶解度增強部分與至少一個期望的蛋白質或多肽部分的氨基末端或羧基末端直接或間接連接。在特定實施方式中,至少一個溶解度增強部分構成融合蛋白的氨基末端和/或羧基末端。在一個實施方式中,融合蛋白還包含(iii)設置在至少一個期望的蛋白質或多肽部分與至少一個溶解度增強部分之間的至少一個裂解位點。在融合蛋白的某些實施方式中,期望的蛋白質或多肽衍生自海綿動物(sponges)、木節水母(comb jellies)、水母(jellyfishes)、珊瑚(corals)、海葵(anemones)、扁蟲(flatworms)、輪蟲(rotifers)、蟲回蟲(roundworms)、紐蟲(ribbon worms)、給(clams)、蝸牛(snails)、章魚(octopuses)、節肢蟲(segmented worm)、甲殼動物(crustaceans)、昆蟲、苔蘚動物(bryozoans)、腕足動物(brachiopods)、帚蟲類(phoronids)、海星(seastars)、海膽(sea urchins)、被囊動物(tunicates)、文昌魚(Iancelets)、包括人類的脊椎動物、植物、真菌、酵母、細菌、古細菌或病毒或是人工蛋白質或多肽。在特定實施方式中、期望的蛋白質或多肽衍生自軟體動物、昆蟲、包括人類的脊椎動物、植物、真菌、酵母、細菌、古細菌或病毒或是人工蛋白質或多肽。在另外的特定實施方式中,期望的蛋白質或多肽衍生自包括人類的脊椎動物、植物、真菌、酵母、細菌、古細菌或病毒或是人工蛋白質或多肽。在融合蛋白的一些實施方式中,期望的蛋白質或多肽選自由淀粉樣形態的蛋白質和多肽、含二硫鍵的蛋白質和多肽、載脂蛋白、膜蛋白和多肽、蛋白質和多肽藥物與藥靶、易于聚集的蛋白質和多肽、及蛋白酶組成的組。在融合蛋白的特定實施方式中,期望的蛋白質或多肽選自由以下組成的組Α β -肽、IAPP, PrP, α -突觸核蛋白、降鈣素、催乳素、半胱氨酸蛋白酶抑制劑、ATF和肌動蛋白;SP-B、a-防衛素和β-防衛素;Α_Η類載脂蛋白;LL_37、SP-C, SP-C33、SP-C33Leu、fcichos、GFP、神經絲抑蛋白;激素,包括EPO和GH,及生長因子,包括IGF-I和IGF-II ;親和素和鏈霉親和素;和蛋白酶3C。融合蛋白的優選實施方式選自由SEQ ID NO 26、28、30、34、37、39、42和47和與這些蛋白質中的任何一種具有至少80%,優選地至少90%,更優選地至少95%的同一性的蛋白質組成的組。根據特定的方面,期望的蛋白質或多肽是拖絲蛋白的蛋白質或多肽。優選的期望的拖絲蛋白的蛋白質包含70至300個氨基酸殘基的重復片段,該片段衍生自蜘蛛絲蛋白的重復片段;和70至120個氨基酸殘基的C端片段,該片段衍生自蜘蛛絲蛋白的C端片段,和任選地100至160個氨基酸殘基的N端片段,該片段衍生自蜘蛛絲蛋白的N端片段。另外優選的期望拖絲蛋白的蛋白質選自由式REP-CT和NT-REP-CT定義的蛋白質的組,其中NT是具有100至160個氨基酸殘基的蛋白質片段,該片段是衍生自蜘蛛絲蛋白的N端片段;REP是具有70至300個氨基酸殘基的蛋白質片段,其中所述片段選自L (AG) nL、L (AG)nAL、L (GA)nUL(GA)nGL的組,其中η是從2至10的整數;每個單獨的A區段是8至18個氨基酸殘基的氨基酸序列,其中這些氨基酸殘基中的O至3個不是Ala,且剩余的氨基酸殘基是Ala ;每個單獨的G區段是12至30個氨基酸殘基的氨基酸序列,其中至少40%的氨基酸殘基是Gly ;且每個單獨的L區段是O至20個氨基酸殘基的接頭氨基酸序列;且CT是具有70至120個氨基酸殘基的蛋白質片段,該片段是衍生自蜘蛛絲蛋白的C端片段。根據另一方面,本發明提供了編碼根據本發明的融合蛋白的分離的多核酸。分離的多核酸的優選實施方式選自由編碼選自由SEQ ID NO 26、28、30、34、37、39、42和47組成的組的融合蛋白和與這些蛋白質中的任何一種具有至少80%,優選地至少90%,更優選地至少95%的同一性的蛋白質的核酸組成的組;以及由SEQ ID NO 27、29、31、38、40、43和48組成的核酸的組。根據一個方面,本發明提供了衍生自蜘蛛絲蛋白的N端(NT)片段的至少一個部分作為融合蛋白中的溶解度增強部分用于制備期望的蛋白質或多肽的新型用途。在優選的實施方式中,期望的蛋白質或多肽是非拖絲蛋白的蛋白質或多肽。在一個實施方式中,融合蛋白受制于如下條件當融合蛋白包含衍生自蜘蛛絲蛋白的N端(NT)片段的單一溶解度增強部分時,則期望的蛋白質或多肽是非拖絲蛋白的蛋白質或多肽。在特定的實施方式中,期望的蛋白質或多肽是拖絲蛋白的蛋白質或多肽。根據另一方面,本發明提供了制備融合蛋白的方法,所述方法包括以下步驟a)在合適的宿主中表達根據本發明的融合蛋白;和《獲得包含該融合蛋白的混合物并任選 地分離該融合蛋白。根據有關的方面,本發明提供了制備期望的蛋白質或多肽的方法,該方法包括以下步驟a)在合適的宿主中表達根據本發明的融合蛋白;和《獲得包含該融合蛋白或多肽的混合物,并任選地分離該融合蛋白或多肽。在某些實施方式中,該方法還包括以下步驟
c)裂解融合蛋白以提供期望的蛋白質或多肽;和d)分離期望的蛋白質或多肽;其中所述融合蛋白包含(iii)設置在至少一個期望的蛋白質或多肽部分與至少一個溶解度增強部分之間的至少一個裂解位點。在這些方法的某些實施方式中,步驟b)還包括在具有固定的NT部分的親和介質上和/或在陰離子交換介質上純化融合蛋白。在特定實施方式中,通過結合6. 3或更低的PH下的具有固定的NT部分的親和介質,然后用期望的離解介質從親和介質上離解,進行融合蛋白在親和介質上的純化。在另外的特定實施方式中,離解介質具有6. 4或更高的pH、4. I或更低的pH和/或具有高的離子強度。在一些實施方式中,通過結合6. 4或更高的pH下的陰離子交換介質,然后用具有高離子強度的離解介質從陰離子交換介質上離解,進行融合蛋白在陰離子交換介質上的純化。在這些方法的一些實施方式中,步驟b)中的融合蛋白的純化發生在柱中、具有官能化表面的磁珠上或具有官能化表面的濾器上。所附序列列表SEQID NOI4Rep24RepCT3NT4Rep4NT5Rep·
5NT4RepCTHis6NT7CT8共有NT序列9共有CT序列10來自 Euprosthenops australis MaSpl 的重復序列11共有G區段序列I12共有G區段序列213共有G區段序列314NT4Rep (DNA)15NT4RepCT(DNA)16NT5Rep (DNA)17NT4RepCTHis 218NT4RepCTHis 2(DNA)19ZbasicNT4RepCT20NT4R 印 CT21HisTrxHisThrNT4RepCT22NT4RepCT 223HisNTNT4RepCT24HisNTNT4RepCT(DNA)25NT8R 印 CT26HisNTMetSP-C33Leu27HisNTMetSP_C33Leu(DNA)28HisNTNTMetSP-C33Leu29HisNTNTMetSP_C33Leu(DNA)30HisNTNTMetLL3731HisNTNTMetLL37(DNA)32NTHis33HisNTNT8RepCT34HisNTNTBrichos
35 HisTrxHisSP-C33Leu36 HisTrxHisSP-C33Leu(DNA)37 HisTrxNtSP-C33Leu38 HisTrxNtSP-C33Leu(DNA)39 2HisNtNtQGBrichos40 2HisNtNtQGBrichos(DNA)41 Brichos
42 2HisNtNtQGGFP 43 2Hi SNtNtQGGFP(DNA)44 GFP (綠色熒光蛋白)45 ZbGFP46 HisABPGFP47 2HisNtNtQGNS48 2HisNtNtQGNS(DNA)49 NS (神經絲抑蛋白)附圖
簡沭圖I示出了拖絲蛋白N端結構域的序列比對。圖2示出了拖絲蛋白C端結構域的序列比對。圖3示出了融合蛋白的電泳凝膠。圖4示出了從融合蛋白獲得的SP_C33Leu蛋白的電泳凝膠。圖5示出了包含從融合蛋白獲得的SP_C33Leu的表面活性物質懸浮液的體外表面活性。圖6示出了 SP_C33Leu融合蛋白的電泳凝膠。圖7示出了 Brichos融合蛋白的電泳凝膠。圖8示出了 GFP融合蛋白和從該融合蛋白獲得的GFP的電泳凝膠。圖9示出了神經絲抑蛋白融合蛋白和從該融合蛋白獲得的神經絲抑蛋白的電泳凝膠。發明詳述本發明涉及蛋白質和多肽,且特別是非拖絲蛋白的蛋白質和多肽的制備。取決于該制備的目的,終產物可變化。例如可能期望獲得插入在脂質膜中、在溶液中或與其他生物分子結合的蛋白質或多肽。還應認識到還可能非常期望獲得作為融合蛋白的一部分的期望蛋白質或多肽,該融合蛋白可提供用于純化和檢測的合適工具和/或提供期望的性質例如穩定性和溶解度。本發明總體上基于對蜘蛛絲蛋白的N端(NT)片段在由重組DNA產生的融合蛋白中作為溶解度增強部分的有用性的洞察。因此,本發明提供了根據第一方面的融合蛋白,其包含(i)衍生自蜘蛛絲蛋白的NT片段的至少一個溶解度增強部分;和(ii)是期望的蛋白質或多肽的至少一個部分。在優選的實施方式中,融合蛋白由以下組成(i)衍生自蜘蛛絲蛋白的NT片段的至少一個溶解度增強部分;和(ii)是期望的蛋白質或多肽的至少一個部分,任選地包括本文公開的其他優選的特征,例如,溶解度增強部分與期望的蛋白質或多肽之間的接頭肽和/或裂解位點。在實驗中,已在大腸桿菌(E. coli)中實現了不同融合蛋白的令人驚奇地高的收率。融合蛋白本身作為分離的形式可能是有用的,例如,用于以可溶解形式研究本來聚集或可溶性差的蛋白質,或用在與X-射線晶體學有關的結晶作用中。融合蛋白還可被裂解以釋放期望的蛋白質。術語“融合蛋白”此處指通過由重組核酸,即通過組合正常情況下不會一起出現的兩個或更多個核酸序列而人工創造的DNA或RNA表達而制備的蛋白質(遺傳工程)。根據本發明的融合蛋白是重組蛋白,且因此其不同于天然存在的蛋白質。特別地,因為野生型拖絲蛋白不是由以上列出的重組核酸表達的,所以其不是 根據本發明的融合蛋白。組合的核酸序列編碼具有特定功能特性的不同蛋白質、部分蛋白質或多肽。所得的融合蛋白或重組融合蛋白是具有衍生自原始蛋白質、部分蛋白質或多肽中的每一種的功能特性的單一蛋白質。在某些實施方式中,根據本發明的任何蛋白和相應的基因是嵌合的,S卩,該蛋白質/基因片段衍生自至少兩種不同的種類。溶解度增強部分衍生自蜘蛛絲蛋白的N端片段。根據該方面,優選期望的蛋白質或多肽是非拖絲蛋白的蛋白質。這意味著期望的蛋白質或多肽不衍生自蜘蛛絲蛋白的C端片段、重復片段或N端片段。根據本發明的融合蛋白還可包含一個或多個接頭肽。接頭肽可設置在溶解度增強部分與期望的蛋白質或多肽部分之間,或可設置在溶解度增強部分和期望的蛋白質或多肽部分的任何一端。如果融合蛋白包含兩個或更多個溶解度增強部分,接頭肽還可設置在兩個溶解度增強部分之間。接頭可在融合蛋白的功能單元之間提供間隔區,而且還可構成用于鑒定和純化該融合蛋白的工具,例如,His和/或Trx標簽。如果融合蛋白包含用于鑒定和純化融合蛋白的兩個或更多個接頭肽,優選它們被間隔序列隔開,例如His6-間隔區-His6_。接頭還可構成將融合蛋白指導到膜和/或致使融合蛋白從宿主細胞分泌到周圍介質中的信號肽,例如信號識別顆粒。融合蛋白還可在其氨基酸序列中包括允許裂解并去除接頭和/或一個或多個溶解度增強部分的裂解位點。各種裂解位點是本領域技術人員已知的,例如,針對化學劑的裂解位點,例如Met殘基之后的CNBr裂解位點和Asn-Gly殘基之間的羥胺裂解位點,針對蛋白酶例如凝血酶或蛋白酶3C的裂解位點,和自我剪接序列,例如內含肽(intein)自我剪接序列。每個溶解度增強部分與期望的蛋白質或多肽部分直接或間接連接。直接連接指兩個部分之間的直接共價結合而無間插序列例如接頭。間接連接也是指兩個部分通過共價鍵連接,但是存在間插序列,例如接頭和/或一個或多個另外的溶解度增強部分。至少一個溶解度增強部分可設置在期望的蛋白質或多肽的任何一端,即,設置在C端或設置在N端。優選至少一個溶解度增強部分設置在期望的蛋白質或多肽的N末端。如果融合蛋白包含用于鑒定和純化融合蛋白的一個或多個接頭肽,例如,His或Trx標簽,優選地其被設置在融合蛋白的N末端。至少一個溶解度增強部分還可整合到期望的蛋白質或多肽內,例如在期望的蛋白質的結構域或部分之間。在優選的實施方式中,至少一個溶解度增強部分構成融合蛋白的N末端和/或C末端,即,無接頭肽或其他序列存在于溶解度增強部分的末端。根據本發明的典型融合蛋白可包含1-6個,例如1-4個,例如1-2個溶解度增強部分。在優選的實施方式中,融合蛋白包含至少兩個溶解度增強部分,所述溶解度增強部分的每一個衍生自蜘蛛絲蛋白的N端(NT)片段。溶解度增強部分,優選地兩個溶解度增強部分可連續地設置在期望的蛋白質或多肽的任何一端,即,設置在C端或設置在N端。連續設置的溶解度增強部分還可整合到期望的蛋白質或多肽內,例如在期望的蛋白質的結構域或部分之間。溶解度增強部分還可不連續地設置,位于期望的蛋白質或多肽部分的每個末端,即設置在C端和N端,或位于期望的蛋白質或多肽的一個末端和整合到期望的蛋白質或多肽內。根據本發明的典型的優選融合蛋白可包含2-6個,例如2-4個溶解度增強部分。在優選的實施方式中,根據本發明的融合蛋白具有設置在至少一個期望的蛋白質或多肽部分與至少一個溶解度增強部分之間的至少一個裂解位點。這允許融合蛋白的裂解和期望的蛋白質的純化。然而應注意可能期望獲得作為融合蛋白的一部分的期望的蛋白質或多肽,該融合蛋白可提供用于純化和檢測的合適工具和/或提供期望的性質例如穩定性和溶解度。在這種情況下,可省略裂解位點,或可包括裂解位點而省略裂解步驟。優選的融合蛋白具有設置在N端的溶解度增強部分通過1-30個氨基酸殘基,例如 1-10個氨基酸殘基的接頭肽偶聯到設置在C端的期望的蛋白質或多肽的形式。接頭肽可包含裂解位點。任選地,融合蛋白具有可包含純化標簽例如His標簽和裂解位點的N端或C %5接頭妝。另一種優選的融合蛋白具有設置在N端的溶解度增強部分直接偶聯到設置在C端的期望的蛋白質或多肽的形式。任選地,融合蛋白具有可包含純化標簽例如His標簽和裂解位點的N端或C端接頭肽。一種優選的融合蛋白具有兩個連續的設置在N端的溶解度增強部分通過1-30個氨基酸殘基,例如1-10個氨基酸殘基的接頭肽偶聯到設置在C端的期望的蛋白質或多肽的形式。接頭肽可包含裂解位點。任選地,融合蛋白具有可包含純化標簽例如HiS標簽和裂解位點的N端或C端接頭肽。另一種優選的融合蛋白具有兩個連續的設置在N端的溶解度增強部分直接偶聯到設置在C端的期望的蛋白質或多肽的形式。任選地,融合蛋白具有可包含純化標簽例如His標簽和裂解位點的N端或C端接頭肽。溶解度增強部分衍生自蜘蛛絲蛋白或拖絲蛋白的NT片段。雖然實例必然地涉及特定的NT片段,在這種情況下,為衍生自來自Euprosthenops australis的主要拖絲蛋白I (major spidroin I,MaSpl),但認為本文公開的方法適用于任何相似的蛋白質部分。術語“拖絲蛋白(spidroin) ”和“蜘蛛絲蛋白(spider silk protein) ”遍及說明書互換地使用并包括所有已知的蜘蛛絲蛋白,包括通常縮寫為“MaSp”或在十字園蛛(Araneus diadematus)的情形中縮寫為“ADF”的大壺狀蜘蛛絲蛋白(major ampul late spider silk protein)。這些大壺狀蜘蛛絲蛋白通常具有I和2兩種類型。此外,這些術語包括如所附權利要求和逐條列舉的實施方式中定義的根據本發明的新型NT蛋白質片段和與已知的蜘蛛絲NT蛋白質片段具有高度的同一性和/或相似性的其他非天然蛋白質。溶解度增強部分與蜘蛛絲蛋白的N端(NT)氨基酸序列具有高度的相似性。如圖I所示,在多個物種和蜘蛛絲蛋白,包括MaSpl和MaSp2之間,該氨基酸序列相當保守。在圖I中,比對了以GenBank登記條目表示(如果合適的話)的下列拖絲蛋白NT片段表I-拖絲蛋白NT片段物種和拖絲蛋白的·$■白質Gcnlank登記號
Ea MaSpI Euprosthmops australis MaSp IAM259067
LgMaSpl ) · M蛛(Lafmdectm geometricm) MaSp IABY67420
LhMaSpl 黑寡婦修蛛MaSp IABY67414
Ne MaSp I 絡新婦蛛(NepMa chwipes) MaSp IACF19411
Al MaSp2 三帶金蛛trifasciatd) MaSp 2AAZ15371
Lg MaSpl 幾何寇蛛 MaSp 2ABY6741
Lh MaSpl 黑寡婦蜘蛛 MaSp 2ABR68855·Nim MaSp2 馬達加斯加紅腿金色_網修蛛切AAZ15322
ma.dagmcari.emis、MaSp 2 Ne MaSp2 絡新婦蛛 MaSp 2ACF194I3
AbCySpl 橫紋金蛛Ari TOi/c/w—)圓柱狀拖絲蛋白 IBAE86855
MclCySpl 棒絡新婦(M /i/i// c/ovoto)國柱狀拖絲蛋白 iBAE54451
LliTuSpi 黑寡婦焓蛛管狀拖絲蛋白ABD24296
Ne Flag 絡新婦蛛鞭形絲蛋白AF027972
Nim Fiag 馬達加斯加紅腿金色圖網修蛛鞭形絲蛋白AF218623
(翻譯)僅示出了對于每個序列的對應于N端結構域的部分,省略了信號肽。Ne flag和Nim flag 是根據 Rising A.等人 Biomacromolecules 7, 3120-3124 (2006)翻譯和編輯的。只要溶解度增強部分未完全缺失,哪種特定的溶解度增強部分存在于根據本發明的融合蛋白中不是關鍵的。因此,根據本發明的溶解度增強部分可選自圖I中示出的氨基酸序列或具有高度相似性的序列中的任何一種。各種各樣的溶解度增強序列可用于根據本發明的融合蛋白中。基于圖I的同源序列,下列序列構成共有溶解度增強氨基酸序列QANTPWSSPNLADAFINSF(M/L)SA(A/I)SSSGAFSADQLDDMSTIG(D/N /Q)TLMSAMD(N/S/K)MGRSG(K/R)STKSKLQALNMAFASSMAEIAAAE SGG (G/Q)SVGVKTNAISDALSSAFYQTTGSVNPQFV(N/S)EIRSLI(G/N)M(F/L)(A/S)QASANEV(SEQ ID NO 8)。根據本發明的溶解度增強部分的序列與基于圖I的氨基酸序列的共有氨基酸序列SEQ ID NO 8具有至少50%的同一性,優選地至少60%的同一性。在優選的實施方式中,根據本發明的溶解度增強部分的序列與共有氨基酸序列SEQ ID NO 8具有至少65%的同一性,優選地至少70%的同一性。此外,在優選的實施方式中,根據本發明的溶解度增強部分與共有氨基酸序列SEQ ID NO 8具有70%,優選80%的相似性。根據本發明的代表性的溶解度增強部分是Euprosthenops australis序列SEQ IDNO 6。根據本發明的優選實施方式,溶解度增強部分與SEQ ID NO 6或圖I中的任何單獨的氨基酸序列具有至少80%的同一性。在本發明的優選實施方式中,溶解度增強部分與SEQID NO 6或圖I中任何單獨的氨基酸序列具有至少90%,例如至少95%的同一性。在本發明的優選實施方式中,溶解度增強部分與SEQ ID NO 6或圖I中任何單獨的氨基酸序列,特別是與Ea MaSpl相同。如下計算遍布說明書和所附權利要求使用的術語同一性”。使用CLUSTAL W算法(Thompson, J. D., Higgins, D. G.和 Gibson, T. J. , Nucleic Acids Research,22 4673-4680 (1994))比對查詢序列與靶序列。在對應所比對的序列中的最短序列的窗口上進行對比。對比每個位置的氨基酸殘基,并將在靶序列中具有相同對應位置的查詢序列中的位置的百分比報告為%同一性。按對同一性”所描述的計算遍布說明書和所附權利要求使用的術語相似性”,但以下除外疏水殘基Ala、Val、Phe、Pro、Leu、He, Trp, Met和Cys是相似的,堿性殘基Lys、Arg和His是相似的;酸性殘基Glu和Asp是相似的;且親水性的、不帶電荷的殘基Gln、Asn、Ser、Thr和Tyr是相似的之外。在該上下文中剩余的天然氨基酸Gly不與任何其他氨基酸相似。
遍布本說明書,根據本發明的替代實施方式實現了相應百分比的相似性,而不是指定百分比的同一性。其他替代實施方式實現了指定百分比的同一性以及選自對于每個序列的優選百分比的同一性的組的另一個較高百分比的相似性。例如,某序列可能與另一序列70%相似;或其可能與另一序列70%相同;或其可能與另一序列70%相同且90%相似。溶解度增強部分包含100至160個氨基酸殘基。優選溶解度增強部分包含至少100,或多于110,優選地多于120個氨基酸殘基。還優選溶解度增強部分包含至多160,或少于140個氨基酸殘基。典型的溶解度增強部分包含約130-140個氨基酸殘基。在本發明的某些實施方式中,期望的蛋白質或多肽是拖絲蛋白的蛋白質或多肽。根據本發明的期望的拖絲蛋白的蛋白質或多肽的序列與本文公開的任一種拖絲蛋白氨基酸序列具有至少50%的同一性,例如至少60%的同一性,優選地至少70%的同一性。在優選的實施方式中,根據本發明的期望的拖絲蛋白的蛋白質或多肽的序列與本文公開的任一種拖絲蛋白氨基酸序列具有至少80%的同一性,優選地至少90%的同一性。在優選的實施方式中,期望的拖絲蛋白的蛋白質包含70至300個氨基酸殘基的重復片段,其衍生自蜘蛛絲蛋白的重復片段;和70至120個氨基酸殘基的C端片段,該片段衍生自蜘蛛絲蛋白的C端片段。任選地,期望的拖絲蛋白的蛋白質包含衍生自蜘蛛絲蛋白的N端片段的100至160個氨基酸殘基的N端片段。期望的拖絲蛋白的蛋白質由170至600個氨基酸殘基,優選地280至600個氨基酸殘基,例如300至400個氨基酸殘基,更優選地340至380個氨基酸殘基組成。小的尺寸是有利的,因為較長的蜘蛛絲蛋白往往形成無定形的聚集體,要求使用苛刻溶劑(harsh solvent)來增溶和聚合。蛋白質片段通常經肽鍵共價偶聯。在特定的優選實施方式中,期望的拖絲蛋白的蛋白質選自由式NT2-REP-CT (或NT-NT-REP-CT)、NT-REP-CT 和 REP-CT 定義的蛋白質的組。NT片段與蜘蛛絲蛋白的N端氨基酸序列具有高度的相似性。如圖I所示,該氨基酸序列在多個物種和蜘蛛絲蛋白,包括MaSpl和MaSp2之間相當保守,再參見表I :哪種特定的NT片段存在于根據本發明的期望的拖絲蛋白的蛋白質中不是關鍵的。因此,根據本發明的NT片段可選自圖I示出的氨基酸序列或具有高度相似性的序列中的任何一種。各種各樣的N端序列可用于根據本發明的期望的拖絲蛋白的蛋白質中。基于圖I的同源序列,下列序列構成共有NT氨基酸序列QANTPWSSPNLADAFINSF(M/L)SA(A/I)SSSGAFSADQLDDMSTIG(D/N/Q)TLMSAMD(N/S/K)MGRSG(K/R)STKSKLQALNMAFASSMAEIAAAESGG(G/Q)SVGVKTNAISDALSSAFYQTTGSVNPQFV(N/S)EIRSLI(G/N)M(F/L)(A/S)QASANEV(SEQID NO 8)。根據本發明的NT片段的序列與基于圖I的氨基酸序列的共有氨基酸序列SEQ IDNO 8具有至少50%的同一性,優選地至少60%的同一性。在優選的實施方式中,根據本發明的NT片段的序列與共有氨基酸序列SEQ ID NO 8具有至少65%的同一性,優選地至少70%的同一'丨生。此外,在優選的實施方式中,根據本發明的NT片段與共有氨基酸序列SEQID N0:8具有70%,優選地80%的相似性。根據本發明的代表性的NT片段是Euprosthenops australis序列SEQ ID NO :6。根據本發明的優選實施方式,NT片段與SEQ ID NO 6或圖I中任何單獨的氨基酸序列具有至少80%的同一性。在本發明的優選實施方式中,NT片段與SEQ ID NO :6或圖I中任何單 獨的氨基酸序列具有至少90%,例如至少95%的同一性。在本發明的優選實施方式中,NT片段與SEQ ID NO 6或圖I中任何單獨的氨基酸序列,特別是與Ea MaSpl相同。NT片段包含100至160個氨基酸殘基。優選NT片段包含至少100,或多于110,優選地多于120個氨基酸殘基。還優選NT片段包含至多160,或少于140個氨基酸殘基。典型的NT片段包含約130-140個氨基酸殘基。REP片段具有在富含丙氨酸的延伸序列(stretches)和富含甘氨酸的延伸序列之間交替的重復性特征。如以下將更詳細地解釋的,REP片段通常包含多于70,例如多于140且少于300,優選地少于240,例如少于200個氨基酸殘基,且自身可分成幾個L (接頭)區段、A (富含丙氨酸)區段和G (富含甘氨酸)區段。通常,所述接頭區段位于REP片段末端,而剩余的區段依次是富含丙氨酸和富含甘氨酸的,所述接頭區段為任選的。因此,REP片段通常可具有以下結構中的任何一種,其中η是整數L (AG) nL,例如 LA1G1A2G2A3G3A4G4A5G5L ;L (AG) nAL,例如 LA1G1A2G2A3G3A4G4A5G5A6L ;L (GA) nL,例如 LG1A1G2A2G3A3G4A4G5A5L ;或L (GA) nGL,例如 LG1A1G2A2G3A3G4A4G5A5G6Lq其遵循富含丙氨酸或富含甘氨酸的區段是否與N端或C端接頭區段相鄰不是關鍵的。優選η是2至10,優選地2至8,還優選地4至8,更優選地4至6,即η = 4、η = 5或η = 6的整數。在優選的實施方式中,根據本發明的REP片段的丙氨酸含量高于20%,優選地高于25 %,更優選地高于30 %且低于50 %,優選地低于40 %,更優選地低于35 %。這是有利的,因為設想更高的丙氨酸含量提供更硬和/或更強和/或不太可延伸的纖維。在某些實施方式中,REP片段不含脯氨酸殘基,即REP片段中不存在Pro殘基。現在轉向構成根據本發明的REP片段的區段,應強調的是每個區段是單獨的,SP,特定REP片段的任何兩個A區段、任何兩個G區段或任何兩個L區段可以是相同的或可以是不相同的。因此,每種類型的區段在特定REP片段內是相同的不是本發明的一般特征。而且,以下公開內容為技術人員提供了如何設計單獨的區段并將其聚集成是根據本發明的功能性蜘蛛絲蛋白的一部分的REP片段的指南。每個單獨的A區段是具有8至18個氨基酸殘基的氨基酸序列。優選每個單獨的A區段包含13至15個氨基酸殘基。大多數,或兩個以上的A區段包含13至15個氨基酸殘基,且少數例如一或兩個A區段包含8至18個氨基酸殘基例如8-12或16-18個氨基酸殘基也是可能的。這些氨基酸殘基中的絕大多數是丙氨酸殘基。更特別地,這些氨基酸殘基中的O至3個不是丙氨酸殘基,且剩余的氨基酸殘基是丙氨酸殘基。因此,每個單獨的A區段中的所有氨基酸殘基毫無例外地或除了一、二或三個氨基酸殘基可以是任何氨基酸以夕卜,都是丙氨酸殘基。優選取代丙氨酸的氨基酸是天然氨基酸,優選地單獨選自絲氨酸、谷氨酸、半胱氨酸和甘氨酸的組,更優選地是絲氨酸。當然,A區段中的一個或多個是全丙氨酸區段,而剩余的A區段包含1-3個非丙氨酸的殘基,例如絲氨酸、谷氨酸、半胱氨酸或甘氨酸是可能的。在優選的實施方式中,每個A區段包含13-15個氨基酸殘基,包括10_15個丙氨酸殘基和0-3個上述非丙氨酸的殘基。在更優選的實施方式中,每個A區段包含13-15個氨基酸殘基,包括12-15個丙氨酸殘基和0-1個上述非丙氨酸的殘基。

優選每個單獨的A區段與選自SEQ ID NO 10的氨基酸殘基7_19、43_56、71-83、107-120、135-147、171-183、198-211、235-248、266-279、294-306、330-342、357-370、394-406、421-434、458-470、489-502、517-529、553-566、581-594、618-630、648-661、676-688、712-725、740-752、776-789、804-816、840-853、868-880、904-917、932-945、969-981,999-1013,1028-1042和1060-1073的組的氨基酸序列具有至少80%,優選地至少90%,更優選地95%,最優選地100%的同一性。該組的每個序列對應于Euprosthenopsaustralis MaSpl蛋白質的天然存在的序列的區段,該天然存在的序列經過克隆相應的cDNA推斷得來,參見WO 2007/078239。可選擇地,每個單獨的A區段與選自SEQ ID NO 3的氨基酸殘基143-152、174-186、204-218、233-247和265-278的組的氨基酸序列具有至少80%,優選地至少90%,更優選地95%,最優選地100%的同一性。該組的每個序列對應于根據本發明的表達的、非天然蜘蛛絲蛋白的區段,這些蛋白具有在合適的條件下形成絲纖維的能力。因此,在根據本發明的某些實施方式中,每個單獨的A區段與選自上述氨基酸區段的氨基酸序列相同。不期望被任何具體的理論束縛,設想根據本發明的A區段形成螺旋結構或β折疊。此外,已從實驗數據推斷出每個單獨的G區段是12至30個氨基酸殘基的氨基酸序列。優選每個單獨的G區段由14至23個氨基酸殘基組成。每個G區段的至少40%的氨基酸殘基是甘氨酸殘基。通常,每個單獨的G區段的甘氨酸含量在40-60%的范圍內。優選每個單獨的G區段與選自SEQ ID NO :10的氨基酸殘基20-42、57-70、84_106、121-134、148-170、184-197、212-234、249-265、280-293、307-329、343-356、371-393、407-420、435-457、471-488、503-516、530-552、567-580、595-617、631-647、662-675、689-71I、726-739、753-775、790-803、817-839、854-867、881-903、918-931、946-968、982-998、1014-1027、1043-1059和1074-1092的組的氨基酸序列具有至少80%,優選地至少90%,更優選地95%,最優選地100%的同一性。該組的每個序列對應于Euprosthenopsaustralis MaSpl蛋白質的天然存在的序列的區段,該天然存在的序列經過克隆相應的cDNA推斷得來,參見WO 2007/078239。可選擇地,每個單獨的G區段與選自SEQ ID NO 3的氨基酸殘基153-173、187-203、219-232、248-264和279-296的組的氨基酸序列具有至少80%,優選地至少90%,更優選地95%,最優選地100%的同一性。該組的每個序列對應于根據本發明的表達的、非天然蜘蛛絲蛋白的區段,這些蛋白具有在合適的條件下形成絲纖維的能力。因此,在根據本發明的某些實施方式中,每個單獨的G區段與選自上述氨基酸區段的氨基酸序列相同。在某些實施方式中,根據本發明的每個G區段的前兩個氨基酸殘基不是 _Gln_Gln_0存在根據本發明的G區段的三種亞型。該分類基于對Euprosthenops australisMaSpl蛋白質序列(WO 2007/078239)的仔細分析,并已在構建新型、非天然蜘蛛絲蛋白中使用并驗證了該信息。根據本發明的G區段的第一種亞型由一字母氨基酸共有序列GQG(G/S)QGG(Q/Y)GG(L/Q)GQGGYGQGAGSS(SEQ ID NO :11)代表。該第一種且通常不是最長的G區段亞型通常包含23個氨基酸殘基,但是可包含少至17個氨基酸殘基,且缺少帶電荷的殘基或包含一個帶電荷的殘基。因此,優選該第一種G區段亞型包含17-23個氨基酸殘基,但設想其可包含少至12個或多至30個氨基酸殘基。不期望被任何具體的理論束縛,設想該亞型形成 卷曲結構或S1-螺旋結構。該第一種亞型的代表性G區段是SEQ ID N0:10的氨基酸殘基20-42、84-106、148-170、212-234、307-329、371-393、435-457、530-552、595-617、689-711、753-775、817-839、881-903、946-968、1043-1059 和 1074-1092。在某些實施方式中,根據本發明的該第一種亞型的每個G區段的前兩個氨基酸殘基不是-Gln-Gln-。根據本發明的G區段的第二種亞型由一字母氨基酸共有序列GQGGQGQG(G/R)YGQG (A/S) G (S/G) S (SEQ ID NO :12)代表。該第二種通常中間尺寸的G區段亞型通常包含17個氨基酸殘基且缺少帶電荷的殘基或包含一個帶電荷的殘基。優選該第二種G區段亞型包含14-20個氨基酸殘基,但設想其可包含少至12個或多至30個氨基酸殘基。不期望被任何具體的理論束縛,設想該亞型形成卷曲結構。該第二種亞型的代表性G區段是SEQ IDNO :10 的氨基酸殘基 249-265、471-488、631-647 和 982-998 ;及 SEQ ID NO :3 的氨基酸殘基 187-203。根據本發明的G區段的第三種亞型由一字母氨基酸共有序列G(R/Q)GQG(G/R)YGQG (A/S/V) GGN(SEQ ID NO :13)代表。該第三種G區段亞型通常包含14個氨基酸殘基,且通常是根據本發明的G區段亞型中最短的。優選該第三種G區段亞型包含12-17個氨基酸殘基,但設想其可包含多至23個氨基酸殘基。不期望被任何具體的理論束縛,設想該亞型形成轉角結構。該第三種亞型的代表性G區段是SEQ ID NO 10的氨基酸殘基57-70、121-134,184-197,280-293,343-356,407-420,503-516,567-580,662-675,726-739,790-803,854-867,918-931,1014-1027 ;及 SEQ ID NO 3 的氨基酸殘基 219-232。因此,在優選的實施方式中,每個單獨的G區段與選自SEQ ID NO =IUSEQ ID NO:12和SEQ ID NO :13的氨基酸序列具有至少80%,優選地90%,更優選95%的同一性。在REP片段的A和G區段的交替序列的優選實施方式中,每隔一個G區段具有第一種亞型,而剩余的G區段具有第三種亞型,例如· · · A1G短A2G長A3G短A4G長A5G短· ··在REP片段的另一個優選的實施方式中,第二種亞型的一個G區段通過插入中斷G區段的規律性,例
如…A1G短A2G長A3G ψ A4G短A5G長…每個單獨的L區段代表可包含O至20個氨基酸殘基,例如O至10個氨基酸殘基的任選的接頭氨基酸序列。雖然該區段是任選的且在功能上對于蜘蛛絲蛋白不是關鍵的,但是其存在仍允許完全功能性的蜘蛛絲蛋白,形成根據本發明的蜘蛛絲纖維。在來自Euprosthenops australis的MaSpl蛋白質的推斷氨基酸序列的重復部分(SEQ ID NO 10)中也存在接頭氨基酸序列。特別地,接頭區段的氨基酸序列可能與所描述的A或G區段的任何一種相似,但是通常不足以滿足本文對其定義的標準。如WO 2007/078239中表明的,設置在REP片段的C端部分的接頭區段可由富含丙氨酸的一字母氨基酸共有序列ASASAAASAA STVANSVS和ASAASAAA代表。實際上,第二序列可被認為是根據本發明的A區段,而第一序列與根據本發明的A區段具有高度的相似性。根據本發明的接頭區段的另一實例具有富含甘氨酸的一字母氨基酸序列GSAMGQGS并與根據本發明的G區段具有高度的相似性。接頭區段的另一實例是SASAG。代表性L區段是SEQ ID NO 10的氨基酸殘基1-6和1093-1110 ;及SEQ ID NO 3的氨基酸殘基138-142,但是本領域技術人員將易于認識到存在用于這些區段的許多合適的替代氨基酸序列。在根據本發明的REP片段的一個實施方式中,L區段中的一個包含O個氨基酸,即缺少L區段中的一個。在根據本發明的REP片段的另一個實施方式中,兩個L區 段都包含O個氨基酸,即不含這兩個L區段。因此,根據本發明的REP片段的這些實施方式可示意性地表示如下(AG)nL、(AG)nAL、(GA)nL、(GA)nGL ;L (AG) n、L (AG) nA、L(GA) n、L(GA)nG ;和(AG)n、(AG)nA, (GA)n, (GA)nG0這些REP片段中的任何一種適合用于以下定義的任何CT片段。期望的拖絲蛋白的蛋白質的CT片段與蜘蛛絲蛋白的C端氨基酸序列具有高度的相似性。如WO 2007/078239中所示,該氨基酸序列在多個物種和蜘蛛絲蛋白,包括MaSpl和MaSp2之間相當保守。以SEQ ID NO :9提供了 MaSpl和MaSp2的C端區域的共有序列。在圖2中,比對了以GenBank登記條目(如果合適的話)表示的下列MaSp蛋白質表2-拖絲蛋白CT片段物種和拖絲蚤白的蛋白質I目
Etipmslhenaps sp MaSp I (Pouclikina-Stanteheva, MN &€lh>.b—EspMcQuccn-Mason. SI.同上)
Enprosthenops australis MaSplCTnat_Eau
三帶金姝 MaSplAF350266—Atl
泉字云斑蛛(('yrtophoramohtccemls) SpIAY666062_CmI
幾何寇蛛 MaSplAF350273—Lg I
黑寡婦蜘蛛 MaSplAY953OT4—Llil 赫氏粒突蛛(MacTO/te/f holsii) SpIAY666068—MhI
絡新婦蛛 MaSplU20329—Ncl
斑絡新婦pilipes) MaSpIAY666076—Mpl
馬達加斯加金色球梭》蛛(iVe/>/}//fl madagascariemis) MaSplAF350277—Nml
帶狀褪金色圓網修蛛mmgalensis) MaSplAF350279—Msl
變異渦蛛(<7c/ woAiV varians) SpIAY666057—0\.I
中華潘網蛛(Psi dH*Ms sinensis') SplAY666064—PsI
長 A綠色癸:光每 蛛(Tetragnatha kmtaiensis) MaSpIAF350285—TkI多 &'肖 ^(Jktragnathaverximior) MaSplAF350286_Tvl巨頭地衣_蛛"rant· s hicenicnarius) Sp2ABU20328_Ab2悅目金蛛(Jfg/ο/κ mnoena) MaSpIAY365016_Aam2阿吉晉奧蘭提亞金蛛aurmtia、MaSp2AF350263—Aau2三帶金姝 MaSp2AF35()267_Al2
多塑■棟腹蛛((—mammosa}Ma$p2AF350272_Gm2
幾何寇蛛 MaSp2AF350275—Lg2
黑暮婦蜘蛛 IVIaSp2AY953075 Lh2
絡新婦蛛 MaSplAY654293JNc2
P]達加斯加金色球緣蛛MaSp2AF350278—Nm2
帶狀褪金色圏網蟛蛛MaSp2AF3502雜—Ns2
褐灰色捕魚驗蛛(Do/owec/es lembmsm) FbIAF350269—DtFbI
褐灰色捕魚蟓蛛FMAF35027()—DtFb2
十字園蛛 ADF-IU47853^ADF!
十字園蛛 ADF-2U47854 ADF2
十字園蛛 ADF-3U47855_ADF3
十字園蛛 ADF-4U47856—ADF4哪種特定的CT片段(若有的話)存在于根據本發明的蜘蛛絲蛋白中不是關鍵的。因此,根據本發明的CT片段可選自圖2和表2中示出的氨基酸序列或具有高度相似性的序列中的任何一種。各種各樣的C端序列可用于根據本發明的蜘蛛絲蛋白中。根據本發明的CT片段的序列與基于圖2的氨基酸序列的共有氨基酸序列SEQ IDNO 9具有至少50%的同一性,優選地至少60%,更優選地至少65%的同一性,或甚至至少70%的同一性。根據本發明的代表性的CT片段是Euprosthenops australis序列SEQ ID NO :7。因此,根據本發明的優選的方面,CT片段與SEQ ID NO 7或圖2和表2中的任何單獨的氨基酸序列具有至少80%,優選地至少90%,例如至少95%的同一性。在本發明的優選的方面,CT片段與SEQ ID NO 7或圖2和表2中的任何單獨的氨基酸序列相同。CT片段通常由70至120個氨基酸殘基組成。優選CT片段包含至少70,或多于80,優選地多于90個氨基酸殘基。還優選CT片段包含至多120,或少于110個氨基酸殘基。典型的CT片段包含約100個氨基酸殘基。
根據另一方面,當融合蛋白包含衍生自蜘蛛絲蛋白的N端(NT)片段的單一溶解度 增強部分時,根據本發明的期望的蛋白質或多肽是非拖絲蛋白的蛋白質或多肽。在優選的實施方式中,期望的蛋白質或多肽是非拖絲蛋白的蛋白質或多肽。根據本發明的期望的非拖絲蛋白的蛋白質或多肽的序列與本文公開的拖絲蛋白的氨基酸序列且特別地與SEQ IDNO 6-10中的任一種優選地具有小于30%的同一性,例如小于20%的同一性,優選地小于10%的同一性。在優選的實施方式中,期望的非拖絲蛋白的蛋白質或多肽衍生自海綿動物、櫛水母、水母、珊瑚、海葵、扁蟲、輪蟲、蛔蟲、紐蟲、蛤、蝸牛、章魚、節肢蟲、甲殼動物、昆蟲、苔蘚動物、腕足動物、帚蟲類、海星、海膽、被囊動物、文昌魚、包括人類的脊椎動物、植物、真菌、酵母、細菌、古細菌或病毒或是人工蛋白質或多肽。“衍生”是指根據本發明的期望的非拖絲蛋白的蛋白質或多肽的序列與相應的天然存在的蛋白質具有優選地至少50%的同一性,優選地至少60 %,優選地至少70 %,更優選地至少80 %的同一性,或甚至至少90 %的同一性,例如95-100%的同一性并具有被保持的功能。在一個優選的實施方式中,期望的非拖絲蛋白的蛋白質或多肽衍生自軟體動物、昆蟲、包括人類的脊椎動物、植物、真菌、酵母、細菌、古細菌或病毒或是人工蛋白質或多肽。在優選的實施方式中,期望的非拖絲蛋白的蛋白質或多肽衍生自包括人類的脊椎動物、植物、真菌、酵母、細菌、古細菌或病毒或是人工蛋白質或多肽。在優選的實施方式中,期望的非拖絲蛋白的蛋白質或多肽選自由淀粉樣形態的蛋白質和多肽、含二硫鍵的蛋白質和多肽、載脂蛋白、膜蛋白和多肽、蛋白質和多肽藥物及藥靶、易于聚集的蛋白質和多肽及蛋白酶組成的組。根據本發明的淀粉樣形態的蛋白質和多肽包括與疾病和功能性淀粉樣蛋白有關的蛋白質和多肽。淀粉樣形態的蛋白質和多肽的實例包括淀粉狀蛋白β肽(Αβ-肽)、胰島淀粉樣多肽(胰淀素或ΙΑΡΡ)、朊病毒蛋白(PrP)、α-突觸核蛋白、降鈣素、催乳素、半胱氨酸蛋白酶抑制劑、心房鈉尿肽(ATF)和肌動蛋白。表3中列出了根據本發明的淀粉樣形態的蛋白質和多肽的實例。表3-淀粉樣形杰的蛋白質和多肽蛋白質Uniprot ID
Αβ 1-42Ρ05067
載脂蛋白SAAΡ02735
半胱氨酸蛋白酶抑制劑CΡ01034
運甲狀腺素蛋白Ρ02766
溶菌酶Ρ61626
α-突觸核蛋白Ρ37840
月元病毒蛋白FO4156·
ODAMΑ1Ε959
乳粘著蛋白Q08431
TauΡ10636
凝溶膠蛋白Ρ06396
ABri, ADanQ9Y287
胰島素Ρ01308
載脂蛋白A-IIΡ02652
載脂蛋白A-IVΡ06727
精膠蛋白IΡ04279
角膜上皮蛋白Q15582
乳運鐵蛋白Ρ02788
血纖蛋白原α鏈P02671
ANFP01160
IAPPP10997

蛋白質Uniprot ID
~β2-微球蛋白Ρ61769
~降鈣素Ρ01258
催乳素Ρ01236
載脂蛋白A-IΡ02647
CsgAΡ28307
Sup35C7GN25
PmeI17P40967
HET-sA8HR89
Ure2pQ8NIE6含二硫鍵的蛋白質和多肽的實例包括表面活性蛋白B(SP-B)和其變體,例如Mini-B、Mini-B27、Mini-BLeu、α -防衛素和β-防衛素。不被任何具體的理論限制,設想溶解度增強部分促進防衛素和其他含二硫鍵的蛋白質和多肽中期望的鏈內二硫鍵的形成勝于鏈間二硫鍵的形成。表4中列出了根據本發明的含二硫鍵的蛋白質和多肽的實例。表4-含二硫鍵的蛋白質和多肽
憂..自.質.一■■■■■ ■f!i■■■■■■ / 關P— ID^I
人 SP-B FPIPLPYCW LCRALIKRIQAMIPKGALAVAVAQ VCRVVPL
_ VAGG1CQCLAERYSV1LLDTLLGRMLPQLVCRLVLRCSM a
小鼠 SP-B LPIPLPFCWLCRTLtKRVQAVIPKGVLAVAVSQVCHWPL
_ WGGICQCLAERYTVLLLDALLGRWPQLVCGLVLRCST a
豬 SP-B FPIPLPFCWLCRTLIKRIQAVVPKGVLLKAVAQVCHWPL
__PVGG1CQCLAERY1VICLNMLLDRTLPQLVCGLVLRCSS 8
_5]兔 SP-B FPiPLPLCWLCRTLLKR !QAyiPKGVLAMAVAQVCH WPl
_WGGICQCLAERYTVILLEVLLGHVLPQLVCGLVLRCSS a
大鼠 SP-B LPI PLPFCWLCRTLf KRVQAVIPKGVLAV AVSQ VCHVVPL
_ WGGICQCLAERYTVLLLDALLGRVVPQLVCGLVLRCST a
Mini-BCWLCRALIKRIQAMIPKGGRMLPQLVCRLVLRCSb
Mini-BLeu CWLCRAL1KRIQALIPKGGRLLPQLVCRLVLRCSb Mini-B27 CLLCRALIKRFNRYLTPQLVCRLVLRCc 1aAACWLARALIKRIQAUPKGGRLLPQLVARL VLRCSd
—1bAAAWLCRALIKRlQALtPKGGRLLPQLVCRLVLRASeI
權利要求
1.一種融合蛋白,包含 (i)衍生自蜘蛛絲蛋白的N端(NT)片段的至少一個溶解度增強部分;和 ( )是期望的非拖絲蛋白的蛋白質或多肽的至少一個部分, 其中每個溶解度增強部分與所述期望的蛋白質或多肽部分直接或間接連接。
2.根據權利要求I所述的融合蛋白,其中每個溶解度增強部分與SEQID NO 6具有至少80%的同一性或與SEQ ID NO 8具有至少50%的同一性。
3.根據任一項前述權利要求所述的融合蛋白,其中每個溶解度增強部分包含100至160個氨基酸殘基。
4.根據任一項前述權利要求所述的融合蛋白,其中所述融合蛋白包含至少兩個溶解度 增強部分,所述溶解度增強部分的每一個衍生自蜘蛛絲蛋白的N端(NT)片段。
5.根據權利要求4所述的融合蛋白,其中所述融合蛋白包含至少兩個連續的溶解度增強部分,所述溶解度增強部分的每一個衍生自蜘蛛絲蛋白的N端(NT)片段。
6.根據任一項前述權利要求所述的融合蛋白,其中至少一個溶解度增強部分與至少一個期望的蛋白質或多肽部分的氨基末端或羧基末端直接或間接連接。
7.根據權利要求6所述的融合蛋白,其中至少一個溶解度增強部分構成所述融合蛋白的氨基末端和/或羧基末端。
8.根據任一項前述權利要求所述的融合蛋白,還包含 (iii)設置在至少一個期望的蛋白質或多肽部分與至少一個溶解度增強部分之間的至少一個裂解位點。
9.根據任一項前述權利要求所述的融合蛋白,其中所述期望的蛋白質或多肽與SEQIDNO 6-10中的任何一個具有小于30%的同一性。
10.根據權利要求9所述的融合蛋白,其中所述期望的蛋白質或多肽衍生自海綿動物、櫛水母、水母、珊瑚、海葵、扁蟲、輪蟲、蛔蟲、紐蟲、蛤、蝸牛、章魚、節肢蟲、甲殼動物、昆蟲、苔蘚動物、腕足動物、帚蟲類、海星、海膽、被囊動物、文昌魚、包括人類的脊椎動物、植物、真菌、酵母、細菌、古細菌或病毒或是人工蛋白質或多肽。
11.根據權利要求10所述的融合蛋白,其中所述期望的蛋白質或多肽衍生自軟體動物、昆蟲、包括人類的脊椎動物、植物、真菌、酵母、細菌、古細菌或病毒或是人工蛋白質或多肽。
12.根據權利要求11所述的融合蛋白,其中所述期望的蛋白質或多肽衍生自包括人類的脊椎動物、植物、真菌、酵母、細菌、古細菌或病毒或是人工蛋白質或多肽。
13.根據權利要求9-12中任一項所述的融合蛋白,其中所述期望的蛋白質或多肽選自由淀粉樣形態的蛋白質和多肽、含二硫鍵的蛋白質和多肽、載脂蛋白、膜蛋白和多肽、蛋白質和多肽藥物及藥靶、易于聚集的蛋白質和多肽及蛋白酶組成的組。
14.根據權利要求13所述的融合蛋白,其中所述期望的蛋白質或多肽選自由以下組成的組:Αβ-肽、IAPP、PrP、α -突觸核蛋白、降鈣素、催乳素、半胱氨酸蛋白酶抑制劑、ATF和肌動蛋白;SP-B、α-防衛素和β -防衛素;Α_Η類載脂蛋白;LL_37、SP-C, SP-C33、SP-C33Leu、Brichos、GFP、神經絲抑蛋白;激素,包括EPO和GH,及生長因子,包括IGF-I和IGF-II ;親和素和鏈霉親和素;和蛋白酶3C。
15.根據任一項前述權利要求所述的融合蛋白,選自由以下組成的組SEQID NO 26、·28、30、34、37、39、42和47 ;和與這些蛋白質中的任何一種具有至少80%同一性的蛋白質。
16.一種編碼根據任一項前述權利要求所述的融合蛋白的分離的多核酸。
17.根據權利要求16所述的分離的多核酸,選自由編碼根據權利要求15所述的融合蛋白的核酸組成的組和由SEQ ID NO 27、29、31、38、40、43和48組成的組。
18.衍生自蜘蛛絲蛋白的N端(NT)片段的至少一個部分作為融合蛋白中的溶解度增強部分用于制備期望的非拖絲蛋白的蛋白質或多肽的用途。
19.一種制備融合蛋白的方法,所述方法包括以下步驟 a)在合適的宿主中表達根據權利要求1-15中任一項所述的融合蛋白;和 b)獲得包含所述融合蛋白的混合物,并任選地分離所述融合蛋白。·
20.一種制備期望的蛋白質或多肽的方法,所述方法包含下列步驟 a)在合適的宿主中表達根據權利要求1-15中任一項所述的融合蛋白;和b)獲得包含所述融合蛋白或多肽的混合物,并任選地分離所述融合蛋白或多肽。
21.根據權利要求20所述的方法,還包括以下步驟 c)裂解所述融合蛋白以提供所述期望的蛋白質或多肽;和 d)分離所述期望的蛋白質或多肽; 其中所述融合蛋白包含 (iii)設置在至少一個期望的蛋白質或多肽部分與至少一個溶解度增強部分之間的至少一個裂解位點。
22.根據權利要求19-21中任一項所述的方法,其中步驟b)還包括在具有固定的NT部分的親和介質上和/或在陰離子交換介質上純化所述融合蛋白。
23.根據權利要求22所述的方法,其中通過結合4.2-6. 3的pH下的具有固定的NT部分的親和介質,然后用期望的離解介質從所述親和介質上離解,進行所述融合蛋白在親和介質上的純化。
24.根據權利要求23所述的方法,其中所述離解介質具有6.4或更高的pH、4. I或更低的PH和/或具有高的離子強度。
25.根據權利要求22-24中任一項所述的方法,其中所述融合蛋白在親和介質上的純化是通過結合6. 4或更高的pH下的陰離子交換介質,然后用具有高離子強度的離解介質從所述陰離子交換介質上離解而進行。
26.根據權利要求22-25中任一項所述的方法,其中步驟b)中的所述融合蛋白的純化發生在柱中、具有官能化表面的磁珠上或具有官能化表面的濾器上。
全文摘要
一種制備期望的非拖絲蛋白的蛋白質或多肽的方法包含以下步驟在合適的宿主中表達融合蛋白,獲得包含該融合蛋白的混合物,并任選地分離該融合蛋白。該融合蛋白包含衍生自蜘蛛絲蛋白的N端(NT)片段的至少一個溶解度增強部分。其還包含是期望的非拖絲蛋白的蛋白質或多肽的至少一個部分。每個溶解度增強部分與所述期望的蛋白質或多肽部分直接或間接連接。
文檔編號C07K1/16GK102844437SQ201080065548
公開日2012年12月26日 申請日期2010年10月27日 優先權日2010年3月18日
發明者揚·約翰松, 安娜·里辛, 麥·赫德哈馬爾, 謝斯廷·努德林 申請人:思百博技術股份公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影