用于獲得高產量重組蛋白表達的基于mgmt的方法
【專利摘要】本發明涉及宿主細胞中蛋白生產的新型增強子。其公開了一種用于在這些細胞中表達重組蛋白的載體,包括編碼a)分泌肽信號、b)6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT,EC2.1.1.63)及其突變體或催化結構域、和c)重組蛋白的核苷酸序列。所述MGMT酶優選是所謂的SNAP蛋白。
【專利說明】用于獲得高產量重組蛋白表達的基于MGMT的方法
【技術領域】
[0001]本發明涉及遺傳工程和分子生物學領域。特別是,本發明涉及一種宿主細胞中蛋白生產的新型增強子。此外,本發明涉及含有編碼所述增強子蛋白的DNA序列的載體,及其用于表達重組蛋白的用途,如工業用酶或藥用蛋白,包括真核(例如,哺乳動物,如人)和病毒蛋白。
【背景技術】
[0002]蛋白生產系統,其中在重組生物體或細胞中生產興趣多肽或蛋白,是商業生物技術的主干。
[0003]最早的系統,基于在宿主如大腸桿菌中的細菌表達,已加入了基于真核宿主的系統,特別是培養的哺乳動物細胞、培養的以及整個昆蟲形式的昆蟲細胞,和轉基因哺乳動物如綿羊和山羊。
[0004]原核細胞培養系統易于維護且操作便宜。然而,原核細胞不能進行真核蛋白的翻譯后修飾。此外,許多蛋白不能正確折疊,需要特殊的程序使其重新折疊,這增加了生產成本。
[0005]真核細胞培養系統已經描述了多種應用。例如,哺乳動物細胞能夠進行翻譯后修飾,且通常產生正確折疊的和可溶性蛋白。哺乳動物細胞系統的主要缺點包括需要專門的和昂貴的培養設施、感染的風險,這可能會導致整個培養物的損失、以及潛在的有害哺乳動物蛋白污染最終產品的風險。交替使用昆蟲細胞用來表達多肽。昆蟲細胞中所用的最普遍的表達系統基于桿狀病毒載體。在強天然多角體蛋白啟動子的控制下,通過用異源基因替換編碼桿狀病毒主要結構蛋白的桿狀病毒多角體蛋白基因來構建桿狀病毒表達載體。用重組病毒感染培養的昆蟲宿主細胞,可以從細胞本身中回收由此產生的蛋白,或者如果采用合適的分泌信號時,從培養基中回收由此產生的蛋白。
[0006]然而,這兩種系統,都存在重組蛋白表達水平和質量的再現性、培養物感染的相關問題,并且需要專門的培養設施。此外,用于某些蛋白生產而不得不在GMP條件下制備的桿狀病毒原料,隨著時間的推移并不總是穩定的。
[0007]果蜆細胞,特別是黑腹果蜆(Drosophila melanogaster) S2細胞,已被US5, 550,043、US5,681,713和US5, 705,359所公開用于蛋白的表達。不同于現有技術的桿狀病毒系統,在其中只有裂解感染的昆蟲細胞時才能提供興趣蛋白,基于S2細胞的方法提供連續的異源蛋白的細胞表達系統,并因此產生更高的表達水平。
[0008]已經提出了幾個其它用于增強異源蛋白在宿主細胞中表達的裝置:例如,US5,919,682描述了在原核生物中使用pCW載體在tac啟動子的控制下、共表達蛋白和分子伴侶過量生產功能性硝酸合酶的方法。此外,US4, 758,512涉及在其DNA序列內具有特定突變的宿主細胞的生產,其導致生物體表現出降解外源產物的能力降低。這些突變的宿主生物體可用于增加遺傳工程的外源蛋白的產量。
[0009]脊椎動物細胞,特別是哺乳動物細胞,也被廣泛用于重組蛋白的表達。來自培養中生長的細胞的蛋白生產的量,隨著時間,依賴于若干因素,如,例如細胞密度、細胞周期相、蛋白的細胞生物合成速度、用以支持細胞活力和生長的介質條件、以及細胞在培養中的壽命(即多久之后它們死于程序性細胞死亡或凋亡)。例如通過控制營養物、細胞密度、氧和二氧化碳的含量、乳酸脫氫酶、pH、滲透性、代謝物等,已經開發了改善細胞在培養中的活力和壽命的各種方法,以及提高所需蛋白的產量的方法。
[0010]其它的宿主細胞可用于生產異源重組蛋白,特別是植物細胞和酵母細胞。
[0011]在植物中已經合成了哺乳動物來源的許多藥物蛋白。這些從血液制品,如有著每年超過500噸需求量的人血清白蛋白,到需要更少量的細胞因子和其它信號分子。大多數植物來源的蛋白已在轉基因煙草中生產,并直接從葉中提取。一般情況下,這些蛋白以較低的水平生產,通常小于總可溶性蛋白的0.1%。這樣低水平的生產尤其反映出各種因素的組合,其中最重要的是蛋白折疊和穩定性差。最近,煙草葉綠體系統已被用于以更高的水平表達人類蛋白(MA JKC等人,2004)。
[0012]酵母系統多年來是用于生產大量工業和生物制藥用蛋白的主要物質。酵母在明確定義的介質中可生長到非常高的細胞質量密度。可在酵母中過度表達重組蛋白,從而產物從細胞中分泌,并可在發酵液中回收。酵母分泌的蛋白,在一致的糖基化位點,被大量糖基化。因此,重組蛋白在酵母系統中的表達歷來被限制用于翻譯后糖基化模式不影響蛋白功能的那些蛋白。若干酵母表達系統用于重組蛋白表達,包括酵母菌屬(Sacharomyces)、分裂酵母(Schizosaccharomyces pombe)、畢赤酵母(Pichia pastoris)和多形漢遜酵母(Hansanuela polymorpha)。最近,出現了一種具有在酵母中生產重組糖蛋白的能力的新型系統,其糖基化序列與哺乳動物細胞中產生的分泌型人糖蛋白相似。通過消除內源性酶(其向N-糖基化中間體添加高甘露糖鏈)來修飾畢赤酵母的糖基化途徑。此外,參與人源化寡糖鏈合成的至少五種活性酶被特異性地轉染至畢赤酵母。在酵母中生產大量人源化糖蛋白的能力賦予了這樣的優勢,在其中糖基化結構是高度統一的且易于純化。此外,可以通過在酵母中使用流加(fed-batch)生產,采用比哺乳動物細胞更短的發酵時間,來消除被哺乳動物病毒和其它哺乳動物宿主糖蛋白的交叉污染。
[0013]然而,通過使用這些系統,在培養細胞的上清中以大約l_2mg/L生產異源蛋白,相較于工業生產目的,這是相當低的。
[0014]因此,迫切需要提供一個能夠達到顯著更高水平的異源蛋白表達的系統。
[0015]本發明迎合了這種需要,并提供了蛋白表達方法,該方法達到了比現有蛋白生產手段高100倍的生產水平(即,上清中直至200mg/L的蛋白)。
[0016]本發明人的確表明,使用編碼來自于人6-甲基鳥嘌呤-DNA-甲基轉移酶(hMGMT)蛋白的蛋白的核苷酸載體,所述hMGMT來源的蛋白直接或不直接地連接興趣蛋白,將所述興趣蛋白的生產平均增強至40mg/L至200mg/L的產量。
【專利附圖】
【附圖說明】
[0017]圖1公開了(A)編碼本發明MGMT融合蛋白序列的mRNA的示意圖,從5’到3’, 含有信號肽、MGMT mRNA序列、間隔序列、蛋白酶切割位點、重組蛋白基因(外源基因)、間隔序列、和一個標記(His6)標簽,和(B)載體相同部分的DNA和氨基酸序列,其包括i)昆蟲ssBiP信號肽(斜體)、ii) SNAP編碼增強子序列(灰色)、iii) DNA間隔序列、iv)腸激酶位點編碼序列(粗體)、V)克隆位點EcoRV/Xmal (下劃線)和vi)編碼His標簽標記的DNA (粗斜體)(也見 SEQ ID NO:5)。
[0018]圖2公開了(A)融合蛋白SNAP (灰色)和連接至His標簽標記的裂谷熱病毒(RiftValley fever virus) N核蛋白(RVF.N,粗體)的氨基酸序列,兩種蛋白被間隔序列GGGS隔開,(B)在轉染有SEQ ID NO:19 (SNAP-RVF)的DNA載體的S2細胞的細胞上清上,用或不用鎘刺激10天,用抗Hi s 的抗體的免疫印跡分析,和(C)用抗Hi s抗體,在大腸桿菌B21裂解物的不溶(INS)或可溶(SOL)蛋白部分(fraction)上進行的免疫印跡分析,所述細菌攜帶pET302/RVF.N+proTEV+GST質粒。(D)免疫印跡分析顯示,來自10天刺激的S2細胞的分泌嵌合蛋白SNAP-RVF.N在經過兩步純化之后所獲得的連續部分(fraction)樣本中的SNAP-RVF.N 的量,使用 Talon 和 Superdex75 柱。
[0019]圖3公開了(A)融合蛋白SNAP (斜體)和來自西尼羅病毒的包膜蛋白E的可溶形式(灰色),連接至His標簽標記(粗體)的DNA和氨基酸序列,蛋白被間隔序列GGGS隔開(SEQ ID NO:20),和(B)使用抗His標簽抗體進行的免疫印跡分析,顯示在轉染有本發明編碼SNAP-WNsE的DNA載體(SEQ ID NO:20)的S2細胞的上清中,用或不用鎘刺激10天,西尼羅病毒包膜蛋白E蛋白的可溶形式的分泌。
[0020]圖4公開了(A)含有BiP肽信號、MGMT樣編碼序列(SNAP樣)、在IFNa序列兩側的兩個pro-TEV切割位點(huIFNAI)、和His標簽標記的DNA盒的示意圖,(B)融合蛋白SNAP(灰色,前面是斜體表示的昆蟲肽信號)和IFNa (粗體)接著是His標簽標記(粗斜體)的DNA和氨基酸序列,SNAP和IFNa蛋白用腸激酶切割位點(下劃線)和間隔序列GGGS隔開。(C)使用抗His標簽抗體進行的免疫印跡分析,來檢測轉染有本發明編碼IFNa (S2/SNAP-1FN)的載體或對照載體的S2細胞上清中IFNa的表達,用或不用Cd2+刺激。(D)使用抗SNAP抗體,在用或不用鎘誘導10天的IOyL S2/DeSNAPuniv-1FNa細胞上清上進行的免疫印跡分析。(E)在感染有表達海腎熒光素酶的基孔肯雅病毒(Chikungunya virus)的HeLa細胞中螢光素酶的活性,用不同劑量的來自商業來源(Intergen)的或通過本發明的方法產生的IFNa處理所述細胞。(F)在感染有表達海腎熒光素酶的基孔肯雅病毒的HeLa細胞中螢光素酶的活性,用不同劑量的通過本發明生產方法獲得的SNAP-1FNa蛋白處理所述細胞。
[0021]圖5表示本發明重組蛋白生產過程中的不同步驟。
[0022]圖6公開了(A)融合蛋白SNAP (灰色,前面是昆蟲肽信號)和顆粒酶M隨后是His標簽的DNA和氨基酸序列,SNAP和顆粒酶M蛋白用腸激酶切割位點和間隔序列GGGS隔開。(B)嵌合融合蛋白SNAP-GrM的示意圖,突出SNAP中的三個潛在GrM酶切割位點(C)使用抗SNAP或抗His標簽抗體進行的免疫印跡分析,來檢測轉染有本發明編碼GrM(S2/SNAP-GrM,SEQ ID NO:55)的載體的S2細胞上清中SNAP-GrM的表達。
[0023]圖7公開了(A)含有BiP樣肽信號、MGMT編碼序列、在IFNa序列兩側的兩個pro-TEV切割位點(huIFNAI)、和His標簽標記的通用DNA盒的示意圖,(B)融合蛋白SNAP(灰色,前面是昆蟲Bip樣肽信號)和人IFNa I (氨基酸以粗體顯示)接著是His標簽標記的DNA和氨基酸序列,SNAP和IFNa蛋白用proTEV切割位點和間隔序列GGGS隔開。(C)用抗SNAP抗體進行的免疫印跡分析,來檢測轉染有單獨編碼SNAP而沒有肽信號的載體(pSNAPf載體)、或單獨編碼SNAP,其前面是登革病毒肽信號的載體(pDVlssprM-SNAP)、或編碼IFNa包括如(A)中所定義的DNA序列的本發明載體(pDeSNAP-4/SNAP-1FNAl,SEQ IDNO:57)的HeLa細胞上清中SNAP-1FNa的表達。
[0024]圖8A公開了包含BiP樣肽信號、SNAP編碼序列、兩個pro_TEV切割位點、His標簽標記、用于克隆興趣基因的四個獨特的克隆位點BamH1、Eco RV、Xma I和Apa 1、和間隔序列GGGS的通用DNA盒(DeSNAP univ,SEQ ID NO:59和60)。需要5’端的獨特位點NheI和3’端的Not I/Hind III用于哺乳動物表達載體中的亞克隆步驟(如質粒pcDNA3或pC1-neo),以及需要5’端的獨特位點Bgl II和3’端的Age I用于非脊椎動物DES系統的亞克隆步驟。(B)中的示意圖公開了包含BiP樣肽信號、MGMT編碼序列、兩個pro-TEV切割位點、His標簽標記、用于克隆興趣基因的四個獨特的克隆位點BamH1、Eco RV,Xma I和Apa1、和間隔序列 GGGS 的通用 DNA 盒(DeMGMT univ, SEQ ID NO:69 和 70)。
[0025]圖9公開了一種將外源基因插入DeMGMT Univ的方式。
[0026]圖10 公開了在-80° C、4° C、25° C 或 37 ° C 下孵育 4 天(A)或在-80 ° C、4° C、25° C 或 37。C 下孵育兩個月(B)的 SNAP 融合蛋白 CHIK.sE2-SNAP、SNAP-WN.EDIII和SNAP-1FNa I的熱穩定性。
[0027]圖11公開了通過將本發明的載體引入S2細胞,在用(+ )或不用(_)鎘誘導10天后,在全部上清(A)或在不同部分(B)中融合蛋白SNAP-SSX2和SNAP-sFasL的生產。
[0028]圖12公開了 (A)包含BiP樣肽信號、MGMT編碼序列(SNAP樣)、SSX2癌抗原兩側的兩個pro-TEV切割位點、和His標簽標記的通用DNA盒的示意圖,(B)包含BiP樣肽信號、MGMT編碼序列、NERMCSL蛋白兩側的兩個pro-TEV切割位點、和His標簽標記的通用DNA盒的示意圖,(C)使用小鼠抗SNAP抗體,在瞬時轉染的HeLa細胞上進行兩天的免疫印跡分析,顯示IFNa、SSX2和NERMCSL的細胞外或細胞內生產。
[0029]圖13公開了(A)包含BiP樣肽信號、MGMT編碼序列(SNAP樣)、hSULF_2A?多肽兩側的兩個pro-TEV切割位點、和His標簽標記的通用DNA盒的示意圖,(B)融合蛋白SNAP (深灰色,前面是昆蟲BiP樣肽信號)和hSULF-2A?接著是His標簽標記的DNA和氨基酸序列,SNAP和hSULF-2"?蛋白用proTEV切割位點和間隔序列GGGS隔開,以及(C)瞬時轉染有pcDNA3/DeSNAPuniv-hSULF_2A?兩天的HEK293細胞所分泌的分泌型嵌合DeSNAP-hSULF_2^m 的酶活性。
[0030]圖14公開了(A)包含BiP肽信號、MGMT編碼序列(SNAP樣)、NERMCSL蛋白兩側的兩個pro-TEV切割位點、和His標簽標記的DNA盒的示意圖,(B)使用抗SNAP抗體進行的免疫印跡分析,來檢測轉染有本發明編碼NERMCSL蛋白的載體(S2/SNAP-NERMCSL)或編碼基孔肯雅病毒可溶性蛋白E2的載體(CHIK.SE2-SNAP)的S2細胞上清中,用或不用Cd2+刺激,NERMCSL蛋白的表達。
【具體實施方式】
[0031]本發明人觀察到6-甲基鳥嘌呤-DNA甲基轉移酶(MGMT)和興趣重組蛋白一起的共表達極大地提高了所述重組蛋白在昆蟲細胞如S2細胞以及在哺乳動物細胞如HeLa細胞中的生產。
[0032]6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT,也被稱為Atase或AGT,以下稱為“MGMT”)在IUBMB酶命名法中編號為EC2.1.1.63。它是207個氨基酸殘基的6-烷基鳥嘌呤-DNA-烷基轉移酶的DNA修復酶,其在細胞內的功能是修復烷基化DNA。更精確地,MGMT通過將Sn2反應中的甲基轉化為反應性半胱氨酸殘基(半胱氨酸145)對DNA中的O6-甲基化鳥嘌呤發揮作用。由于蛋白不可逆地失活,該修復機制是不常見的(Pegg A.E.等人,Mutat.Res.2000; 462,82-100)。目前在分子生物學中,通過與O6-芐基鳥嘌呤衍生物的不可逆標記反應,這種酶用來給蛋白在體內標記上報告分子(Juillerat A.等人,Chemistry&Biology, vol.10,313-317,2003 和 W02005/085470)。[0033]到目前為止,已經描述了源自MGMT的不同酶(Lim A.等人,EMBOJ.15:4050-4060,1996 ;Daniels D.S.等人,EMBO J.19:1719-1730, 2000 Juillerat A.等人,Chemistry&Biology, vol.10,313-317,2003、W02005/085470、W02004/031405)。尤其是,獲得了含有突變 Cys62Ala、Lysl25Ala、Alal27Thr、Argl28Ala、Glyl31Lys、Glyl32Thr、Metl34Leu、Argl35Ser、Cysl50Ser、Asnl57Gly、Serl59Glu、在 182 位氨基酸被截短的 20kDa的蛋白(W02005/085470中所謂的“AGT26”突變體,在W02006/114409中也稱為“SNAP26”)。特定突變體“SNAP26”已被證明具有增強的標記活性。然而,從未顯示或沒有暗示過,它可增強和它偶聯的重組蛋白的表達。
[0034]此處本發明人首次提出使用MGMT酶(EC2.1.1.63)、其突變體、其催化結構域或其子片段,用于增強蛋白在宿主細胞中的生產,特別是在非脊椎動物和脊椎動物宿主細胞中。當宿主細胞表達包括至少i)在所述宿主細胞中具有功能的肽分泌信號、ii) MGMT酶、其突變體、催化結構域或子片段、和iii)興趣蛋白的融合多肽時,觀察到增強作用。為了使增強作用發生,MGMT酶直接或間接地(可引入間隔序列及其它氨基酸)物理連接至興趣蛋白。不受理論約束,可設想,MGMT酶可以作為伴侶蛋白,例如通過利于從宿主細胞的分泌以及在宿主細胞上清中穩定合成的融合多肽,或防止從宿主細胞合成和分泌的過程中和之后被代謝掉。
[0035]此外,已經觀察到,MGMT有三維球狀結構,其包括α螺旋(Wibley JEA等人,2000),這和MGMT的支架作用相兼容。
[0036]在本發明的上下文中,“宿主”細胞是可用于生產重組蛋白的任何細胞,如“非脊椎動物”(或無脊椎動物)細胞、脊椎動物細胞、植物細胞、酵母細胞或原核細胞。優選地,它們是非脊椎動物和脊椎動物細胞。
[0037]非脊椎動物(也稱為無脊椎動物)包括不同的門,最熟知的是昆蟲、蛛形綱(Arachnida)> 甲殼綱(Crustacea)、軟體動物門(Mollusca)、環節動物門(Annelida)、蔓足綱(Cirripedia)、放射蟲綱(Radiata)、腔腸動物門(Coelenterata)和纖毛蟲綱(Infusoria)。它們現在分為30多個門,從簡單的生物體,如海綿和扁形蟲到復雜的動物,如節肢動物和軟體動物。在本發明的上下文中,非脊椎動物細胞優選是昆蟲細胞,如果蠅或蚊子細胞,更優選為果蠅S2細胞。
[0038]可用作宿主細胞系的源自脊椎動物生物體的細胞實例包括非人類胚胎干細胞或其衍生物,例如禽EBX細胞;轉化有SV40序列的猴腎CVI系(C0S-7,ATCCCRL1651);人胚胎腎系(293);幼倉鼠腎細胞(BHK,ATCC CCL10 );中國倉鼠卵巢細胞(CHO);小鼠支持細胞[TM4];猴腎細胞(CVI,ATCC CCL70);非洲綠猴腎細胞(VER0-76,ATCC CRL-1587);人宮頸癌細胞(HeLa,ATCC CCL2);犬腎細胞(MDCK,ATCC CCL34);布法羅大鼠肝細胞(BRL3A,ATCCCRL1442);人肺細胞(W138,ATCC CCL75);人肝細胞(Hep G2,HB8065);小鼠乳腺腫瘤細胞(MMT060562,ATCC CCL51);大鼠肝癌細胞[HTC, Ml.5] ;YB2/0 (ATCC n。CRL1662);NIH3T3 ;HEK和TRI細胞。在本發明的上下文中,脊椎動物細胞優選是EBX、CH0、YB2/0、C0S、HEK、NIH3T3細胞或其衍生物。
[0039]在本發明的上下文中,可用的植物細胞是煙草栽培品種Bright Yellow2 (BY2)和普通煙草 I (Nicotiana Tabaccum) (NT-1)。
[0040]在本發明的上下文中,可用的酵母細胞是:釀酒酵母(Saccharomycescerevisiae)、分裂酵母(Schizosaccharomyces pombe)和多形漢遜酵母(Hansanuelapolymorpha),以及(methylotropic yeast)甲醇營養型酵母如畢赤酵母和甲醇畢赤酵母(Pichia methanolica)0
[0041]在本發明的上下文中,可用的原核生物細胞通常是大腸桿菌細菌或枯草芽孢桿菌(Bacillus Subtilis)細菌。
[0042]因此,本發明公開了編碼至少a)在非脊椎動物細胞或脊椎動物細胞中優選具有功能的肽分泌信號、和b)6-甲基鳥嘌呤-DNA-甲基轉移酶、其突變體、子片段或催化結構域的核苷酸表達載體。
[0043]術語“載體”此處是指,外源基因的DNA或RNA序列借此可以引入宿主細胞中從而轉化和促進所引入的序列的表達的媒介。載體可包括例如,質粒、噬菌體、和病毒,并在下面更詳細討論。事實上,任何類型的質粒、粘粒、YAC或病毒載體可用于制備可引入宿主細胞中的重組核酸構建體,并在宿主細胞中獲得興趣蛋白的表達。或者,其中希望在特定類型的宿主細胞中表達興趣蛋白時,可以使用選擇性感染所需細胞類型或組織類型的病毒載體。在本發明的上下文中,也很重要的是用于基因治療的載體(即,能夠向宿主有機體遞送核酸分子)。
[0044]例如,病毒載體如慢病毒、逆轉錄病毒、皰疹病毒、腺病毒、腺相關病毒、痘病毒、桿狀病毒和其它具有所需細胞嗜性.的重組病毒。用于構建和使用病毒載體的方法在本領域中是已知的(參見,Miller 和 Rosman, BioTechniques, 7:980-990,1992)。
[0045]在本發明中實際優選的病毒載體是非常適用于脊椎動物和非脊椎動物細胞中的那些。
[0046]對于非脊椎動物細胞,優選的載體是蟲媒病毒,特別優選西尼羅病毒,其是節肢動物載體。已知在非脊椎動物細胞中被有效表達的其它載體是桿狀病毒。
[0047]對于脊椎動物細胞,優選慢病毒、AAV、桿狀病毒和腺病毒載體。適于在哺乳動物宿主細胞中表達的載體也可以是非病毒(如質粒DNA)來源。合適的質粒載體包括但不限于pREP4、pCEP4 (Invitrogene)、pCI (Promega)>pCDM8 和 pMT2PC、pVAX 和 pgWiz。
[0048]對于原核生物細胞,優選質粒、曬菌體和粘粒載體。用于原核細胞系統的合適載體包括但不限于 pBR322 (Gibco BRL)> pUC (Gibco BRL)> pBluescript (Stratagene)、pPoly、pTrc ;pETlld ;pIN ;和 pGEX 載體。
[0049]對于植物細胞,優選質粒表達載體如Ti質粒,和病毒表達載體如花椰菜花葉病毒(CaMV)和煙草花葉病毒TMV。
[0050]重組蛋白在酵母細胞中的表達可以通過三種類型的載體來實施:整合載體(Yip)、附加體質粒(YEp)和中心粒質粒(YCp):用于在酵母(例如釀酒酵母)中表達的合適載體包括但不局限于 pYepSecl、pMFa、pJRY88、pYES2 (Invitrogen Corporation, SanDiego, Calif.)和 pTEF-MF (Dualsystems Biotech 產品編號:P03303)。[0051]可被用于基因治療的載體是本領域已知的。它們是例如慢病毒、逆轉錄病毒、腺病毒、痘病毒、皰疹病毒、麻疹病毒、泡沫病毒或腺相關病毒(AAV)。病毒載體可以具有復制能力,或可以遺傳上不具有復制能力,從而成為復制缺陷的或復制受損的。優選的基因治療載體是 W01999/055892、US6, 682,507 和 W02001/27300 中所描述的 DNA Flap 載體。
[0052]“編碼”表達產物(如RNA、多肽、蛋白或酶)的序列是,當表達時,導致RNA、多肽、蛋白或酶產生的核苷酸序列;即核苷酸序列“編碼”RNA或其編碼多肽、蛋白或酶的氨基酸序列。
[0053]在本發明的上下文中,酶的“催化結構域”是指酶的活性位點,或者換句話說,發生底物催化的酶分子部分(此處,在Sn2反應中,將甲基基團轉化為反應性半胱氨酸殘基)。因此,術語“其催化結構域”指定為MGMT多肽的任何片段或同源序列,優選具有至少80%的天然MGMT酶的催化活性。這些片段(也稱為“子片段”)可包括20至180個之間,優選30至100個之間的氨基酸。所述催化結構域的同源序列可以具有一個或多個導致所述催化活性的部分或全部失去的突變。
[0054]在本發明的上下文中,MGMT酶可以是序列SEQ ID NO:4的人MGMT (參考NP_002403.2)、鑒定為 NP_032624.1 的小鼠 MGMT (SEQ ID NO:45)、鑒定為 NP_036993.1 的大鼠MGMT (SEQ ID NO:46)或其同源序列。
[0055]術語“同源的”是指具有序列相似性的序列。術語“序列相似性”,以其所有語法形式,是指核酸或氨基酸序列之間的同一性或對應程度。在本發明的上下文中,當至少約80%、或者至少約81%、或者至少約82%、或者至少約83%、或者至少約84%、或者至少約85%、或者至少約86%、或者至少約87%、或者至少約88%、或者至少約89%、或者至少約90%、或者至少約91%、或者至少約92%、或者至少約93%、或者至少約94%、或者至少約95%、或者至少約96%、或者至少約97%、或者至少約98%、或者至少約99%的氨基酸相似時,兩條氨基酸序列是“同源的”。優選,通過使用Needleman和Wunsch算法鑒定相似或同源的多肽序列。
[0056]優選地,和6-甲基鳥嘌呤-DNA甲基轉移酶同源的序列與SEQ ID NO:4分享至少64%的氨基酸序列同一性,優選至少約65%的氨基酸序列同一性、或者至少約66%的氨基酸序列同一性、或者至少約67%的氨基酸序列同一性、或者至少約68%的氨基酸序列同一性、或者至少約69%的氨基酸序列同一性、或者至少約70%的氨基酸序列同一性、或者至少約71%的氨基酸序列同一性、或者至少約72%的氨基酸序列同一性、或者至少約73%的氨基酸序列同一性、或者至少約74%的氨基酸序列同一性、或者至少約75%的氨基酸序列同一性、或者至少約76%的氨基酸序列同一性、或者至少約77%的氨基酸序列同一性、或者至少約78%的氨基酸序列同一性、或者至少約79%的氨基酸序列同一性、或者至少是80%的氨基酸序列同一性、或者至少約81%的氨基酸序列同一性、或者至少約82%的氨基酸序列同一性、或者至少約83%的氨基酸序列同一性、或者至少約84%的氨基酸序列同一性、或者至少約85%的氨基酸序列同一性、或者至少約86%的氨基酸序列同一性、或者至少約87%的氨基酸序列同一性、或者至少約88%的氨基酸序列同一性、或者至少約89%的氨基酸序列同一性、或者至少約90%的氨基酸序列同一性、或者至少約91%的氨基酸序列同一性、或者至少約92%的氨基酸序列同一性、或者至少約93%的氨基酸序列同一性、或者至少約94%的氨基酸序列同一性、或者至少約95%的氨基酸序列同一性、或者至少約96%的氨基酸序列同一性、或者至少約97%的氨基酸序列同一性、或者至少約98%的氨基酸序列同一性以及或者至少約99%的氨基酸序列同一性。在一個優選的實施方式中,SEQ ID NO:4的同源序列與SEQID NO:4至少64%、優選70%、以及更優選80%相同。
[0057]更優選的同源MGMT序列包含W02005/085470中描述的突變,其位置可以很容易地調換以基于SEQ ID N0:4,SNAP26的起始蛋氨酸殘基對應著SEQ IDNO:4第32位的蛋氨酸殘基(因此,31個氨基酸應加入到W02005/085470所公開的位置中,從而獲得SEQ ID NO:4中對應的那些)。
[0058]優選地,可用于本發明的MGMT同源序列對應著SEQ ID NO:4的野生型MGMT序列,其中I和30個之間,優選6和25個之間,以及尤其是14、15、16、17、18、19、20、21、22或23個氨基酸被其它氨基酸取代,和/或在C-端I至40個,優選I至20個,尤其是10至20個氨基酸,更優選15個氨基酸被刪除。
[0059]在一個優選的實施方式中,與SEQ ID NO:4相比,MGMT同源序列包含以下突變:
[0060](A) Lys31取代為Arg、或Met32取代為Ser、或Cys93取代為Ala、或Lysl56取代為Ala、或Alal58取代為Thr、或Argl59取代為Ala、Glyl62取代為Lys、或Glyl63取代為Thr、或Metl65取代為Leu、或Argl66取代為Ser、或Cysl81取代為Ser、或Asnl88取代為Gly、或Serl90取代為Glu、或Gly214取代為Pro、或Ser215取代為Ala、或Ser216取代為Gly、或Gly217取代為He、或Leu218取代為Gly、或Gly220取代為Pro、或Ala221取代為Gly、或Trp222取代為Ser,或
[0061](B) Lys31-Met32 取代為 Arg-Ser、或 Alal58_Argl59 取代為 Thr-Ala,或Glyl62-Glyl63 取代為 Lys-Thr、或 Metl65_Argl66 取代為 Leu-Ser,或 Glyl62_Glyl63/Metl65-Argl66 取代為 Lys-Thr/Leu-Ser、或 Asnl88/Serl90 取代為 Gly/Glu、或 Gly214_Ser215-Ser216-Gly217-Leu218 取代為 Pro-Ala-Gly-1le-Gly、或 Gly220-Ala221_Trp222 取代為Pro-Gly-Ser,優選與(A)中描述的任何其它氨基酸取代相組合,或
[0062](C)在Leu223后截斷(氨基酸224-238被刪除),優選與(A)或(B)中描述的任何其它氨基酸取代相組合。
[0063]優選的MGMT同源序列是在Leu223后被截斷的那些。
[0064]優選的MGMT同源序列是在其中出現修飾(B)中的2個修飾的那些,任選在Leu223后截斷。
[0065]優選的MGMT同源序列是在其中出現修飾(B)中的3個修飾的那些,任選在Leu223后截斷。
[0066]優選的MGMT同源序列是在其中出現修飾(B)中的4個修飾的那些,任選在Leu223后截斷。
[0067]優選的MGMT同源序列是在其中出現修飾(B)中的5個修飾的那些,任選在Leu223后截斷。
[0068]優選的MGMT同源序列是在其中出現修飾(B)中的6個修飾的那些,任選在Leu223后截斷。
[0069]其它優選的MGMT 同源序列是含有 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、
18、19或20個選自(A)中所公開的修飾的突變的組合的那些,以及任選在Leu223后截斷。
[0070]尤其優選的是,含有突變Lys31Arg、Met32Ser、Cys93Ala、Lysl56Ala、Alal58Thr、Argl59Ala、Glyl62Lys、Glyl63Thr、Metl65Leu、Argl66Ser、Cysl81Ser、Asnl88Gly、Serl90Glu、Gly214Pro、Ser215Ala、Ser216Gly、Gly217Ile、Leu218Gly、Gly220Pro、Ala221Gly、Trp222Ser以及在Leu223后截斷的同源序列(即,SEQ ID NO:2的SNAP序列)。
[0071]在一個更優選的實施方式中,MGMT酶是SEQ ID NO:2的SNAP突變蛋白或其同源物。SEQ ID NO:2的SNAP突變體與人6-甲基鳥嘌呤-DNA-甲基轉移酶(NP_002403.2,SEQ ID NO:4)的氨基酸序列分享77%的同源性,與小鼠6-甲基鳥嘌呤-DNA-甲基轉移酶(NP_032624.1,SEQ ID NO:45)的氨基酸序列分享70%的同源性。
[0072]優選地,所述SNAP蛋白的同源序列與序列SEQ ID NO:2的SNAP蛋白至少80%以上、優選81%、更優選82%、更優選83%、更優選84%、更優選85%、優選86%、更優選87%、更優選88%、更優選89%、更優選90%、更優選91%、更優選92%、更優選93%、更優選94%、更優選95%、更優選96%到甚至更優選97%相同。
[0073]優選地,本發明的核苷酸表達載體還包括使得編碼興趣蛋白的異源DNA序列能夠進行框內插入的克隆位點。
[0074]如本發明中所表示的,術語“肽分泌信號”表示指導蛋白運輸的短(3-60個氨基酸長)肽鏈。
[0075]適用于本發明的分泌信號的實例包括但不限于交配因子(MF) α的信號肽序列(US5, 879,926);轉化酶(W084/01153) ;PH05 (DK3614/83) ;ΥΑΡ3 (酵母天冬氨酸蛋白酶 3 ;W095/02059);和 BARl (TO87/02670)。
[0076]在本發明的上下文中,這種肽分泌信號優選在非脊椎動物細胞或脊椎動物細胞或者在兩種當中是具有功能的。
[0077]在昆蟲細胞中具有功能的肽分泌信號的實例是:昆蟲ssBiP (SEQ ID N0:48,例如具有SEQ ID NO: 11的DNA序列)、SEQ ID NO:51的BiP樣肽信號(例如具有SEQ ID NO:50的DNA序列)以及蟲媒病毒中存在的任何肽信號,例如西尼羅病毒的包膜E蛋白(SEQ IDNO:15)。
[0078]有趣的是,上述BiP樣肽信號在非脊椎動物和脊椎動物細胞中均是有功能的。這種BiP樣信號對應著SEQ ID NO:48的BiP肽信號,其中最后的甘氨酸氨基酸被對應著登革病毒E蛋白切割位點的氨基酸序列Pro Thr Ala Leu Ala (SEQ ID N0:61)取代。因此,一旦蛋白被翻譯和分泌到宿主細胞上清中,BiP樣信號將有利地被切割掉。
[0079]各種分泌信號也可用于在酵母宿主細胞中的表達,如在釀酒酵母中。這包括前體α 因子(pr印ro alpha factor)、HSpl50、PHOl、SUC2、KILMl (I 型殺傷毒毒素)和 GGPl。
[0080]克隆位點是方便將編碼興趣蛋白的基因克隆至表達系統中的序列。其含有限制性位點、或限制性識別位點,即,含有特異性核苷 酸序列的DNA分子上的位置,其被限制性酶所識別(見如圖中)。這些通常是回文序列(因為限制性酶通常作為同型二聚體結合),且特定的限制性酶可切割其識別位點之內或附近的兩條核苷酸之間的序列。克隆位點是本領域技術人員已知的。
[0081]更優選的是,核苷酸表達載體還包括插入到所述克隆位點中的編碼興趣異源蛋白或異源多肽的異源DNA序列。
[0082]術語“異源”是指非天然存在的元素的組合。例如,本發明包括編碼“興趣蛋白/多肽”的“異源DNA序列”,這些DNA序列并非天然地處于或位于用于蛋白表達的宿主細胞的染色體位點中。[0083]當編碼興趣異源蛋白或多肽的異源DNA序列插入至本發明的核苷酸載體中時,優選要求其編碼包括所述信號肽、所述MGMT酶、其突變體或同源物、以及所述興趣異源蛋白/多肽的融合多肽。
[0084]在本發明的一個優選實施方式中,編碼所述MGMT酶的DNA序列位于編碼所述興趣異源蛋白的DNA序列的5’或3’,優選在5’。因此,MGMT酶直接或間接連接至興趣異源蛋白/多肽,優選位于興趣異源蛋白/多肽的N端。
[0085]特別優選,當興趣異源蛋白/多肽的活性結構域位于其C-端部分時,比如IFNa,編碼其所述MGMT酶的DNA序列位于編碼所述興趣異源蛋白/多肽的DNA序列的5’。按照相同的方式,其可以特別優選,當興趣異源蛋白/多肽的活性結構域位于其N-端部分時,編碼所述MGMT酶的DNA序列位于編碼所述興趣異源蛋白/多肽的DNA序列的3’。
[0086]更準確地,在第一方面中,本發明涉及一種用于在宿主細胞中,優選在非脊椎動物和/或脊椎動物宿主細胞中,更優選在昆蟲細胞中表達重組蛋白的載體,所述載體包括按照5’至3’的方向在單一開放閱讀框中編碼如下的核苷酸序列:
[0087]a)在所述宿主細胞中具有功能的肽分泌信號,
[0088]b)6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT,EC2.1.1.63)、其突變體或催化結構域,以及
[0089]c )重組蛋白。
[0090]本發明的上下文中,術語“重組蛋白”或“興趣蛋白”表示異源于蛋白產生細胞的基因產物或多肽,其優選選自診斷和治療蛋白或多肽。
[0091]更優選的是,所述診斷和治療蛋白或多肽選自如下:
[0092]-細菌或病毒的免疫原性蛋白,更優選(感染性、致病性)病毒的蛋白,例如來自登革、日本腦炎、蝶傳播腦炎、黃熱、烏蘇圖、羅西奧、穆雷腦炎、威塞爾斯布朗(Wesselbron)、茲卡或西尼羅病毒的EDIII蛋白,或來自裂谷熱或托斯卡納病毒的核蛋白N,或來自基孔肯雅病毒的E2包膜蛋白的可溶形式,或西尼羅病毒E包膜蛋白的可溶形式,和
[0093]-血液因子、抗凝血劑、生長因子、激素、疫苗、治療性酶、單克隆抗體和細胞因子(如IFN- α、顆粒酶M和FasL),
[0094]-抗原,如癌抗原,如睪丸癌抗原SSX2、或ERC/Mesotheline(無對應譯文)的N-端區域(NERCMSL ),
[0095]-抗腫瘤蛋白,如FasL,或肝素硫酸6_0_內硫酸酯酶(heparan-sulfate6-0_endosulfatases) (hSULF),
[0096]-微生物、病毒和/或寄生蟲多肽,
[0097]-任何其它有用蛋白(例如接觸蛋白)。
[0098]蛋白FasL是一種促凋亡蛋白,其可以用作抗腫瘤劑。其可以例如由SEQ ID NO:88編碼。
[0099]hSulf蛋白(或hSULF)是體內調節肝素硫酸結構并對惡性細胞的生長和進展具有顯著影響的肝素-硫酸6-0-內硫酸酯酶(Dai等人,2005)。在本發明的上下文中,優選hSulf2蛋白,和更優選hSulf_2"?,其中跨膜結構域(TMD)已被刪除以提高其溶解度,這種突變體具有氨基酸序列SEQ ID NO:95,并由例如SEQ IDNO:94編碼。
[0100]本發明的載體也可用于表達和純化興趣肽和/或多肽。在本發明的上下文中,術語“肽”和“多肽”是同義的,表示以肽鍵相連的氨基酸單體的短聚合物(也稱為“殘基”)。這些聚合物優選含有100個以內的殘基,更優選50個以內的殘基。
[0101]特別是,本發明的載體可用于表達和純化診斷性微生物多肽,如細菌、病毒或寄生蟲多肽。這種多肽的實例是由細菌、病毒或寄生蟲所分泌或表達的抗原肽、粘蛋白和/或毒素。優選,所述抗原肽由流感病毒、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、庚型肝炎病毒、HIV病毒、黃熱病毒、登革病毒、日本腦炎病毒、蜱傳播腦炎病毒、烏蘇圖或西尼羅病毒、裂谷熱或托斯卡納病毒、基孔肯雅病毒、呼吸道合胞病毒、羅西奧病毒、穆雷腦炎病毒、威塞爾斯布朗病毒、茲卡病毒(Zika Virus)、淋巴細胞性脈絡叢腦膜炎(lymphocyticchoriomeningitis)病毒、人細小病毒、人乳頭狀瘤病毒、人巨細胞病毒、或任何已鑒定的病毒表達。優選地,所述抗原肽由寄生原蟲(如痢疾變形蟲(Entamoeba histolytica)、籃氏賈第鞭毛蟲(Giardia lamblia))、蠕蟲(如線蟲、絳蟲或吸蟲)、或節肢動物(如甲殼綱、昆蟲綱、蜘蛛綱)表達。優選,所述抗原肽由傳染性細菌,如鏈球菌屬(Streptococcus )、葡萄球菌屬(Staphylococcus)和大腸桿菌表達。傳染性毒素在本領域是眾所周知的。人們可以舉出,作為實例,肉毒桿菌神經毒素、產氣莢膜梭菌ε毒素、蓖麻毒素、蛤蛘毒素、志賀毒素、河豚毒素、葡萄球菌腸毒素等。粘蛋白也是本領域已知的。MUC5AC、MUC5B和MUC2是其實例。這些實施例不是限制性的,任何肽/多肽可以通過本發明的方法表達。
[0102]接觸蛋白是屬于免疫球蛋白超家族的分子亞群,其只在神經系統表達(見Shimoda和Watanabe, 2009的綜述)。它們參與精神障礙,尤其是自閉癥。通過本發明的系統所生產的優選接觸蛋白是接觸蛋白2和接觸蛋白4。例如接觸蛋白4(CNTN4)由SEQ ID NO:91編碼(對應著完整蛋白NP_783200.1的氨基酸19-990)。
[0103]已知大量癌抗原是用于治療癌癥的有效疫苗靶。這種多肽的大量生產(見Cheever等人,2009中的列表)對于獲得有效的癌癥疫苗似乎是非常重要的。有趣的是,本發明的載體能夠獲得高水平的可用于免疫治療、或產生抗體、或癌癥診斷方法中的重組癌抗原。
[0104]SSX2和NERCMSL是癌.抗原的兩個例子。SSX2癌抗原由具有SEQ ID NO:76的DNA編碼(基因庫:NM_175698)0 ERC/Mesotheline 的 N-端區(NERCMSL)由 SEQ ID N0:83 編碼。這種抗原常用作患惡性間皮的患者中的檢測抗原。
[0105]根據本發明的方法可以產生任何蛋白。
[0106]然而,優選蛋白是治療性蛋白,如胰島素、IFN、FasL、Mesotheline、hSULF或接觸蛋白。
[0107]更一般地,優選蛋白是到目前為止難以大量生產的那些。這種蛋白是例如FasL、顆粒酶M、hSULF、Mesotheline和接觸蛋白。
[0108]編碼包括所述肽信號、所述MGMT酶、其突變體或催化結構域和所述興趣重組蛋白的融合多肽的DNA序列可以可操作地連接至誘導型啟動子,其中誘導型啟動子在相同宿主細胞中與肽信號同樣是有功能的。
[0109]更優選地,在本發明的載體中,所述開放閱讀框可操作地連接至誘導型啟動子,其中誘導型啟動子在相同宿主細胞中與肽信號同樣是有功能的。
[0110]在細胞中,編碼序列“可操作地連接至”表達調控序列(即轉錄和翻譯調控序列),當RNA聚合酶將編碼序列轉錄成RNA時,RNA然后進行反式RNA剪接(如果它包含內含子)以及,如果該序列編碼蛋白,則翻譯成該蛋白。[0111]“啟動子”是一種由此起始轉錄可操作地連接至其下游的DNA的核苷酸序列(即在雙鏈DNA的正義鏈3’方向)。啟動子序列內可見轉錄起始位點(例如,通過用核酸酶SI作圖可以方便地找到),以及負責RNA聚合酶結合的蛋白結合結構域(共有序列)。
[0112]本發明的上下文中可用于控制基因表達的啟動子例如在非脊椎動物細胞或脊椎動物細胞中是有功能的。例如,對于非脊椎動物細胞,可以使用金屬硫蛋白基因的調節序列(Brinster 等人,Nature, 296:39-42,1982)。
[0113]優選地,存在于本發明載體中的誘導型啟動子在昆蟲細胞中,更優選在果蠅細胞中,具有啟動子活性。例如果蠅金屬硫蛋白啟動子(Lastowsk1-Perry等人,J.Biol.Chem.260:1527(1985))),其在金屬如硫酸銅存在下指導高水平的基因轉錄。或者,可以使用果蠅肌動蛋白5C基因啟動子,這是一種組成型啟動子并且不需要添加金屬(B.J.Bond等人,Mol.Cell.Biol.6:2080(1986))。其它已知果蠅啟動子的實例包括例如誘導型熱休克(Hsp70)和COPIA LTR啟動子。SV40早期啟動子給出比果蠅金屬硫蛋白更低的表達水平。
[0114]優選地,存在于本發明載體中的誘導型啟動子在黑腹果蠅細胞中,優選在果蠅S2細胞中具有啟動子活性。例如在Lastowsk1-Perry等人,J.Biol.Chem.260:1527(1985)中充分描述的金屬硫蛋白啟動子。
[0115]適于在哺乳動物細胞中組成型表達的啟動子包括巨細胞病毒(CMV)立即早期啟動子、腺病毒主要晚期啟動子、磷酸甘油酸激酶(PGK)啟動子、單純皰疹病毒(HSV)-1的胸苷激酶(TK)啟動子。受外源性提供的化合物調節的誘導型真核啟動子包括但不限于鋅誘導的金屬硫蛋白(MT)啟動子、地塞米松(Dex)誘導型小鼠乳腺腫瘤病毒(MMTV)啟動子、T7聚合酶啟動子系統(W098/10 088)、昆蟲蛻皮激素啟動子、四環素阻遏型啟動子、四環素誘導型啟動子、RU486誘導型啟動子和雷帕霉素誘導型啟動子。
[0116]優選地,存在于本發明載體的啟動子在哺乳動物細胞中,優選在HeLa細胞中具有啟動子活性。例如SV40啟動子。
[0117]一系列酵母啟動子可用于在酵母宿主細胞中表達蛋白。有些例如ADH2、SUC2是誘導型的,而其它的例如GAPDH在表達中是組成型的。適于在酵母中表達的其它啟動子包括TEF,PGK,MFa、CYC-1、GAL_1、GAL4、GAL10、PH05、甘油醛 _3_ 磷酸脫氫酶(GAP 或 GAPDH)和乙醇脫氫酶(ADH)啟動子。
[0118]為了用于植物細胞中,最常用的啟動子是花椰菜花葉病毒(CaMV) 35S啟動子或其增強版,但可以使用一些替代啟動子,如來自玉米和擬南芥(A.Thaliana)的雜交(ocs)3mas啟動子或泛素啟動子。不同于這些組成型啟動子,水稻α-淀粉酶RAmy3D啟動子由糖的剝奪誘導(Hellwig S等人,2004)。
[0119]適于在大腸桿菌宿主細胞中表達的啟動子包括但不僅限于噬菌體lamba pL啟動子、lac、TRP和IPTG誘導型pTAC啟動子。
[0120]優選,肽分泌信號和誘導型啟動子在相同宿主細胞中是有功能的。
[0121]更優選,肽分泌信號和誘導型啟動子在果蠅S2細胞和脊椎動物細胞中是有功能的。
[0122]術語“誘導型”,當用于啟動子時,是本領域技術人員眾所周知的。本質上,在誘導型啟動子控制下的表達,在響應所施加的刺激時,被“開啟”或增加。刺激的性質隨啟動子而不同。在沒有適當刺激的情況下,有些誘導型啟動子導致很少或檢測不到的表達水平(或不表達)。在沒有刺激的情況下,其它誘導型啟動子導致可檢測到的組成型表達。在沒有刺激的情況下,無論表達水平如何,當存在正確刺激時,來自任何誘導型啟動子的表達是增加的。
[0123]一旦構建適當的載體并轉染到所選擇的宿主細胞中,優選果蠅細胞系,通過加入適于誘導型啟動子的誘導劑來誘導異源蛋白的表達。例如鎘或銅是Hsp70啟動子的誘導劑。對于組成型啟動子,如肌動蛋白5C啟動子,表達不需要誘導劑。
[0124]本發明的人MGMT酶優選由人MGMT基因序列NM_002412.3、基因ID4255 (SEQ IDNO:3)編碼、或由優化序列SEQ ID N0:68 (包括僅50% G/C)編碼。然而,在本發明的上下文中可以使用任何其同源序列,只要它編碼功能MGMT酶、其突變體或催化結構域,優選SEQID NO:4 或 SEQ ID NO:2。
[0125]編碼所述MGMT突變體的優選DNA序列是SNAP DNA序列SEQ ID NO:1,或者是編碼 SEQ ID NO:2 但具有 51% G/C 含量的 DNA 序列 SEQ ID NO:47 或 SEQ ID NO:67。
[0126]在本發明的另一個實施方式中,本發明的核苷酸載體編碼至少MGMT酶的一個片段(例如SEQ ID NO:4的片段),或其同源物的片段(例如序列SEQ ID NO:2的MGMT突變體的片段),其保留了以比用該片段所來源的全長酶獲得的水平增加至少0.5倍的因子增加興趣蛋白的表達的生物活性。作為一個實例,如果利用SEQ ID NO:4的全長酶的生產水平為100mg/L,那么具有至少50mg/L生產水平的SEQ ID NO:4的任何片段(與SEQ ID N0:4全長酶相同的實驗條件)都包括在本發明之內。
[0127]在本發明的另一個實施方式中,核苷酸表達載體編碼至少一個肽切割位點,其優選位于MGMT酶或其催化結構域和興趣重組蛋白之間。
[0128]肽的切割位點(也稱為“肽切割位點”)是由至少一種蛋白酶(例如,絲氨酸蛋白酶、半胱氨酸蛋白酶等)所識別的氨基酸序列。肽切割位點的實例是SEQ IDNO:62的腸激酶切割位點(AspAspAspAspLys/Asp),例如由DNA序列SEQ IDNO:12所編碼的。腸激酶是一種絲氨酸蛋白酶(EC3.4.21.9),已知其通過切割序列的C-端將非活性胰蛋白酶原轉換為活性胰蛋白酶:Val—(Asp)4—Lys—Ile—Val ~(胰蛋白酶原)一Val—(Asp)4—Lys (六肽)+Ile—Val~(胰蛋白酶)。如果Lys前面是四個Asp并且后面沒有脯氨酸殘基,則腸激酶在賴氨酸后切割。
[0129]另一種有用的肽切割位點是所謂的“TEV蛋白酶”切割位點,其具有氨基酸序列SEQID N0:53 或 SEQ ID NO:65(Glu Asn Leu Tyr Phe Gln Gly 或 Ser),其是例如由 DNA 序列SEQ ID N0:52 或 SEQ ID N0:66 編碼。TEV 蛋白酶是煙草蝕紋病毒(tobacco etch virus)編碼的核包涵體蛋白的27kDa催化結構域的通用名。其可市售獲得(Invitrogen)。
[0130]來自登革病毒血清型I的膜前體prM的切割位點(SEQ ID NO:61)也可用于本發明的載體中。
[0131 ] 在另一個實施方式中,本發明核苷酸表達載體還編碼一個標記,其優選位于本發明融合多肽中重組蛋白的C端(包括肽信號、MGMT蛋白或其同源物和重組蛋白)。
[0132] 在本發明的上下文中,“標記”專門用于便于從宿主細胞的粗裂解物中回收多肽,并優選選自:突光蛋白、多聚組氨酸(poly-his)或聚組氨酸-甘氨酸(poly-his-gly)標簽;Flu HA標簽;c-myc標簽單純皰疹病毒糖蛋白D (gD)標簽、Flag-肽、α -微管蛋白表位或Τ7基因10蛋白肽標簽。然而,可以使用任何其它標記。在本發明的一個優選實施方式中,載體包括編碼具有SEQ ID NO:14的六個組氨酸標簽的DNA。
[0133]在另一個實施方式中,本發明的核苷酸表達載體還編碼間隔序列,優選位于MGMT酶(或其催化結構域)和興趣重組蛋白之間和/或興趣重組蛋白和標記之間。
[0134]在本發明的上下文中,間隔序列是包括至少三個氨基酸的氨基酸序列,專門用于空間分隔兩條連接的多肽(然后這些多肽間接地連接起來)。這樣的間隔序列可以是例如氨基酸序列甘氨酸-甘氨酸-甘氨酸-絲氨酸(GGGS,SEQ ID NO:63),以及編碼它的DNA間隔序列是SEQ ID NO:130在本發明的上下文中,此后這種DNA序列稱為“DNA間隔序列”并位于編碼MGMT或其催化結構域的DNA和重組DNA序列之間,優選編碼肽切割位點的DNA序列的上游。
[0135]本發明所公開的核苷酸表達載體可以有序列SEQ ID NO:9、序列SEQ ID N0:10或SEQ ID NO:64 (對應著在克隆位點中沒有插入興趣重組基因的空載體)。在【具體實施方式】中,本發明的載體可以編碼:
[0136]-如上所述的肽BiP昆蟲信號(優選在S2果蠅細胞中是有功能的)或BiP樣信號,
[0137]-SEQ ID NO:4 的 MGMT 蛋白或 SEQ ID NO:2 的 SNAP 蛋白,
[0138]-興趣重組蛋白,
[0139]-如上所述的腸激酶肽切割位點或proTEV切割位點,
[0140]-多聚組氨酸標記,和
[0141]-具有氨基酸序列甘氨酸-甘氨酸-甘氨酸-絲氨酸(GGGS,SEQID NO:63)的兩條間隔序列。
[0142]在一個更優選的實施方式中,本發明的表達載體編碼:
[0143]-SEQ ID NO:48 的肽 BiP 昆蟲信號,
[0144]-SEQ ID NO:4 的 MGMT 蛋白或 SEQ ID NO:2 的 SNAP 蛋白,
[0145]-興趣重組蛋白,
[0146]-SEQ ID NO:62的腸激酶肽切割位點,
[0147]-多聚組氨酸標記,和
[0148]-具有氨基酸序列甘氨酸-甘氨酸-甘氨酸-絲氨酸(GGGS)的兩條間隔序列。
[0149]在另一個優選的實施方式中,本發明的表達載體編碼:
[0150]-SEQ ID NO:51 的 BiP 樣肽信號,
[0151]-SEQ ID NO:4 的 MGMT 蛋白或 SEQ ID NO:2 的 SNAP 蛋白,
[0152]-興趣重組蛋白,
[0153]-SEQ ID NO:53 的 proTEV 肽切割位點,
[0154]-多聚組氨酸標記,和
[0155]-具有氨基酸序列甘氨酸-甘氨酸-甘氨酸-絲氨酸(GGGS)的兩條間隔序列。
[0156]例如,這樣的載體可以包括序列SEQ ID NO:19 (當興趣蛋白是RVF病毒核蛋白N時)、SEQ ID NO:20 (當興趣蛋白是西尼羅病毒核蛋白N時)、SEQ IDNO:21或57或72或74(當興趣蛋白是IFNa時)、 SEQ ID N0:77、79或81 (當興趣蛋白是癌抗原SSX2時)、SEQ IDNO:55 (當興趣蛋白是顆粒酶M時)、SEQ ID NO:89 (當興趣蛋白是FasL時)、SEQ ID NO:84或86 (當興趣蛋白是癌抗原NERCMSL時)、或SEQ ID NO:92 (當興趣蛋白是接觸蛋白CNTN4時)。[0157]在第二方面中,本發明還公開了用于在宿主細胞中表達重組蛋白的載體,其包括在單一開放閱讀框中從5’到3’的方向編碼如下的核苷酸序列:
[0158]a)肽分泌信號,
[0159]b) SEQ ID NO:4 的 MGMT 蛋白或 SEQ ID NO:2 的 SNAP 蛋白,
[0160]c)至少一個肽切割位點,
[0161]d)多聚組氨酸標記,和
[0162]e)至少一條間隔序列。
[0163]在一個優選的實施方式中,所述肽分泌信號是SEQ ID NO:50的BiP樣肽信號。
[0164]在一個更優選的實施方式中,所述載體包含兩個SEQ ID NO:52的proTEV肽切割位點和/或兩條具有氣基酸序列SEQ ID NO:63的間隔序列。
[0165]在一個具體的優選實施方式中,所述載體包含序列SEQ ID N0:59或SEQ IDNO:69,所述序列在本申請中被分別稱為通用DeSNAP盒“DeSNAP Univ”和DeMGMT盒“DeMGMTUniv,,。
[0166]這些“DeSNAP Univ” (SEQ ID NO:59)和 “DeMGMT Univ” (SEQ ID NO:69)被稱為“通用”序列,因為它們可以插入到任何類型的專門用于轉染宿主的載體中以產生異源蛋白,即脊椎動物載體(如 PCDNA3或PC1-neo載體)以及非脊椎動物載體(如用于DES系統的pMT/BiP/V5-HisA,見如下實施例)。
[0167]包括所述通用序列的質粒實例是SEQ ID NO:64 (包括DeSNAP Univ的pUC57)和SEQ ID NO:71 (帶有 DeMGMT Univ 的 pUC57)。
[0168]一旦興趣蛋白的異源序列在此處被克隆,這樣的載體可有利地轉染到脊椎動物或非脊椎動物宿主細胞中,以便產生大量興趣蛋白。
[0169]在第三方面中,本發明針對穩定轉染有所述DeSNAP Univ或DeMGMT Univ載體的重組細胞,即轉染有包括在單一開放閱讀框中編碼如下的核苷酸序列的表達載體,從5’到3’的方向:
[0170]a)肽分泌信號,
[0171]b) SEQ ID NO:4 的 MGMT 蛋白或 SEQ ID NO:2 的 SNAP 蛋白,
[0172]c)至少一個肽切割位點,
[0173]d)多聚組氨酸標記,和
[0174]e)至少一條間隔序列,
[0175]各成分如上述定義。
[0176]其優選包括SEQ ID NO:64 的質粒(包括 DeSNAP Univ 的 pUC57)或 SEQ ID NO:71(帶有 DeMGMT Univ 的 pUC57)、或至少核苷酸序列 SEQ ID NO:59 (DeSNAP Univ)或 SEQ IDNO:69 (DeMGMT Univ)。
[0177]優選地,在本發明的這一方面,所述重組細胞是大腸桿菌細胞。
[0178]使用這種重組細胞以便擴增和純化本發明的表達載體,優選包括SEQ ID N0:59的DeSNAP Univ (如 SEQ ID NO:64)或 SEQ ID NO:69 的 DeMGMT Univ (如 SEQ ID NO:71)的那些。
[0179]因此,本發明還針對這種重組細胞用于生產本發明的任何表達載體(所述載體如上所述)的用途。[0180]本發明的核苷酸表達載體也可包括編碼選擇標志物和/或終止子序列的基因。
[0181]可納入構建體的選擇標志物基因通常是賦予選擇性表型的那些,如抗生素抗性(如殺稻痕圃素、氣節青霉素、卡那霉素、潮霉素、嘿吟霉素、氣霉素)。
[0182]在第四方面中,本發明涉及融合多肽,其包括在宿主細胞中,優選在非脊椎動物或脊椎動物細胞中,更優選在昆蟲細胞中有功能的肽分泌信號,以及如上所述的6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT) (EC2.1.1.63)、其突變體或催化結構域。
[0183]在這種融合多肽中,優選所述MGMT酶是SEQ ID NO:4的蛋白、SEQ ID NO:2的SNAP蛋白突變體或其同源物。
[0184]這種融合多肽優選還包括如上所述的興趣重組蛋白,優選位于如上所述的MGMT酶或其催化結構域、和/或標記的C端。這種標記優選是多聚組氨酸標記,且優選位于興趣重組蛋白的C端。
[0185]本發明的融合多肽可以是SEQ ID吣:33至43、5£0 ID NO:56或SEQ ID NO:58的氨基酸序列(當興趣重組蛋白是GrM時)、SEQ ID NO:73或75 (當興趣重組蛋白是IFN a時)、SEQ ID N0:78或80或82 (當興趣重組蛋白是癌抗原SSX2時)、SEQ ID NO:85或87(當興趣重組蛋白是NERCMSL時)、SEQ ID NO:90 (當興趣重組蛋白是FasL時)、或SEQ IDNO:93 (當興趣重組蛋白是CNTN4時)。
[0186]有趣的是,本發明的融合蛋白可以被存儲在4°C下持續幾個月沒有降解。儲存期間的這種體外穩定效果可以歸因于MGMT蛋白的支架作用、和/或由于MGMT蛋白的存在而獲得的高濃度(通常至少40mg/mL)。
[0187]更重要的是,與MGMT.的結合在分泌蛋白的純化過程中穩定了重組蛋白。因此一旦施用至有此需求的受試者中,它可以用于體內穩定重組蛋白。與MGMT偶聯將是用于增強這種重組蛋白在體內壽命的手段。這種體內穩定效果目前正在研究中。
[0188]在第五方面中,本發明涉及包括本發明表達載體的非脊椎動物重組宿主細胞。
[0189]非脊椎動物細胞可以是來自昆蟲、蛛形綱、甲殼綱、軟體動物門、環節動物門、蔓足綱、放射蟲綱、腔腸動物門和纖毛蟲綱的任何細胞。在本發明的上下文中,非脊椎動物細胞優選是昆蟲細胞,如果蠅或蚊子細胞。它們更優選為果蠅S2細胞。
[0190]果蠅S2細胞已被廣泛描述。它們尤其適合蛋白的高產量生產,因為在室溫(24±1°C)下它們可以保持在懸浮培養中。培養基是補充有5%和10% (v/v)之間的熱滅活胎牛血清(FBS)的M3。在本發明的優選實施方式中,培養基含有5%FBS。誘導后,細胞培養在無血清介質中。在這樣的介質中,S2細胞可以在懸浮培養中生長,例如在250mL至2000mL旋轉瓶中,以50-60rpm攪拌。細胞密度通常保持在IO6和IO7之間個細胞每mL。
[0191]本發明還涉及包括本發明表達載體的重組S2果蠅細胞,所述表達載體包括優選選自如下的核苷酸序列:
[0192]-質粒SEQID NO:64 (帶有DeSNAP Univ的pUC57)或克隆至細胞中的核苷酸序列,根據布達佩斯條約該細胞已于2011年12月9日以編號CNCM 1-4581保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所,25rue du Docteur Roux, 75724Paris cedexl5,法國,
[0193]-包括SEQID NO:19的載體或克隆至細胞中的核苷酸序列,根據布達佩斯條約該細胞已于2010年8月19日以編號CNCM 1-4357保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所,25rue du Docteur Roux, 75724Paris cedexl5,法國,
[0194]-包括SEQID NO:22的本發明載體或克隆至細胞中的核苷酸序列,該細胞已于2010年10月27日以編號CNCM 1-4381保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所,
[0195]-包括SEQID NO:21的本發明載體或克隆至細胞中的核苷酸序列,該細胞已于2010年10月27日以編號CNCM 1-4382保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所,
[0196]-SEQ ID NO:9的載體或克隆至細胞中的核苷酸序列,該細胞已于2010年9月29日以編號CNCM 1-4368保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所,
[0197]-包括SEQID NO:20的本發明載體或克隆至細胞中的核苷酸序列,該細胞已于2010年9月29日以編號CNCM 1-4369保藏在法國國家微生物保藏中心(CNCM), 巴斯德研究所,
[0198]-SEQ ID NO:71 的載體,
[0199]-包括SEQ ID N0:57 或 72 或 74 (當興趣蛋白是 IFNa 時)、SEQ ID NO:77、79 或81 (當興趣蛋白是癌抗原SSX2時)、SEQ ID NO:55 (當興趣蛋白是顆粒酶M時)、SEQ ID NO:89(當興趣蛋白是FasL時)、SEQ ID NO:84或86(當興趣蛋白是癌抗原NERCMSL時)、或SEQID NO:92 (當興趣蛋白是接觸蛋白CNTN4時)或SEQ ID NO:96 (當興趣蛋白是hSULF_2A?時)的本發明的載體。
[0200]本發明穩定轉染的S2細胞也可選自如下:
[0201]-于2010年8月19日以編號CNCM1-4357保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所,25rue du Docteur Roux, 75724Paris cedexl5,法國的細胞,
[0202]-于2010年10月27日以編號CNCM1-4381保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0203]-于2010年10月27日以編號CNCM1-4382保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0204]-于2010年9月29日以編號CNCM1-4368保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0205]-于2010年9月29日以編號CNCM1-4369保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0206]-于2011年12月5日以編號CNCM1-4565保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0207]-于2011年12月5日以編號CNCM1-4566保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0208]-于2011年12月5日以編號CNCM1-4567保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0209]-于2011年12月5日以編號CNCM1-4568保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0210]-于2011年12月5日以編號CNCM1-4569保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,[0211]-于2011年12月5日以編號CNCM1-4570保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0212]-于2011年12月5日以編號CNCM1-4571保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0213]-于2011年12月5日以編號CNCM1-4572保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0214]-于2011年12月8日以編號CNCM1-4576保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0215]-于2011年12月8日以編號CNCM1-4577保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0216]-于2011年12月8日以編號CNCM1-4578保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0217]-于2011年12月8日以編號CNCM1-4579保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0218]-于2011年12月8日以編號CNCM1-4580保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0219]-于2011年12月9日以編號CNCM1-4582保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25r ue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0220]-于2011年12月9日以編號CNCM1-4583保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0221]-于2011年12月9日以編號CNCM1-4584保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,
[0222]-于2011年12月9日以編號CNCM1-4585保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,以及
[0223]-于2011年12月9日以編號CNCM1-4586保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞。
[0224]以編號CNCM 1-4357保藏的重組細胞是包括SEQ ID NO: 19的質粒載體(pMT/BiP/SNAP-RVF.N/His標簽)的穩定巨噬細胞果蠅細胞系S2,其中RVF.N為裂谷熱病毒(RVF)的N 抗原(see Brehin 等人,Virology371:185, 2008)。
[0225]以編號CNCM 1-4381保藏的重組細胞是包括質粒載體pMT/BiP/V5_His標簽的穩定巨噬細胞果蠅細胞系S2,其中SEQ ID NO:22 (3應?/11£0111)插入到扮?序列之后,其中WN.EDIII是西尼羅病毒糖蛋白E的III結構域。
[0226]以編號CNCM 1-4382保藏的重組細胞是包括質粒載體pMT/V5_His標簽的穩定巨噬細胞果蠅細胞系S2,其中插入有SEQ ID NO:21 (BiP/SNAP/IFNa I)。IFNa I是SEQ IDNO:32 的人 a I 干擾素(Mokkim 等人,Protein expression purif.63:140,2009)。
[0227]以CNCM 1-4369保藏的重組細胞是包括含有SEQ ID NO:20 (WN.sE/SNAP/his標簽)的質粒載體pMT/BiP/V5-His標簽的穩定巨噬細胞果蠅細胞系S2,其中WN.sE是西尼羅病毒E包膜蛋白的可溶形式。
[0228]以CNCM 1-4369保藏的重組細胞是包括含有SEQ ID NO:20 (WN.sE/SNAP/his標簽)的質粒載體pMT/BiP/V5-His標簽的穩定巨噬細胞果蠅細胞系S2,其中WN.sE是西尼羅病毒E包膜蛋白的可溶形式。
[0229]以CNCM 1-4565保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+DVl.EDII I/His標簽的穩定巨噬細胞果蠅細胞系S2,其中DVl.EDIII編碼登革病毒I的EDIII蛋白,并具有序列 SEQ ID NO:27。
[0230]以CNCM 1-4566保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+DV2.EDII I/His標簽的穩定巨噬細胞果蠅細胞系S2,其中DV2.EDIII編碼登革病毒2的EDIII蛋白,并具有序列 SEQ ID NO:28。
[0231]以CNCM 1-4567保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+DV3.EDII I/His標簽的穩定巨噬細胞果蠅細胞系S2,其中DV3.EDIII編碼登革病毒3的EDIII蛋白,并具有序列 SEQ ID NO:29。
[0232]以CNCM 1-4568保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+DV4.EDII I/His標簽的穩定巨噬細胞果蠅細胞系S2,其中DV4.EDIII編碼登革病毒4的EDIII蛋白,并具有序列 SEQ ID NO:30。
[0233]以CNCM 1-4569保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+YF.EDIII/His標簽的穩定巨噬細胞果蠅細胞系S2,其中YF.EDIII編碼黃熱病毒的EDIII蛋白,并具有序列SEQ ID NO:31。
[0234]以CNCM 1-4570保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+JE.EDIII/His標簽的穩定巨噬細胞果蠅細胞系S2,其中JE.EDIII編碼日本腦炎病毒的EDIII蛋白,并具有序列 SEQ ID NO:25。
[0235]以CNCM 1-4571保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+USU.EDII I/His標簽的穩定巨噬細胞果蠅細胞系S2,其中USU.EDIII編碼烏蘇圖病毒的EDIII蛋白,并具有序列 SEQ ID NO:24。
[0236]以CNCM 1-4572保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+TBE.EDII I/His標簽的穩定巨噬細胞果蠅細胞系S2,其中TBE.EDIII編碼蜱傳播腦炎病毒的EDIII蛋白,并具有序列SEQ ID NO:26。
[0237]以CNCM 1-4576保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+MVE.EDII I/His標簽的穩定巨噬細胞果蠅細胞系S2,其中MVE.EDIII編碼穆雷腦炎病毒的EDIII蛋白。
[0238]以CNCM 1-4577保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+Roci0.EDIII/His標簽的穩定巨噬細胞果蠅細胞系S2,其中Roci0.EDIII編碼羅西奧病毒的EDIII蛋白。
[0239]以CNCM 1-4578保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+SLE.EDII I/His標簽的穩定巨噬細胞果蠅細胞系S2,其中SLE.EDIII編碼圣路易腦炎病毒(Saint-Louisencephalitis virus)的 EDIII 蛋白。
[0240]以CNCM 1-4579保藏的重組細胞是 包括質粒載體pMT/BiP/SNAP+WSL.EDII I/His標簽的穩定巨噬細胞果蠅細胞系S2,其中WSL.EDIII編碼威塞爾斯布朗病毒的EDIII蛋白。
[0241]以CNCM 1-4580保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+Zika.EDIII/His標簽的穩定巨噬細胞果蠅細胞系S2,其中Zika.EDIII編碼茲卡病毒的EDIII蛋白。
[0242]以CNCM 1-4583保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+SSX2/His標簽的穩定巨噬細胞果蠅細胞系S2,其中SSX2是SEQ ID NO:76。[0243]以CNCM 1-4584保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+NERCMSL/His標簽的穩定巨噬細胞果蠅細胞系S2,其中NERCMSL是SEQ IDNO:83。
[0244]以CNCM 1-4585保藏的重組細胞是包括質粒載體pMT/BiP/SNAP+GrM/His標簽的穩定巨噬細胞果蠅細胞系S2,其中GrM是SEQ ID NO:54。
[0245]以CNCM 1-4586保藏的重組細胞是包括質粒載體pMT/BiP/ProTEV/His標簽的穩定巨噬細胞果蠅細胞系S2,其中ProTEV是SEQ ID NO:52。
[0246]在第六方面中,本發明還針對穩定轉染有本發明表達載體的脊椎動物重組細胞。
[0247]優選地,所述脊椎動物重組細胞是哺乳動物細胞,優選CHO、YB2/0、COS、HEK、NIH3T3、HeLa細胞或其衍生物。更優選,在這種情況下,本發明的表達載體包括SEQ ID NO:57或72或74(當興趣蛋白是IFN a時)、SEQ ID NO:77、79或81(當興趣蛋白是癌抗原SSX2時)、SEQ ID NO:55 (當興趣蛋白是顆粒酶M時)、SEQ ID NO:89 (當興趣蛋白是FasL時)、SEQ ID N0:84或86 (當興趣蛋白是癌抗原NERCMSL時)、SEQ ID NO:92 (當興趣蛋白是接觸蛋白CNTN4時)或SEQ ID NO:96 (當興趣蛋白是hSULF_2A?時)。在第七方面中,本發明涉及增強重組蛋白表達的方法,包括將所述蛋白和肽分泌信號與酶6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT)(EC2.1.1.63)、其突變體或催化結構域共表達。所述共表達優選在非脊椎動物細胞中進行,且更優選昆蟲細胞。
[0248]更優選,在本方法中,MGMT酶是SEQ ID NO:4的蛋白或其同源物,例如SEQ ID NO:2的SNAP蛋白或其同源物。
[0249]在本發明的上下文中,術語異源蛋白的“增強表達”是指所述蛋白在重組細胞上清中或細胞自身內的表達,相較于現有技術的重組載體(即,不共表達蛋白與MGMT或SNAP蛋白的載體)所獲的所述蛋白的表達和/或分泌,改善至少2倍,優選5倍,更優選10倍,以及甚至更優選20倍。在一個優選的實施方式中,術語“增強表達”是指有可能從轉染有本發明載體的宿主細胞上清中回收至少40mg/L、優選至少50mg/L、更優選至少60mg/L興趣蛋白。
[0250]術語“共表達”是指編碼i)重組蛋白、ii)MGMT酶、其突變體或催化結構域和iii)肽分泌信號的DNA序列,可操作地連接至表達調控序列(即轉錄和翻譯調控序列),并受其控制。編碼肽分泌信號、興趣異源蛋白和MGMT酶的DNA序列的翻譯因此導致融合多肽的形成,其中蛋白可以通過如上所定義的間隔序列、和/或酶切割位點分開。
[0251]本發明融合多肽的“肽分泌信號”優選是在非脊椎動物細胞或脊椎動物細胞中、或兩者中、以及更優選在昆蟲細胞中、甚至更優選在果蠅S2細胞中具有功能的分泌信號。
[0252]在昆蟲細胞中具有功能的肽分泌信號的實例是:SEQ ID NO:48的昆蟲ssBiP、SEQID N0:51的BiP樣信號以及蟲媒病毒中存在的任何肽信號,例如西尼羅病毒的包膜E蛋白(SEQ ID NO:15)。
[0253]在脊椎動物和非脊椎動物細胞中具有功能的肽分泌信號的實例是SEQ ID NO:51的BiP樣信號。
[0254]在第八方面中,本發明涉及改善興趣重組蛋白的生產或在細胞培養中生產重組蛋白的方法,包括使用如上所述的本發明的載體、或如上所述的重組宿主細胞。
[0255]更精確地,改善興趣重組蛋白的生產、或在細胞培養中生產重組蛋白的所述方法包括步驟:
[0256]a)提供編碼所述興趣蛋白的本發明的核苷酸表達載體,[0257]b)將所述表達載體引入宿主細胞,優選非脊椎動物或脊椎動物宿主細胞,
[0258]c)使引入所述宿主細胞的核苷酸進行表達來產生所述興趣重組蛋白。
[0259]優選地,所述非脊椎動物宿主細胞是昆蟲細胞,例如果蠅S2細胞。
[0260]優選地,所述脊椎動物宿主細胞是哺乳動物細胞,例如CHO、YB2/0、COS、HEK、NIH3T3、HeLa細胞或其衍生物。
[0261]通過使用這 種方法,興趣重組蛋白以至少40mg/L或以上的回收的細胞培養上清
得以表達。
[0262]使用將基因產物直接分泌到介質中的果蠅細胞系S2是本發明的一個優選實施方式(直接分泌到介質中允許利用高效的一步純化系統)。
[0263]在第九實施方式中,本發明涉及酶6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT)(EC2.1.1.63)、其突變體或催化結構域用于增強重組蛋白優選在感染有復制型或缺陷型載體的非脊椎動物和/或脊椎動物宿主細胞,更優選在昆蟲細胞或哺乳動物細胞中的生產水平的用途。
[0264]MGMT酶可以是序列SEQ ID NO:4的人MGMT (參考NP_002403.2)、鑒定為NP_032624.1 的小鼠 MGMT (SEQ ID NO:45)、鑒定為 NP_036993.1 的大鼠 MGMT (SEQ ID NO:46)、其同源序列、或其子片段。
[0265]優選地,MGMT突變酶是SEQ ID NO: 2的SNAP蛋白或是其同源物,即與序列SEQ IDNO:2的SNAP蛋白至少80%以上,優選85%,更優選90%同一性。
[0266]所述非脊椎動物細胞優選是昆蟲細胞,例如果蠅S2細胞。
[0267]在一個優選的實施方式中,本發明涉及酶6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT)(EC2.1.1.63)、其突變體或催化結構域用于增強重組蛋白在感染有復制型或缺陷型載體的脊椎動物細胞,例如哺乳動物細胞中的生產水平的用途。
[0268]所述脊椎動物細胞優選是EBX、CHO、YB2/0、COS、HEK、NIH3T3細胞或其衍生物。
[0269]此外,本發明涉及編碼MGMT酶、其突變體或催化結構域的DNA序列用于改善興趣蛋白在重組細胞中生產水平的用途。
[0270]本發明還涉及編碼MGMT酶、其突變體或催化結構域的DNA序列用于i)體外和體內穩定興趣重組蛋白,和因此ii)增強其體外和體內壽命的用途。
[0271]例如這種DNA序列是人MGMT基因序列NM_002412.3、基因ID4255 (SEQID NO:3)或編碼功能MGMT酶、其突變體或催化結構域的其任何同源序列(優選SEQ ID NO=USEQ NO:47、SEQ ID N0:67 或 SEQ ID NO:68)。
[0272]特別是,本發明涉及6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT,EC2.1.1.63)、其突變體或催化結構域,作為融合至或連接至重組蛋白的保護多肽,來改善重組蛋白在儲存介質、在血漿或緩沖液中半衰期的用途,來改善作為藥物或疫苗的重組蛋白半衰期的用途,或改善用于診斷試劑盒中的重組蛋白半衰期的用途。
[0273]在本發明的上下文中,術語異源蛋白的“改善生產水平”或“增強生產水平”是指所述蛋白在所述細胞上清中或細胞內的表達,相較于用現有技術的重組載體(即,不包括本發明的載體)所獲的所述蛋白的表達,改善了至少2倍,優選5倍,更優選10倍,甚至更優選20倍。在一個優選的實施方式中,術語“改善生產”是指有可能從轉染有本發明載體的宿主細胞上清中回收至少40mg/L、優選至少50mg/L、更優選至少60mg/L興趣蛋白。[0274]在一個優選的實施方式中,所述重組蛋白選自:胰島素、IFN、SSX2、顆粒酶M、FasL、Mesotheline (NERMCSL)、內硫酸酯酶(hSULF)或接觸蛋白。
[0275]在一個具體的實施方式中,本發明還涉及用于生產興趣重組蛋白的方法,方法包括步驟:
[0276]Ca)獲得編碼興趣重組蛋白的異源DNA序列;[0277](b)將所述異源DNA序列插入本發明的核苷酸表達載體,所述載體具有例如DNA序列 SEQ ID N0:9、SEQ ID NO: 10, SEQ ID NO:64 或 SEQ ID NO:71,
[0278](C)用步驟(b)得到的多核苷酸轉染宿主細胞(優選昆蟲細胞或哺乳動物細胞);
[0279](d)使步驟(C)獲得的所述多核苷酸進行表達來生產興趣蛋白;
[0280](e )任選,切割MGMT多肽,
[0281](f)回收興趣蛋白,
[0282](g)任選,純化興趣蛋白。
[0283]為了進行本發明方法的不同步驟,可以采用本領域技術范圍內的常規分子生物學、微生物學和重組DNA技術。這種技術在文獻中都有完整的解釋。見,例如,Sambrook, Fitsch&Maniatis, Molecular Cloning:A Laboratory Manual,第二版(1989)Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(此處參考"Sambrook 等人,?,1989〃);DNA Cloning:A Practical Approach, Volumes I and II(D.N.Glover ed.1985) ;01igonucleotide Synthesis (M.J.Gait ed.1984) ;NucleicAcid Hybridization (B.D.Hames&S.J.Higgins,eds.1984) ;Animal Cell Culture(R.1.Freshney,ed.1986) ;Immobilized Cells and Enzymes (IRL Press, 1986);B.E.Perbal, A Practical Guide to Molecular Cloning (1984) ;F.M.Ausubel 等人,(eds.), Current Protocols in Molecular Biology, John ffiley&Sons, Inc.(1994)。
[0284]術語“轉染”是指將外源核酸引入到真核宿主細胞,從而宿主細胞將表達所引入的基因或序列以產生所需物質,在本發明中是所引入的基因或序列編碼的蛋白。接受且表達所引入的DNA或RNA的宿主細胞是“被轉染的”并成為“轉染子”或“克隆”。引入到宿主細胞中的DNA或RNA可以來自任何來源,包括與宿主細胞屬于相同屬或種的細胞,或屬于不相同屬或種的細胞
[0285]在本發明的上下文中,用多核苷酸轉染宿主細胞可以通過本領域中的經典方法進行,例如通過轉染、感染或電穿孔。在另一個實施方式中,可以通過脂質體轉染(以裸露DNA的形式),或與其它轉染促進劑(肽、聚合物等)體內引入本發明的載體。合成的陽離子脂類可用于制備編碼標志物的基因的體內轉染的脂質體(Feigner等人,Proc.Natl.Acad.Sc1.U.S.A.,84:7413-7417, 1987)。可用于轉移核酸的脂質化合物或組合物描述于W095/18863和TO96/17823,和U.S.5,459,127中。出于靶向的目的,脂質可化學偶聯至其它分子(見Mackey 等人,Proc.Natl.Acad.Sc1.U.S.A.,85:8027-8031,1988)。靶向肽如激素或神經遞質、和蛋白如抗體、或非肽分子可以化學偶聯至脂質體。其它分子也可用于促進核酸在體內的轉染,如陽離子寡肽(參見W095/21931 )、源自DNA結合蛋白的肽(見W096/25508)、或陽離子聚合物(見W095/21931)。也可能將載體作為裸露DNA質粒在體內引入。可通過本領域已知方法,如電穿孔、顯微注射、細胞融合、DEAE葡聚糖、磷酸鈣沉淀、使用基因槍、或使用DNA載體轉運體,將用于基因療法的裸露DNA載體引入所需宿主細胞中(見Wu等人,J.Biol.Chem.,267:963-967,1992 ;ffu 和 ffu, J.Biol.Chem.,263:14621-14624,1988 !Williams 等人,Proc.Natl.Acad.Sc1.U.S.A.,88:2726-2730,1991)。
[0286]術語“允許表達”多核苷酸此處是指存在于載體中的調控序列和所有所需成分的刺激(例如激活誘導型啟動子),其以足以發生多核苷酸翻譯的量進行。
[0287]如果需要的話,所產生的融合蛋白的MGMT/SNAP多肽的切割通過向上清中或重組細胞內加入具有明確切割位點的蛋白酶而實現。例如,通過向重組細胞上清中加入腸激酶而獲得腸激酶切割位點DDDK/D的切割。或者,可以維持MGMT/SNAP多肽從而增強重組蛋白的壽命。
[0288]此外,技術人員將理解可以在用于維持或培養本宿主細胞的培養基中檢測表達或分泌的蛋白或多肽。通過已知方法,如離心或過濾可以將培養基和宿主細胞分離。然后,通過利用蛋白或多肽的已知性質特征,可以在無細胞培養基中檢測蛋白或多肽。這種性質可以包括蛋白或多肽的區別免疫、酶或物理性質。例如,如果蛋白或多肽具有獨特的酶活性,可以在宿主細胞所用培養基上進行針對這種活性的分析。此外,當可以獲得針對給定蛋白或多肽的反應性抗體時,這種抗體可用于在任何已知免疫學方法中檢測蛋白或多肽(例如,在 Harlowe,等人,1988,Antibodies:A Laboratory Manual, Cold Spring HarborLaboratory Press 中X
[0289]興趣蛋白的回收由本領域中公知的方法介導,包括但不限于制備性圓盤凝膠電泳、等電聚焦、HPLC、反相HPLC、凝膠過濾、離子交換和分配色譜、沉淀和鹽析色譜、萃取和逆流分配(countercurrent distribution)等。因為優選在連接有標記的本發明重組系統中產生興趣蛋白,所述標記有助于通過色譜在適當的固相基質上從宿主細胞粗裂解物中回收多肽。或者,產生的對抗蛋白或對抗源自蛋白的多肽的抗體可用作回收劑。
[0290]可實施進一步的純化步驟(g),但有趣的是并不需要。
[0291]被純化的物質可含有小于約50%,優選小于約75%,最優選小于約90%的與該被純化的物質原始相關的細胞成分。“基本上純的”表示使用本領域已知的常規純化技術可以實現的最聞純度。
[0292]在本發明的一個實施方式中,本發明的方法使得可以在回收的細胞培養上清中獲得至少40mg/L,優選至少50mg/L,更優選至少60mg/L基本上純的興趣蛋白。
[0293]本發明的興趣重組蛋白和融合蛋白(即偶聯有MGMT/SNAP多肽的重組蛋白,其比單獨的重組蛋白更穩定)可用于各種產品中。例如,這些重組和/或融合蛋白可用于藥物組合物,例如用于病毒感染的治療。
[0294]在一個優選的實施方式中,所述重組蛋白選自:胰島素、IFN、FasL、顆粒酶M、SSX2、Mesotheline (NERMCSL)、內硫酸酯酶(hSULF)或接觸蛋白。
[0295]在另一個實施方式中,本發明提供含有上述核酸載體的感染性病毒顆粒。通常情況下,通過包括如下步驟的方法產生這樣的病毒顆粒:
[0296](a)將本發明的病毒載體引入到合適的細胞系中,
[0297](b)在適當的條件下培養所述細胞系以便允許生產所述感染性病毒顆粒,
[0298](C)從所述細胞系的培養物中回收所產生的感染性病毒顆粒,和
[0299](d)任選純化所述回收的感染性病毒顆粒。
[0300]當病毒載體是缺陷型時,通常在反式提供非功能性病毒基因的互補細胞系或通過使用輔助病毒來產生感染性顆粒。例如,用于互補El缺失的腺病毒載體的合適細胞系包括293細胞以及PER-C6細胞。可以從培養上清中或從裂解后的細胞中回收感染性病毒顆粒。根據標準技術(例如在 W096/27677、W098/00524、W098/22588、W098/26048、W000/40702、EP1016700和W000/50573中描述的色譜法、在氯化銫梯度中的超速離心法)它們可以被進
一步純化。
[0301]因此,本發明涉及包括本發明的表達載體、重組蛋白、融合蛋白、宿主細胞或病毒顆粒、或其任意組合的藥物組合物。這樣的藥物組合物包括混合有可藥用載體的、通過本發明方法獲得的治療量的載體、顆粒、細胞或蛋白。
[0302]可以通過腸胃外、靜脈或皮下地系統性施用組合物。當系統性施用時,用于本發明的治療組合物為無致熱源的、腸胃外可接受的蛋白溶液形式。這種腸胃外可接受的蛋白溶液的制備,考慮到pH、等滲性、穩定性等,在本領域的技術范圍內。
[0303]考慮到改變藥物作用的多種因素,例如狀態、體重、患者的排泄物(sew)和飲食、感染的嚴重程度、施用時間和其它臨床因素,劑量方案將由主治醫師確定。藥物組合物的藥物載體和其它成分將由本領域技術人員選擇。
[0304]此外,例如,本發明的融合和重組蛋白可用作疫苗組成,來接種哺乳動物受試者以對抗病毒感染。這些蛋白可單獨使用或與其它重組蛋白或治療性接種劑聯合使用。這種疫苗的組成將由本領域技術人員確定。
[0305]本發明還包括本發明的融合蛋白、表達載體、感染性病毒顆粒、宿主細胞或藥物組合物用于制備藥物特別是疫苗中的用途。
[0306]本發明還提供用于治療或預防人或動物生物體的方法,包括向所述生物體施用治療有效量的本發明的融合蛋白、表達載體、感染性病毒顆粒、宿主細胞或組合物。
[0307]最后本發明的蛋白,尤其是興趣融合蛋白的SNAP蛋白,可用作用于檢測癌癥、病毒感染或生物體液(如血液、血清、唾液等)中抗病毒蛋白抗體存在的診斷劑。這些蛋白也可用在鑒定和/或分離生物體液和組織中病毒蛋白的方法。因此,蛋白可以是進行這種方法的試劑盒中的組成。
[0308]因此,在另一個方面中,本發明還涉及通過本發明任何方法獲得的來自致病性或非致病性微生物的重組蛋白或MGMT或SNAP標簽的重組蛋白用于鑒定生物樣本中是否存在所述致病性或非致病性微生物的用途。在一個優選的實施方式中,所述致病微生物是病毒,MGMT或SNAP標簽的蛋白是病毒蛋白,如來自基孔肯雅、登革、日本腦炎(JE)、蜱傳腦炎(TBE)、黃熱(YF)、烏蘇圖(USU)或西尼羅病毒的EDII1、或來自裂谷熱或托斯卡納病毒的核蛋白N。
[0309]在本發明的上下文中,所述生物樣本是指血樣、尿樣、或疑似被病毒感染的任何生物樣本。
[0310]實施例
[0311]1.質粒構律
[0312]1.1.使用質粒pMT/BiP/V5_His A。它包含3642個核苷酸,并包含以下特征:
[0313]-金屬硫蛋白啟動子:堿基412-778
[0314]-轉錄起始:堿基778
[0315]-MT正向引物位點:堿基814-831[0316]-BiP 信號序列:堿基 851-904 (SEQ ID NO:11)
[0317]-多克隆位點:堿基906-999
[0318]-V5 抗原標簽:堿基 1003-1044
[0319]-多聚組氨酸區:堿基1054-1074
[0320]-BGH反向引物位點:堿基1094-1111
[0321]-SV40晚期多聚腺苷酸化信號:堿基1267-1272
[0322]-pUC 原點:堿基 1765-2438 (互補鏈)
[0323]-bla啟動子:堿基3444-3542 (互補鏈)
[0324]-氨芐青霉素(bla)抗性基因ORF:堿基2583-3443 (互補鏈)
[0325]pUC57Amp載體也可以用于本發明的目的。該載體包含:
[0326]-獨特克隆位點EcoRI
[0327]-金屬硫蛋白啟動子、
[0328]_來自西尼羅病毒株IS_98_ST1的基因組RNA5’端非編碼區、
[0329]-翻譯起始密碼子(ATG)、
[0330]-來自西尼羅病毒 株IS-98-ST1的包膜E蛋白的信號肽(SEQID NO:15),
[0331]_來自西尼羅病毒株IS_98_ST1的基因組RNA3’端非編碼區,其中兩個重復序列和3’端莖環已被刪除、
[0332]_S40polyA f目號基序、
[0333]-獨特克隆位點ApaI。
[0334]1.2.SNAP 克隆
[0335]在模板pMT/BiP/CHIK.sE2+SNAP標簽上,通過PCR使用如下文所述的一對5’ -SNAP和3’ -MCS引物進行編碼SNAP蛋白序列SEQ ID NO:2的DNA的擴增。
[0336]引物5,-SNAP:5,-aaaaaagatctgacaaagactgcgaaatg-3,(SEQ ID NO:7)
[0337]引物3,-MCS:5,-gaggagagggttagggataggcttacc-3’ (SEQ ID NO:8)
[0338]然后用Bgl II和Not I消化PCR產物,并插入到DES系統中線性化質粒p/MT/BiP/V5-A的獨特Bgl II (在MCS的5’端)和Not I (在MCS的3’端)位點之間。
[0339]得到的質粒是SEQ ID NO:9的pMT/BiP/SNAP-His標簽載體,包括:
[0340]-SEQ ID NO:11 的昆蟲 ssBiP 序列、
[0341]-SEQ ID NO:1 的 SNAP DNA 序列、
[0342]-SEQ ID NO:12的腸激酶切割位點、
[0343]-EcoRV-Sma I 限制性位點、
[0344]-位于限制性位點下游的編碼His6標簽的DNA(SEQ ID N0:14)、以及
[0345]-位于i)增強子序列和EcoRV-SmaI限制性位點之間,和ii)EcoRV-SmaI限制性位點和編碼His6標簽的DNA之間的SEQ ID NO:13的兩個DNA間隔序列。
[0346]pMT/BiP/SNAP-His標簽載體可以獲自pUC57骨架,并獲得具有序列SEQ ID NO:10的載體,載體包括:
[0347]-獨特克隆位點EcoRI
[0348]_金屬硫蛋白啟動子
[0349]_來自西尼羅病毒株IS-98-ST1基因組RNA的5’端非編碼區、[0350]-翻譯起始密碼子、
[0351]-SEQ ID NO:15的來自西尼羅病毒株IS-98-ST1的包膜E蛋白的信號肽、
[0352]-SEQ ID NO -Al 的 SNAP DNA 序列、
[0353]-用于將外源序列插入框架中的獨特克隆位點EcoRV和Sma I/Xma 1、
[0354]-SEQ ID NO:12的腸激酶切割位點,其位于SNAP增強子DNA和克隆位點之間、
[0355]-編碼六個組氨酸標簽序列的DNA(SEQ ID NO:14)、
[0356]-位于i)增強子序列和EcoRV-SmaI限制性位點之間,和ii)EcoRV-SmaI限制性位點和編碼His6標簽的DNA之間的SEQ ID NO:13的兩個DNA間隔序列
[0357]-兩個翻譯終止密碼子、
[0358]-來自西尼羅病毒株IS-98-ST1基因組RNA的3’端非編碼區,其中兩個重復序列和3’端莖環已被刪除、
[0359]-S40polyA信號基序和
[0360]-獨特克隆位點ApaI。
[0361]pMT/BiP樣/SNAP-His標簽載體可以獲自pUC57骨架,其中SEQ ID NO:59 (也見圖8)插入到獨特位點EcoR V和 Hind III之間。載體具有序列SEQ ID NO:64。其包括:
[0362]-獨特克隆位點EcoRI
[0363]_金屬硫蛋白啟動子
[0364]_來自西尼羅病毒株IS-98-ST1基因組RNA的5’端非編碼區、
[0365]-翻譯起始密碼子、
[0366]-SEQ ID NO:15的來自西尼羅病毒株IS-98-ST1的包膜E蛋白的信號肽、
[0367]-SEQ ID NO -Al 的 SNAP DNA 序列、
[0368]-用于將外源序列插入框架中的獨特克隆位點BamHUEcoR V、Apa I和Xma1、
[0369]-SEQ ID NO:52的兩個proTEV切割位點,位于SNAP增強子DNA和His標簽之間、
[0370]-編碼六個組氨酸標簽序列的DNA(SEQ ID NO:14)、
[0371]-位于i)增強子序列和EcoRV-SmaI限制性位點之間,和ii)ApaI限制性位點和編碼His6標簽的DNA之間的SEQ ID NO:13的兩個DNA間隔序列
[0372]-兩個翻譯終止密碼子、
[0373]-來自西尼羅病毒株IS-98-ST1基因組RNA的3’端非編碼區,其中兩個重復序列和3’端莖環已被刪除、
[0374]-S40polyA信號基序和
[0375]-獨特克隆位點ApaI。
[0376]1.3.興趣基因的克隆
[0377]1.3.1.裂谷熱病毒(RVF-N)的核蛋白N
[0378]通過PCR使用如下所列的5’ -N和3’ -N’弓丨物對進行編碼RFV-N蛋白序列的cDNA的定向誘變。
[0379]引物5’-N:
[0380]5' -aaaaaggcgcgccagggggtggcggatctgacaactatcaagagcttcgagtccagtttgctgctc-3’ (SEQ ID NO:17)
[0381]引物3,-N:[0382]5' -aaaaaaccggtcaatgatgatgatgatgatgacttccaccgccggctgctgtcttgtaagcctgagcgg-3’ (SEQ ID NO:18)
[0383]1.3.2.非病毒蛋白,例如干擾素IFNa I或顆粒酶M
[0384]也可使用SEQ ID NO:32的人IFNa I蛋白序列。
[0385]也可使用SEQ ID NO:54的人顆粒酶M蛋白序列。顆粒酶M是糜蛋白酶樣絲氨酸蛋白酶,其優先在Met或Leu之后切割其底物。其在激活的固有效應自然殺傷細胞中組成型表達。這種蛋白酶還具有抗病毒和抗腫瘤特性(van Domselaar R.等人,The Journal ofImmunology2010 ;Hu D.等人,The Journal of Biological Chemistry2010)o
[0386]1.4.將編碼蛋白的基因插入到pMT/BiP/SNAP-His標簽或pMT/BiP樣/SNAP-His標簽載體,從而獲得pMT/BiP/SNAP-蛋白-His標簽或pMT/BiP樣/SNAP-蛋白-His標簽載體
[0387]1.4.1.RVF.N
[0388]在1.3.1中獲得的PCR產物通過BssHII和AgeI消化,并插入到1.2中獲得的線性化質粒p/MT/BiP/SNAP-His標簽的獨特BssHII (在SNAP基因的3’端)和AgeI (在穿梭質粒MCS的3’端)位點之間。
[0389]得到的質粒是例如p/MT/BiP/SNAP-RVF.N/His 標簽(SEQ ID NO:19)。
[0390]1.4.2.不同黃病毒的ED III蛋白
[0391]為了增強基于重組黃病毒抗原的ELISA或免疫印跡試驗的特異性,E蛋白(EDIII)的抗原結構域III似乎是種有前途的方法(Ludolfs等人,2007)。用本發明的方法測試來自西尼羅(WN)、烏蘇圖(USU)、日本腦炎(JE)、蜱傳播腦炎(TBE)、登革血清型I至4(DEN-1、-2、-3、-4)和黃熱(YF)病毒的重組EDIII的生產。
[0392]動物傳染病的WN、USU和JE病毒屬于JE血清復合物(serocomplex)。果蠅S2誘導型表達系統(DES, Invitrogen)已被選擇用于在非脊椎動物細胞中大規模生產來自黃病毒的個體EDIII。編碼來自黃病毒WN、USU、JE、TBE、DEN-1到DEN-4和YF的E蛋白全長結構域III的合成基因列于SEQ ID NO:23至SEQ IDNO:31。在1.2獲得的質粒pMT/BiP/SNAP-His標簽中,ED III序列在框架中融合至SNAP蛋白的C端產生融合蛋白SNAP-EDIII。
[0393]1.4.3.1FNa
[0394]獲得質粒pMT/BiP/SNAP-1FN-His 標簽(見圖 4)和 pMT/BiP 樣 /SNAP-1FN-His 標簽(詳見圖8)。
[0395]1.4.4.顆粒酶 M
[0396]獲得質粒pMT/BiP/SNAP-GrM-His 標簽(詳見圖 6)。
[0397]2.轉染到宿主細胞中
[0398]2.1.轉染到S2細朐中
[0399]允許將SNAP-標簽蛋白作為 以Hises結尾的分泌融合蛋白進行生產的所得質粒pMT/BiP/SNAP-蛋白-Hi和選擇標志物pC0_Blast共轉染到S2細胞中生成顯示氨芐青霉素抗性的穩定S2/sSNAP-蛋白胞系。
[0400]攪拌瓶(spinner) (IOOOml)中生長的穩定S2細胞系用重金屬鎘(Cd2+)刺激10天,濃縮并純化來自細胞外介質的蛋白。
[0401]用重金屬鎘孵育10天后,在穩定S2/sSNAP_蛋白-His標簽的細胞上清中觀察到分泌的SNAP-標簽蛋白的積累。
[0402]用抗His標簽的羊血清,免疫印跡分析使得能夠檢測細胞外的SNAP-標簽蛋白(見圖 2B、3B、4B、6C)。
[0403]2.2.轉染到HeLa細朐中
[0404]質粒pMT/BiP樣/SNAP-1FN-His標簽轉染到HeLa細胞中。
[0405]使用抗-SNAP抗體,免疫印跡分析使得能夠檢測細胞外SNAP標簽干擾素(見圖7B)。
[0406]3.重組蛋白的純化
[0407]用金屬螯合樹脂和HLPC法純化細胞外His標簽和SNAP標簽蛋白。
[0408]3.1.RVF-N 和 TOS-N
[0409]RVF-N
[0410]聯合 Plate-Forme5Production de Proteines recombinants et d’Anticorps(巴斯德研究所),從用Cd2+刺激10天后的2升S2/sSNAP-RVFV.N-Hises細胞上清中獲得高達97mg的高純SNAP-標簽RVF.N蛋白。
[0411]TOS-N
[0412]聯合 Plate-Forme5Production de Proteines recombinants et d’Anticorps(巴斯德研究所),從用Cd2+刺激10天后的2升S2/sSNAP-T0S.N-HiSes細胞上清中獲得高達4 Img的高純SNAP-標簽RVF.N蛋白。
[0413]生產水平的概要:
[0414]
病毒抗似質粒穩定的細胞系純化的蛋白濃度(/2L)
來 ft RVF
11 pMT/BiP/SNAP + RVF.N S2/SNAP+RVF.N SNAP-RVF.N 97 mg
的N基因F6
夾白TOS
pMT/BiP/SNAP+ TOS.N S2/SNAP+TOS.N SNAP-TOS.N 41
[0415]3.2?可溶 INF a I
[0416]通過用腸激酶切割(Novagen試劑盒),從SNAP標簽釋放可溶INF a I蛋白。
[0417]3.3.來自不同黃病毒的抗原
[0418]使用果蠅表達系統分泌的SNAP-標簽蛋白儲液(stock)
[0419]
【權利要求】
1.一種用于在宿主細胞中表達重組蛋白的載體,其包括在單一開放閱讀框中編碼如下的核苷酸序列,按照5’至3’的方向: a)在所述宿主細胞中具有功能的肽分泌信號, b)6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT,EC2.1.1.63)、其催化結構域或突變體,以及 c)重組蛋白。
2.根據權利要求1所述的表達載體,其中所述MGMT酶是SEQID NO:4的蛋白或其同源物。
3.根據權利要求1所述的表達載體,其中所述MGMT突變體是SEQID NO:2的SNAP蛋白或其同源物。
4.根據權利要求1至3任一項所述的表達載體,其中所述開放閱讀框可操作地與誘導型啟動子結合,所述誘導型啟動子在相同宿主細胞中與肽信號同樣是有功能的。
5.根據權利要求1至4任一項所述的表達載體,其中所述分泌肽信號和所述誘導型啟動子在非脊椎動物細胞中,優選在昆蟲細胞中,更優選在果蠅S2細胞中是有功能的。
6.根據權利要求1至5任一項所述的表達載體,其中所述分泌肽信號和所述誘導型啟動子在脊椎動物細胞中,優選在哺乳動物細胞中,更優選在CHO細胞、YB2/0細胞、COS細胞、HEK細胞、NIH3T3細胞、HeLa細胞或其衍生物中是有功能的。
7.根據權利要求1至6 任一項所述的表達載體,其中所述重組蛋白選自診斷和/或治療蛋白和/或多肽。
8.根據權利要求7所述的表達載體,其中所述診斷和治療蛋白和/或多肽選自: -細菌或病毒免疫原性蛋白,更優選來自登革、日本腦炎(JE)、蜱傳播腦炎(TBE)、黃熱(YF)、烏蘇圖(USU)、羅西奧、穆雷腦炎(MVE)、威塞爾斯布朗(WSL)、茲卡或西尼羅(WN)病毒的EDIII蛋白,或來自裂谷熱(RVF)或托斯卡納(TOS)病毒的核蛋白N,或來自基孔肯雅病毒的E2包膜蛋白的可溶形式,或西尼羅病毒E包膜蛋白的可溶形式,和 -血液因子、抗凝血劑、生長因子、激素、治療性酶和單克隆抗體和細胞因子, -抗腫瘤蛋白, -微生物、病毒和/或寄生蟲多肽, -抗原,比如癌抗原。
9.根據權利要求7所述的表達載體,其中所述診斷和治療蛋白選自IFN-α、顆粒酶M、FasL、SSX2、NERCMSL、hSULF2^m 和 CNTN4。
10.根據權利要求1至9任一項所述的表達載體,其中所述MGMT酶由SEQIDNO:3或SEQ ID NO:68的DNA序列編碼。
11.根據權利要求1至9任一項所述的表達載體,其中所述MGMT酶突變體由SEQIDNO:1或SEQ ID NO:47的DNA序列編碼。
12.根據權利要求1至11任一項所述的表達載體,其還編碼至少一個肽切割位點,其優選位于MGMT酶、其突變體或催化結構域和重組蛋白之間。
13.根據權利要求1至12任一項所述的表達載體,其還編碼一個標記,其優選位于重組蛋白的C端。
14.根據權利要求1至13任一項所述的表達載體,其還編碼間隔序列,優選位于所述MGMT酶、其突變體或催化結構域和所述重組蛋白之間,和/或所述重組蛋白和所述標記之間。
15.根據權利要求1所述的表達載體,其編碼: -肽BiP昆蟲信號,
-SEQ ID NO:2 的 SNAP 蛋白, -權利要求9所定義的重組蛋白, -腸激酶肽切割位點, -多聚組氨酸標記,和 -兩條具有氨基酸序列甘氨酸-甘氨酸-甘氨酸-絲氨酸(GGGS)的間隔序列。
16.根據權利要求1所述的表達載體,其編碼: -BiP樣肽信號,
-SEQ ID NO:2 的 SNAP 蛋白, -權利要求9所定義的重組蛋白, -PiOTEV肽切割位點, -多聚組氨酸標記,和 -兩條具有氨基酸序列甘氨酸-甘氨酸-甘氨酸-絲氨酸(GGGS)的間隔序列。
17.一種用于在宿主細胞中表達重組蛋白的載體,其包括在單一開放閱讀框中編碼如下的核苷酸序列,按照5’至3’的方向: a)BiP樣肽信號,
b)SEQ ID NO:4 的 MGMT 蛋白或 SEQ ID NO:2 的 SNAP 蛋白, c)兩個proTEV肽切割位點, d)多聚組氨酸標記,和 e)兩條具有氨基酸序列甘氨酸-甘氨酸-甘氨酸-絲氨酸(GGGS)的間隔序列。
18.—種重組細胞,其穩定轉染有包括權利要求1至17任一項的表達載體的質粒,優選包括 SEQ ID NO:59 或 SEQ ID NO:69。
19.根據權利要求18所述的穩定轉染的重組細胞,其中其是細菌,優選大腸桿菌細胞。
20.根據權利要求18所述的轉染的重組細胞,其中其是細菌、昆蟲細胞,更優選果蠅S2細胞或其衍生物;哺乳動物細胞,更優選CHO細胞、YB2/0細胞、COS細胞、HEK細胞、NIH3T3細胞、HeLa細胞、PER.C6細胞或其衍生物;和禽細胞比如EBx細胞,優選EB66細胞或其衍生物。
21.根據權利要求18至20任一項所述的重組細胞用于生產權利要求1至17任一項所定義的表達載體的用途。
22.根據權利要求18至20任一項所述的重組細胞用于生產重組蛋白的用途。
23.一種融合多肽,其包括肽分泌信號、和6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT, EC2.1.1.63)、其突變體或催化結構域。
24.根據權利要求23所述的融合多肽,其中所述MGMT突變體是SEQID NO:2的SNAP蛋白或其同源物。
25.根據權利要求23所述的融合多肽,其中所述MGMT酶是SEQID NO:4的蛋白或其同源物。
26.根據權利要求23至25任一項所述的融合多肽,其還包括在MGMT酶、其突變體或催化結構域的C端的重組蛋白。
27.根據權利要求26所述的融合多肽,還包括一個標記,優選多聚組氨酸標記,其位于重組蛋白C端。
28.一種非脊椎動物重組細胞,其穩定轉染有權利要求1至5、和7至14之一的表達載體。
29.根據權利要求28所述的穩定轉染的細胞,其中其是昆蟲細胞。
30.根據權利要求29所述的穩定轉染的細胞,其中其是黑腹果蠅Drosophilamelanogaster細胞,更優選果蜆S2細胞。
31.根據權利要求30所述的穩定轉染的S2細胞,其特征在于: i )所述表達載體選自:-包括SEQ ID NO:19的載體或克隆至細胞中的核苷酸序列,細胞已于2010年8月19日以編號CNCM 1-4357保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所,巴黎,法國,-包括SEQ ID NO:22的權利要求7的載體或克隆至細胞中的核苷酸序列,細胞已于2010年10月27日以編號CNCM 1-4381保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所, -包括SEQ ID NO:21的權利要求7的載體或克隆至細胞中的核苷酸序列,細胞已于2010年10月27日以編號CNCM 1-4382保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所, -包括SEQ ID NO:9的載體或 克隆至細胞中的核苷酸序列,細胞已于2010年9月29日以編號CNCM 1-4368保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所,和 -包括SEQ ID NO:20的權利要求7的載體或克隆至細胞中的核苷酸序列,細胞已于2010年9月29日以編號CNCM 1-4369保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所, -包括SEQ ID NO: 10或59或69的權利要求17的載體, -SEQ ID NO:64的載體或克隆至細胞中的核苷酸序列,細胞已于2011年12月9日以編號CNCM 1-4581保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所, -SEQ ID NO:71 的載體,
-包括 SEQ ID NO:55, SEQ ID NO:57 或 72 或 74、SEQ ID NO:77、79 或 81、SEQ ID NO:.89、SEQ ID NO:84 或 86、SEQ ID NO:92 或 SEQ ID NO:96 的權利要求 9 的載體, 或 ii)其選自: -于2010年8月19日以編號CNCM 1-4357保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所的細胞, -于2010年10月27日以編號CNCM 1-4381保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所的細胞, -于2010年10月27日以編號CNCM 1-4382保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所的細胞, -于2010年9月29日以編號CNCM 1-4368保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所的細胞,-于2010年9月29日以編號CNCM 1-4369保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所的細胞, -于2011年12月5日以編號CNCM 1-4565保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月5日以編號CNCM 1-4566保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月5日以編號CNCM 1-4567保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月5日以編號CNCM 1-4568保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月5日以編號CNCM 1-4569保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月5日以編號CNCM 1-4570保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月5日以編號CNCM 1-4571保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月5日以編號CNCM 1-4572保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du D octeur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月8日以編號CNCM 1-4576保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月8日以編號CNCM 1-4577保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月8日以編號CNCM 1-4578保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月8日以編號CNCM 1-4579保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月8日以編號CNCM 1-4580保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月9日以編號CNCM 1-4583保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月9日以編號CNCM 1-4584保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞, -于2011年12月9日以編號CNCM 1-4585保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞,以及 -于2011年12月9日以編號CNCM 1-4586保藏在法國國家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法國)的細胞。
32.一種脊椎動物重組細胞,其穩定轉染有權利要求1至4、6至14、和16至17之一的表達載體。
33.根據權利要求32所述的穩定轉染的細胞,其中其是哺乳動物細胞,優選CHO細胞、YB2/0細胞、COS細胞、HEK細胞、NIH3T3細胞、HeLa細胞或其衍生物。
34.根據權利要求32或33所述的穩定轉染的哺乳動物細胞,其特征在于所述表達載體是包括SEQ ID N0:57或72或74 (當興趣蛋白是IFNa時)、SEQ IDNO:77、79或81 (當興趣蛋白是癌抗原SSX2時)、SEQ ID NO:55 (當興趣蛋白是顆粒酶M時)、SEQ ID NO:89 (當興趣蛋白是FasL時)、SEQ ID NO:84或86 (當興趣蛋白是癌抗原NERCMSL時)、或SEQ IDNO:92 (當興趣蛋白是接觸蛋白CNTN4時)、或SEQ ID NO:96 (當興趣蛋白是hSULF2A?時)的權利要求9的載體。
35.一種增強重組蛋白表達的方法,其包括將所述蛋白和肽分泌信號、連同酶6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT,EC2.1.1.63)、其突變體或催化結構域共表達,所述共表達優選在非脊椎動物細胞中進行。
36.根據權利要求35所述的方法,其中所述MGMT酶是SEQID NO:4的蛋白。
37.根據權利要求35所述的方法,其中所述MGMT突變體酶是SEQID NO:2的SNAP蛋白或其同源物。
38.一種在細胞培養中生產重組蛋白的方法,其包括步驟: a)提供權利要求1至16所述的表達載體, b)將所述表達載體引入宿 主細胞, c)使引入所述宿主細胞的核苷酸進行表達來產生重組蛋白。
39.根據權利要求35至38任一項所述的方法,其中重組蛋白以至少40mg/L或以上的回收的細胞培養上清得以表達。并不
40.6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT,EC2.1.1.63)、其突變體或催化結構域用于增強異源蛋白在感染有復制型或缺陷型載體的宿主細胞中生產的用途。
41.根據權利要求40所述的用途,其中所述MGMT酶是SEQID NO:4的蛋白。
42.根據權利要求40所述的用途,其中所述MGMT突變體是SEQID NO:2的SNAP蛋白。
43.6-甲基鳥嘌呤-DNA-甲基轉移酶(MGMT,EC2.1.1.63)、其突變體或催化結構域,作為融合至或連接至重組蛋白的保護多肽,用于改善重組蛋白在儲存介質、在血漿或緩沖液中的半衰期,用于改善作為藥物或疫苗的重組蛋白的半衰期,或用于改善用在診斷試劑盒中的重組蛋白的半衰期的用途。
44.根據權利要求43所述的用途,其中所述重組蛋白選自:胰島素、IFNa、顆粒酶M、SSX2、FasL,內硫酸酯酶(hSULF)、接觸蛋白和 MesotheIin (NERMCSL)。
【文檔編號】C12N9/10GK103476928SQ201180065989
【公開日】2013年12月25日 申請日期:2011年12月9日 優先權日:2010年12月9日
【發明者】P·德普雷斯, S·波盧斯, E·克呂布萊特 申請人:巴斯德研究所