用于在絲狀真菌中產生位點特異性突變的方法
【專利說明】用于在絲狀真菌中產生位點特異性突變的方法
[0001] 對序列表的引用
[0002] 本申請包含一個計算機可讀形式的序列表,將其通過引用結合在此。 發明領域
[0003] 本發明涉及用于提供一種位點特異性突變的感興趣的變體多肽的方法。
[0004] 相關技術說明
[0005] 在感興趣的多肽中產生定點突變的若干種方法,包括例如,重疊延伸拼接 PCR( "SOE-PCR")或QuickChange?方法(Stratagene公司)是已知的。后者在線性PCR 反應中使用一組重疊誘變PCR引物來擴增甲基化的雙鏈質粒模板,隨后是片段自連,其中 在執行PCR反應后且在將該連接混合物轉化進大腸桿菌宿主中前,使用Dpnl核酸酶來去除 甲基化的模板質粒。然而,持續需要改進轉化和選擇效率,尤其在絲狀真菌宿主內。
[0006] 發明概述
[0007] 本發明提供了在一種有待直接地轉化進絲狀真菌宿主中的編碼感興趣多肽的基 因中產生定點突變的方法,其中不需要依靠中間宿主如大腸桿菌來產生充足的遺傳材料以 成功地轉化該真菌宿主。這些方法涉及使用被特異性甲基化的常染色體復制型質粒,該常 染色體復制型質粒包括在PCR反應中作為模板的編碼基因與一對非重疊端對端引物(其中 至少一個引物是誘變的),接著去除甲基化的模板DNA,自連以再環化這些PCR片段并指導 將產生的再環化載體轉化至選擇的絲狀真菌表達宿主中,其中將這些引物在PCR反應前磷 酸化或者該產生的PCR片段在連接步驟前或期間磷酸化以便能夠成功地連接。
[0008] 相應地,在第一方面,本發明涉及一種提供位點特異性突變的變體多肽的方法,該 方法包括下述步驟:
[0009] a)提供一種甲基化的模板常染色體絲狀真菌復制型雙鏈環狀DNA載體,該甲基化 的模板常染色體絲狀真菌復制型雙鏈環狀DNA載體包括一種編碼親本多肽的親本多核苷 酸;
[0010] b)提供一對針對該親本多核苷酸的端對端非重疊PCR引物,一個5'正向引物和另 一個3'反向引物,其中至少一個引物是誘變的;
[0011] c)用該PCR引物對進行該模板載體的PCR擴增以產生全長的載體突變的PCR片 段;
[0012] d)用適合的甲基化特異性核酸酶去除該模板載體;
[0013] e)通過自連環化這些突變的PCR片段;并且
[0014] f)將這些環化的突變的PCR片段直接轉化至絲狀真菌宿主細胞中以表達這些變 體多肽,
[0015] 其中將這些PCR引物在該PCR擴增前磷酸化,或者將這些PCR片段在該自連步驟 前或期間磷酸化,以便允許這些引物的端對端連接以環化這些突變的PCR片段。
[0016] 附圖簡要說明
[0017] 圖1示出了實例1中使用的模板質粒PENI4286的示意圖。
[0018] 圖2示出了被用來驗證實例1中產生的PCR片段大小的瓊脂糖凝膠的圖片。
[0019] 圖3示出了被用來驗證通過所聲稱的定點誘變方法成功地去除糖基化位點的在 實例1中使用的SDS-PAGE凝膠的圖片。在實例的結尾中討論該凝膠的細節。
[0020] 定義
[0021] cDNA:術語"cDNA"意指可以通過從得自真核或原核細胞的成熟的、剪接的mRNA分 子進行反轉錄而制備的DNA分子。cDNA缺乏可以存在于對應基因組DNA中的內含子序列。 早先的初始RNA轉錄本是mRNA的前體,其在呈現為成熟的剪接的mRNA之前要經一系列的 步驟進行加工,包括剪接。
[0022] 編碼序列:術語"編碼序列"意指直接指定一個多肽的氨基酸序列的多核苷酸。編 碼序列的邊界一般由一個開放閱讀框架決定,該開放閱讀框架從一個起始密碼子(如ATG、 GTG或TTG)開始并且以一個終止密碼子(如TAA、TAG或TGA)結束。編碼序列可以是一種 基因組DNA、cDNA、合成DNA或其組合。
[0023] 端對端非重疊PCR引物:該術語意指一對PCR引物,一個5'正向引物和一個3'反 向引物,其靶向雙鏈環狀DNA載體模板上的一個連續的多核苷酸區域,在該模板中當每個 引物都退火到其模板鏈時,這些引物端對端排成一行,在它們之間沒有任何堿基對重疊。以 此方式,這兩個引物將各自代表完全擴增的雙鏈載體PCR片段的末端,如果將這些引物在 PCR擴增前磷酸化,或者將PCR片段在連接前或期間磷酸化,這些末端可以被連接在一起以 再環化載體。當這些端對端非重疊PCR引物中的至少一個是誘變的,S卩,它包括至少一個核 苷酸,其不同于所述誘變引物靶向的模板多核苷酸區域,則那個突變將被摻入進產生的擴 增PCR片段中。
[0024] 甲基化的模板常染色體絲狀真菌復制型雙鏈環狀DNA載體:該術語意指一種常規 的雙鏈環狀DNA載體,S卩,一種質粒,其是甲基化的、常染色體的并且在絲狀真菌宿主細胞 中能夠獨立復制,例如,憑借包含"自主復制序列"或ARS,諸如,眾所周知的AMAl序列。
[0025] DNA甲基化:DNA甲基化是一個生化過程,其對于高等生物中的正常發育是重要 的。它涉及將甲基添加至胞嘧啶嘧啶環的5位或腺嘌呤嘌呤環的6號氮(胞嘧啶和腺嘌呤 是4種DNA堿基中的2種)。通過細胞分裂可以遺傳這種修飾。腺嘌呤或胞嘧啶甲基化是 許多細菌的限制修飾系統的一部分,其中特異性DNA序列在整個基因組中被周期性地甲基 化。甲基化酶是識別特異序列并將該序列中或靠近該序列的堿基中的一種甲基化。被引入 至該細胞中的外源DNA(其不是以這種方式被甲基化)被序列特異限制性內切酶降解并切 害J。細菌基因組DNA不被這些限制性內切酶識別。天然DNA甲基化作為一種原始的免疫系 統起作用,從而允許該細菌自我保護以防止被噬菌體侵染。大腸桿菌DNA腺嘌呤甲基轉移 酶(Dam)是一種~32kDa的酶。大腸桿菌Dam的靶識別序列是GATC,因為甲基化出現在這 個序列中的腺嘌呤的N6位(GmeATC)。
[0026] 甲基化特異性核酸酶:如上所述,腺嘌呤或胞嘧啶甲基化是許多細菌的限制修飾 系統的一部分,其中特異性DNA序列在整個基因組中被周期性地甲基化。另一方面,IM類 型限制性內切核酸酶能夠識別并切割甲基化的DNA。DpnI是來自肺炎雙球菌G41的甲基 化特異性核酸酶,其識別由Dam甲基化酶在這個序列中的腺嘌呤的N6位甲基化的序列(G meATC)〇
[0027] 控制序列:術語"控制序列"意指對于表達編碼本發明的成熟多肽的多核苷酸所必 需的核酸序列。各個控制序列可以相對于編碼多肽的多核苷酸是天然的(即,來自相同基 因)或外源的(即,來自不同基因),或相對于彼此是天然的或外源的。此類控制序列包括 但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列、以及轉錄終止子。至 少,控制序列包括啟動子,以及轉錄和翻譯終止信號。出于引入有利于將這些控制序列與編 碼一種多肽的多核苷酸的編碼區連接的特異性限制酶切位點的目的,這些控制序列可以提 供有多個接頭。
[0028] 表達:術語"表達"包括涉及多肽產生的任何步驟,包括但不限于,轉錄、轉錄后修 飾、翻譯、翻譯后修飾、以及分泌。
[0029] 表達載體:術語"表達載體"意指線性或環狀DNA分子,該分子包括編碼多肽的多 核苷酸并且該多核苷酸可操作地與提供用于其表達的控制序列相連接。
[0030] 宿主細胞:術語"宿主細胞"意指任何細胞類型,該細胞類型對于用包含本發明的 多核苷酸的核酸構建體或表達載體進行轉化、轉染、轉導等是易感的。術語"宿主細胞"涵 蓋由于復制期間發生的突變而與親本細胞不同的親本細胞的任何后代。
[0031] 分離的:術語"分離的"意指處于自然界中不出現的形式或環境中的物質。分離的 物質的非限制性實例包括(1)任何非天然發生的物質,(2)包括但不限于任何酶、變體、核 酸、蛋白質、肽或輔因子的任何物質,該物質至少部分地從與其本質相關的一種或多種或所 有天然發生的成分中去除;(3)相對于天然發現的物質通過人工修飾的任何物質;或(4)通 過增加該物質相對于與其本質相關的其他組分的量而修飾的任何物質(例如,編碼該物質 的基因的多拷貝;使用比編碼該物質的基因本質相關的啟動子強的啟動子)。一種分離的 物質可以存在于發酵液樣品中。
[0032] 核酸構建體:術語"核酸構建體"意指單鏈或雙鏈的一種核酸分子,該核酸分子是 從天然發生的基因中分離的,或者以一種本來不存在于自然界中的方式被修飾成含有核酸 的區段,或者是合成的,該核酸分子包括一個或多個控制序列。
[0033] 可操作地連接:術語"可操作地連接"意指如下的構造,其中,控制序列相對于多核 苷酸的編碼序列安置在適當位置處,從而使得該控制序列指導該編碼序列的表達。
[0034] 序列一致性:兩個氨基酸序列之間或者兩個核苷酸序列之間的關聯度通過參數 "序列一致性"來描述。
[0035] 出于本發明的目的,使用尼德曼-翁施(Needleman-Wunsch)算法(尼德曼和翁 施,1970,分子生物學雜志(J.Mol.Biol. )48:443-453)來確定兩個氨基酸序列之間的序列 一致性,該算法是如EMBOSS軟件包(EMBOSS:歐洲分子生物學開放軟件套件(TheEuropean MolecularBiologyOpenSoftwareSuite),賴斯(Rice)等人,2000,遺傳學趨勢(Trends Genet. ) 16:276-277)(優選5.0.0版或更新版本)的尼德爾(Needle)程序所實施的。使用 的這些參數是空位開放罰分10、空位延伸罰分0. 5,以及EBL0SUM62 (BL0SUM62的EMBOSS版 本)取代矩陣。尼德爾標注的"最長的一致性"的輸出(使用-非簡化選項獲得)被用作 百分比一致性,并且如下計算:
[0036] (一致的殘基X100V(比對長度-比對中的空位總數)
[0037] 出于本發明的目的,使用尼德曼-翁施算法(尼德曼和翁施,1970,同上)確定兩 個脫氧核糖核苷酸序列之間的序列一致性,該算法是如EMBOSS軟件包(EMBOSS:歐洲分子 生物學開放軟件套件,賴斯等人,2000,同上)(優選5. 0. 0版或更新版本)的尼德爾程序 所實施的。使用的這些參數是空位開放罰分10、空位延伸罰分0. 5,以及EDNAFULL(NCBI NUC4. 4的EMBOSS版本)取代矩陣。尼德爾標注的"最長的一致性"的輸出(使用-非簡化 選項獲得)被用作百分比一致性,并且如下計算:
[0038]