一種單模塊DNA文庫及TALENs識別模塊的連接方法
【專利摘要】本發明公開了一種DNA文庫及轉錄激活子樣效應因子核酸酶質粒的構建方法。本發明還公開了一種轉錄激活子樣效應因子連接單元庫,所述DNA文庫中包含了該TALE連接單元庫中所有TALE連接單元。所述構建方法包括:根據目的基因的靶序列確定識別模塊,從所述DNA文庫中選取各識別模塊對應的DNA片段;在同一體系內,采用二類限制性內切酶和DNA連接酶將各DNA片段中連接單元重組接入TALENs載體中;用消化線性DNA的酶進行消化處理,得到轉錄激活子樣效應因子核酸酶質粒。與現有技術相比,采用本發明的DNA文庫構建TALENs質粒,可一步將12-19個識別模塊連接起來,速度快,效率高,操作簡單,材料易于保存,成本低。
【專利說明】一種單模塊DNA文庫及TALENs識別模塊的連接方法【技術領域】[0001]本發明涉及基因工程領域,尤其涉及一種TALE連接單元庫、包含該TALE連接單元庫中所有TALE連接單元的DNA文庫、TALENs識別模塊的連接方法以及轉錄激活子樣效應因子核酸酶質粒的構建方法。【背景技術】[0002]按照人類的意愿對基因組進行定向靶向修飾一直是許多科學家的夢想。在內源的基因組上特異地刪除或加入我們需要的序列,一方面可以構建出各種動物模型用于生物學基礎研究和疾病機理研究,另一方面可以生產動物反應器用以廉價生產我們需要的又很難從其他途徑得到的生物組分。人們一直沒有找到簡單高效的方法對基因組進行基因組靶向修飾。傳統的基因打靶技術依賴于細胞內自然發生的同源染色體隨機交換,其打靶效率非常低,通常只有10_6~10_8,這種打靶方法只在小鼠中得到了廣泛了應用,而在其他模式動物及大型哺乳動物中都因效率太低而得不到廣泛應用。[0003]2009年兩個研究組發現植物病原體Xanthomonas中的一種可以調節植物基因表達的轉錄激活子樣效應因子(transcription activator-like effector,TALE)表現出DNA 結合特異性,而其識別密碼具有模塊化和簡單化的特點,為科學家們開發出更簡易的新型基因組祀向修飾技術帶來了新希望。[0004]TALE與Fokl融合后即形成轉錄激活子樣效應因子核酸酶(transcription activator-like effector nucleases,TALENs)。TALENs 由數十個特異性識別 DNA 的串聯 “蛋白模塊”和兩側的N-末端及C-末端序列組成。每個“蛋白模塊”包含34個氨基酸,第 12和13位殘基是祀向識別的關鍵位點,被稱作重復可變的d1-residues (RVDs)位點。[0005]實踐中,TALENs技術大大提高了基因打靶效率,應用范圍和可操作性,但如何把十幾個高度重復的DNA的識別模塊組裝起來成為了 TALENs廣泛應用的一個限制因素。研究者們在怎樣制作TALENs做出了各種各樣的努力。有的采用化學合成的方法,有的采用兩步分子克隆的方法,也有的采用一步分子克隆的方法。但都有各自的缺陷,因為需合成的DNA 高度重復的序列化學合成非常困難,成本也非常高;兩步法因為需兩步連接所以材料成本、 時間成本、測序成本都較高;現在公開的唯一一個可一步連接的方法最多只能連接14個識別模塊,而自然界中常見的識別模塊的長度為12-23,在實際應用中很多情況需要大于14 個識別模塊的TALENs,14個片段長度的限制不止影響此種方法應用,而且不利于TALENs特異性的提高,并且因其需要酶切,純化,再連接造成操作繁瑣,工藝流程復雜,酶切純化后的 DNA保存困難,特別是單鏈的尾巴容易降解。[0006]以前有研究者用單模塊連接TALENs,如連接18個識別模塊,一個反應連接18個片段難度非常大,世界范圍內還沒有人能實現;以前也有建立在雙模炔基礎上的研究,但其只能連接14個識別模塊。
【發明內容】
`[0007]本發明提供了一種轉錄激活子樣效應因子(TALE)連接單元庫,利用該連接單元庫可以連接12個以上的識別模塊。[0008]技術方案為,TALENs識別模塊的連接方法,步驟包括:[0009](I)根據所需連接的識別模塊的順序,從單元庫中選擇識別模塊所對應的連接單元;所需連接的識別模塊數量至少為I ;[0010]所述的單元庫包括4組X k個連接單元;4組連接單元分別識別4種堿基,任意兩組連接單元的粘性末端堿基序列--對應相同;[0011]所述的連接單元為識別單堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;每組的連接單元包含相同的單堿基識別模塊;[0012]同一組的k個連接單元分為兩部分,第一部分包含η個連接單元,第二部分包含m 個連接單元;其中η≥2, m=0~η-1 ;
[0013]第一部分所有連接單元兩端的粘性末端堿基序列互不相同,對第一部分所有連接單元進行順序編號,第i個連接單元的第二粘性末端與第i+1個連接單元的第一粘性末端互補,η-1 ;[0014]第二部分連接單元中任意兩個連接單元至少一個粘性末端堿基序列不同,且第二部分連接單元中的任意一個連接單元的第一粘性末端與第一部分連接單元中第P個連接單元的第二粘性末端互補,第二粘性末端與第一部分連接單元中第q個連接單元的第一粘性末端互補,其中P n-2,3 ^ q ^ n, q-p≥3 ;[0015](2)利用DNA連接酶使連接單元依次連接。具體為,用二類限制性內切酶和DNA連接酶,將連接單元重組接入TALENs載體中,用消化線性DNA的酶進行消化處理,得到轉錄激活子樣效應因子核酸酶質粒。優選的,在TALENs載體上含有O個、I個或2個識別模塊;并且TALENs載體中帶有DNA切割蛋白基因,以及位于轉錄激活子樣效應因子氨基酸序列框架 N端和C端的堿基序列。所述的位于轉錄激活子樣效應因子氨基酸序列框架N端和C端的喊基序列分別如SEQ ID N0.43和44所不。[0016]所述TALEN 載體可選用 pEFla-NLS-TALE backbone-Fokl(R)-pA 或 pEFla-NLS-TALE backbone-Fokl (L) -1RES-PURO-pA,所述 DNA 切割蛋白基因即為 Fokl。 TALENs載體預先經二類限制性內切酶酶切,酶切產生的兩個粘性末端分別與第I個堿基識別模塊的第一粘性末端以及第η個堿基識別模塊第二粘性末端互補。[0017]步驟(2)中,所述二類限制性內切酶(type IIs enzyme)可以為Bsa I。所述的 DNA連接酶可以為T4連接酶。[0018]優選的,在步驟(1)所述的單元庫中,連接單元連接在載體上。載體為PMD18-T載體、topo載體、pucl9載體或pucl8。[0019]當連接單元連接在載體上時,步驟(2)中,在同一體系內,采用二類限制性內切酶和DNA連接酶將各DNA片段中連接單元重組接入TALENs載體中。用消化線性DNA的酶進行消化處理,得到轉錄激活子樣效應因子核酸酶質粒。[0020]以25 μ L計,連接體系包括:載體:40-200ng ;識別模塊:50_200ng/識別模塊;二類限制性內切酶:0.5-2 μ L ;DNA連接酶:0.5-2 μ L ;DNA連接酶緩沖液:2.5yL ;雙蒸水:補足至 25 μ L。連接程序優選為:37°C,5min ; 16°C,lOmin,20 個循環;80°C, IOmin0[0021]具體的,在步驟(1)中,從單元庫中選取各識別模塊對應的連接單元;第一部分連接單元的數量η為11-18個;[0022]單元庫中所選擇連接的連接單元數量a等于η時,從第一部分各組中選取識別相應堿基、序號為I~η的連接單元依次相連;[0023]單元庫中所選擇連接的連接單元數量a小于η時,從第一部分各組中選取識別相應堿基、序號為I~b的連接單元,并從第二部分中選取識別相應堿基、并且第一粘性末端能與第一部分b號連接單元第二粘性末端的互補、第二粘性末端能與第一部分第 (n+2+b-a)連接單元第一粘性末端互補的連接單元,再與第一部分的第(n+2+b_a)至第η個連接單元相連接,a-1≥b≥I。[0024]更優選的,在步驟(1)中,從單元庫中選取各識別模塊對應的連接單元;第一部分連接單元的數量η為18個;[0025]單元庫中所選擇連接的連接單元數量a小于18時,從第一部分各組中選取識別相應堿基、序號為I~b的連接單元,并從第二部分中選取識別相應堿基、并且第一粘性末端能與第一部分b號連接單元第二粘性末端的互補、第二粘性末端能與第一部分第(20+b-a) 連接單元第一粘性末端互補的連接單元,再與第一部分的第(20+b-a)至第18個連接單元相連接,a-1≥b≥I ;[0026]單元庫中所選擇連接的連接單元數量a=18時,從第一部分各組中選取識別相應堿基、序號為I~η的連接單元依次相連。[0027]更優選的,在長度小于18時,從第一部分各組中選取識別相應堿基、序號為 I~(q+a-20)的連接單元,并從第二部分中選取識別相應堿基、并且第一粘性末端能與 (q+a-20)號連接單元第二粘性末端的連接單元,再與第一部分的第q~第18個連接單元相連接。[0028]優選的,所述單元庫第一部分連接單元數量為18個,編號為I~18的連接單元第一粘性末端及第二粘性末端堿基序列分別如SEQ ID N0.5~40的第9~12個堿基所示。[0029]步驟(2)所述的消化線性質粒的質粒酶可以為Plasmid-Safe核酸酶。因為連接時會有連接不完全現象,只連接上部分片段,這種連接不完全的線性DNA會通過重組的方式降低連接的效率,因此,在轉化之前用可以消化線性DNA的酶Plasmid-Safe?ATP-D印endent DNase (Epicentre,貨號:E3105K)進行消化處理,提高連接效率。[0030]該方法中,各識別模塊之間能夠順序連接;同時,識別模塊之間、識別模塊與載體之間一旦連接上,就無法被二類限制性內切酶(type Hs enzyme)再切開,所以把幾個片斷和載體放在同一體系里,用二類限制性內切酶(type IIs enzyme)和DNA連接酶邊切邊連, 一次即可把最多19個DNA片段和一個載體連接成環;即一步把TALENs連接成功,第一次實現了 19個片段的一次連接。[0031]—種轉錄激活子樣效應因子連接單元庫,包括4組Xk個連接單元;4組連接單元分別識別4種堿基,任意兩組連接單元的粘性末端堿基序列一一對應相同;所述的連接單元為識別單堿基識別模塊及兩端的第一粘性末端和第二粘性末端;同一組的連接單元包含相同的單堿基識別模塊;所述的單堿基識別模塊是指該Tale連接單元編碼的氨基酸能夠識別堿基A、T、C、G。[0032]同一組的k個連接單元分為兩部分,第一部分包含η個連接單元,第二部分包含m 個連接單元;其中η≥2, m=0~η-l ;[0033]第一部分所有連接單元兩端的粘性末端堿基序列互不相同,對第一部分所有連接單元進行順序編號,第i個連接單元的第二粘性末端與第i+Ι個連接單元的第一粘性末端互補,η-l ;優選的,n=ll~18。[0034]第二部分連接單元中任意兩個連接單元至少一個粘性末端堿基序列不同,且第二部分連接單元中的任意一個連接單元的第一粘性末端與第一部分連接單元中第P個連接單元的第二粘性末端互補,第二粘性末端與第一部分連接單元中第q個連接單元的第一粘性末端互補,其中P n-3, 3 < q < n, q-p≤3。[0035]連接單元中,兩端的第一粘性末端和第二粘性末端通過二類限制性內切酶酶切形成。優選的,二類限制性內切酶為Bsa 1、BsmBl、BsmAl或Bbsl,最優為Bsa I。[0036]這種轉錄激活子樣效應因子連接單元庫,優選的情況,18≤η≤11,m=n_ll, n ^ q ^ 10, n-1 ^ p ^ I, m+2 ^ q-p ^ 3。[0037]上述的連接單元的粘性末端有4個堿基,沿5’ -3’方向,正義鏈第一粘性末端的第 2~4個堿基編碼亮氨酸,第I個堿基為甘氨酸密碼子的最后一個堿基,正義鏈的最后兩個堿基為甘氨酸密碼子的前兩個堿基;沿5’-3’方向,反義鏈的第二粘性末端的第I~3個堿基的互補序列編碼亮氨酸,第4個堿基的互補序列為甘氨酸密碼子的最后一個堿基。[0038]每個連接單元的粘性末端有4個堿基,沿5’ -3’方向,正義鏈的第一粘性末端的第 2~4個堿基編碼亮氨酸,正義鏈的第I個堿基為甘氨酸密碼子的最后一個堿基;正義鏈的最后兩個堿基為甘氨酸密碼子的前兩個堿基。沿5’-3’方向,反義鏈的第二粘性末端的第 I~3個堿基的互補序列編碼亮氨酸,第4個堿基的互補序列為甘氨酸密碼子的最后一個堿基;反義鏈的前兩個堿基的互補序列為甘氨酸密碼子的前兩個堿基。當相鄰的連接單元通過互補的粘性末端連接到一起時,連接單元之間的正義鏈編碼的氨基酸依次為甘氨酸和亮氨酸。[0039]優選的,上述轉錄激活子樣效應因子連接單元庫的第一部分連接單元數量為 18個,編號為I~18的連接單元第一粘性末端及第二粘性末端堿基序列分別如SEQ ID N0.5 ~40 的第 9 ~12 個堿基所示。即 n=18,m=7,18 > q > 10,15 > p > 1,9 > q-p ^ 3。[0040]上述轉錄激活子樣效應因子連接單元庫的構建方法,是在單堿基識別模塊兩端加上酶切位點,步驟包括:[0041]第一部分編號為I~18的連接單兀構建:以含有4個單堿基識別模塊的載體為模板,分別以18對引物序列F1/R1~F18/F18為引物對,進行PCR擴增;[0042]第二部分編號為19~25的連接單元構建:以含有4個單堿基識別模塊的載體為模板進行PCR擴增,所使用的引物對分別為Ftr3Am Fq-4/Rq-1> FqVRq-^ Fr6ZRrl, Fd 和 FqVIV1 ;18 ^ q ^ 10 ;[0043]引物F1/R1~F18/F18的核苷酸序列如SEQ ID N0.5~40所示。[0044]一種單模塊DNA文庫,包括與上述的轉錄激活子樣效應因子連接單元庫的連接單元數量相同的DNA片段,包含了前述的轉錄激活子樣效應因子 連接單元庫的所有連接單元;每個DNA片段包含一個不同的連接單元(即堿基序列互異);每個連接單元兩末端與DNA 片段的其余部分連接處有二類限制性內切酶酶切位點,也就是說,利用二類限制性內切酶 (type IIs enzyme)對DNA片段進行酶切,就可以得到所述的Tale連接單元。所述DNA片段為重組質粒或PCR擴增產物。重組質粒的原始載體為PMD18-T載體、topo載體、pucl9載體或pucl8。[0045]優選的,其中二類限制性內切酶(type IIs enzyme),可以是Bsa 1、BsmB1、BsmAl、 Bbsl等,優選為Bsa I。[0046]η的值決定了 TALENs的大小,TALENs —般需要12個以上的識別模塊,也就是說 η≥12,最多可以是23個識別模塊,但18個識別模塊即可滿足一般要求,即η=18。以η=18 為例,如果連接單元庫只有第一部分的18個連接單元,那么利用這個連接單元庫只能實現 19個識別模塊的連接(TALEN載體上已有半個識別模塊),而不能實現18、17、…12個識別模塊的連接,因為第一部分連接單元中每個連接單元兩端的粘性末端各不相同,只能從I 至18順序連接,且TALENs載體的兩個粘性末端只能分別與第I個連接單元的第一粘性末端和第18個連接單元的第二粘性末端互補。因此,為了能夠實現小于19個識別模塊的連接,本發明還設計了第二部分連接單元。[0047]第二部分連接單元如跨橋一樣可以減少TALENs中識別模塊的數量,從第P個識別模塊,直接跨越到第q個識別模塊,而省去了中間的識別模塊,省去的數量為q-p-2,比如為了減少1、2、…、6個識別模塊,可以設置q_p=、3、4、…、9。為保證獲得12個識別模塊以上的TALENs, q-p ( 7。從上述分析也可以看出,第二部分連接單元的起始連接位置是不影響最終TALEN連接的,P可以是I~n-2的任意位置。[0048]由于連接單元本身無法進行很好的保存和擴增,因此將連接單元插入相應的原始載體當中,構成環狀結構,以便于保存和擴增。[0049]與現有技術相比,本發明的有益效果為:[0050](I)本發明以四個單堿基識別模塊為基礎,通過設計合適的引物,可以構建得到含有100個連接單元(含有能識別單堿基的識別模塊、二類限制性內切酶酶切位點)的DNA 文庫;通過該DNA文庫,可以把識別模塊的酶切和連接放在一個反應中進行,避免了識別模塊酶切后的純化、再連接步驟,提高了生產效率,改進了生產工藝,速度快,效率高,操作簡單,可以實現一步將12-19個識別模塊快速連接起來,得到轉錄激活子樣效應因子核酸酶 (TALENs)質粒;[0051](2)本發明方法使用的識別單元是質粒或質粒的PCR產物,避免了保存酶切產物中遇到的末端單鏈尾巴破壞和降解的問題,且操作步驟更簡單,更節約成本。【專利附圖】
【附圖說明】[0052]圖1為本發明包含100個識別模塊的DNA文庫示意圖;[0053]圖2為本發明實施例1中,TALE連接單元庫中每組25個連接單元的示意圖;[0054]圖3為本發明TALE連接單元庫中單個連接單元的示意圖;[0055]圖4 為 TALENs 載體 pEFla-NLS-TALE backbone-Fokl (R) -pA 不意圖;[0056]圖 5 為 TALENs 載體 pEFla-NLS-TALE backbone-Fokl (L) -1RES-PURO-pA 示意圖;[0057]圖6為實施例2中,19個識別模塊連接時的連接步驟示意圖;[0058]圖7為實施例2中,不同數量的識別堿基的相應模模塊的選擇塊示意圖;[0059]圖8為實施例2中的電泳圖;圈中的為酶切正確的克隆;[0060]圖9為實施例3中,TALE連接單元庫中每組25個連接單元的結構示意圖;[0061]圖10為實施例3中,不同數量的識別堿基的相應模模塊的選擇塊示意圖。【具體實施方式】[0062]以下實施例中所使用的技術,包括PCR擴增與檢測、細胞轉染等分子生物學技術, 以及細胞培養、檢測技術等,除非特別說明,均為本領域內的技術人員已知的常規技術;所使用的儀器設備、試劑和細胞系等,除非是本說明書特別注明,均為一般本領域的研究和技術人員可以通過公共途徑獲得的。[0063]實施例1TALENs識別模塊之間的連接及重組載體的構建[0064]1、4 個識別模塊(modular)[0065](I)合成分別識別4個單堿基A、T、C、G的識別模塊N1、NG、HD、NN序列見表1,分別如SEQ ID N0.1~4所示。[0066]表1四個單堿基識別模塊的序列[0067]
【權利要求】
1.TALENs識別模塊的連接方法,其特征在于,步驟包括:(1)根據所需連接的識別模塊的順序,從單元庫中選擇識別模塊所對應的連接單元;所需連接的識別模塊數量至少為I ;所述的單元庫包括4組X k個連接單元;4組連接單元分別識別4種堿基,任意兩組連接單兀的粘性末端喊基序列對應相同;所述的連接單元為識別單堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;每組的連接單元包含相同的單堿基識別模塊;同一組的k個連接單元分為兩部分,第一部分包含η個連接單元,第二部分包含m個連接單元;其中n≥2, m=0~n-1 ;第一部分所有連接單元兩端的粘性末端堿基序列互不相同,對第一部分所有連接單元進行順序編號,第i個連接單元的第二粘性末端與第i+Ι個連接單元的第一粘性末端互補, η-1 ;第二部分連接單元中任意兩個連接單元至少一個粘性末端堿基序列不同,且第二部分連接單元中的任意一個連接單元的第一粘性末端與第一部分連接單元中第P個連接單元的第二粘性末端互補,第二粘性末端與第一部分連接單元中第q個連接單元的第一粘性末端互補,其中P≤ n-2,3 ≤ q≤ n, q-p≥3 ;(2)利用DNA連接酶使連接單元依次連接。
2.權利要求1所述TALENs識別模塊的連接方法,其特征在于,步驟(2)中,用二類限制性內切酶和DNA連接酶,將連接單元重組接入TALENs載體中,用消化線性DNA的酶進行消化處理,得到轉錄激活子樣效應因子核酸酶質粒。
3.權利要求2所述TALENs識別模塊的連接方法,其特征在于,所述的TALENs載體上含有O個、I個或2個識別模塊;并且TALENs載體中帶有DNA切割蛋白基因,以及位于轉錄激活子樣效應因子氨基酸序列框架N端和C端的堿基序列。
4.權利要求3所述TALENs識別模塊的連接方法,其特征在于,所述的位于轉錄激活子樣效應因子氨基酸序列框架N端和C端的堿基序列分別如SEQ ID N0.43和44所示。
5.權利要求1所述TALENs識別模塊的連接方法,其特征在于,步驟(1)中,所述的單元庫中,連接單元連接在載體上。
6.權利要求1所述TALENs識別模塊的連接方法,其特征在于,步驟(1)中,從單元庫中選取各識別模塊對應的連接單元;第一部分連接單元的數量η為11-18個;單元庫中所選擇連接的連接單元數量a等于η時,從第一部分各組中選取識別相應堿基、序號為I~η的連接單元依次相連;單元庫中所選擇連接的連接單元數量a小于η時,從第一部分各組中選取識別相應堿基、序號為I~b的連接單元,并從第二部分中選取識別相應堿基、并且第一粘性末端能與第一部分b號連接單元第二粘性末端的互補、第二粘性末端能與第一部分第(n+2+b-a)連接單元第一粘性末端互補的連接單元,再與第一部分的第(n+2+b-a)至第η個連接單元相連接,a-1≥b≥I。
7.權利要求1所述TALENs識別模塊的連接方法,其特征在于,步驟(1)中,從單元庫中選取各識別模塊對應的連接單元;第一部分連接單元的數量η為18個;單元庫中所選擇連接的連接單元數量a小于18時,從第一部分各組中選取識別相應堿基、序號為I~b的連接單元,并從第二部分中選取識別相應堿基、并且第一粘性末端能與第一部分b號連接單元第二粘性末端的互補、第二粘性末端能與第一部分第(20+b-a)連接單元第一粘性末端互補的連接單元,再與第一部分的第(20+b-a)至第18個連接單元相連接,a-1≥b≥I ;單元庫中所選擇連接的連接單元數量a=18時,從第一部分各組中選取識別相應堿基、 序號為I~η的連接單元依次相連。
8.權利要求7所述TALENs識別模塊的連接方法,其特征在于,所述單元庫第一部分編號為I~18的連接單元第一粘性末端及第二粘性末端堿基序列分別如SEQ ID N0.5~40 的第9~12個堿基所示。
9.轉錄激活子樣效應因子連接單元庫,其特征在于,所述的單元庫包括4組Xk個連接單元;4組連接單元分別識別4種堿基,任意兩組連接單元的粘性末端堿基序列一一對應相同;所述的連接單元為識別單堿基識別模塊及兩端的第一粘性末端和第二粘性末端;每組的連接單元包含相同的單堿基識別模塊;同一組的k個連接單元分為兩部分,第一部分包含η個連接單元,第二部分包含m個連接單元;其中η≥2, m=0~η-1 ;第一部分所有連接單元兩端的粘性末端堿基序列互不相同,對第一部分所有連接單元進行順序編號,第i個連接單元的第二粘性末端與第i+Ι個連接單元的第一粘性末端互補, η-1 ;第二部分連接單元中任意兩個連接單元至少一個粘性末端堿基序列不同,且第二部分連接單元中的任意一個連接單元的第一粘性末端與第一部分連接單元中第P個連接單元的第二粘性末端互補,第二粘性末端與第一部分連接單元中第q個連接單元的第一粘性末端互補,其中P ( n-3,3 ^ q ^ n, q-p≥3。
10.權利要求9所述的轉錄激活子樣效應因子連接單元庫,其特征在于,所述的連接單元中兩端的第一粘性末端和第二粘性末端通過二類限制性內切酶酶切形成。
11.權利要求10所述的轉錄激活子樣效應因子連接單元庫,其特征在于,所述二類限制性內切酶為Bsa 1、BsmBl、BsmAl或Bbsl。
12.權利要求9所述的轉錄激活子樣效應因子連接單元庫,其特征在于,18SnS 11, m=n_ll, n ^ q ^ 10, n_l ^ p ^ I, m+2 ^ q-p ^ 3。
13.權利要求9~12任一項所述的轉錄激活子樣效應因子連接單元庫,其特征在于,所述的連接單元的粘性末端有4個堿基,沿5’-3’方向,正義鏈第一粘性末端的第2~4個堿基編碼亮氨酸,第I個堿基為甘氨酸密碼子的最后一個堿基,正義鏈的最后兩個堿基為甘氨酸密碼子的前兩個堿基;反義鏈的第二粘性末端第I~3個堿基的互補序列編碼亮氨酸, 第4個堿基的互補序列為甘氨酸密碼子的最后一個堿基,反義鏈的前兩個堿基的互補序列為甘氨酸密碼子的前兩個堿基。
14.權利要求9或13所述的轉錄激活子樣效應因子連接單元庫,其特征在于,所述第一部分連接單元數量為18個,編號為I~18的連接單元第一粘性末端及第二粘性末端堿基序列分別如SEQ ID N0.5~40的第9~12個堿基所示。
15.權利要求9所述的轉錄激活子樣效應因子連接單元庫,其特征在于,n=18,m=7,,18 ≥ q ≥ 10,15 ≥ p ≥ 1,9 ≥ q-p ≥3。
16.權利要求14或15所述轉錄激活子樣效應因子連接單元庫的構建方法,其特征在于,在單堿基識別模塊兩端加上酶切位點,步驟包括:第一部分編號為I~18的連接單兀構建:以含有4個單堿基識別模塊的載體為模板, 分別以18對引物序列F1/R1~F18/F18為引物對,進行PCR擴增;第二部分編號為19~25的連接單元構建:以含有4個單堿基識別模塊的載體為模板進行 PCR 擴增,所使用的引物對分別為Fq_3/R m FqVRtrl、FqVR^ Ftr6Atrl、Ftr7/ Rq-!和 FqVRtrl ; 18 ≥ q ≥ 10。
17.權利要求16所述轉錄激活子樣效應因子連接單元庫的構建方法,引物F1/R1~ F18/F18的核苷酸序列如SEQ ID N0.5~40所示。
18.—種單模塊DNA文庫,其特征在于,包括權利要求9~15任一項所述的轉錄激活子樣效應因子連接單元庫的連接單元數量相同的DNA片段,包含了權利要求9~15任一項所述的轉錄激活子樣效應因子連接單元庫的所有連接單元;每個DNA片段包含一個不同的連接單元;每個連接單元兩末端與DNA片段的其余部分連接處有二類限制性內切酶酶切位點;所述DNA片段為重組質粒或PCR擴增產物。
19.權利要求18所述的單模塊DNA文庫,其特征在于,所述重組質粒的原始載體為 PMD18-T 載體、topo 載體、pucl9 載體或 pucl8。
【文檔編號】C12N15/66GK103497966SQ201310452282
【公開日】2014年1月8日 申請日期:2013年9月27日 優先權日:2013年9月27日
【發明者】吳昭, 孫文頁 申請人:上海斯丹賽生物技術有限公司