一種單管高通量測序文庫的構建方法
【技術領域】
[0001] 本發明屬于檢測生物技術領域,具體設及一種單管高通量測序文庫的構建方法。
【背景技術】
[0002] 分子生物學診斷技術是現代分子生物學與分子遺傳學取得巨大進步的結晶,是在 人們對基因的結構W及基因的表達和調控等生命本質問題的認識日益加深的基礎上產生 的。近年來,分子生物學診斷技術的方法學研究取得了很大進展,先后建立了限制性內切酶 酶譜分析、核酸分子雜交、限制性片段長度多態性連鎖分析等方法。1985年由美國Cetus公 司人類遺傳學研究室Mul1iS等創立并隨后迅速發展起來的DNA體外擴增技術(Polymerase 化ainReaction,PCR),W及90年代發展起來的DM忍片技術值ΝΑ化ip),又將分子生物學 診斷技術提高到一個嶄新的階段。
[0003]大部分分子診斷實驗室的核屯、技術都主要集中在檢測特異性、相對較短的DNA或RNA片段上。隨著醫學研究的深入,越來越多疾病的發生機制與相關基因的變異有關,如 遺傳性疾病β-地中海貧血與基因缺失相關,遺傳性耳聾與GJB2、SLC26A4和線粒體DNA A1555G和C1494T突變相關,苯丙酬尿癥在中國人群中已發現了 70種W上基因突變,家族遺 傳性乳腺癌與BRCA1/2基因突變相關等等。因此與疾病相關的基因突變呈現多基因、多種 變異類型(點突變,插入,缺失)。臨床迫切需要一種能夠同時檢測多基因、多變異位點的方 法。
[0004] 世界各國高度重視分子診斷技術的發展,高通量測序成為新一代分子診斷試劑開 發的主流。高通量測序是分子生物學、微電子、計算機等多學科結合的結晶,綜合了多種現 代高精尖技術。高通量測序具有同時能夠檢測多個祀點的功能,具有快速有效的特點。因 而高通量測序成為新一代分子診斷試劑的主要開發方向。
[0005] 現有高通量測序文庫構建方法主要分為兩種:一種是Ampliseq技術,即利用多重 PCR技術多祀序列進行擴增,擴增產物純化,通過DNA連接酶將特定序列連接至擴增產物兩 端,再次純化并進行擴增。該缺點是操作步驟多,文庫構建時間久,約需要8個小時。另一 種是通過探針捕獲技術,即將樣本DNA進行打斷,篩選出目標長度大小,利用帶有標記的探 針進行雜交,使用帶標記的磁珠與標記的探針結合,洗脫捕獲所有目標序列,后進行特異序 列的連接并擴增。該方法缺點是雜交效率低,文庫構建時間久約需要24小時。
【發明內容】
[0006] 本發明的目的在于克服現有技術缺陷,提供一種單管高通量測序文庫的構建方 法。
[0007] 本發明的具體技術方案如下:
[0008]-種單管高通量測序文庫的構建方法,包括如下步驟:
[0009] (1)針對若干目的基因分別設計若干對基本擴增引物,在基本擴增引物的正向引 物和反向引物的5'端均連接2~5個T,并在該2~5個T的靠近3'端的第一個T上進 行PM修飾,與目的基因無關,既不影響起始PCR擴增反應的效率,也不會造成引物對之間 的非特異性擴增,使得擴增產物能夠產生粘性末端,該若干對基本擴增引物的Tm值相差不 超過rC,相應的退火溫度為56~64°C;
[0010] (2)設計一對不對稱連接探針和一不與人類基因組形成互補的通用引物,該對不 對稱連接探針包括可自身形成環狀的一正向探針和一反向探針,該正向探針和反向探針從 3'端至5'端均依次包括一能夠與不對稱連接探針的5'端若干連續堿基配對的互補序列、 一與所述通用引物互補配對的擴增序列和一與上述2~5個T相對應的粘性末端識別序 列,上述正向探針和反向探針的Tm值相差不超過rC,且上述正向探針和反向探針自身形 成環狀的退火溫度與基本擴增引物的退火溫度相差不超過rc;
[0011] (3)將模板、上述若干對基本擴增引物、不對稱探針、通用引物置于一含有DM連 接酶和DNA末端修飾酶的PCR反應體系中進行擴增,得擴增產物,該擴增的程序的時間為 2~化,并依次包括:預變性、第一階段擴增和第二階段擴增,其中第一階段擴增依次包括 第一變性階段、第一退火階段和第一延伸循環階段,第一延伸循環階段的循環數為5~15, 第一退火階段的退火溫度為60~65°C,第二階段擴增依次包括第二變性階段、第二退火階 段和第二延伸循環階段,第二延伸循環階段的循環數為15~30 (優選為20);第一退火階 段的退火溫度比第二退火階段的退火溫度高4~8°C;由于每一循環的產物可W作為下一 個循環的模板,經過第一階段擴增之后,本發明設計的基本擴增引物所擴增的產物得到大 量的積累,運些積累的產物又重新作為第二階段擴增的模板,此時通用引物能夠與運些模 板完全匹配,結合效率大幅度提升;
[0012] (4)將擴增產物純化后,即得所述高通量測序文庫。
[0013] 在本發明的一個優選實施方案中,所述互補序列和擴增序列之間還設有一標記序 列,用W對不同樣本進行識別。
[0014] 在本發明的一個優選實施方案中,所述標記序列的長度為10~15bp。
[0015] 在本發明的一個優選實施方案中,所述互補序列的長度為3~化P。
[0016] 在本發明的一個優選實施方案中,所述通用引物的長度為10~15bp。
[0017] 在本發明的一個優選實施方案中,所述不對稱連接探針的正向探針和反向探針的 長度均不大于50bp。
[0018] 在本發明的一個優選實施方案中,所述DM連接酶為T4DNA連接酶。
[0019] 本發明的有益效果是:
[0020] (1)本發明的單管高通量測序文庫的構建方法針對多個祀序列進行單管,快速完 成文庫的構建,整個文庫構建過程僅需要2~3小時,手動時間僅僅需要15~30分鐘即可, 結合高通量測序平臺可W十分有效的解決目前對于臨床上腫瘤、遺傳病等疾病中在少量的 臨床樣本基礎上需要對體細胞多基因、多祀點檢測運一難點,且成本低廉;
[0021] (2)本發明的構建方法所制備的文庫序列可被目前高通量測序系統識別并進行檢 巧。,從而實現文庫構建進行核酸序列的檢測的應用,該核酸檢測可應用于目前多種高通量 測序平臺、基因忍片平臺、雜交檢測平臺。
【附圖說明】
[0022] 圖1為本發明的第一階段擴增和第二階段擴增的示意圖;
[0023] 圖2為本發明實施例1的高通量測序忍片總的Reads數量
[0024] 圖3為本發明實施例1的3個樣本分別Reads數量和平均長度
[0025] 圖4為本發明實施例1的樣本數據與目標序列的匹配度
[0026]圖5為本發明實施例1的每個樣本的匹配度和均一性
【具體實施方式】
[0027]W下通過【具體實施方式】結合附圖對本發明的技術方案進行進一步的說明和描述。 [002引如圖1所示,本發明的技術方案為:
[0029] 一種單管高通量測序文庫的構建方法,包括如下步驟:
[0030] (1)針對若干目的基因分別設計若干對基本擴增引物,在基本擴增引物的正向引 物F1和反向引物R1的5'端均連接2~5個T10,并在該2~5個T10的靠近3'端的第 一個T上進行PNA修飾,該若干對基本擴增引物的Tm值相差不超過rC,相應的退火溫度為 56 ~64Γ;
[0031] (2)設計一對不對稱連接探針和一不與人類基因組形成互補的通用引物F3,該對 不對稱連接探針包括可自身形成環狀的一正向探針F2和一反向探針R2,該正向探針F2和 反向探針R2從3'端至5'端均依次包括一能夠與不對稱連接探針的5'端若干連續堿基配 對的互補序列11、一標記序列化arcode) 12、一與所述通用引物F3互補配對的擴增序列13 和一與上述2~5個T相對應的粘性末端識別序列14,上述正向探針F2和反向探針R2的 Tm值相差不超過rC,且上述正向探針F2和反向探針自身形成環狀的退火溫度與基本擴增 引物的退火溫度相差不超過rc;
[0032] (3)將模板、上述若干對基本擴增引物F1和R1、不對稱探針F2和R2、通用引物F3 置于一含有DNA連接酶和DNA末端修飾酶的PCR反應體系中進行擴增,得擴增產物,該擴增 的程序的時間為2~化,并依次包括:預變性、第一階段擴增和第二階段擴增,其中第一階 段擴增依次包括第一變性階段、第一退火階段和第一延伸循環階段,第一延伸循環階段的 循環數為5~15,第一退火階段的退火溫度為60~65°C,第二階段擴增依次包括第二變性 階段、第二退火階段和第二延伸循環階段,第二延伸循環階段的循環數為15~30;第一退 火階段的退火溫度比第二退火階段的退火溫度高4~8°C;
[003引 (4)將擴增產物純化后,即得所述高通量測序文庫。
[0034] 本領域技術人員可知,本發明的參數在下述范圍內變化時仍能夠取得與下述實施 例相同或相近的技術效果:
[0035] 所述標記序列的長度為10~15bp。
[0036] 所述互補序列的長度為3~化P。
[0037] 所述通用引物F3的長度為10~15bp。