專利名稱::帶背景驗證的信號組合編碼dna連接測序方法
技術領域:
:本發明帶背景驗證的信號組合編碼DNA連接測序方法涉及一種采用信號組合編碼的DNA連接測序方法,并結合背景驗證方案,是一種實現DNA序列分析的方法,屬于生物
技術領域:
。
背景技術:
:隨著基因組研究的深入,特別是人類基因組計劃和各種模式生物基因組計劃的完成,生物學研究和醫學研究方式產生了巨大變革。從基因水平上認識生命的差異,疾病發生、發展的規律,藥物與生命體的相互作用,不同物種之間的遺傳差異以及同一物種內部不同個體間的遺傳差異成為可能。盡管導致疾病發生的因素眾多,但基因序列差異(包括單核苷酸多態性、DNA甲基化等)被廣泛認為是一個重要的內在因素。多數復雜疾病發生和發展,如癌癥、糖尿病、心血管疾病、精神疾病等,是眾多基因和環境共同作用的結果。通過對某一特定疾病大量基因組樣本中基因突變的大規模檢測及與非患病對照基因組樣本的比對,即可獲得與該疾病有關的基因型信息,通過隨后對藥物敏感基因突變位點的篩査,可以獲得對臨床治療與用藥具有指導性意義的信息。無論是親緣關系較近的物種之間遺傳差異,還是同一物種內部不同個體之間的遺傳差異,都主要是以基因序列差異的形式體現出來。因此,如何快速的篩査基因組中的基因序列差異成為后基因組時代的主要課題之一。現有的基因序列差異的檢測方法主要為傳統SangerDNA測序法、限制性酶切長度多態性、單鏈構象多態性和基于基因芯片的寡核苷酸探針雜交法等。在這些方法中,僅有傳統的SangerDNA測序法能完成對目標片段的全方位序列測定,其余方法均只能確定很少的一部分序列信息。但傳統的SangerDNA測序法存在通量低、成本高、耗時長等不足。第一個人類基因組序列測定的費用大約為IO億美元。盡管這一費用目前已經降低到2000萬美元,但依然是制約功能基因組研究的瓶頸,大幅度降低DNA測序的成本將會大大推動生命科學的發展。為此,美國Venter基金會在2003年提出了1000美元人類全基因組測序的研究目標。2004年初,美國國立衛生院投入4千多萬美元支持DNA測序新技術的研究計劃,累計已經超過1億美元。其目標是發展10萬美元的人類全基因組DNA測序技術,并最終減低為1000美元。目前,除對現有的基于電泳的測序技術的改進外,正在研發的測序技術總體上可以分為四類。第一類是合成測序,合成測序又可分成兩種,一種是在堿基加入到正在發生聚合反應的DNA鏈的過程中進行檢測,另一種在寡核苷酸加入到正在發生延伸反應的DNA鏈的過程中進行檢測;第二類是雜交測序法,通過制備一組高密度寡核苷酸微陣列芯片的雜交信號,進行目標基因的序列鑒定;第三類是分子影像等一系列可以在單分子的水平上進行測序的技術;最后一類技術是誘導DNA分子蜿蜒通過非常細微的小孔,在這個過程中借助電子學或者光學的方法對堿基進行讀出,也成為納米孔道測序技術。目前,除對現有的基于電泳的測序技術的改進外,正在研發的測序技術總體上可以分為四類。第一類是延伸測序法,將信號標記的堿基加入到正在發生聚合反應的DNA鏈中進行檢測,第二類是連接測序法,將信號標記的寡核苷酸片段加入到正在發生連接反應的DNA鏈中進行檢測;第三類是雜交測序法,通過制備一組高密度寡核苷酸微陣列芯片的雜交信號,進行目標基因的序列鑒定;第四類是分子影像等一系列可以在單分子的水平上進行測序的技術最后一類技術是誘導DNA分子蜿蜒通過非常細微的小孔,在這個過程中借助電子學或者光學的方法對堿基進行讀出,也成為納米孔道測序技術。目前只有延伸測序方法和連接測序方法用于全基因組測序,并且開發出了商品化的儀器和試劑,大大提高了DNA測序的效率,大幅度降低了DNA測序的成本。然而,目前新一代的DNA測序在測序成本、通量和速度等方面仍然不能滿足生命科學研究的需要。主要原因之一是在檢測核酸的信號標記方法單一、效率不高。例如,在DNA連接測序方法中,受標記物(如熒光基團)種類的限制,每次連接反應一般僅能確定一個堿基的信息,如需在一次連接反應確定兩個及兩個以上堿基信息,則需要對標記物進行二維或多維編碼。然而現有編碼方法對多種標記物都"無信號"的狀態和未成功發生連接反應的"空信號"之間無法有效分辨,測序反應的存在一定的錯誤率。
發明內容本發明的目的就是針對現有DNA的連接測序技術在檢測核酸的信號標記方法單一、效率不高,試圖通過不同標記物狀態的組合進行二維或多維的編碼,合成信號編碼的DNA測序探針,并通過背景驗證標記物的引入,分辨"無信號"和"空信號",提高連接測序編碼方案的準確率,實現使用相同數量的標記物檢測較多堿基或堿基組合的目的,建立快速、準確、低成本和高通量的序列測定方法。DNA連接測序屬于一種DNA合成測序方法。DNA連接測序的基本步驟是首先在待測的DNA模板上雜交一條與特定區域互補配對的測序引物;接著向含有待測模板和測序引物的反應器中加入一種或一組寡核苷酸測序探針,每個寡核苷酸探針由三部分組成簡并堿基或非嚴格配對堿基、標記物和測序堿基;簡并堿基或非嚴格配對堿基是一組非特異性的可與測序模板雜交的堿基組合,標記物用于標記寡核苷酸探針,便于在發生DNA連接反應后進行檢測;測序堿基是一個和多個確定的堿基,用于使得測序探針有選擇性地與部分測序模板-測序引物復合物發生連接反應,發生反應的測序模板的相應堿基與測序探針的測序堿基互補配對,同時,測序堿基與標記物存在某種對應關系;在進行了DNA連接測序反應后,利用相應的檢測手段對測序模板-引物-探針復合物進行檢測,獲得對應的信號信息,再利用預先設定的測序堿基和標記物的對應關系判讀測序模板中相應位置的堿基信息。當完成一次連接測序反應后,移除測序模板-引物-探針復合物上的標記物,以測序探針作為新的連接起點進行下一次的連接測序反應,連續進行連接反應直至完成所需測序長度。測序引物與待測模板變性分離,隨后在待測模板上雜交與第一條引物序列平移一個和多個堿基的測序引物,進行新一輪多次連接反應;完成后重復變性、雜交、連接過程直至所有位置的堿基信息均完成測定。本發明技術方案帶背景驗證的信號組合編碼的DNA連接測序方法,其特征在于針對某一種特定的DNA測序探針,利用一組編碼標記物狀態的組合結合背景標記物進行標記,對于一批DNA測序探針,采用一組編碼標記物狀態的不同組合方案結合背景標記物進行標記,制備一套帶背景驗證的信號組合編碼的DNA測序探針,從而實現在檢測時對不同DNA測序探針的區分和鑒別A—套帶背景驗證的信號組合編碼的DNA測序探針的制備首先制備未標記的DNA測序探針,每一種未標記的DNA測序探針由一個或多個測序堿基、一個或多個簡并堿基N或非嚴格配對堿基組成。測序堿基用于通過堿基互補配對法則測定待測DNA中相應位置的堿基信息,簡并堿基N為A、T、C、G四種堿基中的任意一個。完成未標記的DNA測序探針的制備后,針對每一種未標記的DNA測序探針,采用多種編碼標記物狀態的一種組合進行標記,同時標記背景標記物,每種編碼標記物在該DNA測序探針上標記與否及標記的量由該編碼標記物在狀態的組合中所對應的狀態決定。采用不同的狀態組合方案結合背景標記物對不同的未標記DNA測序探針進行標記,完成一套帶背景驗證的信號組合編碼的DNA測序探針的制備。B利用上述一套帶背景驗證的信號組合編碼的DNA測序探針的測序流程如下a.選取一條測序引物與待測的DNA模板依據堿基互補配對原理進行雜交;b.向反應體系中加入上述的一套帶背景驗證的信號組合編碼的DNA測序探針和DNA連接酶及其反應體系,進行DNA連接反應;c.完成DNA連接反應后,檢測全部參與狀態組合的標記物及背景標記物的信號,首先判讀背景標記物是否符合校驗,如符合,判讀編碼標記物信號所處的狀態,根據全部編碼標記物狀態的組合情況,確定發生連接反應的DNA測序探針的種類,從而確定該測序探針上測序堿基的類型和排布,并最終確定被測DNA模板上對應位置的堿基或堿基序列信息;d.完成對標記物信號的檢測后,移除DNA測序探針上的標記物;e.重復上述步驟b-d直至DNA測序探針達到或超出待測DNA模板待測區域末端f.該測序引物與待測DNA模板變性分離,選取第二條測序引物;g.重復上述步驟a-f,直至全部未知DNA模板的待測區域的全部序列信息得以確定。所述的多種標記物對未標記DNA測序探針進行組合標記,其方案是對同一DNA測序探針分子同時標記一種或多種標記物,或者分別用不同的標記物標記同一種DNA測序探針的不同分子,隨后將上述不同測序探針分子混合。所述的標記物的狀態組合,是標記物的"有信號"、"無信號"兩種狀態組合,或者是標記物不同信號強度比例狀態的組合。所述的測序引物是指一組只能和所有DNA模板的一段通用序列雜交的寡核苷酸片段,一組測序引物在DNA模板上雜交區域彼此相差一個或數個堿基,能夠在數輪測序反應中完成對DNA模板全長的測序工作;測序模板上的通用序列,是在測序模板制備過程中通過連接反應加入,或者在擴增過程中通過引物引入。所述的DNA模板是通過對待測的DNA片段通過DNA擴增技術增加基因組中感興趣的目的片段的量,擴增是單重的,即一次擴增一個目的片段,或者是多重的,即一次擴增多個目的片段;所述的待測的DNA模板中的固定是通過化學或者物理方法固定于平面片基上,或固定于"96孔板"、"384孔板"及各種修飾的珠子載體上。所述的標記物,是采用的熒光基團,或利用測序探針化學的、物理的性質的改變,如電阻變化、電流變化。所述的檢測是指與所述的標記物性質相適應的,在激光激發的熒光標記基團時,激光激發強度可為95%、70%、45%等多個不同強度,光電倍增可以分別為95%、70%、45%等多個檢測區間。所述的標記物的移除,是標記基團通過化學的、物理的方法與DNA測序探針分離,或者DNA測序探針化學的、物理的性質恢復原有狀態。標記物的移除,是僅僅移除標記物本身,或者同時移除與標記物相連或不相連的一個或多個堿基及相關基團。所述的第二條測序引物是一組測序引物中除己經使用的測序引物中的任何一條,并不一定是與已使用的測序引物對應在測序模板上雜交位置最為接近的一條。技術原理本發明的目的是提供一種帶背景驗證信號組合編碼的DNA連接測序方法,在一次連接反應中同時檢測多個堿基,并通過背景標記物的引入,降低測序反應的錯誤率。該方法的原理是通過向連接測序反應中添加特定的背景驗證標記物,有效分辨"無信號"未成功連接兩種狀態,提高信號組合編碼的連接測序反應的準確率。信號組合編碼的連接測序方法利用不同標記物在被檢測信號的有無(二維)和強度差異(多維)進行二進制編碼或多進制編碼。這里我們以信號的有無為例,當標記物為兩種時,通過兩種標記物"有信號"和"無信號"排列組合,共得到22=4種復合狀態,即"標記物1有信號、標記物2有信號"、"標記物1有信號、標記物2無信號"、"標記物1無信號、標記物2有信號"、"標記物l無信號、標記物2無信號"。當標記物數量為n時(n為大于等于2的整數),記錄標記物復合狀態為全部n位二進制數,二進制數的每一位記錄1種標記物的被檢狀態,"1"為檢測到信號,"0"為未檢測到信號,全部2"個n位二進制數與n個信號標記物的2"種復合狀態一一對應。由于構成DNA的常見堿基共有4種,分別為腺嘌呤(A)、鳥嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C),因此需要準確檢測一個堿基的4種類型需要兩種標記物"有信號"和"無信號"的4種復合狀態;2個堿基組成的堿基組合共有4X4=16種類型,需要4種標記物共24=16種復合狀態來檢測;依此類推,n個(n為大于等于2的整數)堿基組成的堿基組合共需要2n種標記物共22"種復合信號狀態來檢測,每種復合狀態通過一個2n位二進制數來唯一表示,并與測序探針的類型一一對應。表1帶背景驗證的二維編碼方法,2n種標記物22"種復合狀態檢測n個堿基寡核苷酸配方列表(表中"1"表示該種標記物修飾該種測序探針,"0"表示該種標記物不修飾該種測序探針)<table>tableseeoriginaldocumentpage8</column></row><table>然而,單純的信號組合編碼的連接測序方法存在如下問題當待測堿基或堿基組合對應的互補測序探針沒有與之對應的修飾標記物時,由于加入反應體系中的測序探針均不含修飾標記物,因此通過檢測全部標記物后我們得到一組全為"無信號"的信號組合;同時,當加入反應體系的測序探針因為連接反應失敗等或其他原因導致測序反應失敗,通過檢測我們同樣可以獲得一組全為"無信號"的信號組合。此時一組全為"無信號"的信號組合對應了兩種可能,傳統組合編碼的測序方法無法有效分辨這兩種可能,因而測序過程存在一定的錯本發明,采用標記物的信號組合編碼技術,并增加了一種標記物作為背景標記物(見表i),在現有方法的測序探針混合物中添加由背景標記物修飾全部各種測序探針或對現有全部測序探針修飾以背景標記物。當進行完連接測序反應后,撿測全部參與狀態組合的標記物及背景標記物的信號,首先判讀背景標記物是否符合校驗,如符合,判讀編碼標記物信號所處的狀態,根據全部編碼標記物狀態的組合情況,確定發生連接反應的DNA測序探針的種類,從而確定該測序探針上測序堿基的類型和排布,并最終確定被測DNA模板上對應位置的堿基或堿基序列信息。并通過背景標記物的引入分辨一組編碼標記物全為"無信號"和連接反應失敗兩種狀況。本發明的有益效果1.本發明最大的優點通過背景標記物的引入,有效分辨編碼標記物全為"無信號"和未成功發生連接反應兩種情況,提高了測序反應的準確率,使得信號編碼的循環連接測序法更加具有實用性。通過的編碼標記物的組合信號編碼,實現在一次連接反應中同時檢測較多堿基或堿基組合。2.由于在單次連接反應中檢測多個堿基的類別所需的標記物種類與傳統方法相比呈現指數型的下降,使得在單次連接反應中同時檢測多個堿基的類別成為可能,成倍縮短了對全部序列測定所需的時間。3.通過信號組合編碼,檢測相同長度的序列所需的連接反應次數的減少,測序的成本也成倍降低。同時,通過信號組合編碼,檢測相同數量的堿基類型所需的標記物種類大幅降低,降低了對檢測標記物設備的需求,從而降低成本。以下結合附圖對本發明進行進一步說明。圖1是當標記物狀態簡化為二維時,即信號的"有"或"無"時,通過兩種標記物的二維狀態組合檢測在一次連接測序反應中A、T、C、G四種堿基的原理圖,圖中實心圖標表示"有信號",空心圖標表示"無信號"。1,當待測堿基為A時,首先驗證背景標記物(圖中黑色實心方塊)信號是否符合預期,隨后由測序堿基為U的測序探針所對應的編碼標記物的組合狀態為"標記物1有信號,標記物2有信號",即"1,1";2,當待測堿基為C時,首先驗證背景標記物(圖中黑色實心方塊)信號是否符合預期,隨后由測序堿基為G的測序探針所對應的編碼標記物的組合狀態為"標記物l有信號,標記物2無信號",即"1,0";3,當待測堿基為G時,首先驗證背景標記物(圖中黑色實心方塊)信號是否符合預期,隨后由測序堿基為C的測序探針所對應的編碼標記物的組合狀態為"標記物1無信號,標記物2有信號",即"0,1";4,當待測堿基為T時,首先驗證背景標記物(圖中黑色實心方塊)信號是否符合預期,隨后由測序堿基為A的測序探針所對應的編碼標記物的組合狀態為"標記物l無信號,標記物2無信號",即"0,0"。圖2是實例2、實例3和實例4共同的工作流程圖。1,將P1、P2引物擴增后的PCR產物固定于玻片表面;2,第一條測序引物Il與固定于玻片表面的PCR產物雜交;3,測序引物II上連接了測序堿基與PCR待測位置互補的寡核苷酸探針;4,完成檢測后移除熒光修飾基團;5,n連接進行第二次測序探針的連接;6,完成檢測后再次移除熒光修飾基團;7,II完成全部4次連接反應;8,測序引物I1與PCR產物變性分離;9,第二條測序引物I2與PCR產物雜交開始新一輪測序反應。圖3是實例2測序引物II進行前兩次測序連接反應的詳細圖解。1,測序引物II與固定于玻片表面的PCR產物雜交,II的全部15個堿基與PCR引物P2互補鏈5'端15個堿基互補配對;2,進行第一次連接反應,48種寡核苷酸探針(32種編碼寡核苷酸探針,16種背景寡核苷酸探針)組成的混合物中測序堿基為"5'-AA-3'"的寡核苷酸單體(寡核苷酸探針其余位置為簡并堿基N)與雜交于PCR產物上的II連接,通過對標記物的檢測獲得CY7的信號,背景標記物驗證通過,查寡核苷酸探針配方表得知當編碼標記物均為"無信號"時待測DNA的3'末端第3、4號堿基為"5'-AA-3'";3,移除寡核苷酸探針末端的熒光修飾基團;4,進行第二次連接,檢測待測DNA的3'末端第ll、12號堿基。具體實施例方式本發明的實施方法分為兩種-第一種是針對某一種測序探針,選用若干種編碼標記物和一種背景標記物同時對同一測序探針分子進行標記。針對一次連接反應,各個標記物在被檢測時分別呈現"有信號"、"無信號"的兩種狀態,由向測序連接反應體系中加入的特定測序探針決定,制備含有不同編碼標記物和背景標記物的測序探針是本發明的關鍵。加入反應體系中的測序探針由一組標記了不同標記物的寡核苷酸探針組成。每個寡核苷酸探針由一個或多個測序堿基(通過堿基互補配對法則測定待測DNA中相應位置的堿基信息)、一個或多個簡并堿基N(N為A、T、C、G四種堿基中的任意一個)或非嚴格配對堿基(如次黃嘌呤等)和一種具有被檢測能力的標記物構成。測序堿基與標記物之間的組合按照表1所列狀態制備,當表1中所確定的"測序探針類型i"對應k種標記物的狀態為"1"時,則在制備測序堿基為"堿基組合類型i"的測序探針分子時,同時標記表格中"測序探針類型i"所有狀態為"1"的標記物;逐行合成表1所列全部2"種寡核苷酸探針,該探針混合物即為所需制備的寡核苷酸探針混合物。第二種是將該種測序探針分為若干部分,每一部分分別標記一種標記物(標記物包含編碼標記物和背景標記物)。針對一次連接反應,各個標記物在被檢測時分別呈現"有信號"、"無信號"的兩種狀態,由向測序連接反應體系中加入的特定測序探針決定。因此制備含有不同編碼標記物和背景標記物的測序探針是本發明的關鍵。加入反應體系中的測序探針由一組標記了不同標記物的寡核苷酸探針組成。每個寡核苷酸探針由一個或多個測序堿基(通過堿基互補配對法則測定待測DNA中相應位置的堿基信息)、一個或多個簡并堿基N(N為A、T、C、G四種堿基中的任意一個)或非嚴格配對堿基(如次黃嘌呤等)和一種具有被檢測能力的標記物構成。測序堿基與標記物之間的組合按照表1所列狀態制備,當表1中所確定的"堿基組合類型i"與"標記物j"所列狀態為"1"時,則制備測序堿基為"堿基組合類型i"、標記物為"標記物j"的寡核苷酸探針;如所列狀態為"0"時則不合成,合成表l所列全部狀態為"1"的寡核苷酸探針,該探針混合物即為所需制備的寡核苷酸探針混合物。更進一步地,每一種編碼標記物的狀態可以通過相對信號強度的大小,可以確定為m種狀態(m〉2),同時背景標記物維持一種不變。例如,標記物的信號可以為"0"、"1"、"2"和"3"等四種狀態。利用每一種標記物在被檢測時有"無信號"、"1/3信號"、"2/3信號"和"全信號"四種狀態進行四進制編碼,可以把"無信號"記錄為"0",把"1/3信號"記錄為"1",把"2/3信號"記錄為"2",把"全信號"記錄為"3"。當對于某一特定的測序探針采用兩種編碼標記物和一種背景標記物時,通過這兩種標記物產生的信號組合,共得到4X4-16種組合狀態,即"00"、"01"、"02"、"03"、"10"、"11"、"12"、"13"、"20"、"21"、"22"、"23"、"30"、"31"、"32"、"33"(二位四進制數的高位記錄1號編碼標記物的狀態,低位記錄2號編碼標記物的狀態),同時背景標記物單獨處理,從而實現了采用3種標記物同時標記16種測序探針。實施例l:帶背景驗證的信號組合編碼的DNA連接測序方法,其特征在于針對某一種特定的DNA測序探針,利用一組編碼標記物狀態的組合結合背景標記物進行標記,對于一批DNA測序探針,采用一組編碼標記物狀態的不同組合方案結合背景標記物進行標記,制備一套帶背景驗證的信號組合編碼的DNA測序探針,從而實現在檢測時對不同DNA測序探針的區分和鑒別A—套帶背景驗證的信號組合編碼的DNA測序探針的制備首先制備未標記的DNA測序探針,每一種未標記的DNA測序探針由一個或多個測序堿基、一個或多個簡并堿基N或非嚴格配對堿基組成。測序堿基用于通過堿基互補配對法則測定待測DNA中相應位置的堿基信息,簡并堿基N為A、T、C、G四種堿基中的任意一個。完成未標記的DNA測序探針的制備后,針每一種未標記的DNA測序探針,采用多種編碼標記物狀態的一種組合進行標記,同時標記背景標記物,每種編碼標記物在該DNA測序探針上標記與否及標記的量由該編碼標記物在狀態的組合中所對應的狀態決定。采用不同的狀態組合方案結合背景標記物對不同的未標記DNA測序探針進行標記,完成一套帶背景驗證的信號組合編碼的DNA測序探針的制備。B利用上述一套帶背景驗證的信號組合編碼的DNA測序探針的測序流程如下a.選取一條測序引物與待測的DNA模板依據堿基互補配對原理進行雜交;b.向反應體系中加入上述的一套帶背景驗證的信號組合編碼的DNA測序探針和DNA連接酶及其反應體系,進行DNA連接反應c.完成DNA連接反應后,檢測全部參與狀態組合的標記物及背景標記物的信號,首先判讀背景標記物是否符合校驗,如符合,判讀編碼標記物信號所處的狀態,根據全部編碼標記物狀態的組合情況,確定發生連接反應的DNA測序探針的種類,從而確定該測序探針上測序堿基的類型和排布,并最終確定被測DNA模板上對應位置的堿基或堿基序列信息;d.完成對標記物信號的檢測后,移除DNA測序探針上的標記物;e.重復上述步驟b-d直至DNA測序探針達到或超出待測DNA模板待測區域末端;f.該測序引物與待測DNA模板變性分離,選取第二條測序引物;g.重復上述步驟a-f,直至全部未知DNA模板的待測區域的全部序列信息得以確定。所述的多種標記物對未標記DNA測序探針進行組合標記,其方案是對同一DNA測序探針分子同時標記一種或多種標記物,或者分別用不同的標記物標記同一種DNA測序探針的不同分子,隨后將上述不同測序探針分子混合。所述的標記物的狀態組合,是標記物的"有信號"、"無信號"兩種狀態組合,或者是標記物不同信號強度比例狀態的組合。所述的測序引物是指一組只能和所有DNA模板的一段通用序列雜交的寡核苷酸片段,一組測序引物在DNA模板上雜交區域彼此相差一個或數個堿基,能夠在數輪測序反應中完成對DNA模板全長的測序工作測序模板上的通用序列,是在測序模板制備過程中通過連接反應加入,或者在擴增過程中通過引物引入。所述的DNA模板是通過對待測的DNA片段通過DNA擴增技術增加基因組中感興趣的目的片段的量,擴增是單重的,即一次擴增一個目的片段,或者是多重的,即一次擴增多個目的片段;所述的待測的DNA模板中的固定是通過化學或者物理方法固定于平面片基上,或固定于"96孔板"、"384孔板"及各種修飾的珠子載體上。所述的標記物,是采用的熒光基團,或利用測序探針化學的、物理的性質的改變,如電阻變化、電流變化。所述的檢測是指與所述的標記物性質相適應的,在激光激發的熒光標記基團時,激光激發強度可為95°/。、70%、45%等多個不同強度,光電倍增可以分別為95%、70%、45%等多個檢測區間。所述的標記物的移除,是標記基團通過化學的、物理的方法與DNA測序探針分離,或者DNA測序探針化學的、物理的性質恢復原有狀態。標記物的移除,是僅僅移除標記物本身,或者同時移除與標記物相連或不相連的一個或多個堿基及相關基團。所述的第二條測序引物是一組測序引物中除己經使用的測序引物中的任何一條,并不一定是與已使用的測序引物對應在測序模板上雜交位置最為接近的一條。實施例2:帶背景驗證的四色熒光復合編碼法(分別標記方案)檢測人類17號染色體上,RP11-354P11克隆上45332-45363共32個堿基對序列;提取人類全基因組DNA,利用PCR方法擴增目的片段,引物為P1、P2(序列見表2),引物P1的5'末端采用羥基修飾。擴增后的PCR產物固定于醛基修飾的玻片表面后,加熱玻片至95TM吏雙鏈PCR產物的一條鏈與固定鏈脫離,隨后開始測序反應。向玻片表面加入雜交緩沖液和第一條測序引物II(序列見表2),37'C雜交復性20分鐘。向反應池中加入表3所列的全部48種寡核苷酸探針組成的混合物,其中CY7為背景標記物,其余四種標記物為編碼標記物。作為背景標記物,CY7與所有16種測序堿基分別構成了16種寡核苷酸探針。采用T4核酸連接酶進行連接反應,反應條件為25'C連接30分鐘。連接完成后利用激光共聚焦顯微鏡對玻片進行掃描,掃描分別采用對應于CY7、CY3、CY5、TXR和FTC的對應的波長進行,根據獲得的熒光信號判讀對應的堿基信息(見附圖2)。表2實例2中相關寡核苷酸序列信息序列名序列信息待測序列5'-CACGGACCAGCTGCCCTGGACCAGCTGCAAGA-3'Pl0H-5'-CGCTATACTACCTCATCTCCTCCTTCACG-3'P25'-GCAGTTGCCAGTGTTCCAGGAGT-3'115,-CAGTGTTCCAGGAGT-3'125'"GTGTTCCAGGAGTNN-3'135'-GTTCCAGGAGTN,-3,145'-GCCAGTGTTCCAGGA-3'在第一次連接反應中,II引物與P2互補鏈上的"5'-AAGAACTCCTGGAACACTG-3'"序列雜交,加入寡核苷酸探針混合物后,寡核苷酸探針混合物中測序堿基如果與待測DNA位于Il引物3'端下游的第3、4號堿基(也是待測DNA的3'末端第3、4號堿基)互補配對,則這些寡核苷酸探針與待測DNA雜交并與引物II發生連接反應。待測DNA位于II引物3'端下游的第3、4個堿基為"5'-AA-3'",其反向互補堿基為"5'-TT-3'",則所有測序堿基為"5'-TT-3'"的寡核苷酸探針僅有一條,為"5'-NNTTNNNN-3'-CY7",與待測DNA模板及引物II發生連接反應(附圖3-2)。在進行信號檢測時,成功驗證背景標記物狀態為"有信號",隨后通過查表得知當編碼標記物狀態均為"無信號"時,待測DNA的3'末端第3、4號堿基的反向互補鏈信息為"5'-TT-3'",從而可以獲得待測DNA的3'末端第3、4號堿基為"5'-AA-3'"。表3寡核苷酸探針混合物詳細列表<table>tableseeoriginaldocumentpage14</column></row><table>完成此輪檢測后,利用化學方法切除鏈接與引物I1上寡核苷酸探針3'末端的熒光基團,在3'末端獲得一個游離的羥基進行再次連接反應(附圖3-3)。向反應池中再次加入表所列全部苷酸探針混合物,進行第二輪連接反應,此次連接反應是檢測待測DNA位于Il引物3'端下游的第11、12號堿基(待測DNA的3'末端第11、12號堿基)"5'-CC-3'",此時三種測序堿基為"5'-GG-3,"的寡核苷酸探針"5'-NNGG隨NN-3'-CY7"、"5'-NNGGN酬-3'-CY5"、"5'-NNGGNNNN-3'-FTC"發生連接反應,進行熒光檢測是同時檢測到CY7、CY5、FTC,背景標記物驗證成功,隨后査表判讀并進行反向互補獲得待測DNA的3'末端第ll、12號堿基為"5'-CC-3'"(附圖3-4)。化學方法切除連接上的寡核苷酸末端熒光基團后再次進行11引物的第3、4輪連接反應,分別測得待測DNA的3'末端第19、20號堿基和第27、28號堿基信息。完成四輪連接反應后,95'C使測序引物I1與待測DNA分離,向玻片表面加入雜交緩沖液和第二條測序引物I2(序列見表2),37'C雜交復性20分鐘。隨后開始四輪連接反應分別檢測待測DNA的3'末端第5、6號,13、14號,21、22號以及29、30號四組堿基。同樣的,利用測序引物I3檢測待測DNA的3'末端第7、8號,15、16號,23、24號以及31、32號四組堿基,禾擁測序引物I4檢測待測DNA的3'末端第1、2號,9、IO號,17、18號以及25、26號四組堿基。通過所獲得序列信息進行拼接即可獲得待測DMA全部32個堿基的序列信息。實施例3:帶背景驗證的四色熒光復合編碼法(共同標記方案)檢測人類17號染色體上,RP11-354P11克隆上45332-45363共32個堿基對序列;提取人類全基因組DNA,利用PCR方法擴增目的片段,引物為P1、P2(序列見表4),引物P1的5'末端采用羥基修飾。擴增后的PCR產物固定于醛基修飾的玻片表面后,加熱玻片至95t:使雙鏈PCR產物的一條鏈與固定鏈脫離,隨后開始測序反應。表4實例3中相關寡核苷酸序列信息<table>tableseeoriginaldocumentpage15</column></row><table>向玻片表面加入雜交緩沖液和第一條測序引物II(序列見表4),37'C雜交復性20分鐘。向反應池中加入表6所列的全部16種寡核苷酸探針組成的混合物,表格每行為一種寡核苷酸探針,其中CY7為背景標記物,其余四種標記物為編碼標記物,每個寡核苷酸探針分子依據表格同時標記了0-4種編碼熒光分子和一種背景熒光分子CY7。采用T4核酸連接酶進行連接反應,反應條件為25'C連接30分鐘。連接完成后利用激光共聚焦顯微鏡對玻片進行掃描,掃描分別采用對應于CY7、CY3、CY5、TXR和FTC的對應的波長進行,根據獲得的熒光信號判讀對應的堿基信息(附圖2)。在第一次連接反應中,II與待測DNA及引物P2互補鏈上的"5'_AAGAACTCCTGGAAC-3,"序列雜交,加入寡核苷酸探針混合物后,寡核苷酸探針混合物中測序堿基如果與待測DNA位于II引物3'端下游的第3、4號堿基互補配對,則這些寡核苷酸探針與待測DNA雜交并與引物I1發生連接反應。待測DNA位于Il引物3'端下游的第3、4個堿基為"5'-AA-3'",其反向互補堿基為"5'-TT-3'",則測序堿基為"5'-TT-3'"的寡核苷酸探針為"5'-NNAGNNNN-3'",由表6可知該寡核苷酸探針標記了背景基團CY7,但未標記編碼熒光基團,與待測DNA模板及引物Il發生連接反應。在進行信號檢測時,成功驗證背景標記物CY7狀態為"有信號",隨后通過查表得知當編碼標記物狀態均為"無信號"時,待測DNA的3'末端第3、4號堿基的反向互補鏈信息為"5'-TT-3'",從而可以獲得待測DNA的3'末端第3、4號堿基為"5'-AA-3'"。<table>tableseeoriginaldocumentpage16</column></row><table>完成此輪檢測后,利用化學方法切除鏈接與引物II上寡核苷酸探針3'末端的熒光基團,在3'末端獲得一個游離的羥基進行再次連接反應。向反應池中再次加入表6所列全部苷酸探針混合物,進行第二輪連接反應,此次連接反應是檢測待測DNA位于Il引物3'端下游的第ll、12號堿基(待測DNA的3'末端第ll、12號堿基)"5'-CC-3'",此時三種測序堿基為"5'-GG-3,"的寡核苷酸探針"5'-NNGGNNNN-3'"同時修飾了背景基團CY7和兩種編碼基團CY5及FTC。發生連接反應,進行熒光檢測是同時檢測到CY7、CY5、FTC,背景標記物驗證成功,隨后査表判讀并進行反向互補獲得待測DNA的3'末端第11、12號堿基為"5'-CC-3'"。化學方法切除連接上的寡核苷酸末端熒光基團后再次進行Il引物的第3、4輪連接反應,分別測得待測DNA的3'末端第19、20號堿基和第27、28號堿基信息。完成四輪連接反應后,95。C使測序引物I1與待測DNA分離,向玻片表面加入雜交緩沖液和第二條測序引物I2(序列見表4),37'C雜交復性20分鐘。隨后開始四輪連接反應分別檢測待測DNA的3'末端第5、6號,13、14號,21、22號以及29、30號四組堿基。同樣的,利用測序引物13檢測待測DNA的3'末端第7、8號,15、16號,23、24號以及31、32號四組堿基,利用測序引物I4檢測待測DNA的3'末端第1、2號,9、10號,17、18號以及25、26號四組堿基。通過所獲得序列信息進行拼接即可獲得待測DNA全部32個堿基的序列信息。實施例4:帶背景校驗的雙色熒光光強組合編碼法檢測人類17號染色體上,RP11-354P11克隆上45332-45363共32個堿基對序列;提取人類全基因組DNA,利用PCR方法擴增目的片段,引物為P1、P2(序列見表6),引物P1的5'末端采用羥基修飾。擴增后的PCR產物固定于醛基修飾的玻片表面后,加熱玻片至95'C使雙鏈PCR產物的一條鏈與固定鏈脫離,隨后開始測序反應。表6實例4中相關寡核苷酸序列信息<table>tableseeoriginaldocumentpage17</column></row><table>向玻片表面加入雜交緩沖液和第一條測序引物Il(序列見表6),37'C雜交復性20分鐘。向反應池中加入表8所列的全部16種寡核苷酸探針組成的混合物,采用T4核酸連接酶進行連接反應,反應條件為25'C連接30分鐘。連接完成后利用激光共聚焦顯微鏡對玻片進行掃描,掃描分別采用對應于CY3、CY5和CY7的波長進行,根據獲得的熒光信號判讀對應的堿基信息(附圖2)。表7寡核苷酸探針混合物詳細列表(每一行代表一種寡核苷酸探針,CY3比例表示寡核苷酸探針中修飾CY3基團的比例,CY5比例寡核苷酸探針中修飾CY5基團的比例)<table>tableseeoriginaldocumentpage18</column></row><table>在第一次連接反應中,II與待測DNA及引物P2互補鏈上的"5'-AAGAACTCCTGGAAC-3'"序列雜交,加入寡核苷酸探針混合物后,寡核苷酸探針混合物中測序堿基如果與待測DNA位于II引物3'端下游的第3、4號堿基互補配對,則這些寡核苷酸探針與待測DNA雜交并與引物n發生連接反應。待測DNA位于Il引物3'端下游的第3、4個堿基為"5'-CT-3'",其反向互補堿基為"5'-AG-3'",則測序堿基為"5,-AG-3'"的寡核苷酸探針為"5'-NNAGN.NNN-3'",由表8可知該寡核苷酸探針中100%標記了作為背景校驗的CY7基團,100%標記了作為信號編碼的CY3基團,33.3免標記了作為信號編碼的CY5基團,與待測DNA模板及引物II發生連接反應。在進行信號檢測時,此輪連接反應同時可以檢測出CY7、CY3和CY5三種熒光,CY7的熒光強度是標準強度的100%,通過背景校驗。同時,CY3熒光強度是標準強度的100%,CY5熒光強度是標準強度的33.3%,通過査表可以判讀待測DNA的3'末端第7、8號堿基的反向互補鏈信息為"5'-AG-3'",從而可以獲得待測DNA的3'末端第7、8號堿基為"5'-CT-3,"。完成次輪檢測后,利用化學方法切除鏈接與引物I1上寡核苷酸探針3'末端的熒光基團,在3'末端獲得一個游離的羥基進行再次連接反應。向反應池中再次加入表6所列全部苷酸探針混合物,進行第二輪連接反應。此次連接反應是檢測待測DNA位于Il引物3'端下游的第11、12號堿基(待測DNA的3'末端第15、16號堿基)"5'-TG-3'",此時測序堿基"5'-CA-3'"對應的寡核苷酸探針為"5'-NNCAN,N-3'",由表8可知該寡核苷酸探針100%標記了CY7基團,66.7W標記了CY3基團,100%標記了CY5基團,進行連接反應后,同時檢測到CY7、CY3和CY5,作為背景校驗的CY7熒光強度是標準強度的100%,同時作為編碼的CY3熒光強度是標準強度的66.7%,CY5熒光強度是標準強度的100%,查表判讀并進行反向互補獲得待測DNA的3'末端第15、16號堿基為"5'-TG-3'"。化學方法切除連接上的寡核苷酸末端熒光基團后再次進行II引物的第3、4輪連接反應,分別測得待測DNA的3'末端第23、24號堿基和第31、32號堿基信息。完成四輪連接反應后,95'C使測序引物I1與待測DNA分離,向玻片表面加入雜交緩沖液和第二條測序引物I2(序列見表6),37i:雜交復性20分鐘。隨后開始四輪連接反應分別檢測待測DNA的3'末端第5、6號,13、14號,21、22號以及29、30號四組堿基。同樣的,利用測序引物I3檢測待測DNA的3'末端第3、4號,11、12號,19、20號以及27、28號四組堿基,利用測序引物I4檢測待測DNA的3'末端第1、2號,9、10號,17、18號以及25、26號四組堿基。通過所獲得序列信息進行拼接即可獲得待測DNA全部32個堿基的序列信息。權利要求1.一種帶背景驗證的信號組合編碼的DNA連接測序方法,其特征在于針對某一種特定的DNA測序探針,利用一組編碼標記物狀態的組合結合背景標記物進行標記,對于一批DNA測序探針,采用一組編碼標記物狀態的不同組合方案結合背景標記物進行標記,制備一套帶背景驗證的信號組合編碼的DNA測序探針,從而實現在檢測時對不同DNA測序探針的區分和鑒別A一套帶背景驗證的信號組合編碼的DNA測序探針的制備首先制備未標記的DNA測序探針,每一種未標記的DNA測序探針由一個或多個測序堿基、一個或多個簡并堿基N或非嚴格配對堿基組成;測序堿基用于通過堿基互補配對法則測定待測DNA中相應位置的堿基信息,簡并堿基N為A、T、C、G四種堿基中的任意一個;完成未標記的DNA測序探針的制備后,針對每一種未標記的DNA測序探針,采用多種編碼標記物狀態的一種組合進行標記,同時標記背景標記物,每種編碼標記物在該DNA測序探針上標記與否及標記的量由該編碼標記物在狀態的組合中所對應的狀態決定;采用不同的狀態組合方案結合背景標記物對不同的未標記DNA測序探針進行標記,完成一套帶背景驗證的信號組合編碼的DNA測序探針的制備;B利用上述一套帶背景驗證的信號組合編碼的DNA測序探針的測序流程如下a.選取一條測序引物與待測的DNA模板依據堿基互補配對原理進行雜交;b.向反應體系中加入上述的一套帶背景驗證的信號組合編碼的DNA測序探針和DNA連接酶及其反應體系,進行DNA連接反應;c.完成DNA連接反應后,檢測全部參與狀態組合的標記物及背景標記物的信號,首先判讀背景標記物是否符合校驗,如符合,判讀編碼標記物信號所處的狀態,根據全部編碼標記物狀態的組合情況,確定發生連接反應的DNA測序探針的種類,從而確定該測序探針上測序堿基的類型和排布,并最終確定被測DNA模板上對應位置的堿基或堿基序列信息;d.完成對標記物信號的檢測后,移除DNA測序探針上的標記物;e.重復上述步驟b-d直至DNA測序探針達到或超出待測DNA模板待測區域末端;f.該測序引物與待測DNA模板變性分離,選取第二條測序引物;g.重復上述步驟a-f,直至全部未知DNA模板的待測區域的全部序列信息得以確定。2.根據權利要求l所述的帶背f驗證的信號組合編碼的DNA連接測序方法,其特征在于所述的多種標記物對未標記DNA測序探針進行組合標記,其方案是對同一DNA測序探針分子同時標記一種或多種標記物,或者分別用不同的標記物標記同一種DNA測序探針的不同分子,隨后將上述不同測序探針分子混合。3.根據權利要求1所述的帶背景驗證的信號組合編碼的DNA連接測序方法,其特征在于所述的標記物的狀態組合,是標記物的"有信號"、"無信號"兩種狀態組合,或者是標記物不同信號強度比例狀態的組合。4.根據權利要求1所述的帶背景驗證的信號組合編碼的DNA連接測序方法,其特征在于所述的測序引物是指一組只能和所有DNA模板的一段通用序列雜交的寡核苷酸片段,一組測序引物在DNA模板上雜交區域彼此相差一個或數個堿基,能夠在數輪測序反應中完成對DNA模板全長的測序工作;測序模板上的通用序列,是在測序模板制備過程中通過連接反應加入,或者在擴增過程中通過引物引入。5.根據權利要求1所述的帶背景驗證的信號組合編碼的DNA連接測序方法,其特征在于所述的DNA模板是通過對待測的DNA片段通過DNA擴增技術增加基因組中感興趣的目的片段的量,擴增是單重的,即一次擴增一個目的片段,或者是多重的,即一次擴增多個目的片段;所述的待測的DNA模板中的固定是通過化學或者物理方法固定于平面片基上,或固定于"96孔板"、"384孔板"及各種修飾的珠子載體上。6.根據權利要求1所述的帶背景驗證的信號組合編碼的DNA連接測序方法,其特征在于所述的標記物,是采用的熒光基團,或利用測序探針化學的、物理的性質的改變,如電阻變化、電流變化。7.根據權利要求1所述的帶背景驗證的信號組合編碼的DNA連接測序方法,其特征在于所述的標記物的移除,是標記基團通過化學的、物理的方法與DNA測序探針分離,或者DNA測序探針化學的、物理的性質恢復原有狀態;標記物的移除,是僅僅移除標記物本身,或者同時移除與標記物相連或不相連的一個或多個堿基及相關基團。8.根據權利要求1所述的帶背景驗證的信號組合編碼的DNA連接測序方法,其特征在于所述的第二條測序引物是一組測序引物中除己經使用的測序引物中的任何一條,并不一定是與己使用的測序引物對應在測序模板上雜交位置最為接近的一條。全文摘要本發明帶背景驗證的信號組合編碼DNA連接測序方法涉及一種具有背景校驗的信號組合編碼的DNA連接測序方法,屬于生物
技術領域:
。本發明的特征在于在信號組合編碼的連接測序反應中增加了背景校驗,成功地對全空信號與未發生連接反應兩種情況進行了分辨,提高測序的準確率,增加了信號編碼測序的可靠性。本發明在組合信號編碼標記物外增加一種背景標記物,利用背景標記物對連接反應是否正常發生進行驗證,驗證成功后通過不同編碼標記物在被檢測時組合信號狀態進行編碼,并與所測堿基的種類一一對應,進行信號編碼的連接DNA測序反應,在不降低測序通量的基礎上提高測序反應的準確度。文檔編號C12Q1/68GK101597643SQ200910026890公開日2009年12月9日申請日期2009年6月3日優先權日2009年6月3日發明者李燕強,景涂,白云飛,肖鵬峰,陸祖宏申請人:東南大學