專利名稱:核酸堿基序列的測定方法
背景技術:
對于通過電泳獲得的全部檢測數據一般都集中執行預處理,隨后用處理過的波形來進行序列測定(base calling)。
對波形定型的預處理包括通過以FFT(快速傅立葉變換)為代表的傅立葉變換進行的波形定型。在此預處理中,當對電泳檢測到的峰信號的數據進行傅立葉變換時,執行過濾操作,隨后通過反向傅立葉變換將數據返給峰信號。在此過濾過程中所運用的過濾函數適于除去那些出現頻率短于DNA峰出現間隔的信號,主要為了除去高頻組分的噪音。
①雖然FFT必須應用于2n個數目的數據,但數據的數目并不是恒定的,隨遷移時間或取樣頻率而改變。
②設置這個除去噪音的過濾函數主要是為了除去具有高頻組分的噪音,例如,那些出現頻率短于DNA峰出現間隔的信號。因此,遷移速率可作為過濾函數的一個重要參數。但是,遷移速率在遷移過程中是逐漸改變的,因此在全部數據范圍中噪音的過濾不能使用同一個參數完成。
發明概述因此,本發明的目的在于獲得一個基于傅立葉變換,從一個較長的、遷移速率是變化的數據范圍內除去噪音從而能夠精確測序的方法。
與本發明相對應的測序方法參照
圖1描述如下。
本發明涉及核酸的序列測定,即對核酸片段樣品進行電泳并基于檢測的數據測定堿基序列,包括以下步驟(A)步驟(S1,S2)是指利用已設定的峰間距參數,對可檢測數據前部特定的N個點的數據通過傅立葉變換來進行波形定型。
(B)步驟(S3)是指對位于此N個點數據前部的P個點(P<N)的數據進行堿基序列測定。
(C)步驟(S4)是指從測序結果獲得峰間距。
(D)步驟(S5,S6)是指以已測序的最后一個數據向前L(L<M)個點的位置為起點,用已獲得的峰間距參數對從該起點往后的N個點數據通過傅立葉變換來進行波形定型。然后,(E)步驟(S7)是指對于經歷第二次或更后的波形定型的N個點數據,取位于其中部M個點(M<N)的數據進行堿基序列測定,這些數據與前一個步驟中的測序數據相銜接。
步驟(E)→(C)→(D)重復進行,直到數據消失,或者盡管由于信號的衰減或數據的異常而有數據存在,但已不需要進行分析。
術語“點”代表在電泳的檢測位置根據設置的時間間隔進行掃描所俘獲的數據,而點的數目與遷移時間相對應。
N個點寬度的傅立葉變換以及包括在此N個點內部的寬度為P或M個點的序列測定,是應用峰間距(遷移速率)作為參數的完全獨立的過程,并不依賴于全部數據的數目。
在進行寬度為N個點的傅立葉變換之前所獲得的峰間距(遷移速率)是非常有用途的,可以為過濾函數和測序反應提供合適的參數,從而提高測序的精度。
根據本發明,通過已獲得的峰間距參數對特定點的檢測數據應用傅立葉變換進行波形定型,從而在已進行波形定型的數據的基礎上測定堿基序列,由于與先前進行的波形定型在范圍上有部分重疊,從而改進了處理過程。一般來說,測序后被分析的(定型的)波形對測序也是必要的。而在本發明中基本上假定被分析的波形是不連續的,局部的點以重疊的方式有規律地進行傅立葉變換,從而可簡單地通過連接已測序的部分,方便地獲得被分析的波形。
當對全部數據均進行傅立葉變換時,由于氣泡或污染的影響而出現的不連續部分的數據,可能會對正常部分的數據造成不良影響。但根據本發明,在到達不連續部分前不會造成影響。
另外,傅立葉變換的寬度和測序的寬度是固定的,互相獨立的,但當增加新的規則或處理時,可達到高的靈活性。
通過下面有關本發明的具體描述,結合附例,本發明前述的以及其它的目標,特征,狀況,優點將更加明顯。
圖2所示的是本發明的一個實施例的處理過程。然后圖3所示的是實施例的處理過程以及電泳所顯示的波形圖表。
優選實施例的描述通過傅立葉變換,FFT處理被用來進行波形定型。在此情況下,FFT處理的寬度(數據數目)固定在2n個點上,用來對經過處理的、位于其中央的2(n-1)個點進行測序,從測序結果獲得峰間距(遷移速率),從后半部分的2(n-1)個點的位置起始,再次在寬度為2n個點上進行FFT處理。重復處理直到最后的數據。
參照圖2和圖3,本發明的一個實施例描述如下。
根據本實施例,FFT處理應用在N=2(n=8)=256個點上。
①獲得峰間距的初值,該初值是預先設定的。
②從前部對N=256個點進行FFT處理。FFT處理是通過以下程序進行的傅立葉變換用步驟①中的峰間距參數進行過濾反向傅立葉變換。
③用步驟①中的峰間距參數從前部對P=192個點進行測序。
④從測序結果獲得峰間距。
⑤以已測序范圍末端向前L(=2(n-2))=64個點的位置為起點,對其后的N=256個點進行FFT處理。如果此時在該點處無法獲得256個點的數據,則停止處理。FFT處理是通過以下程序進行的傅立葉變換用步驟④中的峰間距參數進行過濾反向傅立葉變換。
⑥使用步驟④中的峰間距參數,從前部第L=64位的點起始,對向后的M(=2(n-1))=128個點進行測序。
⑦返回步驟④。
在本實施例中,雖然由于FFT處理而使傅立葉變換的寬度(數據數目)固定在2n個點上,但傅立葉變換的寬度N,測序的寬度P,M及返回以進行下一次傅立葉變換的寬度L是不受數值2x所限的,可以選擇那些滿足關系N>M>L和N>P>L的整數。
雖然已經詳細地描述和圖示了本發明,但應清楚理解這僅僅是作為圖示和范例,而不是作為限制因素,本發明限定的要旨與范圍僅如所附的要求所述。
權利要求
1.一種測定核酸堿基序列的方法,即對核酸片段樣品進行電泳并基于檢測的數據進行堿基序列測定,包括下列步驟(A)用已設定的峰間距參數,從檢測數據前部開始,對一定數目的N個點的數據通過傅立葉變換進行波形定型;(B)對位于N個點數據前部的P個點(P<N)數據的進行堿基序列測定;(C)從測序結果獲得峰間距;(D)用已獲得的峰間距作為參數,以已測序的最后一個數據向前L個點(L<M)的位置為起點,對其后N個點的數據通過傅立葉變換進行波形定型;然后(E)對于經歷第二次或更后的波形定型的N個點數據,對位于其中部M個點(M<N)的數據的堿基序列進行測定,這些數據與前一個步驟中的測序數據相銜接,其中步驟(E)→(C)→(D)重復進行直到數據消失或盡管存在數據,但不需要進行分析為止。
2.按照權利要求1所述的測定核酸堿基序列的方法,其中FFT處理是通過傅立葉變換來進行波形定型的。
3.按照權利要求2所述的測定核酸堿基序列的方法,假設N等于2n,M等于2(n-1)以及L等于2(n-2)。
全文摘要
用已設好的峰間距參數,對位于已檢測數據前部的N個點的數據通過傅立葉變換進行波形定型(S1,S2),對位于N個點數據前部的M個點(M<N)的數據進行堿基序列測定(S3),從測序結果獲得峰間距(S4)。用已獲得的峰間距作為參數,以已測序的M個點中最后一個數據向前L個點(L<M)的位置為起點,對其后N個點的數據通過傅立葉變換進行波形定型,此后,序列測定,峰間距的計算和波形定型是同樣重復進行的。這樣,從一個遷移速率變化的數據范圍中,基于傅立葉變換除去噪音,從而精確測定堿基序列。
文檔編號C12N15/09GK1363688SQ01140309
公開日2002年8月14日 申請日期2001年12月5日 優先權日2001年1月5日
發明者狹間一 申請人:株式會社島津制作所