專利名稱:一種推斷未知來源個體漢、藏、維群體來源的方法和系統的制作方法
技術領域:
本發明涉及一種推斷未知來源個體來源的方法和系統,尤其涉及一種推斷未知來源個體漢、藏、維群體來源的方法和系統。
背景技術:
隨著各方面對司法訴訟活動的科學性、客觀性以及準確性要求的不斷提高,物證鑒定領域不斷發展,要求更為精確的分析手段來對案件中檢材的個體來源進行確定,DNA分析由于其檢驗結果精確,成為物證鑒定領域的重要技術手段。當前法醫DNA分析通常是對現場生物物證,例如血液、毛發、煙蒂、精斑等,進行常染色體或Y染色體串聯重復序列(STR)檢測,或者進行線粒體測序和分析。將分型結果輸入全國DNA數據庫或者與重點嫌疑人的DNA檢驗結果進行比對,如果有比中結果,則案件通常會被認為已偵破。然而,由于中國人口眾多,現有的DNA數據庫只存儲了占總人口極少比例的重點人群的DNA數據,當沒有數據比中時,更多需要通過外圍走訪摸排工作,雖可利用Y-STR結果進行家系排查,但卻耗費大量的人力、物力和財力,無異于“大海撈針”。同時伴隨國家、區域間的人員流動加大,涉外、反恐、跨區域流動作案等復雜案件不斷增多,案件偵查的難度日益加大。我國法醫DNA領域經過近三十年的發展,取得了包括國產化DNA試劑在內的大量的研究成果,相關技術已成為公安辦案實踐中的重要科技支撐。但是,目前DNA檢驗對公安業務的作用主要集中在提供證據方面,而在提供主動偵查線索方面的作用并沒有得到充分發揮。對于既無目標嫌疑人,又無其它線索的案件,偵查往往陷入被動狀態。事實上,人類基因組中蘊含著大量的遺傳信息,如果能夠從法醫應用角度深入挖掘,就有可能獲得人的種族地域、外形體貌等特征信息,而這些信息有可能成為扭轉案件偵查方向、引導案件偵查的重要線索。綜合分析目前國內外的研究情況,國外在DNA種族推斷方面的研究相對較多,并且開始嘗試法醫學應用,但是其研究成果更適用于西方人種,不適用于東亞尤其是我國人群的區分。國內雖然也有大量的針對少數民族的遺傳結構研究,但缺乏針對法醫學應用的研究。國內研究者以STR、Y-SNP、線粒體SNP等遺傳標記對部分少數民族的DNA多態性和遺傳結構等進行了研究。如:針對東亞人群以及維吾爾族人群的群體遺傳結構的研究;針對藏族人群的血紅蛋白濃度調節和對高海拔的適應機制等的相關研究。而目前均沒有針對中國漢、藏、維吾爾族人群為對象的研究。因此,如何開發一種系統或方法能夠推斷該個體的漢、藏、維吾爾族人群來源,為案件提供更多便于主動偵查的線索成為有待解決的問題
發明內容
本發明提供了一種推斷未知來源個體漢、藏、維群體來源的方法,通過確定未知來源個體94個漢、藏、維群體特異性位點的基因型,進一步對各基因型在漢、藏、維群體中的匹配概率值大小進行分析,實現對未知來源個體的漢、藏、維群體來源推斷。本發明還提供一種SNP檢測復合檢測體系,通過該體系可以實現對未知來源個體針對上述94個漢、藏、維群體特異性位點基因型的準確分型,為進一步推斷未知來源個體漢、藏、維來源提供可靠數據。本發明還提供了一種推斷未知來源個體漢、藏、維群體來源的系統,通過該系統可以高準確率實現對未知來源個體的漢族、藏族、維群體來源推斷。本發明提供的一種推斷未知來源個體漢、藏、維群體來源的方法,該方法包括:檢測未知來源個體的DNA獲得其94個漢、藏、維群體特異性位點的基因型;獲得所述未知來源個體的各特異性位點分別在漢、藏、維群體中的基因型頻率;將所述各特異性位點的基因型頻率相乘得到94個特異性位點的分別在漢、藏、維群體中的匹配概率值;所述匹配概率值最高的群體為未知來源個體的來源群體,所述94個漢、藏、維群體特異性位點為:rsl 1652805、rs37369、rsl3419896、rs9522149、 rs2024566、 rsl871428、 rs4891825、 rsll725412、 rs2899826、 rs4984913、rs4908343、rsl471211、rs4717865、rsl92655、rs4741658、rs6979076、rsl2075、rs3785181、rsl994859、rsl2913832、rs7238445、rsl29014504、rs3915736、rs6010138、rs855791、rs5768007、rs9319336、rs2247445、rs2835370、rs2070586, rs647325、rs2532060、rs316598、rs4953388、rs6998293、rs6422347、rs7416743、rs4719711、rsl325502、rsl407434、rs385194、rs228918、rs842639、rs6520015、rsl2682455、rsll064983、rsl800414、rs4463276、rs3943253、rs2001907, rs4458655、rs961154、rs731257、rs9530435、 rsl0491265 、 rs9383760、 rsl491238、 rsl7582830、 rsll676473、 rs7803075、rsl471939、 rsl0839880、 rsl040404、 rs7554936、 rs6451722、 rsl0514802、 rs39883、rs7844723、rs7589621、rsl0512572、rs2564118、rs7583392、rs7997709、rs2306040、rsl569175、rsl2629908、rs3118378、rs7421394、rsl0002268、rsl40880U rsl513181、rs798443、 rsl2657828、 rs3907047、 rs4454698、 rs4142654、 rs2033111、 rs3805322、rs7745461、rsl0204096、rs818386、rs6548616、rsl0510228、rs9845457。在本發明的方案中,所述94個漢、藏、維群體特異性位點是申請人通過對漢族、藏族和維族群體的生活環境、種族起源等進行綜合分析,考察各地區民族人口的表型特征差異,包括外形特征,生理指標等,針對這些差異進行文獻和網絡數據庫調研,在已有研究的基礎上獲得的特異性SNPs位點。進一步的,所述未知來源個體的94個漢、藏、維群體特異性位點的基因型通過DNA測序獲得。進一步的,所述未知來源個體的94個漢、藏、維群體特異性位點的基因型通過SNP檢測復合檢測體系獲得,所述體系包括94個SNP位點,還包括擴增引物組、微測序引物組以及通用芯片;所述擴增引物組由與所述94個SNP位點--對應的94對擴增引物組成,每對擴
增引物能擴增待檢測DNA上包括其相應的SNP位點的突變型或野生型堿基在內的核苷酸序列;所述微測序引物組由與所述94個SNP位點--對應的94條微測序引物組成,每條微測序引物的5 ’端連有標簽序列能與所述通用芯片的標簽序列互補,3 ’端包括與待檢測DNA上其相應的SNP位點之前的核苷酸序列互補的序列。進一步的,所述擴增引物組為序列表中SEQ ID N0.1至SEQ ID N0.188的核苷酸序列;所述微測序引物組為序列表中SEQ ID N0.189至SEQ ID N0.282的核苷酸序列。進一步的,所述微測序引物5’端連有的標簽序列分別為序列表中SEQ ID N0.189至SEQ ID N0.282的各條核苷酸序列的自5’末端的第I至20位的脫氧核苷酸。進一步的,所述通用芯片為:微測序反應通用芯片、固相微測序反應芯片或連接酶反應通用芯片。本發明進一步提供了一種SNP檢測復合檢測體系,所述體系包括94個SNP位點,擴增引物組、微測序引物組以及通用芯片;所述擴增引物組由與所述94個SNP位點——對應的94對擴增引物組成,每對擴增引物能擴增待檢測DNA上包括其相應的SNP位點的突變型或野生型堿基在內的核苷酸序列;所述微測序引物組由與所述94個SNP位點--對應的94條微測序引物組成,每
條微測序引物的5 ’端連有標簽序列能與所 述通用芯片的標簽序列互補,3 ’端包括與待檢測DNA上其相應的SNP位點之前的核苷酸序列互補的序列,所述94個漢、藏、維群體特異性位點為:rsll652805、rs37369、rsl3419896、rs9522149、rs2024566、rsl871428、rs4891825、rsll725412、 rs2899826、 rs4984913、 rs4908343、 rsl471211、 rs4717865、 rsl92655、rs4741658、rs6979076、rsl2075、rs3785181、rsl994859、rsl2913832、rs7238445、rsl29014504、rs3915736、rs6010138、rs855791、rs5768007、rs9319336、rs2247445、rs2835370、rs2070586, rs647325、rs2532060、rs316598、rs4953388、rs6998293、rs6422347、rs7416743、rs4719711、rsl325502、rsl407434、rs385194、rs228918、rs842639、rs6520015、rsl2682455、rsll064983、rsl800414、rs4463276、rs3943253、rs2001907、rs4458655、rs961154、rs731257、rs9530435、rsl0491265、rs9383760、rsl491238、rsl7582830、rsll676473、rs7803075、rs 1471939、rsl0839880、rsl040404、rs7554936、rs6451722、rsl0514802、rs39883、rs7844723、rs7589621、rsl0512572、rs2564118、rs7583392、 rs7997709、 rs2306040、 rsl569175、 rsl2629908、 rs3118378、 rs7421394、rsl0002268、rsl408801, rsl513181、rs798443、rsl2657828、rs3907047、rs4454698、rs4142654、rs2033111、rs3805322、rs7745461、rsl0204096、rs818386、rs6548616、rsl0510228、rs9845457。進一步的,所述擴增引物組為序列表中SEQ ID N0.1至SEQ ID N0.188的核苷酸序列;所述微測序引物組為序列表中SEQ ID N0.189至SEQ ID N0.282的核苷酸序列。進一步的,所述微測序引物5’端連有的標簽序列分別為序列表中SEQ ID N0.189至SEQ ID N0.282的各條核苷酸序列的自5’末端的第I至20位的脫氧核苷酸。進一步的,所述通用芯片為:微測序反應通用芯片、固相微測序反應芯片或連接酶反應通用芯片。本發明還提供了一種推斷未知來源個體漢、藏、維群體來源的系統,所述系統包括所述的SNP復合檢測體系、比較體系和推斷體系,所述SNP復合檢測體系用于獲得未知來源個體的所述各特異性位點的基因型;
所述比較體系用于獲得所述未知來源個體的各特異性位點分別在漢、藏、維群體中的基因型頻率,并將所述各特異性位點的基因型頻率相乘獲得的94個SNP位點在漢、藏、維群體中的匹配概率值進行比較;所述推斷體系用于根據比較結果推斷未知來源個體漢、藏、維群體來源,匹配概率值最高的群體為未知來源個體的來源群體。進一步的,本發明利用所述SNP復合檢測體系進行94個漢、藏、維群體特異性位點的基因分型的方法,包括:1)提取待檢測個體的DNA作為模板;2)使用所述擴增引物組對提取的DNA模板進行多重PCR擴增反應;3)將上述擴增得到的產物使用所述微測序引物組進行引物延伸反應,所述引物延伸反應中ddNTP為熒光標記的ddNTP ;4)將引物延伸反應的產物和通用芯片進行雜交,根據芯片雜交結果確定94個漢、藏、維群體特異性位點的基因型。經本發明試驗證明,利用所篩選的94個SNP位點,可以實現對未知來源個體的漢、藏、維群體來源的推斷(推斷也可以稱為判定或確定)。
·
在本發明的方案中,所述94個SNP位點信息如表I所示:表權利要求
1.一種推斷未知來源個體漢、藏、維群體來源的方法,該方法包括: 檢測未知來源個體的DNA獲得其94個漢、藏、維群體特異性位點的基因型; 獲得所述未知來源個體的各特異性位點分別在漢、藏、維群體中的基因型頻率; 將所述各特異性位點的基因型頻率相乘得到94個特異性位點的分別在漢、藏、維群體中的匹配概率值; 所述匹配概率值最高的群體為未知來源個體的來源群體, 所述94個漢、藏、維群體特異性位點為:rsl 1652805、rs37369、rsl3419896、rs9522149、 rs2024566、 rsl871428、 rs4891825、 rsll725412、 rs2899826、 rs4984913、rs4908343、rsl471211、rs4717865、rsl92655、rs4741658、rs6979076、rsl2075、rs3785181、rsl994859、 rsl2913832、 rs7238445、 rsl29014504、 rs3915736、 rs6010138、 rs855791、rs5768007、rs9319336、rs2247445、rs2835370、rs2070586, rs647325、rs2532060、rs316598、rs4953388、rs6998293、rs6422347、rs7416743、rs4719711、rsl325502、rsl407434、rs385194、rs228918、rs842639、rs6520015、rsl2682455、rsll064983、rsl800414, rs4463276、rs3943253、rs2001907, rs4458655、rs961154、rs731257、rs9530435、rsl0491265、rs9383760、rsl491238、rsl7582830、rsll676473、rs7803075、rsl471939、rsl0839880、rsl040404、rs7554936、rs6451722、rsl0514802、rs39883、rs7844723、 rs7589621、 rsl0512572、 rs2564118、 rs7583392、 rs7997709、 rs2306040、rsl569175、rsl2629908、rs3118378、rs7421394、rsl0002268、rsl40880U rsl513181、rs798443、 rsl2657828、 rs3907047、 rs4454698、 rs4142654、 rs203311U rs3805322、rs7745461、rsl0204096、rs818386、rs6548616、rsl0510228、rs9845457。
2.根據權利要求1所述的方法,所述未知來源個體的94個漢、藏、維群體特異性位點的基因型通過DNA測序獲得。
3.根據權利要求1所述的方法,所述未知來源個體的94個漢、藏、維群體特異性位點的基因型通過SNP檢測復合檢測體系獲得,所述體系包括94個SNP位點,還包括擴增引物組、微測序引物組以及通用芯片; 所述擴增引物組由與所述94個SNP位點--對應的94對擴增引物組成,每對擴增弓I物能擴增待檢測DNA上包括其相應的SNP位點的突變型或野生型堿基在內的核苷酸序列; 所述微測序引物組由與所述94個SNP位點--對應的94條微測序引物組成,每條微測序引物的5’端連有標簽序列能與所述通用芯片的標簽序列互補,3’端包括與待檢測DNA上其相應的SNP位點之前的核苷酸序列互補的序列。
4.根據權利要求3所述的方法,所述擴增引物組為序列表中SEQID N0.1至SEQ IDN0.188的核苷酸序列;所述微測序引物組為序列表中SEQ ID N0.189至SEQ ID N0.282的核苷酸序列。
5.根據權利要求3所述的方法,其特征在于,所述微測序引物5’端連有的標簽序列分別為序列表中SEQ ID N0.189至SEQ ID N0.282的各條核苷酸序列的自5’末端的第I至20位的脫氧核苷酸。
6.根據權利要求1-5任一項所述的方法,其特征在于,所述通用芯片為:微測序反應通用芯片、固相微測序反應芯片或連接酶反應通用芯片。
7.—種SNP檢測復合檢測體系,所述體系包括94個SNP位點,擴增引物組、微測序引物組以及通用芯片;所述擴增引物組由與所述94個SNP位點--對應的94對擴增引物組成,每對擴增弓I物能擴增待檢測DNA上包括其相應的SNP位點的突變型或野生型堿基在內的核苷酸序列; 所述微測序引物組由與所述94個SNP位點--對應的94條微測序引物組成,每條微測序引物的5’端連有標簽序列能與所述通用芯片的標簽序列互補,3’端包括與待檢測DNA上其相應的SNP位點之前的核苷酸序列互補的序列,所述94個漢、藏、維群體特異性位點為:rsll652805、rs37369、rsl3419896、rs9522149、rs2024566、rsl871428、rs4891825、rsll725412、 rs2899826、 rs4984913、 rs4908343、 rsl471211、 rs4717865、 rsl92655、rs4741658、rs6979076、rsl2075、rs3785181、rsl994859、rsl2913832、rs7238445、rsl29014504、rs3915736、rs6010138、rs855791、rs5768007、rs9319336、rs2247445、rs2835370、rs2070586, rs647325、rs2532060, rs316598、rs4953388、rs6998293、rs6422347、rs7416743、rs4719711、rsl325502、rsl407434、rs385194、rs228918、rs842639、rs6520015、rsl2682455、rsll064983、rsl800414、rs4463276、rs3943253、rs2001907、rs4458655、rs961154、rs731257、rs9530435、rsl0491265、rs9383760、rsl491238、rsl7582830、rsll676473、rs7803075、rsl471939、rsl0839880、rsl040404、rs7554936、rs6451722、 rsl0514802、 rs39883、 rs7844723、 rs7589621、 rsl0512572、 rs2564118、rs7583392、 rs7997709、 rs2306040、 rsl569175、 rsl2629908、 rs3118378、 rs7421394、rsl0002268、rsl408801、rsl513181、rs798443、rsl2657828、rs3907047、rs4454698、rs4142654、 rs203311U rs3805322、 rs7745461、 rsl0204096, rs818386、 rs6548616、rsl0510228、rs9845457。
8.根據權利要求7所述的SNP復合檢測體系,其特征在于,所述擴增引物組為序列表中SEQ ID N0.1至SEQ ID N0.188的核苷酸序列;所述微測序引物組為序列表中SEQ IDN0.189至SEQ ID N0.28 2的核苷酸序列。
9.根據權利要求7所述的SNP復合檢測體系,其特征在于,所述微測序引物5’端連有的標簽序列分別為序列表中SEQ ID N0.189至SEQ ID N0.282的各條核苷酸序列的自5’末端的第I至20位的脫氧核苷酸。
10.根據權利要求7-9任一項所述的SNP復合檢測體系,其特征在于,所述通用芯片為:微測序反應通用芯片、固相微測序反應芯片或連接酶反應通用芯片。
11.一種用于推斷未知來源個體漢、藏、維群體來源的系統,所述系統包括權利要求7-10任一項所述的SNP復合檢測體系、比較體系和推斷體系, 所述SNP復合檢測體系用于獲得未知來源個體的所述各特異性位點的基因型; 所述比較體系用于獲得所述未知來源個體的各特異性位點分別在漢、藏、維群體中的基因型頻率,并將所述各特異性位點的基因型頻率相乘獲得的94個SNP位點在漢、藏、維群體中的匹配概率值進行比較; 所述推斷體系用于根據比較結果推斷未知來源個體漢、藏、維群體來源,匹配概率值最高的群體為未知來源個體的來源群體。
全文摘要
本發明提供一種推斷未知來源個體漢、藏、維群體來源的方法和系統。該方法包括通過檢測未知來源個體的DNA獲得其94個漢、藏、維群體特異性位點的基因型;獲得未知來源個體的各特異性位點分別在漢、藏、維群體中的基因型頻率;將所述各特異性位點的基因型頻率相乘得到94個特異性位點的分別在漢、藏、維群體中的匹配概率值;匹配概率值最高的群體為未知來源個體的來源群體。本發明的方案可以高準確率實現對于漢族、藏族、維群體來源推斷。
文檔編號C12Q1/68GK103146820SQ20131005661
公開日2013年6月12日 申請日期2013年2月22日 優先權日2013年2月22日
發明者李彩霞, 魏以梁, 胡蘭, 季安全, 賈竟, 李萬水 申請人:公安部物證鑒定中心