專利名稱::Chr8q24.21上的變異造成癌癥風險的制作方法CHR8Q24.21上的變異造成癌癥風險相關申請本申請與2005年5月18日提交的美國臨時專利申請No.60/682,147和2006年4月28日提交的美國臨時專利申請No.60/795,768有關。上述申請的全部描述在此引為參考。發明背景癌癥,惡性細胞的不受控制的生長,是現代醫學時代的主要健康難題,在發達國家中是主要死因之一。在美國,四分之一的死亡是由癌癥引起的(Jemal,A.等,C4C羅e".C//w.52:23-47(2002))。在過去的幾十年間,前列腺癌的發生率急劇上升,現在,在美國和西歐,前列腺癌是主要的死因(Peschel,R.E.和J.W.Colberg,丄a"c"(233-41(2003);Nelson,W.G.等,TV.J.Mec/.34外":366-81(2003))。在工業化國家,前列腺癌是男性中最頻繁診斷出的非皮膚惡性腫瘤,僅在美國,八個男性中就有一個在其一生中將發展出前列腺癌(Simard,J.等,fW簡W,"3問:2029-40(2002))。盡管環境因素例如飲食因素和與生活方式有關的因素對前列腺癌的風險有貢獻,遺傳因素也已經被顯示出扮演了重要角色。事實上,陽性家族史是前列腺癌最強的流行病學風險因素之一,在同卵雙胞胎中比較前列腺癌的一致發生的雙胞胎研究,也始終表明在前列腺癌的風險中比在任何其它類型的癌癥的風險中存在更強的遺傳成分(Nelson,W.G.等,tV.五"g/.Af^/.345Y力:366-81(2003);LichtensteinP.等,AA.五wg/.J.W3f2力78-85(2000))。此外,在關于冰島從1955年到2003年所有診斷出的癌癥病例的家族性的全國范圍研究中,在前列腺癌病例的第一到第五級親屬中觀察到了增加的前列腺癌風險(Amundadottir等,P丄oSMe^d"e/f":e65(2004))。由親屬間的增加的風險所顯示出的這種疾病的遺傳基礎,進一步得到了在特定人群中進行的前列腺癌研究的支持例如非裔美國人有最高的前列腺癌發生率和由此疾病引起的死亡率,與歐裔美國人相比,他們有1.6倍可能性發展出前列腺癌,2.4被可能性死于該疾病(Ries,L.A.G.等,AW/尸"Z).99-柳9(1999))。前列腺癌影響男性,預期壽命平均減少40%。如果檢測得早,在轉移和局部擴散到囊之外以前,前列腺癌可以被治愈(例如使用外科手術)。但是,如果在從前列腺擴散和轉移之后被診斷,前列腺癌典型來說是致死的疾病,治愈率低。盡管基于前列腺特異性抗原(PSA)的篩選方法對前列腺癌的早期診斷有幫助,但它的靈敏度和特異性都不高(Punglia等,A^wg〃Mec/.3萍」:335-42(2003))。這意味著這種測試伴隨著高百分率的假陰性和假陽性診斷。結果是許多情況下漏檢了癌癥,或對沒有癌癥的人進行了不必需的進一步活組織檢査。多達65%到85%的患前列腺癌個體(依賴于年齡)的PSA值小于或等于4.0ng/mL,該值一般被用作正常PSA水平的上限(Punglia等,WJ.臉d.J所力:335-42(2003》Cookston,M.S.,C騰erCow加/柳133-40(2001);Thompson,LM.等,TV£"g/.丄Mo/.350:2239-46(2004))。那些具有低PSA水平的癌癥中的很大一部分被劃分為Gleason7級或以上,這是侵襲性前列腺癌的度量。W。除了上述的靈敏度問題之外,PSA測試也有特異性和預測預后的難題。在沒有前列腺癌的人中PSA水平可能是異常的。例如,良性前列腺肥大(BPH)是PSA測試假陽性的一個常見原因。此外,多種非癌癥的病癥可能提高血清PSA水平,包括尿潴留、前列腺炎、激烈的前列腺按摩和射精。W。在陽性PSA水平的病人中,如果腫瘤太小而不能通過超聲看見,隨后的使用活組織針檢來證實前列腺癌將是困難的。一般來說會取多個隨機樣品,但是由于僅取樣少量組織,前列腺癌診斷可能被遺漏。數字式直腸檢査(DRE)也會遺漏許多癌癥,因為只檢查前列腺的后葉。由于早期癌癥是不可觸知的,通過DRE檢測的癌癥可能已經擴散到前列腺之外了(MistryKJ.,Fam.戶rad./6(%):95-101(2003))。因此,對于能夠便利前列腺癌的早期檢測和預后、以及幫助預防性或治療性治療該疾病的改進的診斷方法,顯然有極大的需求。此外,也需要開發工具,以更好地鑒別更可能患有侵襲性形式的前列腺癌的病人與更可能患有更良性形式的、仍然位于前列腺之內、因此對于發病率和死亡率沒有顯著貢獻的前列腺癌的病人。這將幫助沒有明顯危險的病人避免侵入性的和昂貴的步驟。乳腺癌在美國和全世界是女性的重要健康問題。盡管在該疾病的檢測和治療方面已經取得了許多進展,乳腺癌仍然是女性中與癌癥相關的第二大致死原因,在美國每年侵襲超過180,000名女性。對于北美女性來說,在一生中患乳腺癌的幾率現在是八分之一。目前沒有普遍成功的治療或預防乳腺癌的方法可用。目前,乳腺癌的管理依賴于早期診斷(例如通過常規的乳腺篩選步驟)和侵襲性治療的結合,后者可以包含一種或多種不同的治療,例如外科手術、放射性治療、化學治療和激素治療。具體的乳腺癌的治療過程通常根據各種預后參數進行選擇,包括分析特定的腫瘤標記物,參見例如Porter-Jordan禾口Lippman,B-ec^5:73-100(1994)。盡管BRCA1和BRCA2的發現是鑒定參與乳腺癌的關鍵遺傳因素的重要步驟,但現在已經清楚BRCA1和BRCA2中的突變只能解釋一部分對乳腺癌的遺傳易感性(Nathanson,K丄.等,Mo/./0(7力715-720(2001);AnglicanBreastCancerStudyGroup.,CawcerS3(76^:1301-08(2000);以及SyrjakoskiK.等,丄A^/.Ca"cer/"w.1529-31(2000))。盡管對乳腺癌的治療方法進行了相當多的研究,乳腺癌仍然難以有效診斷和治療,在乳腺癌病人中觀察到的高死亡率表明在該疾病的診斷、治療和預防中的改進是需要的。關于冰島從1955年到2003年所有診斷出的癌癥病例的家族性的全國范圍研究中,deCODE在乳腺癌病例的第一到第五級親屬中證實了增加的乳腺癌風險(Amundadottir等,尸丄oS"Med.柳e65(2004);LichtensteinP.等,TV.五"g/.M/.WV":78-S5(2000)),其中作者顯示出在接近45,000對雙胞胎人群中測試的所有癌癥中,乳腺癌是具有最高遺傳率的癌癥之一。在世界范圍內,肺癌比任何其它形式的癌癥引起了更多的癌癥死亡(Goodman,G.E.,TAorax57:994-999(2002))。在美國,肺癌在男性和女性中都是癌癥死亡的主要原因。在2002年,肺癌的死亡率估計為134,900例,超過乳腺癌、前列腺癌和結腸癌的總和。W。在所有歐洲l國家,肺癌也是癌癥死亡的主導因素,在發展中國家肺癌也在快速增加。盡管環境因素例如生活方式因素(例如吸煙)和飲食因素在肺癌中扮演了重要角色,遺傳因素也對該疾病有貢獻。例如,一組負責致癌物活化、降解和隨后的DNA修復的酶已經被發現與肺癌的易感性有關。W。此外,deCODE的遺傳學家通過分析在48年間在冰島診斷出的所有肺癌病例,已經顯示出核心家族之外的家族成員的增加的風險。該增加的風險不能完全用吸煙解釋,表明遺傳變異可能使某些個體易患肺癌(Jo勵n等,,間:2977-83(2004);Amundadottir等,仰:e65(2004))。所有肺癌病人的五年存活率,不論診斷時疾病處于什么階段,僅為13%。這與疾病仍然位于局部時檢測到的病例中46%的五年存活率形成對比。但是,僅有16%的肺癌是在疾病擴散前被發現。早期檢測是困難的,因為臨床癥狀直到疾病達到高級階段才能觀察到。目前,使用胸部x-射線、分析痰液中包含的細胞的類型以及支氣管的光纖檢查來幫助診斷。治療方案由癌癥的類型和階段所決定,包括外科手術、放療和/或化療。盡管對于這種和其它癌癥的治療方法進行了相當多的研究,肺癌仍然難以有效診斷和治療。因此,在本
技術領域:
對檢測和治療這種癌癥的改進的方法有極大的需求。在北美,惡性黑素瘤的發生率比任何其它類型的人類癌癥增加得更快(Armstrong等,C羅e"臟79-^:219-240(1994))。盡管黑素瘤在早期階段被鑒定出時是可治愈的,但這需要在原發腫瘤擴散到遠處位點之前將其檢測并移除。惡性黑素瘤具有極大的轉移傾向,對于常規的癌癥治療方法例如化療和口-照射具有顯著的抗性。一旦轉移發生,預后非常不好。因此,黑素瘤的早期檢測在黑素瘤的治療和控制中是極其重要的。研究已經證實遺傳因素在黑素瘤中扮演了重要角色。基于瑞典和冰島人群的研究報道了在第一級親屬中標準化的發生率是大約2(HemminkiK.,丄/騰".D簡Wo/.",:217-23(2003);Amundadottir等,"oSMd/:e65(2004))。家族性病例趨向于具有較早的發病年齡和較高的多個原發腫瘤的風險,這進一步建議了遺傳因素的參與(參見例如TuckerM.,Oncogene22(20):3042-52(2003))。遺傳和環境風險因素的相互作用可能在黑素瘤中扮演了重要角色。但是,正常的黑素細胞如何轉化成黑素瘤細胞的分子和生物學機制仍然不清楚。顯然,鑒定負責對特定形式的癌癥(例如前列腺癌、乳腺癌、肺癌、黑素瘤)的易感性的標記物和基因是今天腫瘤學所面臨的主要挑戰之一。對于對癌癥具有遺傳易感性的個體進行早期檢測的鑒定方法有需求,以便對于癌癥的早期檢測和治療可以建立起更具有效的篩選和干預方案。癌癥基因也可以揭示出可以被操作的關鍵分子途徑(例如使用小或大分子量的藥物),以及不論特定的癌癥首先被診斷出時是什么癌癥階段,可以產生出更有效的治療方案。發明簡述正如在本文中描述的那樣,染色體8q24.21上的基因座已經被證明在癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)中扮演重要角色。已經發現該基因座中特定DNA片段中的特定標記物和/或遺傳標記物的組合("單倍型")是對特定癌癥易感性的指示。在一個實施方案中,本發明是診斷受試者中對癌癥易感性的方法,包括檢測與LD區塊A有關的標記物或單倍型,其中標記物或單倍型的存在是對癌癥易感性的指示。在特定的實施方案中,本發明是診斷選自前列腺癌、乳腺癌、肺癌和黑素瘤的癌癥的易感性的方法。在某些實施方案中,是癌癥或癌癥易感性的指示的標記物或單倍型,包含至少一種從含有表13中列出的標記物的組中選擇的標記物。在另一個實施方案中,方法包括了檢測含有表13中的至少兩種標記物的單倍型。在一個實施方案中,標記物或單倍型(例如與LD區塊A有關的標記物或單倍型)的存在是對特定治療方式(例如特定的治療藥劑、抗技術藥物、化學治療藥劑、放射性治療)的不同反應率的指示。因此,通過確定受試者是否帶有標記物或單倍型,人們可以確定受試者是否將對用于治療癌癥的特定治療、抗激素藥物和/或放射性療法反應得更好或更壞。在一個實施方案中,標記物或單倍型(例如與LD區塊A有關的標記物或單倍型)的存在是對腫瘤或其前體中Chr8q24.21的體細胞重排(例如擴增、易位、插入和/或缺失中的一或多種)的傾向性的指示。在一個實施方案中,標記物或單倍型包含一個或多個與Chr8q24.21相關的標記物,它們與從含有表13中列出的標記物的組中選出的一個或多個標記物處于連鎖不平衡(定義為相關系數的平方,r2,大于0.2)。在一個實施方案中,本發明是診斷對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的方法,包括檢測與Chr8q24.21有關的標記物或單倍型,其中標記物或單倍型的存在是對癌癥易感性的指示。在一個實施方案中,本發明是預測受試者中侵襲性前列腺癌的增加的風險(例如Gleason評分7(4+3)級到10級,增加的階段,更壞的結果)的方法,包括檢測與LD區塊A有關的標記物或單倍型,其中標記物或單倍型的存在是侵襲性前列腺癌的增加的風險的指示。在特定的實施方案中,受試者己經被診斷患有前列腺癌,或還沒有被診斷為前列腺癌。在一個實施方案中,標記物或單倍型具有大于1的相對風險,即標記物或單倍型賦予了增加的癌癥風險(標記物或單倍型是有風險的)。在另一個實施方案中,標記物或單倍型具有小于1的相對風險,即標記物或單倍型賦予了減小的癌癥風險(標記物或單倍型是保護性的)。在一個實施方案中,本發明是用于分析受試者的樣品(例如組織、血液)以檢測對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)的遺傳易感性的試劑盒。這樣的試劑盒包含一種或多種用于檢測與LD區塊A有關的標記物或單倍型的試劑。在具體的實施方案中,這樣的試劑包含了至少一種連續的核苷酸序列,該序列與含有至少一種選自表13中列出的標記物的區域完全互補。在具體的實施方案中,這樣的試劑包含了至少一種連續的核苷酸序列,該序列與含有rs1447295A等位基因或DG8S737-8等位基因的區域完全互補。在一個實施方案中,本發明是用于在受試者中診斷癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)的增加的風險的方法,包括篩選與LD區塊A相關的標記物或單倍型,其中的標記物或單倍型在患有癌癥的受試者中比在不患有癌癥的受試者中更頻繁存在,其中標記物或單倍型的存在增加了受試者患有癌癥的風險。在具體的實施方案中,防線增加了至少大約5%,或者風險的增加被鑒定為至少大約1.2的相對風險。在一個實施方案中,本發明是在受試者中診斷對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)的易感性的方法,包括從受試者獲得核酸樣品并分析核酸樣品中是否存在至少一種標記物或單倍型,其中的標記物或單倍型含有一個或多個從含有表13中列出的標記物的組中選擇的標記物。在本實施方案中,標記物或單倍型的存在是對癌癥易感性的指示。在一個實施方案中,本發明是在受試者中診斷對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)的易感性的方法,包括從受試者獲得核酸樣品并分析核酸樣品中是否存在至少一個與LD區塊A相關的標記物或單倍型,其中標記物或單倍型的存在是對癌癥易感性的指示。在具體的實施方案中,標記物或單倍型含有一個或多個從含有表13中列出的標記物的組中選擇的標記物。在另一個實施方案中,標記物或單倍型具有大于1的相對風險,含有DG8S737-8等位基因或rs1447295A等位基因。在一個實施方案中,本發明是在受試者中診斷對癌癥易感性的方法,包括分析從受試者獲得的核酸樣品中至少一個與LD區塊A有關的標記物或單倍型的存在,其中標記物或單倍型的存在是對癌癥易感性的指示。在具體的實施方案中,標記物或單倍型含有一個或多個從含有表13中列出的標記物的組中選擇的標記物。在另一個實施方案中,標記物或單倍型具有大于1的相對風險,含有DG8S737-8等位基因或rsl447295A等位基因。在另一個實施方案中,受試者是黑人非洲血統。在本發明的一個實施方案中,癌癥選自前列腺癌、乳腺癌、肺癌和黑素瘤。在一個優選實施方案中,癌癥是前列腺癌,標記物或單倍型具有至少1.5的相對風險。在另一個實施方案中,前列腺癌是侵襲性前列腺癌,被定義為組合的Gleason7(4+3)級到10級。在另一個實施方案中,前列腺癌是侵襲性較低的前列腺癌,被定義為組合的Gleason2級到7(3+4)級。在另一個實施方案中,標記物或單倍型的存在是更具侵襲性的前列腺癌和/或更壞的預后的指示。在另一個實施方案中,癌癥是乳腺癌,標記物或單倍型具有至少1.3的相對風險。在另一個實施方案中,癌癥是肺癌,標記物或單倍型具有至少1.3的相對風險。在另一個實施方案中,癌癥是黑素瘤,標記物或單倍型具有至少1.5的相對風險。在另一個實施方案中,黑素瘤是惡性皮膚黑素瘤。在本發明的另一個實施方案中,標記物或單倍型的存在是受試者對特定治療方式的不同反應率的指示。在另一個實施方案中,標記物或單倍型的存在是腫瘤或其前體中Chr8q24.21的體細胞重排的傾向性的指示。在特定的實施方案中,體細胞重排選自擴增、易位、插入和缺失。在本發明的另一個實施方案中,用于診斷對癌癥易感性的標記物或單倍型含有一個或多個與Chr8q24.21相關的標記物,它們與選自表13中列出的標記物的一個或多個標記物處于強烈的連鎖不平衡,正如由(|D'|〉0.8)禾口/或一〉0.2所確定的那樣。在一個實施方案中,一個或多個標記物選自表13中的標記物,含有rs1447295A等位基因或DG8S737-8等位基因。在另一個實施方案中,用于診斷對癌癥易感性的至少一種標記物或單倍型具有小于1的相對風險,并含有rsl2542685等位基因T和rs7814251等位基因C。在另一個實施方案中,至少一種標記物或單倍型含有至少一個表13中顯示的具有小于1的相對風險的標記物。在優選實施方案中,癌癥是前列腺癌。在另一個實施方案中,受試者是黑人非洲血統。在一個實施方案中,本發明涉及分析來自受試者的樣品以檢測對癌癥易感性的試劑盒,其中的試劑盒含有一個或多個用于檢測與LD區塊A相關的標記物或單倍型的試劑。在一個實施方案中,一或多種試劑含有至少一種連續的核苷酸序列,該序列與含有至少一種標記物的區域完全互補,該標記物選自表13中列出的標記物。在一個實施方案中,癌癥是前列腺癌。在優選實施方案中,一或多種試劑含有至少一種連續的核苷酸序列,該序列與含有rsl447295A等位基因或DG8S737-8等位基因的區域完全互補。在具體的實施方案中,受試者是黑人非洲血統。在一個實施方案中,本發明是在受試者中診斷與Chr8q24.21相關的癌癥的方法,包括檢測與Chr8q24.21相關的標記物或單倍型(例如本文描述的標記物或單倍型)的存在,其中標記物或單倍型的存在是與Chr8q24.21相關的癌癥的指示。在具體的實施方案中,與Chr8q24.21相關的癌癥是與Chr8q24.21相關的前列腺癌、與Chr8q24.21相關的乳腺癌、與Chr8q24.21相關的肺癌或與Chr8q24.21相關的黑素瘤。在另一個實施方案中,本發明是通過檢測標記物DG8S737或標記物rs1447295來診斷對前列腺癌易感性、或對前列腺癌(例如侵襲性前列腺癌)增加的風險的方法,其中標記物DG8S737的等位基因-8或標記物rsl447295的等位基因A的存在是對前列腺癌易感性、或對前列腺癌的增加的風險的指示。在另一個實施方案中,本發明通過檢測標記物DG8S737在具有包括非洲血統的血統的人類中來診斷對前列腺癌的易感性,其中標記物DG8S737的等位基因-8的存在是對前列腺癌易感性的指示。附圖簡述根據下面對本發明的優選實施方案的更具體的描述,以及在下面的圖中所進行的描述,本發明的前述的和其它的目標、特點和優點將變得明顯。圖1是染色體8的連鎖掃描圖,描述染色體8q24上的染色體范圍上重要的LOD分數為4.0。圖2描述了使用352微衛星標記物在Chr8q24.21上進行的前列腺癌的單倍型相關性分析。圖3A和3B描述了與前列腺癌相關的單倍型區域中的LD結構(HAPMAP)。等效間隔意味著每個標記物在兩個鄰近的標記物之間以連續的次序以相同的距離顯示(圖3A)。實際位置意味著任何兩個標記物之間的正確間隔(NCBIBuild34)被表示在圖(圖3B)中。圖4描述了冰島人的LD結構。等效間隔意味著每個標記物在兩個鄰近的標記物之間以連續的次序以相同的距離顯示。圖5描述了示意性的對染色體8q24.21的鑒定已知基因作圖。圖6A1-6A31描述了NCBIBuild34(SEQIDNO:1;Build34,hgl6一chr8:1284140007128506000.正(+)鏈)中的從128.414到128.506的基因組DNA序列。圖6中的號碼以及其中包含的表中指示的bp是指在NCBIBuild34的染色體8中的位置。圖7A-7D描述了染色體8q24.21上的區域中前列腺癌的連鎖和群叢(association)結果、標記物密度和LD結構的示意圖。圖7A顯示了使用冰島323個大家庭中的871個前列腺癌病人進行的染色體8q的連鎖掃描結果。圖7B描述了不相關的前列腺癌病例(對照病例組l,n=869)的單一標記物群叢結果,使用了在10Mb區域中分布的358個微衛星和插入缺失(藍色菱形)。圖7C顯示了所有前列腺癌病例(n=1291)的單一標記物群叢結果,紅色方框表示加入到該區域的63個SNPs和12個微衛星的P值,藍色菱形表示已經從7B輸入到該區域中的其它標記物的值。圖7D描述了圖7C的600kb區域的CEUHapMap人群(II期)的兩兩配對的LD,底部的灰色三角形指示了在正文中討論的c-MYC基因和AW183883EST的位置。在右邊提供了r"的標度。黑色豎線代表了微衛星(圖7B)以及用于群叢分析的微衛星和SNPs(圖7C)的密度。圖8描述了HapMap樣品的46個SNPs和DG8S737微衛星的系統發育網絡。圖9A-9C描述了CEU和非裔美國人群中典型的17個SNPs和DG8S737的-8等位基因之間的連鎖不平衡。CEU的17個SNPs和DG8S737的-8等位基因的連鎖不平衡(LD)被顯示在圖9A中,非裔美國人的密西根組的的LD顯示在9B中。這里顯示的是等位基因對之間的D'(左上)和r2(右下)。標記物之間以相等的距離作圖,物理位置在圖9C中給出。標記物的名字顯示在縱軸上,堿基對位置顯示在橫軸上。圖IO是鑒定的AW剪接變異體的示意圖。外顯子被顯示成方框,內含子顯示為線形。轉錄本在Chr8q24上從128,258延伸到128,451Mb。外顯子的長度如下外顯子1:503bp's;外顯子2:343bp's;外顯子3:103bp's;外顯子4:88bp's;外顯子5:371bp's;外顯子6:135bp's;長外顯子6:546bp's;外顯子7:140bp's和外顯子8:246bp's。注意圖沒有按比例畫出。發明詳述包含癌癥病人的人群的擴展的系譜信息與強有力的基因共享方法相結合,對染色體8q24.21上的基因座進行了作圖,該基因座已經被證實在癌癥(例如乳腺癌、前列腺癌、肺癌、黑素瘤)中扮演了重要角色。使用了基因組范圍的標記物組對不同癌癥病人及其親屬進行了基因分型,該標記物組包含了1100個微衛星標記物,平均標記物密度3-4cM。這里顯示了對引起癌癥(例如乳腺癌、前列腺癌、肺癌、黑素瘤)的遺傳位點進行基因組范圍的搜索的結果。與不娜式游艦被游基鵬欽鄉線在過去的幾十年間,前列腺癌的發生率急劇增加。前列腺癌是多種因素引起的疾病,其病因學中有遺傳和環境的成分參與。其特征為不均勻的生長形式,范圍從緩慢生長的腫瘤到非常快速的高度轉移性的病變。盡管遺傳因素是前列腺癌最強的流行病學風險因子之一,對參與該疾病的遺傳決定因子的搜索正在艱難地進行中。研究表明,將參選的遺傳標記物與前列腺癌相聯系比鑒定其它癌癥、例如乳腺癌、卵巢癌和結腸癌的易感性基因更為困難。對于這種增加的困難性提出的幾個原因包括前列腺癌通常在晚年被診斷出來,因此通常難以從超過一代的活的患病個體獲得DNA樣品;在高風險譜系中存在與遺傳和偶發形式之間缺少可分辨的特征有關的擬表型;以及前列腺癌的遺傳異質性和為這種復雜的疾病開發適合的統計傳輸模型所伴隨的困難(Simard,J.等,五油cn',油gj附2029-40(2002))。在基因組上已經進行了多次前列腺癌易感性基因組搜索,并報道了幾個前列腺癌易感性基因座。例如,已經提出HPCl(lq24-q25)、PCAP(lq42-q43)、HCPX(Xq27-q28)、CAPB(lp36)、HPC20(20ql3)、HPC2/ELAC2(17pll)和16q23作為前列腺癌易感性基因座(Simard,J.等,^!^cn.wo/og;;(^):2029-40(2002);Nwosu,V.等,Hwm.Mo/./0卩W:2313-18(2001))。在Smith等進行的基因組搜索中,最有力的連鎖證據位于HPC1,盡管兩點分析也顯示出D4S430上LOD分值〉1.5,在幾個基因座包括Xq27-28上的標記物的LOD分值〉1.0(OstranderE.A.禾口J丄.Stanford,力w.//應.Gewet67:1361-15(2000))。另一個基因組搜索報道了使用常染色體遺傳顯性模型得到染色體10q、12q和14q的兩點LOD分值^1.5,使用遺傳的隱形模型得到染色體lq、8q、10q和16p的兩點LOD分值>1.5。A/。另一個基因組搜索鑒定出在2q、12p、15q、16q和16p上不太明顯連鎖的區域。A/。使用一小組猶他州高風險前列腺癌系譜和一組300個多態性標記物進行的前列腺癌易發性基因座的基因組搜索提供了與染色體17p上的基因座連鎖的證據(Simard.J.等,五"^cr/wo/og;;743(^):2029-40(2002))。在2003年后期,發表了8個新的連鎖分析,描述了顯著的不均一性。報道了11個LOD分值超過2.0的峰,它們之中沒有重疊(參見Actaneconsortium,Schleutker等,Wiklund等,Witte等,Janer等,Xu等,Lange等,Cunningham等;它們所有都出現在《前列腺》(第57巻)Prostate,vol.57(2003)中)。如上所述,涉及前列腺癌的特定基因的鑒定是有挑戰的。已經發現關聯的一個基因是RNASEL,它編碼廣泛表達的潛在酶內切核酸酶,該酶參與干擾素誘導的RNA衰減途徑,據信能夠降解病毒和細胞的RNA,該基因已經被聯系到HPC位點(Carpten,J.等,A^.Ge""30:181-84(2002);Casey,G.等,A^,3V":581-83(2002))。RNASEL中的突變已經與對前列腺癌的增加的易感性相關聯。例如在一個家庭中,4個患有前列腺癌的兄弟在RNASEL上帶有失活突變,而在另一個家庭中6個患有前列腺癌的兄弟中的4個帶有堿基取代,影響了RNASEL的起始甲硫氨酸密碼子。W。另一項研究表明突變的RNASEL等位基因與患有家族性前列腺癌的芬蘭男性和東歐猶太人群中前列腺癌的增加的風險有關(Rokman,A.等,J.Hwm.Ge""70:1299-1304(2002);Rennert,H.等,i^w.77:981-84(2002))。此外,已經提出Ser217Leu基因型占美國65歲以下高加索人中所有偶發性病例的大約9%(Stanford,J丄.,Cfl"cer五pWe""W.SZomflry^^/Vev.7^9」:876-81(2003))。但是,與這些陽性報道相反,某些研究沒能成功檢測到具有失活突變的RNASEL等位基因和前列腺癌之間的任何相關性(Wang,L.等,Jm.//wm.7/:l16-23(2002);Wiklund,F.等,C"m.Omcer70(27):7150-56(2004);Maier,C.等,Ca"cer92(^:1159-64(2005))。位于8p22上的巨噬細胞清除劑受體1(MSR1)基因也已經被鑒定為候選的前列腺癌易感性基因(Xu,J.等,A^.Ge""W:321-25(2002))。在大約3%的患有非遺傳性前列腺癌的男性中檢測到了突變的MSR1等位基因,但是只在0.4%的未患病男性中檢測到。A/。但是,不是所有后續的報道都證實了這些最初的發現(參見例如Lindmark,F.等,5P(7力132-40(2004);Seppala,E.H.等,C/f".Oz"cer9(7力:5252-56(2003);Wang,L.等,淑3柳:128-29(2003);Miller,D.C.等,Ca"ceri仏63(7":34S6-S9(2003))。MSR1為巨噬細胞清除劑受體的亞基編碼,該受體能夠結合多種配體、包括細菌脂多糖和脂胞壁酸、以及血清中的氧化型高密度脂蛋白和低密度脂蛋白(Nelson,W.G.等,W.丄Mec/.3:366-Sl(2003))。17號染色體上的ELAC2基因是第一個被克隆的前列腺癌易感性基因,存在于猶他州的高風險前列腺癌家族中(Tavtigian,S.V.,等,A^.27^:172-80(2001))。在一個系譜中發現了移碼突變(1641InsG)。另外也發現了三個其它的錯義變化Ser217Leu、Ala541Thr和Arg781His與前列腺癌風險的增加有關。在不是在前列腺癌家族史基礎上選擇的組中,帶有Ser217Leu和Ala541Thr的男性中前列腺癌的相對風險被發現是2.37(Rebbeck,T.R.,等,爿m.丄//訓.67^:1014-19(2000))。另一項研究描述了在一個高發病率的前列腺癌家族中的新的終止突變(Glu216X)(Wang,L.,等,Ca"c^A"6"77J:6494-99(2001))。其它的報告還未證實與這三個錯義突變的強烈關聯性,最近的元分析建議與這些突變有關的家族性風險比在最初報告中指出的要更弱一些(Vesprini,D.,等,,/fww.Ge"W.(5Sr":912-11(2001);Shea,P.R.,等,//"m."7(^-":398-400(2002);Suarez,B.K.,等,Oz膨rto.6/(7":4982-84(2001);Severi,G.,等,J.Natl.CancerInst.95(11):818-24(2003);Fujiwara,H.,等,if謂.47(7":641匿48(2002);Camp,NJ.,等,爿w.,Ge"e/.7/附1475-78(2002))。參與雄激素作用的基因(例如雄激素受體(AR)基因、細胞色素P-450cl7(CYP17)基因、以及II型類固醇-5-口-還原酶(SRD5A2)基因)的多態性變異體也已經被顯示與前列腺癌增高的風險有關(Nelson,W.G.等,N.Engl.J.Med.349(4):366-81(2003))。對于編碼雄激素受體的AR來說,幾項遺傳流行病學研究已經顯示出在前列腺癌增加的風險與短的雄激素受體多聚谷氨酰胺重復之間有相關性,但其它的研究沒能檢測出這種相關性。Id。連鎖數據也已經顯示出催化性-類固醇生物合成的關鍵反應的酶CYP17的等位形式與前列腺癌有關(Chang,B.等,Int.J.Cancer95:354-59(2001))。在前列腺中編碼5-口-還原酶主要同工酶、功能是將睪酮轉化為更有力的二氫睪酮的SRD5A2的等位變異體,己經被發現與前列腺癌的增加的風險并與患有前列腺癌的男性的不好的預后有關(Makridakis,N.M.等,丄a"c""4:915-1%(1999);Nam,R.K.等,C/油gy57:199-204(2001))。簡而言之,盡管經過全世界許多研究組的努力,負責前列腺癌風險的主要部分的基因還沒有被鑒定。盡管雙胞胎研究顯示出遺傳因素在前列腺癌中可能是主要的,但僅有少量基因被鑒定出與前列腺癌增加的風險有關,并且這些基因僅占病例中的低百分率。因此,顯然前列腺癌遺傳風險因子中的大部分仍然有待發現。可能這些遺傳風險因子將包括相當大量的低到中度風險遺傳變異體。但是這些低到中度風險遺傳變異體可能負責大部分的前列腺癌,因此,它們的鑒定對于公共衛生來說有極大的好處。此外,還沒有報道過有發表的前列腺癌基因能夠預測出侵襲性前列腺癌比侵襲性較低的前列腺癌的更大的風險。正如本文所述,已經證明染色體8q24.21上的基因座在前列腺癌中扮演重要角色,已經發現在前列腺癌患者中,該基因座中特定的DNA片段中的特定的標記物和/或單倍型出現的頻率比預期在前列腺癌個體中的頻率髙。因此,在本發明的各種實施方案中,使用本文描述的方法鑒定的某些標記物和/或SNPs,可以被用于診斷對前列腺癌的易感性,也可用于診斷對前列腺癌的減少的易感性,或用于鑒定針對前列腺癌的保護性變異體。下面描述的診斷分析方法可以用于鑒定是否存在這些特定的變異體。因此,在一個實施方案中,本發明是診斷對前列腺癌(例如侵襲性的或高Gleason級別的前列腺癌,低侵襲性的或低Gleason級別的前列腺癌)的易感性的方法,包括檢測與LD區塊A相關的標記物或單倍型(例如表13中列出的標記物,具有大于1的RR值,表明標記物與對疾病的易感性/疾病的增加的風險有關,因此是"有風險的"變異體,RR值小于1表明標記物與對疾病的減小的易感性/疾病的減小的風險有關,因此是"保護性"變異體),其中標記物或單倍型的存在是對前列腺癌易感性的指示。在另一個實施方案中,本發明是診斷對前列腺癌(例如侵襲性的或高Gleason級別的前列腺癌,低侵襲性的或低Gleason級別的前列腺癌)易感性、或前列腺癌增加的風險的方法,包括檢測標記物DG8S737或標記物rs1447295,其中標記物DG8S737的等位基因-8或標記物rsl447295的等位基因A的存在是對前列腺癌易感性、或前列腺癌的增加的風險的指示。在另一個實施方案中,本發明在具有包含非洲血統的血統的人類中來診斷對前列腺癌的易感性的方法,包括檢測標記物DG8S737,其中標記物DG8S737的等位基因-8的存在是對前列腺癌易感性或對前列腺癌增加的風險的指示。在具體的實施方案中,與前列腺癌易感性相關的標記物或單倍型具有至少1.5、或至少2.0的相對風險。在另一個實施方案中,前列腺癌是侵襲性前列腺癌,可以通過組合的Gleason分值7(4+3)到10、和/或前列腺癌的高級階段(例如階段2到4)來確定。在另一個實施方案中,前列腺癌是較低侵襲性的前列腺癌,可以通過組合的Gleason分值2到7(3+4)、和/或前列腺癌的早期階段(例如階段1)來確定。在另一個實施方案中,與LD區塊A有關的標記物或單倍型的存在、與患者具有大于4ng/ml的PSA水平相結合,是更具侵襲性前列腺癌和/或更壞的預后的指示。在另一個實施方案中,在具有正常PSA水平(例如低于4ng/ml)的病人中,標記物或單倍型的存在是更具侵襲性前列腺癌和/或更壞的預后的指示。在其它的實施方案中,本發祖是診斷對前列腺癌減少的易感性的方法,包括檢測與LD區塊A相關的標記物或單倍型,其中該標記物或單倍型的存在是對前列腺癌減少的易感性或針對前列腺癌的保護性標記物或單倍型的指示。在某些實施方案中,標記物是表13中列出的標記物、或含有表13中列出的一或多種標記物的單倍型(例如表13中列出的標記物、或含有表13中列出的一或多種標記物的單倍型,其中的標記物具有小于1的RR值,表明標記物與對疾病的減小的易感性/疾病的減小的風險有關,因此是"保護性"變異體;RR值大于1表明標記物與對疾病的增加的易感性/疾病的增加的風險有關,因此是"有風險的"變異體)。在另一個實施方案中,本發明是診斷對前列腺癌的減小的易感性、或前列腺癌減小的風險的方法,包括檢測標記物DG8S737或標記物rs1447295,其中標記物DG8S737的等位基因-8或標記物rsl447295的等位基因C的存在之外的等位基因的存在是對前列腺癌減小的易感性、或前列腺癌的減小的風險(針對前列腺癌具有保護性)的指示。在另一個實施方案中,本發明是在具有包含非洲血統的血統的人類中來診斷對前列腺癌的減小的易感性的方法,包括檢測標記物DG8S737,其中標記物DG8S737的等位基因-8之外的等位基因的存在是對前列腺癌減小的易感性、或前列腺癌的減小的風險(針對前列腺癌具有保護性)的指示。,蘼正如本文所描述的那樣,盡管BRCA1和BRCA2的發現是重要的里程碑,鑒定了涉及乳腺癌的兩個關鍵遺傳因子,但逐漸已經明了BRCA1和BRCA2的突變僅占對乳腺癌的易感性的一部分。據估計,在女性所有的乳腺癌中,僅有5-10%與由常染色體顯性基因例如BRCA1,、BRCA2、p53、pTEN和STK11/LKB1的突變造成的遺傳易感性有關(Mincey,B.A.(9"co/og/W5:466-73(2003))。已經提出染色體8p上的一個遺傳基因座是乳腺癌易感性基因座,這是根據在偶發性乳腺癌中該區域中記錄等位基因喪失的研究提出的(Seitz,S.等,Sr.丄Cfl"cer75:983-91(1997);Kerangueven,F.等,O"cog騰70:1023(1995))。研究也已經提示乳腺癌易感性基因可能位于13q21(Kainu,T.等,/Voc.A^/.^ca《Z7&497:9603-08(2000))。但是,與前列腺癌的情況相似,其它的乳腺癌易感性基因的鑒定很困難。正如本文所描述的那樣,已經證實染色體8q24.21上的位點在乳腺癌中扮演了重要角色,已經發現乳腺癌患者中該基因座中特定DNA片段上特定的標記物和/或單倍型的出現高于預期的乳腺癌患者中的頻率。因此,在一個實施方案中,本發明是診斷對乳腺癌易感性的方法,包括檢測與LD區塊A有關的標記物或單倍型,其中標記物或單倍型的存在是對乳腺癌易感性的指示。在具體的實施方案中,與乳腺癌易感性有關的標記物或單倍型的相對風險為至少1.3。在其它實施方案中,本發明描述了診斷對乳腺癌的減少的易感性的方法,包括檢測與LD區塊A有關的標記物或單倍型,其中標記物或單倍型的存在是對乳腺癌減少的易感性或針對乳腺癌的保護性標記物或單倍型(針對乳腺癌具有保護性)的指示。在具體的實施方案中,與乳腺癌減少的易感性(針對乳腺癌具有保護性)有關的標記物或單倍型具有小于0.75的相對風險。/纖盡管環境、生活方式(例如吸煙)和飲食因素在肺癌中扮演了重要角色,遺傳因素也是重要的。研究顯示,p53和RB/pl6途徑的缺陷對于肺上皮細胞的惡性轉化是重要的(Yokota,J.禾nT.Kohno,Ca"cerS"'95(^」197-204(2004))。其它的基因例如K-ras、PTEN和MYOl8B在肺癌細胞中遺傳改變的頻率比p53和RB/pl6低,表明這些基因的改變與一部分肺癌細胞中迸一步的惡性發展或獨特表型有關。/"。在p53突變和RB/pl6缺失位點進行的分子足跡研究進一步證明,DNA雙鏈斷裂的DNA修復活性和非同源的末端連接在肺癌細胞中遺傳變化的積累中是重要的。/"。此外,研究已經鑒定了候選的肺部腺癌易感性基因,例如致癌藥物代謝基因例如NQOKNAD(P)H:醌氧化還原酶)和GSTTl(谷胱甘肽S-轉移酶Tl)、和DNA修復基因例如XRCC1(X-ray交聯互補組1)(Yanagitani,N.等,Cawcer五/nV/emi'o/.Bi'omaAersfVev.72:366-71(2003);Lin,P.等,丄To;dco/.五wWro".ifea/AA5&187-97(1999);Divine,K.K.等,Mw組b.祉273-78(2001);S畫ga,N.等,Ca"cer五;Wem/0/.5"maAeAs/Vev.77:730-38(2002))。染色體19ql3.3上包含基因座D19S246的區域已經被提示含有與肺部腺癌有關的基因(Yanagitani,N.等,Cawcer£^>/dem/o/.尸rev.72:366-11(2003))。正如本文所描述的那樣,染色體8q24.21上的基因座已經被證實在肺癌中扮演重要角色,已經發現肺癌患者中該基因座中特定DNA片段上特定的標記物和/或單倍型的出現高于預期在肺癌患者中的頻率。在一個實施方案中,本發明是診斷對肺癌易感性的方法,包括檢測與LD區塊A有關的標記物或單倍型,其中標記物或單倍型的存在是對肺癌易感性的指示。在具體的實施方案中,與肺癌易感性有關的標記物或單倍型的相對風險為至少1.3。在其它實施方案中,本發明描述了診斷對肺癌減少的易感性的方法,包括檢測與LD區塊A有關的標記物或單倍型,其中標記物或單倍型的存在是對肺癌減少的易感性或針對肺癌的保護性標記物或單倍型(針對肺癌具有保護性)的指示。在具體的實施方案中,與肺癌減少的易感性(針對肺癌具有保護性)有關的標記物或單倍型具有小于0.75的相對風險。潔蕭研究已經證明遺傳因素在正常色素細胞逐步發展到異常痣、到侵入性原發黑素瘤、最后到具有侵襲性轉移能力的細胞的過程中扮演重要角色(Kim,C.J.,等,Ca"cerCo",ro/9(7,:49-53(2002))。例如遺傳畸變例如含有腫瘤抑制基因的染色體1上的重排,已經被發現與惡性黑素瘤有關。/么但是,成年人皮膚的正常黑素細胞如何轉化成黑素瘤細胞的分子和生物學機制尚不清楚。各種研究已經顯示遺傳因素與黑素瘤有關。例如,通過檢測猶他州人群數據庫注意到黑素瘤早期發作的升高的家族風險(Cannon-Albright,L.A.,等,Ca"cer紐,5柳:2378-85(1994))。此外,瑞典家族癌癥數據庫報告,在具有患病的父母或近親的個體中,皮膚惡性黑素瘤(CMM)的家族性標準化發病率(SIR)分別是2.54和2.98。對于其父母有多發性原發黑素瘤的后代來說,SIR升高到61.78(Hemminki,K.,等,/"ve"Demw/o/./20(7」:217-23(2003))。盡管數據不一,已經報道大約10%的CMM病例是家族性的(Hansen,CB.等,丄朋cW(9"co/.5":314-19(2004))。除了已知的黑素瘤環境風險因子之外,共有的環境以及遺傳學可能也是這些估算的因素。但是,家族性病例傾向于具有較早的發病年齡和較高的多發性原發腫瘤的風險,表明有遺傳的影響在其中。一系列基于連鎖的研究表明Chr9p21上的CDKN2a可能是主要的CMM易感性基因(Bataille,V"Oz匿r1341-47(2003))。緊接其后CDK4被鑒定為途徑候選者,但是,CDK4中的突變僅僅在世界范圍內的幾個家族被觀察到(Zuo,L.,等,"(7,91-99(1996))。CDKN2a編碼周期蛋白依賴性激酶抑制劑p16,它抑制CDK4和CDK6,從而阻止Gl到S期的細胞周期轉變。CKDN2a的另一個轉錄本產生pl4ARF,它編碼作用于MDM2-p53途徑的細胞周期抑制劑。可能CDKN2a突變的黑素細胞在細胞周期控制中有缺陷,或作為發育階段或對DNA損傷作出反應進入衰老階段(Ohtani,N.,等,^T^/./"ve"W卩-力:146-53(2004))。到80歲時,CDKN2a突變在家族性CMM病例中的總外顯率是67%。但是,在黑素瘤高度流行的地區外顯率增加(Bishop,D.T.,等,丄A^/Cfl"cer/"W.94(7":894-903(2002))。黑素瘤遺傳學協會最近使用一組與9p21或CDK4無關的主要的澳大利亞高風險家族完成了基因組范圍的CMM搜索(Gillanders,E.,等,丄//ww.730:301-13(2003))。該分辨率為10cM的搜索在lp22區域中給出了非參數性的多點LOD分值2.06。其它在染色體4、7、14和18上的位點給出的LODs超過1.0。加上lp22的其它標記物和使用發病年齡限制,觀察到的非參數性的LOD分值超過5.0。證據表明該位點上存在腫瘤抑制基因的高外顯率突變,但是LOH的形式是復雜的(Walker,G.J.,等,Ge節C/ira附謂mesC纖er,4/(7力56-64(2004))。另一個可能與CMM有關的遺傳基因座是編碼黑素細胞皮質激素受體l(MC1R)的位點。MC1R是G蛋白偶聯受體,參與促進從嗜鉻黑色素到真黑色素合成的轉換。大量被詳細研究過的MC1R基因變異體已經被顯示與紅發,白膚和雀斑傾向表現型有關。超過一半的紅發個體帶有至少一種這些MC1R變異體(Valverde,P.,等,A^.Ge"W./〃":32S-30(1995);Palmer,J.S.,等,爿肌.丄//畫.Ge威6柳176S6(2000))。其次,已經顯示出同樣的變異體給出的CMM風險有不同的比率,對單一變異來說大約為2.0,對于復合的雜合子來說大約為4.0。最近的研究顯示較強的MC1R變異體增加了CDKN2a突變的外顯率并降低了發病年齡(Box,N.F.,等,丄i/謂.G匿A<5柳165-13(2001);vanderVelden,P.A.,等,爿w.Ge"",卯(^」11A-19(2001))。已經顯示有許多其它候選基因可能與CMM有關。例如,一項在癌癥遺傳學上劃時代的研究在60%的黑素瘤中鑒定出BRAF(v-raf鼠肉瘤病毒癌基因的人類Bl類似物)中的體細胞突變(Davies,H.,等,Mm^eW7^砂":949-54(2002))。在典型的和非典型的痣中突變也是常見的,表明突變是早期事件。/么種系突變還沒有被報道,但是BRAF的種系SNP變異體已經被顯示與CMM風險有關(Meyer,P.,等,,CaW"og.2^:7(2003))。其它通過相關性研究鑒定的并可能與CMM風險有關的候選基因包括例如XRCC3、XPD、EGF、VDR、NBS1、CYP2D6和GSTMl(Hayward,N.K.,"卿:3053陽62(2003))。但是,這些相關研究通常受到樣品數量少、依賴于單一SNPs和潛在的人群階層的限制。正如本文所描述的那樣,染色體8q24.21上的基因座已經被證實在黑素瘤中扮演重要角色,已經發現黑素瘤患者中該基因座中特定DNA片段上特定的標記物和/或單倍型的出現高于預期頻率。在一個實施方案中,本發明是診斷對黑素瘤易感性的方法,包括檢測與LD區塊A有關的標記物或單倍型,其中標記物或單倍型的存在是對黑素瘤易感性的指示。在具體的實施方案中,與黑素瘤易感性有關的標記物或單倍型的相對風險為至少1.5。在另一個實施方案中,黑素瘤是惡性皮膚黑素瘤。在另一個實施方案中,與惡性皮膚黑素瘤有關的標記物或單倍型的相對風險至少為1.7。在其它實施方案中,本發明描述了診斷對黑素瘤減少的易感性的方法,包括檢測與LD區塊A有關的標記物或單倍型,其中標記物或單倍型的存在是對黑素瘤減少的易感性或針對黑素瘤的保護性標記物或單倍型(針對黑素瘤具有保護性)的指示。在具體的實施方案中,與黑素瘤減少的易感性(針對黑素瘤具有保護性)有關的標記物或單倍型具有小于0.7的相對風險。在另一個實施方案中,黑素瘤是惡性皮膚黑素瘤。在另一個實施方案中,與惡性皮膚黑素瘤減少的易感性(針對惡性皮膚黑素瘤具有保護性)有關的標記物或單倍型的相對風險為小于0.6。標記物和單倍型的評估表現出遺傳多樣性的個體人群不具有一致的基因組。而是,個體之間在基因組的許多位置上,基因組表現出序列可變性;換句話說,在群體中有許多多態性位點。在某些情況下,在多態性位點上用不同的等位基因作為對照,而不用選擇參比等位基因。此外,參比序列也可以被指定為特定的多態性位點。參比等位基因有時被稱為"野生型"等位基因,它通常被選擇為或是第一個被測序的等位基因、或是來自"未被影響的"個體(例如沒有表現出疾病或異常表現型的個體)的等位基因。與參比不同的等位基因被稱為"變異體"等位基因。本文中描述的"標記物"是指表現了特定變異體等位基因(即多態性位點)的特征的基因組序列。標記物可以含有在基因組中發現的任何變異體類型的任何等位基因,包括SNPS、微衛星、插入、缺失、重復和易位。本文報告的SNP名稱是指官方參考SNP(rs)ID身份標簽,由國家生物技術信息中心(NCBI)為每個獨特的SNP進行指派。本文描述的"單倍型"是指基因組DNA片段,其特征為片段上排列的遺傳標記物("等位基因")的特定組合。等位基因的組合、例如單倍型1和單倍型la,分別被描述在表2和4中。在某些實施方案中,單倍型可以包含一個或多個等位基因、兩個或以上等位基因、三個或以上等位基因、四個或以上等位基因、或五個或以上等位基因。遺傳標記物是"多態性位點"上與Chr8q24.21和/或LD區塊A相關的特定的"等位基因"。在本文中使用的"Chr8q24.21"和"8q24.21"是指UCSCBuild34(來自www.genome.ucsc.edu的USCS基因組瀏覽器Build34)的染色體帶8q24.21或127,200,001-131,400,000bp。本文中使用的"LD區塊A"是指Chr8q24.21上的LD區塊,其中變異體與前列腺、乳腺、肺癌和黑素瘤的關聯被觀察到。該LD區塊的NCBIBuild34位置是從128,414,000-128,506,000bp。本文中描述的術語"非洲血統"是指個體自己報告的非洲血統。本文中使用的術語"易感性"包含了增加的易感性和減少的易感性。因此,本發明的特定的標記物和/或單倍型可以是癌癥增加的易感性的特征,正如相對風險大于1所表示的。此外,本發明的標記物和/或單倍型也可以是癌癥減小的易感性的特征,正如相對風險小于1所表示的。在種群中(例如自然種群或合成種群例如合成分子的文庫),在一個核苷酸位置上可能存在一種以上的序列的核苷酸位置在本文中被稱為"多態性"位點。當多態性位點長度為單個核苷酸時,該位點被稱為單核苷酸多態性("SNP")。例如,如果在特定的染色體位置,種群中的一個成員有腺嘌呤,而種群中的另一個成員在同樣位置上有胸腺嘧啶,那么該位點是多態性位點,更具體來說,該多態性位點是SNP。在本文中指出的SNP標記物的等位基因,當它們出現在使用的SNP分析中的多態性位點上時,是指堿基A、C、G或T。本領域的專業技術人員將會認識到通過分析或讀取相反鏈,在每種情況下可以計算出互補的等位基因。因此,對于含有A/G多態性的多態性位點來說,所用的分析方法可以計算出可能的兩種堿基、即A和G的百分比或比率。此外,通過設計對確定DNA模板的相反鏈的分析方法,可以計算出互補堿基T/C的百分比或比率。定量的(例如關于相對風險來說)、一致的結果可以從測量任何一條DNA鏈(+鏈或-鏈)獲得。基于取代、插入或缺失,多態性位點可以允許序列上的不同。例如,多態性微衛星在特定的位點上有多個小的堿基重復(例如CA重復),其中重復長度的數量在普通人群中變化。對于多態性位點來說每種序列版本在本文中被稱為多態性位點的一個"等位基因"。因此,在上述的例子中,SNP允許腺嘌呤等位基因和胸腺嘧啶等位基因。與癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)有關的SNPs和微衛星標記物被描述在表1和13中。一般來說,參比序列是一個具體的序列。與參比不同的等位基因被稱為"變異體"等位基因。例如來自參考染色體8中的NCBIBuild34的位置128,414,000-128,506,000bp的參比基因組DNA序列在本文中被描述為SEQIDNO:l(圖FIG.6A1-6A31)。本文中使用的變異體序列是指與SEQIDNO:l不同但基本上相似的序列。組成本文描述的單倍型的遺傳標記物是變異體。其它的變異可以包括影響多肽、例如SEQIDNO:l編碼的多肽的變化。這些序列差異,當與參比核苷酸序列相比時,可以包括單個核苷酸或一個以上的核苷酸的插入或缺失,導致移碼;至少一個核苷酸的變化,導致編碼的氨基酸的變化;至少一個核苷酸的變化,導致產生了過早的終止密碼;幾個核苷酸的缺失,導致核苷酸編碼的一個或多個氨基酸的缺失;一個或幾個核苷酸的插入、例如通過不對等的重組或基因變換,導致閱讀框編碼序列的中斷;全部或部分序列的重復;易位;或核苷酸序列的重排,正如在本文中詳細描述的那樣。這樣的序列變化改變了核酸編碼的多肽。例如,如果核酸序列中的變化引起了移碼,移碼可能導致編碼的氨基酸的變化、和/或可能導致過早的終止密碼的產生,導致生成了截短的多肽。此外,與癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)或癌癥易感性有關的多態性在一個或多個核苷酸上可以是同義變化(即不導致氨基酸序列變化的變化)。這樣的多態性可以例如改變剪接位點、影響mRNA的穩定性或運輸,或者影響編碼的多肽的轉錄或翻譯。也可以改變DNA以增加腫瘤中體細胞水平上發生結構變化、例如擴增或缺失、的可能性。參比核苷酸序列編碼的多肽是具有特定參比氨基酸序列的"參比"多肽,由變異體等位基因編碼的多肽被稱為帶有變異的氨基酸序列的"變異體"多肽。本文描述的單倍型是各種在多態性位點上具有特定等位基因的遺傳標記物例如SNPs和微衛星的組合。單倍型可以包含各種不同遺傳標記物的組合,因此,檢測單倍型可以通過本
技術領域:
中現有的用于檢測多態性位點的序列的方法來完成。例如可以使用用于對SNPs和/或微衛星標記物的存在進行基因分型的標準技術,例如基于熒光的技術(Chen,X.等,Ge"owei仏492-98(1999))、PCR、LCR、嵌套PCR和其它用于核酸擴增的技術。這些標記物和SNPs可以在有風險的單倍型中鑒定出來。某些鑒定相關標記物和SNPs的方法包括使用連鎖不平衡(LD)和/或LOD分值。遂綴不"T薪連鎖不平衡(LD)是指兩個遺傳元件的非隨機的分配。例如,如果特定遺傳元件(例如多態性位點上的"等位基因")在種群中出現的頻率是0.25,另一個遺傳元件的出現頻率也是0.25,假設元件是隨機分配的,那么預計一個人具有兩個元件的發生率是0.125。但是,如果發現兩個元件同時出現的頻率高于0.125,那么元件被說成是連鎖不平衡的,因為它們趨于以比根據它們的獨立的等位基因頻率所預測的頻率更高的比率一起遺傳。大體上講,LD—般與兩個元件之間重組事件的頻率有關。種群中等位基因的頻率可以通過對種群中的個體進行基因分型和測定種群中每個等位基因的發生率來確定。對于二倍體種群例如人類種群來說,對每個遺傳元件(例如標記物或基因)來說個體一般具有兩個等位基因。為了評估連鎖不平衡(LD)的強度提出了許多不同的計算。大多數計算雙等位基因位點對之間聯系的強度。LD的兩個重要的成對計算是r2(有時被表示為A2)和ID'I。兩種計算值的范圍是從0(沒有不平衡)到1("完全"不平衡),但是它們的解釋稍微有些不同。如果只存在兩個或三個可能的單倍型,ID'I被定義為等于1,如果所有四種可能的單倍型都存在,它就小于1。所以,ID'I值小于1表明兩個位點之間可能在歷史上發生過重組(回復突變也可能引起ID'I小于1,但是對于單核苷酸多態性(SNPs)來說,這種情況通常被認為比重組的可能性小)。計算的?表示兩個位點之間的統計相關性,如果只存在兩個單倍型,取值為1。有爭議的觀點認為它是對關聯作圖進行的最相關的計算,因為在^和檢測易感性基因座和SNPs之間的關聯所需的樣品大小之間存在簡單的倒數關系。這些計算被限定于成對的位點,但是對于某些應用來說,可能需要確定在含有許多多態性位點的整個區域上有多強的LD(例如檢測基因座間或種群中LD的強度是否有顯著的不同,或者在特定的模型中在一個區域中是否存在比預期更大或更小的LD)。計算整個區域的LD不是直接進行的,但是一種方法是使用在種群遺傳學中開發的計算值r。大體來說,r度量了在特定種群模型下為了產生數據中看見的LD需要多少重組。這種類型的方法對于確定LD數據是否為重組熱點的存在提供了證據的問題也可能提供了統計學上有力的方法。對于本文描述的方法來說,顯著的一值可以是至少0.2、例如至少0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1.0。因此,LD代表了不同標記物的等位基因之間的相關性。它通過相關系數或ID'沐度量(一最大為1.0,ID'I最大到1.0)。正如本文所描述的那樣,染色體8q24.21上的基因座已經被證實在癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)中扮演了重要角色。已經發現在特定的癌癥患者中特定的標記物和/或單倍型的出現高于預期頻率。在一個實施方案中,標記物或單倍型含有一個或多個與Chr8q24.21有關的標記物,它們與由表13中的標記物的一個或多個標記物處于連鎖不平衡(被定義為相關系數的平方r2大于0.2)。氣感絲基厲座游卓舒盧浙丄OD分澄定乂在某些實施方案中,候選的易感性基因座使用LOD分值來定義。然后對被定義的區域使用SNP和微衛星標記物進行超精細作圖,標記物間的平均間隔小于100kb。所有在公共數據庫中發現的并在該區域中作圖的可用的微衛星和SNP標記物都可以使用。此外,在人類基因組的deCODE遺傳學序列集合中鑒定的微衛星標記物也可以使用。在病人和對照組中單倍型的頻率可以使用期望值-最大化算法(DempsterA.等,JUW.S,39:1-38(1977))來估算。可以使用該算法來處理遺漏的基因型和階段的不確定性。在原假設(millhypothesis)下,病人和對照被假設具有同樣的頻率。使用似然法,對可選的其它假設進行測試,其中候選的、可以包含本文描述的標記物的有風險的單倍型被允許在病人中具有比對照中更高的頻率,而其它單倍型的頻率比率被假設在兩個組中是相同的。在兩種假說下似然性被分別最大化,相應的l-df似然比統計數值被用于評估統計學顯著性。為了在連鎖區域中尋找有風險的或保護性的標記物和單倍型,例如,對基因分型的標記物的所有可能組合的關聯進行了研究,只要那些標記物跨越實際研究區域。合并的病人和對照組可以被隨機地分成兩組,其大小與最初的病人和對照組相等。然后重復標記物和單倍型分析,確定出記錄到的最顯著的p值。這種隨機化的流程可以被重復例如超過100次,以建立起p值的經驗性分布。在優選實施方案中,p值小于0.05表明了顯著的標記物和/或單倍型關聯。單倍型分析的詳細討論如下文所述。稀微#進行單倍型分析的一種常用方法包括將基于似然性的推論結果應用于NEstedModels(GretarsdottirS.,等,A^aA35:131-38(2003))。該方法在NEMO程序中執行,該程序考慮到了許多多態性標記物、SNPs和微衛星。該方法和軟件是為其目的是鑒定能夠帶來不同風險的單倍型組的病例-對照研究而特別設計的。它也是研究LD結構的工具。在NEMO中,在EM算法的幫助下直接計算了最大似然性推定值、似然比和p值,對于觀察到的數據作為遺漏數據問題進行處理。盡管基于從觀察到的數據直接計算的似然性進行的似然比測試已經收集了由于階段的不確定性和遺漏的基因型導致的信息丟失,仍可以被用來給出有效的p值,但是了解有多少信息已經由于信息不完整而丟失仍然是有意義的。用于單倍型分析的信息計算被描述在Nicolae禾口Kong的文獻中(TechnicalReport537,DepartmentofStatistics,UniversityofStatistics,UniversityofChicago;5/o膨Wcs,(50(%):368-75(2004)),作為被定義用于連鎖分析的信息計算的自然擴展,并在NEMO中執行。對于與疾病相關的單個標記物來說,Fisher確切條件檢驗可以被用來計算每個個體等位基因的兩邊的p值。除非特別指明,對于多重比較來說,所有的p值都不被調整地顯示。顯示的頻率(對于微衛星、SNPS和單倍型來說)是等位基因頻率而不是載體頻率。為了最小化由于作為家庭被吸收的病人之間的親緣關系而引起的偏差,第一和第二級親屬可以從病人名單中消除。此外,可以通過擴展在Risch,N.和Teng,J.(Tes.,1273-1288(1998))中描述的方差調整方法和將親屬的DNA合并的方法(同上),重復進行相關性檢驗以校正病人之間任何殘留的親緣關系,以便它可以用于普遍的家族關系,并同時顯示出調整過的和未調整過的p值用于比較。該差異正如預期一般是非常小的。為了評估被校正用于多重檢驗的單標記物相關性的重要性,我們使用同樣的基因型數據進行了隨機化測試。病人和對照組可以被隨機化,重新進行多次關聯性分析(例如多達500,000次),p值是對某些標記物等位基因產生的p值低于或等于我們使用最初的病人和對照組觀察至ij的p值的重復試驗的分數。對于單個標記物和單倍型分析來說,相對風險(RR)和種群可歸因風險(PAR)可以按照乘法模型(單倍型相對風險模型)來計算(Terwilliger,J.D.和Ott,J.,//鼠Z/eW.42:337-46(1992)和Falk,CT.和Rubinstein,P,i/wm.G匿A5/fP"」:221-33(1987)),一個人攜帶的兩個等位基因/單倍型的風險相乘。例如,如果RR是A相對于a的風險,那么一個人純合子AA的風險將是雜合子Aa的RR倍、純合子aa的RRM咅。乘法模型有簡化分析和計算的好性質,即在Hardy-Weinberg平衡中,在患病的人群以及對照人群中單倍型是獨立的。結果,患病者和對照組的單倍型計數每個都有多項式分布,但是在不同的假說下具有不同的單倍型頻率。具體來說,對于兩個單倍型&和~來說,風險(A,)/風險(&"(/;/A)l(/;^),其中f和p分別是患病人群和對照人群中的頻率。盡管如果真實的模型不是乘法模型的話將會有一些倍率損失(powerloss),但除了極端的情況之外,這種損失趨于輕微。更重要的是,因為p值是根據空假說來計算的,它們總是有效的。,賴A^MO游遂徵'不f銜成對標記物之間的LD可以使用1D'I和R2的標準定義來計算(Lewontin,R.,Gewe"cs":49-67(1964);Hill,W.G.禾卩Robertson,A.7Teor.々;/Ge"et":226-231(1968))。使用NEMO,兩個標記物等位基因組合的頻率可以通過最大似然性估算,與連鎖不平衡的偏差通過似然率檢驗來評估。通過對兩個標記物經過臨界等位基因可能性加權的所有可能的等位基因組合的值進行平均,ID'I和W的定義被擴展到包含了微衛星。當對所有標記物組合進行作圖以闡述特定區域中的LD結構時,我們將ID'I作圖在左上角,p值作圖在右下角。在LD圖中,如果需要,標記物可以等距離作圖而不是按照它們物理上的位置作圖。遂綴分析游統^學方泫在分析中可以使用多點的、只在患者中的等位基因共享方法來評估連鎖的證據。LOD分值和非參數性連鎖(NPL)分值的結果可以使用Allegro程序(Gudbjartsson等,淑.G潔r.":12-3(2000))獲得。我們的基線連鎖分析使用Sp,計數函數(Whittemore,A.S.,Halpern,,5/om"〃'"50:118-27(1994);KruglyakL.等,爿m.55:1347-63(1996)),指數等位基因共享模型(Kong,A.禾nCox,N.J.,4m.//t,m.Ge/ieZ.(57:1179-88(1997))和家族加權方案在對數標度上處于每個被影響的對同等加權和每個家族同等加權之間的途中。我們使用的信息計算是Allegro程序輸出結果的一部分,如果標記物基因型完全不提供消息,信息值等于零,而如果基因型確定了患病親屬之內后裔所共享的等位基因的準確的量,該信息值等于l(Gretarsdottir等乂m.丄i/wm.70:593-603(2002))。P值用兩種不同方法計算,不太顯著的結果報道在這里。第一個p值可以在大樣品理論的基礎上計算;在沒有連鎖的原假設下,=口(2[loge(10)LOD])的分布近似于標準的正常變量(Kong,A.禾tlCox,NJ.,爿m.J.//wm.1179-88(1997))。第二個p值可以通過比較觀察到的LOD分值及其在原假設下完整的數據取樣分布來計算(例如Gudbjartsson等,淑.G匿,.Z5:12-3(2000))。當數據由幾個以上的家族組成時,這兩個p值趨于非常近似。^感絲基歷座游卓舒M浙"卓舒M^"炎"定乂在某些實施方案中,標記物和單倍型分析包括了基于"單倍型區塊"(也稱為"LD區塊")確定候選的易感性基因座。已經報道人類基因組的部分可以被分成一系列含有幾個常見單倍型的不連續的單倍型區塊;對于這些區塊來說,連鎖不平衡數據幾乎不能提供指示重組的證據(參見例如Wall.,J.D.禾口Pritchard,J.K.,A^似reieWe體(587-597(2003);Daly,M,等,淑,Ge"W.":229-232(2001);Gabriel,S.B.等,Sc/e"ce,:2225-2229(2002);Patil,N.等,炭1719-1723(2001);Dawson,E.等,胸騰475:544-548(2002);Phillips,M.S.等淑匿G匿"3:382-387(2003))。有兩種主要的方法定義這些單倍型區塊區塊可以被定義為限制了單倍型多樣性的DNA區域(參見例如Daly,M.等,Ato『eGenW.":229-232(2001);Patil,N.等,Sc/e"ce廁:1719-1723(2001);Dawson,E.等,胸廳(2002);Zhang,K.等,P亂麵.&〖99:7335-7339(2002)),也可以被定義為使用連鎖不平衡鑒定的具有擴展的歷史重組的過渡區之間的區域(參見例如Gabriel,S.B.等,"6:2225-2229(2002);Phillips,M.S.等,胸臟G匿Z.33:382-387(2003);Wang,N.等,」w.//謂.G匿f.77:1227-1234(2002);Stumpf,M.P.,和Goldstein,D.B.,Cwr.73:1-8(2003))。本文中使用的術語"單倍型區塊"或"LD區塊"包括了通過任何一種性質確定的區塊。鑒定單倍型區塊的代表性方法被顯示在例如美國出版的專利申請Nos.20030099964、20030170665、20040023237禾口20040146870中。單倍型區塊可以容易地用于對表現型和單倍型狀態之間的關聯進行作圖。在每個單倍型區塊中可以鑒定出主要的單倍型,然后可以鑒定一組"帶標簽的"SNPs或標記物(為了在單倍型之間進行區分所需的最小組的SNPs或標記物)。這些帶標簽的SNPs或標記物然后可以被用于評估來自個體組的樣品,以鑒定表現型和單倍型之間的關聯。如果需要,鄰近的單倍型區塊可以被同時進行評估,因為在單倍型區塊之間也可能存在連鎖不平衡。単錄潛,珍銜正如本文所描述的那樣,某些標記物和單倍型被發現可用于確定對癌癥的易感性,即它們被發現可用于診斷對癌癥的易感性。特定的標記物和單倍型(例如單倍型1、單倍型la、和其它含有下面的任何一個表中描述的一個或多個標記物的單倍型)被發現在患有癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)的個體中比在沒有癌癥的個體中出現得更為頻繁。因此,這些標記物和單倍型對于在個體中檢測癌癥或對癌癥的易感性有預測的價值。含有某些帶標簽的標記物的單倍型區塊在患有癌癥的個體中比在沒有癌癥的個體中被發現出現得更為頻繁。因此,這些單倍型區塊中"有風險的"帶標簽的標記物對于在個體中檢測癌癥或對癌癥的易感性也具有預測價值。單倍型或LD區塊中"有風險的"帶標簽的標記物也可以包括其它能夠區分單倍型的標記物,因為它們同樣對檢測癌癥或對癌癥的易感性也具有預測價值。作為人類基因組的單倍型區塊結構的結果,包括這些與單倍型區塊(LD區塊)關聯的標記物或變異體的大量標記物或其它變異體和/或單倍型可以被發現與某些形狀和/或表現型有關。因此,存在于本文定義的LD區塊A中或與LD區塊A具有強烈LD(特征為一大于0.2)的標記物和/或單倍型有可能與癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)有關。這包含了在本文中描述的標記物(表13、20和21),但是也可以包含其它與表13、20和21中列出的一個或多個標記物具有強LD(特征為一大于0.2)的標記物。這種其它的變異體的鑒定可以通過本
技術領域:
的專業人員所熟知的方法來完成,例如通過LD區塊A基因組區域的DNA測序,本發明也包含了這種其它的變異體。正如本文所描述的那樣(例如表13),已經發現LD區塊A中的某些標記物以減小的頻率存在于患有癌癥的個體中,也已經發現含有兩或多種表13、20和21中列出的標記物的單倍型以減小的頻率出現在患有癌癥的個體中。因此,這些標記物和單倍型是對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)有保護性的,即它們賦予帶有這些標記物和/或單倍型的個體以減小的發展出癌癥的風險。這種保護性單倍型的一個例子是包含標記物rs7814251C等位基因和rsl2542685等位基因T等位基因(表22)。本文描述的單倍型和標記物在某些情況下是不同遺傳標記物例如SNPs和微衛星的組合。因此,可以通過本領域現有的和/或本文描述的用于檢測多態性基因座序列的方法來進行單倍型的檢測。此外,某些單倍型或成組標記物與疾病表現型之間的相關性可以使用標準的技術來證實。相關性的簡單測試的代表性例子是在二乘二表上進行的Fisher精確檢驗。在具體的實施方案中,與LD區塊A和/或Chr8q24.21相關的標記物或單倍型,是在有癌癥風險(受影響的)的個體中出現的頻率與在健康個體(對照)中出現的頻率相比更頻繁的標記物或單倍型,其中標記物或單倍型的存在是癌癥或對癌癥易感性的指示。在另一個實施方案中,與LD區塊A和/或Chr8q24.21相關的一個或多個標記物處于連鎖不平衡的單倍型區塊中的有風險的帶有標簽的標記物,是在有癌癥風險(受影響的)的個體中出現的頻率與在健康個體(對照)中出現的頻率相比更頻繁的帶標簽的標記物,其中帶標簽的標記物的存在是癌癥或對癌癥易感性的指示。在另一個實施方案中,與LD區塊A和/或Chr8q24.21相關的一個或多個標記物處于連鎖不平衡的有風險的標記物,是在有癌癥風險的個體中出現的頻率與在健康個體(對照)中出現的頻率相比更頻繁的標記物,其中標記物的存在是癌癥或對癌癥易感性的指示。在本發明的具體實施方案中,標記物或單倍型與LD區塊A有關。正如本文所描述或例舉的那樣,基因型分析顯示出染色體8q24.21上的標記物和單倍型與癌癥的關聯。具體來說,本文描述的研究證實了與LD區塊A相關的標記物和單倍型(即來自NCBIBuild34(SEQIDNO:1;FIG.6A1-6A31)的128,414,000-128,506,000bp的基因組DNA序列)與癌癥的關聯。應該注意到除了本文具體描述的那些之外,LD區塊A中的其它標記物和單倍型也可能與癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)有關,并被包含在本發明中。基于本文描述的介紹和本領域的現有技術,人們可以不用進行過多的實驗就鑒定出其它的標記物和單倍型(例如通過對患有或不患有癌癥的受試者的LD區塊A區域進行測序,或對與本文描述的標記物和/或單倍型處于強烈LD的標記物進行基因分型)。在一個實施方案中,標記物或單倍型含有至少一種表13中的標記物。在另一個實施方案中,標記物或單倍型含有rs1447295A等位基因和/或DG8S737-8等位基因。在本文描述的某些方法中,具有癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)風險的個體是其中有風險的單倍型被鑒定到的個體、或是其中有風險的標記物被鑒定到的個體。在一個實施方案中,標記物或單倍型的關聯強度由相對風險(RR)來度量。RR是帶有一個拷貝標記物或單倍型的受試者中病癥的發生率與不帶有標記物或單倍型的受試者中病癥的發生率的比率。該比率等于有兩個拷貝標記物或單倍型的受試者中病癥的發生率與帶有一個拷貝標記物或單倍型的受試者中病癥的發生率的比率。在一個實施方案中,標記物或單倍型的相對風險為至少1.2。在另一個實施方案中,標記物或單倍型的相對風險為至少1.3、至少1.4、至少1.5、至少2.0、至少2.5、至少3.0、至少3.5、至少4.0或至少5.0。在一個實施方案中,本發明是診斷對前列腺癌的易感性的方法,包括檢測與LD區塊A和/或Chr8q24.21有關的標記物或單倍型,其中標記物或單倍型的存在是對前列腺癌易感性的指示,標記物或單倍型的相對風險至少為1.5。在另一個實施方案中,標記物或單倍型的相對風險至少為2.0。在一個實施方案中,本發明是診斷對乳腺癌的易感性的方法,包括檢測與LD區塊A和/或Chr8q24.21有關的標記物或單倍型,其中標記物或單倍型的存在是對乳腺癌易感性的指示,標記物或單倍型的相對風險至少為1.3。在一個實施方案中,本發明是診斷對肺癌的易感性的方法,包括檢測與LD區塊A和/或Chr8q24.21有關的標記物或單倍型,其中標記物或單倍型的存在是對肺癌易感性的指示,標記物或單倍型的相對風險至少為1.3。在一個實施方案中,本發明是診斷對黑素瘤的易感性的方法,包括檢測與LD區塊A和/或Chr8q24.21有關的標記物或單倍型,其中標記物或單倍型的存在是對黑素瘤易感性的指示,標記物或單倍型的相對風險至少為1.5。在另一個實施方案中,本發明是診斷對惡性皮膚黑素瘤的易感性的方法,包括檢測與LD區塊A禾B/或Chr8q24.21有關的標記物或單倍型,其中標記物或單倍型的存在是對惡性皮膚黑素瘤易感性的指示,標記物或單倍型的相對風險至少為1.7。在另一個實施方案中,與標記物或單倍型有關的顯著性由相對風險度量。在一個實施方案中,顯著增加的風險被計算為相對風險至少大約1.2,包括但不限于1.2、1.3、1.4、1.5、1.6、1.7、1.8禾B1.9。在另一個實施方案中,相對風險至少1.2是顯著的。在另一個實施方案中,相對風險至少大約1.5是顯著的。在另一個實施方案中,相對風險至少大約1.7是顯著的。在另一個實施方案是,顯著減少的風險被計算為小于l,包括但不限于小于0.8、0.7、0.6、0.5禾P0.4。在另一個實施方案中,相對風險小于0.8是顯著的。在另一個實施方案中,相對風險小于0.6是顯著的。在另一個實施方案中,與標記物或單倍型有關的顯著性通過百分數度量。在一個實施方案中,風險的顯著增加或減少是至少大約20%,包括但不限于大約25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%和98%。在另一個實施方案中,風險的顯著增加或減少是至少大約50%。因此,本文中使用的術語對癌癥的"易感性"表明當某些標記物(標記物等位基因)或單倍型存在時,癌癥的風險以顯著的量增加或減少;顯著性按照上面的指示度量。本文中使用的術語對癌癥"減少的易感性"或對癌癥"有保護性"表明當某些其它標記物或單倍型存在時,癌癥的相對風險因此減少。但是,可以理解的是,鑒定風險是否是醫學上重要的,可能還依賴各種不同的因素,包括具體的疾病、標記物或單倍型、以及通常還有環境因素。本發明的具體實施方案包含了在個體中診斷對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)的易感性的方法,包括在個體中評估包含在與LD區塊A和/或Chr8q24.21有關的核酸區域的一部分中的SNPs和/或微衛星的存在或頻率,其中與健康的對照個體相比過量或較高頻率的SNPs和/或微衛星是個體患有癌癥、或對癌癥易感性的指示(參見例如表1和13(下文)中可以用作篩選工具和/或是單倍型的部分的SNPs和微衛星標記物)。這些微衛星標記物和SNPs可以在單倍型中鑒定到。例如單倍型可以包含例如在下面的表中顯示的微衛星標記物和/或SNPs。標記物或單倍型的存在是癌癥或對癌癥易感性的指示,因此是作為治療性和/或預防性方法的好的候選者的個體的指示。這些標記物和單倍型可以用作篩選工具。本發明的其它具體實施方案包含了在個體中診斷對癌癥易感性的方法,包括在一個或多個多態性基因座上檢測一個或多個標記物,其中的一個或多個多態性基因座與LD區塊A和/或Chr8q24.21處于連鎖不平衡。遺//試游實1絲關于導致發展出癌癥的風險的遺傳變異的知識,為使用遺傳測試來鑒別具有發展出疾病的增加的風險的個體(即風險變異體的攜帶者)和具有發展出疾病的減小的風險的個體(即保護性變異體的攜帶者)提供了機會。對于屬于上面提到的兩個組的個體來說,遺傳測試的核心價值是能夠在早期診斷疾病、以及為臨床醫生提供關于疾病的預后/侵襲性的信息以便使用最合適的治療方法的可能性。1、幫助早期檢測將遺傳測試用于前列腺癌能夠為在較早的時期檢測疾病提供機會,如果發現是局部性時,這導致了較高的治愈率,并通過最小化腫瘤的局部或遠距離擴散增加存活率。對于前列腺癌來說,遺傳測試很可能增加已經普遍使用的前列腺特異性抗原(PSA)測試和數字式直腸檢查(DRE)的靈敏性和特異性。這可以產生較低比率的假陽性(因此最小化了不必需的步驟例如活組織針檢)和假陰性(從而增加了對潛伏的疾病的檢測并最小化由于PCA引起的發病率和死亡率)。2、確定侵襲性遺傳測試可以提供關于診斷前預后指示的信息,并能夠鑒定對侵襲性腫瘤類型具有高或低風險的個體,這可以導致對篩選策略的修改。例如,被確定是發展出侵襲性前列腺癌的高風險等位基因的攜帶者的個體,將可能經歷更頻繁的PSA測試、檢驗,并且在存在異常PSA值的情況下對進行活組織針檢具有較低的臨界值。此外,鑒定是侵襲性腫瘤類型的高或低風險等位基因的攜帶者的個體將導致對治療策略的修改。例如,如果被診斷出前列腺癌的個體是導致發展出侵襲性形式的前列腺癌的增加的風險的等位基因的攜帶者,那么臨床醫生將可能建議更具侵襲性的治療策略例如前列腺切除術,而不是侵襲性較低的治療策略。正如在本
技術領域:
所了解的那樣,前列腺特異性抗原(PSA)是由前列腺上皮細胞、包括癌細胞,分泌的蛋白。血液中PSA水平升高表明了前列腺的異常癥狀,可能是良性的也可能是惡性的。PSA被用于檢測前列腺中潛在的問題,以及用于追蹤前列腺癌治療的進展。PSA水平高于4ng/ml是存在前列腺癌的指示(盡管正如本
技術領域:
所了解的那樣,該測試既不是非常特異也不是非常靈敏)。在一個實施方案中,本發明的方法與PSA分析相結合(可以在之前、同時或之后)使用。在具體的實施方案中,標記物或單倍型的存在,與受試者具有高于4ng/ml的PSA水平相結合,是更具侵襲性的前列腺癌和/或更壞的預后的指示。正如本文所描述的那樣,特定的標記物和單倍型與高Gleason的(即更具侵襲性的)前列腺癌有關。在另一個實施方案中,在具有正常的PSA水平(例如低于4ng/ml)的病人中標記物或單倍型的存在是高Gleason的(即更具侵襲性的)前列腺癌和/或更壞的預后的指示。當癌癥更可能將生長超出前列腺的邊界、轉移、逃脫治療和/或殺死宿主時,發生"更壞的預后"或"壞的預后"。在一個實施方案中,標記物或單倍型的存在是在腫瘤或其前體中傾向于發生Chr8q24.21的體細胞重排(例如一個或多個擴增、易位、插入和/或缺失)的指示。體細胞重排自身隨后可能導致更具侵襲性形式的前列腺癌(例如較高的組織學級別,如同診斷時較高的Gleason分值或較高的階段所反映的那樣,前列腺癌的增加的進展(例如到較高的階段),更壞的結果(例如根據發病率、并發癥或死亡))。正如在本
技術領域:
中所熟知的那樣,Gleason級別是廣泛使用的方法,用于對前列腺癌組織的正常腺體結構(腺體的大小、形狀和分化)的損失程度進行分類。從1到5的級別被成功指派給被檢測的組織樣品中存在的兩個最顯著的組織形式中的每一個,加在一起產生了總的或組合的Gleascm級別(級別2-10)。大的數字表示少的分化,因此是更具侵襲性的癌癥。侵襲性前列腺癌是生長超出了前列腺,轉移并最終殺死病人的癌癥。正如本文所描述的那樣,侵襲性的一種代用度量是高度組合的Gleason級別。級別2-10上級別越高,病人越可能患有侵襲性疾病。除非另外注明,在本文中使用的術語"階段"被用于定義癌癥(例如前列腺癌)的大小和生理范圍。確定各種癌癥的階段的一種方法是TNM方法,其中在TNM的首字母縮寫中,T代表腫瘤大小和侵染力(例如前列腺中的原初腫瘤);N與淋巴結參與(例如前列腺癌已經擴散到淋巴結中)有關;M表示轉移(擴散到遠處位點)的存在或不存在。本發明的方法用于診斷對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的方法被描述在本文中并包含在本發明中。用于分析來自受試者的樣品以檢測對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的的試劑盒也包含在本發明中。在其它的實施方案中,本發明是在受試者中診斷與Chr8q24.21相關的癌癥(例如與Chr8q24.21相關的前列腺癌、與Chr8q24.21相關的乳腺癌、與Chr8q24.21相關的肺癌、與Chr8q24.21相關的黑素瘤)的方法。本發明的診斷和篩選分析方法在某些實施方案中,本發明屬于通過檢測在癌癥受試者或對癌癥具有易感性的受試者中更頻繁出現的特定遺傳標記物,來診斷或幫助診斷癌癥或對癌癥易感性的方法。在具體的實施方案中,本發明是通過檢測一個或多個特定的遺傳標記物(例如本文描述的標記物或單倍型)來診斷對前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌和/或黑素瘤的易感性的方法。本發明描述的方法中特定標記物或單倍型的檢測是對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)易感性的指示。這種預后或預測性分析方法也可以用于在與這些癌癥相關的癥狀發作之前確定對受試者的預防性治療方案。此外,在某些其它實施方案中,本發明屬于通過檢測在癌癥中出現頻率較低的特定遺傳標記物或單倍型,來診斷或幫助診斷對癌癥減少的易感性的方法。在具體的實施方案中,本發明是通過檢測一個或多個特定的遺傳標記物(例如本文描述的標記物或單倍型)來診斷對前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌和/或黑素瘤的減少的易感性的方法。本發明描述的方法中特定標記物或單倍型的檢測是對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)減少的易感性、或針對癌癥的保護性標記物或單倍型的指示。正如在本文中描述和例舉的那樣,與LD區塊A和/或Chr8q24.21有關的特定標記物或單倍型(例如單倍型)與癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)相關。在一個實施方案中,標記物或單倍型能夠賦予對前列腺癌、乳腺癌、肺癌和/或黑素瘤的易感性的顯著風險。在另一個實施方案中,本發明涉及通過篩選與LD區塊A和/或Chr8q24.21有關的、在患有癌癥或對癌癥易感的(受影響的)受試者中與健康受試者(對照)中相比出現頻率更高的標記物或單倍型,在受試者中診斷對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)易感性的方法。在某些實施方案中,標記物或單倍型的p值小于0.05。在這些實施方案中,標記物或單倍型的存在是對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)易感性的指示。這些診斷方法涉及檢測與LD區塊A和/或Chr8q24.21有關的的標記物或單倍型的存在與否。本文描述的單倍型包括各種不同遺傳標記物(例如SNPs、微衛星)的組合。構成特定單倍型的特定遺傳標記物的檢測可以通過本文描述的和/或本
技術領域:
已知的各種方法來進行。例如,遺傳標記物可以在核酸水平(例如通過直接的核苷酸測序)檢測,或者如果遺傳標記物影響了與Chr8q24.21相關的核酸所編碼的蛋白的編碼序列,可以在氨基酸水平上檢測(例如通過蛋白測序或通過使用識別這種蛋白的抗體進行免疫分析)。本文中使用的"與Chr8q24.21有關的核酸"是指是或對應于Chr8q24.21基因組DNA序列的片段。"與LD區塊A相關的核酸"是指是或對應于LD區塊A的基因組DNA序列的片段。在一個實施方案中,可以使用雜交方法例如Southern分析、Northern分豐斤禾口/或原j立雜交(參見CurrentProtocolsinMolecularBiology,Ausubel,F.等主編,JohnWiley&Sons,包括所有附錄)來進行對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)易感性的診斷。來自測試受試者或個體的基因組DNA、RNA或cDNA的生物學樣品("測試樣品")是從被懷疑患有、易感于、或傾向于患有癌癥的受試者("測試受試者")獲得的。受試者可以是成年人、兒童或胎兒。測試樣品可以來自任何含有基因組DNA的來源,例如血液樣品、羊水樣品、腦脊液樣品、或來自皮膚、肌肉、口腔或結膜粘膜、胎盤、胃腸道或其它器官的組織樣品。來自胎兒細胞或組織的DNA測試樣品可以通過適合的方法獲得,例如通過羊膜穿刺或絨膜絨毛取樣。然后對DNA、RNA或cDNA樣品進行檢測。單倍型等位基因的存在可以通過用針對特定等位基因的特異性核酸探針進行序列特異性雜交來鑒定。序列特異性探針可以被導向與基因組DNA、RNA或cDNA雜交。本文使用的"核酸探針"可以是與互補序列雜交的DNA探針或RNA探針。本領域的專業技術人員將知道如何設計這樣的探針,以便只有當測試樣品的基因組序列中存在特定等位基因時才會發生序列特異性雜交。為了診斷對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)的易感性,通過將含有與Chr8q24.21有關的和/或與LD區塊A有關的核酸的測試樣品與至少一種核酸探針相接觸,形成了雜交樣品。用于檢測mRNA或基因組DNA的探針的一個非限制的例子是能夠與本文描述的mRNA或基因組DNA序列雜交的標記的核酸探針。核酸探針可以是例如全長的核酸分子或其一部分,例如長度至少為15、30、50、100、250或500個核苷酸的、能夠在嚴緊條件下與適合的mRNA或基因組DNA雜交的寡聚核苷酸。例如,核酸探針可以是SEQIDNO:l的全部或一部分,任選包含在本文描述的單倍型中包含的至少一種等位基因,或者探針可以是這樣的序列的互補序列。在具體的實施方案中,核酸探針是SEQIDNO:l的一部分,也可以任選包含在本文描述的單倍型中包含的至少一種等位基因,或者探針可以是這樣的序列的互補序列。其它適合用于本發明的診斷分析方法的探針在本文中有描述。雜交樣品被維持在足夠允許核酸探針和與Chr8q24.21有關的核酸和/或與LD區塊A有關的核酸發生特異性雜交的條件下。本文使用的"特異性雜交"是指完全雜交(例如沒有誤配)。特異性雜交可以在本文描述的高嚴緊條件或中嚴緊條件下進行。在一個實施方案中,特異性雜交的雜交條件是高嚴緊的(例如象本文描述的那樣)。特異性雜交如果出現的話,然后可以使用標準的方法來檢測。如果在核酸探針和測試樣品中與Chr8q24.21有關的和/或與LD區塊A有關的核酸之間發生了特異性雜交,那么樣品中含有與核酸探針中存在的核苷酸互補的等位基因。對于構成單倍型的其它標記物可以重復這個過程,或者可以同時使用多個探針以便同時檢測一個以上的標記物。設計出含有特定單倍型的一個以上標記物的單一探針(例如含有與構成特定單倍型的2、3、4、5或所有標記物互補的等位基因的探針)是可能的。樣品中單倍型的特定標記物的檢測是樣品源具有特定單倍型(例如單倍型)、因此也是對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)易感性的指示。在另一種雜交方法中,Northern分析(參見CurrentProtocolsinMolecularBiology,Ausubel,F.等主編,JohnWiley&Sons,同上)被用來鑒定與癌癥或對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)易感性有關的多態性的存在。對于Northern分析來說,RNA測試樣品是從受試者通過適當方法獲得的。正如本文描述的那樣,核酸探針與來自受試者的RNA的特異性雜交是與探針互補的特定等位基因的指示。關于核酸探針的使用的代表性例子參見例如美國專利Nos.5,288,611禾B4,851,330。此外,或另外的,在本文描述的雜交方法中除了核酸探針之外可以使用肽核酸(PNA)探針,或代替核酸探針使用。PNA是DNA的模擬物,具有類似肽的無機骨架例如N-(2-氨基乙基)甘氨酸單位,帶有通過亞甲基羰基連接體結合到甘氨酸氮原子上的有機堿基(A、G、C、T或U)(參見例如Nielsen,P.,等,5/oco"j^g.CTzem.5:3-7(1994))。PNA探針可以被設計成與懷疑含有與癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)有關的單倍型的一個或多個遺傳標記物的樣品中的分子進行特異性雜交。PNA探針的雜交是對癌癥或癌癥易感性的診斷。在本發明的一個實施方案中,對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)或癌癥易感性的診斷是通過酶法擴增來自受試者的核酸來進行的。例如,含有基因組DNA的測試樣品可以從受試者獲得,然后可以使用聚合酶鏈反應(PCR)擴增測試樣品中與Chr8q24.21有關的核酸和/或與LD區塊A有關的核酸。正如本文中所描述的那樣,與擴增的Chr8q24.21區域和/或LD區塊A區域有關的特定標記物或單倍型(例如單倍型)的鑒定可以使用各種方法來進行(例如序列分析、限制性酶消化分析、特異性雜交、單鏈構象多態性分析(SSCP)、電泳分析等)。在另一個實施方案中,診斷通過使用定量PCR(動力學熱循環反應)進行表達分析來完成。該技術可以使用例如商業化可用的技術,例如TaqMan(AppliedBiosystems,FosterCity,CA)以允許鑒定多態性和單倍型(例如單倍型)。該技術可以評估Chr8q24.21和/或LD區塊A編碼的多肽或剪接變異體的表達或組成的變化的存在。此外,變異體的表達可以按照物理或功能上的差別進行定量。在本發明的另一種方法中,限制性酶消化分析可以用于檢測特定的等位基因,如果相對于參比序列來說等位基因導致了限制性酶基因座的產生或消除的話。從受試者獲得含有基因組DNA的測試樣品。可以使用PCR來擴增來自測試受試者的測試樣品中的特定的Chr8q24.21和/或LD區塊A區域。可以按照例如上述的CurrentProtocolsinMolecularBiology中的描述來進行限制性片段長度多態性(RFLP)分析。相關DNA片段的消化譜圖表明了樣品中特定等位基因的存在與否。序列分析也可以用于檢測與Chr8q24.21禾卩/或LD區塊A有關的多態性基因座上的特定等位基因。因此,在一個實施方案中,確定特定標記物或單倍型(例如單倍型)的存在與否包括序列分析。例如,可以從測試受試者獲得DNA或RNA測試樣品。可以使用PCR或其它適合的方法擴增Chr8q24.21禾卩/或LD區塊A的一部分,然后可以通過對樣品中基因組DNA的多態性位點進行測序來直接檢測特定等位基因的存在。通過使用擴增的寡聚核苷酸與等位基因特異性的寡聚核苷酸(ASO)探針進行斑點雜交(參見例如Saiki,R.等,A^wre,3^:163-166(1986)),等位基因特異性的寡聚核苷酸也可用于檢測與Chr8q24.21和/或LD區塊A有關的多態性位點中特定等位基因的存在。"等位基因特異性的寡聚核苷酸"(在本文中也被稱為"等位基因特異性的寡聚核苷酸探針")是大約10-50個堿基對或大約15-30個堿基對的寡聚核苷酸,能夠與Chr8q24.21和/或LD區塊A的區域特異性雜交,并且在多態性位點(例如本文描述的多態性)上含有特定的等位基因。可以使用標準的方法(參見例如CurrentProtocolsinMolecularBiology,同上)制備特異性針對與Chr8q24.21和/或LD區塊A有關的一個或多個特定的多態性的等位基因特異性寡聚核苷酸探針。可以使用PCR來擴增所需的Chr8q24.21禾卩/或LD區塊A區域。含有擴增的Chr8q24.21區域和/或LD區塊A區域的DNA可以使用標準方法(參見例如CurrentProtocolsinMolecularBiology,同上)進行斑點印跡,印跡可以與寡聚核苷酸探針相接觸。然后可以檢測探針與擴增的Chr8q24.21區域和/或LD區塊A區域的特異性雜交的存在。等位基因特異性寡聚核苷酸探針與來自受試者的DNA的特異性雜交是與Chr8q24.21和/或LD區塊A有關的多態性位點上的特異性等位基因的指示(參見例如Gibbs,R.等,A^c/e/c^c^si仏,77:2437-2448(1989)和WO93/22456)。通過添加這樣的類似物如鎖核酸(LNAs),引物和探針的大小可以被減小到少至8個堿基。LNAs是一類新的雙環DNA類似物,其中呋喃糖環的2'和4'位置上通過O-亞甲基(氧-LNA)、S-亞甲基(硫代-LNA)或氨基亞甲基(氨基-LNA)基團而連接。所有這些LNA變異體的共同之處是對互補核酸的親和性,這種親和性是到目前為止報道的DNA類似物中最高的。例如,已經顯示特定的全氧-LNA九聚物在與互補的DNA或RNA形成復合物時熔點溫度(Tm)分別為64°C和74°C,與此相反DNA和RNA與相應的DNA形成的九聚體的熔點是28。C。當LNA單體與標準DNA或RNA單體組合使用時,也可以獲得顯著的Tm增加。對于引物和探針來說,根據LNA單體所被包含的位置(例如3'末端、5'末端或在中間),Tm可以顯著增加。在另一個實施方案中,與來自受試者的靶核酸序列片段互補的寡聚核苷酸探針陣列可以被用于鑒定與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸中的多態性。例如,可以使用寡聚核苷酸陣列。寡聚核苷酸陣列一般含有多種不同的寡聚核苷酸探針,它們被連接到基底表面上已知的不同位置。這些寡聚核苷酸陣列、也被描述為"基因芯片TM"、已經在本
技術領域:
內得到了普遍的描述(參見例如美國專利No.5,143,854、PCT專利申請Nos.WO90/15070和92/10092)。這些陣列一般可以使用機械合成方法或光指導的合成方法來生產,后一種方法整合了光刻方法和固相寡聚核苷酸合成方法(Fodor,S.等,S"'e"ce,257:161-113(1991);Pirrung等,美國專利No.5,143,854(也參見出版的PCT申請No.WO90/15070);以及Fodor.S.等,出版的PCT申請No.WO92/10092和美國專利No.5,424,186,每個文獻的全部描述內容在此引為參考)。使用機械合成方法合成這些陣列的技術被描述在例如美國專利No.5,384,261中;其全部描述內容的教導在此引為參考。在另一個例子中,可以使用線性的陣列。一旦制備了寡聚核苷酸陣列,允許感興趣的核酸與陣列雜交。雜交的檢測是感興趣的核酸中特定等位基因的檢測。雜交和掃描一般通過本文描述的方法以及也在例如出版的PCT申請Nos.WO92/10092和WO95/11995、以及美國專利No.5,424,186中描述的方法來進行,這些文獻中每一個的全部描述內容在此引為參考。簡而言之,包含了一或多種以前鑒定的多態性標記物的靶核酸序列,通過現有的擴增方法(例如PCR)被擴增。一般來說這包括了使用與靶序列兩條鏈多態性位點互補的上游和下游的引物序列。也可以使用不對稱PCR技術。然后允許一般掾入了標記物的擴增的靶與陣列,在允許序列特異性雜交發生的適當條件下進行雜交。在陣列的雜交和清洗完成后,對陣列進行掃描以確定陣列上與靶序列雜交的位置。從掃描獲得的雜交數據一般是作為陣列上位置的函數的熒光強度的形式。盡管最初的描述是關于例如用于檢測單個多態性位點的單個檢測塊,但陣列也可以包含多個檢測塊,因此能夠分析多個特定的多態性(例如特定單倍型(例如單倍型)的多個多態性)。在另一種方案中,一般被理解為可以經檢測塊分組成單個陣列或多個分離的陣列,以便在靶與陣列的雜交過程中可以使用不同的、最適的條件。例如,通常需要提供這種方法以分別檢測位于基因組序列的富含G-C區域中的多態性與位于富含A-T區域中的多態性。這允許在每種情況下對雜交條件分別進行最適化。其它關于使用寡聚核苷酸陣列來檢測多態性的描述可以在例如美國專利Nos.5,858,659和5,837,832中發現,二者的全部描述內容在此引為參考。其它的核酸分析方法可以用于檢測與Chr8q24.21和/或LD區塊A有關的多態性基因座上的特定等位基因。代表性的方法包括例如直接的手工測序(Church禾卩Gilbert,尸rac.A^/.Jcfld.tAS"AS/:1991-1995(1988);Sanger,F.,等,尸亂淑/.脂,74:5463-5467(1977);Beavis,等,美國專利No.5,288,644)、自動熒光測序、單鏈構象多態性分析(SSCP)、鉗式變性凝膠電泳(CDGE)、變性梯度凝膠電泳(DGGE)(Sheffield,V"等,尸亂淑/.^cm/.SW."&4,55:232-236(1989))、泳動性遷移分析(Orita,M.,等,JcW.Sc/.S6:2166-2770(1989))、限制性酶分析(Flavell,R.,等,CW/,/5:25-41(1978);Geever,R.,等,尸roc.A^".爿c^/.tASM,75:5081-5085(1981))、異源雙鏈體分析、化學誤配切割(CMC)(Cotton,R.,等,尸rac.7VaW^cflA&〖.55:4397-4401(1985))、RNase保護性分析(Myers,R.,等,6We"ce,"0:1242-1246(1985))、識別核苷酸誤配的多肽例如大腸桿菌mutS蛋白的使用、以及等位基因特異性性PCR。在本發明的另一個實施方案中,在本文描述的遺傳標記物或單倍型導致多肽的組成或表達發生了變化的情況下,對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)的診斷或癌癥易感性的診斷,可以通過檢測由ChrSq24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的表達和/或組成來進行。正如本文所描述的那樣,作圖在Chr8q24.21上的特定基因和預測的基因包括例如POU5FLC20(Genbank獲取號AF268618;己知基因)、Genbank獲取號BE676854(EST)、Genbank獲取號AL709378(EST)、Genbank獲取號BX108223(EST)、Genbank獲取號AA375336(EST)、Genbank獲取號CB104826(EST)、Genbank獲取號BG203635(EST)、Genbank獲取號AW183883(EST)、Genbank獲取號BM804611(EST)、C-MYC(Genbank獲取號NM—002467;已知基因)和PVT1(Genbank獲取號XM—372058;已知基因)。因此,對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的診斷,可以通過檢測這些多肽之一、或另一個由Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的表達和/或組成來進行,在本文描述的情況下本文描述的遺傳標記物或單倍型導致多肽的成分或表達發生了變化。本文描述的顯示出與癌癥具有相關性的單倍型和標記物,通過它們對一個或多個這些鄰近基因的影響,可能扮演了重要角色。影響這些基因的可能機制包括例如影響轉錄、影響RNA剪接、改變不同mRNA剪接形式的相對量、影響RNA的穩定性、影響從核到細胞質的運輸、以及影響翻譯的效率和準確性。Chr8q24.21上的c-myc基因編碼c-MYC蛋白,它是在20多年前作為鳥類髓細胞組織增生反轉錄病毒的病毒癌基因v-myc(Vernistrom等,丄F/ro/ogyW:113-19(1982))的細胞對應物而被鑒定的。c-MYC蛋白是轉錄因子,在用促有絲分裂刺激物處理細胞時能夠被快速誘導。通過異源雙鏈體復合物中的E盒(CACGTG)與名為MAX的蛋白結合,c-MYC調節許多基因的表達。許多由c-MYC調控的基因參與細胞周期控制。c-MYC促進了細胞周期進展,抑制細胞分化,并誘導凋亡。c-MYC對于雙鏈DNA修復也具有負效應(Karlsson,A,等,/Voc.Wa".爿cflAt/W/卯(77」9974-79(2003))。c-MYC也促進血管發生(Ngo,C.V.,等,Ce〃Dzj^r.〃r":201國10(2000);BaudinoT.A.,等,Ge腦Dev.:2530-43(2002))。c-myc基因在體外和體內是高度致瘤的。c-MYC與抑制凋亡的蛋白例如BCL、BCL-XL協調作用,或在轉基因小鼠淋巴瘤生成中的p53或ARF的丟失協同作用(Strasser等,Nature348:331-333(1990);Blyth,K.,等,Oncogene70:1717-23(1990);Elson,A"等,O腳,e77:181-90(1995);Eischen,CM.,等,Ge臘Dev.73:2658-69(1999))。在前列腺癌中可以觀察到c-myc基因的擴增和過量表達,這通常與侵襲性腫瘤、激素不依賴性和不好的預后有關(Jenkins,R.B.,等,Cawcer57卩力524-31(1997);ElGedaily,A.,等,Pm^fl^46f":184-90(2001);Saramaki,O.,等,^附.,PaAo/."外6力2089國94(2001);Bubendorf,L.,等,Cawcer5SY力:803-06(1999))。c-myc和Chr8q24.21區域也可以在前列腺、乳腺和肺部腫瘤以及黑素瘤中發現(BlancatoJ"等,Ca"cer,」:1612-9(2004);Kubokura,H"等,Jw仏7Tzorac.CanZ/ova^c.Swrg.7卩力197-203(2001);Treszl,A.,等,qy/ome^yM5(7力31-46(2004);Kraehn,G.M.,等,5廣CawcerW(7力12-19(2001))。此外,許多其它的腫瘤類型顯示出獲得了該區域,包括結腸、肝、卵巢、胃、腸和膀胱癌。所有腫瘤類型合起來顯示Chr8q24.21是最頻繁被獲得的染色體區域,在所有腫瘤類型中大約17%者卩獲得了(www.progenetix.com)。參與Burkitt's淋巴瘤的癌基因是易位的結果,該易位將c-myc與免疫球蛋白增強子相并置,從而激活了基因的表達(Dalla-Favera,R.,等,A^/.」cW.fAS^7外":7824-27(1982);Taub,R.,等,尸rac.A^/.^c"A5W."&479f":7837-41(1982))。它也通過將人類乳頭瘤病毒(HPV)整合到基因附近參與了宮頸癌。在大多數情況下,HPV整合發生在c-myc基因的跨越500kb的著絲粒和200kb的端粒的區域(Ferber,J.M.,等,Ca腳rC,g,""7W:l-9(2004);Ferber,MJ.,等,O打cogewe":7233-7242(2003))。兩個不穩定位點FRA8C和FRA8D分別在Chr8q24.21上位于c-myc的著絲粒和端粒端。不穩定位點在存在制止DNA合成的試劑的情況下易于斷裂。不穩定位點的復制被認為發生在S期后期,在誘導后甚至更晚。不穩定位點參與染色體的擴增、易位和/或病毒插入可能與這些位點的復制較晚有關,斷裂在中止的復制叉處或接近中止的復制叉處引發(Hellman,A.,等,C騰erCW//:89-97(2002))。本文描述的在LD區塊A中的或與LD區塊A處于強烈LD(被度量為一大于0.2)的標記物或單倍型能夠影響該區域的穩定性,導致c-myc基因或其它鄰近基因的基因擴增的,這是可能的。也就是說,一個人可以從雙親中的一個或兩個繼承到LD區塊A中或與LD區塊A處于強烈LD的區域(被度量為—大于0.2),因此更可能在后來在一個或多個細胞中具有體細胞突變事件,導致癌癥發展成更具侵襲性的形式。因此,在一個實施方案中,本發明的標記物或單倍型(例如與LD區塊A有關的標記物或單倍型)的鑒定可以被用來診斷能夠導致癌癥發展成更具侵襲性形式的體細胞突變事件的易感性。在一個實施方案中,標記物或單倍型不包含位于c-myc開放閱讀框(艮卩NCBIBuild34中的chr8:128,705,092-128,710,260bp)中白勺標記物。在另一個實施方案中,標記物或單倍型不包含位于c-myc啟動子或開放閱讀框中的標記物。在另一個實施方案中,標記物或單倍型不包含位于c-myc啟動子、增強子或開放閱讀框中的標記物。在另一個實施方案中,標記物或單倍型不包含位于c-myc開放閱讀框的lkb、2kb、5kb、10kb、15kb、20kb或25kb之內的標記物。多種方法可以被用于進行這樣的檢測,包括酶聯免疫吸附分析(ELISA)、Western印跡、免疫沉淀和免疫熒光。來自受試者的測試樣品被評估由與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的表達的變化和/或組成的變化的存在。與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的表達的變化可以是例如多肽表達量(即產生的多肽的量)的變化。與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的組成的變化是定性的多肽表達(例如突變多肽或不同剪接的變異體的表達)的變化。在一個實施方案中,對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的診斷,是通過檢測與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的特定剪接變異體或剪接變異體的特定形式來進行的。也可能同時存在這兩種變化(定量的和定性的)。本文中使用的多肽表達或組成的"變化",是指測試樣品中的表達或組成與對照樣品中與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的表達或組成相比的變化。對照樣品是與測試樣品相應的樣品(例如來自同樣類型的細胞),來自不患有癌癥或對癌癥沒有易感性的受試者(例如不具有本文描述的標記物或單倍型的受試者)。相似地,與對照樣品相比,測試樣品中一或多種不同的剪接變異體的存在、或測試樣品中顯然不同量的不同剪接變異體的存在,可能是對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的指示。與對照樣品相比,測試樣品中多肽的表達或組成的變化,可能是在等位基因相對于對照樣品中的參照物改變了剪接位點的情況下特定等位基因的指示。可以使用多種方法檢測與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的表達或組成,包括分光法、比色法、電泳、等點聚焦和免疫分析(例如David等,美國專禾UNo.4,376,110)例如免疫印跡(參見例如CurrentProtocolsinMolecularBiology,特別是第十章,同上)。例如,在一個實施方案中,可以使用能夠結合與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的抗體(例如帶有可檢測的標記物的抗體)。抗體可以是多克隆的也可以是單克隆的。可以使用完整的抗體或其片段(例如Fv、Fab、Fab'、F(ab')2)。對于探針或抗體來說,術語"標記的"打算包含通過將可檢測的物質偶聯(即物理連接)到探針或抗體上對探針或抗體進行直接的標記,以及通過與另一個被直接標記的試劑進行反應來對探針或抗體進行間接的標記。間接標記的例子包括使用標記的第二抗體(例如熒光標記的第二抗體)來檢測最初的抗體,以及用生物素對DNA探針進行末端標記以便它可以用熒光標記的鏈親和素檢測。在這種方法的一個實施方案中,測試樣品中與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的水平或量與對照樣品中與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的水平或量相比較。測試樣品中多肽的水平或量比對照樣品中多肽的水平或量高或低,如果差別顯著的話,是與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的表達發生變化的指示,是負責導致表達差異的特定等位基因的診斷。此外,測試樣品中與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的組成與對照樣品中與Chr8q24.21相關的核酸和/或與LD區塊A相關的核酸所編碼的多肽的組成相比較。在另一個實施方案中,在測試樣品和對照樣品中多肽的水平或量和組成二者都可以被評估。正如本文所描述和例舉的那樣,與Chr8q24.21禾P/或LD區塊A相關的的特定標記物和單倍型(例如單倍型1、單倍型la、含有后面的表中列出的兩個或多個標記物的單倍型)與癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)有關。在一個實施方案中,本發明涉及在受試者中診斷對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的方法,包括篩選與Chr8q24.21相關核酸禾卩/或LD區塊A相關核酸有關的標記物或單倍型,其在患有癌癥或對癌癥易感的(受影響的)受試者中出現頻率比在健康受試者(對照)中出現頻率更高。在該實施方案中,標記物或單倍型的存在是對癌癥易感性的指示。可以使用對與癌癥有關的SNPs禾口/或微衛星的存在進行基因分型的標準技術,例如基于熒光的技術(Chen,X.,等,ies.,化492-498(1999))、PCR、LCR、嵌套PCR和其它用于核酸擴增的技術。在一個實施方案中,該方法包括在受試者中評估與Chr8q24.21和/或LD區塊A有關的并與癌癥和/或癌癥易感性相關的一個或多個特定SNP等位基因和/或微衛星的存在或頻率。在該實施方案中,與健康對照受試者相比過量或較高頻率的等位基因是受試者對癌癥易感的指示。在另一個實施方案中,對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的診斷是通過至少一個與Chr8q24.21有關的等位基因和/或與LD區塊A有關的等位基因的檢測與其它基于蛋白、基于RNA或基于DNA的分析方法(例如其它的癌癥診斷分析方法,包括但不限于PSA分析、癌胚抗原(CEA)分析、BRCA1分析和BRCA2分析)相結合來進行的。這樣的癌癥診斷分析方法在本
技術領域:
內是眾所周知的。本發明的方法也可以與分析受試者的家族史和風險因子(例如環境風險因子、生活方式風險因子)結合使用。正如在本
技術領域:
內所熟知和本文描述的那樣,PSA測試幫助了前列腺癌的早期診斷,但是靈敏度和特異性都不高(Punglia等,ME"g/.WSY力:335-42(2003))。因此,單獨使用PSA測試導致高百分率的假陰性和假陽性診斷,導致在許多情況下漏診癌癥和對未患癌癥者進行不必需的隨后活組織檢查。在一個實施方案中,前列腺癌或對前列腺癌易感性的診斷是通過檢測至少一種與Chr8q24.21有關的等位基因和/或與LD區塊A有關的等位基因以及PSA分析相結合來進行的。試劑盒在診斷方法中使用的試劑盒包含可用于本文描述的任何方法的成分,包括例如雜交探針、限制性酶(例如用于RPLP分析)、等位基因特異性寡聚核苷酸、與Chr8q24.21相關核酸和/或LD區塊A相關核酸編碼的改變的多肽結合的抗體(例如與含有至少一種包括在本文描述的單倍型中的遺傳標記的多肽結合的抗體)、或與Chr8q24.21相關核酸和/或LD區塊A相關核酸編碼的未改變的(天然的)多肽結合的抗體、擴增Chr8q24.21相關核酸和/或LD區塊A相關核酸的方法、分析Chi"8q24.21相關核酸和/或LD區塊A相關核酸的核酸序列的方法、分析由Chr8q24.21相關核酸和/或LD區塊A相關核酸編碼的多肽的氨基酸序列的方法等。此外,試劑盒可以提供與本發明的方法結合使用的分析方法所用的試劑,例如其它癌癥診斷分析方法所用的試劑(例如用于檢測PSA、CEA、BRCA1、BRCA2等的試劑)。在一個實施方案中,本發明是用于分析來自受試者的樣品,以便在受試者中檢測癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)或對癌癥易感性的試劑盒,其中試劑盒中含有一種或多種用于檢測與Chr8q24.21和/或LD區塊A有關的標記物或單倍型的試劑。在具體的實施方案中,試劑盒含有至少一種連續的核苷酸序列,該序列與含有至少一種與Chr8q24.21禾卩/或LD區塊A有關的標記物的區域完全互補。在另一個實施方案中,試劑盒中含有一或多種能夠檢測一或多種特定標記物或單倍型的核酸。在另一個實施方案中,試劑盒中含有一種或多種試劑,其中包含至少一個連續的核苷酸序列,該序列與含有來自表1或表13或下面的另一個表中的至少一種標記物的區域(例如含有至少一種來自表1或表13的標記物的SEQIDNO:l的區域)完全互補。這種連續的核苷酸序列或核酸(例如寡聚核苷酸引物)可以使用作為癌癥或對癌癥易感性指示的SNPs或微衛星側翼的核酸的部分來設計。這樣的核酸(例如寡聚核苷酸引物)被設計用來擴增與癌癥標記物或單倍型有關的Chr8q24.21禾口/或LD區塊A區域。在另一個實施方案中,試劑盒含有一或多種能夠檢測與Chr8q24.21禾口/或LD區塊A有關的特定標記物或單倍型的標記的核酸以及用于檢測標記的試劑。適合的標記包括例如放射性同位素、熒光標記、酶標記、酶輔助因子標記、磁性標記、自旋標記、表位標記。在具體的實施方案中,用試劑盒的試劑檢測的標記物或單倍型包含選自由表13中的標記物的一種或以上的標記物、兩種或以上的標記物、三種或以上的標記物、四種或以上的標記物、五種或以上的標記物。在另一個實施方案中,被檢測的標記物或單倍型含有rsl447295等位基因A和/或DG8S737等位基因-8。在這樣的實施方案中,標記物或單倍型的存在是對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的指示。與Chr8q24.21相關的前列腺癌的診斷盡管診斷方法已經在診斷對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的上下文中進行了大概的描述,該方法也可以用于診斷與Chr8q24.21相關的癌癥(例如與Chr8q24.21相關的前列腺癌、與Chr8q24.21相關的乳腺癌、與Chr8q24.21相關的肺癌、與Chr8q24.21相關的黑素瘤)。例如,可以對患有癌癥的個體進行評估以確定在個體中,在與Chr8q24.21有關的核酸和/或與LD區塊A有關的核酸中是否存在多態性,和/或個體中單倍型的存在是否可能是個體癌癥的貢獻因素。在本文中使用的術語"與Chr8q24.21相關的癌癥"、"與Chr8q24.21相關的前列腺癌"、"與Chr8q24.21相關的乳腺癌"、"與Chr8q24.21相關的肺癌"、"與ChrSq24.21相關的黑素瘤"是指在Chr8q24.21相關的核酸序列中或具有與Chr8q24.21有關的單倍型中具有多態性的受試者中,癌癥、或特定形式的癌癥的發生。與Chr8q24.21相關的癌癥(例如與Chr8q24.21相關的前列腺癌、與Chr8q24.21相關的乳腺癌、與Chr8q24.21相關的肺癌、與Chr8q24.21相關的黑素瘤)的鑒定便利了治療計劃,因為治療可以被設計,可以選擇靶向適合的、與Chr8q24.21相關的基因或蛋白的治療方案在本發明的一個實施方案中,與Chr8q24.21相關的癌癥(例如與Chr8q24.21相關的前列腺癌、與Chr8q24.21相關的乳腺癌、與Chr8q24.21相關的肺癌、與Chr8q24.21相關的黑素瘤)的診斷是通過檢測與Chr8q24.21相關的核酸中的多態性來進行的(例如使用本文中描述的方法和/或本
技術領域:
中現有的其它方法)。在本文中描述了與Chr8q24.21相關的核酸序列中特定的多態性(參見例如表1和表13)。為了確定癌癥是否與Chr8q24.21有關,從患有癌癥的受試者獲得基因組DNA、RNA或cDNA測試樣品。然后對DNA、RNA或cDNA樣品進行檢測,以確定與Chr8q24.21有關的核酸序列中是否存在多態性。如果與Chr8q24.21有關的核酸序列有多態性,該多態性的存在是與Chr8q24.21有關的癌癥的指示。例如在一個實施方案中,可以使用雜交方法例如Southern分析、Northern分析或原位雜交來檢測多態性。在其它實施方案中,可以使用限制性酶消化突變分析或序列分析,等位基因特異性寡聚核苷酸或定量PCR(動力學熱循環)方法也可以使用。與Chr8q24.21有關的癌癥的診斷也可以通過檢測與Chr8q24.21有關的核酸編碼的多肽的表達和/或組成來進行,這可以使用各種方法,包括酶聯免疫吸附分析(ELISAs)、Western印跡、免疫沉淀和免疫熒光。來自受試者的測試樣品被評估與Chr8q24.21有關的核酸編碼的多肽的表達的變化和/或組成的變化的存在,或與Chr8q24.21有關的核酸編碼的特定變異體的存在。與Chr8q24.21有關的核酸編碼的多肽的表達的變化可以是例如多肽表達的定量的變化(即產生的多肽的量);與Chr8q24.21有關的核酸編碼的多肽的組成的變化是多肽表達的定型的變化(例如與Chr8q24.21有關的多肽或不同的剪接變異體的表達改變)。在其它的實施方案中,本發明涉及通過鑒定在本文中詳細描述的與Chr8q24.21有關的標記物或單倍型的存在,在受試者中診斷和鑒定與Chr8q24.21相關的癌癥(例如與Chr8q24.21相關的前列腺癌、與Chr8q24.21相關的乳腺癌、與Chr8q24.21相關的肺癌、與Chr8q24.21相關的黑素瘤)的方法。例如,在本文表1、2、4、5和13中描述的標記物和/或單倍型在患有癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)的受試者中比在未受癌癥影響的受試者中出現得更加頻繁。因此,這些標記物和/或單倍型對于檢測與Chr8q24.21相關的癌癥具有預測價值。在一個實施方案中,對于檢測與Chr8q24.21相關的癌癥具有預測價值的標記物和/或單倍型包含選自表13中的標記物的的一或多種標記物。在另一個實施方案中,對于檢測與Chi"8q24.21相關的癌癥具有預測價值的標記物和/或單倍型包含選自DG8S737等位基因-8和rsl447295等位基因A的一或多種標記物。在其它實施方案中,對于檢測與Chr8q24.21相關的癌癥具有預測價值的單倍型含有單倍型1或單倍型la。本文描述的方法可以用于評估來自受試者的樣品中標記物或單倍型的存在與否;標記物或單倍型的存在是與Chr8q24.21相關的癌癥的指示。正如在本
技術領域:
中所熟知的那樣,個體對于特定的治療方案(例如治療藥劑)可能有不同的反應。不同的反應的基礎可能部分是由遺傳決定的。因此,在一個實施方案中,標記物或單倍型的存在是對特定治療方式的不同反應率的指示。這意味著在Chr8q24.21上帶有標記物或單倍型的癌癥病人對用于治療癌癥的特定治療方法、抗激素藥物和/或放射療法將有較好的或較差的反應。因此,標記物或單倍型的存在與否能夠幫助決定對于癌癥病人應該使用何種治療。例如,對于新被診斷的前列腺癌病人來說,可以評估Chr8q24.21上標記物或單倍型的存在(例如通過本文描述的方法檢測從血液樣品衍生的DNA)。如果病人在Chr8q24.21上對標記物或單倍型陽性(也就是說存在標記物或單倍型),那么醫生可以推薦一種特定治療方法,而如果病人對標記物或單倍型陰性,那么可以推薦不同的治療過程(可以包括推薦不進行立即治療,而是連續監測前列腺癌的發展)。因此,病人的攜帶狀態可以被用于幫助確定是否應該使用特定的治療方式(例如化療試劑、抗激素試劑、放射治療)。本發明的核酸和多肽本文描述的核酸和多肽可以用于診斷對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的方法中,以及用于這樣的診斷的試劑盒中。本文使用的"分離的"核酸分子是指已經與通常位于基因或核苷酸序列兩側(像在基因組中那樣)的核酸分離開來,并且/或已經從其它被轉錄的序列(例如在RNA文庫中那樣)中完全或部分純化的核酸分子。例如,本發明的分離的核酸可以是對其天然存在的復雜細胞環境來說、或通過重組技術生產時對培養基來說、或化學合成時對化學前體或其它化學物質來說是基本上被分離的。在某些情況下,分離的物質將構成組合物(例如含有其它物質的粗提液)、緩沖系統或試劑混合物的一部分。在其它情況下,物質可以被純化到基本上均一,例如通過聚丙烯酰胺凝膠電泳(PAGE)或柱層析(例如HPLC)所確定的那樣。本發明的分離的核酸分子可以含有存在的所有大分子物質的至少大約50%、至少大約80%或至少大約90%(在物質的量的基礎上)。對于基因組DNA來說,術語"分離的"也可以指從與基因組DNA天然相關的染色體上分離開的核酸分子。例如,分離的核酸分子可以含有在核酸分子所來自的細胞的基因組DNA中位于核酸分子的兩側的少于大約250kb、200kb、150kb、100kb、75kb、50kb、25kb、10kb、5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸。核酸分子可以與其它編碼或調節序列融合并仍然被認為是分離的。因此,載體中包含的重組DNA被包含在本文所用的"分離的"的定義中。分離的核酸分子也包括了異源宿主細胞或異源生物體中的重組DNA分子,以及溶液中的部分或基本上純化的DNA分子。"分離的"核酸分子也包括本發明的DNA分子的體內和體外RNA轉錄本。分離的核酸分子或核苷酸序列可以包括通過化學或重組手段合成的核酸分子或核苷酸序列。這樣的分離的核苷酸序列可用于例如生產編碼的多肽、作為探針用于分離同源序列(例如從其它哺乳動物的種類中)、用于基因作圖(例如通過與染色體進行原位雜交)、或用于檢測組織中(例如人類組織)基因的表達,例如通過Northern印跡分析或其它雜交技術。本發明還涉及在高度嚴緊雜交條件例如用于選擇性雜交的條件下,與本文描述的核苷酸序列雜交的核酸分子(例如與含有與本文描述的單倍型有關的多態性位點的核苷酸序列雜交的核酸分子)。在--個實施方案中,本發明包括了在高度嚴緊的雜交和清洗條件下(例如用于選擇性雜交的條件下),與含有SEQIDNO:l或其片段的核苷酸序列(或含有SEQIDNO:l或其片段的互補序列的核苷酸序列)雜交的變異體,其中核苷酸序列含有至少一種包含在本文描述的單倍型(例如單倍型)中的多態性等位基因。這樣的核酸分子可以通過等位基因或序列特異性雜交(例如在高度嚴緊條件下)來檢測和/或分離。核酸雜交的嚴緊條件和方法在CurrentProtocolsinMolecularBiology(Ausubel,F.等,"CurrentProtocolsinMolecularBiology",JohnWiley&Sons,(1998))的2.10.1-2.10.16和6.3.1-6.3.6的頁面中以及Rraus,M.和Aaronson,S"淑Wsfw"mo/,2卯:546-556(1991)中有解釋,其全部內容在此引為參考。兩條核苷酸或氨基酸序列的百分一致性可以通過以最適合比較的目的對序列進行比對(例如可以在第一個序列的序列中引入間隙)來確定。然后比較對應位置的核苷酸或氨基酸,兩個序列之間的百分一致性是序列所共有的一致的位置數目的函數(即%—致性=一致的位置的數目/總的位置數目x100)。在某些實施方案中,出于比較目的而比對的序列的長度是對照序列的長度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%。兩條序列的準確比較可以通過眾所周知的方法來完成,例如使用數學算法。這樣的數學算法的非限制性的例子被描述在Karlin,S.和Altschul,S.,尸roc.A^/.90:5873-5877(1993)中。這種算法被整合在NBLAST和XBLAST程序(2.0版)中,如同在Altschul,S.等,AW"c爿c!Wsies.,25:3389-3402(1997)中描述的那樣。當使用BLAST和GappedBLAST程序時,可以使用相應程序(例如NBLAST)的默認參數。參見萬維網上的網點ncbi.nlm.nih.gov。在一個實施方案中,序列比較的參數可以被設置為分值=100、詞長度=12,或者也可以改變(例如W=5或\¥=20)。用于序列比較的數學算法的另一個非限制的例子是Myers和Miller的算法CABIOS(1989)。這種算法被整合到ALIGN程序(2.0版本)中,它是GCG序列比對軟件包的一部分。當使用ALIGN程序比較氨基酸序列時,可以使用PAM120權重殘余表(weightresiduetable)、間隙長度罰分12和間隙罰分4。其它用于序列分析的算法在本
技術領域:
中是熟知的,包括在Torellis,A.禾卩Robotti,C,Com/w/./0:3曙5(1994)中描述的ADVANCE禾BADAM,以及在Pearson,W.禾口Lipman,D.,/Voc.A^/.^o^.OS"A55:2444-48(1988)中描述的FASTA。在另一個實施方案中,兩個氨基酸序列之間的百分一致性可以使用GCG軟件包(Accelrys,Cambridge,UK)中的GAP程序來完成,使用Blossom63矩陣或PAM250矩陣,間隙權重為12、10、8、6或4,長度權重為2、3或4。在另一個實施方案中,兩個核酸序列之間的百分一致性可以使用GCG軟件包中的GAP程序來完成,使用間隙權重50和長度權重3。本發明也提供了分離的核酸分子,其中包含的片段或部分可以在高度嚴緊條件下與含有SEQIDNO:l或其片段或由SEQIDNO:l或其片段組成的核酸(或含有SEQIDNO:l或其片段或由SEQIDNO:l或其片段組成的互補序列的核苷酸序列)雜交,其中的核苷酸序列含有至少一個在本文描述的單倍型(例如單倍型)中包含的多態性等位基因。本發明的核酸片段長度為至少大約15、至少大約18、20、23或25個核苷酸,可以是30、40、50、100、200、500、1000、10000或以上的核苷酸長。本發明的核酸片段在例如本文描述的分析方法中被用作探針或引物。"探針"或"引物"是以堿基特異性的方式與核酸分子的互補鏈雜交的寡聚核苷酸。除了DNA和RNA之外,這種探針和引物包括在Nielsen,P.等,2^:1497-1500(1991)中描述的多肽核酸(PNA)。探針或引物含有的核苷酸序列區域可以與含有來自SEQDDNO:l的連續的核苷酸序列、并含有包含在本文描述的一個或多個單倍型中的至少一個等位基因及其互補序列的核酸分子的至少大約15個、典型大約20-25個、在某些情況下大約40、50或75個連續的核苷酸雜交。在具體的實施方案中,探針或引物可以含有100個或更少的核苷酸;例如在某些情況下從6到50個核苷酸,或例如從12到30個核苷酸。在其它的實施方案中,探針或引物與連續的核苷酸序列或連續的核苷酸序列的互補序列具有至少70%的一致性、至少80%的一致性、至少85%的一致性、至少90%的一致性或至少95%的一致性。在另一個實施方案中,探針或引物能夠與連續的核苷酸序列或連續的核苷酸序列的互補序列選擇性地雜交。通常情況下,探針或引物還含有標記物,例如放射性同位素、熒光標記物、酶標記物、酶輔助因子標記物、磁性標記物、自旋標記物、表位標記物。本發明的核酸分子例如上面描述的那些,可以使用標準的分子生物學技術和SEQIDN0:1中提供的序列信息來鑒定和分離。總的來說可以參見《PCR技術DNA擴增的原理和應用》(PCRTechnology:PrinciplesandApplicationsforDNAAmplification)(H.A.Erlich主編,FreemanPress,NY,NY,1992);《PCR方案方法和應用指南》(PCRProtocols:AGuidetoMethodsandApplications)(Innis,等主編,AcademicPress,SanDiego,CA,1990);Mattila,P.等,M/c/e/d油to.,/9:4967-4973(1991);Eckert,K.禾口Kunkel,T.,尸C7M"WsWy^p//c""o"s,7:17-24(1991);PCR(McPherson等主編,IRLPress,Oxford);和美國專利4,683,202,這些文獻中的每個的全部內容在此引為參考。其它適合的擴增方法包括連接酶鏈反應(LCR;參見Wu,D.和Wallace,R.,G飾m.cs,4:560-469(1989);Landegren,U.等,Scfe打ce,2乾.1077-畫0(1988))、轉錄擴增(Kwoh,D.等,尸亂胸/ifl""..園,組173-1177(1989))、自維持的序列復制(Guatelli,J.等,尸麼A^.JcaAS7:1874-1878(1990))和基于核酸的序列擴增(NASBA)。后兩種擴增方法包含基于等溫轉錄的等溫反應,都產生單鏈RNA(ssRNA)和雙鏈DNA(dsDNA)作為擴增產物,比率分別為大約30和100比1。擴增的DNA可以被標記(例如放射性標記)并用作探針來篩選來自人類細胞的cDNA文庫。cDNA可以來自mRNA,并包含在zapexpress(Stratagene,LaJolla,CA)、ZIPLOX(GibcoBRL,Gaithesburg,MD)或其它適合的載體中。相應的克隆可以被分離,在體內切除后可以獲得DNA,然后可以通過本領域所熟知的方法從一個或兩個方向對克隆到的插入片段進行測序,以鑒定為具有適合的分子量的多肽編碼的正確的開放閱讀框。例如,本發明的核酸分子的核苷酸序列的直接分析可以通過商業化的眾所周知的的方法來完成。參見例如Sambrook等,《分子克隆實驗指南》(MolecularCloning,ALaboratoryManual)(第二版,CSHP,NewYork1989);Zyskind等,《重組DNA實驗室指南》(RecombinantDNALaboratoryManual)(Acad.Press,1988)。此外,熒光方法也可用于分析核酸(Chen,X.等,Ge"ome化492-498(1999))和多肽。使用這些或類似的方法,多肽和編碼多肽的DNA可以被分離、測序和進一步定性。一般來說,本發明的分離的核酸序列可以被用作Southern凝膠上的分子量標準,以及被標記用來對相關基因位置進行作圖的染色體標準。核酸序列也可以被用來與病人中內源的DNA序列進行比較,以鑒定癌癥或對癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)的易感性,以及作為探針,以例如雜交和發現相關的DNA序列或從樣品中消減已知的序列(例如消減雜交)。核酸序列還可以被用來產生用于遺傳指紋分析的引物、用來使用免疫技術產生抗多肽的抗體、和/或作為抗原來產生抗DNA抗體或引發免疫反應。在本文中使用時,當氨基酸序列至少大約45-55%同源或一致時,兩個多肽(或多肽的區域)是基本上同源或一致的。在其它的實施方案中,當氨基酸序列至少大約70-75%、至少大約80-85%、至少大約90%、至少大約95%同源或一致、或完全一致時,兩個多肽(或多肽的區域)是基本上同源或一致的。根據本發明,基本上同源的氨基酸序列是由含有SEQIDNO.l或其片段、并含有表1中顯示的至少一個多態性的核酸分子所編碼的,其中的編碼核酸能夠與SEQIDNO.l在嚴緊條件下雜交,正如本文所具體描述的那樣。現在,本發明將通過下面的實施例進行描述,這些實施例不以任何方式構成限制。所有本文引用的出版物的相關內容中以前沒有被引為參考的,在此以其全文引為參考。實施例1與癌癥有關的區域的鑒定研究染色體8q24.21上的區域被鑒定能夠造成對特定癌癥(例如前列腺癌)的增加的風險。該區域首先是通過對與乳腺癌病例緊密相關的前列腺癌病人的前列腺癌(PrCa)家族進行連鎖分析而檢測到的。遺傳學,究^涉i游瘋乂自從1955年以來被診斷患有前列腺癌的病人群體包括3123個病人,其中大約三分之一在研究時還活著。被診斷患有乳腺癌的病人群體包括4045個病人。在進行研究時招募了大約950個前列腺癌病人。我們最初對發現對前列腺癌和乳腺癌都有貢獻的基因感興趣。因此,我們針對譜系數據庫運行了我們招募的病人的名單以覆蓋整個冰島。我們僅僅涵蓋了具有最多涉及6次減數分裂(6次減數分裂分離第二代表親)的至少兩個前列腺癌病人、并同時包含至少一個與前列腺癌病人有很近親緣(最多3次減數分裂)的乳腺癌病人的家族(對于乳腺癌病人我們沒有使用DNA或基因分型,我們僅僅通過親屬中乳腺癌的狀態來設法分離我們的前列腺癌組)。這些標準產生了75個大的家族,含有167個前列腺癌病人。兩個前列腺癌病人之間的最遠距離是6次減數分裂,但是平均距離是3.5次減數分裂。基厲資范房游占蘇譜系數據庫被用于產生含有兩個或以上前列腺癌病人和至少一個與兩個前列腺癌病人的親緣關系在3次減數分裂事件(代)以內的乳腺癌病人的家族。對75個擴展家族中的167個前列腺癌病人進行了基因組范圍的掃描。步驟與Gretarsd6ttir,等,/i/"mGe"e,.,7(Y":593-603(2002)中描述的相似。簡單來說,使用含有1200個微衛星標記物、平均分辨率為3cM的框架標記物組對DNA進行基因分型。在簽署了由冰島數據保護機構和國家生物倫理委員會批準的知情同意表之后,研究中的受試者被抽取45mL血液。使用被調整成適合于高通量的Qiagen提取方法從全血中分離DNA。微衛星篩選組使用熒光標記的引物,所有的標記物通過多重PCR反應進行大規模試驗以最適化收率。基因分型的錯誤率低于0.2%,這是基于對超過5000個用本框架標記物組進行兩次基因分型的個體的基因型的比較得出的。使用Cyberlab機器人進行PCR擴增并合并,使用的反應體積為51,其中含有20ng基因組DNA。使用DAC程序自動或手動地調用等位基因,并使用deCODE-GT程序按照質量進行分離并編輯調用的基因型(Palsson,B.,等,Gewo/weie&,9"0」1002-1012(1999))。從多于30000個參與deCODE遺傳學各種疾病項目的基因組范圍研究的冰島人組中,建立起群體中標記物等位基因的頻率。基因座中被基因分型的微衛星標記物是可以公開獲得的或在deCODE遺傳學項目中設計的;那些標記物用DG標注指明。DNA序列中的重復被鑒定,這允許我們選擇和設計在基因座上均勻地間隔開的的引物。重復序列和相對于其它標記物的位置的鑒定是基于deCODE遺傳學項目的物理作圖組的工作。對于在基因組范圍掃描中使用的標記物來說,遺傳位置從deCODE遺傳學項目構建的最近發表的高分辨率遺傳圖譜(HRGM)(KongA.,等.,胸Gew",3/:241-247(2002))中獲得。其它標記物的遺傳位置或者從HRGM獲得,如果可用的話,或者通過對為本特定的連鎖研究進行基因分型的家族的材料使用與構建HRGM圖譜中使用的同樣的遺傳作圖方法來獲得。連敏分析游統^學方法連鎖分析使用Allegro軟件(Gudbjartsson等,A^z,.Z5:12-3,(2000p進行,它通過使用非參數性的、僅受影響的、等位基因共享的方法(沒有指定任何特定的疾病遺傳模型)來確定相關病人間過量的共享的統計學重要性。Allegro是deCODE遺傳學項目開發的連鎖程序,在多點計算的基礎上計算LOD分值。我們的基線連鎖分析使用Spairei十分函數(Whittemore,A.S.和Halpern,J.,腸m欲/cs50:118-27(1994);EruglyakL,等,」m5&1347-63,(1996))、指數等位基因共享模型(Kong,A.禾PCox,N.J.,i/ww.(57:1179-88(1997))和家族加權方案,它在對數標度上處于每個被影響的對同等加權和每個家族同等加權之間的途中。在分析中,所有沒有患病的被基因分型的個體作為為"未知的"被處理。因為關注小樣品的行為,我們用兩種不同的方法計算了相應的p值以進行比較。第一個p值是根據大樣品理論來計算的;Z'產麵ge(10)LOD),基本上如在沒有連鎖的零設假設下標準的正態分布那樣分布。第二個p值是通過將觀察到的LOD分值與原假設下它的完全數據取樣分布進行比較來計算的。當數據組由多于幾個家族組成時,這些兩個p值趨于非常相似。所有LOD分值大于2的建議基因座用一些額外的標記物進行追蹤,以增加家族中共享的信息并減少LOD分值代表假陽性連鎖的機會。所用的信息計算由Nicolae定義(D.L.Nicolae,論文,UniversityofChicago(1999)),是Allegro程序輸出結果的一部分。該計算與以前由Dempster等(Dempster,A.P.,等,,兄腦.Soc.39:1-38(1977))描述的經典的信息計算方法緊密相關;當標記物的基因型完全不提供信息時,信息等于零,而如果基因型確定了受影響的親屬中后裔所共享的等位基因的準確的量,信息等于l。使用具有4cM的平均標記物間隔的框架標記物組,在用于我們的連鎖分析的家族中一般可以產生大約0.7的信息含量。將標記物密度增加到每個分摩1個標記物時,通常可以將信息含量增加到0.85以上。/^關性與卓譜星^分析游-統^學方^對于與疾病的單個標記物相關性來說,Fisher確切條件檢驗可以被用來計算每個個體等位基因的兩邊的p值。在顯示結果時,對于微衛星、SNPs和單倍型來說,我們使用了等位基因頻率而不是攜帶者頻率。單倍型分析使用我們在deCODE開發的被稱為NEMO(NEstedModels)(Gretarsd6ttir,等,淑2,(9"力(7」131-8)的計算機程序來進行。NEMO被用于研究標記物一標記物之間的相關性和計算標記物之間的連鎖不平衡(LD),以及用于病例對照單倍型分析。使用NEMO,可以通過最大似然性估算單倍型頻率,并使用通用化的似然比測試來檢驗病人和對照之間的差別。被觀察數據的最大似然性估計值、似然比和P值在EM算法的幫助下被直接計算,因此由于階段的不確定性和遺漏的基因型所引起的信息的丟失被似然比自動地捕獲,在大多數情況下,大樣品理論可以被用來可靠地確定統計學顯著性。等位基因或單倍型的相對風險(RR)、即等位基因與同樣標記物的所有其它等位基因相比的風險,可以使用假定的乘法模型(Terwilliger,J.D.禾QOtt,J.檢測等位基因關聯性的基于單倍型的"單倍型相對風險"方法(Ahaplotype-based'haplotyperelativerisk'approachtodetectingallelicassociations.)T/謂.i/erec/.42,337-46(1992)禾口Falk,CT.禾卩Rubinstein,P.單倍型相對風險構建用于風險計算的適合的對照樣品的容易可靠的方法(H叩lotyperelativerisks:aneasyreliablewaytoconstructapropercontrolsampleforriskcalculations.)Hww.GewW.5/(Pt3),227-33(1987))和群體可歸因風險(PAR)來計算。在單倍型分析中,將單倍型合為一組并將該組作為整體來測試與疾病的相關性,可能是有用的。使用NEMO做到這一點是可能的。通過對所有可能的單倍型組進行分配定義了模型,其中同樣的組中的單倍型被假定引起同樣的風險,而不同組中的單倍型可以引起不同餓。當另一種假說對應于虛設假說來說劃分得更為精細時,這兩種假說被說成是嵌套。NEMO在劃分單倍型空間時能夠提供完全的靈活性。通過這種方式,測試多個單倍型共同的關聯性以及測試不同的單倍型是否引起不同的風險,是有可能的。作為LD的度量,我們使用了兩種LD的標準定義,ID'I和R2(Lewontin,R.,49:49-67(1964)禾口HillW.G.和A.Robertson,7Tz亂柳/.G潔/,":226-231(1968)),它們對于LD的量提供了補充的信息。為了估計ID'I和R2,使用最大似然性方法估算了所有兩個等位基因組成的單倍型組合的頻率,使用似然比測試評估與連鎖不平衡的偏差。通過對用臨界等位基因可能性加權的兩個標記物的所有可能的等位基因的組合的值進行平均,ID"和W的標準定義被擴展到包含了微衛星。可以從在一滴LOD中被基因分型的密集的標記物組構建出的可能的單倍型的數量非常巨大,即使在病人和對照組中實際觀察到的單倍型的數量比這小得多,測試所有這些單倍型與疾病的關聯性仍然是一項艱難的任務。應該注意到,我們沒有將我們的分析限制于從一組連續的標記物構成的單倍型,因為某些標記物可能是非常易突變的,可能將由周圍的標記物構成的原本非常保守的單倍型分割開來。在本研究中,只有跨度小于300kb的單倍型被考慮在內。錄榮正如本文所描述的那樣,染色體8q24.21的區域被鑒定為引起了對特定癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)的增加的風險。與對癌癥增加的風險有關的特定單倍型和標記物被描述在表1中。正如表1中所示,單倍型包含了下列標記物(例如SNP、微衛星)和等位基因SG08S6863等位基因、SG08S7102等位基因、DG8S737-8等位基因、SG08S6874等位基因、SG08S7171等位基因、SG08S6642等位基因、SG08S7222等位基因、SG08S6892等位基因、SG08S6904等位基因、SG08S7204等位基因、DG8S17691等位基因、SG08S6912等位基因和DG8S1407-1等位基因。單倍型位于128,417,467和128,511,854bp(NCBIBuild34)之間的我們稱為LD區塊A中,每個標記物的位置指示在表1中。表1<table>tableseeoriginaldocumentpage81</column></row><table>*單倍型中SNPs的解碼的等位基因編碼如下1=A,2=C,3=G,4=T;對于微衛星等位基因來說,CEPH樣品(Centred'EtudesduPolymorphismeHumain,基因組學庫,CEPH樣品1347-02)被用作參考,該樣品中每個微衛星的較短的等位基因被設置為0,其它樣品中所有其它的等位基因相對T該參考編號。因此,例如等位基因1比CEPH樣品中較短的等位基因長1bp,等位基因2比CEPH樣品中較短的等位基因長2bp,等位基因3比CEPH樣品中較短的等位基因長3bp,依此類推,等位基因-1比CEPH樣品中較短的等位基因短lbp,等位基因-2比CEPH樣品中較短的等位基因短2bp,依此類推。INDEL是指插入(IN)或缺失(DEL),MNR=單核苷酸重復。20068002516LX轉溢也被70/1365t為了發現這些與癌癥相關的單倍型,首先使用前列腺癌和乳腺癌分離的家族進行基因組范圍的連鎖掃描。使用那些標準,總共167個前列腺癌病人共計與75個家族有關。圖l描述了連鎖掃描的結果,并詳述了在Chr8q24上看到的峰。具體來說,連鎖掃描顯示了Chr8q24上基因組范圍內分值為4.0的顯著的LOD分值。染色體8上的峰值標記物是D8S1793,在從標記物DG8S507到標記物D8S1746的區域中、或125,594,794-135,199,182bp(NCBIBuild34)的區域中LOD分值下降了l個單位。該區域用352個微衛星標記物和73個SNP標記物進行基因分型,平均密度為每22.8kb—個標記物。對從前列腺癌病例和對照獲得的基因型進行關聯性分析產生了與前列腺癌顯著相關的標記物和單倍型(圖2,表2-5)。前列腺癌、乳腺癌、肺癌、黑素瘤和良性前列腺肥大的結果被詳細描述在表2到5中。與前列腺癌有關的單倍型區域中的LD結構被顯示在圖3A和3B中。結構是從HAPMAP數據14版衍生而來的。具體來說,包含了單倍型1的LD區塊被顯示在圖3A左部,由水平的箭頭指示。該LD區塊(LD區塊A)位于Chr8q24.21上,在位于128,417,467bp的標記物rs7841228和位于128,511,854bp的標記物rs7845403之間,長度大約為95kb。現在已經進一步將LD區塊A定位在Chr8q24.21的128,414,000bp和128,516,000bp之間。LD結構被看作是在圖中被紅色和藍色所指示的標記物之間具有高的一和ID'I的DNA區塊。在圖3A中標記物以任何兩個標記物之間相同的距離標注,但是在圖3B中,以NCBIBuild34的坐標(標記物間的實際距離)標注。圖4顯示了冰島前列腺癌病人組和對照組中與前列腺癌、乳腺癌、肺癌和黑素瘤有關的單倍型區域中的LD區塊。該區塊結構中大部分的標記物對具有高的|D'|(p'l〉0.S),標記物對的?最多達到1。該區域中包含了重組事件,正如在圖3中可以很好地看到的棋盤圖案所顯示的那樣。該區塊結構中的標記物也與多達200kb遠的較遠的標記物(包括在128515000bps的標記物(rs7845403、rs6470531和rs7829243)和PVT1基因區域中的128720000bps附近的標記物(rsl0956383和rs6470572))具有中度的相關性(一小于0.2)。正如本文所描述的那樣,作圖在人類基因組染色體8q24.21中的基因和預測的基因包括已知的基因POU5FLC20(Genbank獲取號AF268618)、C-MYC(Genbank獲取號NM002467)和PVTKGenbank獲取號XM—372058),以及預測的基因(例如GenbankAccessionNos.BE676854、AL709378、BX108223、AA375336、CB104826、BG203635、AW183883和BM804611)。正如圖5中所描述的那樣,本發明的標記物和單倍型位于兩個已知的基因之間,即POU5FLC20/AF268618和C-MYC(來自www.genome.ucsc.edu網點上的USCS基因組瀏覽器Build34)。與該區域和癌癥有關的標記物或單倍型中存在的變異可能影響附近的基因例如POU5FLC20、c-MYC、PVT1禾卩/或其它該區域中已知、未知或預測的基因的表達。此外,這些變異可能影響RNA或蛋白的穩定性,或可以產生結構上的結果、以至于在單倍型攜帶者中該區域更傾向于體細胞重排。這與在很大百分率的癌癥、包括但不限于前列腺癌、乳腺癌、肺癌和黑素瘤中Chr8q24.21被擴增(www廁genetix.函)相一致。事實上,Chr8q21-24是所有包含的癌癥中(大約17%)和前列腺癌中(大約20%)最頻繁被獲得的染色體區域(www.T3rogenetix.com)。因此,存在的變異能夠影響直接與本文描述的單倍型相關的未被定性的基因,或能夠影響不直接與本文描述的單倍型相關的鄰近的基因。表2描述了一個單倍型——單倍型1(SG08S6863等位基因、DG8S737-8等位基因、SG08S6874等位基因、SG08S7171等位基因、SG08S6642等位基因、DG8S17610等位基因、SG08S7222等位基因、SG08S6892等位基因、SG08S6904等位基因、SG08S7204等位基因、DG8S17691等位基因、SG08S6912等位基因、DG8S1407-1等位基因),并顯示出該單倍型增加了對前列腺癌的風險,以及對侵襲性前列腺癌(由組合的Gleason分值7(4+3)-10所定義)的較大的風險。該單倍型在第二組冰島前列腺癌病例和新的對照組中被復制。正如在表2中所描述的那樣,單倍型1被21.4%的前列腺癌病人和11.8%的對照者所攜帶。單倍型1攜帶者患有前列腺癌的相對風險是1.92(p值=1.71xl(T8)。值得注意的是等位基因頻率被顯示在所有表中,它們大約是攜帶者頻率的一半。Gleason分值是最經常使用的前列腺癌分級系統(DeMarzo,A.M.等,丄a"c^M/:955-64(2003))。該系統是基于這樣一個發現,即前列腺癌的預后介于最主要的癌癥形式和第二主要的癌癥形式的預后之間。Id。在來自前列腺腫瘤的組織學樣品中鑒定這些最主要和第二主要的形式,每個按照從l(分化最大)到5(分化最小)分級,并將兩個分值相加。因此,合并的Gleason等級、也被稱為Gleason和或分值,從2(與形式1一致的腫瘤)到10(未分化的腫瘤)。大多數特別是在活組織針檢中具有趨異模式的病例,其差別不超過一種模式。Id。Gleason分值是一種預后指標,主要的預后變化在6到7之間,當Gleason分值為7時腫瘤的行為更糟,分值為5或6的腫瘤相比導致更多的發生率和更高的死亡率。分值為7的腫瘤還可以進一步亞分類為3+4或4+3(第一個數字是活組織檢測的腫瘤樣品中最主要的組織學亞類,第二個數字是第二主要的組織學亞類),分值4+3與較壞的預后有關。病人的Gleason分值也影響治療選擇。例如,在活組織針檢中具有有限的Gleason分值5-6和低的PSA濃度的較年輕男性可以僅僅被監測,而Gleason分值為7或以上的男性通常需要接受主動的管理。在表2中,顯示了單倍型的頻率和侵襲性前列腺癌(即組合的Gleason分值7(4+3)到10所指示的)以及侵襲性較低的前列腺癌(即組合的Gleason分值2到7(只是3+4)所指示的)的相關風險。但是,Gleason分值不是完美的預后預測指標。因此,具有低Gleason分值腫瘤的病人仍然可能具有更具侵襲性的前列腺癌(被定義為腫瘤超出了前列腺的局部范圍或遠距離轉移)。<table>tableseeoriginaldocumentpage85</column></row><table>與單倍型1的某些單個標記物有關的風險和顯著性(在表2的表頭中列出的)與單倍型1的類似。表3列出了這些標記物以及與它們有關的風險。表3:與前列腺癌有關的單個標記物的頻率和風險<table>tableseeoriginaldocumentpage86</column></row><table>使用較少的微衛星標記物檢測的與單倍型1高度相關的單倍型與其它形式的癌癥(例如乳腺癌、肺癌、黑素瘤)的增加的風險有關。表4顯示了該單倍型(含有DG8S737-8等位基因、DG8S17691等位基因和DG8S1407-1等位基因的單倍型la)顯著地(單邊p-值0.05)增加了患有前列腺癌、高Gleason(侵襲性的)前列腺癌、乳腺癌、肺癌、黑素瘤和惡性皮膚黑素瘤的風險,但是沒有增加患有原位黑素瘤的風險。單倍型la分別被22.2%、16.0%、15.4%和18.0%的前列腺癌、乳腺癌、肺癌和黑素瘤病人所攜帶。同樣地,值得注意的是等位基因頻率被顯示在所有表中,它們大約是攜帶者頻率的一半。<table>tableseeoriginaldocumentpage87</column></row><table>正如表5中所描述的那樣,進一步的研究表明單倍型la沒有增加受試者患有不被認為是前列腺癌的良性前列腺肥大(BPH)的風險。正如表5中所顯示的,單倍型la被13.8。/。的BPH病人所攜帶,與對照的11.4%相比,具有不顯著的相對風險1.22。表5:與BPH(良性前列腺肥大)相關的單倍型la的頻率和風險(單倍型la:DG8S737-8等位基因、DG8S17691等位基因、DG8S1407-1等位基因)<table>tableseeoriginaldocumentpage88</column></row><table>tp-值是單邊的**第一組(BPH(非PrCa))包括僅患有BPH的男性第二組(PrCa(非BPH))包括僅患有PrCa的男性第三組(PrCa和BPH)包括被診斷同時患有PrCa和BPH的男性表6描述了被用于擴增序列以檢測微衛星標記物的擴增子。表7描述了被用于擴增序列以檢測SNP標記物的擴增子。表6:微衛星擴增子和引物列表<table>tableseeoriginaldocumentpage88</column></row><table><table>tableseeoriginaldocumentpage89</column></row><table><table>tableseeoriginaldocumentpage90</column></row><table>表7:SNP擴增子和引物的列表。<table>tableseeoriginaldocumentpage90</column></row><table><table>tableseeoriginaldocumentpage91</column></row><table><table>tableseeoriginaldocumentpage92</column></row><table><formula>formulaseeoriginaldocumentpage93</formula>基因型統計以前驗證無SNP人類編輯:C/C:591C/G:1353G/G:730Build34位置chr8:128,467013+別名rs4599773對等物獨特的,沒有其它SNP對等物對等物名稱SG08S689<table>tableseeoriginaldocumentpage94</column></row><table>SNP:SG08S691aaattaacatatactttctttctcagtctcagttcttttccctaaaaataaaataaaataaaataaataggctgttgcactctagaaactactctaaaacaactacagatcaattatgcaaaaaaaagtctgaaagttacagtacatgaggggggaaggaacccttaggtttaacatagaattatctcagttaaggtgactgcataatgaatctgacataaacatcaatttgactgcatgttgctttcattaaagcaaagaaaccagaaaggtggaagaatccttataccttatgctgcatgcatcacaacacaccaagtatactagacctagttctgggaacctcatttcaagagcaatggtgcaaaggagagcagccagaatgaggagaggccaacagaccaggtccactctattccacagtgattcaagaaacgttactgaacatgttgactcctatgttccaggagctgtagagacggagttggatgccacattga[C/T〗gcttccctctagaaacttacattctagtagagggagccagtgtgcaatagaatateatggcaataaacacagggctatactgaatagtgggactgttgcatagctaagagttatgcaagcaccaagtataaagaagcagcttctgagttgatagtgctgttttgtgccttttcagaggtatgttttagaaaaaataactctaatggcagaataaataatggaaataagacagtgaaactaaaagtaaaagaaagccactggg3acccttgc3gt犯ttcccgtg33a3atgataacctcaca3act3aagtagtggtgatgaaaatcgagaagaaaagatgttctgagagctagtttagaaggtagaatcatgagaactcggtgactggataagtatgatggggaatgtagaggaaaagacatccaagatgactctagcttcaaataagagaaaggattgaggaacaagggaagtttggcattaaacaaacaaacaaaaa(SEQIDNO:19)基因型統計以前驗證無SNP人類編輯C/C:1087C/T:1156T/T:296Build34位置chr8:128,501972+別名rs6991990對等物獨特的,沒有其它SNP對等物對等物名稱SG08S691<table>tableseeoriginaldocumentpage96</column></row><table><table>tableseeoriginaldocumentpage97</column></row><table><table>tableseeoriginaldocumentpage98</column></row><table>討論正如本文所描述的那樣,已經證實在染色體Sq24.21上的基因座在癌癥(例如前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌、黑素瘤)中扮演了重要角色。在患有癌癥的受試者中,特定的標記物和單倍型(例如單倍型1、單倍型la、含有一個或多個表1中的標記物的單倍型)的出現比預期頻率高。基于本文描述的與特定形式的癌癥的傾向性有關的單倍型,可以使用遺傳易感性分析(例如診斷篩選測試)來鑒定對癌癥有風險的個體。本文描述的標記物和單倍型與良性前列腺疾病無關,在高Gleason前列腺癌病人中與低Gleason前列腺癌病人中相比具有較高的相對風險,因此是侵襲性的、快速生長的前列腺癌的增加的風險的指示。因為顯著百分比的前列腺癌是不會發展到前列腺外并引起發病或死亡的非侵襲性形式,而且前列腺癌的治療、包括前列腺切除術、放療和化療、都具有副作用并花費昂貴,因此,具有診斷標記物,例如本文描述的能夠顯示出與低侵襲性前列腺癌相比、侵襲性前列腺癌的較高的風險的標記物,將是有價值的。在具有本文描述的標記物和單倍型的個體中乳腺癌、肺癌和惡性黑素瘤的相對風險顯著增加,進一步支持了它們在鑒定這些形式的癌癥的增加的風險中的應用。因為單倍型導致了前列腺癌(例如侵襲性前列腺癌)、乳腺癌、肺癌和惡性黑素瘤的增加的風險,可能這些標記物和單倍型也與其它形式的癌癥的增加的風險有關。實施例2:在幾個組(Cohort)中證實與前列腺癌相關性其它的分析進一步支持了染色體8q24上與前列腺癌相關的變異體的存在。微衛星DG8S737上的等位基因-8與三個來自冰島、瑞典和美國的歐洲系譜的組中的前列腺癌相關。該等位基因估算的相對風險是1.62(戶=2.7x10—11)。大約19%的病人和13%的普通人群攜帶至少一個拷貝(PAR=7.4%)。在具有類似的相對風險的非裔美國人組中這種關聯性也被重現。在非裔美國人中,該等位基因的頻率較高,41%的病人和30%的人群是攜帶者,導致了較高的PAR(16.8%),并可能引起了前列腺癌的較高的發病率。該等位基因與侵襲性前列腺癌的關聯更強。鼎敲法沐島弱fiT,沐。該組是基于來自冰島癌癥登記處(ICR)的全國范圍的名單,該名單包含了從1955年1月1日到2004年12月31曰期間被診斷的所有3815個冰島前列腺癌病人(國際疾病分類第10次修訂代碼(ICD10)C61),其中1291個病人同意進行本研究。此外,平均三個第一級親屬和配偶也參加了(病人和親屬88%的參加比例)。來自ICR的病人的臨床信息包括診斷時的年齡、SNOMED形態學代碼和階段。活體組織Gleason分值從醫學記錄獲得,由病理學家KRB和BAA檢査。被基因分型的病人被診斷時的平均年齡是71歲,在ICR中所有前列腺癌病人的平均年齡是73歲。BPH群體含有510個通過組織病理學證實了BPH診斷的在1982年到2000年間在冰島被診斷出未患有前列腺的個體。997個個體的對照組從普通人群中招募。該組在三次減數分裂內無親緣關系,性別比為1,年齡范圍在25到85歲之間(中值年齡50歲)。在對照組中對于DG8S737的等位基因-8和rsl447295的等位基因A來說沒有觀察到性別差異。該研究被冰島數據保護委員會和冰島國家生物倫理學委員會批準。從所有病人、親屬和對照人員獲得了書面的知情同意書。與醫學信息和血液樣品相關的個人身份標志使用以前描述的第三方加密系統進行加密(Gulcher,J.R.等,五w.丄i/wm.739-42(2000))。瑞輿,夷濕壞充##"。CAPS1(瑞典前列腺癌1)是一項基于群體的病例對照研究,其中的前列腺癌病人(ICD10C61)是從瑞典6個地區性癌癥登記處中的4個中招募的,登記時間為從2001年1月1日或7月1日到2002年9月。該研究群體包含了1435個病例和779個在年齡、性別和居住地上相匹配的對照者。臨床信息包括階段和Gleason分值,大約80%來自活體組織檢査,大約20%來自外科手術檢查,是從癌癥登記或國家前列腺癌登記處獲得的。診斷時的病人平均年齡是66.6歲,對照組在被涵蓋時的平均年齡是67.9歲。該研究獲得了Karolinska研究所和Umea大學倫理學委員會的批準。從所有受試者獲得了書面知情同意(Zheng,SX.等,C騰erto.":2918-22(2004);landmark,F.等,丄淑/.C匿e〃"W.96:1248-54(2004))。美國高加索人群體含有458個在芝加哥的西北紀念醫院泌尿科進行外科手術的前列腺癌病人(ICD10C61)和260個在芝加哥大學人類遺傳學系注冊的基于群體的對照者。檢査了醫學記錄以檢索包括階段和活組織Gleason分值的臨床信息。病人在診斷時的平均年齡是59歲。病人和對照都是自己報告的歐裔美國血統。這通過使用隨機分布在基因組上的30個微衛星標記物(見下文)進行的遺傳祖先估計所證實。在該組中歐洲譜系的平均和中值分數都大于0.99(參見下文中詳細描述的方法)。研究方案被西北大學和芝加哥大學機構評估委員會批準。所有受試者給出了書面知情同意。非裔美國人研究群體包含了通過Flint男性健康研究和前列腺癌遺傳學項目所吸收的246個前列腺癌病人(ICD10C61)和352個對照者。Flint男性健康研究(FMHS)是在年齡在40到79歲之間的非裔美國人中進行的基于社區的病例對照前列腺癌研究,在1996年到2002年間在密歇根州Genesee郡中進行(Cooney,K.A.等,C/ra/ogy57:91-6(2001);Beebe-Dimmer,J丄.等.Pro加?eCawcer9,50-5(2006)),從該項研究中分析了113個病例和352個對照。在密歇根大學進行的前列腺癌遺傳學項目(PCGP)是一項大型的基于家庭的研究,注冊者包括具有兩個或以上活著的患有前列腺癌的家庭成員的男性,或在56歲以前被診斷患有前列腺癌并且沒有該疾病的記錄的家族史的男t生(Douglas,.A.等,GawcerE/^dem/o/S/omarA;er51/Vev.74:2035-9(2005))。從該組中分析了來自109個家庭的153個病人,其中78個病人沒有親緣關系,75個病人分屬31個家庭(大部分是一級親屬)。有15個前列腺癌病人同時出現在FMHS和PCGP組中。對醫學記錄進行了檢查,以提取出與前列腺癌診斷相關的信息,包括階段和活組織Gleason分值。病人和對照都是自己報告的非裔美國人血統。使用結構軟件(Pritchard,J.K.等,^m.J.i/wm.67:170-81(2000年5月26日出電子版))分析了在基因組上隨機分布的30個微衛星的基因型(Helgadottir,A.等,/.76:505-9(2005年1月7日出版電子版)),來評估該組中非裔和歐裔血統的比例。這些微衛星中的每個都具有在用于HapMap項目的成對群體樣品(即CEU、YRI或東亞人)之間表現出頻率的較大差別(〉0.4)的等位基因。來自密歇根州的基因型與來自YRI(作為非洲人對照樣品)、CEUHapM叩樣品和96個冰島人樣品(作為合并的歐洲人對照樣品)的基因型在結構軟件中運行。結構軟件中的USEPOPINFO選擇使用K=3,以便關于具有已知血統(非洲人和歐洲人對照樣品)的個體的信息可以被用于幫助確定具有未知血統(來自密歇根的非裔美國人)的個體的血統。在密歇根組中得出的歐洲血統的平均比例在病人中估計是0.224(中值為0.21),在對照中是0.215(中值為0.207)。根據重復10000次的隨機化測試,這種平均值的差別是統計學上不重要的(P=0.11)。根據這些血統的遺傳評估對密歇根組的關聯性計算進行了調整(詳見下文)。從所有參加研究者獲得了書面同意,研究方案被密歇根大學醫學院機構評估委員會批準。,統^學力^#。象以前描述的那樣使用1068個微衛星的框架掃描進行了基因組范圍的搜索(Gretarsdottir,S.等,//ww.Ge"eA70:593-603(2002);Styrkarsdottir,U.等,Zo//./:E69(2003))。總共871個冰島被診斷患有前列腺癌的病人和他們平均3個第一級親屬的基因型被分析。使用我們的冰島人系譜數據庫(Gulcher,J.和Stefansson,K.,C"w.C/固.MMec/.36:523-7(1998);Gulcher,J.等,Cawcer7:61-8(2001);Gulcher,J.等,丄//wm.Gew".5:739-42(2000))鑒定了他們的譜系。通過定義前列腺癌病人作為受影響者、所有其其他人為未知者進行了連鎖分析。對于多點連鎖分析來說,使用了僅受影響的等位基因共享方法(Kong,A.和Cox,NJ.,^m.//wm.G匿"7:1179-88(1997)),通過Allegro程序(Gudbjartsson,D.F.等,艦G認AZ5:12-3(2000))和deCODE遺傳圖譜(Kong,A.等,淑W:241-7(2002))來進行(參見下文)。另外25個標記物被輸入建議的連鎖區域中以增加信息的含量。對于單個標記物與前列腺癌的相關性來說,似然率測試被用來計算每個等位基因的雙邊p-值。對于通過合并組I和組II形成的冰島組總體(1921個病例和997個對照)來說,某些患有前列腺癌的個體彼此有親緣關系。有鑒于此,通過模擬整個冰島系譜的基因型獲得了測試統計的原假設分布(參見下文)。同樣的方法被用于調整密歇根非裔美國人組中某些患有前列腺癌個體的親屬關系。對于標記物來說顯示的是等位基因頻率而不是攜帶者頻率。等位基因特異性RR在假設乘法模型的條件下計算(Falk,CT.禾卩Rubinstein,P.,//wm.57(P/":227-33(1987))。在比較不同單倍型組的風險時,使用了利用似然性步驟的NEMO程序(Gretarsdottir,S.等,艦35:131-8(2003))。使用Mantel-Haenszel模型(Mantel,N.禾口Haenszel,W.,J.iV"WCa"cer/wW.22:719-48(1959))將來自多個組的結果合并,其中的組被允許具有不同的群體等位基因或基因型頻率,但是被假設具有相同的相對風險。遂徵'分析。Spairs計分函數(Whittemore,A.S.禾卩Halpern,J.,6fomeWcs50:118-27(1994);Kruglyak,L.等,爿m.丄Hwm.58:1347-63(1996))和指數等位基因共享模型(Kong,A.禾口Cox,NJ.,d丄i/wm.6/:1179-88(1997))被用于產生相關的ldf(自由度)統計結果。當將家族分值合并獲得整個分值,而不是對每個家庭或每個受影響的對同等加權時,使用的加權方案在對數標度上是兩種加權方案的中間方案;家庭權重是兩種方案的權重的幾何平均值。襲緣關系皮iF。使用標有符號的(+表示病人中過量,-表示缺少)用于在病人和對照中計算等位基因計數的標準似然率統計結果的平方根來測試等位基因與前列腺癌的相關性,其中,如果受試者是不具有親屬關系的,在原假設下將有接近標準的正態分布。由于某些冰島病人是有親屬關系的,它們的基因型不是獨立的,所描述的統計數據具有大于1的標準偏差,忽略它將導致產生不保守的p-值。使用以前描述的方法(Grant,S.F.等,脂.G匿,.35:320-3(2006年1月15日出版電子版);Stefansson,H.等,WW,Ge"".57:129-37(2005年1月16日出版電子版))進行了調整。10,000組基因型被用來模擬整個708,683個冰島人的譜系中的標記物DG8S737。對于每個模擬的組來說,通過將模擬的基因型作為研究中的病人和對照的真實基因型進行處理,重新計算了統計結果。根據模擬,在原假設下統計結果的真實標準偏差對于等位基因-8來說是1.018,該值被用于計算冰島1291個前列腺癌病人和997個對照者的總的群體的P-值。基于同樣的模擬,rs1447295的等位基因A的調整因子正如預期那樣被發現略低,這是由于與等位基因-8相比,等位基因A出現的頻率較高。為了簡化,決定在整個過程中使用較高的調整因子1.018。因此對等位基因A報道的結果略微有些保守。對某些病人中具有親屬關系的密歇根非裔美國人組也使用了同樣的方法,發現調整因子是1.032。遺傳逾統游伊仿。結構程序(Pritchard,J.K.等,Gee"cs/":945-59(2000))被用于估算個體的遺傳血統。結構軟件在來自一組個體的多基因座基因型和用戶定義的值K的基礎上推斷出K血統群體的等位基因頻率,并根據對應于每個個體的每個推斷出的K群體分配血統的比率。數據組的分析使用K=3運行,幫助鑒定每個個體中非洲人和歐洲人血統的比例。在非裔美國人病人和對照者之間平均的歐洲人血統的統計學顯著的差異根據從10000個隨機數據組衍生出的零分布進行評估。為了對來自美國的研究群體的血統進行遺傳評估,從在以前描述過的(Pritchard,J.K.等,Ge"e""775:945-59(2000))35個歐裔美國人、88個非裔美國人、34個中國人和29個墨西哥裔美國人的多種族群體中被基因分型的大約2000個微衛星中選擇了30個無關聯的微衛星標記物。在這2000個微衛星標記物中,被選出的組在歐裔美國人、非裔美國人和亞洲人之間顯示出了最顯著的區別,同時也具有好的質量和產量D1S2630、D1S2847、D1S466、D1S493、D2S166、D3S1583、D3S4011、D3S4559、D4S2460、D4S3014、D5S1967、DG5S802、D6S1037、D8S1719、D8S1746、D9S1777、D9S1839、D9S2168、D10S1698、D11S1321、D11S4206、D12S1723、D13S152、D14S588、D17S1799、D17S745、D18S464、D19S113、D20S878禾CID22S1172。下面的引物對被用于DG5S802:DG5S802-F:CAAGTTTAGCTGTGATGTACAGGTTT(SEQIDNO:23)禾卩DG5S802-R:TTCCAGAACCAAAGCCAAAT(SEQIDNO:24)。cDA^4jt"^^PCij^遂。商購的cDNA文庫被用于篩選AW轉錄本。被篩選的文庫是前列腺Marathon-ReadycDNA文庫(ClontechCat.7418-1)、睪丸Marathon-ReadycDNA文庫(ClontechCat.7414-1)、骨髓-ReadycDNA文庫(ClontechCat.7431-1),以及被構建用于全血和EBV轉化的人類類淋巴母細胞的cDNA文庫。從類淋巴母細胞株和全血中分別使用來自Qiagen(Cat.75144)的RNeasyRNA分離試劑盒和全血RNeasyRNA分離試劑盒(Cat52304)分離出總RNA。然后使用Agilent2001生物分析儀對RNA進行分析和定量。使用隨機六聚物方法從RevertAidTMH負鏈第一鏈cDNA合成試劑盒(FermentasCat.K1631)制備了cDNA文庫。在10體積中進行了PCR反應,終濃度為3.5tiM正向和反向引物、2mMdNTP、lxAdvantage2PCR緩沖液和0.5ulcDNA文庫。PCR篩選使用Advantage2PCR酶RT-PCR系統(Clontech),按照制造商的說明書進行。使用的PCR引物對(OperonBiotechnologies)顯示在表8中。<table>tableseeoriginaldocumentpage106</column></row><table>iMC^。AW轉錄本的5'陽和3'-RACE使用Marathon-ReadycDNA文庫(Clontech)按照制造商的說明書進行。使用的引物(OperonBiotechnologies)顯示在表9中。表9:用于RACE的引物<table>tableseeoriginaldocumentpage107</column></row><table>通過RACE鑒定的AW轉錄本的新剪接變異體通過在相應的cDNA文庫上使用RT-PCR證實。PCR產物都被克隆并證實序列,以證實最初的RACE結果。潘應樣。下列的前列腺癌細胞株從ATCC獲得。DU145,是從腦轉移病變產生的前列腺癌細胞株;LNCaP,是從淋巴結轉移病變產生的前列腺癌細胞株;CA-HPV-IO,是從HPV18轉染后的腺癌產生的前列腺癌細胞株;PZ-HPV-7和RWPE-1,都是從HPV18轉染后的正常前列腺組織產生的。此外,類淋巴母細胞株是從某些冰島前列腺癌病人的外周血通過EBV轉化產生的。這些細胞株被用于Southern印跡分析。A^W/^/tz伊_^分析。商業化的多組織Northern印跡從Clontech獲得(HumanMTNBlotIICat.7759-1)。此外,印跡從上面描述的前列腺癌細胞株制作。簡而言之,按照制造商的說明使用組合的Trizol(GIBCOBRLCatalog#15596-018)禾卩RNAeasy(QiagenCatalog#74106)純化步驟從細胞株中分離出總RNA。Poly(A)RNA使用來自Ambion的Poly(A)PuristMAG試劑盒(Cat.1922)進一步純化。1.5iigpoly(A)RNA在瓊脂糖-甲醛凝膠上電泳,轉印到HybondN尼龍膜上(Amersham),使用紫外交聯進行固定。使用的探針包括1)從RZPDDeutschesRessourcenzentrumfurGenomforschimgGmbH,Germany(http:〃www.rzpd.de/products/genomecube.shtml)獲得的AW1838833cDNA克隆(IMAGp998M216650Q);以及2)對應于從RT-PCR實驗獲得的AW轉錄本的外顯子6-8的cDNA克隆。克隆被測序驗證如下CTGGCGCCGTACTAGTGATCCGAGCTCGTAGCA(SEQIDNO:77)。使用Megaprime標記試劑盒(AmershamCat.RPN1607)用[a-32P]dCTP(比活性6000Ci/mmol)對cDNA片段進行放射性標記,未摻入的核苷酸用ProbeQuantG-50微柱(AmershamCat.27-5335-01)從反應中除去。膜在Rapid-hyb緩沖液中(AmershamCat.RPN1635)預雜交至少30分鐘,然后與100-300ng標記的cDNA探針雜交。雜交在R叩id-hyb緩沖液中在68°C進行過夜,在使用cDNA探針時加入0.1-0.15ixg/ml剪切過的變性的鮭魚精子DNA。在加入到預雜交溶液中的濾膜上之前,標記的探針在95。C加熱5分鐘。雜交后,將膜在2xSSC、0.05%SDS中在室溫的低嚴緊條件下清洗30-40分鐘,然后在0.1xSSC、0.1%SDS中在50°C的高嚴緊條件下清洗兩次,每次40分鐘。印跡被立即密封,對KodakBioMaxMRX-光膠片(Cat.8715187)曝光。^iV^^So"Aem伊^^分叛。瓊脂糖塊中的高分子量DNA通過將從前列腺癌病人外周血產生的成淋巴細胞株用Biorad10plugpleximould(Bioradcatalogno.170-3591)包埋到低熔點瓊脂糖(Incert,FMCbioproducts)中而制備。瓊脂糖中的細胞終濃度總是被調整到2xl07細胞/ml。DNA也是從新鮮冷凍的正常和惡性前列腺組織中分離出來的。對于每個病人來說,DNA是從4到5個20微米的包埋了新鮮冷凍組織樣品(大于70%的腫瘤百分含量)的OCT切片中,使用MasterPureDNA純化試劑盒(EpicentreInc.CatMC85200)分離的。然后使用GenomiPhiDNA擴增試劑盒(GEHealthcare,Cat.25-6600-02)按照制造商的說明擴增DNA,用等量的TE緩沖液稀釋。相當于10"gDNA的瓊脂糖塊和WGA前列腺組織DNA樣品用HindIII限制性內切酶按照標準程序(NewEnglandBiolabs)進行消化。消化后,瓊脂糖塊或WGADNA樣品被上樣到0.8。/。的瓊脂糖凝膠中。電泳后,將凝膠在0.25MHC1中脫嘌呤化30分鐘,然后在0.5MNaOH、1.5MNaCl中變性。然后將DNA轉移到尼龍濾膜上(HybondN+)。然后將膜用放射性標記的純化的BAC插入片段RP11367L7(Amershammegaprime)按照上述用于Northern印跡的標準程序進行探測。清洗后,將膜對膠片(KodakMR)在-80°C下曝光l-4天。沐萄#銀爐游^,為了鑒定引起前列腺癌風險的遺傳變異體,使用被分成323個擴展家庭的871個冰島前列腺癌病人的群體中存在的1068個微衛星標記物進行了基因組范圍的連鎖掃描。該掃描在染色體Sq24上產生了建議的連鎖信號,在加入增加信息含量的標記物后,它給出了最大的優勢對數值2.11(148.25cM處的D8S529)禾B3.15(145.65cM處的D8S557)(圖7A)。為了提煉出連鎖信號的來源,橫跨在染色體8的從125至lj135Mb(NCBIBuild34)的10Mb(18.6cM)區間中的358個微衛星和插入缺失標記物在869個無親緣關系的前列腺癌病人和596個群體對照中進行基因分型(組1)(圖7A和7B)。單個標記物與前列腺癌的相關性根據風險的乘法模型(Falk,CT.禾卩Rubinstein,P.,Z/wm.57&f",227-33(1987))進行計算。最強的關聯性在微衛星DG8S737的等位基因-8上觀察到,估算的每個拷貝攜帶的相對風險(RR)為1.79(P=3.0xl(r6)(圖7B和表10)。該關聯性在包含422個前列腺病人和401個基于群體的對照的第二個冰島組(組2)中得到重復,估算的等位基因-8攜帶的相對風險(RR)是1.72(P=0.0018,所有的P-值都是雙邊的,包括從重復研究中獲得的)。在含有1291個前列腺癌病人和997個對照的整個冰島組(合并組1和組2)中,DG8S737-8等位基因在病人中的頻率為13.1%,在對照中的頻率為7.8%。在根據組1和組2中的病人之間的親緣性進行調整后,獲得的估計的RR為1.77(P=2.3xl(T8)、群體可歸屬風險(PAR)為11%(表10)。在HapMapCEU樣品中,DG8S737標記物(128.433096Mb)位于染色體8q24.21上橫跨92kb的連鎖不平衡(LD)區塊中(NCBIBuild34的從128.414到128.506Mb)。該LD區塊在本文中被稱為LD區塊A。表10、在冰島人染色體8q24上的等位基因與前列腺癌的相關性<table>tableseeoriginaldocumentpage111</column></row><table>顯示了8q24.21上的標記物DG8S737和rs1447295的等位基因以及相應的病例和對照的數量(N)、在受影響的和對照個體中變異體的等位基因頻率、比值比(RR)和雙邊P-值。3在3次減數分裂內沒有親屬關系的個體b由于某些個體的親緣性而對相關性分析迸行了調整。為了調查關聯性信號的程度,對DG8S737周圍600kb區域中的另外12個微衛星和63個SNPs進行了基因分型(圖1C,表11和12)。在對DG8S737周圍600kb區域中的另外的微衛星和SNPs進行定型后,發現SNPSG08S717(rsl447295)的等位基因A顯示出最強的關聯性(圖7C)。其它與DG8S737禾BSG08S717(rsl447295)位于同樣的LD區塊中的與前列腺癌顯著相關的等位基因/標記物顯示在表13中,可以被用來檢測與前列腺癌相關的風險變異體。這些標記物和等位基因因此可以作為DG8S737的-8等位基因和SG08S717(rsl447295)的A等位基因的代用品,許多含有表13中列出的至少兩個標記物的可能的單倍型也是同樣。表ll、在Chr8q24上600kb區域中被基因分型的微衛星和插入缺失標記物<table>tableseeoriginaldocumentpage112</column></row><table><table>tableseeoriginaldocumentpage113</column></row><table>表12、在Chr8q24上的600kb區域中被基因分型的SNP標記物<table>tableseeoriginaldocumentpage114</column></row><table><formula>formulaseeoriginaldocumentpage115</formula>顯示的是在標記物DGSS737周圍的600kb區域中被定型的SNP標記物。*NCBIBuild34<table>tableseeoriginaldocumentpage116</column></row><table><formula>formulaseeoriginaldocumentpage117</formula></column></row><row><column><table>tableseeoriginaldocumentpage119</column></row><table>總的來說,對包含了DG8S737的LD區塊中的53個SNPs和6個微衛星進行了基因分型。按照UtahCEPH(CEU)HapMap數據(PhaseII,release19),這些基因座捕獲了LD區塊中的大部分單倍型多樣性。在53個SNPs中,總共有37個與前列腺癌顯著相關(P<0.001),其中SNPrsl447295的等位基因A顯示出最強的關聯性(RR=1.72,P=1.7xl0-9)(表10)。16個SNPs屬于與CEUHapMap樣品中的rs1447295同樣的相當的類別(r2=1),因此顯示出可比較的相關性結果。在冰島人樣品中,DG8S737的等位基因-8和rsl447295的等位基因A是基本上相關的(r2=0.5)。在對CEUHapMap樣品中的DG8S737標記物迸行定型后,發現相關性降低了(r2=0.3),但是在HapMap(PhaseII)中仍然沒有其它的SNP有比它更高的相關性(表13)。換句話說,與DG8S737的等位基因-8最相關的SNPs也是與前列腺癌最相關的SNPs。在兩個欲游/i統邀中游重復實驗在包含1435個無關聯的前列腺癌病人和779個基于群體的對照的瑞典人組中和包含芝加哥458個歐裔美國人病人和247個對照的組中,使用標記物DG8S737和rsl447295對這種關聯性進行了重復實驗。在兩個組中,病人中DG8S737-S等位基因的頻率明顯高于對照中的頻率,瑞典人和歐裔美國人組中的RR分別為1.32(P=0.013)和2.10(P=0.0029)。對于rs1447295等位基因A也獲得了相似的結果(表14),表明最初在冰島人組中鑒定到的變異體可能在大多數歐洲血統的人群中與前列腺癌的增加的風險有關。為了研究DG8S737-8和rsl447295A等位基因合在一起的風險(Gretarsdottir,S.等,嵐Ge威35:131-8(2003)),將染色體分為三組i)帶有DG8S737-8等位基因和一種rsl447295等位基因(絕大部分帶有等位基因A)的染色體(-8&A/G);ii)帶有rsl447295的等位基因A和DG8S737的等位基因-8之外任何等位基因(被稱為X)的染色體(X&A);以及iii)既不帶有等位基因-8也不帶有等位基因A的染色體(X&G)。使用Mantel隱Haenszel模型(Mantel,N.和Haenszel,W"J.淑/.Cfl"cer/""22:719-48(1959))合并來自三個組的數據,(-8&A/G)相對于(X&G)的風險被估算為1.61(P=5.9x10-11)。(X&A)相對于(X&G)的估計的風險較低,為1.27,但仍然是顯著的(P=0.0088)。因為DG8S737等位基因-8和rsl447295等位基因A本身都不能完全解釋風險情況,因此在該區域內可能存在多功能的變異體,也可能這些等位基因都處于強烈的、但不完整的連鎖不平衡。求裔夷腐義資#^/7乾丈游^沐#/7歷^廢游置復實邀在包含246個前列腺癌病人和352個對照的非裔美國人組中進行了第三個重復實驗研究,以確定上面在具有高的發病率的組中鑒定的變異體是否也與前列腺癌相關。此外,如果是這樣的話,可以假定在非裔美國人中由于非洲人血統的較大比例而導致的加大的遺傳多樣性,將為正確指出未知的風險變異體的位置提供更高的分辨率。這個假設得到了對尼日利亞約魯巴人(YRI)HapMap樣品中橫跨92kb的LD區塊的區域進行的分析的支持,該分析顯示出在該組中,在歐洲譜系群體中高度相關的SNPs之間中存在較大的遺傳多樣性和較弱的連鎖不平衡。具體來說,盡管在CEUHapMap數據(PhaseII)中19個SNPs、包括rsl447295、都位于同樣的等價類中(r2=1),在HapMapYRI樣品中這些SNPs屬于13個不同的等價類(表14)。因此,除了DG8S737之外,非裔美國人組用19個等價SNPs中的17個(包括rs1447295)進行基因分型。在被省略的兩個中,其中一個與其它被基因分型的兩個SNPs完全相關,而另一個在YRI樣品中不具有多態性。YRIHapM叩樣品和歐洲血統組的對照之間等位基因頻率的差別提出了假陽性或假陰性相關性結果可能是由于歐洲血統在非裔美國人病人和對照中分布的差別所引起的。因此,為了作為血統的對照,對一組30個在基因組中隨機分布、并對非洲和歐洲血統的鑒別具有指示性的微衛星進行了基因分型。使用結構軟件(Pritchard,J.K.等,am.//"附.67:170-81(2000年5月26日出版電子版))對這些數據進行的分析顯示出在病人和對照之間歐洲人血統沒有顯著的區別。此外,伴隨或不伴隨血統調整而進行的關聯性分析給出了實際上相同的結果(Helgadottir,A.等,為.丄if謂.Ge威76:505-9(2005年1月7日出版電子版);Pritchard,J.K.等,^m.,//wm.57:170-81(2000年5月26日出版電子版))。在非裔美國人前列腺癌病人中DG8S737的等位基因-8的頻率是23.4%,在對照中是16.1%,RR-1.60(P=0.0022,由于某些病人之間的親緣關系而進行了調整)。給出最低P-值的SNP是rsl447295,其中在病人中等位基因A的頻率是34.4%,在對照中是31.3%(RR=1.15),但是關聯性不明顯(P-0.29)。這些結果表明在歐洲人和非洲人血統的人群中,DG8S737等位基因-8本身或者是有功能的變異體,或者與目前尚未了解的風險變異體具有非常緊密的相關性。相反,在非裔美國人中,rs1447295和其它16個SNPs中的任何一個都與前列腺癌沒有顯著的相關性(表14)。檢驗H叩M叩YRI數據(PhaseII),可以注意到與DG8S737的等位基因-8具有最強的相關性的三個SNPs(1"2=0.32到0.34),都被包含于在非裔美國人樣品中被基因分型的17個SNPs中(表14)。盡管在非洲人和歐洲人血統的人群中RR相同,但在非裔美國人中PAR相對較高(16.8%對5.8-11%),這是由于在前者組中DG8S737等位基因-8的頻率較高。這種較高的頻率可以用該等位基因在非洲人群體中的頻率來解釋,例如在YRIHapM叩樣品中頻率是22.5%。這提出了DG8S737等位基因-8的PAR在非洲人群體中可能甚至更高的可能性。DG8S737標記物是二核苷酸AC的重復序列,等位基因-8是來自該等位基因比用作微衛星基因型對照的CEPH樣品1347-02的最小等位基因小8bp這個事實。盡管DG8S737顯示出相當大范圍的等位基因大小,但系統發育分析表明它具有中等程度的突變率,重復序列的大小與HapMap樣品中SNP背景具有強烈的相關性(圖8)。描述了136個不同的單倍型之間的譜系關系的中位數拼接網絡(Bandelt,H丄,Forster,P.&Rohl,Mo/腸/£vo/76,37-48(1999)是從HapMap項目(NatureJZ/,1299-320(2005))數據庫(第19版)和一個微衛星DG8S737獲得的46個SNPs的基因型中推斷出來的。所有這些基因座都被包含在染色體8上大約30kb的區域中(128,426,310-128,456,027,NCBIbuild34)。顯示了用在HapMap項目中的來自60個具有北歐和西歐人血統的猶他州人CEPH(CEU)、60個尼日利亞約魯巴人(YRI)、45個來自北京的中國人個體和44個來自東京的日本人個體(HCB&JPT)的單倍型。使用EM算法與來自猶他和約魯巴樣品的家庭三人組信息相結合,產生了分階段的單倍型(其中來自每個群體樣品中的30個兒童的基因型被用于幫助推斷單倍型的等位基因階段)。每個因突變而不同的單倍型用實心圓圈代表,其面積反映了在4個群體組中觀察到的合并的拷貝數。在推測單倍型存在于一個以上的群體的情況下,扇形區表明了來自每個群體的單倍型拷貝數。圓圈之間的線表示單倍型的等位基因狀態之間的差異,長度與差異的數量成正比,在等位基因上有差別的基因座用標記指示。線條代表了按照構成中位數拼接算法的進化簡約性原則在單倍型之間存在的最可能的突變途徑。單倍型之間的突變差異被顯示為與和單倍型相關的進化途徑相交叉的短的垂直線。在這種情況下,突變事件被認為是在單個SNPs上的點突變、DG8S737微衛星的逐步突變以及重組事件。當兩個或多個突變事件的時間次序不能被分辨出來時,網絡中顯示出平行四邊形。重復序列的大小與SNP單倍型相關的程度反映出微衛星的進化穩定性(突變率)。因此,預期相對穩定的微衛星在同樣的或緊密相關的SNP單倍型的背景下將表現出相同的等位基因大小,而在關系更遙遠的單倍型之間將具有較大的差別。相反,對于快速突變的微衛星來說則不能期望這樣的相關性,其中由于微衛星上的回復突變事件在緊密相關的SNP單倍型上可能發現重復序列大小的顯著差別,而在關系遙遠的SNP單倍型上可能發現相同的重復序列大小。圖S清楚地顯示了對于DG8S737來說,緊密相關的SNP單倍型傾向于具有同樣的重復序列大小,而關系遙遠的SNP單倍型傾向于具有更趨異的重復序列大小。在所有單倍型對之間不同的SNP等位基因的數量和在所有單倍型對之間不同的DG8S737重復序列的數量之間的相關性被估算。根據對其中微衛星等位基因被隨機指派給SNP單倍型的10000個數據組的相關性進行的評估,得到的Spearman's非參數性相關性系數P:0.334,經驗性P值O.OOOOl。這表明DG8S737微衛星具有中等的突變率,足夠產生大量不同的等位基因大小,但是不足以打破重復序列大小與SNP單倍型背景之間的相關性。表14、在冰島人、瑞典人和美國人染色體8q24上的等位基因與前列腺癌的相關性<table>tableseeoriginaldocumentpage125</column></row><table>顯示了8q24.21上的標記物DG8S737和rsl447295的等位基因、相應的病例和對照數(N)、在受影響的和對照個體中變異體的等位基因頻率、相對風險(RR)、雙邊P-值和群體可歸因風險(PAR)。a在3次減數分裂之內無親緣關系的個體。20068002516LX轉滔齒被114/1365t多個邀游分析表15顯示了在HapMapCEU、冰島人、HapMap約魯巴人(YRI)和來自密歇根大學FMHS和PCGP研究的非裔美國人中DG8S737等位基因-8和其它19個與SG08S717/rs1447295屬于同一等價類的SNPs的LD特性。在該區塊結構中的標記物也與遠達200kb以外的標記物(包括在PVT1基因區域中128515000bps附近(rs7845403、rs6470531和rs7829243)的標記物和128720000bps附近(rsl0956383和rs6470572)的標記物)有中度的相關性(—小于0.2)。表15A:在被研究的群體中DG8S737的等位基因-8和屬于HapMap咼加索人(CEU)中rsl447295的等位基因A的等價類的其它19個SNPs的LD性質<table>tableseeoriginaldocumentpage127</column></row><table>顯示了相對于HapMapCEU樣品中的rsl447295的r2為LOO或更大的SNPs。對于HapMap高加索人(n-60)和冰島人(n=2288)、HapMap尼日利亞的約魯巴人(YRI)(n-60)和密歇根的非裔美國人(『598)給出了LD性質。Nd:未進行。Np:無多態性。Allfreq=等位基因頻率。aBuild34b病例e對照d這些SNPs在HapMapYRI數據中(PhaseII)顯示出與DG8S737的等位基因-8最強的相關性。20068002516LX勢滯也被116/136s表15B:在被研究的群體中DG8S737的等位基因-8和屬于HapMap商加索人(CEU)中rsl447295的等位基因A的等價類的其它19<table>tableseeoriginaldocumentpage128</column></row><table>顯示了相對于HapMapCEU樣品中的rsl447295的r2為1.00或更大的SNPs。對于HapMap高加索人(11=60)和冰島人(n=2288)、HapMap尼曰利亞的約魯巴人(YRI)(!1=60)和密歇根的非裔美國人(『598)給出了LD性質。Nd:未進行。Np:無多態性。Allfreq=等位基因頻率。aBuild34b病例e對照a這些SNPs在HapMapYRI數據中(PhaseII)顯示出與DG8S737的等位基因-8最強的相關性。20068002516LX轉溢齒被117/1365t已經發現用于試驗的乘法風險模型足夠擬合歐洲和非洲血統的群體的數據。因此,我們在瑞典病例對照樣品、包含458個歐裔美國人病人和247個來自美國芝加哥的對照的病例對照樣品中,使用標記物DG8S737和SG08S717(rsl447295)重復實驗了在冰島前列腺癌病人和對照中看到的關聯性。正如在表16中所顯示的那樣(XX基因型),對于所有4個被研究的群體來說,DGSS737等位基因-8或rs1447295等位基因A的純合攜帶個體比雜合攜帶者具有更高的RR。因此,帶有兩個有風險等位基因的個體比僅帶有一個有風險等位基因的個體具有更高的發展前列腺癌的風險。表16、在乘法模型下DG8S737-8和rsl447295A的相對風險與雜合(0X)、純合(XX)和未攜帶者(00)基因型相對風險的無模型估算值之間的比較。<table>tableseeoriginaldocumentpage129</column></row><table>與虔襲性諒,蘼蘑存更蔬關凝絲游A澄變弄體接下來確定了有風險的變異體是否與高Gleason分值所反映出的前列腺癌的侵襲性形式具有更強的關聯性。在所有4個病人-對照組中,在組合Gleason分值為7到10的前列腺癌病人中比在對照中DG8S737等位基因-8的頻率明顯更高(表17)。Gleason分值為2到6的前列腺癌病人與對照相比也是這樣,只是在Gleason分值為7到IO的組中的RR比Gleason分值為2到6的組中的RR高。此外,在所有4個合并的病例-對照組(RR=1.21,P=0.02)和3個合并的歐洲人血統病例-對照組(RR=1.18,P=0.07)中,在具有高分值(7-10)的病人中等位基因-8的頻率比低分值(2-6)組中的高。表17、在冰島人、瑞典人和美國人染色體8q24上的等位基因與高和低Gleason分值的相關性。<table>tableseeoriginaldocumentpage130</column></row><table><table>tableseeoriginaldocumentpage131</column></row><table>顯示了8q24.21上標記物DG8S737和rsl447295的等位基因以及相應的病例和對照數(N)、受影響的和對照個體的變異體頻率、相對風險(RR)、雙邊P值和群體可歸因風險(PAR)。大約80%的瑞典Gleason分值來自活檢材料,其余來自外科手術。0.2730.1611.963.3x10-40.250.3520.3131.190.280.111此外,在所有4個組中(合并,差異比率=1.22,P=0.020),在高Gleason病人(7-10)中等位基因-8的頻率比低Gleason病人(2-6)中的高。對510個被診斷患有良性前列腺肥大(BPH)但未患有前列腺癌的冰島男性進行的分析顯示DG8S737的等位基因-8或rsl447295的等位基因A都沒有顯著的過量(表18),表明這些變異體僅增加惡性前列腺腫瘤、特別是更具侵襲性的形式的風險。表18、冰島人染色體8q24上的等位基因與良性前列腺肥大(BPH)的相關性<table>tableseeoriginaldocumentpage132</column></row><table>顯示了8q24.21上的等位基因以及相應的病例和對照數(N)、受影響的和對照個體的變異體等位基因頻率、相對風險(RR)、P值和群體可歸因風險(PAR)。良性前列腺肥大(BPH)是在前列腺經尿道切除(TURP)、細針活檢或前列腺切除的基礎上診斷的。個體在3次減數分裂內無親緣性。本分析中使用的對照與冰島前列腺癌組的相關性分析中使用的對照是同樣的個體。BPH+PrCa-表示被診斷患有BPH但不患有前列腺癌的個體。包#7,月澄^r#沐游丄",炎游功虔性性處研究因為只有微衛星等位基因在非裔美國人組中顯示出明顯的相關性,并且含有該基因座的LD區塊較小并在非裔美國人中被分解成較小的單位,因此,可能最可能包含功能性變異體的區域可以被縮小到128.414-128.474Mb(NCBIbuild34)的位置范圍內。該區域含有一個剪接的EST(AW183883)和三個單獨的外顯子ESTs(BE144297、CV364590和AF119310)以及幾個預測的基因,但是沒有已知的基因(Kent,WJ.等,Ge畫eto.72:996-1006(2002))。在該區塊中沒有檢測到微RNAs(Griffiths-Jones,S.,施c/e/c^c油L":D109-11(2004))。在不同cDNA文庫中進行的表達分析證實了AW183883EST的表達,但是沒有其它ESTs的表達(參見上面的力^^7方茲)。從AW183883EST通過cDNA末端的5'和3'快速擴增(RACE)鑒定了4個不同的剪接變異體,通過RT-PCR和Northern印跡分析進行了證實(圖10)。這些轉錄本中的兩個——都包含AW183883EST——被表達在睪丸細胞株中,但不表達在脾臟、胸腺、前列腺、卵巢、小腸、結腸、外周血白細胞或前列腺細胞株中(數據未顯示)。相反,其它兩個含有外顯子6-8的轉錄本的表達僅僅在正常(0.6kb轉錄本)和惡性的前列腺細胞株(0.6和0.9kb轉錄本)中才能檢測到(數據未顯示)。這些轉錄本的預測的ORFs與已知蛋白沒有顯示出明顯的同源性。在睪丸轉錄本中微衛星DG8S737和SNPrs1447295位于外顯子4和5(或6)之間的內含子中,在前列腺特異性轉錄本中位于5'端(圖10)。可以想到,這些標記物或其它與這些標記物處于連鎖不平衡的標記物影響了該區域中一個或多個轉錄本的剪接形式。已經注意到8q24是在前列腺腫瘤中最經常獲得的染色體區域(Baudis,M.禾BCleary,MX.,Ao/"/orma"w〃:1228-9(2001))。該區域中的獲得與侵襲性腫瘤、激素不依賴性和不好的預后有關(ElGedaily,A.等,Pm/a/e":184-90(2001))。為了評估帶有DG8S737等位基因-8的染色體是否與增加的基因組不穩定性相關,使用來自攜帶或不攜帶等位基因-8的前列腺癌病人的種系和腫瘤DNA,對覆蓋了92kb的LD區域進行了Southern印跡分析。在14個腫瘤樣品(非攜帶者)中只有一個顯示出多態性限制形式,但是在來自攜帶者和未攜帶者的種系DNA中一個都沒有觀察到(數據未顯示)。因此,似乎DG8S737等位基因-8種系變異體不可能與LD區塊A區域的重排有關。另外,有趣的是DG8S737鄰近于眾所周知的癌基因c-MYC,距離僅為-270kb(端粒側)。但是,在位于c-MYC基因中的SNPs與前列腺癌風險或本研究中鑒定到的風險變異體之間沒有觀察到明顯的相關性(數據未顯示)。然而,有可能風險變異體的作用是通過誘發基因組不穩定性或通過改變表達的長距離調控來修飾c-MYC的調控。W論總而言之,在3個歐洲人血統的組中,已經證實了前列腺癌風險與DG8S737等位基因-8和rs1447295等位基因A的顯著相關性(其中rsl447295的等位基因與來自至少18個其它附近的SNPs的等位基因完全相關)。從這些組獲得的合并的結果給出了對DG8S737等位基因-8的估計RR為1.59(P=1.40x10—1Q),對rs1447295的等位基因A的估計的相對風險為1.50(P=1.62x10—11)。假定對于這兩個標記物來說群體頻率分別為6.6%和10.7%(來自3個組的平均值),對應的PAR分別為7.4。/。禾卩9.9%。前列腺癌和等位基因-8之間的相關性在非裔美國人組中進行了重復實驗,獲得了接近相同的相對風險(1111=1.60,P=0.0022)。此時,在非裔美國人中,沒有證明與該區域中任何HapMapSNPs的相關性。本文描述的變異體是通過從連鎖分析開始的位置克隆方法鑒定的。也可以使用基因組范圍的關聯,使用rs1447295或其LD等價物之一上的常見SNPs。即使為了測試成百上千個常見的SNPs必需進行調整,結果仍然是非常顯著的。相反,如果僅根據H叩M叩項目第19版中包含的SNPs,分析表明基因組范圍的相關性研究不能在非裔美國人或非洲人組中捕獲到該相關性信號。這是因為在非洲血統的群體中沒有現有的HapMapSNPs足夠與DG8S737等位基因-8相關聯。因此,推測或者是等位基因-8本身引起了風險,或是某些變異體與等位基因-8比與任何現有的HapMapSNPs更緊密相關。如果后一種假設是真的,那么在非裔美國人中降低的LD表明未知的變異體位于含有DGSS737的60kb的區域中。同樣重要的是等位基因-8在非裔美國人中相對高的群體頻率,導致估計的PAR為16.8%。因此,僅是等位基因-8的頻率就能夠導致在非裔美國人中比在歐裔美國人中前列腺癌的發病例高14%,從而部分解釋了前列腺癌在非裔美國人中異常高的發生率。也應該注意到這些被描述的與前列腺癌有關的有風險變異體在其它形式的癌癥中(例如乳腺癌、肺癌、黑素瘤)也以較高的頻率被看到。表19顯示了DG8S737的等位基因-8和SG08S717(rsl447295)的等位基因A增加了侵入性的乳腺癌、肺癌和惡性皮膚性黑素瘤的風險。此外,應該注意到在所有表格中顯示的等位基因頻率大約等于攜帶者頻率的一半。表19、在冰島人染色體8q24上的等位基因和單倍型與黑素瘤、乳腺癌和肺癌的相關性。<table>tableseeoriginaldocumentpage135</column></row><table>顯示了8q24.21上標記物DG8S737和rsl447295的等位基因以及相應的病例和對照數(N)、受影響的和對照個體的變異體的等位基因頻率、相對風險(RR)和單邊P值。表20包含了根據NCBI數據庫(dbSNP125)在LD區塊區間(128.414-128.506)中的所有已知的和描述的SNP標記物。表20、來自dbSNP125(NCBIdbSNPBuild125的圖譜)的92Mb的LD區塊區間中(128.414-128.506Mb)的所有SNPs。<table>tableseeoriginaldocumentpage135</column></row><table>rs64705178128416993dbSNP-125rs70087868128417319dbSNP-125rs78412288128417467dbSNP-125rsl00940598128418196dbSNP-125rsl07192948128418485dbSNP-125rsl17784178128418666dbSNP-125rsl17862818128420006dbSNP-125rsl00957468128420075dbSNP-125rsl01090688128420108dbSNP-125rs286262028128420942dbSNP-125rs284513378128421776dbSNP-125rs96428788128421857dbSNP-125rsll7814208128421931dbSNP-125rs96432218128422076dbSNP-125rs78363458128422269dbSNP-125rs78364688128422360dbSNP-125rsl05376508128422444dbSNP-125rsll3082688128422866dbSNP-125rsl01078308128423213dbSNP-125rsll2717968128423228dbSNP-125rs78412648128423403dbSNP-125rs78288558128423577dbSNP-125rs96432228128423694dbSNP-125rs96432238128423753dbSNP-.125rsl32739938128423809dbSNP-■125rs70176718128424343dbSNP-.125rsl00999058128424523dbSNP-.125rsl01001798128424672dbSNP-.125rs39997848128425358dbSNP--125rsl32503068128425382dbSNP--125rsl25442208128425504dbSNP-■125<table>tableseeoriginaldocumentpage137</column></row><table>rsl25459298128436814dbSNP-125rsl00893108128437573dbSNP-125rs78191028128437938dbSNP-125rs48717998128439231dbSNP-125rs4871歸8128439304dbSNP-125rs69814248128439685dbSNP-125rs70015138128439754dbSNP-125rs48718018128440503dbSNP-125rs69862858128440524dbSNP-125rs69864698128440699dbSNP-125rs64705188128440770dbSNP-125rs64705198128440812dbSNP-125rs64705208128440922dbSNP-125rs78185568128440988dbSNP-125rsl4472958128441627dbSNP-125rs48718028128442229dbSNP-125rs69930748128442270dbSNP-125rsl01097008128442553dbSNP-125rs92977588128443177dbSNP-125rs698楊l8128443731dbSNP-125rsl06105218128443970dbSNP-125rsl33633098128444111dbSNP-125rs96929648128444780dbSNP-125rs73879358128444971dbSNP-125rs73575478128445291dbSNP-125rsl32593968128445300dbSNP-125rsl326037S8128445339dbSNP-125rsl5970198128445342dbSNP-125rs78260428128445690dbSNP-.125rs78261798128445788dbSNP-.125rsl33648578128445897dbSNP國.125rsl32680498128445908dbSNP-125rsl19913868128447040dbSNP-125rsl09563738128447165dbSNP-125rs7836譜8128448381dbSNP-125rsl69021658128448411dbSNP-125rs78310288128448618dbSNP-125rsl9928338128448933dbSNP-125rs22卯0338128449663dbSNP-125rs284551568128449949dbSNP-125rsll9891368128450373dbSNP-125rs96432248128450700dbSNP-125rs96432258128450980dbSNP陽125rs96432268128451070dbSNP-125rsl17757498128451255dbSNP匿125rsl19943848128451916dbSNP-125rsl4472968128451948dbSNP-125rsl69021688128452197dbSNP-125rs96432278128452685dbSNP-125rsl19953788128453001dbSNP-125rsl69021698128453095dbSNP-125rsl3253127S128453180dbSNP-125rsll9884548128453351dbSNP-125rsll9921948128453353dbSNP-125rs69855048128453365dbSNP-■125rsl32585488128453436dbSNP國■125rsl32588128128453456dbSNP-.125rs48718048128454118dbSNP-.125rsl69021718128454315dbSNP--125rsl26799008128454604dbSNP--125rsl69021728128454631dbSNP--125rs78445618128455093dbSNP--125<table>tableseeoriginaldocumentpage140</column></row><table>rsl5624358128463046dbSNP-125rsl21556728128463613dbSNP-125rsl21561288128463780dbSNP-125rsl5624348128463908dbSNP-125rsl5624338128464039dbSNP-125rsl5624328128464191dbSNP-125rsl5624318128464240dbSNP-125rsl20564738128464511dbSNP-125rsl3746268128464584dbSNP-125rsl3746258128464650dbSNP-125rsl20567S88128464661dbSNP-125rsl13657828128464669dbSNP-125rs45997738128467013dbSNP-125rs40782418128467729dbSNP匿125rs125454878128467881dbSNP-125rs44618698128467959dbSNP-125rs40782408128468152dbSNP-125rsl32698958128468547dbSNP-125rs70138508128468613dbSNP-125rs286097918128469167dbSNP-125rs78130158128469646dbSNP-125rs69813218128469894dbSNP-■125rs48718078128469920dbSNP-125rs589柳68128470115dbSNP-.125rs48718088128470134dbSNP-.125rs78178358128470790dbSNP--125rs44123388128471606dbSNP--125rsl14083928128472364dbSNP-125rsll3931288128472372dbSNP--125rs284751368128472373dbSNP--125rs78274288128472636dbSNP--125rs78320318128473541dbSNP-125rsl01135778128473620dbSNP-125rs42423828128474162dbSNP-125rs42423838128474349dbSNP-125rs43146218128474604dbSNP-125rs42423848128475143dbSNP-125rs9297759S128475760dbSNP-125rs70183868128476546dbSNP-125rs78124298128476762dbSNP-125rs78128948128477068dbSNP-125rs48710268128477366dbSNP-125rs48710278128478096dbSNP-125rsl00994138128478652dbSNP-125rs78148378128478791dbSNP-125rs284296928128479233dbSNP-125rsl00883088128479503dbSNP-125rs92977608128479761dbSNP-125rsl1457275S128479S47dbSNP-125rs70075408128480229dbSNP-125rs78412518128480910dbSNP-125rs78248688128481003dbSNP-125rs70173008128481857dbSNP-125rsl32758308128481950dbSNP-125rs64705258128482127dbSNP-125rsl25478748128482221dbSNP-125rs64705268128482480dbSNP-125rs70043748128482574dbSNP-125rs70053438128483167dbSNP-125rs70101658128483880dbSNP-125rs96931138128484019dbSNP-125rs4S718098128484144dbSNP-125<table>tableseeoriginaldocumentpage143</column></row><table>rs48718108128492949dbSNP-125rsl32640918128493043dbSNP-125rsl19859498128493373dbSNP-125rsl32725438128493517dbSNP-125rsl25476068128493842dbSNP-125rsl25426858128494172dbSNP-125rsll9878118128494732dbSNP-125rs7814251812S494806dbSNP-125rsl12686438128494962dbSNP-125rs81809058128495413dbSNP-125rs96940938128495737dbSNP-125rs78376888128495949dbSNP-125rsl3256658128496050dbSNP-125rs78241188128496937dbSNP匿125rsl05519418128496952dbSNP-125rsl32659988128496973dbSNP陽125rsl32660008128496975dbSNP-125rsl01072638128496987dbSNP-125rsl3268425812S496989dbSNP-125rsl32687128128497079dbSNP-125rsl32663518128497100dbSNP-125rsl25497618128497365dbSNP-125rs48718118128497463dbSNP-.125rs42423868128497682dbSNP-.125rs78258238128498506dbSNP--125rs28489376812849卯33dbSNP--125rs74650748128499382dbSNP曙-125rsl13085708128499734dbSNP--125rsl19885568128500924dbSNP--125rs70071968128501145dbSNP--125rs64705298128501401dbSNP--125<table>tableseeoriginaldocumentpage145</column></row><table>*位置以bp為單位、禾艮據UCSC瀏覽器NCBIBuild34表21包含了所有被deCODE遺傳學項目鑒定和試驗的、位于染色體8上的LD區塊區間(128.414-128.506)中的微衛星標記物。<table>tableseeoriginaldocumentpage145</column></row><table><table>tableseeoriginaldocumentpage146</column></row><table>表22、由標記物/等位基因rsl2542685等位基因T和rs7814251等位基因C組成的保護性單倍型p-值RR受影響的數量受影響的頻率對照的數量對照的頻率0,000150,750412800.1949950.242本文中引用的所有相關出版物的內容在此以其全文引為參考。盡管已經參考其優選實施方案對本發明進行了具體的顯示和描述,本領域的專業技術人員將會理解,可以在其中進行各種形式上和細節上的改變,而不背離在隨后的權利要求書中所包含的本發明的范圍。權利要求1.在受試者中診斷對癌癥易感性的方法,包括檢測與LD區塊A相關的標記物或單倍型,其中標記物或單倍型的存在是對癌癥易感性的指示。2.權利要求1中的方法,其中的標記物或單倍型是選自表13中的標記物。3.權利要求2中的方法,其中的標記物是rs1447295等位基因A或DG8S737等位基因-8。4.權利要求l中的方法,其中的標記物或有風險的單倍型是含有選自單倍型1和單倍型la的單倍型的有風險的單倍型。5.權利要求1中的方法,其中的標記物或單倍型是含有選自表13中的標記物的一或多種標記物的單倍型。6.權利要求5中的方法,其中的單倍型含有rs1447295等位基因A或DG8S737等位基因-8。7.權利要求l中的方法,其中的癌癥選自前列腺癌、乳腺癌、肺癌和黑素瘤。8.權利要求7中的方法,其中的癌癥是前列腺癌,標記物或單倍型的相對風險至少為1.5。9.權利要求8中的方法,其中的前列腺癌是侵襲性前列腺癌,被定義為合并的Gleason分值為7(4+3)到10。10.權利要求8中的方法,其中的前列腺癌是侵襲性低的前列腺癌,被定義為合并的Gleason分值為2到7(3+4)。11.權利要求8中的方法,其中標記物或單倍型的存在是更具侵襲性的前列腺癌和/或更壞的預后的指示。12.權利要求7中的方法,其中的癌癥是乳腺癌,標記物或單倍型的相對風險至少為1.3。13.權利要求7中的方法,其中的癌癥是肺癌,標記物或單倍型的相對風險至少為1.3。14.權利要求7中的方法,其中的癌癥是黑素瘤,標記物或單倍型的相對風險至少為1.5。15.權利要求7中的方法,其中的黑素瘤是惡性皮膚性黑素瘤。16.權利要求1中的方法,其中標記物或單倍型的存在是受試者對特定治療方式的不同反應率的指示。17.權利要求1中的方法,其中標記物或單倍型的存在是在腫瘤或其前體中ChrSq24.21的體細胞重排傾向性的指示。18.權利要求17中的方法,其中的體細胞重排選自擴增、易位、插入和缺失。19.權利要求1中的方法,其中的標記物或單倍型含有一或多種與Chr8q24.21有關的標記物,該標記物與一或多種選自表13中的標記物處于強烈的連鎖不平衡,該連鎖不平衡被定義為(ID'I〉0.8)和/或r2〉0.2。20.權利要求19中的方法,其中的一或多種標記物包含rs1447295等位基因A或DG8S737等位基因-8。21.診斷對癌癥易感性的方法,包括檢測與Chr8q24.21有關的標記物或單倍型,其中標記物或單倍型的存在是對癌癥易感性的指示。22.權利要求21中的方法,其中的癌癥選自前列腺癌、乳腺癌、肺癌和黑素瘤。23.在受試者中預測對侵襲性前列腺癌的增加的風險的方法,包括檢測與LD區塊A相關的標記物或單倍型,其中標記物或單倍型的存在是對侵襲性前列腺癌增加的風險的指示。24.權利要求23中的方法,其中的標記物或單倍型包含rs1447295等位基因A或DG8S737等位基因-8。25.用于分析來自受試者的樣品以檢測對癌癥易感性的試劑盒,其中的試劑盒含有一種或多種用于檢測與LD區塊A有關的標記物或單倍型的試劑。26.權利要求25中的試劑盒,其中的癌癥選自前列腺癌、乳腺癌、肺癌和黑素瘤。27.權利要求26中的試劑盒,其中的一種或多種試劑包括至少一種連續的核苷酸序列,該序列與含有至少一種選自表13中的標記物的區域完全互補。28.權利要求26中的試劑盒,其中的一種或多種試劑包括至少一種連續的核苷酸序列,該序列與含有rsl447295等位基因A或DG8S737等位基因-8的區域完全互補。29.在受試者中診斷癌癥的增加的風險的方法,包括篩選與LD區塊A相關的標記物或單倍型,其中的標記物或單倍型在患有癌癥的受試者中比在未患有癌癥的受試者中以更高的頻率出現,其中標記物或單倍型的存在增加受試者患有癌癥的風險。30.權利要求29中的方法,其中的癌癥選自前列腺癌、乳腺癌、肺癌和黑素瘤。31.在受試者中診斷對癌癥易感性的方法,包括i)從受試者獲得核酸樣品;以及ii)分析核酸樣品中是否存在至少一種與LD區塊A有關的標記物或單倍型,其中標記物或單倍型的存在是對癌癥易感性的指示。32.權利要求31中的方法,其中的標記物或單倍型含有一或多種選自表13中的標記物的等位基因。33.權利要求31中的方法,其中的標記物或單倍型包含DG8S737等位基因-8或rsl447295等位基因A。34.權利要求31中的方法,其中的癌癥選自前列腺癌、乳腺癌、肺癌和黑素瘤。35.在受試者中診斷與Chr8q24.21有關的癌癥的方法,包括檢測與Chr8q24.21有關的標記物或單倍型的存在,其中標記物或單倍型的存在是與Chr8q24.21有關的癌癥的指示。36.權利要求35中的方法,其中的標記物或單倍型含有一個或多個選自表13中的標記物。37.權利要求49中的方法,其中的標記物或單倍型包含DG8S737等位基因-8或rsl447295等位基因A。38.權利要求35中的方法,其中與Chr8q24.21有關的癌癥選自與Chr8q24.21有關的前列腺癌、與Chr8q24.21有關的乳腺癌、與Chr8q24.21有關的肺癌和與Chr8q24.21有關的黑素瘤。39.在個體中診斷對前列腺癌易感性的方法,包括檢測標記物DG8S737,其中在DG8S737中等位基因-8的存在是對前列腺癌易感性的指示。40.權利要求39中的方法,其中的前列腺癌是侵襲性前列腺癌,被定義為合并的Gleason分值為7(4+3)到10。41.權利要求39中的方法,其中的前列腺癌是侵襲性低的前列腺癌,被定義為合并的Gleason分值為2到7(3+4)。42.權利要求39中的方法,其中在DG8S737中等位基因-8的存在是更具侵襲性的前列腺癌和/或更壞的預后的指示。43.權利要求39中的方法,其中在DG8S737中等位基因-8的存在是受試者對特定的治療方式的不同反應率的指示。44.在個體中診斷對前列腺癌的增加的風險的方法,包括檢測標記物DG8S737,其中在DG8S737中等位基因-8的存在是前列腺癌的增加的風險的指示45.在受試者中預測前列腺癌的增加的風險的方法,包括檢測標記物DG8S737,其中DG8S737中等位基因-8的存在是侵襲性前列腺癌的增加的風險的指示。46.在受試者中預測侵襲性前列腺癌的增加的風險的方法,包括檢測標記物DG8S737,其中DG8S737中等位基因-8的存在是侵襲性前列腺癌的增加的風險的指示。47.在具有包括非洲人血統的血統的人中診斷對前列腺癌易感性的方法,包括檢測標記物DG8S737,其中DG8S737中等位基因-8的存在是對前列腺癌易感性的指示。48.在個體中診斷對前列腺癌易感性的方法,包括檢測標記物rs1447295,其中在rs1447295中等位基因A的存在是對前列腺癌易感性的指示。49.權利要求48中的方法,其中的前列腺癌是侵襲性前列腺癌,被定義為合并的Gleason分值為7(4+3)到10。50.權利要求48中的方法,其中的前列腺癌是侵襲性低的前列腺癌,被定義為合并的Gleason分值為2到7(3+4)。51.權利要求48中的方法,其中在rs1447295中等位基因A的存在是更具侵襲性的前列腺癌和/或更壞的預后的指示。52.權利要求48中的方法,其中在rs1447295中等位基因A的存在是受試者對特定治療方式的不同反應率的指示。53.在個體中診斷前列腺癌的增加的風險的方法,包括檢測標記物rsl447295,其中rs1447295中等位基因A的存在是前列腺癌的增加的風險的指示。54.在受試者中預測前列腺癌的增加的風險的方法,包括檢測標記物rsl447295,其中rs1447295中等位基因A的存在是侵襲性前列腺癌的增加的風險的指示。55.在受試者中預測侵襲性前列腺癌的增加的風險的方法,包括檢測標記物rsl447295,其中rs1447295中等位基因A的存在是侵襲性前列腺癌的增加的風險的指示。56.在個體中診斷對前列腺癌的降低的易感性的方法,包括檢測表22中顯示的單倍型,其中單倍型的存在是對前列腺癌降低的易感性的指示。57.在個體中診斷對前列腺癌的降低的易感性的方法,包括檢測表13中顯示的相對風險小于1的標記物,其中標記物的存在是對前列腺癌降低的易感性的指示。58.在個體中診斷對前列腺癌的增加的易感性的方法,包括檢測表13中顯示的相對風險大于1的標記物,其中標記物的存在是對前列腺癌增加的易感性的指示。59.在受試者中診斷對癌癥易感性的方法,包括分析從受試者獲得的核酸樣品中至少一種與LD區塊A有關的標記物或單倍型的存在,其中標記物或單倍型的存在是對癌癥增加的易感性的指示。60.權利要求59中的方法,其中的標記物或單倍型含有一或多種選自表13中的相對風險大于1的標記物。61.權利要求60中的方法,其中的標記物或單倍型包含DG8S737等位基因-8或rsl447295等位基因A。62.權利要求59-61任何一個中的方法,其中的癌癥選自前列腺癌、乳腺癌、肺癌和黑素瘤。63.權利要求62中的方法,其中的癌癥是前列腺癌,標記物或單倍型的相對風險至少為1.5。64.權利要求62或63中的方法,其中的前列腺癌是侵襲性前列腺癌,被定義為合并的Gleason分值為7(4+3)到10。65.權利要求62或63中的方法,其中的前列腺癌是侵襲性低的前列腺癌,被定義為合并的Gleason分值為2到7(3+4)。66.權利要求63或64中的方法,其中標記物或單倍型的存在是更具侵襲性的前列腺癌和/或更壞的預后的指示。67.權利要求62中的方法,其中的癌癥是乳腺癌,標記物或單倍型的相對風險至少為1.3。68.權利要求62中的方法,其中的癌癥是肺癌,標記物或單倍型的相對風險至少為1.3。69.權利要求62中的方法,其中的癌癥是黑素瘤,標記物或單倍型的相對風險至少為1.5。70.權利要求62中的方法,其中的黑素瘤是惡性皮膚性黑素瘤。71.權利要求59-70任何一個中的方法,其中標記物或單倍型的存在是受試者對特定治療方式的不同反應率的指示。72.權利要求59-70任何一個中的方法,其中標記物或單倍型的存在是在腫瘤或其前體中Chr8q24.21的體細胞重排傾向性的指示。73.權利要求72中的方法,其中的體細胞重排選自擴增、易位、插入和缺失。74.權利要求59-73任何一個中的方法,其中的標記物或單倍型含有一或多種與Chr8q24.21有關的標記物,該標記物與一或多種選自表13中的標記物處于強烈的連鎖不平衡,該連鎖不平衡被定義為(ID'I>0.8)和/或r2〉0.2。75.權利要求74中的方法,其中選自表13中的一或多種標記物包含rs1447295等位基因A或DG8S737等位基因-8。76.權利要求59中的方法,其中至少一種標記物或單倍型的相對風險小于1,并包含rsl2542685等位基因T和rs7814251等位基因C。77.權利要求59中的方法,其中的至少一種標記物或單倍型包含至少一種表13中顯示的相對風險小于1的標記物。78.權利要求76-77任何一個中的方法,其中的癌癥是前列腺癌。79.權利要求59-79任何一個中的方法,其中的受試者具有非洲黑人血統。80.分析來自受試者的樣品以檢測對癌癥易感性的試劑盒,其中的試劑盒含有一種或多種用于檢測與LD區塊A相關的標記物或單倍型的試劑。81.權利要求80中的試劑盒,其中的癌癥選自前列腺癌、乳腺癌、肺癌和黑素瘤。82.權利要求81中的試劑盒,其中的癌癥是前列腺癌。83.權利要求80-82任何一個中的試劑盒,其中的一或多種試劑含有至少一種連續的核苷酸序列,該序列與含有至少一種選自表13中的標記物的區域完全互補。84.權利要求80-83任何一個中的試劑盒,其中的一或多種試劑含有至少一種連續的核苷酸序列,該序列與含有rsl447295等位基因A或DG8S737等位基因-8的區域完全互補。全文摘要已經證實染色體8q24.21上的位點在特定形式的癌癥中扮演重要角色。已經發現某些標記物和單體型是對特定癌癥易感性的指示。描述了對癌癥易感性進行鑒定的診斷應用。文檔編號C12Q1/68GK101238223SQ200680025161公開日2008年8月6日申請日期2006年5月18日優先權日2005年5月18日發明者勞非·阿孟達多蒂爾,尤利烏斯·格維茲門松,帕特里克·舒萊姆申請人:解碼遺傳學私營有限責任公司