用于創建良種品系的基于最優單倍體值的選擇的制作方法
【專利摘要】本公開內容涉及為了產生加倍單倍體而評估植物的育種值,例如以鑒定具有高育種值的選擇候選物的方法。
【專利說明】
用于創建良種品系的基于最優單倍體值的選擇
[0001] 優先權要求
[0002] 本申請要求2014年12月30日提交的美國非臨時專利申請流水號No. 14/586,488, 2013年12月31日提交的美國臨時專利申請流水號No. 61 /922,148,2014年2月13日提交的美 國臨時專利申請流水號No. 61/939,599,和2014年12月16日提交的美國臨時專利申請流水 號 No. 62/092,737 的權益。
技術領域
[0003] 本公開設及植物分子遺傳學和育種。一些實施方案設及用于在育種群體中選擇優 選的交配對(mating pair)的方法。一些實施方案設及選擇后代植物作為良種品系加 W使 用和/或推進的方法。
[0004] 發明背景
[0005] 在植物育種程序中創建加倍單倍體,使得從遠交植物創建完全純合的個體成為可 能,從而促進新品種的開發。最優的加倍單倍體的選擇是通過人工表型選擇的方法實現的, 要利用個別植物及其親緣的表型記錄,費時且昂貴。在一些情況下,表型選擇還可能設及后 代測試。此外,可W使用把表型和譜系結合起來的方法來預測個體的評估育種值化BV)。運 些EBV可能包含來自個體的多次交配的后代性能信息。參見例如Schaeffer (2006) J .Anim. Breed. Genet. 123: 218-23。一般地,由于獲自親屬的信息可增加評估的可靠性,因 此基于用最優線性無偏預測(BLUP)計算的EBV進行選擇,相比于僅使用表型是有利的。 Henderson(1975)Biometrics 31:423-447。
[0006] 目前,基因組選擇(GS)被用來改善植物選擇效率。它是一種使用表型(例如性狀觀 察,諸如疾病抗性和質量屬性)和基因組數據兩者的統計學遺傳評估方法。Meuwissen等 (2001 )Genetics 157:1819-29 eGS的結果是對特定群體中的所有標志物的性狀效應估計。 在GS中,可W加入性狀效應估計W為個體產生基因組估計育種值(genomic estimated breeding va 1 ue,GEBV)。使用具有表型和基因型的參照群體--在其中估計標記物效應 (marker effects)--來導出"預測方程"(prediction equation)。然后,可W對確定基因 型的個體應用此預測方程來預測GEBV。
[0007] 基因組選擇的實現通常需要具有表型和基因型的參照群體(在參照群體中估計標 志物效應),即所謂的預測方程。然而,遠交物種中的稀疏標志物圖提供的GS信息是有限的, 因為必須對每個要用標志物加 W選擇的家族確立特定標志物和QTL之間的連鎖相。還有,密 集標志物圖中的一些標志物會非常接近QTL,因此與9化處于連鎖不平衡。Hastbacka等 (1992)化t.Genet. 2: 204-11。此外,標志物圖中會存在許多沒有遺傳方差(即不分離)的基 因座,數量上大大超過確實展示遺傳方差的那些基因座。
[000引在GS方法中,迄今為止對群體的選擇限度的估計是基于運樣的假設,即全染色體 單倍型,或者個別的等位基因,可W在必要時被選擇并組合W產生新的完整基因組(例如, "終極動物",其基因組包含群體中的所有最優染色體KCole and VanRaden(2011) J .Anim. Breed .Genet. 128:446-55。另外,計算機選擇程序可W類似地利用遺傳算法來培育 含有最優的已知染色體區段的"終極牛"。Kemper等(2012)J.Dairy Sci.95:4646-56。
[0009] 在牛中,可W使用全染色體GEBV鑒定優選的交配配偶(Cole and化nRaden(2010) J.Dai巧Sci . 93: 2727-40),而在魚中,可W通過利用參照群體中的加倍單倍體的某些組合 ("極端基因型"),利用模擬來提高預測準確性(Nirea等(2012)Genetics Selection Evolution 44:30)。然而,由于主要和次要QTL兩者中的對立關系,GEBV難W達到計算的選 擇限度。參見例如Cole and化nRaden(2011),見上文。此外,基于評估育種值的選擇最大化 下一代中的遺傳獲得量是W犧牲遺傳多樣性為代價的。Kemper等(2012),見上文。因此,基 于總體GEBV的選擇在下一代中給出的響應最高,但是不能保證經過多代后獲得量的最大 化。
[0010] 個體的基因組育種值是所有等位基因效應的總和,并且復雜性狀的改善需要許多 獨特的基因座的等位基因頻率發生有利的改變。然而,植物育種程序中生成的加倍單倍體 之間會有差異,因為每個個體繼承的單倍型組合不同。
[00川發明概述
[0012]對于選育現有植物品種W生成新品種而言,單倍型的某些組合會優于其它組合, 因為它們集合了植物個體中最優的等位基因。本文中的實施方案利用一種新的植物育種策 略,其在生成和選擇良種加倍單倍體個體的過程中引入了對最優或近最優的單倍型(例如 基因組區段單倍型)的選擇。在實施方案中,為分離的個體、或者為用于育種對(或潛在育種 對)的候選個體確定基因組最優單倍體值(0HV),該值是可W從分離植物產生的最優單倍體 基因組的值。在一些例子中,如下確定0HV:對單倍體個體基因組區段做出基因組預測,為二 倍體中的每對區段鑒定最優的單倍體基因組區段(即具有最高的預測值的區段),并組合 (例如求和)所有區段里運些最優區段的值,從而得到具有基因組區段的最優組合的單倍體 個體的育種值;即0HV。在實例中,具有每個最優基因組區段的兩個拷貝的加倍單倍體個體 的合計育種值是0HV的兩倍(2x)。
[0013]在某些實施方案中,從發生分離的(segregating)植物生成一個或多個單倍體植 物或單倍體組織。對每個單倍體植物或單倍體組織確定組合單倍體值(CHV),所述CHV是單 倍體基因組的區段的育種值(例如對于感興趣的數量性狀)("單倍體值";HV)的和。在具體 的實施方案中,將每個單倍體植物或組織的CHV與該發生分離的植物的0HV比較。在一些例 子中,若CHV接近0HV,則選擇該單倍體植物或組織,然后可W使用該選定的單倍體植物或組 織生成加倍單倍體植物。
[0014] 在一些實施方案中,將多個植物中的每個植物的0HV與該多個中的其它植物的0HV 比較,并且將其作為標準用于選擇"最優"的雜交。因此,可W基于其產生可W用于產生加倍 單倍體的最優單倍體染色體組的潛力而選擇出一個或多個具有比其它0HV大的0HV的個體, 從而在育種或生成加倍單倍體群體之前引入選擇步驟。在一些進一步的實施方案中,將選 定的個體與另一個植物雜交W生成后代植物(例如Fi、F2或的后代植物),并且確定至少一個 后代植物的0HV。若后代植物的0HV大于其它0HV,則可W選擇后代植物用于自交或者W生成 單倍體。
[0015] 在一些實施方案中,從選定的后代植物生成單倍體植物或單倍體組織,并且將單 倍體植物或組織的CHV與選定的后代植物的0HV比較。在一些例子中,若CHV接近0HV,則進一 步選擇單倍體植物或組織,然后可W使用經過進一步選擇的單倍體植物或組織生成加倍單 倍體植物。
[0016] 在一些實施方案中,與GS相比,前述選擇方法增加遺傳獲得量和遺傳多樣性。因 此,與通過GS可獲得的遺傳獲得量相比,0HV選擇使得育種程序中經歷多代的遺傳獲得量增 加成為可能。
[0017] 本文中的一些實施方案提供了用于生成良種加倍單倍體植物的0HV選擇方法。在 具體的實施方案中,所述方法包括對個體植物確定基因組0HV,從個體生成單倍體(和/或其 加倍單倍體)的群體,并且對來自該群體的良種植物選擇等于或接近該0HV的CHV。
[0018] 在本文中的一些實施方案中還提供了 0HV選擇植物育種方法,其包括評估品系間 雜交生成良種雙單倍體(其可能含有期望的等位基因或GM事件)的潛力,然后可W選擇所述 良種雙單倍體進一步育種。在一些實施方案中,方法包括確定第一植物W及至少第二植物 的潛在后代的最優基因組0HV,并且如果最優0HV滿足選擇標準,那么雜交第一和第二植物。 在具體的實施方案中,所述標準是運樣的條件:所述最優0HV是對第一植物與多個其他植物 的潛在后代所確定的0HV中的最高者。因此,在一些例子中,該方法包括:對第一植物與多個 其他植物中的每一個的潛在后代確定最高的可能的基因組0HV,并且雜交第一植物與在與 第一植物的潛在雜交中產生最高的可能的0HV的所述多個中其他植物的成員。
[0019] 在本文中的一些實施方案中還提供了用于生成良種加倍單倍體植物的0HV選擇方 法,其中所述方法包括雜交第一和第二植物W生成后代植物的群體,從至少一個所述后代 植物生成單倍體(和任選其加倍單倍體)的群體,并且選擇良種加倍單倍體植物或用于生成 良種加倍單倍體植物的單倍體。在一些例子中,從W接近育種雜交的最優0HV的0HV為標準 選擇出的后代植物生成單倍體的群體。在一些例子中,從單倍體的群體中W接近0HV的CHV 為標準選擇用于生成良種加倍單倍體植物的單倍體。在具體的實施方案中,所述第一植物 包含滲入到良種加倍單倍體植物或用于生成良種加倍單倍體植物的單倍體中的等位基因 或轉基因事件。
[0020] 在本文中的一些實施方案中,用于生成良種加倍單倍體植物的方法在植物育種程 序中的多個步驟中實施。例如,可W利用0HV選擇用第一植物品系生成良種加倍單倍體,所 述良種加倍單倍體變為第二植物品系。然后可W再次使用第二植物品系進行雜交。然后,可 W基于0HV再次選擇運些雜交的后代W生成第二良種加倍單倍體。為了獲得新的期望的良 種植物品系,此過程可W多次重復,運可由熟練技術人員裁量決定。
[0021] 在一些實施方案中,在植物育種程序中利用0HV可相對于GS增加遺傳獲得量(例如 增加多達0.6個遺傳基礎標準差(SD)),同時當與GS相比時還提高遺傳多樣性。可W通過增 加為每個育種對生成和基因分型的后代的數目實現遺傳獲得量的更大增加。假設DH生成的 規模保持恒定,可W在不付出額外成本的條件下實現0HV的優點,因此使0HV選擇成為一種 對于植物育種人員有吸引力的新工具。
[0022] 本文中還描述了植物選擇系統,其包括:用于確定一個或多個植物的基因型的試 劑盒;數據庫;用于從基因型確定0HV的手段;和允許用戶輸入基因型信息的用戶界面,其中 系統為一個或多個植物確定0HV。在具體的實施方案中,試劑盒包含結合有多核巧酸的固體 支持物,其中每個多核巧酸可與緊密連鎖于基因組區段單倍型的多態性遺傳標志物雜交。 在具體的實施方案中,試劑盒包含基于PCR的確定。在具體的實施方案中,使用試劑盒對半 種子或非常幼小的植物,和/或來自單倍體植物的材料基因分型。在一些例子中,用于從基 因型確定OHV的手段是分析編程(analytical programming)。在一些例子中,用于從基因型 確定0HV的手段是參照圖表。
[0023] 通過參考附圖進行的幾個實施方案的W下詳細描述,前述和其它特征會變得更加 顯而易見。
[0024] 附圖簡述
[0025] 圖1包括在小麥新品種的開發中應用0HV選擇的例子。在此例子的第一步中,為具 有期望性狀(即GM事件,W星形表示)的第一植物品系W及作為第一植物的育種配偶的第二 植物品系中的每個單倍體基因組區段評估期望性狀的HV。通過計算機模擬,確定最優的單 倍體值(0HV;能夠從發生分離的植物生成的最優的加倍單倍體,在此情形中是雜交的后 代)。在例示的例子中,對兩個后代植物確定0HV,并且最高的0HV是5+4+4= 13。在下一步中, 對從雜交的具有最高的0HV的分離后代生成的單倍體確定性狀的CHV。在此例子中,選擇具 有接近最高的0HV的CHV(即,CHV = 12)的單倍體植物。在第立步中,從此單倍體植物創建加 倍單倍體,選擇所述加倍單倍體作為新的良種品種。
[0026] 圖2包括利用0HV選擇的示例性育種程序的一般結構,其中可W將雜交重復η代,并 且可W在每代中創建良種固定品系。
[0027] 圖3包括對0HV選擇相對于GS的優點的圖形表示,包括使用0HV代替GS得到更好的 遺傳獲得量(從第2代至第10代的遺傳基礎SD)。垂直軸顯示了當:改變每次遠交雜交的后代 數目(nOff)時(圖3a);改變每個良種植物產生的加倍單倍體的數目(nDH)時(圖3b);將"默 認化EFAULT)情境"繼續20代(nGen)時(圖3c);和改變用于生成加倍單倍體的良種個體的數 目(址1 iteInd)時(圖3d),0HV與GS之間的遺傳獲得量差異(de 1 taG)。
[0028] 圖4包括圖形表示,顯示了對于默認和nD冊00情境,選擇OHV或基因組育種值(GS) 時每代中的真遺傳方差(SE<3.64)。
[0029] 圖5包括圖形表示,顯示了當改變QTL的數目(nQTL)(圖5a),或者改變每個染色體 的單倍型區段的數目(nSeg)(圖化)時,0HV和GS之間的遺傳獲得量的差異(deltaG)。
[0030] 圖6包括圖形表示,顯示了基于OHV的滲入相對于傳統滲入恢復初始遺傳背景的優 點(包括增加的遺傳獲得量)。
[0031] 圖7包括圖形表示,顯示了 "流程Γ的玉米設計中的通用基因組育種程序,其中DH 是加倍單倍體,η是世代數目。選擇基于最優單倍體或基因組評估育種值。在創建后,可W將 良種加倍單倍體循環回到第二代中的育種群體中。
[0032] 圖8包括圖形表示,顯示了利用來自玉米的經驗標志物組,當改變每次雜交的后代 數目(n0ff)(10、50、100、200、500和1000)時,0HV和GS之間每代的遺傳獲得量的差異。標準 誤差的范圍在早期至晚期世代中分別為0.14至0.28。
[0033] 圖9包括圖形表示,顯示了利用來自玉米的經驗標志物組,當改變每個良種植物生 成的加倍單倍體數目(nDH)n0ff)α0、50、100、200、500和1000)時,0HV和GS之間每代的遺傳 獲得量的差異。標準誤差的范圍在早期至晚期世代中分別為0.12至0.19。
[0034] 圖10包括圖形表示,顯示了利用來自玉米的經驗標志物組,當改變循環回到育種 程序中的良種加倍單倍體的數目(nDH巧cled)n0ff)(0、10、50、100、200)時,0HV和GS之間每 代的遺傳獲得量的差異。標準誤差的范圍在早期至晚期世代中分別為0.12至0.19。
[0035] 圖11包括圖形表示,顯示了利用來自玉米的經驗標志物組,當改變每個染色體的 單倍型區段數目(nSeg)(l、2、3和6)時,OHV和GS之間每代的遺傳獲得量的差異。標準誤差的 范圍在早期至晚期世代中分別為0.12至0.18。
[0036] 圖12包括圖形表示,顯示了利用來自玉米的經驗標志物組,0HV和GS育種程序的每 代的真遺傳方差。
[0037] 圖13包括圖形表示,顯示了使用來自玉米的經驗標志物組中的雜種優勢組1SNP效 應,當改變每次雜交的后代數目(n0ff)(10、50、100、200、500和1000)時,0HV和GS之間的遺 傳獲得量的差異。標準誤差的范圍為0.04至0.09。
[0038] 圖14包括圖形表示,顯示了使用來自玉米的經驗標志物組中的雜種優勢組1SNP效 應,當改變每個良種植物生成的加倍單倍體的數目(nDH)時,0HV和GS之間的每代的遺傳獲 得量的差異。標準誤差的范圍為0.04至0.09。
[0039] 圖15包括圖形表示,顯示了使用來自玉米的經驗標志物組中的雜種優勢組1SNP效 應,當改變每個染色體的單倍型區段數目(nSeg)(l、2、3和6)時,0HV和GS之間的每代的遺傳 獲得量的差異。標準誤差的范圍為0.04至0.09。
[0040] 圖16包括圖形表示,顯示了 0HV和GS育種程序的每代的真遺傳方差并且使用來自 玉米的經驗標志物組中的雜種優勢組1SNP效應。標準誤差的范圍0.0至0.03。
[0041] 圖17包括圖形表示,顯示了使用來自玉米的經驗標志物組中的雜種優勢組1SNP效 應,當改變每次雜交的后代數目(n0ff)(10、50、100、200、500和1000)時,0HV和GS之間的每 代的遺傳獲得量的差異。標準誤差的范圍為0.04至0.11。
[0042] 圖18包括圖形表示,顯示了使用來自玉米的經驗標志物組中的雜種優勢組1SNP效 應,當改變每個良種植物生成的加倍單倍體數目(nDH)10、50、100、200、500和1000)時,0HV 和GS之間的每代的遺傳獲得量的差異。標準誤差的范圍為0.04至0.08。
[0043] 圖19包括圖形表示,顯示了使用來自玉米的經驗標志物組中的雜種優勢組2SNP效 應,當改變每條染色體的單倍型區段的數目(nSeg)(l、2、3和6)時,0HV和GS之間的每代的遺 傳獲得量的差異。標準誤差的范圍為0.03至0.08。
[0044] 圖20包括圖形表示,顯示了 0HV和GS育種程序的每代的真遺傳方差,并且使用來自 玉米的經驗標志物組中的雜種優勢組2SNP效應。標準誤差的范圍為0.0至0.11。
[0045] 發明詳述
[OOW I.幾個實施方案的概述
[0047] 在本文中的實施方案中,使用個別單倍體基因組區段(如可W在品系雜交的單倍 體或配子中找到的單倍體基因組區段)的數值預測,為每一對鑒定感興趣的性狀的最優基 因組區段,并且求和,來確定最優雙單倍體(即具有接近"0HV"的單倍體值)。品系雜交的最 高可能0HV是與雜交的GEBV不同的一種數值測量。例如,品系雜交可W在給定的一對染色體 處產生一個非常好的單倍體染色體和一個非常差的單倍體染色體。在運樣的情況下,G邸V 會給出運些值的平均值,而如本文中描述的0HV則可反映組合非常好的單倍體等位基因的 數值。
[0048] GEBV是所有等位基因效應的和,因此如果個體攜帶不利的等位基因,它就會降低 它們的GEBV dGS傾向于增加群體中的單倍型(即純合性)的總頻率。與之相對的是,0HV僅對 每個區段中的最優單倍型值求和,因此如果區段上的另一個單倍型更優勢,那么它會忽略 低價值的等位基因。攜帶兩個有利的單倍型沒有更多的益處,因為個體的0HV將保持不變。 運就能夠在育種群體中維持更具多樣性的單倍型組,并且使得來自OHV選擇的多樣性的實 質的、顯著的增加。維持的單倍型可W劣勢的,因為它們攜帶若干不利的QTL等位基因,但是 此類單倍型也可W包含一個或多個有利的等位基因。隨著時間推移,重組可W將此類有利 的等位基因"釋放"到平均的或有利的背景中,并且然后可W通過選擇增加運些單倍型的頻 率。
[0049] 本文中證明了令人驚訝的結果,即相對于GS,單獨的0HV選擇不僅僅可W提供例如 多達0.6個遺傳 SD的額外遺傳獲得量。0HV選擇還在育種群體中保留更多的遺傳多樣性,運 可提供更大的靈活性,并且長遠來看可實現更多的遺傳獲得量。例如,在具體的實施方案 中,0HV選擇可減少將育種群體帶入的下述情境中的可能性:經過幾輪選擇后,由于遺傳方 差喪失,阻止或限制了性狀的進一步改善(即,遺傳"盲端")。
[0050] 0HV選擇的還有一個優勢是可W對良種植物基于其生成有利(例如最優)加倍單倍 體的潛力加 W選擇,運在創建加倍單倍體前引入一個額外的選擇步驟,從而導致成本節約 和性能優勢。運項創新可加速在優化的遺傳背景中具有期望的等位基因或轉基因事件的栽 培種的開發。0HV選擇的一個特別的優勢是,個體在育種程序中的實際值可W在它展現出表 型(例如在幼小的植物、胚或組織中)前,和/或在雜交植物前得到準確預測。育種程序中的 早期選擇決定可提供相當大的時間和生長成本節約,因為可W在劣勢的個體耗費有價值的 資源之前鑒定并淘汰它們。
[0051] 在一些實施方案中,0HV選擇考慮加性和上位效應。在新的優勢植物品種的育種中 評估上位相互作用當前可行性很低,運是由于整個主題基因組上的單核巧酸多態性的可能 兩兩組合的數目龐大。在本文中的具體的實施方案中,通過減少要測試的上位相互作用的 數目,大大易化了上位相互作用的評估。例如,可W使用單倍體基因組區段(如用于確定HV、 CHV和0HV的單倍體基因組區段)測試逐基因座(loci by loci)的相互作用。作為進一步的 例子,可W通過測試整個單倍體基因組區段的最常見單倍型的相互作用,來評估較長的基 因組距離的相互作用。在具體的實施方案中,根據前述策略考慮上位效應,可W更好地選擇 植物育種中的有利相互作用和遺傳背景。
[0052] 我們已經描述并且在計算機模擬中測試了新的育種框架(0HV),其可優化品系選 擇,得到良種加倍單倍體。0HV選擇所致的遺傳獲得量比GS更多,并且此優勢隨著時間而增 長。聚焦于單倍型選擇允許0HV選擇在育種群體中攜帶實質上更多的遺傳多樣性。
[005;3] II.縮寫
[0054] BLUP最優線性無偏預測
[0化日]cM 厘摩
[0056] CHV組合單倍體值
[0化7] 邸V估計育種值
[0化引 G邸V基因組估計育種值
[0化9] GM 遺傳修飾的
[0060] GS 基因組選擇
[0061 ] HV 單倍體值
[0062] LD 連鎖不平衡
[0063] 0CV最優細胞質值
[0064] OHV最優單倍體值 [0(?日]PCR聚合酶鏈式反應
[0066] QTL數量性狀基因座
[0067] SD 標準差 [006引 III.術語
[0069] 最優:如本文中在單倍型數值的背景中使用,術語"最優"可W指對可發生分離的 植物獲得的最高CHV的預測(即0HV)。在一些例子中,從發生分離的植物(例如雜交的后代) 創建單倍體,并且對在所得的單倍體中的基因組區段確定HV,對所述HV求和W產生CHV。在 一些例子中,選擇具有接近0HV的CHV的單倍體個體。例如,可W選擇運樣的個體,其具有與 0HV相同或基本上相同的CHV。作為進一步的例子,接近0HV的CHV可W是與群體中確定的0HV 最接近的CHV。在一些實施方案中,如果熟練從業人員認為沒有鑒定出具有足夠接近0HV的 CHV從而可被選擇的個體,可W從該特定的雜交生成進一步的后代,直至鑒定并選擇個體。
[0070] 群體:如本文中使用,術語"群體"指彼此潛在可能交配,使得它們在遺傳對下一世 代作貢獻的個體集合,包括但不限于在植物育種程序中的那些個體。運樣的集合可W是任 何大小的(例如物種、品種、品系、栽培種、或單次或多次雜交的后代)。
[0071] 育種值:如本文中使用的,術語"育種值"指個體在育種程序中作為親本的遺傳值, 并且指個體的基因或遺傳標志物當單獨或在組合中(即,"累積育種值")被考慮時,參照一 項或多項選擇標準對性能的影響。
[0072] 遺傳獲得量:如本文中使用的,術語"遺傳獲得量"指可遺傳性狀或可遺傳性狀的 組合從一個世代到下一世代的平均變化,其包括預測的遺傳獲得量和/或實際的遺傳獲得 量。在一些實施方案中,遺傳獲得量使得可遺傳性狀的值向著一個或多個選擇目標方向推 進,或者至少避免顯著的負遺傳獲得量(即,用于選擇標準的不利效應)。
[0073] 遠交:如本文中使用,術語"遠交"指通過遺傳上不相似的親本之間的繁殖生成的 個體。比較而言,術語"近交"指通過遺傳上相似或相同的親本之間的繁殖生成的個體。實際 上,利用遠交群體的植物育種人員掌握的關于個體的遺傳特征的信息(例如它們攜帶什么 基因,W及它們的雜合的程度)一般是有限的。此外,背景遺傳數據經常是不可靠的,因為它 可能快速變化。
[0074] 雜交:術語"育種雜交"和"雜交"在本文中可互換使用,指遠緣或密切近緣的個體 的交叉繁殖(例如,回交、近交、或自交),諸如植物育種程序中的有意育種。雜交的后代指雜 交的一個或多個后代,可W包括例如Fi、F2、的和后續世代的后代。
[0075] 回交:回交方法可W用于將核酸序列導入植物中。近幾十年來廣泛使用回交技術 來將新性狀導入植物中。Jensen,N.編 Plant Breeding Methodology, John Wiley&Sons , Inc. ,1988。在一個典型的回交方案中,將感興趣的初始品種(回歸親本)與攜帶要轉移的感 興趣基因的第二品種(非回歸親本)雜交。然后,將來自此雜交的所得后代與回歸親本再次 雜交,并重復該過程,直到獲得如下的植物:其中不但來自非回歸親本的轉移基因,回歸植 物的基本上所有期望的形態學和生理學特征亦均在轉化植物中得W恢復。在本文中的一些 實施方案中,回交育種程序中納入0HV選擇,W便,例如,提供額外的選擇步驟來鑒定優選的 輪回萊本。
[0076] 基因座:如本文中使用的,術語"基因座"指基因組上與可辨別或可測量的特征(例 如,性狀)對應的位置。SNP基因座通過與基因座內含有的DM雜交的探針來界定。
[0077] 上位性:如本文中使用,術語"上位性"(或"上位性的")指兩個或更多個基因座之 間的相互作用。在上位相互作用中,一個基因的表達取決于一個或多個別的基因的存在。例 如,如果兩個上位基因"A"和"B"是突變的,并且每個突變自身產生獨特的表型,但是兩個突 變一起與基因 A突變顯示相同的表型,則基因 A對于基因 B是上位的。
[0078] 等位基因:如本文中使用的,術語"等位基因"指在單一基因座處的基因或DNA序列 的不同形式中的任一個。
[0079] 標志物:如本文中使用的,標志物是指可W用于鑒定可能具有特定等位基因和/或 展現出特定的性狀或表型的植物(例如單倍體和二倍體)的基因或核巧酸序列。標志物可W 描述為給定基因組基因座處的變異。遺傳標志物可W是短的DNA序列,諸如單堿基對變化 (單核巧酸多態性,或"SNP")周圍的序列,或長的DNA序列,例如小衛星/簡單序列重復 ("SSR")。"標志物等位基卸'指標志物在特定植物中存在的版本。如本文中使用的,術語"標 志物"可W指植物染色體DNA的克隆區段,而且/或者可W指與植物染色體DNA的克隆區段互 補的DNA分子。在具體的實施方案中,植物中的標志物的鑒定促進特定基因組區段的育種值 的確定,該數值可W與其它數值組合W產生HV。
[0080] 在一些實施方案中,可W經由使用核酸探針檢測植物中的標志物存在。探針可W 是DNA分子或RNA分子。可W通過本領域中已知的手段,例如使用DNA分子模板合成RNA探針。 探針可W含有標志物的整個或部分核巧酸序列,W及來自植物基因組的額外的、郵連的核 巧酸序列。運在本文中稱為"郵連探針"。取決于來自植物染色體的郵連核巧酸序列是在初 始標志物如慣常理解的5'還是3 '側,所述額外的、郵連的核巧酸序列稱為初始標志物的"上 游"或"下游"。如本領域普通技術人員認可的,獲得額外的、郵連的核巧酸序列W納入標志 物中的方法可W幾乎無限重復進行(僅受限于染色體的長度),由此沿著染色體鑒定出額外 的標志物。可W在本發明的一些實施方案中使用所有上文描述的標志物。可W根據熟練從 業人員的判斷確定具體例子中利用的探針的數目,例如,根據篩選的基因座或QTL的數目。
[0081] 寡核巧酸探針序列可W合成或通過克隆制備。合適的克隆載體是本領域技術人員 公知的。寡核巧酸探針可W是帶標記的或無標記的。用于核酸分子的標記物和標記技術種 類繁多,包括例如但不限于:放射性標記(例如通過缺口平移、隨機引發、和用末端脫氧轉移 酶(deoxytransf erase)的加尾);巧光團;酶;酶底物;酶輔因子;酶抑制劑。
[0082] 探針可W含有與初始標志物的核巧酸序列不郵連的核巧酸序列;此探針在本文中 稱為"非郵連探針"。非郵連探針的序列與染色體上的初始標志物的序列的位置足夠接近, 從而非郵連探針與初始標志物遺傳連鎖于相同的標志物或基因。例如,在一些實施方案中, 非郵連探針定位在染色體上的初始標志物的100cM;95cM;90cM;85cM;80cM;75cM;70cM; 65cM;60cM;55cM;50cM;45cM;40cM;35cM;30cM;25cM;20cM;15cM;或lOcM內。在一些例子中, 非郵連探針定位在初始標志物的約50cM內。
[0083] 探針可W是要檢測的標志物的精確拷貝。探針也可W是包含運樣的核巧酸序列或 由運樣的核巧酸序列組成的核酸分子:所述核巧酸序列與包含要檢測的標志物的染色體 DNA的克隆區段基本上相同。
[0084] 探針也可W是與要檢測的標志物("DNA祀標")的精確拷貝"可特異性雜交"或"特 異性互補"的核酸分子。"可特異性雜交"和"特異性互補"是運樣的術語,其指示足夠的互補 性程度,使得核酸分子(例如寡核巧酸)和DM祀標之間發生穩定的、特異性的結合。核酸分 子與其可特異性雜交的祀序列不需要是100%互補的。在存在足夠的互補性程度W避免核 酸在期望特異性結合的條件下,例如在嚴格雜交條件下對非祀序列的非特異性結合時,核 酸分子是可特異性雜交的。
[0085] 產生特定嚴格性程度的雜交條件會隨選擇的雜交方法的性質及雜交核酸序列的 組成和長度而有所變化。一般地,雜交的溫度和雜交緩沖液的離子強度(尤其是Na+和/或Mg Η濃度)會決定雜交嚴格性,盡管清洗次數也影響嚴格性。關于獲得特定嚴格性程度需要的 雜交條件的計算是本領域普通技術人員已知的,并且例如在Sambrook等(編)Molecular Cloning: A Laboratory Manual,第2片反,第1-3卷,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY, 1989,第9章和第11 章;及化 mes 和Higgins (編)Nucleic Acid Hybridization,1化Press,Oxford, 1985中討論。關于核酸雜交的更為詳細的用法說 明和指導可W參見例如Tijssen, "Overview of principles of hybridization and the strategy of nucleic acid probe ass曰ys 于L曰bor曰tory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,第I 部分,第2 章,Elsevier, NY,1993;和 Ausubel 等編,Current Protocols in Molecular Biology,第2章 ,Greene Publishing and Wiley-Interscience,NY,1995。
[0086] 如本文中使用,"嚴格條件"涵蓋僅在雜交分子與DM祀標之間存在有小于25%錯 配時發生雜交的條件。"嚴格條件"包括其它特定的嚴格性水平。如此,如本文中使用,"溫和 (moderate)嚴格性"條件是具有超過25%序列錯配的分子不會雜交的那些條件;"中等 (medium)嚴格性"條件是具有超過15 %錯配的分子不會雜交的那些條件;而"高嚴格性"條 件是具有超過10%錯配的分子不會雜交的那些條件。"非常高嚴格性"的條件是具有超過 6%錯配的分子不會雜交的那些條件。
[0087] 在具體的實施方案中,嚴格條件是于65Γ在6x鹽水-巧樣酸鋼(SSC)緩沖液、?5χ登 哈特(Denhardt)氏溶液、0.5%SDS、和lOOyg剪切的娃魚精巢DNA中雜交,接著于65°C在2χ SSC緩沖液和0.5 % SDS中,接著是lx SSC緩沖液和0.5 % SDS中,最終0.2χ SSC緩沖液和 0.5%SDS中序貫清洗15-30分鐘。
[0088] 就上文討論的所有探針而言,探針可W包含別的核酸序列,例如,啟動子;轉錄信 號;和/或載體序列。
[0089] 連鎖的:連鎖的、緊密連鎖的、和極緊密連鎖的遺傳標志物可W用于標志物輔助育 種程序,例如但不限于,W將期望的性狀或表型滲入入植物品種中;W及確定個體或理論個 體(例如可能的個體后代,如通過親本植物雜交預期要生成的個體后代)的染色體中的基因 組區段的單倍型(例如用于HV確定)。
[0090] 如本文中使用的,基因或標志物間的"連鎖"指染色體上的基因或標志物顯示W可 測量概率一起傳遞到下一代個體的現象。兩種基因或標志物彼此越接近,此概率變得越接 近(1)。因此,術語"連鎖的"可W指W大于0.5的概率(運是基于標志物/基因位于不同染色 體上的獨立分配預期的)與第二基因或標志物一起傳遞的一個或多個基因或標志物。由于 兩個基因或標志物在染色體上的接近性與基因或標志物會被一起傳遞到下一世代的個體 的概率直接相關,術語"連鎖的"在本文中也可W指在同一條染色體上彼此接近的一個或多 個基因或標志物。
[0091] 如本文中使用,標志物和期望的性狀或表型之間的連鎖可W指W比從隨機機會預 期的概率(0.5)大的概率各自與某種性狀或表型一起傳遞的一個或多個標志物。例如但不 限于,一個或多個標志物被一起傳遞的概率可W是至少約0.7;至少約0.75;至少約0.8;至 少約0.85;至少約0.9;至少約0.91;至少約0.92;至少約0.93;至少約0.94;至少約0.95;至 少約0.96;至少約0.97;至少約0.98;至少約0.99;和/或基本上為1。雖然標志物在一些例子 中可W被包含在決定特定性狀或表型的基因內,應當理解的是,最經常地,標志物可能與同 一條染色體上的此類基因相隔一段短距離。此外,應當理解的是,大多數性狀或表型是復雜 的(即多基因的),因此在一些例子中,與性狀或表型連鎖的標志物可W存在于決定多基因 性狀的QTL內,或者與決定多基因性狀的QTL連鎖。
[0092] 術語"連鎖不平衡"(LD)指運樣的等位基因或基因座,它們W高于獨立的等位基因 或標志物的預期頻率的頻率聯合,W至于它們作為單倍型出現。例如,當兩個遺傳基因座的 變體在強連鎖不平衡中時,一個基因座處的變體就可W預示個別染色體上的另一個基因座 處的變體。
[0093] 標志物輔助育種:如本文中使用,術語"標志物輔助育種"可W指W-個或多個性 狀(例如多基因性狀)為目標直接育種的方法。標志物輔助育種提供了一種時間和成本高效 的方法來改善植物品種。應用標志物輔助育種的幾種例子設及同工酶標志物的使用。參見 例女日Tanksley and Orton編(1983) Isozymes in Plant Breeding and Genetics , Amsterdam:Elsevier。
[0094] 在當前的實踐中,植物育種人員嘗試鑒定與農藝學期望的性狀連鎖的容易檢出的 性狀,諸如花色、種皮外觀、或同工酶變體。植物育種人員然后通過追蹤該容易檢出的性狀 的分離來追蹤分離的育種群體中的農藝學性狀。然而,感興趣的性狀與植物育種中可用的 易檢出性狀之間很少有運樣的連鎖關系。在本發明的一些實施方案中,標志物輔助育種包 括鑒定與期望的性狀連鎖、并且可為單位表示的一種或多種遺傳標志物(例如SNP標 志物),并且在分離育種群體中基于該一種或多種遺傳標志物的分離追蹤該期望的性狀,W 便,例如,在雜交中產生特定的CHV/0HV。在一些例子中,一種或多種遺傳標志物的分離可W 利用針對一種或多種遺傳標志物的探針來確定:對來自后代植物的遺傳樣品測定一種或多 種遺傳標志物的存在。
[00M]單核巧酸多態性(SNP):如本文中使用的,術語"單核巧酸多態性"指當基因組(或 其它共享序列)中的單個核巧酸在物種的成員或個體中的成對染色體間不同時發生的DNA 序列變異。在群體內,可W對SNP分配次要等位基因頻率,即特定群體中觀察到的基因座處 的最低等位基因頻率。運就是單核巧酸多態性的兩個等位基因頻率中的較小者。
[0096] 單核巧酸多態性可W落入基因的編碼序列、基因的非編碼區內,或者在基因之間 的基因間區域中。由于遺傳密碼的簡并性,編碼序列內的SNP不一定會改變生成的蛋白質的 氨基酸序列。兩種形式都導致相同多膚序列的SNP稱作"同義"(有時稱作沉默突變)。若生成 不同多膚序列,則它們稱作"非同義"。非同義變化可W是錯義或無義,其中錯義變化導致不 同的氨基酸,并且無義變化導致過早的終止密碼子。不在蛋白質編碼區中的SNP對于基因剪 接、轉錄因子結合、或非編碼RNA的序列可能仍具有后果。SNP通常是雙等位的,并且因此容 易測定。Sachidanandam(2001 )Na1:ure 409:928-33。
[0097] 推斷:如本文中就基因型、單倍型、Q化、標志物、或其它遺傳元件而言使用的,術語 "推斷"指從可用的信息推導等位形式。可w推斷缺少的信息,諸如個體基因組中任何一個 或多個標志物(例如在特定的基因座或基因組區段處)的缺少的等位形式。例如,祖先的缺 少的基因型可W使用按照譜系與該祖先相關的群體中的個體的基因型數據推斷。此外,群 體的個體的缺少的基因型可W使用按照譜系與該個體相關的祖先的基因型數據推斷,例如 通過采用一種或多種統計學手段進行。
[0098] 選擇:如本文中使用,術語"選擇"指一種或多種系統、過程、步驟或步驟的組合,用 于確定群體中貢獻于下一世代(或限定育種終點)的一個或多個個體,包括天然選擇和人工 選擇。在一些實施方案中,為群體中的每個植物與供體植物的可能雜交確定0HV。然后,將雜 交產生最高的0HV的植物與供體植物實際雜交,而可W忽視或棄去群體中的其它植物,從而 選擇出具有產生用于雜交的最高0HV的潛力的植物。
[0099] 選擇"標準"指形成選擇決定的基礎的特征,包括例如但不限于:0HV;-種或多種 基因的存在或不存在;和一種或多種與特定基因有關的遺傳標志物;基因的組合、HV、性狀、 和性狀或HV的組合。選擇指數(selector! index)選擇標準的排序,W估計育種值為根據。選 擇強度(selection intensity)指育種人員對關于選擇特定個體進行育種的決策的堅持程 度,W統計學表示。在統計學上,選擇強度可W表示為:被選用來貢獻于下一世代的各個體 的平均選擇標準和所有潛在親本的平均選擇標準之間的差異,W標準偏差單位表示。
[0100] 性狀或表型:術語"性狀"和"表型"在本文中可互換使用。為本公開的目的,特別感 興趣的期望的性狀包括農藝學重要的性狀,其可W例如在作物植物中表現。期望的性狀可 W與一種或多種等位基因和/或QTL連鎖。在一些例子中,期望的性狀是特定等位基因(例如 GM事件)的存在。在一些例子中,期望的性狀是已經對育種群體中的多個基因組區段確定HV 的性狀。在一些例子中,期望的性狀是復雜的或上位的性狀。
[0101] 理想株型:如本文中使用,術語"理想株型"指具有期望的性狀或期望的性狀組合 的理想化個體。在育種程序中,實施選擇性育種的目標可W是:生成接近理想株型的標準的 后代,比近交植物品種更近似于理想株型的后代,和/或可W用來與其他親本品種育種而生 成理想株型的后代。 帥]IV.鑒定(最優)單倍體值
[0103] 本文中的實施方案利用對于每個分離的個體(例如兩個不相似或近交的個體之間 的育種雜交)而言為特異性的可測定值。此值稱為最優單倍體值(0HV)。單倍體值化V)反映 特定單倍體基因組區段的育種值(例如對至少一個感興趣的性狀而言)。在實施方案中,單 倍體個體中的組合單倍體值(CHV)是單倍體個體中的HV的函數。在具體的實施方案中,CHV 是單倍體個體中的HV的和。0HV反映從特定的個體可獲得的最高HV;例如,從特定雜交產生 的個體中可W找到的最優單倍型。通過從鑒定為包含〇HV(或接近0HV的CHV)的單倍體個體 生成加倍單倍體,可W創建最優(或較接近最優)的雙倍體個體。
[0104] HV是可W為單倍型或單倍型的多個區段(例如,如可WWcM限定)確定的值。在一 個具體的例子中,一個個體視為攜帶兩個單倍型,測量其整個基因組。在一些例子中,由于 染色體的獨立分離,認為一個個體攜帶許多單倍型,每個單倍型對應于基因組中的一個染 色體。然而,進一步降低單倍型的長度可W為選擇決策的優化提供可能。因此,在一些實施 方案中,將個體的基因組劃分成區段,將每個區段視為具有特定HV的單倍型。例如,區段可 W定義為具有導致最多遺傳獲得量的長度(例如整個染色體或染色體的亞組,包括但不限 于100cM;95cM;90cM;85cM;80cM;75cM;70cM;65cM;60cM;55cM;50cM;45cM;40cM;35cM; 30〇1;25〇1;20〇1;15〇1;和10〇1的染色體區段)。在一些實施方案中,單倍型區段^物理長度 (例如,千堿基,和通過限制性消化產生的離散片段)來定義。
[0105] 個體的倍性水平決定了它在任何位置/區段處攜帶的單倍型的數目。在一些實施 方案中,個體是二倍體。在一些實施方案中,個體是多倍體(例如Ξ倍體、四倍體等)。本文中 提供的雙倍體例子的0HV計算推廣此類多倍體個體是直截了當的,并且本領域技術人員無 需過度實驗就能實施。
[0106] 若鑒定出可W作為事實上的二倍體對待的亞基因組SNP,則0HV概念推廣到多倍性 是最簡單的。在具體的實施方案中,其中不存在具有亞基因組特異性SNP的同源四倍體物 種,0HV的修改適用可能要求增加從親本傳至后代的潛在單倍型的數目。例如,在同源六倍 體中,它會是3。此外,在一些例子中,遠交異源和同源多倍體的單倍型的定相可能是可取 的。在具體的例子中,可W自近交基礎群體開始跨世代追蹤單倍型。
[0107] 用于生成期望的加倍單倍體植物的常規方法是使用基因組選擇(GS)來選擇較好 的加倍單倍體。Mewissen等(2001),見上文。取而代之的是,本文中的實施方案是利用0HV 選擇來在基因組上選擇親本品系和/或其后代W創建良種栽培種。0HV和GS在選擇系統中計 算用于選擇的育種值的方法上區別很大。在GS中,基因組估計育種值(G邸V)如下計算:
[010 引 GEBV=F(x,0),
[0109] 其中對于基因座的數目(Nloci),x是含有個體在基因座處的基因型的指示變量的 向量(1 :Nloci)(例如取數值0、1或2),并且β是基因座的標志物等位基因效應的向量(1: Nloci)。在大多數情況中,F(x,i3)對應于線性函數:
[0110] GEBV = x 參β,
[0111] 其中?是點積運算符。
[0112] 在GS的典型的例子中,如下計算GEBV:
[0113]
[0114] 其中XI是個體在基因座i處的基因型(例如取數值0、1或2),并且β是基因座i處的 標志物等位基因效應。Cole and化nRaden(2011),見上文,在447。
[0115] 在本文中的實施方案中,為了選擇目的,采用HV為育種值(代替GEBV)。如下對區段 中的兩種單倍型計算一般化的HV:
[0116] HVi = F 化,扣),
[0117] 其中h是向量,含有下列的指示變量:個體在基因座處的單倍型(l:SegL),其中 SegL是區段內的基因座的數目,W及在單倍型基因座之間(SegL+l:SegL+2SegS假設在每個 區段處的僅巧巾單倍型)和在單倍型區段(Nseg+l:Nseg+2WSeg)間的所有可能的相互作用,其 中化eg是基因組區段的數目;且其中扣是對應于指示變量的單倍型和單倍型相互作用效應 的向量。
[0118] 對于雜種作物,考慮到歷史雜種性能,可W如下對每個潛在的測試種t計算一般化 的HV:
[0119] HVit = F(h,0ht),
[0120] 其中是給定測試種t的單倍型和單倍型相互作用效應的向量。在相互作用效應 不顯著貢獻于預測性能(即,無上位性)的情況下,將相應的效應扣或扣t設置為0。
[0121] 為了確定0HV,可W完成一般化的計算,其在所有可能的單倍型組合中取最大值:
[0122] 〇HV=max(HV),
[0123] 其中HV是含有所有可能的HV域HVit的向量。在例子中,將此0HV乘W2可W與GEBV 進行比較,并且與使用0HV選擇的加倍單倍體的完全育種潛力相對應。如上文討論的,通過 0HV選擇的后代的育種值總是等于或大于使用GEBV選擇的育種值。
[0124] 在本文中的一些實施方案中,為了選擇目的而利用HV,其中對區段中的兩種單倍 型都確定HV,例如根據函數:
[0125]
[0126] 其中j是區段內的基因座,hj是個體在基因座j處的單倍型。可W通過對個體中確 定HV求和來確定個體的CHV:
[0127]
[0128] 其中Nseg是基因組區段的數目,k是基因組區段。在例子中,在每個區段中確定最 佳(最優)HV,并且在所有區段上對它們求和W產生0HV:
[0129]
[0130] 在一些實施方案中,具有最高0HV的個體不是具有最高平均基因組育種值的植物。 因此,0HV的使用會導致選擇的個體與常規的基于GS的方法選擇的個體不同。如本領域技術 人員在考慮上文后應當領會的,個體的0HV總是等于或大于其GEBV。通過0HV的選擇是靈活 的,并且它可W替代到先前任何采用GS的方法中。例如,0HV可W在育種程序中與滲入組合, 在此類育種程序中提供相對于GS的益處,而不招致任何額外的成本。
[0131] V.組合0HV和上位性
[0132] 上位(一個或多個基因座之間的相互作用)可W促成作物,如小麥的性能。Holland (2001) "Epistasis and Plant Breeding,"于Plant Breeding Reviews , John Wileyfe Sons,Inc.,pp.27-92;Wang et al.(2012化eredity 109:313-9。然而,考慮到單核巧酸多 態性的所有可能的成對組合,上位相互作用的評估目前是很不現實的。例如,鑒于目前在小 麥育種中利用的約90,000個SNP,測試每種相互作用將設及評估40億個上位效應;造成統計 功效和計算機資源方面突出的問題。
[0133] 評估相互作用效應的已知方法包括序貫評估個別的相互作用,W及同時評估所有 效應的貝葉斯(Bayesian)基因組選擇法。De los Campos等(2013)Genetics 193:327-45; 化be等(2012)J.Dairy Sci.95:4114-29;Habier等(2011)BMC Bioinform.12:186; 16浦133日11等(2001)6日]1日1:;[。3 157:1819-29。在序貫評估中,每次將相互作用評估一次。預 期此方法與全基因組關聯研究(GWAS)-樣差強人意,并且認為其不適合于預測基因組育種 值。序貫評估可能過高估計等位基因效應,并且可能受到顯著的多重檢驗問題的影響。
[0134] 貝葉斯基因組選擇法是一類對標志物效應的分布應用多個先驗協變量的線性回 歸模型。運允許貝葉斯選擇法比同等收縮所有基因座效應的嶺回歸法更有效地適應某些基 因座具有大效應的遺傳構造(即,通過降低對此類基因座的效應施加的收縮量)。具有上位 的貝葉斯基因組選擇法的具體模型是:
[0135]
[0136] 其中1是基因座的數目,yi是個體i的表型,μ是平均值,丫是指明基因座或相互作 用是否具有效應的指示變量,xiq是基因座q處的個體i的基因型,aq是基因座q的疊加效應, bqiq2是基因座ql和q2的相互作用效應,e是殘差。Yi等(2003)Genetics 165:867-83。
[0137] 表1顯示了可W使用根據本文中的一些實施方案的方法探索的相互作用空間。例 如,可每對基因座評估根據逐基因型相互作用(genotype by genotype interaction) 效應的基因型,其中A是基因座1,并且B是基因座2。此例示中為了簡明起見,假設Aa與aA相 同。
[013引表1:示例性的相互作用空間。與加倍單倍體相關的基因型相互作用加下劃線。
[0139]
[0140] ~在本文中的一些實施方案中,方法在僅使用雙單倍體的育種程序中評估相互作用胃 效應。由于加倍單倍體中不出現雜合基因型,所W不需要評估它們的相互作用效應。因此, 表1中例示的每個基因座對的相互作用數目從9減少到4。
[0141] 本文中的具體方法的優勢提供了一個重要的好處,就是可W降低選擇程序中上位 相互作用的復雜性。例如,在小麥中,目前用于育種選擇的SNP標志物有約90,000個。在評估 所有90,000個標志物的純合子和雜合子的育種程序中,潛在的相互作用有90,000*(89999/ 2)*9 = 364億個。在本文中的利用加倍單倍體的0HV選擇的方法中,該相互作用的數目顯著 降低(降低超過200億),其中對于相同的例子,存在有90,000*(89999/2)*4 = 162億個相互 作用。
[0142] 可W使用本文中的一些實施方案進一步降低需要計算的相互作用的數目。在具體 的實施方案中,僅在單倍型內計算上位效應,隨后添加到0HV值W產生個體的"OHVe"值,其 是單倍型內的上位效應和0HV的函數(例如和)。此外,在某些實施方案中,為了解釋更大基 因組距離的相互作用,可W計算整個0HV區段間的潛在相互作用。例如,可W如下計算在0HV 區段內具有上位的個別單倍型的數值:
[0143]
,'
[0144] 其中m是具有0HV區段的基因座的數目,P是0HV區段內的相互作用的數目(例如W
計算),化q是各基因型相互作用的第q個(qth)基因型(例如,其可W采取形式AABB、 AAbb、aaBB或aa化),并且Eq是qth相互作用處的上位效應。因此,在一些例子中,可W如下計 算OHVe:
[0145]
[0146] 在某些實施方案中,對不同OHV區段間計算的上位效應優先最常見的單倍型來排 序。例如,可W如下計算包含不同0HV區段間的上位效應的OHVe:
[0147]
[014引其中η是0HV區段的數目,r是區段間的相互作用的總數并且取決于0HV區段數目m, 出是各常見的單位型相互作用的第S個(sth)常見單倍型,Ss是sth相互作用的上位效應。舉一 示例,若假設常見單倍型的數目是l0,r可WW(n*10)((n*10-l)/2)計算。在一些例子中,區 段間的上位相互作用的和可能會大于區段內的HVe。
[0149] VI.用于植物OHV選擇的方法
[0150] 本文中的一些實施方案提供了選擇植物的方法,其可W用于,例如,易化新的期望 的植物品系的生成。本文中的實施方案包括可W用于選擇能夠產生加倍單倍體的任何合適 的植物(或其組織)的方法。合適的植物還包括那些適合于不同于異型雜交的自身雜交或 "自交"的植物。能夠產生加倍單倍體和/或自交的合適的植物包括例如但不限于:首猜、蘋 果、香蕉、豆、挪菜、藍麻子、相橘、Ξ葉草、挪子、咖啡、黃瓜、花旗松、按樹、火炬松、亞麻子、 甜瓜、燕麥、橄攬、棟桐、魏豆、花生、辣椒、楊、福射松、高梁、南方松、草替、甜菜、甘薦、向日 葵、楓香樹、茶、煙草、番茄、草皮草(turf)、擬南芥、大麥、玉米、棉花、油菜/蕓苔、稻、黑麥、 大豆和小麥。在具體的實施方案中,可W使用公開的方法確定HV、CHV、和/或0HVW生成大 麥、玉米、棉、油菜/蕓苔、稻、黑麥、大豆和/或小麥的加倍單倍體。適合于生成雙單倍體植物 的組織可W是例如但不限于:種子、胚、或胚胎發生組織(例如胚胎發生愈傷組織、花藥、或 小抱子培養物)。
[0151] 根據具體的實施方案的方法相對于當前實施的植物選擇方法,例如表型選擇和/ 或基因組選擇,可W提供若干優勢,在一些例子中,0HV選擇方法對植物育種人員提供,例如 但不限于,成本和資源節約,W及跨越幾個植物開發世代的遺傳獲得量和/或遺傳多樣性增 加。
[0152] 在一些實施方案中,方法包括為個別單倍體植物/組織(或其加倍單倍體)(如可W 從源自第一親本植物和第二親本植物的雜交的后代植物生成的)確定基因組CHV,比較植物 的CHV與為后代植物確定的0HV,并且若CHV接近0HV,則選擇單倍體植物/組織(或其加倍單 倍體)。在具體的實施方案中,從選擇出的單倍體植物/組織生成加倍單倍體植物。加倍單倍 體植物然后可W作為新的良種品系栽培,或者可W在進一步的植物育種步驟中利用。
[0153] 在例子中,當CHV與0HV相同,CHV與0HV基本上相同,CHV最接近后代群體中確定的 所有CHV的0HV,和/或CHV足夠接近0HV,使得熟練技術人員決定不需要更接近的同一性時, 貝IJCHV接近0HV。若例如CHV是0HV的至少 100%、99%、98%、96%、95%、94%93%、92%、 91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、和/或80%,貝11〇^可^接 近0HV。在一些例子中,分析來自分離植物的多個單倍體W確定它們的最高CHV,并且選擇的 單倍體的CHV比特定百分比(例如99%、98%、96%、95%、94%93%、92%、91 %、90%、89%、 88%、87%、86 %、85%、84%、83%、82%、81%、或80%)的其它被分析的單倍體的CHV更接 近分離植物的OHV。
[0154] 可W對單倍體或加倍單倍體個體或其組織確定HV,例如通過對個體或組織進行基 因型分型(例如使用本文中的系統中提供的試劑盒),并且鑒定與感興趣的性狀的一個或多 個基因組區段的育種值連鎖的標志物。當被求和時,此類HV產生個別單倍體或單倍體組織 的CHV。在具體的實施方案中,還對分離的個體確定基因組0HV(例如通過參照其親本植物基 因型),并且選擇從個體生成的單倍體W生成良種加倍單倍體植物,若其CHV等于或接近0HV 的話。
[0155] -些實施方案提供了用于評估品系雜交生成良種雙單倍體(可能含有期望的等位 基因或GM事件)的潛力的方法,所述良種雙單倍體繼而可W被選擇用于進一步育種。例如, 可W為第一植物候選物與一個或多個第二植物之間的理論雜交生成的后代確定最高的可 能0HV。若對第一植物的理論雜交中生成的后代確定的最高的可能0HV滿足預先確定的標 準,則雜交第一和第二植物W生成Fi后代。在一些例子中,所述標準是運樣的條件,即第一 植物候選物可W生成運樣的后代,其在可W從理論雜交的多個植物候選物生成的后代中具 有最高的可能0HV。例如,可W對轉基因植物和多個候選植物中的每一個之間的理論雜交的 后代確定0HV,并且可W將轉基因植物與該多個植物中與第一植物理論雜交產生具有最高 0HV的后代(在可該多個植物中每一個植物通過雜交可產生的那些后代中)的植物雜交。
[0156] 在具體的實施方案中,提供了方法,所述方法包括確定第一植物和至少第二植物 的后代的0HV,從后代植物生成單倍體群體,選擇至少一個具有接近為后代確定的0HV的CHV 的單倍體,并且從每一個選定的后代植物生成加倍單倍體。在具體的實施方案中,第一植物 包含滲入入良種加倍單倍體植物中的等位基因或轉基因事件。
[0157] 在本文中的一些實施方案中,在使用體內單倍體誘導的育種過程中納入0HV選擇。 此類過程可W包括例如但不限于下述步驟:互交選定的品系,創建新的遺傳變異;在世代Fi 中(或在后續世代,諸如F2、F3、或更后的世代中)的體內單倍體誘導;單倍體幼苗的染色體加 倍;生成加倍單倍體后代;移植和自交加倍單倍體植物(世代Do);評估化品系(例如在單行觀 察樣地中)并且任選和平行地,通過自交多路重復(multiplication);評估測試雜交(例如 在多環境試驗中);和試驗雜種的建立。
[0158] 可W通過公式描述來自選擇的預期獲得:
[0159] AG = i hxpG巧,
[0160] 其中i是選擇強度;hx是選擇標準的遺傳力的平方根;pG是選擇標準和獲得標準之 間的遺傳關聯;巧是獲得標準的標準偏差。在長期育種程序中,評估選擇進展通常使用的獲 得標準是改進品系的一般組合能力(GCA)。測試單元在開始育種循環時是加倍單倍體品系 本身。在循環中往后,測試單元是測交。
[0161] 強選擇(較大的i)預期會導致有效群體大小變小,因而由于隨機偏移而導致遺傳 方差的損失。為了將此損失保持在一定限度內,在每個育種循環后必須重組最少數目的品 系。此數目依賴于候選品系的近交系數(F)。一般理解的是,近交系的F的數值應該是非近交 基因型的2倍。假設在常規育種中重組S2品系(F = 0.75),則因此加倍單倍體品系的數目(F =1)會增加到1:0.75 = 1.33倍W保持等同水平的遺傳變異。因此,當使用加倍單倍體品系 時,選擇強度可W相應降低。
[0162] 與選擇強度形成對比,hx和PG在使用加倍單倍體品系時通常增加,尤其是在第一 次測交階段中。在近交系中,忽略上位性:
[0163] AGCA=l/2F〇2A,
[0164] 其中02A是基礎群體的加性方差。因此,加倍單倍體品系的GCA方差是S2品系的GCA 方差的1:0.75 = 1.33倍。運樣,測交之間更容易區分,由此遺傳力更高。例如,當將Ξ組S2和 S3品系各自與源自相同雜交的加倍單倍體品系比較,并且在相同環境中用相同測試種評估 時,谷粒產率的估計遺傳測交方差達到了 50bu/英畝(S2)、94bu/英畝(S3)、和124bu/英畝 (DH)的平均值。
[0165] 選擇和獲得標準之間的遺傳關聯(PG)也隨測試品系的近交程度而增加。例如,St 品系和它們的純合后代之間在GCA方面的關聯等于VFt,而對于加倍單倍體品系,關聯是1。 因此,加倍單倍體品系的關聯強度是S2品系的1: V 0.75 = 1.15倍。
[0166] 獲得標準的遺傳標準偏差(oy)是群體參數,因此依賴于基礎群體(不依賴于育種 程序)。
[0167] 本文中的實施方案可W包括對植物進行基因型分型,其中單倍體或加倍單倍體植 物的基因型也是個體的單倍型。基因型分型可W包括檢測來自個體的樣品中的一種或多種 標志物(例如SNP),并且分析所獲得的結果W確定受試者的等位形式。在一些例子中,來自 個體的樣品包含核酸(例如RNA和基因組DNA)。例如,可W通過測試來自植物的任何部分(例 如,葉、花器官、和種子)的樣品對植物進行基因型分型。可W在用于組織學分析的固體基質 上,或者在合適的溶液(諸如例如但不限于提取緩沖液或懸浮緩沖液)中制備樣品。
[0168] 納入了 0HV選擇的育種程序可W包括親本的隨機交配。然而,在一些實施方案中, 設計程序,其尋求經由0HV選擇組合在不同基因組區段中具有長處的親本,從而提高攜帶所 有強基因組區段的后代的可能性。例如,可W通過計算機模擬產生理想植物的單倍型組成, 并且可W設計育種程序,使用0HV選擇從可用的文庫選擇一個或多個品系來獲得它。此類育 種程序提供在特定的期望性狀中具有長處的植物的加速育種。
[0169] 在本文中的一些實施方案中,經由0HV選擇可獲得的益處W相對于使用標志物輔 助邸V(MEBV)選擇獲得的結果表示。可W通過由Ξ個步驟組成的過程從全基因組DNA標志物 計算MEBV:使用標志物推導每個QTL處的每個個體的基因型;評估每個QTL基因型對感興趣 的性狀的影響;并且對選擇候選物的QTL效應求和W獲得它們的基因組邸WMEBV)。
[0170] 推導QTL基因型的最簡單的方法是鑒定標志物為QTL,并且評估標志物等位基因對 感興趣的性狀的影響。通過標志物解釋的Q化方差(r2)的比例依賴于Q化和標志物或標志物 的線性組合之間的LD。平均r2隨著標志物和QTL之間的距離增加而下降。使用單一標志物基 因型的替代手段是基于幾種標志物構建單倍型。不與任何個別標志物處于完全LD中的QTL 可能與多標志物單倍型處于完全LD中。單倍型相對于單一標志物的優勢隨著鄰近的標志物 之間的r2增加而降低。
[0171] 可W采用最小二乘方法對性狀評估每個QTL的MEBV。最小二乘估計相當于假設具 有無窮大的方差的QTL效應的先驗分布。使用最小二乘,僅會檢出并使用具有大效應的QTL。 因此,不是所有遺傳方差都會被標志物捕捉到。通過假設QTL效應是從正態分布得出且各染 色體區段間為恒定方差,可W得出化UP估計,其中同時估計所有效應。可W使用任何評估標 志物效應的方法,例如,嶺回歸BLUP、BayesA、BayesDi或BayesR(參見化be等(2012)J.Dairy Sci .95:4114-29;Habie;r等(2011)BMC Bioinformatics 12:186;Meuwissen等(2001),見上 文),因為標志物效應的估計步驟在基因組選擇和OHV選擇中是相同的。
[0172] 重組的程度可W是影響0HV相對于GS的優勢的主要因素。創建良種加倍單倍體需 要在一個個體中組合良好的單倍型。重組的積累,經由雜交或加倍單倍性,可增加不同單倍 型組合的數目,然后可W使用基因組工具選擇其中的最優者。對天然近交者諸如小麥進行 強迫遠交設及到相當大的成本。然而,通過使用0HV增加遺傳獲得量,W及通過經由多重性 狀選擇指標方法同時選擇多個性狀,可W抵消些成本。第二種組分會顯著降低回交和性狀 疊加循環中花費的時間。
[0173] 對天然存在的重組的依賴在傾向于不重組的基因組區域中可能構成限制因素。存 在著一些證據,即小麥中存在低重組的區域,例如接近Sr36滲入(Cavanagh等(2013) Proc. Nat 1. Acad. Sci . USA110(20): 8057-62),或者接近端粒。比較而言,染色體上的遠端末 端展現出較高的重組率。4化1111〇¥等(2003)6611〇1116 1^3.13:753-63。預期運些重組差異對每 種方法的影響是相同的。然而,0HV方法隨著動態的單倍型長度延伸W適應不同的重組率, 可W進一步提高其性能。
[0174] 植物育種的最終目標通常是優越的固定品系,并且運目前在很大程度上用加倍單 倍體實現的。品系只有具有生成優良種質的潛力時才是"固定的"。0HV明確選擇此類品系的 潛在遺傳值。0HV選擇比GS更緊密地符合此終極目標,因此比GS性能更好。0HV精巧地適應于 一個重組循環中可達到的結果(即加倍的單倍性)。當0HV步驟中考慮的單倍型長度實質性 降低,W及考慮太遠的將來的植物潛力時,0HV的性能的優越性可W降低。
[0175] 可W在任何近交或遠交物種中實施0HV選擇。當生成加倍單倍體時,并且當生成環 境中的遺傳學不同于育種群體但來源于育種群體時,它的優點是最明顯的。通過0HV選擇可 能增加遺傳多樣性運一點意味著總體上,育種群體的GEBV會略低于用常規GS。然而,0HV選 擇生成良種加倍單倍體的能力增加。在良種品種被推向種植者市場的系統中,諸如大多數 植物育種程序中,運可能是非常有利的。0HV選擇的用處并不能從其它育種程序(例如乳牛) 推知,亦不能簡單推及到其它育種程序,因為不清楚在那些系統中長期遺傳獲得量的增加 相比于由于遺傳方差增加所致的一致性的短期降低是否值得。
[017W VII.用于植物0HV選擇的系統
[0177] 本文中的一些實施方案包括植物選擇系統,其包含:用于確定一個或多個植物的 基因型的試劑盒;數據庫;用于從所述基因型確定0HV的手段;和允許用戶輸入基因型信息 的用戶界面,其中系統為一個或多個植物確定0HV。在具體的實施方案中,使用試劑盒對半 種子或非常幼小的植物(例如單倍體植物或加倍單倍體植物)進行基因型分型。在一些例子 中,用于從基因型確定0HV的手段是分析編程。在一些例子中,用于從基因型確定0HV的手段 是參照圖表。
[0178] 具體的實施方案提供了高通量植物0HV選擇系統,其包含用于測定一個或多個植 物的基因型的試劑盒,其中試劑盒包含具有與其結合的多核巧酸的固體支持物,其中每個 多核巧酸與多態性遺傳標志物雜交,所述多態性遺傳標志物與基因組區段單倍型連鎖(例 如緊密連鎖和非常緊密連鎖),所述基因組區段單倍型與感興趣的性狀的育種值有關。在一 些例子中,試劑盒包含雜交介質(例如微流體裝置或均相測定介質)。示例性的微流體裝置 包括具有含微通道的固體支持物的微流體裝置。參見例如美國專利N〇.5,304,487;5,110, 745;5,681,484;和5,593,838。在一些例子中,試劑盒包含"忍片",所述忍片具有與其表面 結合的(例如但不限于)約10,000-100,000個寡核巧酸,每個所述寡核巧酸由于特定SNP特 異性雜交的序列組成。
[0179] 本文中的某些實施方案的與固體支持物結合的多核巧酸是直接或間接附著于固 體支持物的寡核巧酸。可W使用運樣的寡核巧酸測定已經獲得核酸樣品的個體中的HV:通 過來自個體的核酸與結合到固體支持物的寡核巧酸的特異性雜交,測定與HV關聯的標志物 的出現。在一些例子中,將多個多核巧酸固定到固體基底的離散區域上,其中來自樣品的核 酸與基底的特定區域的結合確定樣品中的標志物的存在。
[0180] 本文中的某些實施方案的高通量系統可W包括例如但不限于,平臺,諸如UHT SNP-IT平臺(Orchid Biosciences 'Princeton,N.J. ,USA); Μα巧Array K'系統(Sequenom, San Diego ,化lif. ,USA);和集成的SNP基因型分型系統(Illumina, San Diego ,Calif., USA)。
[0181] 具體的實施方案包括運樣的試劑盒,其用于經由基于PCR的測定法(例如 TAQMAN?基于PCR的測定法(ABI,Foster City,Calif.,USA))確定一個或多個植物的單 倍型。在一些例子中,此類實施方案可W包括自動化、完全自動化、或手動(例如臺式)測定 方案和設備。
[01劇 VIII.組合滲入和0HV選擇
[0183] 滲入是將植物品系的期望的特征滲入不包含期望的特征的植物中。在一些例子中 要滲入的特征是單個等位基因,例如,遺傳修飾事件。在本文中的一些實施方案中,利用用 于0HV選擇的方法和/或系統來易化感興趣的等位基因(例如GM事件)滲入到具有大部分有 利的特征的輪回親本植物中。在具體的實施方案中,在育種程序的背景內實施滲入,育種程 序尋求生成包含期望表達水平的感興趣性狀的植物,所述感興趣性狀可W用作確定HV育種 值并且用于0HV選擇的性狀。
[0184] 通常通過雜交將新性狀或基因從供體品系滲入到輪回品系。在此過程中,創建Fi 世代,然后與輪回品系回交W在保留新性狀/等位基因的同時恢復初始背景。參見例如 了日證3167(1983化1日111]\1〇1.81〇1.1^口.1(1):3-8;¥133油6'等(1996)66116^。3 144:1923- 32;Hospital(2001)Genetics 158:1969-79。當供體品系除了作為滲入目標的性狀外其他 的性狀較差時,輪回品系的背景通常是期望的。一般地,此類回交策略的效用取決于鑒定具 有來自輪回親本的盡可能接近滲入的祀基因座標志物的后代。
[0185] 本文中的0HV選擇方法和/或系統利用植物育種的可W加速遺傳獲得的速率和/或 改善最大遺傳獲得量的特定特征。本文中的實施方案鑒定包含來自兩個親本的期望的單倍 型基因組區段的后代,不管平均育種值,例如供體親本的平均育種值是否小于輪回親本,從 而改善回交的效用。傳統的恢復初始背景的滲入只會達到良種品系的初始遺傳水平。0HV滲 入的一大優勢在于可W在發生滲入的同時選擇群體。運可W在植物育種程序中增加遺傳獲 得量,并且會產生具有優于初始良種背景的滲入事件的良種品系。
[0186] 本文中在滲入過程中納入0HV選擇的實施方案可W減少獲得理想株型所需的時 間。在一些實施方案中,將包含感興趣的等位基因的植物與包含大部分有利的特征的第二 植物雜交。可W對第一和第二植物中的每個單倍體基因組區段確定性狀的單倍體值化V)。 使用此確定結果,然后可W確定從雜交的后代生成的最優加倍單倍體作為0HV。
[0187] 在具體的實施方案中,從雜交的后代創建加倍單倍體,直至創建具有感興趣的等 位基因和OHV,或非常接近OHV的CHV,的個體。在一些例子中,選擇包含感興趣的等位基因和 最接近0HV的CHV的加倍單倍體W在育種程序的進一步步驟中利用。例如,可W將選定的加 倍單倍體與輪回親本植物再回交一代或多代,其中可W在每一代實施0HV選擇,從而生成新 的品種,其中感興趣的等位基因已經滲入輪回親本品種中,使得新品種的遺傳獲得量和遺 傳多樣性優化。
[0188] 在某些實施方案中,使用納入0HV選擇的滲入程序同時滲入來自一個或幾個來源 的一個或多個期望的等位基因,所述來源例如但不限于:小麥品系或禾本科植物 (grasses);遺傳修飾(例如用于延遲的植物衰老,和草甘麟耐受性);基因組編輯;和基因座 處的轉基因疊加。
[0189] 在某些實施方案中,納入0HV選擇的滲入程序應用0HV的基因組預測W為選擇決策 提供參考。此類程序中的選擇循環可W包括變異的來源,包括例如但不限于:〇HV的基因組 預測(包括隨機GM事件和基因座處的轉基因的堆疊);和在后續世代中序貫地滲入期望的等 位基因(例如包括雙單倍體生成的重復循環)。
[0190] 在某些實施方案中,納入0HV選擇的滲入程序可鑒定植物育種中的新選擇進入點。 例如,一些例子中的新進入點包括例如但不限于,預測異質效應和上位性,和細胞質(例如 線粒體-線粒體組(chondriome)和葉綠體-質體基因組(plastome))與核單倍型的相互作 用;例如,導致最優細胞質值(0CV)的預測,包括異質品系中的mtDNA和葉綠體群體的效應的 預測。
[0191] 因而,在一些實施方案中,0HV為在滲入過程中的群體選擇W改善接受選擇的性狀 滲入的遺傳背景提供了可能。運一實施方案不同于傳統的滲入,傳統的滲入中與輪回(良 種)親本背景重復雜交意圖重建(良種)親本背景。與之相對的是,在植物育種程序中使用 0HV可W產生具有滲入事件和優于初始良種背景的遺傳背景的改進的良種品系。
[0192] 在實施方案中,可W在將具有多個期望的事件(例如2、3、4、5、6、7、8、9或10種期望 的事件)的品系與良種品系雜交W將多個期望的事件滲入入良種品系的基因型中時,使用 0HV選擇。在一些實施方案中,將多個具有期望的事件的品系與一個或多個良種品系雜交W 將每個期望的事件從該多個品系滲入入良種背景基因型中。
[0193] 提供W下實施例W例示某些具體的特征和/或實施方案。實施例不應解釋為將公 開內容限于例示的具體的特征或實施方案。 實施例
[0194] 實施例1 :GS和0HV育種程序的比較
[0195] 將利用0HV選擇的植物育種程序與利用GS的程序進行直接比較。用來自1110個小 麥品系的4,788個SNP的經驗確定基因型的基礎群體實施比較(經驗性Illumina iSELECT? 珠忍片9Κ陣列基因型(Cavana曲等(2013),見上文)實施比較,運確保了一個實際的連鎖不 平衡結構。
[0196] 將運些SNP置于21條染色體上,每條長150摩(3個基因組,每個7條染色體)。然后, 將基因組分成50cM的相等長度的區段,運樣,每條染色體約有3個區段。
[0197] 在創建配子的過程中(用于產生常規后代,或者在生成加倍單倍體期間),W每摩 為1個的比率在基因組上隨機放置重組。從500個基因座的二重指數分布取樣等位基因取代 效應,運反映一個受到許多成因變體影響的數量性狀。
[0198] 模擬兩種育種方案:GS(其中選擇基于GEBV)和0HV。然后,用完全相同的育種程序 比較GS和0HV選擇。所有參數,如選擇強度,在GS和0HV之間是相同的,唯一的差異在于選擇 是基于GEBV或是0HV。使用真標志物效應代替基于連鎖表型評估標志物效應,而且選擇是基 于真標志物效應。
[0199] 通用育種程序如下,具體的情境在下文描述。在1110個初始近交系中,使用最好的 30%作為Fi代的親本W達到55,000個個體的群體大小。將每個選定的近交系與所有其它選 定的品系雜交。然后,每個雜交對一個后代進行基因型分型(因為所有后代是相同的),并且 選擇最好的個體W生成下一世代(F2)。在遠交的F2至Fio世代中,假設由于種子有限,僅可W 將每個個體與一個其他個體交配。所有交配是隨機的。每次遠交雜交的后代的數目是變化 的,并且通過改變選擇強度將總育種群體保持恒定在55,000個個體。在每個世代中,選擇最 優良的植物用于產生加倍單倍體,并且生成了不同數目的加倍單倍體。任選地,可W用最優 良的加倍單倍體可在晚兩代之后用于育種,W補償創建和加倍單倍體種子收集的時滯。然 后,將運重復幾個世代,并且在每代中重新計算0HV和GEBV,結果捕捉到了新的重組事件。
[0200] 在默認情境中,每次遠交雜交生成100個后代,選擇10個良種個體W創建各100個 加倍單倍體,并且將最好的50個加倍單倍體循環回到育種程序中。各種情境調查下列各項 的數目:每次遠交雜交生成的后代(nOff)、選擇W生成加倍單倍體的良種個體 (nEliteInd)、每個良種個體生成的加倍單倍體(nDH)、在兩代后循環回到育種程序中的良 種加倍單倍體(nDHcycled)、模擬的QTUnGTTL)、每條染色體的單倍型區段(nSeg)、和世代數 目(nGen)。
[0201] 實施例2: 0HV選擇增加遺傳獲得量和遺傳方差
[0202] 在嘗試提高遺傳獲得量時確定了育種循環中的某些點是重要的,運些點顯示于圖 2。相關的考慮因素包括:每對遠交植物的后代數目,和每個良種植物生成的加倍單倍體的 數目。測試了運些因素的幾種變化。使每對的后代的數目在5、20、100、200和1000之間變化。 使生成的加倍單倍體的數目在200、500和1000之間變化。每種變化做100個重復,并且在每 個重復內,標志物效應和基礎群體對于GS和0HV選擇是相同的。表2中列出了所有情境集合 和情境集合之內的水平。每個情境重復100次,標準誤差(SE)在表和圖中給出。遺傳獲得量 方面的結果聚焦于0HV和GS在基礎世代的遺傳標準偏差(SD)中的差異(即獲得量0HV-獲得 量GS)。遺傳多樣性W真遺傳方差報告,W-代中的所有GEBV的方差計算。
[0203] 表2:調查的集合。粗體字體中的水平是默認情境。
[0204]
[0205] 在每代中,創建了總共50,000個后代。運在每個育種對產生不同數目的后代的情 境中對選擇強度可能有影響。當每對的后代數目上升時,則必須相應降低育種對的數目,W 使群體大小在一個世代內保持恒定。
[0206] 在每代中,使用W下統計學比較GS和0HV選擇獲得的結果:遺傳方差;育種群體的 均值遺傳水平;最優的10個個體;和最優的加倍單倍體。
[0207] 發現基于0HV選擇與基于GS的選擇相比,到第10代為止遺傳獲得量增加多達0.58 個遺傳 SD。在我們的模擬育種程序中,在后代和加倍單倍體的創建過程中發生了重組。發現 若我們增加重組的機會,或者通過增加后代的數目或者通過增加加倍單倍體的數目,則我 們可W增加良好單倍型被組合的概率。運兩種方法均增加育種群體的良種種質中的重組數 目,但是0HV選擇能更充分地利用運一點。
[020引隨著后代數目增加,0HV的遺傳獲得量有明顯的、遞增的優勢。圖3a;表3。
[0209] 表3:當改變每次雜交生成的后代數目(nOff)時0HV和GV之間的遺傳獲得量的差 異。
[0210]
'[0211]發現從植物生成的加倍單倍體的數
目是影響遺傳獲得量的另一項因素。隨著從10 個最優的個體生成的加倍單倍體的數目增加,0HV和GS之間的差異也增加。圖3b;表4。此外, 0HV選擇比GS更好地受益于此因素,不管所生成的加倍單倍體的數目如何。隨著生成的加倍 單倍體的數目在相對較小的量下(例如,當每個良種植物生成小于約100個加倍單倍體時) 增加,實現0HV的效率提高。
[0212] 表4:當改變每個良種個體生成的加倍單倍體數目(nDH)時,0HV和GV之間遺傳獲得 量的差異。
[0213]
[0214] '隨著育種程序一代代進展,OHV逐漸勝過GS,產生了額外的遺傳獲得量(即當每個 親本對的后代數目增加時,并且當世代數目增加時,0HV的優勢增長),運進一步強調了對重 組和選擇事件加 W積累和組合,W使遺傳獲得量最大化的必要性。在一個情境中進一步調 查了0HV隨時間推移的潛在優勢:該情境中,選擇歷時20代進行,優勢一直繼續到約16代,在 16代,優勢表現為漸近,并且保持相對恒定。圖3c;表5。即使在較早的世代中,實現的獲得量 較大,并且到第10代,遺傳獲得量從用每對1000個后代的0HV選擇起已經幾乎增至Ξ倍。同 樣,具有較多的后代是有益的,但是當每個育種對從200變到1000個后代時,就總體遺傳獲 得量而言收益已有輕微降低。
[0215] 表5:20個世代內0HV和GS之間的遺傳獲得量的差異。
[0216]
[0217]選用于生成加倍單倍體的良種個體的數目對0HV的優越性的影響小于每次雜交的 后代數目,并且它也依賴于選定的最佳個體相比于次一組最佳排序個體的相對優越性。我 們發現了當良種植物的數目增加時,0HV和GS之間的差異增加。圖3d;表6。各最佳組在遺傳 價值(genetic merit)方面是相似的,并且選擇它們中的更多個將增加加倍單倍體實現接 近良種個體的0HV的遺傳數值的概率(機會)。
[021引表6:當改變用于生成加倍單倍體的良種個體的數目(nEliteInd)時OHV和GS之間 的遺傳獲得量差異。
[0219]
[0220] 就0HV和GS之間的差異而言,將良種加倍單倍體循環回到育種程序中的影響不大。 表7。它基本上不影響總體遺傳獲得量(數據未顯示)。循環對遺傳獲得量的影響降低,因為 要經過一段時滯方可將雙單倍體納入回到育種程序中。由于它們的產生不足W快到能在下 一代雜交中納入它們,它們只能在兩代后納入。同時,雜交群體已經過了又一輪選擇,并且 其良種個體的遺傳價值與兩代前的加倍單倍體相似,導致0HV有額外的改善趨勢,運是引人 思考的。
[0221] 表7:當改變循環回到育種程序中的良種加倍單倍體數目(nDHcyc)時0HV和GS之間 的遺傳獲得量差異。
[0222]
[0223] 群體中的遺傳方差運一參數可W用來度量群體中的多樣性。遺傳方差還指示通過 選擇能夠實現多少遺傳獲得量。所有選擇工作都會降低遺傳方差。然而,一些方法實現短期 遺傳獲得量是W犧牲長期獲得量為代價的,因為它們導致方差嚴重降低,使得未來世代中 的選擇更難W實現。
[0224] 0HV選擇的一個關鍵優勢是其比GS能夠維持群體中更多的遺傳變異或多樣性。運 一點在圖4和表8中得到了強有力的展示。真遺傳方差在未選擇的基礎群體中是最高的。首 先,它急劇下降,因為僅前30%的品系被用于產生完全雜合的Fi世代。然后,雜交Fi釋放了額 外的遺傳變異,因為此時還觀察到了純合基因型。在第3代中,0HV選擇的真遺傳方差是GS的 真遺傳方差的幾乎兩倍。此外,0HV選擇在后續世代中W比GS慢的速度降低遺傳方差,并且 到第10代為止0HV多樣性比GS大幾乎200%。需要注意,將500個加倍單倍體循環回到育種程 序在第4代中大大降低了遺傳方差,因為分離個體被替換為從10個經深度選擇的良種產生 的加倍單倍體,導致遺傳基礎顯著變窄。附帶說明,此情境顯示的0HV和GS間的遺傳獲得量 差異是最小的。表7。
[0225] 表8:GS或0HV育種程序中的每代的真育種值方差。
[0226]
[0227] 此結果的一個原因可W用一個可能比較極端的例子來解釋。假設個體在其基因組 上的每個區段上攜帶一個優勢的單倍型,另一個是劣勢的單倍型。因此,可W將它分類為 "高度可變"個體。0HV選擇會選擇它,因為它的0HV將非常高。然而,GS不大可能選擇此個體, 因為它的GEBV是所有等位基因效應的和。因此,GS會選擇具有低變異性的高價值個體,而 0HV選擇不考慮個體內的變異性。
[0228] 群體遺傳多樣性對于長期遺傳獲得量是特別重要的。不考慮多樣性或近交而施加 強選擇壓力的一個缺點是會損失低頻率變體。Jannink(2010)Genet. Select .Evol. 42:35。 在群體中更長地維持低頻率等位基因或單倍型為通過選擇緩慢增加其頻率,直至它們可解 釋更大比例的遺傳方差提供可能。0HV選擇,盡管其選擇一種單倍型而不是選擇兩個單倍型 的和,可更長地維持低頻率變體。0HV的優勢在越往后的世代中越大是長期遺傳獲得量增加 的表現,預期運是由于其在育種群體中攜帶的遺傳方差更大的直接結果。我們的研究證明, 保留遺傳多樣性的清楚的育種策略可導致更多的長期遺傳獲得量。
[0229] 降低選擇壓力,使之遠離單倍型總和而接近個別的單倍型,還使得更高效的多性 狀選擇程序成為可能。它讓有利的單倍型有可能維持一一即使當它們處于反式時一一從而 為作物改善提供更多機會。例如,在經歷GS選擇時,在相同基因組區段中的一個單倍型中攜 帶有利的疾病抗性等位基因、另一個單倍型中攜帶有利的產率等位基因的個體由于兩個區 段的明確競爭而可能導致僅一個單倍型被選擇。與之相比,0HV選擇可能能夠在育種群體中 更容易地維持兩個單倍型,因此增加將來某個重組事件把兩個有利的等位基因組合到同一 單倍型中的概率。
[0230] 為了研究遺傳構造對0HV對GS的相對獲得量的影響,我們模擬了 100、500或 1000Q化的Ξ個不同遺傳構造。不管影響性狀的QTL的數目如何,0HV的使用都是有優勢的。 圖5a;表9。在1009化的情況下,使用0HV的優勢較小,并且在各世代是一致的。當模擬500或 1000Q化時,觀察到0HV對GS的略微降低,到第5代得到克服,此后0HV的表現又一直比GS更 好。性狀越是多基因性,性能的運種持續增益越大。
[0231] 表9:當改變QTL數目(nQTL)時0HV和GS之間的遺傳獲得量的差異。
[0232]
W233] I通過將每條染色體作為其自身的獨立區段、或者將每條染色體分成2、3、6或12個 區段加 W測試,測試了結果對考慮的單倍型或基因組區段的長度的敏感性。當區段數目為3 W下時,0HV選擇比GS表現更好。基礎情境是每條染色體有3個區段,0HV和GS之間的差異在 第3、4和5代中顯示出降低。圖化;表10。在僅將染色體分成兩個或保持完整時,此降低得到 避免。
[0234] 表10:當改變區段數目(nSeg)時0HV和GS之間的遺傳獲得量的差異。
[0235]
[0236]
[0237] 我們模擬了每摩為1的均值重組率。大量個體每條染色體將沒有任何重組(或者非 常少),并且因此具有極少區段的模型可能是最相似的。增加區段的數目會導致特定個體的 0HV增加,因為可W通過計算機模擬更精細地組合單倍型W創建良種植物。然而,此0HV不能 在加倍單倍性的一個世代中實現。本質上,12個區段的0HV是可能通過6個W上的世代積累 重組實現的植物。運導致偏離選擇目標:從挑選能夠在一個選擇循環中實現最優加倍單倍 體的植物,偏離到可能在幾個世代后生成最優加倍單倍體的植物,降低OHV相對于GS的好 處。
[0238] 實施例3:滲入過程中的0HV選擇
[0239] 使用包含5個事件的良種小麥品系(即,一種具有5個EXZACT?基因組修飾的高度可 轉化的品系)通過計算機模擬實施0HV結合滲入的育種程序,所述良種小麥品系與實施例1 中描述的同一良種小麥基礎群體雜交,W同時滲入所述5個事件基因座。在接下來的5個世 代(大致是滲入后恢復初始背景所用的時間)中,選擇還在每個滲入基因座處攜帶至少一個 滲入等位基因的具有最高0HV的植物,W生成加倍單倍體。當生成100個加倍單倍體時,大多 數選擇的單倍體品系生成了幾個固定所有滲入的加倍單倍體。
[0240] 圖6顯示了傳統滲入(GS)和結合0HV選擇的滲入之間的差異(100個重復的均值)。 雖然使用傳統滲入得到的遺傳值保持相同,但是使用OHVi實現了遺傳獲得量的增加。預期 當增加雜交和每個世代的后代的數目時,OHVi選擇實現的遺傳獲得量將超過由GSi產生的 遺傳獲得量。
[0241] 建立一個函數(OHVi),其將0HV的數值和一個或多個期望的事件滲入入群體中的 速度組合起來。OHVi是0HV和期望的滲入的加權值的和。OHVi可用于提高群體中的特定等位 基因頻率的滲入,同時還使群體中的0HV最大化,從而實現最大遺傳獲得量。一般地,OHVi平 衡獲得滲入事件的值和0HV的值,并且可W表示為:
[0242] 0HVi=0HV+i血phasis(wixi+w巧2+w:3X3),
[0243] 其中iEmphasis是置于滲入上的總體權重,Wn(例如wl、w2、和w3)對應于置于滲入 等位基因 η上的權重,Xn(例如X1、x2、和x3)是滲入等位基因的數目(例如,二倍體中的0、1或 2)。每個Wn=[滲入等位基因的期望頻率]-[滲入等位基因的實際頻率]。
[0244] 因此,變量iEmphasis控制滲入的速度,并且調節其數值可確保最大化0HV與滲入 運兩個互補的目標得到最好地滿足。選擇滲入等位基因的加權(Wn)W對與期望的等位基因 頻率相距最遠的低頻率等位基因提供最多增強。此適應度函數可W在如上文描述的個體水 平上或在選定組的水平上應用。例如,可W應用遺傳算法W選擇最優的一組個體在下一代 中用作親本,從而使遺傳獲得量最大化并且實現期望的滲入。
[0245] 實施例4:經驗玉米基因型中的0HV選擇
[0246] 數據。使用的數據池包括來自兩個雜種優勢組的900個近交玉米系的23,981個單 核巧酸多態性(SNP)的經驗基因型。連鎖圖提供了基因組次序和W厘摩kM)計的距離信息。 染色體有10條,連鎖圖的總長度是1748cM。SNP效應評估可獲自常規的基因組選擇方法研 究。Habier等(2011),見上文;Meuwissen等(2001),見上文。SNP效應可獲自兩個雜種優勢 組。
[0247] 模擬。實施兩個模擬流程:1)使用經驗SNP基因型作為基礎群體,并且從二重指數 分布取樣SNP效應(流程1),2)在分析中使用經驗SNP基因型型經驗SNP效應(流程2)。
[0248] 基礎群體基因組。實施計算機模擬W比較玉米中的基因組選擇和0HV選擇。根據連 鎖圖在10條染色體上放置經驗SNP,并且每條染色體長度為170cM。在配子的創建過程中(在 常規的后代中或在創建加倍單倍體期間)W每摩1個的比率在基因組上隨機放置交換。調查 不同的單倍型或0HV區段長度。
[0249] 模擬的育種程序。模擬兩種育種情境:GS,其中選擇基于基因組育種值(G邸V),和 0HV,其中選擇基于最優單倍體值。所有參數,諸如選擇強度,在GS和0HV之間都相同,唯一的 差異在于選擇是對GEBV還是對0HV。
[0250] 通用育種程序如下(具體的情境隨后描述)。在流程1中,使用初始的900個近交系 的最優的30%作為F1代的親本W實現36,000個個體的群體大小。圖7。在流程2中,來自雜種 優勢組的親本分開進行(506組1,394組2),并且選擇了基礎群體個體的60%。將每個選擇的 近交系與所有其它選擇的品系雜交。然后,每次雜交對一個后代進行基因型分型(因為所有 后代都是相同的),并且選擇最佳的個體W生成下一世代巧2)。在遠交F2至F10世代中,將每 個個體僅與一個其他個體交配,如同在種子有限條件下一樣。所有交配是隨機的。每次遠交 雜交的后代的數目是變化的,并且通過改變選擇強度將總育種群體保持恒定在27,000至 36,000個個體(取決于流)。在每個世代中,對加倍單倍體群體選擇最優良的植物,并且生成 不同數目的加倍單倍體。可W用最優良的加倍單倍體可在晚兩代之后用于育種,W補償創 建和加倍單倍體種子收集的時滯。然后,將運重復幾個世代,并且在每代中重新計算0HV和 G邸V,結果捕捉到了新的重組事件。
[0251] 結果。在默認情境中,每次遠交雜交生成100個后代,選擇10個良種個體W各創建 100個加倍單倍體,并且將最好的50個加倍單倍體循環回到育種程序中。育種程序持續時間 是10代。不同的情境調查下列各項的數目:每次遠交雜交生成的后代(nOff)、每個良種個體 生成的加倍單倍體(nDH)、在兩代后循環回到育種程序中的良種加倍單倍體(nDHcycled), 和每條染色體的單倍型區段的數目(nSeg)。表11中列出了所有情境組和其內的水平。遺傳 獲得量方面的結果聚焦于0HV和GS在基礎世代的遺傳標準偏差(SD)中的差異(即獲得量 0HV-獲得量GS)。由于遺傳方差在基礎中實質性更大,運是一個保守的測量。遺傳多樣性W 真遺傳方差報告,W-代中的所有GEBV的方差計算。
[0252] 表11。具有描述和一批水平的調查的情境組。粗體類型的水平設及默認情境。一次 僅擾動一項參數。
[0 巧 3]
[ο 巧 4]
[Ο巧5]對于流程1,所有基因座(Ν= 2388)的10%選擇為數量性狀基因座(9化),并且w從 二重指數分布取樣的效應隨機選擇。對于基因組選擇和OHV選擇兩者,假設標志物效應是已 知的,并且標志物效應估計在基因組選擇和OHV之間不改變。此研究中實現的總遺傳獲得量 的幅度可能高于實際的基于基因組選擇的育種程序,在后者中標志物效應的不準確性可W 降低遺傳獲得量。將每種情境重復100次,并且計算標準誤差(SE)。
[0256] 對于流程2,使用標志物效應的兩組經驗估計(雜種優勢組1和2),并且僅使用來自 相應組的基因型(第1組506個登錄,第2組394個登錄)。在運兩種情況中,除了η畑cycled外, 運行表1中列出的所有情境。若情境改變重組的位置,則運行100個重復。檢查兩組標志物效 應的分布,并且它大致是正態的(高斯分布)。接受估計為真效應,然而預期它們含有一些誤 差。此外,根據評估期間的樣本量,還會將它們回歸到影響它們的分布的均值(即觀察到非 常少的大效應)。假設不提供效應的SNP標志物具有0效應。
[0257] 流程1。在此流程中,使用經驗玉米基因型,并且從二重指數分布取樣SNP效應。當 與基因組選擇相比時,0HV選擇導致遺傳獲得量增加。此優勢在所有考察的情境中是一致 的。當與基因組選擇相比時,遺傳獲得量的增加多達1.2個遺傳標準偏差(nOfflOOO,圖8)。 兩種方法之間的差異在每個后續世代中增加,并且隨每個遠交雜交生成更多后代而增加。
[0258] 增加每個良種植物生成的加倍單倍體的數目也增加0HV選擇相對于基因組選擇的 額外遺傳獲得量(nDH,圖9)。
[0259] 沒有觀察到由于將不同數目的良種加倍單倍體循環回到育種程序中所致的效應 (nD化ycled,圖10)。運很可能是由于加倍單倍體加回時雜交群體已經經歷了額外的一代選 擇,因此在遺傳優越性方面追趕上了良種加倍單倍體。
[0260] 在早期世代中,每條染色體的1、2或3個區段似乎優于6個區段,盡管仍然在SE內 (nSeg,圖11)。在更晚的世代中,結果提示,將染色體分成2或3個區段產生最優的結果。
[0261] 群體中維持的遺傳多樣性是可W實現的長期遺傳獲得量的重要指標。真遺傳方差 是多樣性的一項指標。圖12清楚地表明,在育種群體中0HV選擇比基因組選擇產生了更大的 遺傳方差。
[0262] 流程2。在此流程中,在模擬中使用經驗基因型和經驗SNP效應。有兩組SNP效應(組 巧口組2)。
[0263] -般地,當使用組1SNP效應時,0HV選擇相對于基因組選擇產生了增加的遺傳獲得 量,而且此差異在后來的世代中有向上的趨勢。GS和0HV之間的差異比流程1中的小。圖13- 16中呈現了與流程1相同的情境的結果。在運些模擬中,經驗SNP效應對遺傳方差的降低似 乎成比例地多于取樣效應。參見圖16。然而,0HV選擇仍比基因組選擇維持了更多的遺傳多 樣性。在模擬中使用組2中的效應再次確認了 0HV相對GS的優勢。參見圖17-20。0HV和GS之間 的差異在運些情境中較小,但是0HV仍顯示出略微優勢。
[0264] 此研究中的結果確認了:與基因組選擇相比,0HV選擇增加遺傳獲得量,并且維持 育種群體中更多的遺傳多樣性。流程1中的玉米分析顯示了 OHV的更大的益處(與本文中的 小麥研究相比),其根據物種、染色體的數目、和SNP的數目而不同。在流程1中,23,880個SNP 是可用的,相比之下小麥是約5,000個SNP。除了物種外,目前分析中的優勢的增加可W是由 于SNP數目增加所致,SNP的數目增加可促進更準確的單倍型祀向。
[0265] 流程2的結果確認了流程1的結果,盡管0HV相對于GS的增加較低,并且信號在流程 1中強得多。運可能是由于:使用了向均值回歸的經驗SNP效應,其反映相對較小的用于評估 效應的參照群體;W及使用的評估方法。如果參照更大,0HV的優勢可能更大(如模擬結果提 示的)。向均值回歸會降低SNP效應之間的差異,由此降低GS和0HV二者的選擇效率。
[0266] 在所有Ξ組分析中,0HV選擇在育種群體中維持了顯著更多的遺傳多樣性。運確認 了憑借0HV選擇有可能實現遺傳獲得量,同時在群體中保持較大的遺傳方差W實現未來的 遺傳獲得量。
[0%7] 實施例5:組合0HV與上位性
[0268] 使用僅計算單倍型內的上位效應,并且隨后將該效應添加到0HV值W生成疊加 OHVe值的方法,可顯著減少育種程序中需要評估的上位效應的數目。表12。降低程度范圍為 測試的初始162億個相互作用的1.5%至0.2%,同時仍然探索W最高的似然性在整個基因 組中探索可能性的相互作用。
[0269] 表12。要測試的相互作用的數目,假設有90,000個SNP標志物和21條染色體,使用 各種方式來確定優先測試哪些相互作用,其中"區段數"指整個小麥基因組0HV區段的總數。
[0270]
[0271] 存在一個最優的OHV區段數目,其可降低區段內要測試的相互作用的數目,同時仍 保持跨區段上位效應的數目可控。然而,即使要測試的總上位效應的最低數目達到了3.05 億個,在統計學上和計算上還是相當大的挑戰,需要很大的經過基因型分型、表型表征的基 因組參照群體。通過開始時首先估計區段間的上位效應(其顯著小于區段內的基因座相互 作用),有效地對上位效應優先排序,構成更有用的相互作用空間。通過測試區段的最常見 單倍型的相互作用來評估較長基因組距離上的相互作用,由此進一步減少要測試的上位相 互作用的數目。
[0272] 因此,上位效應的納入為在植物育種中選擇有利的相互作用和遺傳背景提供了可 能。
[0273] 實施例6:最優植物的加速育種
[0274] 用下述做法取代前述情境中的隨機交配親本:設計一種交配方案,其組合在不同 基因組區段中具有長處(或期望的性狀)的親本,W增加后代攜帶具有所有期望的基因組區 段的區段的概率。通過計算機模擬生成理想植物的單倍型組成,并且設計用于實現它的育 種方案。然后,實施此育種方案,從而開發出具有接近0HV的CHV的植物。此育種方案可加速 具有多個期望長處或性狀的植物的育種。
【主權項】
1. 一種選擇植物或植物組織的方法,所述方法包括: 提供發生分離的植物; 對于該發生分離的植物中的多個基因組區段,在每個單倍體基因組區段中針對感興趣 的性狀確定單倍體值(HV),其中組合單倍體值(CHV)是從植物產生的加倍單倍體的每個單 倍體基因組中HV的組合值,并且最優單倍體值(OHV)是能夠從植物產生的最優CHV; 確定所述發生分離的植物的最優單倍體值(OHV); 從所述發生分離的植物產生至少一個加倍單倍體植物或適合于制作所述加倍單倍體 植物的單倍體組織;并且 若所述加倍單倍體植物或單倍體組織的CHV分別接近所述OHV,則選擇該加倍單倍體植 物或單倍體組織。2. 根據權利要求1所述的方法,其中所述方法包括: 產生并選擇所述加倍單倍體植物,并且其中將選定的加倍單倍體植物在育種程序中加 以推進或者作為新的良種植物品種加以利用。3. 根據權利要求1所述的方法,其中所述方法包括: 產生多個加倍單倍體植物或單倍體組織;并且 從所述多個加倍單倍體植物或單倍體組織中選擇具有接近所述OHV的CHV的加倍單倍 體植物或單倍體組織。4. 根據權利要求1所述的方法,其中,選定的植物或組織的CHV與所述OHV相同;選定的 植物或組織的CHV與所述OHV基本上相同;或者選定的植物或組織的CHV比從所述發生分離 的植物產生的其它加倍單倍體植物或單倍體組織的CHV更接近所述OHV。5. 根據權利要求1-4中任一項所述的方法,其中所述方法包括:選擇所述單倍體組織, 并且從所述單倍體組織產生加倍單倍體植物。6. 根據權利要求5所述的方法,其中利用所述加倍單倍體植物作為新優良植物品種。7. 根據權利要求6所述的方法,其中從被利用作為新優良植物品種的選定植物生產商 業產品。8. -種用于產生后代植物的方法,所述方法包括: 針對感興趣的性狀,為多個植物中的每個植物確定最優單倍體值(OHV); 從所述多個植物選擇第一植物,其中該第一植物的OHV是該多個植物中的植物的最高 OHV; 通過將所述第一植物與一個或多個其它植物雜交、或者將所述第一植物自交,而產生 所述后代植物。9. 根據權利要求8所述的方法,其中所述方法進一步包括: 針對所述感興趣的性狀為所述后代植物確定組合單倍體值(CHV),并且若所述CHV接近 所述第一植物的OHV,則選擇該后代植物;并且 從選定的后代植物產生多個加倍單倍體。10. 根據權利要求9所述的方法,其中所述方法進一步包括: 為選定的后代植物確定OHV;并且 選擇所述多個加倍單倍體中如下所述的一個:其所具有的CHV接近產生該加倍單倍體 的后代植物的OHV。11. 根據權利要求8-10中任一項所述的方法,其中該方法在育種群體內重復進行一次 或多次,從而在提高遺傳獲得量的同時保持所述育種群體中的遺傳多樣性。12. 根據權利要求11所述的方法,其中與通過基因組選擇進行的選擇相比,遺傳獲得量 增加約0.6個遺傳基礎標準偏差。13. 根據權利要求11或12所述的方法,其中與通過基因組選擇進行的選擇相比,遺傳多 樣性在2代后增加到約2倍。14. 根據權利要求8-13中任一項所述的方法,其中所述后代植物的基因組是多倍體基 因組。15. 根據權利要求8-13中任一項所述的方法,其中所述后代植物的基因組是二倍體基 因組。16. 根據權利要求1-15中任一項所述的方法,其中所述OHV的確定包括:確定在第一和 第二親本中的多個基因組區段的每個區段處的最高HV,并且將各個基因組區段的最高HV- 起求和。17. 根據權利要求1-8中任一項所述的方法,其中每個選定的植物或單倍體組織包含與 遺傳標志物連鎖的期望性狀。18. 根據權利要求17所述的方法,其中該期望性狀是伴性性狀、僅在破壞所述植物后方 可檢測到的性狀、疾病抗性性狀、或具有低遺傳力的性狀。19. 根據權利要求8-15中任一項所述的方法,其中每個選定的植物包含與遺傳標志物 連鎖的期望性狀,并且該期望性狀僅存在于 所述第一植物,以及如果有的話,與所述第一植物雜交的其它植物 之一中。20. 根據權利要求17-19中任一項所述的方法,其中所述期望性狀是轉基因事件。21. -種用于產生良種加倍單倍體植物的方法,所述方法包括: 將第一親本植物和第二親本植物雜交以產生?:植物群體; 從至少一個所述^植物產生加倍單倍體的群體;并且 從該群體選擇良種加倍單倍體植物,其中選定的加倍單倍體的組合單倍體值(CHV)接 近從育種雜交產生的分離個體的最高可能的最優單倍體值(OHV)。22. 根據權利要求1 -8和21中任一項所述的方法,其中選定的植物的CHV大于所述加倍 單倍體群體的平均CHV。23. 根據權利要求21所述的方法,其中所述第一親本植物包含感興趣的等位基因,其中 所述第二親本植物不包含該感興趣的等位基因,并且其中選定的植物也包含該感興趣的等 位基因。24. 根據權利要求23所述的方法,其中該感興趣的等位基因是轉基因事件。25. -種用于產生良種雙單倍體植物的方法,所述方法包括: 提供第一雙倍體親本植物和多個候選第二雙倍體親本植物; 預測所述第一親本植物與每個所述候選親本植物雜交所能夠產生的基因型; 為每個預測的基因型確定最優單倍體值(OHV); 選擇這樣的候選第二親本植物:預測它在與所述第一親本植物的雜交中產生具有最高 OHV的基因型; 將所述第一親本植物與該選定的第二親本植物雜交以產生^植物; 從該^植物產生單倍體植物或組織; 為每個所述單倍體植物或組織確定組合單倍體值(CHV); 選擇至少一個這樣的單倍體植物或組織,其具有接近所述Fi植物的OHV的CHV;并且 從每個選定的單倍體植物或組織產生加倍單倍體的群體。26. -種用于將期望性狀引入良種植物品種的方法,所述方法包括: (a) 將良種植物品種的第一親本植物與包含期望性狀的不同品種的第二親本植物雜 交,以產生?:植物; (b) 為所述物確定最優單倍體值(OHV); (c) 從所述?:植物產生多個單倍體; (d) 選擇具有接近所述最優單倍體值(OHV)的組合單倍體值(CHV)、以及所述期望性狀 的單倍體,其中所述CHV是所述植物中的多個基因組區段中每一個的單倍體值之和; (e) 從選定的單倍體產生加倍單倍體的群體;并且 (f) 將步驟(a)到(e)連續實施一次或多次,以產生包含所述期望性狀的選定的或更高 代的回交后代植物。27. -種用于將一種或多種期望性狀引入良種植物品種中的方法,所述方法包括: (a) 將良種植物品種的第一親本植物與包含一種或多種期望性狀的不同品種的第二親 本植物雜交以產生h植物,其中所述第一和第二親本植物基因組包含多個(η)等位基因&上 的幾個期望的性狀,其中這些等位基因的集合是( Χ1,Χ2,···Χη); (b) 給各個等位基因 χη的滲入分配權重Wn,使得各個等位基因的權重的集合是(W1,W2,… Wn); (C)確定所述?:植物的滲入加權的最優單倍體值(OHVi),其中所述OHVi包含對各等位基 因的組合滲入所施加的總體權重(iEmphas is),其如下計算: OHVi = OHV+iEmphasis(wixi,W2X2,."WnXn); (d) 從所述物產生一個或多個單倍體; (e) 選擇至少一個具有接近所述OHVi的組合單倍體值(CHV)、以及所述期望性狀的單倍 體,其中所述CHV是所述植物中多個基因組區段中的每一個的單倍體值之和;并且 (f) 從所述一個或多個選定的單倍體中的每一個單倍體產生一個或多個加倍單倍體。28. 權利要求27的方法,其中所述方法包括:從所述Fi后代植物產生多個單倍體,從每一 個所述單倍體產生加倍單倍體群體,并且選擇至少一個具有接近所述OHVi的CHV的雙單倍 體。29. 權利要求27或28的方法,其中每個wn =[等位基因(χη)的期望滲入頻率]-[等位基因 (Xn)滲入的實際頻率]。30. 權利要求1-29中任一項的方法,其中所述植物是苜蓿、蘋果、香蕉、豆、西蘭花、蓖麻 子、柑橘、三葉草、椰子、咖啡、黃瓜、花旗松、桉樹、火炬松、亞麻子、甜瓜、燕麥、橄欖、棕櫚、 豌豆、花生、辣椒、楊、輻射松、高粱、南方松、草莓、甜菜、甘蔗、向日葵、楓香樹、茶、煙草、番 茄、草皮草、擬南芥、大麥、玉米、棉花、油菜/芥花、稻、黑麥、大豆或小麥植物。31. 權利要求30的方法,其中所述植物是小麥植物。32. 權利要求30的方法,其中所述植物是玉米植物。
【文檔編號】C12Q1/68GK106028798SQ201480076357
【公開日】2016年10月12日
【申請日】2014年12月31日
【發明人】H·D·德特維勒, B·J·海耶斯, K·羅賓斯, M·J·海登, G·斯潘根貝格
【申請人】美國陶氏益農公司