2021-11-16 16:53:56
我國糧食總產(chǎn)量位居全球首位,玉米產(chǎn)量位居世界第二,但是育種技術(shù)體系的信息化與智能化程度與歐美發(fā)達國家相比,還有相當大的差距。
科研人員意識到,我國急需建設(shè)為玉米種業(yè)服務(wù)的玉米智能設(shè)計育種技術(shù)體系,為我國玉米育種行業(yè)解決“卡脖子”問題。
近日,中國農(nóng)業(yè)大學(xué)農(nóng)學(xué)院、國家玉米改良中心教授王向峰與西北農(nóng)林科技大學(xué)生命科學(xué)學(xué)院、旱區(qū)作物逆境生物學(xué)國家重點實驗室教授馬闖課題組在《生物信息學(xué)簡報》上發(fā)表了一篇方法學(xué)研究論文,論文介紹了科研團隊聯(lián)合開發(fā)的一款基因組優(yōu)化設(shè)計模型GOVS,可以加速玉米雜交育種,縮短育種周期,促進玉米種業(yè)智能化、高質(zhì)量發(fā)展。
急需技術(shù)攻關(guān),解決關(guān)鍵問題
21世紀以來,隨著互聯(lián)網(wǎng)、人工智能、機器學(xué)習(xí)等現(xiàn)代信息技術(shù)的迅速發(fā)展,全球已邁入大數(shù)據(jù)時代。信息科學(xué)與生命科學(xué)的跨學(xué)科交叉融合為育種科技的跨越式發(fā)展提供了新的契機。
2018年美國康奈爾大學(xué)玉米遺傳育種學(xué)家、美國科學(xué)院院士Buckler教授提出“育種4.0”概念。中國科學(xué)院院士、我國水稻遺傳育種學(xué)家張啟發(fā)也提出作物育種已進入5G育種時代。
“美國基本已經(jīng)進入育種4.0時代,也就是智能育種時代,但我國還沒有實現(xiàn)這一步。”論文通訊作者王向峰在接受《中國科學(xué)報》采訪時表示,無論是“育種4.0”還是“5G育種”,其本質(zhì)都是育種行業(yè)的工程化、智能化升級,即逐步形成“智能設(shè)計育種”技術(shù)體系。
在他看來,智能設(shè)計育種是在分子設(shè)計育種的基礎(chǔ)上融合生物信息學(xué)、群體遺傳學(xué)、大數(shù)據(jù)、人工智能等多個交叉學(xué)科的育種智能化解決方案,是全基因組選擇育種的升級和優(yōu)化,是我國“十四五”期間種業(yè)創(chuàng)新工程中重點攻關(guān)的技術(shù)領(lǐng)域。
玉米智能設(shè)計育種技術(shù)體系可以幫助解決三方面關(guān)鍵問題。王向峰指出,首先,可以解決玉米育種行業(yè)研發(fā)周期長、效率低、成本高、決策難等問題;其次,助推現(xiàn)代種業(yè)與人工智能的融合發(fā)展,形成“智能+種業(yè)”的新經(jīng)濟產(chǎn)業(yè)體系;最后,打破育種技術(shù)壁壘,縮短與國際種業(yè)巨頭之間的技術(shù)差距,振興民族種業(yè)。
兩款工具相輔相成
為什么美國育種水平比我國高?“因為他們通過幾十年發(fā)展積累了大量育種數(shù)據(jù),在整個育種過程中,每一個步驟都是通過大數(shù)據(jù)驅(qū)動,已經(jīng)可以進行作物表型的模擬,根據(jù)模型預(yù)測來輔助育種家篩選材料進行雜交組配。”王向峰答道。
要想在種業(yè)科技創(chuàng)新上“彎道超車”,開發(fā)玉米智能設(shè)計育種技術(shù)體系成了當務(wù)之急。
“不過,大數(shù)據(jù)的高效采集、深度分析和充分利用,十分困難。”論文共同通訊作者馬闖在接受《中國科學(xué)報》采訪時表示,相比歐美發(fā)達國家,我國的育種相關(guān)生物學(xué)大數(shù)據(jù)還比較缺乏。以基因組數(shù)據(jù)、表型數(shù)據(jù)為例,之前采集這些數(shù)據(jù)的成本較高,近年來隨著科技發(fā)展,相關(guān)成本有所下降,數(shù)據(jù)呈快速增長趨勢,數(shù)據(jù)的高效采集問題正在解決,深度分析和充分利用問題還需要高度關(guān)注。
玉米要做雜交種,實際是兩個純和自交系雜交以后形成。以前需要四五年才能生產(chǎn)出來一個純和自交系。“現(xiàn)在的利好是單倍體誘導(dǎo)育種技術(shù),基本上一年就可以生產(chǎn)出一個純和自交系。”王向峰表示,雙單倍體技術(shù)在玉米育種行業(yè)中的逐步成熟與普及,使得玉米純和自交系的生產(chǎn)周期大幅縮短、成本大幅降低、自交系數(shù)量大幅度增加。
我國一個中、大型種業(yè)公司每年可生產(chǎn)2萬到5萬份的玉米自交系。自交系量已經(jīng)達到如此規(guī)模,如果再將這些自交系與3到5個測驗種進行雜交,理論雜交組合的數(shù)量為幾十萬。依賴于田間表型測試對數(shù)十萬的組合進行人工選擇的成本太高,是幾乎無法完成的任務(wù)。
因此,科研團隊認為,必須采用智能育種的方式,依據(jù)預(yù)測模型指導(dǎo)基于基因型的選系。
“假如有10萬個自交系,再與一個測驗種進行雜交,就有10萬個雜交種,把它們都種在田里根本不可能。而用模型先在計算機上模擬,篩選出產(chǎn)量最高、最優(yōu)的10%的雜交種,在田間就可以只種這10%的部分,相當于種1萬株,成本僅是原來的十分之一。”王向峰舉例。
鑒于此,科研團隊開發(fā)了基因組優(yōu)化設(shè)計模型GOVS。傳統(tǒng)育種模擬軟件主要利用遺傳材料的系譜關(guān)系和表型數(shù)據(jù)模擬育種過程,同時指導(dǎo)未來育種流程中的選系和組配。“GOVS則采用了稱為‘基因組優(yōu)化設(shè)計’的策略,即通過算法模擬出一個理論上盡可能多地聚合了某個育種群體中目標表型的優(yōu)勢基因組片段或有利等位基因的虛擬基因組。”論文第一作者、西北農(nóng)林科技大學(xué)博士生程前告訴《中國科學(xué)報》。他還是GOVS軟件的主要開發(fā)人之一。
程前表示,目前,這樣一個理想基因組在現(xiàn)實中還不太可能得到,但是可以作為評估層面或者育種路徑的一個指導(dǎo)。
在此之前,王向峰還與華中農(nóng)業(yè)大學(xué)教授嚴建兵課題組在《基因組生物學(xué)》上發(fā)表了一款基于機器學(xué)習(xí)建立的全基因組選擇模型——CropGBM工具箱,同時整合了多種常用遺傳分析工具,比如基因型與表型數(shù)據(jù)預(yù)處理、育種材料遺傳結(jié)構(gòu)解析、全基因組選擇模型、標記篩選與模塊設(shè)計、數(shù)據(jù)可視化等功能模塊,為作物基因組設(shè)計育種提供一站式解決方案。
“智能指的就是機器學(xué)習(xí)里面建立的模型,這個模型相當于人的大腦,是有驅(qū)動力的。GOVS與CropGBM相輔相成,分別用于不同的育種環(huán)節(jié),實際上都是利用人工智能的策略加速育種。”王向峰說。
“強心劑”和“加速劑”
糧食安全事關(guān)國計民生與長治久安,種業(yè)是現(xiàn)代農(nóng)業(yè)核心與命脈,科技創(chuàng)新是戰(zhàn)略支持。要想培育具有自主知識產(chǎn)權(quán)的新品種,需要育種家不懈的努力。
“不過,育種現(xiàn)狀卻不容樂觀。國內(nèi)育種家普遍年齡偏大,大多已過50歲,而且他們多是憑經(jīng)驗、靠眼睛去決策選材料,每個人的經(jīng)驗又有差異。加上在田間搞測試的年輕人很少,以后的育種越來越不能靠人去完成,只能通過計算機做育種。”王向峰表示。
而機器學(xué)習(xí)最大的兩個亮點,一個是效率,一個是自動化。用模型去代替育種家的經(jīng)驗,做更加標準化、規(guī)范化的決策,既減少育種家的工作量,又降低了許多成本。
“育種要‘藏糧于技’,我們這個成果是智能育種方法學(xué)和技術(shù)的大膽突破,也是給國內(nèi)做相關(guān)育種工作科研人員注入‘強心劑’。”馬闖說。
此外,他指出,相較于國外育種4.0理念,我國如何去追趕、超越,邁入“育種4.0”或是“5G育種”時代,需要更加先進的技術(shù),從這個意義上說,這項成果也是“加速劑”。
“要明確的是,我們這套技術(shù)并不是基因組選擇的替代,我認為基因組選擇在未來育種體系中仍是核心技術(shù),最大優(yōu)勢是可以大幅度減少田間工作量和成本,不可取代。而我們這套技術(shù)如果和基因組選擇、雙單倍體技術(shù)相結(jié)合,會達到更好的效果。”程前強調(diào)。
當前,科研團隊正圍繞玉米智能設(shè)計育種技術(shù)體系的建設(shè)開展多方面的工作,力爭打造大數(shù)據(jù)驅(qū)動的玉米智能育種服務(wù)平臺,為全國范圍內(nèi)的種業(yè)企業(yè)、育種團隊提供智能決策服務(wù)。
有了這樣一個服務(wù)平臺,未來育種流程中的組材、選系、組配、測試、推廣等諸多環(huán)節(jié)都將由一系列模型進行育種決策,輔助甚至代替人工決策,最終實現(xiàn)數(shù)據(jù)驅(qū)動式的智能設(shè)計育種。