浙江在线4月23日讯(记者 汪雨晨)从8-10年缩短至2到5年,育种周期有望压缩三分之二!4月23日,浙江省农业科学院正式发布“豆芯”DNA育种大模型,为豆科作物育种从“经验筛选”迈向“精准预测”提供了全新路径。

发布会现场 记者 汪雨晨
与国内外已发布的多数作物模型不同,“豆芯”并非针对单一物种,而是建立在“科”这一分类层级上。“豆芯”DNA育种大模型以27种、120个豆科植物基因组为基座,系统整合了大豆、豇豆、豌豆等5000余份种质资源多组学数据,涵盖8万余个基因和超12.5万份表型数据,构建起一套从DNA序列解读到育种方案设计的一体化智能解析与育种决策系统。在实际测试中,模型对荚长、淀粉含量等性状的预测准确率较传统全基因组选择模型提升超过10%,对大豆含油量和蛋白含量的预测准确度分别达到76%和78%。
据省农科院生物技术研究所所长朱英介绍,以大豆育种为例,传统育种若用200份核心种质资源做杂交组配,大约会产生数万种组合。按每年完成300个组合计算,一个育种家需要几十年才能做完所有组合的测试。而从杂交到获得稳定品种还需经过至少6代自交筛选,过程通常耗时8到10年。
“有了大模型的加持,在理想状态下,一天之内就可以预估完所有备选组合的性状表现。育种家可以从中筛选出100个最优组合,在一年内完成测试。”朱英表示,“这就是为什么我们说,育种周期可以缩短到原来的三分之一。”
“豆芯”之所以能实现这样的效率跃升,关键在于其处理的是“大自然的语言”。当前农业领域大模型大致分为两类:一类处理人类文字,通过阅读文献回答问题;另一类处理DNA序列、遥感数据等自然信息。“豆芯”属于后者,以DNA序列为输入语言,模型能够识别基因结构、关键调控位点和基因互作网络,进而预测株高、产量、品质等性状。

“豆芯” 图源省农科院
在育种实践中,“豆芯”的使用方式被形象地比喻为“调色盘”。育种家可以根据需求设定优先级——要高蛋白的便将蛋白权重调高,要抗病性强的便将抗病权重调高,模型会在海量组合中自动排序,给出最优推荐。“传统育种有时候就像开盲盒,有运气的成分。有些性状当年不发病、不遇高温就筛不出来,可能做到第六代才发现短板。”朱英坦言,“‘豆芯’就是帮育种家提高效率、提升精准度。”
据悉,“豆芯”的底座采用了百图生科自主研发的DNA大模型“xTrimo”。除豆科外,番茄、玉米、高粱、油菜、水稻等作物的智能育种模型也已在同步推进中。“‘豆芯’的发布只是一个起点。我们会在此基础上向多作物拓展,构建‘菜芯’‘稻芯’‘玉米芯’等系列模型,为保障国家粮食安全、发展绿色农业贡献力量。”
省农科院相关负责人表示,当前以人工智能为核心的新一轮科技革命正在深刻重塑科研范式,下一步将围绕重要农业产业,加快构建高质量农业科研数据集,深化“数据—算法—平台—验证—应用”一体化创新体系建设,推动人工智能与农业科技深度融合。
版权和免责申明
凡注有"浙江在线"或电头为"浙江在线"的稿件,均为浙江在线独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"浙江在线",并保留"浙江在线"的电头。