发布日期:2024-10-25 18:03 点击次数:109
棉花产量与纤维品性怎么受到DNA甲基化调控?在AI的匡助下,中国棉花育种群众到手破译这一“密码本”,并从中找出有望更动棉花品种的要道基因位点。
近日,由浙江大学棉花精确育种团队、中国农科院生物本事所和湖畔试验室(阿里巴巴达摩院)智谋育种团队构成的纠合科研团队,抽象诳骗遗传学、生物大数据和AI本事,构建了涵盖207个品种的棉花全基因组DNA甲基化图谱,决然2.87亿个单甲基化多态性(SMP)位点,范畴为当今扫数作物之最。纠合团队从中发现43个潜在参与纤维发育的eQTM基因,为棉花育种提供首要的候选基因列表。关联论文发表在国外顶级期刊《细胞商讨》(Cell Research)上。
棉花是大众最大的自然纺织纤维开头,需要通过束缚团聚优异的基因组遗传位点,进行品种更动。在AI、大数据等本事加捏下,农业正在步入“智谋育种”期间,通过综协作物基因型数据、表型数据和环境数据,斟酌作物性状,精确筛选出优异基因。
这次,纠合科研团队聚焦DNA甲基化对作物的影响。DNA甲基化不错在不转换棉花DNA序列的情况下,影响棉花产量、纤维品性等农艺性状,并通过当然进化和东谈主工礼聘传递。团队采集了207个品种的棉花全基因组甲基化测序数据、基因组测序数据、转录组测序数据,再联接农艺性状的表型数据,进行关联分析,初次构建起群体法式的棉花全基因组DNA甲基化图谱,涵盖2.87亿个单甲基化多态性(SMP)位点。其中,仅甲基化测序数据就达到17TB。
湖畔试验室会通AI、并行瞎想等本事拓荒了一套新式算法,加快海量遗传数据的分析处理。湖畔试验室智谋育种团队厚爱东谈顾客斐示意:“比拟起传统纪律,AI加成的分析瞎想速率进步近100倍,有助于开展亿级序列对比、群体变异分析和多组学关联分析,在数百个遗传变异、数万个基因以及数亿个甲基化位点之间设立起复杂的映射接洽。”
纠合科研团队进而初次绘画出与棉花纤维发育关联、孤苦于遗传要素的表不雅调控麇集,揭示了43个潜在参与纤维发育的eQTM基因。其中一个位点已通过基因剪辑试验,证据其调控棉花纤维长度的作用。此外,商讨东谈主员研发了深度学习模子DeepFDML,基于DNA甲基化位点隔邻的序列,斟酌影响基因抒发的甲基化位点,往日有望发现更多具有育种价值的信息。
浙江大学棉花精确育种团队方磊解说示意:“这项商讨效果评释了DNA甲基化数据可当作育种资源,为棉花品种更动提供新的想路。依托生命科学+AI,育种家们将捏续挖掘要道基因、斟酌农艺性状,加快培植‘超等’作物。”
据悉,湖畔试验室(数据科学与应用浙江省试验室)成立于2020年7月助记词转换工具破解助记词,依托阿里巴巴达摩院树立,聚焦数据科学范畴的“数据智能”和“新式瞎想”两大标的。在智谋育种范畴,湖畔试验室牵头研发全经过智谋育种平台,为育种家们提供包含育种数据处理和分析、瞎想加快、AI斟酌的“中央厨房”,大幅裁汰培植新品种的周期。
上一篇:没有了