张一婧课题组利用机器学习方案整合多组学数据搭建普通小麦层级调控网络平台

发布时间:2023-03-29浏览次数:688

通小麦(Triticum aestivum)是全球重要的粮食作物,阐明其基因调控网络可以为机制研究和分子育种靶标选取提供重要信息。然而,鉴于普通小麦庞大而复杂的基因组(16 Gb,异源六倍体),这是一项具有挑战性的任务。

https://doi.org/10.1016/j.molp.2022.12.018

20231月,复旦大学、河南大学与南京农业大学合作在Molecular Plant在线发表题为Wheat-RegNet: An encyclopedia of common wheat hierarchical regulatory network的研究论文。该研究收集整理189个普通小麦转录因子结合谱、90个表观基因组数据集、2,356个转录组和144个农艺性状的全基因组关联研究(GWAS)数据及染色质空间互作数据。在此基础上,利用机器学习方案进一步整合这些特征以推断层级调控网络,并开发在线检索平台Wheat-RegNet

现代小麦具有庞大(16Gb)而复杂的异源六倍体基因组,染色体尺度的全基因组测序五年前才完成并发布。尽管近年来积累了大量小麦的多维组学测序数据,不同的数据类型着眼点不同,而且大数据不可避免存在各种噪声,如何系统整合不同数据,提升对特异靶标与调控网络预测的准确度,是大数据辅助调控机制研究中一个亟待解决的问题。课题组通过开发机器学习方案,结合定量表观基因组分析策略,创新性地利用LASSO回归模型整合多组学数据特征,整合表观组协同变化与染色质高级结构信息鉴定增强子的靶基因,同时预测顺式元件及反式因子对靶基因的调控潜力(图6)。在此基础上,进一步开发Wheat-RegNet在线平台挖掘小麦层级调控网络,提供多种在线工具,从多个层面系统辅助小麦调控机制的解析













Wheat-RegNet的数据收集、整合和功能预测模块



Wheat-RegNet网址:

http://bioinfo.sibs.ac.cn/Wheat-RegNet



复旦大学张一婧研究员、河南大学农学院生命科学学院/作物逆境适应与改良国家重点实验室李浩研究员和南京农业大学作物遗传与种质创新国家重点实验室张文利研究员为论文的共同通讯作者。河南大学与中国科学院分子植物科学卓越创新中心联合培养研究生唐腾飞王昊宇、中国科学院分子植物科学卓越创新中心博士生田世龙吕笑同为论文的共同第一作者。感谢中国农业科学院贾继增研究员提出的宝贵意见。本研究由国家优秀青年科学基金、国家自然科学基金、中国科学院战略重点研究项目、江苏省种业振兴工程的资助。