RNA拼接是基因表达调控的重要环节,其过程分为两步:首先,内含子的5’端剪接位点被切开,随即5’磷酸基团攻击靠近内含子3’末端分支位点(BP)的2’-OH形成2’-5’磷酯键的套索中间体;然后,内含子3’端的剪接位点被切开,外显子相连产生成熟的mRNA,被切除的内含子被称为套索RNA (lariat RNA)。传统上认为套索RNA被去分支酶DBR1线性化后被降解,但近年来发现动植物中很多套索RNA逃逸线性化以环形RNA的形式存在并参与基因表达调控。我们课题组在研究植物miRNA产生途径的调控机制的过程中发现套索RNA的累积导致植物miRNA产生途径关键复合物Dicer结合miRNA前体的效率降低,最终影响全基因组范围内miRNA的产生,提示套索RNA的及时清除为生物体内miRNA的加工提供了安全保障(Li et al., PLoS Genet 2016)。然而尽管套索RNA的快速清除非常重要,动植物的dbr1无义突变体都是胚胎致死,但RNA拼接过程中分支位点如何选择以及套索RNA被降解还是被滞留的分子特征均不清楚。
为了深入探究套索RNA的代谢调控机制,通过和昆明理工大学生物信息学专家郑云博士合作,郑冰莲团队成员结合拟南芥、水稻、玉米和番茄中上千种套索RNA测序数据和RNA测序数据鉴定了6万余个植物内含子分支位点。总体而言,和酵母和人类中的分支位点类似,植物中的分支位点多为腺嘌呤,随着基因组复杂性的增加,其它碱基的分支位点的比例越来越高。分支点一般距离内含子的3’末端50 bp以内,而且植物内含子普遍存在多个分支位点,不同的分支位点的使用具有明显的组织特异型调控方式,最终导致所在亲本基因表达的变化。通过对野生型拟南芥和dbr1突变体中的2万余个套索RNA的分子特征分析发现,能够逃逸线性化的套索RNA的内含子长度普遍偏长,所在亲本基因表达量也偏高。更有意思的是,套索RNA积累的水平与内含子区域逆转录转座子的插入序列的占比显著负相关,但与旁测外显子甚至所在亲本基因外显子的反向环化概率正相关,提示套索RNA的选择性去留与碱基序列有关,转座子入侵加快RNA拼接副产物套索RNA的及时清除可能有利于基因组扩增过程中物种的适应性。该项研究首次系统地提供了全基因组范围内植物内含子分支位点的序列特征图谱,并部分揭示了套索RNA代谢的分子特征。研究结果为理解内含子分支位点变异在农作物育种中的应用和研究DBR1识别套索RNA的分子机制提供线索,并为其它物种尤其是农作物中鉴定套索RNA并探究其生物学意义等奠定了重要的基础。
相关研究结果于3月20日发表在国际植物学顶级期刊《植物 细胞》(Plant Cell)杂志。复旦大学生科院郑丙莲课题组的在读博士研究生张小跎和张勇同学为本文共同第一作者,郑丙莲研究员和昆明理工大学的郑云博士为共同通讯作者。本研究工作得到了复旦大学遗传工程国家重点实验室开放课题、人才计划项目和国家自然科学基金面上项目和重点项目的资助。
论文全文链接:DOI: https://doi.org/10.1105/tpc.18.00711。