PDF
摘要
为挖掘甜橙(Citrus sinensis)基因组中的环状RNA(circular RNA, circRNA),明确circRNA在甜橙与病原菌互作过程中的生物学功能,本研究基于机器学习随机森林模型,利用python环境开发了针对甜橙circRNA鉴定的流程,比较不同建模算法的优劣,鉴定甜橙基因组中的circRNA,构建甜橙circRNA-miRNA及circRNA-miRNA-mRNA互作网络,并对靶向mRNA进行基因功能富集。通过比较随机森林、决策树以及前馈神经网络3种建模算法,结果表明,基于随机森林算法构建的模型性能最好。共鉴定了2 523个甜橙circRNA,它们不均匀地分布在9条染色体上,其中5号染色体分布最多,有416个;存在606个甜橙circRNA-miRNA互作对及21 043个miRNA-mRNA互作对;靶向mRNA基因功能广泛参与代谢、转运及发育等过程,涉及苯丙烷类物质生物合成、亚油酸代谢和植物-病原菌互作等代谢途径;甜橙circRNA影响miR172和miR482等抗病相关小RNA的转录调控。本研究为甜橙circRNA参与抗病生物学过程的研究提供参考。
关键词
甜橙
/
环状RNA
/
随机森林模型
/
靶基因
/
转录调控
Key words
基于随机森林模型的甜橙环状RNA的鉴定及其功能初步分析[J].
基因组学与应用生物学, 2024, 43(02): 250-260 DOI:10.13417/j.gab.043.000250