基于自然语言处理的枯草芽孢杆菌启动子强度预测

陈聪葛, 郭怡雪, 卞亚蕊, 刘夫锋, 路福平, 彭冲

天津科技大学学报 ›› 2026, Vol. 41 ›› Issue (1) : 11 -19.

PDF
天津科技大学学报 ›› 2026, Vol. 41 ›› Issue (1) : 11 -19. DOI: 10.13364/j.issn.1672-6510.20240146

基于自然语言处理的枯草芽孢杆菌启动子强度预测

    陈聪葛, 郭怡雪, 卞亚蕊, 刘夫锋, 路福平, 彭冲
作者信息 +

Author information +
文章历史 +
PDF

摘要

作为在转录水平上调节基因表达的关键元件,启动子的强度直接调控基因的表达水平。现有启动子强度预测模型多集中于大肠杆菌,针对其他物种启动子强度预测的模型则相对较少。本研究主要以枯草芽孢杆菌启动子为研究对象,收集多组枯草芽孢杆菌启动子序列强度数据,采用绿色荧光蛋白表达强度作为统一表征指标,对多组启动子强度进行标准化计算,构建枯草芽孢杆菌启动子强度数据集。分别使用7种自然语言处理方法,包括Fast Text、TextCNN、TextRNN、TextRCNN、TextRNN_Att、DPCNN和Transformer,构建启动子强度预测模型。结果表明,Transformer模型在启动子强度预测任务中取得最好的预测效果,准确率可达79.49%。本研究自主构建了枯草芽孢杆菌启动子强度数据集,并使用自然语言处理的方法训练得到效果较好的启动子强度预测模型,研究结果可以为枯草芽孢杆菌特定强度启动子的筛选提供依据。

关键词

枯草芽孢杆菌 / 启动子 / 启动子强度 / 自然语言处理

Key words

引用本文

引用格式 ▾
基于自然语言处理的枯草芽孢杆菌启动子强度预测[J]. 天津科技大学学报, 2026, 41(1): 11-19 DOI:10.13364/j.issn.1672-6510.20240146

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

4

访问

0

被引

详细

导航
相关文章

AI思维导图

/