基于小数据集的机器学习预测酰胺键合成转化率

李兴海, 吴志森, 张利静, 陶胜洋

物理化学学报 ›› 2025, Vol. 41 ›› Issue (02) : 87 -95.

PDF
物理化学学报 ›› 2025, Vol. 41 ›› Issue (02) : 87 -95. DOI: CNKI:SUN:WLHX.0.2025-02-005

基于小数据集的机器学习预测酰胺键合成转化率

    李兴海, 吴志森, 张利静, 陶胜洋
作者信息 +

Author information +
文章历史 +
PDF

摘要

机器学习(ML)在分子合成领域显示了重要的应用前景。然而,准确的机器学习预测依赖于大量实验数据,而通过传统实验方法获得成千上万的实验数据仍然是一个巨大的挑战。因此,基于小数据集得到可接受的预测模型是目前该领域亟待解决的重要问题。本研究通过构建1152个反应数据,利用大量有化学意义的特征描述符,通过多维数据分析获得了有效的预测结果,证明了基于小数据集的机器学习算法可以可靠地预测酰胺键合成反应的转化率。研究比较了6种机器学习算法的预测精度,其中随机森林表现出卓越的预测性能(R2> 0.95)。同时,在预测未知芳胺分子的转化率时,研究发现在训练集中加入少量未知分子的相关反应数据,即使数据集较小,也能显著提升对未知分子转化率的预测准确性,揭示了一种利用小数据集得到较好预测结果的方法。本研究为小数据集下的机器学习辅助化学合成研究提供了参考价值。不久的将来,机器学习将有力地推动有机合成化学的智能化发展。

关键词

酰胺键合成 / 机器学习 / 特征描述符 / 随机森林算法 / 小数据集

Key words

引用本文

引用格式 ▾
基于小数据集的机器学习预测酰胺键合成转化率[J]. 物理化学学报, 2025, 41(02): 87-95 DOI:CNKI:SUN:WLHX.0.2025-02-005

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

97

访问

0

被引

详细

导航
相关文章

AI思维导图

/