ChemRB:基于双向分子环约束的新型生成模型

王庆勇, 唐良贵, 王振宇, 辜丽川

陕西师范大学学报(自然科学版) ›› 2025, Vol. 53 ›› Issue (01) : 45 -59.

PDF
陕西师范大学学报(自然科学版) ›› 2025, Vol. 53 ›› Issue (01) : 45 -59. DOI: 10.15983/j.cnki.jsnu.2025005

ChemRB:基于双向分子环约束的新型生成模型

    王庆勇, 唐良贵, 王振宇, 辜丽川
作者信息 +

Author information +
文章历史 +
PDF

摘要

在药物发现的早期阶段,深度生成模型正逐渐成为分子设计的关键工具。简化分子线输入系统(simplified moleaclar input line entry system, SMILES)作为标准的化学表示法,被广泛用于模型训练与生成。然而,由于分子环系统线性表示的非唯一性和非方向性,现有的单向编码器在捕捉样本全局语义结构和生成有效分子环时存在局限性。因此,提出一种名为Chemical RWKV BERT(ChemRB)的方法,旨在从海量的未标记数据中深度挖掘双向信息。为实现这一目标,创新性地设计了2个预训练任务:环级特征预测与全局跨度闭合预测。这些预训练任务不仅为模型提供了丰富多元的上下文信息,更进一步提升了其对复杂分子结构特性的深入理解。实验结果显示:ChemRB模型不仅在性能上取得了显著提升,而且在新分子/样本的评估指标上也达到了最优的基准性能。结果充分验证了ChemRB在精准捕获分子固有结构信息方面的有效性,为其在相关领域的应用提供了坚实的实证基础。最后,通过在EGFR抑制剂上的测试和应用,进一步验证了ChemRB模型的实用性和广泛应用前景。

关键词

分子建模 / 分子生成 / 分子环系统 / SMILES / 深度学习

Key words

引用本文

引用格式 ▾
ChemRB:基于双向分子环约束的新型生成模型[J]. 陕西师范大学学报(自然科学版), 2025, 53(01): 45-59 DOI:10.15983/j.cnki.jsnu.2025005

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

3

访问

0

被引

详细

导航
相关文章

AI思维导图

/