针对数据不平衡问题的分子生成模型

辽宁大学学报(自然科学版) ›› 2022, Vol. 49 ›› Issue (01) : 1 -8+104.

PDF
辽宁大学学报(自然科学版) ›› 2022, Vol. 49 ›› Issue (01) : 1 -8+104. DOI: 10.16197/j.cnki.lnunse.2022.01.010

针对数据不平衡问题的分子生成模型

作者信息 +

Author information +
文章历史 +
PDF

摘要

化合物毒性预测中所使用的有标签数据较少且存在数据类别不平衡问题,因此为了解决这个问题,提高预测准确率,本文提出了一种自编码器-辅助分类器的生成对抗网络(AE-ACGAN)分子生成模型.该模型使用自编码器处理化合物数据得到特征向量,然后将其作为ACGAN模型的输入,生成的输出通过解码器解码得到新的化合物分子,在原始的ACGAN基础上进行改良,引入wasserstein距离解决原始模型的模式坍塌问题,同时对模型中的判别器的结构进行改良,在ACGAN模型的输入中加入真实的无标签数据来增强判别器的鉴别能力,使得无标签的数据也能得到充分的利用.实验结果表明,本文所提出的模型可以生成新颖的化合物分子,而且与原始数据具有相同的特征,可以加入到原始数据集中进行数据扩充,平衡后的数据集能够提升预测模型的准确率.

关键词

分子生成 / 化合物毒性预测 / 自编码器 / 生成对抗网络

Key words

引用本文

引用格式 ▾
针对数据不平衡问题的分子生成模型[J]. 辽宁大学学报(自然科学版), 2022, 49(01): 1-8+104 DOI:10.16197/j.cnki.lnunse.2022.01.010

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

28

访问

0

被引

详细

导航
相关文章

AI思维导图

/