多特征融合的油气勘探领域命名实体识别与应用

袁满, 赵兴雨, 袁靖舒, 马茁然

吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (02) : 401 -411.

PDF
吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (02) : 401 -411. DOI: 10.19292/j.cnki.jdxxp.2025.02.022

多特征融合的油气勘探领域命名实体识别与应用

    袁满, 赵兴雨, 袁靖舒, 马茁然
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对现有命名实体识别方法在识别油气勘探文本中涉及多元素组合的实体以及嵌套实体时存在一定局限性的问题,提出了一种多特征融合的BERT-CNN-BiGRU-Attention-CRF(Bidirectional Encoder Representations from Transformers-Convolutional Neural Network-Bidirectional Gated Recurrent Unit-Attention-Conditional Random Field)命名实体识别方法。模型利用BERT的语义提取能力获取句子具有全局特征的字向量;并利用CNN局部特征捕获能力消除了BERT字向量的局限性得到词语字符级向量;通过自建油气勘探领域词典,使用双向最大长度匹配方法获取了词典特征向量。将这3种向量拼接作为BiGRU-Attention-CRF模型的输入。实验结果表明,在自主构建的小规模油气勘探领域数据集上,模型的F1值为91.10%,相较于其他主流的命名实体识别方法,该模型具有更好的识别性能,并为油气勘探领域知识图谱构建提供了有利帮助。

关键词

命名实体识别 / 油气勘探 / 知识图谱 / BERT预训练模型 / 卷积神经网络 / 词典特征

Key words

引用本文

引用格式 ▾
多特征融合的油气勘探领域命名实体识别与应用[J]. 吉林大学学报(信息科学版), 2025, 43(02): 401-411 DOI:10.19292/j.cnki.jdxxp.2025.02.022

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

64

访问

0

被引

详细

导航
相关文章

AI思维导图

/