基于汉字上下文信息增强词典知识融入的中文命名实体识别

赵振宇, 朱静静, 张宇馨, 刘梦珠, 陈黎, 琚生根

四川大学学报(自然科学版) ›› 2024, Vol. 61 ›› Issue (04) : 110 -118.

PDF
四川大学学报(自然科学版) ›› 2024, Vol. 61 ›› Issue (04) : 110 -118. DOI: 10.19907/j.0490-6756.2024.042001

基于汉字上下文信息增强词典知识融入的中文命名实体识别

    赵振宇, 朱静静, 张宇馨, 刘梦珠, 陈黎, 琚生根
作者信息 +

Author information +
文章历史 +
PDF

摘要

由于中文语言缺少显式的分隔符,使得中文命名实体识别任务面临缺少词语边界信息的难题.为了解决这一问题,现有的主流模型通过引入词典来利用词语边界信息.然而,词典中的词语信息只是根据字词之间的匹配关系融入汉字表示中,忽视了句子信息对于词语选择的影响,与句子语义信息无关的词语不可避免地引入到模型中,使模型感知错误的词语边界信息.为了减少无关词语对于实体识别结果的影响,本文提出了一种新的中文命名实体识别方法 ELKI,通过带有句子语义信息的汉字上下文表示来增强词典知识的融入,从而改善模型感知词语边界的精度.具体地,本文设计了一种新型的交叉注意力网络从词典中挖掘与语义信息相关的词语信息.同时,本文构造了一种门控融合网络来动态地将词典知识融入到汉字的上下文表示中.在Resume、MSRA和OntoNotes三个基准数据集上的实验结果表明本文方法优于其它的基线模型.

关键词

中文命名实体识别 / 交叉注意力网络 / 门控融合网络 / 信息抽取

Key words

引用本文

引用格式 ▾
基于汉字上下文信息增强词典知识融入的中文命名实体识别[J]. 四川大学学报(自然科学版), 2024, 61(04): 110-118 DOI:10.19907/j.0490-6756.2024.042001

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

7

访问

0

被引

详细

导航
相关文章

AI思维导图

/