基于主题标签和CRF的中文微博命名实体识别

朱颢东, 杨立志, 丁温雪, 冯嘉美

华中师范大学学报(自然科学版) ›› 2018, Vol. 52 ›› Issue (03) : 316 -321.

PDF
华中师范大学学报(自然科学版) ›› 2018, Vol. 52 ›› Issue (03) : 316 -321. DOI: 10.19603/j.cnki.1000-1190.2018.03.005

基于主题标签和CRF的中文微博命名实体识别

    朱颢东, 杨立志, 丁温雪, 冯嘉美
作者信息 +

Author information +
文章历史 +
PDF

摘要

近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields,CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.

关键词

命名实体 / 中文微博 / 主题标签 / 条件随机场

Key words

引用本文

引用格式 ▾
基于主题标签和CRF的中文微博命名实体识别[J]. 华中师范大学学报(自然科学版), 2018, 52(03): 316-321 DOI:10.19603/j.cnki.1000-1190.2018.03.005

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

70

访问

0

被引

详细

导航
相关文章

AI思维导图

/