借助自然语言处理模型的档案文献自动标引与分类研究

林龙江

信息记录材料 ›› 2025, Vol. 26 ›› Issue (11) : 37 -39.

PDF
信息记录材料 ›› 2025, Vol. 26 ›› Issue (11) : 37 -39. DOI: 10.16009/j.cnki.cn13-1295/tq.2025.11.002

借助自然语言处理模型的档案文献自动标引与分类研究

    林龙江
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对档案管理智能化水平提升的需求,本研究探索了自然语言处理技术在档案文献处理中的应用。通过引入词向量模型和主题模型等技术,构建了包含数据预处理、特征提取与关键词选择、主题词映射与规范化模块的自动标引模型,以及由文本表示层、特征融合层、分类决策层组成的自动分类模型,并基于多领域档案文献数据开展实验。结果表明:自动标引模型准确率达85%、召回率为80%、F1值为82.5%;自动分类模型准确率达90%、召回率为88%、F1值为89%,性能优于部分经典对比模型。综上所述,自然语言处理技术可有效提升档案文献处理的智能化水平,在档案管理领域具有显著的应用价值。

关键词

自然语言处理模型 / 档案文献 / 自动标引分类

Key words

引用本文

引用格式 ▾
借助自然语言处理模型的档案文献自动标引与分类研究[J]. 信息记录材料, 2025, 26(11): 37-39 DOI:10.16009/j.cnki.cn13-1295/tq.2025.11.002

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

95

访问

0

被引

详细

导航
相关文章

AI思维导图

/