基于监督学习的HSK阅读文本自动分级模型研究

任梦, 王方伟

河北科技大学学报 ›› 2024, Vol. 45 ›› Issue (02) : 150 -158.

PDF
河北科技大学学报 ›› 2024, Vol. 45 ›› Issue (02) : 150 -158.

基于监督学习的HSK阅读文本自动分级模型研究

    任梦, 王方伟
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对HSK(汉语水平考试)各类阅读材料难度判定与等级对应中缺乏有效参照标准和分析工具的问题,以历年HSK真题阅读文本为研究对象,提取文本可读性特征,采用支持向量机、随机森林、极端梯度增强等9种监督学习算法,建立可将自选文本自动归类于相应HSK等级的模型,采用准确率、AUC等多项指标评价各模型的分级效果,并选择最佳模型制成在线工具。结果表明,监督学习在HSK阅读材料文本分析及分级方面具有较高性能,9种模型中极端梯度增强的分级效果最好,准确率为0.913,AUC为0.994。建立的分级模型和在线工具能够以较高的准确率对HSK自选文本进行分级,帮助用户有针对性地遴选文本,提高学习效率。

关键词

自然语言处理 / 监督学习 / HSK阅读文本 / 可读性特征 / 分级模型

Key words

引用本文

引用格式 ▾
基于监督学习的HSK阅读文本自动分级模型研究[J]. 河北科技大学学报, 2024, 45(02): 150-158 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

51

访问

0

被引

详细

导航
相关文章

AI思维导图

/