基于中朝统一IDS编码的朝鲜语古籍文字识别方法

赵梦玲, 金小峰

延边大学学报(自然科学版) ›› 2024, Vol. 50 ›› Issue (02) : 101 -106.

PDF
延边大学学报(自然科学版) ›› 2024, Vol. 50 ›› Issue (02) : 101 -106. DOI: 10.16379/j.cnki.issn.1004-4353.2024.02.012

基于中朝统一IDS编码的朝鲜语古籍文字识别方法

    赵梦玲, 金小峰
作者信息 +

Author information +
文章历史 +
PDF

摘要

为解决朝鲜语古籍中的中文和朝鲜文字混排的识别难题,提出一种中朝文字的表意文字描述序列(IDS)统一编码方案,旨在通过利用偏旁分解字符识别模型(CCR-CLIP)识别朝鲜语古籍文字.首先,根据中朝文字结构的相似性,对文字中出现的汉字偏旁、朝鲜文字字母和12种基本结构进行了统一编码;其次,通过加入朝鲜文字的IDS序列扩充了CCR-CLIP原模型中提供的汉字的IDS序列文件;最后,通过在训练阶段使用印刷体文字训练的方式解决了朝鲜语古籍样本少的问题.

关键词

朝鲜语古籍 / 零样本 / 文字识别 / 文字编码 / 表意文字描述序列

Key words

引用本文

引用格式 ▾
基于中朝统一IDS编码的朝鲜语古籍文字识别方法[J]. 延边大学学报(自然科学版), 2024, 50(02): 101-106 DOI:10.16379/j.cnki.issn.1004-4353.2024.02.012

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

71

访问

0

被引

详细

导航
相关文章

AI思维导图

/