藏语文本标准化方法

拉巴顿珠, 扎西多吉, 珠杰

吉林大学学报(工学版) ›› 2024, Vol. 54 ›› Issue (12) : 3577 -3588.

PDF
吉林大学学报(工学版) ›› 2024, Vol. 54 ›› Issue (12) : 3577 -3588. DOI: 10.13229/j.cnki.jdxbgxb.20230098

藏语文本标准化方法

作者信息 +

Author information +
文章历史 +
PDF

摘要

针对现代藏语文本表征形式复杂多样且不规范,影响语音合成系统的性能问题,提出了具有易于维护及可扩展性特点的藏语文本标准化方法。首先,对藏文标记符号和来自其他语言的非藏文特殊符号在藏语文本中的不同表现形式进行了深度解析,并通过不同特征对特殊符号进行了分类;其次,根据归纳的不同类型,分别建立起了15种特殊符号转化为藏语的书写规则;最后,以13 490个句子作为实验数据,通过藏语字音转换测试识别并检测文本中特殊符号和藏文音节的有效性,采用规则匹配的方法对含有特殊符号的句子进行标准化处理。实验结果表明:标准化之前藏语音素转写的遗漏率高达4.69%,而经过标准化之后音素转写的遗漏率降低到0.01%,其藏语文本标准化准确率达99%。

关键词

计算机应用技术 / 藏语文本分析 / 文本标准化 / 语音合成 / 特殊符号 / 字音转换

Key words

引用本文

引用格式 ▾
拉巴顿珠, 扎西多吉, 珠杰 藏语文本标准化方法[J]. 吉林大学学报(工学版), 2024, 54(12): 3577-3588 DOI:10.13229/j.cnki.jdxbgxb.20230098

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

117

访问

0

被引

详细

导航
相关文章

AI思维导图

/