面向中文场景文本编辑的不确定性感知生成网络

高宇童, 张颖, 刘湘赣, 刘怡典, 姜山, 郭子毅, 宋非凡

北京师范大学学报(自然科学版) ›› 2025, Vol. 61 ›› Issue (03) : 285 -292.

PDF
北京师范大学学报(自然科学版) ›› 2025, Vol. 61 ›› Issue (03) : 285 -292.

面向中文场景文本编辑的不确定性感知生成网络

    高宇童, 张颖, 刘湘赣, 刘怡典, 姜山, 郭子毅, 宋非凡
作者信息 +

Author information +
文章历史 +
PDF

摘要

通过研究,提出了一种基于不确定性建模的中文场景文本编辑(Chinese scene text editing,CSTE)方法,并发现了1种有效的技术解决方案.该方法通过不确定性引导的调整机制优化预测噪声,提升噪声估计准确性,从而增强生成文本的清晰度和结构完整性.同时,通过过滤文本和图像特征中的无关信息,提高了跨模态对齐能力,实现了文本与背景纹理的融合.

关键词

中文场景文本编辑 / 不确定性感知机制 / 跨模态对齐 / 冗余消除 / 噪声矫正

Key words

引用本文

引用格式 ▾
面向中文场景文本编辑的不确定性感知生成网络[J]. 北京师范大学学报(自然科学版), 2025, 61(03): 285-292 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

49

访问

0

被引

详细

导航
相关文章

AI思维导图

/