面向目标检测和人眼视觉的视频编码优化

刘宇洋, 毛敏, 张昆, 徐煜, 孙悦

信阳师范大学学报(自然科学版) ›› 2025, Vol. 38 ›› Issue (02) : 159 -166.

PDF
信阳师范大学学报(自然科学版) ›› 2025, Vol. 38 ›› Issue (02) : 159 -166.

面向目标检测和人眼视觉的视频编码优化

作者信息 +

Author information +
文章历史 +
PDF

摘要

为了降低视频编码失真对目标检测性能的影响,提出了一种面向目标检测和人眼视觉的视频编码优化方法。首先,调整I帧的量化参数,提升率-编码失真性能;其次,将目标检测算法引入到视频编码器中提取编码帧中的目标区域信息;接着,采用深度网络模型提取当前编码单元的特征,并采用余弦距离计算特征失真;然后,通过改进的VGG网络模型预测编码单元的量化参数;最后,将特征失真引入到率失真优化问题中,通过计算码率-编码失真-特征失真代价函数选择编码单元的最优编码参数。实验结果表明,与最新视频编码标准参考软件VTM-23.0相比,对于目标检测性能,所提算法平均可取得10.5%的BD-rate节省;对于人眼视觉,所提算法平均可取得2.2%的BD-rate节省。

关键词

视频编码 / 目标检测 / 率失真优化 / 人眼视觉质量 / 量化

Key words

引用本文

引用格式 ▾
刘宇洋, 毛敏, 张昆, 徐煜, 孙悦 面向目标检测和人眼视觉的视频编码优化[J]. 信阳师范大学学报(自然科学版), 2025, 38(02): 159-166 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

2

访问

0

被引

详细

导航
相关文章

AI思维导图

/