返回列表 发布新帖

基于神经网络的HEVC帧内预测组合快速算法

10 0
admin 发表于 2024-12-14 11:59 | 查看全部 阅读模式

文档名:基于神经网络的HEVC帧内预测组合快速算法
摘要:为了提升高效视频编码(HighEfficiencyVideoCoding,HEVC)帧内编码的实时性能,本文提出的方法利用了引入偶数边长与步长的卷积核以及自注意力机制的轻量级卷积网络来预测编码树单元(CodingTreeUnit,CTU)的帧内划分结构,从而减少了编码器对CTU进行四叉树递归遍历划分的编码时间.原始编码策略中粗模式决策通过基于残差经哈德曼变换的预测残差绝对值总和(SumofAbsoluteTransformedDifference,SATD)的损失值来估计率失真优化过程中的率失真损失值来进行加速,但仍会耗费一定的编码时间.提出一种方法通过采样搜索的方式减少粗模式决策过程中计算的模式数,从35种模式降低到了18种模式,降低了粗模式决策过程中计算估计损失值的时间.由粗模式决策过程得到的较优的多个候选帧内模式来进行率失真优化,为了缩减粗模式决策需要计算的候选模式数,在候选模式列表中根据前后帧内预测角度模式的估计损失值的差距来筛选掉部分可能性较低的候选模式实现早停止决策,从而减少需要进行率失真优化的候选模式数量,进而减少率失真优化过程的计算时间.本文提出的算法在测试序列上平均实现78.15%的编码时间缩减,BD-PSNR为-0.168dB,BD-RATE为3.49%.

Abstract:Toimprovethereal-timeperformanceofHighEfficiencyVideoCoding(HEVC)intra-frameencoding,amethod,whichutilizesalightweightconvolutionalnetworkwitheven-lengthandstep-sizeconvolutionalkernelsandaself-attentionmechanism,isproposedtopredicttheintra-framepartitioningstructureofCodingTreeUnits(CTU),therebyreducingtheencodingtimerequiredfortheencodertoperformquadtreerecursivetraversalpartitioningonCTUs.Intheoriginalencodingstrategy,RoughModeDecisionacceleratestheprocessbyestimatingtherate-distortionlossvalueinRateDistortionOptimizationbasedontheSumofAbsoluteTransformedDifference(SATD)-basedlossvalue,butitstillconsumesacertainamountofencodingtime.AproposedmethodreducesthenumberofpatternscalculatedintheRoughModeDecisionprocessthroughasamplingsearchapproach,reducingthenumberofpatternsfrom35to18,anddecreasingthetimerequiredtoestimatethelossvalueduringtheRoughModeDecisionprocess.Themorefavorablemultiplecandidateintra-framemodesobtainedfromtheRoughModeDecisionprocessareusedforRateDistortionOptimization.InordertoreducethenumberofcandidatemodesthatneedtobecalculatedinRateDistortionOptimization,anearlystoppingdecisionisimplementedbyfilteringoutsomelesslikelycandidatemodesbasedonthedifferencesintheestimatedlossvaluesoftheintra-framepredictionanglemodesinthecandidatemodelist,thusreducingthenumberofcandidatemodesthatneedtobeevaluatedinRateDistortionOptimizationandconsequentlydecreasingthecomputationtimeoftheRateDistortionOptimizationprocess.Theproposedalgorithmachievesanaverageencodingtimereductionof78.15%onthetestsequences,withaBD-PSNRof-0.168dBandaBD-RATEof3.49%.

作者:范俊宇   宋立锋 Author:FanJun-yu   SongLi-feng
作者单位:广东工业大学信息工程学院,广东广州510006广东工业大学信息工程学院,广东广州510006;惠州市广工大物联网协同创新研究院有限公司,广东惠州516025
刊名:广东工业大学学报
Journal:JournalofGuangdongUniversityofTechnology
年,卷(期):2024, 41(3)
分类号:TN919.81
关键词:视频编码  神经网络  帧内预测  快速算法  
Keywords:videocoding  neuralnetwork  intra-frameprediction  fastalgorithm  
机标分类号:TN919.81TP391TP183
在线出版日期:2024年6月19日
基金项目:广东省科技创新战略专项资金(省重点实验室认定)项目基于神经网络的HEVC帧内预测组合快速算法[
期刊论文]  广东工业大学学报--2024, 41(3)范俊宇  宋立锋为了提升高效视频编码(HighEfficiencyVideoCoding,HEVC)帧内编码的实时性能,本文提出的方法利用了引入偶数边长与步长的卷积核以及自注意力机制的轻量级卷积网络来预测编码树单元(CodingTreeUnit,CTU)的帧内划分结...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        基于神经网络的HEVC帧内预测组合快速算法  A Fast Combination Algorithm for HEVC Intra-Prediction Based on Neural Network

基于神经网络的HEVC帧内预测组合快速算法.pdf
2024-12-14 11:59 上传
文件大小:
808.99 KB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表