文档名:基于神经网络的HEVC帧内预测组合快速算法
摘要:为了提升高效视频编码(HighEfficiencyVideoCoding,HEVC)帧内编码的实时性能,本文提出的方法利用了引入偶数边长与步长的卷积核以及自注意力机制的轻量级卷积网络来预测编码树单元(CodingTreeUnit,CTU)的帧内划分结构,从而减少了编码器对CTU进行四叉树递归遍历划分的编码时间.原始编码策略中粗模式决策通过基于残差经哈德曼变换的预测残差绝对值总和(SumofAbsoluteTransformedDifference,SATD)的损失值来估计率失真优化过程中的率失真损失值来进行加速,但仍会耗费一定的编码时间.提出一种方法通过采样搜索的方式减少粗模式决策过程中计算的模式数,从35种模式降低到了18种模式,降低了粗模式决策过程中计算估计损失值的时间.由粗模式决策过程得到的较优的多个候选帧内模式来进行率失真优化,为了缩减粗模式决策需要计算的候选模式数,在候选模式列表中根据前后帧内预测角度模式的估计损失值的差距来筛选掉部分可能性较低的候选模式实现早停止决策,从而减少需要进行率失真优化的候选模式数量,进而减少率失真优化过程的计算时间.本文提出的算法在测试序列上平均实现78.15%的编码时间缩减,BD-PSNR为-0.168dB,BD-RATE为3.49%.
Abstract:Toimprovethereal-timeperformanceofHighEfficiencyVideoCoding(HEVC)intra-frameencoding,amethod,whichutilizesalightweightconvolutionalnetworkwitheven-lengthandstep-sizeconvolutionalkernelsandaself-attentionmechanism,isproposedtopredicttheintra-framepartitioningstructureofCodingTreeUnits(CTU),therebyreducingtheencodingtimerequiredfortheencodertoperformquadtreerecursivetraversalpartitioningonCTUs.Intheoriginalencodingstrategy,RoughModeDecisionacceleratestheprocessbyestimatingtherate-distortionlossvalueinRateDistortionOptimizationbasedontheSumofAbsoluteTransformedDifference(SATD)-basedlossvalue,butitstillconsumesacertainamountofencodingtime.AproposedmethodreducesthenumberofpatternscalculatedintheRoughModeDecisionprocessthroughasamplingsearchapproach,reducingthenumberofpatternsfrom35to18,anddecreasingthetimerequiredtoestimatethelossvalueduringtheRoughModeDecisionprocess.Themorefavorablemultiplecandidateintra-framemodesobtainedfromtheRoughModeDecisionprocessareusedforRateDistortionOptimization.InordertoreducethenumberofcandidatemodesthatneedtobecalculatedinRateDistortionOptimization,anearlystoppingdecisionisimplementedbyfilteringoutsomelesslikelycandidatemodesbasedonthedifferencesintheestimatedlossvaluesoftheintra-framepredictionanglemodesinthecandidatemodelist,thusreducingthenumberofcandidatemodesthatneedtobeevaluatedinRateDistortionOptimizationandconsequentlydecreasingthecomputationtimeoftheRateDistortionOptimizationprocess.Theproposedalgorithmachievesanaverageencodingtimereductionof78.15%onthetestsequences,withaBD-PSNRof-0.168dBandaBD-RATEof3.49%.
作者:范俊宇 宋立锋 Author:FanJun-yu SongLi-feng
作者单位:广东工业大学信息工程学院,广东广州510006广东工业大学信息工程学院,广东广州510006;惠州市广工大物联网协同创新研究院有限公司,广东惠州516025
刊名:广东工业大学学报
Journal:JournalofGuangdongUniversityofTechnology
年,卷(期):2024, 41(3)
分类号:TN919.81
关键词:视频编码 神经网络 帧内预测 快速算法
Keywords:videocoding neuralnetwork intra-frameprediction fastalgorithm
机标分类号:TN919.81TP391TP183
在线出版日期:2024年6月19日
基金项目:广东省科技创新战略专项资金(省重点实验室认定)项目基于神经网络的HEVC帧内预测组合快速算法[
期刊论文] 广东工业大学学报--2024, 41(3)范俊宇 宋立锋为了提升高效视频编码(HighEfficiencyVideoCoding,HEVC)帧内编码的实时性能,本文提出的方法利用了引入偶数边长与步长的卷积核以及自注意力机制的轻量级卷积网络来预测编码树单元(CodingTreeUnit,CTU)的帧内划分结...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于神经网络的HEVC帧内预测组合快速算法 A Fast Combination Algorithm for HEVC Intra-Prediction Based on Neural Network
基于神经网络的HEVC帧内预测组合快速算法.pdf
- 文件大小:
- 808.99 KB
- 下载次数:
- 60
-
高速下载
|
|