[发明专利]基于深度高斯过程回归的图像编码、解码以及压缩方法在审

专利信息
申请号: 202210203902.X 申请日: 2022-03-03
公开(公告)号: CN114584780A 公开(公告)日: 2022-06-03
发明(设计)人: 戴文睿;曹迈达;李劭辉;李成林;邹君妮;熊红凯 申请(专利权)人: 上海交通大学
主分类号: H04N19/19 分类号: H04N19/19;H04N19/192;H04N19/147;H04N19/146;G06T9/00;G06N3/08;G06N3/04;G06F17/18
代理公司: 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 代理人: 徐红银;张琳
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 过程 回归 图像 编码 解码 以及 压缩 方法
【说明书】:

发明公开一种基于深度高斯过程回归的图像编码方法,包括:采用编码卷积神经网络得到待编码图像的瓶颈层多通道特征,作为第一特征图;将第一特征图中的每个特征量化为整数,得到第二特征图;基于深度高斯过程回归的自回归模型和超先验模型,对第二特征图的每一个通道,加权组合多个高斯分布的混合高斯分布编码特征,生成特征二进制码流;将超先验模型得到的超先验信息编码为超先验二进制码流;合并超先验二进制码流与特征二进制码流,得到压缩图像的二进制码流。采用非参数化的深度高斯过程回归方法进行自回归建模,将深度高斯过程回归输出的后验分布作为混合高斯模型的均值,可以灵活地获得均值估计的不确定性,从而得到更准确的均值估计。

技术领域

本发明涉及图像压缩领域,具体地,涉及一种基于深度高斯过程回归的图像编码、解码以及压缩方法。

背景技术

近年来,深度神经网络在图像压缩领域中得到广泛应用。在近几年兴起的端到端图像压缩方法中,深度神经网络代替了传统图像压缩方法中的变换、量化和熵编码模块。目前主流的端到端图像压缩方法采用的是变分自编码器的架构。在这种架构中,对瓶颈层特征熵模型建模的准确性因极大影响码率的大小而引起广泛关注。

早期的熵模型假设瓶颈层特征的元素之间是相互独立的。经过对现有技术的文献检索发现,J.Ballé等人在2017年的International Conference on LearningRepresentation会议上发表的“End-to-end Optimized Image Compression”一文中提出了一种非参数化的、可完全分解的熵模型。随后,为了利用瓶颈层特征元素之间的依赖关系,基于上下文的熵模型被提出。现有的基于上下文建立熵模型的方法主要分为两种。第一种是基于三维上下文的熵模型,它同时考虑了瓶颈层特征通道内和通道间元素的相关性。第二种是基于二维上下文的熵模型,由于它只考虑瓶颈层特征通道内元素的相关性,相比于基于三维上下文的熵模型,在编解码时通道之间可以并行,极大减少了计算和时间开销,因此引起了人们广泛的兴趣。

在基于二维上下文的熵模型中,主要有两种方法利用上下文进行建模。第一种是自回归方法,由于因果性,它只能利用瓶颈层特征中已经解码的元素。第二种是J.Ballé等人在2018年的International Conference on Learning Representation会议上发表的“Variational Image Compression With a Scale Hyperprior”一文中提出的超先验模型。它利用卷积神经网络获取全局的上下文信息,但是需要存储额外的码流。目前主流的基于二维上下文的熵模型同时用到了这两种互补的方法,比如Minnen等人在2018年的Conference and Workshop on Neural Information Processing Systems会议上发表的“Joint Autoregressive and Hierarchical Priors for Learned Image Compression”一文中提出的熵模型。然而,现有的基于二维上下文的熵模型都用确定的参数估计瓶颈层特征中元素的分布,比如,混合高斯分布中的均值,即熵模型基于混合高斯分布来估计瓶颈层特征的分布,具体地对于每个特征,将混合高斯分布的均值作为对于其该特征的预测值,并对产生的残差根据均值为零、方差为所估计方差的混合高斯分布来估计用于编码的概率值。因此,当均值的估计并不准确时,会产生更大的残差,从而导致对应概率值变小,码率增大。目前混合高斯分布是基于确定个数的高斯分布均值的线性组合来估计均值,而不是估计该均值的分布,因此更容易受到输入图像的影响,从而对瓶颈层特征的估计值会不准确、产生偏离,使得用于编码的估计概率远离高斯分布的峰值,导致压缩图像的码率增大,使率失真性能变差。

发明内容

针对现有技术中的缺陷,本发明的目的是提供一种基于深度高斯过程回归的图像编码、解码以及压缩方法。

根据本发明的一个方面,提供一种基于深度高斯过程回归的图像编码方法,包括:

采用编码卷积神经网络得到待编码图像的瓶颈层多通道特征,作为第一特征图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210203902.X/2.html,转载请声明来源钻瓜专利网。

同类专利
  • 一种视频编码方法、视频编码装置和可读存储介质-202310734328.5
  • 胡祥斌;翟云;杨作兴 - 深圳比特微电子科技有限公司
  • 2023-06-20 - 2023-09-22 - H04N19/19
  • 本发明实施例提供了一种视频编码方法、装置和可读存储介质。所述方法包括:对于当前视频序列中待编码的当前帧,基于当前视频序列中历史帧的复杂度,确定当前帧对应的帧级调整因子;基于基准的拉格朗日参数值以及当前帧对应的帧级调整因子,确定当前帧对应的拉格朗日参数值;对于当前帧中待编码的当前编码单元,基于当前帧中历史编码单元的复杂度,确定当前编码单元对应的单元级调整因子;基于当前帧对应的拉格朗日参数值以及当前编码单元对应的单元级调整因子,确定当前编码单元对应的拉格朗日参数值;基于当前编码单元对应的拉格朗日参数值对当前编码单元进行编码。本发明实施例可以提高视频编码的压缩性能。
  • 一种快速帧级自适应拉格朗日乘子优化方法、系统及设备-202310643124.0
  • 张昊;李昆霖;李祖德;黄兴军;肖婴然;刘增辉;胡雪峰 - 中南大学
  • 2023-06-01 - 2023-09-01 - H04N19/19
  • 本发明公开了一种快速帧级自适应拉格朗日乘子优化方法、系统及设备,本方法通过计算目标编码视频序列的序列内容因子;计算每个P帧的传播权重,并根据每个P帧的传播权重和序列内容因子计算得到每个P帧的第一最优放缩系数;传播权重用于表征每个P帧被参考的程度;根据序列内容因子,计算每个I帧的第二最优放缩系数、每个B帧的第三最优放缩系数和每个b帧的第四最优放缩系数;根据第一最优放缩系数、第二最优放缩系数、第三最优放缩系数和第四最优放缩系数,计算目标编码视频序列中每一帧的最优拉格朗日乘子;最优拉格朗日乘子用于对目标编码视频序列中每一帧进行编码。本发明通过有效计算出最优拉格朗日乘子,能够提高编码质量和效率。
  • 一种编码单元级的拉格朗日乘子调节方法及系统-202310444074.3
  • 郭红伟;刘婷 - 红河学院
  • 2023-04-24 - 2023-07-18 - H04N19/19
  • 本发明公开一种编码单元级的拉格朗日乘子调节方法及系统,涉及视频编码领域,方法包括对待编码帧中的每一编码树单元进行划分,得到编码单元,根据编码单元对应的像素块的拉格朗日权重计算编码单元的编码单元级拉格朗日乘子,通过编码单元的编码单元级拉格朗日乘子计算每一预测模式下的率失真代价,并由率失真代价确定编码树单元的最终编码模式,利用最终编码模式对编码树单元进行编码。本发明通过编码树单元中编码单元的编码单元级拉格朗日乘子以及率失真代价,确定最终编码模式,充分利用了编码单元的率失真依赖差异进行编码优化,提高了视频压缩性能。
  • 一种帧间的拉格朗日乘子优化方法、系统、设备及介质-202210385961.3
  • 张昊;黄兴军;彭春华;王照;孙意翔 - 中南大学
  • 2022-04-13 - 2023-03-14 - H04N19/19
  • 本发明公开了一种帧间的拉格朗日乘子优化方法、系统、设备及介质,包括以下步骤:获取目标编码视频当前时刻的位置向量,位置向量的值对应每帧λ的放缩系数,根据当前时刻的位置向量计算当前时刻的适应值,根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量,根据下一时刻的位置向量计算下一时刻的适应值,依次迭代,直至当下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数,根据最优放缩系数计算得到最优λ。本方法中灰狼优化算法可优化非线性不可导问题,算法中每只狼的位置对应每一次的帧级λ搜索值,实现了在有效计算次数内搜索出帧级最优λ,使得编码器具有更高的压缩效率。
  • 基于深度高斯过程回归的图像编码、解码以及压缩方法-202210203902.X
  • 戴文睿;曹迈达;李劭辉;李成林;邹君妮;熊红凯 - 上海交通大学
  • 2022-03-03 - 2022-06-03 - H04N19/19
  • 本发明公开一种基于深度高斯过程回归的图像编码方法,包括:采用编码卷积神经网络得到待编码图像的瓶颈层多通道特征,作为第一特征图;将第一特征图中的每个特征量化为整数,得到第二特征图;基于深度高斯过程回归的自回归模型和超先验模型,对第二特征图的每一个通道,加权组合多个高斯分布的混合高斯分布编码特征,生成特征二进制码流;将超先验模型得到的超先验信息编码为超先验二进制码流;合并超先验二进制码流与特征二进制码流,得到压缩图像的二进制码流。采用非参数化的深度高斯过程回归方法进行自回归建模,将深度高斯过程回归输出的后验分布作为混合高斯模型的均值,可以灵活地获得均值估计的不确定性,从而得到更准确的均值估计。
  • 一种基于运动检测的率失真优化方法及装置-202210159000.0
  • 刘鹏飞 - 翱捷科技股份有限公司
  • 2022-02-21 - 2022-05-27 - H04N19/19
  • 本申请公开了一种基于运动检测的率失真优化方法,包括如下步骤。步骤S10:采用运动检测技术识别当前待编码图像块的运动、静止特征。步骤S20:根据当前待编码图像块的运动、静止特征以及邻近已编码图像块的运动、静止特征,从多个预设的拉格朗日乘数中为当前待编码图像块选择合适的拉格朗日乘数。步骤S30:将所选择的拉格朗日乘数与当前待编码图像块的运动估计的拉格朗日常数相乘,然后将相乘结果取代运动估计的拉格朗日常数再进行当前待编码图像块的运动估计的率失真优化运算。本申请通过运动检测的方法改进率失真优化过程中使用的拉格朗日常数,从而提升视频编码效率。
  • 一种基于多通带滤波器的多目标微小振动视频放大方法-202010064122.2
  • 杨学志;张龙;沈晶;张礼俊;牟睿;任国军 - 合肥工业大学
  • 2020-01-20 - 2022-04-15 - H04N19/19
  • 本发明公开一种基于多通带滤波器的多目标微小振动视频放大方法,该方法包括以下步骤:步骤S1,用相机拍摄多目标振动视频,将视频进行YIQ颜色空间转换,提取Y通道的视频数据;步骤S2,在Y视频中,人工框选包含第1个振动目标边缘的ROI(region of interest)区域,提取该区域中N个像素位置上的亮度信号,计算这些信号的平均频谱;同理,获得其他M‑1个振动目标的平均频谱;然后,检测M个目标的振动频率及频率峰值,得到频率向量fvector和频率峰值向量步骤S3,根据fvector设计多通带滤波器filter。步骤S4,用filter替换PVM方法中的带通滤波器,实现M个目标微小振动视频放大。本发明提供的多目标微小振动视频放大方法具有实现多目标微小振动可视化显示等优点。
  • 基于视频序列特征和QP-λ修正的时域率失真优化方法-202010776206.9
  • 朱策;秦晗;王永华;刘翼鹏;刘凯 - 电子科技大学
  • 2020-08-05 - 2022-03-08 - H04N19/19
  • 本发明属于视频编解码技术领域,具体涉及一种基于视频序列特征和QP‑λ修正的时域率失真优化方法。本发明对新一代编码器AV1提出了一种基于视频序列特征以及QP‑λ修正的时域率失真优化方法,根据此前在HEVC‑RA编码结构下的时域依赖关系以及AV1的特性和视频序列特征,通过构造时域失真传播链,估计当前编码单元及受影响的未来编码单元的聚合失真,计算时域失真传播模型中编码单元的传播因子,进而通过更加准确的传播因子调整拉格朗日乘子实现时域依赖率失真优化,同时对QP‑λ的关系进行重新修正,调整I帧以获得更好的编码效果。
  • 自适应帧间参考结构的拉格朗日乘子优化方法-201810204914.8
  • 周益民;黄航;程学理;王宏宇;冷龙韬 - 电子科技大学
  • 2018-03-13 - 2021-10-26 - H04N19/19
  • 本发明涉及视频编码的方法,提供了一种自适应帧间参考结构的拉格朗日乘子优化方法,包括:A.获取一个图像组;B.获取该图像组内的1帧图像;C.对步骤B所获得图像的未优化的拉格朗日乘子λbase进行优化计算,优化后的值为λ(i),λ(i)=λbase·Γ(i)·κ1‑p(i),其中,λbase为当前帧对应的未优化的拉格朗日乘子,Γ(i)为当前帧对应的层次因子,κ为表示拉格朗日乘子的最远偏移因子的极大偏移范围乘子,p(i)为取值空间为[0,1]的依赖因子;D.根据优化后λ(i)配置当前帧图像的量化参数QP并编码当前帧的图像。本发明有效的为每一帧图像建立数学统计模型,无需人工的干预,能够实现优化过程的自适应调节,能合理、高效的对拉格朗日乘子进行优化。
  • 适用于HEVC标准的编码器中SAO模式判决的拉格朗日乘子取值方法-201310377943.1
  • 范益波;沈蔚炜;刘聪;曾晓洋 - 复旦大学
  • 2013-08-27 - 2018-04-27 - H04N19/19
  • 本发明属于高清数字视频压缩编解码技术领域,具体为一种适用于HEVC标准的编码器中SAO模式判决的拉格朗日乘子取值方法。本发明在进行图像的亮度分量Y模式判决时,通过式判决出最优模式;在进行Y的两个色度分量Cb和Cr模式判决时,通过式判决出最优模式;Y分量下的拉格朗日乘子λY和Cb、Cr分量下的拉格朗日乘子λCb&Cr,分别通过查表得到。本发明可以简化模式判决时的乘法器运算,减小了硬件的开销,同时也可使硬件的工作频率显著提高,从而实现高清视频的实时编码。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top