[发明专利]图像编解码方法、系统、设备及存储介质在审

专利信息
申请号: 202211718595.5 申请日: 2022-12-29
公开(公告)号: CN116055727A 公开(公告)日: 2023-05-02
发明(设计)人: 张子文;武祥吉;陈也达;袁庆祝;冯溢 申请(专利权)人: 上海双深信息技术有限公司
主分类号: H04N19/149 分类号: H04N19/149;H04N19/147
代理公司: 北京凯特来知识产权代理有限公司 11260 代理人: 郑立明;韩珂
地址: 200030 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种图像编解码方法、系统、设备及存储介质,一方面,对图像编解码模型中的编码器与解码器进行改进;另一方面,在进行自回归超参上下文估计的时候,使用逐行的Rowcnn替代传统逐点的pixelcnn,大大降低了计算IO的碎片程度;综合以上两个方面,能够将计算复杂度降低一个维度,从而加快编解码速度,并且,可以提升图像压缩性能,保证重建图像的质量。
搜索关键词: 图像 解码 方法 系统 设备 存储 介质
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海双深信息技术有限公司,未经上海双深信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202211718595.5/,转载请声明来源钻瓜专利网。

同类专利
  • 视频编码方法、装置、电子设备及存储介质-202310640157.X
  • 巩佳超;郝进华;孙明 - 北京达佳互联信息技术有限公司
  • 2023-05-31 - 2023-09-26 - H04N19/149
  • 本公开关于一种视频编码方法、装置、电子设备及存储介质,涉及计算机技术领域,该方法通过对待处理视频进行特征提取,获得待处理视频的视频特征;基于视频特征以及目标视频码率,获取目标参数预测模型输出的至少两个输出结果;基于至少两个输出结果中的质量指标参数以及目标视频码率,生成码率质量对应关系;从码率质量对应关系中确定目标样本点,并将目标样本点对应的预测参数,作为目标预测参数。这样,由于视频特征可以表征待处理视频的视频内容,因此通过参数预测模型为待处理视频输出更适合视频内容的预测参数,并且通过码率质量对应关系,确定适合待处理视频的目标预测参数,在保持编码质量稳定的同时,保障编码后视频的清晰度和流畅度。
  • 基于神经网络算法的信息转换系统-202310805179.7
  • 请求不公布姓名 - 江苏汇智达信息科技有限公司
  • 2023-07-03 - 2023-09-19 - H04N19/149
  • 本发明涉及一种基于神经网络算法的信息转换系统。所述系统包括:编码判断机构,用于采用深度神经网络模型基于多份转换数据以及待编码的视频片段被配置执行视频编码的编码类型标识判断对待编码的视频片段采用其被配置执行视频编码的编码类型需要的编码时长;模型提取机构,与编码判断机构连接,用于提供所述深度神经网络模型,所述深度神经网络模型为执行完多次学习后的深度神经网络。通过本系统,能够采用针对性设计的智能预测模型对每一视频编码标准执行基于视频编码标准和待压缩视频数据各项参数的对应视频编码时长的预测操作,从而提前预知不同编码标准分别对应的不同编码时长,为根据具体应用需求选择对应编码标准提供有价值的参考信息。
  • 图像分量预测方法、编码器、解码器以及存储介质-202310752393.0
  • 霍俊彦;万帅;马彦卓 - OPPO广东移动通信有限公司
  • 2019-10-28 - 2023-09-05 - H04N19/149
  • 本申请实施例公开了一种图像分量预测方法、编码器、解码器以及存储介质,该方法包括:确定图像中当前块的相邻参考像素;根据所述相邻参考像素,构造相邻参考像素子集;其中,所述相邻参考像素子集中包含有所述相邻参考像素中的部分像素;根据所述相邻参考像素子集,计算预测模型的模型参数;其中,所述预测模型包括N个预测子模型,N个预测子模型对应N组模型参数,所述预测子模型用于通过对应的模型参数对待预测图像分量进行跨分量预测处理,N为大于或等于2的正整数。
  • 编码方法、解码方法、装置及通信设备-202210163353.8
  • 邹文杰;张伟;杨付正;吕卓逸 - 维沃移动通信有限公司
  • 2022-02-18 - 2023-08-29 - H04N19/149
  • 本申请公开了一种编码方法、解码方法、装置及通信设备,属于编解码技术领域,本申请实施例的编码方法包括:编码端根据三维网格中相邻三角面片的空间夹角,确定第一空间范围内的待排序顶点,所述第一空间范围为所述三维网格中待编码三角形的目标顶点所在的空间范围,且所述待排序顶点包括所述目标顶点;所述编码端对所述待排序顶点进行排序,得到所述目标顶点的排序信息;所述编码端根据所述目标顶点的排序信息对应的编码信息,得到所述待编码三角形的编码信息。
  • 面向人机混合的视频编码方法、装置、系统、设备及介质-202210086997.1
  • 王慧芬;张园;杨明川;史敏锐;薛俊达 - 中国电信股份有限公司
  • 2022-01-25 - 2023-08-04 - H04N19/149
  • 本公开提供了一种面向人机混合的视频编码方法、装置、系统、设备及介质,涉及视频编码技术领域。该方法包括:首先对采集的原始视频图像执行编码前图像预处理得到第一视频图像,并对第一视频图像进行编码得到第一二进制码流,传输到解码端;然后对第一视频图像执行编码前图像后处理得到第二视频图像,并根据第二视频图像和原始视频图像生成残差视频图像,对残差视频图像进行编码得到第二二进制码流,传输至解码端;最后使得解码端对第一二进制码流和第二二进制码流分别进行解码,并根据解码结果合成待输入到人眼视觉任务模型的视频图像。本公开能够在满足机器视觉任务的基础上,合成高质量的视频图像,以满足人眼视觉任务等高保真需求场景。
  • 图像处理方法及设备-202210045090.0
  • 施亦纯;杨骁;沈晓辉 - 脸萌有限公司
  • 2022-01-14 - 2023-07-25 - H04N19/149
  • 本公开实施例提供一种图像处理方法及设备,该方法包括:通过编码器和第一模型,对初始图像进行多次迭代处理,得到初始图像对应的目标图像特征;基于目标图像特征,通过第二模型进行图像重建,得到初始图像的重建图像,第一模型和第二模型均为用于图像重建的神经网络。其中,在多次迭代处理中,第一模型进行图像重建所提取的图像特征和第一模型的输出图像为编码器的反馈信息,以辅助编码器进行编码。从而,通过多次迭代以及在多次迭代中将图像重建过程中的图像特征和输出图像作为编码器的反馈信息,提高了编码器的编码性能,进而提高了重建图像的图像质量。
  • 用于具有持续赖斯自适应的范围扩展的约束标志信令技术-202280006859.6
  • 崔秉斗;刘杉;史蒂芬·文格尔 - 腾讯美国有限责任公司
  • 2022-04-29 - 2023-07-18 - H04N19/149
  • 本公开的各方面提供了用于视频数据处理的方法和装置。在一些示例中,用于视频数据处理的装置包括处理电路。例如,该处理电路确定用于在比特流中的已编码视频数据的第一范围中的编码控制的第一语法元素。该第一语法元素与用于残差编码中的基于统计的赖斯参数推导、且被定义在视频标准的范围扩展中的持续赖斯自适应的编码工具相关联。响应于该第一语法元素为指示在该第一范围中禁用该编码工具的第一值,该处理电路在不调用该编码工具的情况下解码包括已编码视频数据的一个或多个第二范围的该已编码视频数据的第一范围。
  • 一种基于Zynq的图像帧率可控模拟器和方法-202310364151.4
  • 李相迪;刘志威;胡塘;任嵩楠;闫力;玉虓 - 之江实验室
  • 2023-03-31 - 2023-07-18 - H04N19/149
  • 本发明公开了一种基于Zynq的图像帧率可控模拟器和方法,所述模拟器包括存储器、Zynq芯片和内存;所述Zynq芯片包括PS和PL;所述存储器,用来为PS提供图像数据;所述PS,用来读取存储器中的图像数据,并将所述图像数据存储在内存中;所述PL,用来控制图像的帧率,根据所需帧率,将内存中的数据进行读取以及输出。本发明采用zynq芯片,zynq芯片内部集成了cpu和FPGA,减少片外互联之间的链路不稳定性,更具有可靠性,更加小型化,轻量化,便于携带,降低开发难度,增加了扩展数据库的功能。
  • 图像分量预测方法、编码器、解码器以及存储介质-202110993233.6
  • 霍俊彦;万帅;马彦卓 - OPPO广东移动通信有限公司
  • 2019-10-28 - 2023-06-20 - H04N19/149
  • 本申请实施例公开了一种图像分量预测方法、编码器、解码器以及存储介质,该方法包括:确定图像中当前块的相邻参考像素;根据所述相邻参考像素,构造相邻参考像素子集;其中,所述相邻参考像素子集中包含有所述相邻参考像素中的部分像素;根据所述相邻参考像素子集,计算预测模型的模型参数;其中,所述预测模型包括N个预测子模型,N个预测子模型对应N组模型参数,所述预测子模型用于通过对应的模型参数对待预测图像分量进行跨分量预测处理,N为大于或等于2的正整数。
  • 图像的编解码方法和编解码装置-202211712053.7
  • 潘蓉;尤沛;高歌 - 三星(中国)半导体有限公司;三星电子株式会社
  • 2022-12-29 - 2023-05-16 - H04N19/149
  • 提供了一种图像的编解码方法和装置。所述编解码方法包括:基于所述图像获取用于对所述图像执行压缩编码的已训练的深度神经网络的多个通道块的重要度权值,其中,所述已训练的深度神经网络的通道被划分为所述多个通道块,其中,每个通道块包括预定数量的通道,每个通道块中的通道彼此不重叠;基于所述重要度权值以及针对所述图像的压缩率选择用于对所述图像进行编码的至少一个通道块;利用由所述至少一个通道块中的通道构成的子深度神经网络对所述图像执行压缩编码以获得编码后的图像。
  • 基于HVS特征的VVC码率控制优化方法-202111319969.1
  • 何小海;贺立强;何海波;陈洪刚;熊淑华 - 四川大学;成都西图科技有限公司
  • 2021-11-09 - 2023-05-12 - H04N19/149
  • 本发明从VVC中比特分配与人眼视觉特性不匹配及参数更新时收敛步长过小及未考虑绝对收敛这两个问题入手,公开了一种基于HVS特征的VVC码率控制优化方法。首先,利用Sobel算子得到空域信息;利用参考帧的MV信息自适应得到时域信息;提出对特殊情况的时域信息提取方式;然后,将帧目标比特分为两部分,再分别利用CTU各自的空域信息进行CTU级的比特分配;在一个CTU或一帧编码完成后,使用拟牛顿收敛算法进行参数更新,针对收敛特殊情况提出了对应方法。基于本发明得到的视频序列更在加满足人眼视觉系统的需要,并在客观质量指标及主观质量上能够实现大幅度的优化,并且输出编码的视频波动程度更为平稳。
  • 基于智慧校园管理平台的数据传输方法-202211513346.2
  • 阳菲菲 - 江苏益捷思信息科技有限公司
  • 2022-11-30 - 2023-05-09 - H04N19/149
  • 本发明涉及机器视觉技术领域,具体涉及一种基于智慧校园管理平台的数据传输方法,包括获取每秒校园视频的连续帧的图像,对图像中的目标区域进行标记并获取灰度图像;获取优质图像的实际权重和劣质图像的实际权重;获取每张优质图像中目标区域的占比系数和劣质图像中目标区域的占比系数;获取优质图像/劣质图像目标区域中每个像素点的传输权重值,并获取优质图像/劣质图像中其他区域中每个像素点的传输权重值;获取每张劣质图像中最大辐射邻域层内每个像素点的传输权重值;将所有连续帧图像中所有像素点传输权重值按照由小到大的顺序进行霍夫曼编码;本发明解决了用户在智慧校园平台下载文件时出现目标区域损失的技术问题。
  • 一种HEVC帧内编码中基于深度学习的率失真优化快速决策系统及其方法-202010157663.X
  • 蔡晓刚 - 蔡晓刚
  • 2020-03-09 - 2023-05-09 - H04N19/149
  • 本发明公开了一种HEVC帧内编码中基于深度学习的率失真优化快速决策系统及其方法,属于视频编码技术领域。考虑到编码参数选择时存在的内在联系,结合视频内容的时空相关性,来同时确定当前编码单元的CU/PU分区和预测模式,避免了HEVC帧内编码中率失真优化过程中的遍历过程,能够最大程度地降低计算复杂度,节省编码时间。具体包括步骤:1)准备用于训练及测试决策网络的视频数据集;2)利用训练数据集分别在不同QP下对单步决策网络进行训练,并保存训练后的网络模型参数;3)将单步决策网络嵌入到HEVC参考模型HM.15.0中,实现低复杂度HEVC编码器;4)分别使用不同QP下训练出的单步决策网络模型对测试集上的视频进行编码,测试编码复杂度和RD性能。
  • 色度块预测方法及装置-201811210441.9
  • 马祥;牟凡;杨海涛 - 华为技术有限公司
  • 2018-10-17 - 2023-04-28 - H04N19/149
  • 本发明实施例提供一种色度块的预测方法和装置。所述方法获得亮度块模板中的亮度点的均值,然后根据该均值将模板亮度点分成两个集合,相应的模板色度点也被分成了两个集合。分别计算各集合内的亮度均值以及色度均值,基于这两个亮度均值以及对应的色度均值导出线性模型系数。然后根据所述亮度块的亮度点的值和所述线性模型系数,获得所述色度块的色度点的预测值。本发明实施例可以降低线性模型的复杂度,提高鲁棒性,从而可以提高色度编解码的效率。
  • 基于2D马尔可夫和边缘方向特性的屏幕内容索引图预测方法-202010091952.4
  • 宋传鸣;刘定坤;刘丹;王相海 - 辽宁师范大学
  • 2020-02-13 - 2023-04-14 - H04N19/149
  • 本发明公开一种基于2D马尔可夫和边缘方向特性的屏幕内容索引图预测方法,根据待预测像素沿着边缘方向的线性相关性,建立了2D马尔可夫模型,并利用待预测像素周围、因果邻域内的4个像素,对待预测像素的索引值进行预测;其次,将0~180区间均匀划分为8个方向区间,再利用Bresenham直线光栅化算法设计了8个大小为4×4的方向模板,从而根据视频关键帧的主要边缘方向分布,自适应地为待预测像素选取4个因果预测像素;最后,采用最小二乘法为每个方向模板计算出一组1阶2D自适应线性相关系数,进而实现沿着主要边缘方向的、2D马尔可夫模型的屏幕内容索引图预测。
  • 一种环境安防工程监测数据管理方法及系统-202211619607.9
  • 周皓 - 苏州迈创信息技术有限公司
  • 2022-12-16 - 2023-04-04 - H04N19/149
  • 本发明公开了一种环境安防工程监测数据管理方法及系统,涉及数据处理技术领域,该方法包括:获取监控视频数据中每帧图像中每个单通道图像的多个超像素块;获取超像素块中每个边缘点连线的灰度差值的拟合直线,以及拟合直线的拟合质量;利用超像素块在不同方向的拟合直线的拟合质量得到拟合熵值;利用每两个超像素块的相关度将超像素块分为多个类别;获取每类超像素块的预测模型系数;根据灰度图像中每个像素点的目标预测灰度值和灰度值得到预测误差;对每个像素点的预测误差进行编码存储。本发明构建的预测模型更加准确,得到的预测误差数值更小,编码后的占用空间更小。
  • 基于人工智能的视频编码处理方法、装置、设备及介质-202211387166.4
  • 张旭 - 北京百度网讯科技有限公司
  • 2022-11-07 - 2023-03-31 - H04N19/149
  • 本公开提供了一种基于人工智能的视频编码处理方法、装置、设备及介质,涉及人工智能领域,具体涉及云计算、视频处理、媒体云技术,可应用在智能云场景下。具体实现方案为:基于待处理单元的残差信息,提取第一特征序列表达和至少一个第二特征序列表达;基于第一特征序列表达、至少一个第二特征序列表达、预先训练的第一预测模型和至少一个第二预测模型,预测待处理单元为全零块的第一预测概率和至少一个第二预测概率;基于第一预测概率、至少一个第二预测概率、第一预设概率阈值和至少一个第二预设概率阈值,获取待处理单元是否为全零块的预测结果;基于预测结果对待处理单元进行编码处理。本公开的技术,能够有效地提高视频编码效率。
  • 端到端AI图像压缩的码率控制方法、系统、设备及介质-202211496153.0
  • 盛颜开;陈也达;袁庆祝 - 上海双深信息技术有限公司
  • 2022-11-24 - 2023-03-17 - H04N19/149
  • 本发明公开了一种端到端AI图像压缩的码率控制方法、系统、设备及介质,利用端到端图像压缩模型可以在最高和最低码点间无限插值的特性,插值出较多码点,从而获得码率控制表(Rate Control Table,简写为RCT),并根据超先验及上下文模型估计出最大和最小码率,从RCT中选择出最接近的码点以达到码率控制的效果,从而能够在带宽有限的情况下可以设置一个可靠的传输带宽。本发明不需要重新训练模型,是一种非常适合深度学习端到端图像压缩的码率控制方法,且误差较小。
  • 视频处理方法及其相关设备-202211570952.8
  • 卜彦云;钟光华;降伟帅;雷财华 - 荣耀终端有限公司
  • 2022-12-08 - 2023-01-24 - H04N19/149
  • 本申请提供一种视频处理方法及其相关设备,涉及视频处理领域,该方法包括:获取视频码流数据;对视频码流数据解码,得到多帧初始视频帧;针对第一初始视频帧进行第一超分处理,得到第一超分视频帧;针对第二初始视频帧,结合第一超分视频帧进行第二超分处理,得到第二超分视频帧;针对第三初始视频帧,结合第一超分视频帧和第二超分视频帧进行第三超分处理,得到对应的第三超分视频帧;基于第一超分视频帧、第二超分视频帧和第三超分视频帧,得到目标视频流。本申请在解码的过程中对视频中的不同类型的视频帧进行不同的超分处理,以达到重构和修复图像、提高视频质量的目的。
  • 基于多用户视角预测和码率分配的方法及装置-202211126717.1
  • 刘伟;董威;彭若涛 - 武汉理工大学
  • 2022-09-16 - 2023-01-13 - H04N19/149
  • 本发明公开了一种基于多用户视角预测和码率分配的方法及装置,其中方法包括:将用户历史头部轨迹转化成视点轨迹;基于多用户视点轨迹,采用聚类方法获取全景视频每帧的ROI区域;利用目标用户历史视点轨迹训练时序模型,并预测得到中间视点;计算目标用户和其他用户的视点轨迹相似度,依据视点轨迹相似度构建预测视点轨迹权重模型;结合视点轨迹权重,并利用其他用户视点轨迹对中间视点进行调整得到最终预测视点;利用最终预测视点构建全景视频当前帧的FOV区域;结合FOV和ROI区域为当前视频帧分配码率。本发明大大降低对计算资源的需求,充分利用传输带宽的同时,保证了视频的传输质量,优化了用户体验。
  • 一种视频编码参数获取方法、装置及电子设备-202211125470.1
  • 不公告发明人 - 沐曦科技(成都)有限公司
  • 2022-09-16 - 2022-12-27 - H04N19/149
  • 本申请涉及一种视频编码参数获取方法、装置及电子设备,属于视频编码技术领域。该视频编码参数获取方法包括:获取待编码视频;利用预先训练好的多叉戟神经网络模型对待编码视频进行处理,输出不同分辨率不同码率下的质量分数;根据不同分辨率不同码率下的质量分数确定出目标分辨率和目标码率,其中,目标分辨率和目标码率为待编码视频编码所需的编码参数。本申请实施例中,仅需要向多叉戟神经网络模型输入一个待编码视频便可得到多个不同分辨率和/或不同码率的质量分数,解决了现有技术需要多次编码才能得到不同分辨率和/或不同码率的视频所存在的问题,即改善了现有视频编码方法耗时长以及消耗的编码资源多的问题。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top