[发明专利]一种模型训练和视频编码方法、装置、设备及存储介质有效

专利信息
申请号: 202210602534.6 申请日: 2022-05-30
公开(公告)号: CN115052154B 公开(公告)日: 2023-04-14
发明(设计)人: 张旭 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: H04N19/192 分类号: H04N19/192;H04N19/196;H04N19/176;G06T7/50
代理公司: 北京品源专利代理有限公司 11332 代理人: 孔凡红
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开提供了一种模型训练和视频编码方法、装置、设备及存储介质,涉及人工智能技术领域,具体涉及云计算、视频处理、媒体云技术,可应用在智能云场景下。包括:根据样本编码单元CU对样本视频帧划分后的样本图像块,确定样本图像块对应的样本可选特征和样本划分指示信息;根据样本图像块对应的样本可选特征和样本划分指示信息,训练第一模型;根据训练后的第一模型,从样本可选特征中筛选第一样本关键特征;基于第一样本关键特征和样本划分指示信息,训练第二模型,得到CU划分指示预测模型。本方案通过训练能够预测CU划分指示信息的模型,并将其应用在基于HEVC技术对CU进行递归划分的过程中,极大提高了CU递归划分效率,进而提高视频编码效率。
搜索关键词: 一种 模型 训练 视频 编码 方法 装置 设备 存储 介质
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202210602534.6/,转载请声明来源钻瓜专利网。

同类专利
  • 一种模型训练和视频编码方法、装置、设备及存储介质-202210602534.6
  • 张旭 - 北京百度网讯科技有限公司
  • 2022-05-30 - 2023-04-14 - H04N19/192
  • 本公开提供了一种模型训练和视频编码方法、装置、设备及存储介质,涉及人工智能技术领域,具体涉及云计算、视频处理、媒体云技术,可应用在智能云场景下。包括:根据样本编码单元CU对样本视频帧划分后的样本图像块,确定样本图像块对应的样本可选特征和样本划分指示信息;根据样本图像块对应的样本可选特征和样本划分指示信息,训练第一模型;根据训练后的第一模型,从样本可选特征中筛选第一样本关键特征;基于第一样本关键特征和样本划分指示信息,训练第二模型,得到CU划分指示预测模型。本方案通过训练能够预测CU划分指示信息的模型,并将其应用在基于HEVC技术对CU进行递归划分的过程中,极大提高了CU递归划分效率,进而提高视频编码效率。
  • 基于轻量级神经网络的VVC帧间CU划分提前跳过方法-202211192262.3
  • 李跃;刘武;万亚平;刘杰;田纹龙 - 南华大学
  • 2022-09-28 - 2023-04-07 - H04N19/192
  • 本发明公开了一种基于轻量级神经网络的VVC帧间CU划分提前跳过方法,包括如下步骤:提取当前CU的残差值(原始亮度像素值和预测亮度像素值的差值)、残差值的方差值、QP值、深度值、块形比,预处理后作为神经网络的输入;经过神经网络后,输出不跳过当前划分的概率值;最后,概率值与提前设定的阈值进行比较,判断是否提前跳过当前CU进行的划分(包括水平二叉树划分BTH、垂直二叉树划分BTV、水平三元树划分TTH、垂直三元树划分TTV)。本发明通过一个简单的神经网络有效的降低了编码单元多类型树划分的复杂度,在基本不影响编码质量的情况下,降低了VVC帧间编码时间。
  • 视频数据处理方法、装置、设备及存储介质-202211445730.3
  • 张佳 - 腾讯科技(深圳)有限公司
  • 2022-11-18 - 2023-03-31 - H04N19/192
  • 本申请实施例公开了一种视频数据处理方法、装置、设备及存储介质,应用于云技术中的云游戏等场景中,其中,该方法包括:获取针对目标视频帧中的待编码单元的目标递归划分策略,以及待编码单元的编码参数;按照目标递归划分策略,对待编码单元进行划分,得到N个第一待编码子单元;获取N个第一待编码子单元分别对应的编码参数,确定待编码单元的编码参数与N个第一待编码子单元分别对应的编码参数之间的参数关系;若参数关系指示待编码单元不满足继续划分条件,则暂停对待编码单元进行再次划分,根据第一待编码子单元和待编码单元,确定待编码单元的目标划分结果。通过本申请降低视频数据的编码过程的复杂度,提高视频数据的编码效率。
  • 一种应用于混合语境中的多码率深度图像压缩系统及方法-202211533749.3
  • 雷中岳;洪学敏;石江宏 - 厦门大学
  • 2022-12-01 - 2023-03-28 - H04N19/192
  • 本发明一种应用于混合语境中基于残差增强掩码的多码率深度图像压缩系统,其包括深度图像编解码模块、潜在向量重要性分析模块和隐空间编码模块。其中,隐空间编码模块采用残差方式将隐空间向量分为基础层和增强层,消除了隐空间的冗余度提高了压缩效率;其中,基础层包含了原图像的全局特征,保证重建图像的整体感知效果,且包含了整体语义信息。而且本发明在进行图像压缩编码时,深度编码器进行一次编码得到潜在向量,通过隐空间编码实现码率和语境自适应,使得图像的压缩传输具有更高的实时性。
  • 一种应用于混合语境中的多码率深度图像压缩系统及方法-202211533806.8
  • 雷中岳;洪学敏;陈凌宇;石江宏 - 厦门大学
  • 2022-12-01 - 2023-03-28 - H04N19/192
  • 本发明涉及一种应用于混合语境中基于掩码的多码率深度图像压缩系统及方法,其中,系统包括深度图像编解码模块、潜在向量重要性分析模块和隐空间编码模块。本发明采用单一深度编解码模型实现多码率和混合语境自适应,相对于当前训练多个模型的进行码率和语境自适应的方法,节省了大量的存储和通信资源;而且,本发明进行图像压缩编码时,深度编码器进行一次编码得到潜在向量,通过隐空间编码实现码率和语境自适应,使得图像的压缩传输具有更高的实时性。
  • 一种数据处理方法、装置、计算机设备及存储介质-202211355258.4
  • 张佳 - 腾讯科技(深圳)有限公司
  • 2022-11-01 - 2023-03-07 - H04N19/192
  • 本申请实施例公开了一种数据处理方法、装置、计算机设备及存储介质,适用于云技术中的数据传输领域,包括:获取针对目标视频帧中的待编码单元的递归划分策略集合;递归划分策略集合包括N个划分策略;N个划分策略包括划分策略Gi;按照划分策略Gi,对待编码单元进行块划分,得到划分策略Gi下的递归划分结果Ri;递归划分结果Ri包括基于划分策略Gi得到的待编码子单元;遍历N个划分策略对应的N个递归划分结果分别所包含的待编码子单元的编码参数,直到遍历到的编码参数指示待编码单元满足块划分条件,则根据N个递归划分结果,确定待编码单元的目标划分结果。采用本申请实施例,可以降低编码复杂度。
  • 一种基于参数选择的视频编码算法优化方法-202110153835.0
  • 查攀;殷海兵;周洋 - 杭州电子科技大学
  • 2021-02-04 - 2022-11-18 - H04N19/192
  • 本发明公开了一种基于参数选择的视频编码算法优化方法,包括:S1,通过R‑D‑T综合性能评价指标,将率失真性能和编码复杂度进行综合分析;S2,分析参数间的相关性,定量计算参数的耦合系数,根据耦合系数对参数进行排序;S3,通过参数选择算法,在第一个循环中,获得一组最优参数组合;第二个循环在第一个循环的基础上加入编码时间限制,基于同一个参数的取值越小,则编码时间越短的规律,在第一个循环得到的最优参数组合的基础上,通过实际编码时间与目标编码时间对比来确定增大或减小参数取值,比较不同参数调整后的RDTscore,从而找出综合性能最好的参数作为本轮参数调整的对象,直到在误差允许的范围内达到目标复杂度。
  • 一种视频自适应调整方法和装置-201911354380.8
  • 丁长文;方伟;顾益双;王亮 - 成都鼎桥通信技术有限公司
  • 2019-12-25 - 2022-10-11 - H04N19/192
  • 本发明实施方式提出一种视频自适应调整方法和装置。摄像单元基于预定分辨率采集原始视频,编码器将原始视频转换为对应于多个分辨率等级的多个视频数据流;从多个视频数据流中确定当前视频数据流,基于预定码率将当前视频数据流发送到接收端;解析接收端的接收端报告(RR),通过丢包率计算期望调整码率;如果期望码率在当前分辨率范围之内,则直接进行码率调整;如果期望码率不在当前分辨率调整范围,切换到对应分辨率的视频数据流,同时将期望码率配置成该视频数据流的输出码率。可以实现视频分辨率的平滑调整,而无需重启编码器。
  • 基于单像素相机的视频多帧重建方法及装置-202110241030.1
  • 边丽蘅;闫荣;张军 - 北京理工大学
  • 2021-03-04 - 2022-03-22 - H04N19/192
  • 一种基于单像素相机的视频多帧重建方法和装置,该方法利用单像素相机获取连续多帧图像对应的一维测量值;基于一维测量值建立视频多帧重建模型,视频多帧重建模型使得多帧图像在时间维度上具有低秩性,在空间维度上具有全变分正则化先验;通过增广拉格朗日乘子法求解所述视频多帧重建模型,得出各变量迭代表达式;代入测量值和已知的调制掩膜矩阵,经多次迭代,从所述测量值中解耦合出多帧图像。由此,在多帧图像帧间低秩性先验和视频帧内全变分正则化约束下的本申请实施例,可在较低采样率下,同时重建多帧图像,提高重建效率和重建精度,对噪声具有鲁棒性,也就是说,本申请实施例具有高信噪比、高精度、低成本、效率高、适应性好等特性。
  • 视频码率自适应调整方法及装置-201510208870.2
  • 耿玉峰;张行功;牛童;郭宗明 - 北京大学;北大方正集团有限公司;北京北大方正电子有限公司
  • 2015-04-28 - 2019-08-06 - H04N19/192
  • 本发明实施例提供一种视频码率自适应调整方法及装置。该方法包括:获取与通信对端无线通信的往返时延,以及所述通信对端的接收速率;依据所述往返时延获得排队延迟;依据所述排队延迟和所述接收速率调整视频码率,并依据调整后的视频码率对视频文件进行编码;向所述通信对端发送编码后的视频文件。本发明实施例通过发送设备获取与通信对端之间的往返时延计算出排队延迟,再依据排队延迟与通信对端的接收速率调整视频码率,即将排队延迟作为视频码率调整的参照变量,相对于采用丢包率作为视频码率调整的参照变量,避免由于无线网络中链路错误、传输距离长引起丢包率增大,从而准确有效解决视频文件实时传输的问题。
  • 视频码率自适应调整方法及发送端设备-201510388573.0
  • 方伟;张涛;王亮 - 成都鼎桥通信技术有限公司
  • 2015-06-30 - 2019-05-07 - H04N19/192
  • 本发明提供一种视频码率自适应调整方法及发送端设备,该方法包括:发送端设备根据码率估计事件估计目标编码速率,然后将目标编码速率应用于视频编码器,从而实现视频编码速率的自适应调整,使得发送端设备的视频编码器的编码速率与缓存情况、接收端设备的接收状况等相符合,达到解决现有技术中视频丢包、视频业务质量下降的问题。
  • 带宽压缩中的后选择预测方法-201811261664.8
  • 张莹;罗瑜 - 西安科锐盛创新科技有限公司
  • 2018-10-26 - 2019-04-16 - H04N19/192
  • 本发明涉及一种带宽压缩中的后选择预测方法,包括:将图像分成大小为m×n的多个MB;其中,m、n分别为每个MB的行分辨率、列分辨率;分别采用自适应模板预测方法与自适应纹理渐变预测方法对当前MB进行预测以获取对应的残差主观和;根据所述残差主观和确定所述当前MB中每个像素的最终预测残差。本发明提供的带宽压缩中的后选择预测方法,以自适应模板预测方法与自适应纹理渐变预测方法为基础,通过预测选择算法可以选择出最优的一种预测方法,对于复杂纹理图像进一步优化了预测效果。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top