[发明专利]一种基于强化学习的图片动态自适应压缩方法有效
申请号: | 201910446859.8 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110210548B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 朱文武;李洪珊;王智 | 申请(专利权)人: | 清华大学深圳研究生院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;H04L29/08;H04N19/105 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
地址: | 518055 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于强化学习的图片动态自适应压缩方法,包括对DQN进行训练的阶段和使用训练好的DQN为图片选择合适的压缩程度并进行压缩上传的阶段;第一阶段将原图和利用随机初始化DQN分配的压缩程度压缩后的压缩图同时上传至云端,通过比较云端返回的原图识别结果和压缩图识别结果来得到当前压缩程度对应的准确率,将当前图片的特征、压缩程度、识别准确率和奖赏值组成一个记忆步存入记忆池,完成一个测试步;完成预定数量的测试步后开始训练DQN,训练预定次数收敛后,不再上传原图,而将新图片的特征送入训练好的DQN,计算不同压缩程度的策略价值并选择价值最大的压缩程度压缩后上传。 | ||
搜索关键词: | 一种 基于 强化 学习 图片 动态 自适应 压缩 方法 | ||
【主权项】:
1.一种基于强化学习的图片动态自适应压缩方法,其特征在于,包括第一阶段和第二阶段;第一阶段:1.1、初始时刻,对部署于边缘侧的深度策略价值神经网络进行随机初始化;1.2、对用户上传的当前图片执行操作1和操作2,操作1:将原图上传至云端;操作2:提取图像特征并送入随机初始化的深度策略价值神经网络中,计算采用预配置的压缩算法的不同压缩程度进行压缩的策略价值,选取策略价值最大的压缩程度进行压缩后,将压缩图上传至云端;通过云端深度学习模型对原图和压缩图进行图像识别;1.3、接收云端返回的原图识别结果和压缩图识别结果并进行两者的比较,得出深度学习模型对当前压缩程度下的压缩图的识别准确率;1.4、将当前图片的图像特征、压缩程度、识别准确率和奖赏值组合成一个记忆步存入一有限长度的队列中;至此,完成一个测试步;1.5、对下一张图片,重复步骤1.2~1.4;1.6、当执行步骤1.2~1.5至完成M个测试步时,从所述队列中随机取出N个记忆步构成训练集,开始训练所述深度策略价值神经网络;同时,继续对收到的图片执行步骤1.2~1.5以不断地更新所述队列,并且,每完成K个测试步便从所述队列中随机取出N个记忆步,继续训练所述深度策略价值神经网络;1.7、对所述深度策略价值神经网络训练至预定次数,进入所述第二阶段;其中:M、N和K均为预先设定的值,M≥N;奖赏值等于识别准确率减去压缩率;在第一阶段,将云端对原图的识别结果返回至用户;第二阶段:2.1、对当前用户新上传的图片,提取图像特征并送入训练好的深度策略价值神经网络中,以计算采用预配置的压缩算法的不同压缩程度进行压缩的策略价值;2.2、选取策略价值最大的压缩程度,利用所述预配置的压缩算法对当前用户新上传的图片进行压缩,压缩后上传至云端,并将云端对压缩图片的识别结果返回至用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳研究生院,未经清华大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910446859.8/,转载请声明来源钻瓜专利网。
- 上一篇:基于惯性手套的钢琴弹奏手势识别方法
- 下一篇:一种跨域变分对抗自编码方法