[发明专利]基于增强学习的双目视觉导盲仪有效

专利信息
申请号: 201711316314.2 申请日: 2017-12-12
公开(公告)号: CN108245384B 公开(公告)日: 2019-10-25
发明(设计)人: 周坤;孙辉;张伟 申请(专利权)人: 清华大学苏州汽车研究院(吴江)
主分类号: A61H3/06 分类号: A61H3/06;G06K9/00;G06K9/46;G06K9/62
代理公司: 苏州创元专利商标事务所有限公司 32103 代理人: 范晴;丁浩秋
地址: 215200 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于增强学习的双目视觉导盲仪,包括:双目视觉模块,用于将第一、第二图像采集模块的图像进行处理,生成实时的深度图,构建三维场景;语音模块,包括语音输入模块和输出模块,语音输入模块包括语音识别模块,用于进行语音识别,语音输出模块,用于以语音的方式输出增强学习模块的行为指令、定位信息和路径导航信息;状态集生成模块,将三维场景通过卷积神经网络提取环境特征,生成状态集;增强学习模块,包括增强学习网络,以状态集作为输入,学习状态转换策略得到输出动作指令;GPS导航模块,用于定位,及根据语音识别信息生成路径规划。可以提供盲人的实时路径规划信号,对盲人的行动策略进行方便的实时的指导。
搜索关键词: 状态集 语音输入模块 三维场景 双目视觉 学习模块 导盲仪 卷积神经网络 路径导航信息 实时路径规划 双目视觉模块 图像采集模块 语音识别模块 语音识别信息 语音输出模块 定位信息 环境特征 路径规划 生成模块 输出动作 输出模块 输出增强 行为指令 学习状态 语音模块 语音识别 转换策略 深度图 构建 学习 语音 指令 图像 网络
【主权项】:
1.一种基于增强学习的双目视觉导盲仪,其特征在于,包括:双目视觉模块,用于将第一图像采集模块和第二图像采集模块的图像进行处理,生成实时的深度图,构建三维场景;语音模块,包括语音输入模块和语音输出模块,所述语音输入模块包括语音识别模块,用于进行语音识别,所述语音输出模块,用于以语音的方式输出增强学习模块的行为指令、定位信息和路径导航信息;状态集生成模块,将构建的三维场景通过卷积神经网络提取环境特征,生成状态集;所述状态集生成模块还包括将盲人当前的状态信息根据预先设置的字典映射关系进行离散化成不同的一维词向量,再将词向量按照固定的规则进行行方向拼合,编码成稀疏矩阵,所述稀疏矩阵的维度和卷积神经网络的输入相同,与提取的环境特征融合得到状态集;增强学习模块,包括增强学习网络,所述增强学习网络以状态集作为输入,学习状态转换策略得到输出动作指令;GPS导航模块,用于定位,及根据语音识别信息生成路径规划。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学苏州汽车研究院(吴江),未经清华大学苏州汽车研究院(吴江)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711316314.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top