[发明专利]一种移动机器人导航方法在审
申请号: | 201910598925.3 | 申请日: | 2019-07-04 |
公开(公告)号: | CN110307848A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 唐开强;傅汇乔;王岚;柴昭;杨宇琼;季娟宇;李步印;柯兴萍;车佳嫣;陈春林;朱张青;陈力立;辛博;曲直;闻羽 | 申请(专利权)人: | 南京大学 |
主分类号: | G01C21/20 | 分类号: | G01C21/20 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 常虹 |
地址: | 210006 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种移动机器人导航方法,导航区域上空设置有图像采集装置,包括如下步骤:1、在机器人运动前采集一次移动机器人环境图像;2、根据采集到的环境图像得到环境障碍物信息;3、根据获取的环境障碍物信息建立二值化栅格地图,栅格地图中标注出可通行区域和不可通行区域;4、根据栅格地图建立移动机器人运行规则;5、设置总回合数M和浅尝试学习回合数M1;使用移动机器人运行规则进行浅尝试学习,得到初步的Q表;根据移动机器人初始位置p0采用强化学习对Q表进行更新;6、根据更新后的Q表,获取移动机器人的最优运动策略π*,得到移动机器人的运动路径。该方法使得机器人在训练过程中减少了无效探索,学习效率高,收敛快。 | ||
搜索关键词: | 移动机器人 移动机器人导航 障碍物信息 环境图像 通行区域 运行规则 栅格地图 采集 图像采集装置 栅格地图建立 机器人运动 导航区域 强化学习 学习效率 训练过程 运动策略 运动路径 二值化 更新 机器人 标注 收敛 学习 探索 | ||
【主权项】:
1.一种移动机器人导航方法,导航区域上方设置有图像采集装置,其特征在于,包括如下步骤:(1)所述图像采集装置在机器人运动前采集一次移动机器人环境图像,该图像包括机器人与目的地;(2)根据采集到的环境图像得到环境障碍物信息;(3)根据获取的环境障碍物信息建立二值化栅格地图,所述栅格地图中标注出可通行区域和不可通行区域;(4)根据栅格地图建立移动机器人运行规则;(5)设置总回合数M,浅尝试学习回合数M1,强化学习回合数M2;M=M1+M2;使用步骤4中建立的移动机器人运行规则进行浅尝试学习,得到初步的Q表;根据移动机器人初始位置p0,采用强化学习对Q表进行更新;(6)根据更新后的Q表获取移动机器人的运动策略π,所述运动策略π由多个动作依次组合,最优运动策略π*为:其中S为可通行区域;表示从状态s转移到状态s'的过程,Qπ(s',a')表示在策略π下,Q表中状态s'下选择某一动作a'的价值,r(s,a)表示在状态s下选取动作a所得回报;根据最优运动策略,得到移动机器人的运动路径。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910598925.3/,转载请声明来源钻瓜专利网。