[发明专利]用于车辆仿真评测的自动驾驶规划模型的训练方法及装置在审
申请号: | 202111602240.5 | 申请日: | 2021-12-24 |
公开(公告)号: | CN114355793A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 周杰;高飞;魏晓;刘旭;李瑾;常淞泓;刘峰 | 申请(专利权)人: | 阿波罗智能技术(北京)有限公司 |
主分类号: | G05B17/02 | 分类号: | G05B17/02 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 车辆 仿真 评测 自动 驾驶 规划 模型 训练 方法 装置 | ||
本公开提供了一种用于车辆仿真评测的自动驾驶规划模型的训练方法及装置、设备和介质,涉及人工智能技术领域,尤其涉及自动驾驶和模拟仿真技术领域。实现方案为:获取目标路况场景的状态特征数据;将所述状态特征数据输入自动驾驶规划模型,并获取所述自动驾驶规划模型所输出的第一车辆控制决策;对所述目标路况场景下车辆执行所述第一车辆控制决策进行仿真测评,以得到所述第一车辆控制决策的针对目标路况场景的第一测评结果,所述第一测评结果用于指示车辆执行所述第一车辆控制决策的行驶行为是否满足预设条件;基于所述第一测评结果,获取所述第一车辆控制决策的第一奖励值;以及基于所述第一奖励值对所述自动驾驶规划模型进行调参。
技术领域
本公开涉及人工智能技术领域,尤其涉及自动驾驶和模拟仿真技术领域,具体涉及一种用于车辆仿真评测的自动驾驶规划模型的训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
背景技术
当前使用最广泛的自动驾驶规划算法主要基于深度学习和规则,需要依赖大量场景数据作为训练输入。真实世界中的道路复杂度和障碍物的行为类型非常丰富,只有模型通过仿真验证,得到来自复杂场景的反馈后才有可能得到改进。目前,尚没有自动驾驶领域的可信评价体系,能够面向专业用户提供仿真评测环境,协助研究人员训练出可信的自动驾驶规划模型。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
本公开提供了一种用于车辆仿真评测的自动驾驶规划模型的训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
根据本公开的一方面,提供了一种用于车辆仿真评测的自动驾驶规划模型的训练方法,包括:获取目标路况场景的状态特征数据;将所述状态特征数据输入自动驾驶规划模型,并获取所述自动驾驶规划模型所输出的第一车辆控制决策;对所述目标路况场景下车辆执行所述第一车辆控制决策进行仿真测评,以得到所述第一车辆控制决策的针对目标路况场景的第一测评结果,所述第一测评结果用于指示车辆执行所述第一车辆控制决策的行驶行为是否满足预设条件;基于所述第一测评结果,获取所述第一车辆控制决策的第一奖励值;以及基于所述第一奖励值对所述自动驾驶规划模型进行调参。
根据本公开的另一方面,提供了一种用于车辆仿真评测的自动驾驶规划模型的训练装置,包括:第一获取单元,被配置用于获取目标路况场景的状态特征数据;第二获取单元,被配置用于将所述状态特征数据输入自动驾驶规划模型,并获取所述自动驾驶规划模型所输出的第一车辆控制决策;仿真测评单元,被配置用于对所述目标路况场景下车辆执行所述第一车辆控制决策进行仿真测评,以得到所述第一车辆控制决策的针对目标路况场景的第一测评结果,所述第一测评结果用于指示车辆执行所述第一车辆控制决策的行驶行为是否满足预设条件;第三获取单元,被配置用于基于所述第一测评结果,获取所述第一车辆控制决策的第一奖励值;以及调参单元,被配置用于基于所述第一奖励值对所述自动驾驶规划模型进行调参。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述用于车辆仿真评测的自动驾驶规划模型的训练方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述用于车辆仿真评测的自动驾驶规划模型的训练方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时能够实现上述用于车辆仿真评测的自动驾驶规划模型的训练方法。
根据本公开的一个或多个实施例,可以获得性能优化的自动驾驶规划模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿波罗智能技术(北京)有限公司,未经阿波罗智能技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111602240.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种羟基钴颗粒的洗涤方法
- 下一篇:作业现场评估方法及装置