[发明专利]基于视频图像的行人意图预测方法、装置及电子设备有效
申请号: | 202210323532.3 | 申请日: | 2022-03-29 |
公开(公告)号: | CN114639125B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 陈禹行;董铮;李雪;范圣印 | 申请(专利权)人: | 北京易航远智科技有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/40;G06V10/77;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京庚致知识产权代理事务所(特殊普通合伙) 11807 | 代理人: | 韩德凯 |
地址: | 100015 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视频 图像 行人 意图 预测 方法 装置 电子设备 | ||
1.一种基于视频图像的行人意图预测方法,其特征在于,包括:
基于实时获取的视频图像数据中包含行人的连续帧,获取包含行人的视频图像序列及行人的观测轨迹序列;基于实时获取的本车速度数据,获取所述连续帧对应的本车速度序列;
基于包含行人的所述视频图像序列,逐帧地提取视频图像特征,并获取所述视频图像序列的连续帧平均特征;基于行人的观测轨迹序列,获取行人的观测轨迹特征;基于所述连续帧对应的本车速度序列,获取本车速度特征;
基于所述连续帧平均特征、所述观测轨迹特征及所述本车速度特征,获取模态融合特征;以及
至少基于所述模态融合特征的语义信息,提取表征行人意图的意图特征;
其中,基于包含行人的所述视频图像序列,逐帧地提取行人的视频图像特征,获取所述视频图像序列的连续帧平均特征,包括:对当前帧的视频图像进行基于2D卷积的特征提取,以获取当前帧的特征图及其对应的特征张量;以及基于当前帧的特征图及当前帧的前一帧的特征图进行时序建模,以更新当前帧的特征图及其对应的特征张量,将更新后的当前帧的特征张量作为当前帧的视频图像特征;如果不存在当前帧的前一帧的特征图,以0值填充出当前帧的前一帧的特征图;对更新后的当前帧的特征图对应的特征张量进行基于全连接层的降维处理,获得当前帧的高维特征张量,并存储至高维特征张量序列之中;当所述高维特征张量序列的长度达到所述连续帧的帧数量值,对所述高维特征张量序列中的高维特征张量取平均,以获取所述连续帧平均特征;
其中,基于所述连续帧平均特征、所述观测轨迹特征及所述本车速度特征,获取模态融合特征,包括:将所述连续帧平均特征、所述观测轨迹特征及所述本车速度特征进行相加,以获得所述模态融合特征。
2.根据权利要求1所述的基于视频图像的行人意图预测方法,其特征在于,还包括:
删除当前帧的前一帧的特征图,保留当前帧的特征图。
3.根据权利要求1所述的基于视频图像的行人意图预测方法,其特征在于,如果所述高维特征张量序列中的最早时刻的序列元素为以0值填充出的特征图,则将其删除之后对所述高维特征张量序列取平均以获取所述连续帧平均特征。
4.根据权利要求1所述的基于视频图像的行人意图预测方法,其特征在于,基于当前帧的特征图及当前帧的前一帧的特征图进行时序建模,以更新当前帧的特征图,包括:
将当前帧的前一帧的特征图的至少一部分通道与当前帧的特征图的相应通道进行关联,进行时序建模;以及
将当前帧的前一帧的所述至少一部分通道的特征图更新至当前帧的特征图的相应位置,以获取更新后的当前帧的特征图。
5.根据权利要求4所述的基于视频图像的行人意图预测方法,其特征在于,所述对当前帧的视频图像进行基于2D卷积的特征提取,通过2D卷积骨干网络进行,所述2D卷积骨干网络包括一个或两个以上的2D卷积层。
6.根据权利要求5所述的基于视频图像的行人意图预测方法,其特征在于,所述2D卷积骨干网络为嵌入时序建模的2D卷积骨干网络,以使得所述2D卷积骨干网络能够执行所述时序建模。
7.根据权利要求6所述的基于视频图像的行人意图预测方法,其特征在于,所述2D卷积骨干网络被设置有限数量的时序建模位置,以平衡所述2D卷积骨干网络的性能与计算量。
8.根据权利要求1所述的基于视频图像的行人意图预测方法,其特征在于,所述基于行人的观测轨迹序列,获取行人的观测轨迹特征,包括:
使用全连接层对所述观测轨迹序列进行增强处理,获取增强后的输入轨迹集合;
将所述增强后的输入轨迹集合在时间维度进行拼接,获得输入轨迹张量;
将所述输入轨迹张量输入至1D卷积网络,提取局部短期特征;以及
将所述局部短期特征输入至多层感知机进行编码处理,以获得全局轨迹特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易航远智科技有限公司,未经北京易航远智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210323532.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序