[发明专利]一种基于YOLO的目标关键点检测方法在审
申请号: | 202310111977.X | 申请日: | 2023-02-14 |
公开(公告)号: | CN116188768A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 刘少红;马波;祝中科;陈初杰;张建楠;魏豪;倪静;范长军 | 申请(专利权)人: | 中国电子科技集团公司第五十二研究所;中国航空工业集团公司成都飞机设计研究所 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/44;G06V10/774;G06V10/82;G06N3/08;G06N3/0464 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨天娇 |
地址: | 311121 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 yolo 目标 关键 检测 方法 | ||
1.一种基于YOLO的目标关键点检测方法,其特征在于:所述基于YOLO的目标关键点检测方法,包括:
获取样本图片,并在样本图片上标注目标框及所属的关键点,生成标签文件;
在YOLO卷积神经网络中加入与YOLO层并列的关键点检测层,构建得到目标关键点检测网络模型;
将样本图片和标签文件输入至目标关键点检测网络模型并利用整体损失函数进行迭代训练直至收敛;
将待检测图片输入至目标关键点检测网络模型中,目标关键点检测网络模型输出检测到的目标信息及关键点信息。
2.如权利要求1所述的基于YOLO的目标关键点检测方法,其特征在于:所述在样本图片上标注目标框及所属的关键点,包括:
在图片上标注目标框的中心坐标(xb,yb)、目标框的长宽(wb,hb)和类别,再标注每个目标框所属的关键点的坐标(xk,yk)和类别。
3.如权利要求1所述的基于YOLO的目标关键点检测方法,其特征在于:所述关键点检测层的输出通道数为N*3,其中N为关键点个数,每个关键点由横坐标、纵坐标和置信度3个参数表示。
4.如权利要求3所述的基于YOLO的目标关键点检测方法,其特征在于:所述整体损失函数包括目标框损失函数和关键点损失函数;
所述关键点损失函数包括关键点横纵坐标损失、每个关键点之间的距离损失和关键点置信度损失,所述关键点损失函数losskeypoint表示如下:
losskeypoint=lossxy+lossdistance+lossconfidence
其中,
其中,lossxy表示关键点横纵坐标损失;lossdistance表示每个关键点之间的距离损失;lossconfidence表示关键点置信度损失;S×S表示YOLO卷积神经网络把输入图像划分为网络的数量;B表示每个网格预测目标框的个数;表示YOLO层的第i个网格的第j个目标框是否负责预测目标,当为1时,表示负责预测目标,当为0时,表示不负责预测;xkim和ykim分别表示关键点检测层的第i个网格预测的第m个关键点的横纵坐标;和分别表示被关键点检测层的第i个网格预测的第m个关键点的横纵坐标真值;tkcim表示关键点检测层的第i个网格预测的第m个关键点的置信度;表示被关键点检测层的第i个网格预测的第m个关键点置信度的真值;dimn表示关键点检测层的第i个网格的第m个预测关键点与第n个真实关键点的距离;表示关键点检测层的第i个网格的第m个真实关键点与第个n真实关键点的距离。
5.如权利要求1所述的基于YOLO的目标关键点检测方法,其特征在于:所述目标信息包括目标框的中心点坐标、目标框的长宽及目标框的置信度;
所述关键点信息包括关键点坐标及关键点的置信度;
将关键点到目标框中心点所在的格子左上角点的横纵坐标偏移量(tkx,tky)与目标框中心点所在的格子左上角点坐标(Cx,Cy)相加得到关键点坐标(xk,yk)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第五十二研究所;中国航空工业集团公司成都飞机设计研究所,未经中国电子科技集团公司第五十二研究所;中国航空工业集团公司成都飞机设计研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310111977.X/1.html,转载请声明来源钻瓜专利网。