[发明专利]样本融合方法和装置在审
申请号: | 202010464546.8 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111639698A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 苏英菲 | 申请(专利权)人: | 东软睿驰汽车技术(沈阳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 孔默 |
地址: | 110000 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 融合 方法 装置 | ||
本发明提供了一种样本融合方法和装置,涉及数据处理的技术领域,该方法包括:获取待融合样本;其中,待融合样本中携带原始标签的标签信息;原始标签的标签信息中包含原始标签的标签内容和标签名称;通过预先训练之后的预设神经网络对待融合样本进行数据推理,得到数据推理结果;其中,数据推理结果包含待融合样本的预测标签的标签信息;预测标签的标签信息中包含预测标签的标签内容和标签名称;基于数据推理结果中待融合样本的预测标签的标签信息和原始标签的标签信息对待融合样本进行样本融合处理。本申请缓解了传统样本融合方式效率低下,且准确度差的技术问题。
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种样本融合方法和装置。
背景技术
随着人工智能技术的飞速发展,人工智能技术的应用也越来越广泛,例如,图像识别领域。在人工智能技术中,普遍的技术方案为通过神经网络对数据进行处理,例如,通过神经网络对图像进行识别处理,从而得到识别结果。但是,在采用该神经网络进行图像识别时,需要对该神经网络进行训练,神经网络的训练精度将影响其测试精度。因此,对神经网络的训练就显得尤为重要。在对神经网络进行训练的过程中,需要大量的样本集。例如,可以选用开源数据集来进行网络的训练。但是,但是由于开源数据集种类有限且和所需要的数据集标签种类大多不相同,所以需要对数据集进行有效的融合。在现有技术中,可以手动为开源数据集设置标签,以使该开源数据集与所需要的数据集标签种类相匹配。由于开源数据集的数据量很大,因此,采用手动方式对其进行调整时,效率低下,且准确度差。
发明内容
有鉴于此,本发明的目的在于提供一种样本融合方法和装置,以缓解传统样本融合方式效率低下,且准确度差的技术问题。
第一方面,本发明实施例提供了一种样本融合方法,包括:获取携带原始标签的标签信息的待融合样本;所述原始标签的标签信息中包含原始标签的标签内容和标签名称;通过预先训练的预设神经网络对所述待融合样本进行数据推理,得到数据推理结果;所述数据推理结果包含所述待融合样本的预测标签的标签信息;所述预测标签的标签信息中包含预测标签的标签内容和标签名称;基于所述数据推理结果中所述待融合样本的预测标签的标签信息和所述原始标签的标签信息对所述待融合样本进行样本融合处理。
进一步地,基于所述数据推理结果中所述待融合样本的预测标签的标签信息和所述原始标签的标签信息对所述待融合样本进行样本融合处理包括:基于所述预测标签的标签内容和所述原始标签的标签内容,计算所述预测标签和所述原始标签之间的交并比;基于所述交并比将所述预测标签和所述原始标签进行匹配,得到标签匹配结果;基于所述标签匹配结果对所述待融合样本的标签进行融合处理,以实现对所述待融合样本进行融合处理。
进一步地,基于所述标签匹配结果对所述待融合样本的标签进行融合处理包括:若所述标签匹配结果为所述预测标签中包含与所述原始标签相匹配的第一匹配标签,则基于所述第一匹配标签的标签名称对所述待融合样本的标签进行融合处理。
进一步地,基于所述第一匹配标签的标签名称对所述待融合样本的标签进行融合处理包括:若所述第一匹配标签和第二匹配标签的标签名称相同,则将所述第二匹配标签的标签名称和标签内容,确定为所述第一匹配标签的标签名称和标签内容,其中,所述第二匹配标签为所述原始标签中与所述第一匹配标签相匹配的标签。
进一步地,基于所述第一匹配标签的标签名称对所述待融合样本的标签进行融合处理包括:若所述第一匹配标签和第二匹配标签的标签名称不相同,则判断所述第一匹配标签的标签名称和所述第二匹配标签的标签名称是否为对标标签;所述对标标签表示所述第一匹配标签和所述第二匹配标签所对应的对象相同;若是对标标签,则将所述第一匹配标签的标签内容替换为所述第二匹配标签的标签内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软睿驰汽车技术(沈阳)有限公司,未经东软睿驰汽车技术(沈阳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010464546.8/2.html,转载请声明来源钻瓜专利网。