[发明专利]一种样本类别标签纠正方法及装置在审
申请号: | 201610388080.1 | 申请日: | 2016-06-01 |
公开(公告)号: | CN107451597A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 金洪波;金欢;潘安群 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙)44285 | 代理人: | 王仲凯 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种样本类别标签纠正方法及装置,本申请基于不同类别间距离越大越好的聚类思想,挑选出距离满足设定距离条件的目标聚类簇对,该目标聚类簇对中存在类别标签错误的样本,因此,根据先验知识得到的第一类别标签的可信度大于第二类别标签的可信度,将目标聚类簇中第二样本的类别标签,从第二类别标签修改为可信度高的第一类别标签,实现了对样本类别标签的纠正,提升了样本类别标签的准确度。 | ||
搜索关键词: | 一种 样本 类别 标签 纠正 方法 装置 | ||
【主权项】:
一种样本类别标签纠正方法,其特征在于,包括:对第一样本集合和第二样本集合分别进行聚类,所述第一样本集合聚类后得到至少一个第一聚类簇,所述第二样本集合聚类后得到至少一个第二聚类簇;其中,所述第一样本集合中各第一样本的类别标签为第一类别标签,所述第二样本集合中各第二样本的类别标签为第二类别标签,所述第一类别标签的可信度大于所述第二类别标签的可信度;确定所述第一聚类簇和所述第二聚类簇间的距离;根据所述第一聚类簇和所述第二聚类簇间的距离,确定满足设定距离条件的目标聚类簇对,目标聚类簇对包含所述至少一个第一聚类簇中的一个第一聚类簇,和所述至少一个第二聚类簇中的一个第二聚类簇;将所述目标聚类簇对中,第二聚类簇中各第二样本的类别标签从所述第二类别标签修改为可信度高的所述第一类别标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610388080.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种网络节点分类方法及装置
- 下一篇:一种基于最小平均距离的动态时间规整方法