[发明专利]字符图片分类方法、装置和电子设备有效
申请号: | 201911314877.7 | 申请日: | 2019-12-18 |
公开(公告)号: | CN111091128B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 薛亮;杨陆;张超;王晓宇 | 申请(专利权)人: | 北京数衍科技有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/18 |
代理公司: | 北京超凡宏宇知识产权代理有限公司 11463 | 代理人: | 李飞 |
地址: | 100000 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 图片 分类 方法 装置 电子设备 | ||
1.一种字符图片分类方法,其特征在于,所述方法包括:
对获取的待处理字符图片进行特征提取,得到特征数据;
将所述特征数据与预设样本库中的图片特征进行匹配;
如果所述预设样本库中不存在与所述特征数据相匹配的图片特征,根据所述特征数据与所述图片特征的相似度,确定所述待处理字符图片的分类;
所述预设样本库包括多个图片分类,每个图片分类中包括多个样本图片,每个所述样本图片对应有所述图片特征,所述图片特征包括所述样本图片中每个像素点的特征值;
根据所述特征数据与所述图片特征的相似度,确定所述待处理字符图片的分类的步骤,包括:
根据每个图片分类中的所述图片特征,确定所述预设样本库对应的相似性索引;
根据所述相似性索引,计算所述待处理字符图片与所述图片分类的相似度;
将相似度高的所述图片分类,作为所述待处理字符图片的分类;
所述样本图片中每个像素点对应的特征值为第一数值或者第二数值;
根据每个图片分类中的所述图片特征,确定所述预设样本库对应的相似性索引的步骤,包括:
针对所述预设样本库中的每个所述图片分类,执行下述步骤:针对每个像素点,计算当前图片分类对应的所述样本图片中所述特征值为所述第一数值的个数,以及所述特征值为所述第二数值的个数;根据所述第一数值的个数和所述第二数值的个数,得到每个像素点上所述特征值为所述第一数值的概率,以及所述特征值为第二数值的概率;
将每个所述图片分类对应的每个像素点上所述特征值为所述第一数值的概率,以及所述特征值为第二数值的概率,确定为所述相似性索引。
2.根据权利要求1所述的方法,其特征在于,所述对获取的待处理字符图片进行特征提取,得到特征数据的步骤之前,所述方法还包括:
对获取的所述待处理字符图片进行归一化处理,得到预设像素数量的所述待处理字符图片。
3.根据权利要求1所述的方法,其特征在于,所述对获取的待处理字符图片进行特征提取,得到特征数据的步骤,包括:
对所述待处理字符图片进行二值化处理;
根据二值化处理后的所述待处理字符图片的像素值,确定每个像素点的特征值;
将所有像素点的所述特征值进行逐行拼接,得到所述待处理字符图片的特征数据。
4.根据权利要求1所述的方法,其特征在于,根据所述相似性索引,计算所述待处理字符图片与所述图片分类的相似度的步骤,包括:
根据每个所述图片分类对应的每个像素点上所述特征值为所述第一数值的概率和所述特征值为第二数值的概率,得到所述待处理字符图片在每个所述图片分类上的得分;
所述将相似度高的所述图片分类,作为所述待处理字符图片的分类的步骤,包括:
将所述得分最高的所述图片分类,确定为所述待处理字符图片的分类。
5.根据权利要求4所述的方法,其特征在于,根据每个所述图片分类对应的每个像素点上所述特征值为所述第一数值的概率和所述特征值为第二数值的概率,得到所述待处理字符图片在每个所述图片分类上的得分的步骤,包括:
针对每个所述图片分类,执行下述步骤:根据当前图片分类对应的每个像素点上所述特征值为所述第一数值的概率和所述特征值为第二数值的概率,确定所述待处理字符图片中每个像素点的特征值对应的概率;
将每个像素点对应的所述概率相加,得到所述待处理字符图片在所述当前图片分类上的得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数衍科技有限公司,未经北京数衍科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911314877.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:丛式井集气系统及控制方法
- 下一篇:一种矿用煤炭运输系统