[发明专利]一种基于笔划编码的印刷体汉字识别方法有效
申请号: | 201610352919.6 | 申请日: | 2016-05-25 |
公开(公告)号: | CN106022393B | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 尤新革;李政;陈鹏旭 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/62 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 赵伟 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于笔划编码的印刷体汉字识别方法,包括如下步骤:(1)根据汉字笔划对汉字进行编码;根据编码结果建立笔划编码数据库;(2)提取汉字库中各字符图像的LBP特征;(3)使用svm分类器学习汉字的编码,以获得学习器;(4)使用所述学习器对待识别汉字的字符图像进行预判,获取笔划编码;(5)将预判获得的笔划编码与笔划编码数据库里所有的笔划编码进行匹配,匹配成功的笔划编码所对应的汉字即为识别结果;本发明公开的这种印刷体汉字识别方法,基于笔划编码进行汉字识别,使用特征学习的方法空间映射预判,笔划编码特征向量只由25位二进制编码表示,具有识别速度快,识别精度高的特点。 | ||
搜索关键词: | 一种 基于 笔划 编码 印刷体 汉字 识别 方法 | ||
【主权项】:
1.一种基于笔划编码的印刷体汉字识别方法,其特征在于,包括如下步骤:(1)根据汉字笔划对汉字进行编码;根据编码结果建立笔划编码数据库;根据汉字笔划,为每个汉字生成一个唯一对应的25位二进制编码;所述步骤(1)根据汉字笔划对汉字进行编码的方法,具体包括如下子步骤:(1.1)判断汉字图像是否包含横竖撇捺折五个笔划,若是,则将对应的笔划的编码位标记为1;若否,则将对应的笔划的编码位标记为0;由此生成二进制编码的第0‑4位的编码;(1.2)将汉字图像区域均匀划分为2*2的区域;并按照从左到右,从上到下的顺序,依次判断各区域是否包含有横竖撇捺折五个笔划;若是,则将对应的笔划的编码位标记为1;若否,则将对应的笔划的编码位标记为0;获得各区域的5位编码;按照所述各区域在汉字图像里从左到右,从上到下的顺序,将所述各区域的5位编码,依次对应到二进制编码的第5‑9位、第10‑14位、第15‑19位、第20‑24位;并与所述第0‑4位二进制编码一起按照比特位顺序生成25位二进制编码;(2)提取汉字库中各字符图像的LBP特征向量;(3)使用svm分类器学习汉字的编码,获得学习器;具体为:将步骤(2)获得的LBP特征向量,依次输入到25个svm分类器中,与汉字库中对应的笔划编码进行训练学习;使得每一位笔划编码对应的svm分类器形成对应的规则,获得学习器;(4)使用所述学习器对待识别汉字的字符图像进行预判,获取笔划编码;具体包括如下子步骤:(4.1)提取待识别汉字的字符图像的LBP特征向量;(4.2)将步骤(4.1)获得的LBP特征向量输入到学习器中,预判出对应的25位笔划编码;这25位笔划编码即为待识别汉字的字符图像所对应的笔划编码;(5)将预判获得的笔划编码与笔划编码数据库里所有的笔划编码进行匹配,匹配成功的笔划编码所对应的汉字即为识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610352919.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于形状的餐盘自动计价系统
- 下一篇:一种智能家居空气净化装置