[发明专利]文字识别方法、系统、计算机设备及存储介质有效
申请号: | 202010647824.3 | 申请日: | 2020-07-07 |
公开(公告)号: | CN111783066B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 齐飞;陶蒙华;盛明哲;周桂英;魏梓原 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F21/36 | 分类号: | G06F21/36;G06V30/40 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 罗建民;杜丹丹 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 识别 方法 系统 计算机 设备 存储 介质 | ||
本公开实施例提供一种文字识别方法、系统、计算机设备及存储介质,其中,所述方法包括:接收需求方发送的各幅待识别文字图片;将每幅待识别文字图片分别分发给多个使用验证码系统的第三方系统,以使各个第三方系统将其用户识别出并手动输入的与待识别文字图片对应的可编辑文字发送给验证码系统;按照预设规则对各个第三方系统发送的每幅待识别文字图片对应的可编辑文字进行处理,以得出每幅待识别文字图片分别对应的所有确认文字,将其形成为可编辑文档并发送给需求方。本公开实施例通过验证码系统将待识别文字图片分发给多个第三方系统,利用各个第三方系统用户的认知能力来正确识别待识别文字图片中的模糊文字,提高了纸质文字电子化的准确率。
技术领域
本公开涉及通信技术领域,尤其涉及一种文字识别方法、一种文字识别系统、一种计算机设备以及一种计算机可读存储介质。
背景技术
图书是文化载体的表现形式,它的产生和发展都有一定的基本规律,以电子书为代表的新一代读物的出现和普及,给传统的纸质图书带来巨大的冲击。纸质书在深度阅读、传承文明、出版正规等方面都有优势;而电子书具有方便快捷、易于携带、便宜、内容丰富、环保、人性化等优点,但同时,电子书在阅读习惯限制、阅读设备局限、出版混乱等方面也存在一些缺陷。从多个层面来说,电子书和纸质书能够互补,在现阶段到未来相当长的一段时间内,二者还将共存。
将现存纸质图书电子化是图书留存的方式之一。目前,将纸质图书电子化一般采用如下几种途径:
1、直接将纸质图书扫描成PDF文档,一般不可编辑。
2、用精度稍高的扫描仪对纸质图书进行扫描后,再用文字识别软件识别出来整理成可编辑的文档。
可见,现有技术中将纸质图书识别为可编辑的电子文档一般是通过文字识别软件来实现,但是,当存在纸张褶皱、文字粘污等情况时,文字识别软件就会识别不准确,从而降低用户阅读效果,甚至可能会影响到用户的正常工作。
因此,提出一种结果更为准确的文字识别方案是目前亟待解决的问题。
发明内容
为了至少部分解决现有技术中存在的技术问题而完成了本公开。
根据本公开实施例的一方面,提供一种文字识别方法,应用于验证码系统,所述方法包括:
接收需求方发送的各幅待识别文字图片;
将每幅所述待识别文字图片分别分发给多个使用所述验证码系统的第三方系统,以使各个所述第三方系统将其用户识别出并手动输入的与所述待识别文字图片对应的可编辑文字发送给所述验证码系统;以及,
按照预设规则对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行处理,以得出每幅所述待识别文字图片分别对应的所有确认文字,将其形成为可编辑文档并发送给所述需求方。
根据本公开实施例的另一方面,提供一种文字识别系统,其包括验证码系统,所述验证码系统包括:
接收模块,其设置为接收需求方发送的各幅待识别文字图片;
分发模块,其设置为将每幅所述待识别文字图片分别分发给多个使用所述验证码系统的第三方系统,以使各个所述第三方系统将其用户识别出并手动输入的与所述待识别文字图片对应的可编辑文字发送给所述验证码系统;以及,
处理模块,其设置为按照预设规则对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行处理,以得出每幅所述待识别文字图片分别对应的所有确认文字,将其形成为可编辑文档并发送给所述需求方。
根据本公开实施例的又一方面,提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行前述文字识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010647824.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:白平衡调整方法及其装置
- 下一篇:一种分布式基础词库的构建和同步的方法及装置