[发明专利]OCR识别结果的修正方法及装置在审

专利信息
申请号: 202310916950.8 申请日: 2023-07-24
公开(公告)号: CN116935414A 公开(公告)日: 2023-10-24
发明(设计)人: 张焱凯 申请(专利权)人: 平安国际融资租赁有限公司
主分类号: G06V30/26 分类号: G06V30/26;G06V30/41
代理公司: 北京中强智尚知识产权代理有限公司 11448 代理人: 刘丽颖
地址: 200000 上海市浦东新区中国(上海)*** 国省代码: 上海;31
权利要求书: 暂无信息 说明书: 暂无信息
摘要: 发明公开了一种OCR识别结果的修正方法及装置,涉及文本识别技术领域、金融科技领域,主要目的在于解决OCR识别结果修正准确率低的问题。主要包括获取待修正处理的初始识别结果、输出所述初始识别结果的目标识别模型信息;从修正策略中识别出与所述目标识别模型信息匹配的目标修正策略,所述目标修正策略为基于所述目标目标识别模型的历史识别结果构建的,所述修正策略包括正则匹配规则、与所述正则匹配规则对应的替换规则;基于所述目标修正策略对所述初始识别结果进行修正,得到所述初始识别结果的修正结果。主要用于修正OCR识别结果。
搜索关键词: ocr 识别 结果 修正 方法 装置
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际融资租赁有限公司,未经平安国际融资租赁有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202310916950.8/,转载请声明来源钻瓜专利网。

同类专利
  • OCR识别结果的修正方法及装置-202310916950.8
  • 张焱凯 - 平安国际融资租赁有限公司
  • 2023-07-24 - 2023-10-24 - G06V30/26
  • 本发明公开了一种OCR识别结果的修正方法及装置,涉及文本识别技术领域、金融科技领域,主要目的在于解决OCR识别结果修正准确率低的问题。主要包括获取待修正处理的初始识别结果、输出所述初始识别结果的目标识别模型信息;从修正策略中识别出与所述目标识别模型信息匹配的目标修正策略,所述目标修正策略为基于所述目标目标识别模型的历史识别结果构建的,所述修正策略包括正则匹配规则、与所述正则匹配规则对应的替换规则;基于所述目标修正策略对所述初始识别结果进行修正,得到所述初始识别结果的修正结果。主要用于修正OCR识别结果。
  • 图像识别数据纠错方法、装置、计算机设备和存储介质-202010382159.X
  • 王斌;康安 - 腾讯科技(深圳)有限公司
  • 2020-05-08 - 2023-10-10 - G06V30/26
  • 本申请涉及一种图像识别数据纠错方法、装置、计算机设备和存储介质。方法包括:获取图像识别数据,提取图像识别数据中各字符的置信度,获取图像识别数据对应的结构化的文本数据,根据文本数据,确定对应的目标知识库,根据结构化的文本数据的对应字段在目标知识库中对应的参考数据,确定文本数据与参考数据的相异字符和编辑距离,根据编辑距离以及相异字符的置信度,进行纠错处理。采用本方法能够应用在人工智能技术领域,实现对图像识别数据进行准确可靠的纠错处理,从而能够提高图像数据识别结果的准确性。
  • 一种用于证照识别的文本纠错方法、装置、设备及介质-202310808006.0
  • 陈其宾;段强;姜凯;李锐 - 山东浪潮科学研究院有限公司
  • 2023-07-03 - 2023-09-19 - G06V30/26
  • 本申请公开了一种用于证照识别的文本纠错方法、装置、设备及介质,涉及证照识别领域,包括:利用预设模型以及目标证照确定目标证照的字符文本和字符置信度;对字符文本进行文本切分,获取若干个子文本,基于子文本中的字符长度确定待纠错子文本;基于预先构建的与证照相关的关键词库判断是否需要对待纠错子文本进行纠错操作,若需要,利用基于字符置信度确定的待纠错子文本中的错字与关键词库中的关键词之间的编辑距离,从关键词库中确定候选关键词;利用候选关键词对待纠错子文本中的错字进行纠错操作,以得到纠错后子文本,对纠错后子文本进行合并操作,以得到纠错后字符文本。由此,本申请能够实现文本识别纠错的精准可控,降低误纠错的概率。
  • 基于人工智能的文件自动归档方法及相关设备-202310411525.3
  • 任健鑫 - 深圳平安综合金融服务有限公司
  • 2023-04-06 - 2023-07-11 - G06V30/26
  • 本申请提出一种基于人工智能的文件自动归档方法、装置、电子设备及存储介质,基于人工智能的文件自动归档方法包括:获取训练完毕的OCR智能识别模型;将待归档文件输入所述OCR智能识别模型,得到所述待归档文件中至少一个属性类别的属性值;将所有属性值输入训练完毕的文件分类模型以获取所述待归档文件的归档类别,并基于所述归档类别对所述待归档文件进行归档;核对多个已归档文件的归档过程并生成错误记录,所述错误记录包括归档类别错误记录和属性值错误记录;基于所述错误记录更新所述OCR智能识别模型和所述文件分类模型,以用于下一个待归档文件的归档过程。本申请能够提高文件自动归档的精度和效率。
  • 光学字符识别辅助方法、装置、计算机设备及存储介质-201910558319.9
  • 郭俊雄;王健宗 - 平安科技(深圳)有限公司
  • 2019-06-26 - 2023-06-30 - G06V30/26
  • 本发明涉及人工智能技术领域,提供了一种光学字符识别辅助方法、装置、计算机设备及存储介质,所述光学字符识别辅助方法包括:获取操作用户发送的待识别的目标图片;使用光学字符识别工具对目标图片中的字符信息进行字符识别,得到识别结果及识别结果对应的可信度;将可信度与预设阈值进行比较;若可信度大于等于预设阈值,则将可信度对应的识别结果确定为目标结果;若可信度小于预设阈值,则对可信度对应的识别结果进行预处理,以确定目标结果;将目标结果作为光学字符识别结果发送给操作用户。本发明的技术方案实现对光学字符识别结果进行辅助校验,进一步提高光学字符识别的准确性,保证操作用户的工作效率。
  • 一种基于特征增强金字塔网络的场景文本检测方法-202210742861.1
  • 明悦;孙娟娟;邓茜;钟倩文 - 北京邮电大学
  • 2022-06-28 - 2023-06-09 - G06V30/26
  • 本发明提供了一种基于特征增强金字塔网络的场景文本检测方法。该方法包括:将待检测图像输入到特征增强金字塔网络,特征增强金字塔网络对待检测图像经过不同的卷积阶段生成不同尺度的特征图,将不同尺度的特征图进行拼接得到富含尺度信息的高级特征图;将高级特征图输入到通道注意力机制模块中,输出经过权重选择的各个通道权重不同的特征图;将经过权重选择的各个通道权重不同的特征图输入到后处理模块,后处理模块输出待检测图像的文本检测结果。本发明使用Res2Net与特征增强金字塔网络作为骨架网络,在特征金字塔网络的基础上新增下采样路径,只对邻近层进行采样后融合,使用通道注意力机制增强文本特征的权重,使算法检测到更加精确的文本边界。
  • 表格数据校验方法及装置-202211697796.1
  • 王文欣;康健朔;马宇;王建军;蔡婷 - 中国电信股份有限公司
  • 2022-12-28 - 2023-06-02 - G06V30/26
  • 本申请公开了一种表格数据校验方法及装置。其中,该方法包括:获取表格扫描图像,并识别表格扫描图像中的表格数据,其中,表格数据中包括多个行数据,每个行数据中包括多个字段和与每个字段对应的值;获取校验配置信息,其中,校验配置信息中至少包括多个待校验列的标识信息;对于每个行数据,对行数据中与校验配置信息对应的多个目标字段的值进行校验,其中,仅在多个目标字段的值均通过校验时,确定行数据通过校验,若存在任一目标字段的值未通过校验,则确定行数据未通过校验。本申请解决了相关技术中在将纸质表格整理为电子表格时,表格数据校验效率较低的技术问题。
  • 一种OCR识别字体的还原方法、装置及存储介质-202211470472.4
  • 邓彪;杜倩龙 - 中科凡语(武汉)科技有限公司
  • 2022-11-22 - 2023-04-25 - G06V30/26
  • 本发明公开一种OCR识别字体的还原方法、装置及存储介质,属于文字识别技术领域。该OCR识别字体的还原方法,包括以下步骤:对待处理的内容进行OCR识别得到识别结果;将识别结果进行过滤,从中抽取出字符内容、图片的页面大小信息和字符的坐标信息;将图片的页面大小信息进行空间转换获得第三转换系数,字符的坐标信息根据第三转换系数进行空间转换得到所有字符在纸张中的坐标值;利用转换后的字符的坐标值对字符的高度进行计算,之后将字符的高度映射到不同的字体大小中,从而得到所有字符的字体大小;将所有文本内容按照字符的字体大小写入到文本中。该还原方法能够使目标文档中文本内容的排版与原始文档保持一致。
  • 一种基于融合字形信息的服药单识别结果纠错方法-202110015403.3
  • 唐万梅;梁燕;李锦;周东亮;陈峻嵩 - 重庆邮电大学
  • 2021-01-04 - 2023-03-14 - G06V30/26
  • 本发明涉及一种基于融合字形信息的服药单识别结果纠错方法,属于文字识别领域,包括构建一个标准药品词库,将词库中的每个药品信息作为一个节点存储在BK树内存结构中,设置搜索距离阈值n,通过阈值搜索规则减少数据搜索规模,得到结果候选集;将文字识别后待纠错字符串与结果候选集中的字符串进行相似度匹配,在原有的相似度匹配方案基础上改进传统的编辑距离公式,保持插入和删除操作代价不变,降低替换字符代价;在进行替换字符操作时,考虑字符的五笔编码、四角码和笔画三个字形相关信息,增大字符串近似匹配精度;将相似度最高的字符串作为纠错结果进行替换。本发明通过对服药单识别结果纠错,提高服药单识别准确率。
  • 变电站面板文字识别方法、系统、设备及存储介质-202211097849.6
  • 陈中;李冰融;谭林林;娄骐 - 东南大学
  • 2022-09-08 - 2023-02-24 - G06V30/26
  • 本发明提供变电站面板文字识别方法、系统、设备及存储介质,涉及电网巡检维护领域。该变电站面板文字识别方法,包括获取原始图片,对原始图片进行预处理;对预处理后的图片进行文字识别处理;根据提供的仪器面板信息照片构建变电站面板文字信息数据库;根据变电站面板文字信息数据库对文字识别处理结果进行纠正,得到最终识别结果;结合面板文本信息数据库对CNOCR识别的文字信息进行优化,实现了对于面板文字信息的高准确率识别,提升了识别结果的可靠性;使用轻量化的文字OCR进行识别,在高准确率的同时有较快的识别速度与较小的数据体积。
  • 笔记内容的更正方法、装置、设备-202211230423.3
  • 赵怀锋 - 深圳市沃特沃德信息有限公司
  • 2022-09-30 - 2023-01-17 - G06V30/26
  • 本申请涉及人工智能领域,揭示了一种笔记内容的更正方法、装置、设备。本申请的方案中,终端获取用户书写的内容,当用户书写完成后,再将获取到用户书写的内容进行内容识别,再将识别到内容进行检查是否存在预设标记,若终端识别到内容存在预设标记,则对预设标记的位置进行识别,并将识别到的内容进行相应位置的提醒,以提醒用户相应位置的内容存在需要更正,用户将根据提醒的内容进行修改更正,或者用户控制终端执行指定的操作,从而以解决对全篇笔记的检查,时间久、判断难度大、中标率不高的问题。
  • 光学字符识别方法及系统-202110541402.2
  • 乐建建 - 中移雄安信息通信科技有限公司;中移系统集成有限公司;中国移动通信集团有限公司
  • 2021-05-18 - 2022-11-25 - G06V30/26
  • 本发明提供一种光学字符识别方法及系统,包括:利用检测纠错混合模型与待训练的文本识别模型一起预训练,以获取训练好的文本识别模型;将待识别的文本图像输入至所述训练好的文本识别模型,以获取由所述文本识别模型输出的文本识别结果。本发明考虑到模型实际运算过程中的性能问题,检测纠错混合模型在实际运算阶段不参与计算,仅在对文本识别模型进行预训练的过程中,引入检测纠错混合模型参与预训练,以改进文本识别模型的文字识别结果,进而修正文本识别模型的模型参数,以提高文本识别模型的整体识别性能,解决了现有技术方案中利用网络模型进行文本识别不准确的缺陷,在不影响文本识别模型的识别速度的基础上,有效地提高了其识别准确度。
  • 表格图片校正方法、装置、电子设备及存储介质-202210354601.7
  • 陈嘉 - 北京智慧荣升科技有限公司
  • 2022-04-06 - 2022-07-01 - G06V30/26
  • 本发明实施例公开了一种表格图片校正方法、装置、设备及介质。其中,该方法包括:对原有表格图片中表格边缘进行增强,得到目标表格图片;对所述目标表格图片进行边缘检测识别,得到所述目标表格图片的目标表格边缘识别结果;依据所述目标表格边缘识别结果,对所述原有表格图片进行校正以使所述原有表格图片中表格形状转换为预设形状。本技术方案,能够有效的解决对表格图片进行OCR文字识别时易出现误识别的问题,提高表格数据的统计准确性。
  • 一种对字符识别结果进行自动纠错的方法-202210257337.5
  • 周博文;李康军;冯石佳;龚权华 - 湖南睿图智能科技有限公司
  • 2022-03-16 - 2022-05-13 - G06V30/26
  • 本发明公开了一种对字符识别结果进行自动纠错的方法,包括获取待处理图像中的预测字符信息,以及同一场景下的标准字符信息;在预测字符信息和标准字符信息中寻找候选公共子序列;遍历候选公共子序列,判断候选公共子序列是否是一个合理的子列,若是,则结束遍历;使用公共子序列对预测字符信息进行滤除和填充得到处理后的预测字符信息;根据处理后的预测字符信息,对预测字符信息进行纠正,输出正确的字符信息。适用于对OCR检测识别结果进行后处理,能有效解决字符误检测,字符漏检测,字符误识别导致结果错误的问题。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top