[发明专利]文本识别方法、装置、设备、存储介质和程序产品在审

申请号：	202310876780.5	申请日：	2023-07-17
公开（公告）号：	CN116935400A	公开（公告）日：	2023-10-24
发明（设计）人：	张文彬;刘志华;李韶英;贺晓东;何晓明	申请（专利权）人：	中国电信股份有限公司技术创新中心;中国电信股份有限公司
主分类号：	G06V30/16	分类号：	G06V30/16;G06V30/18;G06V30/19
代理公司：	华进联合专利商标代理有限公司 44224	代理人：	樊倩
地址：	102209 北京市昌平区北七家镇未来科技城***	国省代码：	北京;11
权利要求书：	暂无信息	说明书：	暂无信息
摘要：	本申请涉及一种文本识别方法和装置。所述方法包括：通过获取包含有待识别文本的文本图像，并将文本图像输入至文本识别模型，通过文本识别模型获取文本图像中包围待识别文本的第一基准像素点的第一像素点位置；根据第一像素点位置，获取对第一基准像素点进行校正后的第二基准像素点的第二像素点位置；根据第一像素点位置以及第二像素点位置，获取对文本图像进行校正后的校正图像中，各校正像素点的校正像素点位置，以及文本图像对应的校正参数；根据校正参数，确定各校正像素点的像素值，即得到校正图像；获取校正图像中待识别文本对应的文本特征，并基于文本特征，得到待识别文本的识别结果。采用本方法能够准确识别工业文本图像中文本内容。
搜索关键词：	文本识别方法装置设备存储介质程序产品
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司技术创新中心;中国电信股份有限公司，未经中国电信股份有限公司技术创新中心;中国电信股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202310876780.5/，转载请声明来源钻瓜专利网。

上一篇：信息展示方法、装置、设备及存储介质
下一篇：基于InSAR技术的多因子滑坡预警监测方法

同类专利

一种文本识别方法及相关装置-202310814591.5
发明人：郑岩 -专利权人：腾讯科技（深圳）有限公司
申请日： 2023-07-04 - 公布日： 2023-10-27 - 主分类号： G06V30/16
摘要：本申请实施例公开了一种文本识别方法及装置，该方法包括：在利用文本识别模型对待检测图像进行文本识别处理前，基于待检测图像中多个文本区域各自对应的文本图像进行图像拼接处理，得到参考图像，进而，利用文本识别模型对参考图像进行处理，得到参考图像中的文本图像对应的文本识别结果，最终，利用待检测图像中各个文本图像各自对应的文本结果，确定待检测图像对应的目标文本识别结果。其中，通过将多个文本图像拼接起来作为文本识别模型的处理对象，可以增加文本识别模型每次工作时所需处理的有效信息，使得文本识别模型每次工作时可以识别尽可能多的文本，从而减少性能损失，提高识别效率。

场景残缺文本识别方法、装置、存储介质及设备-202310949389.3
发明人：薛家亮;张立臣 -专利权人：广东工业大学
申请日： 2023-07-28 - 公布日： 2023-10-24 - 主分类号： G06V30/16
摘要：本申请提供场景残缺文本识别方法、装置、存储介质及设备，包括：获取待识别图片；判断所述待识别图片是否包含残缺文本；若所述待识别图片包含残缺文本，对所述待识别图片进行文本修复，直至所述待识别图片不包含残缺文本，输出修复图片；识别修复图片的文本信息，并将所述文本信息转换为语音信息播报。上述方法对在实际场景中受到不同程度损坏的文本信息进行识别恢复，帮助盲人或视障者准确的获取各个实际场景的文本信息。

文本识别方法、装置、设备、存储介质和程序产品-202310876780.5
发明人：张文彬;刘志华;李韶英;贺晓东;何晓明 -专利权人：中国电信股份有限公司技术创新中心;中国电信股份有限公司
申请日： 2023-07-17 - 公布日： 2023-10-24 - 主分类号： G06V30/16
摘要：本申请涉及一种文本识别方法和装置。所述方法包括：通过获取包含有待识别文本的文本图像，并将文本图像输入至文本识别模型，通过文本识别模型获取文本图像中包围待识别文本的第一基准像素点的第一像素点位置；根据第一像素点位置，获取对第一基准像素点进行校正后的第二基准像素点的第二像素点位置；根据第一像素点位置以及第二像素点位置，获取对文本图像进行校正后的校正图像中，各校正像素点的校正像素点位置，以及文本图像对应的校正参数；根据校正参数，确定各校正像素点的像素值，即得到校正图像；获取校正图像中待识别文本对应的文本特征，并基于文本特征，得到待识别文本的识别结果。采用本方法能够准确识别工业文本图像中文本内容。

一种用于水溶肥料包装的视觉检测方法-202310985335.2
发明人：李秉政 -专利权人：山东禾之源现代农业发展有限公司
申请日： 2023-08-07 - 公布日： 2023-10-24 - 主分类号： G06V30/16
摘要：本发明涉及图像数据处理技术领域，具体涉及一种用于水溶肥料包装的视觉检测方法。该方法获取水溶肥料包装图像的灰度图像；根据灰度图像中每个像素点的滑动窗口区域中角点和直线交点的分布，获取结构复杂因子；确定滑动窗口区域中的目标直线；根据目标直线和结构复杂因子，获取滑动窗口区域中的笔划密集指数；根据像素点所在行的角点分布和笔划密集指数，获取结构丰富度；根据结构丰富度，获取每个超像素块的区域丰富度；确定每个超像素块中进行伽马变换的伽马因子，获取灰度图像的增强图像。本发明获取超像素块对应的伽马因子，使得文字像素点的增强效果更好，对水溶肥料包装的视觉检测更准确，进而对水溶肥料包装的质量进行准确的评价。

一种基于扭曲矫正的文本图像预处理方法-202310841263.4
发明人：李雪;杨彤;陈其宾;姜凯 -专利权人：山东浪潮科学研究院有限公司
申请日： 2023-07-11 - 公布日： 2023-10-20 - 主分类号： G06V30/16
摘要：本发明涉及文本图像预处理技术领域，具体为一种基于扭曲矫正的文本图像预处理方法，包括以下步骤：输入图像获取：获取待处理的图像；图像预处理：对输入图像进行预处理，包括降噪、灰度化、二值化操作，以减少背景干扰并突出文本信息；采用基于边缘检测和连通域分析的方法，对图像中的文本区域进行定位；有益效果为：本发明提出的基于扭曲矫正的文本图像预处理方法，对图像中的文本区域进行定位和裁剪，保留文字主体区域，然后利用卷积神经网络对扭曲图像进行校正；在复杂背景和多种字体样式下进行高效、准确的文本检测，通过图像预处理步骤，减少背景干扰并突出文本信息，提高文本检测的准确性。

文档图像矫正方法、电子设备及存储介质-202310709715.3
发明人：程自华;孙斌;宓振鹏;刘石磊 -专利权人：荣耀终端有限公司
申请日： 2023-06-15 - 公布日： 2023-10-20 - 主分类号： G06V30/16
摘要：本申请实施例提供一种文档图像矫正方法、电子设备及存储介质，应用于电子技术领域。该方法获取扭曲文档图像，采用文档矫正模型对扭曲文档图像进行处理，得到扭曲文档图像对应的多个第一控制点的坐标位置，根据多个第一控制点的坐标位置，对扭曲文档图像的边缘进行补充，得到第一文档图像，对第一文档图像进行采样，得到第二文档图像。因此，本申请实施例针对边缘不完整的扭曲文档图像，对扭曲文档图像的边缘进行补充，并对边缘补充后的第一文档图像进行采样，以实现文档矫正，因此，本申请实施例可以改善矫正后的文档图像的边缘处的文字信息丢失的情况，从而提升矫正后的文档图像的质量。

一种用于标识字符识别的图像预处理方法及系统-202310988487.8
发明人：陈博尧;沈泽霖;陆小锋;樊一鸣 -专利权人：上海大学
申请日： 2023-08-07 - 公布日： 2023-10-10 - 主分类号： G06V30/16
摘要：本发明公开一种用于标识字符识别的图像预处理方法及系统。本发明在HSV空间对V分量进行图像增强，对S分量进行线性拉伸，使处理后的RGB图像减少了颜色失真，图像细节、纹理、边缘清晰，有效抑制了干扰噪声，改善了整个图像质量。

一种字符识别方法、装置及电子设备-202310722371.X
发明人：朱松;尹昌顺;刘敏 -专利权人：杭州海康机器人股份有限公司
申请日： 2023-06-16 - 公布日： 2023-09-29 - 主分类号： G06V30/16
摘要：本申请实施例提供了一种字符识别方法、装置及电子设备，涉及图像处理技术领域。获取待识别图像；其中，待识别图像是图像采集设备利用具有多个采集角度的预设镜头采集的关于待识别字符所在曲面的图像；在待识别图像中确定关于待识别字符的目标区域，并利用预设展平算法，展平目标区域；对展平后的目标区域中的各个字符进行定位识别，得到待识别字符的识别结果。应用本申请实施例提供的方案，可以识别曲面上的字符。

监控视频下模糊车牌的去模糊识别系统及去模糊识别方法-201910417533.2
发明人：马苏欣;王家希;戴雅淑;陈杰;邵文泽 -专利权人：南京邮电大学
申请日： 2019-05-20 - 公布日： 2023-09-22 - 主分类号： G06V30/16
摘要：本发明公开了一种监控视频下模糊车牌的去模糊识别系统及去模糊识别方法，系统包括：去模糊处理模块和图像识别模块，所述去模糊处理模块基于神经网络对模糊图像进行去模糊处理，并输出复原图像；所述图像识别模块通过调用API识别接口，对复原图像进行识别，输出车牌文本信息。方法包括如下步骤：1、构建图像去模糊模型；2、针对城市道路监控视频中由于车辆高速行驶造成的车牌模糊进行去模糊处理；3、对图像去模糊模型输出的复原图像进行批量识别，输出文本识别结果。本发明克服了现有深度学习中图片去模糊与识别系统的不足，训练时间少，识别率高，通过本系统处理车牌图片后应用于道路交通管理。

一种基于seq2seq语言模型的文字识别方法及系统-202310131709.4
发明人：王德军;于龙洋;孟博;彭阳;朱建豪;李舒蕾 -专利权人：中南民族大学;武汉空天软件技术有限公司
申请日： 2023-02-16 - 公布日： 2023-09-19 - 主分类号： G06V30/16
摘要：本发明公开了一种基于seq2seq语言模型的文字识别方法及系统，其方法步骤：获取将要识别的含有文字信息的图片；对输入的图片进行图像分割、图像二值化和角度矫正预处理，去除图片中的干扰信息；将图片输入到融合文字识别模型和seq2seq语言模型的文字识别方法中，得到图片中的文字信息。本发明有益效果：本发明通过使用CRNN文字识别模型和seq2seq语言模型相融合，获取了文字的视觉特征和语言特征，并将得到的特征和结果进行融合迭代，从而逐步获取更具有鲁棒性的识别结果，提高了文字识别尤其是在部分文字被遮挡时的正确率。

基于示值结构先验特征的圆形指针式仪表变形校正方法-202310735028.9
发明人：白福忠;单文轩;徐永祥;高晓娟;梅秀庄 -专利权人：内蒙古工业大学
申请日： 2023-06-20 - 公布日： 2023-09-08 - 主分类号： G06V30/16
摘要：本发明公开了一种基于示值结构先验特征的圆形指针式仪表变形校正方法，包括以下步骤：S1)将拍摄的待校正圆形指针式仪表图像输入至预置特征点检测模型；S2)获得所述待校正仪表图像的特征点(即长刻度线的外端点)坐标,本发明所检测的特征点应等于或多于四个；S3)基于待校正仪表的示值结构先验特征，构造正视角标准仪表图像中的特征点坐标；S4)将特征点对坐标值代入透视变换模型，计算透视变换矩阵；S5)利用透视变换矩阵和灰度插值对所述待校正仪表图像进行变形校正；本发明以圆形指针式仪表示值结构先验特征为基础，选用长刻度线外端点作为特征点，结果客观准确，理论依据充分；本发明方法适用于多种类型圆形指针式仪表图像，方法普适性好。

图像文字识别方法、设备及存储介质-202310280106.0
发明人：叶方义 -专利权人：上海中通吉网络技术有限公司
申请日： 2023-03-21 - 公布日： 2023-09-05 - 主分类号： G06V30/16
摘要：本发明公开了一种图像文字识别方法、设备及存储介质，涉及图像识别技术领域，包括获取待处理图像，利用nvjpeg库对所述待处理图像进行解码，得到解码图像，利用量化后的识别模型对所述解码图像进行文字识别，以获得文字信息，利用图像处理器完成图像的解码和文字识别，数据仅在显存和显存之间传输，相当于现有技术而言，不仅缩短了数据传输时间，且加快了文字识别的运算速度，解决了OCR文字识别效率低的技术问题，实现了高效的图像文字识别。

书法作品汉字的识别检索方法、装置及存储介质-202310534872.5
发明人：陈映庭;陈勇平;郑倩萍 -专利权人：广州逅艺文化科技有限公司
申请日： 2023-05-11 - 公布日： 2023-09-05 - 主分类号： G06V30/16
摘要：本发明公开了一种书法作品汉字的识别检索方法、装置及存储介质，包括：对待处理的书法作品图像进行预处理，输入至预训练好的书法字对象识别模型，框选出所述书法作品图像中的各个字体区域，进行裁剪和归一化处理，得到单字体图像；将所述单字体图像输入至预训练好的多维多流书法字识别模型，得到每一单字体图像对应的单字向量数据；将所述单字向量数据与预设的书法字向量数据库进行比对，获取向量数据索引；根据所述向量数据索引从预设资源库中获取字体信息。本发明有效地解决了现有技术在进行汉字书法识别时存在的功能单一、效率低、字体及内容不全面的问题。

用于进行预定处理的设备及其控制方法和存储介质-201810960050.2
发明人：松本義高 -专利权人：佳能株式会社
申请日： 2018-08-22 - 公布日： 2023-08-29 - 主分类号： G06V30/16
摘要：本发明提供一种用于进行预定处理的设备及其控制方法和存储介质。在使用对扫描图像进行OCR处理所获得的字符串来设置文件名等的情形下，可以根据要扫描的字符串来设置适当的条件，以提高字符识别率。用于对扫描文档所获得的扫描图像进行预定处理的设备包括：显示控制单元，用于显示用于进行预定处理的UI画面，该UI画面以能够选择的方式向用户显示扫描图像中的被假定为一个连续字符串的字符区域；以及设置单元，用于基于用户经由UI画面选择的字符区域的选择顺序和用于预定处理的补充信息的格式来确定用于OCR处理的条件，使用所确定的用于OCR处理的条件来对所选择的字符区域进行OCR处理，并使用在OCR处理中提取的字符串来设置用于预定处理的补充信息。

一种识别指示牌的方法、装置、设备、介质及产品-202310678608.9
发明人：刘巍;孔旭旭;肖旭;李翔;张建平 -专利权人：北京四维图新科技股份有限公司
申请日： 2023-06-08 - 公布日： 2023-08-08 - 主分类号： G06V30/16
摘要：本说明书实施例公开了一种识别指示牌的方法、装置、设备、介质及产品。该方案可以包括：获取含有待识别指示牌的第一图像；利用基于角点矫正的矫正算法，对所述第一图像进行矫正，得到第一矫正图像；利用第一字符识别算法对所述第一矫正图像进行识别，得到所述第一矫正图像的第一识别结果；采用深度学习样板插值矫正模型，对所述第一图像进行矫正，得到第二矫正图像；利用第二字符识别算法对所述第二矫正图像进行识别，得到所述第二矫正图像的第二识别结果；基于所述第一识别结果和所述第二识别结果，得到所述第一图像的最终识别结果。

文档图像矫正方法、装置、电子设备及可读介质-202310224700.8
发明人：陶提 -专利权人：上海太美数字科技有限公司
申请日： 2023-03-08 - 公布日： 2023-07-21 - 主分类号： G06V30/16
摘要：本发明公开了一种文档图像矫正方法、装置、电子设备及可读介质，该文档图像矫正方法包括：对待矫正文档图像进行文本检测和文本识别，获取第一文本检测结果和第一文本识别结果，计算第一文本识别结果的第一置信度；当第一置信度小于或等于第一阈值时，基于第一文本检测结果和第一文本识别结果，确定待矫正文档图像中文本字条的排布方向，并基于所述排布方向旋转待矫正文档图像；对旋转后的待矫正文档图像进行文本识别，获取第二文本识别结果，计算第二文本识别结果的第二置信度，基于第一置信度和第二置信度，矫正待矫正文档图像。本发明提供的文档图像矫正方法，能够将待矫正文档图像矫正至其标准方向，以提高文档图像的OCR识别准确率。

一种扫描文档矫正方法、系统、装置和存储介质-202310239525.X
发明人：金连文;张家鑫;张沛荣;陈邦栋 -专利权人：华南理工大学
申请日： 2023-03-13 - 公布日： 2023-07-18 - 主分类号： G06V30/16
摘要：本发明公开了一种扫描文档矫正方法、系统、装置和存储介质，其中方法包括：获取文档图像，对所述文档图像进行分割处理，获得分割掩膜图；对所述分割掩膜图进行边界线段检测，获得多条边界线段；对所述边界线段进行识别，以获得所述边界线段的类型；根据识别后的所述边界线段，为文档的四个边界分别选取一条特征线段；根据所述特征线段进行仿射变换矫正，获得矫正后的文档图像。本发明通过对线段进行处理，可以处理多种边界、角点缺失的情况，也可以处理角点处含有折叠的文档，具有较好的适用性；另外，本发明仅利用仿射变换进行矫正，不会引入额外的形变。本发明可广泛应用于文档图像处理技术领域。

自监督的褶皱文档图像矫正方法、系统、设备与存储介质-202310330328.9
发明人：吴枫;李厚强;周文罡;刘绍锴;冯浩 -专利权人：中国科学技术大学
申请日： 2023-03-30 - 公布日： 2023-07-18 - 主分类号： G06V30/16
摘要：本发明公开了一种自监督的褶皱文档图像矫正方法、系统、设备与存储介质，它们是对应的方案，方案可以充分高效地利用大规模无标注的褶皱文档图像进行预训练，进而在微调阶段提取更有效的文档形变表征，提升对形变文档图像的矫正效果。并且，适用于各种不同语种以及文档布局的文档图像，无需针对文本行等特征进行专门的提取和训练，同时可通过增加更多的无标注数据来进行预训练进而提升矫正效果，提高了方案的可扩展性。此外，相比于以往基于单一神经网络模型的技术，本发明经过两阶段的训练后，能够在实现相同的文档图像矫正效果的同时减少计算开销，因此，可被搭载于智能手机等其他带有相机的智能设备中，从而方便在更广泛的应用场景中推广使用。

一种针对表格签名的计数分析方法-202310423527.4
发明人：陈水军;李响;马文捷;荣芬;易善文;帅敏 -专利权人：国网江苏省电力有限公司;江苏电力信息技术有限公司
申请日： 2023-04-19 - 公布日： 2023-07-18 - 主分类号： G06V30/16
摘要：本发明公开了一种针对表格签名的计数分析方法，包括：通过深度学习方法对图像进行超分辨，提升识别准确率；由于图像在拍摄过程中存在阴影，通过计算机视觉形态学方法来去除图像阴影；对于倾斜的图像，通过hough变化找出表格线条，并计算和水平方向的角度，进行旋转校正；签到表一般具有表格形式，因此通过深度学习实现表格结构识别；当表格存在多列时，利用OCR方法，找出签字、姓名等关键字对应的列，通过深度学习方法去除噪声点干扰，准确识别框架结构点。本发明利用深度学习OCR技术和图像处理技术，对图像进行校正、去噪、超分辨的方法进行预处理，并最后通过表格识别和阈值处理来找到签到的人数，具有较高的准确率和较高的实用性。

扭曲文本行的方向矫正方法、装置、介质及设备-202211637317.7
发明人：王家霈 -专利权人：中国电信股份有限公司
申请日： 2022-12-14 - 公布日： 2023-07-14 - 主分类号： G06V30/16
摘要：本申请的实施例揭示了一种扭曲文本行的方向矫正方法、装置、介质及设备。该方法通过获取待处理图像；根据待处理图像中的扭曲文本行对应的扭曲文本曲线，获取位于扭曲文本曲线上的参考点，生成参考点集合；根据参考点集合中的参考点的坐标，得到扭曲文本行对应的目标圆曲线，以通过更加标准规范的圆曲线表征扭曲文本曲线的分布特征，方便后续的计算，提高方向矫正的准确度；然后根据目标圆曲线和预设的基准方向，计算扭曲文本行中目标字符的旋转角度，对目标字符按旋转角度进行旋转处理，得到呈正方向分布的扭曲文本行，方便用户阅读，且在后续对扭曲文本行进行文本识别时，提高文本识别的精度。

一种图像矫正方法、装置、电子设备及可读存储介质-202211160393.3
发明人：刘峰;刘洋;周进洋;刘渊;张科;杨明;孙佩豪;黄宇;段焱丰;汪晗韬;符颖 -专利权人：中电金信软件有限公司
申请日： 2022-09-22 - 公布日： 2023-06-27 - 主分类号： G06V30/16
摘要：本申请提供了一种图像矫正方法、装置、电子设备及可读存储介质，对获取到的原始文档图像进行图像预处理，得到待矫正文档图像；利用所述待矫正文档图像所属版式类别对应的区域采样窗口，从所述待矫正文档图像中提取出待矫正区域；针对于每个待矫正区域，利用所述版式类别对应的预先训练好的畸变矫正模型，通过确定该待矫正区域的畸变系数，对该待矫正区域进行畸变矫正，得到矫正后的目标矫正区域；拼接各个目标矫正区域，得到矫正后的目标文档图像。这样，可以根据待矫正文档图像的版式类别，利用该版式类别对应的畸变矫正模型实现对该待矫正文档图像的畸变矫正，进而，可以提高矫正结果的准确性。

文档图像矫正方法、装置、电子设备及可读介质-202310220642.1
发明人：陶提 -专利权人：上海太美数字科技有限公司
申请日： 2023-03-08 - 公布日： 2023-06-23 - 主分类号： G06V30/16
摘要：本发明公开了一种文档图像矫正方法、装置、电子设备及可读介质，该文档图像矫正方法，包括：获取待矫正文档图像相对于其标准方向，分别偏置0°、90°、180°和270°的偏置概率；当偏置概率中的最大概率大于第一阈值时，基于最大概率对应的偏置角度矫正待矫正文档图像至标准方向；当偏置概率中的最大概率小于或等于第一阈值时，对待矫正文档图像进行文本检测和文本识别，判断文本识别结果是否具有语义信息，并基于判断结果矫正待矫正文档图像至标准方向。本发明提供的文档图像矫正方法及装置，基于待矫正文档图像的偏置概率对待矫正文档图像进行矫正，能够将待矫正文档图像矫正至其标准方向，以提高文档图像的OCR识别准确率。

文本预测方法、装置、计算机可读存储介质及电子设备-202310249616.1
发明人：卢健 -专利权人：中国工商银行股份有限公司
申请日： 2023-03-10 - 公布日： 2023-06-23 - 主分类号： G06V30/16
摘要：本发明公开了一种文本预测方法、装置、计算机可读存储介质及电子设备。涉及人工智能领域，该方法包括：获取目标图像，其中，目标图像包括多个字符；将目标图像输入至目标预测模型中，通过目标预测模型对目标图像中的多个字符进行预测，得到目标文字序列，其中，目标预测模型用于分步预测多个字符，在每一步预测中存在多个初始标识序列，根据初始标识序列的序列长度和目标概率确定初始标识序列的目标评分，根据目标评分从多个初始标识序列中确定目标文字序列，其中，目标评分与序列长度正相关。本发明解决了相关技术中利用束搜索算法进行文本预测时存在的预测准确率低的技术问题。

图像处理的方法、文本识别方法及装置-202210182337.3
发明人：刘经拓 -专利权人：北京百度网讯科技有限公司
申请日： 2022-02-25 - 公布日： 2023-06-20 - 主分类号： G06V30/16
摘要：本公开提供了一种图像处理的方法、文本识别方法及装置，涉及人工智能技术领域，具体为深度学习、计算机视觉技术领域。包括：对获取到的样本图像进行预处理，得到样本图像中字段分别对应的位置信息、图像块、以及文本内容，根据字段分别对应的位置信息、图像块、以及文本内容，对字段的位置信息进行掩码预测，得到预测结果，根据预测结果训练得到文本识别模型，文本识别模型用于对待识别图像进行文本识别，通过融合样本图像的多个维度的内容进行“预训练”，使得“预训练”具有较高的全面性和可靠性，当基于预测结果生成文本识别模型时，使得文本识别模型具有较高的准确性，进而当基于文本识别模型进行文本识别时，提高文本识别的可靠性。

一种文本矫正方法、电子设备及存储介质-202211075834.X
发明人：吴勇涛;吴士泓;王瑞平;王志刚 -专利权人：远光软件股份有限公司
申请日： 2022-09-01 - 公布日： 2023-06-06 - 主分类号： G06V30/16
摘要：本申请公开了一种文本矫正方法、电子设备及存储介质。该方法包括检测待处理图像中的文本区域，并检测文本区域的区域形状；其中，文本区域由第一边界控制点顺序连接而描绘得到；响应于文本区域的区域形状表示文本区域为弯曲区域，基于弯曲区域的区域宽度，得到参考弧长，并基于参考弧长，在弯曲区域的弧形边界上确定第二边界控制点；其中，参考弧长不大于区域宽度，参考边界基于第一边界控制点拟合得到；基于第二边界控制点进行文本分割及矫正，得到弯曲区域矫正后的文本图像。上述方案，能够在待识别图像中存在弯曲文本的场景下，提高文本矫正的准确度。

一种书法字骨架矫正方法、系统及存储介质-202310139297.9
发明人：徐占洋;秦飞扬;熊宁阳;王晶弘;杨盛凯;李丁宇;马彪;徐益鸣;张家瑞;汤正博;陆斌;林巍 -专利权人：南京信息工程大学;江苏少儿春互联教育科技有限公司
申请日： 2023-02-21 - 公布日： 2023-06-06 - 主分类号： G06V30/16
摘要：本发明公开了一种书法字骨架矫正方法、系统及存储介质，包括：对采集到的汉字图像进行图像二值化，得到预处理图像；利用细化算法对预处理图像提取汉字骨架，删除交叉区域中的笔画从而将汉字骨架拆分为若干笔画段A；计算所述笔画段A靠近交叉区域的局部斜率和倾斜角度；根据局部斜率和倾斜角度判断两个笔画段是否属于同一笔画，将属于同一笔画的两个笔画段连接；按照待评价的汉字笔画顺序依次选择延伸的笔画段A，根据局部斜率对笔画段A进行延长直至与其他笔画相交形成新交点；对汉字骨架进行校正获得最终的汉字骨架；以解决汉字骨架交叉点分裂问题和笔画相交区域在细化之后的骨架变形的问题，提高对书法字智能评价的准确性和可靠性。

文档矫正模型的训练及图像矫正方法、装置、设备和介质-202310116117.5
发明人：李星;谢群义;钦夏孟;姚锟 -专利权人：北京百度网讯科技有限公司
申请日： 2023-02-08 - 公布日： 2023-05-12 - 主分类号： G06V30/16
摘要：本公开提供了一种文档矫正模型的训练及图像矫正方法、装置、设备和介质，涉及深度学习、图像处理、计算机视觉技术领域，可应用于OCR等场景。具体实现方案为：采用文档矫正模型对样本文档图像进行矫正，以得到目标文档图像；对目标文档图像进行文本行检测，得到至少一个文本行的中心线；根据以下至少一项对文档矫正模型进行训练：目标文档图像中同一中心线上各像素点的图像坐标之间的差异、不同中心线上处于同一排列位置的像素点的图像坐标之间的差异。由此，可实现基于文本行中心线上的各像素点，约束模型矫正后的文档图像上的文本行的中心线方向与文档图像的阅读方向匹配，以提升文档图像的矫正效果，提升文档图像矫正还原的准确度。

检验有价文件的方法和设备和产生用于在检验有价文件的方法中使用的检验参数的方法和设备-202180061922.1
发明人： M·科德维茨 -专利权人：捷德货币技术有限责任公司
申请日： 2021-07-15 - 公布日： 2023-05-09 - 主分类号： G06V30/16
摘要：本发明涉及一种产生用于在检验预设有价文件类型的有价文件、尤其是钞票时形成模板的元件模板的方法，其中，预设有价文件类型的有价文件具有至少两个预设的制造元件、尤其是印刷层和/或防伪元件，所述制造元件在必要时部分地重叠，并且所述元件模板对应于制造元件，其中，使用预设有价文件类型的训练有价文件的数字训练图像和预设有价文件类型的参考有价文件的数字参考图像，其分别具有像素，所述像素分别配置有像素数据，所述方法具有以下步骤：对于训练图像，分别确定所述制造元件的位置，并且在使用参考图像和在考虑分别确定的制造元件位置的情况下，将相应的训练图像的像素配置给所述制造元件，‑对于每个制造元件，产生第一元件模板，所述第一元件模板包含那些在所有训练图像中都被配置给相应的制造元件的像素，并且‑对于每个制造元件，产生第二元件模板，所述第二元件模板包含那些在一个或多个训练图像中被配置给相应的制造元件的像素。此外，描述了一种检验方法，在所述检验方法中使用元件模板。

一种票据识别方法、装置、电子设备和存储介质-202010243502.2
发明人：谢文辉;张浩;周期律;常学亮;刘杰;汪翔;汪哲逸 -专利权人：重庆农村商业银行股份有限公司
申请日： 2020-03-31 - 公布日： 2023-04-28 - 主分类号： G06V30/16
摘要：本申请提供了一种票据识别方法，包括：获取目标票据扫描件，对目标票据扫描件的目标区域进行裁剪，得到票据训练图像；将票据训练图像依次进行灰度化、自适应阈值二值化、膨胀处理、腐蚀处理，得到处理后图像；对处理后图像进行轮廓检测，得到位置坐标；将位置坐标和内容信息输入训练器，以便得到票据识别器，利用票据识别器对待识别票据扫描件进行识别。本申请通过对目标票据扫描件的目标区域进行裁剪，得到票据训练图像，通过对目标区域的剪裁，在复杂的票据图像中制定一个小的范围，在一个较小干扰的背景下进行定位，提高了识别准确性。本申请同时还提供了票据识别装置、电子设备和计算机可读存储介质，均具有上述有益效果。

扭曲文字行的矫正方法及装置、字符识别方法及装置-201711078947.4
发明人：程孟力;施兴 -专利权人：阿里巴巴集团控股有限公司
申请日： 2017-11-06 - 公布日： 2023-04-28 - 主分类号： G06V30/16
摘要：本文公开一种扭曲文字行的矫正方法及装置、字符识别方法及装置，扭曲文字行的矫正方法包括：接收待识别的文档图像；确定所述文档图像中扭曲文字行的形变曲线；利用所述形变曲线对所述文档图像中扭曲文字行进行拉直处理，以对拉直处理后的所述文档图像进行识别。本申请至少能够有效提高具有扭曲文字行的文档图像的识别效果。

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]文本识别方法、装置、设备、存储介质和程序产品在审

专利文献下载