[发明专利]书写内容提取方法、装置、设备及存储介质在审

申请号：	202310622631.6	申请日：	2023-05-29
公开（公告）号：	CN116665220A	公开（公告）日：	2023-08-29
发明（设计）人：	邹颖思;詹建勋	申请（专利权）人：	广州市奥威亚电子科技有限公司
主分类号：	G06V30/162	分类号：	G06V30/162;G06V30/146;G06V30/19;G06V30/226;G06V30/16
代理公司：	北京竟易和专利代理事务所(特殊普通合伙) 16103	代理人：	李欣迎
地址：	510670 广东省广州市萝岗区科***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种书写内容提取方法、装置、设备及存储介质。其中，该方法包括步骤：获取书写媒介的图像；对所述书写媒介的图像进行灰度化处理，得到书写内容图像；利用统计学方法，对所述书写内容图像进行自适应阈值二值化，获得背景与书写内容二分类的掩码图；根据所述掩码图，在所述书写媒介的图像中提取书写内容，输出仅含书写内容的结果图像；其中，基于目标区域的灰度值聚类，得到目标区域的二值化阈值。本发明针对黑板或白板的场景，对字迹提取的过程进行了优化，降低出现字迹误检或漏检的概率，提高了书写内容提取的精度；并且能够快速得出二值化阈值灰度，提高了字迹提取的速度。
搜索关键词：	书写内容提取方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州市奥威亚电子科技有限公司，未经广州市奥威亚电子科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202310622631.6/，转载请声明来源钻瓜专利网。

同类专利

文档图像二值化方法、系统、计算机设备及可读存储介质-202310555567.4
发明人：张吴明;张展鹏;张书航 -专利权人：中山大学
申请日： 2023-05-16 - 公布日： 2023-09-22 - 主分类号： G06V30/162
摘要：本发明公开了一种文档图像二值化方法、系统、计算机设备及可读存储介质，方法包括：获取输入图像和反色图像；基于地面滤波器，根据将灰度值视为高程值的方式，对所述输入图像和所述反色图像进行二值化处理，得到第一二值影像和第二二值影像，其中，第一二值影像作为正底面，第二二值影像作为反底面；根据所述正底面和灰度值反转后的所述反底面，得到暗场文字掩膜；基于所述输入图像的背景亮度估计值，扣除所述输入图像的背景光，得到去背景光图像；利用所述暗场文字掩膜增强所述去背景光图像的文字信息，获得文档图像二值化结果。本发明可以提供比传统局部阈值分割方法更好的文本二值化结果，提高OCR工具在恶劣光照条件下对文档图像的识别准确率。

治疗控制系统显示器中的字符识别方法、电子设备及存储介质-202310669387.9
发明人：菅影超;王虹;马善达 -专利权人：江苏瑞尔医疗科技有限公司
申请日： 2023-06-07 - 公布日： 2023-09-05 - 主分类号： G06V30/162
摘要：本发明提供了一种治疗控制系统显示器中的字符识别方法、电子设备及存储介质，字符识别方法包括：获取治疗控制系统显示器中的图像；获取包括字符的待识别图像；对待识别图像进行二值化处理；去除二值化图像的边缘空白区域；对二值化图像实施字符分割，获得若干第一字符图像块，第一字符图像块为单字符图像块或粘连字符图像块；确认第一字符图像块的类别，并做出如下处理：第一字符图像块为单字符图像块，则通过与模板字符图像进行匹配，实施对单字符图像块中的单字符的识别；第一字符图像块为粘连字符图像块，对粘连字符图像块实施去粘连处理，以实施对粘连字符图像块中的各字符的识别。本发明实现了对治疗控制系统显示器中的计划信息的自动识别。

书写内容提取方法、装置、设备及存储介质-202310622631.6
发明人：邹颖思;詹建勋 -专利权人：广州市奥威亚电子科技有限公司
申请日： 2023-05-29 - 公布日： 2023-08-29 - 主分类号： G06V30/162
摘要：本发明公开一种书写内容提取方法、装置、设备及存储介质。其中，该方法包括步骤：获取书写媒介的图像；对所述书写媒介的图像进行灰度化处理，得到书写内容图像；利用统计学方法，对所述书写内容图像进行自适应阈值二值化，获得背景与书写内容二分类的掩码图；根据所述掩码图，在所述书写媒介的图像中提取书写内容，输出仅含书写内容的结果图像；其中，基于目标区域的灰度值聚类，得到目标区域的二值化阈值。本发明针对黑板或白板的场景，对字迹提取的过程进行了优化，降低出现字迹误检或漏检的概率，提高了书写内容提取的精度；并且能够快速得出二值化阈值灰度，提高了字迹提取的速度。

一种文字识别方法、装置及计算机可读存储介质-201911137654.8
发明人：马文伟;刘设伟;沈程秀;闫永泽 -专利权人：泰康保险集团股份有限公司;泰康在线财产保险股份有限公司
申请日： 2019-11-19 - 公布日： 2023-08-18 - 主分类号： G06V30/162
摘要：本发明提供了一种文字识别方法、装置及计算机可读存储介质，所述方法包括：针对待识别的圆形印章图像进行二值化处理，得到二值图像；对二值图像中的文字进行区域连通，得到多个连通区域；根据每个连通区域的中心到二值图像的圆心的距离，以及与穿过圆心的射线所相交的连通区域的数量，从多个连通区域中分别确定第一连通区域、第二连通区域；分别对位于第一目标区域中的文字和第二目标区域中的文字进行识别。上述方法将弯曲型文字和直线型文字准确区分开来，提高了文字识别的准确度；并分别对第一连通区域中的文字和第二连通区域中的文字单独进行识别，使得可以按照语义顺序进行提取，降低了文字识别难度。

一种计算题判断系统-202310276266.8
发明人：王钰;钱锟;李栋良;徐飞 -专利权人：中教云智数字科技有限公司
申请日： 2023-06-19 - 公布日： 2023-08-11 - 主分类号： G06V30/162
摘要：本发明公开了一种计算题判断系统，包括信息获取平台和对比平台，信息获取平台包括信息截取模块、信息预处理模块和内容识别模块，信息截取模块与信息预处理模块电性连接，内容识别模块与信息预处理模块电性连接，所述信息截取模块用于对学生答题卡进行拍照，所述信息预处理模块用于将所述信息截取模块拍摄到的照片进行预处理，对比平台包括内容判断模块和计算得分模块，内容判断模块与内容识别模块电性连接，计算得分模块与内容判断模块电性连接，深度融合模型包括数据预处理模块，与数据预处理模块信号相连的多个模型。本方案，通过设置深度融合模型，采用多种模型作为OCR识别模式并融合，使得识别的准确率提高。

基于投影法的古文字自动切割与识别方法-202310446305.4
发明人：陈婷珠;宋轶旻;李令德 -专利权人：上海交通大学
申请日： 2023-04-24 - 公布日： 2023-08-04 - 主分类号： G06V30/162
摘要：本发明公开了一种基于投影法的古文字自动切割与识别方法，该方法包括对具备行列分明的原始古文字拓片材料进行自动分割和识别古文字单字图像并逐一编号，具体包括步骤：根据古文字拓片特点对拓片图片进行二值化，并将有效数据部分标为白色；对拓片图片进行预处理，以去除噪声；采用投影法作为分割方法，对拓片图片中的古文字先后进行列与行的划分并记录位置信息；根据位置信息对古文字进行分割标注。本发明避免了深度学习中对于大数据集的依赖；同时，通过复杂度低的算法，获得了更快的运行速度。在测试集上分割准确率在90％以上，具有较好的表现。

图像处理方法及装置-202310136892.7
发明人：梁增龑 -专利权人：北京飞象星球科技有限公司
申请日： 2023-02-13 - 公布日： 2023-06-27 - 主分类号： G06V30/162
摘要：本申请提供图像处理方法及装置，其中所述图像处理方法包括：确定目标图像对应的灰度图像，并对所述灰度图像进行滤波处理，获得滤波图像以及所述滤波图像的滤波像素点信息；基于所述滤波图像和所述滤波像素点信息，计算所述滤波图像对应的全局亮度参数，并根据所述全局亮度参数生成所述滤波图像对应的亮度方差图像；比较所述亮度方差图像的亮度像素点信息和所述灰度图像的灰度像素点信息，根据比较结果调整所述灰度像素点；根据调整后的灰度像素点生成所述目标图像对应的二值化图像。实现针对每个灰度像素点都设置对应的亮度像素点进行比较，根据比较结果调整灰度像素点并生成二值化图像，从而解决因阈值选取不合理而无法获得二值化图像的问题。

文字检测及其模型训练方法、装置、系统及可读存储介质-202211441255.2
发明人：谌贵雄;张丽民;徐兵;张楠赓 -专利权人：杭州嘉楠耘智信息科技有限公司
申请日： 2022-11-17 - 公布日： 2023-06-02 - 主分类号： G06V30/162
摘要：本发明提供了一种文字检测及其模型训练方法、装置、系统及可读存储介质方法，该模型训练方法包括：获取样本图片的样本特征图，将样本特征图输入第一预测网络，得到尺寸小于样本图片的第一概率图和第一阈值图；对第一概率图和第一阈值图进行可微二值化处理，得到近似二值图；基于样本图片的样本标签对近似二值图进行监督学习，训练生成文字检测模型。利用上述方法，能够明显提升文字检测模型的后处理效率。

一种表盘滚动数字字符的半字判断方法-201910119615.9
发明人：吴林煌 -专利权人：福州视驰科技有限公司
申请日： 2019-02-18 - 公布日： 2023-05-09 - 主分类号： G06V30/162
摘要：本发明涉及一种表盘滚动数字字符的半字判断方法，首先，获取原始图像即输入图像，并利用加权平均法将原始图像灰度化，得到灰度图像；采用Bersen局部二值化算法，并对灰度图像进行二值化处理，得到二值图；利用投影法去除进行二值化处理后的图像的左右和上下边框；然后，将利用投影法去除左右和上下边框后的图像五等分得到分割后的图像，并提取出五个水表字符；保留五个水表字符的各个水表字符的最大连通域；最后，将得到的图像每一行的零像素个数投影到纵坐标上，若投影后在纵坐标设定的范围内出现全白像素，则判定为半字；否则为全字；本发明可以快速地从输入的表盘图像中把全字和半字分开来并记上标签，便于后期进行针对性识别。

基于自适应多阈值的字符识别预处理二值化方法-201811242923.2
发明人：朱德利;杨雨浓;杨德刚;万辉 -专利权人：重庆师范大学
申请日： 2018-10-24 - 公布日： 2023-04-25 - 主分类号： G06V30/162
摘要：本发明提供的一种基于自适应多阈值的字符识别预处理二值化方法，包括步骤：S1：获得原始图像中每个像素点的二值化标准阈值；S2：对原始图像进行优化，得到优化后的图像；S3：获取优化后图像的积分图数表；S4：计算原始图像的各像素点的二值化标准阈值；S5：获得原始图像中每个像素点的松弛因子ξ；S6：求每个像素点的二值化标准阈值与松弛因子的乘积，得到每个像素点的二值化松弛阈值；S7：运用二值化松弛阈值原始图像进行二值化处理；本发明解决移动终端字符识别应用中光照不均匀，环境不可控导致的识别效果不佳的问题，减小了计算松弛因子的时间开销，提高了对需进行字符识别的图像的二值化预处理的效率和精度。

一种图像二值化处理方法和装置-202211562829.1
发明人：黄琼;张浩;张冠;马晓圆 -专利权人：中国工商银行股份有限公司
申请日： 2022-12-07 - 公布日： 2023-04-04 - 主分类号： G06V30/162
摘要：本发明实施例提供了一种图像二值化处理方法和装置，可用于人工智能技术领域，所述方法包括：获取原始图像；对原始图像进行图像预处理，得到目标灰度图和初始二值化阈值；通过最大类间方差法和初始二值化阈值，对目标灰度图进行自适应二值化，得到目标二值化阈值；根据目标二值化阈值对目标灰度图进行二值化处理，得到目标二值化图像，能够预先对图像进行图像预处理和图像二值化，通过改进的最大类间方差法，确定出最佳的目标二值化阈值，能够兼容特殊场景图像，从而提高后续对图像进行字符分割的准确性。

一种二值化文字图像的确定方法、装置、设备及存储介质-202211353542.8
发明人：李键红;陈焰;王连杰;罗杰鸿 -专利权人：广东外语外贸大学
申请日： 2022-11-01 - 公布日： 2023-04-04 - 主分类号： G06V30/162
摘要：本发明公开了一种二值化文字图像的确定方法、装置、设备及存储介质，本发明通过获取文字图像，并对所述文字图像进行灰度处理，得到灰度图，检测所述灰度图的文字轮廓梯度信息，根据所述文字轮廓梯度信息以及梯度阈值，确定轮廓梯度信息矩阵，根据所述轮廓梯度信息矩阵以及所述灰度图进行交替最小化处理，得到目标文字图像，对所述目标文字图像进行二值化处理，得到二值化文字图像；通过文字轮廓梯度信息从而减少文字内与文字外的灰度值之间的差距，使得二值化文字图像能够便捷地去除污渍、光照不均匀或者阴影等等的图像缺陷问题，有利于实际应用，本发明可广泛应用于图像处理领域。

语义识别方法、装置、终端设备和存储介质-202211102098.2
发明人：刘博;杜俊博;屈玉涛;阮威健;何耀彬;胡金晖 -专利权人：中电科新型智慧城市研究院有限公司;南方科技大学
申请日： 2022-09-09 - 公布日： 2023-01-06 - 主分类号： G06V30/162
摘要：本申请适用于数据识别技术领域，提供了一种语义识别方法、装置、终端设备和存储介质。其中，上述语义识别方法具体包括：分别对待识别文本中的各个文字进行向量化，得到各个文字的字符向量；获取所述各个文字的图像向量，所述图像向量用于表征相应文字的原始象形文字图像的全局特征和局部特征；根据所述字符向量和所述图像向量，确定相应文字的语义分类结果，所述语义分类结果包括相应文字所属的一个或多个语义分类；将同一所述语义分类的文字进行组合，得到所述待识别文本的语义识别结果。本申请的实施例可以提高语义识别的准确性。

基于跨模态笔迹的类协同训练方法、笔迹比对系统、设备及介质-202211258873.3
发明人：石芳;覃勋辉;刘科 -专利权人：重庆傲雄在线信息技术有限公司
申请日： 2022-10-14 - 公布日： 2022-12-16 - 主分类号： G06V30/162
摘要：本发明公开一种基于跨模态笔迹的类协同训练方法、系统、笔迹比对方法及介质，采集纸质版手写签名图像转化成二值化签名图像、电子签名序列正写数据及仿写数据回显为签名图像数据；对齐两种模态类型的签名图像，在通道维度进行拼接构建对应电子‑纸质签名图像对；对图像对数据集分为有标签数据集及无标签数据集；构建双塔式网络结构，对有标签数据集两次随机采样并依次输入不同网络，对无标签数据集进行单次随机采样依次输入不同网络，结合交叉网络输出的软标签对无标签数据进行像素扰动生成对抗样本数据，分别输入对应的非交叉网络，进行跨模态比对多任务联合分类训练；综合分类结果判别跨模态笔迹签署人身份。广泛用于需要进行识别跨模态签名的场所。

一种基于计算机视觉的涉海图书识别方法及系统-202211068071.6
发明人：侯迎;庞亮;解登峰;王栋;邱玥;张莉红;尹晖 -专利权人：中国海洋大学
申请日： 2022-09-01 - 公布日： 2022-12-02 - 主分类号： G06V30/162
摘要：本发明公开了一种基于计算机视觉的涉海图书识别方法及系统，包括：采集涉海类图书的第一封面页图像，通过灰度和二值化处理，并进行形态学变换后，对文字进行识别，生成用于识别涉海类图书的特征数据集；构建具有AdamOptimier优化器以及损失函数为交叉熵函数的CNN网络，通过特征数据集进行训练，根据训练后的CNN网络，对图书的第二封面页图像进行识别，判断图书是否为涉海类图书；本发明克服了当前中文涉海图书识别中的操作过剩及误判问题，并节省了机器运存和时间成本。

一种基于特征提取的书法风格分类方法-202210705886.4
发明人：肖云;李祁;许鹏飞;董志强;左双全;任哲;王淑文;郭军;陈晓江 -专利权人：西北大学
申请日： 2022-06-21 - 公布日： 2022-09-30 - 主分类号： G06V30/162
摘要：本发明公开了一种基于特征提取的书法风格分类方法，包括：输入两幅书法图像，通过二值化的处理获取到图像的二值图像，提取书法字的全局特征和局部特征；将提取的特征包括字体的全局特征和局部特征，并将其以数值形式表示；通过获取大量数据的特征形成构建决策树的数据，构建决策树进行书法风格的分类；通过向决策树输入一组特征值，得到最终的书法风格分类结果。该方法所提取的特征包括全局特征和局部特征，并将所提取的每个特征都以图的形式进行呈现，具有更高的分类精确度。

一种文本识别系统及方法-202210637055.8
发明人：王乾坤;谭鸿 -专利权人：重庆法链科技有限责任公司
申请日： 2022-06-07 - 公布日： 2022-08-30 - 主分类号： G06V30/162
摘要：本发明公开了一种文本识别系统及方法。本发明中，图像预处理模块包括归一化模块、白化操作模块、图像二值化模块和几何变换模块，在对文本进行处理之前可以先对文本图像进行预处理，能够有效的降低图像的冗余性，使得分类器能够达到更好的识别效果，设计了一种既可以在一定程度上保留文字图像二维又利用了LSTM的序列学习的优势，通过在合成数据集和真实数据集上训练得到了相当优秀的结果，该模型通过Tensorflow‑serving部署到服务器端，采用gRPC的方式与客户端交互，从而提高了该系统在对文本进行识别时的速度，为人们的使用带来了便利性。

文本识别方法、装置、存储介质及电子设备-202210475607.X
发明人：杨明坤 -专利权人：北京智通东方软件科技有限公司
申请日： 2022-04-29 - 公布日： 2022-08-30 - 主分类号： G06V30/162
摘要：本公开涉及一种文本识别方法、装置、存储介质及电子设备，该方法获取待检测图像对应的初始文本区域；在确定所述初始文本区域为非水平状态的情况下，对所述初始文本区域进行形变处理，得到所述初始文本区域对应的水平文本区域；根据所述水平文本区域，确定所述待检测图像中的文本。也就是说，本公开在确定待检测图像对应的初始文本区域为非水平状态的情况下，先对该初始文本区域进行形变处理，之后，再基于形变处理后的水平文本区域进行文本识别，由于该水平文本区域的形状比较规则，其轮廓不会与文本行过于贴合，使得根据该水平文本区域识别得到的文本行中的文本不会被截断，文本行更加完整，从而提高了文本识别的准确率。

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]书写内容提取方法、装置、设备及存储介质在审

专利文献下载