[发明专利]一种模型训练的方法、装置、存储介质及电子设备在审
申请号: | 202310865146.1 | 申请日: | 2023-07-13 |
公开(公告)号: | CN116844183A | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 唐董琦;李若愚;刘健 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06V30/42 | 分类号: | G06V30/42;G06V30/148 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 邓超 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本说明书公开了一种模型训练的方法、装置、存储介质和电子设备,获取用户发送的待识别证件图像,将所述待识别证件图像输入预先训练的字符识别模型,获得第一字符识别结果,判断所述用户是否修改所述第一字符识别结果,若是,则获取所述修改后的字符识别结果,作为第二字符识别结果,根据所述第二字符识别结果,对所述字符识别模型进行训练。本方法通过用户修改后的识别结果对模型进行训练,提高了模型输出结果的准确性。 | ||
搜索关键词: | 一种 模型 训练 方法 装置 存储 介质 电子设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310865146.1/,转载请声明来源钻瓜专利网。
- 上一篇:半导体结构及其制备方法
- 下一篇:设备控制方法、装置、存储介质与电子设备
- 同类专利
- 一种证照多光谱图像防伪方法-202310834526.9
- 聂芸芸;夏炉系;翁文;鲁成成;张万园;张浒;苗应亮 - 盛视科技股份有限公司
- 2023-07-10 - 2023-10-27 - G06V30/42
- 本发明公开了一种证照多光谱图像防伪方法,包括以下步骤:S1:读取证件的电子信息,同时读取证件的光源图像,其中光源图像包括:白光图像、红外图像、紫外图像;S2:通过红外图像计算变换矩阵对三种光源图像进行图像矫正;S3:对完成图像矫正后的红外图像进行二值化处理,得到字符二值化图像,提取特定的字符区域,再进行轮廓检测;S4:对提取的字符使用特征算子提取特征;S5:验证信息一致性,包括不同源信息验证和同源信息验证。
- 一种基于OCR的智能查验方法、系统及设备-202310660857.5
- 钟鸿敏;王骏光;孔彪;张远航;陈昕 - 简单汇信息科技(广州)有限公司
- 2023-06-05 - 2023-10-27 - G06V30/42
- 本发明公开了一种基于OCR的智能查验方法、系统及设备,涉及金融信息审核技术领域,包括以下步骤:获取企业用户的登记文件信息;对登记文件信息进行预处理,得到一类字符串信息;获取企业融资信息,处理得到二类字符串信息,将二类字符串信息和一类字符串信息进行查重比对,判断是否存在同类型字符串信息,若是,输出查重比对结果和带有相同字符串信息的登记文件信息,等待人工决策;否则输出查重比对结果,结束查验;判断预处理的结果与查重比对结果是否正确,若是,输出查重比对结果,结束查验;否则将人工决策结果和查重比对结果进行数据回流。本发明提供了一个准确率高,识别速度快的查验模型与查验方法。
- 一种受控签署的电子公章制作和使用方法-202310996995.0
- 易磊;沈虹;邓发远 - 易签链(深圳)科技有限公司
- 2023-08-09 - 2023-10-27 - G06V30/42
- 本发明公开了一种受控签署的电子公章制作和使用方法,属于电子公章技术领域,包括公章图片上传、特征形状识别及位置获取等步骤。本发明能够方便的获取公章图片中的文字序列,并准确地对文字序列的各文字属性进行判断,确定各文字为环形文字或者横行文字,再将环形文字、横行文字序列按照实体公章的布局规则填写到已预设五角星的公章图模板中,生成准确的电子公章图,使生成电子公章图的过程更为简单、高效;同时在使用电子公章图时,可以通过预设的签署页面识别标识、签署位置识别标识,获取准确的签署页码和签署位置,大大提高了签署操作速度,对于多个相同结构形式的待签署文件,能够快速完成批量签署工作。
- 一种基于人工智能模型的比例尺自动识别系统-202310126005.8
- 陈俊;王冲 - 江苏艾佳家居用品有限公司
- 2023-02-16 - 2023-10-27 - G06V30/42
- 本发明涉及图像识别领域,尤其为一种基于人工智能模型的比例尺自动识别系统,包括图像收集模块:用于接收外部图像采集设备所采集的需要识别的房间图像,并将采集到的图像数据传送至图像处理模块;图像处理模块:用于对图像采集模块传送来的数据进行处理,并将处理后的数据传送至云服务系统模块;云服务系统模块:用于将图像处理模块传送来的数据与户型图数据库进行比对,并将比对结果处理后反馈给用户。本发明通过图像进行多边形拟和整理,使图像更加准确;通过云端存储比例图,增加了比对时的可靠性,满足了人们对比例图检索的需求,进而提高人们的工作和生活品质。
- 票据识别方法、装置和处理器及电子设备-202310930016.1
- 刁涛 - 中国工商银行股份有限公司
- 2023-07-26 - 2023-10-24 - G06V30/42
- 本申请公开了一种票据识别方法、装置和处理器及电子设备。涉及大数据处理技术领域,该方法包括:获取待分类的票据图像;对票据图像进行特征提取,得到票据图像在第一卷积维度上的第一特征信息;对第一特征信息进行映射填充处理,得到票据图像在第二卷积维度上的第二特征信息,其中,第二卷积维度高于第一卷积维度;对第二特征信息进行压缩变换处理,得到票据图像在第一卷积维度上的目标特征信息;对目标特征信息进行识别处理,得到票据图像对应的目标票据类型。通过本申请,解决了相关技术中票据识别的准确性较低的问题。
- 从DICOM SC图像对临床数据的基于OCR的提取-202310437301.X
- P·乌拉斯克里希南;罗人怡 - 西门子医疗有限公司
- 2023-04-21 - 2023-10-24 - G06V30/42
- 将描述便于处理至少一个DICOM SC图像(例如,使用医院或机构中的PC或工作站)以自动提取其中的临床数据的技术。基于与所述至少一个DICOM SC图像相关联的配置信息从所述至少一个DICOM SC图像提取与临床数据相关联的字符,所述配置信息是基于所述至少一个DICOM SC图像获得的。
- 身份证信息抽取方法、系统、存储介质及电子设备-202311154037.5
- 刘玉龙;孔欧 - 上海蜜度信息技术有限公司
- 2023-09-08 - 2023-10-20 - G06V30/42
- 本发明提供一种身份证信息抽取方法、系统、存储介质及电子设备,所述方法包括以下步骤:获取身份证图像;抽取所述身份证图像的图像模态嵌入特征;识别所述身份证图像中的文本内容和文本边框位置;基于所述文本内容和所述文本边框位置抽取所述身份证图像的文本模态嵌入特征;对所述图像模态嵌入特征和所述文本模态嵌入特征进行融合,获取融合嵌入特征;基于注意力机制对所述融合嵌入特征进行处理,获取融合特征;识别所述融合特征中的关键字和键值,获取关键字和键值的键值对。本发明的身份证信息抽取方法、系统、存储介质及电子设备能够基于图像文本多模态信息,实现身份证信息的准确抽取。
- 翻拍照片识别方法、装置、设备及介质-202211701942.3
- 区晓江;丁一;徐亮;乔志勇;钱育羡;林银娜 - 中国移动通信集团广东有限公司;中国移动通信集团有限公司
- 2022-12-28 - 2023-10-20 - G06V30/42
- 本发明涉及计算机技术领域,提供一种翻拍照片识别方法、装置、设备及介质,该方法包括:对待识别证件照进行图像预处理,得到时域特征图;对待识别证件照进行图像调整,并将调整后的待识别证件照进行傅里叶变换运算,得到频域特征图;基于时域特征图和频域特征图,得到目标区域,并基于第一图神经网络和目标区域确定翻拍识别概率;基于翻拍识别概率确定待识别证件照的翻拍识别结果。本发明实施例提供的翻拍照片识别方法通过图像预处理后得到的时域特征图、傅里叶变换运算后得到的频域特征图和第一图神经网络,准确地输出待识别证件照的翻拍识别概率,从而通过准确的翻拍识别概率确定出待识别证件照是否为二次翻拍照片,提高了翻拍识别准确度。
- 基于光学字符识别的数字校验方法、装置、设备及介质-202310858928.2
- 孙瑜尧 - 平安科技(深圳)有限公司
- 2023-07-12 - 2023-10-17 - G06V30/42
- 本发明涉及人工智能技术,揭露了一种基于光学字符识别的数字校验方法,包括:对发票图片进行清晰度处理,得到清晰图片,对清晰图片进行文本检测,得到文字区域;将文字区域中的字符进行分离,得到文字字符,对文字字符进行识别,得到大写数字以及小写数字;提取大写数字的大写特征以及小写数字的小写特征,将大写特征与小写特征进行拼接,得到融合特征;获取带有CTC损失函数的深度学习模型并确定为数字校验模型,获取融合特征的标签序列;将所述标签序列映射回对应的字符或数字,得到映射向量,将所述映射向量进行拼接,得到校验结果。本发明还提出一种基于光学字符识别的数字校验装置、电子设备以及介质。本发明可以提高数字校验精确度。
- 一种基于实例分割的证章图像提取方法-202310951050.7
- 杨梅;付雪平;夏炉系;聂芸芸;苗应亮 - 盛视科技股份有限公司
- 2023-07-29 - 2023-10-17 - G06V30/42
- 本发明公开了一种基于实例分割的证章图像提取方法,包括以下步骤:提取证章的资料页的图像特征;所述图像特征经过Protonet生成原型mask;所述图像特征经过图像预测分支分别生成目标检测框和mask系数;通过线性组合的方式结合Protonet分支和产生mask系数的分支,并对组合结果使用Sigmoid非线性化生成实例mask;根据目标检测框box裁剪实例Mask,生成最终Mask;根据原图像和最终Mask,从获取的图像数据中提取证章图像数据;对提取到的所述证章图像的背景特征进行去除。
- 一种模型训练的方法、装置、存储介质及电子设备-202310865146.1
- 唐董琦;李若愚;刘健 - 支付宝(杭州)信息技术有限公司
- 2023-07-13 - 2023-10-03 - G06V30/42
- 本说明书公开了一种模型训练的方法、装置、存储介质和电子设备,获取用户发送的待识别证件图像,将所述待识别证件图像输入预先训练的字符识别模型,获得第一字符识别结果,判断所述用户是否修改所述第一字符识别结果,若是,则获取所述修改后的字符识别结果,作为第二字符识别结果,根据所述第二字符识别结果,对所述字符识别模型进行训练。本方法通过用户修改后的识别结果对模型进行训练,提高了模型输出结果的准确性。
- 计量设备到货单的智能识别系统及方法-202310609685.9
- 胡厚鹏;欧家祥;王吉;肖艳红;周密;何沛林;唐建林;李航峰;罗奕;陈泽瑞;李富盛;邓钥丹;高正浩;吴欣;李鹏程 - 贵州电网有限责任公司;南方电网科学研究院有限责任公司
- 2023-05-26 - 2023-10-03 - G06V30/42
- 本发明公开了一种计量设备到货单的智能识别系统及方法。所述智能识别系统包括到货单获取模块、图像预处理模块、OCR识别模块、识别判断模块、模板识别模块、智能识别模块、相似度排查模块、人工处理模块和数据库。本发明解决了当前不同的单据模板均采用统一的识别方法,存在的识别效率低、拒识率和误识率较高的问题,还解决了计算复杂度高,识别等待时间长,无法最大限度解放人工劳动力,识别结果不够可靠且不够智能化等问题。
- 一种版式自动识别的卡证文字识别方法-202310762287.0
- 仇恒坦;潘震;吴俊雄;宁方刚;陈兆亮 - 浪潮软件股份有限公司
- 2023-06-27 - 2023-10-03 - G06V30/42
- 本发明涉及计算机视觉和深度学习技术领域,具体为一种版式自动识别的卡证文字识别方法,包括如下步骤:对卡证的图像进行版式识别;对每一块区域进行文本检测;对区域内的每个文本区域进行文字识别;将文字识别信息与标签识别信息输入到识别器;有益效果为:本发明提出的版式自动识别的卡证文字识别方法,采用深度学习技术实现版式自动识别,避免了人工指定版式带来错误输出的问题;结合文字识别、语义关联等技术,自动建立字段与信息的关系,避免自定义字段需要大量人力成本和时间成本的问题。
- 证件图像分类方法、装置、计算机设备及可读存储介质-201910979547.3
- 黄文韬;刘鹏;王健宗 - 平安科技(深圳)有限公司
- 2019-10-15 - 2023-09-29 - G06V30/42
- 本申请实施例提供了一种证件图像分类方法、装置、计算机设备及可读存储介质。本申请实施例属于证件图像分类技术领域,通过获取待分类的证件图像,基于OCR模型提取证件图像中包含的所有字段,根据字段,通过第一预设方式生成证件图像的向量,判断预设的向量集中是否存在与证件图像的向量相匹配的向量,其中,向量集包括多个通过第一预设方式所生成的、对应于不同证件类型的证件图像的向量;若向量集中存在与证件图像的向量相匹配的向量,将与证件图像的向量相匹配的向量作为目标向量,并根据目标向量对应的证件类型确定证件图像的证件类型,能够提高证件图像分类的准确性。
- 授权书的识别审核方法、装置、设备及系统-202010795215.2
- 王恒;张立君;赵睿;刘超凡 - 中国工商银行股份有限公司
- 2020-08-10 - 2023-09-26 - G06V30/42
- 本说明书提供一种授权书的识别审核方法、装置、设备及系统,可用于人工智能技术领域,该方法包括:通过采集授权书的授权书图像信息,再对授权书进行智能图像识别,获得图像识别结果,将图像识别结果和预先设置的业务规则进行匹配,以确定授权书是否满足要求。实现了授权书的自动化、智能化审核,提高了授权书审核的效率,并且审核的业务规则是相同的,不再因人而异,可以提高授权书审核的准确性,确保了用户信息的安全性。同时,可以通过自由定义业务规则,实现授权书的灵活审核,满足不同的业务需求。
- 一种票据审核识别方法、装置、终端和存储介质-202310765324.3
- 伍润泽;钟倩;马其;姚勤;廖葱;龙辉;刘舒豪 - 国网四川省电力公司德阳供电公司
- 2023-06-25 - 2023-09-22 - G06V30/42
- 本发明公开了一种票据审核识别方法、装置、终端和存储介质,涉及图像识别领域,其技术方案要点是:基于第一票据图像建立包括至少一个票据定位模板的票据模板库;采用深度学习模型提取第二票据图像包含开票信息的至少一个特征候选框,其中第二票据图像表示待识别票据的图像;提取特征候选框内的关键信息特征以及特征候选框的文本框尺寸信息特征,根据关键信息特征和文本框尺寸信息特征从票据模板库中匹配对应的票据定位模板;基于匹配到的票据定位模板对第二票据图像进行裁切处理,以获得第二票据图像中包括票据字段的至少一个图像切片;利用OCR算法对至少一个图像切片的字段信息的格式进行识别,确定待审核识别票据的审核结果。
- 基于OCR和自然语言处理的两票信息提取方法-202310393718.0
- 苏长宝;姚楠;张泽中;王志方;尚光伟;刘斌;张朋飞;曹锐;杨干;苏鸣方 - 国网河南省电力公司南阳供电公司
- 2023-04-13 - 2023-09-22 - G06V30/42
- 本发明涉及基于OCR和自然语言处理的两票信息提取方法,所述的方法包括以下步骤:步骤1:基于OCR技术的两票文字提取;步骤2:构建面向非结构化文本数据处理的循环神经网络;步骤3:基于RNN的工作票语义感知模型构建;本发明具有方法简单、提取关键信息、自动识别关键信息、提高工作效率的优点。
- 一种动车票识别方法、装置、计算机装置及计算机可读存储介质-201911369515.8
- 周忠诚;郭建京;符颖;黄九鸣;张圣栋;陈晖 - 湖南星汉数智科技有限公司
- 2019-12-26 - 2023-09-22 - G06V30/42
- 本发明适用于互联网技术领域,提供了一种动车票识别方法、装置、计算机装置及计算机可读存储介质,该方法包括:对N张动车票图像进行区域标注,生成标注标签,对标注标签进行格式转换;将N张动车票图像及转换后的标注标签输入YOLO网络模型,得到检测模型;获取标准动车票模板,将所述标准动车票模板上的关键信息进行遮挡,得到遮挡区域;将待检测动车票图像映射至与标准动车票模板的尺寸一致;根据标准动车票模板的遮挡区域对待检测动车票图像进行分割,得到动车票关键词条图像;通过关键信息识别模型识别动车票关键词条图像,得到动车票面信息。本发明提供的动车票识别方法,可提高动车票识别的准确度。
- 一种海量证照数据质量检验方法-202311006766.6
- 赵一新;王雪;关新雨;谷蕾;李文乾 - 山东省大数据中心
- 2023-08-11 - 2023-09-19 - G06V30/42
- 本申请属于图像数据处理技术领域,提供了一种海量证照数据质量检验方法,包括:通过获得像素点i的分布变化特征数值,对证照灰度图像中异常像素点进行凸显表征;通过获得局部区域中的像素点i与其他任一像素点j之间的分布度量距离,对证照灰度图像中异常像素点进行优化表征;获得像素点i的分布度量阈值,进一步获得像素点i的关联像素点,根据分布度量距离和关联像素点,计算获得像素点i的异常划分系数;然后计算获得局部划分阈值;判断识别局部区域中的异常像素点。本发明提供的方法,提高了海量证照数据检验过程中智能化和准确性效果,并且提高了海量证照数据计算过程中实时响应效果,降低了计算成本。
- 一种识别文档段落的方法、装置及电子设备-201811418118.0
- 邓斌 - 北京金山办公软件股份有限公司;珠海金山办公软件有限公司;广州金山移动科技有限公司
- 2018-11-26 - 2023-09-19 - G06V30/42
- 本发明实施例提供了一种识别文档段落的方法、装置及电子设备,通过获取待处理文档,生成待处理文档图像,将待处理文档图像输入基于卷积神经网络的段落识别模型,获得待处理文档图像的段落识别结果。由于段落识别模型是利用文档图像样本及文档图像样本中的段落位置进行训练获得的,因而相对现有技术能够更准确的建立表示文档图像特征与段落位置之间关系的模型,提高了文档段落识别的准确性,使识别结果与人工识别的结果更加接近,便于进行后续的文档编辑和排版。
- 基于机器学习的营销信息识别方法、装置、设备和介质-202311050755.8
- 潘春霞;姜凤龙;朱亚辉 - 苏州极易科技股份有限公司
- 2023-08-21 - 2023-09-15 - G06V30/42
- 本申请涉及机器学习的技术领域,尤其是涉及基于机器学习的营销信息识别方法、装置、设备和介质,方法包括:基于期望商品参数和参数逻辑关系进行预处理,得到期望参数逻辑规则,并基于期望参数逻辑规则进行竞品搜索,得到竞品主图。进而,针对竞品主图进行划区归类处理,得到竞品主图对应的标记竞品主图,以使得将产品外观图的背景感染与营销信息分离,降低干扰因素对信息提取的影响。然后,基于标记信息中区块内容类别,利用信息提取模型对标记竞品主图进行信息提取,得到竞品主图对应的竞品信息和营销信息,利用标记竞品主图进行信息提取能够避免竞品信息和营销信息混杂在一起,提高了营销信息的精确度。
- 一种基于虚拟化的智能硬件扫描方法及系统-202310747562.1
- 胡小勇;崔海春;陈苗雪 - 山东云秘网络科技有限公司
- 2023-06-21 - 2023-09-15 - G06V30/42
- 本发明涉及智能虚拟化扫描技术领域,尤其涉及一种基于虚拟化的智能硬件扫描方法及系统。所述方法包括以下步骤:通过在计算机系统内构建硬件虚拟化环境,基于硬件虚拟化环境对硬件扫描设备进行硬件识别与模拟处理,得到硬件模拟扫描设备;利用图像处理技术算法和扫描分类模型对硬件模拟扫描设备进行图像特征分类提取处理,以得到硬件模拟扫描模式分类结果;利用智能算法对硬件模拟扫描模式分类结果进行数字化存储和优化处理,得到硬件模拟精确扫描结果;利用智能监测技术对硬件模拟精确扫描结果进行自适应监测处理以执行相应的硬件扫描决策。本发明通过智能算法和技术将硬件扫描功能抽象出来处理,从而提供更智能、高效且灵活的扫描功能。
- 票证识别方法、装置、电子设备及计算机可读存储介质-202310749857.2
- 孙晴晴;王炳乾;孔岳;褚虓 - 京东方科技集团股份有限公司
- 2023-06-21 - 2023-09-12 - G06V30/42
- 本申请实施例提供了一种票证识别方法、装置、电子设备及计算机可读存储介质,涉及计算机技术领域。该方法包括:通过获取待识别票证的目标票证信息,通过预设识别器对所述目标票证信息进行识别处理,得到所述待识别票证的预测票证类别;其中,所述预设识别器为根据样本识别信息进行训练得到的;所述样本识别信息包括隐信息及样本票证的样本票证信息;所述隐信息为对所述识别提示语句进行随机编码确定的。本申请实现了在少样本情况下,通过基于Prompt范式训练的预设识别器对待识别票证进行识别,提升了识别的准确度,此外,通过随机编码的隐向量来确定Prompt范式模板,相比于固定编码所确定的Prompt范式模板,本申请实现Prompt范式的灵活性。
- 一种金融票据图像票号处变造检测的计算方法-202011496467.1
- 张振彬;刘贯伟;张云峰;滕飞;江浩然 - 恒银金融科技股份有限公司
- 2020-12-17 - 2023-09-12 - G06V30/42
- 本发明公开了一种金融票据图像票号处变造检测的计算方法,包括如下步骤:获取可见光下单个字符图像像素序列LB:针对可见光下票号图像ROI区域,获得有效的票号图像,在有效的票号图像基础上获得单个字符图像像素序列LB;获取紫外光下单个字符图像像素序列UB:针对紫外光下票号图像中的单个字符图像U,依次生成红色通道分量图像,并二值化,得到单个字符图像像素序列UB;计算差异图像序列:统计差异图像序列中白色像素的个数,得到差异数组;依次比较差异数组中的每个值,其中任意一项高于阈值,则可判定票号处发生了变造。利用票号的像素值进行比对,更加客观,降低了人为分辨的主观性,提高对票号处涂改变造的鉴伪准确率。
- 一种发票识别处理装置-202320009275.6
- 杨兵;肖佳 - 成都政弘科技有限公司
- 2023-01-04 - 2023-09-08 - G06V30/42
- 本实用新型公开了一种发票识别处理装置,其包括收纳箱,收纳箱的上端开口,且收纳箱的上端设置有支撑架,支撑架的侧面设置有用于发票放入支撑架内的进票口,支撑架内部的进票口处设置有第一夹具和第二夹具,第一夹具和第二夹具水平排列,第一夹具固定在支撑架的侧面,第二夹具设置在直线移动模组的滑块上,直线移动模组横跨支撑架的两侧设置在收纳箱的上方;支撑架的顶部设置有识别发票信息的摄像头,摄像头的两侧设置有LED灯。本方案使整个发票信息识别过程均未自动处理过程,在降低人员操作强度的同时,提升工作人员的工作效率,工作人员只需执行简单的放票操作即可,结构简单,并且有利于发票信息的收集与整理。
- 将纸质文件内容进行标识并高保真的转换为OFD文件的技术-202310996818.2
- 严伟;何冉冉;何中;朱聪聪 - 江苏中威科技软件系统有限公司
- 2023-08-09 - 2023-09-05 - G06V30/42
- 本发明提出将纸质文件内容进行标识并高保真的转换为OFD文件的技术,读取待处理图片,对图片中存在的文字的内容以及位置进行检测识别;对图片中的线条元素进行识别;对图片中的图形元素的位置和内容进行识别;将识别的图片中的文字、线条、图形信息建立识别结果的信息库;创建OFD文件,将识别的图片信息一一对应的转换为OFD文件;转换完成后在OFD文件上各文字、线条、图形信息上覆盖透明信息层,本发明可以将纸质文件加工为电子文件,为纸质文件识别为电子文件后的利用做好了坚实的基础,既将内容提取出来,有利于数字化的利用,又原模原样高保真的保存了文件加工前的状态,通过覆盖透明信息层的方式能够使得文件在利用时通过各种工具快速找到并定位到文件的具体位置。
- 一种轻量的药典图片文字提取方法-202211539551.6
- 李朋;于硕 - 大连理工大学
- 2022-12-02 - 2023-09-05 - G06V30/42
- 本发明属于视觉文档理解技术领域,公开了一种轻量的药典图片文字提取方法,包含两个关键步骤。1)构建药典特征轻量聚焦模块:首先利用全秩网络特征主成分构建低秩神经网络层,然后设计聚焦策略从输入特征中提取关键信息,2)构建药典文档信息识别提取网络:串联8个药典特征轻量聚焦模块为网络骨架,构建多阶段编码器提取药典数据特征嵌入;然后串联8个药典特征轻量聚焦模块为网络骨架,构建多阶段解码器转换药典数据信息为特定文本,实现药典电子化;最后利用交叉熵损失衡量解码器提取的药典数据文本与原始药典数据文本的差距,通过最小化交叉熵损失最优化网络参数。
- 一种面向发电设备多模态数据的文本交互式提取方法-202310514968.5
- 潘生华;干桂静;王飞;谢天;孟瑜炜;俞荣栋;郭庆;张震伟;王豆;傅骏伟 - 浙江浙能绍兴滨海热电有限责任公司;浙江浙能数字科技有限公司
- 2023-05-06 - 2023-09-05 - G06V30/42
- 本发明涉及一种面向发电设备多模态数据的文本交互式提取方法,包括:收集包含电力设备相关故障信息的图片或PDF文件;使用OCR识别技术,将步骤1中的图片信息转换为文本信息;对所述文本信息进行编辑修改,并采用N‑Gram模型对所述文本信息进行处理;运用TF‑IDF算法,利用处理好的文本信息构建知识图谱。本发明的有益效果是:本发明将设备故障信息从图片文件提取为文本文件,并结合知识图谱相关知识,提供给技术人员进行故障检测分析的方法,使得修理效率大大提升。
- 一种纸质计量数据信息智能提取装置-202310003696.2
- 杨玉博;孟静;张密;赵兵;陈昊;林繁涛;郑安刚;岑炜;张丽;白静芬;段永贤;耿爱玲;蒋依芹;徐熙彤;李华;宋晓卉;贾福泉;葛亚男;王猛;李宗嵘;古雄;刘浩;王海燕;项琼;尚怀嬴 - 中国电力科学研究院有限公司
- 2023-01-03 - 2023-09-05 - G06V30/42
- 本申请公开了一种纸质计量数据信息智能提取装置,包括:主板以及设置在主板上的数据提取模块,用于提取纸质计量数据文件的计量数据文本信息,其中提取模块包括:图像扫描单元,用于对纸质计量数据文件进行扫描,生成纸质计量数据文件对应的电子图像文件;图像识别单元,用于将电子图像文件进行处理,生成文本信息以及图像特征向量;证书分类模块,用于根据图像特征向量进行文档分类排序,确定电子图像文件的证书分类特征;数据结构化单元,用于将文本信息以及证书分类特征进行结构化,生成计量数据文本信息。
- 票据识别系统-201980000684.6
- 野田享弘 - 福冈金融集团株式会社
- 2019-03-29 - 2023-09-05 - G06V30/42
- 本发明提供一种票据识别系统,能够提高用户填写的手写文字的识别精度,削减人工校正作业业务。经公共通信网络使中央服务器与系统终端彼此可通信连接,其中,所述中央服务器识别票据中记载的用户的手写文字,所述系统终端包括读取通过用户填写至所述票据中的手写文字的图像扫描仪,在该票据识别系统中,所述中央服务器包括手写文字识别单元,其从所述系统终端接收经所述图像扫描仪读取到的所述票据的图像数据,将接收到的所述票据的图像数据的用户手写文字通过至少两种以上不同算法的OCR识别程序分别识别,该识别结果一致的部分确定所述票据中记载的手写文字,识别结果不一致的部分作为校正处理的对象。
- 专利分类