[发明专利]字符识别结果验证设备和字符识别结果验证方法有效
申请号: | 201010588384.5 | 申请日: | 2010-12-10 |
公开(公告)号: | CN102243707A | 公开(公告)日: | 2011-11-16 |
发明(设计)人: | 古畑彰夫 | 申请(专利权)人: | 株式会社东芝;东芝解决方案株式会社 |
主分类号: | G06K9/03 | 分类号: | G06K9/03;G06K9/00 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜;王英 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及字符识别结果验证设备和字符识别结果验证方法。在一个实施例中,字符识别结果验证设备具有组生成部和验证图像生成部。组生成部从包括多个字符图像的文档图像中生成包括了被识别为相同字符的多个字符图像的组。验证图像生成部通过叠置在生成的组中包括的多个字符图像,生成包括第一区域和第二区域的验证图像。第一区域所对应的像素在多个字符图像的全部中具有相同的像素值。第二区域所对应的像素在多个字符图像的一部分中具有相同的像素值。 | ||
搜索关键词: | 字符 识别 结果 验证 设备 方法 | ||
【主权项】:
一种字符识别结果验证设备,包括:组生成部,其从包括多个字符图像的文档图像中生成包括被识别为相同字符的多个字符图像的组;以及验证图像生成部,其通过叠置在所生成的组中包括的所述多个字符图像,来生成包括第一区域和第二区域的验证图像,其中,所述第一区域所对应的像素在所述多个字符图像的全部字符图像中具有相同的像素值,而所述第二区域所对应的像素在所述多个字符图像的一部分字符图像中具有相同的像素值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝解决方案株式会社,未经株式会社东芝;东芝解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010588384.5/,转载请声明来源钻瓜专利网。
- 上一篇:电化学元件用隔板
- 下一篇:光学式触控装置及其光感测模组
- 同类专利
- 一种票据识别纠错方法及装置-201610928581.4
- 张世龙;纪录 - 用友网络科技股份有限公司
- 2016-10-31 - 2019-10-22 - G06K9/03
- 本发明公开了一种票据识别纠错方法及装置,由于主要包括:进行文本预处理,票据文本与纠错历史中的生效数据匹配,匹配成功则比较识别到的票据的指定位置的一组文本与数据库存储的档案的编码、名称、属性,修正文本,记录纠错历史,在循环纠错的情况下,标记纠错历史的生效状态,使循环纠错记录失效但不删除;预先对特定种类的票据定义数值的等式关系,自动修正票据的错误数值;即利用票据各字段的语义和上下文的联系,结合ERP系统存储的档案,对票据识别结构进行交叉校验,纠正识别错误,提高准确率。
- 评估诸如半导体基板的产品的质量-201780070000.0
- 安藤丹一;菅原启 - 欧姆龙株式会社
- 2017-02-17 - 2019-07-02 - G06K9/03
- 可提供用于评估由半导体基板制造设备(40)制成的半导体基板的质量的评估装置(10)。该评估装置(10)可包括:用于接收半导体基板的图像的接收单元(100),该图像由设置在半导体基板制造设备(40)上的成像装置(50)拍摄;用于利用神经网络(1020)来确定表示机器学习装置(70)针对半导体基板的图像输出的错误输出的概率的至少一个值的确定单元(102),该机器学习装置(70)用于(i)接收半导体基板的图像,(ii)利用所接收的图像执行计算,及(iii)基于计算结果输出表示半导体基板的质量的信息;以及基于表示概率的至少一个值来输出一输出的输出单元(104),其中神经网络(1020)已利用制成的半导体基板的图像,和对于制成的半导体基板的图像中的各个图像,表示机器学习装置(70)针对所述制成的半导体基板的图像中的该图像的输出的错误程度的信息进行训练。
- 一种光学字符识别结果的校验方法及装置-201610756984.5
- 陈家辉;李衡峰 - 东方网力科技股份有限公司
- 2016-08-29 - 2019-05-21 - G06K9/03
- 本发明提供了光学字符识别结果的校验方法及装置,涉及字符识别领域。该方法,采用为模板图上的参考点设置不同权值的方式,其通过先获取了识别结果图和模板图,其中,所述模板图上阵列的设置有多个参考点;之后,再根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;最后,再判断所述匹配值是否超过预设阈值;若超过,则判定所述识别结果图为正确结果。由于为每个参考点设置了相应的权值,因此,不再只是判断识别结果图中的图形是否在图版图中出现,而是采用更为精确的方式计算识别结果图的匹配值,再依据该匹配值进行判断,提高了判断的准确程度。
- 图像处理装置及图像处理方法-201510821654.5
- 宫谷苑子;铃木达矢;藤木真和;小林一彦;铃木雅博;广田祐一郎;小竹大辅 - 佳能株式会社
- 2015-11-24 - 2019-04-12 - G06K9/03
- 本发明提供一种图像处理装置及图像处理方法。获得由摄像装置拍摄的目标物体的拍摄图像;针对所述拍摄图像中的位置,获得指示所述拍摄图像的劣化度的信息;基于所述劣化度从所述拍摄图像提取所述目标物体的特征;根据预定位置及姿态来将目标物体的特征,与当布置三维模型时观察到的三维模型的特征相关联。通过基于关联的结果校正预定位置及姿态,来导出目标物体相对于摄像装置的位置及姿态。
- 文字图形识别装置、文字图形识别方法以及文字图形识别程序-201680084112.7
- 高仓穗;竹之内磨理子 - 松下知识产权经营株式会社
- 2016-09-29 - 2018-12-21 - G06K9/03
- 一种文字图形识别装置,是执行以附加在处于规定的空间的被摄体上的文字或者图形为对象的识别并获取信息的装置,所述文字图形识别装置具备:控制部;摄像部,对包含被摄体的规定的摄影范围的图像进行拍摄;照明部,包含从不同位置射出光来照明规定的空间的多个照明灯;和识别部,识别由摄像部拍摄的图像中的文字或者图形来获取信息,输出包含获取到的信息的识别结果信息,控制部进行多个照明灯的每一个的点亮或者熄灭的组合即照明图案向照明部的应用、以及摄像部的拍摄的定时的控制。
- 一种基于环境一号卫星遥感影像的自动正射校正方法-201510472463.2
- 吕争;傅俏燕;王小燕;乔志远;崔林 - 中国资源卫星应用中心
- 2015-08-04 - 2018-12-18 - G06K9/03
- 一种基于环境一号卫星遥感影像的自动正射校正方法,步骤如下:(1)根据几何投影变换原理消除参考影像中的地面起伏所造成的投影变形,生成模拟投影影像;(2)利用Harris角点提取算法在参考影像与原始影像中寻找可能的特征点;(3)再利用相关系数法在步骤(2)的基础上寻找可能的同名点;(4)用基于最小二乘的多项式模型求解参考影像与原始影像间的关系系数;(5)利用参考影像与原始影像间的关系系数对原始影像进行校正并再次根据几何投影变换原理消除地形起伏所造成的畸变,最终完成正射校正。本发明所述方法具有自动化程度高、无需人工选取控制点、校正精度高以及生产效率高的特点。
- 遥感图像土地利用分类结果的修正方法-201510753837.8
- 许文波;周丽梅;张春雨;刘思雨 - 电子科技大学
- 2015-11-06 - 2018-11-09 - G06K9/03
- 本发明涉及图像处理领域,提供一种遥感图像土地利用分类结果的修正方法,该方法包括定义解空间、利用适于搜索的方法组织解空间、利用深度优先遍历解空间。本发明提出的技术方案更有利于分类精度低的类别的修正,而且精度修正按照有利于自动识别分类精度较低的方向运作,因此更有利于平衡各地物类别的分类准确度。
- 信息处理装置、字符位置校正方法以及信息处理系统-201410779804.6
- 宇野光雄 - 冲电气工业株式会社
- 2014-12-16 - 2018-10-16 - G06K9/03
- 本发明涉及信息处理装置、字符位置校正方法以及信息处理系统。上述信息处理装置减少包含字符的图像以及字符的识别结果中的与同一位对应的字符的位置的偏移。该信息处理装置具备存储包含字符的图像、和上述字符的识别结果的存储部,上述字符的识别结果包括上述字符的识别数据和插入在上述字符的识别数据的一侧的校正数据,上述信息处理装置还具备位置校正部,该位置校正部使上述图像中的上述字符的位置向与在上述字符的识别结果中被插入上述校正数据的一侧相反的一侧移动。
- 一种提高版式文档中字符识别率的方法和系统-201310450972.6
- 董宁;耿蕾蕾 - 北大方正集团有限公司;北京方正阿帕比技术有限公司
- 2013-09-25 - 2018-09-04 - G06K9/03
- 本发明是一种提高版式文档中字符识别率的方法和系统,将所述版式文档中同一个预定字符所对应的字符原始编码与字符标准编码进行比对得到编码比对结果,将多个所述编码比对结果进行概率统计得到概率值,将所述概率值与阈值进行比对,若超过阈值,则所述版式文档显示所述字符原始编码对照通用标准字符编码库得到的字符;否则,所述版式文档显示OCR识别后的字符。本发明通过概率统计的方法,来选择显示所述字符原始编码对照通用标准字符编码库得到的字符或者所述版式文档显示OCR识别后的字符,因此有效提高了字符识别的正确率。
- 一种基于稳定映射点夜间灯光影像间相互辐射校正方法-201610115608.8
- 刘斌;邸凯昌;辛鑫;刘召芹;张过 - 中国科学院遥感与数字地球研究所
- 2016-03-01 - 2018-08-31 - G06K9/03
- 本发明涉及一种基于稳定映射点夜间灯光影像间相互辐射校正方法,其特征在于包括以下步骤:1)读取待相互辐射校正的夜间灯光影像;2)根据读入的夜间灯光影像确定参考地区;3)确定校正参考影像;4)提取影像中的稳定映射点作为相互校正中模型参数的回归解算点;5)将回归解算点中的参考影像DN值与各待校正影像映射的DN值之间建立有理函数校正模型,计算得出校正参数;6)采用步骤5)得出的校正参数对各待校正影像进行校正。本发明可以广泛应用于未进行辐射定标的夜间稳定灯光强度影像数据搭载的业务型线扫描传感器获取的夜间灯光数据的多卫星传感器、多年际之间的相互辐射校正中。
- 单据图像的字符识别方法和装置-201710091081.4
- 赵骏 - 平安科技(深圳)有限公司
- 2017-02-20 - 2018-08-21 - G06K9/03
- 本发明涉及一种单据图像的字符识别方法和装置,所述方法包括:获取银行单据图像;识别所述银行单据图像中的字符得到识别结果;根据所述识别结果确定所述银行单据图像对应的银行标识;调用所述银行标识对应的纠错字库;根据调用的纠错字库对所述识别结果中的错误字符串进行纠错得到正确识别结果。本发明提供的单据图像的字符识别方法和装置,根据银行单据图像对应的银行标识查询相应的纠错字库,根据调用的纠错字库中的字符错误格式对银行单据图像的识别结果进行纠错,提高了识别结果的准确性。
- 一种图像切分标记方法及其装置-201611163078.0
- 兴百桥;熊蜀光;周迅溢;杨镜;白建国 - 北京新唐思创教育科技有限公司
- 2016-12-15 - 2018-06-29 - G06K9/03
- 本申请实施例提供一种图像切分标记方法及其装置,所述方法,包括:对需要进行OCR识别的图像进行整体自动标记,获得整体标记图像;对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记。本申请实施例能够对图像自动切分标记,减少人力消耗,提高了工作效率。
- 一种基于光流场的印刷字符缺陷的检测方法-201710859329.7
- 王锐;李强;张炼彬;刘金平;张雨涛;陈高磊;张超 - 苏州轩明视测控科技有限公司
- 2017-09-21 - 2018-02-16 - G06K9/03
- 一种基于光流场的印刷字符缺陷的检测方法;包括如下步骤⑴利用光流算法,将标准图像当作图像序列n,实际拍摄的产品图像当作图像序列n+1;⑵用传统匹配方式将图像序列n和图像序列n+1中的两个图像匹配套合后,图像序列n的A点的位置预定义为An(x1,y1),在图像序列n+1再运算出An+1点,记录该位置为(x2,y2);以此可以确定A点的变形为(ux,vy)=(x2,y2)‑(x1,y1);⑶光流算法通过预定义An和An+1的密集跟踪点阵列,计算出局部偏移分布图;通过局部偏移分布图跟踪印刷图案的细微变形;⑷根据所计算出的偏移分布图反向仿射图像,通过该仿射即实现了对实际产品图像局部变形的矫正效果图N+1。
- 基于OCR和双向LSTM的文字序列纠错算法、系统及其设备-201710630581.0
- 王志成;邝展豪;高磊;刘志欣;王亮 - 顺丰科技有限公司
- 2017-07-28 - 2017-12-12 - G06K9/03
- 基于OCR和双向LSTM的文字序列纠错算法、系统及其设备,所述方法包括S1,获取文字图像;S2,所述文字图像经过OCR预处理得到第一序列集合X={x0,x1,...,xm};S3,将正序的{x0,x1,…,xm}以及反序的{xm,xm‑1,...,x0}输入双向LSTM构建的编码器中得到语境向量c;S4,所述语境向量c经双向LSTM构建的解码器解码分别获得第二序列集合Y。所述系统包括图像采集模块、OCR处理模块、双向LSTM构建的编码器、双向LSTM构建的解码器。所述设备用于搭载所述方法的执行程序。
- 一种彩票识别器图像自动校准的方法和系统-201410166108.8
- 姜立斌;吴杰 - 广州市乐得瑞科技有限公司
- 2014-04-23 - 2017-11-14 - G06K9/03
- 本发明公开了一种彩票识别器图像自动校准的方法和系统,方法包括A、出厂前对接触式图像传感器进行校准;B、使用过程中对接触式图像传感器采集的彩票图像进行实时监测与计算;C、判断彩票图像内部黑区域的实时灰度值与出厂前黑校准基值的差值是否大于设定比例或者彩票图像内部白区域的实时灰度值与出厂前白校准基值的差值是否大于设定比例,若是,则执行步骤D,反之,则流程结束;D、分别以彩票图像内部黑区域的实时灰度值和白区域的实时灰度值作为黑基准数据和白基准数据,对接触式图像传感器采集的彩票图像进行重新校准。本发明能实时对接触式图像传感器进行校准,智能化程度高,校准效率较高。本发明可广泛应用于图像处理领域。
- 嵌入式电力继电压板投退状态智能识别装置及实现方法-201710065175.4
- 项文波;王兴照;阎新军;茅耀斌;胡新刚;罗兵;包强;刘永国;宫晓林;苏玉营 - 王兴照
- 2017-02-06 - 2017-07-21 - G06K9/03
- 本发明公开了一种嵌入式电力继电压板投退状态智能识别装置及实现方法,包括压板图像标记和识别器训练的部件、嵌入式图像采集与处理识别部件;压板图像标记和识别器训练部件与嵌入式图像采集和处理识别部件通过有线/无线网络交换数据。该方法体现于图像采集与处理识别部件中,它首先载入训练好的压板检测和压板状态识别模型;之后,利用摄像头采集继电压板图像,对图像进行降噪、平滑、光照均匀处理后,采用压板检测器检测出压板的位置;然后,对各个检测出的区域进行识别,以判断压板状态;最后,通过先验规则判定,确定最终压板状态并与前次状态进行校核,输出校核结果并通过本地存储模块进行保存。
- 显示控制装置、以及显示装置的控制方法-201280073181.X
- 久野道明 - 夏普株式会社
- 2012-09-03 - 2017-06-27 - G06K9/03
- 输入字符候补显示单元(1213)/输入字符串候补显示单元(1214)将被推测为用户意图输入的字符/字符串的候补作为输入字符候补/输入字符串候补进行显示,变换字符串候补显示单元(1215)显示对上述输入字符串候补进行字符变换后的变换字符串候补。
- 一种检测答题卡扫描产生二次污染的方法及装置-201611144423.6
- 刘雄敏;冯亚军;涂生华 - 深圳市海云天科技股份有限公司
- 2016-12-13 - 2017-06-16 - G06K9/03
- 本发明提供了一种检测答题卡扫描产生二次污染的方法及装置,旨在解决无法检测答题卡扫描是否产生二次污染的问题。本发明将灰度的答题卡图像划分为多个扫描区域,并对所述扫描区域以预设像素个数为单位进行划分,得到若干子图像,依次对所述扫描区域进行扫描,并统计各个所述扫描区域内像素灰度值达到预设灰度值的子图像的个数,然后基于该个数进行计算,确定该答题卡是否被二次污染。本发明所提供的方法或装置能够实时有效的检测该答题卡是否产生二次污染。
- 测试治具及测试装置-201621019738.3
- 徐露 - 南昌欧菲生物识别技术有限公司
- 2016-08-30 - 2017-05-31 - G06K9/03
- 本实用新型公开一种测试治具及测试装置。测试治具用于产线测试指纹图像质量,测试治具是导电的,测试治具包括基体及多个按压部。基体包括相互连接的多个基面。每个按压部设置在每个基面上,每个按压部形成一个测试图案,至少有两个测试图案是不相同的。上述测试治具的至少两个测试图案是不相同的,因此,测试治具可用于测试至少两种模块,进而节约了测试治具的设计成本且在使用中不易混淆。
- 人机对话平台里增加扫描纠错功能的方法-201611209548.2
- 陈勇 - 陈勇
- 2016-12-23 - 2017-04-26 - G06K9/03
- 本发明涉及软件领域,特别是涉及人机对话平台里增加扫描纠错功能的方法,自动删除噪点文件后,把扫描文件的图纸型文件变成文字型文档文件时,准确率更高。
- 光偏折检测模块及使用其检测及误差校正的方法-201510446795.3
- 蔡政道 - 政美应用股份有限公司
- 2015-07-27 - 2016-03-02 - G06K9/03
- 本发明关于一种光偏折检测模块,包含一检测载台、一面光源、至少两个扫描摄影机及一矫正标准面。检测载台用以承载待测物,面光源设置于检测载台上方,提供一平面光朝检测载台照射。至少两个扫描摄影机设置于面光源的相对侧。矫正标准面邻设于检测载台。其中,当面光源朝检测载台照射平面光后,平面光将会被待测物的表面及矫正标准面反射,至少两个扫描摄影机在接收被待测物的表面及矫正标准面所反射的平面光后,适于由一处理器进行一数值分析,以获得相关检测数据并进行误差校正作业。
- 一种指纹传感器校准方法和装置-201510681098.6
- 张强;王立中;周海涛;蒋奎;贺威 - 广东欧珀移动通信有限公司
- 2015-10-19 - 2016-01-13 - G06K9/03
- 本发明实施例公开了一种指纹传感器校准方法和装置,所述方法包括:当用户手指离开指纹传感器时,对指纹传感器进行校准,得到第一校准数据;使用所述第一校准数据和指纹传感器中的第二校准数据分别进行抓图;如果使用所述第一校准数据抓图的质量高于使用所述第二校准数据抓图的质量,则使用所述第一校准数据替换所述第二校准数据。本发明实施例提供的技术方案,可以对指纹传感器进行校准,提高了指纹传感器的识别率,延长了指纹传感器的寿命。
- 变电站设备压板快速校核系统及其校核方法-201510503128.4
- 韩晓;崔铸元;沈文涛;宋杨;张健;李俊;张乐乐 - 国网山东省电力公司日照供电公司;国家电网公司
- 2015-08-17 - 2015-12-02 - G06K9/03
- 变电站设备压板快速校核系统及其校核方法,涉及电力设备技术领域,特别属于一种针对变电站内设备压板的快速校核系统及其校核方法。其特征在于,包括图像识别模块、压板对比模块以及核对记录模块,上述压板对比模块、核对记录模块分别与服务器联结;本发明所提供的变电站设备压板快速校核系统及其校核方法,压板核对过程无需人工逐条核对,可自动与变电站压板标准位置表进行比对,效率高、快速准确,省时省力,避免了人工核对时易出差错的问题,具有提高供电安全性的积极效果。
- 电子设备和手写文档处理方法-201380000676.4
- 出宫健彦 - 株式会社东芝
- 2013-03-22 - 2015-09-30 - G06K9/03
- 本发明提供一种电子设备和手写文档处理方法。电子设备包括:显示处理单元,发送单元,接收单元。所述显示处理单元将包含通过手写而被记载的多个笔画手写文档显示于画面上。所述发送单元将所述画面上的选择范围所指定的手写部分发送到系统。所述接收单元从所述系统接收通过对所述手写部分进行整形而得到的整形结果,所述显示处理单元将所述整形结果与所述手写部分相互关联地显示于所述画面上。
- 用于在图像上重叠光学可读数据矩阵代码的系统和方法-201380029710.0
- I·弗瑞德门;N·艾娃;U·普立德 - 艾克尼特有限公司
- 2013-02-04 - 2015-03-11 - G06K9/03
- 根据当前公开的主题的例子,一种用于在图像上重叠矩阵代码的处理可包括:a)在图像上重叠框体;b)在框体内的图像上重叠矩阵代码并且提供重叠图像;c)根据命令在重叠图像上移动框体;和d)根据需要重复动作(a)、(b)和(c)。
- 字符读取装置和字符读取方法-201380006324.X
- 涩谷直纪;玉井敬一;鹈饲贤一 - 欧姆龙株式会社
- 2013-02-04 - 2014-09-24 - G06K9/03
- 本发明涉及用于使与具有动态图像拍摄功能的摄像单元(照相机2)连接的计算机作为字符读取装置发挥作用的程序(OCR应用程序1),以大幅度提高读取处理的精度为课题。应用程序(1)内的字符识别处理部(11)输入由照相机(2)生成的字符串的动态图像,并反复执行识别1帧图像中包含的字符的处理。分析处理部(12)沿着时间轴,以字符为单位对每次的字符识别结果进行对照,确定在连续实施的规定次数以上的识别处理中以超过预先设定的基准值的出现率出现的识别结果,并向输入输出接口(14)输出所确定的识别结果。
- 使用背景信息的移动装置上的光学字符辨识-201280041851.X
- 黄奎雄;太元·李;金杜勋;延奇宣;真珉豪;金泰殊;朝玄默 - 高通股份有限公司
- 2012-08-06 - 2014-04-30 - G06K9/03
- 本发明的实施例描述用于执行背景敏感OCR的方法和设备。装置使用耦合到所述装置的相机来获得图像。所述装置识别包括图形对象的所述图像的一部分。所述装置推断与所述图像相关联的背景且基于与所述图像相关联的所述背景来选择图形对象群组。使用所述图形对象群组来产生改进的OCR结果。可使用来自包含麦克风、GPS和相机等各种传感器的输入连同包含话音、触摸和用户使用模式的用户输入一起推断用户背景且选择与所述所推断的背景最相关的字典。
- 字符输入装置、字符输入方法及字符输入程序-201280021401.4
- 岩间智大 - 松下电器产业株式会社
- 2012-10-03 - 2014-01-08 - G06K9/03
- 本发明的字符输入装置包含:笔迹输入部(11),在字符填入区域(11a)中输入笔迹;字符识别部(12),根据输入给相同区域的笔迹,识别由多个字符构成的字符串;字符显示部(14),显示所识别的字符串;及控制部(13),根据所识别的字符串的字符数,进行字符串的由字符显示部(14)显示时或编辑时的控制。
- 照明系统-201180038571.9
- Y.卡兹尔;T.赫维特斯;D.菲什;E.梅默恩 - 奥博泰克有限公司
- 2011-08-02 - 2013-04-24 - G06K9/03
- 一种照明线性或高宽高比区域图像传感器的延长视场的系统和方法,包括:利用多个分立的光源提供延长场形状的照明;和向待成像的物体投射所述照明;其中在物体上投射的照明沿着物体的延长场形状在强度和辐角分布上基本空间地不变。
- 在光学字符识别(OCR)过程中的段落识别-201180013187.3
- B.拉达科维奇;S.加利奇;A.乌泽拉奇 - 微软公司
- 2011-03-08 - 2012-11-14 - G06K9/03
- 用于检测在文本图像中的段落的图像处理设备包括:输入部件,用于接收其中文本行和单词已被标识的输入图像;和页分类部件,用于把输入图像分类为第一或第二页类型。该设备还包括段落检测部件,用于把在输入图像上的所有文本行分类为开始段落行或继续段落行。设备还被提供有段落创建部件,用于创建包括两个连续的开始段落行之间的文本行,包括所述两个连续的开始段落行的第一个开始段落行的段落。已被识别的段落可以通过它们呈现的对齐的类型而被分类。例如,段落可以按照它们是左对齐、右对齐、居中对齐还是两端对齐而进行分类。
- 专利分类