[发明专利]OFD文件合并展现迅捷阅读的方法有效

申请号：	202010643511.0	申请日：	2020-07-07
公开（公告）号：	CN111753501B	公开（公告）日：	2021-02-26
发明（设计）人：	何冉冉;蔡亚军;何中;顾永新;张军;戴建峰;姚童;陈明敏	申请（专利权）人：	江苏中威科技软件系统有限公司
主分类号：	G06F40/137	分类号：	G06F40/137;G06F40/151;G06F40/131;G06F40/18;G06F40/169;G06F16/16;G06F16/174
代理公司：	南京钟山专利代理有限公司 32252	代理人：	陈亮亮
地址：	226000 江苏省南通***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种OFD文件合并展现迅捷阅读的方法，获取电子表单内容、解析表单结构后获取电子表单结构体，按照固定的JSON格式进行表单元素重组，并保存到工作流引擎系统中；将多种格式文件转换成PDF版式文件；将超过系统设定大小的版式文件进行切割；将超过系统设定的阈值的那一份版式文件进行压缩，然后服务器解压OFD文件获取OFD文件夹；读取OFD文件夹下的文件、工作流电子表单与多个不同格式的文件转化的版式文件的目录后进行目录的重组；客户端将对应的文件数据进行格式解析加载后将页面进行渲染并完成展现。本发明能够阅读OFD文件、工作流电子表单与多种格式文件，文件的加载响应速度大幅提高。
搜索关键词：	ofd 文件合并展现迅捷阅读方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于江苏中威科技软件系统有限公司，未经江苏中威科技软件系统有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202010643511.0/，转载请声明来源钻瓜专利网。

上一篇：版式化后的电子表单与OFD合并展现及目录生成的方法
下一篇：麻将机洗牌方法

同类专利

一种从PDF文档中抽取表格数据和篇章结构的方法-201911017195.X
发明人：范举;韩涵;卢卫;杜小勇 -专利权人：中国人民大学
申请日： 2019-10-24 - 公布日： 2023-10-10 - 主分类号： G06F40/137
摘要：本发明涉及一种从PDF文档中自动抽取表格数据和篇章结构的方法，其步骤：从PDF文件中进行章节抽取，得到带有篇章结构的PDF文件；从带有篇章结构的PDF文件进行裁剪；对裁剪后的PDF文件进行表格抽取，同时，对章节号和章节名也进行表格抽取，得到表格；将表格以html页面进行展示，完成抽取。本发明能自动化提取数据，提供一套浏览器端的操作界面，有良好的用户交互；可以在数据处理领域中应用。

知识大纲的构建方法、装置、存储介质及服务器-202310154210.5
发明人：范瑞 -专利权人：保腾网络科技有限公司
申请日： 2023-02-17 - 公布日： 2023-07-21 - 主分类号： G06F40/137
摘要：本申请公开了一种知识大纲的构建方法、装置、存储介质及服务器。该知识大纲的构建方法包括：获取各保险产品险种的属性框架；对所述属性框架执行多层级的特征参数定义操作，形成知识大纲目录；按照所述知识大纲目录中的险种属性标签，在第三方数据平台采集得到对应的知识大纲内容；构建所述知识大纲内容中提取的特征参数与其中相应的第一知识点间的映射关系；将所述知识大纲目录、知识大纲内容和映射关系输入训练好的机器学习模型中，生成具有图谱关系的知识大纲。本申请解决了由于保险产品宣传介绍材料多以广告宣传图片搭配保险条款的形式呈现给用户造成的展现形式局限性大的技术问题。

文档处理方法及装置、电子设备、计算机可读存储介质-202210795404.9
发明人：阙文书;罗仕杰;赵飞;吴海英 -专利权人：马上消费金融股份有限公司
申请日： 2022-07-07 - 公布日： 2023-05-23 - 主分类号： G06F40/137
摘要：本公开提供了一种文档处理方法及装置、电子设备、计算机可读存储介质，该方法包括：根据待处理文档中每个文档元素的元素属性，确定每个文档元素对应的元素级别；根据待处理文档中每个文档元素对应的元素级别确定目标文档元素，并基于目标文档元素的位置确定至少一个游标区间，一个游标区间表征待拆分出的一个子文档在待处理文档中的位置范围；根据每个游标区间对待处理文档进行拆分处理，生成每个游标区间对应的目标子文档。根据本公开的技术方案，能够实现将大体积的文档自动化拆分为多个子文档，从而有效提高文档的知识内容的可查阅性、可维护性和可编排性。

文本目录生成方法及装置-202211734526.3
发明人：姬子明;李长亮;李小龙 -专利权人：北京金山数字娱乐科技有限公司
申请日： 2022-12-30 - 公布日： 2023-04-07 - 主分类号： G06F40/137
摘要：本申请提供一种文本目录生成方法及装置，其中所述文本目录生成方法包括：获取待处理文本；将所述待处理文本输入至目录分类模型进行处理，获得所述待处理文本对应的候选目录语句；根据所述候选目录语句在所述待处理文本中的属性特征，确定所述候选目录语句对应的目录等级信息；基于所述候选目录语句和所述目录等级信息创建与所述待处理文本对应的目录。实现了对不包含标题样式的文本进行目录提取，得到与文本对应的具有完整目录层级结构的文本目录，解决了对于无标题样式的文本无法提取目录的问题，提高了文本目录提取的效率和准确度。

一种文档的目录信息推荐方法及系统-202211608732.X
发明人：李锦洲;李思伟;池沐霖;张旭君;蓝建敏 -专利权人：京华信息科技股份有限公司
申请日： 2022-12-15 - 公布日： 2023-03-03 - 主分类号： G06F40/137
摘要：本发明公开了一种文档的目录信息推荐方法及系统，本发明技术方案通过用户当前行为判断用户的查找文档意图，建立临时用户画像，利用预设规则来确定用户需要提取的本地文档；从而对提取的本地文档进行解析得到目录信息推荐给用户，解决了现有技术在使用终端过程中无法根据用户的使用行为而推荐更具体、更准确的本地文档目录信息的技术问题，实现了在使用终端过程中根据用户的使用行为推荐更具体、更准确的本地文档目录信息。

PDF文档拆分方法、装置、设备及存储介质-202210939980.6
发明人：陈忠玉 -专利权人：中国平安财产保险股份有限公司
申请日： 2022-08-05 - 公布日： 2022-11-01 - 主分类号： G06F40/137
摘要：本申请提供一种PDF文档拆分方法、装置、设备及存储介质，该方法包括获取待处理文档，并基于对所述待处理文档的解析结果，获得所述待处理文档中各行文档内容对应的行标签；基于所述各行文档内容对应的行标签以及预设分割层级对应的正则表达式，确定所述各行文档内容对应的各个分割层级；基于所述各行文档内容对应的各个分割层级，对所述待处理文档进行拆分，获得至少一个拆分数据。本申请涉及数据处理领域，通过行标签和正则表达式的匹配，以及正则表达式对应的分割层级，依次对待处理文档进行拆分，能够在拆分过程中保留拆分数据在待处理文档中的顺序和层级关系，从而提高文档拆分质量。

一种中医古籍文献主题段落切分与属性标引系统-202210570602.5
发明人：李兵;张华敏;张伟娜;刘思鸿;李斌;董燕;侯酉娟;李莎莎 -专利权人：中国中医科学院中医药信息研究所;中国中医科学院中药研究所
申请日： 2022-05-24 - 公布日： 2022-08-05 - 主分类号： G06F40/137
摘要：本发明公开一种中医古籍文献主题段落切分与属性标引系统，包括图书维护模块、原书浏览模块、标题管理模块、图书加工模块、加工后浏览模块、段落管理模块、导入导出模块、标签管理模块，本发明可有机整合中医古籍图文数据，集成中医古籍术语词表、古籍知识维护等功能，结合中医古籍文本的特殊性，对中医古籍进行医理、疾病、症状、证候、治法、方剂、中药、调护等主题段落的切分，对主题段落进行主题标引，形成结构化中医古籍主题知识单元。基于主题段落和属性形成对中医古籍进行知识挖掘、大数据分析的基础数据、知识单元。本发明的技术方案提高了中医古籍文献的加工效率，实现了中医古籍等资源的知识挖掘与高效利用。

层次有序列表识别方法、装置、计算机设备和存储介质-202210156914.1
发明人：段炼;周忠诚;黄九鸣;张圣栋 -专利权人：湖南星汉数智科技有限公司
申请日： 2022-02-21 - 公布日： 2022-05-13 - 主分类号： G06F40/137
摘要：本发明涉及计算机文本处理技术领域，提供了一种层次有序列表识别方法、装置、计算机设备和存储介质，所述方法包括：对文本进行字符块分类、类序数识别以及样式块识别，输出序数信息序列；将所述序数信息序列作为观测序列，构造隐马尔可夫模型参数；利用所述隐马尔可夫模型参数解码所述序数信息序列，得到隐状态序列；根据所述隐状态序列确定所述序数信息序列的层次结构，输出层次有序列表。采用本方法能够提高层次有序列表识别的准确率。

长文本的分段方法及装置、存储介质、电子装置-202110476650.3
发明人：田维政;李昕城 -专利权人：新声科技（深圳）有限公司
申请日： 2021-04-29 - 公布日： 2022-01-28 - 主分类号： G06F40/137
摘要：本发明提供了一种长文本的分段方法及装置、存储介质、电子装置，其中，该方法包括：将源语音文档转换为文本文档；将所述文本文档转换为向量序列，其中，所述向量序列包括词向量序列和句向量序列；根据所述向量序列生成语篇树，其中，所述语篇树的每个叶子节点对应所述句向量序列的一个句向量，叶子节点的父节点对应下级至少两个叶子节点之间的连贯性关系；基于所述语篇树生成所述文本文档的段落分割点，并采用所述段落分割点对所述文本文档进行分段。通过本发明，解决了相关技术对长文本自动分段的准确率低的技术问题，实现了长文本的自动和准确分段，提高了自动识别文本的可读性。

目录提取方法及装置-201611028787.8
发明人：靳强;刘宝川 -专利权人：北大方正集团有限公司;北京北大方正电子有限公司
申请日： 2016-11-18 - 公布日： 2021-12-24 - 主分类号： G06F40/137
摘要：本发明实施例提供一种目录提取方法及装置，其中，该方法包括：获取目录的结构以及目录内容的提取路径；根据所述提取路径，获取所述目录的目录内容；根据所述目录的结构和所述目录的目录内容，生成所述目录。本发明实施例提供的目录提取方法及装置，能够用于基于可扩展标记语言xml结构化排版的期刊类出版物的目录提取。

基于正则表达式匹配算法的政策法律法规解析方法及系统-202110152861.1
发明人：邢生阳 -专利权人：浪潮云信息技术股份公司
申请日： 2021-02-04 - 公布日： 2021-05-07 - 主分类号： G06F40/137
摘要：本发明公开了基于正则表达式匹配算法的政策法律法规解析方法及系统，属于政策法律法规解析技术领域，要解决的技术问题为如何基于正则表达式算法对政策法律法规进行解析。方法包括：对具有代表性的少量政策法律法规进行人工解析，得到初始规则算法库；获取历史政策法律法规文件作为训练样本，基于上述初始规则算法库对上述训练样本进行分析，挖掘新的匹配规则，得到训练后匹配规则模型；通过上述训练后匹配规则模型对待检测的政策法律法规文件进行解析，得到解析后标准化内容。

版式化后的电子表单与OFD合并展现及目录生成的方法-202010643500.2
发明人：何冉冉;何中;蔡亚军;蒋烽;顾永新;张军;戴建峰;施东海 -专利权人：江苏中威科技软件系统有限公司
申请日： 2020-07-07 - 公布日： 2021-05-04 - 主分类号： G06F40/137
摘要：本发明公开了一种版式化后的电子表单与OFD合并展现及目录生成的方法，将绘制好的工作流电子表单转化为版式文件并保存工作流电子表单页面上的各类元素信息，其他格式文件根据不同方法转化为标准的版式文件，解压OFD版式文件获取OFD文件夹下的文件数据，读取工作流电子表单转化的版式文件、其他格式文件转化的版式文件以及OFD版式文件的目录后重组新目录，通过重组后的新目录选择展示页面，客户端将对应的文件数据进行格式解析加载后将页面进行渲染并完成展现。本发明在保证工作流电子表单、OFD版式文件以及其他格式文件独立性的基础上，实现了各类文件之间相同的阅读体验度。

OFD文件合并展现迅捷阅读的方法-202010643511.0
发明人：何冉冉;蔡亚军;何中;顾永新;张军;戴建峰;姚童;陈明敏 -专利权人：江苏中威科技软件系统有限公司
申请日： 2020-07-07 - 公布日： 2021-02-26 - 主分类号： G06F40/137
摘要：本发明公开了一种OFD文件合并展现迅捷阅读的方法，获取电子表单内容、解析表单结构后获取电子表单结构体，按照固定的JSON格式进行表单元素重组，并保存到工作流引擎系统中；将多种格式文件转换成PDF版式文件；将超过系统设定大小的版式文件进行切割；将超过系统设定的阈值的那一份版式文件进行压缩，然后服务器解压OFD文件获取OFD文件夹；读取OFD文件夹下的文件、工作流电子表单与多个不同格式的文件转化的版式文件的目录后进行目录的重组；客户端将对应的文件数据进行格式解析加载后将页面进行渲染并完成展现。本发明能够阅读OFD文件、工作流电子表单与多种格式文件，文件的加载响应速度大幅提高。

OFD文件合并展现及目录生成方法-202010643537.5
发明人：何冉冉;何中;蒋烽;蔡亚军;龚超;严伟;姚童;陈明敏 -专利权人：江苏中威科技软件系统有限公司
申请日： 2020-07-07 - 公布日： 2021-02-26 - 主分类号： G06F40/137
摘要：本发明公开了OFD文件合并展现及目录生成方法，客户端遍历若干个OFD文件，然后将若干个OFD文件复制到新的文件目录中，并进行解压；读取解压后的OFD文件夹下的文件，获取文件夹的文件路径，将若干个OFD文件页码信息和内容信息拼接为JSON数组；解析JSON数组的文件数据，并组织文件目录；文件目录中每个目录分别超链接一个文件地址路径，点击每个目录进行对应文件加载；初始化客户端展示区域的滚动条高度，跨页面、跨文件多OFD文件阅读。本发明不破坏原有OFD文件，在保证多个OFD文件独立性的基础上利用文件数据重组了新目录并增加了目录显示工具，多个OFD文件直接展示，不需要一个一个的打开OFD文件，整体的阅读体验度有效地提升。

电子表单与OFD版式文件合并展现及目录生成的方法-202010643499.3
发明人：何冉冉;蔡亚军;何中;陈明敏;王斌;何登;徐晓辉;姚童 -专利权人：江苏中威科技软件系统有限公司
申请日： 2020-07-07 - 公布日： 2021-02-05 - 主分类号： G06F40/137
摘要：本发明公开了一种电子表单与OFD版式文件合并展现及目录生成的方法，获取电子表单结构体，按照JSON格式进行表单元素重组并保存,解压OFD文件并读取OFD文件夹下的文件路径，将其文件页码信息和内容信息拼接为JSON数组,其他格式文件根据不同方法转化为标准的版式文件；在OFD文件的JOSN数组中添加电子表单元素重组后的JSON格式数据和版式文件的JSON数据，形成电子表单、OFD版式文件与其他格式文件合并后的统一目录；解析JSON数组的数据，所有文件合并成双目录修订本，统一阅读、检索和签批。本发明实现了电子表单与OFD版式文件及其他文件之间的合并阅读、签批、查阅、检索并完整保持文件原有形态，确保文件安全。

文本的数据标注方法和装置、存储介质及电子装置-202010712345.5
发明人：韩俊明;赵培;马志芳 -专利权人：海尔优家智能科技（北京）有限公司
申请日： 2020-07-22 - 公布日： 2020-10-30 - 主分类号： G06F40/137
摘要：本发明公开了一种文本的数据标注方法和装置、存储介质及电子装置。其中，该方法包括：获取待标注的文本；通过层次化的逐层串行的第一处理方式对文本标注数据，得到第一标注数据，通过不区分层次的并行处理的第二处理方式对文本标注数据，得到第二标注数据；根据预设规则对第一标注数据和第二标注数据存在差异的部分进行标注，得到第三标注数据，对第一标注数据和第二标注数据相同的部分进行标注，得到第四标注数据；将第三标注数据与第四标注数据确定为所文本的标注数据，将两种标注数据方式相结合，对比两种方式产生差异的数据再进行二次处理的目的，进而解决了现有技术中，对文本进行数据标注的准确性较低的技术问题。

一种文档正文识别方法及装置-201710150271.9
发明人：徐佳宏;朱吕亮 -专利权人：深圳市茁壮网络股份有限公司
申请日： 2017-03-14 - 公布日： 2020-03-20 - 主分类号： G06F40/137
摘要：本申请公开一种文档正文识别方法和装置，所述方法包括：确定待识别页中的所有元素；遍历所述待识别页中的所有元素，并尝试一一抛弃；确定实际抛弃元素；将所述实际抛弃元素抛弃；计算剩余元素的平均密度；判断所述剩余元素的平均密度是否大于或等于预设平均密度阈值；若是，则将所述剩余元素作为正文区元素；若否，则返回所述遍历所述待识别页中的所有元素，并尝试一一抛弃的步骤。本发明充分利用正文元素之间的距离间距较小，平均密度较大，而非正文元素与正文元素之间的距离较大，使得正文元素和非正文元素的整体平均密度较小的原理，从而通过抛弃非正文元素，得到正文元素，使得正文元素识别准确度较高。

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]OFD文件合并展现迅捷阅读的方法有效

专利文献下载