[发明专利]一种生成文本目录的方法及装置在审

专利信息
申请号: 202210750036.6 申请日: 2022-06-29
公开(公告)号: CN115048908A 公开(公告)日: 2022-09-13
发明(设计)人: 邓斌 申请(专利权)人: 珠海豹好玩科技有限公司
主分类号: G06F40/134 分类号: G06F40/134;G06F40/114
代理公司: 北京市广友专利事务所有限责任公司 11237 代理人: 张仲波
地址: 519031 广东省珠海市横琴新*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明实施例公开一种生成文本目录的方法及装置,涉及文档处理技术领域。为解决文本从目录跳转到标题所在的文本页时发生错误的问题而发明。所述生成文本目录的方法,包括遍历目标文本的各文本页,以从文本页中获取目标文本自带的目录页及目录页的排序页码,排序页码与各文本页在目标文本中的前后排序相对应;提取目录页中的标题和标题对应的标题页码;从与标题页码相等的排序页码对应的文本页中,搜索相应标题,得到第一搜索结果;根据第一搜索结果,利用标题页码作为跳转页码或对标题页码调整得到对应的跳转页码,并基于跳转页码为目标文本生成跳转目录。适用于需要避免文本从目录跳转到标题所在的文本页时发生错误,提高用户体验的应用场景。
搜索关键词: 一种 生成 文本 目录 方法 装置
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海豹好玩科技有限公司,未经珠海豹好玩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202210750036.6/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于密度分布检测自动生成锚文本的seo优化方法-202310702622.8
  • 黄柱聪 - 广州凡科互联网科技股份有限公司
  • 2023-06-14 - 2023-09-29 - G06F40/134
  • 本发明公开了一种基于密度分布检测自动生成锚文本的seo优化方法,包括以下步骤:1.获取用户输入的关键词及其跳转链接;2.获取用户编辑存储的文章富文本内容;3.清洗富文本内容,得到纯文本内容;4.计算关键词在纯文本内容中第一次出现的位置;5.关键词存在包含关系且位置相同时,过滤掉较短的关键词;6.关键词在富文本中如果已经存在链接,过滤该关键词;7.检测关键词在文章中的密度分布,过滤掉过于密集的关键词;8.根据过滤后的关键词及链接,生成对应的锚文本。本发明提供一种系统自动匹配生成锚文本的方法,有助于搜索引擎更快的爬行网站,增加收录;提高关键词排名;提升网站权重。且极大的减少了其中的人力成本、学习成本和操作失误成本。
  • 一种基于实体关系获取链接实体的数据处理系统-202211543320.2
  • 刘羽;常鸿宇;张正义;傅晓航 - 中科雨辰科技有限公司
  • 2022-12-02 - 2023-08-15 - G06F40/134
  • 本发明提供了一种基于实体关系获取链接实体的数据处理系统,系统包括初始实体列表、预设实体关系优先级集、处理器和存储由计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:将初始实体的数量与预设的实体数量阈值进行比对,当初始实体的数量大于等于预设的实体数量阈值时,获取初始实体列表对应的关键实体集和关键实体集对应的关键实体优先级集,根据关键实体优先级集,获取中间实体集和中间实体集对应的中间优先级集,根据中间优先级集,获取中间实体对应的链接实体列表;本发明能够基于实体关系和实体关系与实体关系之间的关联程度,对实体优先级进行处理,获取到更加精确的实体优先级,提高了获取链接实体的准确度。
  • 一种实体链接方法及装置、存储介质、计算机设备-202310460767.1
  • 张倩 - 平安科技(深圳)有限公司
  • 2023-04-23 - 2023-08-11 - G06F40/134
  • 本发明公开了一种实体链接方法及装置、存储介质、计算机设备,属于数字医疗技术领域,主要解决现有技术中实体链接的准确度不高的问题,包括:确定输入文本中待链接实体的多个候选实体,所述候选实体绑定有实体描述信息和实体关联关系;对所述输入文本与所述实体描述信息进行文本匹配处理,得两者之间的信息匹配度,并确定所述输入文本与所述实体描述信息之间的上下文相关度;基于所述实体关联关系对所述候选实体的平稳度进行评估,得到所述候选实体的平稳概率值;基于所述信息匹配度、所述平稳概率值和所述上下文相关度确定所述候选实体的链接评估结果,并基于所述链接评估结果将所述待链接实体链接至目标实体名称。
  • 候选实体生成方法、装置、存储介质及电子设备-202310582057.6
  • 孙俊;龙斌 - 匀熵智能科技(无锡)有限公司
  • 2023-05-23 - 2023-08-08 - G06F40/134
  • 本发明涉及实体链接技术领域,具体公开了一种候选实体生成方法、装置、存储介质及电子设备,包括:根据训练好的孪生BERT模型编码器将知识库中的所有实体均编码为向量,获得知识库实体向量空间;获取待生成候选实体的实体指称项及其上下文文本,并根据训练好的孪生BERT模型编码器对待生成候选实体的实体指称项及其上下文文本均进行编码获得目标向量;在知识库实体向量空间中检索获得与目标向量近邻的k个向量;将知识库实体向量空间中的k个向量所对应的实体作为候选实体;其中所述孪生BERT模型编码器为根据正样本数据集、负样本数据集和知识库进行训练获得。本发明提供的候选实体生成方法获得的实体链接结果准确性高。
  • 实体链接方法及设备-202211659704.0
  • 王述;边超;龚笠;朱文焕 - 北京字跳网络技术有限公司
  • 2022-12-22 - 2023-05-05 - G06F40/134
  • 本公开实施例提供一种实体链接方法及设备,该方法包括:确定待处理文本和候选实体的实体义项文本中至少一者的关键信息,所述待处理文本和所述实体义项文本构成句子对;确定所述关键信息对应的标签;根据所述标签生成句子对关键信息标签表示;将所述句子对关键信息标签表示输入到实体链接模型,由所述实体链接模型根据所述句子对关键信息标签表示预测所述候选实体与所述待处理文本之间的链指关系。实现了由关键信息标签表示作为实体链接模型预测候选实体与待处理文本之间的链指关系的辅助信息,便于实体链接模型确定不同关键信息之间的交互信息。提高了实体链接模型对上述链指关系进行预测的效率和准确度。
  • 一种基于上下文消歧的高效表格实体链接方法-202310126466.5
  • 汪鹏;李欣和;王树鑫;周伟;洪天宇;张公瑞;蒋承欢;陈希烨 - 东南大学
  • 2023-02-17 - 2023-05-02 - G06F40/134
  • 一种基于上下文消歧的高效表格实体链接方法,首先,对表格数据进行结构分析,提取主题列索引与非主题列索引。其次,通过搜索引擎抓取的网页标题来过滤表格单元格噪声,实现拼写纠错。然后,查询知识图谱以获得实体链接的候选实体,并为每个表格额外转储一份预处理文件。接着,基于非主题列单元格与知识图谱中实体属性值间的相似度对候选实体进行初步评分,最后,根据候选实体排序结果得到表格数据在知识图谱中的对应实体,即得到表格实体链接结果。本发明具有优秀的实体链接性能和高效的实体查询效率,能有效解决大规模表格数据的实体链接问题。
  • 实体链接方法及设备-202211659716.3
  • 王述;龚笠;朱文焕;边超 - 北京字跳网络技术有限公司
  • 2022-12-22 - 2023-03-21 - G06F40/134
  • 本公开实施例提供一种实体链接方法及设备,该方法包括:获取待处理文本的第一文本向量以及候选实体的实体义项描述的第一候选实体向量;根据第一文本向量与第一候选实体向量之间的相关性,对第一文本向量和第一候选实体向量进行相关性增强的再编码,得到第二文本向量和第二候选实体向量,相关性包括相关和不相关;确定第二候选实体向量与第二文本向量之间的交叉融合特征;基于至少一个候选实体分别与第二候选实体向量之间的交叉融合特征,确定与待处理文本相匹配的链接实体。实现了由第一文本向量与第一候选实体向量之间的语义交互结果来确定与待处理文本对应的链接实体,从而由上述方法得到的与待处理文本匹配的链接实体的准确度较高。
  • 一种基于杂志的人名实体链接方法-202211494547.2
  • 张开放;甘云锋;江敏;高雁冰 - 杭州数澜科技有限公司
  • 2022-11-25 - 2023-03-21 - G06F40/134
  • 本发明公开了一种基于杂志的人名实体链接方法,包括BERT Encode编码器、实体分类模块和实体链接模块构成,BERT Encode编码器与实体分类模块、实体链接模块联通。本发明通过对时尚传统纸媒数据(杂志、期刊等)和时尚新媒体数据(公众号文章等)首先进行数据预处理操作,得到统一处理后的数据。然后对数据按照一定的比例进行切分为训练集、验证集和测试集,使用训练集进行模型的训练,使用验证集进行模型的验证,再将测试集送入训练好的实体生成模型获得候选人名实体集合。紧接着将候选实体集合和领域知识库送入实体消歧模型,具体是通过计算实体指称与候选实体之间的相似度并进行相似度排序来选择可能的候选实体,从而提升实体链接的准确性。
  • 超链接标记方法和装置、文本分类方法和装置-201810091591.6
  • 王星雅;万伟 - 腾讯科技(深圳)有限公司
  • 2018-01-30 - 2023-01-03 - G06F40/134
  • 本申请涉及一种超链接标记方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取待标记的文本;确定所述文本所属的类别;所述类别用于确定与所述类别相匹配的分词方式,并按照所述分词方式对所述文本分词,得到词序列;获取链接地址,所述链接地址指向根据所述词序列检索得到的检索结果;将所述链接地址标记为所述文本的超链接。本申请提供的方案可以提高超链接标记的准确性。
  • 一种生成文本目录的方法及装置-202210750036.6
  • 邓斌 - 珠海豹好玩科技有限公司
  • 2022-06-29 - 2022-09-13 - G06F40/134
  • 本发明实施例公开一种生成文本目录的方法及装置,涉及文档处理技术领域。为解决文本从目录跳转到标题所在的文本页时发生错误的问题而发明。所述生成文本目录的方法,包括遍历目标文本的各文本页,以从文本页中获取目标文本自带的目录页及目录页的排序页码,排序页码与各文本页在目标文本中的前后排序相对应;提取目录页中的标题和标题对应的标题页码;从与标题页码相等的排序页码对应的文本页中,搜索相应标题,得到第一搜索结果;根据第一搜索结果,利用标题页码作为跳转页码或对标题页码调整得到对应的跳转页码,并基于跳转页码为目标文本生成跳转目录。适用于需要避免文本从目录跳转到标题所在的文本页时发生错误,提高用户体验的应用场景。
  • 一种基于实体上下文语义交互的实体链接方法-202010294780.0
  • 王伟;许峻峰;张焱;刘刚;孙成胜;敖佳 - 中国电子科技网络信息安全有限公司
  • 2020-04-15 - 2022-09-13 - G06F40/134
  • 本发明涉及数据处理技术领域,本发明公开了一种基于实体上下文语义交互的实体链接方法,结合待链接实体的上下文信息和知识库实体的属性描述信息,采用Transformer结构编码知识库实体文本,采用LSTM网络编码查询实体文本,并对知识库实体文本和查询实体文本的语义编码采用细粒度词级注意力交互来捕捉文本局部相似信息。本发明在利用LSTM和Transformer网络分别编码两段文本的基础上,增加了词级别细粒度语义特征交互,丰富了文本的细节语义特征,在验证集和测试集上达到了89.1%和88.5%的准确率,分别超过了目前主流的实体链接编码模型CNN和LSTM网络2.1%和1.7%,表明了本发明的实体链接方法的有效性。
  • 一种文档处理方法、装置及存储介质-202210692791.3
  • 齐雅楠 - 北京金堤科技有限公司
  • 2022-06-17 - 2022-09-09 - G06F40/134
  • 本发明公开了一种文档处理方法、装置及存储介质,所述方法包括:获取目标文档的文件名称;根据所述文件名称确定所述目标文档的文件参数,并基于文件参数和文件名称,拼接出访问链接;根据访问链接获取目标文档的文档内容;根据所述文档内容确定与所述目标文档对应的转换文档,并基于所述转换文档进行页面展示。由此,本发明实施例在推荐PDF文档时,只返回文档名称,避免返回完整的超链接而引起的盗取下载,完整文档链接只有服务端知道,通过node服务将PDF文档流返回前端,前端再将其转化为其他格式展示即可,一方面,可以让用户方便地查看推荐PDF的文献内容,不影响用户参考引用,另一方面,也有效保证了推荐的PDF文献的安全,防止被盗下载,一举两得。
  • 知识图谱问答问句实体链接方法、装置、设备及介质-202210649330.8
  • 汪美玲 - 工银科技有限公司;中国工商银行股份有限公司
  • 2022-06-08 - 2022-08-09 - G06F40/134
  • 本公开提供了一种知识图谱问答问句实体链接方法,可以应用于人工智能技术领域。该方法包括:获取用户问句;提取用户问句中的实体提及;从知识图谱中检索出与实体提及匹配的T个候选实体;获取T个候选实体中每个候选实体的实体差异化编码表示,其中,实体差异化编码表示是基于候选实体的编码表示与候选实体的N个相似实体的编码表示的差异得到的;基于实体提及的编码表示与T个候选实体中每个候选实体的实体差异化编码表示,计算实体提及与每个候选实体的第二相似度;以及确定T个候选实体中第二相似度最大的候选实体,为实体提及的链接实体。本公开还提供了一种知识图谱问答问句实体链接装置、设备、存储介质和程序产品。
  • 一种文本编辑方法、装置、电子设备和存储介质-202210269588.5
  • 孙鑫;王丹;王佳欣 - 北京字节跳动网络技术有限公司
  • 2022-03-18 - 2022-07-15 - G06F40/134
  • 本公开实施例公开了一种文本编辑方法、装置、电子设备和存储介质,该系统包括:在针对文本内容中的目标词添加内链时,显示内链添加界面,所述目标词为多义词;在所述内链添加界面展示所述目标词对应的各义项词的第一描述信息,所述第一描述信息用于表征所述义项词区别于其它义项词的特征信息;响应于针对目标义项词的触发操作,在所述内链添加界面上展示所述目标义项词的第二描述信息;其中,所述目标义项词为所述各义项词中的一个,所述第二描述信息的信息量大于所述第一描述信息的信息量。本公开提供的文本编辑方法,实现了针对文本内容中的多义词快捷添加内链的目的,有助于提升编辑效率。
  • 信息处理方法、装置、电子设备和存储介质-202210253716.7
  • 董航宇;岑之卉 - 北京字跳网络技术有限公司
  • 2022-03-15 - 2022-06-17 - G06F40/134
  • 本公开提供一种信息处理方法、装置、电子设备和存储介质。其中,信息处理方法,包括:在即时通讯客户端的消息输入区接收目标链接;响应于目标链接为外部链接,基于外部链接生成目标在线文档;响应于发送目标链接,向目标用户发送目标在线文档,从而将外部链接的内容转换为目标在线文档,解决了用户在分享外部的内容时无法进行编辑、评论等操作造成工作不便的问题。
  • 实体链接方法、构建方法、装置及存储介质-202210266043.9
  • 王子奕;刘嘉伟;鞠剑勋;李健 - 上海携旅信息技术有限公司
  • 2022-03-17 - 2022-05-10 - G06F40/134
  • 本公开实施例中提供实体链接方法、构建方法、装置及存储介质,在实体链接方法中,分别输入用户的查询文本至前缀树和命名实体识别模型,以得到第一实体提及结果和第二实体提及结果,并合并第一实体提及结果和第二实体提及结果得到合并实体提及结果;基于所述合并实体提及结果召回候选实体集;基于实体消歧模型,根据所述候选实体集中的每个候选实体的特征,以预测所述候选实体为所述查询文本的链接结果的概率;基于各所述候选实体的概率确定目标实体。通过结合并行的前缀树和命名实体识别模型的实体提及结果,以提升所包含实体的全面度,并利用基于实体消歧模型等机器学习模型来提升预测的准确性,从而提升实体链接结果的准确性,提升用户体验。
  • 实体链接方法、装置、电子设备及存储介质-202111665522.X
  • 孙剑;徐俊;高建伟;谢睿 - 北京三快在线科技有限公司
  • 2021-12-30 - 2022-05-03 - G06F40/134
  • 本申请实施例提供了实体链接方法、装置、电子设备及存储介质方法,该方法包括:获取目标文本中的每一个待链接对象对应的关键信息,待链接对象对应的关键信息包括:待链接对象的上下文信息、待链接对象的每一个候选实体的关键信息,候选实体的关键信息包括:候选实体的描述信息;从候选实体集合中确定出关键候选实体,以及获取所述关键候选实体的地址信息,其中,候选实体集合通过对每一个所述待链接对象的候选实体进行聚合而得到;对于每一个待链接对象,利用实体消歧模型基于待链接对象对应的关键信息、关键候选实体的地址信息,确定待链接对象的所有候选实体中的、可以与待链接对象进行链接的目标实体。
  • 移动设备上的模拟超链接-202110557172.9
  • 马修·谢里菲;戴维·彼得鲁 - 谷歌有限责任公司
  • 2016-11-17 - 2021-09-03 - G06F40/134
  • 公开了移动设备上的模拟超链接。系统和方法模拟在屏幕上显示的常规内容中的超链接。示例方法可以包括响应于检测到模拟超链接指示,根据显示在计算设备的显示器上的内容生成居中选择,将居中选择提供给模拟超链接模型,该模拟超链接模型预测给定居中选择的操作,以及使用与移动应用程序相关联的意图来发起操作。模拟超链接模型还可以根据居中选择提供使用意图参数的智能选择。另一种方法包括:识别具有超链接白名单网站的文档;使用该文档生成模拟超链接模型的正面训练示例,每个正面训练示例具有居中选择、网站、和映射到所述网站的移动应用程序;以及使用正面训练示例来训练模拟超链接模型,以预测给定居中选择的移动应用程序的操作。
  • 以评论为中心的新闻阅读器-201580043166.4
  • 韦福如;周明;刘洋;曹自强;黄绍晗;董力;崔磊 - 微软技术许可有限责任公司
  • 2015-05-29 - 2020-11-24 - G06F40/134
  • 用于提供以评论为中心的新闻阅读器的方法和系统。配置允许实况评论与新闻或类似的网站内容一起呈现。当用户在用户的计算机设备(例如,移动设备)上呈现新闻文章的浏览器中上下滚动时,经链接的评论被显示在所选区域中。所显示的评论自动改变以适应用户当前正在阅读新闻文章的什么部分(段落,语句)。同时,用户可发布他们自己的评论而无需前进到浏览器的分开部分,从而使观看者节省了动作并改善了用户的体验。在评论被输入时,用户的系统或远程服务器将评论连同文章或用户在文章中所处的位置一起记录。
  • 一种对PDF药品文档进行超链接编辑的方法和系统-202010445799.0
  • 唐裕辉;郝华;魏巍;包卿 - 浙江明度智控科技有限公司
  • 2020-05-25 - 2020-11-13 - G06F40/134
  • 本发明公开了一种对PDF药品文档进行超链接编辑的方法,包括:对导入的PDF药品文档内容进行识别;根据待处理超链接项目的特征编辑相应的匹配规则;根据所述匹配规则形成链接项目集合,所述链接项目集合包括各项目的源文件属性、目标文件属性、以及源文件与目标文件对应关系;遍历各经过预处理的PDF药品文档的链接项目集合,验证并删除无效目标文件属性后创建剩余的各超文本链接。实现了多个文档自动编辑超链接,能适应各类文档的超链接编辑要求,极大的提高了药品申报的速度。
  • 实体链接方法、装置、设备及存储介质-202010125376.0
  • 高丛;陈孝良;苏少炜 - 北京声智科技有限公司
  • 2020-02-27 - 2020-06-26 - G06F40/134
  • 本申请公开了一种实体链接方法、装置、设备及存储介质,属于计算机技术领域。本申请实施例通过对文本信息中的实体指称进行匹配得到候选实体信息,从而通过候选实体信息来替换实体指称得到候选文本信息,通过对候选文本信息进行特征提取,判定语义合理性,来确定实体链接结果,通过替换步骤,将候选实体信息和实体指称在文本信息中的上下文信息结合在一起进行特征提取和语义合理性判断,在确定实体链接结果是否准确时,直接利用到了上下文信息,在语义合理性分析时分析更准确,得到的实体链接结果也更准确。
  • 包括多色图片的文件的展示方法、装置和计算机设备-202010125466.X
  • 李静 - 中国平安财产保险股份有限公司
  • 2020-02-27 - 2020-06-26 - G06F40/134
  • 本申请揭示了一种包括多色图片的文件的展示方法、装置、计算机设备和存储介质,所述方法包括:获取指定文件;获取所述第一多色图片;选出第二多色图片,并计算第一多色图片和第二多色图片的相似程度值;若所述相似程度值不大于相似程度阈值,则对所述第一多色图片进行图片切分处理;生成n个单色子图片;在所述指定文件中删除所述指定链接,并对删除后留下的空位采用叠加所述n个单色子图片的方式进行填补,其中所述n个单色子图片被设置为同时展示;展示所述指定文件。从而克服了传统技术无法在只能显示单色图片的文件中,展示多色图片的缺陷。
  • 一种多模态实体链接方法和实体链接系统-201911101194.3
  • 徐叶强;王峰;窦任荣;吴云标;谢海博 - 广州爱学信息科技有限公司
  • 2019-11-12 - 2020-04-10 - G06F40/134
  • 本发明公开一种多模态实体链接方法及系统,其链接方法包括以下步骤:生成物体识别模型:采集标注图片,对采集标注后的图片进行预处理;构建物体识别模型;训练物体识别模型;生成实体链接库:采集实体语料,关联实体与图片标签,得到实体链接库;实体链接:对拍摄获取的图片进行预处理,再输入到物体识别模型,得到物体识别结果,把物体识别结果在实体链接库中进行检索,得到实体的文本结果。本发明通过图片的物体识别来达到实体消歧的目的,并实现了由图片到文本的多模态的实体链接。具体是通过摄像设备,拍摄生活中常见的物体,然后对图片里的物体进行物体识别,最后把物体识别结果链接到对应的实体中,从而实现从图片到文本多模态的实体链接。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top