[发明专利]基于三元组森林的实体关系联合抽取方法及系统在审
申请号: | 202211199819.6 | 申请日: | 2022-09-29 |
公开(公告)号: | CN115687638A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 程学旗;靳小龙;郭嘉丰;王炫力;席鹏弼;廖华明 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/211;G06F40/289;G06N3/0455;G06N3/044;G06N3/048;G06N3/047;G06N3/08 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;陈思远 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于三元组森林的实体关系联合抽取方法和系统,包括:获取待实体关系抽取的语料,得到句子及其对应的词序列;将词序列输入BERT模型,BERT模型对词序列进行分词,得到子词序列,使用BERT模型对子词序列进行编码,得到句子的分布式表示;将分布式表示输入CRF模型,标注句子中实体,得到实体的向量表示;将实体向量输入,通过TransformerDecoder模块中多头注意力机制获得实体向量中包含的实体间交互信息、实体和输入句子间交互信息的隐层向量;将隐层向量作为Tree‑RNN的初始状态和初始隐层单元,输入实体表示至Tree‑RNN,从Tree‑RNN的根节点的头实体生成其所参与的关系,根据头实体及其对应的关系,选择其尾实体,从而生成重叠的三元组树,再进一步解码得到实体关系三元组。 | ||
搜索关键词: | 基于 三元 森林 实体 关系 联合 抽取 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211199819.6/,转载请声明来源钻瓜专利网。