[发明专利]基于BERT并融合N-gram特征的实体抽取方法在审
申请号: | 202211205747.1 | 申请日: | 2022-09-30 |
公开(公告)号: | CN115270803A | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 石文翔;李光林;李军 | 申请(专利权)人: | 北京道达天际科技股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/279;G06F40/30 |
代理公司: | 北京市领专知识产权代理有限公司 11590 | 代理人: | 潘镜如 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明涉及基于BERT并融合N‑gram特征的实体抽取方法,包括步骤:将语料文本输入BERT预训练模型转换为字向量;基于语料文本构建N‑gram特征向量,所述N‑gram特征向量的维度与字向量的维度相同;将字向量和N‑gram特征向量进行融合,得到融合后的高维向量;将融合得到的高维向量经过一个全连接层后输入CRF模型中进行解码,得到语料文本中每个字符是否属于某一实体的概率分布。本发明基于BERT+CRF模型融合N‑gram特征向量,提取出来的高维向量能够包含更加丰富的特征,使模型拥有更加丰富的知识。 | ||
搜索关键词: | 基于 bert 融合 gram 特征 实体 抽取 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京道达天际科技股份有限公司,未经北京道达天际科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211205747.1/,转载请声明来源钻瓜专利网。
- 上一篇:下肢溃疡清创装置
- 下一篇:一种文档安全加解密方法