[发明专利]一种网络信息分类体系构建方法有效
申请号: | 201811138261.4 | 申请日: | 2018-09-28 |
公开(公告)号: | CN109460467B | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 顾爽;胡岩峰;杨婷;许舟军;焦程波;潘月浩;金晨;乔雪;刘振 | 申请(专利权)人: | 中国科学院电子学研究所苏州研究院 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 32200 南京经纬专利商标代理有限公司 | 代理人: | 田凌涛 |
地址: | 215000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种网络信息分类体系构建方法,将现有两种分类体系的优点集于一身,设计全新构建方法,采用Synonyms将词语映射到低维向量空间,通过词向量空间距离度量词语相似性,弥补了单一的one‑hot词向量语义信息的不足,从而能够获得更全面的相似类别词;并采用传统文献分类方法和自编分类方法集合的方式,弥补了文献分类分类方法领域适应性不足、以及自编分类方法科学性不强的缺陷,从而能够构建科学专业的分类体系;而且提出结合用户业务需求和预设筛选规则,对领域术语关联解释,参考提示进行类别体系的选择、删除、增加、修改,构建最终分类体系,使得分类体系更加科学、准确和专业。 | ||
搜索关键词: | 分类体系 构建 网络信息分类 体系构建 文献分类 词向量 分类 词语 用户业务需求 空间距离 类别体系 领域术语 筛选规则 相似类别 向量空间 语义信息 映射 低维 度量 预设 删除 集合 提示 关联 参考 | ||
【主权项】:
1.一种网络信息分类体系构建方法,其特征在于:首先初始化目标信息类型领域的类别分类体系数据库为空,然后依次针对目标信息类型领域下的各个目标类别词,分别执行如下步骤:/n步骤A.查找类别分类体系数据库中是否存在目标类别词,是则返回对应该目标类别词的分类体系,该目标类别词的执行步骤结束;否则进入步骤B;/n步骤B.应用预设中文近义词查询工具,结合工具自带词汇语库,以类别词之间的空间距离作为类别词之间的相似度,获得对应该目标类别词的各个相似类别词,并结合该目标类别词,组建该目标类别词所对应的待查询类别词集合,然后进入步骤C;/n步骤C.分别针对待查询类别词集合中的各个类别词,获得类别词分别对应各个指定现有分类文献当中的分类体系,然后进入步骤D;/n步骤D.分别针对待查询类别词集合中的各个类别词,将类别词所对应的各个分类体系进行融合,获得类别词所对应的融合分类体系,然后进入步骤E;/n步骤E.针对待查询类别词集合中各个类别词分别所对应的融合分类体系进行融合,作为该目标类别词所对应的分类体系,并加入至目标信息类型领域的类别分类体系数据库当中。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院电子学研究所苏州研究院,未经中国科学院电子学研究所苏州研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811138261.4/,转载请声明来源钻瓜专利网。