[发明专利]一种从众多网络标签里生成折射词的方法无效
申请号: | 201010244308.2 | 申请日: | 2010-08-04 |
公开(公告)号: | CN102346742A | 公开(公告)日: | 2012-02-08 |
发明(设计)人: | 张占平 | 申请(专利权)人: | 张占平 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100039 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种从众多网络标签里生成折射词的方法。所属的技术领域是互联网的数据挖掘、数据检索和数据显示。许多网络文章,如博客和新闻,往往被作者或者编辑者附加一些标签。网友通过一个标签找到许多包含该标签的标签串,但是,这些标签串呈现为散乱的分布形式,网友需要对这些散乱的众多标签进行人工识别,这耗费了网友的精力;并且,在标签串非常多的情况下,网友很难从这些散乱的标签里总结出关联性最强的标签。本发明可以从这些散乱的标签里生成有用的折射词。 | ||
搜索关键词: | 一种 众多 网络 标签 生成 折射 方法 | ||
【主权项】:
一种从众多网络标签里生成折射词的方法,其特征是:由计算机处理,把一篇网络文章里附加的2‑N个标签作为一个标签串,标签串里有多少个标签就生成多少个衍生串,每个标签均有一次机会成为对应衍生串的领头词;把大量衍生串以相同的领头词为前提,添加到一个或者多个总串里,相同的跟随词累计频度,并且,同一个总串里的各个跟随词依据频度排序,从而得到一个或者多个总串。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张占平,未经张占平许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010244308.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种mp3播放器
- 下一篇:一种灯箱面框的开启结构