[发明专利]一种适用于网络学术资源的检索系统无效
申请号: | 200910312854.2 | 申请日: | 2009-12-31 |
公开(公告)号: | CN101930447A | 公开(公告)日: | 2010-12-29 |
发明(设计)人: | 刘玉良;李连栓 | 申请(专利权)人: | 北京中加国道科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 网络 学术 资源 检索系统 | ||
技术领域
本发明是一种适用于网络学术资源的,把网络学术资源重要度和相关度结合起来的检索系统。在学科上属于现代图书馆学,情报学,信息管理学的范畴。
背景技术
网络学术资源就是人们以网络为载体用文字、图形、符号、音像等手段记录下来的科技活动或科技知识,简述为以网络为载体的科技文献,或互联网上和学术有关的数字化资源。网络学术资源数量巨大,种类繁多,学科覆盖面广,并且具有一定的学术价值和科技情报价值,是传统学术资源,例如学术期刊的重要补充。
一方面每条网络学术资源的学术价值和科技情报价值各不相同,人们总是希望找到的资源具有较高的学术价值或情报价值。而另一方面,由于网络学术资源的种类多,数量大,并且缺乏人工评价环节,依靠传统的技术实现的检索系统返回的检索结果质量参差不齐,需要用户花很大精力对搜索结果的价值进行甄别。针对这一难题,本系统对传统的检索系统进行改造,把网络学术资源重要度和相关度结合起来,既考虑相关性,也考虑重要性。其基本思想是为每条网络学术资源计算一个反映其质量的重要度指标,然后用其重要度修正传统的相关度指标,并以修正后的相关度作为搜索结果排序的依据。
发明内容
本发明揭示了一种适用于网络学术资源的检索系统,属于现代图书馆学,情报学,信息管理学的范畴。本系统为每条网络学术资源都计算其重要度,用它修正传统的相关度指标;根据修正相关度对检索结果进行降序排列,保证将相关并且重要的检索结果优先呈现给读者。
首先,每一条入库的网络学术资源都预先计算出了其重要度参数。重要度参数依赖于该记录:基础参数;被检索的次数;被下载的次数;用户对其评价等指标。该指标会周期更新。当读者检索时,每条记录均有一个确定的重要度值备查。
第二,当一个读者发出检索请求时,以检索词在记录中的出现频次除于该记录中分词总数作为该记录相对于该查询词的相关度。
第三,检索系统根据每条记录的重要度值,通过一个设定的加权运算公式,对第二条中的每条记录的相关度进行加权修正,得到一个包含了重要度因子的修正相关度。
第四,在检索系统给出检索结果列表时,总是按照包含了重要度因子的修正相关度进行降序排列,使得最相关、最重要的检索结果优先呈现给读者。省去读者大量翻页搜寻的麻烦,体现系统最佳的易用性。
本方案的优点
针对网络学术资源信息检索的特点,本方案使用了基于网络学术资源重要度的修正相关度这个新参数,使得每次检索都能够将最相关也是最重要的结果优先呈现给读者。
1、网络学术资源的重要度参数被利用在检索系统中。以往的数据库信息检索只关注相关度这一个参数,只要检索结果与检索词相关度高即可。本方案使用了修正相关度这个新参数,使得网络学术资源的检索更符合读者的主观意图。
2、节省读者在面对大量检索结果时需要甄别好坏资源的时间。本方案能将最相关也是最重要的检索结果优先呈现读者,省去读者在检索结果页中大量翻页搜寻重要文献的烦恼,体现了系统良好的易用性。
具体实施方案
1、每一条入库的网络学术资源都预先计算出了其重要度值I(d)。d表示网络学术资源,I(d)大于0,小于1,并且是网络学术资源d重要性的单调非递减函数;
2、当一个读者发出检索请求时,用Q表示;他输入的检索词通过系统运算,均能算出数据库每条记录内的检索词占总分词数的比值,即每条记录的相关度,用R(d,Q)表示;R(d,Q)大于等于0,小于1;
3、系统根据每条记录的重要度值I(d),通过一个设定的加权运算公式,比如都按100%的权重相乘,即,R’(d,Q)=I(d)×R(d,Q),对每条记录的相关度进行加权修正,得到一个包含了重要度因子的修正相关度R’(d,Q);
4、在检索系统给出检索结果列表时,总是按照修正相关度R’(d,Q)进行降序排列,使得最相关、最重要的检索结果排在最前面,优先呈现给读者;
5、实现了用网络学术资源重要性调整检索结果的目的。当R(d,Q)相似时,I(d)大的排列靠前;当I(d)相似时,仍然是R(d,Q)大的排列靠前;当R(d,Q)、I(d)都不相似时,R’(d,Q)大的排列靠前,完全体现修正相关度价值。
6、本系统同时保留了读者选择完全按照传统的相关度值R(d,Q)进行检索结果排序的权利,体现了一切面向用户、用户价值最大化的设计理念,这里不做赘述。
附图说明
附图是一种适用于网络学术资源的检索系统的原理图。详见《说明书附图》。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中加国道科技有限公司,未经北京中加国道科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910312854.2/2.html,转载请声明来源钻瓜专利网。