信息检索相关论文例文,与信息检索中的查询扩展技术综述相关论文格式

时间:2020-07-05 作者:admin
后台-系统-系统设置-扩展变量-(内容页告位1-手机版)

本论文是一篇信息检索相关论文格式,关于信息检索中的查询扩展技术综述相关在职毕业论文范文。免费优秀的关于信息检索及计算机应用及数据结构方面论文范文资料,适合信息检索论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

摘 要:查询扩展技术是提高信息检索查准率和查全率的有效手段.文章介绍了几种重要的查询扩展技术的工作原理,并对他们的算法效率进行了分析和比较.

关 键 词:信息检索;查询扩展;相关反馈

中图分类号:TP391.3

信息检索中由于一般用户在检索时输入的关 键 词过于短少,在信息比对上极易造成检索结果与用户需求不匹配的查准率低和检索结果不全面、漏查的查全率低下的问题.查询扩展是提高检索性能的有效手段,它把与原查询相关的语词、概念等以逻辑或的方式添加到原查询中,构造一个新的查询[1].扩展后的新查询可以提供更多有利于判断文档相关性的信息,从而改善查准率和查全率.查询扩展技术的有效性吸引了很多学者进行研究,其中主要的方法有基于全局的、基于相关反馈的、基于伪相关反馈的和基于用户查询日志的等几种.

1基于全局分析

基于全局的查询扩展方法是一种早期较常采用的技术.该技术需要对全部文档集中的词或词组进行相关度的计算分析,然后排序选择相关度最高的词进行扩展.在计算相关度时一般根据共现率(即两个词或词组同时出现在一篇文章中的频率),并将结果保存在一种特殊的类似同义词字典的数据结构中.当检索开始时,系统首先根据查询词在字典中查找与该查询词相关度最高的字词,并将其添加到原查询中扩展生成新的查询.全局分析的主要的技术有以下几种词:

1.1基于词的聚类算法

在较早的信息检索系统中采用的基本算法就是SparckJones提出的对词进行聚类的算法,它根据查询词的共现性来实施词的聚类,从而进行扩展.之所以能够这样判断的依据是假设以下论断成立,即如果来源于检索文档源中的两个语词相关,则它们在文档源集合中共同出现的概率肯定就大.随着Voorhees、Hunag等人数十年的深入研究,我们在获得研究成果的同时也发现:聚类虽然能提高检索性能,但是它对词的歧义性不能正确的判断和分析处理,当遇到检索中的检索词包含多重涵义时,采用词的聚类算法及有可能将它们分配到各不相同的聚类中,造成查询结果偏离题意,降低了查询性能.


如何撰写论文综述
播放:24081次 评论:4309人

1.2潜语义索引(LSI)

潜在语义索引技术基于简单高效的向量空间模型(VSM).在向量空间模型中,文档和查询都被映射为向量空间中的一个点,并用n维向量表示出来.而文档与查询间的相似度就可以定义为查询向量和文档向量之间的夹角的余弦值.LSI使用奇异值分解技术SVD来发现检索词之间的关联关系,减少向量空间的维数.变换后的文档可用于比较两文档的相似度并找出与查询最匹配的前面N个词,即为查询扩展词.该方法最大的缺点是n维空间带来了巨大的计算开销,提高检索效率的效果不明显,对歧义词的问题仍然不能很好地解决,降维后的空间选择也缺乏行之有效的方法.

信息检索中的查询扩展技术综述参考属性评定
有关论文范文主题研究: 关于信息检索的论文范文集 大学生适用: 学院论文、学年论文
相关参考文献下载数量: 81 写作解决问题: 如何写
毕业论文开题报告: 论文任务书、论文设计 职称论文适用: 刊物发表、职称评副高
所属大学生专业类别: 如何写 论文题目推荐度: 最新题目

1.3基于相似词典

为了解决检索词的歧义带来的检索性能下降问题,采用了将查询概念化的处理.在该处理过程中要求所选的扩展词要与全部原查询检索词同现,而不再是只比较单个的检索词,实验证明用多个查询检索词同时共现计算出的相似性结果可以极大降低单个检索词的歧义性风险,而且检索效果更佳.所以进行扩展词选择时,必须先计算比对文档集中的关 键 词与所有的查询词的共现度,通过加权合计计算出每个关 键 词和整个查询的相似性,然后建立相似性叙词表,选择相关度最高的概念中的关 键 词作为查询扩展词.不过获得概念需要对每一组词计算共现率,极大地增加了计算的工作量.


本篇论文地址:http://www.sxsky.net/benkelunwen/06062176.html

全局分析的优势是通过分析词间关系建立同义词词典,通过查找词典可以高效地实施查询扩展.但是随着文档素材的不断扩大,文档更新的速度日益加快,建立基于全局的同义词词典所耗费的时间和空间非常大.所以现在的查询扩展研究主要集中在与之对应的局部分析上.

2基&

后台-系统-系统设置-扩展变量-(内容页告位2-手机版)
声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:123456789@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。
后台-系统-系统设置-扩展变量-(内容页告位3-手机版)