首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于统计机器翻译模型的查询扩展
引用本文:李卫疆,赵铁军,王宪刚.基于统计机器翻译模型的查询扩展[J].电子与信息学报,2008,30(3):725-729.
作者姓名:李卫疆  赵铁军  王宪刚
作者单位:哈尔滨工业大学计算机科学与技术学院语音语言教育部-微软重点实验室,哈尔滨,150001;哈尔滨工业大学计算机科学与技术学院语音语言教育部-微软重点实验室,哈尔滨,150001;哈尔滨工业大学计算机科学与技术学院语音语言教育部-微软重点实验室,哈尔滨,150001
基金项目:国家自然科学基金 , 微软亚洲研究院项目
摘    要:在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响。该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻译的查询扩展方法。通过统计机器翻译模型提取文档集中与查询词相关联的词,用以进行查询扩展。在TREC数据集上的试验结果表明:基于统计翻译的查询扩展方法不仅比不扩展的语言模型方法始终有12%~17%的提高,而且比流行的查询扩展方法-伪反馈也具有可比的平均准确率。

关 键 词:信息检索    查询扩展    语言模型    统计机器翻译
文章编号:1009-5896(2008)03-0725-05
收稿时间:2006-9-26
修稿时间:2006年9月26日

A SMT-based Approach for Query Expansion in Information Retrieval
Li Wei-jiang,Zhao Tie-jun,Wang Xian-gang.A SMT-based Approach for Query Expansion in Information Retrieval[J].Journal of Electronics & Information Technology,2008,30(3):725-729.
Authors:Li Wei-jiang  Zhao Tie-jun  Wang Xian-gang
Institution:School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, china
Abstract:In practical applications of information retrieval, such as the search engine,the query user submitted contains only several keywords usually. This will cause unmatched issue of word of relevant files and users query and have more serious negative effects on the performance of information retrieval. On the basis of analyzing of process of producing query, this paper puts forward a new method of query expansion on the basis of model of statistical machine translation. The approach extract related terms between documents and query through statistical machine translation model, then expand into query. The experiment result on TREC data collection shows the proposed method, SMT-based query expansion, has 12 - 17% of the improvement all the time more than the language model method without expanding. Compared to the popular approach of query expansion, pseudo feedback, the proposed method has the competed average precision.
Keywords:Information retrieval  Query expansion  Language model  Statistical Machine Translation(SMT)  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《电子与信息学报》浏览原始摘要信息
点击此处可从《电子与信息学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号