出版时间:2012-5 出版社:高等教育出版社 作者:何靖,李晓明 页数:142 字数:180000
Tag标签:无
内容概要
《搜索引擎效果评测:基于用户点击日志分析的方法与技术》主要介绍评估搜索引擎质量的方法与技术。评估搜索引擎质量的技术通常可分为三类:基于Cranfield范式的评测方法、基于用户研究的评价方法和基于用户隐反馈的评价方法。其中,基于隐反馈的评价方法因其自动性和准确性,得到学术界和工业界越来越多研究者的关注。在用户隐反馈中,最容易获取、使用最广泛的是用户的点击行为,它们可以被搜索引擎自动收集起来,进而被深入分析。《搜索引擎效果评测:基于用户点击日志分析的方法与技术》着重介绍基于用户点击日志分析的搜索引擎评价方法。
《搜索引擎效果评测:基于用户点击日志分析的方法与技术》虽然为学术专著,但文风流畅,语句通俗易懂,在一些难点上一般都给予了必要的铺垫,因而不仅适合已在搜索引擎领域从事研究和开发的技术人员参阅,还适合作为希望进入该领域研究生的入门教材,也可以作为现代信息检索技术课程的教学参考书。
作者简介
何靖,2011年毕业于北京大学计算机科学技术系,获博士学位,曾在美国伊利诺伊大学香槟分校计算机系进行为期一年的学术访问,现在加拿大蒙特利尔大学计算机系从事博士后研究。从2004年开始从事搜索引擎相关领域的工作,主要研究方向是搜索引擎的评价方法和搜索引擎日志挖掘技术。曾参加核高基项目和多个国家自然科学基金项目的研究工作,并在SIGIR,CIKM,AIRS等搜索引擎相关的学术会议上交流多篇学术论文。
李晓明,北京大学计算机科学技术系教授,网络与信息系统研究所所长。从1999年开始从事与搜索引擎有关的研究与教学工作,主持开发了互联网信息搜索引擎--“天网搜索”,出版了《搜索引擎:原理、技术与系统》(科学出版社,2005)。2001年,提出了收集存储并系统研究中国网页历史信息的理念,发起并主持建设了“中国网络信息博物馆”。出版《计算机网络与互联网》(机械工业出版社,2009)和《计算机系统平台》(清华大学出版社,2009)教材,译著《万维网的定律》(北京大学出版社,2009)和《网络、群体与市场》(清华大学出版社,2011年)。
书籍目录
第1章 搜索引擎评价技术
1.1 目标、角度和方法
1.2 符号定义
1.3 Cranfield范式评价方法
1.4 评测指标
1.4.1 二值相关性指标
1.4.2 多值相关性指标
1.4.3 偏好性指标
1.4.4 分数综合方法
1.4.5 系统比较
1.4.6 指标分析
1.5 评测集
1.6 不完整的评测集
1.6.1 文档池方法
1.6.2 抽样方法
1.6.3 最小标注集方法
1.7 相关性之外的考虑
1.7.1 多样性和新颖性
1.7.2 评测方法
1.7.3 多样性指标
1.7.4 新颖性指标
1.7.5 归一化因子:一个NP难问题
1.8 Cranfield评测方法遇到的困难
1.9 用户研究
1.9.1 用户研究的指标
1.9.2 用户研究的顺序性
1.9.3 用户研究和Cranfield范式:比较和关联
1.10 搜索引擎的效率
1.10.1 在线指标和离线指标
……
第2章 搜索引擎用户隐反馈建模
第3章 搜索引擎结果归并一比较方法
第4章 基于用户点击模型的搜索引擎评价方法
第5章 有效时间比:一种新的搜索引擎评价指标
附录 一个基于归并比较的元搜索系统
参考文献
章节摘录
版权页: 插图: 1.4 评测指标 本节介绍Cranfield评测范式中常用的一些评测指标,它们虽然大都产生于Cranfield范式的框架中,但其中许多也适用于其他的评测方法(例如本书重点介绍的用户隐反馈方法)。应该注意的是,由于搜索引擎与传统信息检索系统的应用环境有显著差别,以前提出的一些指标不一定很适合搜索引擎。这种认识成为本书第5章所体现工作的出发点,在那里,我们提出了一个新的搜索引擎评价指标:有效时间比(Effective Time Ratio,ETR)。 读者可以认识到,一个搜索引擎的好坏最终取决于总体用户体验,任何评测指标都是对用户体验的近似。指标的好坏对应这种近似程度的高低。由于搜索引擎应用环境的复杂,用户的需求多样且表达方式有限,很难讲某一指标就是最好的。常常可以说的只是某一指标更适合什么情形。这也是在信息检索领域不断有人提出新指标的原因之一。在理解指标局限性的同时,也应该看到指标的意义。从20世纪90年代中期万维网兴起开始,近20年过去了,最初的一些搜索引擎有些已经不存在,目前最受用户欢迎的搜索引擎也都是后来才出现的,实现了后来居上的目标。同时,现在也有一些新的搜索引擎实现了新的超越。广大互联网用户在搜索引擎之间的迁移是搜索引擎质量对比的最好风向标。然而,这种迁移是需要时间的,一个有雄心的搜索引擎不是要在投入市场后等待迁移,而是应该在投入市场前预测是否会发生所希望的用户迁移。按照一定的指标来对系统进行评估,就是进行上述预测的重要基础。 下面,首先介绍用于评测系统在单个信息需求上检索效果表现的指标。根据对相关性‘函数定义方式的不同,这些指标可以分成三类:二值相关性指标、多值相关性指标以及偏好类指标(这些指标的一个比较完整的列表和分类体系,也可以参考Demartini等人的工作)。其次,讨论把单个信息需求的分数在多个信息需求上综合的方法,并讨论如何根据两个系统各自的综合性分数比较它们检索效果的优劣。最后,讨论这些指标之间的关系。
图书封面
图书标签Tags
无
评论、评分、阅读与下载