出版时间:2012-8 出版社:刘俊熙、 盛宇 电子工业出版社 (2012-08出版) 作者:刘俊熙,盛宇 著
内容概要
信息检索是指将信息按一定的方式组织起来,并根据用户的需求找出有关信息的过程与技术。本书共分11章,内容包括计算机信息检索基础,信息检索技术实现,网络信息资源概述,搜索引擎,综合和专题数据库,国际联机检索,多媒体信息检索,学术论文撰写、答辩及发表,国内主要数据库检索方法汇集等。全书在上一版的基础上,增加了有关搜索引擎、人文社会科学信息检索与利用、中外文网络数据库的检索与利用等内容,内容丰富、新颖,信息量大。
书籍目录
第1章 计算机信息检索基础 1.1 学科基础——信息学 1.1.1 信息概述 1.1.2 信息需要和检索 1.2 技术基础——信息技术 1.2.1 信息技术概述 1.2.2 信息检索的关键技术——数据库技术 1.2.3 网络时代对信息存储与检索技术的挑战 第2章 计算机信息检索概述 2.1 计算机信息检索基本概念 2.1.1 计算机信息检索的发展、条件和类型 2.1.2 计算机信息检索的原理 2.1.3 计算机信息检索系统 2.2 计算机信息检索语言 2.2.1 检索语言基础知识 2.2.2 检索语言的类型 2.3 计算机信息检索原理、步骤和检索效果 2.3.1 计算机信息检索的步骤 2.3.2 检索效果的评价指标 2.3.3 检索策略 第3章 计算机信息检索技术实现 3.1 初级和高级检索技术 3.1.1 初级检索技术 3.1.2 高级检索技术 3.1.3 智能推拉技术 3.1.4.自然语言处理技术 3.2 信息检索技术的延伸——数据挖掘 3.2.1 数据挖掘基本概况 3.2.2 数据挖掘常用的技术 3.2.3 信息检索和数据挖掘的技术关联分析 第4章 网络信息资源概述 4.1 网络资源的基本概念 4.1.1 Intemet概况 4.1.2 网络信息资源的类型 4.2 网络信息资源的组织 4.2.1 元数据概述 4.2.2 元数据的主要代表:DublinCore 第5章 网络信息资源检索——搜索引擎(1) 5.1 搜索引擎 5.1.1 搜索引擎概述 5.1.2 搜索引擎技术分析 5.1.3 搜索引擎评价 5.2 著名搜索引擎——Google(谷歌) 5.2.1 关于Google 5.2.2 eageRank算法解析 5.3 著名搜索引擎一Baidu(百度) 5.3.1 关于Baidu 5.3.2 Baidu的超链分析 5.3.3 Baidu和Google主要内容比较分析 5.4 搜索引擎的搜索策略和技巧 5.4.1 利用搜索引擎学习网站 5.4.2 搜索引擎的搜索步骤 5.4.3 搜索引擎的搜索技巧 5.4.4 常见问题的搜索方法 5.4.5 搜索引擎的优化(SEO) 第6章 网络信息资源检索——搜索引擎(2) 6.1 国外常用的搜索引擎介绍 6.2 元搜索引擎 6.2.1 元搜索引擎概述 6.2.2 元搜索引擎的优势、选择和评价 6.2.3 常用元搜索引擎介绍 6.3 垂直搜索引擎 6.3.1 垂直搜索引擎概述 6.3.2 垂直搜索引擎的技术分析 6.3.3 垂直搜索引擎现状分析 6.4 站内搜索引擎 6.4.1 站内搜索引擎概述 6.4.2 典型站内搜索引擎介绍 6.4.3 垂直和通用搜索引擎的差别 6.5 知识搜索和人肉搜索 6.5.1 机器搜索的延伸——知识搜索 6.5.2 知识搜索的变异——“人肉搜索” 第7章 网络信息资源检索——综合和专题数据库 7.1 综合数据库检索系统 7.1.1 中国期刊网概况 7.1.2 维普资讯数据库 7.1.3 中国高等教育文献保障系统(CALIS) 7.1.4 万方数据资源检索系统 7.1.5 中文社科报刊篇名数据库 7.1.6 SCIExpanded 7.1.7 联机书目检索系统(OPAC) 7.2 专题数据库检索系统 7.2.1 网上专利信息检索 7.2.2 网上学位论文信息检索 7.2.3 网上学术会议信息检索 7.2.4 网上科技报告信息检索 7.2.5 网上标准资料信息检索 7.2.6 网上参考工具书信息检索 7.2.7 GoogleEarth检索 第8章 网络信息资源检索——国际联机检索 8.1 联机检索系统 8.1.1 联机检索系统概述 8.1.2 联机检索系统的选择及数据库选择 8.2 国际联机检索:Dialog 8.2.1 Diflog概述 8.2.2 Diflog检索技术 8.2.3 Diflog检索步骤、结果处理及操作实例 8.3 国际联机检索:OCLC的FirstSealCh 8.3.1 FirstSearch概述 8.3.2 FirstSearch数据库 8.3.3 FirstSearch检索方法 第9章 多媒体信息检索 9.1 多媒体信息检索 9.1.1 多媒体信息检索概述 9.1.2 多媒体信息检索的关键技术 9.2 多媒体信息检索——图像检索 9.2.1 图像数据的检索原理、方法与技术 9.2.2 基于图像内容的图像检索系统 9.3 多媒体信息检索——视频检索 9.3.1 视频检索概述 9.3.2 视频检索关键技术 9.4 多媒体信息检索——音频检索 9.4.1 音频检索概述 9.4.2 音频检索方法 第10章 学术论文撰写、答辩及发表 10.1 学术论文 10.1.1 学术论文概述 10.1.2 学术论文的选题 10.2 学术论文的撰写 10.2.1 学术论文撰写的过程 10.2.2 学术论文的具体要求 10.3 学术论文的使用 10.3.1 学术论文的讲解、答辩和发表 10.3.2 利用信息资源进行论文写作的示例 第11章 国内主要数据库检索方法汇集 11.1 中国期刊网检索方法 11.2 中文科技期刊数据库检索方法 11.3 万方数据资源检索系统检索方法 11.4 其他数据库检索方法举例 参考文献
章节摘录
版权页: 插图: 在搜索软件系统里面,真正起指挥作用的是人工管理系统制定的规则和检索索引数据库。它可以决定什么样的网站抓得勤一点,或者干脆不抓。同时要判断这个网页几项要素: ①这个网页的核心内容是什么,也就是这个网页的“关键词”是什么。 ②这个网页的重要性权重如何,也就是说在同样“关键词”的网页比较,谁更符合这个“关键词”。 在第一个要素里面,需要通过对网页上的内容进行分析,而这里的“关键词”不是我们日常理解的词语,它是由语义分析学习系统按照一定规律制定的“最小语境含义表达单位(语境根)”,它可以是一个字,一个词,甚至一个短语,就是说它是表示某个含义的最小单位。通过根据“最小语境含义表达单位(语境根)”和网页文字进行比较,判断出这个网页的“关键词”。 这里有两点是很关键的,因为“最小语境含义表达单位(语境根)”和网页文字,是按照一定层次来进行比较的,所以首先会比较网页代码头部里面的关键词,其次是网页标题,然后会比较明显的标记的文字。这也是为什么网站优化(SEO)说标题和某些“关键词”突出显示很重要的缘故。 还有一个是网页文字相关性,其实也就是“相关词”。举例来说,一个“关键词”是“计算机”的页面上,同时出现内存、硬盘等相关内容的页面,肯定比一个同时只出现“萝卜”、“白菜”的页面更符合这个“关键词”。 (2)索引软件 索引软件主要是理解Robot所搜索的网页信息,利用数据库管理系统来组织所采集标引的网页信息,并从中抽取索引项,形成索引数据库。数据库中的一条记录基本上对应于一个网页,一般包括关键词、网页摘要、网页URL等信息。由于各个搜索引擎的标引原则和方式不同,所以它们的索引记录内容不一定相同,即使是同一网页的记录内容也不尽完全相同。搜索引擎的有效性在很大程度上取决于索引的质量,而索引的质量由索引技术和索引策略来决定。 索引可以分为客观索引项和内容索引项两种: ①客观索引项与文档的语意内容无关,如作者名、URL、更新时间、编码、长度、链接流行度(LinkPopularity)等。内容索引项是用来反映文档内容的,如关键词及其权重、短语、单字等。
编辑推荐
《大学计算机规划教材:计算机信息检索(第3版)》可作为高等学校信息管理及相关专业学生的教材或教学参考书,也可作为各类专业人员、普通网民堂握计笪机网络信息检索知识与技能的参考书。
图书封面
评论、评分、阅读与下载