文本挖掘原理

出版时间:2010-11  出版社:科学出版社  作者:程显毅,朱倩  页数:228  
Tag标签:无  

内容概要

在信息时代,存储大量数据比较容易。通过Web、企业内部网、电传新。闻获得的文本数量在急剧增加,这导致信息过载。然而,数据量虽然增加了,但可用的信息却在减少。文本挖掘是一个新的令人振奋的研究领域,其试图通过综合数据挖掘、机器学习、自然语言处理、信息检索和知识管理等技术来解决信息过载问题。    文本挖掘包括文本集合的预处理(文本分类、信息抽取)、中间结果存储、中间结果分析技术(分布分析、聚类、趋势分析、关联规则抽取)和最终结果的可视化。它与关联分析类似,为人们提供了分析海量文本数据的新工具,并且通过学习模式来指导抽取实体关系。    本书首先讨论了文本挖掘的总体结构以及文本挖掘预处理算法,然后深入地研究了文本挖掘核心操作,最后探讨真实世界中文本挖掘的主要应用和DIAL,弥补了理论和实践的脱节。    本书主要可供对文本挖掘感兴趣的本科高年级学生、研究生、研究人员和专业开发人员参考,对从事文本挖掘开发和使用文本挖掘系统的人也会有很大帮助。

书籍目录

前言第1章  文本挖掘概述  1.1  文本挖掘的产生背景  1.2  文本    1.2.1  文本格式    1.2.2  动态文本集  1.3  文本挖掘的概念  1.4  文本挖掘的任务    1.4.1  文本挖掘预处理    1.4.2  文本模式挖掘    1.4.3  挖掘结果可视化  1.5  文本挖掘系统的通用体系结构第2章  文本表示第3章  文本挖掘预处理——文本分类第4章  文本挖掘预处理——文本聚类第5章  文本挖掘核心操作——信息抽取第6章  文本挖掘核心操作——关系抽取第7章  文本挖掘核心操作——关联分析第8章  文本挖掘结果的可视化第9章  文本挖掘的应用第10章  专门用于文本挖掘的信息抽取语言——DIAL参考文献

编辑推荐

大量文档集内容的预处理包括特征抽取、文本分类、文本聚类等。文本分类和文本聚类研究的成果比较多,《文本挖掘原理》只作简单介绍;而对特征生成、特征选择和特征抽取,《文本挖掘原理》进行深入地讨论。 信息抽取是文本挖掘的核心操作,目前的主要研究方向是命名实体识别、实体关系抽取和事件抽取。实体关系抽取是文本挖掘的关键任务,所以《文本挖掘原理》用大量篇幅讨论了实体关系发现技术。 由于文本挖掘强调用户交互到知识发现过程的集成性,因此,《文本挖掘原理》最后讨论了文本挖掘结果可视化方法,并介绍了一种文本挖掘语言——DIAL。

图书封面

图书标签Tags

评论、评分、阅读与下载


    文本挖掘原理 PDF格式下载


用户评论 (总计18条)

 
 

  •   挖掘可是很重要的技术了。
  •   总体感觉很棒!
  •   书还没看,在有需要的时候可以给我帮助。
  •   使用了其中的思想
  •   内容还行,特别是实体识别那块。
  •   书名取得大了一点,原理说得不是太透
  •   该图书的内容涵盖面较广,适用于入门者。
  •   好像这方面的教材相当少!可以读一下!
  •   还没来得及看,不过应该不错吧
  •   送货速度真快。该书已浏览,慢慢看吧,等有收获再来说。
  •   不错的书,很权威不错的书,很权威
  •   可以看一下,开拓一下思路,要是书写厚一点就更好了
  •   就是个技术大纲,一点也没有深入。
  •   书的封皮在递送过程中有破损,虽不影响阅读,但外观毕竟有瑕疵。
  •   内容太差, 空洞。 作者估计也没什么实际经验。就是一个攒子的人
  •   教材而已,理论性大于实际动手可能性
  •   不仅有数据挖掘,同样我们要好好学习一下如何文本。这只是告诉我们如何做文本,理论大于案例
  •   这是比较全面的介绍该领域的一本书,可以当作入门读物。
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7