实战Hadoop

出版时间:2011-8  出版社:电子工业出版社  作者:刘鹏  页数:456  
Tag标签:无  

内容概要

作为谷歌云计算基础架构的模仿实现,Hadoop堪称业界最经典的开源云计算平台软件。《实战Hadoop--开启通向云计算的捷径》(作者刘鹏)是原著的Hadoop编程技术书籍,是云计算专家刘鹏教授继《云计算》教材取得成功后,再次组织团队精心编写的又一力作,其作者均来自拥有丰富实践经验的云计算技术研发和教学团队。
《实战Hadoop--开启通向云计算的捷径》强调动手、强调实战,以风趣幽默的语言和一系列生动的实战应用案例,系统地讲授了Hadoop的核心技术和扩展技术,包括:
HDFS、MapReduce、HBase、Hive、Pig、Cassandra、
Chukwa和ZooKeeper等,并给出了3个完整的Hadoop云计算综合应用实例,最后介绍了保障Hadoop平台可靠性的方法。
本书读者对象为各类云计算相关企业、高校和科研机构的研发人员,亦适合作为高校研究生和本科生教材。

作者简介

刘鹏,清华大学博士,解放军理工大学教授、学科带头人,中国云计算专家委员会委员。主要研究方向为信息网格和云计算,完成科研课题18项,发表论文70余篇,获部级科技进步奖6项。曾夺得国际计算机排序比赛冠军,并两次夺得全国高校科技比赛最高奖,获“全军十大学习成才标兵”、“南京十大杰出青年”和“清华大学学术新秀”等称号。2002年首倡的“网格计算池”和2003年研发的“反垃圾邮件网格”分别为云计算和云安全的前身。创办了知名的中国网格(chinagrid.net)和中国云计算(chinacloud.cn)网站。

书籍目录

第1章 神奇的大象——Hadoop
 1.1 初识神象
  1.2 Hadoop初体验
  1.2.1 了解Hadoop的构架
  1.2.2 查看Hadoop活动
 1.3 Hadoop族群
 1.4 Hadoop安装
  1.4.1 在Linux系统中安装Hadoop
  1.4.2 在Windows系统中安装Hadoop
  1.4.3 站在象背上说“hello”
  1.4.4 Eclipse下的Hadoop应用开发
 参考文献
第2章 HDFS——不怕故障的海量存储
第3章 分久必合——MapReduce
第4章 一张无限大的表——HBase
第5章 更上一层楼——MapReduce进阶
第6章 Hive——飞进数据仓库的小蜜蜂
第7章 Pig——一头什么都能吃的猪
第8章 Facebook的女神——Cassandra
第9章 Chukwa——收集数据的大乌龟
第10章 一统天下——ZooKeeper
第11章 综合实战1——打造一个搜索引擎
第12章 综合实战2——生物信息学应用
第13章 综合实战3——移动通信信令监测与查询
第14章 高枕无忧——Hadoop容错

章节摘录

版权页:插图:在对源文件进行功能性处理之前,有必要对11.2.2节生成的源文件进行一次预分析和过滤。主要原因有以下几个。(1)在遇到故障并恢复爬行后,爬虫会从日志文件的最近一页(一页包含20个帖子)重新继续爬取工作。从最近一页爬取保证了帖子不被遗漏,但是会导致有些帖子被重复爬取(一般不会超过2次)。为保证索引时指定文件的唯一性,有必要过滤相同帖子的记录,保证帖子的唯一性。(2)爬取过程中,从遇到的帖子中抽取出的信息可能并不符合我们的要求,比如,源文件中可能会有之类的记录。这样的空信息记录也必须过滤掉。对源文件进行一次预分析和过滤以确保数据的完整性和正确性,可以避免后续步骤中由于数据不正确而引发的一些问题。对元数据进行预分析是海量数据处理过程中很必要也是很自然的一步。

媒体关注与评论

随着计算模式从个人计算向云计算的发展,开源软件的比重和作用越来越大,现在多数云服务都基于开源平台Hadoop是国际著名的云计算开源平台,本书通过许多实例,深入系统地分析了Hadoop的技术、源码以及构建实用系统的方法。为国内产学研各界开启了一条通向云计算的捷径。  ——中国工程院院士、中国电子学会计算专家委员会副主任 倪光南作为云计算基础架构的开源软件,Hadoop堪称业界最成熟和经典的案例该书是云计算业界专家刘鹏教授带领科研团队,基于多年研究心得,做了大量技术开发和测试,以严谨的态度和诙谐幽默的语言编写的Hadoop实战宝典。相信对推动中国云计算技术的发展和应用具有重要价值。  ——中兴通讯首席构师、中国电子学会云计算专家委员会委员 罗圣美热烈祝贺刘鹏教授主编的  实战Hadoop——开启通向云计算的捷径。一书出版发行,它将大力推动我国云计算的应用。  ——清华大学教授、中国电子学会云计算专家委员会委员 郑纬民

编辑推荐

《实战Hadoop:开启通向云计算的捷径》:云计算核心研发团队剖析Hadoop:怎么装?怎么编程?怎么解决实际问题?

图书封面

图书标签Tags

评论、评分、阅读与下载


    实战Hadoop PDF格式下载


用户评论 (总计86条)

 
 

  •   实战Hadoop——开启通向云计算的捷径 看看
  •   Hadoop的入门教材,学习云计算的开始。
  •   深入浅出、生动而详细地讲述Hadoop的基本原理,并配以实际应用案例,相信本书会对推动Hadoop在国内的应用和研究起到极大的作用
  •   云计算涉及到的相关软件的情况介绍的很多,对于对云计算所知不多的人很有帮助
  •   简明易懂,由浅入深,很适合hadoop学习。
  •   了解hadoop必读书籍,写得很不错,推荐
  •   这是购买的第一本hadoop方面的书,真的很不错。
  •   内容很标准,hadoop入门的话再好不过了,不会像网上的教程那样总是出错。
  •   知道如何开发云技术平台,值得一看的书
  •   刚买,还没时间看,但是作者给的网址: ***.chinacloud***尽然没法登陆
  •   学习一下新技术。看看了解了解。
  •   书写的不错,历史,发展,案例
  •   入门可以,但这些上网找也是可以的。。。。不过可以帮着理一下思路。书很厚,说的点也多。。。但都不整个深入,介绍性的讲了下。。。
  •   适合已经入门的读者。
  •   大数据时代入门书籍
  •   昨晚一口气读了大半,写了很好,很适合初学者
  •   这书值得一看,不错的书!
  •   书不错,是可以直接上手的书
  •   书的内容正好符合我所想要的
  •   书的质量不错,内容还没有看呢,很有手感
  •   这书实践性好像挺强的.
  •   书刚到,还没来的及看。
  •   从基础入手,讲的比较全面。
  •   纯粹学习之用。
  •   精品,非常不错,是一本入门级的好书,如果正在接触海量数据的操作,可以尝试学习。
  •   这本书配合权威指南看还行
  •   感觉这本书是初学者的最初的选择
  •   实用性很强,就是里面有些错误有待修改。
  •   虽然有一些错别字,但是还是觉得比其他的读物要好点
  •   看了几章 爱不释手
  •   内容详实,很新,有用。
  •   正在看,看了下目录不错
  •   才看了一点,觉得理论讲的不错!
  •   看了目录和第一页,内容质量不错,希望有收获。
  •   《实战Hadoop》是中国电子学会云计算专家委员会刘鹏教授主编的国内第一本原著的Hadoop编程技术书籍。国内原创,但是讲的比较浅显,失之深入,快速浏览下也还不错。
  •   作为Hadoop使用级别挺好的,之前刘博写过一本云计算,不过理论偏多。后来写了这本实战,感觉可以。如果能够配合hadoop原理自己实现一套山寨或者精简版的云计算平台就更好了。——沉重感大于感动……
  •   刘鹏教授的云计算看过,很不错,相信他推荐的书也很不错,希望有所收获
  •   书一看就是正版,但是感觉每页的含量都不是很足,很多都是来自论文上面的,有点拼凑的感觉!在如今Hadoop资料比较缺乏的时代,用来作入门还是可以的。
  •   虽然从hadoop权威指南中抄了不少,但还是以中国人的方式呈现了hadoop。案例不错。
  •   花一个小时通篇粗读了一遍。对我们这种用不上想了解偶尔又想实战研究一把的人,是本好书。
  •   这本书范围挺广,但是案例不错经典,缺相关关联。不过可以提高自己的知识面。
  •   适合入门,深入的话,只能再买更详细的书来看
  •   不错的一本书,正好老师上课也是推荐这本书作为教材!
  •   总体内容不错,不够详细,不够深入,初学者的入门好书。
  •   送货的速度很快,书的内容还没有具体看,希望很好。
  •   还不错,包装不好,书略有破损
  •   总的说来,感觉内容太少,虽然书挺厚的,但明显内容不多,一页纸浪费不少。字号特别大,行间距也不小,一页没写多少字,就用完了,如今这年头,出版的书基本上都这个样。无语!
  •   感觉还行,正在学习
  •   正在努力地学习中……
  •   挺实用的一本书,入门还是挺好的
  •   还不错,入门参考
  •   这个需要慢慢看!
  •   还可以,深度不够,不过还是比较全面
  •   给别人买的,听说还好
  •   项目需要,研读中...
  •   权威,目前阶段算很好的了
  •   适合初学者学习hadoop框架,一步一步写的比较仔细,不错。
  •   该书编者是我老师,以及同学。 只能说,不推荐这本书。 这更像一本手册。 推荐Hadoop权威指南这本书。
  •   只是工具书,对hadoop没有一个直观的认识,只是拿来玩玩还行。
  •   可能是个人水平有限,书中涉及到很多的JAVA语言内容,本来想着增加运维能力的,感觉这本书应该适合开发看!
  •   书本的内容比较适合初学者,但是要深入研究的话光靠这本书是不行的。
  •   书中介绍不详细!每页书的内容很少!介绍不是很到位!
  •   正在读,写的比较朴实,比较适合初学者
  •   看了之后还是觉得应该买国外版的。
  •   以后再也不在当当买书了 运输不好 书都损坏的不成样子了 真够闹心
  •   还算可以,但不是我想想中的完美!
  •   体现了国产书的特色,东拼西凑,多个作者,一人一章,没有统一的写作思想,书的很多内容就是官方文档翻译过来的,买亏了,不如去看官方文档。
    求国人什么时候别太想着坑读书人的钱!
  •   这本书一般般,讲述的不够细致。
  •   内涵不够!适合初级学习!!!!!!!!!
  •   那有什么实战,简直就是狗屁!看完这本书后就知道hadoop包括哪些模块以及哪些实现技术,没有一点实战性。这本书就是介绍hadoop的组成模块以及子模块的功能。
  •   内容严重错误,字大,行间距大,摆明了坑爹啊。

    书内的源码肯定是乱写上去的,各别类的方法在实际中跟本不存在,方法的输入参数类型胡拼乱凑,全是异常,编译都通不过。真是坑人啊。~~~~~~~~~~~~~

    后几单的实战,根本就是海吹,没有实战的可行性。这些作者真是太无耻了。。。。。。大家警惕啊,买了就后悔。。。。。。
  •   看了这本书终于明白什么叫做天下文章一大抄
  •   这本书还算不错的。比如Pig一章,介绍了如何运行脚本,都简明扼要,切中要害。看了其他的书,都没有很好阐述这个问题。抄的话,肯定是有的,毕竟这些东西都是外国人提出的。另外,这本书的推荐者实在太多了,比如张亚勤都推荐,觉得有点太中国特色了。
  •   这本书讲述了很多新技术,不过只是皮毛,不够深入
  •   很出名的一本书,适合初学者,但是有的地方讲的确实不到位,按照上面的说法安装hadoop是绝对安装不上的,有何必讲,直接略过好了,或者给个指引,推荐个好的资源让我们去看
  •   预期的差不多,虽然最终没有采用这个技术做项目,但确实了解了一些技术要领与细节,值得购买。
  •   纸质什么的都行,挺满意的……
  •   杂糅,不具体,死抠概念,完全不想看,还不如网络资料来的具体。
  •   很好,很不错。书写的很好,送货速度很快
  •   书质量很好,很喜欢,正在学习中
  •   1,质量 非常好2,内容 偏于实践,如果初学,买本原理的会比较好
  •   太专业,有点看不太懂。卓越的送货还是不错的。
  •   刚拿到书,随后进一步评论
  •   实战Hadoop
  •   实战Hadoop:开启通向云计算的捷径
  •   好书,希望解决大数据问题
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7