驾驭大数据

出版时间:2013-1  出版社:人民邮电出版社  作者:Bill Franks  页数:242  字数:246000  译者:黄海 车皓阳 王悦  
Tag标签:无  

前言

  你收到一封邮件,邮件中提供了一套个人电脑的报价。而你几个小时前刚刚在这家零售商的网站上搜索过电脑的信息,似乎它们已经读出了你的想法……当你驱车前往这家商店购买这套个人电脑时,你路过了一家咖啡店,你看到了这家咖啡店的一条折扣信息。你获知由于你刚来到这片区域,你可以在未来20分钟内享受10%的折扣……  在你享用咖啡的时候,你收到了一家制造商关于某产品的道歉,而你昨天刚刚在你的Facebook主页和这家公司的网站上抱怨了它们的产品……  最后,当你回到家之后,你又收到了一条关于购买你最喜欢的在线视频游戏升级装备的信息。有了这些装备,你才能顺利通过某些你曾经苦苦挣扎的关卡……  听起来很疯狂吗?难道这些事情都是在很远的未来才发生的吗?不,这些场景都是我们今天可能见到的!大数据、高级分析、大数据分析,似乎今天你已经逃脱不了这些术语了。无论在哪里,你都会听到人们在讨论大数据和高级分析,看到关于它们的文章或是宣传推销它们。好了,现在你也可以将这本书加入关于它们的讨论中了。  什么是真实的,什么是炒作?这些关注可能会使你怀疑大数据分析是一种炒作,而非真实的东西。尽管在过去的几年曾经有不少被炒作的概念,然而就分析能力和处理海量数据而言,我们确实处在一个转型的年代。如果你肯花一些时间来理清并过滤掉那些有时被媒体过分炒作的部分,你会发现大数据背后有一些非常真实和强大的东西。随着时间的推移,大数据分析会使企业和消费者都获益,而收益带来的兴奋和期待又会继续引发更多的炒作。  大数据是下一波新数据源的浪潮,并会驱动分析在商业、政府及教育界的下一次革新。这些革新将有可能快速地改变企业审视它们自身业务的方式。大数据分析可以促成更加明智的决策,在某些情况下,促成这些决策的方式将明显不同于今天。它带来的很多洞察在今天看起来都像是在做梦。你会看到,征服大数据的需求和一直以来征服新数据源的需求在很大程度上是一致的。然而,大数据的额外规模必须使用新的工具、技术、方法和流程。传统的分析方法已经不再适用于新的环境,我们有必要使用高级分析将商业界带入更高的层次。这就是这本书要讲的内容。  “驾驭大数据”并不只是本书的书名,而是下一个十年中,决定哪些商业活动将振兴,而哪些商业活动将消亡的决定性因素。准备主动接受大数据,企业可以通过驾驭大数据浪潮而取得成功,而不是遭受大数据浪潮连绵不断的拍打。你需要了解些什么?你如何为征服大数据做准备?你如何从大数据中获得振奋人心的分析结果?坐下来,找一个舒服的姿势,准备好发现大数据的秘密!  读者对象  这些年来有无数关于高级分析的书籍问世,最近也开始有关于大数据的书籍出现。本书是从一个与其他书籍不同的角度来看大数据的,主要帮助读者理解什么是大数据,如何通过分析来利用大数据,以及在如今的大数据环境中,如何处理世界范围内的高级分析生态系统的创新和变革。大部分读者都将发现这本书有价值且充满趣味。无论你是分析专家,还是使用分析结果的商人,或者只是对大数据和高级分析感兴趣的人,这本书都有适合你阅读的内容。  本书并不会深入介绍它所涉及主题的技术细节。本书的技术高度刚刚能够让读者从高层次来理解其所讨论的概念。本书的目的是使读者可以理解,并开始运用这些概念,以及帮助他们认识在哪些方面还需要更加深入的研究。这本书更像是一本手册而非教科书,完全可以被非技术人员理解和掌握。同时,那些对这些主题已经有深入了解的读者,也可以从本书的一些讨论中获得一些技术方面更深层次的启示。  内容提要  本书由四部分组成,每一部分都从一个方面来介绍如何驾驭大数据浪潮。第一部分将介绍什么是大数据,大数据为什么重要,以及如何应用大数据。第二部分集中介绍那些能够用于分析和操作大数据的工具、技术和方法。第三部分介绍如何使分析专家、分析团队以及所需的分析原则更加高效。第四部分将前三部分结合在一起,重点介绍了如何通过分析创新中心使得分析更加有创造力,以及如何改变分析文化。以下是关于各章节所涉及内容的详细提纲。  第一部分  大数据的兴起  第一部分重点介绍了什么是大数据,大数据为什么重要,以及分析大数据可以带来什么好处。本部分覆盖了10种类型的大数据源,以及如何利用这些资源来帮助企业提高其业务水平。如果读者拿起这本书时,还不知道什么是大数据,以及大数据的应用有多么广泛,那么第一部分会帮助你了解这部分内容。  第1章  什么是大数据,大数据为什么重要  本章首先介绍了大数据的背景知识,以及大数据到底是关于什么的。然后给出了一些企业如何利用大数据的案例。如果读者想要帮助他们的企业驾驭大数据浪潮,那么请首先理解本章所讲的内容。  第2章  网络数据:原始的大数据  如今,或许应用最为广泛并为人们所熟知的大数据源是从互联网网站上收集来的详细数据。用户浏览互联网所产生的日志信息,是等待分析和挖掘的信息宝库。不同行业的企业都将从它们网站上收集到的详细用户信息整合到它们的企业业务分析中。本章将探索这些数据将如何增强和改变一系列的商务决策。  第3章  典型大数据源及其价值  在本章中,我们将从高层次来探索9种大数据源。其目的是介绍每种数据源,并讨论每种数据源在商业中的应用和启示。一些本质相同的技术应用在不同的行业中,以产生多种大数据源,这个趋势已经越来越明显。另外,不同的行业可以利用一些相同的大数据源,大数据并非只能用于某些狭窄的领域。  第二部分  驾驭大数据:技术、过程以及方法  第二部分将集中介绍用于驾驭大数据的技术、过程以及方法。这些年取得的重大进展增加了这3个方面的可扩展性。企业不能继续依赖外部的方法和专家来保持它们在大数据世界中的竞争力。本书的这一部分将是技术性最强的一部分,但仍然可以被绝大多数的读者所理解和接受。读完这些章节后,读者将熟悉他们今后进入大数据分析领域时可能遇到的一系列概念。  第4章  分析可扩展性的演进  在每一个时期,数据的高速增长使得当时最具可扩展性的工具也只能疲于应付。在大数据出现之前,传统的高级分析方法已经到达了它们的瓶颈。如今,传统的方法已经不再适用。本章将讨论分析和数据环境的融合、海量并行处理(MPP)体系、云、网格计算,以及MapReduce技术。这些技术增强了可扩展性,并且在大数据分析中扮演着重要角色。  第5章  分析流程的演进  为了更好地利用被极大增强的可扩展性,分析流程也需要进行升级。本章将首先概述如何利用分析沙箱为分析专家提供一个可扩展的环境,从而建立高级分析流程。然后,我们将介绍企业分析数据库如何帮助在创建分析数据时,获得更高的一致性并减小风险,同时提高分析专家的生产效率。本章最后将探讨如何使用嵌入式评分过程将高级分析流程部署和转移到用户端和应用端。  第6章  分析工具和方法的演进  本章将介绍一些高级分析方法演进的过程,以及这些改进将如何继续改变分析专家完成工作和处理大数据的方式。讨论的主题将包括视觉角度、点击界面、分析解决方案、开源工具,以及数据可视化工具的演进。本章也讲述了分析专家将如何改变他们建模的方法,以便更好地利用可用资源。讨论的主题包括组合模型、简易模型以及文本分析。  第三部分  驾驭大数据:人和方法  第三部分重点讨论驾驭大数据的人和他们所属的团队,以及确保他们能够提供优质分析的方法。如何提供优质的分析,包括大数据分析,其关键因素是找到合适的人来掌舵,并且他们能够遵循正确的分析原则。读完这3章后,读者将了解优质分析、优秀的分析专家和分析团队的特质。  第7章  如何提供优质分析  计算统计结果、撰写报告、使用建模算法仅仅是创建一个优质分析众多步骤中的几步。本章首先阐述了一些定义,然后讨论了一系列关于如何创建优质分析的主题。大数据给企业带来了从未处理过的复杂数据组合,将本章讨论的原则牢记在心对驾驭大数据非常关键。  第8章  如何成为优秀的分析专家  数学、统计学以及编程方面的能力是必要的,但对于一个优秀的分析专家来说,仅仅具备这些技能还不够。优秀的分析专家还需要具备一些人们通常不会首先想到的特质。这些特质包括承诺、创造力、商业头脑、演讲能力与沟通技巧以及直觉。本章将探讨在寻找一个优秀的分析专家时,这些特质为什么非常重要且不能被忽视。  第9章  如何打造优秀的分析团队  企业如何打造一个高级分析团队,并使其发挥最优效果?把他们放在企业的什么位置最合适?这些团队如何运转?谁来创建高级分析?本章将讨论建立一个优秀的分析团队时必须考虑的一些常见挑战和原则。  第四部分  整合:分析文化  第四部分将介绍一些著名的基本原则,企业想利用高级分析和大数据进行成功创新必须遵循这些原则。尽管这些原则也被广泛地应用于其他领域,但我们的焦点和视角是这些原则将要如何应用于当前企业环境的高级分析中。读者可能已经比较熟悉所涉及的这些概念,但是对于如何将它们应用到高级分析和大数据中,也许还是很陌生的。  第10章  促进分析创新  本章从回顾一些成功创新背后的基本原则开始,然后通过分析创新中心的概念将它们应用到大数据和高级分析中。我们的目标是能够让读者清楚地理解如何在企业中更好地促进分析创新,并驾驭大数据。  第11章  营造创新和探索的文化氛围  本章将介绍如何营造创新和探索的文化氛围作为本书的结尾。本章的文字有趣而轻松,并给如何营造出有利于促进创新分析的文化氛围留出了一些思考空间。这些涉及的原则被广泛地讨论,并被大家熟知。但是,这些原则仍然值得回顾,并且需要思考企业如何将这些确立的原则应用到大数据和高级分析中。

内容概要

本书为读者提供了处理大数据和在你的企业中培养一种创新和发现的文化所需的工具、过程和方法,描绘了一个易于实施的行动计划,以帮助你的企业发现新的商业机会,实现新的业务流程,并做出更明智的决策。
本书主要介绍了如何驾驭大数据浪潮,并详细地介绍了什么是大数据,大数据为什么重要,以及如何应用大数据。本书还从具体实用的角度,介绍了用于分析和操作大数据的工具、技术和方法;以及人才和企业文化的角度,介绍了如何使分析专家、分析团队以及所需的分析原则更加高效,如何通过分析创新中心使得分析更加有创造力,以及如何改变分析文化。
本书适于所有对数据、数据挖掘、数据分析感兴趣的技术人员和决策者阅读。

作者简介

  Bill
Franks是Teradata公司全球合作伙伴计划的首席分析专家,他负责跟踪研究分析领域的前端趋势,帮助客户理解Teradata和其分析合作伙伴如何为客户创造价值。Bill还负责管理Teradata与SAS合作成立的业务分析创新中心,并专注于帮助客户获得创新分析能力。此外,Bill负责制定Teradata公司在高级分析领域的战略与定位。
  Bill是国际数据分析研究所的一名讲师,国际数据分析研究所(International Institute for
Analytics)是由分析领域专家Tom Davenport成立的研究机构。Bill还是一名活跃的演讲人和博客作者,他的博客地址是:
http://iianalytics.com/category/faculty-blogs/
bill-franks。
  Bill一直专注于如何将复杂的分析转化为业务人员可以理解的语言,并帮助企业更有效地使用这些分析成果。他曾服务于很多不同行业和公司规模的客户,其中有财富前100强的大型企业,也有小型的非营利组织。
  Bill拥有弗吉尼亚科技大学应用统计专业的学士学位,以及北卡罗来纳州立大学应用统计专业的硕士学位。

书籍目录

第一部分 大数据的兴起
第1章 什么是大数据,大数据为什么重要
1.1 什么是大数据
1.2 大数据中的“大”和“数据”哪个更重要
1.3 大数据有何不同
1.4 大数据为何是数量更多的、相同类型的传统数据
1.5 大数据的风险
1.6 你为什么需要驾驭大数据
1.7 大数据的结构
1.8 探索大数据
1.9 很多大数据其实并不重要
1.10 有效过滤大数据
1.11 将大数据和传统数据混合
1.12 对大数据标准的需求
1.13 今天的大数据将不再是明天的大数据
1.14 本章小结
第2章 网络数据:原始的大数据
2.1 网络数据概观
2.1.1 你遗漏了什么
2.1.2 想象各种可能性
2.1.3 一个全新的信息来源
2.1.4 应当收集什么数据
2.1.5 关于隐私
2.2 网络数据揭示了什么
2.2.1 购物行为
2.2.2 顾客的购买路径和偏好
2.2.3 研究行为
2.2.4 反馈行为
2.3 行动中的网络数据
2.3.1 最优的推荐商品
2.3.2 流失模型
2.3.3 响应模型
2.3.4 顾客分类
2.3.5 评估广告效果
2.4 本章小结
第3章 典型大数据源及其价值
3.1 汽车保险业:车载信息服务数据的价值
3.2 多个行业:文本数据的价值
3.3 多个行业:时间数据与位置数据的价值
3.4 零售制造业:RFID数据的价值
3.5 电力行业:智能电网数据的价值
3.6 博彩业:筹码跟踪数据的价值
3.7 工业发动机和设备:传感器数据的价值
3.8 视频游戏:遥测数据的价值
3.9 电信业与其他行业:社交网络数据的价值
3.10 本章小结
第二部分 驾驭大数据:技术、过程以及方法
第4章 分析可扩展性的演进
4.1 分析可扩展性的历史
4.2 分析与数据环境的关联性
4.3 海量并行处理系统
4.3.1 使用MPP系统进行数据准备与评分
4.3.2 使用MPP系统进行数据准备与评分小结
4.4 云计算
4.4.1 公有云
4.4.2 私有云
4.4.3 云计算小结
4.5 网格计算
4.6 MapReduce
4.6.1 MapReduce工作原理
4.6.2 MapReduce优缺点
4.6.3 MapReduce小结
4.7 这不是一个单选题
4.8 本章小结
第5章 分析流程的演进
5.1 分析沙箱
5.1.1 分析沙箱:定义与范围
5.1.2 分析沙箱的好处
5.1.3 内部分析沙箱
5.1.4 外部分析沙箱
5.1.5 混合式分析沙箱
5.1.6 不要仅仅使用数据,而要丰富数据
5.1.7 系统负载管理和容量规划
5.2 什么是分析数据集
5.2.1 两种分析数据集
5.2.2 传统的分析数据集
5.3 企业分析数据集
5.3.1 什么时候创建企业分析数据集
5.3.2 企业分析数据集里有什么
5.3.3 逻辑结构与物理结构
5.3.4 更新企业分析数据集
5.3.5 汇总表还是概要视图
5.3.6 分享财富
5.4 嵌入式评分
5.4.1 嵌入式评分集成
5.4.2 模型与评分管理
5.5 本章小结
第6章 分析工具与方法的演进
6.1 分析方法的演进
6.1.1 组合建模
6.1.2 简易模型
6.1.3 文本分析
6.1.4 跟上分析方法的发展脚步
6.2 分析工具的演进
6.2.1 图形化用户界面的崛起
6.2.2 单点解决方案的兴起
6.2.3 开源的历史
6.2.4 数据可视化的历史
6.3 本章小结
第三部分 驾驭大数据:人和方法
第7章 如何提供优质分析
7.1 分析与报表
7.1.1 报表
7.1.2 分析
7.2 分析的G.R.E.A.T原则
7.2.1 导向性(Guided)
7.2.2 相关性(Relevant)
7.2.3 可解释性(Explainable)
7.2.4 可行性(Actionable)
7.2.5 及时性(Timely)
7.3 核心分析方法与高级分析方法
7.4 坚持你的分析
7.5 正确地分析问题
7.6 统计显著性与业务重要程度
7.6.1 统计显著性
7.6.2 业务重要程度
7.7 样本VS全体
7.8 业务推断与统计计算
7.9 本章小结
第8章 如何成为优秀的分析专家
8.1 哪些人是分析专家
8.2 对分析专家常见的误解
8.3 每一位优秀的分析专家都是独特的
8.3.1 教育
8.3.2 行业经验
8.3.3 当心“人力资源清单”
8.4 优秀分析专家身上经常被低估的特质
8.4.1 承诺
8.4.2 创造力
8.4.3 商业头脑
8.4.4 演讲能力与沟通技巧
8.4.5 直觉
8.5 分析认证有意义吗,还是干扰视听的噪音
8.6 本章小结
第9章 如何打造优秀的分析团队
9.1 各个行业并非生而平等
9.2 行动起来
9.3 人才紧缩
9.4 团队组织结构
9.4.1 分布式组织结构
9.4.2 集中式组织结构
9.4.3 混合式组织结构
9.5 持续更新团队技能
9.5.1 矩阵式方法
9.5.2 管理人员不能眼高手低
9.6 应该由谁来做高级分析工作
9.6.1 前后矛盾的地方
9.6.2 如何帮助刚刚从事分析工作的新手茁壮成长
9.7 IT人员和分析专家为何相处不好
9.8 本章小结
第四部分 整合:分析文化
第10章 促进分析创新
10.1 商业需要更多创新
10.2 传统的方法阻碍了创新
10.3 定义分析创新
10.4 在创新分析中使用迭代方法
10.5 考虑换个角度
10.6 你是否为建立分析创新中心做好了准备
10.6.1 组件1:技术平台
10.6.2 组件2:第三方的产品和服务
10.6.3 组件3:承诺和支持
10.6.4 组件4:强大的团队
10.6.5 组件5:创新委员会
10.6.6 分析创新中心的指导原则
10.6.7 分析创新中心的工作范围
10.6.8 处理失败
10.7 本章小结
第11章 营造创新和探索的文化氛围
11.1 做好准备
11.1.1 Crocs和Jibbitz的传说
11.1.2 推动创新
11.2 关键原则概述
11.2.1 原则1:打破思维定势
11.2.2 原则2:形成连锁反应
11.2.3 原则3:统一行动目标
11.3 本章小结
结论:再敢想一些

章节摘录

版权页:   插图:   使用传感器数据 发动机的结构很复杂,有很多移动部件,必须在高温下运转,会经历各种各样的运转状况。因为它们的成本太高,所以期望寿命越长越好。因此,稳定的、可预测的性能就变得异常重要,因为机器的寿命依赖于此。例如,对故障飞机进行保养维修会花掉航空公司或者空军部队一笔不小的钱,但这种事情我们还必须做,因为我们要识别出飞机是否存在安全隐患。因此,飞机或者飞机发动机以及其他设备的停机时间一定要降到最低,航空公司或者空军部队对此都有非常迫切的需求。 停机时间最小化策略包括准备备件或后备发动机快速割接时需要维修的设备、从诊断结果中快速识别需要更换的部件、针对问题部件投资开发更可靠的新版本。要想有效实施这3种策略,必须得有数据。我们要用数据生成诊断算法,或者用数据作为输入来诊断某个特定的问题。工程部门可以使用传感器数据准确地定位问题的原因,设计新的措施支持更长、更可靠的操作。不管发动机是飞机的,还是船只的,或者是陆地设备的,这些考虑因素都适用。 通过提取和分析详细的发动机运转数据,我们可以精确地定位那些会导致立即失效的某些模式。然后我们就能识别出会降低发动机寿命的时间分段模式以及更加频繁的维修。多个变量的排列组合数目,特别是一段时间内的排列组合数目,使得这类数据分析活动变成了一项挑战。这个过程不仅会涉及到大数据,就连随之开发出来的分析也会变得异常复杂和困难。以下是我们可以研究的一些问题。

媒体关注与评论

“随着信息技术的飞速发展,人类社会已进入一个数字信息时代。即时获取和掌握信息的多少,己成为衡量一个国家实力强弱的标志。但一切信息,又随不同需求者而定义为有益与否,而一切有益信息都是从海量数据中经过分析而生成的。海量数据又随时间不断产生,不断流动、扩散,形成一股像海潮的大数据流。只有经过对大数据的分析才能形成各自需要的信息,才能从信息中产生知识,才能造就智慧型社会。本书作者就大数据兴起及分析方法和技巧作出了深入浅出的表述,在当前大数据热潮中,值得一读。” ——吴基传  原国家信息产业部部长 “信息技术的飞速发展,以及互联网企业商业模式的不断创新,使得全球数据量呈现出几何级数般的爆炸性增长,全球进入了大数据时代。红楼梦中‘任凭弱水三千,我只取一瓢饮’,在浩瀚的信息海洋中,谁能够更快速、更准确地获取有价值的信息并充分利用,谁就能在大数据时代立于不败之地,获得成功。如何充分利用大数据、挖掘大数据所蕴含的价值,需要我们把握大数据的特点,积极探索海量数据存储、实时数据处理、新型分析挖掘技术的应用,以及新的数据架构的设计等解决之道。本书对上述问题进行了深入探讨,提出了许多真知灼见,值得一读。” ——王晓初  中国电信集团公司董事长 “大数据时代不以人的意志而来。对此,不仅要认知和熟悉,更要学会驾驭与运用。与一般大数据书籍不同,本书聚焦如何在分析中凝炼数据价值、在运用中创造数据财富,发乎启迪,止乎‘驾驭’,对于人们在大数据的浪潮中畅享更多精彩大有裨益。” ——常小兵  中国联通集团公司董事长 “现代信息技术推动了大数据的发展,大数据给各行各业带来了许多新的机会。面对大数据的浪潮,人们关心如何去釆集和汇总海量的数据,人们更关心如何对采集到的数据进行系统性的分析,通过分析体现出数据的价值,并在实际工作中得到充分的利用。本书很好地回答了这些问题。” ——王建宙  原中国移动集团公司董事长 “大数据浪潮催生了一个新的产业,也催生了一本又一本关于大数据的新书。这一本由业内的技术先驱和行业领导者之一Teradata的专家 Bill Franks 撰写的著作,从丰富的实战经验中萃取出大数据相关的若干关键的概念,并给予了精确而易懂的解读。它可以让大数据的客户、方案提供者、分析师们在短时间内通盘了解关于大数据的概念、主要技术、工具、方法和流程,快速走上决胜未来的大数据之路。” ——刘博  明博智创(北京)软件技术

编辑推荐

《驾驭大数据》是世界顶级数据仓库公司Teradata首席分析专家Bill Franks倾力巨献,揭秘驾驭大数据的技术和方法,诠释大数据专业分析之道。国内外知名数据分析专家、行业领袖联袂推荐。你是否在大数据面前犹豫、恐惧、不知所措?你是否无法说服你的老板投入人力、财力、物力去进行大数据分析?你是否已经身处大数据中而依旧茫然?你是否在做了很多大数据分析后仍然无法发现新的商业价值和机会?如何不再因循守旧,如何积极主动地去改变、探索、创新,如何在驾驭大数据的过程中游刃有余、成竹在胸?答案就在《驾驭大数据》一书中!

名人推荐

“随着信息技术的飞速发展,人类社会已进入一个数字信息时代。即时获取和掌握信息的多少,己成为衡量一个国家实力强弱的标志。但一切信息,又随不同需求者而定义为有益与否,而一切有益信息都是从海量数据中经过分析而生成的。海量数据又随时间不断产生,不断流动、扩散,形成一股像海潮的大数据流。只有经过对大数据的分析才能形成各自需要的信息,才能从信息中产生知识,才能造就智慧型社会。本书作者就大数据兴起及分析方法和技巧作出了深入浅出的表述,在当前大数据热潮中,值得一读。”——吴基传 原国家信息产业部部长“信息技术的飞速发展,以及互联网企业商业模式的不断创新,使得全球数据量呈现出几何级数般的爆炸性增长,全球进入了大数据时代。红楼梦中‘任凭弱水三千,我只取一瓢饮’,在浩瀚的信息海洋中,谁能够更快速、更准确地获取有价值的信息并充分利用,谁就能在大数据时代立于不败之地,获得成功。如何充分利用大数据、挖掘大数据所蕴含的价值,需要我们把握大数据的特点,积极探索海量数据存储、实时数据处理、新型分析挖掘技术的应用,以及新的数据架构的设计等解决之道。本书对上述问题进行了深入探讨,提出了许多真知灼见,值得一读。”——王晓初 中国电信集团公司董事长“大数据时代不以人的意志而来。对此,不仅要认知和熟悉,更要学会驾驭与运用。与一般大数据书籍不同,本书聚焦如何在分析中凝炼数据价值、在运用中创造数据财富,发乎启迪,止乎‘驾驭’,对于人们在大数据的浪潮中畅享更多精彩大有裨益。”——常小兵 中国联通集团公司董事长“现代信息技术推动了大数据的发展,大数据给各行各业带来了许多新的机会。面对大数据的浪潮,人们关心如何去釆集和汇总海量的数据,人们更关心如何对采集到的数据进行系统性的分析,通过分析体现出数据的价值,并在实际工作中得到充分的利用。本书很好地回答了这些问题。”——王建宙 原中国移动集团公司董事长“大数据浪潮催生了一个新的产业,也催生了一本又一本关于大数据的新书。这一本由业内的技术先驱和行业领导者之一Teradata的专家 Bill Franks 撰写的著作,从丰富的实战经验中萃取出大数据相关的若干关键的概念,并给予了精确而易懂的解读。它可以让大数据的客户、方案提供者、分析师们在短时间内通盘了解关于大数据的概念、主要技术、工具、方法和流程,快速走上决胜未来的大数据之路。”——刘博 明博智创(北京)软件技术有限责任公司董事长“面对大数据带来的挑战和机遇,卓越的科技和商业领袖都认识到大数据分析技术和实践的优势。完成这种炼数成金的思想转变,领悟到洞察力的真正价值,将获得驱动业务发展的无穷能量。本书不仅涵盖驾驭大数据的最佳技术、方法和流程,而且介绍了如何培养优秀的分析师及创新文化,专注于大数据链条中最核心的分析和决策行动环节,是大数据时代每一位思想家、技术精英和商业领袖必读的书籍。”——吴辅世 SAS赛仕软件大中华区总裁

图书封面

图书标签Tags

评论、评分、阅读与下载


    驾驭大数据 PDF格式下载


用户评论 (总计102条)

 
 

  •   国内外知名数据分析专家、行业领袖联袂推荐!
      世界顶级数据仓库公司Teradata首席分析专家BillFranks倾力巨献!
      揭秘驾驭大数据的技术和方法,诠释大数据专业分析之道!
      抓住大数据!理解大数据!驾驭大数据!在大数据掘金浪潮中脱颖而出!
      你是否在大数据面前犹豫、恐惧、不知所措?你是否无法说服你的老板投入人力、财力、物力去进行大数据分析?你是否已经身处大数据中而依旧茫然?你是否在做了很多大数据分析后仍然无法发现新的商业价值和机会?
      如何不再因循守旧,如何积极主动地去改变、探索、创新,如何在驾驭大数据的过程中游刃有余、成竹在胸?
      答案就在《驾驭大数据》一书中!
      本书将会告诉你:
      什么是大数据?
      目前有哪些大数据源?
      这些大数据源有什么价值?
      有哪些技术和方法可以帮助我们驾驭大数据?
      需要招聘什么样的分析师?
      如何打造一支Super分析团队?
      什么样的文化氛围才能促进分析创新?
    内容推荐
    本书为读者提供了处理大数据和在你的企业中培养一种创新和发现的文化所需的工具、过程和方法,描绘了一个易于实施的行动计划,以帮助你的企业发现新的商业机会,实现新的业务流程,并做出更明智的决策。
    本书主要介绍了如何驾驭大数据浪潮,并详细地介绍了什么是大数据,大数据为什么重要,以及如何应用大数据。本书还从具体实用的角度,介绍了用于分析和操作大数据的工具、技术和方法;以及人才和企业文化的角度,介绍了如何使分析专家、分析团队以及所需的分析原则更加高效,如何通过分析创新中心使得分析更加有创造力,以及如何改变分析文化。
    本书适于所有对数据、数据挖掘、数据分析感兴趣的技术人员和决策者阅读。
  •   本书提供了处理大数据和在企业中培养创新和探索文化所需的工具、流程和方法,描绘了一个易于实施的行动计划,以帮助企业发现新的商业机会,实现新的业务流程,并做出更明智的决策。本书重点介绍了如何驾驭大数据浪潮,并详细地介绍了什么是大数据,大数据为什么重要,以及如何应用大数据。本书还从具体实用的角度,介绍了用于分析和操作大数据的工具、技术和方法;以及从人才和企业文化的角度,介绍了如何使分析专家、分析团队以及所需的分析原则更加高效,如何通过分析创新中心使得分析更加具有创造力,以及如何改变分析文化。本书适合对数据处理、数据挖掘、数据分析感兴趣的技术人员和决策者阅读。
  •   提供了处理大数据和在你的企业中培养一种创新和发现的文化所需的工具、过程和方法,描绘了一个易于实施的行动计划,以帮助你的企业发现新的商业机会,实现新的业务流程,并做出更明智的决策。
  •   大数据的“大”含义有“多”及“杂”的意味,很多大数据源最初并未被“设计”(规范格式获取),正如书中所言大数据“凌乱而丑陋”。在这种认识下的对大数据理解的关键在于“驾驭”,驾驭的基本方法有三个要点。一是受限于企业的能力及规模,处理大数据的一个“域”;二是初期处理时,在大数据中抽样,探究特定数据源的规范及分析方法;三是与传统数据混合,挖掘商业或社会管理方面的价值。
  •   对大数据的分析比较透彻,是理解大数据发展的一本好书。
  •   喜欢这本书。数据分析一直是难点,这本书做到了举重若轻。值得。
  •   一直 在苦恼为什么别人的人脉比我的多。为什么别人了解的比我多。但相信阅读完这本《驾驭大数据》后,我们会从中得到很多的启发。并且能够发掘到许多不一样的东西。体会到不同事物的不同价值体现!
  •   该书是大数据介绍类型书籍,用以普及大数据理念。与其他大数据的书籍不同的是,该书并没有涉及多少专业知识技术,是从一个宏观的角度来阐述大数据。该书适合信息化高层人士和企业管理者阅读,使之更加准确的把握大数据的精髓,而不是把精力放在技术细节上。
  •   这本书很好的讲了大数据在现实生活中的应用,与技术相比,这本书更多的是开阔眼界,开阔视野,用新技术给人更多的启发
  •   也是了解大数据中比较完整和全面的一本书。。。很不错 推荐
  •   看了大数据时代后决定写的很好,想进一步学习如何处理大数据,故买了这本书,还没细看,大概翻了翻,里面的方法理论还挺多的,没买错。
  •   大概翻阅了下。这本书主要提供了如何使用大数据的一个方法论,还是值得研究下。
  •   对于大数据有深刻超前的思考,具有可操作性。每一章都有很精彩的内容,全文阅读后对整个大数据会有很深刻的理解
  •   不错 不像其他书 只介绍大数据的好处 有学习意义
  •   在了解与应用大数据层面,的确是一本不错的书,可惜我修行太低,但这不能说这不是一本好书!
  •   挺有收获,大数据的启蒙读物,技术方面都只给了个概述
  •   现在大数据比较热门,需要学习一下,正在阅读中。。。。。。。。。。。。
  •   不错的书,适合新想法转变及数据搜集调查的人
  •   很快读完了,对于大数据来说,这是一本不错的书,从实际出发,举了互联网等一些实际的例子,空话不多。能够为大数据处理提供一些不错的思路。
  •   这本书总体还是不错,从另一角度阐述大数据,科普可以用它。
  •   大数据是热门,这本书写的不错,能看到很多东西。而且在当当网买很省心,且便宜。
  •   还不错的,值得一读的大数据方面的书!
  •   对大数据有关的基本概念进行了概述,值得一看!
  •   此书是大数据的经典之作。
  •   全面了解大数据的好书。
  •   理性、深刻地理解大数据
  •   基础的理论,让人搞明白大数据是干啥的
  •   新时代,光靠经验不行,必须有学会利用数据
  •   大数据,与我们的生活相关,与人类社会的进步相关。
  •   讲述大数据的内容,可以看看
  •   大数据时代,先了解下基础知识,学习学习。
  •   起码知道大数据是怎么回事了。
  •   怎么看懂大数据,可以从中掌握法门
  •   知识不是最重要的,最重要的是运用和驾驭知识的能力和视野。本书提供了一些思路,值得推荐。
  •   大体看了一下,非常适合互联网公司员工使用
  •   书确实不错,看了看里面的东西还是很实用的,推荐一下
  •   样子不错,还没开始看,应该会有帮助
  •   好书啊!希望对我有所帮助!
  •   刚拿到手,读了两页 非常有帮助
  •   同事推荐的,不错,不过还没来得及看
  •   基础知识学习,同事推荐的
  •   不错的内容,值得推荐
  •   不是技术方面的书
  •   有讲理论,又有技术,很不错
  •   内容翔实,可以满足专业知识不足的阅读
  •   工作需要买的这本书,还是很不错的~
  •   这本书非常适合企业家或者有管理经验的人,作为初学者会觉得有些乏味
  •   比较新的知识与概念,最近很火的。
  •   很好的一本书,第二次帮领导们买
  •   内容很详细,案例不太符合国内情况。
  •   看起来正版,含有阅读意义
  •   很形象,生动,深入浅出。有几页破损,不影响阅读。
  •   期待仔细阅读,应该是一本好书。
  •   从目录看买对书了
  •   很好的书,值得大家购买!
  •   当今时代,多看看这样书,与时俱进吧
  •   包装还不错,书刚入手,正打算开始看
  •   刚拿到书,翻了一下,看一下目录,要细看才叫好
  •   就是有点贵了,一本这么薄的书,原价50?
  •   书很好,值得一看,包装很好,速度快
  •   很不错的书呀。值得购买呀。
  •   包装不错,还没来得及看书,赶紧好评!
  •   很不错的书,只是库存很久了吧,灰尘多很不错的书,只是库存很久了吧,灰尘多很不错的书,只是库存很久了吧,灰尘多很不错的书,只是库存很久了吧,灰尘多很不错的书,只是库存很久了吧,灰尘多很不错的书,只是库存很久了吧,灰尘多很不错的书,只是库存很久了吧,灰尘多很不错的书,只是库存很久了吧,灰尘多很不错的书,只是库存很久了吧,灰尘多很不错的书,只是库存很久了吧,灰尘多很不错的书,只是库存很久了吧,灰尘多很不错的书,只是库存很久了吧,灰尘多
  •   对于没接触过的新手来说还是很不错的
  •   帮着别人买的,看上去不错。
  •   老公要求买的,还不错!
  •   名头很大,内容很一般了,粗略看了一哈
  •   内容设计的很多实践
  •   真的好书,送货快速。价格又公道。好。
  •   不故弄悬殊,说真话,很实在的一本好书!
  •   到货很及时,内容也很不错
  •   很好,非常满意,下次再来.
  •   還沒開始看,應該不錯
  •   应该不错,还没来得及看呢,但是给个好评。
  •   讲的不叫范范,入门不错!
  •   包装很好,学习学习。
  •   很喜欢老外写的这些东西 感觉内容充实
  •   为领导买的,还没读
  •   在当当网这个大数据库里找到了这本好书
  •   可以买,观点新颖,深刻
  •   纸张摸起来沙沙的,感觉是有灰尘的样子,可能就是这种感觉。
  •   不错的一本书!认识到了很多新的东西!未来会有更多的信息!
  •   正不错 但是概念性东西比较多
  •   本书作者是数据分析行业的权威专家,写起自己的本行自然得心应手。全书内容看似不多,实则面面俱到,提纲掣领。看完舍恩伯格的大数据后,对数据分析产生了浓厚的兴趣,于是打算买一本入门书看看,这本书无疑是最佳选择。
  •   我同时买了《驾驭大数据》与《大数据时代》两本书,现在看完《时代》,正开始看《驾驭》。总体来说,两本书都给读者介绍了有关大数据的知识。但,相比较而言,个人觉得《驾驭》一书的内容比较言之有物,较实在;而《时代》一书,个人感觉则只是在开头给出了论点,然后每一章节用各种例子来论述证明而已,简单来说《时代》就是阐述了什么是大数据,大数据的特点,意义,以及其影响。《驾驭》一书还会提及怎样去运用大数据,介绍相关分析工具等等比较实用而且我本人想要知道的东西。所以,我觉得《时代》一书在书店读读当做增添课外知识的消遣是不错的选择,买下来看就没多大必要。《驾驭》对于想要了解更深层知识的读者是一个不错的选择。
  •   建立数据分析创新中心:人、文化、工具、价值,是一本讲述数据分析入门书。(1)大数据分析已成为电商行业标配 ;(2)真正了解你的顾客行为,必须关注网络数据;(3)分析必须以问题为导向;(4)优秀分析专家特质:承诺、创造力、商业头脑、演讲能力与沟通技巧、直觉;(5)在创新分析中使用迭代方法:快速构建原型、不断显示进展;(6)组建分析创新委员会和中心。
  •   《大数据时代》特别火,不过看了以后基本上就增加了一些忽悠的素材。这本书对于非技术人员,企业管理层(需要做数据布局)的人非常有帮助。可以增加数据库、大数据技术、分析、数据团队搭建和管理等方面的知识。在一些方面,比如可视化一笔带过,可以去看更专业的数据。但是从大数据基础知识、数据的布局方面,很有帮助。
  •   内容真的不是一般的泛,如果你从来没有接触过大数据,可以作为消遣看看,但要指导实践的话差太远了应该是一本领导,或者说至少项目经理级别的人,看的书,不是具体的分析和技术人员该看的
  •   这本书开头一小部分讲了讲大数据的一些现状,后面部分都在讲数据分析,涉及到理论、工具、方法,团队建设经验等方面。个人感觉关于书中以下两块内容值得看一看:数据分析师的特点和核心竞争力、数据分析团队的组织形式,是作者多年工作经验的一些总结。其他方面则很一般。
  •   因为看完大数据时代在看本书,所以在思维方式上进行了对比,无疑大数据时代的舎恩伯格的思维比较新颖,但他更多是在理论方面。而对于真正运用,Bill Franks提到很多实际操作行的应用解答,较全面的阐述的数据应用处理,值得参考。特别是针对行业应用上,比较详细介绍如何做的问题,这方面可以解答《大数据时代》提及的许多例子在如何做的上的疑惑。也许是作者在这方面长期作为技术顾问,更偏向于实践性。
  •   感觉整体不错,纸质似乎差了点
  •   觉得这本书其实分了三个部分,只有第一部在讲大数据,后面两部分讲的只是大数据背景下的技术问题和管理问题。对于想了解大数据本身是什么以及应用、影响等的人来说书的大半部分是比较枯燥的。不过书中有一个观点很对,大数据不只是一个技术问题。
  •   书很不错,包装也不错!
  •   蛮不错的,值得阅读。
  •   就看了一部分,还没看完呢
  •   买了3本大数据,一本用来扫盲,一本用来做操作方式指南,这一本是用来承上启下的,属于进阶级。
  •   该书从大的方面介绍了大数据,比较适合作为了解性扩张的读本,专业性不强
  •   内容不错,属于入门必读的
  •   别人说大数据,你不能不懂大数据,对于这类书,省时省事的办法就是看中译版。
  •   书质量很好,很值得购买
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7