出版时间:2010-6 出版社:人民邮电出版社 作者:杜强,贾丽艳 编著 页数:330
Tag标签:无
前言
商业分析正在逐步地取代传统意义上的商业智能概念,在传统的商业智能技术之上增加了高等分析部分,就是预测和优化部分。在过去的几年间,国际软件巨头不断地吞噬BI和分析软件厂商,真正地表明了将来商业应用软件的发展趋势,也应了中国那句通俗的说法,吃啥补啥。从被广大业务人员普遍使用的Excel到为高层管理人员提供服务的优化软件SAS/OR.,这才真正覆盖了从普通业务人员到高级决策管理人员对业务分析的需求。随着业务复杂性的增加,预测和决策变得越来越困难,很大程度上要依赖于商业分析的手段。全球的数据存储量每年正在以60%的速度增长,目前已经达到了1021的量级,即将进入到1024的量级。很多企业的数据也达到了1012以上的级别。大量数据的存储已经成为企业的一种负担,不将其转变成有价值的财产,就是一种浪费。通过正确的分析手段,这些数据就可以变成企业有用的信息和竞争优势。SAS将软件的分析能力分成了8个级别。他们分别是:标准化的报告、专用报告、查询钻取、警示、统计分析、预测(prediction)、时间序列预测模型(forecasting)、优化。目前,市场上大部分分析软件可以提供前4级功能,即可以提供过去发生的历史数据,但不是对将要发生事件的洞察力。对于简单的业务问题,这些软件就能满足需要。但是,如果更复杂的问题,要求有预见性的洞察力时,你就需要有后4级功能的软件。更好一点,如果你能够学会所有这些技术,能够辨别不同情况下使用什么分析工具,你就能体会到什么是商业上的真正智能。在数据处理和统计分析领域,SAS软件被公认为是标准软件,是分析软件的高端产品。SAS软件是美国食品药品管理局的认定产品,在国内外有广泛的崇拜者,它极大地满足了人们对数据神秘性认知的兴趣。在过去30几年的实践应用中,SAS软件被广泛地应用在政府的经济决策和企业的经营决策中。目前,SAS已经遍布全球113个国家。SAS产品被广泛地使用在金融、医药、通讯、科学研究、物流、零售业、政府和教育等领域。AS软件通常被认为是难学的。首先,SAS软件是一个庞大的体系,让人不知道从何入手;其次,要想掌握好SAS,必须学习SAS编程语言,这让许多没有接触过SAS的人产生某种畏惧感;最后,由于SAS产品较高的价格,使得很多企业和机构都没有这种软件,这就更增加了它的神秘感。虽然,SAS软件在市场上有较高的认知度,但由于上面的因素,很多人只好忍痛割爱,选择一种易用的软件。本书作者根据自己使用SAS的经验编写了这本《SAS统计分析标准教程》,它非常适合初学者,教你如何从数据入手,通过SAS的图形界面导出所需要的分析结果。同时,作者还给出了SAS程序,这有利于读者在学习SAS软件的同时学习SAS编程语言。初学者只要按照书上给出的步骤,就可以学习统计分析的过程,获得分析结果。从本书的易用性上就可以看出SAS软件其实并不难学。根据我们的实践统计,新加入SAS公司的员工,通常通过一个月的学习就可以通过SAS基础编程认证考试。现在,SAS系统已经做到了非常好用,简洁。
内容概要
本书系统地介绍了如何使用SAS/Analyst模块、SAS/EM模块以及SAS编程执行常用的统计分析功能,用可视化的图形操作和灵活的编程两种方式向读者展示了SAS的强大功能。书中涉及的统计方法包括探索性分析、假设检验、方差分析、非参数检验、回归分析、聚类分析、判别分析、因子分析、时间序列分析等,且每种方法都配有经典的案例分析,读者可在具体的操作过程中掌握用SAS解决实际问题的方法。每章最后都给出一些例题,供读者练习与提高。最后几章还给出了SAS在数据预测、市场与销售研究、分类分析这3个方面的多个实用案例,供读者参考和研究。 本书光盘中提供了书中案例使用的数据文件,以及大多数案例的操作视频,以方便读者学习和使用。 通过本书,读者可以学会如何用SAS软件进行数据管理和统计分析。本书既可作为一般统计课程的参考用书,也可供大中专院校的老师和学生、数据分析人员以及希望通过数据辅助科学决策的有关人士阅读参考。
书籍目录
第1章 SAS基本操作 1.1 SAS的常用界面 1.2 菜单功能简介 1.2.1 Assist模块 1.2.2 Desktop模块 1.2.3 Analyst模块 1.3 SAS编程基础 1.3.1 SAS语句的基本结构 1.3.2 SAS语句的数据步骤 1.3.3 SAS语句的过程步骤 1.3.4 SAS语句的运行与调试 1.3.5 SAS编程的控制语句 1.3.6 SAS/IML语言简介 习题 第2章 建立数据文件 2.1 图形界面建立数据集 2.1.1 逻辑库与数据集概述 2.1.2 Analyst建立数据集 2.2 DATA步骤建立数据集 2.2.1 直接输入数据 2.2.2 格式化输入 2.2.3 从文件读入数据 2.3 导入外部数据 2.3.1 使用向导导入 2.3.2 使用IMPORT语句 习题 第3章 常用的数据文件操作 3.1 数据集的编辑与整理 3.1.1 复制数据集 3.1.2 增加变量 3.1.3 筛选变量 3.1.4 更改变量属性 3.2 数据集排序 3.3 数据集的拆分与合并 3.3.1 数据集的拆分 3.3.2 数据集的纵向合并 3.3.3 数据集的横向合并 3.4 数据集的筛选 3.4.1 Analyst筛选数据集 3.4.2 DATA步骤筛选数据集 3.5 数据转置 3.6 使用Datasets步骤管理数据集 习题 第4章 描述性统计分析 4.1 描述性统计分析简介 4.1.1 描述性统计分析概述 4.1.2 SAS中的描述性过程 4.2 案例描述——考试成绩分析 4.3 SAS/Analyst描述性统计分析 4.3.1 频率分析 4.3.2 变量分布分析 4.3.3 图形分析 4.4 编程分析过程 4.4.1 MEANS过程 4.4.2 FREQ过程 4.4.3 UNIVARIATE过程 4.4.4 TABULATE过程 4.4.5 GCHART过程 4.4.6 GPLOT过程 习题 第5章 均值比较和假设检验 5.1 假设检验问题简介 5.2 单样本的均值Z检验 5.2.1 基本原理 5.2.2 案例描述——袋装食品的重量检验1 5.2.3 SAS/Analyst单样本均值Z检验 5.3 单样本的均值t检验 5.3.1 案例描述——袋装食品的重量检验2 5.3.2 SAS/Analyst单样本均值t检验 5.3.3 TTEST过程分析 5.4 单样本的比例检验 5.4.1 基本原理 5.4.2 案例描述——购车价格的比例分析1 5.4.3 SAS/Analyst变量编码 5.4.4 SAS/Analyst单样本比例检验 5.5 单样本的方差检验 5.5.1 案例描述——考试成绩的变异分析 5.5.2 SAS/Analyst单样本方差检验 5.6 两样本的均值t检验 5.6.1 案例描述——男女减肥的效果对比 5.6.2 SAS/Analyst两样本均值t检验 5.6.3 TTEST过程分析 5.7 配对样本的均值t检验 5.7.1 案例描述——装配时间的差异分析 5.7.2 SAS/Analyst配对样本均值t检验 5.7.3 TTEST过程分析 5.8 两样本的比例检验 5.8.1 案例描述——购车价格的比例分析2 5.8.2 SAS/Analyst两样本比例检验 5.9 两样本的方差检验 5.9.1 案例描述——股票价格的波动比较 5.9.2 SAS/Analyst两样本方差检验 习题 第6章 方差分析 6.1 方差分析简述 6.1.1 方差分析的基本原理 6.1.2 方差分析实例讲解 6.2 单因素方差分析 6.2.1 单因素方差分析原理 6.2.2 案例描述——施肥量对产量的影响分析 6.2.3 SAS/Analyst单因素方差分析 6.2.4 ANOVA和GLM过程分析 6.3 多因素方差分析 6.3.1 多因素方差分析原理 6.3.2 案例描述——影响销售额的因素分析 6.3.3 SAS/Analyst多因素方差分析 6.3.4 ANOVA和GLM过程分析 6.4 重复测量的方差分析 6.4.1 重复测量方差分析原理 6.4.2 案例描述——转移基因的抑制分析 6.4.3 SAS/Analyst重复设计方差分析 6.4.4 SAS编程分析 习题 第7章 列联表分析 7.1 列联表的基本原理 7.2 案例描述——产品质量的检验分析 7.3 SAS/Analyst列联表分析 7.4 FREQ过程分析 习题 第8章 非参数检验方法 8.1 非参数检验概述 8.1.1 非参数检验的特点 8.1.2 SAS中的NPAR1WAY过程 8.2 单样本非参数检验 8.2.1 x2拟合优度检验 8.2.2 单样本K-S检验 8.2.3 符号检验 8.3 两样本非参数检验 8.3.1 两独立样本Wilcoxon秩和检验 8.3.2 两独立样本Kolmogorov-Smirnov检验 8.3.3 成对样本Wilcoxon符号秩检验 8.4 多样本非参数检验 8.4.1 多独立样本Kruskal-Wallis检验 8.4.2 多独立样本Brown-Mood检验 8.5 等级相关分析 8.5.1 Spearman等级相关系数 8.5.2 Kendall等级相关系数 8.5.3 案例研究——财务指标的相关性分析 习题 第9章 相关分析与回归分析 9.1 相关分析 9.1.1 相关分析简述 9.1.2 案例描述——身体特征的相关性分析 9.1.3 SAS/Analyst相关分析 9.1.4 CORR过程分析 9.2 线性回归分析 9.2.1 线性回归原理 9.2.2 案例描述——环境对植物生长的影响分析 9.2.3 SAS/Analyst线性回归分析 9.2.4 REG过程分析 9.3 曲线回归分析 9.3.1 曲线回归的基本原理 9.3.2 案例描述——不同光学密度的关系研究 9.3.3 SAS/Analyst曲线回归分析 9.4 Logistic回归分析 9.4.1 Logistic回归的基本原理 9.4.2 案例描述——个人信誉的评估分析 9.4.3 SAS/Analyst Logistic回归分析 9.4.4 LOGISTIC过程分析 习题 第10章 聚类分析 10.1 聚类分析简介 10.1.1 聚类分析的基本原理 10.1.2 系统聚类原理 10.1.3 最佳聚类数的确定 10.2 SAS编程分析 10.2.1 CLUSTER过程 10.2.2 TREE过程 10.2.3 FASTCLUS过程 10.2.4 ACECLUS过程 10.2.5 VARCLUS过程 习题 第11章 判别分析 11.1 判别分析简介 11.2 案例描述——鸢尾花的类型判别 11.3 SAS编程分析 11.3.1 STEPDISC过程 11.3.2 DISCRIM过程 11.3.3 CANDISC过程 习题 第12章 主成分分析 12.1 主成分分析简介 12.2 案例描述——国民生产状况的评价分析 12.3 SAS/Analyst主成分分析 12.4 PRINCOMP过程分析 习题 第13章 因子分析 13.1 因子分析简介 13.2 FACTOR和SCORE过程语法 13.3 案例分析——不同地区的经济状况比较 习题 第14章 时间序列分析 14.1 时间序列的基本原理 14.1.1 时间序列的数学模型 14.1.2 时间序列模型的识别 14.1.3 时间序列模型的估计 14.1.4 时间序列分析的步骤 14.2 Forecasting System模块及应用 14.2.1 Forecasting System模块概述 14.2.2 案例研究——GNP的时间序列分析 14.2.3 用ARMA模型做进一步分析 14.3 ARIMA过程及应用 14.3.1 ARIMA过程的语法 14.3.2 案例研究——抽查次品数量的序列分析 习题 第15章 SAS在数据预测中的应用 15.1 数据预测的基本方法 15.2 案例研究——GDP增长率预测 15.3 案例研究——上证指数日线预测 15.4 案例研究——汽车市场的需求预测 习题 第16章 SAS在市场研究中的应用 16.1 联合分析 16.1.1 联合分析简介 16.1.2 案例描述——汽车轮胎的评价分析 16.1.3 SAS联合分析过程 16.2 对应分析 16.2.1 对应分析概述 16.2.2 案例描述——汽车销售市场分析 16.2.3 SAS对应分析过程 16.3 多维偏好分析 16.3.1 多维偏好分析的基本概念 16.3.2 案例描述——消费者对汽车的偏好分析 16.3.3 SAS多维偏好分析过程 习题 第17章 SAS在分类分析中的应用 17.1 聚类分析应用 17.1.1 系统聚类——居民消费支出分析 17.1.2 快速聚类——噪声监测分析 17.1.3 变量聚类——经济发展指标分析 17.2 判别分析应用 17.2.1 一般判别——农民家庭收支分析 17.2.2 典则判别——农民家庭收支分析 17.2.3 逐步判别——农民家庭收支分析 习题 第18章 SAS/Enterprise Miner概述 18.1 Enterprise Miner简介 18.1.1 EM主界面 18.1.2 新建EM项目 18.2 SAS/EM节点 18.2.1 Sample数据环节 18.2.2 Explore探索环节 18.2.3 Modify调整环节 18.2.4 Model建模环节 18.2.5 Assess评估环节 18.2.6 报告和预测环节 18.3 EM案例——棒球球员的聚类分析 18.3.1 数据输入 18.3.2 缺失值处理 18.3.3 聚类分析的参数设置 18.3.4 查看聚类分析的结果 18.3.5 用Insight做进一步分析 习题
章节摘录
插图:描述性数据分析是人们认识数据和发现问题的有力工具,同时也是正式建立统计分析模型之前的铺垫,是科学的统计分析的一个重要环节。许多研究者往往一开始就应用经验对数据进行建模分析,而忽略了对统计数据的探索、研究这一初步过程,这样容易使其分析只停留在问题的表面而不能够深入。在对数据进行分析的时候,首先要对数据进行描述性统计分析(Descriptive Analysis),以发现其内在的规律,再选择进一步分析的方法。4.1描述性统计分析简介描述性数据分析直接从原始数据入手,让数据说话。许多统计方法都假定数据服从某种分布,然后用满足该种分布的模型进行拟合、分析和预测,但客观实际的数据并不总是满足理论上的分布,因而这些方法具有极大的局限性。描述性分析从客观数据出发,而不是从某种假定出发,从而能在实际数据中探索内在的规律。多数统计模型都是以概率论为理论基础的,并能够给出精确度的度量方法和度量值。探索性数据分析在研究数据的内在特征、数量间的关系和变化时,所用方法尽可能服从于数据特点和研究目的,并且更重视数据特征的稳健性,而相对放松对概率论理论和精确度的刻意追求。描述性数据分析使用的工具简单直观,更易于普及。专业的统计方法运用的数学理论越来越深,使想应用它的人们越来越害怕统计。探索性数据分析运用简单直观的茎叶图、箱线图、残差图和字母值、数据变换、中位数平滑等方法,使具有初等数学知识的人也可以进行分析。
媒体关注与评论
本书通过丰富的实例详细讲解了世界统计分析全才——SAS系统。书中不仅全面包括了SAS的功能、实现方法以及实例应用,还展示了如何用时下最为热门的数据挖掘工具——SAS/EM进行完整的数据挖掘工作。《SAS统计分析标准教程》是一本快速、有效、实用的使用SAS系统进行统计分析的中文教材。 ——SAS全球华人俱乐部发起人兼联合主席 周宏森博士本教程针对SAS系统的基本操作和基本的统计分析应用进行了由浅及深的介绍,内容涵盖了实际工作中有关统计分析的大部分SAS操作和编程技术,结构合理,文字清晰易懂,同时配有视频教学光盘,非常适合统计应用专业的师生以及相关从业人员学习。 ——西安杨森制药有限公司医学事务部生物统计经理 薛富波博士本书是一本实用的统计分析参考用书,内容涵盖多元统计分析、时间序列分析、EM数据挖掘等诸多方面,且每种方法都用实际的案例分析加以阐述。书中还举例介绍了SAS在数据预测、市场研究、分类分析中的应用,便于读者将理论知识转化为解决实际问题的能力。随书光盘辅以视频指导,初学者能够快速学会SAS并掌握其使用技巧。 ——南开大学数学科学学院副教授 吴忠华本书各章节贯穿了“算法原理-案例描述-可视化分析-编程分析”的基本思路,向读者展示了如何使用SAS9.2进行数据管理、统计分析、数据挖掘等工作。同时书中还给出了SAS在市场研究等专题中的多个应用,是一本使用SAS进行统计分析的不错的参考用书。 ——中国疾病预防控制中心 汪海波博士
编辑推荐
《SAS统计分析标准教程》:挖掘数据宝藏,助力支持,200分析全程视频讲解。
图书封面
图书标签Tags
无
评论、评分、阅读与下载