統計,讓數字說話!

出版社:天下遠見出版股份有限公司  作者:墨爾(David S. Moore) 著  页数:351  

前言

  新版譯序  鄭惟厚  天下文化的編輯說,《統計,讓數字說話!》要出「新版本」了,要我寫序。這是我生平翻譯的第一本書,是民國87年11月出版的,到現在竟然已超過十年了。十年還在賣,而且能夠以新面目見人,代表了它「長銷書」的地位,身為譯者,與有榮焉。  當初天下文化找我翻譯時,我是懷著忐忑的心情接下這份工作的,因為從來沒翻譯過書,對於會做出怎樣的成果,還真是沒有把握。那時有不少翻譯書,看起來都像是「直譯」的,把英文直接翻成中文,連英文語法都保留,不管中文裡面有沒有那種語法。這種書讀起來的感受,就是「折磨」兩個字;逛書店時只要翻閱到這類文字彆扭的書,一定立刻放棄,即便書的內容似乎很吸引人。所以我開始翻譯時,心裡只有一個主要目標,就是希望翻譯出來的書,「不像是一本翻譯書」;這代表我得把原著內容消化吸收之後,再用自己的語言說出來。  這本書一開始的銷售量就讓天下文化大吃一驚。其後的幾年當中,曾經不知有多少次了,碰到有人跟我說,「我讀過妳的書」。一開始我都立刻更正:「不是我寫的書耶,是我翻譯的書」,總不能把人家作者的功勞據為己有吧。可是好像沒什麼用,還是一直聽到「妳的書」的說法;久而久之,我也就半推半就的覺得是我的書啦。什麼時候應該e一封信給作者道歉一下。從上述的讀者反應看起來,猜想我的譯寫目標應該有達成吧。而且還曾有好些讀者形容它是一本「可以看得懂的統計書」,和一般統計書給人的「遙不可及」印象對照起來,我覺得這句話對這本書「讚很大」!  第一本翻譯的書當然在我心裡有特殊地位,現在能以新面目現身,希望也有更多讀者會喜歡它。  2009年6月  前言  統計是什麼?  墨爾  統計是從數據中獲取資訊的科學。為什麼要學統計呢?因為在各行各業、公共政策,甚至日常生活當中,使用數據已經成為稀鬆平常的事了,讓我們先舉幾個例子,看看這本書要討論些什麼樣的統計問題吧。  政府宣布上個月的失業率是6.5%,這個數字到底是什麼意思?政府又是打哪兒得到這樣的資訊呢?(他們既沒問你、又沒問我上個月是否有工作,對不對?)這個官方失業率的精確度又如何?  根據蓋洛普的調查,45%的美國成年人因為安全問題而害怕在夜間外出。這訊息從哪得來的?有多精確呢?  根據醫學實驗的結果得知,按時服用阿斯匹靈可減低心臟病的風險。這些實驗結果為什麼可信?阿斯匹靈有多大效果呢?  懷孕期間服用班得廷(Bendectin)來緩解嘔吐症狀會造成胎兒缺陷嗎?抽菸會引起肺癌嗎?這兩個疑問都已經由統計得到肯定的答案。統計證據到底何所指?我們又為什麼可以說,有強烈的證據顯示吸菸會致癌,而對班得廷造成胎兒缺陷這件事,又為什麼只能做比較保守的結論呢?  在彩券及賭場愈來愈多的今天,因為誤算贏的機會而輸錢的人也愈來愈多了,賭徒可以從「平均數定律」(law of averages)中學到些什麼?有沒有什麼方法可以幫我們贏錢或者中彩券?  統計學的目的就是從數據中找訊息。數據雖然只是些數字,但它們還有上下文。比如說,光是10.5這個數字,本身沒什麼含意,但是假如我們得知,一個朋友的新生嬰兒出生時重10.5磅,我們會恭喜她生了個健康寶寶。數字配合著上下文,就和常識銜接上了,因此我們可做出判斷。我們知道10.5磅重的嬰兒相當大,而且也知道嬰兒不可能重10.5英兩或10.5公斤。數字加了上下文,就提供了訊息。  就因數據是有「上下文」的數字,所以做統計並不只是玩弄數字而已。希望你在讀這本書時,花在思考上的時間比計算上的要多。如果你期待的是一本充滿算式的數學書,可能就要有點兒失望了。雖然我們要用到一些基礎數學,統計卻不是數學,所以不妨放輕鬆,準備接收新概念吧!  我們的目標  為了討論如何從數據中找訊息,我們的研究分成三部分:  1. 如何產生數據  2. 如何整合數據  3. 怎樣從數據中得出結論  在第一部分中,我們將會介紹能夠生產出好的數據的統計設計(statistical design)。「樣本」(sample)和「實驗」背後的觀念,雖然很簡單,也沒牽涉到什麼數學,但卻是統計概念中很重要的部分。  第二部分中將談到如何進數據中探索資訊,包括圖形的利用及數值計算。我們通常稱這個主題為「資料分析」(data analysis),就是試圖了解資料中所含的訊息,並傳達給別人。  本書第三部分的內容是「統計推論」(statistical inference)。推論就是在利用機率,從數據中找出結論,並表達出我們對所得結論的正確性有多大的信心。  以上的主題是全書的骨架,支撐的內容是利用數據和機率做推理。我們會討論到民意調查對政治產生的影響、人體試驗的道德問題、試圖用數字誤導我們的人所用的伎倆,以及因果關係證據的微妙問題等等。  讀本書的目標應分成三個方面。  第一、了解統計概念本身;利用數據以及機率做推理的觀念,是值得注意的重大智慧結晶。  第二、獲得批判有關數學的立論之能力。很多人太輕易相信數字,只要有幾個看來可靠的數字擺在面前,他們並不深究立論的本質。另有一些人又疑心太重了,認為數字天生就是騙人的,所以從不相信數字。其實有關數字的立論就和其他事物一樣,有好有壞,而有些根本離題。加強一點對數字的了解,可讓你自己判斷,而不光是「接招」。  第三、可了解統計概念對公共政策以及其他學術領域的影響。  如何處理「不確定性」  資料會變。人會變,動物會變,事物也會變動,對同一個體多次度量同樣的標的,也會量出不同的結果。所以我們從資料得出的結論,也並不是完全確定的。統計學就是要和世上的變異性及不確定性正面交鋒。利用統計推理得到的數據,不會因為變異性及不確定性,而變得沒有用處。統計學可以分析數據,將一些有系統的型態從無所不在的變異性中抽離出來。統計學也可以做出一些雖不確定、但不確定性卻很小的結論。這世界上本來也沒有什麼是百分之百確定的。更重要的是,經由統計推論,我們可以有辦法聲明,所得結論的不確定程度到底有多少。  統計觀念及技巧的出現,就是在人們試圖對付不確定的資料時慢慢產生的。將近兩個世紀以前,天文學家和測量員面臨整合數據的困難:不論多麼小心,數據仍然無法吻合。為了處理資料的變異性,他們發展出了初步的統計技巧。  十九世紀,社會學出現的時候,為了描述個體及社會的差異,人們改革了舊的統計觀念,並創造了新的觀念。之後,為了研究遺傳理論及各種生物族群,統計技巧又更進一步。二十世紀前半發展出了可產生數據的統計設計,機率也開始正式用在統計推論上。  到了二十世紀中,已可清楚看到一個新的學科誕生了!由於各種研究領域都愈來愈重視數據,大家也愈來愈了解資料的變異性是不可避免的,統計學可說已成了一種核心方法。每個知識份子都應該熟悉統計推理,而讀這本書可幫助你達到這個目的。  導讀  數字真的說了什麼?  鄭惟厚  一聽到「統計」,你的第一個反應是什麼呢?是不是腦海裡會浮現出一堆數字,或者一堆圖表?似乎許多人對統計的印象就是這樣。這一類把資料做整理與綜合、以方便人們從資料中尋找訊息的方法當然也是統計,但只是統計裡面的小小一部分。這類統計很有用,但是稍微枯燥一點。另外一部分的內容就豐富、精采、有趣多了。聽我這麼說,你可能還有些懷疑,還是先舉幾個例子,也等於先替這本書的內容,大致做個「預告」:  A.有個朋友告訴我,如果要去拉斯維加斯或大西洋城,一種有系統的賭法是:這一把如果輸了,下一把賭注加倍;這一把如果贏了,下一把賭注就照舊。這樣如果連輸幾把,只要贏一把就可回本。聽起來很有道理。我如果照這樣玩,是不是可以贏錢?  B.股市可以預測嗎?  C.「吸菸可能致癌」好像是不容懷疑的事實,可是這種結論怎麼得來的呢?  D.民意調查(我指的是由公正的專業機構所做的民意調查)為什麼可以只問一兩千人的意見,就告訴我們大家是怎麼想的呢?  你一定同意,以上都是既實際又有趣的問題吧!這本書就給了我們許多這類問題的答案。  讓我們來看看這些問題的本質是什麼。問題A牽涉到機率和一種叫「期望值」的東西,第7章就在談這些,說明很淺顯易懂。讀完第7章,你就會知道問題A的答案,也同時會知道賭場和保險公司是靠什麼賺錢。  問題B和第6章第4節的內容有關,因為股市資料是隨著時間而變動的。那一節裡面介紹了這類資料的一些特性,也談到了預測的問題,對問題B提供了部分答案。  問題C牽涉到兩個變數(吸菸及肺癌)之間的關係。這種關係該怎麼度量?兩個變數之間如果有高度相關性,是不是可以說其中一個變數導致另一個變數(例如吸菸導致肺癌)呢?這些答案都在第5章裡面。  問題D的重點在於樣本如何抽取,第1章就談到了這個問題。只要讀完第1章,你就大致有了答案,如果想知道多一些細節,第8章有詳細討論。  從資料中推出結論  從以上的例子,是不是可以感受到:其實統計對我們每個人都很有用,可以提供給我們許多答案!  再舉一個例子:某些媒體常常使用的叩應(call-in)民調,你覺得做出來的結果能代表廣大民眾的意見嗎?  多年前,我曾經在報上讀到一篇報導,報導說明:從民意調查的結果獲知,台北市民80%家裡曾遭小偷。這個數字太誇張了吧!你相信嗎?這倒不是寫報導的人存心欺騙,而是抽樣方法的問題。這項民意調查發問卷出去,而寄回的問卷當中,80%的人說曾被偷。因為問卷上還問到對於偷竊刑罰的意見,所以想想看,不怕麻煩填問卷再寄回的人,比較可能是被偷過的人呢?還是沒被偷過的人?這和叩應的狀況是類似的。當然,如果結果太誇張,你會猜到有問題;可是如果不那麼誇張呢?  我們現在經常聽到、談到別人「餵」給我們的資訊,比如各種民調結果(民眾對候選人的支持率、電視節目收視率、政府官員施政滿意度等等)、股市預測、新藥測試(每種新藥上市之前,都要經過一定的測試程序)等等。  這幾個例子看起來沒多大關係,其實有一個共同點:都是在做推論。民調根據樣本(大多數民調只調查一兩千人)的結果,告訴我們台北市民支持王建?、馬英九、陳水扁(依姓氏筆畫順序)的各有多少比例;股市預測是根據現有資料,推斷以後的狀況;新藥上市前所做的最後一道測試,則是根據小部分人對這個藥的反應,來評估這個藥對所有可能服藥者的有效性及安全性。從小小的樣本,卻要推到大大的全體;或從現在為止的資料,卻要推到未知的未來,當然都要有根據,而這些根據,都是推論統計的內容。  前面曾提到的光是整理和綜合資料的方法,有人稱為「敘述統計」,而推論統計則是要從資料中導出結論。  生活中的判斷智慧  相信你可以想像,要從資料中推導出結論,背後的學問當然很大,所以大學統計系學生要讀四年,可是你不需要傷這麼多腦筋,你只要有統計常識就可以了。  這本書給你的,其實就是統計常識。它原本是教科書,作者墨爾教授任教於美國普度大學,他在教一門統計通識課程時,完成並修訂這本書。那門通識課程的對象主要是文科學生,這些學生大部分以後並不準備再修習任何統計方面的課。對他們來說統計不是工具,是常識。本書以這種理念為基礎,所談的都是觀念及統計方法背後的推理過程。整本書裡面看不到幾個數學公式,作者用了許許多多和日常生活相關的實例,利用敘述的方法,把統計最重要的基本概念解釋得清清楚楚。在讀到這本書之前,還真不相信統計書可以寫成這麼「不專業」、這麼可讀。  這本書的可讀性高,內容又非常生活化,天下文化把這本書納入「科學天地」系列,介紹給大家。原本書中每一節都有很多習題,考量閱讀的連貫性和篇幅的問題,在翻譯時略去了這些習題。  讀這本書,你可以得到清楚的統計基本知識,而大多數人都可以從這種知識獲利。如果你的工作和行銷有關,市場調查就是一種民意調查,當然市場調查的方式有許多種,簡單到複雜、低成本到高成本都有,但你必須考慮樣本代表性的問題。如果取樣本的方法不對,做出一個誤導的結果,很可能比完全不做還糟糕。如果你在製造業,品質管制的概念就是統計。各種保險的保費怎麼算的?根據統計的期望值觀念。航空公司怎麼知道接受預定座位可以超過多少百分比?也要用到統計觀念。兩種藥哪種療效比較好?要做有效的比較,都要用到統計觀念。  統計的應用不勝枚舉,只要牽涉到資料的蒐集、整理與分析,就必須有統計的基礎,才能得到合理的結果。如果你是學生,不論學的是理、工、商、農、醫、管理,甚至教育等文科,你都需要接觸數據!你可能要做實驗、可能要做調查,也可能要讀別人的報告,基本的統計知識是必要的。甚至連學統計的學生,都可以受惠於這本書。因為一般的統計書也許強調方法、強調理論,這本書強調的則是觀念,會讓人有「茅塞頓開」的清新感覺。  我們或許不需要自己整理數據,但也要有統計基本觀念,才能得知資料可不可靠。當別人告訴我們數字說了什麼話時,我們怎麼判斷正確性有多高呢?這本書帶給我們基本的判斷智慧,讓我們可以去評估數字是不是真的說了那些話,而不必照單全收。  如果下次再看到如下的「報導」:「經過測試,某某方法減肥最具成效」或「根據調查,某某門號的大哥大通話品質最佳」,建議你不妨打個電話去問一下,測試或調查是怎麼做的?樣本如何取?樣本大小如何?看看他們如何回答,你再判斷要不要相信那則廣告吧!

内容概要

  有了基本的統計觀念,就能聽懂數字說的話!  統計與現代人的生活息息相關,我們平時會碰到各式各樣的統計數字,各行各業都需要應用到統計方法。想了解統計嗎?《統計,讓數字說話!》透過生活化的實例,利用敘述的方式,把最重要的基本概念解釋得清清楚楚,不管是學生還是社會人士,這本書都能讓你茅塞頓開,正確判斷數字所說的話。  讀了這本書,你就能回答以下這類問題:  ? 政府宣布上個月的失業率是6.5%──這個數字代表什麼意義?這個官方數字是怎麼算出來的?它精確嗎?  ? 根據醫學實驗結果,按時服用阿斯匹靈,可減低心臟病的風險──這些實驗結果可信嗎?  ? 只訪問了一、兩千人的民調結果會準嗎?  ? 資料顯示,坐飛機比開車安全得多,可是為什麼大家還是覺得坐飛機比較危險?

作者简介

  墨爾David S. Moore  普度大學(Purdue University)統計學教師。墨爾是資料分析法的始祖之一,美國統計學會/美國數學學會(SAA/MAA)委員會會員,成功提倡統計教學法的改革。他在教學方面的成就,獲得了美國數學學會1995年教學傑出獎。鄭惟厚  台灣大學數學系畢業。美國愛荷華大學數學碩士、統計學博士,現任淡江大學數學系教授。譯有《統計,讓數字說話!》、《毛起來說e》、《看漫畫,學統計》、《統計學的世界》、《機率學的世界》、《別讓統計數字騙了你》(皆為天下文化出版)。所著的第一本書《你不能不懂的統計常識》,即榮獲第四屆「吳大猷科學普及著作獎」創作類銀籤獎,並且入圍了97年行政院新聞局金鼎獎最佳科學類圖書。

书籍目录

導  讀	數字真的說了什麼?  鄭惟厚新版譯序	  鄭惟厚前  言	統計是什麼?  墨爾第一部 產生數據第一章	樣本抽樣基本觀念  叩應的意見調查準確嗎?簡單隨機抽樣 不管有錢沒錢,被選入的機會都是一樣的從樣本看母體  好的抽樣方法要像神槍手一樣信賴敘述  「95%的信心水準」是什麼意思?抽樣的實際面  在相信調查結果之前,應該問哪些問題?其他抽樣設計  「從地圖抽樣」而不是「從人抽樣」議題:民意調查與政治活動  競選活動變成行銷活動了議題:以隨機選取作為公共政策  為什麼當兵用抽籤決定?議題:資訊道德  保護個人和提供知識,哪裡才是平衡點?第二章	實驗為什麼要實驗?  因果關係的最好證據隨機化比較實驗  很多病人甚至對假的治療有正面反應實驗的施行  任何改變都可以增加生產量其他實驗設計  也想要知道男性和女性分別的反應如何議題:公共政策實驗  要對付政壇人士及激進團體議題:道德與實驗  故意給病人比較差的治療是否道德?第三章	量度有效和無效量度  聯考分數是否有助於預測大學成績?準確和不準確量度  如果度量許多次,會是什麼狀況?量度的尺度  我們不能計算1500人的「平均性別」議題:數字可以怎樣「詐」我們  清楚看到假數據 139第二部 整合數據第四章	描述分布展示數據  怎樣才是好的圖和表?呈現分布  從圖讀出故事如何度量中心或平均  各式各樣的「平均」怎麼用?如何度量離度或變異性  資料散布多廣?常態分布  許多資料都是常態分布第五章	了解關聯的意義雙向表  女性在工作收入上受否受到歧視?散布圖及相關係數  哪些資料之間有相連?相關性多強?議題:因果問題  吸菸一定導致肺癌嗎?迴歸及預測  如何預測未知資料?預測準確嗎?第六章	消費者物價指數及它的鄰居指數  1980年到現在,什麼東西漲價了?消費者物價指數  錢變小了!議題:政府統計的處境  消費者物價指數影響每個人的收入隨時間改變的資料  景氣循環可不可以預測?第三部 根據資料做結論第七章	機率:討論可能性的語言什麼是機率?  保險公司怎麼賺錢?議題:對於可能性的探討  生7個女兒後,一定生兒子嗎?用模擬方法求機率  簡單算機率賭場的優勢:期望值  有沒有會贏錢的賭法?第八章	推論:有信心的結論有信心的估計  市長有多少信心會當選?比率及平均數的信賴區間  如何估計學生平均看多久電視?統計顯著性  怎樣否定∕肯定一個假設?比率和平均數的顯著性檢定  證據有多強?議題:真正了解統計顯著性的意義  依據什麼判定為歧視?附 錄表A 隨機數字表B 常態分布的百分位數表C 常態分布的臨界值

章节摘录

  新版譯序/鄭惟厚天下文化的編輯說,《統計,讓數字說話!》要出「新版本」了,要我寫序。這是我生平翻譯的第一本書,是民國87年11月出版的,到現在竟然已超過十年了。十年還在賣,而且能夠以新面目見人,代表了它「長銷書」的地位,身為譯者,與有榮焉。  當初天下文化找我翻譯時,我是懷著忐忑的心情接下這份工作的,因為從來沒翻譯過書,對於會做出怎樣的成果,還真是沒有把握。那時有不少翻譯書,看起來都像是「直譯」的,把英文直接翻成中文,連英文語法都保留,不管中文裡面有沒有那種語法。這種書讀起來的感受,就是「折磨」兩個字;逛書店時只要翻閱到這類文字彆扭的書,一定立刻放棄,即便書的內容似乎很吸引人。所以我開始翻譯時,心裡只有一個主要目標,就是希望翻譯出來的書,「不像是一本翻譯書」;這代表我得把原著內容消化吸收之後,再用自己的語言說出來。  這本書一開始的銷售量就讓天下文化大吃一驚。其後的幾年當中,曾經不知有多少次了,碰到有人跟我說,「我讀過妳的書」。一開始我都立刻更正:「不是我寫的書耶,是我翻譯的書」,總不能把人家作者的功勞據為己有吧。可是好像沒什麼用,還是一直聽到「妳的書」的說法;久而久之,我也就半推半就的覺得是我的書啦。什麼時候應該e一封信給作者道歉一下。從上述的讀者反應看起來,猜想我的譯寫目標應該有達成吧。而且還曾有好些讀者形容它是一本「可以看得懂的統計書」,和一般統計書給人的「遙不可及」印象對照起來,我覺得這句話對這本書「讚很大」!  第一本翻譯的書當然在我心裡有特殊地位,現在能以新面目現身,希望也有更多讀者會喜歡它。

图书封面

评论、评分、阅读与下载



用户评论 (总计0条)

 
 

 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7