一秒鐘看穿統計陷阱

weihua99 · 發表於 2012-2-16 23:11

發表於前天 17:04 來源獨家網

嚴酷的魔王 2011-10-07 18:29:45

「隨機調查了100位網友，有87.53%的網友同意……」恩？等等。呃，糊弄鬼呢！「哦，不好意思，看錯了，是130位網友……」哦，這樣……恩？再等等……

正所謂「流氓懂科學，誰也擋不住」。如今越來越多的複雜統計數據像潮水般向我們湧來，一批又一批的調查結果，都顯得那麼鏗鏘有力，似乎那就是客觀事實。統計陷阱被科學流氓們包裝的越發完美，一不小心就把我們忽悠了。該怎麼辦呢？別急，且看死理性派現身說法，幫大家理清真相。

抽樣調查，想說無偏不容易

調查問卷你肯定知道，多半還做過。在統計上，問卷調查屬於抽樣調查。再大規模的抽樣調查，都可能存在著意想不到的陷阱。不妨讓我們穿越到 1936 年的美國，看一個被許多書本都引用過的實例吧。

1936 年美國總統大選在即，當時一本著名雜誌《文學文摘》就在讀者中做了一次問卷調查，斷言共和黨的蘭登即將以 57% 對 43% 的絕對優勢大勝民主黨的羅斯福——這可是根據 240 萬份調查問卷得到的結果。這麼大規模的調查，如同宣告了蘭登的勝利，可是，最後的結果卻讓人大跌眼鏡：羅斯福以 62% 的支持率成功連任美國總統。出現了這個戲劇性的醜聞后，《文學文摘》業績直接掉落為零，最後竟然倒閉了。對於《文學文摘》來說，他們的問題出在哪裡呢？

現在看來，《文學文摘》的調查問卷雖然數量龐大，但是樣本構成大有問題。首先，最可能看到這個調查的是這個雜誌的常客，而他們參加調查的動機各有不同。另外，這個話題更能引發人的興趣，有些則只是很少的人關心。這都會導致最終參加調查的人是一個有偏的樣本。結論可能代表了這些人群，卻不能推廣到全體。

其次，問卷的回收率只有 24% ，忽略那些沒有被回收的問卷就等於是忽略了剩餘 760 萬人的意見。《文學文摘》雜誌社還通過電話調查的方式對自己的讀者進行了抽樣，但在 1936 年，並不是每一個家庭都能裝得起電話——那些訂閱雜誌、用電話的人家往往都是有錢的人，他們並不能代表全美國的選民意見。最終，這些看起來不算起眼的問題對他們的預測結果產生了巨大影響，事情的發展也走向了完全相反的方向。

如果我們現在做一個調查，看一看在最初恢復高考的三年中進入幾所名牌大學就讀的學生如今的年收入，你一定會得到一個高得嚇人的數字。我敢如此肯定並不是我熟悉他們的社會成就，而是因為我了解調查的缺陷。可以想見，當年的那些大學生雖然有案可查，但能夠準確聯繫調查的卻只有一部分較為成功的人了。其中有一些人雖然聯繫上了，卻不一定願意接受調查。最後，還不能排除一些人受讚許傾向的影響，有意無意地提高報告自己的收入水平。最終，調查員只回收了那些成功人士的數據，而沉默的大多數卻被「統計式」地忽視了。

圖表裡的玄機

為了讓沒有直接接觸數據的人也能直觀地感受到其中的一些信息，人們發明了各種各樣漂亮的統計圖表。但是就是「客觀」的圖表裡面也存在著各種各樣的陷阱。

在製作統計圖表時，一個常用的欺騙手法便是改變統計圖形的坐標尺度，從而改變了整個圖形的陡峭程度。《統計陷阱》一書中就曾舉過這樣一個例子。下圖反映了某年9月27日某時的黃金價格走勢。

上面兩幅圖描述的是相同時間段的黃金價格走勢，顯然，左邊的金價急升更容易讓人產生激動的心情。右邊將左邊的圖橫向拉長了，使得它看起來是在更短的時間內衝上高峰，即使標出了橫縱軸的刻度，這兩幅圖給普通人留下的第一印象也大不一樣。

當然，還有比拉伸圖表更隱蔽的手法。現在我們手上有一組羅坦提亞和美國的木匠平均周收入，如果做成條形圖就像下面那樣：

看得出來，美國木匠的平均收入是羅坦提亞木匠的兩倍。但通常為了視覺效果，它會被做成更形象的卡通圖。這其實卻暗中改變了人們對這個統計事實的印象。

美國人的錢袋長、高都是羅坦提亞木匠的兩倍，看起來挺忠實於數據的，但是右邊錢袋實際佔用的面積就是左邊的4倍。這幅圖像導致的暗示效果其實還沒完，因為在生活中錢袋都是立體的，所以每個讀者看到這個錢袋的時候會不經意地給它加上一個厚度，這樣一來，在有些人眼裡這幅圖表達的明明是美國木匠的收入是羅坦提亞的8倍——這樣的印象完全脫離了原始數據所給出的信息，無疑是一次成功的誤導。

如何練就火眼金睛

上面說了幾個很容易讓公眾迷惑的統計陷阱，那當我們看到各類統計數字時，應該如何判斷它是否客觀呢？

首先要細心尋找統計中的偏差。比較明顯的是在描述上有意識進行的偏差。比如濫用平均數等帶來的問題：「我們工廠 3000 人，月平均工資有 5000 塊。」看起來比較不錯的待遇，實際上可能是一個月薪 100 萬的老總加上每個月拿著可憐薪水的上千名工人簡單平均起來的結果。同時報道中常常聲稱的「升高」和「下降」並不一定真的如此。在面對類似「這段時間氣溫異常升高，熱浪持續一周導致城市死亡人數激增至 300 人」這樣的標題時，我們往往要小心這裡所說的「激增」是否屬實。一個一定規模的城市在一周內有 300 人死亡並不算是異常的數字，而熱浪實際上是一個沒有多少分量的因素。半個世紀以前，紐約市的兩份報紙上面刊登的犯罪數量一度達到了令人髮指的水平，迫於輿論壓力，當時的警察聯合會主席不得不有所表示，但是他僅僅採用了一個行動就平息了這場風波——他解僱了兩名編輯，因為這場風波是他們在互相競爭著挖掘犯罪事件並搬上檯面，導致對民眾產生誤導。事實上，警察局的統計數據表示這段時間的犯罪事件數量並沒有上升。

其次我們要尋找潛伏著的無意識偏差，這種偏差帶來的結果往往影響更深遠——《文學文摘》就是無意識偏差的受害者。無意識偏差常常會體現在對樣本的選取不注意上。一個超市對50名顧客進行了調查，得出了「 75% 的人聲稱喜歡喝茶而不是咖啡」的結論，那麼我們大可不必去相信這個結論，因為相比起總數來說， 50 個人實在是微不足道的。這家超市也發現了這個問題，接著發出 10000 份調查問卷，最後回收了 2300 份，發現「 64% 的人聲稱喜歡喝茶而不是咖啡」，這個結論毫無疑問也不能令人信服。實際上這個調查體現出來的是有 1472 個人更喜歡喝茶，828 個人更喜歡和咖啡，但是還有剩下 7300 個人沒有給出答案——這是光看結果分析的讀者所無法知道的，所以不能簡單地相信一個直接而草率的結論。

最後我們要注意保持對統計圖示和統計數據的敏感性。圖標會有意無意地通過巧妙設計（比如橫縱軸的尺度問題），從而使得這幅圖凸顯的內容就是作者期望讀者能夠收到的信息。在觀看圖表的時候，我們可以試圖在腦海中想象出與圖像所對應的具體數據，只要圖像不是捏造的，那麼就能夠在一定程度上擺脫視覺上的誤導。然而白底黑字的統計數字又怎麼會出錯呢？捏造的數字當然是錯誤的。比如當年鬧得沸沸揚揚的 87.53%事件，但如果報道中提到的被調查人數是 130 人，不知道還會有多少人能發現這個數據不正確？113 個人表示支持的話，那麼支持率是 86.92% ，114 個人表示支持的話，那麼支持率是 87.69% ——無論如何也得不到 87.53% 的數據，但是這樣造假的數據卻大大提高了可信度，讓人再難發現起謬了。實際上，很多的假數據都利用到了人們天生對「精確的數字」的信任——「在校大學生每日開銷大約為 50 元」的說法就不如「在校大學生每日開銷為 51.74 元」更顯真實。仔細想想，我們每天接觸著海量的信息，身邊有多少數據是這樣以假亂真的呢？

或許對於那些統計學家來說，只有下面這幅圖才讓人感到一點點的安心吧：

snakek · 發表於 2012-2-17 04:57

網上兩種報告，不可輕信。一種是健康知識或醫學報告。太多片面或歪曲的。另一種就是統計數字，就像文章中所說。

HappyUSANA · 發表於 2012-2-17 11:46

HappyUSANA · 發表於 2012-2-17 11:46

回復 snakek 2樓的帖子

基本同意

一秒鐘看穿統計陷阱

瀏覽過的版塊