如果你沒辦法證明你想證明的,那麼你可以選擇展示其他事物,假裝這兩者是一樣的。由於人類的思想在遇上統計後總會產生茫然的感覺,所以幾乎沒有任何人會注意到其中的差異。只要你使用的是半關聯性數字(semi attached figure)這種工具,就能保證對你有好處,一直以來都是如此。
雖然你無法證明某種藥方能治癒感冒,但你可以(用超大的字體)刊登一則宣稱絕對誠實的實驗報告,告訴讀者只要半盎司(oz,約14克)的藥方就可以在11秒內殺死試管中的31,108隻細菌。過程中,請確保你找的實驗室具有良好信譽或聲名遠播。你可以全文轉載那份報告,並找一名模特兒穿上白色醫師袍,拍一張相片,附在文章中。
但請不要提到你在這裡使用的詭計。你不能自行決定(又或者你可以決定?)要不要在文章中指出,試管中效果絕佳的抗菌劑不一定能在人體中發揮作用,更不用說你還得先根據規範,把藥劑稀釋到不至於灼傷喉嚨組織的程度。而且不要告訴讀者你殺死的是哪一種細菌,否則會混淆議題。誰知道感冒是由哪些細菌引起的呢?說不定引起這波感冒的根本就不是細菌?
事實上,試管中的各種細菌與導致感冒的原因沒有任何已知的關聯。無論感冒的成因是什麼,人們在感冒期間進行的推論通常都不會太嚴謹,尤其是在他們鼻塞的時候。或許這個例子太過明顯,人們已經開始有所警覺,但從廣告的頁數來看,這種藥還是賣得很好。
假設在種族偏見日益嚴重的某段時期,有人僱用你來「證明」相反的事實。這項任務不算困難。你可以進行民意調查,或者採用更好的方法:僱用聲譽優良的機構替你進行調查。從能夠代表社會大眾的人口橫斷面進行調查,詢問他們是否認為黑人找到工作的機會與白人相同。你可以每隔一段時間重複調查一次,如此一來就能在報告中標示趨勢。
普林斯頓大學的公眾意見研究辦公室(Office of Public Opinion Research)曾測試過這個問題,最後獲得了有趣的證據,證明了在民意調查中,事情並不總是像表面上看起來那樣。回答此問題的人也回答了其他問題,這些問題的目的是確認受訪者對於黑人是否抱持強烈偏見。結果證明,偏見最嚴重的人,最有可能在回答「黑人找到工作的機會是否與白人相同?」時回答「是」。
如上所述,在進行民調的期間,如果偏見愈來愈高的話,獲得的結果中就會有愈來愈多人認為黑人找到工作的機會和白人一樣高。於是你宣布了結果:你的民調顯示,這段時間以來,黑人找到工作的機率變得愈來愈平等。你謹慎的使用了半關聯性的數字,藉此取得了非凡的成就。偏見愈是嚴重,民調的結果就愈好看。
又或者我們可以舉另一個例子:「在數量龐大的傑出醫師樣本中,有27%的人抽潤喉牌(Throaties)香菸—比其他牌子的使用者都還要多。」當然了,從很多方面來說,這個數字本身就有可能是假的,不過無論這個數字是真是假一點都不重要。看到這個毫無關聯的數字時,你唯一能給出的答案是:「那又怎樣?」我們當然要對醫學專業抱持著應有的尊重態度,但是醫師真的比你還要更懂香菸品牌嗎?
他們會因為能夠取得內線消息而選擇危害最小的香菸嗎?當然不會,他們沒辦法獲得任何內線消息,而且你的醫師一定會是第一個這麼告訴你的人。然而,不知道為什麼,你總是覺得「27%」聽起來好像代表了什麼有意義的事情。
接著,讓我們稍微減一個百分點,看看某牌果汁機的狀況。大量廣告指出,「經過實驗室測試證明」,某種果汁機能夠「榨出的果汁量多出了26%」,而且獲得了「好管家學會(Good Housekeeping Institute)的擔保」。
聽起來很不錯。如果你可以選擇效率高出26%的果汁機的話,怎麼還會想購買其他品牌呢?我們在此先不討論「實驗室測試」(尤其是「獨立實驗室測試」)證明過的一些怪奇事實,只先討論一件事就好:這個數字代表了什麼意思?比什麼還要多26%?你將會在追根究柢後發現,這個數字代表的是這臺果汁機能榨出的果汁比老式的絞刀榨汁機更多。這個數據跟你在購買前想要了解的資訊毫無關聯;這款果汁機甚至有可能是市場上最糟的果汁機。26%這個數字不但精確到有些可疑,而且對你來說根本無關緊要。
會用數字愚弄你的,可不只廣告商而已。《本週》(This Week)雜誌曾刊登過一篇有關安全駕駛的文章,無疑是為了你好,才會在文章中告訴你若「以時速70英里(160公里)的速度在高速公路上左搖右擺的飛馳」的話,會發生什麼事。
文章指出,如果時間是早上7點,那麼你存活下來的機會將會是晚上7點的4倍。他們提出的證據是:「晚上7點在高速公路上發生的死亡事故數量,是早上7點的4倍。」好的,雖然這個數字大概是真的,但結論並不成立。晚上死亡的人之所以會比早上多,單純是因為晚上在高速公路上的人車比較多,所以死亡人數才會比較多。身為汽車駕駛的你可能會在晚上處於較大的危險,但在「4倍」這個數字之中,沒有任何證據能證明這一點。
按照該篇文章作者使用的荒謬邏輯,你也可以證明在晴天駕駛會比在霧中駕駛更危險。晴天發生的事故數量比較多,是因為晴天的天數比起霧的天數還要多。儘管如此,在起霧的天氣駕駛應該還是危險得多。
你可以用任何交通工具的意外事故統計數字來把自己嚇死⋯⋯前提是你沒有注意到這些數字和交通工具本身的關聯性有多麼薄弱。去年死於飛機失事的人比1910年還要多,所以現代的飛機比較危險嗎?當然不是!只不過是因為現在搭飛機的人數比以前要多上許多倍而已。
根據報導指出,某一年因為火車事故而死亡的人數是4712人。這個數據聽起來是個遠離火車的好理由,你或許也可以靠著此論點堅持你要繼續開車。但是若你認真了解該數字所代表的意義後,會發現事情和你想的天差地遠。這個數字將近半數受害者是坐在汽車中,和火車在平交道相撞。餘下的受害者中,絕大部分都在搭火車時跨坐在火車車廂之外的鐵桿上(編按:常見於大蕭條時期,是貧窮且須長途跋涉工作的人搭乘火車的模式。),只有132人確實是火車上的乘客。然而,就算是132這個數字,也幾乎無法證明任何比較上的差異,除非你在列出這些數字時,也一併附上乘客的總里程數。
如果你擔心自己在美國東岸與西岸間旅行時有高機率因事故死亡,即使調查去年致死人數最多的交通工具是火車、飛機或汽車,也不會為你帶來太多有用的相關資訊。想知道機率是多少,你要尋找的應該是每100萬乘客里程數的死亡人數。這個數字才能以準確性較高的方式告訴你,會在哪裡遇到最大的風險。
作者介紹:德瑞爾.赫夫(Darrell Huff,1913~2001)
愛荷華大學文學碩士。其作品《統計操控的真相與謊言》是20世紀下半葉最暢銷的統計學書籍,向大學生和高中生介紹實用的統計學,以超過22種語言出版,至今仍持續被翻譯為各種語言,並在世界各地的課堂中使用。
1946年開始全職寫作之前,赫夫曾擔任《美好家園》和《自由》雜誌的編輯。做為一名自由工作者,赫夫發表過數百篇「如何做」專題文章,並撰寫至少16本書。