為什麼穿夾克比較容易發生車禍?專家揭密驚人原因,魔鬼藏在細節裡

2023-07-07 14:00

? 人氣

條件機率通常寫成P(A|C)的形式,即在事件C發生的情況下,事件A發生的機率。(示意圖/取自DesignersPics)

條件機率通常寫成P(A|C)的形式,即在事件C發生的情況下,事件A發生的機率。(示意圖/取自DesignersPics)

通用汽車有一個品牌叫龐帝克,相關部門曾經收到某位顧客的郵件投訴,該封信內容如下:

[啟動LINE推播] 每日重大新聞通知

這是我第二次寫信給你,我不怪你不回覆我,因為我知道這聽起來很瘋狂,但它是一個事實。我家有個傳統:晚飯後去吃冰淇淋,每天晚上我們都開車去買不同口味的冰淇淋。我發誓我說的都是真的,我最近購買了一輛龐帝克,但是去買冰淇淋時我發現了一個問題:每當我買香草冰淇淋,汽車都發不動,但如果我買其他口味的冰淇淋,汽車就會很好地啟動。我非常嚴肅地看待這件事,不管你覺得我有多麼愚蠢,我都想知道,為什麼龐帝克每次遇到香草冰淇淋就無法順利發動?

汽車公司的經理雖然很懷疑事情的真實性,但還是派了一位工程師調查這個問題。工程師和車主見了面,約定一起去買香草冰淇淋,他們到了商店,買完冰淇淋,車子果真發不動了。

工程師盡量還原現場,並連著三天晚上開車去買冰淇淋。

第一晚,買巧克力口味的,車子啟動了。

第二晚,買草莓口味的,車子也啟動了。

第三晚,買香草味口味的,車子就不動了。

這到底是怎麼一回事?

這位工程師非常細心,在這幾次和顧客一起買冰淇淋的過程中,他詳細記錄了過程中的每一個細節,並分析了這些細節,希望找出買香草冰淇淋的過程和買其他口味冰淇淋的過程中所有的不同之處。

真相果然隱藏在細節裡。工程師發現,買香草冰淇淋所用的時間遠比買其他口味的要短

香草冰淇淋賣得最好,被放在距離商店門口最近的地方,不需要翻找,直接拿起來付錢即可。而其他口味的冰淇淋被放在商店較靠後面的位置,多種口味混合放在一起,不只要走到相應位置,還要翻找想要的口味,所花時間明顯比買香草冰淇淋更久。

購買時間和車子的啟動又有什麼關係?工程師對這個顧客的汽車進行了檢查,發現「氣阻」問題氣阻通常在引擎較熱時產生,如果汽車的供油系統中出現氣阻,引擎吸燃料時,燃料的供應會變得斷斷續續,汽車會因此無法啟動或在行進間熄火

這位顧客購買的龐帝克汽車就有氣阻的問題。購買其他口味冰淇淋花費的時間足以讓引擎冷卻,從而讓車順利啟動;而當顧客購買香草冰淇淋時,時間短,引擎過熱,氣阻無法及時消失,汽車因此無法啟動。

工程師解決了顧客汽車的氣阻問題,這位顧客以後在購買任何口味的冰淇淋時,再也沒有出現車子無法啟動的情況。

條件獨立

大部分人看完上述故事的收穫是:有時候問題看起來無解,但在冷靜思考後會發現它的確可以被解釋。不過,在本書中我想更深入地分析這個故事。故事中包含了一個數學概念──條件獨立。

條件獨立和條件機率有關。我先介紹什麼是條件機率。條件機率通常寫成P(A|C)的形式,即在事件C發生的情況下,事件A發生的機率

例如,下雨天通常選擇搭車上班。在這個例子裡,C就是「下雨天」,A就是「搭車」,而P(A|C)就是一個接近1的機率值(下雨天通常會搭計程車)。如果去掉這個條件,P(A)就是一般情況下你搭計程車的機率(可以藉由統計一年有多少次搭計程車去上班得出)。明顯可見,P(A|C)和P(A)是不同的。

知道了什麼是條件機率,就可以給出條件獨立的定義。在數學上,如果事件A和事件B關於事件C條件獨立,那麼有:

 P(B|A,C)=P(B|C)
 P(A|B,C)=P(A|C)

P(B|A,C)是在事件A和事件C同時發生的情況下,事件B發生的機率;P(B|C)是在事件C發生的前提下,事件B發生的機率。這個公式告訴我們,在條件獨立的情況下,這兩個機率是相同的

為了更清楚地解釋這兩個機率相同的含義,我們假設有兩個人,他們都知道事件C發生了,但是第二個人除了知道事件C發生了,還知道事件A發生了。現在這兩個人要根據自己掌握的資訊,推斷出事件B發生的機率。

用數學公式來表達,第一個人要得到P(B|C),而第二個人要得到P(B|A,C)。

一般來說,第二個人知道的訊息更多,其推斷出來的事件A發生的機率也會和第一個人不同。但是在條件獨立的前提下,P(B|A,C)=P(B|C),這兩個人得出的結論完全一樣。

也就是說,如果事件A和事件B關於事件C條件獨立,那麼在知道事件C發生的前提下,知道事件A發生並不能幫助我們更好地推斷事件B發生的機率。

同樣有:P(A|B,C)=P(A|C)

這個公式告訴我們,如果事件A和事件B關於事件C條件獨立,那麼在知道事件C發生的前提下,知道事件B發生並不能幫助我們更好的推斷事件A發生的機率

總結一下,如果事件A和事件B關於事件C條件獨立,那麼在知道事件C發生的前提下,知道事件A或事件B中的一個是否發生,並不能幫助我們更好地推斷出另外一個事件發生的機率。

這就是條件獨立的核心思想。

條件獨立案例

我們以上文為例,其中事件A是「購買香草冰淇淋」,事件B是「車啟動不了」,事件C是「購買時間短」。

「車啟動不了」的內在原因是「購買時間短」,而不是「購買香草冰淇淋」。如果我們知道這位顧客某次「購買時間短」,那麼不管他這次是否購買香草冰淇淋,我們都可以推斷出這一次「車子發不動」的機率極高。

也就是說,在「購買時間短」這個事件發生的前提下,知道「購買香草冰淇淋」並不能幫助我們更好地推斷「車子發不動」的機率。「車子發不動」和「購買香草冰淇淋」關於「購買時間短」條件獨立。我們用圖7-1來表示這個例子,事件A是「購買香草冰淇淋」,事件B是「車子發不動」,事件C是「購買時間短」。因為事件A很可能導致事件C發生,事件C很可能導致事件B發生,因此A、B、C的關係如圖7-1所示。

從統計意義上來說,事件A(購買香草冰淇淋)和事件B(車子發不動)看似有關係(每次購買香草冰淇淋時,車子都發不動),但是中間隔了一個事件C(購買時間短)。在這種結構下,事件A和事件B在事件C發生的情況下條件獨立。

兩個事件看似相關,實則關於另外一個事件條件獨立的情況非常普遍。如果意識不到這一點,就很容易犯了把「相關性」當成「因果性」的錯誤。我們來舉幾個例子。

穿夾克和車禍發生率

一項調查發現,每當倫敦的計程車司機穿夾克,發生車禍的機率都會大大增加。

很多人猜想是穿夾克導致司機的操作不便,從而增加了事故發生率。這項調查幾乎促成了英國通過立法禁止計程車駕駛員穿夾克。

經過仔細研究才發現,天氣才是背後的根源:下雨時,司機經常穿夾克;下雨時,發生車禍的機率大。

也就是說,我們知道了「下雨天」,自然就可以推斷出「發生車禍」的機率比較高;而「司機穿夾克」實際上並不能幫助我們更好地推測「發生車禍」的機率。因此,「穿夾克」和「發生車禍」這兩個事件關於「下雨天」條件獨立。

這個例子中,事件A是「穿夾克」,事件B是「發生車禍」,事件C是事件背後共同的原因:「下雨天」。

「穿夾克」和「發生車禍」具有統計意義上的相關性,但這兩個事件之間沒有因果關係,它們關於「下雨天」這一事件條件獨立。

作者介紹|劉雪峰

北京航空航天大學計算機學院副教授,博士生導師。2008年取得英國布里斯托大學博士學位。〈知識星球〉廣受歡迎的計算機大師。主要研究方向包括線性代數、訊號處理、人工智慧等。在全球期刊和國際會議上發表過70多篇學術論文。2018年榮獲中國高等學校科學研究優秀成果獎(科學技術)二等獎。執教的《小波信號與系統》在學院的課程教評中獲得滿分。

本文經授權轉載自如何出版《心中有數,腳下有路:用數學思維解讀世界、解決生活中的難題》(原標題:心中有数:生活中的数学思维)

責任編輯/梁溶珈

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章