抗疫要數據,更需要數商:《數商》選摘(1)

2021-01-23 04:10

? 人氣

數據英雄的逆行

1854年秋天,霍亂第4次席捲英國,8月31日爆發,3天內就有127人喪生,10天之後,死亡人數攀升到500多人,其中一個名為寬街(Broad Street)的區域,居民死亡案例最多、最集中。

[啟動LINE推播] 每日重大新聞通知

這時候的斯諾,於每週第一時間閱讀法爾的死亡報表,關注死者的飲用水源,希望在表格和數據中找到線索。

雖然法爾收集了供水的來源,但斯諾根據這部分數據做不出任何判斷。為什麼呢?這是因為整個倫敦有10幾家大公司供水給城市的不同地區,各家公司的地盤互相交錯,供水管雜亂無章地交織在一起,僅憑地址無法準確判斷供水公司。

斯諾左思右想,無計可施之下,為了得到這些數據,他最後決定一家一家上門走訪。斯諾走了多少路,我們今天已不得而知。但他很快又碰到新的困難──即使挨家挨戶去敲開每一位患者的門,得到的數據也還是不完整、不準確,因為很多住戶根本不知道自家的用水是哪個公司提供的,房子可能是租的,水費可能是由房東繳交的,即便是自己付的,也找不到公司的收據,名稱還是不清楚。

皇天不負苦心人,斯諾又想出新辦法解決這個問題。他在走訪中發現,某一家公司的水中,鹽分含量是另外一家公司的4倍,根據這個差別就能判斷水的來源,如此一來,他碰到不知道自家供水公司的住戶時,就取一小瓶水樣,在瓶上注明地址,然後帶回去檢測。

斯諾搜集數據的執著讓人感佩。在大多數情況下,數據都沒有現成的。搜集數據太難了,就像在風中奔跑,搜集隨風飛散的柳絮一樣,你需要逐風而行,東奔西走。但對高數商的人而言,這一點是共性:他們都願意展開搜集數據的行動,都願意付出極大的努力,包括精力和時間。搜集數據所用的精力、體力和時間,可能是分析數據的數倍之多。第谷和克卜勒就是最好的例子。

在死亡案例高度集中的寬街,斯諾發現,「幾乎所有的死亡案例都發生在某街頭的一口水井附近。只有10名死者的住所靠近另一個街頭的水井,而其中有 5 名死者的家屬確認,他們一直使用那個水泵,有3戶距離這口水井遠一點,但死亡的孩子所在的學校就在這口水井附近」。

在這條街上,他還發現有1家啤酒廠和1家感化院沒有任何人死亡。他實地走訪了這2個地方,發現啤酒廠和感化院都有自己獨立的水井,而且啤酒廠的工人平常只喝啤酒不喝水,斯諾因此更加確定,水就是人們感染霍亂的最終原因。

現在,讓我們試想一下,一個社區爆發了有史以來最為兇險的傳染病,驚恐的居民在一片混亂中成群出逃,用馬車拉著家當往一個方向走,但1名皇家醫生選擇逆人流而上,挨家挨戶去敲門瞭解死者的生活細節,他走進的每一間屋子,都還籠罩在葬禮的陰影和哀號當中。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章