華爾街日報》這份疫情地圖,全世界都在參考!約翰霍普金斯大學師生如何打造每月近10億流量的資訊平台?

2020-05-14 11:30

? 人氣

約翰霍普金斯大學的新冠肺炎(武漢肺炎,COVID-19)疫情統計(取自網路)

約翰霍普金斯大學的新冠肺炎(武漢肺炎,COVID-19)疫情統計(取自網路)

今年1月,美國約翰霍普金斯大學(Johns Hopkins University)的工程學副教授賈德納(Lauren Gardner)和兩名研究生坐在一家咖啡店裡,談論他們在麻疹、登革熱和茲卡病毒方面的研究,話題隨後轉向了在中國出現的新冠病毒。

★一手掌握熱門話題

這兩名來自中國的學生都希望可以對新冠病毒情況進行追蹤,與研究交通運輸系統如何傳播疾病的賈德納一拍即合。他們一天內就建立了一個網站,用來匯總新冠肺炎(2019冠狀病毒病,Covid-19)的數據資訊,網站於1月22日正式上線。隨後,他們發現自己開啟了歷史先河:追蹤這種有致死性並快速發展的大流行病的全球傳播。

本文為風傳媒與華爾街日報正式合作授權轉載。欲看更多華爾街日報全文報導,請訂閱特別版華爾街日報VVIP方案,本方案僅風傳媒讀者專屬,以低於原價3折以下之全球最優惠價,即可無限暢讀中英日文全版本之華爾街日報全部內容。

這個網站的熱度遠遠超出了預期。隨著代表病例數的紅點範圍逐漸擴大,各國死亡人數殘酷攀升,該網站已成為關注大流行的人們不可或缺的資訊來源。該網站的數據,被美國衛生與公共服務部營運中心等全球抗疫戰情室當成核心參考資料,也定期出現在電視新聞的報導中。

據網站追蹤分析公司SimilarWeb統計,3月份,這個線上疫情地圖所在的網站arcgis.com吸引將近10億次訪問。流量比領英(LinkedIn)、CNN或eBay還要多,躋身全球訪問量最高的100個網站之列。美國總統川普當月正式呼籲社交隔離時站在一張圖表前,該圖表部分是根據約翰霍普金斯追蹤系統的數據製作而成。

美國政府沒有製作其他可與之媲美的追蹤系統。其他組織緊跟在後,也創設了類似網站,包括新聞機構、世界衛生組織,以及由軟體開發商非營利運營的網站Worldometers。美國疾病預防控制中心(CDC)網站上有類似的美國數據,但更新頻率不高。

「雖然說數據匯總並不完美,但與沒有匯總相比價值還是很大的。」研究病原體和大流行病的懷俄明大學經濟學教授芬諾夫(David Finnoff)說,「我每天都要在他們的網站或APP上查看數據很多次。」

2月27日,美國副總統彭斯訪問華盛頓哥倫比亞特區衛生與公共服務部緊急行動中心時,展示螢幕上就是約翰霍普金斯大學Covid-19數據資訊匯總。  (AP)
2月27日,美國副總統彭斯訪問華盛頓哥倫比亞特區衛生與公共服務部緊急行動中心時,展示螢幕上就是約翰霍普金斯大學Covid-19數據資訊匯總。 (AP)

賈德納的經歷,展現了追蹤快速傳播的病毒並了解其健康影響所帶來的挑戰。檢測不足、無症狀病例以及各國政府報告感染和死亡的方法差異,讓人們很難了解這種疾病的波及範圍。此外,某些地方的官員可能會提供有誤的數據。

賈德納認為,新冠病毒病例和與其相關的死亡病例數字被低估了。她即將完成的一項研究表明,保持社交距離有助於減緩病毒傳播,但在很多州份,很多企業和家庭厭倦了這種政策及其對經濟造成的破壞。

「這絕對是有用的,我們有非常明確的證據可以證明,」賈德納博士在接受採訪時談到社交距離時說道。「我們有觀察到的數據可用來量化社交距離,也有病例數據可量化爆發增長率,並且可以證明兩者之間確實有很強的相關性。」

35歲的賈德納是德州人,在德州大學奧斯汀分校(University of Texas at Austin)獲得博士學位。她在雪梨新南威爾士大學(University of New South Wales)擔任多年的土木工程講師後,去年來到約翰霍普金斯大學。她和她的丈夫以澳洲的巧克力小點心Tim Tam幫他們的愛犬命名。

這個計劃以迅雷不及掩耳之勢展開了。賈德納的一名學生董恩生,非常擔心住在武漢以北山西省的家人們。這位2012年以來一直在美國學習和工作的地理製圖高手,花了很長時間手工輸入數據,同時間還要上課。

他們剛開始是從一些網站、新聞報導和Twitter上獲取數據。由於當時病例集中在中國,他們最初的資訊源之一是中國醫療專業人士使用的線上社區丁香園(DXY.cn),這個網站會追蹤官方統計的病例數據。

賈德納說:「我們當時覺得,如果能有幾十名甚至上百名研究人員想用我們的數據,就很棒了。」董恩生也希望為他的論文獲取數據。「那天晚上我們把數據彙整在一起。」

隨著疾病的發展,越來越多人來這裏查看最新動態,網站開發得越發精細和自動化。除了來自世界各地的國家、省、市和其他政府機構的官方數據之外,該小組還開始抓取美國各市和州的官方數據。賈德納介紹,他們追蹤了來自幾十個資訊源、約7000個數據點,包括一些數據匯總的站點。

他們的團隊也從霍普金斯大學的其他地方擴展並吸納了資源,現在把大部分時間花在輸入數據。其中包括「異常檢測系統」,用來偵測輸入過程中的異常情況。工作也從校園轉移到了遠端。

現在許多政府官員反過來依靠他們追蹤病毒傳播之處。

康乃狄克州州長拉蒙特(Ned Lamont)的發言人賴斯(Max Reiss)表示:「剛開始的時候,他們還不是我們擷取本地和美國實時動態的最佳資訊來源。」

3月10日,拉蒙特和州政府官員擠在緊急行動中心的一張桌子旁,討論宣布民防和公共衛生緊急情況,室內的大螢幕顯示了疫情追蹤地圖。

聯邦政府的冠狀病毒工作組依靠位於西雅圖的華盛頓大學健康指標與評估研究所(IHME)創建的模型,而該模型又依賴霍普金斯大學Covid-19資訊匯總平台收集的死亡病例數據,IHME一位女發言人說。白宮戰情室舉行的冠狀病毒特別工作組會議,很多時候都是先由白宮冠狀病毒應對協調員伯克斯(Deborah Birx)博士和政府最高傳染病官員佛奇(Anthony Fauci)博士對IHME的模型進行介紹分析。

疫情地圖的背後是個複雜的數據供應鏈,收集和處理來自世界各地成千上萬個來源的原始資訊帶來了不小的挑戰。美國的病例數統計正反映了這樣的挑戰。

全國各地的病毒測試方法都有所不同。霍普金斯的數據顯示,紐約州每10萬人中就有6464人接受檢測。相比之下,亞利桑那州每10萬人中只有1526人接受檢測。由於檢測的數量有限且方法不一,而且許多感染者是無症狀的,因此很難知道該病毒的真正傳播情況。

死亡病例的計算方式也很棘手。根據CDC指導,有些州把沒有得到檢測結果但帶有症狀的死亡病例也計算在內。但另外一些州在網上發布的數據並未包含這類「可能的未確診死亡病例」。

造成死亡的原因取決於醫生、體檢醫師和驗屍官來自各方面的個人判斷。

統計方法甚至在州內也不盡相同。紐約州僅在其官方報告納入經測試確認的感染Covid-19的死亡病例。另一方面,紐約市開始按照CDC指導,將4月中旬的未確診可能病例加到城市匯總數據。賈德納的團隊為此要手動將數千個未確診的疑似死亡病例加到匯總。

賈德納說,裁定這些分歧並不是其團隊職責。當局報告了這些疑似死亡病例時,她就會將這部分包括進去。

「我怎麼可能確定數據匯總裡所有4000多個數據點中,包含多少未確診的疑似死亡病例?」 賈德納博士說。「對我來說,這是一件不可能的事情,僅是把已公布的數據加進去就已經很困難了。」

這樣的挑戰對全球來說都一樣。4月初,法國重新計算了先前在療養院中未檢測到的病例,其官方死亡人數一下提高了40%以上。霍普金斯大學的站點還更新了來自中國數據修訂後的版本,但流行病學家、美國情報部門和武漢市民均對這個版本數據是否低估了實際情況抱有懷疑。

賈德納說,她認為中國和其他包括美國在內的國家一樣,目前公布的病例數量遠比實際情況要低。她說,她不認為這是出於惡意,因為世界各地政府要與這種快速發展的新疾病保持同步是種挑戰。

普林斯頓大學(Princeton University)的研究員拉克斯米納拉揚(Ramanan Laxminarayan)說,在過去的流行病中,各國往往延遲到問題確定之後才公布情況,因為向公眾公布情況會帶來經濟成本,例如旅行活動和貿易會減少。他和一些其他學者認為,預警系統是預防的關鍵。

「從某種意義上說,這似乎是疾病預防控制中心可承擔的任務。」 賈德納談到建立美國追蹤系統時說,「但我認為他們承擔了許多別的任務,專注於其他互補的事項。」

最初,大家並不清楚約翰霍普金斯大學這個一系統能持續使用多久,病毒也可能會迅速消亡。但5月8日晚間的統計顯示,全世界有超過390萬例感染病例和27.4萬多例死亡病例。

「公布的數據明顯存在巨大差距,」賈德納說,「這是世界上首次能夠實時觀察到大流行病蔓延的情況。」

決策者的最佳夥伴

立即訂閱,即刻暢讀華爾街日報全文內容

並享有更佳的閱讀體驗

訂閱 每天只要10.9元 查看訂閱方案
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章