梁建章:用統計學思維精準控制疫情
當前,中國正在傾全國之力來控制疫情。可喜的是,很多地區的疫情開始趨於穩定。但與此同時,整個社會也在為此付出高昂的經濟代價。如何在防治疫情和恢復之間找到平衡點,會成為目前乃至今後一段時間內的難題。至於解題的關鍵,就是需要來精準計算不同措施的綜合成本和各種情況的概率。
從根本上看,傳染病其實是個隨機事件,所以在防治疫情的過程中,我們需要運用更多統計學的概念,來幫助各方面理性對待各種隨機現象,從而避免過度恐慌,做出正確的判斷和決策。下面我們舉兩個例子:
有關潛伏期的擔憂
比如,鐘南山團隊近日在網站上發布最新論文,披露了針對1099例新冠病毒感染者的回顧性研究成果。這篇論文對未來的疫情防治工作提供了重要的決策支持,但其中提到的潛伏期最長可達24天的結論,卻引起不少人的恐慌——原來不是一直說潛伏期最長14天嗎,現在怎麼變成24天了?到底是前面的結論錯了,還是病毒已經變異得更加可怕了?當前各地執行的14天隔離期是否需要延長到24天?
其實大可不必如此恐慌,幾乎所有涉及到群體生理乃至其他特徵的結論,都具有一定程度的不確定性。要更好地理解這些結論的意義,需要對統計學知識有個基本的了解。在流行病學中,疾病的潛伏期通常可以用對數正態分佈來近似,這種近似的合理性往往可在病原體繁殖動力學上得到一定解釋。簡單來說,這相當於假設log(潛伏期) 服從正態分佈。對數正態隨機分佈都存在一個長尾,儘管長尾部分的概率很小但不是零,如果樣本量足夠大,長尾部分的小概率事件還是有可能發生的。
鐘南山團隊在論文中提到潛伏期的中位數為3.0天,這意味著log(潛伏期) 的均值為1.1。在均值已經確定的前提下,log(潛伏期)的標準差越大,潛伏期的尾部概率也越大。根據鍾南山團隊的論文,1099例中潛伏期最長為24天。我們使用蒙特卡洛模擬方法可以推算出,當log(潛伏期) 的標準差為0.64,1099例中最長的潛伏期的中位數為24天。這個對數正態分佈中,百分之九十以上的患者的潛伏期在7天以內。(具體計算:(Log 7-log 3)/0.64= 1.32σ,可以查正態分佈的計算表格,就可以得到超過1.32個方差以外的概率<10%)
我們還可以模擬出,任意一個病例的潛伏期超過14天的概率為0.838%,超過24天的概率為0.062%。顯而易見的是,觀察到的病例越少,這些病例中的最長潛伏期也越短。如果我們只觀察83個病例,那麼其中最長潛伏期的中位數就只有14天。如上所述,當觀察病例達到1099時,最長潛伏期的中位數就會達到24天。
所以,不用質疑鐘南山以前的結論,或者據此擔心病毒發生了變化。其實還是同樣的病毒,同樣的潛伏期隨機分佈,只是在樣本量增加之後,長尾的小概率事件就有可能發生。專家們當然還會據此進行更深入的研究,而普通人卻不必為極小概率而過度恐慌。
做個簡單的類比.如果觀察1000人,最高的身高可能是1.9米,如果觀察10000個人,最高就可能超過2米,我們都知道,世界上存在著身高2.2米以上的人類,然而,在實踐中的建築標準只要房門高度達到2.0米就夠了。同樣的道理,不要因擔心現有的檢測和隔離制度會因為一兩個極端病例而被徹底顛覆。
有關氣溶膠的擔憂
近期還有一個引發了不少恐慌情緒的關鍵詞,叫做“氣溶膠”。因為曾有人公開表示,目前確定的新冠肺炎傳播途徑,除了原先眾所周知的直接傳播和接觸傳播之外,還有氣溶膠傳播。一時間人們又變得緊張了起來,以為只要感染者曾經路過某個區域,然後由其呼吸所產生的“氣溶膠”,就可能導致之後途經該區域的其他人感染病毒。
對於這種“氣溶膠傳播”的說法,之後又有其他權威專家表示,目前尚沒有證據顯示新型冠狀病毒通過氣溶膠傳播。但即便在澄清之後,部分公眾仍然對於這個概念心有餘悸。其實在我們看來,這種情緒同樣屬於過度恐慌。至於消除恐慌的關鍵,依然是懷著科學精神,從統計學的角度來尋求答案。
病毒傳播其實也是一個隨機事件,不排除有極小概率以某種特殊方式進行傳播,但關鍵是概率到底有多低?如果在現有已經確診的幾萬個病例中,僅有幾例是因為特殊方式被傳染的,那麼更精確的表述,應當是在四個九的可靠性下,病毒只是通過近距離途徑傳播。至於“氣溶膠傳播”,如果僅僅存在理論上的可能性,實踐中卻很難達到符合條件的場景,那麼對於絕大多數人來說,仍然只是極小概率的威脅。
還有,我們在看待各類數據的過程中,還必須把各種測量誤差考慮進去。在目前的檢測中,必然存在一定數量的假陰性和假陽性的誤差。假設,現有檢測方式存在假陽誤診概率(即沒有患病的情況下被錯誤診斷),人群中又有一定比例的人具有一般感冒的症狀,當我們測試幾十萬到幾百萬的人群時,不免有相當數量的被確診,但是實際真的只是普通流感患者。而且這些誤診的人完全沒有到武漢或者緊密接觸武漢的歷史。如果硬是要把這些誤診的人尋找傳染源的話,那就需要偵探小說的想像力,會誇大了這個病毒的真實傳染性。又會引發新一輪的沒有必要的恐慌。
結論
所以說,消除恐慌最有效的方式,就是學會從研究概率和統計學的角度來看待消息。公眾千萬別因為外界對於少數不幸事件的聚焦,就喪失從整體統計中獲取信心的思考。更為重要的是,決策者也需要以冷靜而客觀的態度,來分析目前呈現出來的各項數據,據此在製定政策時實現平衡,避免在過度恐慌的背景下出現極端做法,為追求所謂的“零風險”,而徹底犧牲其它領域,導致整個社會為此付出過於高昂的成本。
正如我們之前文章中所分析的那樣,如果經濟遭受沉重打擊,那麼由此產生的副作用,最終也會導致人均壽命的下降,以另一種形式付出生命的代價。還有些情況下,過度恐慌所造成的極端決策,會直接導致其他各類風險的上升。比如曾有新聞報導提及,在湖北省黃岡市黃梅縣,母親要帶著女兒接受白血病的二期治療,卻因為封路而無法前往武漢,險些造成悲劇。
我們在隔離方面也是要更加精準。目前對於很多返程人員,部分地區要求一律自行隔離14天。表面上看,這自然是為了將風險降到最低點。但實際上,返程人員到底來自疫情嚴重地區還是其他地區?返程之前在當地是否接受過隔離?這些變量會導致傳染風險出現天差地別的變化,如今一刀切地全都要求隔離14天,顯然並不是最科學的做法,同時也可能稀釋基層日趨緊張的防治資源。
現在很多地方,交通設施和小區採取以戶籍作為隔離依據的粗暴方式,使得很多人在各地被重複隔離甚至無家。更為理性而有效的做法,應當在國家出面,組織專家,出台評估風險的相關規則以及針對不同風險等級的不同措施,避免各地制定重複和過激的限行和隔離政策。政府還可以利用移動通信技術,根據個人在短期內的旅行軌跡,來估算相關人員的感染風險,進而作為各地採取限制措施的依據。如果國家的隔離和限行規則能夠執行到位,確保現在進入低發地區的人都是低風險的,那麼在這些地區也不需要大面積帶口罩,這樣口罩也就夠用了。另外隔離時間也不應追求要做到零風險,對於無症狀者甚至不需隔離14天,只要下降到和當地普通人群差不多就可以放行。按照我們本文簡單模擬估算的數學模型,隔離7天就能成功排查出百分之九十以上的感染者,也就是說把風險降低到了只有原來的百分之十。如果,對於很多人群可能隔離7天就夠了,那麼就會大幅降低經濟和社會成本。(需要提醒讀者的是,我們的模型只是基於鍾南山的文章非常有限的幾個數據,一線的專家應該可以給出更加精確的模型)
未來這段時間裡,疫情防治即將進入最關鍵的攻堅戰。值此時刻,對任何一種隨機事件的描述,都應該從概率和統計的角度進行考慮,要理解隨機事件不可能實現絕對的零風險,並且避免為不切實際的追求付出額外代價。相信所有人都希望,整個社會最終能用最小的代價,來獲取最好的疫情防治效果。要想實現這個目標,就需要綜合各類數據進行精準的統計和概率計算,幫助我們制定科學理性的控制疫情的政策。
作者:梁建章黃文政