如何準確估計流行病的傳播情況?
在新冠肺炎大流行期間,大多數建模工作都試圖解決緊迫的實際問題,但一些研究團隊還有另一個目標,那就是鞏固這些模型的理論基礎。人們通常對流行病學模型及其中的變量並不熟悉,但有一個模型卻因為在電影《傳染病》(Contagion)中出現過而變得廣為人知。“我們需要確定的是,”由凱特·溫斯萊特扮演的科學家說,“每一個感染者可能會將疾病傳染給多少人?”她在白板上寫下了幾種常見疾病的傳染人數:季節性流感約為1,天花高達3,而脊髓灰質炎在4到6之間。
研究人員無法直接觀察到疾病傳播的諸多關鍵特徵,因此需要依賴統計模型將觀察到的現象轉化為預期結果。但他們發現,特別是對於新冠疫情而言,有一些模型方法給出了錯誤的答案
這個數值就是基本傳染數(R0),即一個病例在完全易感人群中將疾病傳染其他個人的平均數。當某種流行病出現時,研究者會立即對R0進行估計,因為這個數可以顯示出一種新病原體可能傳播的猛烈程度,即如果不加以緩解,疫情可能會發展到多大程度;以及可能達到群體免疫的臨界值。R0可以幫助決策者判斷控制這種疾病的難度,以及如何進行控制。一般而言,如果R0大於1,表明疾病會繼續擴散;如果小於1,則說明疾病傳染能力受到限制,將會自行消退。
然而,評估一種疾病的傳播參數可能非常困難,而且容易出現連專家也不一定能預見到的陷阱。例如,在COVID-19大流行期間,R0的估計值相差很大,從小於2到6與7之間不等。
因此,儘管過去一年的大多數建模工作都專注於解決世界新冠疫情中最緊迫和最實際的問題,但一些研究團隊卻在更深的層次上,努力探討潛在的理論問題。他們試圖對R0等參數進行更深入的分析,以了解這些變量的真正含義,如何進行估算,以及何時應該或不應該使用它們。
這些科學家所做的是重要的基礎工作,他們的目標是為下一次不可避免的流行病做好準備。“我覺得這是值得理解的,”加拿大麥克馬斯特大學的理論生物學家喬納森·杜肖夫說,“我們希望會有更多可靠的工具,這樣當下一次疫情來臨時,需要擔心的事情就會少一些。”
流行病的傳播速度和強度
關於R0,最基本的障礙是它不能直接測量。如果流行病學家可以獲得所有想要的信息,他們就可以通過計算每個感染者導致的病例數並取其平均值來獲得R0。但在實踐中,研究者無法觀察這些感染事件,只能根據觀察到的數據從統計模型中估計R0。
為什麼世代間隔很重要?對疾病基本傳染數(R0)的估計取決於已觀察到的病例數和推測的世代間隔。不同的推測可能會導致R0估計值的巨大差別
為了彌合可觀察到的流行病增長或減少的速率(杜肖夫稱之為“速度”)與期望值R0(即“強度”)之間的差距,我們還需要引入另一個重要的參數:世代間隔(generation interval),即從一個人被感染到其感染下一個人之間的時間(由於該變量的數值可能變化很大,因此研究人員常用單個數值來表示世代間隔,比如平均值,或者用分佈來表示)。
美國佐治亞理工學院的生物學家約書亞·韋茨說,“人們常常把這兩者混為一談,認為更快的增長率一定意味著更高的R0。”事實上,我們需要通過世代間隔以及一次感染導致另一次感染的速度來審視這種增長率。
考慮這樣一種情況:一種疾病在最初病例出現三週後,出現了8個新病例。如果這種疾病的世代間隔是一周,那麼最初病例會導致第一周後出現2個新病例,再下一周出現4個,然後是8個;也就是說,每一次感染都會導致另外兩次感染,R0為2。但是,如果這種疾病的世代間隔為三週,那麼第一個病例就會直接產生8個新病例,R0為8。
約書亞·韋茨說:“我們觀察到的結果和我們想知道的並沒有一一對應。”已觀察到的相同病例統計數據可以用完全不同的R0值來解釋,這給研究者提出了挑戰,“在該領域仍然沒有得到很好的解決”。
韋茨和杜肖夫在2014至2016年的西非埃博拉疫情期間就直面了這一挑戰。他們意識到,如果死後傳播——在葬禮期間處理死者導致的感染——是新埃博拉病毒感染病例的主要來源,那麼大多數專家所估計的世代間隔可能就太短了。這意味著已公佈的R0值可能被低估了,醫療部門在阻止疫情爆發方面可能採取了錯誤的優先順序。事實上,研究人員後來證實了死後感染在埃博拉病毒傳播中的重要性。
估計新冠肺炎的R0
考慮到這一經驗,杜肖夫和韋茨以及普林斯頓大學的生態學和進化生物學研究生Sang Woo Park從去年開始對不同的新冠肺炎R0估計值進行分析。當韋茨看到這些估計值之間的巨大差異時,他說:“在我看來,他們真正在做的是對世代間隔的不同假設。”
生物學家喬納森·杜肖夫、約書亞·韋茨和Sang Woo Park一直試圖更好地理解基本傳染數R0背後的理論,以及如何對COVID-19等疾病進行評估
事實上,當韋茨等人仔細梳理不同研究小組的計算結果時,他們發現的情況正是如此。他們還發現,如果研究人員只考慮有症狀個體的傳播動態,就很可能會計算出錯誤的R0值。一些研究發現,無症狀者傳播病毒的時間更長,既因為他們可能有較長的病毒釋放期,也因為他們更有可能避免被發現,從而繼續傳播疾病。
韋茨表示,如果有症狀和無症狀傳播“具有不同的世代間隔,那麼這將從根本上改變我們的估算結果,從而改變我們對當前風險和(未來)情況的理解”。他還指出,這些發現強調了確定無症狀傳播的明確定義,以及確定其發病率是否隨時間或在不同人群中發生變化的重要性,“這些都將導致非常不同的結果”和應對措施(例如優先考慮對COVID-19進行快速大規模檢測)。
另一個考慮因素是,COVID-19的世代間隔可能隨著時間的推移而減小。甚至當研究人員第一次開始計算R0時,封城和“檢測—追踪—隔離”等乾預措施已經大大減少了人與人的接觸,縮短了傳播週期。然而,對R0的估計需要基於流行病未減弱時的情況,因此,如果在某些變化發生後再推斷世代間隔,就會有再次低估R0的風險。
這項工作也使韋茨等研究者開始對疾病傳播的某些方面進行重新解釋。韋茨舉例稱,整個夏天,“有一種說法是,病例在年輕人中傳播,是他們(不負責任的)行為推動了這種傳播。”但是,行為本身可能並不是罪魁禍首:如果年輕人在生物學上更有可能以無症狀的方式傳播病毒,他們就可能對傳播速度產生巨大的影響,而這僅僅是因為無症狀傳播的世代間隔較長。韋茨指出,相關研究結果仍然是初步的,並不完整,但他認為這些結果“很有趣”,可能有助於我們“開始擺脫這種需要某個群體承擔罪過的觀念”,因為這是不合適的。
朝著正確的方向發展
新冠肺炎的世代間隔之所以如此復雜,部分原因在於無法直接觀察到,因為感染的時間往往是不可知的——這一點與R0類似。研究人員必須藉助一個替代參數——序列間隔(serial interval),也就是從一個人首次出現症狀(原發病例)到被其感染的人出現症狀(繼發病例)之間所經過的平均時間。
然而,序列間隔的值通常是通過仔細的接觸者追踪和相關的流行病學研究獲得的,而這兩者在流行早期都無法做到。這導致有關序列間隔到底是什麼的問題出現了許多不同的假設和不確定性。
研究人員必須藉助一個替代參數——序列間隔(serial interval),也就是從一個人首次出現症狀(原發病例)到被其感染的人出現症狀(繼發病例)之間所經過的平均時間。儘管世代間隔和序列間隔在概念上是相似的,但它們有著本質的不同。例如,世代間隔總是為正值。但在新冠肺炎等涉及大量症狀發生前傳播的疾病中,患者有時會先於感染他們的人出現症狀,因此序列間隔的值可能是負的
儘管世代間隔和序列間隔在概念上是相似的,但它們有著本質的不同。例如,世代間隔總是為正值。但在新冠肺炎等涉及大量症狀發生前傳播的疾病中,患者有時會先於感染他們的人出現症狀,因此序列間隔的值可能是負的(在無症狀傳播的情況下,序列間隔是無法定義的)。Sang Woo Park表示,新冠病毒使他意識到“他們需要建立一個更好的框架來捕捉”傳播動態的複雜性。
此外,研究人員還發現了另一個統計上的難題:個體應該如何分組,以及應該如何測量它們的傳播間隔。這些都非常重要。根據接觸者追踪數據對序列間隔進行估計通常是回溯式的,即從感染人群回溯至感染他們的人;但結果表明,這種方法比向前測量序列間隔——從攜帶者至被感染者— —更容易受到統計偏差的影響。為了解決這個問題,杜肖夫等研究者正深入研究如何使用適當的參考點來獲得更準確的R0估計值。
“我們還沒有完成,”杜肖夫說道。這是他們和其他同行仍然需要努力解決的問題。不過,一切都在有條不紊地進行著,他們正在分析每一個體的傳播時間,採取不同的觀察視角,以確定這些個體對了解疾病的動態有多重要。
轉向Rt
儘管在流行病開始時很有必要對R0進行良好的估計,但隨著時間的推移,R0的即時效用會逐漸減弱。為遏制傳播而採取的干預措施、康復人群免疫力的提高以及其他因素都會隨著時間的推移而改變,從而疾病的傳染數量。隨著疫情的發展,研究人員逐漸將注意力從R0轉向實時的有效傳染數Rt。
與R0一樣,Rt通常由序列間隔和推測的世代間隔計算得出,而且由於這些間隔會在整個疫情期間不斷演變,因此準確估計Rt並不容易。不過,當疫情的指數增長相對較高時(通常是R0相關性更高的時期),Rt往往對序列間隔和生成間隔的假設最為敏感。因此,一些影響R0的不確定性在開始時對Rt的影響較小。
Rt更具優勢的一點是,至少在原則上,Rt可以作為疫情傳播潛力的實時指標,還可用於判斷干預措施的效果。如果Rt大於1,表明疫情正在蔓延,可能需要採取更多緩解措施;如果Rt小於1,則表明疫情正在減少,政策制定者可能會考慮取消一些限制。
然而,使用Rt也可能帶來危險,因為我們仍然難以對其準確評估。如果Rt被嚴重低估的話,決策者可能會認為還有比實際更多的空間來放鬆干預。為了使Rt在短期內保持準確,研究人員需要根據報告病例、住院或死亡的時間推斷感染髮生的時間。然而,從人們感染COVID-19到他們被視為病例(或他們住院或死亡)之間存在著延遲,使研究者幾乎難以推斷出準確的感染時間。
芝加哥大學的生態學家莎拉·科貝與其他團隊的科學家合作,開發了更好的統計方法,用來估計實時有效傳染數Rt
芝加哥大學的生態學家薩拉·科貝於2020年4月在《美國醫學會雜誌》(JAMA)發表了一篇文章,試圖估計Rt的變化與新冠肺炎早期流行時實施不同防疫政策的關係。也有研究者指出,不同方法所估計的Rt值可能會在時間上稍有偏差。
科貝實驗室的博士後研究者凱特琳·戈斯蒂奇和其他研究人員發現,用於處理這些延遲的現有統計技術在COVID-19大流行中效果不佳。他們試驗了各種已公佈的方法,利用模擬數據來估算Rt,以了解Rt值及其對應的有效時間。即便如此,他們也不是總能得到準確的結果。“這變成了一個反复拉扯的問題,”戈斯蒂奇說,“我們試圖弄清楚我們沒有得到正確答案是因為犯了錯誤,還是因為這些方法從根本上就無法得到正確答案。”
結果表明,是這些方法本身的問題。“我們在大流行之前所準備使用的工具遺漏了很多細節,我們突然意識到這些細節十分重要——特別是報告延遲的影響。”戈斯蒂奇說,“因此,作為流行病學家,我們得到的這些嘈雜的數據流其實是流行病實際變化的滯後指標。然後,我們就得努力找出恰當調整它們的方法。”
為此,研究人員求助於信號或圖像處理中常用的方法。他們還利用了20世紀80年代和90年代艾滋病流行期間使用的統計方法,其特點是感染和病例觀察之間的具有更長的時間延遲。
研究人員承認,Rt的估算總是存在一些不確定性。即便如此,戈斯蒂奇還是希望她的團隊以及其他研究者的工作,能夠對未來應對新的大流行有所幫助。
更完整的模型
對R0和Rt進行精確估計的研究也表明,這些參數還不夠充分或可靠,不足以提供對流行病的預期情況提供足夠的參考。韋茨說:“比如在提到今天的天氣時,我認為我們這個社會並不會只滿足於只說一個數值:溫度。”
因此,科學家們開始尋找其他參數來描述流行病疫情。一些研究者傾向於採用一個反映疾病傳播中不均勻性和差異性的參數。其他研究者,比如卡內基梅隆大學的計算機科學家扎卡里·利普頓和他的團隊,則一直在開發新的數據信號,試圖超越病例、住院和死亡人數,“從一個不同的角度來看待這個怪物”。這些新的信號包括近期被觀察到出現類似新冠肺炎症狀的人的比例,以及因此類症狀而就診的比例,還有其他數十個不同指標。
韋茨建立了一個風險計算器,以確定在不同地方不同規模的事件中是否有一人或多人可能感染COVID-19。“其中一個挑戰是……外行可以用Rt來做什麼?”韋茨說,“不過,如果在準備去參加一個50人的活動時,被告知有25%的機會可能會感染COVID-19,人們會理解這意味著什麼。”
撇開應用不談,韋茨認為他和其他研究者在R0和Rt上所做的理論研究是至關重要的。“有時候你需要做一些基礎性的工作,”他說,“否則,你就不能根據基礎研究的結果來得出可推廣的發現。”
杜肖夫對此表示贊同,並補充道:“我們絕對需要更詳細、更現實的模型。”但他也認為,如果模型能以對病毒傳播方式的直覺理解作為指引,可能會更加成功,“我認為我們需要建立更多的直覺理解”。