季節性流感比新冠還嚴重?斯坦福抗體研究結果遭痛批
COVID-19 可能沒有季節性流感那麼恐怖。這個根據美國抗體研究得出的結論,引起一片嘩然。近日,眾多統計學家、流行病學家指出,網上廣為流傳的“可靠數據”存在著重大缺陷——不僅對樣本的選擇不具有足夠的公平性,用於抗體測試的產品參考價值也可以說是非常差。
“防護措施完全不合理”
早在當地時間2020 年3 月17 日,斯坦福大學人口健康研究人員John Ioannidis 就通過美國生物醫學新聞媒體STAT 發聲:
COVID-19 的死亡率可能遠低於預期,因此當前的一些防護政策完全不合理。
一周後,斯坦福大學衛生政策研究人員Eran Bendavid 和Jay Bhattacharya 於3 月24 日在《華爾街日報》上也發表了類似的觀點。在題為Is the Coronavirus as Deadly as They Say?(新冠病毒有他們說的那麼致命嗎?)的評論中,二人認為此前對COVID-19 的死亡率估值(2%-4%)“存在嚴重缺陷”。
到了4 月,兩項新研究也提出了類似的觀點。
2020 年4 月17 日,斯坦福大學研究團隊(成員包括上文提到的三位科研人員)題為COVID-19 Antibody Seroprevalence in Santa Clara County, California(加州聖克拉拉縣新冠肺炎抗體血清流行病學調查)的論文在線發表於預印本平台medRxiv。
該研究檢測了3330 名成人和兒童血液中的抗體,其中50 份血樣(1.5%)呈陽性。
為使試驗樣本與當地人口統計數據更好地匹配,研究人員調整了婦女和白人的比例,經此調整,陽性率從1.5% 升至2.8%。
隨後,研究人員根據敏感性、特異性兩個標準,又重新進行了評估,最終得到的真實患病率在2.49% 和4.16% 之間,這表明當地約48000-81000 感染,而截止預印本論文在線發表時,當地確診病例僅為956,因此感染估計數比確診的病例高50-85 倍。
基於此,研究人員估計COVID-19 感染致死率(IFR)為0.12%-0.2%,而季節性流感致死率為0.1%。
2020 年4 月20 日,加州洛杉磯縣公共衛生部門在其官網宣布,與南加州大學合作進行了一項研究,研究成果題為Seroprevalence of SARS-CoV-2 Specific Antibodies Among Adults in Los Angeles County(洛杉磯縣成人中新型冠狀病毒特異性抗體的血清流行病學研究)。
研究人員估計,洛杉磯約4.1% 的成年人有抗體,2.8%-5.6% 的成年人具有對新冠病毒抗體,也就是說,洛杉磯約有221000-442000 成年人感染了新冠病毒,這一數據比4月初報告的7994 例確診病例數高28-55 倍。與聖克拉拉研究一樣,這項研究表明 COVID-19 感染致死率處於0.3%-0.13%,接近季節性流感致死率。
兩大嚴重缺陷
這兩項研究通過評估COVID-19 分別在美國加州聖克拉拉和洛杉磯的真實傳播情況———其出發點毫無疑問是正確的。通過研究,明確新冠疫情在當地的真實感染程度,自然有利於出台政策、措施,對控制疫情的傳播作出努力,同時也能更好地評估疾病的嚴重程度與死亡率。
由於美國的診斷測試非常有限,許多病例症狀輕微、甚至是無症狀感染,因此研究人員預計聖克拉拉和洛杉磯的新冠病毒感染人數都超出了預期,這一點不存在爭議。
真正存在爭議的是——研究者表示,COVID-19 的致命性遠不及預期,而由於死亡人數增長變化不大,COVID-19 與季節性流感的死亡率相近。而且,COVID-19 可能沒有季節性流感那麼致命,並且目前採取的緩解措施無濟於事、沒有必要。
由於加州洛杉磯縣公共衛生部門提供的數據不多,也幾乎沒有披露統計和方法方面的細節,因此學界主要分析的是聖克拉拉研究,不過多數人認為洛杉磯研究也可能存在相似的缺陷。
且先不論上述研究結論,學術界認為,聖克拉拉研究存在基本的計算錯誤和選取樣本、統計數據時出現的偏差,主要有兩方面問題:
第一,聖克拉拉研究對樣本的選擇不具有足夠的公平性:
- 研究是通過Facebook 廣告召集志願者的,這就把測試樣本僅僅限定為Facebook 用戶;
- 對樣本的檢測也都是通過設置駕車直通測試站點進行的(如下),這就把測試樣本僅僅限定為方便駕駛的人群;
- 志願者們通過自薦的方式參與測驗,而招募廣告也帶有一種“參與檢測就能知道您的健康狀況,讓您和家人更安心”的意味,所以說積極參與測驗的志願者可能都迫切地想知道自己是否感染上新冠病毒,這可能也會增加陽性的比例,所以新冠肺炎的潛在確診數將會比實際情況更多。
更有甚者,據外媒Buzzfeed News 披露,論文作者之一Jay Bhattacharya 的妻子此前通過郵件,利用高中學生的名單招募其父母參與實驗,這可能會進一步使得結果產生偏差。而其研究團隊對此也不予置評。
第二,學界最大的擔憂也許是,研究人員用於兩項研究的抗體測試並不准確。
由於新冠疫情肆虐,美國食品藥品監督管理局(FDA)允許廠商在沒有常規審查的情況下,在市場上出售檢驗產品,研究團隊使用的Premier 檢驗產品便是其中之一,並未經過徹底的準確性審查。實際上,FDA 此前甚至警告過相關人士要注意其局限性。
Premier 此前公開了對陽性、陰性樣品進行測試從而確定其敏感性和特異性的方法,但研究人員在斯坦福大學進行了自己的測試:
- 據Premier 的方法,檢驗產品正確地識別了共37 個已知陽性樣本中的25 個陽性樣本。在斯坦福大學的測試中,產品在測試中正確識別了160 個已知陽性樣本中的153 個,因此敏感度最有可能約為80%(可能在72.1%-87%)。
- 據 Premier 的方法,檢驗產品將30 個已知陰性樣本全部正確識別出來。在斯坦福大學的測試中,該產品只能正確識別371 個已知陰性樣品中的369 個,因此認為特異性約99.5%(可能在98.3%-99.9%)。
根據其對特異性的估計,只有0.5% 的檢測為假陽性,但實際上該產品仍存在高達1.7% 假陽性的可能性。如此說來,上述聖克拉拉研究得到的1.5% 陽性率(3330 份樣本中發現50 例陽性)意味著他們測出的陽性結果有可能全部都是假陽性,就算不是全部,其參考價值也可以說非常差。
面對統計方法方面的質疑,研究團隊表示,目前正在重新進行統計分析,並將很快發布結果。
“作者欠我們一個道歉”
當前,這兩項研究在美國學術界飽受批評,從推特到博客都不乏爭議。
哥倫比亞大學統計學家Andrew Gelman 以很長的篇幅提出了聖克拉拉研究存在的問題,並在博客中直言:
我認為該論文的作者們應該向我們道歉,因為讀這篇論文本質上就是在浪費時間和精力。它的主要賣點是一些數字,而這些數字都是錯誤的統計結果。如果是無意搞砸了,那不需要道歉;但犯了原本可以避免的錯,就必須道歉。
18 世紀,英國統計學家Thomas Bayes 將歸納推理法用於概率論基礎理論,創立了貝葉斯統計理論,對於統計決策函數、統計推斷、統計的估算等做出了貢獻。
面對上述研究,瑞士巴塞爾大學(University of Basel)計算系統生物學家Erik van Nimwegen 實驗室更是發推特稱:
貝葉斯的墓碑下傳來了哭聲。
美國舊金山州立大學進化生物學家Pleuni Pennings 針對聖克拉拉研究,在博客中犀利地指出:
我們常說,非常的主張需要非常的證據。然而,這篇論文的主張很獨特,而證據不是。而且,即使一篇研究論文出自名校,也不能保證這項研究就是靠譜的。
值得注意的是,學術論文在正式發表前,首先需要發表預印本,經過嚴格的同行評審流程後,最終會正式發表。因此,預印本的研究結論不具有完全的可信度(即便是正式發表的論文也可能存在爭議)。
特殊時期湧現出的研究,很可能會讓我們無意間就掉進了陷阱。對此,哈佛大學流行病學家William Hanage 也建議:
不要輕信所謂的專業數據,要注重數據來源,辨別相關論文究竟是預印本,還是已在知名期刊上正式發表。