借助AI,科學家可在人類細胞圖譜中更快找到某個病變細胞
人類細胞圖譜是世界上最大的的單細胞參考圖譜,而且還在不斷增長擴大中。 它包含了跨組織、器官和發育階段的數百萬個細胞的參考。 這些參考資料幫助醫生瞭解衰老、環境和疾病對細胞的影響–並最終更好地診斷和治療病人。 然而,參考圖集並非沒有挑戰。 單細胞數據集可能包含測量誤差(批處理效應),全球可用的計算資源有限,原始數據的共用往往受到法律限制。
為此,來自德國慕尼克亥姆霍茲聯合研究中心和慕尼黑工業大學(TUM)的研究人員開發了一種名為”scArches”的新型演算法,是英文”single-cell architecture surgery”(單細胞結構手術)的簡稱。 最大的優勢是:「該演算法不是在診所或研究中心之間共用原始數據,而是使用轉移學習將單細胞基因組學的新數據集與現有的參考資料進行比較,從而保留了隱私和匿名」。。
該演算法的主要科學家Mohammad Lotfollahi說:「這也使得對新數據集的註釋和解釋變得非常容易,並使單細胞參考圖集的使用大大民主化」。。
研究人員應用 scArches 來研究幾個肺部支氣管樣本中的 COVID-19。 他們利用單細胞轉錄組學將 COVID-19 患者的細胞與健康參照物進行比較。 該演算法能夠將患病的細胞從參照物中分離出來,從而使用戶能夠準確定位需要治療的細胞,對於輕度和重度COVID-19病例都是如此。 患者之間的生物差異並沒有影響繪圖過程的品質。
Fabian Theis 表示「我們的願景是,未來我們將像現在的基因組參考一樣,輕鬆使用細胞參考。 換句話說,就像你要考個蛋糕,你不需要想出自己的食譜,而是在食譜上找到一個。 而通過 scArches,我們能大大簡化查找過程」。
關於scArches 更多資訊可以存取: https://github.com/theislab/scarches