AI助天文學家尋找星系:像素尺度分析誤報率僅0.09%
最近,加州大學聖克魯茲分校的研究人員開發了一款名為“墨菲斯”(Morpheus)的深度學習模型,可以對天文圖像數據進行像素級分析,識別並分類所有的星系和恆星。這項研究成果發表在5月12日的《天體物理學雜誌增刊》(Astrophysical Journal Supplement Series)。
據論文介紹,在處理天空某一區域的圖像時,“墨菲斯”會生成一副新的圖像。圖中,算法模型根據形態對天體進行顏色編碼,將其與背景分離,識別出恆星和不同類型的星系。
準確率方面,論文指出,相對於哈勃太空望遠鏡的CANDELS項目和3D-HST計劃提供的分類目錄而言,“墨菲斯”模型的假陽性率(false-positive rate,FPR)僅約為0.09 %。假陽性率即實際非天體,但被識別為天體的百分比。
“墨菲斯”對天體進行形態分類後生成的彩色合成圖。
上述論文的兩位共同作者之一、加州大學聖克魯斯分校計算天體物理學研究組負責人、天文學教授布蘭特•羅伯遜(Brant Robertson)介紹,隨著天文學數據集規模的迅速擴大,傳統意義上由天文學家完成的任務需要變得自動化。
他表示,“作為人類,有些事情我們根本做不到。因此必須想辦法用計算機來處理未來幾年內大型天文學項目收集的大量數據”。
以正在智利建設的大型綜合巡天望遠鏡LSST為例,該項目完工後將用32億像素的相機每晚拍攝800幅全景圖像,每週記錄天空2次。此類大型天文項目所產生的龐大數據量已經遠遠超出了天文學家的分析能力。
事實上,已經有天文學家借助深度學習對星系進行分類,但通常使用現成的圖像識別算法,需要預先進行額外的數據整理工作。“墨菲斯”的不同點在於,它為處理天文圖像數據而生,天文學家可以用標準數字文件格式輸入原始圖像數據。
“墨菲斯”使用的圖像分割和反合成過程。
“墨菲斯”的另一大優勢是像素級分類。布蘭特•羅伯遜介紹,在使用其他模型時,天文學家必須首先知道圖像中含有某些內容,然後再向模型提供圖像,模型隨後對整個星系進行分類;但“墨菲斯”可以幫助天文學家發現星系,而且是以像素為單位,逐一進行分析。這一特性賦予了“墨菲斯”處理複雜圖像的能力。
“墨菲斯”對GOODS-South Field(大天文台宇宙起源深度巡天計劃的南天區)局部的分類結果。
與其他大型深度學習模型的訓練過程類似,研究人員向模型“投餵”了大量學習資料。主要是哈勃太空望遠鏡提供的CANDELS巡天觀測資料,由數十位專業天文學家進行分析歸類,總共分成約10000個星系類目。
“墨菲斯”的神經網絡架構。
“墨菲斯”進行自動形態分解的例子。
學習之後,研究人員將“墨菲斯”應用到了迄今最完整最全面的宇宙圖譜——“哈勃遺產場”(HLF)當中。該宇宙照片由哈勃太空望遠鏡在16年間拍攝的7500張星空照片拼接而成,包含約265000個星系。
為幫助深度學習模型快速完成對整個數據集的逐像素分析,研究人員為其配置了加州大學聖克魯斯分校的超級計算機“lux”。該超算由美國國家科學基金會撥款154.7萬美元建成,應用範圍包括天體物理學和氣候科學。