科學家稱機器學習將是識別宜居系外行星的最佳方式之一
系外行星的研究領域正在經歷一場巨大的轉變。迄今為止,天文學家們已經在3711個行星系統中確認了4940顆系外行星,另有8709顆候選行星正在等待確認。由於有如此多的行星可供研究,以及望遠鏡靈敏度和數據分析的改進,重點正在從發現過渡到定性。天體生物學家不是簡單地尋找更多的行星,而是檢查“潛在的宜居”世界,以尋找潛在的“生物特徵”。
這指的是與生命和生物過程相關的化學特徵,其中最重要的一個是水。在最近的一項研究中,天體物理學家Dang Pham和Lisa Kaltenegger解釋了未來的調查(當與機器學習相結合時)如何能夠分辨出遙遠的系外行星上是否存在水、雪和雲。
Dang Pham是多倫多大學David A. Dunlap天文學和天體物理學系的一名研究生,他專門從事行星動力學研究。Lisa Kaltenegger是康奈爾大學天文學副教授,卡爾-薩根研究所所長,也是對潛在的宜居世界進行建模並描述其大氣層特徵的世界領先專家。
水是地球上所有生命都依賴的東西,因此它對系外行星和天體生物學調查非常重要。正如Lisa Kaltenegger通過電子郵件告訴《 Universe Today 》的那樣,這種重要性反映在NASA的口號中–“只要跟著水走”–這也是他們論文標題的靈感所在。
“行星表面的液態水是潛在生命的證據之一–我在這裡說潛在是因為我們不知道還需要什麼來啟動生命。但液態水是一個很好的開始。因此,我們使用了NASA的口號’只要跟著水走’,並問道:’我們如何才能在宜居區的岩質系外行星的表面找到水?’做光譜分析是需要時間的,因此我們正在尋找一種更快的方法來初步確定有希望的行星–那些上面有液態水的行星。”
目前,天文學家只限於尋找萊曼-阿爾法線的吸收,這表明系外行星的大氣層中存在氫氣。這是大氣層中的水蒸氣暴露在太陽紫外線輻射下的副產品,導致它在化學上分解為氫和分子氧–前者流失到太空,而後者被保留下來。
這種情況即將改變,這要歸功於詹姆斯·韋伯太空望遠鏡和南希·格雷斯·羅曼太空望遠鏡這樣的下一代望遠鏡,以及起源太空望遠鏡、宜居系外行星觀測站(HabEx)和大型紫外/光學/紅外測量儀(LUVOIR)這樣的下一代觀測站。還有一些地面望遠鏡,如極大望遠鏡(ELT)、巨型麥哲倫望遠鏡(GMT)和三十米望遠鏡(TMT)。
由於它們的大型主鏡和先進的光譜儀、計時儀、自適應光學裝置套件,這些儀器將能夠對系外行星進行直接成像研究。這包括研究從一個系外行星的大氣層或表面直接反射的光線,以獲得光譜,使天文學家能夠看到存在哪些化學元素。但正如他們在論文中指出的,這是一個時間密集的過程。
天文學家首先觀察數以千計的恆星,觀察其亮度的周期性下降,然後分析光曲線,尋找化學特徵的跡象。目前,系外行星研究人員和天體生物學家依靠業餘天文學家和機器算法來整理他們的望遠鏡獲得的大量數據。展望未來,Pham和Kaltenegger展示了更先進的機器學習將是多麼關鍵。
正如他們所指出的,ML技術將使天文學家能夠更迅速地進行系外行星的初步特徵分析,使天文學家能夠優先考慮後續觀測的目標。通過“跟著水走”,天文學家將能夠把天文台寶貴的調查時間更多地用於更有可能提供重大回報的系外行星。
Kaltenegger說:“下一代望遠鏡將尋找行星大氣中的水蒸氣和行星表面的水。當然,為了在行星表面找到水,你應該尋找(水的)液態、固態和氣態形式,正如我們在論文中所做的那樣。”
“機器學習使我們能夠快速確定最佳過濾器,以及在各種信噪比下的準確性權衡,”Pham補充說。“在第一個任務中,使用(開源算法)XGBoost,我們得到了一個排名,哪些過濾器對算法檢測水、雪或云的任務最有幫助。在第二項任務中,我們可以觀察到,在噪聲較小的情況下,算法的表現要好得多。有了這一點,我們可以畫出一條線,在這條線上,獲得更多的信號將不會對應於更好的準確性。”
為了確保他們的算法能夠完成任務,Pham和Kaltenegger做了一些大量的校準工作。這包括創建53130個具有不同表面成分的寒冷地球的光譜圖,包括雪、水和水雲。然後,他們在大氣和表面反射率方面模擬了這些水的光譜,並指定了顏色輪廓。
正如Pham所解釋的:“大氣層是用Exo-Prime2-Exo-Prime2建模的,通過在各種任務中與地球的比較得到了驗證。雪和水等表面的反射率是由美國地質調查局在地球上測量的。然後我們從這些光譜中創建顏色。我們在這些顏色上訓練XGBoost,以執行三個獨立的目標:檢測水的存在、雲的存在和雪的存在。”
這個經過訓練的XGBoost顯示,雲和雪比水更容易識別,這是預期的,因為雲和雪的反照率(對陽光的反射率更大)比水高得多。他們進一步確定了五種對該算法非常有效的最佳過濾器,所有這些過濾器都是0.2微米寬的,並且在可見光範圍內。最後一步是進行模擬概率評估,從他們確定的五個最佳過濾器的集合中評估他們關於液態水、雪和雲的行星模型。
“最後,我們(進行)了一個簡短的貝葉斯分析,使用馬爾科夫鏈蒙特卡洛(MCMC)對五個最佳過濾器做同樣的任務,作為一種非機器學習方法來驗證我們的發現,”Pham說。“我們在那裡的發現是類似的:水更難檢測,但通過光度測量識別水、雪和雲是可行的。”
同樣,他們驚訝地看到訓練有素的XGBoost僅根據顏色就能識別岩質行星表面的水。根據Kaltenegger的說法,這就是過濾器的真正含義:一種將光分離成謹慎的”倉”的手段。“她說:”想像一下,一個用於所有紅光的倉(’紅色’過濾器),然後一個用於所有綠光的倉,從淺綠到深綠(’綠色’過濾器)。”
他們提出的方法並不能識別系外行星大氣中的水,而是通過光度測量在系外行星的表面上識別。此外,它不會與凌日法一起使用,後者是目前最廣泛使用和有效的系外行星探測手段。這種方法包括觀察遠處的恆星,以尋找歸因於系外行星相對於觀察者在恆星前面經過(又稱凌日)的周期性亮度下降。
有時,天文學家可以從一個系外行星的大氣層中獲得光譜,因為它正在凌日–這個過程被稱為”凌日光譜學”。當太陽光穿過系外行星相對於觀測者的大氣層時,天文學家將用光譜儀對其進行分析,以確定那裡有哪些化學物質。利用其敏感的光學系統和光譜儀套件,詹姆斯·韋伯太空望遠鏡將依靠這種方法來描述系外行星大氣的特徵。