研究:向人工智能教授物理學可以讓它自己做出新的發現
根據杜克大學的研究人員的說法,將已知的物理學融入機器學習算法可以幫助神秘的“黑匣子”獲得更高的透明度和對材料特性的洞察力。研究人員使用了一種複雜的機器學習算法來識別一類被稱為超材料的工程材料的特性,並預測它們如何與電磁場相互作用。
該算法基本上被迫展示其工作,因為它首先必須考慮超材料的已知物理限制。該方法不僅使算法能夠高精度地預測超材料的特性,而且與早期的方法相比,它做得更快,並且具有更多的洞察力。
該結果於2022 年5月13日發表在《先進光學材料》雜誌上。
杜克大學電氣和計算機工程教授Willie Padilla說:“通過將已知物理學直接納入機器學習,該算法可以在更少的訓練數據和更短的時間內找到解決方案。雖然這項研究主要是展示該方法可以重建已知解決方案,但它也揭示了一些以前沒人知道的非金屬超材料的內部工作原理。”
超材料是由許多單獨的工程特徵組成的合成材料,它們通過它們的結構而不是它們的化學共同產生自然界中不存在的特性。在這種情況下,超材料由類似於樂高底板的大型矽圓柱網格組成。
根據圓柱體的尺寸和間距,超材料以各種方式與電磁波相互作用,例如吸收、發射或偏轉特定波長。在新論文中,研究人員試圖建立一種稱為神經網絡的機器學習模型,以發現單圓柱體的一系列高度和寬度如何影響這些相互作用。但他們也希望它的答案有意義。
“神經網絡試圖在數據中找到模式,但有時他們發現的模式不符合物理定律,這使得它創建的模型不可靠,”杜克大學電氣和計算機工程助理研究教授Jordan Malof 說。“通過強制神經網絡遵守物理定律,我們阻止了它找到可能適合數據但實際上並不真實的關係。”
研究小組強加於神經網絡的物理學稱為洛倫茲模型——一組描述材料固有特性如何與電磁場共振的方程。該模型不是直接跳到預測氣缸的響應,而是必須學會預測洛倫茲參數,然後用於計算氣缸的響應。然而,加入這個額外的步驟說起來容易做起來難。
Padilla 實驗室的博士後研究員Omar Khatib 說:“當你讓神經網絡更具可解釋性時,這在某種意義上是我們在這裡所做的,微調可能更具挑戰性。我們肯定很難優化訓練來學習模式。”
然而,一旦模型开始工作,它就被证明比该小组为相同任务创建的先前神经网络更有效。特别是,该小组发现这种方法可以显著减少模型确定超材料特性所需的参数数量。他们还发现,这种基于物理学的人工智能方法能够自行发现。
當電磁波穿過一個物體時,它在其旅程開始時與它的交互方式不一定與它在其結束時完全相同。這種現像被稱為空間色散。由於研究人員必須調整空間色散參數以使模型準確工作,他們發現了他們以前不知道的過程物理學的見解。
“現在我們已經證明這是可以做到的,我們希望將這種方法應用於物理未知的系統,”Padilla說。
“很多人都在使用神經網絡來預測材料特性,但從模擬中獲得足夠的訓練數據是一個巨大的痛苦,”Malof 補充道。“這項工作還展示了一條創建不需要太多數據的模型的途徑,這在所有方面都很有用。”