推進材料科學:計算代碼的新“黃金標準”
《自然-物理評論》(Nature Review Physics)上的一篇新文章詳細介紹了在驗證材料科學中使用的固態DFT 程式碼方面取得的重大進展。這項綜合研究擴展了先前的研究,提供了一個包含960種材料的基準資料集,有助於完善和測試其他程式碼。這項研究得到了NCCR MARVEL和AiiDA的支持,旨在確保未來計算研究的可重複性和效率。
NCCR MARVEL的科學家們領導了迄今為止最全面的材料模擬電腦程式碼驗證工作,為同事們提供了評估和改進現有及未來程式碼的參考資料集和指南。
過去幾十年來,世界各地的物理學家和材料科學家一直在忙於開發模擬材料關鍵特性的電腦程式碼,現在他們可以從一整套此類工具中進行選擇,並利用它們每年發表數以萬計的科學文章。
了解密度函數理論(DFT)
這些程式碼通常基於密度泛函理論(DFT),這是一種建模方法,使用多種近似值來降低根據量子力學定律計算每個電子行為的複雜性。使用不同程式碼得出的結果之間的差異,歸根結底在於所採用的數值近似方法,以及這些近似方法背後的數值參數的選擇,這些參數通常是為研究特定類別的材料或計算特定應用的關鍵屬性(例如,潛在電池材料的導電性)而量身定制的。
AiiDA工作流引擎(馬克杯上有其標誌)的藝術再現,得益於”AiiDA通用工作流程”介面,AiiDA工作流引擎可利用多個量子力學模擬程式碼無縫計算材料特性。平板電腦中的圖片是論文中圖4的簡化版,圖中比較了11種不同計算方法和程式碼的結果(特別是,圖中比較了論文中考慮的所有960種材料和化學元素的狀態方程式參數:平衡體積、體積模及其導數)。資料來源:Giovanni Pizzi/NCCR MARVEL
程式碼驗證的挑戰
鑑於這些代碼的複雜性,要確保所有代碼都不存在任何可能的編碼錯誤,或者不存在過於粗糙的數值近似,確實非常困難。但是,驗證不同代碼所得出的結果是否具有可比性、一致性和可重複性,對整個社會來說至關重要。
在今天(11月14 日)發表於《自然-物理評論》(Nature Review Physics)的一篇新文章中,一大批科學家對固態DFT 代碼進行了迄今為止最全面的驗證工作,並為他們的同事提供了評估和改進現有及未來程式碼的工具和一套指南。
這項工作建立在2016 年發表在《科學》(Science)雜誌上的前一項研究的基礎上,該研究比較了40 種計算方法,用每一種方法計算了一組71 種晶體(每種晶體對應元素週期表上的一種元素)的測試能量,得出的結論是主流程式碼之間的一致性非常好。
擴大化學多樣性
瑞士維利根保羅舍勒研究所(PSI)材料軟體和資料組組長、新論文通訊作者喬瓦尼-皮齊(Giovanni Pizzi)說:「這項工作令人欣慰,但它並沒有真正探索足夠的化學多樣性。在這項研究中,我們考慮了96 種元素,並為每種元素模擬了十種可能的晶體結構”。
具體而言,對於元素週期表中的前96 種元素,他們分別研究了四種不同的單質(即僅由元素本身的原子構成的晶體)和六種不同的氧化物(其中還包括氧原子) 。研究結果是由兩個獨立的、最先進的DFT 代碼FLEUR 和WIEN2k 計算得出的包含960 種材料及其特性的資料集。這兩種代碼都是”全電子”(AE)代碼,這意味著它們明確考慮了所研究原子中的所有電子。
程式碼測試基準資料集
現在,任何人都可以將該資料集用作基準,以測試其他代碼的精度,特別是那些基於偽勢的代碼,在偽勢中,與全電子(AE)代碼不同,不參與化學鍵的電子被簡化處理,以使計算更輕。
Pizzi解釋說:”實際上,我們已經開始改進我們論文中的九種此類代碼,將它們的結果與我們數據集中的結果進行比較,測量差異,並相應地調整它們的數值參數(如偽勢)。”
建議和未來方向
這項研究也為DFT 程式碼的使用者提出了一系列建議,以確保計算研究的可重複性,如何使用參考資料集進行未來的驗證研究,以及如何將其擴展到其他程式碼系列和其他材料特性。
Pizzi說:『我們希望我們的資料集在未來幾年都能成為該領域的參考。”Pizzi是MARVEL九位研究人員之一,他與Marnik Bercx、Kristjan Eimre、Sebastiaan Huber、Matthias Krack、Nicola Marzari、 Aliaksandr Yakutovich、Jusong Yu和Austin Zadoks共同撰寫了這項研究。
支援計算框架
這項研究也透過AiiDA為未來的驗證研究提供了一個環境,AiiDA是由國家研究能力中心(NCCR)MARVEL和歐洲卓越中心MaX開發的開放式運算框架。”Pizzi說:”AiiDA讓我們能夠以同樣的方式為11種不同的程式碼編寫相同的指令,例如,計算特定結構的請求。然後,它可以為你運行計算,並為每個計算選擇正確的數字參數。”
除了用更多的結構來擴展參考資料集之外,Pizzi 還說,他希望將來不僅能考慮到不同程式碼的精確度,還能考慮到它們在時間和運算能力方面的昂貴程度,從而幫助科學家找到最具成本效益的計算參數。