60%的材料遵循”四法則” 但科學家們不知道為什麼會這樣
科學家通常樂於發現數據中的規律性和相關性,但前提是他們能夠解釋這些規律和相關性。否則,他們就會擔心這些規律可能只是暴露了數據本身的某些缺陷,也就是所謂的實驗假象。瑞士洛桑聯邦理工學院(EPFL)尼古拉-馬爾扎里(Nicola Marzari)研究小組的科學家們在兩個廣泛使用的電子結構數據庫–材料項目(MP)數據庫和材料雲三維晶體結構”源”資料庫(MC3Dsource) –中發現了一種意想不到的模式,他們為此憂心忡忡。
這兩個資料庫收錄了8 萬多種實驗材料和預測材料的電子結構,原則上所有類型的結構都應得到同等的體現。但科學家注意到,這兩個資料庫中約有60% 的結構具有由4 個原子的倍數組成的原始單元格(晶體結構中可能存在的最小單元格)。科學家將這種反覆出現的現象命名為”四法則”,並開始尋找解釋。
埃琳娜-加扎里尼(Elena Gazzarini)說:”第一個直觀的原因可能是,當一個傳統的單元格(比原始單元格更大的單元格,代表晶體的完全對稱性)轉變為原始單元格時,原子數量通常會減少四倍。
“從化學角度來看,另一個可能的疑點是矽的配位數(能與其原子結合的原子數),即四個。”加扎里尼說:”我們可能會發現,所有遵循四配位規則的材料都包括矽。
化合物的形成能量也無法解釋”四法則”。然界中最豐富的物質應該是能量上最有利的,這意味著最穩定的物質,也就是那些具有負形成能的物質。但透過經典計算方法發現,四則運算與負形成能之間並沒有關聯。
由於這兩個資料庫所涵蓋的材料空間非常大,從小單元到包含數十種不同化學物質的超大單元,因此,透過更精細的分析尋找形成能與化學性質之間的相關性仍有可能找到解釋。於是,研究團隊邀請了威斯康辛大學的機器學習專家羅斯-切諾斯基(Rose Cernosky),她開發了一種演算法,根據原子特性對結構進行分組,並研究具有某些化學相似性的材料類別中的形成能。但是,這種方法同樣無法區分符合四項規則的材料和不符合規則的材料。
同樣,4 的倍數的豐富程度甚至與高度對稱結構無關,而是與低對稱性和鬆散排列有關。
最後,《npj 計算資料》上發表的這篇文章是一篇罕見的描述負面結果的科學論文:研究人員只能描述這一現象,並排除幾種可能的原因,卻沒有找到其中一種。但是,負面結果與正面結果對科學進步同樣重要,因為它們指出了棘手的問題–這就是為什麼科學家經常抱怨期刊應該發表更多此類研究的原因。
雖然未能找到令人信服的解釋,但這並不妨礙研究小組通過隨機森林演算法,以87% 的準確率預測特定化合物是否遵循”四法則”。加扎里尼說:”這很有趣,因為該演算法只使用局部而非全局的對稱性描述符,這表明細胞中可能有小的化學基團(仍有待發現)可以解釋四法則。”
編譯來源:ScitechDaily