**LED、太陽能電池、光電探測器和光子集成電路 (PIC) 等光電設備是現代通信、照明和能源轉換技術的核心。**這些設備的性能和效率在很大程度上取決于材料的光學特性,因此,深入理解這些特性對于推動技術進步和滿足日益增長的科學及工業需求至關重要。為了應對這一挑戰,實驗和計算領域的研究人員通過積極開展高通量篩選工作,以尋找和開發具有定制光學特性的新型材料。

然而傳統的獲取材料光學特性的實驗技術,如橢偏儀、紫外-可見光譜儀和傅立葉變換紅外光譜儀 (FTIR),雖然能夠提供精確的測量結果,但它們通常只適用于特定的波長范圍,并且對樣品條件有嚴格的要求。這些限制使得這些技術在高通量材料篩選中的應用受到了一定制約。

**為了解決這一問題,研究人員轉向了基于密度泛函理論 (DFT) 的第一性原理計算。**與傳統實驗技術相比,DFT 計算能夠覆蓋所有波長范圍的光學光譜,提供了一種更為全面的分析手段。盡管 DFT 計算能力強大,但在預測晶體結構的光學性質時,由于缺乏有效的原子嵌入,仍然面臨著一定的挑戰。

**針對于此,日本東北大學 (Tohoku University) 和麻省理工學院 (MIT) 的研究人員推出了一種新型人工智能工具 GNNOpt,成功識別出 246 種太陽能轉換效率超過 32% 的材料,**以及 296 種具有高量子權重的量子材料,極大地加速了能源和量子材料的發現,為材料科學領域帶來了新的研究范式。

相關研究以「Universal Ensemble-Embedding Graph Neural Network for Direct Prediction of Optical Spectra from Crystal Structures」為題,發表在 Advanced Materials 上。
研究亮點:

* GNNOpt 采用「集成嵌入」技術,不僅能夠學習來自多種數據集的信息,還能夠直接從晶體結構中精準預測所有線性光學光譜

* 通過集成等變神經網絡,GNNOpt 利用 944 種材料組成的小型數據集實現了高質量的預測

* GNNOpt 從未知材料中成功出了篩選 246 種太陽能轉換效率超過 32% 的材料,以及包括 SiOs 在內的 296 種具有高量子權重的量子材料

數據集:基于 944 種晶體材料的小樣本學習

**研究人員使用基于密度泛函理論 (DFT) 計算得出的 944 種晶體材料,對 GNNOpt 模型進行光譜預測。**這些數據庫是通過 API 從 Materials Project 獲取得到的。而數據庫中的光譜數據通過獨立粒子近似 (IPA) 獲取,包含了頻率相關的介電函數及其對應的吸收系數。

整個數據集按照 80%、10% 和 10% 的比例,被隨機分為訓練集 (733 種材料)、驗證集 (97 種材料) 和測試集 (110 種材料)。

訓練集、驗證集、測試集元素分布
GNNOpt 模型架構:在晶體結構與頻率相關光學特性之間直接建立關系

GNNOpt 是一種基于圖神經網絡 (GNN) 的模型,采用「集成嵌入」技術,能夠直接從晶體結構中預測所有線性光學光譜。值得說明的是,在訓練 GNNOpt 模型之前,研究人員通過一系列實驗證明了應用克拉莫-克若尼關系式 (Kramers–Kronig relations) 能夠更好地預測光學光譜。

如下圖 a 所示,**GNNOpt 的唯一輸入值是晶體結構 (Crystal structure),而輸出值則是光譜,**具體包括復介電函數 (Complex dielectric function)、吸收系數 (Absorption coefficient)、復折射率 (Complex refractive index)、反折射率 (Reflectance)。

GNNOpt 模型的輸入與輸出示意圖

在圖 b 中,**晶體結構中每種原子種類 (O、CI、TI) 的輸入特征采用獨熱編碼表示。**由于元素周期表中的所有元素都有原子質量 (atomic mass, 用 x0 表示)、偶極子極化率 (dipole polarizability, 用 x1 表示) 和有效共價半徑 (effective covalent radius, x2 表示) 這 3 種特征,因此研究人員選擇這 3 個特征進行集成嵌入。

集成嵌入的 3 種特征

研究人員通過引入自動嵌入優化的集成嵌入層,可在不修改神經網絡結構的情況下提高模型預測精度,具體過程如下圖 c 所示。

首先,所有原子輸入特征通過集成嵌入層 (Ensemble embedding) 進行自動優化。為了實現等變性,卷積濾波器由可學習的徑向函數和球諧函數 (Spherical Harmonics) 組成。然后,將嵌入的特征通過一系列等變圖卷積 (Graph convolution) 和門限非線性層 (Gated nonlinear layers) 參數化為可輸入的參數。緊接著,參數結果被傳遞到包括激活和聚合操作的后處理層,用來生成預測的輸出光譜。最后,通過最小化預測光譜與真實光譜之間的均方誤差 (MSE) 損失函數來訓練優化 GNNOpt 權重。

GNNOpt 模型架構示意圖

**為了深入了解晶體結構,研究人員對 TlClO4 的晶胞 (unit cell) 結構進行了分析,如圖 d 所示。**其中圓形節點代表晶胞內的原子,線條表示圖卷積層的信息傳遞方向。

TlClO4 的晶胞結構

**圖 e 則展示了通用集成嵌入層的細節,即使沒有任何神經網絡模型的改變,它也是性能提高的關鍵因素。**對于每個原子,每個特征都獨立地嵌入其線性和活化層。然后,所有嵌入的特征通過可學習的混合概率 pi 進行加權平均,其中 pi 通過 ∑ipi = 1 進行歸一化。

通用集成嵌入層細節展示

模型性能:GNNOpt 可識別出數百種太陽能電池以及量子候選材料

為了測試 GNNOpt 模型的性能,研究人員使用 GNNOpt 識別太陽能電池材料以及量子材料,成功識別出 246 種太陽能電池材料,以及 296 種具有高量子權重的量子材料。
上述材料的詳細資料詳見附加信息:
https://go.hyper.ai/rVSS8
關注公眾號,后臺回復「預測材料信息」獲取完整 PDF

GNNOpt 能夠從未知材料中篩選出 246 種太陽能電池材料

在識別具有高性能能量轉換功能的潛在太陽能電池材料方面,研究人員使用光譜有限最大效率 (Spectroscopic Limited Maximum Efficiency,SLME) 方法,對太陽能電池的光電轉換效率進行初步篩選和評估。
隨后,研究人員使用 GNNOpt 模型預測了 Materials Project 中 5,281 種未知晶體結構的能量轉換效率 (η 值),需要說明的是這些晶體結構沒有真實的光譜數據。如下圖 a 所示,研究人員比較了測試集的預測效率與真實效率,結果顯示 R2 = 0.81,表明 GNNOpt 對太陽能電池的光電轉換效率的預測準確性較高。

測試集中由 GNNOpt 預測的效率 η 與由 DFT 計算獲得的真實效率 η 之間的對比

在圖 b 中,研究人員將在測試集中由 GNNOpt 預測效率 η 與由 DFT 獲得的真實效率 η 值,繪制成能量帶隙 (energy band gap,用 Eg 表示) 的函數關系圖。當 Eg 約為 1.3 eV 時,η 的最大值約為 32%,這與 SQ 極限一致。然而, SLME 作為太陽能電池材料的選擇參數比 SQ 極限更加嚴格,因為對于具有相似帶隙的材料,SLME 顯示了 η 值在較寬范圍內的變化,這表明吸收系數 α(E) 對 η 有著顯著的貢獻。

能量帶隙函數關系圖

此外,了解元素周期表中哪些元素對高效太陽能電池材料的貢獻最大,可以為材料設計提供初步的指導。如圖 c 所示,**GNNOpt 模型預測出過渡金屬 (如 Tc、Rh、Pd、Pt、Cu、Ag、Au 和 Hg) 以及硫族元素 (如 S、Se 和 Te) 是太陽能電池材料的主要組成元素。**這一結果與廣為人知的太陽能電池材料一致,如富銅的黃銅礦 (Cu-rich chalcopyrite)、鉛基鈣鈦礦 (Pb-based perovskites) 或 CdTe。

根據 SLME 對元素周期表進行著色

為了驗證 GNNOpt 模型對未知材料的 SLME 預測值,研究人員從最高 SLME 材料列表中選取了 3 個示例:LiZnP、SbSeI 和 BiTeI。需要說明的是,這些材料不在 DFT 數據庫中。因此,研究人員對這些材料進行了 DFT 計算,以確定這些材料的吸收系數 α(E)。
結果如下圖 d 所示,DFT 計算的結果(用虛線表示)與 GNNOpt 預測的 α 值(用實線表示)高度吻合。這表明 GNNOpt 可以在大幅降低計算成本的情況下,成為一種有效的材料篩選工具。值得一提的是,對于大型數據庫,可以將 GNNOpt 與遺傳算法 (GA) 結合使用,從而加速候選材料的搜索過程。

對于 3 種未知材料,GNNOpt 預測結果和 DFT 計算結果對比

GNNOpt 成功探測出包括 SiOs 在內的 296 種量子材料
除了可以識別未知的、具有高性能能量轉換潛力的太陽能電池材料,**GNNOpt 的另一個應用是用于探測量子材料中的量子幾何 (quantum geometry) 和拓撲結構 (topology)。**此前曾有學者表明,廣義量子權重這一概念可以從光譜中推導出來,是衡量基態量子幾何和拓撲結構的直接指標。量子權重 Kxx 是由反向頻率加權的 f-sum 規則修正而來。

* 量子權重 Kxx 是量子系統中一個與材料的光學和電子性質相關的重要物理量,特別用來衡量其量子幾何和拓撲特性。它描述了材料的量子幾何結構與其光學性質或電學性質之間的關聯。

在圖 a 中,研究人員比較了測試集中以 h/e2 為單位的預測 Kxx 和真實 Kxx 的值。在 Kxx < 25 的范圍內,R2 = 0.73, 表明 GNNOpt 預測結果接近 DFT 計算的真實結果。

GNNOpt預測的Kxx和DFT計算的真實Kxx比較示意圖

因此,GNNOpt 被用來預測 5,281 種未知絕緣體材料的 Kxx 值,如圖 b 所示。為了簡化分析,研究人員將著名的拓撲絕緣體 Bi2Te3 的量子權重 Kxx = 28.87 作為分類量子材料的閾值 (threshold),其中 Kxx > 28.87 的材料被視為高 Kxx 材料。

最終,研究人員確定了 297 種高 Kxx 材料。其中一些材料,如 ZrTe5 (Kxx = 33.90)、TaAs2 (Kxx = 37.66)、FeSi (Kxx = 48.74) 和 NbP (Kxx = 35.58) 等,已被確認為具有反常霍爾效應 (anomalous hall effect)、巨磁阻效應 (large magnetoresistance)、拓撲費米弧 (topological Fermi arcs) 和量子振蕩 (quantum oscillations) 現象的量子材料。

使用 GNNOpt 搜索具有高量子權重 Kxx 的量子材料

由于 SiOs 具有極高的量子權重 (Kxx = 46.52),且此前未被深入研究,因此研究人員對 SiOs 進行了額外的 DFT 計算,并分析了其電子能帶結構 (Electronic band structure)。如圖 c 所示,SiOs 在 Γ 點和 R 點分別存在三重費米子 (Three-fold fermion) 和雙韋爾費米子(Double-Weyl fermion)。
SiOs 電子能帶結構

圖 d 則是研究人員使用最大局域化萬尼爾函數 (Wannier functions) 和格林函數 (Green’s function) 方法計算了 SiOs (001) 表面的能帶結構,表明了 SiOs 的超量子特性。

SiOs 電子能帶結構的表面

人工智能將重塑材料研發過程,材料會逆向生成

在材料科學的快速發展中,AI 技術正在引領著一場革命。此前,中國工程院院士干勇曾公開表示,「人工智能將重塑材料研發過程,材料會逆向生成。」

首先,AI 在材料發現中的應用尤為顯著。**2023 年 11 月底,谷歌旗下的 DeepMind 發布用于材料科學的 AI 強化學習模型 GNoME,**并通過該模型和高通量第一性原理 (DFT) 計算,尋找到了 38 萬余個熱力學穩定的晶體材料,極大加快了發現新材料的研究速度。

**微軟不甘其后,在 GNoME 模型發表數天后,發布了材料科學領域的人工智能生成模型 MatterGen,**可根據所需要的材料性質按需預測新材料結構。

**2024 年 1 月,微軟與美國能源部下屬的西北太平洋國家實驗室 (PNNL) 合作,利用人工智能和高性能計算,從 3,200 萬種無機材料中篩選出了一種全固態電解質材料,**完成了從預測到實驗的閉環,該技術可助力下一代鋰離子電池材料研發。

此外,AI 也在材料性質預測方面發揮著重要作用。通過機器學習模型,可以預測材料的電子結構、力學性質等,從而優化材料設計。例如,**北京大學工學院研究員陳默涵開發的國產開源密度泛函理論軟件 ABACUS,**結合 AI 輔助的交換關聯泛函方法 DeePKS,克服了 DFT 計算在精度和效率上的兩難問題,實現了高效率的雜化泛函精度計算。

AI 在材料科學領域的應用遠不只此,在落地層面也涌現出諸如 Green Dynamics、CuspAl、DeepVerse 等致力于將 AI 運用于新材料領域的公司。隨著技術的不斷發展,AI 或將在材料科學領域迸發出無限的力量!

來源: HyperAI超神經