在人工智能驅(qū)動材料設(shè)計迅速發(fā)展的背景下,如何以科學(xué)、可解釋且高效的方式從復(fù)雜材料結(jié)構(gòu)中提取關(guān)鍵特征,已成為實現(xiàn)智能材料發(fā)現(xiàn)的核心挑戰(zhàn)。拓?fù)浣Y(jié)構(gòu)化學(xué)作為一種將材料微觀結(jié)構(gòu)映射為數(shù)學(xué)拓?fù)淠P偷难芯糠椒ǎ陙碓诓牧匣蚪M工程、催化活性探索以及能量材料設(shè)計等領(lǐng)域,展現(xiàn)出強大的結(jié)構(gòu)表征與性質(zhì)預(yù)測能力。北京大學(xué)深圳研究生院新材料學(xué)院潘鋒教授團隊近年來致力于圖論/拓?fù)鋽?shù)據(jù)分析方法及其在結(jié)構(gòu)特征提取中的拓展與應(yīng)用,在該領(lǐng)域取得了一系列創(chuàng)新性成果,包括材料結(jié)構(gòu)的拓?fù)浔硎荆?span lang="EN-US">J. Phys. Chem. Lett., 2023, 14: 954)、材料反向設(shè)計(npj Comput. Mater., 2025, 11: 147)、新型固態(tài)電解質(zhì)設(shè)計(J. Am. Chem. Soc., 2024, 146, 18535; J. Am. Chem. Soc., 2025, 147, 24)、化學(xué)反應(yīng)路徑搜索(CCS Chemistry, 2024, 7, 1)以及催化活性相搜索(Nat. Commun., 2025, 16, 2542)。這些研究系統(tǒng)建立了從拓?fù)浣Y(jié)構(gòu)表示到性質(zhì)預(yù)測,再到功能材料設(shè)計的全鏈條研究框架,為結(jié)構(gòu)化學(xué)與人工智能的深度融合奠定了堅實的理論與方法基礎(chǔ)。
近期,潘鋒教授團隊提出了一種基于拓?fù)鋽?shù)據(jù)分析(Topological Data Analysis, TDA)的材料結(jié)構(gòu)特征提取框架,為材料結(jié)構(gòu)表征與性質(zhì)預(yù)測提供了兼具數(shù)學(xué)嚴(yán)謹(jǐn)性與高可解釋性的新思路。相關(guān)研究成果以“Structural Feature Extraction via Topological Data Analysis”為題,發(fā)表于國際知名期刊《物理化學(xué)快報》(Journal of Physical Chemistry Letters, 2025, 16, 8056–8067, DOI: 10.1021/acs.jpclett.5c01831)。

圖1. 用于材料結(jié)構(gòu)特征提取的拓?fù)鋽?shù)據(jù)分析原理
該研究基于代數(shù)拓?fù)淅碚摚瑢⒉牧系脑咏Y(jié)構(gòu)抽象為數(shù)學(xué)復(fù)形(simplicial or path complexes),并通過計算其拓?fù)洳蛔兞浚ㄈ?span lang="EN-US">Betti數(shù)、循環(huán)密度等),實現(xiàn)對結(jié)構(gòu)形貌、連通性與孔洞特征的多尺度量化。相較于傳統(tǒng)經(jīng)驗型結(jié)構(gòu)描述符(如配位數(shù)、局部環(huán)境參數(shù))或“黑箱式”深度學(xué)習(xí)特征,該方法具備更強的結(jié)構(gòu)敏感性與物理可解釋性,能夠有效捕獲材料體系中與性能相關(guān)的高維幾何與連通信息。

圖2. 拓?fù)涮卣鹘沂镜慕Y(jié)構(gòu)—性質(zhì)關(guān)系
研究團隊系統(tǒng)展示了持續(xù)同調(diào)(Persistent Homology)、GLMY同調(diào)及高階超圖同調(diào)(Hypergraph Homology)等方法在晶體、MOF和多組分分子體系中的應(yīng)用,揭示了拓?fù)涮卣髟诿枋鲦I合網(wǎng)絡(luò)、孔隙分布、取向關(guān)系和缺陷敏感性方面的優(yōu)勢。通過與圖神經(jīng)網(wǎng)絡(luò)(GNN)模型結(jié)合,團隊在缺陷敏感性質(zhì)預(yù)測中使模型誤差降低高達55%,并在MOF氣體吸附性能預(yù)測中將模型R2從0.74提升至0.85,展現(xiàn)出優(yōu)異的泛化與解釋能力。研究首次系統(tǒng)總結(jié)了拓?fù)鋽?shù)據(jù)分析在多類結(jié)構(gòu)體系(晶體、分子與生物大分子)中的應(yīng)用機制,并提出了適配不同結(jié)構(gòu)特征的選型指南。例如,持續(xù)同調(diào)適用于周期性或孔隙主導(dǎo)的體系;GLMY同調(diào)適用于具方向性或非平衡行為的體系(如化學(xué)反應(yīng)網(wǎng)絡(luò)、帶電分子圖);超圖同調(diào)則適合分析多體相互作用主導(dǎo)的體系(如蛋白-配體識別、復(fù)雜吸附過程)。研究指出,拓?fù)涮卣髟诓东@結(jié)構(gòu)—性質(zhì)關(guān)聯(lián)關(guān)系方面具有獨特優(yōu)勢,可為能量材料、催化劑、功能氧化物等體系提供統(tǒng)一的數(shù)學(xué)表征框架,并為“結(jié)構(gòu)-性能-生成”一體化的材料設(shè)計奠定理論基礎(chǔ)。
該研究展示了拓?fù)涮卣魈崛『头治雠c人工智能算法深度融合的潛力。通過在圖神經(jīng)網(wǎng)絡(luò)和Transformer模型中嵌入拓?fù)涮卣鳎芯繄F隊不僅顯著提升了預(yù)測精度,也增強了模型輸出的可解釋性,為理解結(jié)構(gòu)—性能關(guān)系提供了量化依據(jù)。
該工作在潘鋒教授和李舜寧博士共同指導(dǎo)下完成。新材料學(xué)院博士生王炳胥與碩士生馮彬為共同第一作者。研究得到了國家自然科學(xué)基金、廣東省重點實驗室等項目支持。
論文鏈接:https://pubs.acs.org/doi/10.1021/acs.jpclett.5c01831