近日,新材料學院莫凡洋團隊在柱層析分離技術領域取得重要進展。研究團隊通過融合自動化實驗平臺與機器學習算法,成功開發(fā)出柱層析分離條件的智能預測模型。作為有機化學實驗室最核心的分離純化技術,柱層析的分離效能依賴于層析柱規(guī)格、上樣方式、流動相選擇等關鍵參數(shù)的優(yōu)化配置,這些參數(shù)的確定通常需要實驗人員具備豐富的實踐經驗。然而,此類經驗的積累往往需要長期培養(yǎng)與反復實踐,且形成的認知體系與特定實驗系統(tǒng)和研究者個體深度綁定,存在個體差異大、難以標準化、知識傳承效率不足等問題,這些問題客觀上制約了該項技術的創(chuàng)新迭代速率。

圖1. 自動化與機器學習結合建立柱層析預測模型
針對以上問題,研究團隊創(chuàng)新性地開展了柱層析機器學習預測模型研究。團隊首先搭建了自動化實驗平臺,系統(tǒng)采集了218種有機化合物在6365次柱層析實驗中的保留體積數(shù)據,構建了包含分子結構特征、洗脫劑比例、上樣質量、層析柱規(guī)格等多維實驗參數(shù)的標準化數(shù)據集。這種數(shù)據采集方法實現(xiàn)了傳統(tǒng)經驗依賴型分離過程向定量化、標準化科學問題的轉化。

圖2. 特征工程
基于此數(shù)據集,研究團隊開發(fā)了分位數(shù)幾何增強圖神經網絡(QGeoGNN)模型。該模型通過構建原子-鍵圖(GraphG)和鍵-角圖(GraphH)雙重圖表征,實現(xiàn)了分子三維結構特征與實驗條件的協(xié)同建模。其中,原子-鍵圖精確描述分子拓撲結構,鍵-角圖則有效捕捉分子空間構型特征。研究首創(chuàng)性地將實驗參數(shù)嵌入圖神經網絡的邊特征,使模型能夠同時考慮分子特性和實驗條件的影響。驗證實驗顯示,該模型對保留體積的預測決定系數(shù)R2達0.9以上,顯著優(yōu)于傳統(tǒng)經驗方法。此外,模型采用的分位數(shù)學習技術還可提供預測結果的置信區(qū)間,為實驗設計提供科學依據。

圖3. 不同算法訓練結果對比
在應用驗證階段,研究團隊選取了Claisen重排反應、鈀催化偶聯(lián)反應、氰基加成反應等典型有機反應體系進行系統(tǒng)評估。結果表明,該智能預測系統(tǒng)對不同規(guī)格層析柱(4g-40g)和多種溶劑體系(如石油醚/乙酸乙酯、二氯甲烷/甲醇等)均展現(xiàn)出良好的適應性。團隊提出的分離概率(Sp)指標能夠定量評估特定條件下混合物的分離效果,為實驗設計提供可靠的量化依據。經核磁共振驗證,采用模型預測條件獲得的產物純度均達到預期標準,充分證實了該智能預測模型在化學研究中的的實用價值。

圖4. 實驗驗證
該研究不僅為有機合成純化工藝優(yōu)化提供了創(chuàng)新性技術方案,同時為人工智能在化學領域的深度應用拓展了新路徑。為促進學術共享,研究團隊已將相關數(shù)據集和模型代碼在GitHub平臺開源。
研究成果以“Intelligent Column Chromatography Prediction Model Based on Automation and Machine Learning”為題,于2025年5月29日在線發(fā)表于Cell Press旗下化學領域旗艦期刊《Chem》。論文通訊作者為新材料學院莫凡洋長聘副教授,第一作者為課題組博士生吳文超。該工作得到北京大學深圳研究生院AI4S交叉研究專項計劃支持。