原標題:創(chuàng)新計算框架在蛋白質(zhì)設(shè)計方面獲突破
在今年諾貝爾化學獎表彰計算蛋白質(zhì)設(shè)計領(lǐng)域的重大進展后,美國能源部阿貢國家實驗室團隊宣布開發(fā)出一種名為MProt-DPO的創(chuàng)新計算框架,該框架利用人工智能(AI)和世界頂尖的超級計算機,推動蛋白質(zhì)設(shè)計取得新突破。這一成就標志著向AI自主科學發(fā)現(xiàn)邁出了重要一步。
MProt-DPO框架的關(guān)鍵在于其能將傳統(tǒng)的蛋白質(zhì)序列數(shù)據(jù)與實驗結(jié)果、分子模擬及基于文本的敘述相結(jié)合。這一特性有望大幅加速蛋白質(zhì)發(fā)現(xiàn),特別是在疫苗開發(fā)和環(huán)保酶設(shè)計等領(lǐng)域。
蛋白質(zhì)設(shè)計的核心挑戰(zhàn)之一是從氨基酸序列預測蛋白質(zhì)的三維結(jié)構(gòu)及其功能。由于蛋白質(zhì)的氨基酸組成極其復雜,即使是微小變化也會導致成千上萬種不同的可能性。因此,傳統(tǒng)實驗方法難以高效完成。鑒于此,團隊結(jié)合了大型語言模型(LLM)和超級計算機的強大算力。
團隊利用了包括阿貢國家實驗室的“極光”在內(nèi)的多個頂級超級計算機。這些超算不僅支持模型訓練和微調(diào),還能夠執(zhí)行大規(guī)模的分子模擬,驗證所設(shè)計蛋白質(zhì)的穩(wěn)定性和催化活性。MProt-DPO框架已經(jīng)在多個平臺上實現(xiàn)了超過1 exaflop(百億億次浮點運算)的持續(xù)計算,其中在“極光”上的峰值算力達到了5.57 exaflop。
MProt-DPO框架的算法使得AI模型可以從結(jié)果中學習,不斷改進設(shè)計。這種方法類似于人類專家根據(jù)實驗結(jié)果調(diào)整研究方向的過程,但速度更快,處理的數(shù)據(jù)量更大。
團隊已在兩項蛋白質(zhì)設(shè)計任務上測試了MProt-DPO框架,分別是優(yōu)化酵母蛋白HIS7的突變性能和提高蘋果酸脫氫酶的催化效率。結(jié)果顯示,AI設(shè)計的蛋白質(zhì)表現(xiàn)良好,達到了預期效果。(記者張夢然)
團隊稱,新框架不僅能夠從海量“候選者”中篩出有潛力的蛋白質(zhì),還能探索自然界中尚未存在的蛋白質(zhì)。這促進了生物技術(shù)和醫(yī)藥領(lǐng)域的創(chuàng)新與發(fā)展,對于應對全球健康和環(huán)境問題具有重要意義。