在過去兩年中,機器學習徹底改變了蛋白質(zhì)結構預測?,F(xiàn)在,《科學》雜志上的三篇論文描述了蛋白質(zhì)設計方面的革命:華盛頓大學醫(yī)學院的生物學家表明,機器學習可比以前更準確、更快速地創(chuàng)建蛋白質(zhì)分子??茖W家們希望這一進步將帶來更多新的疫苗、療法、碳捕獲工具和可持續(xù)生物材料。
論文資深作者、華盛頓大學醫(yī)學院生物化學教授、2021年生命科學突破獎獲得者大衛(wèi)?貝克表示,蛋白質(zhì)是整個生物學的基礎,但迄今在每種植物、動物和微生物中發(fā)現(xiàn)的蛋白質(zhì),遠不到所有可能蛋白質(zhì)的百分之一。有了這些新的軟件工具,研究人員應該能夠找到解決醫(yī)學、能源和技術方面長期挑戰(zhàn)的方案。
蛋白質(zhì)常被稱為“生命基石”,因為它們對于所有生物的結構和功能都是必不可少的。蛋白質(zhì)中的氨基酸序列決定了它的三維形狀,這種復雜的形狀對于蛋白質(zhì)的功能至關重要。
為了超越自然界中發(fā)現(xiàn)的蛋白質(zhì),貝克團隊成員將蛋白質(zhì)設計的挑戰(zhàn)分解為3個部分,并為每個部分使用新的軟件解決方案。
首先,必須生成新的蛋白質(zhì)形狀。在《科學》雜志上稍早發(fā)表的論文中,該團隊表明AI可通過兩種方式生成新的蛋白質(zhì)形狀。第一個被稱為“幻覺”,類似于基于簡單提示就能產(chǎn)生輸出的工具。第二個被稱為“修復”,類似于現(xiàn)代搜索欄中的自動完成功能。
其次,為加快這一過程,團隊設計了一種生成氨基酸序列的新算法。15日發(fā)表的論文描述了這個名為ProteinMPNN的工具,運行時間約為一秒,比以前最好的軟件快200多倍。它不但結果優(yōu)于以前的工具,還不需要專家定制即可運行。
第三,該團隊使用“深度思維”公司開發(fā)的阿爾法折疊來獨立評估他們提出的氨基酸序列是否可能折疊成預期的形狀。
研究人員表示,預測蛋白質(zhì)結構的軟件是解決方案的一部分,但它本身無法提出任何新的東西。ProteinMPNN之于蛋白質(zhì)設計,就像阿爾法折疊之于蛋白質(zhì)結構預測。
在另一篇論文中,貝克實驗室的一個團隊證實,新機器學習工具的組合能可靠地生成在實驗室中起作用的新蛋白質(zhì)。
研究發(fā)現(xiàn),新制造的蛋白質(zhì)更有可能按預期折疊,因此可使用這一方法創(chuàng)建非常復雜的蛋白質(zhì)組裝體?!斑@是蛋白質(zhì)設計中機器學習的開端?!必惪苏f。
編輯:王程玥
審核:朱麗