出品:科普中國
作者:郭菲(煙臺大學)
監制:中國科普博覽
2024年諾貝爾物理學獎頒發給機器學習領域的專家以后,大家紛紛調侃“物理學不存在了”,并對化學獎有了更多猜測。畢竟,即使在往年物理學獎還頒發給大家傳統印象中的物理學家的時候,化學獎就很少頒發給傳統印象中的化學家,而是經常發給生物學家、物理學家,也因此被戲稱為“理綜獎”。
剛剛,答案終于揭曉。
2024年10月9日,瑞典皇家科學院宣布將2024年諾貝爾化學獎授予三位科學家:美國華盛頓大學的David Baker、英國Google DeepMind公司的Demis Hassabis和John M. Jumper。其中,Baker因“計算機輔助蛋白質設計”獲得一半獎金,Hassabis和Jumper因“蛋白質結構預測”共同分享另一半獎金。
三位獲獎人
(圖片來源:諾貝爾獎委員會官網)
這三位科學家的研究成果標志著人類已經能夠破解和掌控生命的化學工具——蛋白質。Baker成功設計出全新的人造蛋白質,而Hassabis和Jumper則利用人工智能解決了困擾科學界50多年的蛋白質結構預測難題。他們的發現具有巨大的應用潛力,將為人類帶來深遠影響。
因為又是和人工智能相關,不禁想起許多人都有的憂慮,“人工智能這樣發展下去,會不會統治世界?”我想,在這之前,人工智能可能會先嘗試“統治”諾獎。
蛋白質:生命的化學工具
要理解這項成果的重要性,我們需要先了解蛋白質的基本概念。蛋白質是由20種氨基酸以不同順序和比例組合而成的大分子。在細胞中,DNA攜帶的遺傳信息指導氨基酸按特定順序連接成長鏈,這條氨基酸鏈會自發折疊成特定的三維結構,從而形成具有特定功能的蛋白質。
蛋白質的四級結構(左)及蛋白質數據庫中多樣化的蛋白質(右)
(圖片來源:維基百科“蛋白質”條目)
蛋白質的功能多種多樣,它們可以是構建肌肉、角質或羽毛的材料,也可以是激素或抗體。許多蛋白質是酶,能夠以驚人的精確度催化生命的化學反應。細胞表面的蛋白質則充當細胞與外界環境的通信渠道。正是這些功能各異的蛋白質,構成了生命豐富多彩的化學基礎。
然而,要完全理解和掌控蛋白質一直是科學家們的夢想。這個夢想的實現面臨兩大挑戰:一是如何從氨基酸序列預測蛋白質的三維結構;二是如何設計全新的、自然界不存在的蛋白質。2024年諾貝爾化學獎正是表彰了在這兩個方向上取得突破性進展的科學家們。
蛋白質結構科學插畫
(圖片來源:諾貝爾獎委員會官網)
人工智能破解蛋白質結構之謎
自20世紀50年代科學家首次通過X射線晶體學獲得蛋白質三維結構以來,預測蛋白質結構一直是生物化學領域的重大挑戰。雖然公共數據庫中已有近30億個DNA序列和2億多個蛋白質序列,但通過實驗方法解析的蛋白質結構只有約20萬個。如果能夠直接從氨基酸序列預測蛋白質結構,將是一項重大突破。
挑戰的根源在于蛋白質可能的構象數量是天文數字。以一個由100個氨基酸組成的蛋白質為例,其理論上可能的構象數量高達10的47次方。顯然,蛋白質不可能通過隨機搜索所有這些構象來找到正確的折疊方式,它必然遵循某些規律。
蛋白質折疊示意圖
(圖片來源:諾貝爾獎委員會官網)
為了推動這一領域的發展,研究人員于1994年發起了“蛋白質結構預測關鍵評估”(CASP)競賽。每兩年,參賽者需要根據給定的氨基酸序列預測蛋白質結構,預測結果與實驗解析的結構進行比對評分。
長期以來,CASP競賽的進展緩慢。直到2018年,Demis Hassabis領導的DeepMind團隊帶著他們的人工智能模型AlphaFold參賽,才取得了突破性進展。2020年,John Jumper主導開發的升級版AlphaFold2在CASP14競賽中取得了驚人的成績,在大多數情況下,其預測精度幾乎可以與X射線晶體學媲美。
AlphaFold2的成功源于其創新的設計。它利用了名為“transformer”的神經網絡,這種網絡能夠在海量數據中找到模式,并有效確定應該關注什么來實現特定目標。研究團隊用所有已知的蛋白質結構和氨基酸序列數據庫訓練了AlphaFold2。
在預測過程中,AlphaFold2首先搜索數據庫中相似的氨基酸序列和蛋白質結構。然后,它分析這些序列在進化過程中的保守性,并估算氨基酸之間的距離。通過迭代過程,AlphaFold2不斷優化這些分析結果,最終得出蛋白質的三維結構。
AlphaFold預測的蛋白質結構(藍色)與實際結構(綠色)對比
(圖片來源:AlphaFold)
計算機輔助蛋白質設計的突破
與此同時,David Baker領導的研究團隊在另一個方向上取得了突破。他們開發的Rosetta軟件不僅可以預測蛋白質結構,還能反向設計全新的蛋白質。
2003年,Baker團隊發表了一項里程碑式的成果:他們設計出了一種名為Top7的全新蛋白質。這個由93個氨基酸組成的蛋白質具有獨特的結構,在自然界中并不存在。更重要的是,實驗合成的Top7蛋白質與計算機設計的結構幾乎完全一致。
這一成功開啟了蛋白質設計的新時代。此后,Baker實驗室不斷創造出各種令人驚嘆的人造蛋白質,包括可用作藥物的蛋白質、疫苗、納米材料和微型傳感器等。Baker還公開了Rosetta的源代碼,使全球的研究人員能夠繼續開發和應用這一強大的工具。
利用人工神經網絡進行蛋白質結構預測的示意圖
(圖片來源:諾貝爾獎委員會官網)
突破性成果的廣泛應用
AlphaFold2和Rosetta的成功為生物化學和醫學研究帶來了革命性的變化。以前需要幾年時間才能獲得的蛋白質結構,現在只需幾分鐘就能預測出來。研究人員可以更好地理解生命如何運作,包括某些疾病為什么會發生、抗生素耐藥性如何產生,以及某些微生物如何分解塑料等。
在藥物開發方面,這些工具可以幫助研究人員設計更精確的靶向藥物,加速疫苗的研發過程。在材料科學領域,可以設計新型的納米材料。在環境保護方面,可以設計能夠更有效分解塑料的酶。在化學工業中,可以開發更環保的催化劑。
結語:開啟生命科學新紀元
2024年諾貝爾化學獎的成果標志著人類在理解和掌控生命的基本單元——蛋白質方面邁出了巨大的一步。Baker、Hassabis和Jumper的工作不僅解決了長期困擾科學界的難題,還為未來的研究和應用開辟了廣闊的前景。
這些突破性成果再次證明,跨學科合作和新技術的應用對于科學進步的重要性。物理學、化學、生物學和計算機科學的結合,加上人工智能技術的引入,共同推動了這一領域的飛躍式發展。總的來說,2024年諾貝爾化學獎的成果為解決人類面臨的諸多挑戰提供了新的工具和思路。它開啟了生命科學研究的新紀元,其影響將深遠持久。
來源: 中國科普博覽
內容資源由項目單位提供