在生命科學的領域中,蛋白質始終扮演著核心角色。從催化化學反應的酶,到維持免疫功能的抗體,再到決定我們性狀的調控因子均是蛋白質。因此,如何通過人工改造讓蛋白質變得更好,早已成為生物醫藥、農業育種、生物制造等領域的共同追求。

傳統蛋白質工程如同“盲盒式”試驗,需要大量測試才能找到有效突變,既耗時又難以規模化。盡管如AlphaFold等人工智能帶來新希望,但其高算力需求和模型復雜性限制了廣泛應用。因此,亟需一種既懂結構、又懂進化,且低成本、高準確率的蛋白質設計新方法。

2025年7月,中國科學院的科研團隊交出了一份令人驚喜的答卷,他們開發出一個名為基于人工智能的信息約束蛋白質工程(Al-informed Constraints for protein Engineering,AiCE )的智能蛋白質改造顧問。它不僅懂結構,還懂進化,以一種幾乎反向思考的方式,提出高效而精準的蛋白質改造方案,正在悄然改變整個蛋白質工程的設計邏輯。

發表在《細胞》上的相關論文(圖片來源:參考文獻[1])

AiCE 是怎么懂結構、懂進化的?

我們常說蛋白質的結構決定功能,蛋白質就像一條被折疊成復雜三維結構的氨基酸項鏈,其折疊后的形狀決定了它能不能精準對接特定的分子、完成生物反應中的任務。因此,科學家要想改造蛋白質,往往需要知道一件事,如果我把某一個氨基酸換掉,會不會毀了整條項鏈的形狀?

蛋白質折疊示意圖(圖片來源:作者使用AI生成)

AiCE 的獨特之處,在于它巧妙融合了兩個維度的信息:結構與進化,并構建了一種全新的反向思維策略,稱為反向折疊模型。

傳統的蛋白質預測方法通常是給你一串氨基酸序列,猜猜它會折成什么結構。而反向折疊恰好相反,它從目標的三維結構出發,反過來推測哪一組氨基酸最可能折疊成這個樣子。這個方向的好處在于,它天然適合用于蛋白質改造而不是預測,因為我們已經知道目標結構應該是怎樣的,現在要找的是哪些突變可以保留甚至優化這個結構。

AiCE的方法及其兩個模塊AiCEsingle 與AiCEmulti(圖片來源:參考文獻[1])

AiCE 的第一個子模塊叫 AiCEsingle,專門用于篩選只替換一個氨基酸的突變。它基于大量反向折疊模型的采樣,輔以結構約束,比如某個位點如果埋在蛋白內部,適合用疏水性殘基,如果在表面則可承受更多極性變體。實驗結果顯示,單靠引入結構約束,準確率就提高了 37%,遠超大多數 AI 方法。

而在60個蛋白質功能突變的真實數據集中,AiCEsingle 的表現更是領先其他方法36%到90%,特別是在復雜蛋白和蛋白-核酸復合物的預測中表現出色。

蛋白質突變的組合并非簡單疊加。一些突變單獨存在可能是好的,但組合在一起卻可能互相沖突,產生所謂的負向協同作用。

為了應對這一挑戰,研究人員開發了第二個模塊——AiCEmulti,它引入了進化耦合約束。該模塊通過分析自然蛋白數據庫中哪些氨基酸突變常一起出現,判斷哪些組合是進化認可的,從而在預測多位點突變時更具可靠性。

簡而言之,AiCE 就像一個擁有結構工程師和進化歷史學家雙重視角的蛋白質設計顧問。它既考慮這個蛋白怎么折才滿足功能,也考慮怎么變才自然,幫助科學家做出更聰明、更穩妥的設計決策。

從編輯升級到功能進化

一個科學工具是否具有變革意義,最終還是要看它能解決什么問題。AiCE 不只是一個算法的進步,更是一種能推動蛋白質工程真正走向高效、低門檻、產業級應用的技術平臺。在研究團隊的驗證中,AiCE 已成功將其理念應用于多種蛋白質的功能優化中,成果令人矚目。

基因編輯是一項極其依賴蛋白質設計的前沿技術,尤其是堿基編輯器,它們要精確地將DNA上的一個堿基修訂為另一個,關鍵就在于編輯酶的性能。

利用 AiCE,科研團隊成功對多種編輯酶進行了高適應性突變設計,最終開發出多個性能大幅提升的新版本。這些編輯工具不僅在實驗中展現出卓越性能,更為后續臨床級基因治療奠定了基礎,真正體現了 AiCE 在精準醫學領域的賦能能力。

除了基因編輯器,AiCE 還被成功用于優化多個結構和功能各異的蛋白質,包括:脫氨酶、核酸酶、核定位序列、逆轉錄酶。AiCE 的通用性在這些多樣蛋白質中得到了驗證,說明它不依賴于特定蛋白類型,而可廣泛應用于各類結構復雜、功能精細的目標。

AiCE可用于基因編輯器和優化結構功能各異的蛋白質(圖片來源:參考文獻[1])

基于 AiCE 的蛋白質工程策略,展現出廣闊的跨領域應用前景。在精準醫學中,它可用于開發更安全、高效的蛋白藥物和治療工具;在農業育種上,能優化作物抗病性和營養合成能力;在工業中,可設計出耐受極端環境的高性能酶類;在基礎科研領域,也有助于構建更強大的生物分子工具,服務于細胞工程、神經成像和合成生物學等研究。AiCE 正推動蛋白質設計從實驗室走向實際應用。

簡而言之,AiCE 不只是一個實驗室里的概念驗證,它正在成為一個可以被廣泛復制、被大規模推廣的蛋白質設計范式,讓蛋白質改造不再是少數實驗室的特權,而是未來各行各業可以輕松使用的生物技術能力。

總結

在蛋白質工程這條充滿挑戰的道路上,AiCE 的出現無疑是一劑強心針。它既不依賴龐大的AI訓練,也無需海量計算資源,卻能在結構和進化的雙重常識指導下,做出比肩甚至超越主流AI模型的設計成果。這種低成本、高精度的策略,不僅提高了研究效率,更打開了蛋白質改造的普及化大門。未來,借助這樣的工具,我們也許能更快地開發出對抗疾病的新療法、提升農作物性能的關鍵蛋白,甚至實現分子層級的生物智造。技術在進步,關鍵是——它變得更容易被掌握了。

參考文獻:

[1] Fei, Hongyuan, et al. "Advancing protein evolution with inverse folding models integrating structural and evolutionary constraints." Cell (2025): S0092-8674(25)00680-4.

[2] Arnold, Frances H. "Directed evolution: creating biocatalysts for the future." Chemical engineering science 51.23 (1996): 5091-5102.

作者丨褚宏偉博士 湖南師范大學碩士生導師;楊超 中國科普作家協會會員

審核丨趙寶鋒博士 遼寧生命科學學會

來源: 科普中國創作培育計劃

內容資源由項目單位提供