登Science，藥物親和力增加37倍，AI對蛋白、抗體複合物進行無監督優化-人工智慧-PHP中文網

登Science，藥物親和力增加37倍，AI對蛋白、抗體複合物進行無監督優化

王林

發布： 2024-07-18 22:22:51

原創

764 人瀏覽過

登Science，藥物親和力增加37倍，AI對蛋白、抗體複合物進行無監督優化

編輯 | 蘿蔔皮

蛋白質參與了細胞組成、肌肉收縮、消化食物、識別病毒等眾多生物學功能。

為了設計出更好的蛋白質（包括抗體），科學家經常在不同位置反覆變異氨基酸（按一定順序排列組成蛋白質的單位），直到使蛋白質獲得所需的功能。

但胺基酸序列的數量比世界上的沙粒還要多，因此找到最佳蛋白質，進而找到最佳潛在藥物，通常難度很高。當面臨這項挑戰時，科學家通常會花費數百萬美元，並在微型化、簡化版的生物系統中進行測試。

「這需要大量的猜測和驗證。」史丹佛大學（Stanford University）化學工程助理教授兼Arc 研究所創新研究員Brian L. Hie 說，「許多智慧演算法的目標是消除其中的猜測。」

史丹佛大學的科學家開發了一種基於機器學習的新方法，可以更快、更準確地預測導致更好抗體藥物的分子變化。研究人員將蛋白質骨架的 3D 結構與基於胺基酸序列的大型語言模型結合，能夠在幾分鐘內找到罕見且理想的突變。

研究以「Unsupervised evolution of protein and antibody complexes with a structure-informed language model」為題，於 2024 年 7 月 4 日發佈在《Science》。

登Science，藥物親和力增加37倍，AI對蛋白、抗體複合物進行無監督優化

儘管蛋白質結構預測取得了巨大進步，但將序列與功能聯繫起來仍然是各種任務的蛋白質計算機工程的關鍵。

僅基於序列資訊進行訓練的大型語言模型可以學習蛋白質設計的高級原理。然而，除了序列之外，蛋白質的三維結構也決定了它們的特定功能、活性和可進化性。

針對抗體工程問題，史丹佛大學的研究人員應用結構資訊蛋白質語言模型，來預測受已知抗體或抗體-抗原複合物結構約束的高適應度序列。

研究表明，增強蛋白質結構主幹座標的通用蛋白質語言模型可以指導不同蛋白質的演化，而無需對單一功能任務進行建模。

登Science，藥物親和力增加37倍，AI對蛋白、抗體複合物進行無監督優化

圖示：使用結構引導語言模型來指導多種蛋白質的演化。（資料來源：論文）

結構引導範式：
- 不模擬明確的蛋白質功能或適應性定義。
- 專注於保留蛋白質主鏈折疊的區域，間接探索適應度景觀。
- 假設高序列似然範圍內的演化是高適應度變異體的有效先驗。
廣泛應用：
- 可間接研究不同環境中蛋白質的適應度景觀，如酵素催化、抗生素抗藥性和化療抗藥性。
蛋白質複合物設計：
- 僅對單鏈結構訓練的 ESM-IF1 可擴展到設計蛋白質複合物。
- 顯示結構資訊語言模型能隱式學習結合特徵並推廣到多聚蛋白質。
人類抗體演化：
- 此方法對人類抗體的演化特別有價值，可用於治療多種疾病。
- 抗體透過結合目標抗原來提供保護。
取代大量數據：
- 結構可以取代大量數據，電腦仍能學習。
- 更多抗體有最佳化機會。
定向進化：
- 此方法用於實驗性地指導多種蛋白質的定向進化活動。
- 生成功能活性優於野生型蛋白質的設計。
- 不需要分析標記的適應度資料或特定任務的模型監督。
  圖示：利用結構資訊語言模型演化抗體可提高中和效力和彈性。 （資料來源：論文）