蛋白质参与了细胞组成、肌肉收缩、消化食物、识别病毒等众多生物学功能。
为了设计出更好的蛋白质(包括抗体),科学家经常在不同位置反复变异氨基酸(按一定顺序排列组成蛋白质的单位),直到使蛋白质获得所需要的功能。
但氨基酸序列的数量比世界上的沙粒还要多,因此找到最佳蛋白质,进而找到最佳潜在药物,通常难度巨大。当面临这一挑战时,科学家通常会花费数百万美元,并在微型化、简化版的生物系统中进行测试。
「这需要大量的猜测和验证。」斯坦福大学(Stanford University)化学工程助理教授兼 Arc 研究所创新研究员 Brian L. Hie 说,「许多智能算法的目标是消除其中的猜测。」
斯坦福大学的科学家开发了一种基于机器学习的新方法,可以更快、更准确地预测导致更好抗体药物的分子变化。研究人员将蛋白质骨架的 3D 结构与基于氨基酸序列的大型语言模型相结合,能够在几分钟内找到罕见且理想的突变。
该研究以「Unsupervised evolution of protein and antibody complexes with a structure-informed language model」为题,于 2024 年 7 月 4 日发布在《Science》。
尽管蛋白质结构预测取得了巨大进步,但将序列与功能联系起来仍然是各种任务的蛋白质计算机工程的关键。仅基于序列信息进行训练的大型语言模型可以学习蛋白质设计的高级原理。然而,除了序列之外,蛋白质的三维结构还决定了它们的具体功能、活性和可进化性。
针对抗体工程问题,斯坦福大学的研究人员应用结构信息蛋白质语言模型,来预测受已知抗体或抗体-抗原复合物结构约束的高适应度序列。
研究表明,增强蛋白质结构主干坐标的通用蛋白质语言模型可以指导不同蛋白质的进化,而无需对单个功能任务进行建模。
图示:使用结构引导语言模型来指导多种蛋白质的进化。(来源:论文)结构引导范式:
广泛应用:
蛋白质复合物设计:
人类抗体进化:
替代大量数据:
定向进化:
通过这种方法,该团队筛选了约 30 种用于治疗严重急性呼吸综合征冠状病毒 2 (SARS-CoV-2) 感染的两种治疗性临床抗体的变体。同时,研究人员对 BQ.1.1 和 XBB.1.5 抗体逃逸病毒变体的中和作用分别提高了 25 倍,亲和力提高了 37 倍。
总之,这一工具将有助于快速应对新出现或正在发展的疾病。它还降低了制造更有效药物的门槛。更强的药物意味着需要更低的剂量,这意味着给定的剂量可以使更多的患者受益。
论文链接:https://www.science.org/doi/10.1126/science.adk8946
相关报道:https://phys.org/news/2024-07-ai-approach-optimizes-antibody-drugs.html
以上是登Science,药物亲和力增加37倍,AI对蛋白、抗体复合物进行无监督优化的详细内容。更多信息请关注PHP中文网其他相关文章!