AI模拟了一场5亿年的进化
蛋白质是生命的基石。从驱动肌肉运动的分子引擎,到捕捉光能的光合作用机器,再到细胞内的信息处理系统,这些功能复杂的分子贯穿了生命的每一个环节。尽管科学界早已解析了蛋白质的化学结构,但蛋白质的设计逻辑于人类而言,如同一门尚未理解的古老语言。
在这篇《科学》论文中,研究团队借助全新的AI模型,模拟了一种自然不存在的蛋白质的进化过程。而在自然界,这种程度的进化需要5亿年之久!
为了实现这一目标,来自EvolutionaryScale和Arc研究所的研究团队打造了一款全新的多模态生成式AI模型——EvolutionaryScale Model 3(ESM3)。ESM3与我们熟悉的ChatGPT、DeepSeek等AI模型原理相近,不过ESM3处理的不是文本,而是蛋白质的序列、结构和功能。
研究团队将蛋白质的结构和功能编码为离散的字母,构建了一个统一的“生物语言”体系,使模型能够同时推理蛋白质的序列、结构和功能。“生物学本质上是一种编程语言,”EvolutionaryScale的联合创始人兼首席科学家Alexander Rives博士表示,“ESM3让我们能够像设计芯片或编写代码一样,从第一性原理出发设计蛋白质。”