蛋白质是生命活动的主要承担者,其在生物医学、化学工程等多个领域具有重要的应用价值,包括作为药物靶点和治疗剂或者充当关键催化剂等等。不过,自然界的蛋白质,往往需要经过多重工程改造才能满足工业应用要求。而传统蛋白质设计则需要经历长达数年的实验研究,耗时耗力。近年来,深度学习技术的发展,在一定程度上有望打破传统方法面临的瓶颈。目前,领域内正在构建 AI 蛋白质生成大模型,提升蛋白质设计的效率和成功率等。业内普遍认为,基于深度学习的大模型正在推动产业级蛋白质设计进入“智能生成时代”。也因此,基于 AI 设计新的生物系统目前已经发展成为了一个备受关注的领域。今年 5 月,微软支持的 OpenAI 与跨国制药大厂赛诺菲达成合作,利用 AI 推动药物开发项目。4 月,David Baker 联创的 AI 药物公司 Xaira Therapeutics 筹集了超过 10 亿美元的资金,旨在利用端到端 AI 技术开发新药。近日,一家专注于 AI 蛋白设计的初创公司EvolutionaryScale 宣布已获得 1.42 亿美元种子轮融资,本轮融资由 GitHub 前首席执行官 Nat Friedman、曾在苹果公司负责人工智能项目的 Daniel Gross 和 Lux Capital 领投,亚马逊和英伟达的风险投资部门 NVentures 也参与了此次融资。
EvolutionaryScale 的首席科学家 Alexander Rives 向外媒透露,本次种子轮筹集的资金将用于继续训练下一代 AI 模型、扩展功能以及组建一支与生物技术行业合作的团队。
宣布融资消息的同时,该公司还正式发布生成式新型蛋白质 AI 模型 ESM3。Lux Capital 联合创始人兼执行合伙人 Josh Wolfe 表示,该公司已开发出用于创造新型蛋白质和其他生物系统的大型语言模型,这是“生物学领域的 ChatGPT 机会”。核心团队来自 Meta,利用 AI 设计全新蛋白质
EvolutionaryScale 建立在社群元宇宙公司 Meta 的基础人工智能研究部门(FAIR)基础上,由原 Meta 的 AI 蛋白质折叠团队负责人 Alexander Rives 主导创办,他在新公司担任首席科学家。
2019 年,Alexander Rives 与 Tom Sercu 和 Sal Candido 在 Meta 的 AI 研究实验室 FAIR 开始专注于开发生成式 AI 模型解码蛋白质。期间,该团队构开发了一种名为进化规模建模 ( evolutionary scale modeling,ESM) 的大型语言模型,即第一代大型蛋白质语言模型 ESM1(ESMFold)。这是一个基于 Transformer 的蛋白质预测模型,该模型只需了解蛋白质序列即可预测其三维结构,与谷歌旗下 DeepMind 开发的 AlphaFold 模型类似。2023 年,Meta 解散了其 AI 蛋白质折叠团队,Alexander Rives 离开 Meta 并与前同事们共同创办了AI 生物学公司 EvolutionaryScale 继续他们的工作。据相关媒体报道,该团队的 8 个核心成员均已加入了新公司。新成立的公司专注于构建生物学领域的大语言模型,并利用这些大模型从头设计和生成蛋白质。图 | Alexander Rives 博士(来源:个人领英)根据该公司在官网的描述,AI 随着大模型、数据集以及算力的不断推动而进步,生物学的发展亦是如此。在过去五年的研究中,我们团队探索了生物学的扩展性,发现语言模型的扩展可以加深对生物学基本原理的理解,并发现生物结构和功能。基于此,EvolutionaryScale 的重点是扩大其模型训练,整合蛋白质以外的数据,并正在为生物技术应用创建一个通用的人工智能模型。目标是将数亿年的生物反复试验压缩到一个工作周内,帮助研究人员快速高效设计蛋白质,帮助靶向癌细胞、寻找有害塑料的替代品、推动环境缓解等。在公布融资消息时,这家公司推出了最新的生成式蛋白质语言模型 ESM3,它可以生成自然界中从未见过的蛋白质。“不打算成为一家药物研发公司”
EvolutionaryScale 的主要业务是从头蛋白质设计,可能会利用 AI 更快设计蛋白质药物,亦或瞄准传统“难成药”、“不可成药”靶点以及难治性疾病寻找新线索。
领域内的其他同行还包括 Flagship Pioneering 孵化创办的生成式 AI 药物研发公司 Generate:Biomedicines,这家公司基于生成式 AI 设计蛋白质药物,已筹集超过 7.5 亿美元;以及刚刚亮相不久的 Xaira Therapeutics,该公司聚焦设计蛋白质和抗体,亮相即筹集了超过 10 亿美元的初始资金,用于推进联合创始人兼生物化学家 David Baker 实验室的深度学习模型。这两家公司专注于开发药物研发管线,与这种模式不同,EvolutionaryScale 自称是“生物学 AI 研究实验室”,其策略是与制药商合作将 ESM3 模型整合到药企工作流程中或者通过英伟达以微服务形式出售其软件。该公司还表示,精简版的 ESM3 将会免费开源,提供给学术界使用。“我们确实更想开发一些 AI 工具,让科学家能够理解和设计生物学,我们并不打算成为一家垂直综合的药物研发公司。事实上,我们首先将自己定位成一家前沿研究实验室。”Alexander Rives 在接受外媒采访时说。公开资料显示,现阶段,EvolutionaryScale 大约有 20 名员工,没有 CEO。Alexander Rives 进一步指出,他们也不打算招聘 CEO,他计划今年秋天重返学术界,并担任麻省理工学院助理教授和博德研究所成员,同时保留公司首席科学家的职位。可为蛋白质发现提供可编程的平台
“ESM3 向生物学的未来迈出了重要的一步,该模型能够更加创造性地思考生物学设计。未来,人工智能将成为一种从第一性原理出发进行工程设计的工具,而不再是通过艰苦的反复试验研究生物学,就像我们设计结构、机器和微芯片以及编写计算机程序那样。”Alexander Rives 在一份声明中说。
最新的 ESM3 是该公司正在重点推进的蛋白质语言模型,这是第三代 ESM 模型,经过在 28 亿种天然蛋白质序列的数据集上进行了 1 万亿次浮点运算训练而创建的一个生物学生成式 AI 模型,包含 980 亿个参数,而第一代 ESM 大约有 7 亿个参数。ESM3 的浮点运算次数比 ESM2 多出约 25 倍,数据量多出 60 倍。ESM3 较之前的版本进行了重大更新升级,该模型本身具有生成性,并且是一种“多对多”的模型,这意味着结构和功能注释可以作为输入而不仅仅是输出。该模型可以同时推理蛋白质的序列、结构和功能,这是蛋白质生物学和生物化学的三个基本方面,能够帮助科学家更精准识别和验证新蛋白质。这为蛋白质发现工程提供一个可编程的平台,可创建用于药物研发和材料科学的蛋白质。一旦开源,科学家就可以微调这个基础模型,并根据自己的专有数据构建专用模型。具体而言,ESM-3 可为生物学家和蛋白质设计师提供生成式人工智能服务,帮助他们改进蛋白质工程和理解。只需简单输入提示,它就可以利用提供的支架生成新蛋白质,根据反馈自我改进蛋白质设计,并根据用户指示的功能设计蛋白质。这些功能可以以任何组合方式串联使用,以提供思路链蛋白质设计,就好像用户正在向一位研究人员发送消息,而这位研究人员已经记住了人类已知的每个蛋白质序列的复杂三维结构定义,并且已流利学习了该语言,使用户能够来回迭代。比方说,EvolutionaryScale 利用 ESM3 设计出一种全新的绿色荧光蛋白 (GFP),这是一种从发光水母中分离出来的蛋白质,在自然界中这种蛋白质需要 5 亿年才能进化出来。迄今为止,生物医学研究中使用的 GFP 几乎都是在自然界中发现的。进一步讲,这是一个系列模型,可分为小、中、大三个规模,可通过该公司的 API 和合作伙伴的平台使用。该公司将于将于今日开放封闭测试版 API,并且开放小型 ESM3-open 模型的权重和源代码,用户可以在 GitHub 上免费获得供非商业用途使用。该公司正在与亚马逊网络服务和英伟达合作,帮助其加速 ESM3 的药物发现和合成生物学应用。英伟达将优化 ESM3 所有版本的训练和推理性能。ESM3-open 版本即将在 NVIDIA BioNeMo 上推出,这是一个用于药物发现的生成式 AI 平台。完整的 ESM3 系列模型将很快作为 NVIDIA NIM 微服务提供给特定客户,与 英伟达合作进行运行时优化,并由 NVIDIA AI Enterprise 软件许可证支持,可在 ai.nvidia.com 上进行测试;而与 AWS 的合作将使全球数十万研究人员能够使用他们自己的专有数据轻松访问和安全地大规模微调 AI 模型,包括在 Amazon Bedrock、Amazon Sagemaker、AWS HealthOMICs 平台推出。Alexander Rives 透露,公司正在研发更大的模型,目前筹集的资金可以维持大约两年。参考链接:
1.https://finance.yahoo.com/news/evolutionaryscale-lands-142-million-advance-100911758.html
2.https://press.aboutamazon.com/aws/2024/6/evolutionaryscale-launches-with-esm3-a-milestone-ai-model-for-biology
3.https://blogs.nvidia.com/blog/evolutionaryscale-esm3-generative-ai-nim-bionemo-h100/
免责声明:本文旨在传递生命科学和医疗健康产业最新讯息,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。
收藏
登录后参与评论