*以下内容编译自知名生物医药媒体GEN,
文章由Alex Zhavoronkov博士受邀撰稿
点击文末【阅读原文】即可访问
2022年ChatGPT横空出世,将生成式人工智能带入了消费领域,但深度学习和生成式人工智能在药物研发领域的进展其实是在过去十年间陆续取得的。以英矽智能为例,2016年,我们发表了第一篇“将生成式人工智能用于小分子生成”的同行评审论文。2019年,经过一年的审稿期,我们又发表了“使用生成式张量强化学习(GENTRL)生成分子——从概念到动物试验验证”研究。
如今,人工智能驱动的药物研发(AIDD)领域正在经历重大整合,有些投资者甚至为此损失了数十亿美元。过去十年间,我们看到了数百家旨在颠覆制药业的人工智能初创公司不断涌现。这些 AIDD 公司中有些被过度炒作、已经失败、正在失败、或者已经转型为传统的生物技术公司。在本文中,我将就 AIDD 的炒作和现状发表自己的看法。
*考虑到我是从英矽智能创始人的角度出发来写这篇文章的,因此可能存在一定的偏见和矛盾。
01
什么是炒作?
最近,我们听到一些人工智能药物研发公司断言:生成式人工智能被过度夸大了,他们需要更多高质量的数据、更多资源、更强的计算能力或其他东西来兑现承诺。换句话说,他们一边在试图降低业界的预期,一边试图以“现实主义者”、“资深人士”或 “睿智大师”的身份自居吸引眼球。不出意外,这些公司大多是在筹集了大量资金后,经过多年的技术开发,却未能凭借人工智能制药创造业界记录。
通常被指为“炒作”的,是媒体宣传新公司或新产品的醒目标题,或是针对科学家宣称“AI将很快解决生物学问题,并治愈所有疾病”的声明。举例来说,有些人可能会批评主流媒体对 AlphaFold 的过度追捧,因为没有任何药物是利用这项突破性技术开发的。这种炒作有多危险,我们是否应该抵制?在我看来,媒体对科学和科学家的关注是一件非常积极的事情,在药物研发领域,需要华丽的头衔来吸引非科学受众的关注,实现对市场的基础教育。
然而,另一种炒作是非常危险的——金融炒作。每一次技术革命都会引发一波媒体报道和资本追逐。被过度炒作的公司通常都是由著名风险投资家孵化的,他们有一个简单的公式:发现趋势,与许多初创公司交流以了解什么是有效的,精心制作一个引人入胜的故事,把几位大佬聚集在一起,用学术研究为其增色,然后联合大量资金进行融资。通常,这些公司会成为头条新闻,因为媒体自然而然地认为,融资额、投资者声誉和大牌业界意见领袖将成为制胜法宝。
在下一轮,这些公司与制药公司建立了一些高调的合作关系,这些公司“信守承诺”布局前期投入,吸引了养老基金的资金募集,并成为头条新闻。但是,几年过去了,真正的药物还没有进入人体临床试验阶段,业界意见领袖们也会发生内部矛盾,然后离开去追求新的行业热点或退休。令人惊讶的是,媒体、投资者,甚至是为这类公司叫好的制药公司,都很少回顾过去并得出结论。
制药业,药物发现和开发的周期实在太长,而人们更换工作的速度往往快于失败的显现。许多业内人士致力于个人利益和事业,而不是真正的开发具有变革性意义的药物。这样的金融炒作非常危险,不仅会导致预期落空和财富损失,还会导致患者无法及时获得药物,造成成千上万甚至数百万人的生命损失。
02
如何区分炒作与进展?
在深度学习革命开始初期, 2013-2014年左右,很难分清谁是谁。先驱公司们花了几年时间试错、发表论文、并制定了一些标准。如今,人工智能制药的准入门槛已经大大降低,以英矽智能为例,我们也探索出了端到端人工智能驱动药物发现的范例,并发表在了Nature Biotechnology上,在论文中我们披露了项目的大部分数据,并附上了时间表和说明,使资深分析师和记者可以通过这些院士数据展开研究。遗憾的是,对于评判人工智能制药公司孰好孰坏,大多数人仍然追随大牌业界领袖和高额募集资金,而不是关注可衡量的结果和实验验证。
为了避免危险的金融炒作,最简单的方法就是这些人工智能制药公司,根据其取得的阶段性成果,而非承诺和名人站台,逐步获得资金。当公司准备好启动一定数量的1期或2期临床试验时,才有理由进行大量的资金调配,而不是更早去投入到不必要的基础建设。比如:如果公司需要计算资源时,可以很容易地与云服务提供商合作,而不是斥巨资建立自己的基础设施,因为当一种药物进入临床时,这些基础设施很可能就已经过时了。
同样重要的是,要通过实验验证来证明它们以人工智能驱动制药的真正能力。洛桑联邦理工学院、哥伦比亚大学和牛津大学的科学家们最近在Nature Machine Intelligence联合发表了一篇论文,总结了生成化学领域的大多数实验验证研究,并提供了一个评估“技术就绪程度”的框架。
对此,基于经验,我也提出了一系列简单的问题,以帮助评估在人工智能制药这一相当成熟的领域中的公司,并估算其炒作与成果的比率:
内部研发的项目中有多少进入了临床1期、2期或3期?
外部合作的项目中是否有进入临床1期、2期和3期的,合作耗时多久?
一年内完成了提名了多少临床前候选药物(PCC)?
单个项目提名临床前候选药物(PCC)平均需要多长时间?
靶点的新颖程度如何?分子的新颖程度如何?
从立项到临床试验,人工智能药物发现平均需要多长时间?
在研管线中是否有从其他公司获得授权的药物?是否包含“老药新用”项目?
人工智能药物发现软件的客户有多少?每年有多少用户选择续约?
筹集了多少资金,分几轮?上一轮的估值是多少?
上一年度的收入是多少?
这些是我会关注的问题,遗憾的是大多数记者、分析师甚至投资者很少问这些问题,即使答案可以用一张小表或一张小图来概括。
03
人工智能驱动的药物发现有基准吗?
我想与大家分享一些英矽智能的内部基准,但要声明的是,这些基准只是参考,不能用作财务建议或任何形式的招标。2020年,我们发布了人工智能平台Pharma.AI,该平台目前包括用于靶点发现和生物制剂设计的Biology42、用于生成化学的Chemistry42和用于临床试验分析的Medicine42。如今,全球以营收计排名前 20 的制药公司中超过 10 家使用了该软件的全部或部分功能,创造了每年数百万美金的软件收入,并帮助不断验证和优化算法模型。
药物研发领域,我们在 Pharma.AI的支持下,建立了一系列由新型疗法组成的多元化内部管线,并将其对外授权给其他制药公司,以充分展示人工智能制药软件的能力。值得一提的是,这些项目通常需要更高水平的质量和独特性——对外授权项目的标准往往高于内部自研的项目。
从 2021 年 2 月到 2024 年 5 月,我们提名了 18 个 PCC,其中 9 个分子获得FDA或CDE批件进入临床试验阶段,包括进入 2 期临床试验阶段的IPF项目。仅在 2022 年,我们就提名了 9 个临床前候选项目,其中 8 个为内部项目,1 个为制药合作伙伴项目。
我们的目标是针对高、中度新颖性靶点开发全球首创或同类最佳的新分子。目前,处于临床试验1期的QPCTL 项目,在提名 PCC之前就与业界伙伴达成外部研发合作,同样处于临床试验1期的USP1和KAT6 ,分别在获得临床试验批件和提名临床前候选化合物阶段,达成对外授权合作。区别是,前者的首付款达8000 万美元,这是对项目质量和新颖性的认可。
平均而言,从立项到提名临床前候选化合物,我们需要 11-12 个月的时间,再推进到开启临床试验需要另外12个月左右的时间。
04
生成式人工智能是否改善了药物发现?
我们的实践经验表明,基于 18 个真实项目的研究数据,人工智能可以将临床前开发时间缩短一半,并提高成功概率。虽然现在断言能否加速开发一种新疗法还为时尚早,但对于人工智能驱动的生物技术来说,从项目启动到开始人体临床试验,18-24 个月应该是标准时间。
但在我看来,在临床阶段人工智能发现的药物没有捷径可走,需要扎实地通过临床试验,遵守FDA的所有规定,为安全性和有效性提供令人信服的证据。要想提供令人信服的证据来证明生成式人工智能对药物发现的影响,公司需要展示从靶点发现和药物设计到提供大片治疗药物的干净利落、有据可查的路径,使大量患者受益,而不仅仅是治疗一种罕见疾病。
鉴于目前的行业状况,如果没有战争或经济崩溃,我预计这将在 2026 年至 2029 年间发生。
遗憾的是,关于药物研发的书籍屈指可数。《十亿美元的分子:追寻完美药物》(The Billion-Dollar Molecule:The Quest for the Perfect Drug)是我最喜欢的书之一,我希望几年后,在第一批真正利用人工智能发现和开发的药物获得监管部门批准后,有人会讲述深度学习在药物发现中的故事。
关于英矽智能
英矽智能是一家由生成式人工智能驱动的临床阶段生物医药科技公司,通过下一代人工智能系统连接生物学、化学和临床试验分析,利用深度生成模型、强化学习、转换模型等现代机器学习技术,构建强大且高效的人工智能药物研发平台,识别全新靶点并生成具有特定属性分子结构的候选药物。英矽智能聚焦癌症、纤维化、免疫、中枢神经系统疾病、衰老相关疾病等未被满足医疗需求领域,推进并加速创新药物研发。
更多信息,请访问网站
www.insilico.com
商务合作,请联系 bd@insilico.ai
媒体垂询,请联系 pr@insilico.ai
收藏
登录后参与评论