计算机辅助药物设计(CADD)始于20世纪70年代,当时科学家首次使用计算机来预测药物分子对生物系统的影响。
如今,CADD已成为药物发现的一个重要工具,使研究人员能够快速分析大型数据集并识别潜在的药物靶点。
随着最近ChatGPT、GPT-4等为代表的人工智能技术的发展,或再掀AI研发热潮!
从CADD到AIDD,药物「智造」进展如何?
CADD的「前世今生」
CADD开发了虚拟筛选方法,可用于寻找有希望的化合物进行药物开发:
结合人工智能(AI)、机器学习(ML)和深度学习(DL)等技术,可以处理大量的生物数据,从而在药物开发过程中减少时间和成本;根据蛋白质或配体的3D结构的可用性使用两种不同的技术,它们被称为基于结构的药物设计(SBDD)和基于配体的药物设计(LBDD)。
在某些情况下,这两种技术的结合在寻找先导分子方面表现出不错的准确性。
、
图1 CADD概览图片来源:综述论文1
下表列举了CADD常用的对接软件。
表1 常用CADD对接工具列表
注:增量构建是一种药物发现的方法,即通过添加与目标蛋白契合度高的片段,一步步构建药物分子。这种方法可以减少搜索空间,提高寻找最佳候选药物的效率。增量构建可以使用不同的算法,如FlexX,它使用一套规则,根据其结合亲和力和几何形状选择和放置片段。资料来源:参考论文1
目前流行的采样算法有三种:形状匹配、系统搜索(穷举搜索、分段搜索和构象集合)和随机搜索算法(如蒙特卡洛算法、遗传算法、禁忌搜索法和群体优化法)。而流行的评分函数主要可分为三类:力场、经验和基于知识的评分函数。
作者发现商业对接软件,可能比学术对接软件有更好的性能。根据对1990年至2013年的所有分子对接文献的分析,AutoDock12、GOLD12和Glide12是最常用的对接软件。
然而,这并不意味着这三个软件比其他软件更准确。更多关于分子对接程序的横向评测可以参考文献3。在文章里讨论了多种分子对接软件的效果,包括Autodock、Autodock Vina、Ledock、Rdock、UCSF DOCK、LigandFit、Glide、GOLD、MOE Dock、Surflex-dock等。
其次,CADD在药物发现过程中仍存在一些问题。
比如使用CADD预测结合亲和力的挑战,在过去三十年的研究中由于蛋白质柔性,水的行为,拥挤效应等影响依然无法仅仅依靠CADD做出可靠的、普遍的预测。
另外,CADD只是产生想法,而药物发现和生物学仍然需要非常多的实验,和同行的交流中普遍感觉到目前药物研发行业还是趋向保守。
因此,CADD仍然被视为药物发现过程的支持部门,而不是核心部门。
AI驱动药物设计的现状
过去十年来,人工智能(AI)一直在药物发现领域取得进展:采用人工智能方法的生物技术公司,有150个小分子药物正在研发,超15个已经进入临床试验阶段。
据Exscientia公司报告,第一个由人工智能设计的候选药物将在2020年初进入临床试验。该候选药物DSP-0038是一种双靶点5-HT1a受体激动剂和5-HT2a受体拮抗剂,是Exscientia和Sumitomo Dainippon Pharma之间合作的一部分。2021年5月宣布在美国启动DSP-0038的1期临床研究。
近期涉及AI在药物研发中应用的公司交易整理如下:
表2 人工智能应用于药物研发的部分交易
资料来源:参考资料4
最近,笔者有幸聆听insilico medicine(英矽智能)团队介绍他们最新的Pharma AI平台,特别是引入了类似chatgpt的界面大大方便了没有深厚计算机基础的药物研发用户的使用门槛。
图2 英硅智能公司的PHARMA AI药物研发平台
如图所示,英硅智能公司致力于促进新药发现和研发的三个领域:疾病靶点识别、合成生物学的生成和新型分子数据的生成、以及临床试验结果的预测
与传统药物研发流程相比,引入GPT的AI药物研发平台还可以通过在研究和开发过程中减少失败的尝试次数来节省时间和资源。
此外,可以根据已知的蛋白质结构和化学反应,预测新的化合物和药物靶点。这意味着研究人员可以更快地进行药物筛选和评估,从而缩短药物研发周期。然而,这些技术仍处于早期阶段,需要进一步的发展和验证,以确保其在药物研发中的可靠性和安全性。
然而,人工智能在药物发现中的方法需要在未来更好地考虑药物的体内相关特性,数据生成和分析需要向更快、更低成本地到达安全和有效的药物方向发展。
未来已来:GPT打破壁垒
GPT-4和ChatGPT是人工智能技术发展的缩影,具有影响药物发现和开发的潜力。
GPT-4可以提出新的化合物,从而加快和提高药物发现的效率,也可能发现传统方法未能发现的新药。
ChatGPT是一款会话式聊天机器人,可以找到具有类似性质的化合物并对其进行修改,以确保它们没有被专利。这些技术有潜力释放海量数据的能量,加速药物发现和开发的进程。
下面,笔者就使用GPT工具来尝试新药研发初期常见的靶点立项基础任务。
笔者以正在研究的靶向河马通路下游TEAD开发治疗癌症新药为例,用GPT要求写一份已知化合物抑制剂的清单,并给出一个邮件模板方便笔者写信给CRO公司咨询合成报价。
图3 ChatGPT关于TEAD抑制剂的回答
为了比较,笔者尝试了谷歌最新的BARD,结果如下:
图4 BARD关于相同问题的答案
相比ChatGPT找到了CA3(CIL56)化合物,BARD提出了更多候选化合物,包括共价抑制剂TEAD347等。
图5 CA3的化学结构
两个GPT都提到了CA3这个化合物。
通过Bing浏览器Edge dev版内置的Chat继续提问了解到CA3(CIL56)是一种小分子化合物,通过产生依赖铁的活性氧(ROS)诱导细胞铁死亡12。铁死亡是近年来发现的一种新型细胞死亡方式,通常在细胞死亡过程中伴随着大量铁积累和脂质过氧化反应。CA3(CIL56)对YAP1/Tead转录活性具有强烈的抑制作用,主要靶向具有CSC特性的YAP1高表达和治疗耐药性的食管腺癌细胞。
图6 使用bing chat可以通过互联网更快找到可靠的参考来源
英文邮件格式也很贴心的准备好,稍作修改即可发给CRO公司,大大提高了效率。
图7 地道英文生成的咨询CRO公司合成目标化合物的商业邮件模板
除了以上几款人工智能软件外,笔者还近距离体验了一款天然产物与AI完美结合的AI研发平台——药智NPAIEngine。
据了解,NPAIEngine是一个天然产物+AI研发平台,由药智网与英国伯明翰大学何山教授等团队合作打造,特别适用于聚焦于天然产物与中药研发领域。
据介绍该平台汇聚了全球约3.5万种植物、生物和矿物质的57万个天然产物,并应用了AIA Insights自主研发的核心AI算法。
图8 NPAIEngine天然产物AI研发平台
通过将天然产物中的化合物结构数据库、化合物生物活性数据库以及相应的疾病数据库有机地结合起来,NPAIEngine的强大功能使得用户能够筛选出天然产物中的有效成分,并预测这些成分对于特定靶点或疾病的作用。
另外,基于输入的天然物化学结构利用药物AI从头设计算法,设计可合成性高、成药性好、具有新颖专利结构的先导化合物优化功能也即将年内上线。
小结
尽管AI在药物开发中展现出了巨大的潜力,但也面临着一些挑战和障碍:基于人工智能的方法通常是数据密集型的,需要大量的数据集以获得准确的结果。
此外,基于人工智能的方法可能难以解释,使得基于人工智能的药物发现的结果难以解释。基于人工智能的药物发现可能是昂贵的,因为它往往需要专门的硬件和软件。不过笔者认为随着GPT技术的普及,通过聊天方式就可以高效解决以往需要费时费力才能搞定的问题指日可待。
接下来传统药物研发团队,更多要关注新药开发过程中数据质量和可用性、算法可解释性和可靠性、知识产权和监管问题等。要充分利用AI在药物开发中的价值,需要投资数据、技术、新技能和行为,并实现整个研发过程的转型。传统制药公司需要及时跟上AI带来的变革,并与AI先驱公司进行合作或竞争。
参考文献:
1.Vemula,D.,Jayasurya,P.,Sushmitha,V.,Kumar,Y.N.and Bhandari,V.,2022.CADD,AI and ML in Drug Discovery:A Comprehensive Review.European Journal of Pharmaceutical Sciences,p.106324.
2.Ledock介绍:生信云实证,ledock分子对接,ledock实证,虚拟筛选-速石科技BLOG(fastonetech.com)
3.十种分子对接程序的综合评价:基于多种蛋白-配体复合物、采样能力和评分能力的预测精度-四川魔德科技有限公司(modekeji.cn)
4.Tapping into the drug discovery potential of AI(nature.com)
5.在药物发现中采用人工智能https://www.bcg.com/publications/2022/adopting-ai-in-pharmaceutical-discovery
6.How Artificial Intelligence is Changing Drug Discovery and Development?.https://www.delveinsight.com/blog/artificial-intelligence-in-drug-discovery
7.AI in drug discovery and development:A brief commentary.https://www.pharmatutor.org/articles/ai-in-drug-discovery-and-development-a-brief-commentary
8.AI&Machine Learning in Drug Discovery&Development(2022)-Insider Intelligence.https://www.insiderintelligence.com/insights/ai-machine-learning-in-drug-discovery-development/
9.有关异黄酮Dracaeconolide B发表在JNP的论文https://pubs.acs.org/doi/10.1021/acs.jnatprod.2c00859
10.NPAIengine平台网址:https://app.npaiengine.com/login
11.Hermite直播间|精彩回顾:分子对接与打分函数:历史、现状与新工具