从靶点认识的递进性,还有一个就是我们对靶点认识的局限性上,您谈谈对于新药开发的观念以及怎么来提高我们新药开发的成功率?
季鸣
靶点
2023-12-08
我觉得一个药物实际上起作用的核心,就是药物的物质基础,那它的物质基础实际上它的核心就是它的化学结构,如果从小分子的角度或者天然产物的角度来说,那它的化学结构肯定就决定了这个药物的药效,但是所有的药物药效的核心基础我觉得还是所谓的化学反应。药物我觉得在体内肯定是通过一系列的化学反应,最后实现它生物学的治疗作用或者是产生它的作用靶点。
 
您刚刚说的不同类型的效应,我的理解是这样的,化合物本身的结构,肯定是可以跟体内的活性蛋白反应的。有的蛋白可能带一个羧基或者羟基,有些蛋白可能含一些其他的特殊结构。如果特定的细胞里或者特定的组织里,可能某一类蛋白的富集量会更多一点,那这个化合物可能更容易跟这个蛋白反应。反之在其他的组织器官里可能是另外一类蛋白,可能会产生一些其他的化学反应,这个时候可能就会产生所谓的on target的效应和off target效应。
 
最直接的一个现象是什么呢?因为很多小分子的天然产物可能酚羟基会特别多,所以我们现在有一个研究的方法,就是我去寻找小分子天然产物所谓的作用靶点,但是往往用一些分子垂钓的方法垂钓的时候会发现,垂钓出来一堆的靶点,而不是一个靶点。
 
而且我选择其中一个靶点去解释生理学现象的时候,可能并不能完全能解释,这可能就是跟我不同的蛋白,它的作用靶点在不同组织里面的分布,这个小分子化合物跟不同蛋白之间的化学反应是相关的,所以我觉得所有药物所谓的不良反应或者是有效性,还是得从本身化学反应的角度去理解,这个可能也是真正根本所在。
我们做小分子药物,我们在筛选的时候,有很多活性很好的微量成分,但它的问题就在于没法合成,所以成不了药。那AI设计的药物能不能合成出来?
邓亚峰
AI技术
AI新药开发
2023-12-08
实际上AI生成的分子,实际上在合成性上确实是很难合成的,有的结构还比较奇怪。我们这里边用了一些技术,就是一方面我们会有些规则或者模板把那些奇怪的结构过滤掉。第二就是我们在分子生成的阶段其实就考虑了合成性,比如我们在做一些片段拼接的时候,我们会考虑它要符合一定的合成规则。再有就是当我生成这个分子之后,我会有一个合成性的评估指标,就给它一个分数,它会有一个排序。
 
其实AI目前做的可能100个或者几十个分子,有的还是相对容易合成,但也有些不太好合成的,所以我们为什么要加入专家的环节中,就是因为专家还是有他的经验,再根据他的经验在这里边做一些合成性的判断,比如结构的新颖性或者多样性的判断,我们再送去做实验,所以目前是这样的使用方式。
您做了大量基于真实世界的大数据研究。我在想,比如一个中药它的药材有八味,那我是不是可以针对每一味药材建立它特征的大数据包括基于基因组或者蛋白质组,它跟疾病的关系,它哪些信号通路是跟有效性相关的,哪些是可能预测它安全性的。在这个基础上,通过AI的这种算法,是不是可以人为地配伍中药产生增效减毒的作用?
朱宏
中药
2023-12-08
理论上是可以的,而且我觉得这也是一个正确的方法。我们现在做的其中一个重要的方式也是这样,比如一个复方,它有很多种成分,从中医角度来讲,它不是一个单病,它是一个模块化作用得到的结果。
 
首先的方法就是这个复方有多少种成分,我们先要给它列出来,每种成分所对应的人体蛋白靶点,也可以通过类似ChatGPT的形式在全球数据库检索,同时再加上自己的私有库做这方面的研究,其实是可以得到一些数据的,这个实际上是一个基础的方法。
 
但是从中医角度来讲,它的维度比较多,中药有很多的药味,它最终出来可能就是一碗汤,这一碗汤里面有很多成分,而且里面有相互的作用,包括根据中医药传统理论,它之间还有禁忌配伍、君臣佐使这些,所以相对来讲就很复杂。
 
那怎么继续解决这种问题?一方面就是我们实际上就要把刚才提到的这些君臣佐使这种理论以参数的形式放进去,再去做这方面的初步筛选,得到了这些相应的结果以后,我们一方面还是要用实验验证去做,另外一方面可以用现有的这些最新方式,能不能找到更核心的这种算法来解决这方面的问题。目前从方法论角度,我看到这个方法已经有了,但是从实际的效果来讲,其实还有很长的路需要走,就是由它的复杂性决定的。
对于一个特别原创性的新靶点或者潜在性靶点,可能我知道这个靶点跟某一疾病有关,但是没有经过临床POC的验证,现在也没有任何的小分子药物报道过,那我能不能用AI 的技术来发现一些很新的先导化合物?
邓亚峰
靶点
2023-12-08
其实这里面是分情况的,一个是你的靶点有没有晶体结构,这个是比较重要。如果有晶体结构,其实没有任何问题,因为无论是分子生成还是对接,只要基于晶体结构,都是可以做一个计算的。还有一种情况,可能没有晶体结构,可能只有序列,目前传统地对接方法或者生成方法是比较难做的,即使做了可能也不是很准。但是最近DeepMind做了一个工作,它实际上是可以把蛋白序列作为输入,把小分子的结构作为输入,之后它就可以预测出来它俩相互作用的这种状态,所以我自己觉得如果这个技术成熟的话,这种只要有序列相应地做药物筛选就可以做得比较好。
 
还有另外一个,对我个人来讲,因为我们自己也在做一些靶点的选型,其实新靶点除了找一个好的苗头,我觉得可能更重要其实是生物机制,就是当你做一个全新靶点的时候,它从来没有被验证过,这里边最大的失败可能并不是你找不到一个好的化合物和它相互作用,而是作用之后到底对疾病或者生物机制有没有显著的影响。因为我们知道某一个疾病虽然有一个靶点会影响他,可能还有别的通路或者靶点影响,药物失败有百分之八九十是因为这个原因造成的。所以它的成药性本身我自己觉得可能是更本质或者更挑战的问题,如果想找一个活性的化合物,反而可能是技术上差不多能达到的事情。
AI的成本怎么样?
邓亚峰
成本
AI新药开发
2023-12-08
其实人工智能的成本分为两块,一个是研发成本,就是训练这个模型或者开发这个模型的成本。目前看来,因为我原来做计算机视觉与自然语言处理,其实那个的数据量包括模型大小都还是蛮大的,所以它的训练成本会比较高,特别是像GPT这样的模型。
 
但在生命科学领域因为我们数据量的原因,可能几亿数据已经算是比较大的数据量了,而且模型的大小也没有到千亿的规模,所以基本上训练的数据量成本我自己觉得还好,其实并不是特别大,比如我们公司每年花个几百万的量级,不是那么大的一个成本。
 
第二个是使用成本,其实我们的方法大部分速度还是蛮快的。像我刚才也提到有些物理模块可能要2分钟,我们可能有些可能是几秒钟甚至几毫秒,特别是我们现在有些客户内部有一个8卡的服务器,基本部署上就能用,能做很多计算,所以这个成本我个人认为,比如硬件成本一年十来万,你买台机器可能五六十万,平均下来五年折旧,一年可能十来万,再加上我们软件的一些成本,其实我觉得和我们药物实验的成本比是非常小的。