这里面不是 30 个碱基,你用 AI 去只是合成这个可能就几个碱基?那另外的碱基,难道不需要把它再补充上去吗?还是怎么个情况?
韩蓝青
AI新药开发
AI技术
2022-12-08
我们说的这个 ASO 它的长度一般是在 30 个 base 以内。那么它是跟 mRNA 的序列,它是形成一个互补配对的这么一个结构。所以说这个设计 ASO 的人往往就是一个 base 一个 base 的挪过去,然后在一个细胞水平上用高通量的筛选去看哪一个序列是可以纠正他的这个问题。传统上来讲非常耗时耗力,你要耗掉很大的这个金钱和时间去合成很多的不同的序列,可能动不动就是上千个序列,然后再要在细胞水平上去做高通量的筛选,这个过程也非常的复杂漫长。但是有了 AI 以后,我可能只要做几条不同的,可能每一个都是在 20 个 base 左右,我只要做几条我就能够保证找到你想像这个要的序列。这个 AI 是实际上现在已经有一些比较好的一个预测的工具。那我们要实现里面去拿到更多的数据,这样的训练的模型能够更精准。
我们现在 AI 跟核酸药物的一个作用机制是什么样的?我们原来传统的这个核酸药物,我们用 AI 之后我们解决掉什么样精准化的问题?从你的一个角度来说,你的切入点是什么?
韩蓝青
AI新药开发
AI技术
2022-12-08
核酸药物它也分有几种,一个是这个si RNA说这个 rna 干扰,这一类的这个药物。那我们最近 focus 在这 ASO ,就是反义寡核苷酸这一类的这个药物。那么这个 ASO其中有一类这个,实际上 AI ASO 领域有一家公司是非常了不起的, 叫Ionis,是一个时间还蛮长的一家公司,沉寂了有将近 30 年,最近这几年就爆发了,所以说我觉得像这样一家公司,他这个三十年如一日,在这样一个一开始不被大家看好的一个领域去耕耘,这 30 来年也发了有上千篇的这个论文,现在一下子就爆发了,他们就专做一件事,那么这 ASO 要解决的其中的一个问题是什么?像我刚才说的这个 dmd 这里面,来解决一些,这个由于错移突变还是引起的这个叫 frameshift 或者说这个 stop code 这个问题。
那么AI 在这里面起到一个什么作用?首先就是我刚才讲的要先找到这个致病突变是什么,那么我刚才讲的那实际上就讲的那一大段里面,基本上先要解决什么事,就用 AI 的这个模型来解决什么是致病突变。比如说我们前一段时间有一个病人的家长,正好是我的这个认识的一个朋友,他这个小孩得了一个病,他这个病实际上在一个基因上面有一个单碱基的突变。之前这个医生就觉得他是因为造成了一个氨基酸的变化,所以就治病。但是在我们模型跑了以后,就发现他实际上是造成了多切掉了 36 个碱基,那么后来我们在细胞水平上也验证了。那么现在假如去干预的话,那我们怎么样去设计一个 ASO 来去让他纠正 mRNA剪接的问题。那这个时候我们 AI 又有用武之地了,这个 ASO 传统的办法,说你可以在一个,你怀疑会引起这个 mRNA 剪接错误的这个地方,你去合成这个比如说二三十个 base 的这么样的这个 ASO, 一个一个的去合成。那你有可能要一下子就合成上千条,但每一个他的合成的成本都非常高,经过我们预测以后,我们可能只要合成几条就行了,我们给你大大缩小了范围,能够让你在最短的时间内用最少的代价就能够找到一个非常合适的 ASO 的序列。当然这个序列我们还要去计算它的实际上的这个由于拖把造成的这种这个毒性,所以这个 ASO 我们要是跟 AI 结合了以后,我们就会发现我们对于他的这种预测、设计都会大大的提高效率。将来假如说真的哪一天 ASO 变成了一个非常个性化的治疗,假如有 AI 能够大大的提高效率的话,这件事情就变成了一个可能,不然的话,全世界只有这一种治病突变的一个病人。你不可能说一个药厂为他花几年的时间去开发,所以说这个很可能变成了个性化的治疗手段。假如说没有 AI 的话,这个是没有办法做到的。
我们会不会在量子计算会不会即又进一步形成一个革命化的一个情况,出在有数据、算力、算法各方面。另外你们在难成药上来说,它的整个算法的一个设计上它是有什么样的一个讲究吗?
牛张明
量子计算
2022-12-08
那个我先说一下,刚才我们提到的算力这个问题。其实那个算力这个问题在计算机领域是比较经典的一个问题。然后外国人专门出了一本书或者一系列书,就叫 no silver bullets。因为其实随着这个摩尔定律,然后每年基本上算力或者说同样价格的计算机其实都在 double 也就都在成倍的扩增。然后我们其实现在算力我个人认为已经比较充分了,但当然只是说我们在同样的一个资金、还有同样的时间内,然后你如何去选择应用这样的算力,然后能去解决多大精度的一个问题。所以像刚才我们说的其实算力问题现在已经比以前要好很多了,因为比如说在以前是登月球的那个一个宇航局的机器里面,它的算力还不如我们现在用的手机。所以其实我们现在的可能 AI 科学家和CAD的科学家比以前已经幸福很多了。但当然像这个算力的瓶颈问题它一直是存在的。比如说我们刚才在提到的那个,他们用了许多个 TPU ,然后那个计算的费用就是上百万美金起计。然后所以其实是这些 TPU 一个都代表,比如说几百个 GPU 的这样的算力,然后每个 GPU 的价格都是在 10 万美金,比如说一台机器,所以其实这是大部分的 biotech 公司很难以去承受的。但是这是一个客观的层面。然后另外一个例子就是其实像美国的一家上市公司,他们是在做难以成药靶点上面的一个显著的代表,然后这家公司他们就是使用计算机大量的去模拟蛋白动态的一个过程。然后去找到了一些别构的口袋,然后通过这样的一个口袋发现,然后设计出了一些已经上临床的一些候选药物。然后他们使用的计算机也是特别值得一提。因为这边是在那个美国的一些科研机构,他们这边专门设计出来的一些比如上亿美金这样价值的一些专门的硬件做蛋白动态模拟,不是说我们现在使用的一些机器。所以其实在那个上市公司在美国的这些公司,其实对一些小型比如说 AI 初创公司那个确实在算力上面是有很大的一些优势的。这样的优势其实它可以带来的一些可以怎么扩大,说这些公司其实它可以用更短的时间内可能更容易攻克一个蛋白的模拟,然后它可以模拟的蛋白的时长也比我们小的公司那个要更快很多。所以这个说让他们可以去做更大的一些事,行更高回报率的一些事情。
但是也不是说像小的 AI biotech或 biotech公司没有其他的一些办法,因为现在 AI 的技术其实让我们可以做到,说使用同样的算力情况下,如果我们做一些算法的优化,做一些底层的优化,它虽然没有能达到像比如说这些上市公司这样的精度,但是它已经足够让我们去快速地解决一些药物研发中的实际问题了。所以这那个也是我们公司的一个实际的做法,我们模拟的时间会更短一些。但是其实虽然没有精度那么高,但是我们可以通过一些其他的 AI 的算法去尽量的弥补这样的一个精度的损失。
刚才提到了那个在具体的一些算法,比如说我们那个做AI或者说使用 cadd 如何去解决难以成药靶点的问题,其实在那个难以成药靶点,它最难的一个问题是 AI 可能现阶段解决不了的,因为它是一个靶点相关的问题。说靶点的这个机理还有作用机制,这个是需要生物学家,比如说像那个韩教授这边的公司或者学术机构来解决的,他如何去判断这些蛋白之间和基因之间的相互作用,然后去如何产生这样的成药性,或者英文叫 mechanism affection,然后下一阶段我们知道这个蛋白,比如说如何表达,然后我们可以在蛋白的口袋上才去可以设计这样的药物。
所以其实我们现在比如说那个大部分的 AI 制药公司,那个主要做的还是说在前人的一些肩膀上面,然后我们可以做下一步的药物研发,比如说根据这些可能已经发现了一些机制,然后有的时候是已经发现了这样的至少是蛋白或者口袋进行一些药物设计,它所使用的说非常需要大量规模的模拟。然后这样来比喻,如果不用那个计算机模拟的话,其实像解析一些难以成药靶点,它的那个代价是非常高的,一个是时间成本。另外一个是比如说我们拿GPCR来举个例子,就是我们虽然很有钱,然后花很多时间,比如说 50 万人民币的价格,大概要花 6 个月时间可以解析出来一个共晶的结构。
但往往这个共晶的结构其实在上市的CRO里面,没有几个公司可以做到。然后另外解析出来的时候,它其实因为这个蛋白表达非常难,表达纯化的时候,它也很难去解析出来真正具有成药性的这个构象。所以其实这也是为什么就是难以成药靶点难以攻克的一个主要的问题。然后计算机模拟带给我们的一些解决方案,说在这些过程之中,然后我们可以通过结合一些比如说冷冻电竞或者说计算模拟的方式,去潜在的找到一些具有成药性的结构。然后根据这些成药性的结构,也就说我们知道蛋白的结构之后,知道这个锁长什么样,知道锁孔长什么样,然后再去给这个锁孔配一些钥匙。这些钥匙可能是一些小分子或者是一些那个大分子或多肽的药物。
能不能先一方面先谈一谈这个 AI 跟新药筛选结合这个全球的一个玩家的一个情况。另外 AI 在这里面的话它是怎么起到作用的?
段宏亮
AI新药开发
AI技术
2022-12-08
关于应用那个 AI 来筛选新药或者是以前我们叫做用计算机来筛选新药,就是计算机辅助药物设计,其实这个概念已经是比较老的一个概念了,在国内其实都存在了20年以上,在国外可能是更加历史更加悠久的这样一个技术。那么现在的话我们用 AI 来筛选新药,新药很多可能就是源自于CADD的这个流派,然后加入了一些新的 AI 技术,这样子来发展过来的。所以像我们国外的玩家,最典型的就是薛定谔了。薛定谔是一家开发CADD软件或者叫AI软件的这样一家公司,它主要以售卖软件这样为主,当然也会做一些这种写自己的新药的一些管线还慢慢来进入。所以说 AI 筛选新药应该不算是一个特别新的行业。只是说我们现在又重新把这个热度给它提起来而已。我们能看得到国内包括是创业公司或者一些课题组,其实很多都是在以前一些 cadd 的老的这样一些科技组的基础上发展起来的。但是的话,其实那个AI 制药的话又不完全等同于 cadd 因为以前 CADD 的话,其实它主要通过这种超计算机完全基于算力的这样一些对小分子和那个蛋白药物的一些一种对接。那么这个地方的话,它一个是非常消耗算力。以前的话除了像上海药物所或者是一些比较知名的一些研究机构的话,它会能有这种超级计算机的存在,这种算力的存在才可以做这样一些任务。大部分的筛选。这是其一。
其二的话就是这一个方向的话。它的精度以前存在的一些那个不是特别的准确的这样一些疑虑。那么 AI 技术的引入的话。它在以前纯粹基于算力的基础上的话,做了革新,很多革新算法的引入导致以前非常消耗算力的一些环节的话,我们可以通过 AI 来实现,这样可以降低一些依赖,从而这个提高一些新药虚拟筛选的这样一个速度。
另外的话,这个新算法的引入的话也大的提高了这样一些以前一些精度不够高的一些问题。以前它的可能准确率命中率比较低,AI引入之后的话其实会大大的提高它这样一个准确率。
这样子就是通过 cadd 这样衍生出来的。那么其实是我们大家知道,其实 AI 是基于大数据的。那么其实除了基于 cadd 之外的,还有一个基于数据的一个新的这样技术流派出现的话,
包括跟那个高通量筛选或者是跟一些第一编码化合物库,这些可能是提供了一些大数据量的这样一些平台。比如说成都的先导这样一个 dell 技术的话,他们跟腾讯的有一些合作,包括国外的 Google 公司跟那个 xcam 的一些合作的话,他们是完全基于数据的,而不会基于算力的,基于传统CAD的这样一个东西的话,这样的话也是在那个我们 AI 制药的话,也是带来了一些比较新的这样一些东西。这两个技术的流派的话,其实可以是互相补充、互相协作存在的。就像那个我们华山派里边那个剑宗和气宗一样,其实都是可以独立发展,但是也可以互相协同,共同来把这个 AI 制药的这任务完善掉,最终有助于新药的一些发现。
你现在我们新冠药物用这种,大家因为很多东西都是不太明白,新冠药我们本来就是那个病毒出来之后我们是筛选药物,是不是可以用这种逻辑或者用什么样的方式用 AI 怎么去解决?
牛张明
AI新药开发
AI技术
2022-12-08
对,那个在新冠上面,像 AI 最早的时候是在做一些老药新用,以及说 drug repurposing 包括比如说辉瑞现在的还有之前比较出名的瑞德西韦,都是可能比如说作用在 mers 上、同一类的疾病上面。大家看已经上市的已经受到审批的这些药物,比如小分子或者说那个能不能用在新冠这上面。然后过了这个阶段以后,老药新用这个阶段以后。后来比如说现在有一些那个疫苗,有些小分子口服的其实还是作用在这个那个,比如说疫苗作用在突刺蛋白上,但我们小分子药物潜在的话就可以根本上解决,它核蛋白如果能破坏的话就可以。比如说破坏任何一种那个突变的这样的新冠。
然后在那个比如说国外的他们是在柳叶刀上面发了一篇那个类似的老药新用的文章。然后在早期的时候,然后我们团队之前在一些国外顶级会议上面也做了一些老药新用的一些案例。然后国内的应该是在研发一些那个小分子的药物,因为那个大家可能看到的像辉瑞这些他们的药报得比较早,因为这些做新冠的药物其实它也是风险很高的,尤其对小的初创公司。然后小的那个 AI 公司其实没有特别多的钱,弄新出来一个东西或者一个药物,或者以上问题,我都可以去全力地去解决这个新出来的,因为每家都是有自己的一个特点。然后新冠的这个比如说它变异的很快,其实还是需要业内的专家,尤其是对病毒学比较了解,还有对结构生物学比较了解的专家和相关的这样的好的企业,和 AI 公司一起去共同攻克。所以大概是这样的一个landscape。
推荐视频