那为什么投资机构给你去投?你们的核心竞争力在哪里?你们的 AI 这一块到底独特性在哪里?能不能给大家介绍一下是不是AI公司也是有差异的?
牛张明
AI新药开发
AI技术
2022-12-08
我们也是比较新的公司,整个行业其实起步也比较早,投资机构,其实天使轮大家思路都比较简单,主要是看团队、技术、赛道,我们当时的团队除了我以外,还有一位剑桥大学医学院的副院长、他发现过16个靶点,也做过合成药物,另外一位是核心的联合创始人是原来国内一家头部药企的小分子药的研发负责人,做过6款药物上临床,其中有2款已经通过了三期要上市看,所以我们当时的核心的团队也非常互补,加上我在英国伦敦和德国柏林有过一些做算法拿过世界冠军的团队,还有包括我们被世界权威机构评选为过去2018年到2020年最具突破性的11个AI药物研发成就之一。另外的话,就是在欧盟创新药计划,在2020年拿到7200万欧元中的一千多万欧元,是我当时的那家公司,主要是针对新冠肺炎在全欧洲征集最好的解决方案。所以就是我们的AI技术和整个经验有些特异性,所以融资比较顺利。当然后续的融资,大家的起步可能都是差不多的,像后续的融资,比如说在A轮以后看一些比较深入的,比如说管线的进度、平台的进一步搭建和团队的进一步扩展。
 
然后我介绍一下我们公司的特点,就像段教授这边说的就是数据是非常重要的,这个我们也非常认同。还有一点就是其实我们觉得现阶段的话做一些特异性、有差异化的,而且现在市面上没有公开的算法是非常有必要的,这一点也是我们一直在不断去尝试和摸索的。然后包括国外的一些头部公司比如DeepMind等都是有一些市面上没有的一些算法,所以它们才可以走到头部,然后我们内部也是一直对科研创新还有产业转换都比较重视,所以其实在这方面是做的可能会比较好,然后再比如说过去一年多我们发过大概有六七篇10分影响因子以上的论文,其中包括1篇nature子刊,1篇Science子刊,所以这是我们公司的一个主要的思路,还是主要的是做一些原创性的一些技术。

我们现在如果对比这种传统的比如像AAV这块,比如说用 AI 来做解决了什么样的问题,这两者对比的一个情况。
韩蓝青
AI新药开发
AI技术
2022-12-08
我们这个用AI,它其中解决的一个问题是提高效率,提高找药的效率。那么基因治疗这个分病毒载体和非病毒载体,那么在病毒载体里面,这个腺相关病毒目前是最热门的,腺相关病毒它是可以作为一个非常好的送工具,但是大家在开发AAV腺相关病毒这个药物的时候,一个很大的问题就是AAV病毒的包装效率还有它的靶向性的问题。那么这个AAV衣壳蛋白它是一个递送工具,它是一个正二十面体的病毒,那么可以把你的想要递送的遗传物质 DNA 能够递送到你想把它送到的目的地,那你怎么去设计、筛选一个好的AAV,那么实际上这个衣壳蛋白在这里面是非常重要的,因为它这个衣壳蛋白它上面的这些结构是决定了它是不是能够和某一些特定的细胞、特定组织细胞的表面的载体、表面的这个受体能够结合以后能够进入到细胞内部。所以它传统的设计方法,这个有理性设计,非常有经验的人通过它的这个经验来进行一些改造。那么还有一种就是定向进化,这个定向进化实际上它就是在实验室里面模拟一个进化论的过程,那么我给它造成了一个非常多的突变体,那么我看这些不同的突变体在一定的进化压力下,使它能够筛选出一些你想要的一些特性,那么定向进化这个是在 2017 年,也是得了诺贝尔奖 Frances H.Arnold女科学家,她这个定向进化得诺贝尔奖,那么当然她当时的工作是这个主要是在去筛选工业煤这方面。但是就是同理,这个AAV的定向进化也是这个大家普遍在用的,一直到现在这个业内大家都在用这个方法。
 
好比说你看这个新冠病毒,新冠病毒像在印度这样一个人非常嘈杂,什么样的人都有,大家也不戴口罩,互相传染,在这样一个非常复杂的环境里面,这个病毒不断地进化。突然一下冒出来一个 delta 病毒一下子传染到全世界,这个后来南非又出了一个更厉害的病毒。那么这个病毒它实际上是在一个自然环境里面进化,那我们定向进化就是模拟这个进化的过程,而且要去加速这个过程,那 AI 在这里面起什么作用呢?就是这个过程实际上它还是太漫长了。你比如说我们做这个 AAV 的这个筛选的时候,那我们会去把它的一些高突变区去做成一个突变库,也说我把在这做个突变,那做个突变,把各种可能性的这种组合做成一个 library ,做成一个库,然后我在这里面去筛哪一些突变体是我想要的。
 
你比如是这个AAV上面有一个叫做三倍轴的一个地方有 28 个氨基酸,大家都去做这个 28 个氨基酸的突变。但是你想想每一个氨基酸有 20 种可能性,28个氨基酸就是 20 的 28 次方,就是 10 的 30 几次方,这是个天门数字,所以说你要是想去做一个饱和突变的话,你做这样的一个库是做不出来,那怎么办呢?我们能做出来的库大概可以做到 10 的 8 次方,甚至是做到 10 的 9 次方。那么我们就用一个合成的,用合成生物学、用合成的这种突变库来去做实验。达到大量的数据以后去训练我们的电脑神经网络这种模型,让它对于一个10的三十几次方的这么一个可能性空间形成一种认识,然后基于这种认识,我们再去在这里面去寻找一些局部的最优,那这些局部的最优很可能就是你想要的了,比如说我想要靶向这个神经,我不想让AAV去到肝脏,我希望它能够去到神经系统,那么我希望它的这个包装效率要高,我希望它的免疫原性要低,像这样的情况我们可以用 AI 来大大提高效率。那我们在实验室里面,我们把 AI 合成生物学,还有这个湿试验能够结合起来,用这个数据来训练神经网络以后,我们可以做非常高效率的AAV的预测和设计,这个工作已经有非常好的阶段性成果。

能不能把这个里面再更具体一点谈谈这个相关的那个、咱们现在比如说像变构抑制剂一个情况,就单单谈这个领域的,因为要结合这个场景。
牛张明
AI新药开发
AI技术
2022-12-08
别构抑制剂是一类比较特殊的,像解决药物小分子,比如说我只说小分子这一类那个产生药物的一种方式。然后它主要说结构这个词是其实英文翻译过来的,然后它对应的是一个正构抑制剂,比如说我们拿一个锁来比喻这个靶点,然后这个我们设计的这个蛋白就像一个锁一样,然后我们其实设计靶向药物的,说去找到这个锁孔的位置,然后再去给这个锁孔配一个合适的钥匙。但别构抑制剂,说正常的话我们在正构位点有一个钥匙,但是比如说别构抑制剂,它是一个锁,它在一个门的两侧,它可以通过正构的位点解决一个问题,但是有的时候通过另外一个锁孔,然后它如果进入到这个蛋白以后,对蛋白进行一个挤压,然后蛋白的结构进行变形,所以原来的正构位点其实会受到蛋白的别构位点的挤压,然后它就变成了另外一种样子,让正构的这个位点就是我们插进去这个锁,原来想插进去这个钥匙它发挥不出原来的作用,通过这样来解决问题,比如说比较出名的别构抑制剂比如SHP2、TYK2等等。

我原来我不用 AI 不行吗?我用 AI 解决了什么问题?原来像类似这两个方向,它是怎么样一个情况?
牛张明
AI新药开发
AI技术
2022-12-08
原来这两个方向都是以湿实验为主的,简单的说,然后现在 AI 这边可以通过包括 cadd 可以通过很多模拟的、我们所谓的干实验的手段,也就是说在因为其实湿实验的时间周期比较长,成本比较高,然后干实验可以通过大量的计算机模拟,就像 zero AlphaGo下围棋一样,所以可以很快的以更短暂的时间和更低廉的成本,然后得出一些比较可信的结果。所以我们现在的公司也主要是使用一些大量的计算模拟的手段,然后代替一些传统的实验,但是不是湿实验可以跳过,只是说我们在湿实验上面所花费的这样的周期和金钱会比起以往更少,以这样的方式来解决一些问题。比如说像我们在大家都知道 alphaFold 2 在做蛋白的一个模拟的时候,可以通过序列然后预测出蛋白的结构,传统的方式是需要使用冷冻电镜或者X-ray等非常高开销的东西来做,而且它做不到的一点就是说如果只有序列的话,其实是没有办法得到的,所以现在就是科技的进步,尤其 AI 和 CADD 的方向,让我们可以做很多以前做不到的事情,所以这也是我们公司所看好、还有所投入的。

你觉得这个数据跟算法哪个更重要,原因是什么?另外AI到底是什么情况?给大家稍微描绘一个故事。
段宏亮
AI新药开发
AI技术
2022-12-08
我先回答第二个问题,AI是什么东西?人工智能本身就是模仿人类,模仿人类是模仿什么呢,简单来说就是脑袋,模仿人的头、五官、眼睛、嘴巴、耳朵等等,那么和老百姓接触比较多的话就是人脸识别,高铁站要刷脸,要进站拿票,或者是我们支付宝现在也可以刷脸来支付,它其实这个人工智能的话就是来模仿我们人类眼睛,这是一个流派;另外一个流派是说模仿我们的嘴巴或者是耳朵,这样来说就跟我们一些语言文字,和语言处理比较相关的一些基础,就比如说像我们上市公司科大讯飞,它的话是做一些这种一些语言处理的,再有个比如说小爱音箱,智能音箱它也是模仿人的一个嘴巴或者是耳朵,这样的话,它这一个流派技术的话就是循环形容,这样一个技术流派。这样的话等于是我们人的五官尽量已经模仿掉一大部分了,这样的话就能够一定来模仿人员做一些人类能做的一些事情,这样电脑计算机也能做,这就是一个人工智能一个比较通俗的一个理解。
 
刚才说算法、算力、数据就是人工智能里边的三要素,就是算法、算力和数据这三个之间这个是一个孰重孰轻?应该说都非常非常之重要,那么具体到我们的人工智能企业或者是人工智能制药企业来说的话,我认为算力这一块的话,因为前几年一个云计算的一个出现,比如说我们国内的阿里云,腾讯云,随便想出一个服务器,想一个非常强大的服务器,都是可以通过租借互联网服务器来实现,像国外的亚马逊名做得更加早一些,因此算力这一块通常来说的话不是什么大问题,只要我们有钱,也就是我们 AI 制药公司的话的融资能力都非常非常的强,所以我们的算力总来说不会成为一个大的问题。那么在算法层面上的话,因为我刚刚说过,我们是模仿人的这种眼睛,模仿人的这个嘴巴和耳朵,其实相对而言,以 Google 为首的国外的一些互联网公司,比如Google , Facebook 包括微软等等,它们这一块其实做得都非常非常之好,另外互联网行业它有一个很好的精神,就是喜欢共享,它们有一个很好的算法的话,它会迅速把这个算法给大家公开出来,就是底层的算法,我们国内其实是可以充分的利用一些国外的这方面研发的优势,拿来主义的话,大家还要针对我们具体的一些场景的话做一些优化、一些改造,所以算法层面的话也没有什么太大的问题。
 
在 AI 制药里面的话,数据反而是一个比较大的一个问题。我们知道本身来说,我们通常来说就是一个新药研发大概需要 10 年的时间,需要花费 10 亿美金,就是这样子我们才拿到一个新药,在数据的角度上的话,只有一个新药数据,这个数据量是非常之可怜的。那就算我们的这个新药研发过程当中还会有一些涉及到一些先导化合物等等,所以这一个 project、 一个靶点的话,它的这数据量也不过是几百,它多了说是上千的这样一个级别,数据量非常小,至少还达不到我们所说的这样一个大数据概念。另外的话说算虽然这个数据非常之可怜,但是这些数据多数还掌握在大多数的制药公司手边,比如辉瑞 、GSK,它们公司它们自己内部的一些这种新药的数据的话,它们又不会拿出来跟我们共享,这是它们公司内部的一些这种这种商业的核心价值所在,所以它不会拿出来贡献。这样的话本来我们数据就不多,然后各个公司之间的话又各自为战,这样数据就显得非常非常的重要。所以可以简单点说如果说哪一个公司它能够解决的数据问题,这个 AI 制药问题可能就是迎刃而解,所以可能数据会成为一个很大的护城河,另外的话就是我们在那个传统的一些互联网公司的话,它们在创业的时候都会碰到这样一个问题,如果说阿里或者腾讯进入这样一个行业,那么你的那个护城河在哪里?
 
那么我们的算力都是它们的云计算提供的,我们的算法可能是互联网公司它们会有更好的一些积累,那么反而是我们医药行业出身的一些人,因为对医药的一些理解,或者我们常年积累的一些医药的数据,比如说像韩教授,它积累了很多基因方面这种数据,像牛总的话,它可能积累了一些难成药靶点数据,这些数据的阿里、腾讯它是拿不到的,或者它在短期里它是挤攒不起来的,或者它没有意识到这个难成药靶点是什么意思,所以这个东西的话可能就会成为我们 AI 制药公司或者初创公司的护城河,可以阻挡一些互联网巨头或者其它一些资本强势的一些新的玩家的一些进度,会成为一个比较好的一个护城河。所以如果说算法算力数据里面的话谁最重要的话,我觉得都很重要,当然数据可能会成为我们每个公司里面的一些独特的一些优势所在。