对于刚才提到那个未成药靶点痛点什么解决方案能不能再具体稍微展开一下?通过这个如果我们对这个未成药的这个因为你刚才也提到很多是蛋白的一个结构,一会有要么没有,要么你这个我结合上蛋白又发生变化了,然后多种多样的。那对于这个从你们在数据构建那个算法上的一些问题有哪些更多的经验能分享的给大家总聊一聊。好吧。

医药靶点疾病靶点
王波 2022-12-13
分享
李成涛
32
对好,谢谢。对,这个还是一个挺有意思的这个问题,也是我们最近确实是一直在探索的,就是 again 就是难成药靶点这个其实是像裴老师这边说的,就是说他有巨大的这个商业价值,也有很大的这个社会价值。但同时确实是很少有这个 validation 然后可以去做它数据类数据来讲的话,相对来讲也比较少。那数据少这个问题其实刚才我也讲过,就是可能用多模态或者是 transfer learning ,就是迁移学习或者元学习这种方式我可以在一定程度上解决。那另外一套方式其实就是,更多的去带入到一些第一性原理的这种方式,我们可以去有一整套新的方法论可以去做。那比如说就刚才讲到了这个没有结构的这样一个靶点,这个其实是我们自己内部的一个真实的项目。
那这个没有结构靶点的话,首先是我们可能用一些方式我们去做一些这个结构的预测。那可能现在已经有现成的像 alpha fold 2或者是RoseTTAFold这边的话,其实已经可以给我们一些初步的这样一个蛋白质三维结构了。但是光有这大 V 这三维结构的话其实是不够的,我们还需要进一步的去刚才讲到了这个 complex ,这个比如说怎么样去根据目前的这个三维结构,以及它比如蛋白表面的一些特征的这个信息,我提取出来之后,我能进一步的预测,比如说哪一块可能会成为我的这binding pocket,可能会成为了这个结合口袋,然后以及这个结合口袋我找到了之后我做这个 global docking,我找到了之后,我怎么样用这个小分子给结合进去,然后有一个比较好的这样binding pose而且实质上它在物理上面也是 visible 的,这个其实还是一个挺困难的这个问题。那我们最近刚才讲了这个 T bind 其实在一定程度上解决这个问题,就是现在我就可以直接去预测到现在一个单靶点蛋白质这边它的这个 context大概是什么样?那么在下一步的话其实就是 OK 我现在已经知道一个虚拟的这样一个 context 是什么。
那我现在就是根据刚才大家提到比如说一些分子设计、分子生成、分子优化的这些算法,然后我可以找到一些更多的这种分子,然后使得这个分子能够跟现在在这样一个binding pose下面的话跟我的蛋白的话更加契合。那在这边的话其实我们有一整套自己的这个完善的程序叫HSH,这个主要是我们收集了很多不同的专家这边做的优化分子设计这边的这个经验。因为刚才其实包括裴老师,徐老师这边也都提到了,就是其实专家经验这边是很重要的。那尤其是在化学这边,我给我一个分子之后,我怎么样去涉及到更好的这个分子?它其实是有一些经验和方法论是可以总结出来的。
比如说现在我遇到这种情况,我有哪些集团,我可以换成另外一些集团,或者是比如说一些这个常见的 Python 比如说开环闭环或者加环减环这种,这种的话,其实都是可以通过我们不断的去积累数据,然后比较通用的这样一些roll,然后把这些roll再丢到我们的这个 AI 模型里面,它能产生特别大量的这个分子。而这些大量分子一方面的话它是符合药化学家这边做AI ,做这个药物发现或者药物优化、分子优化的这样一个直觉的。但同时的话在一定程度上他可以跳出他原本的这样舒适圈,就是他可能因为有太多的可能性了,他可能没有办法完全想到。那这个时候的话我们可以帮他去想到更多更广阔的化学空间,是专家这边没有想到或者没有意识到的。而这更大的化妆空间,然后再结合上我们自己的这个 context 的结构,我就可以做基于结构的这样一个筛选的这样工作。那这个东西做好了之后的话,我就可以继续往下去推,比如说这个怎么样去优化或者怎么样。
对,所以这个其实是一整套的这个方法论。当然就是说这个前提是什么前提就是说,我基于结构的这样一个预测或者筛选的这个方式是 work 的。那这种情况下,一种是我刚才讲用 AI 的这个方式,我可以用 multitasking 或 whatever这种多模态学习这个方式我可以去解决。那另外一种方式其实就是基于第一性原理,比如说我们自己也有这种自己产生的这个立场和 FP的这个系统,我们也可以用一些商用的系统,薛定谔这边 FP plus 这边的话,其实都是可以去作为一个我们产生数据和做一个预测的这样一个方式的。
对,所以这块其实是一个这样,不管是就比如数据多还是少,他这个 AI 模型好还是不好,我们这个第一性原理的这个模型的话是可以作为一个保底的。那接下来的话其实就是一个传统的这样一个过程。就是我去合成,然后检测拿到更多的这个数据之后的话,我可以去进一步去 refine 我自己的,不管是我的立场也好,还是我的这个 AI 模型也好。那在这个有了更好的模型之后,我再去设计更好的分子,然后再用更好的模型去筛选出来更好的分子,然后再去合成和检测。这样整个循环的话,整个 AI 的模型或者是传统的这个计算化学的模型,它其实会越迭代越好。对,所以这个是这样一个流程。

评论(0
登录后参与评论
    相关问答