你们AI是怎样预测蛋白结构?AI的价值是基于已知靶蛋白的解析结构,进行优化设计?还是不知道靶蛋白结构做预测、优化、设计?

AI创新蛋白靶点AI辅助
王波 2023-04-28
分享
常珊
157
我觉得其实AI能解决的阶段主要还是在药物发现的早期阶段,其实就是相应的苗头分子发现,苗头分子的发现,比如我们通过AI的方式,假设我们不知道这个靶点蛋白的三维结构,你可以去预测它的三维结构,那么预测出来的三维结构,再去筛选它的苗头分子,这样当然是可以的,但这样准不准确是要打一个问号的。因为现在这个结构预测做到95%的成功率,那还有5%可能不一定特别成功。
 
举个例子,AlphaFold做得非常好,但是它也不是在所有的蛋白上都做得非常好,比如对于有些蛋白它可能是没有特别多的模板或者没有特别多的进化信息的,我们叫孤儿蛋白,那孤儿蛋白的预测可能就不是很好。那么现在我们考虑除了AlphaFold以外,我们能不能用大语言模型等等新的方法,就是不借助于它原有的模板或者不借助于它MSA的信息去预测它的三维结构,这也是一些尝试。
 
换句话说,AI发展得很好,但是AI有很多的知识是通过已有的结构或者已有的信息得到的。那么对于未知的或者信息特别少的蛋白,其实AI也是极有可能犯错的。AlphaFold可以把我们现在已知所有序列的蛋白都能预测出来,但是这里面预测的很多蛋白,如果你让结构生物学家一看,他就说这是错的,因为他有很多的地方可能确实还没有到各个蛋白都能预测的准确的程度。
 
所以对于我们做药物设计的时候,我们更倾向于这个靶蛋白的结构最好是能够有解析的。如果靶蛋白没有相应的解析结构,我们是可以预测的,但是预测的结构毕竟不是真正解析出来的结构,所以如果真正对于药物筛选,如果有解析的结构,那么最好还是根据实验结构去做预测会好一些。
 
我们真正在AI降本增效的方式,在小分子这端,我们可以做更多的设计或者做更多的筛选,让我们找到的苗头化合物在后续优化中,可以做更少的优化,做更少的实验,最好是一步到位,比如我们现在做PROTAC设计的时候,我们差不多都可以做到一步到位,一步到位以后我们再去做实验,相应的成本就会低一些,这是我们期望达到的效果。

评论(0
登录后参与评论
    相关问答