根据公开资料里面,您那边是可以用一些算法做核酸的,那在核酸领域算法预测和湿实验相比,已经走到什么程度了?面临的挑战是什么?

RNAmRNA
王波 2023-11-22
分享
吴立刚
112
现在我们主要现在做mRNA比较多,小RNA我主要还是在实验室做得比较多一点。
 
mRNA因为它分子比较长,而且编码不同的基因,它的序列都有比较大的差异,天然的其实它的表达并不好,我们看来天然的和优化的比起来,光序列优化这一件事情就有5到 10倍的差别。而以前都是基于热力学的RNA折叠的算法,热力学RNA结构算法其实是经历了很多年,但也是相当不完善,因为RNA不像蛋白质有比较固定的结构,RNA的结构预测由于它的数据本身就非常的少,真正解过结构的RNA没有几个,所以机器学习本身能够学习的就比较少,现在的结构预测基本上还是基于二级结构往三级结构的推测,第二个,它的序列本身不像蛋白质,它的预测在算法上其实效率不是很高,而且计算量非常的庞大,因为同一个a,平均4个碱基就会出现一个u,它可以在这边配,也能在那边配对,但实际上真实世界的RNA,我们在研究中发现它又不是一个绝对的热力学最稳定的东西。
 
以现在的算力来说,我们感觉是远远不够的。我们已经用了比较大型的计算服务器,经常算一个结构,要一周的时间。我们觉得从理论上来说,以现在的算力还是不可能穷举所有的结构。第二个就是哪一种结构是最优的?其实即使给你了,你也不知道它是最优的,但是我们现在能做到的就是在次优解里面也许有100个,我们能从中间挑到100个里面相对比较好的次优解用于制药。
 
实际上核酸药物前期研发的费用比小分子要高的多,没办法高通量筛选,所以通过这个算法能够尽可能地减少湿实验的程度。第二,我能找到尽可能优的解,能够在目前的应用场景下它足够好。
 
我们主要还是把基础研究的理念运结合到现在生信分析方法,然后再在湿实验上,这个过程是个滚动的过程,我们不断地去测试,那我可以把这个结果反过来训练我的机器学习程序,通过一段时间的滚动,你的预测就会越来越好,这个领域大家也在想一些新的方法。第二个在实验方法上,现在也有很多人在想能把高级结构更多地解出来,包括用一些化学加上二代测序、深度测序、三代测序的方法,能更好地解析它的高级结构,用一些实验证据来预测它的高级结构,再和生物学功能联系起来使用。
评论(0
登录后参与评论
    相关问答