注册忘记密码

777老虎机

查看: 196|回复: 0

人工智能+蛋白质组学:药物研发的生物学底层变革(上)

[复制链接]

6万

主题

6

回帖

18万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
183235
发表于 2023-8-17 07:20:53 | 显示全部楼层 |阅读模式
整体看来,药物研发的体系,构建于生物学原理与规律的基础之上。生物学的进步,可以在深度与广度上全面影响药物研发的所有领域。


那么人工智能对蛋白质组学认知的进步,会从哪些方面影响和改变药物研发呢?


为什么药物会脱靶?为什么药物会有重定向?药物临床试验的结果可以预测吗?药物临床试验为什么会失败?


本文作者西湖大学蛋白质组学大数据实验室负责人郭天南教授,长期从事蛋白质组学相关研究,并将其应用于临床样本的大队列(包括甲状腺癌、前列腺癌等),结合人工智能探索生物标志物,在国际上率先提出将蛋白质组大数据和人工智能相结合的研究策略。本文将分为上、中、下三篇,从蛋白质组大数据与人工智能的角度对上述问题进行阐述。


1
蛋白质是生命的基础,然而核心奥秘远未解开
一切生命的表现形式,本质上都是蛋白质功能的体现。如果我们能够了解细胞、组织乃至整个生命体内蛋白质的组成及其活动规律,透彻地理解不同组织器官在不同生理病理状态下蛋白质组的构成和动态变化,就会对疾病的发生、发展、转归等过程有一个全面的认识,把握疾病诊治的关键,提高药物开发的效率。


事实上,蛋白质研究的巨大价值,早在20年前就被高度关注。在人类基因组计划完成后,有科学家在《Science》杂志兴奋地预言,蛋白质组学将很快取代基因组学成为生命科学研究的焦点。《Nature》杂志的专刊则在显著版面报道了人类蛋白质组学组织(HUPO)的成立,并宣告生命科学正式进入蛋白质组学时代。可以说,蛋白质组学在诞生之初,在科学界光环熠熠,工业界也对之热情洋溢。然而20年后的今天,与基因组学相比,蛋白质组学的科学研究进展和市场化水平却远远落后。总体来看,蛋白质组学研究目前并未像基因组学那样,在科学研究产生巨大的学术价值,在经济领域形成一个高度规模化的基因产业;相反,其在疾病诊疗和药物开发等领域产生的影响非常有限。因此,蛋白质组学甚至常常被人遗忘。


2

传统的蛋白质组学研究的技术和方法,不适合复杂的蛋白质系统
有人说,“生”在基因组,“命”在蛋白质组。蛋白质组研究对于生命科学的价值是毋庸置疑的。


蛋白质组学发展如此滞后的原因是什么呢?很大程度上是因为蛋白质组学研究面临巨大的技术挑战:传统的蛋白质组学分析技术和方法,并不完全适合用来研究蛋白质系统。


蛋白质系统本身是非常复杂的。人体的一个细胞当中,就包含有数万个蛋白质。这些蛋白质可以运输到不同的地方(如细胞膜、细胞核、线粒体、内质网等),可以相互形成复合物,可以不停地生成和降解,还可以发生翻译后修饰(如磷酸化、乙酰化修饰等)。



人工智能+蛋白质组学:药物研发的生物学底层变革(上)-1.jpg

一个细胞内所有蛋白质的集合称为蛋白质组



因此,与基因组相比,对复杂的、动态的蛋白质系统的研究更为复杂和艰巨。一个人从出生到死亡,绝大多数情况下,基因都是不变的,这也是基因可以用于身份鉴定的原因。但是蛋白质组学则不同,在不同的健康状态下,人体内的蛋白质每时每刻都在发生变化。


那么,对于蛋白质组这样的复杂系统的研究,目前的技术方法是什么样的呢?这就要说到传统的蛋白质组学分析技术和方法的局限性。具体有二:


其一,在研究思路上,传统蛋白质组学是盲人摸象。现代生命科学与医学研究,很多时候使用Western Blot、ELISA等基于抗体的方法,来测量几个或者是几十个蛋白质(一般不会超过100个)。在测量对象的选择上,研究者一般只选择自己认为重要的、感兴趣的蛋白质。这种研究的主如何保养眼部皮肤性极易带来研究方向、结果的片面性。比如,一个药物进入细胞后,可能会作用于许多蛋白质,但研究者可能仅仅测量细胞内数万个蛋白质当中的几十个,然后分析数据、得出结论、发表论文。而事实上,除了这几十个蛋白质之外,是否还有其他与该药物相关性更强的蛋白质,它们如何相互作用的等等,均无从得知。


其二,在统计方法上,传统的蛋白质组学研究分析方法很难用来理解整个系统。蛋白质系统的复杂程度远远超出我们的一般认知。当我们通过抗体检测,用Western测量10个蛋白质的时候,仅仅通过条带的粗细,肉眼就可以判断蛋白质的表达丰度。但是如果想动态地监测不同时间范围内的几千甚至上万个蛋白质的变化情况,我们就很难用肉眼去如何保养眼部皮肤察并得出有效的实验结果。此外,对这些数以千计的蛋白,也很难为它们都找到一一对应的抗体来进行鉴定。


不能直接用肉眼如何保养眼部皮肤察,那应该怎么样去获得有效数据呢?之前研究者使用统计分析的方法,但之后发现这种方法具有极大的局限性。因为传统的统计分析方法只能考虑到研究者已经预设好的影响因素。此外,还有大量的研究者认知范围之外的变量,它们是客如何保养眼部皮肤存在的。而对于这些认知范围之外的因素,如果没有很好的定量方法和分析方法去认识,就很难真正清晰地理解整个生物系统。因此,蛋白质组学的研究,必须找到能够匹配这种复杂系统的分析技术和方法。(本文由智药邦侯小龙整理)


文|郭天南

来源|中国食品药品网
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表