科学前言——等待蝶变:人类血浆蛋白质组项目(HPPP)研究进程

时间:2023-09-18来源:中国输血协会教育工作委员会作者:MIR医学仪器与试剂
  人类血浆蛋白质组 (The human plasma proteome) 在人类生物学 (Human biology) 和病理生理学 (Pathophysiology) 研究领域起着关键作用,并有望为精准疾病诊断和治疗监测创造一场颠覆性革命。 
  一方面,血浆蛋白是各种生物过程的重要“玩家”,参与生长、修复、信号传导、运输和抵御感染等关键生命活动。另一方面,血浆蛋白会随着疾病发生发展过程产生差异化调节。因此,系统而精确地认识正常生理/病理状态下血浆蛋白性质,将能有效推动疾病分子标志物和药物靶标的发现进程。
  国际人类蛋白质组组织 (Human Proteome Organization, HUPO) 首任主席Sam Hanash于2002年启动重点试点计划——人类血浆蛋白质组学项目 (Human Plasma Proteome Project, HPPP)。该项目由HUPO创始人之一Gilbert Omenn领头,来自13个国家的35家蛋白质组学实验室参与其中。
  HPPP项目为人类蛋白质组研究的“先行者”之一,因为HPPP是HUPO早期推动项目之一,更因为血浆蛋白无可替代的研究价值。首先,
  (1)血浆蛋白质组是人类蛋白质组中最复杂的一个类别,囊括了不同组织的亚蛋白质组;
  (2)血浆是主要的临床样本。与其他体液(如脑脊液、胃液、胆汁和滑膜液)相比,血浆也更容易获得及标准化;
  (3)血浆蛋白对疾病诊断和疗效监测具有重要意义。因为血浆蛋白会随着血液循环流经全身,因此可反映多种疾病问题。血浆亦成为发现临床诊断监测和判断药物反应蛋白生物标志物的潜在丰富来源。目前已有一些血浆及血清蛋白被确定为疾病的潜在生物标志物,包括心血管疾病、自身免疫性疾病、感染性疾病和神经系统疾病;
  (4)血浆蛋白与其相应的mRNA表达相关性不大,因此以蛋白质水平对其展开研究以作补充。 
  与此同时,基于上文所提到的血浆蛋白自身的复杂性,以及分离、分析技术和平台的多样性,HPPP项目确定了其初期研究目标:
  (1)比较蛋白质组分析技术平台的优点和局限性,如灵敏度和分析深度;
  (2)分析人类血浆/血清参考样本 (Reference specimens);
  (3)建立人类血浆蛋白质组知识库。
  随着质谱技术的进步与广泛应用,血浆蛋白组相关数据迅速涌现,但数据之间的可比性存在着较大问题。2003年,HPPP获得一批来自世界主要人种的样本:白种美国人(Caucasian-American)、非裔美国人(African-American),和亚裔美国人(Asian-American),并将它们制备成混合血浆和血清。
  与HPPP合作的35个实验室都得到了这批样本,但他们所应用技术平台和数据提取、分析方法各不相同,这导致数据结果间出现了很大差异。项目报告指出,该研究共检测出9504个不重复蛋白,每个实验室都能检测到这9504个蛋白质中的至少1个肽段。其中的3020个蛋白质能被检测出至少两个肽段,而能被检测出3个肽段的蛋白质数量为1500。由于数据间的可比性较差,研究人员于2006年对这份报告进行再分析,认为仅有889个蛋白质拥有高可靠性证据证实其存在。
  逐渐地,质谱技术向双“高”发展(高灵敏度和高准确度),蛋白质的量化鉴定规模也“水涨船高”。与早期血浆蛋白质组数据库相比,现在的二级质谱图具有高分辨率的特性,使样品分析的准确度大为提高,假阳性率大大降低。研究人员因此能够“看”得更“深”、更“多”——观察到更多的肽段,并提高了序列覆盖率。
  2005年,Eric  Deutsch(Moritz实验室首席科学家)与8个实验室应用液相色谱-串联质谱法对血浆/血清进行研究,并将实验结果映射到Ensembl人类基因组数据库 (Ensembl Genomes) 中。数据显示,共有6929个肽段被映射到960个蛋白质中。2011年,Terry Farrah(曾任职于系统生物学研究所)研究团队识别了1929个高可靠性蛋白质 (FDR为1%);2013年,共有3553个不重复蛋白质被成功鉴定。
  2015年,Hasmik Keshishian团队 (麻省理工Broad Institute蛋白质组学研究中心高级科学家) 以四位进行过心肌梗塞手术的肥厚型心肌病 (Hypertrophic cardiomyopathy, HCM) 患者的血浆为样本,应用iTRAQ技术和高分辨率的Q Exactive Plus Orbitrap仪器进行分析。他们成功将每个样品中的至少3400个蛋白质进行量化,部分样品中有5300个蛋白质被成功鉴定(FDR<0.02%)。2016年, 研究人员鉴定出3509个符合《HPP质谱数据注解指南2.1版本》标准 (HPP Guidelines for Mass Spectrometry Data Interpretation v2.1) 的血浆蛋白。
  另一方面,PeptideAtlas数据库(储存、记录不同物种肽段及蛋白质质谱数据)作为HPPP项目的一部分,自2004年开始持续收集全球实验室的质谱实验数据。通过对原始数据进行分析处理,最终整理为标准统一的多肽汇编,并向全球科研人员公开。不仅如此,人类血浆多肽图谱 (Human Plasma PeptideAtlas) 也从2005年开始,随着血浆蛋白质组数据的增长变化,更新公开高严格性的血浆蛋白快照 (Snapshot)。人类血浆肽段图谱的最新数据 (Human Plasma PeptideAtlas 2021-07) 显示,研究人员从240个基于质谱分析的实验中鉴定出4395个标准蛋白质 (Canonical proteins)。
  2021年, Eric Deutsch等科学家就人类血浆蛋白质组的进展及应用领域发表文章Advances and Utility of the Human Plasma Proteome。文章指出,血浆蛋白质组学的研究与相关应用必然在精准医疗方面发挥越来越大的作用,目前已为新冠感染、衰老和止血 (Hemostasis) 三大热门研究板块带来更多的研究思路。
  血浆蛋白质组的研究无疑会给生命科学领域带来颠覆性的进展。然而我们也不难看出,近20年中人类血浆蛋白质的识别鉴定速度和数量仍很受阻。
  尽管当前的蛋白质组学技术和分析方法都有了长足的进步,如自动化高通量分离、鉴定技术及平台的相继出现,但其仍无法与血浆蛋白的高度复杂性相匹配。这使得科学家们所测得的数据精度不够,无法揭示深层的信息,更难以用于临床诊断与治疗监测上。 
  同样的,尽管HPPP项目研究进程并不那么理想,但我们仍可以乐观地预测,其将在不久的未来,帮助研究人员和临床医生精确地描绘出疾病治疗、监测的问答全景图。

声明:本平台所发布资讯,如非特别注明,均来源于互联网的公开信息,仅做了少量修改,版权归属于著作权人。本平台所发布的咨询均用于免费的交流与学习,非商业用途。我们尊重著作权人的合法权益,如著作权人对本平台发布的内容有异议或涉及权利纠纷,请及时与我们联系,谢谢。