Nat Commun:刘小龙/刘景丰/吴李鸣团队开发基于血清蛋白质组学的无创筛查新方法,助力肝细胞癌早期诊断
2024-01-19 测序中国 测序中国
该研究通过整合血清蛋白质组学和机器学习方法对1002名个体进行研究,以探索用于HCC早期诊断的血清蛋白质生物标志物。
肝细胞癌(HCC)是肝癌的主要组织学亚型,约占原发性肝癌的90%,也是全世界癌症相关死亡率的第三大常见原因,其主要风险因素是由肝炎病毒和代谢性疾病引起的慢性肝硬化。由于缺乏早期症状,大多数HCC患者通常在晚期临床阶段被诊断出,预后效果不佳。目前HCC诊断策略包括影像学检查、血清蛋白生物标志物 (AFP、PIVKA-II)和组织病理学等,但因经验限制、敏感度受限或采用侵入性检测方式,这些方法难以准确诊断早期HCC。
血清和血浆是肝脏症状患者的常规采集物,能反映肝功能的变化,是液体活检的理想选择,也是生物标志物开发的主要研究对象。目前,基于质谱(MS)的蛋白质组学方法极大地提高了血清和血浆蛋白的深度和广度,是发现生物标志物的理想工具,如DDA(数据依赖采集模式)-MS、DIA(数据非依赖采集模式)-MS等。特别地,已有科研人员使用 DIA+PRM(平行反应监测)工作流程进行了一系列具有生物学意义的蛋白质组学研究。但DIA+PRM方法当前仅应用于非常小的临床队列,缺乏大型临床队列的筛选和验证研究。
近期,福建医科大学刘小龙、刘景丰及浙江大学吴李鸣研究团队合作在Nature Communications上发表了题为“Proteomics-driven noninvasive screening of circulating serum protein panels for the early diagnosis of hepatocellular carcinoma”的文章。该研究通过整合血清蛋白质组学和机器学习方法对1002名个体进行研究,以探索用于HCC早期诊断的血清蛋白质生物标志物;并通过学习机器开发了 P4 panel(HABP2、CD163、AFP和PIVKA-II),可准确区分HCC、肝硬化(LC)和健康个体(HC),并能够在影像学检查前11.4个月(中位时间)预测 LC 到 HCC 的转化,优于现有的临床预测策略。这些结果表明,基于蛋白质组学的血清生物标志物发现为液体活检提供了有价值的参考,并具有改善HCC早期诊断的巨大潜力。
文章发表于Nature Communications
血清样本的蛋白质组学特征
为系统地识别和验证血清中潜在、可用于HCC诊断的无创蛋白质生物标志物,研究团队进行了一项分阶段基于MS的蛋白质组学发现-验证-确认工作流程(图1)。该研究纳入320名个体组成发现队列,并对其进行DIA-MS定量蛋白质组学分析,其中包括163名HCC患者、53名LC和64名基础肝病(BLD)个体以及40名慢性无症状乙型肝炎病毒携带者(AsC)。验证队列包括独立回顾性验证队列(n=429)以及独立前瞻性验证队列(n=253)。随后,研究团队利用基于PRM的靶向蛋白质组学对候选生物标志物进行定量分析,并开发了用于早期诊断的生物标志物panel,以预测肝癌风险。
图1. 生物标志物模型开发的总体实验设计。
研究团队首先使用高通量DIA-MS蛋白质组学策略对收集的血清样本进行蛋白质组谱分析(图2)。为最大化蛋白质组的深度和覆盖范围,研究团队生成了一个混合谱库,包括来自DDA的128个混合血清样本和来自DIA的320个个体血清样本,涵盖875种蛋白质。
利用该谱库,研究团队通过DIA-MS分析检测到451种可定量的蛋白质(51.5%)。平均而言,在单次运行中分别定量每组血清样品中300个(AsC)、278个(BLD)、289个(LC)和304个(HCC)蛋白;血清蛋白强度的定量跨越六个数量级,前十个最丰富的蛋白质约占血清蛋白质组信号的 80%。
图2. 发现队列的血清蛋白MS分析。
与HCC相关的蛋白质差异丰度和功能改变
为筛选有意义的HCC诊断生物标志物,研究团队排除了201种免疫球蛋白。在HCC/AsC、HCC/BLD、HCC/LC的比较中,共有17种上调和17种下调的蛋白质存在差异,这些蛋白的表达谱明显显示出组间差异,并与疾病严重程度相关,其中HCC组差异最为显著(图3)。失调的蛋白质主要富集在免疫和炎症的生物过程中,以及与启动多种受体和涉及肿瘤发生发展的多种酶活性相关的分子功能中。
通路富集分析显示,这些蛋白质主要与互补和凝血级联、NOD样受体信号通路、NF-kappaB信号通路和Toll样受体信号通路等相关,表明HCC可能通过调节多种与免疫、炎症相关的受体或通路促进自身发展。
图3.与 HCC相关的差异丰度蛋白质和功能改变。
使用基于PRM的靶向MS验证候选血清生物标志物
基于发现研究中揭示的HCC相关蛋白质组学和功能变化,研究团队通过学习向量量化(LVQ)模型评估了34个与HCC相关的差异丰度蛋白质的诊断性能,筛选出了15个准确率较高的蛋白质;通过进一步分析,筛选出11个具有独特肽段和在HCC中异常丰度的候选生物标志物。
接下来,研究团队验证了候选生物标志物的真实性,发现有5种蛋白质能够在轻、重标记匹配的三对以上离子中定量,且在HCC中的定量具有统计学意义,因此这5五种蛋白质以不同的组合方式被用于构建HCC诊断模型。
图4.利用PRM靶向蛋白质组学筛选和验证候选血清生物标志物。
基于机器学习的HCC诊断模型
为筛选出最适用于HCC诊断的panel,研究团队利用PRM定量数据,构建了一个随机森林预测模型,并在验证集中比较了5种潜在生物标志物不同组合的AUC(图5)。结果显示,HABP2和CD163组合在区分HCC与LC、HCC与HC群体方面具有很高的性能,灵敏度分别为0.838、0.875,特异性分别为0.872、0.907。
鉴于HABP2 + CD163与AFP和PIVKA-II的互补性,研究团队构建了基于HABP2、CD163、AFP和PIVKA-II的4种蛋白质的HCC诊断panel(P4 panel)。与AFP、PIVKA-II及其组合相比,P4 panel对HCC患者的诊断效果显著提高,其AUC、敏感性和特异性在所有组合中均最高。此外,在独立验证队列中,P4 panel能准确区分HCC与LC、HC ,灵敏度分别为0.925、0.975,特异性为0.915、1.000,表明P4 panel在HCC患者早期诊断中具有较好的预测作用。
图5. P4 panel在验证队列中的诊断性能。
P4 panel可准确预测LC向HCC的转化
研究团队在独立前瞻性外部验证队列中,进一步评估了P4 panel性能,并将其与其他常用方法进行了比较(图6)。结果显示,P4 panel能够准确预测超90%后续发展为HCC的LC患者,灵敏度为0.909、特异性为0.877,与影像学诊断完全一致,甚至比影像学诊断早 3.6-20.1 个月(中位时间11.4个月)。与AFP、PIVKA-II、AFP+PIVKA-II、ASAP模型和aMAP相比,P4 panel诊断性能更佳。上述结果表明,与传统的蛋白质生物标志物或其他基于评分的模型相比,P4 panel有希望成为LC患者转化为HCC的有效预测工具,为早期诊断和治疗提供了突破性的可能性。
图6. P4 panel在前瞻性验证队列中预测HCC高风险人群的性能。
综上所述,通过筛选和验证一系列血清蛋白质,该研究提出了一种有效的基于MS的蛋白质组学工作流程,并通过机器学习开发了一个生物标志物panel用于HCC患者的诊断。经评估,与现有临床方法相比,该panel更准确地区分HCC与LC、HC,能更早地预测LC向HCC的转化,可为HCC的早期诊断提供有用的参考。
参考文献:
Xing X, Cai L, Ouyang J, et al. Proteomics-driven noninvasive screening of circulating serum protein panels for the early diagnosis of hepatocellular carcinoma. Nat Commun. 2023;14(1):8392. Published 2023 Dec 18. doi:10.1038/s41467-023-44255-2
作者:测序中国
版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#肝细胞癌# #生物标志物# #血清蛋白质组学#
30