Front Immunol:基于综合生物信息学和机器学习的狼疮性肾炎驱动基因鉴定

2024-01-07 从医路漫漫 MedSci原创

背狼疮肾炎(Lupus nephroritis, LN)是一种常见且严重的肾小球肾炎,常作为系统性红斑狼疮(SLE)的器官表现出现。然而,与LN相关的复杂病理机制阻碍了靶向治疗的进展。

系统性红斑狼疮(SLE)是一种由多种内源性抗原引发的复杂自身免疫性疾病。狼疮是一种由多种内源性抗原引发的复杂自身免疫性疾病(LN),是一种以狼疮为靶器官表现的严重免疫复杂性肾小球肾炎。它的特征是症状,包括血尿、蛋白尿和肾功能受损。LN通常出现在SLE诊断后的5年内,影响约50%的患者。尽管在了解LN的发病机制方面取得了进展,但治疗进展有限。肾衰竭的发生率仍然高得令人无法接受,大约三分之一的严重LN患者在10年内有发展为终末期肾病(ESRD)的风险。

在SLE患者中,免疫系统产生自身抗体和免疫复合物,并逐渐在肾小球内积累。这种积累引发炎症反应,导致肾小球损伤和功能障碍。肾小球常见的组织病理学异常包括免疫复合物沉积、系膜和内皮细胞增殖增加、炎症细胞浸润、细胞新月形形成和肾小球基底膜损伤。因此,肾小球在LN的发生和发展中起着至关重要的作用。

最近的研究提供了易感基因参与LN,破坏免疫耐受和促进疾病发展的见解。这些基因放大先天免疫信号通路,促进淋巴细胞活化,最终导致肾损伤。自身反应性白细胞、免疫复合物、补体蛋白和各种炎症介质也在LN的发展中发挥重要作用。了解LN的分子机制有助于开发更有效的治疗策略。免疫细胞的浸润在肾脏疾病的发生和发展中起着至关重要的作用。针对特定的免疫细胞群或操纵其功能可以减轻炎症,减少组织损伤,改善肾脏疾病患者的预后。

基因微阵列技术和高通量技术的出现使得生物信息学方法对于有效鉴定Deg至关重要。近年来,机器学习在解决生物医学领域的复杂问题方面得到了广泛的应用。机器学习在分析大型数据集和发现有价值的关系方面的能力使其成为阐明模式和提供解释的有效工具。将生物信息学分析与机器学习相结合为提高疾病诊断的准确性、可靠性和可预测性提供了潜在的机会。在这项研究中,我们利用生物信息学方法从GEO数据库中获得LN患者肾小球组织的基因表达矩阵。

我们进行了差异表达分析、富集分析,并使用加权基因共表达网络分析(WGCNA)研究了候选枢纽基因。采用LASSO回归和随机森林两种机器学习算法来识别与LN相关的枢纽基因。采用基于基因表达谱的CIBERSORT算法量化LN和正常对照的肾小球免疫浸润。

此外,我们还研究了中枢基因与免疫浸润以及LN的临床和病理特征之间的关系。这些中心基因的分布和表达模式也得到了鉴定。这些分析的主要目的是为LN的预防和治疗提供新的见解。

图1 本研究的流程图。

方法:我们分析了133例LN患者和51例正常人的肾小球组织,数据来自GEO数据库。鉴定差异表达基因(DEGs)并进行富集分析。采用加权基因共表达网络分析(WGCNA)识别关键基因模块。采用最小绝对收缩选择算子(LASSO)和随机森林方法鉴定轮毂基因。我们还使用CIBERSORT分析免疫细胞浸润。此外,我们还研究了枢纽基因与临床病理特征的关系,并检测了枢纽基因在肾脏中的分布和表达。

图2狼疮性肾炎中Deg的鉴定。(A)主成分分析(PCA)显示狼疮性肾炎患者和正常对照的样本分布。(B)热图显示在诊断为狼疮肾炎的个体和正常对照中具有最高标准偏差变化的前1000个基因。(C)火山显示狼疮肾炎与正常对照之间DEGs的表达。(D)条形图显示与正常对照相比,狼疮性肾炎患者的KEGG通路明显上调。(E)与正常对照相比,狼疮性肾炎患者GO表达上调(右)和下调(左)的棒棒糖图。

图3 基于WGCNA分析的候选枢纽基因鉴定。(A) WGCNA网络的软阈值功率(左)和平均连通性(右)。(B) WGCNA网络的聚类树状图。(C)点图显示了不同模块间最富集的反应组通路。(D)描述模块与临床特征,特别是狼疮肾炎和正常对照之间关系的热图。(E)狼疮性肾炎不同模块间基因意义的柱状图。(F)绿松石模组基因显著性(GS)与模组成员(MM)的散点图。(G)绿松石模块基因DEGs相交的维恩图。

图4 通过套索回归分析和随机森林分析鉴定最终枢纽基因。(A)训练组狼疮性肾炎相关中枢基因LASSO系数通径图。(B) LASSO回归交叉验证曲线。训练组采用10倍交叉验证确定最佳l值。(C)训练组随机森林模式的错误率置信区间。(D)在训练组内随机森林模型中基因的相对重要性的棒棒糖图。(E) LASSO与随机森林特征基因相交的维恩图。(F)训练组狼疮性肾炎患者与正常对照组相比,四个枢纽基因的表达水平。(G)训练组4个枢纽基因的ROC分析(H)验证组狼疮性肾炎患者4个枢纽基因与正常对照的表达水平。(1)验证组4个枢纽基因的ROC分析。

图5 狼疮性肾炎中枢基因的GSEA。(A)狼疮性肾炎中CD53的GSEA。(B) TGFBI在狼疮性肾炎中的GSEA。(C)狼疮性肾炎中MS4A6A的GSEA。(D)狼疮性肾炎中HERC6的GSEA。

免疫细胞浸润与中枢基因的关系。(A)狼疮性肾炎与正常人之间的免疫细胞浸润。(B)狼疮性肾炎中CD53与不同免疫细胞浸润的关系。(C) TGFBI与狼疮性肾炎不同免疫细胞浸润的关系。(D) MA4A6A与狼疮性肾炎不同免疫细胞浸润的关系。(E)狼疮性肾炎中HERC6与不同免疫细胞浸润的关系。** p < 0.01;*** p < 0.0001。

hub基因表达与病理分型、慢性肾病(CKD)分期及蛋白尿的关系(A)描述CD53表达水平与三个变量之间关系的散点图:病理分类(左)、CDK分期(中)和蛋白尿(右)。(B) TGFBI表达水平与病理分型(左)、CKD分期(中)、蛋白尿(右)三个变量关系的散点图。(C) MS4A6A表达水平与病理分型(左)、CKD分期(中)、蛋白尿(右)三个变量关系的散点图。(D) HERC6表达水平与病理分型(左)、CKD分期(中)、蛋白尿(右)三个变量关系的散点图。* p < 0.05;** p < 0.01。

基于单细胞RNA测序数据的枢纽基因分布与表达。(A) t-SNE图显示22个已识别的细胞簇。(B) CD53的分布和表达的特征图、柱状图和点图。(C) TGFBI的分布和表达的特征图、柱状图和点图。(D) MS4A6A的分布和表达的特征图、柱状图和点图。(E) HERC6的分布和表达的特征图、柱状图和点图。(F)显示枢纽基因组合表达分数的小提琴图。

结果:在LN中共鉴定出270个Deg。使用加权基因共表达网络分析(WGCNA),我们将这些基因聚类为14个模块。其中,绿松石模块与LN呈显著相关(cor=0.88, p<0.0001)。机器学习技术鉴定出CD53 (AUC=0.995)、TGFBI (AUC=0.997)、MS4A6A (AUC=0.994)和HERC6 (AUC=0.999)四个枢纽基因,它们参与炎症反应和免疫激活。CIBERSORT分析提示这些中枢基因可能参与免疫细胞浸润。此外,这些枢纽基因与LN的分类、肾功能和蛋白尿有很强的相关性。有趣的是,巨噬细胞中hub基因表达评分最高。

结论:CD53、TGFBI、MS4A6A和HERC6已成为LN的候选驱动基因。这些中心基因有潜力为LN的分子诊断和治疗提供有价值的见解。

原始出处:

Wang Z,  Hu D,  Pei G,Identification of driver genes in lupus nephritis based on comprehensive bioinformatics and machine learning.Front Immunol 2023;14

作者:从医路漫漫



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题

相关资讯

J Clin Rheumatol:生物制剂治疗狼疮性肾炎的疗效和安全性

系统性红斑狼疮(SLE)是一种多系统的结缔组织自身免疫性疾病,其特点是以核抗原为目标的自身抗体、缓解和发作,临床表现、病程和预后变化很大。

来氟米特与硫唑嘌呤在狼疮性肾炎维持治疗中的比较:多中心、随机对照研究

来氟米特是一种广泛用于类风湿性关节炎治疗的免疫抑制剂,在LN维持治疗中的疗效和安全性与硫唑嘌呤相当。

Arthritis Rheumatol:不同环磷酰胺(CYC)治疗方案治疗儿童发病型增殖性狼疮性肾炎(LN)的有效性比较

研究未能证明NIH方案相较于EuroLupus方案有益,但未来仍需要进行更多前瞻性的研究来进一步探讨这一主题