单细胞测序与GWAS整合分析工具:sc-linker可识别疾病关键细胞类型和细胞过程
2022-11-10 测序中国 测序中国
全基因组关联研究(GWAS)已成功识别出数千种与疾病相关的变异,其中约95%的风险变异位于非编码调控区域。但这些变异驱动的复杂疾病和性状的细胞机制在很大程度上仍然未知。
全基因组关联研究(GWAS)已成功识别出数千种与疾病相关的变异,其中约95%的风险变异位于非编码调控区域。但这些变异驱动的复杂疾病和性状的细胞机制在很大程度上仍然未知。
单细胞RNA测序(scRNA-seq)为解决上述难题提供了机会。单细胞图谱能够将GWAS变异与功能更精细地关联起来,包括反映细胞类型特异性特征的程序、细胞类型中疾病依赖性特征的程序以及在细胞类型内和跨细胞类型变化的关键细胞过程。但疾病往往涉及多种组织类型,只关注单一组织很可能得出误导性的结论。因此,需要一种将人类遗传学和综合scRNA-seq相结合、能够应用于多个组织和器官的方法。
近日,麻省理工学院和哈佛博德研究所的研究团队合作在Nature Genetics上发表题为“Identifying disease-critical cell types and cellular processes by integrating single-cell RNA-sequencing and human genetics”的文章,研究团队开发并应用了“sc-linker”。sc-linker是一个整合scRNA-seq、表观基因组单核苷酸多态性(SNP)-基因图谱和GWAS统计数据的计算框架,能够识别遗传变异影响疾病的潜在细胞类型和过程。
文章发表在Nature Genetics
综合框架sc-linker将来自scRNA-seq的基因程序与疾病和复杂性状联系起来(图1)。研究人员利用sc-linker分析了人类scRNA-seq数据,包括来自6种疾病(包括多发性硬化症、阿尔茨海默病、溃疡性结肠炎等)11种组织的17个数据库,包含209名个体、1,602,614个细胞和256个注释的细胞亚群,构建了能够描述细胞类型和细胞过程的基因程序。随后,使用组织特异性增强子-基因链接将基因程序转换为SNP注释,通过baseline-LD模型对生成的SNP注释进行分层连锁不平衡回归分析(S-LDSC),将SNP注释与疾病相关联。
目前,研究团队已经发布了开源软件(sc-linke)、一个可视化结果的web界面(数据可用性)和该研究中分析的scRNA-seq数据、基因程序、增强子-基因链接策略以及SNP注释的后处理。
图1. sc-linke框架流程。
通过分析与特定免疫细胞类型生物学对应的5种血细胞特性,研究团队使用从scRNA-seq数据中构建的6个免疫细胞类型程序(两个来自外周血单个核细胞;脐带血和骨髓各一个)对sc-linke进行基准测试(图2)。结果显示,在灵敏度、特异性方面,sc-linker表现优于现有基因集富集方法(如MAGMA)。
图2. 将免疫细胞类型和细胞过程与免疫相关疾病和血细胞特征联系起来。
研究团队检测了多发性硬化症(MS)和阿尔茨海默病(AD)中的疾病依赖性程序,其中神经元和免疫细胞之间的异常相互作用被认为起着重要作用。研究团队分析了MS、AD的GWAS数据,以及来自健康个体和MS、AD患者大脑scRNA-seq的细胞类型、疾病依赖性和细胞过程程序。(图3)
结果显示,在MS和AD中,每种细胞类型中的疾病相关程序与仅从健康或疾病样本中构建的细胞类型程序都存在较大差异。MS中,疾病依赖程序显著富集于GABA氨基丁酸神经元和小胶质细胞,前者在氢离子跨膜转运蛋白活性基因中富集,后者在MERTK和TREM2等主要驱动基因中富集。AD中,所有关联都显示小胶质细胞起到核心作用。图3. 将MS和AD疾病依赖的细胞过程程序与MS和AD相关联。
接下来,研究团队分析了细胞类型、疾病依赖性和细胞过程程序在溃疡性结肠炎(UC)中的作用,分析了UC和炎症性肠病(IBD)的GWAS数据(图4)。结肠增强子-基因链接显示出最强的富集结果;最显著的改变在内皮细胞,涉及肿瘤坏死因子-α信号途径相关基因。此外,与MS和AD中一致,UC疾病依赖程序在每个细胞类型中与相应的健康或疾病结肠细胞类型的程序也存在显著差异,肠细胞和M细胞(健康结肠中一种罕见细胞类型)存在疾病依赖细胞程序。
图4. UC疾病依赖性和细胞过程程序与UC和IBD的连接。
此外,研究团队还分析了哮喘、特发性肺纤维化(IPF)、COVID-19和健康(肺下叶)组织scRNA-seq的健康细胞类型、疾病依赖和细胞过程程序,以及哮喘、IPF、COVID-19和肺活量的GWAS数据(图5)。结果显示,对于哮喘,T细胞中健康细胞类型和疾病依赖程序显著富集;对于肺活量,成纤维细胞中健康细胞、疾病依赖程序和MAPK细胞过程程序显著富集。图5. 将哮喘疾病依赖和细胞过程程序与哮喘和肺活量联系起来。
综上所述,研究团队开发一个集成框架sc-linker,通过整合来自多种组织类型、疾病、个体和细胞的GWAS总结统计数据、表观基因组学和scRNA-seq数据,将人类疾病和复杂性状与细胞类型和细胞过程联系起来。基于sc-linker,该研究确定了先前使用GWAS数据未确定的显著富集,并观察到数据集中的模式,为潜在疾病机制提供了新的见解,更为研究各种疾病提供了计算框架。
作者:测序中国
版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#单细胞测序#与#GWAS#整合分析工具#生物信息学#
182