2024-01-28 21:40

基于RNA测序技术筛选脓毒症4个溶酶体相关基因


下载原文档:

摘要。

目的

筛选脓毒症患者溶酶体相关基因,为溶酶体靶向治疗提供指导。

方法

选取22例败血症患者和10例正常人的外周血样本,进行RNA测序和差异基因表达分析。同时,从基因本体数据库中获取溶酶体相关基因。然后对差异基因和溶酶体相关基因之间的交叉基因进行PPI、GO和KEGG分析。通过生存分析鉴定核心基因,并通过meta分析确定其在不同组中的表达趋势。单细胞RNA测序用于明确核心基因的细胞定位。

结果

1328个脓毒症差异基因与878个溶酶体相关基因相交,得到76个基因。PPI分析显示,交叉基因主要参与细胞过程、刺激反应、免疫系统过程、信号转导、溶酶体等。GO和KEGG分析显示,交叉基因主要参与白细胞介导的免疫、参与免疫应答的细胞活化、溶泡、溶酶体。生存分析筛选出4个与脓毒症预后呈正相关的基因,分别是GNLY、GZMB、PRF1和RASGRP1。荟萃分析显示,与败血症组相比,正常对照组中这四种基因的表达水平显著高于败血症组,这与RNA测序数据的发现一致。此外,单细胞RNA测序显示,T细胞和NK细胞高表达GNLY、GZMB、PRF1和RASGRP1。

结论

GNLY、GZMB、PRF1、RASGRP1等溶酶体相关基因与脓毒症的预后密切相关,可能成为脓毒症新的研究靶点,为溶酶体靶向治疗的发展提供有价值的见解。临床试验注册号为ChiCTR1900021261,注册日期为2019年2月4日。

介绍

败血症是一种危及生命的器官功能障碍,由宿主对感染的反应异常引起。它的特点是急性细胞因子风暴,随后是幸存者免疫系统的长期功能障碍[1]。由于其高死亡率和高昂的医疗费用,败血症仍然是最难治疗的疾病之一。在败血症的早期阶段,免疫系统的过度激活和一连串的炎症反应往往伴随着免疫抑制。脓毒症的核心发病机制是宿主先天和适应性免疫反应失调[2]。脓毒症的早期治疗包括源头控制、抗菌药物和复苏[3]。尽管在脓毒症的发病机制方面取得了重大进展,但目前尚无临床有效的治疗方法[4]。

溶酶体是一种膜封闭的囊泡细胞器,存在于所有真核细胞中,含有维持结构和功能所必需的两类蛋白质:具有消化功能的可溶性溶酶体水解酶和具有更复杂功能的溶酶体膜蛋白。溶酶体是负责降解、营养感知和免疫的细胞器。近年来,越来越多的研究表明,溶酶体在许多疾病的病理过程中也发挥着重要作用[5]。已有研究证明溶酶体与动脉粥样硬化[6]、神经退行性疾病[7]、肿瘤[8]等疾病密切相关。机体的免疫受巨噬细胞和T细胞等细胞溶酶体活性的影响。对于先天免疫,细菌等病原体通过吞噬作用内化,并通过靶向溶酶体降解[9,10]。此外,溶酶体膜上的几种toll样受体(TLRs)能够识别各种微生物和宿主衍生的配体,并引发促炎信号传导[11]。对于适应性免疫,溶酶体产生抗原肽,通过主要组织相容性复合体II类(MHC-II)分子呈递给CD4 + T细胞。在这个过程中,吞噬体和溶酶体的TLR4信号诱导管对抗原呈递很重要[12,13]。可见,溶酶体广泛参与先天性和适应性免疫反应的过程,靶向溶酶体治疗可调节脓毒症引起的免疫紊乱,改善脓毒症患者的预后,有望成为脓毒症新的治疗方向。然而,在脓毒症治疗领域,针对溶酶体的治疗研究尚缺乏。

因此,我们打算利用RNA测序技术和生物信息学分析,筛选出影响脓毒症患者预后的溶酶体相关基因,为溶酶体的治疗提供指导。

方法

志愿者招募和血液采集

选取2019年1月至2020年12月在西南医科大学附属医院ICU或EICU住院的脓毒症患者22例及同期正常对照10例。患者入院后24小时内采集外周血样本。脓毒症组选择:(1)ICU或EICU住院的脓毒症患者;(2)符合2016年Critical Care Medicine Society (SCCM)和European Society of Intensive Care Medicine (ESICM)发布的脓毒症3.0标准[14];(3)患者或其法定代理人愿意参加实验,并签署知情同意书。排除标准为:(1)孕妇或哺乳期妇女;(二)患有精神疾病的;(3)免疫缺陷或HIV阳性。正常对照组的纳入标准为:(1)年龄> 18岁的健康志愿者;(2)无严重的心、肝、肾、消化道、神经系统疾病;(3)育龄女性志愿者血液妊娠试验阴性;(4)自愿参加试验并签署知情同意书。排除标准为:(1)有血液病、针病、严重贫血病史者;(二)有严重临床疾病史的;(3)研究前4周内接受手术的患者;(四)研究前一年内有药物滥用史的。本研究符合《赫尔辛基宣言》,已获得西南医科大学附属医院伦理委员会批准,伦理号:ky2018029,临床试验注册号:ChiCTR1900021261。

RNA序列

RNA测序已成为转录组分析的常规方法。用Trizol试剂从外周血混合物中提取总RNA。将混合物在4℃下12,000 rpm离心5min,将得到的上清转移到含有0.3 mL异戊醇的新EP管中。在4℃下以12,000 rpm离心10分钟后,将含有RNA的上水相转移到新管中,与等体积的异丙醇混合。然后将混合物在4℃下以13,600 rpm离心20分钟。去除上清后,RNA颗粒用1ml 75%乙醇洗涤两次。用50µL的depc处理过的水溶解RNA。随后使用Nano Drop和Agilent 2100生物分析仪对总RNA进行评估和定量。测序数据使用SOAPnuke进行过滤[15]。这涉及去除含有测序适配器的reads,未知碱基('N'碱基)比例超过5%的reads。随后,使用HISAT2将clean reads与参考基因组比对[16]。然后利用Bowtie2[17]将clean reads与参考编码基因集进行比对。最后,利用RSEM计算基因的表达水平[18]。

鉴别ex的筛选压力基因

由于其直观的用户界面和庞大的注释数据库,iDEP (integrated differential expression and pathway analysis)网站被广泛用于RNA测序数据的交互式分析[19]。因此,我们使用iDEP 9.6 (http://149.165.154.220/idepg/)在线平台对数据进行质量控制和过滤。随后,对标准化数据进行箱线图和密度分布分析,阐明RNA测序数据的同质性和可比性。采用主成分分析(PCA)发现异常样本,保证数据的稳定性。采用DESeq2方法进行统计分析,在|Fold Change| (FC)≥4、False Discovery Rate (FDR)<0.05的条件下筛选差异基因。

溶酶体相关基因筛选

基因本体(GO)知识库(http://geneontology.org/)是一个关于基因和基因产物(蛋白质和非编码rna)功能的综合性资源[20]。因此,我们利用基因本体数据库筛选溶酶体相关基因。进入基因本体数据库,在搜索框中输入“溶酶体”,选择“基因产品”,将生物体限定为“智人”,下载人类溶酶体相关基因。与脓毒症密切相关的溶酶体相关基因可以通过将差异基因与溶酶体相关基因交叉得到。

PPI分析

蛋白质之间的功能联系通常可以通过编码它们的基因之间的关联来推断,一组具有相同功能的基因往往显示出相似的物种覆盖范围,通常位于基因组的附近,并倾向于参与基因融合事件。STRING数据库是预先计算的用于探索和分析这些关联的全局资源[21]。将交叉的基因提交到STRING数据库中,物种选项选择“Homo sapiens”,网络类型选项选择“full STRING network”,网络边缘含义选择“evidence”,主动交互源选择“Text mining, Experiments, Databases”,相关强度系数设为0.15,去除网络中未连接的点。

去分析

进一步分析交叉基因是否参与特定的生物过程(BP),是否参与细胞c组分(CC)的形成,以及它们表达的分子功能(MF)。我们利用Omicshare网站(https://www.omicshare.com/)进行GO注释和分类富集分析,确定交叉基因的主要功能,全面描述基因和基因产物的性质。计算得到的p值经FDR校正后,以调整后的p值≤0.05作为阈值,并将满足该条件的GO项定义为差异表达基因显著富集。

KEGG分析

京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)是一个系统分析基因功能的知识库,将基因组信息与高阶功能信息连接起来,包括代谢途径数据库、层次分类数据库、基因数据库、基因组数据库等[22]。利用Omicshare网站对交叉基因进行KEGG富集分析,找出整个基因组背景中最显著的通路,显著富集标准为调整后的p值≤0.05。

生存分析

临床资料是科学研究的根本依据。为了进一步研究基因与预后的相关性,我们使用GEO公共数据库(https://www.ncbi.nlm.nih.gov/geo/)的GSE65682[23]数据集进行生存分析。该数据集包括来自479名败血症患者的外周血RNA测序数据,以及每个个体的基因表达值和临床预后信息。生存分析采用Graphpad prism 7,显著性阈值设为logrank检验p值小于0.05。

我ta-analysis

为了提高核心基因筛选和不同组间基因表达评估的准确性,我们从GEO数据库中获取脓毒症患者外周血RNA测序数据进行meta分析。具体使用的数据集为GSE28750[24]、GSE54514[25]、GSE69528[26]、GSE95233[27]。数据集均质化(log2对数),分为正常对照和脓毒症,随后使用R语言包对不同数据集中同一组内的单个基因进行meta分析。当p≤0.05时选择随机效应模型,当p > 0.05时选择固定效应模型,进行多数据异质性检验。

单细胞RNA测序

为了进一步了解核心基因的细胞分布,我们对两名健康人、一名全身性炎症反应综合征(SIRS)患者和两名败血症患者的外周血样本进行了分析。采用Cell Ranger软件进行质量控制措施,确保获得高质量的细胞计数、基因计数和基因组比对。利用唯一分子标识符(UMI)和细胞条形码可以确定单个细胞内每个转录分子的精确数量。将基于互近邻(MNN)算法的降维结果通过t分布随机近邻嵌入(t-SNE)算法可视化,最终得到最优的细胞种群分类。每个细胞群的特异性标记基因是通过使用bimod试验从所有剩余的细胞群中区分指定的细胞群来筛选的。基于HPCA参考数据集[28],使用SingleR包进行细胞类型注释[29]。


目录

摘要。
介绍
方法
结果
讨论
结论
数据和材料的可用性
参考文献。

作者信息
道德声明






#####

结果

人口学及临床特点

共有22名被诊断为败血症的个体被纳入本研究,其中包括14名男性和8名女性。正常对照组10只,男5只,女5只。在败血症组中,12人存活,10人在28天内死亡。相反,对照组的所有10个人都存活了下来,没有任何死亡。统计学分析采用非配对t检验评估两组患者的年龄、谷丙转氨酶(ALT)、谷草转氨酶(AST)、直接胆红素(DBIL)、总胆红素(TBIL)、肌酐、尿素、白细胞计数、中性粒细胞计数、单核细胞计数、淋巴细胞计数。采用均数±标准差表示,结果见表1。

表1人口学和临床特征

鉴别ex的筛选压力基因

随机选择两个有代表性的组生成散点图,以便对RNA测序数据进行质量控制。得到的Pearson积矩相关系数(R=0.985)表明两个变量之间存在高度稳健的正相关关系,从而证实了数据的稳定性(图1A)。此外,箱形图和密度分布图显示了两个数据集的同质性和可比性(图1B-C)。此外,PCA成功地区分了正常组和败血症组,没有异常样本的存在(图1D)。通过筛选|FC|≥4、FDR<0.05的基因,共获得差异基因1328个。其中,脓毒症组221个基因表达上调,脓毒症组1107个基因表达下调(图1E)。

图1
figure 1

脓毒症差异基因和溶酶体相关基因的筛选。散点图的R值为0.985,表明两个变量之间具有较强的正相关和数据稳定性。B-C箱形图和密度分布图显示了两组数据的同质性和可比性。D - PCA成功地区分了正常对照组和脓毒症组,没有任何异常样本。E火山图直观表示败血症组221个上调基因,用红色表示,蓝色表示败血症组1107个下调基因。F Venn图显示1328个脓毒症差异基因与878个溶酶体相关基因相交,共得到76个相交基因

溶酶体相关基因筛选

从基因本体数据库中获得溶酶体相关基因共878个,用于进一步分析。发现878个溶酶体相关基因与1328个在脓毒症中表现出差异表达的基因交叉,从而鉴定出76个与脓毒症密切相关的溶酶体相关基因(图1F)。

PPI分析

PPI网络由75个节点和450个连接组成,其中GNLY、GZMB、PRF1、TLR3、KIT等蛋白占据网络的中心位置。这些蛋白有可能成为影响败血症预后的核心靶点。网络中的点以不同的颜色表示不同的生物过程,蓝色表示细胞过程,绿色表示对刺激的反应,黄色表示免疫系统过程,紫色表示信号转导,红色表示溶酶体。连接节点的线的颜色表示交互证据的类型,绿色表示文本挖掘,红色表示实验,蓝色表示数据库(图2)。

图2
figure 2

PPI的分析。PPI网络由75个节点和450个连接组成,网络中的点以颜色编码代表不同的生物过程,蓝色表示细胞过程,绿色表示对刺激的反应,黄色表示免疫系统过程,紫色表示信号转导,红色表示溶酶体。连接节点的线的颜色表示交互证据的类型,绿色表示文本挖掘,红色表示实验,蓝色表示数据库

去分析

GO分析显示,前25项中,9项与bp相关,16项与CCs相关,无一项与MFs相关(图3A)。此外,分类富集分析表明,交叉基因主要参与各种bp,如白细胞介导的免疫、参与免疫应答的细胞激活、免疫效应过程、白细胞脱颗粒和囊泡介导的运输(图3B)。与交叉基因相关的CCs主要包括溶泡、溶酶体、细胞质囊泡、溶酶体膜和溶酶体腔(图3C)。此外,具有交叉基因的mf主要参与相同蛋白结合、丝氨酸型肽酶活性、丝氨酸水解酶活性、脂质结合、内肽酶活性(图3D)。

图3
figure 3

去分析。A对GO的分析显示,在前25个项目中,9个与bp有关,16个与cc有关,没有一个与mf有关。B交叉基因主要参与各种bp,如白细胞介导的免疫、参与免疫应答的细胞活化、免疫效应过程、白细胞脱颗粒和囊泡介导的运输。C与交叉基因相关的cc主要包括溶泡、溶酶体、细胞质囊泡、溶酶体膜和溶酶体腔。D具有交叉基因的bp主要参与相同蛋白结合、丝氨酸型肽酶活性、丝氨酸水解酶活性、脂质结合、内肽酶活性

KEGG分析

KEGG进行的分析确定了25个最值得注意的项目,包括1个代谢,4个环境信息处理,2个细胞过程,5个有机体系统和13个人类疾病(图4A)。交叉基因最重要的通路包括移植物抗宿主病、I型糖尿病、细胞凋亡、同种异体移植排斥反应、自身免疫性甲状腺疾病和溶酶体(图4B)。

图4
figure 4

KEGG分析。由KEGG进行的分析确定了25个最值得注意的项目,包括1个代谢,4个环境信息处理,2个细胞过程,5个有机体系统和13个人类疾病。B交叉基因在移植物抗宿主病、I型糖尿病、细胞凋亡、同种异体移植排斥反应、自身免疫性甲状腺疾病和溶酶体等途径中具有最高的意义

生存分析

基于GEO数据库中GSE65682数据集的生存分析,观察到GNLY、GZMB、PRF1和RASGRP1高表达患者的28天生存率高于低表达患者(P<0.05)。这一发现提示这些基因与脓毒症患者的预后呈正相关,它们的高表达水平可能成为脓毒症研究的新热点。因此,这些发现为开发溶酶体靶向治疗败血症提供了有价值的见解(图5A-D)。

图5
figure 5

生存分析。基于GSE65682数据集的a -d生存分析发现,GNLY、GZMB、PRF1和RASGRP1高表达患者28天生存率高于低表达患者(P<0.05)。

我ta-analysis

在转录组水平上,使用RNA测序数据集GSE28750、GSE54514、GSE69528和GSE95233对核心基因进行meta分析。分析结果显示,GNLY、GZMB、PRF1、RASGRP1在正常对照组中表达水平较高,而在脓毒症组中表达水平较低(图6A-D)。关于纳入研究的GEO数据集的进一步信息可在表2中找到。根据正常对照组(n=10)和脓毒症组(n=22)的外周血RNA测序数据,绘制核心基因的表达豆荚图,结果显示,GNLY、GZMB、PRF1和RASGRP1在正常对照组中高表达,脓毒症组中低表达,差异有统计学意义(图7)。

图6
figure 6

荟萃分析。基于GSE28750、GSE54514、GSE69528、GSE95233数据集的A-D meta分析显示,GNLY、GZMB、PRF1和RASGRP1在正常对照组中表达水平较高,而在脓毒症组中表达水平较低

表2生存分析和me的GSE数据集ta-analysis
图7
figure 7

核心基因表达分析。荚果图显示了通过正常对照组(n=10)和脓毒症组(n=22)的外周血RNA测序数据确定的核心基因的表达模式。值得注意的是,分析显示GNLY、GZMB、PRF1和RASGRP1在正常对照组中的表达水平明显高于脓毒症组(P<0.05)。值得注意的是,显著性水平用*P<0.05、**P<0.01、***P<0.001表示

单细胞RNA测序

每个样品用于质量控制的高质量细胞的分布范围为4050 ~ 10191。在排除双细胞、多细胞和凋亡细胞后,最终获得的细胞数从3108到8509不等。每个细胞的平均UMI数在519 ~ 8529之间,每个细胞的平均基因数在343 ~ 2337之间。降维后,将细胞分为9组(图8A), B细胞、NK细胞、T细胞、血小板和巨噬细胞作为参比细胞类型。在鉴定的细胞系中,T细胞代表1、2、6和8个,巨噬细胞代表3和5个,NK细胞代表4个,B细胞代表7个,血小板代表9个(图8B)。单细胞RNA测序数据分析显示,GNLY、GZMB和PRF1主要在细胞系2和4中表达,而RASGRP1主要定位于细胞系1、2、4、6和8中(图8C)。因此,GNLY、GZMB、PRF1和RASGRP1在T细胞和NK细胞中表现出高表达水平(图8D-E)。

图8
figure 8

单细胞RNA测序。A总测序图显示,在降维之后,细胞被分为9个不同的组。B在鉴定的细胞系中,T细胞代表1、2、6和8,巨噬细胞代表3和5,NK细胞代表4,B细胞代表7,血小板代表9。C点图中,横坐标表示基因名称,纵坐标表示细胞组数。点的大小与特定细胞群中表达该基因的细胞的比例相对应。此外,从蓝色到红色的颜色梯度表示不同水平的基因表达,红色表示更高的表达。本研究结果表明,GNLY、GZMB和PRF1主要定位于细胞系2和4,而RASGRP1主要定位于细胞系1、2、4、6和8。D-G,特征图中的A点代表单个细胞,颜色梯度从蓝色到红色,表示细胞内较高的基因表达水平。这些结果进一步表明,GNLY、GZMB、PRF1和RASGRP1在T细胞和NK细胞中具有高表达水平