一种空间转录组特征富集差异分析方法及其应用技术

技术编号:38463690 阅读:11 留言:0更新日期:2023-08-11 14:40
本发明专利技术公开了一种空间转录组特征富集差异分析方法及其应用。所述方法包括:整合多样本空间转录组数据,从单细胞转录组数据中提取细胞类型特异性的特征基因集合,空间转录组特征基因集合打分,筛选空间富集点,空间富集点占比差异分析。本发明专利技术能够分析多样本多分组空间转录组数据,有效合理地进行样本层面的统计差异分析,提高了对单细胞的分辨率,能够对空间转录组spot进行细胞类型的注释,一致性和可重复性高,对研究细胞亚群地空间转录组分布特征及不同疾病状态或发育阶段下的细胞类型变化差异进行量化分析有重要意义。化差异进行量化分析有重要意义。化差异进行量化分析有重要意义。

【技术实现步骤摘要】
一种空间转录组特征富集差异分析方法及其应用


[0001]本专利技术属于生物
,涉及一种空间转录组特征富集差异分析方法及其应用。

技术介绍

[0002]空间转录组RNA测序作为一款结合了空间信息和RNA转录本信息的新技术,可以将组织原位切片上的空间位置分布信息添加到捕获的转录本上,从而得到拥有空间分布信息的高通量转录组数据。空间转录组RNA测序技术提高了组织内部的分辨率,现已被广泛使用。然而,受到现有技术的限制,市面上的多款商业化空间转录组产品都无法做到单细胞分辨率,通常每个空间转录组spot中混合了若干个细胞。因此无法使用单细胞RNA测序技术的细胞注释方式对空间转录组spot进行细胞类型的注释,这一直是空间转录组数据分析的一大难题。
[0003]目前,常用的空间转录组细胞类型解析方法有以下两种:一是使用反卷积分析方法对每个spot中的细胞比例进行解析,常用软件如Seurat和SPOTlight等;二是使用细胞类型特征基因对每个spot进行打分,常用方法如ssGSEA和AddModuleScore等。然而,以上两种方法均存在一些缺陷。反卷积分析的一致性和可重复性较低,且反卷积对转录组层面相似性高的细胞亚群解析效果差,常会出现细胞类型缺失的情况,不利于空间转录组研究细致的细胞亚群。用特征基因打分的方式视每个细胞类型的特征为独立的基因集合进行分析,可以用于研究细胞亚群,然而基因集合打分算法缺乏阈值判定,且由于整合多个样本时的大量spot,在spot水平上对基因集富集分数进行差异分析通常会导致几乎所有特征都具有很强的统计显著性,而不考虑样本效应大小,会被错误地解释为生物学显著。
[0004]综上所述,目前空间转录组细胞类型解析方法存在单细胞分辨率低,对转录组层面相似性高的细胞亚群解析效果差,缺乏阈值判定易误判统计显著性等问题。如何提供一种空间转录组特征富集差异分析方法,提高对单细胞的分辨率,有效解析转录组层面相似性高的细胞亚群,已成为目前生物
亟待解决的问题之一。

技术实现思路

[0005]针对现有技术的不足和实际需求,本专利技术提供一种空间转录组特征富集差异分析方法及其应用,能够对空间转录组多样本多分组数据进行细胞类型特征富集打分,评估每个空间转录组样本和特征的富集空间点的比例,并能够合理地评估特征的样本级别差异。
[0006]为达到此专利技术目的,本专利技术采用以下技术方案:
[0007]第一方面,本专利技术提供了一种空间转录组特征富集差异分析方法,所述方法包括:整合样本空间转录组数据,从单细胞转录组数据中提取细胞类型特异性的特征基因集合,对空间转录组特征基因集合进行打分,筛选空间富集点,空间富集点占比差异分析。
[0008]本专利技术能够分析多样本多分组空间转录组数据,有效合理地进行样本层面的统计差异分析,提高了对单细胞的分辨率,能够对空间转录组spot进行细胞类型的注释,一致性
和可重复性高,对研究细胞亚群地空间转录组分布特征及不同疾病状态或发育阶段下的细胞类型变化差异进行量化分析有重要意义。
[0009]优选地,所述整合样本空间转录组数据包括:
[0010]在每个数据spot标签前添加样本名称,并在数据切片图像images信息框中填入对应样本名,在数据meta.data的sample和group信息列填入所提供的样本和分组名称,添加信息后,使用Seurat中内置merge函数进行多样本数据整合。
[0011]优选地,所述样本包括正常组织切片和/或病理组织切片。
[0012]优选地,所述从单细胞转录组数据中提取细胞类型特异性的特征基因集合的方法包括:
[0013]使用FindMarkers函数计算细胞亚型差异基因,并选取以avg_log2FC排序的显著高表达基因作为该细胞类型的特征基因集合,所述显著高表达的判断标准为:在目标亚群中avg_log2FC > 0.25 且表达值在目标亚群细胞和其他亚群细胞的Wilcoxon秩和检验显著性p值小于0.05。
[0014]优选地,所述对空间转录组特征基因集合进行打分包括:
[0015]使用ssGSEA、AUCell、UCell和singscore四种算法进行打分。
[0016]ssGSEA对每个空间转录组spot的基因依据表达值排序,通过计算spot中属于特征基因集合内和不属于特征基因集合的基因表达值的累计密度分布的差异计算富集分数。AUCell对每个空间转录组spot的基因依据表达值排序得到基因表达排名,使用曲线下面积来评估特征基因集合的富集得分。UCell是基于单个spot的基因表达排名,使用Mann

Whitney U统计量来衡量特征基因集合在spot中的富集评分。singscore与上述三种打分方法一样,也是基于spot的基因表达排名,其算法使用特征基因集合远离中心的程度来评估spot富集评分。
[0017]优选地,所述空间转录组特征基因集合的来源包括cell marker和/或对应组织的单细胞转录组数据。
[0018]优选地,所述筛选空间富集点包括:
[0019]按式(1)确定富集阈值,具体为根据特征基因集合打分的得分S
j
对每个特征j进行排序,得分最高的前α占比的spot不包括在阈值的确定中,选择排除得分最高的前α占比的spot后的最高得分作为富集阈值,富集分数高于富集阈值的spot为空间富集点,
[0020]ꢀꢀꢀ
式(1);
[0021]其中j为特征,thr
j
为特征j的富集阈值,S
j
为特征基因集合打分的得分,α为得分最高的前α占比,K为定义的百分比因子,K为0.6

0.8。
[0022]优选地,所述空间富集点占比差异分析包括:
[0023]按照式(2)计算每个空间转录组切片样本i的每个特征j的空间富集点占比,使用t检验或wilcox检验对空间转录组数据样本组之间进行样本层面的统计分析比较,并设置pvalue < 0.05以估计统计显著性,
[0024]ꢀꢀꢀ
式(2);
[0025]其中j为特征,i为空间转录组切片样本,fraction
ij
为每个空间转录组切片样本i
的每个特征j的空间富集点占比,N
ij
为样本超过阈值thr
j
的spot数,M
i
为样本的spot总数。
[0026]第二方面,本专利技术提供了一种空间转录组特征富集差异分析装置,所述装置包括整合样本空间转录组数据模块,从单细胞转录组数据中提取细胞类型特异性的特征基因集合模块,对空间转录组特征基因集合进行打分模块,筛选空间富集点模块,空间富集点占比差异分析模块;
[0027]所述整合样本空间转录组数据模块用于执行包括:
[0028]在每个数据spot标签前添加样本名称,并在数据切片图像images信息框中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种空间转录组特征富集差异分析方法,其特征在于,所述方法包括:整合样本空间转录组数据,从单细胞转录组数据中提取细胞类型特异性的特征基因集合,对空间转录组特征基因集合进行打分,筛选空间富集点,空间富集点占比差异分析。2.根据权利要求1所述的空间转录组特征富集差异分析方法,其特征在于,所述整合样本空间转录组数据包括:在每个数据spot标签前添加样本名称,并在数据切片图像images信息框中填入对应样本名,在数据meta.data的sample和group信息列填入所提供的样本和分组名称,添加信息后,使用Seurat中内置merge函数进行多样本数据整合。3.根据权利要求1所述的空间转录组特征富集差异分析方法,其特征在于,所述从单细胞转录组数据中提取细胞类型特异性的特征基因集合的方法包括:使用FindMarkers函数计算细胞亚型差异基因,并选取以avg_log2FC排序的显著高表达基因作为该细胞类型的特征基因集合;所述显著高表达的判断标准为:在目标亚群中avg_log2FC > 0.25 且表达值在目标亚群细胞和其他亚群细胞的Wilcoxon秩和检验显著性p值小于0.05。4.根据权利要求1所述的空间转录组特征富集差异分析方法,其特征在于,所述对空间转录组特征基因集合进行打分包括:使用ssGSEA、AUCell、UCell和singscore四种算法进行打分。5.根据权利要求1所述的空间转录组特征富集差异分析方法,其特征在于,所述空间转录组特征基因集合的来源包括cell marker和/或对应组织的单细胞转录组数据。6.根据权利要求1所述的空间转录组特征富集差异分析方法,其特征在于,所述筛选空间富集点包括:按式(1)确定富集阈值,具体为根据特征基因集合打分的得分S
j
对每个特征j进行排序,得分最高的前α占比的spot不包括在阈值的确定中,选择排除得分最高的前α占比的spot后的最高得分作为富集阈值,富集分数高于富集阈值的spot为空间富集点;
ꢀꢀꢀ
式(1);其中j为特征,thr
j
为特征j的富集阈值,S
j
为特征基因集合打分的得分,α为得分最高的前α占比,K为定义的百分比因子,K为0.6

0.8。7.根据权利要求1所述的空间转录组特征富集差异分析方法,其特征在于,所述空间富集点占比差异分析包括:按照式(2)计算每个空间转录组切片样本i的每个特征j的空间富集点占比,使用t检验或wilcox检验对空间转录组数据样本组之间进行样本层面的统计分析比较,并设置pvalue < 0.05以估计统计显著性;
ꢀꢀꢀ
式(2);其中j为特征,i为空间转录组切片样本,fraction
ij
为每个空间转录组切片样本i的每个特征j的空间富集点占比,N
ij
为样本超过阈值thr...

【专利技术属性】
技术研发人员:冯诗婧胡龙飞
申请(专利权)人:南京通元医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1