【技术实现步骤摘要】
一种空间转录组特征富集差异分析方法及其应用
[0001]本专利技术属于生物
,涉及一种空间转录组特征富集差异分析方法及其应用。
技术介绍
[0002]空间转录组RNA测序作为一款结合了空间信息和RNA转录本信息的新技术,可以将组织原位切片上的空间位置分布信息添加到捕获的转录本上,从而得到拥有空间分布信息的高通量转录组数据。空间转录组RNA测序技术提高了组织内部的分辨率,现已被广泛使用。然而,受到现有技术的限制,市面上的多款商业化空间转录组产品都无法做到单细胞分辨率,通常每个空间转录组spot中混合了若干个细胞。因此无法使用单细胞RNA测序技术的细胞注释方式对空间转录组spot进行细胞类型的注释,这一直是空间转录组数据分析的一大难题。
[0003]目前,常用的空间转录组细胞类型解析方法有以下两种:一是使用反卷积分析方法对每个spot中的细胞比例进行解析,常用软件如Seurat和SPOTlight等;二是使用细胞类型特征基因对每个spot进行打分,常用方法如ssGSEA和AddModuleScore等。然而,以上两种方法均存在一些缺陷。反卷积分析的一致性和可重复性较低,且反卷积对转录组层面相似性高的细胞亚群解析效果差,常会出现细胞类型缺失的情况,不利于空间转录组研究细致的细胞亚群。用特征基因打分的方式视每个细胞类型的特征为独立的基因集合进行分析,可以用于研究细胞亚群,然而基因集合打分算法缺乏阈值判定,且由于整合多个样本时的大量spot,在spot水平上对基因集富集分数进行差异分析通常会导致几乎所有特征都具有 ...
【技术保护点】
【技术特征摘要】
1.一种空间转录组特征富集差异分析方法,其特征在于,所述方法包括:整合样本空间转录组数据,从单细胞转录组数据中提取细胞类型特异性的特征基因集合,对空间转录组特征基因集合进行打分,筛选空间富集点,空间富集点占比差异分析。2.根据权利要求1所述的空间转录组特征富集差异分析方法,其特征在于,所述整合样本空间转录组数据包括:在每个数据spot标签前添加样本名称,并在数据切片图像images信息框中填入对应样本名,在数据meta.data的sample和group信息列填入所提供的样本和分组名称,添加信息后,使用Seurat中内置merge函数进行多样本数据整合。3.根据权利要求1所述的空间转录组特征富集差异分析方法,其特征在于,所述从单细胞转录组数据中提取细胞类型特异性的特征基因集合的方法包括:使用FindMarkers函数计算细胞亚型差异基因,并选取以avg_log2FC排序的显著高表达基因作为该细胞类型的特征基因集合;所述显著高表达的判断标准为:在目标亚群中avg_log2FC > 0.25 且表达值在目标亚群细胞和其他亚群细胞的Wilcoxon秩和检验显著性p值小于0.05。4.根据权利要求1所述的空间转录组特征富集差异分析方法,其特征在于,所述对空间转录组特征基因集合进行打分包括:使用ssGSEA、AUCell、UCell和singscore四种算法进行打分。5.根据权利要求1所述的空间转录组特征富集差异分析方法,其特征在于,所述空间转录组特征基因集合的来源包括cell marker和/或对应组织的单细胞转录组数据。6.根据权利要求1所述的空间转录组特征富集差异分析方法,其特征在于,所述筛选空间富集点包括:按式(1)确定富集阈值,具体为根据特征基因集合打分的得分S
j
对每个特征j进行排序,得分最高的前α占比的spot不包括在阈值的确定中,选择排除得分最高的前α占比的spot后的最高得分作为富集阈值,富集分数高于富集阈值的spot为空间富集点;
ꢀꢀꢀ
式(1);其中j为特征,thr
j
为特征j的富集阈值,S
j
为特征基因集合打分的得分,α为得分最高的前α占比,K为定义的百分比因子,K为0.6
‑
0.8。7.根据权利要求1所述的空间转录组特征富集差异分析方法,其特征在于,所述空间富集点占比差异分析包括:按照式(2)计算每个空间转录组切片样本i的每个特征j的空间富集点占比,使用t检验或wilcox检验对空间转录组数据样本组之间进行样本层面的统计分析比较,并设置pvalue < 0.05以估计统计显著性;
ꢀꢀꢀ
式(2);其中j为特征,i为空间转录组切片样本,fraction
ij
为每个空间转录组切片样本i的每个特征j的空间富集点占比,N
ij
为样本超过阈值thr...
【专利技术属性】
技术研发人员:冯诗婧,胡龙飞,
申请(专利权)人:南京通元医学检验实验室有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。