System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多组比较的单细胞表达模式差异可靠性筛选方法技术_技高网

一种基于多组比较的单细胞表达模式差异可靠性筛选方法技术

技术编号:40249660 阅读:5 留言:0更新日期:2024-02-02 22:44
本发明专利技术公开了一种基于多组比较的单细胞表达模式差异评估方法,涉及生物信息分析技术领域。包括以下步骤:S101,合并多个组别的单细胞转录组表达谱;S102,对合并后的单细胞转录组表达谱中的所有细胞进行分群;S103,对各细胞群进行细胞类型的鉴定;S104,筛选出同时存在于两个或两个以上组别的细胞类型,提取该细胞类型的共存表达谱;S105,根据所述共存表达谱计算出对应细胞类型的差异富集得分;S106,将所述细胞类型按照差异富集得分从大到小进行排名。本法买那个能够评估多组比较下单细胞表达谱差异大小与差异富集程度的确切指标,为科学选择后续研究方向提供依据。

【技术实现步骤摘要】

本专利技术涉及生物信息分析,尤其涉及一种基于多组比较的单细胞表达模式差异评估方法。


技术介绍

1、单细胞转录组学、单细胞atac组学(单细胞染色质转座酶可及性的高通量分析)、单细胞表观遗传组学等单细胞层级的测序技术可以获得单个细胞内数千个、数万个基因的rna和染色质信息,全面展示了各个细胞之间的基因表达差异。高通量的单细胞测序平台(如10x genomics的相关平台)利用微流控、油滴包裹和barcode标签等技术,可以实现高通量的细胞分选与捕获,能够一次性分离、并标记数百乃至数万个细胞,经过扩增、测序等处理后可获得每个细胞的转录组或染色质、位点甲基化等信息,具有细胞通量高、建库成本低、效率高等优势。结合不同细胞类型的标志性信号特征(标记基因)或细胞类型标记算法(如singler),该技术可以用于分析不同类型细胞的表达、染色质或甲基化特征,进而用于生物发育、疾病发展、免疫变化等方面的研究。

2、单细胞组学数据的分析通常包含以下步骤:过滤低质量细胞、鉴定细胞类型、初步分析各细胞类型的整体特征或表达模式、选择深入分析的细胞类型、针对目标细胞类型进行个性化分析(如通路富集分析、预测分化轨迹、转录因子活性、细胞通讯等)。最后一步的个性化分析,理论上可使用现有的理论上无限多种软件进行分析,故通常在此步骤中花费的人力、精力和时间最多。而前一步的选择细胞类型的步骤则是个性化分析的基础——选择到关键的、合适的细胞类型,则后续的个性化分析可以挖掘出重要的、有意义的信息,若细胞类型选择失当,则可能花费大量时间与精力,却仅挖掘出无价值或低价值的信息。特别在存在多组比较的单细胞数据中,每一种细胞类型的深入研究,相较于无比较组或两组比较,都成倍增加了其研究成本。

3、目前,研究者对同时具有多个处理组(三组或三组以上)的单细胞数据,通常基于现有的生物学知识进行选择后续研究方向,而非基于数据本身的特点和差异。这可能导致人们错过许多有潜在价值的研究方向。多组间在不同细胞类型上是否存在差异及差异的大小、差异的显著性,都预示着处理或实验条件对不同细胞的表达模式的影响程度。但由于单细胞组学庞大的数据量与细胞量、复杂的数据状况,现有技术难以直接、准确评估细胞表达模式的差异。


技术实现思路

1、为了解决
技术介绍
中提到的至少一个技术问题,本专利技术的目的在于提供一种基于多组比较的单细胞表达模式差异评估方法,能够评估多组比较下单细胞表达谱差异大小与差异富集程度的确切指标,为科学选择后续研究方向提供依据。

2、为实现上述目的,本专利技术提供如下技术方案:

3、一种基于多组比较的单细胞表达模式差异评估方法,包括以下步骤:

4、s101,合并多个组别的单细胞转录组表达谱;

5、s102,对合并后的单细胞转录组表达谱中的所有细胞进行分群;

6、s103,对各细胞群进行细胞类型的鉴定;

7、s104,筛选出同时存在于两个或两个以上组别的细胞类型,提取该细胞类型的共存表达谱;

8、s105,根据所述共存表达谱计算出对应细胞类型的差异富集得分;

9、s106,将所述细胞类型按照差异富集得分从大到小进行排名。

10、进一步的,所述差异富集得分的计算方法如下:

11、s1051,基于共存表达谱,求得该细胞类型的总特征表达谱;

12、s1052,按照组别将所述总特征表达谱分割为若干子特征表达谱;

13、s1053,计算每一子特征表达谱与对应的总特征表达谱的距离;

14、s1054,对其余共存表达谱重复s1051至s1053,获得对应的距离;

15、s1055,对所有距离按照从大到小进行排序,赋予排名;

16、s1056,基于排名求得细胞类型的差异富集得分:

17、;

18、;

19、;

20、其中,代表差异富集得分,代表排名,代表同属细胞类型的距离对应的排名集合,下标代表细胞类型,下标代表组别;代表排名总数;代表同属于细胞类型的组别数量;为富集权重,。

21、进一步的,。

22、进一步的,所述距离为欧式距离或曼哈顿距离。

23、进一步的,所述总特征表达谱的求解方法如下:针对筛选出的细胞类型所对应的细胞群,对每个基因的基因表达量取平均值,作为该基因的特征值,若干基因的特征值构成所述总特征表达谱。

24、进一步的,所述s106中,还对所述细胞类型进行可靠性筛选:

25、s1061,以该细胞类型中所有距离的排名与其他细胞类型的所有距离的排名进行比较,使用wilcoxon秩和检验计算p值;

26、s1062,对其他细胞类型求得相应的p值;

27、s1063,将p值高于预先设定阈值的细胞类型删除。

28、进一步的,所述s102中,对细胞进行分群之前对细胞进行归一化和/或pca降维。

29、进一步的,所述s103中,采用具有细胞类型特异性的标记基因对细胞类型进行鉴定,将高表达标记基因的细胞群鉴定为相应的细胞类型;或,使用singler软件进行各细胞类型的鉴定。

30、一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上所述的基于多组比较的单细胞表达模式差异评估方法。

31、一种终端设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上所述的基于多组比较的单细胞表达模式差异评估方法。

32、与现有技术相比,本专利技术的有益效果是:

33、本专利技术通过计算各细胞类型下,各组的特征表达谱与细胞类型表达谱的距离,对所有距离进行排名,基于距离排名计算各细胞类型的差异富集得分,可以比较各组在各细胞类型中的差异富集得分差异,获得相应的表达模式差异幅度评估结果,为科学选择后续研究方向提供依据。

本文档来自技高网...

【技术保护点】

1.一种基于多组比较的单细胞表达模式差异可靠性筛选方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于多组比较的单细胞表达模式差异可靠性筛选方法,其特征在于,所述差异富集得分的计算方法如下:

3.根据权利要求1所述的一种基于多组比较的单细胞表达模式差异可靠性筛选方法,其特征在于,。

4.根据权利要求1所述的一种基于多组比较的单细胞表达模式差异可靠性筛选方法,其特征在于,所述距离为欧式距离或曼哈顿距离。

5.根据权利要求1所述的一种基于多组比较的单细胞表达模式差异可靠性筛选方法,其特征在于,所述总特征表达谱的求解方法如下:针对筛选出的细胞类型所对应的细胞群,对每个基因的基因表达量取平均值,作为该基因的特征值,若干基因的特征值构成所述总特征表达谱。

6.根据权利要求1所述的一种基于多组比较的单细胞表达模式差异可靠性筛选方法,其特征在于,所述S102中,对细胞进行分群之前对细胞进行归一化和/或PCA降维。

7.根据权利要求1所述的一种基于多组比较的单细胞表达模式差异可靠性筛选方法,其特征在于,所述S103中,采用具有细胞类型特异性的标记基因对细胞类型进行鉴定,将高表达标记基因的细胞群鉴定为相应的细胞类型;或,使用SingleR软件进行各细胞类型的鉴定。

8.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7任意一项所述的基于多组比较的单细胞表达模式差异可靠性筛选方法。

9.一种终端设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任意一项所述的基于多组比较的单细胞表达模式差异可靠性筛选方法。

...

【技术特征摘要】

1.一种基于多组比较的单细胞表达模式差异可靠性筛选方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于多组比较的单细胞表达模式差异可靠性筛选方法,其特征在于,所述差异富集得分的计算方法如下:

3.根据权利要求1所述的一种基于多组比较的单细胞表达模式差异可靠性筛选方法,其特征在于,。

4.根据权利要求1所述的一种基于多组比较的单细胞表达模式差异可靠性筛选方法,其特征在于,所述距离为欧式距离或曼哈顿距离。

5.根据权利要求1所述的一种基于多组比较的单细胞表达模式差异可靠性筛选方法,其特征在于,所述总特征表达谱的求解方法如下:针对筛选出的细胞类型所对应的细胞群,对每个基因的基因表达量取平均值,作为该基因的特征值,若干基因的特征值构成所述总特征表达谱。

6.根据权利要求1所述的一种基于多组比较的单细胞表...

【专利技术属性】
技术研发人员:陈哲名
申请(专利权)人:杭州联川生物技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1