一种单细胞转录组RNA污染去除方法、介质和设备技术

技术编号:37701582 阅读:23 留言:0更新日期:2023-06-01 23:46
本发明专利技术公开了一种单细胞转录组RNA污染鉴定方法,涉及生物数据分析方法。包括以下步骤:根据基因表达量从大到小对barcode进行排序;求得基因表达量变化幅度由小变大的A类拐点和基因表达量变化幅度由大变小的B类拐点;取规定区间内对应基因表达量最大的A类拐点为起点拐点,对应基因表达量最小的B类拐点为终点拐点;将起点拐点到终点拐点之间的所有barcode设为背景barcode;提取背景barcode的表达谱,统计不同基因在背景barcode中的表达比例;将表达比例大于污染阈值GP的基因设定为污染基因;若存在污染基因,则判定单细胞转录组数据存在RNA污染。本发明专利技术可以分析单细胞转录组数据中是否存在背景RNA污染,便于提高后续分析的可靠程度。的可靠程度。的可靠程度。

【技术实现步骤摘要】
一种单细胞转录组RNA污染去除方法、介质和设备
[0001]相关申请的交叉引用
[0002]本申请是基于申请号为2022113640956,申请日为:2022年11月02日,专利技术名称为:一种单细胞转录组RNA污染鉴定方法、介质和设备的分案申请。


[0003]本专利技术涉及生物数据分析方法,尤其涉及一种单细胞转录组RNA污染去除方法、介质和设备。

技术介绍

[0004]基于微流控技术的单细胞转录组测序能够在单个实验中对数万个细胞的基因表达进行量化。其主要是基于序列标签来识别单细胞,其核心技术是给每个细胞添加一个独特的序列标签,在测序时把携带相同标签的核酸序列视为来自同一个细胞。10X Genomics单细胞转录组测序平台为目前应用广泛的一种技术,该平台利用微流控、油滴包裹和barcode标签等技术来实现高通量的细胞分选与捕获,能够一次性分离、并标记500至数万个单细胞,测序后可获得每个细胞的转录组信息,具有细胞通量高、建库成本低、捕获周期短等优势。
[0005]典型的单细胞转录组测序实验流程如下,首先制备细胞悬浮液,在相应的平台仪器上利用微流控芯片将细胞悬浮液与磁珠混合,并用油滴包裹。每个微珠带有独特的核苷酸序列,即barcode标签,可以对单个细胞进行标记。而每条barcode标签还连有一段由核苷酸序列组成的分子标识符(unique molecular identifier,UMI),每个UMI可以标记一个mRNA转录本。经过逆转录、PCR扩增、生成文库和测序,在测序数据中,根据barcode标签和UMI标记,即可确定结果中每条序列是否来自于同一个细胞、同一个mRNA,这一方法可以减少PCR对不同分子的偏好影响。通过匹配和计数barcode和UMI,汇总基因表达信息在计数矩阵中,由此获得单个细胞的转录组表达谱。
[0006]基于液滴的单细胞转录组数据分析的前提是假设所有获得的RNA序列都是细胞内源性的。然而,在实际实验过程中,难免混入其他非细胞RNA,这些RNA可能来源于样本中已经破裂甚至破碎的细胞,或者来源于试剂溶液中,也可能来源于实验人员等环境因素。实验过程中,非细胞RNA与内源性细胞RNA会被一起包裹在液滴中,可能与细胞RNA一起被标记、扩增和计数。这导致不同细胞群之间转录本的交叉污染,构成了单细胞转录组数据的背景污染,使单细胞转录组数据的生物学解释偏离真实情况。目前还未有系统判定是否存在RNA污染的方法。

技术实现思路

[0007]为了解决
技术介绍
中提到的至少一个技术问题,本专利技术的目的在于提供一种单细胞转录组RNA污染鉴定方法、介质和设备,分析单细胞转录组数据中是否存在背景RNA污染。
[0008]为实现上述目的,本专利技术提供如下技术方案:
[0009]一种单细胞转录组RNA污染鉴定方法,包括以下步骤:
[0010]S1,根据基因表达量从大到小对barcode进行排序;
[0011]S2,求得基因表达量变化幅度由小变大的A类拐点和基因表达量变化幅度由大变小的B类拐点;
[0012]S3,取规定区间内对应基因表达量最大的A类拐点为起点拐点,对应基因表达量最小的B类拐点为终点拐点;将起点拐点到终点拐点之间的所有barcode设为背景barcode;
[0013]S4,提取背景barcode的表达谱,统计不同基因在背景barcode中的表达比例;将表达比例大于污染阈值GP的基因设定为污染基因;
[0014]S5,若存在污染基因,则判定单细胞转录组数据存在RNA污染。
[0015]进一步的,所述A类拐点的求解方法如下:
[0016]SA21,以barcode的排名为X轴,基因表达量为Y轴绘制散点图;
[0017]SA22,在所述散点图上,间隔规定距离取最近的一个点,求相邻两个点之间的斜率;
[0018]SA23,当斜率的变化趋势为由小到大,且在该趋势持续过程中,斜率首次小于设定的斜率阈值时,将对应的点设为A类拐点。
[0019]进一步的,所述B类拐点的求解方法如下:
[0020]SB21,以barcode的排名为X轴,基因表达量为Y轴绘制散点图;
[0021]SB22,在所述散点图上,间隔规定距离取最近的一个点,求相邻两个点之间的斜率;
[0022]SB23,当斜率的变化趋势为由大到小,且在该趋势持续过程中,斜率首次小于设定的斜率阈值时,将对应的点设为B类拐点。
[0023]进一步的,在S21绘制散点图之前,对barcode的排名和基因表达量先进行对数处理。
[0024]进一步的,所述表达比例的计算方法如下:
[0025]P=N
A
/N
total
*100%
[0026]其中,P为基因的表达比例;N
A
为表达了该基因的barcode数量;N
total
为背景barcode的总数。
[0027]进一步的,所述规定区间的确定方法如下:设定基因表达量阈值G1和G2,G1>G2;所述规定区间为基因表达量大于G2且小于G1。
[0028]进一步的,所述基因表达量阈值G1=800,G2=80。
[0029]进一步的,所述污染阈值GP为70%。
[0030]一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的单细胞转录组RNA污染鉴定方法。
[0031]一种终端设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的单细胞转录组RNA污染鉴定方法。
[0032]与现有技术相比,本专利技术的有益效果是:
[0033]本专利技术通过基因表达量的变化幅度求得两类拐点,并进一步确定背景barcode,进而提取背景barcode的表达谱,统计不同基因在背景barcode中的表达比例,若存在某一基
因的表达比例大于污染阈值,则判定单细胞转录组数据存在RNA污染,从而提高后续分析的可靠程度。
附图说明
[0034]图1为本专利技术一实施例的RNA污染鉴定方法流程图。
[0035]图2为本专利技术一实施例的散点图。
[0036]图3为本专利技术一实施例的拐点示意图。
[0037]图4为本专利技术一实施例的RNA污染去除方法流程图。
具体实施方式
[0038]下面对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0039]实施例一:
[0040]请参阅图1,本实施例提供一种单细胞转录组RNA污染鉴定方法,包括以下步骤:
[0041]计算分析基因表达量(UMI counts数,简称C
UMI
)的剧烈变化点(称为“拐本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种单细胞转录组RNA污染去除方法,其特征在于,包括以下步骤:S1,根据基因表达量从大到小对barcode进行排序;S2,求得基因表达量变化幅度由小变大的A类拐点和基因表达量变化幅度由大变小的B类拐点;S3,取规定区间内对应基因表达量最大的A类拐点为起点拐点,对应基因表达量最小的B类拐点为终点拐点;将起点拐点到终点拐点之间的所有barcode设为背景barcode;S4,提取背景barcode的表达谱,统计不同基因在背景barcode中的表达比例;将表达比例大于污染阈值GP的基因设定为污染基因;S5,若存在污染基因,则判定单细胞转录组数据存在RNA污染;T1,根据污染基因在背景barcode中的表达谱,计算每个污染基因的基因表达量的平均值u1和标准差a1;T2,对细胞barcode进行分群,针对每一细胞群,分别计算污染基因在该群细胞中基因表达量的平均值u2和标准差a2;T3,根据公式Cp=(C
raw

u2)/a2*a1+u1计算每个污染基因在每个细胞中的污染表达量Cp,再将细胞的污染基因的基因表达量C
raw
减去计算得到的污染表达量,则为实际表达量C
clean
。2.根据权利要求1所述的一种单细胞转录组RNA污染去除方法,其特征在于,所述A类拐点的求解方法如下:SA21,以barcode的排名为X轴,基因表达量为Y轴绘制散点图;SA22,在所述散点图上,间隔规定距离取最近的一个点,求相邻两个点之间的斜率;SA23,当斜率的变化趋势为由小到大,且在该趋势持续过程中,斜率首次小于设定的斜率阈值时,将对应的点设为A类拐点。3.根据权利要求1所述的一种单细胞转录组RNA污染去除方法,其特征在于,所述B类拐点的求解方法如下:...

【专利技术属性】
技术研发人员:陈哲名陈志锋方超韩斐然
申请(专利权)人:杭州链康医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1