一种RNA-seq差异表达基因的判定方法及应用技术

技术编号：32220775 阅读：14 留言：0更新日期：2022-02-09 17:26

本发明专利技术公开了一种RNA

全部详细技术资料下载

【技术实现步骤摘要】
一种RNA
‑
seq差异表达基因的判定方法及应用

[0001]本专利技术涉及单细胞生物
，尤其涉及一种RNA
‑
seq差异表达基因的判定方法及应用。

技术介绍

[0002]单细胞RNA
‑
seq技术可以全面地描绘在采样时刻单个细胞的表达谱特征信息。由于现在的单细胞技术可以同时获取多个细胞的信息，因此为更好的理解生物学和临床的问题提供了一个强有力的工具。很多情况下人们会从多个条件下获取样本，比疾病和正常；然后通过对比不同条件下的细胞表达谱特征的区别来推测条件改变对细胞的影响。其中，差异表达基因的判定至关重要。
[0003]目前有两种思路来帮助人们找出差异表达基因，一种是依据表达水平差异幅度，一种是基于差异的显著性。前者最常用的是基因表达水平的变化倍数。但是由于缺乏广泛接受的标准，变化倍数的阈值往往由人为确定，主管偏差大。后者基于p值的，有广泛接受的阈值(0.05).但是由于所要评估的基因数目往往上万，p值需要做多重检验校正，比如Bonferroni,FDR校正等。但是基于p值也有它的问题。比如选取何种校正方法以及阈值的选取也需要谨慎选择。
[0004]由于数据的特征千差万别，每套数据都需要选择合适的阈值参数。目前还没有一种方法可以根据不同数据的特征选取差异表达基因最优解，缺乏判定差异表达基因的统一标准。
[0005]因此，本领域的技术人员致力于开发基于一种可以根据不同的数据自动调整的，并不需要人为干预，从而降低了人为干预误差的差异表达基...

【技术保护点】

【技术特征摘要】
1.一种单细胞RNA
‑
seq差异表达基因的判定方法，其特征在于，所述方法包括以下步骤：步骤1、比较两组单细胞RNA
‑
seq的基因表达水平，确定给定所述表达水平后基因方差的预期值，其中，所述噪声污染基因为所述方差低于预期值的基因；所述信号基因为所述方差低于预期值的基因；只保留所述信号基因；步骤2、使用t
‑
test差异表达基因判定方法计算步骤1保留的所述信号基因中每个基因的p值，选取所述p值不显著的基因作为非差异表达基因；步骤3、使用PLS模型构建步骤1中所述两组单细胞RNA
‑
seq的基因表达水平数据间的差异特征；步骤4、然后使用所述PLS模型提取并保留所述数据中两组间的差异特征分量，去除与分类无关的分量，获得处理过的数据；步骤5、通过计算非差异表达基因在步骤4得到的处理过的数据中的残留值分布特征，所述残留值显著高于步骤2得到的所述非差异表达基因的基因则为所述差异表达基因。2.如权利要求1所述的方法，其特征在于，所述步骤1还包括：使用分段线性回归模型确定所述给定所述表达水平后基因方差的预期值。3.如权利要求2所述的方法，其特征在于，所述分段线性回归模型的计算公式为：σ2/μ2＝a0+a1/μ，其中，所述μ为所述每一个基因的平均表达水平，所述σ2为所述每一个基因的平均表达水平的方差，所述给定所述表达水平...

【专利技术属性】
技术研发人员：王蕊，
申请(专利权)人：浙江百麦生物科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人