【技术实现步骤摘要】
基于PDX的单细胞转录组数据分析方法、系统、设备和介质
[0001]本专利技术属于生物数据处理
,具体地,涉及基于PDX的单细胞转录组数据分析方法、系统、设备和介质。
技术介绍
[0002]PDX(病人来源肿瘤异种移植,Patient
‑
derived tumor xenograft)模型是将来源于患者的肿瘤组织或原代细胞移植到NSG(免疫缺陷)小鼠的体内而构建的肿瘤模型。该模型是将肿瘤组织直接移植到NSG小鼠体内,未经过任何人工培养,所以在组织病理学、分子生物学和基因水平上保留了大部分原代肿瘤的特点,与临床的相似度更高。PDX模型是目前为止最接近临床样本的肿瘤模型,这种模型对于临床肿瘤评估治疗和预后具有重要的意义。
[0003]使用PDX模型进行单细胞转录组测序,可以深入分析肿瘤各个阶段在不同阶段下细胞类型以及基因表达特征,从而为肿瘤的治疗提供指导。目前,10
×
官方分析软件cellranger虽然可以针对PDX模型的多个物种混合库进行数据分析,并得到相应的表达谱矩阵和聚类结果。但是由于人和小鼠物种间存在大量的同源基因,即使来自人的细胞通过人和小鼠的混合基因组分析后,也会有部分reads可以比对上小鼠的基因组,直接基于该表达谱得到的细胞聚类结果以及下游数据分析挖掘得到的结果都会不准确。且由于人和小鼠基因组存在同源序列,也不能直接用比对上人基因组的序列进行分析,会导致部分来自小鼠的细胞最终被错误识别成人的细胞。
[0004]另外,在PDX模型研究中,除了需要研 ...
【技术保护点】
【技术特征摘要】
1.一种基于PDX的单细胞转录组数据分析方法,其特征在于,包括以下步骤:S1,将获得的PDX模型的单细胞转录组测序数据与人和小鼠的混合基因组库进行比对,获得基于所述混合基因组库的细胞
‑
基因表达谱矩阵,其中,所述混合基因组库是将人和小鼠的参考基因组文件和基因注释文件进行合并得到的;S2,根据细胞中表达人基因的比例或表达小鼠基因的比例是否大于等于第一预设阈值P1,识别细胞为人细胞、小鼠细胞或双细胞;S3,基于细胞的barcode,从所述单细胞转录组测序数据中提取识别为人细胞的序列和识别为小鼠细胞的序列;S4,将获得的人细胞的序列与人的参考基因组进行对比,并将获得的小鼠细胞的序列与小鼠的参考基因组进行比对,获得相应的细胞
‑
基因表达谱,其中,P1的设置使得双细胞率与多细胞率的一半相差不超过5%,由下面公式计算双细胞率和多细胞率:双细胞率=(双细胞数目/(人细胞数目+小鼠细胞数目+双细胞数目))
×
100%;多细胞率=(捕获的细胞数目
×
7.589
×
10
‑6+5.272
×
10
‑4)
×
100%。2.根据权利要求1所述的一种基于PDX的单细胞转录组数据分析方法,其特征在于,步骤S2具体包括:S21,统计细胞中表达人基因的数目Nh以及表达小鼠基因的数目Nm;S22,计算细胞中表达的人基因的比例Ph以及表达的小鼠基因的比例Pm,其中Ph=Nh/(Nh+Nm),Pm=Nm/(Nh+Nm);S23,若Ph大于等于第一预设阈值P1,则细胞识别为人细胞,若Pm大于等于第一预设阈值P1,则细胞识别为小鼠细胞,其余为双细胞。3.根据权利要求1所述的一种基于PDX的单细胞转录组数据分析方法,其特征在于,步骤S3中,所述提取识别为人细胞的序列和识别为小鼠细胞的序列具体包括:S31,识别测序序列的barcode,与细胞的barcode进行对比,获得碱基匹配系数Mi,Mi=Lm/Lb,其中,Lm为测序序列的barcode与细胞的barcode匹配的碱基数目,Lb为细胞的barcode的碱基数目;S32,根据Mi与第二预设阈值P2进行序列提取:若Mi=100%,则直接提取对应的序列;若P2≤Mi<100%时,并且未完全匹配上的测序reads对应碱基的测序质量值<10,则将测序reads校正为正确的碱基后提取序列;若Mi<P2,则不提取,其中,P2≥80%。4.根据权利要求3所述的一种基于PDX的单细胞转录组数据分析方法,其特征在于,所述将测序reads校正为正确的碱基是指将测序序列的barcode中测序质量值<10的碱基校正为匹配的细胞的barcode对应位置的碱基。5.根据权利要求1所述的一种基于PDX的单细胞转录组数据分析方法,其特征在于,在步骤S2之后,进行如下步骤:S3
’
,将所述单细胞转录组测序数据与人和小鼠同源基因的整合基因序列集进行比对,获得与整合基因的比对结果;S4
’
,基于步骤S2识别的人细胞和小鼠细胞barcode,从步骤S3
’
得到的比对结果中获得
细胞
‑
整合基因表达谱,其中,所述同源基因的整合基因序列集基于以下步骤得到:(1)将人和小鼠的每个同源基因的序列进行拼接,...
【专利技术属性】
技术研发人员:葛长利,韩斐然,郎秋蕾,
申请(专利权)人:杭州链康医学检验实验室有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。