一种细胞亚型智能判定方法技术

技术编号:31833850 阅读:12 留言:0更新日期:2022-01-12 13:11
本发明专利技术公开了一种细胞亚型智能判定方法,根据确定好细胞类型的单细胞数据,建立含有多种细胞类型的数据库,并对数据库内的单细胞数据进行细胞类型分类;根据确定好细胞类型的单细胞数据,通过基因表达情况进行计算,得到每个细胞类型的特征表达打分模型;然后将新的细胞数据导入到特征表达打分模型进行识别打分,则得到新的细胞的基因表达情况;将得到新的细胞的基因表达情况于收录在含有多种细胞类型的数据库内的单细胞数据进行对比,则得到新的细胞的细胞类型,完成对新的细胞的分类;构建了一个完善的数据库,通过特征表达打分模型,能够自动化的对输入的数据进行识别打分,然后判定出不同细胞类型,从而能够精确的去判断细胞类型。胞类型。胞类型。

【技术实现步骤摘要】
一种细胞亚型智能判定方法


[0001]本专利技术涉及细胞分类
,具体为一种细胞亚型智能判定方法。

技术介绍

[0002]随着人工智能技术的成熟,机器学习的应用范围越来越广泛,例如数据挖掘、自然语言处理、DNA序列预测等等。在生物学研究领域,大量的识别和分类生物特征,对于研究人员来说工作量十分巨大。而在生物特征中对于细胞特征的分析既基础又重要。
[0003]目前,对细胞的分析主要靠研究人员人眼观察进行分类识别,观察大量的样本数据很容易因疲劳而导致误差;或者,也利用一些常用的细胞染色方法对细胞进行分类识别,但是染色反应局限于细胞自身的特性,导致不同的细胞有可能呈现同样或者相近的颜色,不利于研究。例如,在疾病诊断时,病理图像经过染色后,医生会根据染色后的图像判断细胞是否发生病变等医学问题。但在医生观察病理图像时,很容易因工作压力、视觉疲劳等各种问题导致诊断结果出错,我们对此做出改进,提出一种细胞亚型智能判定方法。

技术实现思路

[0004]为了解决上述技术问题,本专利技术提供了如下的技术方案:
[0005]提供一种细胞亚型智能判定方法,包括以下几个步骤:
[0006]步骤1,根据确定好细胞类型的单细胞数据来建立含有多种细胞类型的数据库,并对数据库内的单细胞数据进行细胞类型分类;
[0007]步骤2、根据确定好细胞类型的单细胞数据,通过基因表达情况进行计算,得到每个细胞类型的特征表达打分模型;
[0008]步骤3、将新的细胞数据导入到特征表达打分模型进行识别打分,则得到新细胞的基因表达情况;
[0009]步骤4、将得到新细胞的基因表达情况与收录了含有多种细胞类型的数据库内的单细胞数据进行对比,则得到新细胞基因表达信息对比情况;
[0010]步骤5、基于新细胞基因表达信息对比情况,判断新细胞的细胞类型,从而完成对新的细胞的分类。
[0011]作为本专利技术的一种优选技术方案,所述的得到每个细胞类型的特征表达打分模型的方法,是采用cell blast的算法得到,得到每个细胞类型的特征表达矩阵,具体过程为,找到鉴定好细胞类型的数据,拿到细胞类型的鉴定结果生成数据集,选择合适的vargenes进行model训练、无监督降维并拟合成DIRECTi模型,然后进行函数内部自动数据标化和聚类并把细胞投影到cell embedding space上,进行降维和可视评估相同细胞类型的聚类情况,即相同细胞类型没有聚集在一起的数据会被弃用,根据原始样本情况进行批次矫正;评估相关信息重复训练多个模型,其中每个模型有自己随机的seed,并和原始的参考数据集合并为一个cell_blast database,最后加载合适的待测数据集。算法会通过潜在空间中基于欧几里德距离的有效最近邻搜索来得到待测数据集的初始匹配结果。
[0012]作为本专利技术的一种优选技术方案,所述的将新的细胞数据导入到特征表达打分模型进行识别打分的方法是,将新的细胞数据在多个模型中的结果进行合并,并且对p值进行过滤,得到一个python dist key是细胞名查询的结果,该结果会给出当前细胞在潜在空间里的命中次数,当前预测细胞类型在空间中的总值以及预测结果的p值并综合测试结果给出最终的细胞类型预测结果。
[0013]作为本专利技术的一种优选技术方案,当得到新的细胞的细胞类型后,则对新输入的细胞数据进行一个细胞注释。
[0014]作为本专利技术的一种优选技术方案,所述对细胞亚型进行分类,细胞亚型分类的时候一般我们都需要marker基因对其进行分类。
[0015]作为本专利技术的一种优选技术方案,所述的对数据库内的单细胞数据进行细胞类型分类的方式是,利用marker基因对其进行分类。
[0016]本专利技术的有益效果是:该种细胞亚型智能判定方法根据确定好细胞类型的单细胞数据来建立含有多种细胞类型的数据库,并对数据库内的单细胞数据进行细胞类型分类;根据确定好细胞类型的单细胞数据,通过基因表达情况进行计算,得到每个细胞类型的特征表达打分模型;然后将新细胞的数据导入到特征表达打分模型进行识别打分,则得到新细胞的基因表达情况;进一步将新细胞的基因表达情况与收录了含有多种细胞类型的数据库内的单细胞数据进行对比,则得到新细胞的细胞类型,从而完成对新细胞的分类;构建了一个完善的数据库,通过特征表达打分模型,能够自动化的对输入的数据进行识别打分,然后判定出不同细胞类型,并且标注上,从而能够精确的去判断细胞类型。
附图说明
[0017]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:
[0018]图1是本专利技术一种细胞亚型智能判定方法的流程图。
具体实施方式
[0019]以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。
[0020]实施例1:
[0021]一种细胞亚型智能判定方法,如图1所示,基于前期已有的确定好细胞类型的单细胞数据,构建含有多种细胞类型的数据库,进一步,对数据库内的每一个细胞的数据进行划分,确定细胞类型的分类;
[0022]已确定好细胞类型的单细胞数据,采用cell blast的算法对细胞基因表达情况进行计算,选择合适的vargenes进行model训练、无监督降维并拟合成DIRECTi模型,然后进行函数内部自动数据标化和聚类并把细胞投影到cell embedding space上,进行降维和可视评估相同细胞类型的聚类情况,根据原始样本情况进行批次矫正;评估相关信息重复训练多个模型,最后加载合适的待测数据集。算法会通过潜在空间中基于欧几里德距离的有效最近邻搜索来得到待测数据集的初始匹配结果,得到每个细胞类型的特征表达打分模型;
[0023]新细胞的数据导入到特征表达打分模型进行识别打分,对新录入细胞的数据在多
个模型中的结果进行合并,并且对p值进行过滤,则得到新细胞的基因表达情况;
[0024]新细胞的基因表达情况与收录了含有多种细胞类型的数据库内的单细胞数据进行对比,则得到新细胞基因表达信息对比情况;
[0025]基于新细胞基因表达信息对比情况,判断新细胞的细胞类型,从而完成对新的细胞的分类。结果为构建了一个完善的数据库,通过特征表达打分模型,能够自动化的对输入的数据进行识别打分,然后判定出不同细胞类型,并且标注上,从而能够精确的去判断细胞类型。
[0026]得到新的细胞的细胞类型后,则对新输入的细胞数据进行一个细胞注释。
[0027]所述对细胞亚型进行分类,细胞亚型分类的时候一般需要marker基因对其进行分类。
[0028]基于多个数据集的细胞类群识别:识别多个数据集时,不同的数据集判断不同的细胞,有的专门判断成纤维细胞,有的判断免疫细胞,有的判断T细胞、B细胞、树突状细胞、巨噬细胞、上皮细胞、成纤维细胞、内皮细胞、自然杀伤细胞、红细胞、脂肪细胞、干细胞、恶本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种细胞亚型智能判定方法,其特征在于:包括以下几个步骤,步骤1,根据已有确定好细胞类型的单细胞数据,建立含有多种细胞类型的数据库,并对数据库内的单细胞数据进行细胞类型分类;步骤2、根据确定好细胞类型的单细胞数据,通过基因表达情况进行计算,得到每个细胞类型的特征表达打分模型;步骤3、将新细胞数据导入到特征表达打分模型进行识别打分,则得到新细胞的基因表达情况;步骤4、将得到新细胞的基因表达情况与收录了含有多种细胞类型的数据库内的单细胞数据进行对比,则得到新细胞基因表达信息对比情况;步骤5、基于新细胞基因表达信息对比情况,判断新细胞的细胞类型,从而完成对新的细胞的分类。2.根据权利要求1所述的一种细胞亚型智能判定方法,其特征在于,所述的得到每个细胞类型的特征表达打分模型的方法,是采用cell blast的算法得到,得到每个细胞类型的特征表达矩阵,具体过程为,找到鉴定好细胞类型的数据,拿到细胞类型的鉴定结果生成数据集,选择合适的vargenes进行model训练、无监督降维并拟合成DIRECTi模型,然后进行函数内部自动数据标化和聚类并把细胞投影到cell embedding space上,进行降维和可视评估相同细胞类型的聚类情况,即相同细胞类型没有聚集在一起的数据会被弃用,根据原...

【专利技术属性】
技术研发人员:宗杰张博
申请(专利权)人:上海烈冰生物医药科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1