System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 肿瘤良恶性的鉴别模型的构建方法、其装置和应用制造方法及图纸_技高网

肿瘤良恶性的鉴别模型的构建方法、其装置和应用制造方法及图纸

技术编号:44778269 阅读:2 留言:0更新日期:2025-03-26 12:57
本发明专利技术提供了一种肿瘤良恶性的鉴别模型的构建方法、其装置和应用。其中,构建方法包括:计算已知阳性样本基因组的各区域的log2R的平均数和中位数;利用各区域的log2R的平均数和中位数,计算已知样本的CNV变异的占比及长度;利用已知阳性样本的CNV变异的占比及长度与肿瘤性质构建机器学习模型,从而获得鉴别模型;其中,log2R为已知阳性样本基因组中的CpG位点的甲基化芯片检测信号强度与对照样本中的同一CpG位点的甲基化芯片检测信号强度的比值的对数值。利用上述方法能够得到鉴别肿瘤良恶性的预测模型,不受到样本个体异质性的影响,能够更为全面的得到患者的肿瘤信息,为下一步的诊断和治疗提供判断依据。

【技术实现步骤摘要】

本专利技术涉及基因组学,具体而言,涉及一种肿瘤良恶性的鉴别模型的构建方法、其装置和应用


技术介绍

1、甲基化芯片是一种基于基因芯片技术,用于检测dna甲基化状态的高通量测序技术,其在癌症研究、遗传疾病等医学领域广泛地用于甲基化生物标志物的挖掘。illumina的epic技术通过获取cpg位点的甲基化和非甲基化的荧光信号来计算该位点的甲基化水平,同时该位点的荧光信号的强度也代表了该位点的dna数量,通过生物信息学算法可以分析甲基化芯片数据的拷贝数变异。

2、其中,肿瘤细胞的染色体非常不稳定,会发生大片段的扩增或者缺失,一些恶性肿瘤的癌细胞会转移到胸膜,形成胸水。很多胸科疾病(肺癌、肺结核、肺炎等)都会引起胸腔积液(简称胸水)的形成,明确病因是进一步针对性治疗的关键。目前,病因的分析需要结合影像学、胸水细胞学及患者的症状等进行判断。

3、在现有技术中,主要用于诊断胸水良恶性的方法,包括胸水细胞学方法、pcr甲基化方法。胸水细胞学是临床上诊断恶性胸水特异性非常高的方法,但当脱落到浆膜腔的肿瘤细胞稀少、多种因素引发恶性肿瘤细胞发生破坏、分化良好的腺癌细胞与增生的间皮细胞形态易混淆存在时,临床细胞学诊断的敏感性将降低。此外,影响临床细胞学鉴别良恶性胸腹腔积液的因素,还包括院内细胞学的诊断水平和免疫细胞学染色的方法。最近几年,基于pcr技术的甲基化标志物的检测,也成为了肿瘤鉴定的方法之一,一种基于shox2、rassf1a、septin9和hoxa9基因的pcr甲基化技术,也应用于血液、胸腔及腹腔积液的良恶性诊断。但肿瘤个体的异质性非常高,这4个基因的甲基化水平并不能覆盖所有恶性肿瘤样本。因而,如何提供一种能够较准确的提供肿瘤良恶性鉴别的方法对患者的后续治疗具有较大的意义。


技术实现思路

1、本专利技术的主要目的在于提供一种肿瘤良恶性的鉴别模型的构建方法、其装置和应用,以解决现有技术中肿瘤良恶性检测方法准确性较低的问题。

2、为了实现上述目的,根据本专利技术的第一个方面,提供了一种肿瘤良恶性的鉴别模型的构建方法,该构建方法包括:计算已知阳性样本基因组的各区域的log2r的平均数和中位数;利用各区域的log2r的平均数和中位数,计算已知阳性样本的cnv变异的占比及长度;利用已知阳性样本的cnv变异的占比及长度与肿瘤性质构建机器学习模型,从而获得鉴别模型;其中,log2r为已知阳性样本基因组中的cpg位点的甲基化芯片检测信号强度与对照样本中的同一cpg位点的甲基化芯片检测信号强度的比值的对数值。

3、进一步地,区域为甲基化芯片检测信号强度相同且坐标相邻的bin的集合;优选地,bin为基因组中依据cpg位点分布划分得到的片段区域;优选地,bin的长度为5000bp-5000000bp;优选地,bin内的cgg位点的数量≥15个;优选地,在进行计算已知阳性样本基因组的各区域的log2r的平均数和中位数之前,构建方法还包括:计算每一个bin内的所有cpg位点的log2r的平均数,记为每一个bin的log2r;优选地,各区域的log2r的平均数为每一个区域内的所有bin的log2r的平均数;优选地,各区域的log2r的中位数为每一个区域内的所有bin的log2r的中位数。

4、进一步地,对照样本选自表1所示的细胞系中的至少一种;优选地,利用lasso算法建立鉴别模型;优选地,利用cbs算法计算已知阳性样本基因组的各区域的log2r的平均数和中位数;优选地,已知阳性样本基因组的样本包括:胸水、血液或组织。

5、进一步地,计算已知阳性样本的cnv变异的占比及长度包括:计算log2r的平均数>0.1或< -0.1的区域数量占总区域数量的比值;计算log2r的中位数> 0.1或< -0.1的区域数量占总区域数量的比值;计算每一个区域的log2r的平均数与区域的长度的乘积的总和;计算每一个区域的log2r的中位数与区域的长度的乘积的总和。

6、为了实现上述目的,根据本专利技术的第二个方面,提供了一种肿瘤良恶性鉴别的方法,该方法包括:计算待测样本基因组的各区域的log2r的平均数和中位数;利用各区域的log2r的平均数和中位数,计算待测样本的cnv变异的占比及长度;将待测样本的cnv变异的占比及长度输入上述的构建方法得到的肿瘤良恶性的鉴别模型中处理,输出待测样本的肿瘤性质;其中,log2r为待测样本基因组中的cpg位点的甲基化芯片检测信号强度与对照样本中的同一cpg位点的甲基化芯片检测信号强度的比值的对数值。

7、进一步地,区域为甲基化芯片检测信号强度相同且坐标相邻的bin的集合;优选地,bin为基因组中依据cpg位点分布划分得到的片段区域;优选地,bin的长度为5000bp-5000000bp;优选地,bin内的cgg位点的数量≥15个;优选地,在进行计算待测样本基因组的各区域的log2r的平均数和中位数之前,方法还包括:计算每一个bin内的所有cpg位点的log2r的平均数,记为每一个bin的log2r;优选地,各区域的log2r的平均数为每一个区域内的所有bin的log2r的平均数;优选地,各区域的log2r的中位数为每一个区域内的所有bin的log2r的中位数。

8、进一步地,对照样本选自表1所示的细胞系中的至少一种;优选地,利用cbs算法计算待测样本基因组的各区域的log2r的平均数和中位数;优选地,待测样本基因组的样本包括:胸水、血液或组织。

9、进一步地,计算待测样本的cnv变异的占比及长度包括:计算log2r的平均数> 0.1或< -0.1的区域数量占总区域数量的比值;计算log2r的中位数> 0.1或< -0.1的区域数量占总区域数量的比值;计算每一个区域的log2r的平均数与区域的长度的乘积的总和;计算每一个区域的log2r的中位数与区域的长度的乘积的总和。

10、为了实现上述目的,根据本专利技术的第三个方面,提供了一种肿瘤良恶性的鉴别模型的构建装置,该构建装置包括:区域计算模块,被设置为计算已知阳性样本基因组的各区域的log2r的平均数和中位数;cnv变异计算模块,被设置为利用各区域的log2r的平均数和中位数,计算已知阳性样本的cnv变异的占比及长度;模型输出模块,被设置为利用已知阳性样本的cnv变异的占比及长度与肿瘤性质,建立鉴别模型;其中,log2r为已知阳性样本基因组中的cpg位点的甲基化芯片检测信号强度与对照样本中的同一cpg位点的甲基化芯片检测信号强度的比值的对数值。

11、进一步地,区域为甲基化芯片检测信号强度相同且坐标相邻的bin的集合;优选地,bin为基因组中依据cpg位点分布划分得到的片段区域;优选地,bin的长度为5000bp-5000000bp;优选地,bin内的cgg位点的数量≥15个;优选地,区域计算模块之前,构建装置包括:bin计算模块,被设置为计算每一个bin内的所有cpg位点的log2r的平均数,即为每一个bin的lo本文档来自技高网...

【技术保护点】

1.一种肿瘤良恶性的鉴别模型的构建方法,其特征在于,所述构建方法包括:

2.根据权利要求1所述的构建方法,其特征在于,所述区域为所述甲基化芯片检测信号强度相同且坐标相邻的bin的集合;

3.根据权利要求1所述的构建方法,其特征在于,在进行所述计算已知阳性样本基因组的各区域的log2R的平均数和中位数之前,所述构建方法还包括:

4.根据权利要求1所述的构建方法,其特征在于,所述对照样本选自表1所示的细胞系中的至少一种;

5.根据权利要求1所述的构建方法,其特征在于,所述计算所述已知阳性样本的CNV变异的占比及长度包括:

6.一种肿瘤良恶性鉴别的方法,其特征在于,所述方法包括:

7.根据权利要求6所述的方法,其特征在于,所述区域为所述甲基化芯片检测信号强度相同且坐标相邻的bin的集合;

8.根据权利要求6所述的方法,其特征在于,在进行所述计算待测样本基因组的各区域的log2R的平均数和中位数之前,所述方法还包括:

9.根据权利要求6所述的方法,其特征在于,所述对照样本选自表1所示的细胞系中的至少一种;

10.根据权利要求6所述的方法,其特征在于,所述计算所述待测样本的CNV变异的占比及长度包括:

11.一种肿瘤良恶性的鉴别模型的构建装置,其特征在于,所述构建装置包括:

12.根据权利要求11所述的构建装置,其特征在于,所述区域为所述甲基化芯片检测信号强度相同且坐标相邻的bin的集合;

13.根据权利要求11所述的构建装置,其特征在于,所述区域计算模块之前,所述构建装置包括:

14.根据权利要求11所述的构建装置,其特征在于,所述对照样本选自表1所示的细胞系中的至少一种;

15.根据权利要求11所述的构建装置,其特征在于,所述CNV变异计算模块包括:

16.一种肿瘤良恶性鉴别的装置,其特征在于,所述装置包括:

17.根据权利要求16所述的装置,其特征在于,所述区域为所述甲基化芯片检测信号强度相同且坐标相邻的bin的集合;

18.根据权利要求16所述的装置,其特征在于,所述区域计算模块之前,所述装置包括:

19.根据权利要求16所述的装置,其特征在于,所述对照样本选自表1所示的细胞系中的至少一种;

20.根据权利要求16所述的装置,其特征在于,所述CNV变异计算模块包括:

21.一种计算机可读储存介质,其特征在于,所述储存介质包括存储的程序,其中,在所述程序运行时,控制所述储存介质所在设备执行权利要求1至5中任一项所述的构建方法或权利要求6至10中任一项所述的方法。

22.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行权利要求1至5中任一项所述的构建方法或权利要求6至10中任一项所述的方法。

...

【技术特征摘要】

1.一种肿瘤良恶性的鉴别模型的构建方法,其特征在于,所述构建方法包括:

2.根据权利要求1所述的构建方法,其特征在于,所述区域为所述甲基化芯片检测信号强度相同且坐标相邻的bin的集合;

3.根据权利要求1所述的构建方法,其特征在于,在进行所述计算已知阳性样本基因组的各区域的log2r的平均数和中位数之前,所述构建方法还包括:

4.根据权利要求1所述的构建方法,其特征在于,所述对照样本选自表1所示的细胞系中的至少一种;

5.根据权利要求1所述的构建方法,其特征在于,所述计算所述已知阳性样本的cnv变异的占比及长度包括:

6.一种肿瘤良恶性鉴别的方法,其特征在于,所述方法包括:

7.根据权利要求6所述的方法,其特征在于,所述区域为所述甲基化芯片检测信号强度相同且坐标相邻的bin的集合;

8.根据权利要求6所述的方法,其特征在于,在进行所述计算待测样本基因组的各区域的log2r的平均数和中位数之前,所述方法还包括:

9.根据权利要求6所述的方法,其特征在于,所述对照样本选自表1所示的细胞系中的至少一种;

10.根据权利要求6所述的方法,其特征在于,所述计算所述待测样本的cnv变异的占比及长度包括:

11.一种肿瘤良恶性的鉴别模型的构建装置,其特征在于,所述构建装置包括:

12.根据权利要求11所述的构建装...

【专利技术属性】
技术研发人员:车南颖孙祖钰张敏罗方匡倍庆
申请(专利权)人:首都医科大学附属北京胸科医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1