System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请属于分子生物医学,具体地,涉及基于cfdna的癌症甲基化标志物筛选方法、装置及电子设备。
技术介绍
1、针对不同细胞起源的癌症亚型,尤其是腺癌的早期鉴定对于癌症预防诊治具有越来越重要的积极意义。早期癌症基因组图谱计划(the cancer genome atlas,tcga)的发布推动了面向泛癌的基础和临床研究。研究者们通过整合33种癌症的多维度数据分析发现,包含基因表达和甲基化等在内的多种分子特征可以刻画不同细胞类型来源的癌症类型,如肺腺癌、乳腺癌、胃腺癌、结直肠癌、食管腺癌、胰腺癌等来自于腺上皮细胞的癌症样本,其显示出相似的分子特征模式。而食管鳞癌、肺鳞癌、宫颈癌等则表现为截然不同的分子特征。
2、当然,上述的研究成果来自于癌症患者的组织样本,并不适用于癌症的早期检测。血浆游离dna(cfdna)是外周血中游离于细胞外的dna,来源是机体细胞通过细胞凋亡、坏死,而分泌释放到血液中。其中,大多数cfdna来自于血细胞释放的dna片段。而对于癌症患者,例如早期患者,cfdna中存在极少数比例来自于癌细胞的dna片段。因此,近几年cfdna的一个分支循环肿瘤dna(ctdna)检测技术已成为癌症早筛的主要方法之一。
3、目前基于ctdna的癌症检测的技术难点主要表现在:1)含量低、背景噪音大而难以检测,特别是在癌症早期阶段的检测中这些问题更为显著,这可以通过增加测序深度克服,为了均衡测序深度与成本,通常优先确定一组高质量的目标分子并设计探针,然后再进行目标分子检测;2)癌症高异质性,cfdna中标志物
4、考虑到上述问题,本申请根据血浆中cfdna的甲基化信息在癌症亚型早筛、早诊的体外检测产品中的杰出潜力,基于cfdna的甲基化靶向测序数据设计了一种可以针对不同起源肿瘤细胞类型的特异的标志物筛选方法,用于亚型特异的多种癌症的早筛早检。
技术实现思路
1、为了解决现有技术中存在的问题,本申请的目的在于提供基于cfdna的癌症甲基化标志物筛选方法,针对细胞来源特异的癌症亚型,利用样本血浆中提取的cfdna靶向测序得到的cpg位点来筛选高特异性的甲基化标志物,可以在肺腺癌、结直肠腺癌、胃腺癌、甲状腺癌、食管腺癌、胰腺癌等多种腺癌早期检测中提供相应的甲基化标志物;并且本申请还基于cfdna的癌症甲基化标志物筛选方法提供了多个腺癌标志物,在特异癌症亚型中可以表现出优异的癌症样本和健康样本分类性能。
2、具体来说,本申请涉及如下方面:
3、1.基于cfdna的癌症甲基化标志物筛选方法,包括:分别提取第一人群和第二人群的多个cfdna样本,提取每个cfdna样本在目标区间的所有cpg位点以及每个cpg位点的甲基化值,以分别得到第一人群样本集和第二人群样本集;从第一人群样本集和第二人群样本集中分别选取部分或全部样本组成训练样本集,合并来自第一人群样本集和第二人群样本集的训练样本集并平均划分为l个训练样本子集,多次选取l个训练样本子集中的l-1个训练样本子集,筛选l-1个训练样本子集中第一人群和第二人群的差异cpg位点,得到多个候选甲基化标志物集;通过多个候选甲基化标志物集分别构建多个筛选模型,利用多个筛选模型提取甲基化标志物集。
4、2.根据项1的基于cfdna的癌症甲基化标志物筛选方法,其中,筛选l-1个训练样本子集中第一人群和第二人群的差异cpg位点包括:删除l-1个训练样本子集中的出现缺失值的cpg位点;计算l-1个训练样本子集中的属于第一人群样本集的每个cpg位点的第一方差和属于第二人群样本集的每个cpg位点的第二方差,响应于第一方差和/或第二方差大于第一阈值删除对应的cpg位点。
5、3.根据项1的基于cfdna的癌症甲基化标志物筛选方法,其中,筛选l-1个训练样本子集中第一人群和第二人群的差异cpg位点包括:利用lasso回归得到l-1个训练样本子集中的属于第一人群样本集和/或属于第二人群样本集的每个cpg位点的贡献度值,响应于贡献度值不大于第二阈值删除对应的cpg位点。
6、4.根据项1-3中任一项的基于cfdna的癌症甲基化标志物筛选方法,其中,通过多个候选甲基化标志物集分别构建多个筛选模型,利用多个筛选模型提取甲基化标志物集包括:确定多个筛选模型中的每个筛选模型所用的候选甲基化标志物;统计所有候选甲基化标志物在多个筛选模型中的复现次数;响应于在多个筛选模型中的复现次数小于第三阈值删除对应的候选甲基化标志物,响应于在多个筛选模型中的复现次数大于第三阈值保留对应的候选甲基化标志物并组成甲基化标志物集。
7、5.根据项3的基于cfdna的癌症甲基化标志物筛选方法,其中,利用lasso回归得到l-1个训练样本子集中的属于第一人群样本集和/或属于第二人群样本集的每个cpg位点的贡献度值包括:设置lasso回归的正则化参数为最小误差的1倍标准差,以计算l-1个训练样本子集中的属于第一人群样本集和/或属于第二人群样本集的每个cpg位点的贡献度值。
8、6.根据项1的基于cfdna的癌症甲基化标志物筛选方法,其中,第一人群为癌症患者人群,第二人群为健康人群。
9、7.根据项1的基于cfdna的癌症甲基化标志物筛选方法,其中,多个筛选模型包括一个或多个广义线性模型。
10、8.基于cfdna的癌症甲基化标志物筛选装置,包括:样本提取单元,分别提取第一人群和第二人群的多个cfdna样本,提取每个cfdna样本在目标区间的所有cpg位点以及每个cpg位点的甲基化值,以分别得到第一人群样本集和第二人群样本集;标志物提取单元,从第一人群样本集和第二人群样本集中分别选取部分或全部样本组成训练样本集,合并来自第一人群样本集和第二人群样本集的训练样本集并平均划分为l个训练样本子集,多次选取l个训练样本子集中的l-1个训练样本子集,筛选l-1个训练样本子集中第一人群和第二人群的差异cpg位点,得到多个候选甲基化标志物集;标志物确定单元,通过多个候选甲基化标志物集分别构建多个筛选模型,利用多个筛选模型提取甲基化标志物集。
11、9.根据项8的基于cfdna的癌症甲基化标志物筛选装置,其为执行如项1-7的基于cfdna的癌症甲基化标志物筛选方法。
12、10.一种电子设备,包括:处理器;以及存储器,在存储器中存储有计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行如项1-7中任一项的基于cfdna的癌症甲基化标志物筛选方法。
13、11.一种腺癌检测的标志物,其中,标志物包含下述中的一种或两种以上:1号染色体的142619144至142619145位的基因组区域、1号染色体的149673092至149673093位的基因组区域、2号染色体的133015244至1330152本文档来自技高网...
【技术保护点】
1.基于cfDNA的癌症甲基化标志物筛选方法,包括:
2.根据权利要求1所述的基于cfDNA的癌症甲基化标志物筛选方法,
3.根据权利要求1所述的基于cfDNA的癌症甲基化标志物筛选方法,
4.根据权利要求1-3中任一项所述的基于cfDNA的癌症甲基化标志物筛选方法,
5.根据权利要求3所述的基于cfDNA的癌症甲基化标志物筛选方法,
6.根据权利要求1所述的基于cfDNA的癌症甲基化标志物筛选方法,
7.根据权利要求1所述的基于cfDNA的癌症甲基化标志物筛选方法,
8.基于cfDNA的癌症甲基化标志物筛选装置,包括:
9.根据权利要求8所述的基于cfDNA的癌症甲基化标志物筛选装置,其为执行如权利要求1-7所述的基于cfDNA的癌症甲基化标志物筛选方法。
10.一种电子设备,包括:
【技术特征摘要】
1.基于cfdna的癌症甲基化标志物筛选方法,包括:
2.根据权利要求1所述的基于cfdna的癌症甲基化标志物筛选方法,
3.根据权利要求1所述的基于cfdna的癌症甲基化标志物筛选方法,
4.根据权利要求1-3中任一项所述的基于cfdna的癌症甲基化标志物筛选方法,
5.根据权利要求3所述的基于cfdna的癌症甲基化标志物筛选方法,
6....
【专利技术属性】
技术研发人员:关晋霞,周光朋,李永君,彭勇飞,王秀秀,田继超,李琪,
申请(专利权)人:博尔诚北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。