System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及预测模型训练,尤其是一种病变预测模型训练方法、病理数据的处理方法、系统、设备及介质。
技术介绍
1、宫颈癌仍然是全球妇科癌症相关死亡的主要原因,并且是全球女性中第四大最常见的癌症,仅次于乳腺癌、结直肠癌和肺癌。尽管宫颈癌患者在临床表现上存在差异,但高危人乳头瘤病毒(hpv)感染仍然是宫颈癌肿瘤发生的重要起始事件。最常见的宫颈筛查方法是液基细胞学和hpv检测或两者的结合,尽管细胞学具有很高的特异性,但hpv检测更为敏感。
2、但即使属于同一高危型,不同hpv基因分型的致病性也不尽相同,鉴于hpv的细胞学和全基因分型检测数据集的巨大规模,了解和管理宫颈筛查结果变得更加复杂,大量临床数据创造的迫切需要智能工具对其进行充分、安全和高效的分析。
技术实现思路
1、本专利技术要解决的技术问题是为了克服现有技术中缺乏对hpv的细胞学和全基因分型检测数据集的分析工具的缺陷,提供一种病变预测模型训练方法、病理数据的处理方法、系统、设备及介质。
2、本专利技术是通过下述技术方案来解决上述技术问题:
3、第一方面提供一种病变预测模型的训练方法,所述训练方法包括:
4、获取病理样本数据集,所述病理样本数据包括关联的细胞学数据、hpv全基因型检测数据和年龄数据;
5、以所述病理样本数据集为输入,hsil(高度鳞状上皮内病变)置信度为输出,采用预设网络模型进行训练以得到所述病变预测模型。
6、较佳地,所述采用预设网络模型进行
7、采用catboost模型进行训练,并在训练过程中基于网格搜索算法确定所述catboost模型的目标运行参数。
8、较佳地,所述采用catboost模型进行训练,并在训练过程中基于网格搜索算法确定所述catboost模型的目标运行参数的步骤包括:
9、将所述病理样本数据集分为训练集和测试集;
10、将所述训练集作为输入,对应的第一置信度为输出,采用catboost模型进行训练;
11、将测试集输入训练后的所述catboost模型,基于所述catboost模型输出的对应的第二置信度;
12、将所述第一置信度和所述第二置信度基于网格搜索算法计算得到所述catboost模型的目标运行参数;
13、将基于所述目标运行参数对应的所述catboost模型作为所述病变预测模型。
14、第二方面提供一种病理数据的处理方法,所述处理方法包括:
15、获取目标病理数据;
16、将所述目标病理数据输入病变预测模型,输出对应的hsil置信度;
17、其中,所述病变预测模型利用上述的病变预测模型的训练方法得到;
18、基于所述hsil置信度对所述目标病理数据进行病理分类。
19、第三方面提供一种病变预测模型的训练系统,所述训练系统包括样本获取模块和训练模块;
20、所述样本获取模块,用于获取病理样本数据集,所述病理样本数据包括关联的细胞学数据、hpv全基因型检测数据和年龄数据;
21、所述训练模块,用于以所述病理样本数据集为输入,hsil置信度为输出,采用预设网络模型进行训练以得到所述病变预测模型。
22、较佳地,所述训练模块,还用于采用catboost模型进行训练,并在训练过程中基于网格搜索算法确定所述catboost模型的目标运行参数。
23、较佳地,所述获取模块,还用于将所述病理样本数据集分为训练集和测试集;
24、所述训练模块,还用于将所述训练集作为输入,对应的第一置信度为输出,采用catboost模型进行训练;
25、将测试集输入训练后的所述catboost模型,基于所述catboost模型输出的对应的第二置信度;将所述第一置信度和所述第二置信度基于网格搜索算法计算得到所述catboost模型的目标运行参数;将基于所述目标运行参数对应的所述catboost模型作为所述病变预测模型。
26、第四方面提供一种病理数据的处理系统,所述处理系统包括数据获取模块、处理模块和分类模块;
27、所述数据获取模块,用于获取目标病理数据;
28、所述处理模块,用于将所述目标病理数据输入病变预测模型,输出对应的hsil置信度;
29、其中,所述病变预测模型利用上述的病变预测模型的训练系统得到;
30、所述分类模块,用于基于所述hsil置信度对所述目标病理数据进行病理分类。
31、第五方面提供一种电子设备,包括存储器、处理器及存储在存储器上并用于在处理器上运行的计算机程序,所述处理器执行计算机程序时实现如上述的病变预测模型的训练方法;或,实现如上所述的病理数据的处理方法。
32、第六方面提供一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述的病变预测模型的训练方法;或,实现如上述的病理数据的处理方法。
33、本专利技术的积极进步效果在于:采用关联的细胞学数据、hpv全基因型检测数据和年龄数据的病理样本数据集,通过catboost模型训练得到应用于宫颈病变预测的病变预测模型,整个训练过程具有较高的计算和迭代效率,并通过grid search算法精准筛选重要参数,得到高预测性能的病变预测模型。
本文档来自技高网...【技术保护点】
1.一种病变预测模型的训练方法,其特征在于,所述训练方法包括:
2.根据权利要求1所述的病变预测模型的训练方法,其特征在于,所述采用预设网络模型进行训练以得到所述病变预测模型的步骤包括:
3.根据权利要求2所述的病变预测模型的训练方法,其特征在于,所述采用Catboost模型进行训练,并在训练过程中基于网格搜索算法确定所述Catboost模型的目标运行参数的步骤包括:
4.一种病理数据的处理方法,其特征在于,所述处理方法包括:
5.一种病变预测模型的训练系统,其特征在于,所述训练系统包括样本获取模块和训练模块;
6.根据权利要求5所述的训练系统,其特征在于,所述训练模块,还用于采用Catboost模型进行训练,并在训练过程中基于网格搜索算法确定所述Catboost模型的目标运行参数。
7.根据权利要求6所述的训练系统,其特征在于,所述获取模块,还用于将所述病理样本数据集分为训练集和测试集;
8.一种病理数据的处理系统,其特征在于,所述处理系统包括数据获取模块、处理模块和分类模块;
9.
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-3中任一项所述的病变预测模型的训练方法;或,实现如权利要求4中所述的病理数据的处理方法。
...【技术特征摘要】
1.一种病变预测模型的训练方法,其特征在于,所述训练方法包括:
2.根据权利要求1所述的病变预测模型的训练方法,其特征在于,所述采用预设网络模型进行训练以得到所述病变预测模型的步骤包括:
3.根据权利要求2所述的病变预测模型的训练方法,其特征在于,所述采用catboost模型进行训练,并在训练过程中基于网格搜索算法确定所述catboost模型的目标运行参数的步骤包括:
4.一种病理数据的处理方法,其特征在于,所述处理方法包括:
5.一种病变预测模型的训练系统,其特征在于,所述训练系统包括样本获取模块和训练模块;
6.根据权利要求5所述的训练系统,其特征在于,所述训练模块,还用于采用catboost模型进行训练,并在训练过程中基于网格搜索算法确定所...
【专利技术属性】
技术研发人员:丛青,陶祥,陈子任,
申请(专利权)人:复旦大学附属妇产科医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。