System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及疾病诊断的机器学习,尤其涉及一种基于呼气测量数据元学习的自适应肺癌筛查方法。
技术介绍
1、由于肺癌起病较为隐匿,往往出现诸如咳血、胸痛、头晕等症状时预示着肿瘤已进展到相对晚期的地步,因此肺癌的早期发现对于患者的预后起着至关重要的作用。据统计,病理分期ia期的早期患者5年生存率达到了90%,而iv期的晚期患者的5年生存率却不足5%。目前国际上最重要的筛查方法为低剂量螺旋ct,它对于早期肺癌的敏感度是普通胸片的4~10倍。美国全国肺癌筛查试验证明,低剂量螺旋ct筛查可降低高危人群20%的肺癌死亡率。
2、但是低剂量螺旋ct对肺癌的普筛也存在着许多的问题:1)对于早期中央型肺癌的检出并不能更好的代替气管镜检查,往往出现漏诊的现象;2)对于肺结节良恶性的判断包含着主诊医生的主客观因素,存在较高的假阳性率;3)频繁的ct检查增加了病人的辐射暴露风险,也加重了病人的经济负担以及国家的医保压力。由此可见,低剂量螺旋ct虽然提高了早期肺癌的检出率,但也存在着许多的不足之处。肺癌的早期诊断是降低患者死亡率的关键。因此,建立更为经济、无损、高效、普适、高通量和准确的肺癌筛查方法迫在眉睫。
3、因此,本申请公开了一种基于呼气测量数据元学习的自适应肺癌筛查方法。
技术实现思路
1、本专利技术提供一种基于呼气测量数据元学习的自适应肺癌筛查方法,用以解决现有技术中测量精度不足、诊断准确率低的问题。
2、本专利技术提供一种基于呼气测量数据元学习的自适应肺癌筛查
3、采集患者的呼气样本,对所述呼气样本进行预浓缩处理,得到预浓缩呼气样本;
4、测量所述预浓缩呼气样本挥发性有机物含量,得到呼气样本有机物含量数据;
5、对所述呼气样本有机物含量数据进行预处理,得到预处理的样本数据,所述预处理包括:数据分布检验、数据清理、异常值处理;
6、分类所述预处理的样本数据,得到样本数据集,所述样本数据集包括元训练集和元测试集;
7、构建元学习模型,将所述样本数据集输入所述元学习模型,得到患者为肺癌的概率值。
8、根据本专利技术提供的一种基于呼气测量数据元学习的自适应肺癌筛查方法,所述采集患者的呼气样本,对所述呼气样本进行预浓缩处理,得到预浓缩呼气样本,包括:
9、采集患者呼吸样本,将所述呼吸样本引入冷阱装置中;
10、通过液氮制冷三级冷阱设计技术将所述呼吸样本由气态转为液态;
11、加热冷阱装置,将所述呼吸样本由液态转为气态,得到预浓缩呼气样本。
12、根据本专利技术提供的一种基于呼气测量数据元学习的自适应肺癌筛查方法,液氮制冷三级冷阱设计技术,包括:
13、对所述呼吸样本进行第一级冷阱,将气体通入低温环境中的管道中,使用液氮制冷,将气体冷凝并减少其体积;
14、第一级冷阱之后,使用更低的温度进一步冷却气体,通过使用另一个液氮冷阱进行第二级冷阱,进一步减小气体体积;
15、在第二级冷阱之后,利用更高效的制冷方法,进一步降低气体温度,进行第三级冷阱,使得气体达到所需的预浓缩程度。
16、根据本专利技术提供的一种基于呼气测量数据元学习的自适应肺癌筛查方法,所述对所述呼气样本有机物含量数据进行预处理,得到预处理的样本数据,包括:
17、采用shapiro-wilk检验来进行正态性分析,检查数据的分布情况;
18、识别和处理数据可能存在的问题,对数据进行清理,判断数据是否存在缺失值、重复值和不一致的数据格式;
19、基于dbscan算法对数据进行异常值的处理,将所有数据分为核心点、边界点、噪声点,检测后将所述噪声点视为异常值并去除。
20、根据本专利技术提供的一种基于呼气测量数据元学习的自适应肺癌筛查方法,所述采用shapiro-wilk检验来进行正态性分析,检查数据的分布情况,包括:
21、设置原假设与备择假设,所述原假设包括样本数据来自正态分布,所述备择假设包括样本数据不来自正态分布;
22、从所述呼气样本有机物含量数据选择一个样本数据执行shapiro-wilk检验,得到检验结果;
23、判断检验结果显著性水平是否大于设定阈值,若大于设定阈值,则无法拒绝原假设,所述样本数据符合正态分布,若小于设定阈值,则拒绝原假设,所述样本数据不符合正态分布。
24、根据本专利技术提供的一种基于呼气测量数据元学习的自适应肺癌筛查方法,所述识别和处理数据可能存在的问题,对数据进行清理,判断数据是否存在缺失值、重复值和不一致的数据格式,包括:
25、若存在缺失值,可以选择删除具有缺失值的样本或使用插补方法填充缺失值,若存在重复值,可以选择保留一个唯一值或删除所有重复项,若存在不一致的数据格式,可以进行数据转换或规范化,使其具有一致的格式。
26、根据本专利技术提供的一种基于呼气测量数据元学习的自适应肺癌筛查方法,所述基于dbscan算法对数据进行异常值的处理,将所有数据分为核心点、边界点、噪声点,检测后将所述噪声点视为异常值并去除,包括:
27、预先设置半径阈值和数量阈值,将所有数据分为核心点、边界点、噪声点,检测后将所述噪声点视为异常值并去除;
28、所述核心点是在半径内至少有所述设定数量阈值个数的数据点,所述边界点位于簇的边缘与核心点相连,所述噪声点既不是核心点也不是边界点的数据点。
29、根据本专利技术提供的一种基于呼气测量数据元学习的自适应肺癌筛查方法,所述构建元学习模型,将所述样本数据集输入所述元学习模型,得到患者为肺癌的概率值,包括:
30、将所述样本数据集转化为适合卷积神经网络模型的特征表示形式,并标准化输入数据,输入时考虑影响因素,所述因素包括年龄、性别、bmi、吸烟情况和居住地址;
31、构建卷积神经网络模型的输入层、卷积层、注意力机制层和池化层;
32、引入maml算法的元学习结构,对所述样本数据集进行内部训练和外部训练;
33、在maml算法的元学习结构之后,添加一个全连接层,在所述全连接层输入经过内部训练和外部训练后的模型参数,输出肺癌预测值,所述肺癌预测值包括患者为肺癌的概率值。
34、根据本专利技术提供的一种基于呼气测量数据元学习的自适应肺癌筛查方法,所述引入maml算法的元学习结构,对所述样本数据集进行内部训练和外部训练,包括:
35、选择当前任务的少样本数据作为内部训练的支持集,在支持集上进行模型参数的内部更新,内部更新公式可以表示为:
36、
37、其中θ是模型的初始参数,θ′是经过内部更新后的新参数,α是内部学习率,用于控制内部更新的步长。是损失函数l对模型参数θ的梯度;
38、外部训练阶段采用线性学习率衰减策略,使用多个元学习任务的快速学习过程进行模型参数的梯度更新,外部更新公式可以表示为:
...【技术保护点】
1.一种基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,包括:
2.根据权利要求1所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,所述采集患者的呼气样本,对所述呼气样本进行预浓缩处理,得到预浓缩呼气样本,包括:
3.根据权利要求2所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,液氮制冷三级冷阱设计技术,包括:
4.根据权利要求1所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,对所述呼气样本有机物含量数据进行预处理,得到预处理的样本数据,包括:
5.根据权利要求4所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,所述采用Shapiro-Wilk检验来进行正态性分析,检查数据的分布情况,包括:
6.根据权利要求4所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,所述识别和处理数据可能存在的问题,对数据进行清理,判断数据是否存在缺失值、重复值和不一致的数据格式,包括:
7.根据权利要求4所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征
8.根据权利要求1所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,所述构建元学习模型,将所述样本数据集输入所述元学习模型,得到患者为肺癌的概率值,包括:
9.根据权利要求8所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,所述引入MAML算法的元学习结构,对所述样本数据集进行内部训练和外部训练,包括:
10.根据权利要求8所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,所述全连接层,包括:
...【技术特征摘要】
1.一种基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,包括:
2.根据权利要求1所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,所述采集患者的呼气样本,对所述呼气样本进行预浓缩处理,得到预浓缩呼气样本,包括:
3.根据权利要求2所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,液氮制冷三级冷阱设计技术,包括:
4.根据权利要求1所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,对所述呼气样本有机物含量数据进行预处理,得到预处理的样本数据,包括:
5.根据权利要求4所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,所述采用shapiro-wilk检验来进行正态性分析,检查数据的分布情况,包括:
6.根据权利要求4所述的基于呼气测量数据元学习的自适应肺癌筛查方法,其特征在于,...
【专利技术属性】
技术研发人员:王飞,秦立山,吕国钧,崔海滨,王文苑,裘莲,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。