当前位置: 首页 > 专利查询>李一专利>正文

一种基于拉曼光谱的涎腺肿瘤的诊断模型构建方法技术

技术编号:31014687 阅读:43 留言:0更新日期:2021-11-30 02:53
本发明专利技术公开了一种基于拉曼光谱的涎腺肿瘤的诊断模型构建方法,包括以下步骤:S1:特征提取,具体包括以下步骤:S101对患者满足要求的唾液进行提取,并将提取的唾液样本进行表面增强拉曼光谱检测,获得样本光谱数据;S102:选取一定量的样本,通过OneR对选取的样本进行数据挖掘,通过检测预测误差对特征的重要性进行评估;S103:对选取的样本进行特征选择;S2:构建预测模型:S201:使用随机森林和逻辑回归算法建立诊断模型,并通过5

【技术实现步骤摘要】
一种基于拉曼光谱的涎腺肿瘤的诊断模型构建方法


[0001]本专利技术涉及一种涎腺肿瘤的体液诊断方法,更具体地说,它涉及一种基于拉曼光谱的涎腺肿瘤的诊断模型构建方法。

技术介绍

[0002]涎腺肿瘤是发生于腮腺、下颌下腺、舌下腺及口腔颌面部小涎腺的肿瘤性疾病,是口腔颌面部肿瘤的常见类型,近年来发病率呈逐年增加的趋势。涎腺肿瘤组织病理分类复杂,肿瘤类型众多,根据《世界卫生组织肿瘤分类(2005年版):头颈部肿瘤病理学和遗传学》中的唾液腺肿瘤组织病理学分类,其病理分类包括良性肿瘤、恶性肿瘤、软组织肿瘤、淋巴造血系统肿瘤及继发肿瘤五大类41种。这给临床医师和病理医师在诊断和鉴别诊断涎腺肿瘤带来困难,而由于涎腺肿瘤禁止常规术前活检,对其术前诊断则更加困难。目前,临床上主要依靠细针针吸活检技术来进行涎腺肿瘤术前诊断,但诊断准确率常常取决于穿刺操作者的技术和病理医师的经验,并不能够为术前诊断提供一个稳定客观的参考,同时穿刺技术本身属于一个有创操作,会对肿瘤产生刺激,引起肿瘤的播散、穿刺区的感染等并发症。因此依靠术中冰冻病理切片诊断涎腺肿瘤良恶性则成为决定手术切除方式的决定性技术,但是术中冰冻切片诊断技术的敏感性和灵敏度并不可靠,相关研究表明约30%恶性肿瘤被诊断为良性,同时术中冰冻切片技术并不能够准确鉴别不同恶性肿瘤亚型,这些缺点都给术中确定肿瘤切除方式及判断预后造成困难。
[0003]拉曼光谱技术,其原理基于非弹性散射,即根据分子振动形成的光散射频率改变来反应分子结构、基团的组成等信息,具有高灵敏性和特异性,同时其样本无需特殊处理、适用范围广泛、测试快捷等优点,被广泛应用于生物医学领域。拉曼光谱技术具有其他光谱技术无法比拟的优势,如谱峰较红外光谱分辨率高,不受水分干扰,成像实时快速等,特别适用于对红外光谱干扰较强的含有大量水分的生物样本研究,可以提供大量关于细胞、组织或体液内分子构成、分子结构和分子之间相互作用的信息,反映蛋白质、核酸、脂类等物质成分变化、结构改变等,被称为分子指纹技术。既往研究通过较为系统的实验和计算发现吸附在粗糙银表面上的吡啶分子的拉曼散射信号与溶液相中的吡啶分子的拉曼散射信号相比增强了10^6个数量级,这种现象是一种与粗糙表面相关的表面增强效应,被称为表面增强拉曼光谱效应。由于表面增强拉曼光谱对人体检测的无创性、高特异性、高灵敏度等优点,使得其在临床疾病的诊断方面逐渐成为研究热点。
[0004]支持向量机(Support Vector Machine)作为机器学习算法的一种,适合于解决小样本、非线性及高维模式的识别问题,显示出了许多特有的优势。该算法建立在统计学习理论的VC维理论和结构风险最小原理基础之上,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳方案,以期获得最好的泛化能力。一般情况下,该算法作为一个二分类模型时,其目的是寻找一个超平面来对样本进行分割,分割的原则是使得样本间的间隔最大化,对于分割超平面的寻优问题最终是转化为一个凸二次规划问题来求解。当训练样本线性可分时,算法采用硬间隔并使其最大化,可获得一个线性可分支持向量机模型;当训练样
本线性不可分时,算法采用非线性核函数并使软间隔最大化,可获得一个非线性支持向量机模型。

技术实现思路

[0005]为解决上述技术问题,本专利技术提供一种基于拉曼光谱的涎腺肿瘤的诊断模型构建方法,通过对涎腺肿瘤患者的血清和唾液等体液标本进行实时表面增强拉曼光谱检测,获得体液样本的特征性光谱数据,此过程大概约5分钟。收集涎腺肿瘤患者的体液光谱数据建立数据库,应用支持向量机技术对数据库腮腺肿瘤数据进行分析,建立鉴别诊断模型,通过该鉴别诊断模型,对临床涎腺肿瘤患者体液的拉曼光谱数据进行鉴别诊断,从而确定涎腺肿瘤的病理类型,为涎腺肿瘤患者的诊断和筛查提供一个快速、无创、准确、简便的新方法。
[0006]本专利技术的上述技术目的是通过以下技术方案得以实现的:
[0007]一种基于拉曼光谱的涎腺肿瘤的诊断模型构建方法,包括以下步骤:
[0008]S1:特征提取,具体包括以下步骤:
[0009]S101对患者满足要求的唾液进行提取,并将提取的唾液样本进行表面增强拉曼光谱检测,获得样本光谱数据;
[0010]S102:选取一定量的样本,通过OneR对选取的样本进行数据挖掘,通过检测预测误差对特征的重要性进行评估;
[0011]S103:对选取的样本进行特征选择;
[0012]S2:构建预测模型:
[0013]S201:使用随机森林和逻辑回归算法建立诊断模型,并通过5

fold交叉验证,得到最终诊断模型;
[0014]S202:对S102中选取一定量后的剩余样本进行预测能力检验,并根据检验结果对最终诊断模型做修正。
[0015]作为一种优选方案,S101中,唾液的收集方法具体包括以下步骤:患者晨起禁食,使用生理盐水漱口,将唾液收集材料置于口中放置,然后将该收集材料置于唾液收集管中,进行离心处理;然后将收集的体液标本与纳米银溶胶混合均匀。
[0016]作为一种优选方案,S103过程中,特征具体的选择方法具体包括以下步骤:
[0017][0018]其中:H
j
为所选的同一类中的邻域,其中j=1,2,

k;M
j
为不同类中的邻域;对于所有特征,初始权重W(A)0设置为0;函数diff(s
i,al
,H
j,al
)计算第i个样本和第j个相邻样本之间的特征同一类;函数diff(s
i,al
,M
j,al
)计算第i个样本与第j个相邻样本之间的第l个特征不同的阶级;其中:
[0019][0020][0021]其中:其中max(A)是特征的最大值,min(A)是特征的最小值,是第i个样本的特征,是第l个样本的特征值同一类中的第j个样本,是不同类中第j个样本的特征;所有流程重复m次。
[0022]作为一种优选方案,S2过程中,构建预测模型具体包括以下步骤:
[0023][0024][0025][0026][0027]其中:预测准确度(ACC)、敏感性(SEN)、特异性(SPE)和马太相关系数(MCC)被视为性能指标;TP、FP、TN和FN分别表示真阳性、假阳性、真阴性和假阴性的数目。
[0028]作为一种优选方案,S201中,采用逻辑回归算法建立诊断模型具体包括以下步骤:
[0029]f(t)=P(Y=1|x)=1/(1+e

t
)=e
t
/(1+e
t
)
ꢀꢀꢀꢀ
(8)
[0030]t=b0+b1x1+b2x2+

b
n
x
n
ꢀꢀꢀꢀꢀꢀ
(9)
[0031]其中,f(t)为事件发生的概率,并随时间变化从0到1;Y为阳性样本(定义为1)或阴性样本(定义为0)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于拉曼光谱的涎腺肿瘤的诊断模型构建方法,其特征在于,包括以下步骤:S1:特征提取,具体包括以下步骤:S101对患者满足要求的唾液进行提取,并将提取的唾液样本进行表面增强拉曼光谱检测,获得样本光谱数据;S102:选取一定量的样本,通过OneR对选取的样本进行数据挖掘,通过检测预测误差对特征的重要性进行评估;S103:对选取的样本进行特征选择;S2:构建预测模型:S201:使用随机森林和逻辑回归算法建立诊断模型,并通过5

fold交叉验证,得到最终诊断模型;S202:对S102中选取一定量后的剩余样本进行预测能力检验,并根据检验结果对最终诊断模型做修正。2.根据权利要求1所述的基于拉曼光谱的涎腺肿瘤的诊断模型构建方法,其特征在于,所述S101中,唾液的收集方法具体包括以下步骤:患者晨起禁食,使用生理盐水漱口,将唾液收集材料置于口中放置,然后将该收集材料置于唾液收集管中,进行离心处理;然后将收集的体液标本与纳米银溶胶混合均匀。3.根据权利要求1所述的基于拉曼光谱的涎腺肿瘤的诊断模型构建方法,其特征在于,所述S103过程中,特征具体的选择方法具体包括以下步骤:其中:H
j
为所选的同一类中的邻域,其中j=1,2,

k;M
j
为不同类中的邻域;对于所有特征,初始权重W(A)0设置为0;函数diff(s
i,al
,H
j,al
)计算第i个样本和第j个相邻样本之间的特征同一类;函数diff(s
i,al
,M
j,al<...

【专利技术属性】
技术研发人员:李一文志宁闫冰吴沉洲
申请(专利权)人:李一
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1