基于生物标志物增强拉曼光谱数据库的病理诊断方法技术

技术编号:36793515 阅读:25 留言:0更新日期:2023-03-08 22:51
本发明专利技术提出一种基于生物标志物增强拉曼光谱数据库的病理诊断方法,该方法基于生物标志物的理论拉曼光谱和实测生物标志物蛋白及组织切片的增强拉曼光谱建立数据库,之后利用数据库数据训练生成病理诊断的深度学习模型,最后利用深度学习模型对待测组织进行病理表达程度判断,并生成标记了生物标志物分布的待测组织切片病理图像。本发明专利技术提出的方法既能实现分子水平的高特异性、灵敏度的定量检测,又能方便医生直观的理解检测结果,帮助临床决策,本申请提出的方法对于癌症的临床检测具有重要意义,有望发展成为一项极具前景的全自动临床辅助诊断技术。临床辅助诊断技术。临床辅助诊断技术。

【技术实现步骤摘要】
基于生物标志物增强拉曼光谱数据库的病理诊断方法


[0001]本专利技术属于临床癌症诊断与检测领域,尤其涉及基于生物标志物增强拉曼光谱数据库的病理诊断方法。

技术介绍

[0002]癌症是当今社会对人类生命威胁最大的疾病,以乳腺癌为例,根据国际癌症研究机构(IARC)的统计,2020年全球近68.5万人死于乳腺癌,并预计到2040年,乳腺癌负担将增加到每年300多万新发病例和100多万死亡病例。人表皮生长因子受体2(HER2)、雌性激素受体(ER)、孕激素受体(PR)和Ki67抗原等是用于乳腺癌诊断的生物标志物,这些生物标志物的表达程度的排列组合决定了乳腺癌的类型。不同的乳腺癌类型需要安排对应的治疗方案,如HER2过表达型使用HER2靶向药物治疗,而三阴型则没有合适的靶向药物,只能以化疗为主。因此,准确检测生物标志物在活体组织中的表达程度对癌症的分型诊断、靶向治疗及预后具有重要意义。
[0003]目前,最常用的评估生物标志物表达程度的方法是免疫组化(IHC),该方法首先对各种生物标志物的抗体标记显色剂,然后通过抗原

抗体免疫反应来检测生物标志物受体,最后根据染色结果将生物标志物的表达程度分为阳性和阴性。对于某些生物标志物,比如HER2而言,还需要进一步根据染色结果将其表达程度进行分级,以便进一步进行癌症病理的准确判断。虽然这种方法为目前医疗系统癌症病理检测的主流方法,其也能辅助医生进行疾病诊断,但是该方法检测过程过于复杂、抗体试剂和染色工艺成本高、细胞的生理状态会受到染色工艺和不同抗体试剂的影响、检测周期长,不具备手术现场实时检测潜力;由于该方法基于形态学检测原理进行,因此受医生主观性影响较大,容易引起观察者之间的分歧,且这种主观性随着生物标志物表达程度分级越多越明显,极大的降低了癌症诊断的准确性和效率。
[0004]随着拉曼散射技术的发展,近年来在癌症疾病诊断中拉曼散射技术也显示出巨大的潜力,其主要应用在血清检测和组织病理检测两方面。基于拉曼散射技术的血清检测主要用于癌症早筛,尽管已有研究通过使用机器学习或深度学习方法尽可能提升筛查的准确率,但目前医学上尚无充分证据建立血清成分差异与癌症诊断的确切联系,因此临床上对癌症的确诊以及后续治疗方案的确定,仍然依靠组织病理学诊断结果。现有采用拉曼光谱进行癌症病理分析的方法主要通过对不同类型的肿瘤组织的拉曼光谱进行对比,从而区分健康组织、良性癌变组织与恶性癌变组织,然而这种方法也存在一些问题,主要表现为:(1)目前获得的肿瘤组织拉曼光谱为常规拉曼光谱,其光谱信号较弱、信噪比差,需要后期花费大量的时间提升光谱信号质量,增加了肿瘤诊断周期;(2)肿瘤组织的成分非常复杂,其拉曼光谱通常包含大量的信息,在进行拉曼光谱分析中,对不同类型肿瘤组织的光谱差异来源进行区分时,会具有一定的人为推测性,而且这种差异判断易受实验条件改变的影响,进而使得其检测方法鲁棒性及解释性差,导致诊断结果的准确性和可靠性降低,比如专利CN202110357929.X提出了一种基于拉曼光谱的结直肠癌错配修复蛋白表达的检测方法,该
专利中建立的拉曼光谱数据库包含的是结直肠癌组织中不同类型组织的光谱,在完成检测后,将获得数据与数据库中的数据对比分析来完成分类、检测,然而,由于肿瘤组织的成分非常复杂,各种成分理论上都会贡献拉曼信号,因此直接利用肿瘤组织拉曼光谱进行癌症诊断,由于尚无法建立检测分类判据与肿瘤病理特征的准确对应关系,缺乏临床诊断依据;又如,专利CN202110120055.6提出了一种鼻咽癌单细胞检测方法、存储检测及系统,该专利的检测对象是细胞,该专利也是根据不同类型肿瘤组织的光谱差异来进行分类,缺乏临床诊断依据;专利CN202011409383.X提出一种基于拉曼检测光谱数据深度学习的口腔癌分类系统,该专利也是根据不同类型肿瘤组织的光谱差异来进行分类,存在的问题上文已有表述;(3)现有的基于拉曼光谱的诊断方法,仅提供肿瘤组织的拉曼光谱结果,受限于医生对拉曼光谱认识的不足,仅凭拉曼光谱结果很难直观诊断病情,限制了拉曼散射技术在肿瘤诊断中的发展应用。专利CN202010674317.9提出了图案化的外泌体膜蛋白表达量检测方法及其应用,该专利虽然使用的是基于标记的增强拉曼检测技术,但是其检测的拉曼光谱信号来自于拉曼探测分子的信息,而非蛋白自身的指纹信息,而且该专利中基于标记的方法单次检测只能获得一种蛋白的表达量信息,因此为了实现多种膜蛋白表达量的一次性分析,需要对多个光学检测芯片进行采谱,这无疑增加了时间和试剂成本,因此其同样不能直接用于临床应用。

技术实现思路

[0005]有鉴于此,本专利技术提出一种基于生物标志物增强拉曼光谱数据库的病理诊断方法,该方法基于生物标志物的理论拉曼光谱和实测生物标志物蛋白及组织切片的增强拉曼光谱建立数据库,之后利用数据库数据训练生成病理诊断的深度学习模型,最后利用深度学习模型对待测组织进行病理表达程度判断,并生成标记了生物标志物分布的待测组织切片病理图像。该方法不是简单地将肿瘤光谱数据与数据库中的光谱数据对比分析来完成分类,而是针对检测组织上的特定生物标志物的含量和分布进行检测,由于生物标志物是目前肿瘤病理诊断“金标准”一免疫组化方法的检测靶点,因此本专利技术基于生物标志物的检测方法能够与现行的临床诊断建立直接关系,且该方法的检测判据具有坚实的病理基础,而且本专利技术方法可给出肿瘤组织的病理分型,解决了不同类型肿瘤组织光谱差异解释性差、分类可靠性不足的问题。
[0006]为达此目的,本专利技术采用以下技术方案:一种基于生物标志物增强拉曼光谱数据库的病理诊断方法,所述方法包括:
[0007]S1:建立生物标志物和组织切片的拉曼光谱数据库;
[0008]S2:建立用于进行病理诊断的深度学习模型;
[0009]S3:获取待测组织切片的增强拉曼光谱和待测组织的光学图像;
[0010]S4:使用深度学习模型对待测组织的生物标志物病理表达程度进行检测;
[0011]S5:对待测组织的增强拉曼光谱进行图像化处理,得到标记了生物标志物分布的待测组织病理图像。
[0012]优选的,所述S1包括:
[0013]S11:通过计算获得生物标志物的理论拉曼光谱;
[0014]S12:制备增强拉曼光谱测量所用的定制基底;
[0015]S13:获取S11中生物标志物的蛋白样本以及不同类型组织切片样本;
[0016]S14:将生物标志物蛋白样本以及组织切片样本至于定制基底上,获取生物标志物蛋白样本和不同类型组织切片样本的增强拉曼光谱;
[0017]S15:对获取的增强拉曼光谱进行去噪、平滑滤波、荧光背景校正和归一化预处理;
[0018]S16:以生物标志物的理论拉曼光谱、预处理后的生物标志物蛋白样本和不同类型组织切片样本的增强拉曼光谱组成拉曼光谱数据库。
[0019]优选的,所述S2包括:
[0020]S21:利用S1中的拉曼光谱数据库构建训练数据集,所述训练数据集包含阴性数据集和阳性数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生物标志物增强拉曼光谱数据库的病理诊断方法,其特征在于,所述方法包括:S1:建立生物标志物和组织切片的拉曼光谱数据库;S2:建立用于进行病理诊断的深度学习模型;S3:获取待测组织切片的增强拉曼光谱和待测组织的光学图像;S4:使用深度学习模型对待测组织的生物标志物病理表达程度进行检测;S5:对待测组织的增强拉曼光谱进行图像化处理,得到标记了生物标志物分布的待测组织病理图像。2.根据权利要求1所述的基于生物标志物增强拉曼光谱数据库的病理诊断方法,其特征在于,所述S1包括:S11:通过计算获得生物标志物的理论拉曼光谱;S12:制备增强拉曼光谱测量所用的定制基底;S13:获取S11中生物标志物的蛋白样本以及不同类型组织切片样本;S14:将生物标志物蛋白样本以及组织切片样本至于定制基底上,获取生物标志物蛋白样本和不同类型组织切片样本的增强拉曼光谱;S15:对获取的增强拉曼光谱进行去噪、平滑滤波、荧光背景校正和归一化预处理;S16:以生物标志物的理论拉曼光谱、预处理后的生物标志物蛋白样本和不同类型组织切片样本的增强拉曼光谱组成拉曼光谱数据库。3.根据权利要求1所述的基于生物标志物增强拉曼光谱数据库的病理诊断方法,其特征在于,所述S2包括:S21:利用S1中的拉曼光谱数据库构建训练数据集,所述训练数据集包含阴性数据集和阳性数据集,其中阴性数据集由正常组织的增强拉曼光谱组成,阳性数据集通过将生物标志物蛋白的增强拉曼光谱乘以一个随机强度调制系数叠加到正常组织的增强拉曼光谱上得到;S22:利用数据库中的不同类型的肿瘤组织切片样本的增强拉曼光谱对阳性数据集进行验证,若验证不合格,则调整随机强度调制系数或检查生物标志物蛋白增强拉曼光谱获取过程重新获取增强拉曼光谱,直至阳性数据集中的增强拉曼光谱与与其类型相对应的肿瘤组织切片样本的增强拉曼光谱在光谱特征峰上保持高度一致性;S23:建立神经网络模型,并利用构建的阴性数据集和阳性数据集对神经网络模型进行训练,得到训练合格的深度学习模型。4.根据权利要求1所述的基于生物标志物增强拉曼光谱...

【专利技术属性】
技术研发人员:赵宗清莫文博杜小波周民杰柯琦杜凯谢刚黄景林高峰倪爽杨曦月祁道健王安群温家星杨月景萌
申请(专利权)人:绵阳市中心医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1