基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的方法、系统及设备技术方案

技术编号：41229690 阅读：20 留言：0更新日期：2024-05-09 23:46

本发明专利技术提供了一种基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的方法、系统及设备，包括：通过图像采集器获取实时图像，将图像输入至目标检测模型；通过目标检测模型分析输入图像中会厌和声门的位置和轮廓信息；判断会厌和声门的相对位置，通过语音指导操作者将会厌和声门都调整到合适的位置；分析计算声门的开闭情况，根据声门的开闭情况通过语音指导操作者调整图像采集器的角度；当声门开口占比达到预设理想占比时，通过语音指导操作者及时插管。本发明专利技术的方法在临床应用中展现出巨大的潜力，尤其是在提高喉部检查和手术操作的准确性和效率方面，不仅优化了医疗流程，也为患者提供了更安全、更舒适的医疗体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于医学图像处理，涉及一种基于嵌入式边缘计算的识别和定位人体声门会厌结构方法、系统、设备及存储介质。

技术介绍

1、随着医学成像技术的快速发展，尤其是在喉科医学领域，高质量的图像识别与处理已成为提高诊断准确性和手术效率的关键。现有的图像处理方法面临着一系列挑战，如拍摄角度不当、图像分辨率限制以及关键解剖结构识别的不足等。尽管深度学习模型在医学图像分析中展现出了潜力，但它们在处理复杂性和实时性需求方面常常面临局限。特别是在特定医学条件下，如在亟需插管环境下声门和会厌的识别上，现有技术的不足可能影响手术的安全性和效率。

2、随着人工智能技术和内窥技术的快速发展，以及医疗器械产业的进步，喉镜的功能已经得到显著增强。现代喉镜不仅能清晰地实时显示喉咙内部情况，而且能够结合人工智能方法识别会厌和声门，为医护操作者提供更多关键信息。然而，对于经验较少的操作者而言，拍摄角度和位置的不准确会严重影响医疗判断的准确性。

3、在使用喉镜进行插管操作时，快速性至关重要。操作时间的延长不仅会引起患者强烈的不适感，甚至可能导致干呕等不良反应，从而错失插管的最佳时机。在临床实践中，仅仅显示出会厌和声门的位置并不足以实现快速准确的插管。这种限制对于医护人员来说是一个明显的挑战，也可能给患者带来负面影响。

4、因此，存在一个迫切需要解决的问题：如何提高喉镜在插管过程中的应用效率，以便快速而准确地协助医护操作者完成插管任务。解决这一问题将对提高医疗操作的效率和患者的安全性产生重大影响。

5、鉴于此，本专利技

技术实现思路

1、为解决上述问题，本专利技术提供一种基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的方法、系统及设备。

2、本专利技术采用的技术方案如下：

3、基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的方法，包括以下步骤：

4、s1、通过图像采集器获取实时图像，对所述实时图像进行标准化处理得到输入图像，将所述输入图像输入至目标检测模型；

5、s2、通过目标检测模型分析所述输入图像中会厌和声门的位置和轮廓信息信息，并对会厌和声门标注标识框，根据所述标识框计算图像采集器的移动矫正方案，通过语音指导操作者调整图像采集器的位置，使会厌大小、图像中心与会厌的距离、声门大小、图像中心与声门的距离均达到预设阈值和声门均处于合适的位置；

6、s3、分析计算声门的开闭情况，根据声门的开闭情况通过语音指导操作者调整图像采集器的角度；当声门开口占比达到预设理想占比时，向操作者发送语音提示。

7、进一步的，所述步骤s2包括：

8、s2.1、通过目标检测模型分析所述输入图像中是否存在会厌，若不存在，则计算图像采集器的移动矫正方案，通过语音指导操作者调整图像采集器的位置，直至输入图像中存在会厌，在输入图像中对所述会厌进行标注，得到会厌标识框；

9、s2.2、根据所述会厌标识框范围计算会厌大小和图像中心与会厌之间的距离，并与预设阈值进行比较；若会厌大小和图像中心与会厌之间的距离未达到所述预设阈值，则计算图像采集器的移动矫正方案，通过语音指导操作者调整图像采集器的位置，直至所述会厌大小和图像中心与会厌之间的距离均达到所述预设阈值；

10、s2.3、通过目标检测模型分析所述输入图像中是否存在声门，若不存在，则计算图像采集器的移动矫正方案，通过语音指导操作者调整图像采集器的位置，直至输入图像中存在声门，在输入图像中对所述声门进行标注，得到声门标识框；

11、s2.4、根据所述声门标识框范围计算声门大小和图像中心与声门之间的距离，并与预设阈值进行比较；若声门和图像中心与会厌之间的距离未达到所述预设阈值，则计算图像采集器的移动矫正方案，通过语音指导操作者调整图像采集器的位置，直至所述声门大小和图像中心与声门之间的距离均达到所述预设阈值。

12、进一步的，所述目标检测模型采用yolov5模型，训练方法包括：

13、获取喉镜插管时图像，创建训练集和验证集，并对所述训练集中图像进行预处理；

14、在所述预处理后的训练集图像中对会厌和声门进行标注，得到标注后的训练集；

15、构建初始yolov5模型，利用所述标注后的训练集和所述验证集训练模型，得到训练后的yolov5模型；

16、对所述训练后的目标检测模型进行轻量化处理，得到所述目标检测模型。

17、该模型采用了先进的损失函数设计，结合特征点识别和标记参考机制，以提高标记的准确性。此外，模型在考虑了多种复杂环境和噪声数据的情况下，增强了抗干扰能力和泛化性能，确保了高性能和实时响应的需求，满足临床手术中对实时图像处理的要求。在软件部署方面，本专利技术采用了自动化脚本来简化安装和配置过程，从而提高了用户体验和操作的便利性。

18、进一步的，对会厌和声门进行标注的方法包括：根据会厌和声门的形状从会厌边缘选择三个特征点，从声门边缘选择四个特征点进行标识框标注；所述标识框为方形，用于显示声门的位置和大小。

19、所述轻量化处理的方法为采用模型剪枝技术压缩所述yolov5模型大小和优化推理时间。在实际应用中可以根据部署设备的具体情况选择合适的yolov5模型，比如：

20、yolov5s模型：这是最小的模型，适用于资源受限的环境，比如在移动设备或边缘计算设备上。它牺牲了一些准确性来换取更快的速度和更低的资源消耗。

21、yolov5m模型：这个版本在大小和性能之间提供了一个平衡，适用于需要比yolov5s更高精度但仍然关注速度和资源消耗的应用。

22、yolov5l模型：这个版本更大，提供了更高的准确性，适合在资源不是主要限制因素的情况下使用，例如在较强大的服务器或云环境中。

23、yolov5x模型：这是最大和最准确的版本，但同时也是最慢和资源消耗最高的。它适合当准确性是首要考虑因素时，在资源充足的情况下使用。

24、进一步的，所述目标检测模型为onnx(open neural network exchange)格式，onnx格式作为一个开放式的文件格式，为模型的跨平台部署提供了便利，确保了模型的灵活性和扩展性。所述目标检测模型基于pytorch框架，该框架可以部署在常见的arm、x64架构下，还可以部署在高效能的powerpc架构上，可以部署在linux、windows、macos等主流系统上；可以在nvidia jetson系列和rockchip(rk)设备上运行，还经过特别优化以支持在如intel nuc这类小型但功能强大的嵌入式系统上部署；可以在gpu、cp本文档来自技高网...

【技术保护点】

1.基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的方法，其特征在于，所述步骤S2包括：

3.根据权利要求1所述的基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的方法，其特征在于，所述目标检测模型采用yolov5模型，训练方法包括：

4.根据权利要求3所述的基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的方法，其特征在于，对会厌和声门进行标注的方法包括：根据会厌和声门的形状从会厌边缘选择三个特征点，从声门边缘选择四个特征点进行标识框标注；

5.根据权利要求3所述的基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的方法，其特征在于，所述目标检测模型为ONNX格式。

6.根据权利要求1所述的基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的方法，其特征在于，调整会厌和声门位置的方法包括：

7.根据权利要求1所述的基于具

8.一种基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的系统，其特征在于，包括：

9.一种计算机设备，其特征在于，所述计算机设备包括：

10.一种存储有计算机指令的计算机可读存储介质，其特征在于，当所述计算机指令被一个或多个处理器执行时，致使所述一个或多个处理器执行权利要求1-7任一项所述方法中的步骤。

...

【技术特征摘要】

1.基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会厌结构的方法，其特征在于，所述步骤s2包括：

5.根据权利要求3所述的基于具有边缘计算能力的通用嵌入式模型识别和定位人体声门会...

【专利技术属性】
技术研发人员：魏金涛，张茂，高博文，陈可，周长江，王立强，徐善祥，李强，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人