当前位置: 首页 > 专利查询>厦门大学专利>正文

一种胶囊内镜视频中消化道器官的定位方法技术

技术编号:26651740 阅读:34 留言:0更新日期:2020-12-09 00:53
本发明专利技术公开了一种胶囊内镜视频中消化道器官的定位方法,其包括步骤:S1、使用感知哈希算法对相似图片进行过滤,去除相似度较高的图片;S2、利用二分查找算法搜索目标位置;S3、对胶囊内镜图像进行分类。本发明专利技术通过相似图片过滤、目标位置搜索、图片分类实现了胶囊内镜视频中不同器官的分类,且分类结果准确,且使用的时间较短,实现了胶囊内镜视频中消化道器官的快速定位,解决了人工阅片工作量大、耗时长的难题。

【技术实现步骤摘要】
一种胶囊内镜视频中消化道器官的定位方法
本专利技术涉及图像处理
,特别涉及一种胶囊内镜视频中消化道器官的定位方法。
技术介绍
胶囊内镜进入人体内后会随着消化道的蠕动而移动,能够对传统消化内镜无法到达的部位进行拍摄,从而实现对消化道的全面观察。目前消化内镜图像的诊断主要依靠人工阅片,然而胶囊内镜以2Hz的拍摄频率产生数万帧图像数据,这极大地增加了医生的工作负荷,且耗时较长,效率较低。此外,大部分消化道疾病只会在特定器官中发生,因此,快速定位到目标器官、忽略无关内容能够减少阅片时间,提高诊疗效率。在现有的工作中,最常见的方法是基于颜色和纹理特征来理解胶囊内镜图像,将手动提取的特征用于机器学习算法,对图像进行分类。但依赖于手动提取特征的方法不能充分利用图像特征,算法的准确率难以提高;而且对于实际应用也不够便利。
技术实现思路
为解决上述问题,本专利技术提供了一种胶囊内镜视频中消化道器官的定位方法。本专利技术采用以下技术方案:一种胶囊内镜视频中消化道器官的定位方法,其包括以下步骤:S1、使用感知哈希算法对相似图片进行过滤,去除相似度较高的图片;S2、利用二分查找算法搜索目标位置;S3、对胶囊内镜图像进行分类。进一步地,步骤S1具体包括以下步骤:S11、将图片缩放到固定尺寸32×32,并且将结果保存为256阶的灰度图;S12、计算所述灰度图的离散余弦相似度(DCT),保留左上角的8×8个像素作为该图的最低频率表示;S13、计算步骤S13得到的8×8个像素的均值,在这64个像素中,像素值比均值大的记为1,反之记为0,进而得到一个64位的编码串;S14、比较两张图片对应的编码串,计算它们之间的汉明距离,该距离参数用于反映两个等长编码串的相似度;S15、按图片之间的相似度将一段完整视频划分为若干个区间,在每一段区间中,只保留处于中间位置的一张图像,从而过滤视频中的冗余图像。进一步地,步骤S15具体为:首先,将视频的第一帧图像作为一个区间的起始,对于视频序列中的每一帧图片,都计算其与最近区间的第一帧图像和最后一帧图像之间的汉明距离d1、d2,若d1和d2都大于预设的阈值t,则将当前图片作为下一区间的起点,然后,再计算,重复这一过程,最终能够将一段完整视频按图片之间的相似度划分为若干个区间,最后,在每一段区间中,只保留处于中间位置的一张图像,就可以过滤视频中的冗余图像。进一步地,所述阈值设为6。进一步地,步骤S2具体为:根据所拍摄的器官,分别使用0-3这四个数字为所有图像进行标注,将视频映射为一个基本有序的数组,此时,二分查找算法选择一个位置后,便以此位置为中心,取长度为2n+1的视频序列,并对这2n+1个预测结果使用多数投票策略确定中心位置最终所属的类别,在二分搜索的过程中,左右边界的移动方式为:Left=Mid+1+n或Right=Mid-1-n,其中,Left、Mid、Right分别表示区间左端点、中间位置和右端点,当中心值与目标值相等或区间长度小于等于1时,算法终止。进一步地,步骤S3包括以下步骤:S31、无用图像的移除:使用ResNet-18对选中的图像进行二分类,判断图像中消化道内部被遮挡面积是否超过2/3,若是,则移除相应图像,如果一个序列中的所有帧都需要被移除,那么二分查找算法将向右继续选择其他序列,重复上述步骤;S32、消化道器官分类:在排除干扰图像后,对当前选择的图像使用SENet-154判断图片中包含的器官类别,输出图像中所拍摄的消化道器官的类别标签。采用上述技术方案后,本专利技术与
技术介绍
相比,具有如下优点:本专利技术在分类之前使用感知哈希算法对相似图片进行过滤,相当于对图片进行预处理,去除大量高度相似的图片,大大减少需要进行定位的图片数量,缩短计算时间的同时,还避免错误的预测,造成定位结果错误;此外,本专利技术还采用二分查找算法,无需对视频中的每一帧图像都进行分类,极大地缩短了运行时间;在分类时,使用两个不同的分类网络,先在排除待分类图片中消化道管壁被大面积遮挡的情况后,再判断当前图片所对于的器官种类,提高了分类的效率和准确性,本专利技术的定位方法具有快速、准确的优点,解决了人工阅片工作量大、耗时长的难题。附图说明图1为本专利技术定位方法的示意图;图2为本专利技术感知哈希算法流程图;图3为图片定位抽象化过程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。实施例一一种胶囊内镜视频中消化道器官的定位方法,如图1所示,其包括以下步骤:S1、使用感知哈希算法对相似图片进行过滤,去除相似度较高的图片;由于胶囊内镜在体内的运动完全依赖于消化道蠕动,而消化道蠕动的速度较慢,胶囊内镜很有可能在某一个位置停留较长时间,并因此拍摄出大量高度相似的图片,同时,为了提高算法的鲁棒性,在定位时,分类器对以某个位置为中心、长度为2n+1帧的视频序列的每帧图像都进行分类,通过对整个序列的分类结果进行多数投票来确定该位置最终所属的类别。但对于性能较稳定的深度神经网络而言,高度相似的图片有可能同时被错误预测,造成定位结果错误。针对上述问题,模型使用感知哈希算法对视频序列做下采样以移除冗余图像,确保这2n+1帧图像的内容多样性。如图2所示,步骤S1具体包括以下步骤:S11、将图片缩放到固定尺寸32×32,并且将结果保存为256阶的灰度图;S12、计算所述灰度图的离散余弦相似度(DCT),保留左上角的8×8个像素作为该图的最低频率表示;S13、计算步骤S13得到的8×8个像素的均值,在这64个像素中,像素值比均值大的记为1,反之记为0,进而得到一个64位的编码串;S14、比较两张图片对应的编码串,计算它们之间的汉明距离,该距离参数用于反映两个等长编码串的相似度;S15、按图片之间的相似度将一段完整视频划分为若干个区间,在每一段区间中,只保留处于中间位置的一张图像,从而过滤视频中的冗余图像。步骤S15具体为:首先,将视频的第一帧图像作为一个区间的起始,对于视频序列中的每一帧图片,都计算其与最近区间的第一帧图像和最后一帧图像之间的汉明距离d1、d2,若d1和d2都大于预设的阈值t=6,则将当前图片作为下一区间的起点,然后,再计算,重复这一过程,最终能够将一段完整视频按图片之间的相似度划分为若干个区间,最后,在每一段区间中,只保留处于中间位置的一张图像,就可以过滤视频中的冗余图像。S2、利用二分查找算法搜索目标位置;进一步地,步骤S2具体为:由于胶囊内镜图像的相对顺序与其拍摄位置和拍摄时间有关,若根据所拍摄的器官,分别使用0~3这四个数字为所有图像进行标注,那么可将一段视频映射为一个基本有序的数组。此时,二分查找算法选择一本文档来自技高网
...

【技术保护点】
1.一种胶囊内镜视频中消化道器官的定位方法,其特征在于:包括以下步骤:/nS1、使用感知哈希算法对相似图片进行过滤,去除相似度较高的图片;/nS2、利用二分查找算法搜索目标位置;/nS3、对胶囊内镜图像进行分类。/n

【技术特征摘要】
1.一种胶囊内镜视频中消化道器官的定位方法,其特征在于:包括以下步骤:
S1、使用感知哈希算法对相似图片进行过滤,去除相似度较高的图片;
S2、利用二分查找算法搜索目标位置;
S3、对胶囊内镜图像进行分类。


2.如权利要求1所述的一种胶囊内镜视频中消化道器官的定位方法,其特征在于:步骤S1具体包括以下步骤:
S11、将图片缩放到固定尺寸32×32,并且将结果保存为256阶的灰度图;
S12、计算所述灰度图的离散余弦相似度(DCT),保留左上角的8×8个像素作为该图的最低频率表示;
S13、计算步骤S13得到的8×8个像素的均值,在这64个像素中,像素值比均值大的记为1,反之记为0,进而得到一个64位的编码串;
S14、比较两张图片对应的编码串,计算它们之间的汉明距离,该距离参数用于反映两个等长编码串的相似度;
S15、按图片之间的相似度将一段完整视频划分为若干个区间,在每一段区间中,只保留处于中间位置的一张图像,从而过滤视频中的冗余图像。


3.如权利要求2所述的一种胶囊内镜视频中消化道器官的定位方法,其特征在于:步骤S15具体为:首先,将视频的第一帧图像作为一个区间的起始,对于视频序列中的每一帧图片,都计算其与最近区间的第一帧图像和最后一帧图像之间的汉明距离d1、d2,若d1和d2都大于预设的阈值t,则将当前图片作为下一区间的起点,然后,再计算,重复这一过程,最终能够将一段完整视频按图片之间的相似...

【专利技术属性】
技术研发人员:王连生
申请(专利权)人:厦门大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1