当前位置: 首页 > 专利查询>沈阳大学专利>正文

一种餐饮税源监控目标跟踪算法及系统技术方案

技术编号:31563165 阅读:19 留言:0更新日期:2021-12-25 10:47
本申请公开了一种餐饮税源监控目标跟踪算法及系统。该方法可包括:获取当前帧图像中包括所述目标及其周边的区域、预搜索区域,其中,对于第一帧图像,手动初始化待跟踪目标及其周边的区域框和预搜索区域;将所述目标及其周边的区域、目标预搜索区域分别输入到预训练好的卷积神经元网络中,分别提取第四层、第五层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;使用相关滤波器计算两个第四层、第五层得到的输出响应;将上述两个响应结果加权相加,得到语义分支的响应;将三个具有最高得分的响应对应的目标搜索区域分别输入到IoU预测网络,得到网络的输出结果;比较三个输出结果,最大值对应的目标区域即为当前帧的跟踪结果。的跟踪结果。的跟踪结果。

【技术实现步骤摘要】
一种餐饮税源监控目标跟踪算法及系统


[0001]本申请涉及CV(Computer Vision,计算机视觉)领域,更具体地,涉及一种餐饮税源监控目标跟踪算法及系统。

技术介绍

[0002]视觉目标跟踪是计算机视觉中的一个重要研究方向,有着广泛的应用,如:视频监控,人机交互,无人驾驶等。过去二三十年视觉目标跟踪技术取得了长足的进步,特别是最近两年利用深度学习的目标跟踪方法取得了令人满意的效果,使目标跟踪技术获得了突破性的进展。
[0003]视觉跟踪是指对图像序列中的运动目标进行检测、提取、识别和跟踪,获得运动目标的运动参数,如位置、速度、加速度和运动轨迹等,从而进行下一步的处理与分析,实现对运动目标的行为理解,以完成更高一级的检测任务。
[0004]现有技术中给出了基于区域的跟踪算法、基于特征的跟踪方法、基于轮廓的跟踪方法、基于模型的跟踪方法以及基于检测的跟踪算法。进来随着人工智能的迅猛发展,也有人提出将神经网络技术应用到跟踪算法中。
[0005]针对我国餐饮酒店税收实践工作中的迫切需要,研制一种餐饮税源监控目标跟踪算法及系统。该系统综合利用人工智能、大数据、互联网等多领域创新性技术成果,实现了视频流并发采集及存储管理、视频数据实时目标跟踪,根据视频目标行为及酒店人均消费网络化评估、为后续的酒店应缴税费统计提供依据,具有可操作性强、易于推广应用的明显优势。

技术实现思路

[0006]本申请提供一种餐饮税源监控目标跟踪算法及系统。通过将深度学习网络与IoU(Intersection over Union,交叠)网络相结合,获得形变目标的准确跟踪。
[0007]本申请的一个方面提供了一种餐饮税源监控目标跟踪算法,包括:
[0008]1)获取当前帧图像中包括所述目标及其周边的区域、预搜索区域,其中,对于第一帧图像,手动初始化待跟踪目标及其周边的区域框和预搜索区域;
[0009]2)将所述目标及其周边的区域输入到预训练好的卷积神经元网络中,提取第四层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;
[0010]3)将所述目标及其周边的区域输入到预训练好的卷积神经元网络中,提取第五层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;
[0011]4)将所述目标预搜索区域输入到预训练好的卷积神经元网络中,提取第四层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;
[0012]5)将所述目标预搜索区域输入到预训练好的卷积神经元网络中,提取第五层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;
[0013]6)使用相关滤波器计算步骤2)和步骤4)的全链接层输出的响应;
[0014]7)使用相关滤波器计算步骤2)和步骤4)的全链接层输出的响应;
[0015]8)将步骤6)和步骤7)的结果加权相加,得到语义分支的响应;
[0016]9)将三个具有最高得分的响应对应的目标框作为候选结果,分别输入到IoU预测网络,得到网络的输出结果;
[0017]10)比较三个输出结果,最大值对应的目标区域即为当前帧的跟踪结果;
[0018]11)进行下一帧图像操作,转到步骤1),直到所有跟踪结束。
[0019]本申请的另一个方面提供了一种餐饮税源监控目标跟踪系统,包括:
[0020]存储器,存储有计算机可执行的指令;以及处理器,执行所述指令:
[0021]1)获取当前帧图像中包括所述目标及其周边的区域、预搜索区域,其中,对于第一帧图像,手动初始化待跟踪目标及其周边的区域框和预搜索区域;
[0022]2)将所述目标及其周边的区域输入到预训练好的卷积神经元网络中,提取第四层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;
[0023]3)将所述目标及其周边的区域输入到预训练好的卷积神经元网络中,提取第五层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;
[0024]4)将所述目标预搜索区域输入到预训练好的卷积神经元网络中,提取第四层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;
[0025]5)将所述目标预搜索区域输入到预训练好的卷积神经元网络中,提取第五层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;
[0026]6)使用相关滤波器计算步骤2)和步骤4)的全链接层输出的响应;
[0027]7)使用相关滤波器计算步骤2)和步骤4)的全链接层输出的响应;
[0028]8)将步骤6)和步骤7)的结果加权相加,得到语义分支的响应;
[0029]9)将三个具有最高得分的响应对应的目标搜索区域分别输入到IoU预测网络,得到网络的输出结果;
[0030]10)比较三个输出结果,最大值对应的目标区域即为当前帧的跟踪结果;
[0031]11)进行下一帧图像操作,转到步骤1),直到所有跟踪结束。
[0032]在一个实施方式中,所述步骤9)包括:
[0033]9‑
1)输入上一帧目标的真实区域和边框信息,构建网络的参考分支;
[0034]9‑
2)输入三个具有最高得分的响应对应的目标搜索区域信息,构建测试分支。
[0035]在一个实施方式中,所述步骤9

1)包括:
[0036]输入真实目标区域到ResNet

18网络,提取第一层特征映射,经过卷积和池化后,得到特征映射,进行全卷积操作,将结果输入到测试分支;
[0037]提取第二层特征映射,经过卷积和池化后,得到特征映射,进行全卷积操作,将结果输入到测试分支。
[0038]在一个实施方式中,所述步骤9

2)包括:
[0039]输入真实目标区域到ResNet

18网络,提取第一层特征映射,经过卷积和池化后,得到特征映射;提取第二层特征映射,经过卷积和池化后,得到特征映射;联合参考分支的结果,得到IoU值。
[0040]有益效果
[0041](1)采用最高卷积特征作为语义分支输入,对目标的外观变化具有鲁棒性;
[0042](2)与传统的基于分类的跟踪方法不同,所述方法采用IoU网络细化边界框,它包含了更多的目标空间状态信息;
[0043](3)混合策略提供了互补的好处。语义分支得到目标的粗定位,Iou网络分支细化边界框;
[0044](4)对两个分支进行离线训练,提高了跟踪速度;
[0045](5)能够实时统计客流数量,为餐饮系统的税收提供依据。
附图说明
[0046]为了使本专利技术的目的,系统方案和优点更加清楚,下面将结合附图对本专利技术作进一步的详细描述:
[0047]图1所示为根据本申请一个实施方式的ResNet

18的网络结构。
[0048]图2所示为根据本申请一个实施方式的餐饮税源监控目标跟本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.本申请的一个方面提供了一种餐饮税源监控目标跟踪算法,包括:1) 获取当前帧图像中包括所述目标及其周边的区域、预搜索区域,其中,对于第一帧图像,手动初始化待跟踪目标及其周边的区域框和预搜索区域;2)将所述目标及其周边的区域输入到预训练好的卷积神经元网络中,提取第四层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;3)将所述目标及其周边的区域输入到预训练好的卷积神经元网络中,提取第五层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;4)将所述目标预搜索区域输入到预训练好的卷积神经元网络中,提取第四层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;5)将所述目标预搜索区域输入到预训练好的卷积神经元网络中,提取第五层的卷积特征,然后将其输入到全连接层,并获得全链接层的输出;6)使用相关滤波器计算步骤2)和步骤4)的全链接层输出的响应;7)使用相关滤波器计算步骤2)和步骤4)的全链接层输出的响应;8)将步骤6)和步骤7)的结果加权相加,得到语义分支的响应;9)将三个具有最高得分的响应对应的目标框做为候选结果,分别输入到IoU预测网络,得到网络的输出结果;10)比较三个输出结果,...

【专利技术属性】
技术研发人员:谢英红周育竹韩晓微杨光英高强吴浩铭
申请(专利权)人:沈阳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1