一种场景识别方法、装置、设备和存储介质制造方法及图纸

技术编号：35877127 阅读：7 留言：0更新日期：2022-12-07 11:15

本发明专利技术公开了一种场景识别方法、装置、设备和存储介质，该方法包括：获取待识别场景对应的待识别图像；将所述待识别图像输入预先训练好的场景识别模型中，以使所述场景识别模型基于Stem结构、第一Inception结构、至少一个第二Inception结构和全局平均池化层依次对所述待识别图像进行处理，得到所述待识别图像对应的目标特征信息，并基于全连接层对所述目标特征信息进行分类，得到所述待识别图像的预测分类；根据所述待识别图像的预测分类确定所述待识别场景的场景识别结果。上述技术方案，实现根据参数量较少的预先训练好的场景识别模型确定待识别场景对应的待识别图像的预测分类，并根据待识别图像的预测分类确定待识别场景的场景识别结果，提升场景识别效率。提升场景识别效率。提升场景识别效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种场景识别方法、装置、设备和存储介质

[0001]本专利技术实施例涉及图像处理技术，尤其涉及一种场景识别方法、装置、设备和存储介质。

技术介绍

[0002]场景识别需要根据待识别场景对应的待识别图像，确定待识别场景的场景类型或者位置信息，从而帮助智能系统对待识别场景进行高度准确的语义概括。
[0003]现有技术中，可以基于具有学习能力的神经网络模型提取待识别场景对应的待识别图像的特征信息，并根据特征信息确定待识别场景的场景类型或者位置信息。场景识别需要同时考虑待识别图像中的物体信息、背景信息和上下文信息，给识别任务带来较大的困难，且目前用于场景识别的神经网络模型普遍存在参数量较大的问题。

技术实现思路

[0004]本专利技术提供一种场景识别方法、装置、设备和存储介质，以实现根据参数量较少的预先训练好的场景识别模型确定待识别场景对应的待识别图像的预测分类，并根据待识别图像的预测分类确定待识别场景的场景识别结果，提升场景识别效率。
[0005]第一方面，本专利技术实施例提供了一种场景识别方法，包括：
[0006]获取待识别场景对应的待识别图像；将所述待识别图像输入预先训练好的场景识别模型中，以使所述场景识别模型基于Stem结构、第一Inception结构、至少一个第二Inception结构和全局平均池化层依次对所述待识别图像进行处理，得到所述待识别图像对应的目标特征信息，并基于全连接层对所述目标特征信息进行分类，得到所述待识别图像的预测分类；根据所述待识别图像的预测分类确定所述待...

【技术保护点】

【技术特征摘要】
1.一种场景识别方法，其特征在于，包括：获取待识别场景对应的待识别图像；将所述待识别图像输入预先训练好的场景识别模型中，以使所述场景识别模型基于Stem结构、第一Inception结构、至少一个第二Inception结构和全局平均池化层依次对所述待识别图像进行处理，得到所述待识别图像对应的目标特征信息，并基于全连接层对所述目标特征信息进行分类，得到所述待识别图像的预测分类；根据所述待识别图像的预测分类确定所述待识别场景的场景识别结果。2.根据权利要求1所述的场景识别方法，其特征在于，所述场景识别模型基于Stem结构对所述待识别图像进行处理，包括：将所述待识别图像输入所述Stem结构，以使所述Stem结构基于三个步长为2的3
×
3卷积核的卷积层、三个步长为1的3
×
3卷积核的卷积层、一个步长为1的1
×
1卷积核的卷积层对所述待识别图像进行处理，以减小所述待识别图像的宽度和高度，增加所述待识别图像的通道数，得到所述待识别图像对应的第一特征信息。3.根据权利要求2所述的场景识别方法，其特征在于，所述场景识别模型基于第一Inception结构对所述待识别图像进行处理，包括：将所述第一特征信息输入所述第一Inception结构，以使所述第一Inception结构基于1
×
1卷积核的卷积层对所述第一特征信息进行第一尺寸的特征提取，得到第一中间特征；基于1
×
1卷积核的卷积层、5
×
1卷积核的卷积层和1
×
5卷积核的卷积层对所述第一特征信息进行第二尺寸的特征提取，得到第二中间特征；基于1
×
1卷积核的卷积层、3
×
3卷积核的卷积层、3
×
1卷积核的卷积层和1
×
3卷积核的卷积层对所述第一特征信息进行第二尺寸的特征提取，得到第三中间特征；基于3
×
3卷积核的最大池化层和1
×
1卷积核的卷积层对所述第一特征信息进行第一尺寸的特征提取，得到第四中间特征；融合所述第一中间特征、所述第二中间特征、所述第三中间特征和所述第四中间特征得到所述待识别图像对应的第二特征信息。4.根据权利要求3所述的场景识别方法，其特征在于，所述场景识别模型基于第二Inception结构对所述待识别图像进行处理，包括：将所述第二特征信息输入所述第二Inception结构，以使所述第二Inception结构基于1
×
1卷积核的卷积层对所述第二特征信息进行第一尺寸的特征提取，得到第五中间特征；基于1
×
1卷积核的卷积层、3
×
1卷积核的卷积层和1
×
3卷积核的卷积层对所述第二特征信息进行第三尺寸的特征提取，得到第六中间特征；基于1
×
1卷积核的卷积层、7
...

【专利技术属性】
技术研发人员：谢莲铭，
申请(专利权)人：中国农业银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人