用于处理图像的方法和装置制造方法及图纸

技术编号：18896455 阅读：24 留言：0更新日期：2018-09-08 11:54

本申请实施例公开了用于处理图像的方法和装置。该方法的一具体实施方式包括：获取待识别图像；将待识别图像划分为至少两个子图像；对于至少两个子图像中的每个子图像，对该子图像进行滤波处理，得到该子图像的纹理图像；将所得到的纹理图像输入至预先训练的目标检测模型，确定是否得到该子图像的纹理图像包括的第一目标图像的位置信息和类别信息，其中，目标检测模型用于表征图像与图像包括的目标图像的位置信息和类别信息的对应关系；响应于确定得到第一目标图像的位置信息和类别信息，输出所得到的第一目标图像的位置信息和类别信息。该实施方式提高了对待识别图像进行识别的准确性。

Method and device for processing images

The embodiment of the application discloses a method and device for processing images. One specific embodiment of the method includes: acquiring the image to be recognized; dividing the image to be recognized into at least two sub-images; filtering each sub-image of at least two sub-images to obtain the texture image of the sub-image; and inputting the obtained texture image to the pre-trained target. Detection model, determining whether or not the position information and category information of the first target image included in the texture image of the sub-image are obtained, wherein the target detection model is used to characterize the correspondence between the image and the position information and category information of the target image including the image; in response to determination, the position information of the first target image is obtained. And class information, and output the location information and category information of the first target image. The implementation improves the accuracy of recognizing image recognition.

全部详细技术资料下载

【技术实现步骤摘要】
用于处理图像的方法和装置
本申请实施例涉及计算机
，具体涉及用于处理图像的方法和装置。
技术介绍
计算机视觉技术是一门研究如何使机器“看”的技术。计算机视觉技术利用摄影机和电脑代替人眼对目标进行识别、跟踪、测量等，再进一步做图形处理，使目标图像被处理成为更适合人眼观察或传送给仪器检测的图像。计算机视觉技术可以应用于人脸识别、物体识别、工业品检测等多种领域。例如，在轮胎制造行业，可以通过采集轮胎的X光图像，并对采集的X光图像进行分析，以判断轮胎是否具有缺陷。
技术实现思路
本申请实施例提出了用于处理图像的方法和装置。第一方面，本申请实施例提供了一种用于处理图像的方法，该方法包括：获取待识别图像；将待识别图像划分为至少两个子图像；对于至少两个子图像中的每个子图像，对该子图像进行滤波处理，得到该子图像的纹理图像；将所得到的纹理图像输入至预先训练的目标检测模型，确定是否得到该子图像的纹理图像包括的第一目标图像的位置信息和类别信息，其中，目标检测模型用于表征图像与图像包括的目标图像的位置信息和类别信息的对应关系；响应于确定得到第一目标图像的位置信息和类别信息，输出所得到的第一目标图像的位置信息和类别信息。在一些实施例中，目标检测模型通过如下步骤训练得到：获取多个样本纹理图像，多个样本纹理图像中的每个样本纹理图像中的第一目标图像的标注位置信息和标注类别信息；获取预设的第一卷积神经网络；利用机器学习方法，将多个样本纹理图像中的每个样本纹理图像作为第一卷积神经网络的输入，将多个样本纹理图像中的每个样本纹理图像中的第一目标图像的标注位置信息和标注类别信息作为输出，训练得到...

【技术保护点】
1.一种用于处理图像的方法，包括：获取待识别图像；将所述待识别图像划分为至少两个子图像；对于所述至少两个子图像中的每个子图像，对该子图像进行滤波处理，得到该子图像的纹理图像；将所得到的纹理图像输入至预先训练的目标检测模型，确定是否得到该子图像的纹理图像包括的第一目标图像的位置信息和类别信息，其中，所述目标检测模型用于表征图像与图像包括的目标图像的位置信息和类别信息的对应关系；响应于确定得到第一目标图像的位置信息和类别信息，输出所得到的第一目标图像的位置信息和类别信息。

【技术特征摘要】
1.一种用于处理图像的方法，包括：获取待识别图像；将所述待识别图像划分为至少两个子图像；对于所述至少两个子图像中的每个子图像，对该子图像进行滤波处理，得到该子图像的纹理图像；将所得到的纹理图像输入至预先训练的目标检测模型，确定是否得到该子图像的纹理图像包括的第一目标图像的位置信息和类别信息，其中，所述目标检测模型用于表征图像与图像包括的目标图像的位置信息和类别信息的对应关系；响应于确定得到第一目标图像的位置信息和类别信息，输出所得到的第一目标图像的位置信息和类别信息。2.根据权利要求1所述的方法，其中，所述目标检测模型通过如下步骤训练得到：获取多个样本纹理图像，所述多个样本纹理图像中的每个样本纹理图像中的第一目标图像的标注位置信息和标注类别信息；获取预设的第一卷积神经网络；利用机器学习方法，将所述多个样本纹理图像中的每个样本纹理图像作为所述第一卷积神经网络的输入，将所述多个样本纹理图像中的每个样本纹理图像中的第一目标图像的标注位置信息和标注类别信息作为输出，训练得到目标检测模型。3.根据权利要求1所述的方法，其中，所述对该子图像进行滤波处理，得到该子图像的纹理图像，包括：提取该子图像的频谱信息；基于所提取的频谱信息对该子图像进行滤波处理，得到该子图像的纹理图像。4.根据权利要求1所述的方法，其中，所述方法还包括：对于所述至少两个子图像中的每个子图像，将该子图像与该子图像的纹理图像进行差分运算，得到该子图像的背景图像；将所得到的背景图像输入至所述目标检测模型，确定是否得到该子图像的背景图像包括的第二目标图像的位置信息和类别信息；响应于确定得到第二目标图像的位置信息和类别信息，输出所得到的第二目标图像的位置信息和类别信息。5.根据权利要求4所述的方法，其中，所述目标检测模型通过如下步骤训练得到：获取多个样本纹理图像，多个样本背景图像，所述多个样本纹理图像中的每个样本纹理图像中的第一目标图像的标注位置信息和标注类别信息，所述多个样本背景图像中的每个样本背景图像中的第二目标图像的标注位置信息和标注类别信息；获取预设的第二卷积神经网络；利用机器学习方法，将所述多个样本纹理图像中的每个样本纹理图像作为所述第二卷积神经网络的输入，将所述多个样本纹理图像中的每个样本纹理图像中的第一目标图像的标注位置信息和标注类别信息作为所述第二卷积神经网络的输出，以及将所述多个样本背景图像中的每个样本背景图像作为所述第二卷积神经网络的输入，将所述多个样本背景图像中的每个样本背景图像中的第二目标图像的标注位置信息和标注类别信息作为所述第二卷积神经网络的输出，训练得到目标检测模型。6.根据权利要求1所述的方法，其中，所述将所述待识别图像划分为至少两个子图像，包括：将所述待识别图像输入至预先训练的区域划分模型，得到至少一个用于指定所述待识别图像中的区域图像的区域信息，其中，所述区域划分模型用于表征待识别图像和区域信息的对应关系；对于所得到的至少一个区域信息中的每个区域信息，根据该区域信息确定所述待识别图像中的区域图像；对于所确定的各个区域图像中的每个区域图像，将该区域图像划分为至少两个子图像。7.根据权利要求6所述的方法，其中，所述区域划分模型通过如下步骤训练得到：获取多个样本图像和用于标注所述多个样本图像中的每个样本图像中的区域图像的标注区域信息；获取预设的第三卷积神经网络；利用机器学习方法，将所述多个样本图像中的每个样本图像作为所述第三卷积神经网络的输入，将所述多个样本图像中的每个样本图像对应的标注区域信息作为所述第三卷积神经网络的输出，训练得到区域划分模型。8.根据权利要求1-7之一所述的方法，其中，所述方法还包括：基于所述待识别图像，以及所输出的位置信息和类别信息，生成包括位置标记和类别标记的目标标记图像。9.一种用于处理图像的装置，包括：获取单元，配置用于获取待识别图像；划分单元，配置用于将所述待识别图像划分为至少两个子图像；第一检测单元，配置用于对于所述至少两个子图像中的每个子图像，对该子图像进行滤波处理，得到该子...

【专利技术属性】
技术研发人员：王蔚，陈科第，孟泉，周淼，范竣翔，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人