图像识别装置和图像识别方法制造方法及图纸

技术编号:17310226 阅读:37 留言:0更新日期:2018-02-19 10:09
具备针对所输入的图像而进行支持向量机(SVM)运算的SVM运算部、和对在图像识别处理的途中生成的数据进行暂时保存的数据保存部,SVM运算部具备:特征值计算部,其计算表示在所输入的图像中拍到的对象物即识别对象物与要进行识别的对象物即比较对象物相似的程度的特征值;以及累积相加部,其对与在示教数据组中被归类为同种比较对象物的示教数据对应的特征值进行累积相加,在SVM运算处理中,特征值计算部将与示教数据对应的特征值全部计算出并保存在数据保存部中,累积相加部对同种比较对象物的特征值进行累积相加,作为在图像识别处理中对识别对象物进行识别的结果而输出。

Image recognition device and image recognition method

In the view of the input image and support vector machine (SVM) operation SVM operation Department, and on the way to generate image recognition processing of the data is temporarily stored data, SVM arithmetic section includes eigenvalue calculation, the calculation of said object in the input image is photographed object recognition for object recognition and to compare feature point object similarity value; and the cumulative sum, and in teaching data group classified teaching data corresponding to the comparison of the characteristics of the object as the same value of the cumulative sum in SVM processing, characteristic value calculation unit with the characteristics of teaching data corresponding to the value of all calculated and stored in a data storage section, Department of the same sum of cumulative characteristics comparison object value of cumulative sum, as in the image recognition process of recognition of The output of an image as a result of recognition.

【技术实现步骤摘要】
【国外来华专利技术】图像识别装置和图像识别方法
本专利技术涉及图像识别装置和图像识别方法。本申请根据2015年06月22日在日本申请的特愿2015-124786号要求优先权,并在此援引其内容。
技术介绍
一直以来,存在对图像中拍摄到的物体即被摄体(对象物)和被拍摄了图像的场景进行识别的图像识别的技术(参照非专利文献1)。在现有的图像识别技术中,通过以下的处理步骤来识别被拍摄了图像的场景。(步骤1):生成所输入的图像中的代表性的局部图案(视觉词汇)的集合。(步骤2):根据视觉词汇生成所输入的图像整体的直方图(识别对象数据)。(步骤3):对识别对象数据与大量示教数据分别进行比较,对所输入的图像的场景进行识别。在此,示教数据为按照每个对象物的种类对大量的图像进行分类汇总而得到的直方图。在现有的图像识别的技术中,在上述的步骤3的处理中例如进行SVM(Supportvectormachine:支持向量机)运算等,按照各示教数据的每一个而计算出表示在所输入的图像中拍到的对象物与各示教数据所表示的对象物相似到了何种程度的特征值。然后,识别出特征值最大的示教数据所表示的对象物为所输入的图像中所映现的对象物或者映现有特征值最大的对象物的场景。在此,在SVM运算中,利用以下的步骤,按照各示教数据的每一个计算出特征值。(步骤3-1):从大量的示教数据中读取1个示教数据。(步骤3-2):对所读取的示教数据与识别对象数据进行比较并计算出特征值(内核)。(步骤3-3):对计算出的特征值进行累积相加。(步骤3-4):输出累积相加而得到的各特征值,作为表示所输入的图像中所映现的对象物与各示教数据所表示的对象物相似的程度的相似度。另外,在现有的图像识别的技术中,为了输出与1个对象物对应的相似度,例如从5000个示教数据中读取被分类为同种对象物的1500个示教数据,并对1500个特征值进行累积相加而作为相似度输出。即,在现有的图像识别的技术中,通过反复1500次上述的步骤3-1~步骤3-3的处理步骤,按照示教数据中被分类出的每一个对象物输出与所输入的图像中包含的1个对象物对应的相似度。此外,在现有的图像识别的技术中,是按照所输入的图像中包含的识别对象的对象物的数目,即场景的数目来输出相似度的。即,在现有的图像识别的技术中,通过按照场景的数目来反复执行上述步骤3-1~步骤3-4的处理步骤来输出识别对象的各个对象物的每一个的相似度。在先技术文献非专利文献非专利文献1:柳井啓司,“Bag-of-Keypointsによるカテゴリー認識”,第14回画像センシングシンポジウム(SSII2008),2008年6月13日
技术实现思路
专利技术所要解决的课题但是,在现有的图像识别的技术中,如上文所述,为了输出与1个对象物对应的相似度而进行大量(例如1500个)示教数据的读取。而且,在现有的图像识别技术中,在持续输出与相同图像中包含的其他对象物对应的相似度时,会废弃为了输出上一次的相似度而对示教数据进行读取而计算出的特征值,并再次进行被归类为另外的种类的对象物的大量示教数据的读取。因此,在现有的图像识别的技术中,在所输入的图像中包含多个识别对象的对象物的情况下,会进行对象物的数目(场景数)×大量的示教数据的读取与特征值的计算。但是,在示教数据中,相同的直方图被归类为不同的多种对象物。即,存在在不同的对象物中示教数据发生重复的情况。因此,在现有的图像识别装置中,在输出与不同的对象物对应的相似度的情况下,会多次进行相同的示教数据的读取,或多次进行使用相同的示教数据对相同的特征值进行计算的运算。该现有的图像识别装置中的相同示教数据的读取和相同特征值的计算的反复执行即重复进行的处理成为在图像识别装置中进行图像识别处理时的负荷增大的主要原因。本专利技术是基于上述课题的认识而被完成的,其目的在于提供一种能够降低进行图像识别处理时的负荷的图像识别装置以及图像识别方法。用于解决课题的手段根据本专利技术的第1方式,图像识别装置按照比较对象物的每个种类来对示教数据进行归类,基于包含多个该示教数据的示教数据组来进行针对所输入的图像的图像识别处理,所述比较对象物是要进行识别的对象物,所述示教数据是所述比较对象物的图像的直方图,所述图像识别装置具备:SVM运算部,其基于所述示教数据组中包含的多个所述示教数据中的各个示教数据,针对基于所述图像的视觉词汇而生成的直方图进行支持向量机(SVM)运算;以及数据保存部,其暂时保存在所述图像识别处理的途中所生成的数据,所述SVM运算部具备:特征值计算部,其对所输入的所述图像的直方图与所述示教数据所表示的所述比较对象物的直方图进行比较,并计算表示在所输入的所述图像中拍到的对象物即识别对象物与所述比较对象物相似的程度的特征值;以及累积相加部,其对与被归类为同种所述比较对象物的所述示教数据对应的所述特征值进行累积相加,在所述SVM运算的处理中,所述特征值计算部按照各个所述示教数据计算与所述示教数据组中包含的全部所述示教数据对应的所述特征值,并将计算出的全部所述特征值保存在所述数据保存部中,在所述特征值计算部将全部所述特征值保存到所述数据保存部中之后,所述累积相加部从所保存的全部所述特征值中读取与被归类为同种所述比较对象物的所述示教数据对应的所述特征值并进行累积相加,且将累积相加而得到的所述特征值作为在所述图像识别处理中对所述识别对象物进行识别的结果而输出。根据本专利技术的第2方式,在上述第1方式的图像识别装置中,也可以采用如下方式,在所述示教数据组中包含的所述示教数据的数目少于、在所述图像识别处理中至输出对所述识别对象物进行识别的全部结果为止所述累积相加部读取保存在所述数据保存部中的所述特征值并进行累积相加的次数的情况下,所述特征值计算部计算与所述示教数据组中包含的全部所述示教数据对应的全部所述特征值并将其保存在所述数据保存部中。根据本专利技术的第3方式,在上述第2方式的图像识别装置中,也可以采用如下方式,该图像识别装置还具备示教数据解压部,该示教数据解压部对所述示教数据组进行解压而恢复成各个所述示教数据,其中所述示教数据组是以如下形式输入的:在将全部所述示教数据汇总为1个的状态下进行了可逆压缩,在所述SVM运算的处理中,所述示教数据解压部对所述示教数据组进行解压而恢复成各个所述示教数据,所述特征值计算部计算与被所述示教数据解压部恢复的各个所述示教数据对应的全部所述特征值并将该特征值保存在所述数据保存部中。根据本专利技术的第4方式,在上述第2方式或者上述第3方式的图像识别装置中,也可以采用如下方式,该图像识别装置还具备仲裁部,该仲裁部仲裁在所述图像识别处理中以排他的方式进行运算处理的视觉词汇运算部、直方图运算部和所述SVM运算部对所述数据保存部的利用,所述仲裁部根据被分配了所述数据保存部的利用的任意一个运算部对所述数据保存部的访问而对所述数据保存部进行访问。根据本专利技术的第5方式,在上述第4方式的图像识别装置中,也可以采用如下方式,所述数据保存部具有如下存储容量,该存储容量能够存储所述视觉词汇运算部、所述直方图运算部和所述SVM运算部执行各自的处理时向所述数据保存部暂时保存的最大量的数据。根据本专利技术的第6方式,图像识别方法为如下图像识别装置的图像识别方法,该图像识别装置按照比较对象物的每本文档来自技高网
...
图像识别装置和图像识别方法

【技术保护点】
一种图像识别装置,其按照比较对象物的每个种类来对示教数据进行归类,基于包含多个该示教数据的示教数据组来进行针对所输入的图像的图像识别处理,所述比较对象物是要进行识别的对象物,所述示教数据是所述比较对象物的图像的直方图,所述图像识别装置具备:SVM运算部,其基于所述示教数据组中包含的多个所述示教数据中的各个示教数据,针对基于所述图像的视觉词汇而生成的直方图进行支持向量机(SVM)运算;以及数据保存部,其暂时保存在所述图像识别处理的途中所生成的数据,所述SVM运算部具备:特征值计算部,其对所输入的所述图像的直方图与所述示教数据所表示的所述比较对象物的直方图进行比较,并计算表示在所输入的所述图像中拍到的对象物即识别对象物与所述比较对象物相似的程度的特征值;以及累积相加部,其对与被归类为同种所述比较对象物的所述示教数据对应的所述特征值进行累积相加,在所述SVM运算的处理中,所述特征值计算部按照各个所述示教数据计算与所述示教数据组中包含的全部所述示教数据对应的所述特征值,并将计算出的全部所述特征值保存在所述数据保存部中,在所述特征值计算部将全部所述特征值保存到所述数据保存部中之后,所述累积相加部从所保存的全部所述特征值中读取与被归类为同种所述比较对象物的所述示教数据对应的所述特征值并进行累积相加,且将累积相加而得到的所述特征值作为在所述图像识别处理中对所述识别对象物进行识别的结果而输出。...

【技术特征摘要】
【国外来华专利技术】2015.06.22 JP 2015-1247861.一种图像识别装置,其按照比较对象物的每个种类来对示教数据进行归类,基于包含多个该示教数据的示教数据组来进行针对所输入的图像的图像识别处理,所述比较对象物是要进行识别的对象物,所述示教数据是所述比较对象物的图像的直方图,所述图像识别装置具备:SVM运算部,其基于所述示教数据组中包含的多个所述示教数据中的各个示教数据,针对基于所述图像的视觉词汇而生成的直方图进行支持向量机(SVM)运算;以及数据保存部,其暂时保存在所述图像识别处理的途中所生成的数据,所述SVM运算部具备:特征值计算部,其对所输入的所述图像的直方图与所述示教数据所表示的所述比较对象物的直方图进行比较,并计算表示在所输入的所述图像中拍到的对象物即识别对象物与所述比较对象物相似的程度的特征值;以及累积相加部,其对与被归类为同种所述比较对象物的所述示教数据对应的所述特征值进行累积相加,在所述SVM运算的处理中,所述特征值计算部按照各个所述示教数据计算与所述示教数据组中包含的全部所述示教数据对应的所述特征值,并将计算出的全部所述特征值保存在所述数据保存部中,在所述特征值计算部将全部所述特征值保存到所述数据保存部中之后,所述累积相加部从所保存的全部所述特征值中读取与被归类为同种所述比较对象物的所述示教数据对应的所述特征值并进行累积相加,且将累积相加而得到的所述特征值作为在所述图像识别处理中对所述识别对象物进行识别的结果而输出。2.根据权利要求1所述的图像识别装置,其中,在所述示教数据组中包含的所述示教数据的数目少于在所述图像识别处理中至输出对所述识别对象物进行识别的全部结果为止所述累积相加部读取保存在所述数据保存部中的所述特征值并进行累积相加的次数的情况下,所述特征值计算部计算与所述示教数据组中包含的全部所述示教数据对应的全部所述特征值并将其保存在所述数据保存部中。3.根据权利要求2所述的图像识别装置,其中,该图像识别装置还具备示教数据解压部,该示教数据解压部对所述示教数据组进行解压而恢复成各个所述示教数据,其中所述示教数据组是以如下形式输入的:在将全部所述示教数据汇总为1个的状态下进行了可逆压缩,在所述SVM运算的处理中,所述示教数据解...

【专利技术属性】
技术研发人员:刈屋三友上野晃
申请(专利权)人:奥林巴斯株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1