目标分类方法、目标分类装置及计算机可读存储介质制造方法及图纸

技术编号:27804547 阅读:27 留言:0更新日期:2021-03-30 09:11
本公开提供了一种目标分类方法、目标分类装置及计算机可读存储介质,涉及人工智能技术领域。其中的目标分类方法包括:将训练图像输入神经网络,得到训练图像的特征向量;将与训练图像具有相同标签的正样本图像输入神经网络,得到正样本图像的特征向量;将与训练图像具有不同标签的负样本图像输入神经网络,得到负样本图像的特征向量;调整神经网络的参数以减小神经网络的损失函数值;损失函数值与第一距离呈正相关且与第二距离呈负相关,第一距离为负样本图像的特征向量与训练图像的特征向量之间的距离,第二距离为正样本图像的特征向量与训练图像的特征向量之间的距离;利用神经网络对目标图像进行分类。本公开能够更加准确的对目标进行识别和分类。的对目标进行识别和分类。的对目标进行识别和分类。

【技术实现步骤摘要】
目标分类方法、目标分类装置及计算机可读存储介质


[0001]本公开涉及人工智能
,特别涉及一种目标分类方法、装置及计算机可读存储介质。

技术介绍

[0002]图像识别是人工智能领域的重要部分。图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标的技术。为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型。
[0003]图像分类是计算机视觉的核心,实际应用广泛。采用机器学习的方法处理图像分类问题时,向机器学习模型输入图像,机器学习模型能够输出一个已知的混合类别中的某一个标签,从而确定该图像中内容所属的类别。

技术实现思路

[0004]本公开解决的一个技术问题是,如何更加准确的对目标进行识别和分类。
[0005]根据本公开实施例的一个方面,提供了一种目标分类方法,包括:将训练图像输入神经网络,得到训练图像的特征向量;将与训练图像具有相同标签的正样本图像输入所述神经网络,得到正样本图像的特征向量;将与训练图像具有不同标签的负样本图像输入所述神经网络,得到负样本图像的特征向量;调整所述神经网络的参数以减小所述神经网络的损失函数值;所述损失函数值与第一距离呈正相关且与第二距离呈负相关,所述第一距离为负样本图像的特征向量与训练图像的特征向量之间的距离,所述第二距离为正样本图像的特征向量与训练图像的特征向量之间的距离;利用所述神经网络对目标的图像进行处理,以确定目标的类别。
[0006]在一些实施例中,所述距离为余弦距离。
[0007]在一些实施例中,所述神经网络的损失函数L为:
[0008][0009]其中,N表示训练图像、正样本图像、负样本图像所组成三元组的个数,i表示三元组的序号;{
·
}
+
=max({
·
},0),表示{
·
}内的值大于零时取该值,小于零时取零;表示第i个三元组中的训练图像,表示第i个三元组中的负样本图像,表示第i个三元组中的正样本图像;f(
·
)表示求特征向量;cos[]表示求特征向量之间的余弦距离;α为常数。
[0010]在一些实施例中,目标分类方法还包括:将InceptionV3神经网络中第三个Inception模块组之后的神经层,替换为由全局平均池化层、全连接层、分类层组成的神经层,以生成所述神经网络。
[0011]在一些实施例中,所述利用所述神经网络对目标的图像进行处理,以确定目标的类别包括:将目标的图像输入所述神经网络,以使得所述分类层输出多维向量;所述多维向量中的元素表示目标属于各个类别的概率,所述多维向量的维度表示各个类别的总数;根
据所述多维向量,确定目标所属的类别。
[0012]在一些实施例中,目标分类方法还包括:在对InceptionV3神经网络中第三个Inception模块组之后的神经层进行替换之前,采用标注了标签的训练图片集对InceptionV3神经网络进行训练。
[0013]根据本公开实施例的另一个方面,提供了一种目标分类装置,包括:图像输入模块,被配置为:将训练图像输入神经网络,得到训练图像的特征向量;将与训练图像具有相同标签的正样本图像输入所述神经网络,得到正样本图像的特征向量;将与训练图像具有不同标签的负样本图像输入所述神经网络,得到负样本图像的特征向量;网络调整模块,被配置为调整所述神经网络的参数以减小所述神经网络的损失函数值;所述损失函数值与第一距离呈正相关且与第二距离呈负相关,所述第一距离为负样本图像的特征向量与训练图像的特征向量之间的距离,所述第二距离为正样本图像的特征向量与训练图像的特征向量之间的距离;目标分类模块,被配置为利用所述神经网络对目标的图像进行处理,以确定目标的类别。
[0014]在一些实施例中,前述距离为余弦距离。
[0015]在一些实施例中,神经网络的损失函数L为:
[0016][0017]其中,N表示训练图像、正样本图像、负样本图像所组成三元组的个数,i表示三元组的序号;{
·
}
+
=max({
·
},0),表示{
·
}内的值大于零时取该值,小于零时取零;表示第i个三元组中的训练图像,表示第i个三元组中的负样本图像,表示第i个三元组中的正样本图像;f(
·
)表示求特征向量;cos[]表示求特征向量之间的余弦距离;α为常数。
[0018]在一些实施例中,目标分类装置还包括网络生成模块,被配置为:将InceptionV3神经网络中第三个Inception模块组之后的神经层,替换为由全局平均池化层、全连接层、分类层组成的神经层,以生成所述神经网络。
[0019]在一些实施例中,目标分类模块被配置为:将目标图像输入所述神经网络,以使得所述分类层输出多维向量;所述多维向量中的元素表示目标属于各个类别的概率,所述多维向量的维度表示各个类别的总数;根据所述多维向量,确定目标所属的类别。
[0020]在一些实施例中,网络生成模块还被配置为:在对InceptionV3神经网络中第三个Inception模块组之后的神经层进行替换之前,采用标注了标签的训练图片集对InceptionV3神经网络进行训练。
[0021]根据本公开实施例的又一个方面,提供了又一种目标分类装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述的目标分类方法。
[0022]根据本公开实施例的再一个方面,提供了一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现前述的目标分类方法。
[0023]本公开能够更加准确的对目标进行识别和分类。
[0024]通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
[0025]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0026]图1示出了本公开一些实施例的目标分类方法的流程示意图。
[0027]图2示出了本公开另一些实施例的目标分类方法的流程示意图。
[0028]图3示出了本公开一些实施例的目标分类装置的结构示意图。
[0029]图4示出了本公开另一些实施例的目标分类装置的结构示意图。
具体实施方式
[0030]下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例,本领域普通技术人员在没有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标分类方法,包括:将训练图像输入神经网络,得到训练图像的特征向量;将与训练图像具有相同标签的正样本图像输入所述神经网络,得到正样本图像的特征向量;将与训练图像具有不同标签的负样本图像输入所述神经网络,得到负样本图像的特征向量;调整所述神经网络的参数以减小所述神经网络的损失函数值;所述损失函数值与第一距离呈正相关且与第二距离呈负相关,所述第一距离为负样本图像的特征向量与训练图像的特征向量之间的距离,所述第二距离为正样本图像的特征向量与训练图像的特征向量之间的距离;利用所述神经网络对目标的图像进行处理,以确定目标的类别。2.如权利要求1所述的目标分类方法,其中,所述距离为余弦距离。3.如权利要求2所述的目标分类方法,其中,所述神经网络的损失函数L为:其中,N表示训练图像、正样本图像、负样本图像所组成三元组的个数,i表示三元组的序号;{
·
}
+
=max({
·
},0),表示{
·
}内的值大于零时取该值,小于零时取零;表示第i个三元组中的训练图像,表示第i个三元组中的负样本图像,表示第i个三元组中的正样本图像;f(
·
)表示求特征向量;cos[]表示求特征向量之间的余弦距离;α为常数。4.如权利要求1所述的目标分类方法,还包括:将InceptionV3神经网络中第三个Inception模块组之后的神经层,替换为由全局平均池化层、全连接层、分类层组成的神经层,以生成所述神经网络。5.如权利要求4所述的目标分类方法,其中,所述利用所述神经网络对目标的图像进行处理,以确定目标的类别包括:将目标的图像输入所述神经网络,以使得所述分类层输出多维向量;所述多维向量中的元素表示目标属于各个类别的概率,所述多维向量的维度表示各个类别的总数;根据所述多维向量,确定目标所属的类别。6.如权利要求4所述的目标分类方法,还包括:在对InceptionV3神经网络中第三个Inception模块组之后的神经层进行替换之前,采用标注了标签的训练图片集对InceptionV3神经网络进行训练。7.一种目标分类装置,包括:图像输入模块,被配置为:将训练图像输入神经网络,得到训练图像的特征向量;将与训练图像具有相同标签的正样本图像输入所述神经网络,得到正样本图像的特征向量;将与训练图像具有不同标签的负样本...

【专利技术属性】
技术研发人员:于志刚贺群李昊刘国萍孙静博刘康全硕辛冠军付睿周路
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1