更新物体识别模型的方法和装置制造方法及图纸

技术编号:30186666 阅读:26 留言:0更新日期:2021-09-29 08:23
本申请提供人工智能领域中的更新物体识别模型的方法和装置。本申请提供的技术方案中,获取目标图像和获取用户的第一语音信息,所述第一语音信息用于指示所述目标图像中的目标物体的第一类别,并根据所述目标图像和所述第一语音信息,更新第一物体识别模型的特征库,更新后的所述第一物体识别模型中包括所述目标物体的特征和用于表示所述第一类别的第一标签,且所述目标物体的特征与所述第一标签对应。本申请提出的技术方案,可以更便捷地提高物体识别模型的识别率。高物体识别模型的识别率。高物体识别模型的识别率。

【技术实现步骤摘要】
更新物体识别模型的方法和装置


[0001]本申请涉及人工智能(artificial intelligence,AI)领域,并且更具体地,涉及更新物体识别模型的方法和装置。

技术介绍

[0002]人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人,自然语言处理,计算机视觉,决策与推理,人机交互,推荐与搜索,AI基础理论等。
[0003]物体检测是计算机视觉中的经典问题之一,其任务是用框去标出图像中物体的位置,并给出物体的类别。其中,物体检测中给出物体类别是通过物体识别来实现的。物体识别,也可以理解为物体分类,是根据物体的特征,把不同类别的物体区分开来的方法。
[0004]随着人工智能技术的发展,物体识别已经不再仅仅是依靠传统的人工识别来实现,还是可以使用基于深度学习的物体识别模型来实现。
[0005]基于深度学习的物体识别模型,通常是使用大量已知类别的物体图像对物体识别模型进行训练,以使得物体识别模型能够学习到不同类别物体所特有的特征,并记录不同类别的物体的特征与类别标签的对应关系。这样,训练过的物体识别模型在实际业务应用中输入了物体图像时,即可以根据该物体图像推理出该物体的类别,从而达到物体识别的目的。
[0006]例如,用户利用手机等终端设备进行物体检测时,可以利用训练好的物体识别模型来识别出手机等终端拍摄到的图像中的物体的类别。
[0007]上述通过训练使得物体识别模型能够识别物体的类别的方法存在如下问题:该物体识别模型只能识别训练过程中涉及的物体类别,若目标物体的类别不属于训练过程中涉及的物体类别,则物体识别模型识别不了该目标物体。
[0008]解决该问题的一种方法为,对物体识别模型训练之后,在物体识别模型的使用过程中,可以对物体识别模型进行更新,以使得物体识别模型可以识别更多类别的物体。
[0009]因此,如何更新物体识别模型,称为一个亟待解决的技术问题。

技术实现思路

[0010]本申请提供更新物体识别模型的方法和装置,使得物体识别模型能够识别更多的物体,提高物体识别模型的识别率。
[0011]第一方面,本申请提供一种更新物体识别模型的方法,该方法包括:获取摄像设备采集的目标图像;获取语音设备采集的第一语音信息,所述第一语音信息用于指示所述目标图像中的目标物体的第一类别;根据所述目标图像和所述第一语音信息,更新第一物体
识别模型,更新后的所述第一物体识别模型中包括所述目标物体的特征和第一标签,且所述目标物体的特征与所述第一标签之间具有对应关系,所述第一标签用于表示所述第一类别。
[0012]本申请的方法中,因为可以向物体识别模型中添加物体特征和该特征对应的类别标签,使得该物体识别模型可以识别出该类别的物体,从而提高物体识别模型的识别率,进而提升物体识别模型的智能化。此外,本申请的方法使得用户可以通过语音指示待更新的物体类别,可以提高用户更新该物体识别模型的便捷性。
[0013]结合第一方面,在第一种可能的实现方式中,所述根据所述目标图像和所述第一语音信息,更新第一物体识别模型,包括:根据所述第一标签和至少一类标签中每类标签的相似度,确定所述第一标签为所述至少一类标签中的第一类标签,所述第一标签与所述第一类标签的相似度大于所述第一标签与所述至少一类标签中其他类标签的相似度;使用第二物体识别模型,根据所述目标图像,确定所述目标物体的类别标签为所述第一类标签的第一概率;在所述第一概率大于或等于预设的概率阈值时,将所述目标物体的特征和所述第一标签添加至所述第一物体识别模型的特征库。
[0014]该实现方式中,在确定用户通过语音指示的类别为目标物体的真实类别的概率较高的情况下,才更新第一物体识别模型,有助于提高更新到第一物体识别模型中的物体特征对应的类别标签的准确率,从而可以提高第一物体识别模型的识别准确率。
[0015]结合第一种可能的实现方式,在第二种可能的实现方式中,所述根据所述第一标签和至少一类标签中每类标签的相似度,确定所述第一标签为所述至少一类标签中的第一类标签,包括:根据所述第一标签的语义特征和至少一类标签中每类标签的语义特征之间的相似度,确定所述第一标签为所述至少一类标签中的第一类标签;其中,所述第一标签与所述第一类标签的相似度大于所述第一标签与所述至少一类标签中其他类标签的相似度,包括:所述第一标签的语义特征与所述第一类标签的语义特征之间的距离,小于所述第一标签的语义特征与所述其他类标签的语义特征之间的距离。
[0016]结合第一方面或上述任意一种可能的实现方式,在第三种可能的实现方式中,所述目标图像中包括第一物体,所述目标物体为所述目标图像中位于所述第一物体指示的方向上离所述第一物体最近的物体,所述第一物体包括眼球或手指。
[0017]该实现方式中,可以预先指定目标图像中的眼球或手指为指向物体,并将位于指向物体指示的方向上的物体确定为目标物体,这有助于准确地将用户通过声音指示的第一类别标记到用户指定的目标物体,从而可以提高更新后的第一物体识别模型的识别准确率。
[0018]结合第三种可能的实现方式,在第四种可能的实现方式中,所述根据所述目标图像和所述第一语音信息,更新第一物体识别模型,包括:根据所述目标图像,确定所述目标图像中的所述第一物体的边界框;根据所述边界框中的图像确定所述第一物体指示的方向;对所述目标图像进行视觉显著性检测,得到所述目标图像中的多个显著区域;据所述第一物体指示的方向,从所述多个显著区域中确定目标显著区域,所述目标显著区域为所述多个显著区域中,在所述第一物体指示的方向上,离所述第一物体最近的显著区域;根据所述目标显著区域更新所述第一物体识别模型,其中,所述目标显著区域内的物体包括所述目标物体。
[0019]结合第四种可能的实现方式,在第五种可能的实现方式中,所述根据所述边界框框中的图像确定所述第一物体指示的方向,包括:使用分类模型,对所述边界框中的图像进行分类,得到所述第一物体的目标类别;根据所述第一物体的目标类别确定所述第一物体指示的方向。
[0020]第二方面,本申请提供一种更新物体识别模型的装置,该装置包括:获取模块,用于获取摄像设备采集的目标图像;所述获取模块还用于获取语音设备采集的第一语音信息,所述第一语音信息用于指示所述目标图像中的目标物体的第一类别;更新模块,用于根据所述目标图像和所述第一语音信息,更新第一物体识别模型,更新后的所述第一物体识别模型中包括所述目标物体的特征和所述第一标签,且所述目标物体的特征与所述第一标签之间具有对应关系,所述第一标签用于表示所述第一类别。
[0021]本申请的装置中,因为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种更新物体识别模型的方法,其特征在于,包括:获取摄像设备采集的目标图像;获取语音设备采集的第一语音信息,所述第一语音信息用于指示所述目标图像中的目标物体的第一类别;根据所述目标图像和所述第一语音信息,更新第一物体识别模型,更新后的所述第一物体识别模型中包括所述目标物体的特征和第一标签,且所述目标物体的特征和所述第一标签之间具有对应关系,所述第一标签用于表示所述第一类别。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标图像和所述第一语音信息,更新第一物体识别模型,包括:根据所述第一标签和至少一类标签中每类标签的相似度,确定所述第一标签为所述至少一类标签中的第一类标签,所述第一标签与所述第一类标签的相似度大于所述第一标签与所述至少一类标签中其他类标签的相似度;使用第二物体识别模型,根据所述目标图像,确定所述目标物体的类别标签为所述第一类标签的第一概率;在所述第一概率大于或等于预设的概率阈值时,将所述目标物体的特征和所述第一标签添加至所述第一物体识别模型。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一标签和至少一类标签中每类标签的相似度,确定所述第一标签为所述至少一类标签中的第一类标签,包括:根据所述第一标签的语义特征和至少一类标签中每类标签的语义特征之间的相似度,确定所述第一标签为所述至少一类标签中的第一类标签;其中所述第一标签与所述第一类标签的相似度大于所述第一标签与所述至少一类标签中其他类标签的相似度,包括:所述第一标签的语义特征与所述第一类标签的语义特征之间的距离,小于所述第一标签的语义特征与所述其他类标签的语义特征之间的距离。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述目标图像中包括第一物体,所述目标物体为所述目标图像中位于所述第一物体指示的方向上且离所述第一物体最近的物体,所述第一物体包括眼球或手指。5.根据权利要求4所述的方法,其特征在于,所述根据所述目标图像和所述第一语音信息,更新第一物体识别模型的特征库,包括:确定所述目标图像中的所述第一物体的边界框;根据所述边界框中的图像确定所述第一物体指示的方向;对所述目标图像进行视觉显著性检测,得到所述目标图像中的多个显著区域;根据所述第一物体指示的方向,从所述多个显著区域中确定目标显著区域,所述目标显著区域为所述多个显著区域中,在所述第一物体指示的方向上,离所述第一物体的边界框最近的显著区域;根据所述目标显著区域更新所述第一物体识别模型,其中,所述目标显著区域内的物体包括所述目标物体。6.根据权利要求5所述的方法,其特征在于,所述根据所述边界框中的图像确定所述第一物体指示的方向,包括:
使用分类模型,对所述边界框中的图像进行分类,得到所述第一物体的目标类别;根据所述第一物体的目标类别确定所述第一物体指示的方向。7.一种更新物体识别模型的装置,其特征在于,包括:获取模块,用于获取摄像设备采集的目标图像;所述获取模块还用于...

【专利技术属性】
技术研发人员:岳俊钱莉许松岑邵滨
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1