行为识别方法、装置、设备和存储介质制造方法及图纸

技术编号:34903602 阅读:10 留言:0更新日期:2022-09-10 14:14
本申请提供一种行为识别方法、装置、设备和存储介质,包括:将待识别视频输入识别模型中,以得到待识别视频对应的视频特征,识别模型用于识别至少一种行为类别;获取多个训练样本视频各自对应的目标样本特征,多个训练样本视频对应于至少一种行为类别;根据视频特征与获取的多个训练样本视频各自对应的目标样本特征,确定待识别视频对应的不确定度;根据不确定度确定待识别视频的域类别,其中,域类别为包含至少一种行为类别的域内类别或者不包含至少一种行为类别的域外类别;若待识别视频属于域内类别,则确定待识别视频在域内类别下对应的目标行为类别。本方案根据不确定度确定待识别视频的域类别,从而提高行为识别结果的准确性。准确性。准确性。

【技术实现步骤摘要】
行为识别方法、装置、设备和存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种行为识别方法、装置、设备和存储介质。

技术介绍

[0002]诸如行为类别识别等分类识别,是深度学习技术重要的应用方向,同时也是视频分析中的基础任务。针对视频的行为识别,是指用来分析视频中目标人物的动作的类别。为了完成行为识别任务,一般都需要基于大量的标记训练数据来训练出一个识别模型,让该识别模型能够学习到不同行为类别的特征信息,以使用该识别模型完成视频的行为识别任务。
[0003]传统的行为识别任务使用大量的标记训练数据来训练模型,其中被标记的数据属于域内数据(in

distribution data),这样训练出来的模型只能正确的分类域内数据,并且会把训练时未出现过的数据——域外数据(out

of

distribution data)误分类成域内数据的某个类,导致实际应用受限,识别结果准确度不佳。

技术实现思路

[0004]本专利技术实施例提供一种行为识别方法、装置、设备和存储介质,用以提高行为识别结果的准确性。
[0005]第一方面,本专利技术实施例提供一种行为识别方法,所述方法包括:将待识别视频输入识别模型中,以得到所述待识别视频对应的视频特征,所述识别模型用于识别至少一种行为类别;获取多个训练样本视频各自对应的目标样本特征,所述多个训练样本视频对应于所述至少一种行为类别;根据所述视频特征与所述多个训练样本视频各自对应的目标样本特征,确定所述待识别视频对应的不确定度;根据所述不确定度确定所述待识别视频的域类别,所述域类别为包含所述至少一种行为类别的域内类别或者不包含所述至少一种行为类别的域外类别;若所述待识别视频属于所述域内类别,则确定所述待识别视频在所述域内类别下对应的目标行为类别。
[0006]第二方面,本专利技术实施例提供一种行为识别装置,所述装置包括:提取模块,用于将待识别视频输入识别模型中,以得到所述待识别视频对应的视频特征,所述识别模型用于识别至少一种行为类别;确定模块,获取多个训练样本视频各自对应的目标样本特征,所述多个训练样本视频对应于所述至少一种行为类别;根据所述视频特征与所述多个训练样本视频各自对应的目标样本特征,确定所述待识别视频对应的不确定度;识别模块,用于根据所述不确定度确定所述待识别视频的域类别,所述域类别为
包含所述至少一种行为类别的域内类别或者不包含所述至少一种行为类别的域外类别;以及,若所述待识别视频属于所述域内类别,则确定所述待识别视频在所述域内类别下对应的目标行为类别。
[0007]第三方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器、通信接口;其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如第一方面所述的行为识别方法。
[0008]第四方面,本专利技术实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现如第一方面所述的行为识别方法。
[0009]第五方面,本专利技术实施例提供一种行为识别方法,所述方法包括:接收用户设备通过调用行为识别服务触发的请求,所述请求中包括待识别视频;利用所述行为识别服务对应的处理资源执行如下步骤:将待识别视频输入识别模型中,以得到所述待识别视频对应的视频特征,所述识别模型用于识别至少一种行为类别;获取多个训练样本视频各自对应的目标样本特征,所述多个训练样本视频对应于所述至少一种行为类别;根据所述视频特征与所述多个训练样本视频各自对应的目标样本特征,确定所述待识别视频对应的不确定度;根据所述不确定度确定所述待识别视频的域类别,所述域类别为包含所述至少一种行为类别的域内类别或者不包含所述至少一种行为类别的域外类别;若所述待识别视频属于所述域内类别,则确定所述待识别视频在所述域内类别下对应的目标行为类别。
[0010]在本专利技术实施例中,当需要识别视频中目标人物的动作类别时,首先,将待识别视频输入识别模型中,以得到待识别视频对应的视频特征。其中,识别模型用于识别至少一种行为类别,基于训练好的识别模型可以获取多个训练样本视频各自对应的目标样本特征,其中,该多个训练样本视频对应于识别模型可识别的至少一种行为类别。之后,根据待识别视频的视频特征与多个训练样本视频各自对应的目标样本特征,确定待识别视频对应的不确定度,根据不确定度确定待识别视频是属于域内类别还是属于域外类别,若待识别视频属于域内类别,则确定待识别视频在域内类别下对应的目标行为类别。
[0011]在上述方案中,基于训练好的识别模型获取至少一种行为类别的多个训练样本视频各自对应的目标样本特征,意味着该识别模型会关注同一行为类别中不同训练样本视频的特征差异性,该差异性的学习,有助于更佳准确的识别出待识别视频是否属于域内类别(即是否属于上述至少一种行为类别之一)。具体地,基于这些目标样本特征与待识别视频的视频特征,可以确定出用于区分待识别视频是属于域内类别还是域外类别的不确定度这个指标,据此完成待识别视频的域分类,能够避免将属于域外类别的待识别视频错误的分类到某个域内类别下,从而可提高行为识别结果的准确性。
附图说明
[0012]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使
用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0013]图1为本专利技术实施例提供的一种行为识别方法的流程图;图2为本专利技术实施例提供的不确定度的计算过程的示意图;图3为本专利技术实施例提供的行为识别方法的应用示意图;图4为本专利技术实施例提供的一种识别模型训练方法的流程图;图5为图4所示实施例的执行过程的示意图;图6为本专利技术实施例提供的另一种识别模型训练方法的流程图;图7为图6所示实施例的执行过程的示意图;图8为本专利技术实施例提供的一种行为识别方法的应用示意图;图9为本专利技术实施例提供的一种行为识别装置的结构示意图;图10为本实施例提供的一种电子设备的结构示意。
具体实施方式
[0014]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0015]另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
[0016]先对本专利技术实施例中涉及到的如下概念进行说明。
[0017]行为识别,本实施例涉及针对视频的行为识别,是指分析视频中目标人物的动作的类别,即识别视频中目标人物的行为类别,比如:握拳、拍手等。要完成行为识别任务,通常需要基于大量的标记训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行为识别方法,其特征在于,包括:将待识别视频输入识别模型中,以得到所述待识别视频对应的视频特征,所述识别模型用于识别至少一种行为类别;获取多个训练样本视频各自对应的目标样本特征,所述多个训练样本视频对应于所述至少一种行为类别;根据所述视频特征与所述多个训练样本视频各自对应的目标样本特征,确定所述待识别视频对应的不确定度;根据所述不确定度确定所述待识别视频的域类别,所述域类别为包含所述至少一种行为类别的域内类别或者不包含所述至少一种行为类别的域外类别;若所述待识别视频属于所述域内类别,则确定所述待识别视频在所述域内类别下对应的目标行为类别。2.根据权利要求1所述的方法,其特征在于,所述确定所述待识别视频在所述域内类别下对应的目标行为类别,包括:获取所述至少一种行为类别各自对应的目标类别特征,所述目标类别特征是所述识别模型中被训练的参数;根据所述视频特征与所述至少一种行为类别各自对应的目标类别特征之间的相似度,确定所述待识别视频在所述域内类别下对应的目标行为类别。3.根据权利要求1所述的方法,其特征在于,所述根据所述视频特征与所述多个训练样本视频各自对应的目标样本特征,确定所述待识别视频对应的不确定度,包括:根据所述多个训练样本视频各自对应的目标样本特征,确定所述多个训练样本视频对应的样本统计特征;根据所述视频特征与所述多个训练样本视频对应的样本统计特征,确定所述待识别视频对应的不确定度。4.根据权利要求3所述的方法,其特征在于,所述样本统计特征包括:所述多个训练样本视频各自对应的目标样本特征的均值和协方差矩阵。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述获取多个训练样本视频各自对应的目标样本特征,包括:将所述多个训练样本视频分别输入到训练好的所述识别模型中,以获得所述多个训练样本视频各自对应的目标样本特征。6.根据权利要求1至4中任一项所述的方法,其特征在于,所述识别模型的训练过程,包括:获取第一行为类别对应的第一训练样本视频和多个第二训练样本视频;通过所述识别模型提取所述第一训练样本视频对应的第一样本特征以及所述多个第二训练样本视频对应的多个第二样本特征;确定所述第一样本特征与所述识别模型当前学习到的所述第一行为类别对应的类别特征之间的第一相似度,以及所述第一样本特征分别与第一特征集中特征之间的第二相似度,所述第一特征集中包括所述多个第二样本特征;确定第二特征集,所述第二特征集包括所述识别模型当前学习到的第二行为类别对应的类别特征以及所述第二行为类别对应的训练样本视频对应的样本特征;其中,所述第二
行为类别包括所述至少一种行为类别中除所述第一行为类别外的行为类别;确定所述第一样本特征与所述第二特征集中特征之间的第三相似度;以使得所述第一相似度、所述第二相似度靠近设定相似度阈值为约束,根据所述第一相似度、所述第二相似度...

【专利技术属性】
技术研发人员:岑俊张士伟吕逸良赵德丽
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1