一种训练样本获得方法、装置、电子设备和存储介质制造方法及图纸

技术编号:21116558 阅读:38 留言:0更新日期:2019-05-16 09:14
本发明专利技术提供了一种训练样本获得方法、装置、电子设备及存储介质,方法包括:获得视频中的场景片段;在所述场景片段中选择一个包含目标对象的视频帧作为初始帧,对所述初始帧中的所述目标对象所在的目标区域进行标注;提取所述初始帧中被标注的所述目标区域的特征信息;以所述初始帧为基准,对所述场景片段中前向和/或后向的视频帧进行特征搜索,确定各个被搜索帧中特征信息与所述目标区域的特征信息相匹配的区域,并对各个被搜索帧中所确定的区域进行自动标注;提取所述场景片段中已标注的各个视频帧的图像作为训练样本。本发明专利技术可以解决现有技术中获取图像训练样本效率低、成本高的问题。

【技术实现步骤摘要】
一种训练样本获得方法、装置、电子设备和存储介质
本专利技术涉及机器学习
,尤其涉及一种训练样本获得方法、装置、电子设备和计算机可读存储介质。
技术介绍
人工智能识别模型的建立需要大量训练样本进行训练,训练样本一般为图片格式。然而,为满足训练要求,通常需要获取大量的图片作为训练样本,并且在进行标注时,需要分别对每张图片进行目标标注,效率较低、成本也比较高。
技术实现思路
本专利技术的目的在于提供一种训练样本获得方法、装置、电子设备和计算机可读存储介质,以解决现有技术中获取图像训练样本效率低、成本高的问题。为解决上述技术问题,本专利技术提供了一种训练样本获得方法,包括:获得视频中的场景片段;在所述场景片段中选择一个包含目标对象的视频帧作为初始帧,对所述初始帧中的所述目标对象所在的目标区域进行标注;提取所述初始帧中被标注的所述目标区域的特征信息;以所述初始帧为基准,对所述场景片段中前向和/或后向的视频帧进行特征搜索,确定各个被搜索帧中特征信息与所述目标区域的特征信息相匹配的区域,并对各个被搜索帧中所确定的区域进行自动标注;提取所述场景片段中已标注的各个视频帧的图像作为训练样本。可选的,所述获得视频中的场景片段,包括:若所述视频为单场景视频,则将所述视频作为一个场景片段;若所述视频为多场景视频,则利用场景切换检测技术,将所述视频划分为多个场景片段。可选的,所述场景切换检测技术包括:基于像素域的检测算法、基于压缩域的检测算法。可选的,在所述提取所述初始帧中被标注的所述目标区域的特征信息之前,还包括:对所述初始帧进行图像预处理,以使所述初始帧中所述目标区域的特征信息更加明显。可选的,所述目标区域的特征信息,包括:颜色特征、纹理特征和形状特征中的一种或多种。可选的,所述对所述场景片段中前向和/或后向的视频帧进行特征搜索,包括:利用均值漂移算法、Kalman滤波算法或粒子滤波算法,对所述场景片段中前向和/或后向的视频帧进行特征搜索。可选的,所述方法还包括:如果某一被搜索帧中不存在特征信息与所述目标区域的特征信息相匹配的区域,则获取目标特征信息,确定该被搜索帧中特征信息与所述目标特征信息相匹配的区域,并对该被搜索帧中所确定的区域进行自动标注;其中,所述目标特征信息为:该被搜索帧的相邻预设数量帧中已被标注区域的特征信息。本专利技术还提供一种训练样本获得装置,包括:获得模块,用于获得视频中的场景片段;第一标注模块,用于在所述场景片段中选择一个包含目标对象的视频帧作为初始帧,对所述初始帧中的所述目标区域进行标注;第一提取模块,用于提取所述初始帧中被标注的所述目标区域的特征信息;第二标注模块,用于以所述初始帧为基准,对所述场景片段中前向和/或后向的视频帧进行特征搜索,确定各个被搜索帧中特征信息与所述目标区域的特征信息相匹配的区域,并对各个被搜索帧中所确定的区域进行自动标注;第二提取模块,用于提取所述场景片段中已标注的各个视频帧的图像作为训练样本。可选的,所述获得模块,具体用于:若所述视频为单场景视频,则将所述视频作为一个场景片段;若所述视频为多场景视频,则利用场景切换检测技术,将所述视频划分为多个场景片段。可选的,所述场景切换检测技术包括:基于像素域的检测算法、基于压缩域的检测算法。可选的,所述装置还包括:预处理模块,用于在所述第一提取模块提取所述初始帧中被标注的所述目标区域的特征信息之前,对所述初始帧进行图像预处理,以使所述初始帧中所述目标区域的特征信息更加明显。可选的,所述目标区域的特征信息,包括:颜色特征、纹理特征和形状特征中的一种或多种。可选的,所述第二提取模块对所述场景片段中前向和/或后向的视频帧进行特征搜索,具体为:利用均值漂移算法、Kalman滤波算法或粒子滤波算法,对所述场景片段中前向和/或后向的视频帧进行特征搜索。可选的,所述第二提取模块还用于:如果某一被搜索帧中不存在特征信息与所述目标区域的特征信息相匹配的区域,则获取目标特征信息,确定该被搜索帧中特征信息与所述目标特征信息相匹配的区域,并对该被搜索帧中所确定的区域进行自动标注;其中,所述目标特征信息为:该被搜索帧的相邻预设数量帧中已被标注区域的特征信息。本专利技术还提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口、存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述任一项所述的训练样本获得方法的步骤。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的训练样本获得方法的步骤。本专利技术提供的方案,首先对视频的场景片段内的初始帧进行标注,然后使用目标跟踪技术对整个场景片段内其它视频帧进行自动标注,从而获得大量的经过标注的图像作为后期建立目标识别模型的训练样本。现有技术中通过获取大量图片进行人工标注,图片获取以及标注成本较高,而本专利技术可以拍摄一段视频,标注素材的获取比较方便容易,然后可以从视频中采集大量自动标注的样本,降低了样本标注成本,提高了标注处理效率。附图说明图1是本专利技术一实施例提供的一种训练样本获得方法的流程示意图;图2是本专利技术一实施例提供的一种训练样本获得装置的结构示意图;图3是本专利技术一实施例提供的电子设备的结构框图。具体实施方式以下结合附图和具体实施例对本专利技术提出的一种训练样本获得方法、装置、电子设备和计算机可读存储介质作进一步详细说明。根据权利要求书和下面说明,本专利技术的优点和特征将更清楚。为解决现有技术的问题,本专利技术实施例提供了一种训练样本获得方法、装置、电子设备及计算机可读存储介质。需要说明的是,本专利技术实施例的训练样本获得方法可应用于本专利技术实施例的训练样本获得装置,该训练样本获得装置可被配置于电子设备上。其中,该电子设备可以是个人计算机、移动终端等,该移动终端可以是手机、平板电脑等具有各种操作系统的硬件设备。图1是本专利技术一实施例提供的一种训练样本获得方法的流程示意图,请参考图1,一种训练样本获得方法可以包括如下步骤:S101,获得视频中的场景片段。一个视频一般由一个或多个场景段组成,一个场景由多个视频帧组成。本专利技术所基于的视频可以是单场景视频,也可以是多场景视频。若所述视频为单场景视频,由于视频中只包含一个场景片段,则可以直接将所述视频作为所获得的一个场景片段,并执行后续的处理步骤。若所述视频为多场景视频,则可以利用场景切换检测技术,将所述视频划分为多个场景片段。在划分出多个场景片段后,可以仅采用其中的一个场景片段,通过执行后续的处理步骤,得到该场景片段内已标注的各个视频帧的图像作为训练样本,也可以针对每一场景片段均执行后续的处理步骤,从而可以进一步增加所获得的训练样本的数量。场景切换检测技术,是指找出一个视频中发生场景切换的帧和帧位置,得到的帧位置能用于视频快速和精确剪辑或进一步处理,得到的帧所组成的帧序列可以用于粗略描述整个视频内容。目前,传统的视频场景切换检测方法一般采用人工提取特征的方式,例如计算相邻帧的颜色直方图相似度,或者直接计算帧差,或者利用视频场景中各帧的高频子带系数的变化程度特征VH(viewportHeight,视窗高度)检测场景切换,其中计算高频子带系数需要用到三维小本文档来自技高网...

【技术保护点】
1.一种训练样本获得方法,其特征在于,包括:获得视频中的场景片段;在所述场景片段中选择一个包含目标对象的视频帧作为初始帧,对所述初始帧中所述目标对象所在的目标区域进行标注;提取所述初始帧中被标注的所述目标区域的特征信息;以所述初始帧为基准,对所述场景片段中前向和/或后向的视频帧进行特征搜索,确定各个被搜索帧中特征信息与所述目标区域的特征信息相匹配的区域,并对各个被搜索帧中所确定的区域进行自动标注;提取所述场景片段中已标注的各个视频帧的图像作为训练样本。

【技术特征摘要】
1.一种训练样本获得方法,其特征在于,包括:获得视频中的场景片段;在所述场景片段中选择一个包含目标对象的视频帧作为初始帧,对所述初始帧中所述目标对象所在的目标区域进行标注;提取所述初始帧中被标注的所述目标区域的特征信息;以所述初始帧为基准,对所述场景片段中前向和/或后向的视频帧进行特征搜索,确定各个被搜索帧中特征信息与所述目标区域的特征信息相匹配的区域,并对各个被搜索帧中所确定的区域进行自动标注;提取所述场景片段中已标注的各个视频帧的图像作为训练样本。2.如权利要求1所述的训练样本获得方法,其特征在于,所述获得视频中的场景片段,包括:若所述视频为单场景视频,则将所述视频作为一个场景片段;若所述视频为多场景视频,则利用场景切换检测技术,将所述视频划分为多个场景片段。3.如权利要求2所述的训练样本获得方法,其特征在于,所述场景切换检测技术包括:基于像素域的检测算法、基于压缩域的检测算法。4.如权利要求1所述的训练样本获得方法,其特征在于,在所述提取所述初始帧中被标注的所述目标区域的特征信息之前,还包括:对所述初始帧进行图像预处理,以使所述初始帧中所述目标区域的特征信息更加明显。5.如权利要求1所述的训练样本获得方法,其特征在于,所述目标区域的特征信息,包括:颜色特征、纹理特征和形状特征中的一种或多种。6.如权利要求1所述的训练样本获得方法,其特征在于,所述对所述场景片段中前向和/或后向的视频帧进行特征搜索,包括:利用均值漂移算法、Kalman滤波算法或粒子滤波算法,对所述场景片段中前向和/或后向的视频帧进行特征搜索。7.如权利要求1所述的训练样本获得方法,其特征在于,所述方法还包括:如果某一被搜索帧中不存在特征信息与所述目标区域的特征信息相匹配的区域,则获取目标特征信息,确定该被搜索帧中特征信息与所述目标特征信息相匹配的区域,并对该被搜索帧中所确定的区域进行自动标注;其中,所述目标特征信息为:该被搜索帧的相邻预设数量帧中已被标注区域的特征信息。8.一种训练样本获得装置,其特征在于,包括:获得模块,用于获得视频中的场景片段;第一标注模块,用于在所述场景片段中选择一个包含目标对象的视频帧作为初始帧,对所述初始帧中的所述目标对象所在的目标区域进行标注;第一提取模块,用于提取所述初始帧中被标注的所述目标区域的特征信息...

【专利技术属性】
技术研发人员:徐青松李青
申请(专利权)人:杭州睿琪软件有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1