行人检测模型的训练方法、装置、系统和计算机可读介质制造方法及图纸

技术编号:22642873 阅读:19 留言:0更新日期:2019-11-26 16:26
本发明专利技术提供了一种行人检测模型的训练方法、装置、系统和计算机可读介质,该训练方法包括:将训练图像输入至神经网络,以生成关于所述训练图像中的目标对象的预测信息,所述预测信息包括检测框位置、检测框权重和检测框分数,其中,所述检测框权重表示所述检测框中目标对象与背景的相似性,相似性越高,则检测框权重越低;计算所述检测框分数与分数真值之间的第一分类误差,并根据所述检测框权重和所述第一分类误差计算加权分类误差;至少基于所述加权分类误差更新所述神经网络的网络参数。本发明专利技术在行人检测模型的训练过程中自动降低与背景相似的行人样本的检测框权重,从而降低了易混淆样本对网络参数的不利影响,极大地提高了行人检测的精度。

Training method, device, system and computer readable medium of pedestrian detection model

The invention provides a training method, device, system and computer-readable medium for pedestrian detection model, the training method includes: inputting a training image to a neural network to generate prediction information about the target object in the training image, the prediction information includes detection frame position, detection frame weight and detection frame score, wherein, the detection frame weight represents The higher the similarity between the target object and the background in the detection frame, the lower the weight of the detection frame; calculate the first classification error between the score of the detection frame and the true value of the score, and calculate the weighted classification error according to the weight of the detection frame and the first classification error; update the network parameters of the neural network at least based on the weighted classification error. The invention automatically reduces the detection frame weight of the pedestrian sample similar to the background in the training process of the pedestrian detection model, thereby reducing the adverse effect of the easily confused sample on the network parameters, and greatly improving the accuracy of pedestrian detection.

【技术实现步骤摘要】
行人检测模型的训练方法、装置、系统和计算机可读介质
本专利技术涉及行人检测
,更具体地涉及一种行人检测模型的训练方法、装置、系统和计算机可读介质。
技术介绍
行人检测在安防和自动驾驶等领域有着广泛的应用,其目的是从图像或视频中把行人的位置寻找出来。行人检测是很多其他视觉任务的基础,例如行人重识别、行人跟踪和行人动作识别等。由于行人场景中存在许多和行人外观十分相似的背景异物,导致行人检测系统在这些场景中会出现错误检测的状况,降低了行人检测的精确度。在安防或者自动驾驶场景中,错误的检测结果会导致严重的后果,因而需要更加精确的检测系统,以降低与行人相似的异物对行人检测所造成的干扰。
技术实现思路
为了解决上述问题,本专利技术提出了一种基于权重自调节的行人检测模型的训练方案。下面简要描述本专利技术提出的关于行人检测模型的训练方案,更多细节将在后续结合附图在具体实施方式中加以描述。根据本专利技术实施例一方面,提供了一种行人检测模型的训练方法,所述方法包括:将训练图像输入至神经网络,以生成关于所述训练图像中的目标对象的预测信息,所述预测信息包括检测框位置、检测框权重和检测框分数,其中,所述检测框权重表示所述检测框中目标对象与背景的相似性,所述相似性越高,则所述检测框权重越低;计算所述检测框分数与分数真值之间的第一分类误差,并根据所述检测框权重和所述第一分类误差计算加权分类误差;至少基于所述加权分类误差更新所述神经网络的网络参数。在一个实施例中,所述加权分类误差为所述检测框权重与所述第一分类误差的乘积。在一个实施例中,所述方法还包括:计算所述检测框权重与权重真值之间的第二分类误差;以及基于所述第二分类误差更新所述网络参数。在一个实施例中,所述方法还包括:计算所述检测框位置与位置真值之间的位置误差;以及基于所述位置误差更新所述网络参数。在一个实施例中,所述生成所述训练图像中的训练目标的预测信息包括:基于所述神经网络对所述训练图像进行特征提取,以生成所述训练图像的特征图;根据所述特征图生成所述预测信息。根据本专利技术实施例另一方面,提供了一种行人检测模型的训练装置,所述行人检测模型的训练装置包括:预测模块,用于将训练图像输入至神经网络,以生成关于所述训练图像中的目标对象的预测信息,所述预测信息包括检测框位置、检测框权重和检测框分数,其中,所述检测框权重表示所述检测框中目标对象与背景的相似性,所述相似性越高,则所述检测框权重越低;误差计算模块,用于计算所述检测框分数与分数真值之间的第一分类误差,并根据所述检测框权重和所述第一分类误差计算加权分类误差;以及训练模块,用于至少基于所述加权分类误差更新网络参数。在一个实施例中,所述加权分类误差为所述检测框权重与所述第一分类误差的乘积。在一个实施例中,所述装置还包括:特征提取模块,用于基于所述神经网络对所述训练图像进行特征提取,以生成所述训练图像的特征图;并且,所述预测模块根据所述特征图生成所述预测信息。根据本专利技术实施例再一方面,提供了一种行人检测模型的训练系统,所述行人检测模型的训练系统包括存储装置和处理器,所述存储装置上存储有由所述处理器运行的计算机程序,所述计算机程序在被所述处理器运行时执行上述任一项所述的行人检测模型的训练方法。根据本专利技术实施例又一方面,提供了一种计算机可读介质,所述计算机可读介质上存储有计算机程序,所述计算机程序在运行时执行上述任一项所述的行人检测模型的训练方法。本专利技术实施例的行人检测模型的训练方法、装置、系统和计算机可读介质在行人检测模型的训练过程中自动降低与背景相似的行人样本的检测框权重,从而避免了易混淆样本对网络参数的不利影响,极大地提高了行人检测的精度。附图说明通过结合附图对本专利技术实施例进行更详细的描述,本专利技术的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与本专利技术实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中,相同的参考标号通常代表相同部件或步骤。图1示出用于实现根据本专利技术实施例的行人检测模型的训练方法、装置、系统和计算机可读介质的示例电子设备的示意性框图;图2示出根据本专利技术实施例的行人检测模型的训练方法的示意性流程图;图3示出根据本专利技术实施例的行人检测模型的训练方法的神经网络的框架图;图4示出根据本专利技术实施例的行人检测模型的训练装置的示意性框图;以及图5示出根据本专利技术实施例的行人检测模型的训练系统的示意性框图。具体实施方式为了使得本专利技术的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本专利技术的示例实施例。显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是本专利技术的全部实施例,应理解,本专利技术不受这里描述的示例实施例的限制。基于本专利技术中描述的本专利技术实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本专利技术的保护范围之内。首先,参照图1来描述用于实现本专利技术实施例的行人检测模型的训练方法、装置、系统和计算机可读介质的示例电子设备100。如图1所示,电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106、输出装置108以及图像传感器110,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本专利技术实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。所述输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。所述输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音),并且可以包括显示器、扬声器等中的一个或多个。所述图像传感器110可以拍摄用户期望的图像(例如照片、视频等),并且将所拍摄的图像存储在所述存储装置104中以供其它组件使用。当注意,图1所示的电子设备100的组件和结构只是示例性的,尽管图1示出的电子设本文档来自技高网...

【技术保护点】
1.一种行人检测模型的训练方法,其特征在于,所述训练方法包括:/n将训练图像输入至神经网络,以生成关于所述训练图像中的目标对象的预测信息,所述预测信息包括检测框位置、检测框权重和检测框分数,其中,所述检测框权重表示所述检测框中目标对象与背景的相似性,所述相似性越高,则所述检测框权重越低;/n计算所述检测框分数与分数真值之间的第一分类误差,并根据所述检测框权重和所述第一分类误差计算加权分类误差;/n至少基于所述加权分类误差更新所述神经网络的网络参数。/n

【技术特征摘要】
1.一种行人检测模型的训练方法,其特征在于,所述训练方法包括:
将训练图像输入至神经网络,以生成关于所述训练图像中的目标对象的预测信息,所述预测信息包括检测框位置、检测框权重和检测框分数,其中,所述检测框权重表示所述检测框中目标对象与背景的相似性,所述相似性越高,则所述检测框权重越低;
计算所述检测框分数与分数真值之间的第一分类误差,并根据所述检测框权重和所述第一分类误差计算加权分类误差;
至少基于所述加权分类误差更新所述神经网络的网络参数。


2.根据权利要求1所述的行人检测模型的训练方法,其特征在于,所述加权分类误差为所述检测框权重与所述第一分类误差的乘积。


3.根据权利要求1所述的行人检测模型的训练方法,其特征在于,还包括:
计算所述检测框权重与权重真值之间的第二分类误差;以及
基于所述第二分类误差更新所述网络参数。


4.根据权利要求1所述的行人检测模型的训练方法,其特征在于,还包括:
计算所述检测框位置与位置真值之间的位置误差;以及
基于所述位置误差更新所述网络参数。


5.根据权利要求1所述的行人检测模型的训练方法,其特征在于,所述生成所述训练图像中的训练目标的预测信息包括:
基于所述神经网络对所述训练图像进行特征提取,以生成所述训练图像的特征图;
根据所述特征图生成所述预测信息。


6.一种行人检测模型的训练装置,其特征在于,...

【专利技术属性】
技术研发人员:胡立孙培泽李伯勋俞刚
申请(专利权)人:北京迈格威科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1