【技术实现步骤摘要】
利用卷积神经网络进行视频处理的方法及装置
本专利技术涉及图像处理
,更具体地,涉及利用卷积神经网络进行视频处理的方法及装置。
技术介绍
卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网络已经成为在图像识别、语音识别等领域最常用的算法,这一类方法需要非常多的计算量,需要设计专用的加速器。但由于可移动设备资源受限,目前在GPU和FPGA(FieldProgrammableGateArray,现场可编程门阵列)平台上设计的加速器很难在这些要求低功耗、资源受限的平台(例如移动操作系统)上使用。目前神经网络被广泛应用于追踪领域,神经网络往往用于处理视频任务,即神经网络会处理连续的帧图像,用于追踪或者识别视频中的物体。多帧处理需要加速器按时计算结果响应,但同时,多帧处理又给加速器带来了非常多的计算量,增大了延时。目前大部分方法均采用逐帧处理的方式,即一帧图像经过神经网络的所有卷积层处理后,再处理下一帧图像,但这样的处理方式存在计算量大且效率低的缺陷。
技术实现思路
本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的利用卷积神经网络进行视频处理的方法及装置。第一个方面,本专利技术实施例提供一种利用卷积神经网络进行视频处理的方法,包括:将视频拆分成按时序排列的多帧图像;将任意一帧图像作为目标图像,选择在所述目标图像时序前的另一帧 ...
【技术保护点】
1.一种利用卷积神经网络进行视频处理的方法,其特征在于,包括:/n将视频拆分成按时序排列的多帧图像;/n将任意一帧图像作为目标图像,选择在所述目标图像时序前的另一帧图像作为参考图像,将所述目标图像和所述参考图像分别经过卷积神经网络中第i层卷积层计算的结果求和,获得所述目标图像相对卷积神经网络中第i+1层卷积层的原始帧;/n将所述参考图像经过卷积神经网络中第i层卷积层计算的结果和所述原始帧分别输入至卷积神经网络中的激活函数,并计算两个输出结果的差值,获得所述目标图像相对卷积神经网络中第i+1层卷积层的差分帧;/n将所述目标图像相对卷积神经网络中第i+1层卷积层的差分帧输入至卷积神经网络中第i+1层卷积层,获得所述目标图像经过卷积神经网络中第i+1层卷积层计算的结果;0≤i≤N-1,i和N均为正整数,N表示卷积层的总层数。/n
【技术特征摘要】
1.一种利用卷积神经网络进行视频处理的方法,其特征在于,包括:
将视频拆分成按时序排列的多帧图像;
将任意一帧图像作为目标图像,选择在所述目标图像时序前的另一帧图像作为参考图像,将所述目标图像和所述参考图像分别经过卷积神经网络中第i层卷积层计算的结果求和,获得所述目标图像相对卷积神经网络中第i+1层卷积层的原始帧;
将所述参考图像经过卷积神经网络中第i层卷积层计算的结果和所述原始帧分别输入至卷积神经网络中的激活函数,并计算两个输出结果的差值,获得所述目标图像相对卷积神经网络中第i+1层卷积层的差分帧;
将所述目标图像相对卷积神经网络中第i+1层卷积层的差分帧输入至卷积神经网络中第i+1层卷积层,获得所述目标图像经过卷积神经网络中第i+1层卷积层计算的结果;0≤i≤N-1,i和N均为正整数,N表示卷积层的总层数。
2.根据权利要求1所述的利用卷积神经网络进行视频处理的方法,其特征在于,所述将所述目标图像相对卷积神经网络中第i+1层卷积层的差分帧输入至卷积神经网络中第i+1层卷积层,之前还包括:
根据所述差分帧中各像素点的比特数,将所述差分帧拆分为低比特数据和高比特数据;
相应地,所述将所述目标图像相对卷积神经网络中第i+1层卷积层的差分帧输入至卷积神经网络中第i+1层卷积层,具体为:
若判断输入至用于计算卷积神经网络的计算单元的数据为低比特数据,则将所述计算单元重构为低比特模式,将所述低比特数据输入至低比特模式的计算单元的卷积神经网络中第i+1层卷积层;
若判断输入至用于计算卷积神经网络的计算单元的数据为高比特数据,则将所述计算单元重构为高比特模式,将所述高比特数据输入至高比特模式的计算单元的卷积神经网络中第i+1层卷积层。
3.根据权利要求2所述的利用卷积神经网络进行视频处理的方法,其特征在于,获得所述目标图像经过卷积神经网络中第i+1层卷积层计算的结果,具体为:
将低比特模式的计算单元和高比特模式的计算单元的卷积神经网络中第i+1层卷积层的输出结果相加,获得所述目标图像经过卷积神经网络中第i+1层卷积层计算的结果。
4.根据权利要求2或3所述的利用卷积神经网络进行视频处理的方法,其特征在于,所述将所述差分帧拆分为低比特数据和高比特数据,之后还包括:
对低比特数据使用第一编码方法进行编码,获得第一编码结果;
对高比特数据使用第二编码方法进行编码,获得第二编码结果;
将所述第一编码结果和所述第二编码结果存储至内存中。
5.根据权利要求4所述的利用卷积神经网络进行视频处理的方法,其特征在于,所述将所述低比特数据输入至低比特模式的计算单元的卷积神经网络中第i+1层卷积层,具体为:
根据第一解码方法将内存中的第一编码结果进行解码,获...
【专利技术属性】
技术研发人员:刘勇攀,袁哲,杨一雄,岳金山,刘若洋,李学清,杨华中,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。