特征处理方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：27535382 阅读：29 留言：0更新日期：2021-03-03 11:20

本发明专利技术提供了一种特征处理方法、装置、电子设备及计算机可读存储介质，属于计算机技术领域。该方法中会对任一待处理特征分别进行至少三次分组卷积操作，得到至少三个特征分量，待处理特征包括待处理视频中的目标视频帧的帧特征，对待处理特征分别进行至少三次分组卷积操作，得到至少三个特征分量，基于至少三次特征分量中的第一特征分量及第二特征分量，计算基于自注意力机制的注意力图，根据剩余的特征分量、注意力图、各个待处理特征及预设权重，获取待处理视频的视频特征。本方法中包含了一个等级分组结构，通过采用分组卷积操作进行卷积运算，进而一定程度上可以降低参数冗余及计算代价。算代价。算代价。

全部详细技术资料下载

【技术实现步骤摘要】
特征处理方法、装置、电子设备及计算机可读存储介质

[0001]本专利技术属于计算机
，特别是涉及一种特征处理方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]在视频理解技术中，往往需要提取待处理视频中某些视频帧的帧特征，然后将这些帧特征聚集为视频级的视频特征。
[0003]现有技术中，可以通过非局部模块(Non-local block)进行帧特征聚集。由于进行帧特征聚集时，是直接针对待处理特征整体进行卷积运算，因此，这种处理方式中，会存在参数冗余程度较高、计算代价较高的问题。

技术实现思路

[0004]本专利技术实施例的目的在于提供一种特征处理方法、装置、电子设备及计算机可读存储介质，以解决生成视频特征时，参数冗余程度较高、计算代价较高的问题。具体技术方案如下：
[0005]在本专利技术实施的第一方面，首先提供了一种特征处理方法，所述方法包括：
[0006]对于任一待处理特征，对所述待处理特征分别进行至少三次分组卷积操作，得到至少三个特征分量；所述待处理特征包括待处理视频中的目标视频帧的帧特征；基于所述至少三次特征分量中的第一特征分量及第二特征分量，计算基于自注意力机制的注意力图；
[0007]根据剩余的特征分量、所述注意力图、各个所述待处理特征及预设权重，获取所述待处理视频的视频特征；
[0008]其中，所述第一特征分量及所述第二特征分量对应的分组数均为g1，所述g1是所述剩余的特征分量对应的分组数g2的r倍，所述注意力图包括g2个子注意...

【技术保护点】

【技术特征摘要】
1.一种特征处理方法，其特征在于，所述方法包括：对于任一待处理特征，对所述待处理特征分别进行至少三次分组卷积操作，得到至少三个特征分量；所述待处理特征包括待处理视频中的目标视频帧的帧特征；基于所述至少三次特征分量中的第一特征分量及第二特征分量，计算基于自注意力机制的注意力图；根据剩余的特征分量、所述注意力图、各个所述待处理特征及预设权重，获取所述待处理视频的视频特征；其中，所述第一特征分量及所述第二特征分量对应的分组数均为g1，所述g1是所述剩余的特征分量对应的分组数g2的r倍，所述注意力图包括g2个子注意力图。2.根据权利要求1所述的方法，其特征在于，所述基于所述至少三次特征分量中的第一特征分量及第二特征分量，计算基于自注意力机制的注意力图，包括：将所述第一特征分量中每r个特征组作为一个第一特征单元，对所述第一特征分量进行划分，得到g2个第一特征单元，以及将所述第二特征分量中每r个特征组作为一个第二特征单元，对所述第二特征分量进行划分，得到g2个第二特征单元；根据所述第一特征分量中的每个第一特征单元及所述第二特征分量中的每个第二特征单元，并基于预设的自注意力算法计算每个所述第一特征单元对应的子注意力图，得到g2个子注意力图。3.根据权利要求2所述的方法，其特征在于，所述根据所述第一特征分量中的每个第一特征单元及所述第二特征分量中的每个第二特征单元，并基于预设的自注意力算法计算每个所述第一特征单元对应的子注意力图，包括：对于任一所述第一特征单元，对所述第一特征单元和所述第一特征单元对应的第二特征单元进行组矩阵相乘操作，得到第一相乘结果；根据预设的自注意力算法中的修正线性单元RELU激活函数，对所述第一相乘结果进行处理，以获取每个所述第一特征单元对应的子注意力图。4.根据权利要求1所述的方法，其特征在于，所述剩余的特征分量为第三特征分量，所述第三特征分量中包括g2个特征组；所述根据剩余的特征分量、所述注意力图、各个所述待处理特征及预设权重，确定所述待处理视频的视频特征，包括：对于任一所述待处理特征，根据所述第三特征分量中的特征组及所述注意力图中的子注意力图进行组矩阵相乘操作，得到第二相乘结果；根据所述第二相乘结果、所述预设权重及所述待处理特征，计算所述待处理特征对应的中间特征；按时间维度对各个所述待处理特征对应的中间特征进行平均处理，得到所述待处理视频的视频特征。5.根据权利要求1至4任一所述的方法，其特征在于，所述r为大于1的整数。6.根据权利要求1至4任一所述的方法，其特征在于，所述对所述待处理特征分别进行至少三次分组卷积操作，得到至少三个特征分量，包括：按照分组数g1对所述待处理特征进行第一分组卷积操作及第二分组卷积操作，得到所述第一特征分量及所述第二特征分量；按照分组数g2对所述待处理特征进行第三分组卷积操作，得到第三特征分量。7.一种特征处理装置，其特征在于，所述装置包括：

【专利技术属性】
技术研发人员：刘倩，王涛，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人