图像处理方法、神经网络及其训练方法、设备和介质技术

技术编号：33635835 阅读：11 留言：0更新日期：2022-06-02 01:48

本公开提供了一种图像处理方法、神经网络及其训练方法、设备和介质，涉及人工智能领域，具体涉及计算机视觉技术、图像处理技术和深度学习技术。神经网络包括与多个模态对应的多个分支网络，分支网络包括：输入子网络，被配置为在对应的模态的输入图像中提取第一特征；第一交互子网络被配置为：针对多个模态中的每一个模态确定第一注意力分数；基于多个模态各自的第一注意力分数调整对应的模态的第一注意力分数；基于调整后的对应的模态的第一注意力分数对对应的模态的第一特征进行处理以得到第二特征；输出子网络被配置为基于对应的模态的第二特征得到第一结果。神经网络还包括：综合输出子网络被配置为基于模态的多个第二特征，得到第二结果。得到第二结果。得到第二结果。

全部详细技术资料下载

【技术实现步骤摘要】
图像处理方法、神经网络及其训练方法、设备和介质

[0001]本公开涉及人工智能领域，具体涉及计算机视觉技术、图像处理技术、和深度学习技术，特别涉及一种神经网络，一种神经网络的训练方法、一种利用神经网络进行图像处理的方法、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]随着人脸识别技术的进步，人脸识别系统也得到了越来越广泛的使用，但同时如何保证人脸识别系统抵御各种虚假人脸的攻击、保证人脸识别系统的可信度是一个巨大的挑战。对此，人脸防伪受到了学术届、工业界的广泛关注。人脸防伪旨在判断输入人脸图像或者视频是否为真实活体脸，而对于假的、合成的人脸来攻击算法，应当予以拒绝，从而抵御不法分子通过照片、视频、面具等虚假人脸对人脸识别系统进行攻击。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0005]本公开提供了...

【技术保护点】

【技术特征摘要】
1.一种神经网络，所述神经网络包括与多个模态对应的多个分支网络，其中，所述多个分支网络中的每一个分支网络包括：输入子网络，被配置为在对应的模态的输入图像中提取所述对应的模态的多个第一特征，其中，所述对应的模态的多个第一特征与所述多个模态中的任一其他模态的多个第一特征相对应；第一交互子网络，被配置为：针对所述多个模态中的每一个模态，确定该模态的多个第一注意力分数，所述多个第一注意力分数与该模态的多个第一特征对应；基于所述多个模态各自的多个第一注意力分数，调整所述对应的模态的多个第一注意力分数；以及基于调整后的所述对应的模态的多个第一注意力分数对所述对应的模态的多个第一特征进行处理，以得到所述对应的模态的多个第二特征；以及输出子网络，被配置为基于所述对应的模态的多个第二特征，得到第一结果，其中，所述神经网络还包括：综合输出子网络，被配置为基于所述多个模态各自的多个第二特征，得到第二结果。2.根据权利要求1所述的神经网络，其中，所述调整所述对应的模态的该第一特征的第一注意力分数包括：针对所述对应的模态的多个第一注意力分数中的每一个第一注意力分数，将所述多个模态各自与该第一注意力分数对应的第一注意力分数与预设阈值进行比较；基于比较结果，调整所述对应的模态的该第一注意力分数。3.根据权利要求2所述的神经网络，其中，所述基于比较结果，调整所述对应的模态的该第一注意力分数包括执行以下步骤中的至少一项：响应于确定所述多个模态各自与该第一注意力分数对应的第一注意力分数中的至少一个第一注意力分数大于预设阈值，提升该第一注意力分数；以及响应于确定所述多个模态各自与该第一注意力分数对应的第一注意力分数均不大于所述预设阈值，降低将该第一注意力分数。4.根据权利要求1所述的神经网络，其中，所述多个第一特征包括第一全局特征和多个第一局部特征，其中，所述确定该模态的多个第一注意力分数包括：基于该模态的第一全局特征和该模态的多个第一局部特征中的每一个第一局部特征的乘积，确定该模态的多个第一注意力分数，所述多个第一注意力分数与所述多个第一局部特征对应。5.根据权利要求4所述的神经网络，其中，所述第一交互子网络被进一步配置为：针对多个模态中的每一个模态，利用第一查询参数，将该模态的第一全局特征映射为第一查询特征；以及分别利用第一键参数和第一值参数，将该模态的多个第一局部特征映射为多个第一键特征和第一值特征，其中，所述确定该模态的多个第一注意力分数包括：基于该模态的第一查询特征与该模态的多个第一键特征中的每一个第一键特征的乘积，确定该模态的多个第一注意力分数，
其中，所述基于调整后的所述对应的模态的多个第一局部特征各自的第一注意力分数对所述对应的模态的多个第一局部特征进行处理包括：基于调整后的所述对应的模态的多个第一注意力分数分别和所述对应的模态的多个第一值特征中的对应的第一值特征的乘积，得到所述对应的模态的多个第二特征。6.根据权利要求5所述的神经网络，其中，所述第一交互子网络使用同一组的第一查询参数、第一键参数、以及第一值参数对所述多个模态中的每一个模态的第一全局特征和多个第一局部特征进行映射处理，并且其中，所述多个模态各自的分支网络中的对应的第一交互子网络使用同一组第一查询参数、第一键参数、以及第一值参数。7.根据权利要求4
‑
6中任一项所述的神经网络，其中，所述多个分支网络中的每一个分支网络包括第一数量的第一交互子网络，并且该分支网络还包括：第一融合子网络，被配置为将所述第一数量的第一交互子网络各自输出的多个第二特征进行融合，以得到融合后的多个第二特征，其中，所述融合后的多个第二特征包括第二全局特征和多个第二局部特征，其中，所述输出子网络被进一步配置为基于所述对应的模态的第二全局特征，得到所述第一结果，并且其中，所述综合输出子网络被进一步配置为基于所述多个模态各自的第二全局特征，得到所述第二结果。8.根据权利要求7所述的神经网络，其中，所述多个分支网络中的每一个分支网络还包括：第二交互子网络，被配置为：在所述多个模态中确定不同于所述对应的模态的目标模态；基于所述对应的模态的第二全局特征和所述目标模态的多个第一局部特征，确定所述目标模态的多个第二注意力分数，所述多个第二注意力分数与所述多个第一局部特征对应；以及基于所述多个第二注意力分数对所述目标模态的多个第一局部特征进行处理，以得到所述对应的模态的多个第三特征，其中，所述输出子网络被进一步配置为基于所述对应的模态的多个第三特征，得到第三结果，并且其中，所述综合输出子网络被进一步配置为基于所述多个模态各自的多个第三特征，得到第四结果。9.根据权利要求8所述的神经网络，其中，所述第二交互子网络被进一步配置为：利用第二查询参数，将所述对应的模态的第二全局特征映射为第二查询特征；以及分别利用第二键参数和第二值参数，...

【专利技术属性】
技术研发人员：谭资昌，刘阿建，郭国栋，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人