本申请提供一种违规音频的识别方法、装置、设备、存储介质及程序产品,所述方法包括:服务端接收终端发送的请求消息,该请求消息中携带有终端预发布的待识别数据;获取训练好的识别模型,其中,训练好的识别模型由服务端根据训练数据集对初始识别模型进行训练得到,该初始识别模型由服务端基于神经网络架构搜索得到;将待识别数据输入至训练好的识别模型进行识别,得到识别结果;当识别结果表征待识别数据审核未通过时,发送第一响应消息至终端,该第一响应消息用于提示待识别数据包括违规音频。通过本申请实施例提供的违规音频的识别方法,能够快速准确地识别出违规音频,减少漏报误报情况的发生,提升平台信誉。提升平台信誉。提升平台信誉。
【技术实现步骤摘要】
违规音频的识别方法、装置、设备、存储介质及程序产品
[0001]本申请涉及人工智能
,涉及但不限于一种违规音频的识别方法、装置、设备、存储介质及程序产品。
技术介绍
[0002]随着互联网技术的不断发展,人们在互联网平台上可以进行各种直播、拍摄短视频等,为博眼球,其中不乏一些色情、涉政、暴恐等各类违法违纪的内容。现有技术中主要通过以下两种方式处理这些违规内容:
[0003]1)传统人工审核方式,由后台的管理人员人工判断审核,这种方式耗时、效率低,需要大量的人力、物力和财力支持。
[0004]2)通过捕获预设违禁词的方式来筛选违规内容,通常做法是针对文本内容直接进行是否违规的判别,针对音频多数平台采取语音识别的方式转化为文本,再通过文本来进行音频是否违规的判别。然而对于一些娇喘音频,无法识别出文字或者根据识别的文字无法判别出音频是否违规,此时这种方法不再适用。
[0005]对于种类繁多的短视频、直播等违规音频,如果不能快速准确地区分正常音频与违规音频,将会产生大量漏报或者误报等情况,降低用户观看体验,而且会影响平台的信誉。
技术实现思路
[0006]本申请实施例提供一种违规音频的识别方法、装置、设备、计算机可读存储介质及计算机程序产品,能够快速准确地识别出违规音频,减少漏报误报情况的发生,提升平台信誉。
[0007]本申请实施例的技术方案是这样实现的:
[0008]本申请实施例提供一种违规音频的识别方法,所述方法包括:
[0009]接收终端发送的请求消息,所述请求消息中携带有所述终端预发布的待识别数据,所述待识别数据包括音频数据;
[0010]获取训练好的识别模型,所述训练好的识别模型由服务端根据训练数据集对初始识别模型进行训练得到,所述初始识别模型由所述服务端基于神经网络架构搜索得到;
[0011]将所述待识别数据输入至所述训练好的识别模型进行识别,得到识别结果;
[0012]当所述识别结果表征所述待识别数据审核未通过时,发送第一响应消息至所述终端,所述第一响应消息用于提示所述待识别数据包括违规音频。
[0013]本申请实施例提供一种违规音频的识别装置,所述装置包括:
[0014]接收模块,用于接收终端发送的请求消息,所述请求消息中携带有所述终端预发布的待识别数据,所述待识别数据包括音频数据;
[0015]获取模块,用于获取训练好的识别模型,所述训练好的识别模型由服务端根据训练数据集对初始识别模型进行训练得到,所述初始识别模型由所述服务端基于神经网络架
构搜索得到;
[0016]识别模块,用于将所述待识别数据输入至所述训练好的识别模型进行识别,得到识别结果;
[0017]第一发送模块,用于当所述识别结果表征所述待识别数据审核未通过时,发送第一响应消息至所述终端,所述第一响应消息用于提示所述待识别数据包括违规音频。
[0018]在一些实施例中,所述获取模块,包括:
[0019]第一获取单元,用于获取训练数据集和验证数据集;
[0020]第二获取单元,用于获取基于神经网络架构搜索得到的初始识别模型;
[0021]训练单元,用于基于预设的多个训练条件和所述训练数据集分别对所述初始识别模型进行训练,得到各训练条件对应的训练好的待选识别模型;
[0022]筛选单元,用于基于所述验证数据集,从各训练好的待选识别模型中筛选出训练好的识别模型。
[0023]在一些实施例中,所述第一获取单元,还用于:
[0024]获取训练样本数据集,所述训练样本数据集包括正样本子集和负样本子集;所述正样本子集中的正样本数据包括违规音频;
[0025]对所述正样本子集中的正样本数据进行数据增强处理,得到处理后的正样本子集;
[0026]将所述处理后的正样本子集和所述负样本子集确定为训练数据集。
[0027]在一些实施例中,所述第二获取单元,还用于:
[0028]获取随机初始化的网络结构,并将所述网络结构作为候选种群;
[0029]利用所述训练数据集和所述验证数据集对所述候选种群进行迭代进化,直至得到符合迭代终止条件的进化种群;
[0030]将符合迭代终止条件的进化种群确定为初始识别模型。
[0031]在一些实施例中,所述训练单元,还用于:
[0032]基于预设的多个类型权重和所述训练数据集分别对所述初始识别模型进行训练,得到各类型权重对应的训练好的待选识别模型;和/或,
[0033]基于预设的多个样本比例和所述训练数据集分别对所述初始识别模型进行训练,得到各样本比例对应的训练好的待选识别模型;和/或,
[0034]基于预设的多个阈值和所述训练数据集分别对所述初始识别模型进行训练,得到各阈值对应的训练好的待选识别模型。
[0035]在一些实施例中,所述装置还包括:
[0036]发布模块,用于当所述识别结果表征所述待识别数据审核通过时,对所述待识别数据进行发布;
[0037]第二发送模块,用于发送第二响应消息至所述终端,所述第二响应消息用于提示所述待识别数据发布成功。
[0038]本申请实施例提供一种电子设备,所述设备包括:
[0039]存储器,用于存储可执行指令;
[0040]处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的违规音频的识别方法。
[0041]本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有可执行指令,用于引起处理器执行时,实现本申请实施例提供的违规音频的识别方法。
[0042]本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本申请实施例提供的违规音频的识别方法。
[0043]本申请实施例具有以下有益效果:
[0044]在本申请实施例提供的违规音频的识别方法中,用户发布包括音频的内容时,终端将预发布的内容作为待识别数据,携带于请求消息中发送至服务端;服务端接收到终端发送的请求消息后,将请求消息携带的待识别数据输入至预先训练好的的识别模型中进行识别,得到识别结果,当识别结果表征待识别数据审核未通过时,发送第一响应消息至终端,第一响应消息用于提示待识别数据包括违规音频。本申请实施例中的训练好的识别模型由服务端根据训练数据集对初始识别模型进行训练得到,初始识别模型是由服务端基于神经网络架构搜索得到的,无需人工审核音频数据,能够实现违规音频的自动识别,大大降低人工审核成本,提高审核速度,而且相较于现有的基于语音识别得到的文字判断音频是否违规的方案,能够提高识别准确率,通过本申请实施例提供的违规音频的识别方法,能够快速准确地识别出违规音频,减少漏报误报情况的发生,提升平台信誉。
附图说明
[0045]图1是本申请实施例提供的违规音频的识别系统的一种网络架构示意图;
[0046]图2是本申请实施例提供的电子设备的一种组成结构示意图本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种违规音频的识别方法,其特征在于,所述方法包括:接收终端发送的请求消息,所述请求消息中携带有所述终端预发布的待识别数据,所述待识别数据包括音频数据;获取训练好的识别模型,所述训练好的识别模型由服务端根据训练数据集对初始识别模型进行训练得到,所述初始识别模型由所述服务端基于神经网络架构搜索得到;将所述待识别数据输入至所述训练好的识别模型进行识别,得到识别结果;当所述识别结果表征所述待识别数据审核未通过时,发送第一响应消息至所述终端,所述第一响应消息用于提示所述待识别数据包括违规音频。2.根据权利要求1所述的方法,其特征在于,所述获取训练好的识别模型,包括:获取训练数据集和验证数据集;获取基于神经网络架构搜索得到的初始识别模型;基于预设的多个训练条件和所述训练数据集分别对所述初始识别模型进行训练,得到各训练条件对应的训练好的待选识别模型;基于所述验证数据集,从各训练好的待选识别模型中筛选出训练好的识别模型。3.根据权利要求2所述的方法,其特征在于,所述获取训练数据集,包括:获取训练样本数据集,所述训练样本数据集包括正样本子集和负样本子集;所述正样本子集中的正样本数据包括违规音频;对所述正样本子集中的正样本数据进行数据增强处理,得到处理后的正样本子集;将所述处理后的正样本子集和所述负样本子集确定为训练数据集。4.根据权利要求2或3所述的方法,其特征在于,所述获取基于神经网络架构搜索得到的初始识别模型,包括:获取随机初始化的网络结构,并将所述网络结构作为候选种群;利用所述训练数据集和所述验证数据集对所述候选种群进行迭代进化,直至得到符合迭代终止条件的进化种群;将符合迭代终止条件的进化种群确定为初始识别模型。5.根据权利要求2或3所述的方法,其特征在于,所述基于预设的多个训练条件和所述训练数据集分别对所述初始识别模型进行训练,得到各训练条件对应的训练好的待选识别模型,...
【专利技术属性】
技术研发人员:陈亦欣,姜迪,徐倩,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。