本申请是关于一种视频风险分类方法、装置、电子设备及存储介质,涉及数据挖掘技术领域,所述方法包括:获取针对视频的意向行为和对应的评论样本;基于所述意向行为将所述对应的评论样本分类;基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型;所述目标风险评论分类模型用于对视频的目标评论进行风险分类;基于所述目标风险评论分类模型,确定目标视频的风险分类。通过意向行为将对应的评论样本自动进行分类,提升了对视频进行风险分类的效率,同时,可以快速增大评论样本的数量,进而提高目标风险评论分类模型的准确率,提升了对目标视频风险分类的准确性和效率。
【技术实现步骤摘要】
视频风险分类方法、装置、电子设备及储存介质
本公开涉及数据挖掘
,尤其涉及视频风险分类方法、装置、电子设备及存储介质。
技术介绍
随着多媒体技术的高速发展,各种各样的视频在网络上不断涌现。然而,有些视频并不适合未成年人观看,例如带有暴力和色情内容的视频。为了未成年人的健康成长,建立一个良好的网络环境是非常必要的。获取视频的风险分类是建立一个良好的网络环境的基础。现有技术,通过人工标注的方式获取视频的风险分类,耗费大量人力物力,且分类效率低。然而,如何高效、省力地获取视频的风险分类是一个亟待解决的技术问题。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种视频风险分类方法,该模型用于对视频进行风险分类。根据本公开实施例的第一方面,提供一种视频风险分类方法,包括获取针对视频的意向行为和对应的评论样本;基于所述意向行为将所述对应的评论样本分类;基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型;所述目标风险评论分类模型用于对视频的目标评论进行情感分类;基于所述目标风险评论分类模型,确定目标视频的风险分类。可选的,所述基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型之前,还包括:获取所述分类后的评论样本中的单个字;确定所述单个字的字向量;依据所述字向量训练原始句向量模型,得到目标句向量模型;基于所述目标句向量模型,获取所述分类后的评论样本对应的分类句向量样本;所述基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型,包括:基于所述分类句向量样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型。可选的,所述确定所述单个字的字向量,包括:采用预设字向量模型确定所述单个字的字向量。可选的,所述基于所述意向行为将所述对应的评论样本分类,包括:若所述意向行为包括:点赞、下载、分享中的至少一种,将所述对应的评论样本分类为正倾向;若所述意向行为包括:举报、讨厌中的中的至少一种,将所述对应的评论样本分类为负倾向;否则,将所述对应的评论样本分类为中性倾向。可选的,所述基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型之前,还包括:将各类评论样本中符合预设过滤条件的样本过滤;所述预设过滤条件包括:重复过滤条件、长度过滤条件、各类样本共用过滤条件中的至少一种;所述基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型,包括:基于过滤后的分类评论样本对所述原始风险评论分类模型进行训练,得到目标风险评论分类模型。可选的,所述基于所述目标风险评论分类模型,确定目标视频的风险分类,包括:获取目标用户针对所述目标视频的评论数据;将所述评论数据,输入所述目标风险评论分类模型,获取所述目标用户评论的风险分类。基于所述目标用户评论的风险分类,确定所述目标视频的风险分类。根据本公开实施例的第二方面,提供一种视频风险分类装置,包括评论样本获取模块,被配置为获取针对视频的意向行为和对应的评论样本;评论样本分类模块,被配置为基于所述意向行为将所述对应的评论样本分类;目标风险评论分类模型训练模块,被配置为基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型;所述目标风险评论分类模型用于对视频的目标评论进行风险分类;目标视频的风险分类确定模块,被配置为基于所述目标风险评论分类模型,确定目标视频的风险分类。可选的,所述的装置还包括:单个字获取模块,被配置为获取所述分类后的评论样本中的单个字;字向量确定模块,被配置为确定所述单个字的字向量;目标句向量模型训练模块,被配置为依据所述字向量训练原始句向量模型,得到目标句向量模型;分类句向量样本获取模块,被配置为基于所述目标句向量模型,获取所述分类后的评论样本对应的分类句向量样本;所述目标风险评论分类模型训练模块,包括:目标风险评论分类模型第一训练单元,被配置为基于所述分类句向量样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型。可选的,所述字向量确定模块,包括:字向量确定单元,被配置为采用预设字向量模型确定所述单个字的字向量。可选的,所述评论样本分类模块,包括:第一评论样本分类单元,被配置为若所述意向行为包括:点赞、下载、分享中的至少一种,将所述对应的评论样本分类为正倾向;第二评论样本分类单元,被配置为若所述意向行为包括:举报、讨厌中的中的至少一种,将所述对应的评论样本分类为负倾向;第三评论样本分类单元,被配置为否则,将所述对应的评论样本分类为中性倾向。可选的,所述的装置还包括:样本过滤模块,被配置为将各类评论样本中符合预设过滤条件的样本过滤;所述预设过滤条件包括:重复过滤条件、长度过滤条件、各类样本共用过滤条件中的至少一种;所述目标风险评论分类模型训练模块,包括:目标风险评论分类模型第二训练单元,被配置为基于过滤后的分类评论样本对所述原始风险评论分类模型进行训练,得到目标风险评论分类模型。可选的,所述目标视频的风险分类确定模块,包括:评论数据获取单元,被配置为获取目标用户针对所述目标视频的评论数据;评论风险分类单元,被配置为将所述评论数据,输入所述目标风险评论分类模型,获取所述目标用户评论的风险分类。目标视频的风险分类确定单元,被配置为基于所述目标用户评论的风险分类,确定所述目标视频的风险分类。根据本公开实施例的第三方面,提供一种视频风险分类电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取针对视频的意向行为和对应的评论样本;基于所述意向行为将所述对应的评论样本分类;基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型;所述目标风险评论分类模型用于对视频的目标评论进行风险分类;基于所述目标风险评论分类模型,确定目标视频的风险分类。根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种视频风险分类方法,所述方法包括:获取针对视频的意向行为和对应的评论样本;基于所述意向行为将所述对应的评论样本分类;基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型;所述目标风险评论分类模型用于对视频的目标评论进行风险分类;基于所述目标风险评论分类模型,确定目标视频的风险分类。根据本公开实施例的第五方面,提供一种计算机程序产品,当所述计算机程序产品中的指令由移动终端的处理器执行时,使得移动终端能够执行一种视频风险分类方法,所述方法包括:获取针对视频的意向行为和对应的评论样本;基于所述意向行为将所述对应的评论样本分类;基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型;所述目标风险评论分类模型用于对视频的目标评论进行风险分类;基于所述目标风险评论分类模型,确定目标视频的风险分类。本公开的实施例提供的技术方案可以包括以下有益效果:获取针对视频的意向行为和对应的评论样本;基于所述意向行为将所述对应的评论样本分类;即,通过意向行为将对应的评论样本自动进行分类,无需人工参与,节省人力物力,且分类效率高;基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险本文档来自技高网...
【技术保护点】
1.一种视频风险分类方法,其特征在于,包括:获取针对视频的意向行为和对应的评论样本;基于所述意向行为将所述对应的评论样本分类;基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型;所述目标风险评论分类模型用于对视频的目标评论进行风险分类;基于所述目标风险评论分类模型,确定目标视频的风险分类。
【技术特征摘要】
1.一种视频风险分类方法,其特征在于,包括:获取针对视频的意向行为和对应的评论样本;基于所述意向行为将所述对应的评论样本分类;基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型;所述目标风险评论分类模型用于对视频的目标评论进行风险分类;基于所述目标风险评论分类模型,确定目标视频的风险分类。2.根据权利要求1所述的视频风险分类方法,其特征在于,所述基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型之前,还包括:获取所述分类后的评论样本中的单个字;确定所述单个字的字向量;依据所述字向量训练原始句向量模型,得到目标句向量模型;基于所述目标句向量模型,获取所述分类后的评论样本对应的分类句向量样本;所述基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型,包括:基于所述分类句向量样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型。3.根据权利要求2所述的视频风险分类方法,其特征在于,所述确定所述单个字的字向量,包括:采用预设字向量模型确定所述单个字的字向量。4.根据权利要求1所述的视频风险分类方法,其特征在于,所述基于所述意向行为将所述对应的评论样本分类,包括:若所述意向行为包括:点赞、下载、分享中的至少一种,将所述对应的评论样本分类为正倾向;若所述意向行为包括:举报、讨厌中的中的至少一种,将所述对应的评论样本分类为负倾向;否则,将所述对应的评论样本分类为中性倾向。5.根据权利要求1所述的视频风险分类方法,其特征在于,所述基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型之前,还包括:将各类评论样本中符合预设过滤条件的样本过滤;所述预设过滤条件包括:重复过滤条件、长度过滤条件、各类样本共用过滤条件中的至少一种;所述基于分类后的评论样本对原始风险评论分类模型进行训练,得到目标风险评论分类模型,包括:基于过滤后的分类评论样本对所述原始风险评论分类模型进行训练,得到目标风险评论分类模型。6.根据权利要求1所述的视频风险分类方法,其特征在于,所述基于所述目标风险评论分类模型,确定目标视频的风险分类,包括:获取目标用户针对所述目标视频的评论数据;将所述评论数据,输入所...
【专利技术属性】
技术研发人员:穆冠宇,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。