本发明专利技术提供的一种弹幕处理方法及装置,涉及网络技术领域,在处理垃圾弹幕的过程中,可以提高垃圾弹幕清理的效率和准确性。所述方法包括:获取预置时间段内用户发布的第一弹幕数据;从所述第一弹幕数据中提取符合预设条件的用户发布的第二弹幕数据;检测所述第二弹幕数据中弹幕信息之间的平均相似度是否大于或等于预设阈值;若所述平均相似度大于或等于所述预设阈值,则对与所述第二弹幕数据对应的用户进行封禁。
【技术实现步骤摘要】
本专利技术涉及网络
,尤其涉及一种弹幕处理方法及装置。
技术介绍
随着网络技术的发展,用户可以在视频播放过程中发送弹幕,弹幕是指大量以字幕形式显示的评论同时出现的现象。然而随着弹幕的普及,垃圾弹幕也越来越多,垃圾弹幕主要包括广告、骂人和无意义的刷屏等弹幕,垃圾弹幕严重影响了正常用户的互动。为了让观众可以更好的进行互动,就需要对垃圾弹幕进行清理。目前在清理垃圾弹幕的过程中,可以通过人工封禁方式进行垃圾弹幕清理。然而,专利技术人在实现专利技术的过程中发现了当垃圾弹幕数量庞大时,通过上述人工封禁的方式,往往难以迅速封禁垃圾弹幕,会造成清理垃圾弹幕的效率较低,并且人工封禁容易出现误操作,进而影响了垃圾弹幕清理的准确性。
技术实现思路
有鉴于此,本专利技术实施例提供了一种弹幕处理方法及装置,用以解决现有技术中当垃圾弹幕数量庞大时,通过人工封禁方式,会造成清理垃圾弹幕的效率和准确性较低的问题。针对现有技术存在的问题,本专利技术实施例提供了一种弹幕处理方法,包括:获取预置时间段内用户发布的第一弹幕数据;从所述第一弹幕数据中提取符合预设条件的用户发布的第二弹幕数据;检测所述第二弹幕数据中弹幕信息之间的平均相似度是否大于或等于预设阈值;若所述平均相似度大于或等于所述预设阈值,则对与所述第二弹幕数据对应的用户进行封禁。本专利技术实施例提供了一种弹幕处理装置,包括:获取单元,用于获取预置时间段内用户发布的第一弹幕数据;提取单元,用于从所述第一弹幕数据中提取符合预设条件的用户发布的第二弹幕数据检测单元,用于检测所述第二弹幕数据中弹幕信息之间的平均相似度是否大于或等于预设阈值;封禁单元,用于若所述平均相似度大于或等于所述预设阈值,则对与所述第二弹幕数据对应的用户进行封禁。本专利技术实施例提供的一种弹幕处理方法及装置,首先获取预置时间段内用户发布的第一弹幕数据,然后从所述第一弹幕数据中提取符合预设条件的用户发布的第二弹幕数据,再检测所述第二弹幕数据中弹幕信息之间的平均相似度是否大于或等于预设阈值,若所述平均相似度大于或等于所述预设阈值,则对与所述第二弹幕数据对应的用户进行封禁。与目前通过人工方式进行封禁弹幕相比,本专利技术实施例在清理垃圾弹幕的过程中,通过获取预置时间段内用户发布的第一弹幕数据,筛选出符合预设条件的用户发布的第二数据,通过检测第二弹幕数据中弹幕信息之间的平均相似度是否超过预设阈值,进而判断是否对与所述第二弹幕数据对应的用户进行封禁,从而可以实现自动进行垃圾弹幕的清理,提高了垃圾弹幕清理的效率和准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种弹幕处理方法流程示意图;图2为本专利技术实施例提供的另一种弹幕处理方法流程示意图;图3为本专利技术实施例提供的一种弹幕处理装置结构示意图;图4为本专利技术实施例提供的一种弹幕处理装置的实体结构示意图;图5为本专利技术实施例提供的另一种弹幕处理装置结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供了一种弹幕处理方法,可以提高垃圾弹幕清理的效率和准确性,如图1所示,所述方法包括:101、获取预置时间段内用户发布的第一弹幕数据。其中,所述弹幕可以为直播视频弹幕、网络点播视频弹幕、游戏弹幕等,本专利技术实施例不做限定。所述预置时间段可以根据不同情况进行设定,具体可以根据弹幕数量确定,所述第一弹幕数据可以为预置时间段内所有用户发布的全部弹幕,具体可以为中文、符号、英文等弹幕。需要说明的是,对于本专利技术实施例的执行主体可以为配置在网络服务器中用于清理垃圾弹幕的弹幕处理装置,对网络服务器中接收到的弹幕信息进行监控,确定需要封禁的用户并及时进行封禁处理,清理垃圾弹幕,以便提高用户的观看体验。例如,某直播游戏平台每分钟会收到500条弹幕信息,预置时间段的时长可以设定为30秒,当弹幕处理装置需要对平台接收到的弹幕数据进行分析,确定需要封禁的用户时,可以获取最近30秒内平台接收到的所有用户的弹幕数据。102、从所述第一弹幕数据中提取符合预设条件的用户发布的第二弹幕数据。其中,所述预设条件可以根据不同情况进行设定,具体可以为弹幕内容、字符长度、发送弹幕频率等条件,本专利技术实施例不做限定。所述第二弹幕数据可以为符合预设条件的单个用户在预置时间段内发布的弹幕数据。例如,通过弹幕处理装置对游戏视频平台接收到的弹幕信息进行监控,预设条件可以设定为1分钟内发布10条以上弹幕信息,且发布的这10条以上弹幕信息的字符数都大于或等于10;在弹幕处理的过程中,该弹幕处理装置获取最近1分钟内平台接收到的所有用户的弹幕数据,并从该弹幕数据中确定这1分钟内发布了15条弹幕信息,且发布的这15条弹幕信息的字符数都大于或等于10的用户a,获取用户a这1分钟内发布的这15条弹幕信息。103、检测所述第二弹幕数据中弹幕信息之间的平均相似度是否大于或等于预设阈值。其中,所述相似度根据类编辑距离进行计算,类编辑距离是指两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。所述预设阈值可以根据实际情况进行设置,例如可以设置为0.5、0.8、0.95等。所述平均相似度可以为第二弹幕数据中每两条弹幕信息之间的相似度的平均值。例如,从第一弹幕数据中提取符合预设条件的第二弹幕数据,为用户b在一分钟内所发送的5条弹幕数据,该5条弹幕数据中每两条弹幕的相似度分别为0.93、0.84、0.82、0.91、0.95、0.87、0.93、0.88、0.91、0.86,将所得10个相似度值相加并除以10得到的平均值0.89,即为第二弹幕数据中弹幕信息之间的平均相似度。104、若所述平均相似度大于或等于所述预设阈值,则对与所述第二弹幕数据对应的用户进行封禁。其中,所述封禁可以为有限封禁,如1天、3天、一个月等,也可以为无限期封禁,本专利技术实施例不做限定。例如,获取45s内用户发布的第一弹幕数据,预设条件为45s内发布4条以上弹幕信息,且发布的这4条以上弹幕信息的字符数都大于或等于8,此时从该第一弹幕数据中提取符合预设条件的第二弹幕数据,为用户c发布的6条弹幕消息且这6条弹幕消息的字符数都大于8,检测到这6条弹幕信息之间的平均相似度为0.95,大于预设阈值0.92,此时对用户c进行封禁,以便其他用户看不到用户c发布的弹幕内容。本专利技术实施例提供的一种弹幕处理方法,首先获取预置时间段内用户发布的第一弹幕数据,然后从所述第一弹幕数据中提取符合预设条件的用户发布的第二弹幕数据,再检测所述第二弹幕数据中弹幕信息之间的平均相似度是否大于或等于预设阈值,若所述平均相似度大于或等于所述预设阈值,则对与所述第二弹幕数据对应的用户进行封禁。与目前通过人工方式进行封禁弹幕相比,本专利技术实本文档来自技高网...
【技术保护点】
一种弹幕处理方法,其特征在于,包括:获取预置时间段内用户发布的第一弹幕数据;从所述第一弹幕数据中提取符合预设条件的用户发布的第二弹幕数据;检测所述第二弹幕数据中弹幕信息之间的平均相似度是否大于或等于预设阈值;若所述平均相似度大于或等于所述预设阈值,则对与所述第二弹幕数据对应的用户进行封禁。
【技术特征摘要】
1.一种弹幕处理方法,其特征在于,包括:获取预置时间段内用户发布的第一弹幕数据;从所述第一弹幕数据中提取符合预设条件的用户发布的第二弹幕数据;检测所述第二弹幕数据中弹幕信息之间的平均相似度是否大于或等于预设阈值;若所述平均相似度大于或等于所述预设阈值,则对与所述第二弹幕数据对应的用户进行封禁。2.根据权利要求1所述的弹幕处理方法,其特征在于,所述从所述第一弹幕数据中提取符合预设条件的用户发布的第二弹幕数据,具体包括:从所述第一弹幕数据中确定弹幕发布次数大于或等于预设次数阈值的用户对应的标识信息;当与所述标识信息对应的第二弹幕数据中存在的预定比例条数弹幕信息的弹幕内容长度都大于或等于预定长度阈值时,提取所述第二弹幕数据。3.根据权利要求1所述的弹幕处理方法,所述检测所述第二弹幕数据中弹幕信息之间的平均相似度是否大于或等于预设阈值之前,所述方法还包括:计算所述第二弹幕数据中任意两条弹幕信息之间的相似度;将计算得到的相似度进行求和并除以相似度个数,得到所述第二弹幕数据中弹幕信息之间的平均相似度;所述检测所述第二弹幕数据中弹幕信息之间的平均相似度是否大于或等于预设阈值,具体包括:检测计算得到的所述平均相似度是否大于或等于预设阈值。4.根据权利要求3所述的弹幕处理方法,所述计算所述第二弹幕数据中任意两条弹幕信息之间的相似度,具体包括:通过预设类编辑距离相似度函数,计算所述第二弹幕数据中任意两条弹幕信息之间的相似度。5.根据权利要求1所述的弹幕处理方法,所述方法还包括:检测所述第二弹幕数据中弹幕信息之间的平均相似度是否大于或等于预定告警阈值且小于所述预设阈值;若所述平均相似度大于或等于所述预定告警阈值且小于所述预设阈值,则对与所述第二弹幕数据对应的用...
【专利技术属性】
技术研发人员:刘健,
申请(专利权)人:乐视控股北京有限公司,乐视体育文化产业发展北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。