即时通讯消息识别方法及系统技术方案

技术编号:24945766 阅读:27 留言:0更新日期:2020-07-17 22:49
本发明专利技术实施例提供了一种即时通讯消息识别方法及系统,所述方法首先获取IM消息;然后将IM消息输入至神经网络模型,基于所述神经网络模型,确定所述IM消息的所属类别;最后基于所述IM消息的所属类别,确定是否对所述IM消息进行封禁。本发明专利技术实施例中引入神经网络模型对IM消息的所属类别进行识别,通过具有多尺度卷积核的卷积层组和Bi‑GRU神经网络层,可以分别提取IM消息的全局特征信息以及局部特征信息,使得基于神经网络模型确定的IM消息的所属类别更加准确。

【技术实现步骤摘要】
即时通讯消息识别方法及系统
本专利技术涉及信息识别
,更具体地,涉及即时通讯消息识别方法及系统。
技术介绍
目前,信息已经渗透到日常生活中的各个角落,用户接收到的信息也越来越多,例如QQ、短信、微信等常用即时通讯软件以及商用即时通讯软件接收到的各种即时通讯信息。有部分异常用户(例如微商用户、黑产用户、恶意报复他人用户)通过即时通讯(InstantMessaging,IM)软件发送广告或者骚扰信息等垃圾消息,这将给接收用户造成极大的干扰,例如对于房屋委托中的房产经纪人来说,经常收到垃圾消息将会影响房产经纪人的正常工作,而且房产经纪人极有可能根据接收到的垃圾消息作出作弊、违规、泄漏内部数据等行为。另外,由于房产经纪人在接收到垃圾消息时,一般直接忽略,不会对接收到的垃圾消息进行回复或相应的处理,这将导致房产经纪人的绩效指标(如一分钟响应率,商机转化率)难以进行考核。因此,识别即时通讯消息是否属于垃圾消息并对属于垃圾消息的即时通讯消息进行拦截至关重要。现有技术中对于即时通讯消息的识别,通常采用如下三种方法实现:1)基于样本库中存储的垃圾消息样本,采用距离计算公式或simhash算法确定即时通讯消息与样本库中存储的垃圾消息样本之间的差异程度,根据确定的差异程度识别即时通讯消息是否为垃圾消息;2)采用简单的敏感词模糊匹配的方法确定即时通讯消息是否为垃圾消息;3)采用线上行为特征分析等方法直接将频繁触发发送消息动作的用户发送的即时通讯消息判定为垃圾消息并进行拦截。现有技术中提供的各种即时通讯消息识别方法,均具有识别不准确的缺陷,例如对于方法1),完全依赖于样本库中存储的垃圾消息样本,而垃圾消息样本无法穷举出所有的垃圾消息,所以对于样本库中没有存储的垃圾消息无法识别;对于方法2),简单的敏感词模糊匹配时也会出现由于无法所有的敏感词而导致无法对未列举的敏感词进行识别;对于方法3),频繁触发发送消息动作并不意味着就是在发送垃圾消息,因此直接将频繁触发发送消息动作的用户发送的即时通讯消息判定为垃圾消息的方法会有识别错误的风险,例如房屋委托中的业主来说,业主在线主动推广自己房子的行为很容易与微商用户、黑产用户刷广告的行为产生一致性,进而会被拦截造成误伤。为此,现急需提供一种即时通讯消息识别方法及系统。
技术实现思路
为克服上述问题或者至少部分地解决上述问题,本专利技术实施例提供了一种即时通讯消息识别方法及系统。第一方面,本专利技术实施例提供了一种即时通讯消息识别方法,包括:获取即时通讯IM消息;将所述IM消息输入至神经网络模型,基于所述神经网络模型,确定所述IM消息的所属类别;基于所述IM消息的所属类别,确定是否对所述IM消息进行封禁;其中,所述神经网络模型基于嵌入层、具有多尺度卷积核的卷积层组和双向门控循环Bi-GRU神经网络层构建,所述卷积层组中具有不同尺度的卷积核的每个卷积层以及所述Bi-GRU神经网络层均分别与所述嵌入层连接;所述神经网络模型基于样本库中的IM消息样本以及所述IM消息样本的所属类别训练得到。优选地,所述卷积层组中具有不同尺度的卷积核的卷积层中存在目标卷积层,所述目标卷积层所处的支路上还包括所述卷积层组中与所述目标卷积层的卷积核尺度不同的第一卷积层。优选地,所述神经网络模型还包括:多个平滑层;所述第一卷积层所处的支路上以及所述卷积层组中除所述目标卷积层外具有不同尺度的卷积核的卷积层所处的支路上均分别包括一所述平滑层。优选地,所述神经网络模型还包括:多个第一池化层;所述目标卷积层与所述第一卷积层之间、所述卷积层组中除所述目标卷积层外具有不同尺度的卷积核的卷积层与对应的所述平滑层之间均连接有一所述第一池化层。优选地,所述神经网络模型还包括:拼接层;所述Bi-GRU神经网络层以及所有所述平滑层均分别与所述拼接层连接。优选地,所述神经网络模型还包括:第二卷积层、第二池化层和输出层;所述拼接层、所述第二卷积层、所述第二池化层以及所述输出层依次连接。优选地,所述基于所述IM消息的所属类别,确定是否对所述IM消息进行封禁,具体包括:若判断获知所述IM消息的所属类别为异常消息,向所述IM消息的接收端发送提醒信息;若接收到与所述提醒信息对应的回复信息,基于所述回复信息,确定是否对所述IM消息进行封禁。第二方面,本专利技术实施例提供了一种即时通讯消息识别系统,包括:IM消息获取模块、类别识别模块和封禁模块。其中,IM消息获取模块用于获取即时通讯IM消息;类别识别模块用于将所述IM消息输入至神经网络模型,基于所述神经网络模型,确定所述IM消息的所属类别;封禁模块用于基于所述IM消息的所属类别,确定是否对所述IM消息进行封禁;其中,所述神经网络模型基于嵌入层、具有多尺度卷积核的卷积层组和双向门控循环Bi-GRU神经网络层构建,所述卷积层组中具有不同尺度的卷积核的每个卷积层以及所述Bi-GRU神经网络层均分别与所述嵌入层连接;所述神经网络模型基于样本库中的IM消息样本以及所述IM消息样本的所属类别训练得到。第三方面,本专利技术实施例提供了一种电子设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的即时通讯消息识别方法的步骤。第四方面,本专利技术实施例提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述的即时通讯消息识别方法的步骤。本专利技术实施例提供的一种即时通讯消息识别方法及系统,所述方法首先获取IM消息;然后将IM消息输入至神经网络模型,基于所述神经网络模型,确定所述IM消息的所属类别;最后基于所述IM消息的所属类别,确定是否对所述IM消息进行封禁。本专利技术实施例中引入神经网络模型对IM消息的所属类别进行识别,通过具有多尺度卷积核的卷积层组和Bi-GRU神经网络层,可以分别提取IM消息的全局特征信息以及局部特征信息,使得基于神经网络模型确定的IM消息的所属类别更加准确。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种垃圾消息识别方法的流程示意图;图2为本专利技术实施例提供的一种垃圾消息识别方法中神经网络模型的部分结构示意图;图3为本专利技术实施例提供的一种垃圾消息识别方法中神经网络模型的结构示意图;图4为本专利技术实施例提供的一种垃圾消息识别方法的完整流程示意图;图5为本专利技术实施例提供的一种垃圾消息识别系统的结构示意图;图6为本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案本文档来自技高网
...

【技术保护点】
1.一种即时通讯消息识别方法,其特征在于,包括:/n获取即时通讯IM消息;/n将所述IM消息输入至神经网络模型,基于所述神经网络模型,确定所述IM消息的所属类别;/n基于所述IM消息的所属类别,确定是否对所述IM消息进行封禁;/n其中,所述神经网络模型基于嵌入层、具有多尺度卷积核的卷积层组和双向门控循环Bi-GRU神经网络层构建,所述卷积层组中具有不同尺度的卷积核的每个卷积层以及所述Bi-GRU神经网络层均分别与所述嵌入层连接;所述神经网络模型基于样本库中的IM消息样本以及所述IM消息样本的所属类别训练得到。/n

【技术特征摘要】
1.一种即时通讯消息识别方法,其特征在于,包括:
获取即时通讯IM消息;
将所述IM消息输入至神经网络模型,基于所述神经网络模型,确定所述IM消息的所属类别;
基于所述IM消息的所属类别,确定是否对所述IM消息进行封禁;
其中,所述神经网络模型基于嵌入层、具有多尺度卷积核的卷积层组和双向门控循环Bi-GRU神经网络层构建,所述卷积层组中具有不同尺度的卷积核的每个卷积层以及所述Bi-GRU神经网络层均分别与所述嵌入层连接;所述神经网络模型基于样本库中的IM消息样本以及所述IM消息样本的所属类别训练得到。


2.根据权利要求1所述的即时通讯消息识别方法,其特征在于,所述卷积层组中具有不同尺度的卷积核的卷积层中存在目标卷积层,所述目标卷积层所处的支路上还包括所述卷积层组中与所述目标卷积层的卷积核尺度不同的第一卷积层。


3.根据权利要求2所述的即时通讯消息识别方法,其特征在于,所述神经网络模型还包括:多个平滑层;
所述第一卷积层所处的支路上以及所述卷积层组中除所述目标卷积层外具有不同尺度的卷积核的卷积层所处的支路上均分别包括一所述平滑层。


4.根据权利要求3所述的即时通讯消息识别方法,其特征在于,所述神经网络模型还包括:多个第一池化层;
所述目标卷积层与所述第一卷积层之间、所述卷积层组中除所述目标卷积层外具有不同尺度的卷积核的卷积层与对应的所述平滑层之间均连接有一所述第一池化层。


5.根据权利要求3所述的即时通讯消息识别方法,其特征在于,所述神经网络模型还包括:拼接层;
所述Bi-GRU神经网络层以及所有所述平滑层均分别与所述拼接层连接。


6.根据权利要求5...

【专利技术属性】
技术研发人员:张鑫
申请(专利权)人:贝壳技术有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1