【技术实现步骤摘要】
一种消息处理方法、设备、系统及存储介质
本申请涉及数据安全
,尤其涉及一种消息处理方法、设备、系统及存储介质。
技术介绍
目前,在消息收发过程中,为了识别出异常的消息,通常是:在消息发送后,根据消息的发送内容,提取出其中的关键字信息,之后,人工审核提取出的关键字信息中是否包含异常关键字,如果包含,则在该消息再次发送时,拦截该消息。现有的拦截方式漏拦率很高,因此,需要一种新的解决方案来提高拦截准确率。
技术实现思路
本申请的多个方面提供一种消息处理方法、设备、系统及存储介质,以提高消息处理过程中的拦截准确率。本申请实施例提供一种消息处理方法,包括:获取待发送消息字符串;对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则对所述待发送消息字符串进行相应的处理。本申请实施例提供一种消息处理方法,包括:获取待发送消息字符串;对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则确定所述待发送消息字符串需要被拦截。本申请实施例还提供一种消息处理设备,包括存储器、处理器和通信组件;所述存储器,用于存储一条或多条计算机指令;所述处理器,与所述存储器和所述通信组件耦接,用于执行一条或多条计算机指令,以用于:获取待发送消息字符串 ...
【技术保护点】
1.一种消息处理方法,其特征在于,包括:/n获取待发送消息字符串;/n对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;/n若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则确定所述待发送消息字符串需要被拦截。/n
【技术特征摘要】
1.一种消息处理方法,其特征在于,包括:
获取待发送消息字符串;
对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;
若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则确定所述待发送消息字符串需要被拦截。
2.根据权利要求1所述的方法,其特征在于,所述字符串片段为字和/或字符。
3.根据权利要求1所述的方法,其特征在于,所述对所述待发送消息字符串进行拆解,包括:
基于噪音词库,确定所述待发送消息字符串中包含的一个或多个噪音词;
将所述一个或多个噪音词从所述待发送消息字符串中删除,以获得去噪后的待发送消息字符串;
基于所述去噪后的待发送消息字符串,执行拆解操作。
4.根据权利要求3所述的方法,其特征在于,当确定所述待发送消息字符串需要被拦截时,还包括:
基于所述待发送消息字符串包含的一个或多个未包含在所述消息字库中的字符串片段,确定一个或多个误拦词,并根据所述一个或多个误拦词更新所述噪音词库;和/或
根据所述待发送消息字符串包含的一个或多个身份标识词,更新所述噪音词库。
5.根据权利要求4所述的方法,其特征在于,所述噪音词库中还包括表情字符、副词、介词、语气助词或连接词中的一种或多种词。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述确定所述待发送消息需要被拦截,包括:
向消息服务器发送拦截指示。
7.根据权利要求1~5中任一项所述的方法,其特征在于,还包括:
若所述至少一个字符串片段中指定数量的字符串片段包含在消息字库中,则向消息服务器发送放行指示。
8.根据权利要求1所述的方法,其特征在于,所述若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则确定所述待发送消息字符串需要被拦截之前,还包括:
对一个或多个消息样本进行拆解,以获得一个或多个字符串片段样本;
统计所述一个或多个字符串片段样本的使用频率,并以使用频率满足预设条件的一个或多个字符串片段样本形成初始字库;
基于中国标准汉字字库,将未包含在所述初始字库中的常用字加入所述初始字库中,以形成所述消息字库。
9.根据权利要求8所述的方法,其特征在于,当所述一个或多个消息样本中包含异常消息样本时,还包括:
将所述异常消息样本包含的一个或多个字符串片段中使用频率低于预设阈值的一个或多个字符串片段从所述消息字库中删除。
10.一种消息处理方法,其特征在于,包括:
获取待发送消息字符串;
对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;
若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则对所述待发送消息字符串进行相应的处理。
11.一种消息处理设备,其特征在于,包括存储器、处理器和通信组件;
所述存储器,用于存储一条或多条计算机指令;
所述处理器,与所述存储器和所述通信组件耦接,用于执行一条或多条计算机指令,以用于:
通过所述通信组件获取待发送消息字符串;
对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;
若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则确定所述待发送消息字符串需要被拦截。
12.根据权利要...
【专利技术属性】
技术研发人员:张翅飞,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。