一种消息处理方法、设备、系统及存储介质技术方案

技术编号:24014888 阅读:105 留言:0更新日期:2020-05-02 03:02
本申请实施例提供一种消息处理方法、设备、系统及存储介质,其中,方法包括:获取待发送消息字符串;对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则确定所述待发送消息字符串需要被拦截。在本申请实施例中,对待发送消息字符串进行拆解,并在拆解出的一个或多个字符串片段中指定数量的字符串片段未包含在消息字库中时,确定所述待发送消息字符串需要被拦截。据此,可将消息字符串限制在消息字库对应的字符串范围内,从而可拦截各种未知的异常字符串变种,有效提高了拦截准确率。

A message processing method, equipment, system and storage medium

【技术实现步骤摘要】
一种消息处理方法、设备、系统及存储介质
本申请涉及数据安全
,尤其涉及一种消息处理方法、设备、系统及存储介质。
技术介绍
目前,在消息收发过程中,为了识别出异常的消息,通常是:在消息发送后,根据消息的发送内容,提取出其中的关键字信息,之后,人工审核提取出的关键字信息中是否包含异常关键字,如果包含,则在该消息再次发送时,拦截该消息。现有的拦截方式漏拦率很高,因此,需要一种新的解决方案来提高拦截准确率。
技术实现思路
本申请的多个方面提供一种消息处理方法、设备、系统及存储介质,以提高消息处理过程中的拦截准确率。本申请实施例提供一种消息处理方法,包括:获取待发送消息字符串;对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则对所述待发送消息字符串进行相应的处理。本申请实施例提供一种消息处理方法,包括:获取待发送消息字符串;对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则确定所述待发送消息字符串需要被拦截。本申请实施例还提供一种消息处理设备,包括存储器、处理器和通信组件;所述存储器,用于存储一条或多条计算机指令;所述处理器,与所述存储器和所述通信组件耦接,用于执行一条或多条计算机指令,以用于:获取待发送消息字符串;对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则对所述待发送消息字符串进行相应的处理。本申请实施例还提供一种消息处理设备,包括存储器、处理器和通信组件;所述存储器,用于存储一条或多条计算机指令;所述处理器,与所述存储器和所述通信组件耦接,用于执行一条或多条计算机指令,以用于:通过所述通信组件获取待发送消息字符串;对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则确定所述待发送消息需要被拦截。本申请实施例还提供一种消息处理系统,包括:消息处理设备和消息服务器;所述消息处理设备用于:获取待发送消息字符串;对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则向所述消息服务器发送拦截指示;所述消息服务器用于根据所述拦截指示对所述待发送消息字符串进行拦截。本申请实施例还提供一种存储计算机指令的计算机可读存储介质,当计算机指令被一个或多个处理器执行时,致使一个或多个处理器执行前述的消息处理方法在本申请实施例中,对待发送消息字符串进行拆解,并判断拆解出的一个或多个字符串片段是否包含在一预先配置的消息字库中,当拆解出的一个或多个字符串片段中指定数量的字符串片段未包含在消息字库中时,确定所述待发送消息需要被拦截。据此,可将消息字符串限制在消息字库对应的字符串范围内,从而可拦截各种未知的异常字符串变种,有效提高了拦截准确率。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1a为本申请一实施例提供的一种消息处理系统的结构示意图;图1b为本申请另一实施例提供的一种消息处理方法的流程示意图;图2为本申请另一实施例提供的一种消息处理方法的流程示意图;图3为本申请另一实施例提供的另一种消息处理方法的流程示意图;图4为本申请另一实施例提供的又一种消息处理方法的流程示意图;图5为本申请又一实施例提供的消息处理设备的结构示意图;图6为本申请又一实施例提供的消息处理设备的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。现有技术中,采用关键词结合人工审核的方式对消息进行处理,但是这种方式的漏拦率较高。为了解决现有技术中存在的缺陷,在本申请的一些实施例中:对待发送消息字符串进行拆解,并判断拆解出的一个或多个字符串片段是否包含在一预先配置的消息字库中,当拆解出的一个或多个字符串片段中指定数量的字符串片段未包含在消息字库中时,确定所述待发送消息需要被拦截。据此,可将消息字符串限制在消息字库对应的字符串范围内,从而可拦截各种未知的异常字符串变种,有效提高了拦截准确率。以下结合附图,详细说明本申请各实施例提供的技术方案。图1为本申请一实施例提供的消息处理系统的结构示意图。如图1所示,该系统包括:消息处理设备10和消息服务器20。消息处理设备10用于:获取待发送消息字符串11;对待发送消息字符串11进行拆解,以获得待发送消息字符串11包含的至少一个字符串片段;若至少一个字符串片段中指定数量的字符串片段未包含在消息字库12中,则向消息服务器20发送相应指示;消息服务器20用于根据拦截指示对待发送消息字符串11进行相应处理。本实施例中,消息服务器20是指运营商所管理的消息收发服务器。消息服务器20中可包含消息收发接口,其中,消息接收接口可用于接收个人或企业用户的待发送消息字符串11,消息发送接口可用于将待发送消息字符串11发送至目标地址。在物理实现上,消息服务器20可以是常规服务器、云服务器、云主机、虚拟中心等服务器设备,服务器设备的构成主要包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似。本实施例提供的消息处理系统,可适用于各种消息业务场景中,例如,个人消息业务或企业消息业务等,其中,企业消息业务是指运营商为企业用户提供的可以批量向个人发送消息的接口服务。在一些应用场景中,消息处理设备10可部署在运营商的消息服务器20上。消息处理设备10可通过消息服务器20中包含的消息接收接口接收待发送消息字符串11,或从消息服务器20的存储空间中获取待发送消息字符串11,本实施例对此不作限定。在另一些应用场景中,消息处理设备10可部署在运营商合作的通信平台上。个人或企业用户可将其待发送消息字符串11发送至通信平台,并由通信平台将待发送消息字符串11通过运营商的消息服务器20发送至目标地址。该应用场景下,消息处理设备10可从通信平台中获取待发送消息字符串11。另外,该应用场景下,消息处理设备10也可部署在消息服务器20上,并从消息服务器20上获取待发送消息字符本文档来自技高网...

【技术保护点】
1.一种消息处理方法,其特征在于,包括:/n获取待发送消息字符串;/n对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;/n若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则确定所述待发送消息字符串需要被拦截。/n

【技术特征摘要】
1.一种消息处理方法,其特征在于,包括:
获取待发送消息字符串;
对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;
若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则确定所述待发送消息字符串需要被拦截。


2.根据权利要求1所述的方法,其特征在于,所述字符串片段为字和/或字符。


3.根据权利要求1所述的方法,其特征在于,所述对所述待发送消息字符串进行拆解,包括:
基于噪音词库,确定所述待发送消息字符串中包含的一个或多个噪音词;
将所述一个或多个噪音词从所述待发送消息字符串中删除,以获得去噪后的待发送消息字符串;
基于所述去噪后的待发送消息字符串,执行拆解操作。


4.根据权利要求3所述的方法,其特征在于,当确定所述待发送消息字符串需要被拦截时,还包括:
基于所述待发送消息字符串包含的一个或多个未包含在所述消息字库中的字符串片段,确定一个或多个误拦词,并根据所述一个或多个误拦词更新所述噪音词库;和/或
根据所述待发送消息字符串包含的一个或多个身份标识词,更新所述噪音词库。


5.根据权利要求4所述的方法,其特征在于,所述噪音词库中还包括表情字符、副词、介词、语气助词或连接词中的一种或多种词。


6.根据权利要求1-5任一项所述的方法,其特征在于,所述确定所述待发送消息需要被拦截,包括:
向消息服务器发送拦截指示。


7.根据权利要求1~5中任一项所述的方法,其特征在于,还包括:
若所述至少一个字符串片段中指定数量的字符串片段包含在消息字库中,则向消息服务器发送放行指示。


8.根据权利要求1所述的方法,其特征在于,所述若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则确定所述待发送消息字符串需要被拦截之前,还包括:
对一个或多个消息样本进行拆解,以获得一个或多个字符串片段样本;
统计所述一个或多个字符串片段样本的使用频率,并以使用频率满足预设条件的一个或多个字符串片段样本形成初始字库;
基于中国标准汉字字库,将未包含在所述初始字库中的常用字加入所述初始字库中,以形成所述消息字库。


9.根据权利要求8所述的方法,其特征在于,当所述一个或多个消息样本中包含异常消息样本时,还包括:
将所述异常消息样本包含的一个或多个字符串片段中使用频率低于预设阈值的一个或多个字符串片段从所述消息字库中删除。


10.一种消息处理方法,其特征在于,包括:
获取待发送消息字符串;
对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;
若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则对所述待发送消息字符串进行相应的处理。


11.一种消息处理设备,其特征在于,包括存储器、处理器和通信组件;
所述存储器,用于存储一条或多条计算机指令;
所述处理器,与所述存储器和所述通信组件耦接,用于执行一条或多条计算机指令,以用于:
通过所述通信组件获取待发送消息字符串;
对所述待发送消息字符串进行拆解,以获得所述待发送消息字符串包含的至少一个字符串片段;
若所述至少一个字符串片段中指定数量的字符串片段未包含在消息字库中,则确定所述待发送消息字符串需要被拦截。


12.根据权利要...

【专利技术属性】
技术研发人员:张翅飞
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1