System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及风控领域,尤其涉及一种违规短信识别方法、装置、设备及计算机程序产品。
技术介绍
1、当前行业端口类短信被广泛应用,已成为人们日常生活中的重要信息传播载体。因此,违规短信识别尤为主要。
2、目前,传统的违规短信识别方法主要依赖于关键词匹配的方式,而实际应用中,很多违规短信会通过适当的文本描述技巧来避开对关键词使用,基于关键词匹配的违规短信识别方式局限性较高,存在较高的漏检率。
3、为此,有必要提出一种以可解释角度识别违规短信的方案。
技术实现思路
1、本申请目的是提供一种违规短信识别方法、装置、设备及计算机程序产品,能够基于语义理解找出既定违规短信共性的实体和实体关系,从而以此为可解释性依据,挖掘出新的违规短信。
2、为了实现上述目的,本申请实施例是这样实现的:
3、第一方面,提供一种通信加密控制方法,包括:
4、对目标短信集中的短信进行语义识别,确定所述目标短信集中的短信的实体和实体关系,所述目标短信集中的部分短信为既定违规短信;
5、构建所述目标短信集对应的第一短信关系图谱,所述第一短信关系图谱的节点为所述目标短信集中的短信,所述第一短信关系图谱的边为短信之间的相似度,所述目标短信集中的短信之间的相似度是基于共同的实体和对应的实体关系所确定得到的;
6、基于图聚类算法对所述第一短信关系图谱的节点进行社区分类,得到至少两个社区;
7、将包含所述既定违规短信的数量满足预设标准的所
8、第二方面,提一种违规短信识别装置,包括:
9、实体分析模块,用于对目标短信集中的短信进行语义识别,确定所述目标短信集中的短信的实体和实体关系,所述目标短信集中的部分短信为既定违规短信;
10、图谱生成模块,用于构建所述目标短信集对应的第一短信关系图谱,所述第一短信关系图谱的节点为所述目标短信集中的短信,所述第一短信关系图谱的边为短信之间的相似度,所述目标短信集中的短信之间的相似度是基于共同的实体和对应的实体关系所确定得到的;
11、社区分类模块,用于基于图聚类算法对所述第一短信关系图谱的节点进行社区分类,得到至少两个社区;
12、违规识别模块,用于将包含所述既定违规短信的数量满足预设标准的所述社区确定为可疑社区,并从所述可疑社区中除所述既定违规短信外的其他短信中确定出违规短信。
13、第三方面,本申请实施例提供了一种电子设备,包括:处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行第一方面所述的方法。
14、第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现第一方面所述的方法。
15、本申请实施例的方案准备目标短信集,目标短信集中的部分短信为既定违规短信;然后,对目标短信集中的短信进行语义识别,确定目标短信集中的短信的实体和实体关系,以构建点目标短信集的第一短信关系图谱,该第一短信关系图谱的节点为目标短信集中的短信,边为短信之间的相似度。其中,短信之间的相似度是基于共同的实体和对应的实体关系所确定得到的。之后,基于图聚类算法对第一短信关系图谱的节点进行社区分类,以将包含既定违规短信的数量满足预设标准的社区确定为可疑社区,并从可疑社区中除既定违规短信外的其他短信中确定出违规短信。可以看出,本申请实施例的方案基于语义理解找出既定违规短信共性的实体和实体关系,从而以此为可解释性依据,挖掘出新的违规短信,相比于传统的基于关键词匹配方式的违规短信方案,更难被有针对性地规避检测,因此对漏检率有明显的改善。
本文档来自技高网...【技术保护点】
1.一种违规短信识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求1所述的方法,其特征在于,
4.根据权利要求1所述的方法,其特征在于,
5.根据权利要求1所述的方法,其特征在于,
6.根据权利要求5所述的方法,其特征在于,
7.根据权利要求1所述的方法,其特征在于,
8.一种违规短信识别装置,其特征在于,包括:
9.一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,其特征在于,所述可执行指令在被执行时使所述处理器执行如权利要求1至7任一项所述的方法。
10.一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的计算机可读存储介质,其特征在于,所述计算机程序可操作来使计算机执行如权利要求1至7任一项所述的方法。
【技术特征摘要】
1.一种违规短信识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求1所述的方法,其特征在于,
4.根据权利要求1所述的方法,其特征在于,
5.根据权利要求1所述的方法,其特征在于,
6.根据权利要求5所述的方法,其特征在于,
7.根据权利要求1所述的方法,其特征在于,
8...
【专利技术属性】
技术研发人员:梁炳琛,黄涛,于晓玲,宋立婷,李汉章,
申请(专利权)人:中国移动通信集团山东有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。