System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大数据的短信数据智能化管理系统及方法技术方案_技高网

一种基于大数据的短信数据智能化管理系统及方法技术方案

技术编号:44819146 阅读:1 留言:0更新日期:2025-03-28 20:07
本发明专利技术公开了一种基于大数据的短信数据智能化管理系统及方法,涉及短信数据管理技术领域,所述管理方法包括以下步骤:经过用户授权后,对通讯设备接收到的每一条短信的过滤过程进行记录,生成相应的过滤记录;对所设置的过滤规则进行特征提取,并对所述过滤记录所对应的短信进行种类划分;基于所述过滤记录中各个特征的呈现情况,建立异常评估规则对过滤情况进行评估;对用户每一次短信浏览行为进行捕捉,对用户所浏览短信的各个特征进行汇总,并对过滤规则进行修正;基于修正后的过滤规则,对接收到的实时短信进行相应特征的提取,对所述实时短信进行异常评估,判断是否对所述实时短信向用户进行推送。

【技术实现步骤摘要】

本专利技术涉及短信数据管理,具体是一种基于大数据的短信数据智能化管理系统及方法


技术介绍

1、垃圾短信通常是指未经用户同意或请求,向其发送的具有广告、推销、欺诈等性质的短信,这些垃圾短信往往涉及个人信息的收集和使用,频繁地接收到垃圾短信会导致用户感到困扰,影响到正常的生活;因此在短信管理上设置了短信过滤,帮助对接收到的短信进行筛选和处理,以便识别和阻止垃圾短信、骚扰信息等不必要的内容;

2、现有的短信过滤规则大多为预设关键词进行过滤,虽然一定程度上能够减少垃圾短信的推送;但是垃圾短信会不断变换关键词导致预设的关键词不能完全覆盖所有的垃圾短信,或者一些正常的短信中可能也会出现预设的关键词导致正常信息无法接收;随着误检的频率越来越高,同样会影响到用户的信息获取和使用体验。


技术实现思路

1、本专利技术的目的在于提供一种基于大数据的短信数据智能化管理系统及方法,以解决现有技术中提出的问题。

2、为实现上述目的,本专利技术提供如下技术方案:一种基于大数据的短信数据智能化管理方法,管理方法包括以下步骤:

3、步骤s100:经过用户授权后,对通讯设备接收到的每一条短信的过滤过程进行记录,生成相应的过滤记录;基于各条过滤记录所呈现的过滤结果,对所设置的过滤规则进行特征提取;

4、步骤s200:对任意过滤记录的特征包含情况进行分析,对所述过滤记录所对应的短信进行种类划分;基于所述过滤记录中各个特征的呈现情况,建立异常评估规则对过滤情况进行评估;p>

5、步骤s300:对用户每一次短信浏览行为进行捕捉,分析用户所浏览短信中所包含特征与过滤规则之间的关联情况;对用户所浏览短信的各个特征进行汇总,并对所设置的过滤规则进行修正;

6、步骤s400:基于修正后的过滤规则,对接收到的实时短信进行相应特征的提取,对所述实时短信进行异常评估;基于异常评估结果判断是否对所述实时短信向用户进行推送。

7、进一步的,步骤s100包括以下步骤:

8、步骤s101:每当用户的通讯设备接收到一条短信时,读取接收短信的短信内容,调取预设的短信过滤规则对所述短信内容进行判断,得到接收短信的过滤结果,生成一条过滤记录对接收短信的短信内容和过滤结果进行存储;若接收短信经过短信过滤后未被推送给用户,则对接收短信的过滤记录进行异常标记;

9、步骤s102:任意选取一条过滤记录,若所述过滤记录中存在异常标记,则对所述过滤记录中的短信内容进行分词处理,生成若干个关键词;

10、步骤s103:对各条存在异常标记的过滤记录的所有关键词进行获取,提取任意两个关键词进行相似度比对,若得到的相似度超过设定的相似度阈值,则将所述两个关键词设定为相同关键词,对每一类相同关键词生成相应的关键词集合;

11、步骤s104:任意选取一类关键词集合,获取所述关键词集合中包含的关键词数量,设定其中第i类关键词集合的关键词数量为mi,计算得到第i类关键词集合的数量占比αi=mi/a,其中,a为存在异常标记的过滤记录数量;

12、步骤s105:设定一个数量占比阈值为αmax,任意选取一条存在异常标记的过滤记录,获取所述存在异常标记的过滤记录中第j个关键词所在的关键词集合,设定第j个关键词对应第i类关键词集合,若αi>αmax,则将第j个关键词设定为短信过滤规则的一个特征,若任意一个关键词所对应关键词集合的数量占比均小于数量占比阈值,则选取数量占比最大的一个关键词设定为短信过滤规则的一个特征;对所有存在异常标记的过滤记录中设定的特征进行汇总,得到短信过滤规则的特征集合;通过对短信过滤规则的调整进行识别,有利于后续异常评估的计算和特征调整的展开。

13、进一步的,步骤s200包括以下步骤:

14、步骤s201:任意选取一条过滤记录,对所述过滤记录中存储的短信内容进行关键词提取,并将每一个关键词与特征集合中的任意特征进行相似度比对,若得到的相似度超过设定的相似度阈值,则将所比对的关键词与所比对特征所对应的关键词集合进行匹配,并获取所对应关键词集合的数量占比;

15、步骤s202:获取各个关键词所匹配关键词集合的数量占比,按照数量占比从大到小对各个关键词集合进行排序,选取数量占比最大的一类关键词集合作为所述过滤记录的第一特征种类,以此类推,将位序为b的关键词集合作为所述过滤记录的第b特征种类;不同级别的特征种类代表的是所对应关键词集合的影响程度,作为优先判断是否为垃圾短信的判断标准,若短信中涉及的关键词属于第一特征种类的数量越多,则被判断为垃圾短信的概率越高;

16、步骤s203:任意选取位序为b的关键词集合在所述过滤记录所对应的关键词数量为nb,设定位序为b的关键词集合的数量占比为αb,建立评估模型:

17、;

18、其中,b1为正整数且b1∈(1,e),e为所述过滤记录所属于关键词集合数量,n为所述过滤记录的短信内容所提取的关键词总数;计算得到所述过滤记录的评估值p;通过数量占比和出现的关键词数量,都是能最直接判断是否为垃圾短信的标准,再基于相关关键词在短信内容中的占比情况,能够帮助得到更为准确的评估值,帮助用户精准识别是否为垃圾短信;

19、步骤s204:若所述过滤记录中存在异常标记,则将所述过滤记录的评估值p设定为异常评估值;获取所有存在异常标记的过滤记录的异常评估值,选取数值最小的一个异常评估值pmin作为判断短信是否被过滤的异常评估规则。

20、进一步的,步骤s300包括以下步骤:

21、步骤s301:每当用户对一条短信进行浏览时,获取所述短信所对应过滤记录的评估值p,设定判断短信是否被过滤的异常评估值为pmin,若p>pmin,则提取所述短信中的短信内容并对短信内容进行分词得到若干个关键词;

22、步骤s302:对每一个关键词与过滤规则的特征集合进行比对,得到所述短信所包含的若干个特征,任意选取第k个特征,获取所述第j个特征所对应的关键词集合,得到第k个特征所对应关键词集合的数量占比为αk,获取存在异常标记的过滤记录数量为n,根据公式:

23、;

24、计算得到所述第k个特征所对应关键词集合的修正数量占比α’k;设定数量占比阈值为αmax,若α’k<αmax,则将所述第k个特征从过滤规则的特征集合中进行剔除;识别到用户浏览了被识别为垃圾短信的短信内容,则说明当前的过滤规则存在误差或者用户出现了误点行为,则需要对相应关键词的数量占比进行调整并重新进行特征识别,能够帮助降低将正常短信识别为垃圾短信的概率;

25、步骤s303:当存在一条短信向用户进行推送时,用户未对所推送短信产生浏览行为,则提取所推送短信的各个关键词,将任意关键词与各个特征进行相似度比对,若得到的相似度小于设定的相似度阈值,则将所述关键词设定为期望特征;得到所推送短信的特征集合和期望特征集合;

26、步骤s304:若所推送短信的特征集本文档来自技高网...

【技术保护点】

1.一种基于大数据的短信数据智能化管理方法,其特征在于:所述管理方法包括以下步骤:

2.根据权利要求1所述的一种基于大数据的短信数据智能化管理方法,其特征在于:所述步骤S100包括以下步骤:

3.根据权利要求2所述的一种基于大数据的短信数据智能化管理方法,其特征在于:所述步骤S200包括以下步骤:

4.根据权利要求3所述的一种基于大数据的短信数据智能化管理方法,其特征在于:所述步骤S300包括以下步骤:

5.根据权利要求4所述的一种基于大数据的短信数据智能化管理方法,其特征在于:所述步骤S400包括以下步骤:

6.一种短信数据智能化管理系统,用于执行权利要求1-5中任一项所述的一种基于大数据的短信数据智能化管理方法,其特征在于:所述管理系统包括历史短信分析模块、短信划分评估模块、用户行为分析模块和短信实时分析模块;

7.根据权利要求6所述的一种短信数据智能化管理系统,其特征在于:所述历史短信分析模块包括历史过滤采集单元和过滤规则提取单元;

8.根据权利要求6所述的一种短信数据智能化管理系统,其特征在于:所述短信划分评估模块包括短信类型划分单元和短信异常评估单元;

9.根据权利要求6所述的一种短信数据智能化管理系统,其特征在于:所述短信过滤调整模块包括用户行为分析单元和识别规则修正单元;

10.根据权利要求6所述的一种短信数据智能化管理系统,其特征在于:所述短信实时过滤模块包括实时短信分析单元和短信识别推送单元;

...

【技术特征摘要】

1.一种基于大数据的短信数据智能化管理方法,其特征在于:所述管理方法包括以下步骤:

2.根据权利要求1所述的一种基于大数据的短信数据智能化管理方法,其特征在于:所述步骤s100包括以下步骤:

3.根据权利要求2所述的一种基于大数据的短信数据智能化管理方法,其特征在于:所述步骤s200包括以下步骤:

4.根据权利要求3所述的一种基于大数据的短信数据智能化管理方法,其特征在于:所述步骤s300包括以下步骤:

5.根据权利要求4所述的一种基于大数据的短信数据智能化管理方法,其特征在于:所述步骤s400包括以下步骤:

6.一种短信数据智能化管理系统,用于执行权利要求1-5中任一项所述的一种基于大数据的短信数据智...

【专利技术属性】
技术研发人员:王佳
申请(专利权)人:中为聚旦数字科技苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1