System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及通信服务与云通信,尤其涉及一种基于机器学习大模型与asr的隐私号反诈系统和方法。
技术介绍
1、随着平台型客户对用户隐私信息的越发重视,隐私号码运营平台业务量突破到每日千万级的维度。面对千万级的数据,对业务风险把控,异常通话发掘和通话链路追踪都提出了巨大的挑战。诈骗分子利用可乘之机,在隐私号码平台对用户实施诈骗,通话话术隐蔽,让业务运营人员难以甄别。现有技术手段,缺乏对异常话单做有效分组,对异常通话链路追踪处于空缺状态。
2、现有反诈手段,主要通过事后下发诈骗工单,人工回溯可疑通话,然后再对相应通话中主被叫号码进行拉黑和客户账号冻结管控。现有方法效率低下且滞后,无法及时有效拦截诈骗通话,存在巨大安全隐患漏洞。
技术实现思路
1、本专利技术旨在至少解决上述所提及的技术问题之一,提供一种基于机器学习大模型与asr的隐私号反诈系统和方法,能够主动挖掘涉诈通话行为特征,全自动拦截高危涉诈号码,有效遏制诈骗分子利用隐私号平台实施诈骗的行为。
2、为了实现上述目的,本专利技术采用的技术方案为:一种基于机器学习大模型与asr的隐私号反诈系统,包括:
3、数据统计预处理模块,负责对数据库基础的话单数据做提炼,完成整个数据的抽取、转换以及加载过程,以实现对数据的预处理;
4、机器学习模块:负责将预处理好的数据做聚类分析,根据关键指标数据进行通话组的预测分类,将通话分为正常通话组和异常通话组;
5、语音自动识别模块,将机器学习模
6、自动巡检模块,具有创建定时任务功能,并能够将机器学习模块中分类是涉诈通话组的通话录音拉取到语音自动识别模块中,后将识别出的文本内容调度到关键词识别和大模型判断任务中,使关键词识别和大模型判断两个模型可以定期执行任务,对文本内容进行学习;
7、通话内容识别和判断模块,具有关键词识别功能和大模型判断功能,关键词识别功能能够识别异常通话组对话文本内容,判断对话是否存在高危涉诈相关内容,大模型判断功能能够对语音自动识别模块输出的文本结果做语义理解,判断是否符合涉诈通话的特征;
8、业务告警模块,通过流程引擎将聚合后的机器学习数据与内容识别结果,评估风险等级与分类,之后将告警内容推送到业务管控模块;
9、业务管控模块,根据业务告警模块的告警级别和告警分类,做不同的管控策略响应,同时对客户画像体系做补充维护。
10、优选的,所述关键指标数据包括通话时长、接通率、短通话占比,将通话时长小于10s、接通率小于40%、短通话占比超过50%的为异常通话组。
11、优选的,所述风险等级分为一级风险、二级风险、三级风险,一级风险为违禁违规、二级风险为涉嫌诈骗、三级风险为高危业务、四级风险为恶意骚扰。
12、优选的,所述管控策略包括:当运营收到各级别告警后,按照风险等级安排业务人工复核优先级,即优先复核一级风险和二级风险业务,如复核结果无误,一级风险和二级风险客户直接冻结业务并下线,三级风险和四级风险如复核结果无误则与所负责销售沟通酌情下线。
13、本申请还公开了一种基于机器学习大模型与asr的隐私号反诈方法,采用上述的反诈系统,包括以下步骤:
14、(1)通过数据统计预处理模块将基础话单信息做数据抽取、转换和加载,输出关键性的通话特征指标数据给机器学习模块;
15、(2)通过机器学习模块对数据预处理模块输出的通话特征指标数据做聚类分析,将通话组分为正常通话组和异常通话组;
16、(3)通过语音自动识别模块将机器学习输出的异常通话组通话录音文件识别成文本内容;
17、(4)通过通话内容识别和判断模块的关键词识别功能对文本内容进行关键词识别,若文本内容命中关键词,则抽取命中的关键词,若文本内容未命中关键词,则通过人工复核分类是否正确,若分类不正确,则进行模型调优,若分类正确,则标注新关键词;以及通过通话内容识别和判断模块的大模型判断功能判断文本内容是否符合异常通话,若文本内容符合异常通话,则输出判断结果,若文本内容不符合异常通话,则通过人工复核判断是否正确,若判断错误,则进行模型调优,然后聚合文本学习结果和机器学习结果。
18、(5)通过业务告警模块对机器学习和内容识别后的聚合结果做告警等级判断,输出告警等级和类别,业务管控模块根据告警等级和类别做出相应的策略管控,同时对客户画像体系做补充维护。
19、优选的,所述模型调优方法为人工复核不准确的通话案例,判断通话案例具体通话场景是否与实际报备场景一致,如一致则人工筛选该场景下关键词,将新的关键词维护到对应场景关键词库,如不一致则将关键词维护到报备与实际不符关键词库。
20、有益效果是:与现有技术相比,本专利技术的一种基于机器学习大模型与asr的隐私号反诈系统和方法基于指标数据的机器学习和大模型对自动语音识别技术的支撑,双管齐下,对异常通话组的筛选效率高,对异常通话内容的识别和判断更准确,通过对千万级话单的预处理,机器学习模块根据通话组的呼叫特征进行分类,快速筛选出疑似涉诈的通话组,关键词识别和大模型判断对筛选出的这些疑似涉诈通话组通话内容做二次校验判断,这样能更精准的识别出涉诈通话号码加快对异常通组的管控响应速度,从而遏制诈骗案件发生。
本文档来自技高网...【技术保护点】
1.一种基于机器学习大模型与ASR的隐私号反诈系统,其特征在于,包括:
2.根据权利要求1所述的一种基于机器学习大模型与ASR的隐私号反诈系统,其特征在于,所述关键指标数据包括通话时长、接通率、短通话占比,将通话时长小于10s、接通率小于40%、短通话占比超过50%的为异常通话组。
3.根据权利要求1所述的一种基于机器学习大模型与ASR的隐私号反诈系统,其特征在于,所述风险等级分为一级风险、二级风险、三级风险,一级风险为违禁违规、二级风险为涉嫌诈骗、三级风险为高危业务、四级风险为恶意骚扰。
4.根据权利要求1所述的一种基于机器学习大模型与ASR的隐私号反诈系统,其特征在于,所述管控策略包括:当运营收到各级别告警后,按照风险等级安排业务人工复核优先级,即优先复核一级风险和二级风险业务,如复核结果无误,一级风险和二级风险客户直接冻结业务并下线,三级风险和四级风险如复核结果无误则与所负责销售沟通酌情下线。
5.一种基于机器学习大模型与ASR的隐私号反诈方法,其特征在于,采用权利要求1至4任一所述的反诈系统,包括以下步骤:
6.
...【技术特征摘要】
1.一种基于机器学习大模型与asr的隐私号反诈系统,其特征在于,包括:
2.根据权利要求1所述的一种基于机器学习大模型与asr的隐私号反诈系统,其特征在于,所述关键指标数据包括通话时长、接通率、短通话占比,将通话时长小于10s、接通率小于40%、短通话占比超过50%的为异常通话组。
3.根据权利要求1所述的一种基于机器学习大模型与asr的隐私号反诈系统,其特征在于,所述风险等级分为一级风险、二级风险、三级风险,一级风险为违禁违规、二级风险为涉嫌诈骗、三级风险为高危业务、四级风险为恶意骚扰。
4.根据权利要求1所述的一种基于机器学习大模型与asr的隐私号反诈系统,其特征在于,所述管控策略包括:当运营收...
【专利技术属性】
技术研发人员:劳珍珍,吕周童,覃炳深,黄嘉才,罗晓,周美凤,江冰,黄蕴钰,
申请(专利权)人:广西东信易通科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。