System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及语音识别,特别涉及一种基于rnn语音识别的实时语音风控系统。
技术介绍
1、随着信息技术的迅猛发展和通讯技术的普及,语音通信已成为人们重要的沟通方式之一,越来越多的人开始使用语音对话进行沟通和交流。然而,一些不法分子可能会利用语音通信进行欺诈、诈骗等违法犯罪活动,给社会安全和个人财产造成重大威胁,给互联网的通话风险检测也带来了一些风险和挑战,传统的文字风险检测已经无法满足风险检测需求,如何快速准确地识别和分析语音内容,成为当前亟待解决的问题,因此本专利技术提出一种基于rnn语音识别的实时语音风控系统。
技术实现思路
1、本专利技术提供一种基于rnn语音识别的实时语音风控系统,通过语音识别以及风险检测实现了语音通讯的自动检测,并自动将语音通讯内容与文字通讯内容进行结合,实现了通讯过程的完整检测,有利于及时发现当前通讯中的隐藏套路,帮助用户及时识别并发现潜在风险,降低用户受骗概率,保护用户的利益和安全,可以及时发现泄密行为,降低事件的泄露几率,提高信息安全。
2、本专利技术提供一种基于rnn语音识别的实时语音风控系统,包括:
3、语音检测模块,用于采集当前用户当前通讯的双向通讯语音,并进行预处理后获得有效双向通讯语音;
4、语音处理模块,用于基于rnn语音识别模型对双向通讯语音进行识别整理,获得双向通讯文本,并提取双向通讯文本的文本语义特征以及关联语义特征;
5、风险检测模块,用于基于文本语义特征以及关联语义特征对用户的当前
6、风险控制模块,用于基于风险控制信号,对当前通讯进行对应的风控处理。
7、优选的,在一种基于rnn语音识别的实时语音风控系统中,语音检测模块,包括:
8、语音采集单元,用于当前用户当前通讯双方的语音进行采集,获得双向通讯语音;
9、预处理单元,用于基于双向通讯语音的接听关系,将双向通讯语音进行分组,获得第一语音和第二语音,并分别对第一语音和第二语音进行预处理。
10、优选的,在一种基于rnn语音识别的实时语音风控系统中,预处理单元,包括:
11、语音降噪子单元,用于基于预设算法对应第一语音以及第二语音进行语音降噪,获得第一去噪语音和第二去噪语音;
12、语音分离子单元,用于获取当前第一语音对应的多个第一历史语音,基于第一历史语音进行语音特征提取,获得第一参考特征并发送至第一参考特征列表进行存储,根据第一参考特征对第一语音进行人声净化,获得第一有效语音;
13、获取当前第二语音对应的多个第二历史语音,基于第二历史语音进行语音特征提取,获得第二参考特征并发送至第二参考特征列表进行存储,根据第二参考特征对第二语音进行人声净化,获得第二有效语音;
14、语音发送单元,用于将第一有效语音和第二有效语音作为有效双向通讯语音,发送至语音处理模块。
15、优选的,在一种基于rnn语音识别的实时语音风控系统中,语音分离子单元,包括:
16、参考更新子单元,用于获取预设时间内的多条单方通讯语音对应的语音特征,并与其对应的参考特征列表中的参考特征进行对比,判断单方通讯语音人声是否存在语音异常;
17、其中,单方通讯语音为第一语音或者第二语音;
18、当单方通讯语音人声存在语音异常时,将与其对应的参考特征不一样的单方通讯语音作为异常语音,计算同一类型异常语音在预设时间段内的使用频率,基于所述使用频率,预测异常语音的使用连续程度;
19、当使用连续程度大于预设值时,判定异常语音为常用语音,将常用语音对应的语音特征作为参考特征,并对单方通讯语音对应的参考特征列表进行更新;
20、否则,判定异常语音为非常用语音。
21、优选的,在一种基于rnn语音识别的实时语音风控系统中,语音处理模块,包括:
22、语音识别单元,用于基于rnn语音识别模型对有效双向通讯语音进行识别,获得语音识别结果,并结合当前通讯中的文字对话,生成双向通讯文本;
23、第一提取单元,用于基于双向通讯语音的接听关系,将双向通讯文本进行文本分组,获得第一文本组和第二文本组,并对分别对第一文本组和第二文本组进行提取,获得文本语义特征;
24、第二提取单元,用于对双向通讯文本进行对话逻辑识别,并基于对话逻辑识别结果,对双向通讯文本进行顺序整理,获得整理文本,并将整理文本与双向通讯文本进行对比,获得关联语义特征。
25、优选的,在一种基于rnn语音识别的实时语音风控系统中,第二提取单元,包括:
26、逻辑识别子单元,用于按照原对话顺序,通过rnn语音识别模型对双向通讯文本进行语义识别,根据语义识别结果,分别确定当前通讯中的多个对话话题的话题首句,基于对话问答特征以及话题首句关键词,对当前剩余文本语句与各个话题首句的相关性进行判断,根据判断结果,确定每个对话话题对应的全部通讯文本,得到双向通讯文本的对话逻辑;
27、文本整理子单元,用于基于所述对话逻辑,对双向通讯文本进行顺序调整,将同一对话话题对应的全部通讯文本调整成连续对话文本,获得多个双向通讯文本段,并基于原对话中各个对话话题的出现顺序,对多个双向通讯文本段进行拼接形成完整的新双向通讯文本,获得整理文本;
28、特征提取子单元,用于将整理文本与双向通讯文本进行对比,确定双向通讯语音中的对话话题穿插关系以及对话话题更换频率,基于对话话题穿插关系以及对话话题更换频率,生成关联语义特征。
29、优选的,在一种基于rnn语音识别的实时语音风控系统中,风险检测模块,包括:
30、第一检测单元,用于将独立通讯文本的文本语义特征与预设风险列表中的多个风险词汇对应的语义特征进行对比,若文本语义特征与任意风险词汇对应的语义特征相同时,判定所述文本语义特征对应的独立通讯文本为疑似风险文本;
31、并截取疑似风险文本所在的双向通讯文本段,获取所述双向通讯文本段对应的关联语义特征,提取对话情景关键词,基于对话情景关键词,确定疑似风险文本的对话情景,参考预设风险列表,判断疑似风险文本的对话情景与其对应的风险词汇的风险情景是否匹配;
32、若匹配,则判定疑似风险文本为风险文本,并生成第一控制信号;
33、若不匹配,则判定疑似风险文本为正常语音;
34、第二检测单元,用于基于关联语义特征,确定当前通讯的对话话题切换复杂程度,当对话话题切换复杂程度大于预设值时,判断当前通讯是否为多方对话,若是,判断当前通讯正常;
35、否则,判定当前通讯异常,并将当前通讯对应的整理文本发送至风险确定单元;
36、风险确定单元,用于判断当前通讯是否存在敏感话题,若存在,则判定当前通讯为风险通讯,生成第二控制信号;
37、若不存在,则向当前通讯添加可疑标签,基于关联语义特征,本文档来自技高网...
【技术保护点】
1.一种基于RNN语音识别的实时语音风控系统,其特征在于,包括:
2.根据权利要求1所述的一种基于RNN语音识别的实时语音风控系统,其特征在于,语音检测模块,包括:
3.根据权利要求2所述的一种基于RNN语音识别的实时语音风控系统,其特征在于,预处理单元,包括:
4.根据权利要求3所述的一种基于RNN语音识别的实时语音风控系统,其特征在于,语音分离子单元,包括:
5.根据权利要求3所述的一种基于RNN语音识别的实时语音风控系统,其特征在于,语音处理模块,包括:
6.根据权利要求5所述的一种基于RNN语音识别的实时语音风控系统,其特征在于,第二提取单元,包括:
7.根据权利要求1所述的一种基于RNN语音识别的实时语音风控系统,其特征在于,风险检测模块,包括:
8.根据权利要求1所述的一种基于RNN语音识别的实时语音风控系统,其特征在于,风险控制模块,包括:
9.根据权利要求7所述的一种基于RNN语音识别的实时语音风控系统,其特征在于,风险确定单元,还包括:
10.根据权利要求
...【技术特征摘要】
1.一种基于rnn语音识别的实时语音风控系统,其特征在于,包括:
2.根据权利要求1所述的一种基于rnn语音识别的实时语音风控系统,其特征在于,语音检测模块,包括:
3.根据权利要求2所述的一种基于rnn语音识别的实时语音风控系统,其特征在于,预处理单元,包括:
4.根据权利要求3所述的一种基于rnn语音识别的实时语音风控系统,其特征在于,语音分离子单元,包括:
5.根据权利要求3所述的一种基于rnn语音识别的实时语音风控系统,其特征在于,语音处理模块,包括:
6.根据权利要求5所述的一种基于rnn语音...
【专利技术属性】
技术研发人员:郑亚珂,
申请(专利权)人:北京秒信科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。