System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 话术识别方法、装置、设备及存储介质制造方法及图纸_技高网

话术识别方法、装置、设备及存储介质制造方法及图纸

技术编号:43919461 阅读:4 留言:0更新日期:2025-01-03 13:24
本发明专利技术涉及人工智能领域和金融科技领域,公开了话术识别方法、装置、设备及存储介质,方法包括:选取骗保样本或非骗保样本作为样本数据,基于样本数据训练大语言模型,获取大语言模型基于样本数据输出的预测话术标签;获取预测话术标签与预设话术标签之间的第一损失值、第二损失值;根据第一损失值、第二损失值,确定预测话术标签的总损失值;当总损失值满足预定义的收敛条件时,停止训练大语言模型,保存训练完成的大语言模型;获取报险电话的当前录音,获取训练完成的大语言模型基于当前录音输出的当前话术标签,当前话术标签为骗保话术标签时,识别报险电话的当前话术为骗保话术。本发明专利技术有利于骗保话术的识别效率。

【技术实现步骤摘要】

本专利技术涉及人工智能领域和金融科技领域,尤其涉及话术识别方法、装置、设备及存储介质


技术介绍

1、保险平台在现代社会扮演着至关重要的角色,为个人和企业提供了财务保障和风险管理的不可或缺的服务。随着保险业务的不断扩展,骗保问题已成为保险平台面临的严重挑战之一。骗保分子为了非法获取保险金,常常采用各种骗保手段,他们深谙报险流程,并且精通如何应对理赔人员,以巧妙地获取赔款。这些骗保分子的报险过程通常伴随着精心设计的骗保话术。

2、然而,现有保险平台的骗保话术的识别过程繁琐,不利于提高骗保话术的识别效率。其原因在于,现有保险平台主要采用人工识别的方式,识别保险平台的骗保话术,而人工识别的方式效率低下且容易出现识别不一致的问题。因为,同一种欺诈话术可能多次被不同的客服人员或理赔人员处理,这增加了识别的难度,同时也导致了更多的骗保行为逃脱监测,因此,不利于提高骗保话术的识别效率。


技术实现思路

1、本专利技术提供一种话术识别方法、装置、计算机设备及存储介质,以解决现有保险平台的骗保话术的识别过程繁琐,不利于提高骗保话术的识别效率的技术问题。

2、第一方面,提供了一种话术识别方法,包括:

3、获取保险平台的预设录音,获取所述预设录音中的骗保录音和非骗保录音,将所述骗保录音和骗保话术标签组成骗保样本,将所述非骗保录音和非骗保话术标签组成非骗保样本;

4、选取所述骗保样本或所述非骗保样本作为样本数据,基于所述样本数据训练大语言模型,获取所述大语言模型基于所述样本数据输出的预测话术标签;

5、获取所述样本数据中的预设话术标签,通过预定义的获取方式,获取所述预测话术标签与所述预设话术标签之间的第一损失值、第二损失值;

6、根据所述第一损失值、所述第二损失值,确定所述预测话术标签的总损失值;

7、当所述总损失值满足预定义的收敛条件时,停止训练所述大语言模型,保存训练完成的所述大语言模型;

8、获取所述保险平台的报险电话,获取所述报险电话的当前录音,获取训练完成的所述大语言模型基于所述当前录音输出的当前话术标签,当所述当前话术标签为所述骗保话术标签时,识别所述报险电话的当前话术为骗保话术。

9、进一步地,所述选取所述骗保样本或所述非骗保样本作为样本数据,基于所述样本数据训练大语言模型,获取所述大语言模型基于所述样本数据输出的预测话术标签,包括:

10、将多个不同的所述骗保样本和多个所述非骗保样本组成数据集,随机抽取所述数据集中的所述骗保样本或所述非骗保样本作为样本数据;

11、基于所述样本数据训练大语言模型,获取所述大语言模型基于所述样本数据输出的预测话术标签。

12、进一步地,所述获取所述样本数据中的预设话术标签,通过预定义的获取方式,获取所述预测话术标签与所述预设话术标签之间的第一损失值、第二损失值,包括:

13、当样本数据为所述骗保样本时,将所述骗保话术标签设置为所述样本数据中的预设话术标签,当样本数据为所述非骗保样本时,将所述非骗保话术标签设置为所述样本数据中的预设话术标签;

14、通过预设的余弦相似度损失函数,获取所述预测话术标签与所述预设话术标签之间的第一损失值,通过预设的正则化损失函数,获取所述预测话术标签与所述预设话术标签之间的第二损失值。

15、进一步地,所述根据所述第一损失值、所述第二损失值,确定所述预测话术标签的总损失值,包括:

16、获取预设文件,通过所述预设文件导入预设的总损失值生成模型;

17、根据所述第一损失值、所述第二损失值以及预设的总损失值生成模型,生成所述预测话术标签的总损失值。

18、进一步地,所述当所述总损失值满足预定义的收敛条件时,停止训练所述大语言模型,保存训练完成的所述大语言模型,包括:

19、对所述大语言模型进行多轮训练,在多轮训练的过程中,获取所述总损失值的变化量;

20、获取收敛条件对应的预设值,当所述变化量小于预设值时,确定所述总损失值满足所述收敛条件,停止训练所述大语言模型,保存训练完成的所述大语言模型。

21、进一步地,所述获取所述保险平台的报险电话,获取所述报险电话的当前录音,获取训练完成的所述大语言模型基于所述当前录音输出的当前话术标签,当所述当前话术标签为所述骗保话术标签时,识别所述报险电话的当前话术为骗保话术,包括:

22、获取所述保险平台的报险电话,获取所述报险电话的当前录音,提取所述当前录音的特征向量,将所述特征向量输入训练完成的所述大语言模型;

23、获取训练完成的所述大语言模型基于所述特征向量输出的当前话术标签,当所述当前话术标签为所述骗保话术标签时,识别所述报险电话的当前话术为骗保话术。

24、进一步地,在所述获取所述保险平台的报险电话,获取所述报险电话的当前录音,获取训练完成的所述大语言模型基于所述当前录音输出的当前话术标签,当所述当前话术标签为所述骗保话术标签时,识别所述报险电话的当前话术为骗保话术之后,所述话术识别方法,包括:

25、获取所述报险电话对应的显示窗口,通过显示窗口显示所述骗保话术对应的图标。

26、第二方面,提供了一种话术识别装置,包括:

27、第一获取模块,用于获取保险平台的预设录音,获取所述预设录音中的骗保录音和非骗保录音,将所述骗保录音和骗保话术标签组成骗保样本,将所述非骗保录音和非骗保话术标签组成非骗保样本;

28、第二获取模块,用于选取所述骗保样本或所述非骗保样本作为样本数据,基于所述样本数据训练大语言模型,获取所述大语言模型基于所述样本数据输出的预测话术标签;

29、第三获取模块,用于获取所述样本数据中的预设话术标签,通过预定义的获取方式,获取所述预测话术标签与所述预设话术标签之间的第一损失值、第二损失值;

30、确定模块,用于根据所述第一损失值、所述第二损失值,确定所述预测话术标签的总损失值;

31、保存模块,用于当所述总损失值满足预定义的收敛条件时,停止训练所述大语言模型,保存训练完成的所述大语言模型;

32、识别模块,用于获取所述保险平台的报险电话,获取所述报险电话的当前录音,获取训练完成的所述大语言模型基于所述当前录音输出的当前话术标签,当所述当前话术标签为所述骗保话术标签时,识别所述报险电话的当前话术为骗保话术。

33、第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述话术识别方法的步骤。

34、第四方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述话术识别方法的步骤。

35、本申请提供一种话术识别方法、装置、计算机设备及存储介质,获取保险平台的预设录音,获取所述预设录音中的骗保本文档来自技高网...

【技术保护点】

1.一种话术识别方法,其特征在于,包括:

2.根据权利要求1所述的话术识别方法,其特征在于,所述选取所述骗保样本或所述非骗保样本作为样本数据,基于所述样本数据训练大语言模型,获取所述大语言模型基于所述样本数据输出的预测话术标签,包括:

3.根据权利要求1所述的话术识别方法,其特征在于,所述获取所述样本数据中的预设话术标签,通过预定义的获取方式,获取所述预测话术标签与所述预设话术标签之间的第一损失值、第二损失值,包括:

4.根据权利要求1所述的话术识别方法,其特征在于,所述根据所述第一损失值、所述第二损失值,确定所述预测话术标签的总损失值,包括:

5.根据权利要求1所述的话术识别方法,其特征在于,所述当所述总损失值满足预定义的收敛条件时,停止训练所述大语言模型,保存训练完成的所述大语言模型,包括:

6.根据权利要求1所述的话术识别方法,其特征在于,所述获取所述保险平台的报险电话,获取所述报险电话的当前录音,获取训练完成的所述大语言模型基于所述当前录音输出的当前话术标签,当所述当前话术标签为所述骗保话术标签时,识别所述报险电话的当前话术为骗保话术,包括:

7.根据权利要求1所述的话术识别方法,其特征在于,在所述获取所述保险平台的报险电话,获取所述报险电话的当前录音,获取训练完成的所述大语言模型基于所述当前录音输出的当前话术标签,当所述当前话术标签为所述骗保话术标签时,识别所述报险电话的当前话术为骗保话术之后,所述话术识别方法,包括:

8.一种话术识别装置,其特征在于,包括:

9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述话术识别方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述话术识别方法的步骤。

...

【技术特征摘要】

1.一种话术识别方法,其特征在于,包括:

2.根据权利要求1所述的话术识别方法,其特征在于,所述选取所述骗保样本或所述非骗保样本作为样本数据,基于所述样本数据训练大语言模型,获取所述大语言模型基于所述样本数据输出的预测话术标签,包括:

3.根据权利要求1所述的话术识别方法,其特征在于,所述获取所述样本数据中的预设话术标签,通过预定义的获取方式,获取所述预测话术标签与所述预设话术标签之间的第一损失值、第二损失值,包括:

4.根据权利要求1所述的话术识别方法,其特征在于,所述根据所述第一损失值、所述第二损失值,确定所述预测话术标签的总损失值,包括:

5.根据权利要求1所述的话术识别方法,其特征在于,所述当所述总损失值满足预定义的收敛条件时,停止训练所述大语言模型,保存训练完成的所述大语言模型,包括:

6.根据权利要求1所述的话术识别方法,其特征在于,所述获取所述保险平台的报险电话,获取所述报险电话的当前录音,...

【专利技术属性】
技术研发人员:梁健龙贺亚运彭俊清王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1