答非所问识别模型的训练方法、装置、设备和存储介质制造方法及图纸

技术编号:29527341 阅读:20 留言:0更新日期:2021-08-03 15:13
本申请涉及人工智能领域,具体公开了一种答非所问识别模型的训练方法、装置、设备和存储介质,其中,训练方法包括:获取训练样本,所述训练样本包括问句和答句;对所述训练样本中的问句进行语义向量编码,得到所述训练样本的第一语义向量;对所述训练样本中的答句进行语义向量编码,得到所述训练样本的第二语义向量;获取所述第一语义向量与所述第二语义向量的差,得到第三语义向量;将所述训练样本的第一语义向量、第二语义向量和第三语义向量进行拼接,得到所述训练样本的第四语义向量;将所述训练样本的第四语义向量输入初始识别模型中进行训练,得到答非所问识别模型。

【技术实现步骤摘要】
答非所问识别模型的训练方法、装置、设备和存储介质
本专利技术涉及人工智能
,具体涉及一种答非所问识别模型的训练方法、装置、设备和存储介质。
技术介绍
目前,金融欺诈风险不断扩大,反欺诈形势严峻。对于新型的欺诈手段,传统反欺诈手段维度单一、效率低下、范围受限,难以应对。对此,通过对历史数据的分析,发现客户是否正确回答坐席的问题,以及正确回答的占比,和该客户是否是一个风险欺诈用户的可能性息息相关。因此,可以通过分析客户与坐席的对话,初步预测该客户是否是一个风险欺诈用户的可能性。但是,目前的答非所问分析大多是基于实体和意图的匹配,即,分别确定问句和答句的实体特征和意图特征,继而,通过分析问句和答句的实体特征和意图特征的匹配度,确定问句和答句是否属于答非所问。这种分析方式只运用了句子的实体特征和意图特征,识别的准确率并不高。
技术实现思路
为了解决现有技术中存在的上述问题,本申请实施方式提供了一种答非所问识别模型的训练方法、装置、电子设备和存储介质,能够极大的提升答非所问识别的准确率。第一方面,本申请的实施方式提供了一种答非所问识别模型的训练方法,包括:获取训练样本,训练样本包括问句和答句;对训练样本中的问句进行语义向量编码,得到训练样本的第一语义向量;对训练样本中的答句进行语义向量编码,得到训练样本的第二语义向量;获取第一语义向量与第二语义向量的差,得到第三语义向量;将训练样本的第一语义向量、第二语义向量和第三语义向量进行拼接,得到训练样本的第四语义向量;将训练样本的第四语义向量输入初始识别模型中进行训练,得到答非所问识别模型。第二方面,本申请的实施方式提供了一种答非所问识别模型的训练装置,包括:样本获取模块,用于获取训练样本,训练样本包括问句和答句;样本处理模块,用于对训练样本中的问句进行语义向量编码,得到训练样本的第一语义向量,对训练样本中的答句进行语义向量编码,得到训练样本的第二语义向量,获取第一语义向量与第二语义向量的差,得到第三语义向量,以及将训练样本的第一语义向量、第二语义向量和第三语义向量进行拼接,得到训练样本的第四语义向量;训练模块,用于将训练样本的第四语义向量输入初始识别模型中进行训练,得到答非所问识别模型。第三方面,本申请实施方式提供一种电子设备,包括:处理器,处理器与存储器相连,存储器用于存储计算机程序,处理器用于执行存储器中存储的计算机程序,以使得电子设备执行如第一方面的方法。第四方面,本申请实施方式提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序使得计算机执行如第一方面的方法。第五方面,本申请实施方式提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机可操作来使计算机执行如第一方面的方法。实施本申请实施方式,具有如下有益效果:在本申请实施方式中,首先,通过对训练样本中的问句和答句分别进行语义向量编码,得到对应于训练样本中问句的第一语义向量和对应于训练样本中答句的第二语义向量。然后,使第一语义向量减去第二语义向量,得到第三语义向量,使得问句与答句在语义向量层面产生交互,再将第一语义向量、第二语义向量和第三语义向量进行拼接,得到训练样本的第四语义向量。最后,基于第四语义向量对初始识别模型进行训练,得到最终的答非所问识别模型。由此,在训练过程中,增加了问句与答句在句子层面语义向量之间的交互信息,即,第三语义向量,使得问句的特征、答句的特征、以及问句与答句在句子层面语义向量之间的交互信息均被充分利用,提高了答非所问识别模型对问句与答句之间匹配的准确率。附图说明为了更清楚地说明本申请实施方式中的技术方案,下面将对实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施方式提供的一种答非所问识别模型的训练装置的硬件结构示意图;图2为本申请实施方式提供的一种答非所问识别模型的训练方法的流程示意图;图3为本申请实施方式提供的一种对训练样本中的问句进行语义向量编码的方法的流程示意图;图4为本申请实施方式提供的一种将各个字符的字向量按照对应的字符在原句中的位置进行纵向拼接的示意图;图5为本申请实施方式提供的另一种对训练样本中的问句进行语义向量编码的方法的流程示意图;图6为本申请实施方式提供的再一种对训练样本中的问句进行语义向量编码的方法的流程示意图;图7为本申请实施方式提供的一种用每个字符的字向量中的最大元素替换训练样本中的问句中的每个字符的示意图;图8为本申请实施方式提供的一种答非所问识别模型的训练装置的功能模块组成框图;图9为本申请实施方式提供的一种电子设备的结构示意图。具体实施方式下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本申请保护的范围。本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。在本文中提及“实施方式”意味着,结合实施方式描述的特定特征、结果或特性可以包含在本申请的至少一个实施方式中。在说明书中的各个位置出现该短语并不一定均是指相同的实施方式,也不是与其它实施方式互斥的独立的或备选的实施方式。本领域技术人员显式地和隐式地理解的是,本文所描述的实施方式可以与其它实施方式相结合。参阅图1,图1为本申请实施方式提供的一种答非所问识别模型的训练装置的硬件结构示意图。该答非所问识别模型的训练装置100包括至少一个处理器101,通信线路102,存储器103以及至少一个通信接口104。在本实施方式中,处理器101,可以是一个通用中央处理器(centralprocessingunit,CPU),微处理器,特定应用集成电路(application-specificintegratedcircuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。通信线路102,可以包括一通路,在上述组件之间传送信息。通信接口104,可以是任何收发器一类的装置(如天线等),用于与其他设备或通信网络通信,例如以太网,RAN,无线局域网(wirelesslocalareanetworks,本文档来自技高网...

【技术保护点】
1.一种答非所问识别模型的训练方法,其特征在于,所述训练方法包括:/n获取训练样本,所述训练样本包括问句和答句;/n对所述训练样本中的问句进行语义向量编码,得到所述训练样本的第一语义向量;/n对所述训练样本中的答句进行语义向量编码,得到所述训练样本的第二语义向量;/n获取所述第一语义向量与所述第二语义向量的差,得到第三语义向量;/n将所述训练样本的第一语义向量、第二语义向量和第三语义向量进行拼接,得到所述训练样本的第四语义向量;/n将所述训练样本的第四语义向量输入初始识别模型中进行训练,得到答非所问识别模型。/n

【技术特征摘要】
1.一种答非所问识别模型的训练方法,其特征在于,所述训练方法包括:
获取训练样本,所述训练样本包括问句和答句;
对所述训练样本中的问句进行语义向量编码,得到所述训练样本的第一语义向量;
对所述训练样本中的答句进行语义向量编码,得到所述训练样本的第二语义向量;
获取所述第一语义向量与所述第二语义向量的差,得到第三语义向量;
将所述训练样本的第一语义向量、第二语义向量和第三语义向量进行拼接,得到所述训练样本的第四语义向量;
将所述训练样本的第四语义向量输入初始识别模型中进行训练,得到答非所问识别模型。


2.根据权利要求1所述的训练方法,其特征在于,所述对所述训练样本中的问句进行语义向量编码,得到所述训练样本的第一语义向量,包括:
对所述训练样本中的问句中的每个字符,分别获取所述每个字符的字向量;
确定所述每个字符的字向量中的最大元素;
使用所述每个字符的字向量中的最大元素替换所述训练样本中的问句中的所述每个字符,得到所述训练样本中的第一语义向量。


3.根据权利要求1所述的训练方法,其特征在于,所述对所述训练样本中的问句进行语义向量编码,得到所述训练样本的第一语义向量,包括:
对所述训练样本中的问句中的每个字符,分别获取所述每个字符的字向量;
将所述训练样本中的问句中的所有字符的字向量的第a位元素的元素值的平均值,作为所述训练样本中的第一语义向量的第a位元素的元素值,得到所述训练样本中的第一语义向量,其中,a为大于0的整数。


4.根据权利要求1所述的训练方法,其特征在于,所述对所述训练样本中的问句进行语义向量编码,得到所述训练样本的第一语义向量,包括:
对所述训练样本中的问句中的每个字符,分别获取所述每个字符的字向量;
按照所述每个字符在所述训练样本中的问句中的位置,将所述每个字符的字向量,进行纵向拼接,得到所述训练样本中的第一语义向量。


5.根据权利要求1-4中任意一项所述的训练方法,其特征在于,所述将所述训练样本的第一语义向量、第二语义向量和第三...

【专利技术属性】
技术研发人员:陈军庄伯金刘玉宇
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1