答非所问识别模型的训练方法、装置、设备和存储介质制造方法及图纸

技术编号：29527341 阅读：20 留言：0更新日期：2021-08-03 15:13

本申请涉及人工智能领域，具体公开了一种答非所问识别模型的训练方法、装置、设备和存储介质，其中，训练方法包括：获取训练样本，所述训练样本包括问句和答句；对所述训练样本中的问句进行语义向量编码，得到所述训练样本的第一语义向量；对所述训练样本中的答句进行语义向量编码，得到所述训练样本的第二语义向量；获取所述第一语义向量与所述第二语义向量的差，得到第三语义向量；将所述训练样本的第一语义向量、第二语义向量和第三语义向量进行拼接，得到所述训练样本的第四语义向量；将所述训练样本的第四语义向量输入初始识别模型中进行训练，得到答非所问识别模型。

全部详细技术资料下载

【技术实现步骤摘要】
答非所问识别模型的训练方法、装置、设备和存储介质
本专利技术涉及人工智能
，具体涉及一种答非所问识别模型的训练方法、装置、设备和存储介质。
技术介绍
目前，金融欺诈风险不断扩大，反欺诈形势严峻。对于新型的欺诈手段，传统反欺诈手段维度单一、效率低下、范围受限，难以应对。对此，通过对历史数据的分析，发现客户是否正确回答坐席的问题，以及正确回答的占比，和该客户是否是一个风险欺诈用户的可能性息息相关。因此，可以通过分析客户与坐席的对话，初步预测该客户是否是一个风险欺诈用户的可能性。但是，目前的答非所问分析大多是基于实体和意图的匹配，即，分别确定问句和答句的实体特征和意图特征，继而，通过分析问句和答句的实体特征和意图特征的匹配度，确定问句和答句是否属于答非所问。这种分析方式只运用了句子的实体特征和意图特征，识别的准确率并不高。
技术实现思路
为了解决现有技术中存在的上述问题，本申请实施方式提供了一种答非所问识别模型的训练方法、装置、电子设备和存储介质，能够极大的提升答非所问识别的准确率。第一方面，本申请的实施方式提供了一种答非所问识别模型的训练方法，包括：获取训练样本，训练样本包括问句和答句；对训练样本中的问句进行语义向量编码，得到训练样本的第一语义向量；对训练样本中的答句进行语义向量编码，得到训练样本的第二语义向量；获取第一语义向量与第二语义向量的差，得到第三语义向量；将训练样本的第一语义向量、第二语义向量和第三语义向量进行拼接，得到训练样本的...

【技术保护点】
1.一种答非所问识别模型的训练方法，其特征在于，所述训练方法包括：/n获取训练样本，所述训练样本包括问句和答句；/n对所述训练样本中的问句进行语义向量编码，得到所述训练样本的第一语义向量；/n对所述训练样本中的答句进行语义向量编码，得到所述训练样本的第二语义向量；/n获取所述第一语义向量与所述第二语义向量的差，得到第三语义向量；/n将所述训练样本的第一语义向量、第二语义向量和第三语义向量进行拼接，得到所述训练样本的第四语义向量；/n将所述训练样本的第四语义向量输入初始识别模型中进行训练，得到答非所问识别模型。/n

【技术特征摘要】
1.一种答非所问识别模型的训练方法，其特征在于，所述训练方法包括：
获取训练样本，所述训练样本包括问句和答句；
对所述训练样本中的问句进行语义向量编码，得到所述训练样本的第一语义向量；
对所述训练样本中的答句进行语义向量编码，得到所述训练样本的第二语义向量；
获取所述第一语义向量与所述第二语义向量的差，得到第三语义向量；
将所述训练样本的第一语义向量、第二语义向量和第三语义向量进行拼接，得到所述训练样本的第四语义向量；
将所述训练样本的第四语义向量输入初始识别模型中进行训练，得到答非所问识别模型。

2.根据权利要求1所述的训练方法，其特征在于，所述对所述训练样本中的问句进行语义向量编码，得到所述训练样本的第一语义向量，包括：
对所述训练样本中的问句中的每个字符，分别获取所述每个字符的字向量；
确定所述每个字符的字向量中的最大元素；
使用所述每个字符的字向量中的最大元素替换所述训练样本中的问句中的所述每个字符，得到所述训练样本中的第一语义向量。

3.根据权利要求1所述的训练方法，其特征在于，所述对所述训练样本中的问句进行语义向量编码，得到所述训练样本的第一语义向量，包括：
对所述训练样本中的问句中的每个字符，分别获取所述每个字符的字向量；
将所述训练样本中的问句中的所有字符的字向量的第a位元素的元素值的平均值，作为所述训练样本中的第一语义向量的第a位元素的元素值，得到所述训练样本中的第一语义向量，其中，a为大于0的整数。

4.根据权利要求1所述的训练方法，其特征在于，所述对所述训练样本中的问句进行语义向量编码，得到所述训练样本的第一语义向量，包括：
对所述训练样本中的问句中的每个字符，分别获取所述每个字符的字向量；
按照所述每个字符在所述训练样本中的问句中的位置，将所述每个字符的字向量，进行纵向拼接，得到所述训练样本中的第一语义向量。

5.根据权利要求1-4中任意一项所述的训练方法，其特征在于，所述将所述训练样本的第一语义向量、第二语义向量和第三...

【专利技术属性】
技术研发人员：陈军，庄伯金，刘玉宇，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人