System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及语音交互,特别涉及一种用于车辆语音交互的模型的优化方法、语音交互方法、服务器和计算机可读存储介质。
技术介绍
1、车载智能系统往往通过输入拒识训练数据对其拒识能力进行训练,提升系统在实际应用中拒绝处理不适当或无效输入的能力。然而,由于拒识训练数据数量的不足和拒识训练数据的广度较低,车载智能系统的拒识能力较差。
技术实现思路
1、本申请提供了一种用于车辆语音交互的模型的优化方法、语音交互方法、服务器和计算机可读存储介质。
2、本申请实施方式提供一种用于车辆语音交互的模型的优化方法,所述方法包括:
3、对所述模型的原始训练数据集进行拒识改造处理,得到第一训练数据集和第二训练数据集;
4、根据所述原始训练数据集和原始日志数据集,得到第三训练数据集;
5、根据所述原始训练数据集、所述第一训练数据集、所述第二训练数据集和所述第三训练数据集对所述模型进行训练,以提升所述模型的拒识能力。
6、如此,服务器对模型的原始训练数据集进行拒识改造处理,得到第一训练数据集和第二训练数据集。接着,服务器根据原始训练数据集和原始日志数据集,得到第三训练数据集。最后,服务器根据原始训练数据集、第一训练数据集、第二训练数据集和第三训练数据集对模型进行训练,以提升模型的拒识能力。这样,通过对原始训练数据集进行拒识改造处理及根据原始训练数据集和和原始日志数据集进行特定处理,增加拒识训练数据集的数量和拓宽拒识训练数据集的广度,并通过这些拒识训练数
7、在某些实施方式中,所述对所述模型原始训练数据集进行拒识改造处理,得到第一训练数据集和第二训练数据集,包括:
8、基于预设测试方法,根据预设拒识描述、所述原始训练数据集中的原始拒识数据子集和原始有效数据子集,得到所述第一训练数据集。
9、如此,基于预设测试方法,服务器根据预设拒识描述、原始训练数据集中的原始拒识数据子集和原始有效数据子集,得到第一训练数据集。这样,服务器使用预设测试方法和预设拒识描述,并结合原始训练数据集中的原始拒识数据子集和原始有效数据子集,获得了第一训练数据集,从而能够帮助模型更好地理解在何种情况下应该拒绝处理输入,提高模型在实际应用中的安全性和可靠性。
10、在某些实施方式中,所述原始有效数据子集包括多个原始有效数据,所述基于预设测试方法,根据所述原始训练数据集和预设拒识描述,得到所述第一训练数据集,包括:
11、基于预设颗粒度,对所述原始有效数据子集中的每个所述原始有效数据进行分割处理,得到多个目标拒识数据,其中,每个所述目标拒识数据与一个所述原始有效数据相对应;
12、根据所述预设拒识描述和多个所述目标拒识数据,得到多个临时拒识数据集;
13、根据所述原始拒识数据子集,对所述临时拒识数据集进行测试处理,确认将所述临时拒识数据集中的至少一个加入所述第一训练数据集。
14、如此,服务器基于预设颗粒度,对原始有效数据子集中的每个原始有效数据进行分割处理,得到多个目标拒识数据,其中,每个目标拒识数据与一个原始有效数据相对应。接着,服务器根据预设拒识描述和多个目标拒识数据,得到多个临时拒识数据集。最后,服务器根据原始拒识数据子集,对临时拒识数据集进行测试处理,确认将临时拒识数据集中的至少一个加入第一训练数据集。这样,通过细致的数据处理和测试,确保生成的第一训练数据集能够有效地训练模型,使模型在实际应用中能够更安全、更可靠地运行。
15、在某些实施方式中,所述目标拒识数据包括至少一个分句,所述根据所述预设拒识描述和所述目标拒识数据,得到多个临时拒识数据集,包括:
16、将所述预设拒识描述分别置于每个所述目标拒识数据中的分割位置处,得到多个所述临时拒识数据集,所述分割位置为将所述目标拒识数据中各个分句的连接位置。
17、如此,服务器将预设拒识描述分别置于每个目标拒识数据中的分割位置处,得到多个临时拒识数据集,分割位置为将目标拒识数据中各个分句的连接位置。这样,服务器将预设的拒识描述分别置于每个第一拒识数据的分割位置处,创建多个新的数据集,即临时拒识数据集,从而根据该临时拒识数据集生成第一训练数据集,以训练模型,提高模型在实际应用中的拒识能力。
18、在某些实施方式中,所述对所述模型原始训练数据集进行拒识改造处理,得到第一训练数据集和第二训练数据集,包括:
19、对所述原始有效数据子集进行改造处理,得到所述第二训练数据集。
20、如此,服务器对原始有效数据子集进行改造处理,得到第二训练数据集。这样,得到了第二训练数据集,从而能够帮助模型更好地理解在何种情况下应该拒绝处理输入,从而提高模型在实际应用中的安全性和可靠性。
21、在某些实施方式中,所述对所述原始有效数据子集进行改造处理,得到所述第二训练数据集,包括:
22、对所述原始有效数据子集中的原始有效数据进行解析处理,得到目标待改造信息;
23、对所述目标待改造信息进行改造处理,得到目标错误信息;
24、根据所述目标错误信息,得到所述第二训练数据集。
25、如此,服务器对原始有效数据子集中的原始有效数据进行解析处理,得到目标待改造信息。接着,服务器对目标待改造信息进行改造处理,得到目标错误信息。最后,服务器根据目标错误信息,得到第二训练数据集。这样,通过使用生成的目标错误信息替换目标待改造信息,生成第二训练数据集,从而能够训练模型更好地理解在何种情况下应该拒绝处理输入,提高模型在实际应用中的安全性和可靠性。
26、在某些实施方式中,所述根据所述原始训练数据集和原始日志数据集,得到第三训练数据集,包括:
27、基于预设相似度算法,根据所述原始日志数据集中的日志数据和所述原始训练数据集中的原始有效数据子集,得到每个所述日志数据的相似度;
28、根据预设相似度阈值和所述相似度确定所述第三训练数据集。
29、如此,服务器基于预设相似度算法,根据原始日志数据集中的日志数据和原始训练数据集中的原始有效数据子集,得到每个日志数据的相似度。接着,服务器根据预设相似度阈值和相似度确定第三训练数据集。这样,得到了包括与原始有效数据子集不相似或异常的日志数据,这些日志数据能够用于训练模型,以提高模型在实际应用中拒绝处理不适当或异常输入的能力。
30、在某些实施方式中,所述原始有效数据子集包括多个原始有效数据,所述基于预设相似度算法,根据所述原始日志数据集中的日志数据和所述原始训练数据集中的原始有效数据子集,得到每个所述日志数据的相似度,包括:
31、根据所述预设相似度算法和所述日志数据,确定所述日志数据的日志数据向量;
32、根据所述预设相似度算法和所述原始有效数据,确定所述原始有效数据的原始有效数据向量;
本文档来自技高网...
【技术保护点】
1.一种用于车辆语音交互的模型的优化方法,其特征在于,所述方法包括:
2.根据权利要求1所述的优化方法,其特征在于,所述对所述模型原始训练数据集进行拒识改造处理,得到第一训练数据集和第二训练数据集,包括:
3.根据权利要求2所述的优化方法,其特征在于,所述原始有效数据子集包括多个原始有效数据,所述基于预设测试方法,根据所述原始训练数据集和预设拒识描述,得到所述第一训练数据集,包括:
4.根据权利要求3所述的优化方法,其特征在于,所述目标拒识数据包括至少一个分句,所述根据所述预设拒识描述和所述目标拒识数据,得到多个临时拒识数据集,包括:
5.根据权利要求2所述的优化方法,其特征在于,所述对所述模型原始训练数据集进行拒识改造处理,得到第一训练数据集和第二训练数据集,包括:
6.根据权利要求5所述的优化方法,其特征在于,所述对所述原始有效数据子集进行改造处理,得到所述第二训练数据集,包括:
7.根据权利要求1所述的优化方法,其特征在于,所述根据所述原始训练数据集和原始日志数据集,得到第三训练数据集,包括:
< ...【技术特征摘要】
1.一种用于车辆语音交互的模型的优化方法,其特征在于,所述方法包括:
2.根据权利要求1所述的优化方法,其特征在于,所述对所述模型原始训练数据集进行拒识改造处理,得到第一训练数据集和第二训练数据集,包括:
3.根据权利要求2所述的优化方法,其特征在于,所述原始有效数据子集包括多个原始有效数据,所述基于预设测试方法,根据所述原始训练数据集和预设拒识描述,得到所述第一训练数据集,包括:
4.根据权利要求3所述的优化方法,其特征在于,所述目标拒识数据包括至少一个分句,所述根据所述预设拒识描述和所述目标拒识数据,得到多个临时拒识数据集,包括:
5.根据权利要求2所述的优化方法,其特征在于,所述对所述模型原始训练数据集进行拒识改造处理,得到第一训练数据集和第二训练数据集,包括:
6.根据权利要求5所述的优化方法,其特征在于,所述对所述原始有效数据子集进行改造处理,得到所述第二训练数据集,包括:
7.根据权利要求1所述的优化方法,其特征在于,所述根据所述原始训练数据集和原始日志数据集,得到第三训练数据集,包括:
8.根据权利要求7所述的...
【专利技术属性】
技术研发人员:胡璟,谢扬帆,冯康,汪建,
申请(专利权)人:广州小鹏汽车科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。