一种基于轻量化大模型的辅助人车交互的控制方法技术

技术编号：41185038 阅读：24 留言：0更新日期：2024-05-07 22:17

本发明专利技术公开了一种基于轻量化大模型的辅助人车交互的控制方法，涉及人车交互技术领域。本发明专利技术至少包括以下步骤：S1：轻量化学生模型的构建和应用；S2：模型的双阶段预训练；S3：持续优化和更新机制；S4：云端和车载系统间的交互。本发明专利技术通过针对驾驶场景优化的模型，能更准确地识别驾驶者的情感状态和意图，从而提升人车交互的智能化水平，且通过不断收集驾驶场景下的数据进行优化，使得模型能更好地适应具体驾驶环境和用户需求，实现场景适应性，且利用云端的高能力模型对轻量级学生模型进行对比和优化，使车载模型在保持轻量化的同时，提高了响应的准确性和个性化。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人车交互，具体为一种基于轻量化大模型的辅助人车交互的控制方法。

技术介绍

1、人车交互是指人与汽车之间的互动，它不仅包括语音识别这种智能交互方式，还涵盖了车辆与人的情感交互。在智能汽车快速发展的今天，人车交互对于智能汽车来说越来越重要。

2、首先，人车交互可以提高驾驶的安全性和舒适性。智能汽车可以根据驾驶员的情感状态和需求，自动调整车内温度、音乐等，提供更加个性化的驾驶体验，增强了驾驶的舒适性。其次，人车交互可以提升驾驶的智能化水平。通过车辆与人的情感交互，智能汽车可以感知驾驶员的情绪和需求，从而自动调整车辆的运行状态和功能，提供更加智能化的驾驶体验。例如，当驾驶员感到疲惫时，车辆可以自动降低车速、播放轻松的音乐等，以缓解驾驶员的疲劳感。在自动驾驶模式下，车辆需要能够准确感知人的意图和需求，从而做出正确的驾驶决策。例如，当车辆在自动驾驶时遇到危险情况时，车辆需要通过语音提示、灯光提示等方式与乘客进行交互，确保乘客的安全。

3、已有的专利中，如申请公布号为cn116913270a，名称为一种语音交互方法、系统及车辆，采用通过用户语音确定语音指令；根据所述语音指令生成触发信号，获取与所述触发信号对应的交互结果。

4、此专利通过语音指令生成触发信号，缺乏对驾驶员交互过程中，情感的理解以及意图的理解，对于智能化的人车交互来说，这样的交互是不够的。

5、因此可知，当前的智能汽车人车交互缺乏情感的理解和意图的理解，这意味着车辆无法真正理解驾驶者的需求和情感状态。智能汽车设计中，情

技术实现思路

1、本专利技术的目的在于提供一种基于轻量化大模型的辅助人车交互的控制方法。

2、一种基于轻量化大模型的辅助人车交互的控制方法，至少包括以下步骤：

3、s1：轻量化学生模型的构建和应用，利用t5模型作为基础模型，通过利用它从大模型蒸馏得到的轻量化t5学生模型，专门针对驾驶场景的意图识别，构建意图识别模块，所述意图识别模块用于从用户的语言输入中识别出用户的意图，并且可能还包含情感状态的识别。以达到提升控制交互的质量的目的；

4、s2：模型的双阶段预训练，结合情绪识别和意图识别数据集对t5模型进行初次预训练，以及通过模拟场景进行的预训练增强；

5、s3：持续优化和更新机制，在车载系统中持续收集数据，并通过云端服务器上的大模型进行不断优化和参数更新，至少包括模型后续优化，所述模型后续优化过程至少包括云端数据收集、模型优化和新模型量化评估，所述模型后续优化针对整个交互场景下的所有用户进行的统一改进；

6、s4：云端和车载系统间的交互，利用云端的高能力模型与车载的轻量级学生模型进行对比和优化。

7、所述模型的双阶段预训练至少包括初次预训练和预训练增强；

8、所述初次预训练采用t5模型作为基础模型，通过使用公用的情绪识别数据集和意图识别数据集对该模型进行初次预训练，所述预训练增强用于对初次预训练进行进一步的增强。

9、优选的，所述初次预训练至少包括以下步骤：

10、首先，将收集并整理大量的文本数据，包括各种语言和领域的数据，构建一个大规模的语料库；

11、所述语料库包含各种不同类型的文本，至少包括新闻文章、社交媒体帖子、产品评论和对话；

12、随后，使用语料库中的数据对t5模型进行预训练，以便让模型学习到从文本中提取情绪和意图的能力，模型采用交叉熵损失函数作为损失函数，如下公式所示：

13、

14、l(θ)为损失函数本身，通常用l(.)表示，这里用θ表示模型参数，损失函数的目的是衡量模型的性能其中θ表示模型的参数；

15、pdata(x,y)为数据的真实分布，表示给定输入x下，正确标签y的概率；

16、pmodel(y∣x；θ)为模型预测的条件概率分布，表示在模型参数θ下，给定输入x时预测正确标签y的概率；

17、预训练过程就是通过调整θ来最小化损失函数l(θ)；

18、最后，对初次预训练后的模型进行评估和优化，使用标准的评估指标来衡量模型的性能，至少包括准确率、召回率和f1得分，如下公式所示：

19、

20、

21、

22、

23、其中，tp、tn、fp和fn分别代表真正例、真负例、假正例和假负例的数量，根据评估结果，进一步将对模型进行调整和优化，以提高其性能；

24、accuracy为衡量分类器正确预测的比例，即所有正确预测(正类和负类)占所有预测的比例；

25、recision为衡量预测为正类中实际为正类的比例，也称为查准率；

26、recall为衡量实际为正类中被正确预测为正类的比例，也称为查全率或敏感性，是精确率和召回率的调和平均数，用于当我们需要考虑精确率和召回率的平衡时。

27、优选的，所述预训练增强至少包括以下步骤：

28、通过运用两个大型模型，其中之一模拟驾驶者的角色，另一个则负责对驾驶者的请求进行响应；

29、每当驾驶者角色的模型发出请求后，该请求会被同时传递给另一个大型模型和轻量级t5学生模型；

30、两个模型的输出构成一个二元组，所述二元组至少包括情绪状态和关于驾驶需求的用户意图；

31、通过比较大型模型的回答与轻量级t5学生模型的回答，优化了轻量级t5学生模型，通过模拟场景来实现预训练增强的过程；

32、在这个过程中我们没有预训练的pdata(y|x)，而是有一个数据集两个大模型输入和正确输出的例子，在这种情况下，所使用的损失函数如下所示：

33、

34、其中，n为样本的总数；

35、i为索引，用于表示第i个样本；

36、x(i)为表示第i个样本的输入特征；

37、y(i)为表示第i个样本的实际标签；

38、pmodel为模型预测的概率分布函数，它给出了给定输入x和模型参数θ时，预测输出y的概率。

39、并采用如下公式进行最下化损失：

40、

41、其中，α是学习率，是损失函数关于参数θ的梯度；

42、θnew是更新后的模型参数。θold是更新前的模型参数。

43、经过两个阶段的预训练后，模型即可进入部署阶段。

44、优选的，所述模型后续优化至少包括以下步骤：

45、收集驾驶场景下用户的人车交互数据，数据内容包括用户的请求、语音识别的结果、识别后的响应和下一次用户的请求，通过对下一次用户的请求，我们可以对响应结果有一个预测和判断，上一次的响应是否符合用户需求本文档来自技高网...

【技术保护点】

1.一种基于轻量化大模型的辅助人车交互的控制方法，其特征在于：至少包括以下步骤：

2.根据权利要求1所述的一种基于轻量化大模型的辅助人车交互的控制方法，其特征在于：所述模型的双阶段预训练至少包括初次预训练和预训练增强；

3.根据权利要求2所述的一种基于轻量化大模型的辅助人车交互的控制方法，其特征在于：所述初次预训练至少包括以下步骤：

4.根据权利要求3所述的一种基于轻量化大模型的辅助人车交互的控制方法，其特征在于：所述预训练增强至少包括以下步骤：

5.根据权利要求1所述的一种基于轻量化大模型的辅助人车交互的控制方法，其特征在于：所述模型后续优化至少包括以下步骤：

6.根据权利要求1所述的一种基于轻量化大模型的辅助人车交互的控制方法，其特征在于：所述意图识别模块的应用至少包括以下步骤：

7.根据权利要求5所述的一种基于轻量化大模型的辅助人车交互的控制方法，其特征在于：所述模型推断过程如下：

【技术特征摘要】

1.一种基于轻量化大模型的辅助人车交互的控制方法，其特征在于：至少包括以下步骤：

2.根据权利要求1所述的一种基于轻量化大模型的辅助人车交互的控制方法，其特征在于：所述模型的双阶段预训练至少包括初次预训练和预训练增强；

3.根据权利要求2所述的一种基于轻量化大模型的辅助人车交互的控制方法，其特征在于：所述初次预训练至少包括以下步骤：

4.根据权利要求3所述的一种基于轻量化大模型的辅助人车交互的控制...

【专利技术属性】
技术研发人员：邢欣来，周恕冉，张小川，
申请(专利权)人：重庆理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人