基于车内语音交互模式的多媒体数据推荐方法及装置制造方法及图纸

技术编号：40957095 阅读：35 留言：0更新日期：2024-04-18 20:34

公开了一种基于车内语音交互模式的多媒体数据推荐方法及装置。其首先对用户的语音指令进行语音识别并进行基于词粒度的语义分析以得到用户语音指令语义理解特征向量，接着，对待推送多媒体数据的文本描述进行基于词粒度的语义分析以得到待推送多媒体数据文本描述词粒度语义编码特征向量的序列，然后，对所述用户语音指令语义理解特征向量和所述待推送多媒体数据文本描述词粒度语义编码特征向量的序列进行语义交互匹配分析并基于得到的用户语音意图‑待推送多媒体语义交互匹配表达特征确定待推送多媒体的匹配度是否超过预定阈值。这样，可以提供给驾驶员更高效和便捷的多媒体数据交互体验，同时保证用户的驾驶安全。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及智能化推荐领域，且更为具体地，涉及一种基于车内语音交互模式的多媒体数据推荐方法及装置。

技术介绍

1、随着车载设备的智能化和多媒体数据的丰富化，车内用户对于多媒体数据的需求和消费也越来越多样化。例如，用户可能想要根据自己的心情、喜好、场景等因素选择不同类型的音乐、视频、新闻等多媒体数据。然而，传统的车载多媒体系统通常通过触摸屏、物理按钮或简单的语音识别进行操作，并基于用户的历史行为或者人工标注的元数据来进行多媒体数据的推荐。但这种基于手动操作或者简单的语音控制的多媒体数据推荐方法，常常需要经过多次的输入调整和用户选择来实现准确地多媒体数据推荐，不仅在驾驶过程中会分散驾驶员的注意力，增加驾驶风险，还往往无法及时捕捉用户的实时需求和偏好，不能满足用户的个性化需求。同时，也无法适应车内语音交互模式，不能提供高效和便捷的交互体验。

2、因此，期望一种优化的基于车内语音交互模式的多媒体数据推荐方案。

技术实现思路

1、为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种基于车内语音交互模式的多媒体数据推荐方法及装置，其可以基于用户的语音指令来控制车载多媒体系统自动推荐适配的多媒体数据给用户，进而提供给驾驶员更高效和便捷的多媒体数据交互体验，同时保证用户的驾驶安全。

2、根据本申请的一个方面，提供了一种基于车内语音交互模式的多媒体数据推荐方法，其包括：

3、通过车载设备采集用户的语音指令；

4、对所述用户的语音指令进行语音识别以

5、对所述用户语音指令语音识别结果进行基于词粒度的语义分析以得到用户语音指令语义理解特征向量；

6、获取待推送多媒体数据的文本描述；

7、对所述待推送多媒体数据的文本描述进行基于词粒度的语义分析以得到待推送多媒体数据文本描述词粒度语义编码特征向量的序列；

8、对所述用户语音指令语义理解特征向量和所述待推送多媒体数据文本描述词粒度语义编码特征向量的序列进行语义交互匹配分析以得到用户语音意图-待推送多媒体语义交互匹配表达特征；以及

9、基于所述用户语音意图-待推送多媒体语义交互匹配表达特征，确定待推送多媒体的匹配度是否超过预定阈值。

10、根据本申请的另一个方面，提供了一种基于车内语音交互模式的多媒体数据推荐装置，其包括：

11、语音指令采集模块，用于通过车载设备采集用户的语音指令；

12、语音识别模块，用于对所述用户的语音指令进行语音识别以得到用户语音指令语音识别结果；

13、语音指令语义分析模块，用于对所述用户语音指令语音识别结果进行基于词粒度的语义分析以得到用户语音指令语义理解特征向量；

14、文本描述获取模块，用于获取待推送多媒体数据的文本描述；

15、文本描述语义分析模块，用于对所述待推送多媒体数据的文本描述进行基于词粒度的语义分析以得到待推送多媒体数据文本描述词粒度语义编码特征向量的序列；

16、语义交互匹配分析模块，用于对所述用户语音指令语义理解特征向量和所述待推送多媒体数据文本描述词粒度语义编码特征向量的序列进行语义交互匹配分析以得到用户语音意图-待推送多媒体语义交互匹配表达特征；以及

17、匹配度分析模块，用于基于所述用户语音意图-待推送多媒体语义交互匹配表达特征，确定待推送多媒体的匹配度是否超过预定阈值。

18、与现有技术相比，本申请提供的基于车内语音交互模式的多媒体数据推荐方法及装置，其首先对用户的语音指令进行语音识别并进行基于词粒度的语义分析以得到用户语音指令语义理解特征向量，接着，对待推送多媒体数据的文本描述进行基于词粒度的语义分析以得到待推送多媒体数据文本描述词粒度语义编码特征向量的序列，然后，对所述用户语音指令语义理解特征向量和所述待推送多媒体数据文本描述词粒度语义编码特征向量的序列进行语义交互匹配分析并基于得到的用户语音意图-待推送多媒体语义交互匹配表达特征确定待推送多媒体的匹配度是否超过预定阈值。这样，可以提供给驾驶员更高效和便捷的多媒体数据交互体验，同时保证用户的驾驶安全。

本文档来自技高网...

【技术保护点】

1.一种基于车内语音交互模式的多媒体数据推荐方法，其特征在于，包括：

2.根据权利要求1所述的基于车内语音交互模式的多媒体数据推荐方法，其特征在于，对所述用户语音指令语音识别结果进行基于词粒度的语义分析以得到用户语音指令语义理解特征向量，包括：

3.根据权利要求2所述的基于车内语音交互模式的多媒体数据推荐方法，其特征在于，对所述待推送多媒体数据的文本描述进行基于词粒度的语义分析以得到待推送多媒体数据文本描述词粒度语义编码特征向量的序列，包括：

4.根据权利要求3所述的基于车内语音交互模式的多媒体数据推荐方法，其特征在于，对所述用户语音指令语义理解特征向量和所述待推送多媒体数据文本描述词粒度语义编码特征向量的序列进行语义交互匹配分析以得到用户语音意图-待推送多媒体语义交互匹配表达特征，包括：

5.根据权利要求4所述的基于车内语音交互模式的多媒体数据推荐方法，其特征在于，使用语义交互匹配模块对所述用户语音指令语义理解特征向量和所述待推送多媒体数据文本描述词粒度语义编码特征向量的序列进行语义交互匹配处理以得到用户语音意图-待推送多媒体语义

6.根据权利要求5所述的基于车内语音交互模式的多媒体数据推荐方法，其特征在于，基于所述用户语音意图-待推送多媒体语义交互匹配表达特征，确定待推送多媒体的匹配度是否超过预定阈值，包括：

7.根据权利要求6所述的基于车内语音交互模式的多媒体数据推荐方法，其特征在于，还包括训练步骤：用于对所述包含词嵌入层的语音指令语义理解器、所述包含词嵌入层的多媒体数据语义编码器、所述语义交互匹配模块和所述分类器进行训练。

8.根据权利要求7所述的基于车内语音交互模式的多媒体数据推荐方法，其特征在于，所述训练步骤，包括：

9.一种基于车内语音交互模式的多媒体数据推荐装置，其特征在于，包括：

10.根据权利要求9所述的基于车内语音交互模式的多媒体数据推荐装置，其特征在于，所述语音指令语义分析模块，用于：

...

【技术特征摘要】

1.一种基于车内语音交互模式的多媒体数据推荐方法，其特征在于，包括：

5.根据权利要求4所述的基于车内语音交互模式的多媒体数据推荐方法，其特征在于，使用语义交互匹配模块对所述用户语音指令语义理解特征向量和所述待推送多媒体数据文本描述词粒...

【专利技术属性】
技术研发人员：俞志海，
申请(专利权)人：宁波凯普电子有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人