获取语义的方法、装置、设备及存储介质制造方法及图纸

技术编号:38590499 阅读:17 留言:0更新日期:2023-08-26 23:30
本申请公开了一种获取语义的方法、装置、设备及存储介质,属于互联网技术领域。该方法获取输入的目标语音数据;在对目标语音数据进行语音识别的过程中,识别目标语音数据对应的目标标签和文本,并将识别得到的文本表示为第一字向量;获取第一字向量与多个第二字向量中的各个第二字向量之间的相似度,多个第二字向量是通过对多个历史语音数据分别进行语音识别得到的,多个历史语音数据分别对应的标签包括目标标签中的至少一个标签;确定多个第二字向量中与第一字向量的相似度最大的目标字向量;基于目标字向量对应的语义获取目标语音数据的语义。该方法能够在提高语义获取的响应速度的基础上,保证语义获取的准确性。保证语义获取的准确性。保证语义获取的准确性。

【技术实现步骤摘要】
获取语义的方法、装置、设备及存储介质


[0001]本申请涉及互联网
,特别涉及一种获取语义的方法、装置、设备及存储介质。

技术介绍

[0002]NLU(Natural Language Understanding,自然语言理解)是所有支持机器理解文本内容的方法模型或任务的总称,能够实现人机之间的自然语言通信。例如,通过NLU实现查询资料、解答问题、摘录文献、汇编资料等有关自然语言信息的加工处理。
[0003]相关技术中,在人机交互过程中,需要对用户的语音数据进行ASR(Automatic Speech Recognition,自动语音识别)处理,在ASR处理结束之后,将识别得到的文本送入NLU引擎。NLU引擎首先对文本进行断句、分词等处理,将文本切割为一系列具有语义、语法的单元;然后,使用词向量空间模型、分布式表示模型等等文本表示模型,将具有语义、语法的单元表示为数值向量或者矩阵;最后,使用分类算法、序列标注方法等计算数值向量或者矩阵中的关键信息,基于关键信息得到文本对应的语义。
[0004]由于用户的语音数据需要在ASR处理结束后送入NLU引擎,且NLU引擎需要通过断句、分词等处理获取语义,使得NLU引擎获取语义的响应速度较慢。

技术实现思路

[0005]本申请提供了一种获取语义的方法、装置、设备及存储介质,能够解决相关技术中的问题。
[0006]第一方面,提供一种获取语义的方法,所述方法包括:
[0007]获取输入的目标语音数据;
[0008]在对所述目标语音数据进行语音识别的过程中,识别所述目标语音数据对应的目标标签和文本,并将识别得到的文本表示为第一字向量,所述识别得到的文本为所述目标语音数据对应的部分文本或全部文本,所述目标标签指示所述目标语音数据对应的用户群体特征;
[0009]获取所述第一字向量与多个第二字向量中的各个第二字向量之间的相似度,所述多个第二字向量是通过对多个历史语音数据分别进行语音识别得到的,所述多个第二字向量中的任一第二字向量与所述第一字向量的维度相同,所述多个第二字向量分别包括对应的语义,所述多个历史语音数据分别对应的标签包括所述目标标签中的至少一个标签;
[0010]确定所述多个第二字向量中与所述第一字向量的相似度最大的目标字向量;
[0011]基于所述目标字向量对应的语义获取所述目标语音数据的语义。
[0012]在一种可能的实施方式中,所述目标语音数据的全部文本为第一文本,所述目标字向量对应的历史语音数据的全部文本为第二文本,所述第一文本的内容少于所述第二文本。
[0013]在一种可能的实施方式中,所述获取所述第一字向量与多个第二字向量中的各个
第二字向量之间的相似度之前,还包括:
[0014]通过埋点对历史语音输入行为进行数据采集,得到埋点数据,所述埋点数据包括所述多个历史语音数据以及各个历史语音数据对应的处理结果;
[0015]对所述埋点数据中处理结果为成功的N个历史语音数据进行语音识别,得到所述N个历史语音数据分别对应的文本和标签,所述N为正整数;
[0016]基于所述N个历史语音数据分别对应的文本和标签,获取所述多个第二字向量。
[0017]在一种可能的实施方式中,所述基于所述N个历史语音数据分别对应的文本和标签,获取所述多个第二字向量,包括:
[0018]在所述N个历史语音数据中获取标签包括所述目标标签中的至少一个标签的M个历史语音数据,所述M为小于N的正整数;
[0019]获取所述M个历史语音数据中重复出现的次数满足次数条件的P个历史语音数据,所述P为正整数;
[0020]将所述P个历史语音数据分别对应的文本表示为所述多个第二字向量,将所述P个历史语音数据分别对应的语义作为所述多个第二字向量分别对应的语义。
[0021]在一种可能的实施方式中,所述获取所述第一字向量与多个第二字向量中的各个第二字向量之间的相似度之前,还包括:
[0022]获取所述目标语音数据对应的环境信息,所述环境信息包括输入时间、输入地点或输入场景中的至少一种,所述多个历史语音数据为基于所述环境信息获取得到的;
[0023]所述通过埋点对历史语音输入行为进行数据采集,得到埋点数据,包括:
[0024]通过埋点对所述环境信息下的历史语音输入行为进行数据采集,得到所述环境信息对应的埋点数据。
[0025]在一种可能的实施方式中,所述获取所述第一字向量与多个第二字向量中的各个第二字向量之间的相似度,包括:
[0026]基于第一深度神经网络分别对所述第一字向量与所述多个第二字向量进行语义特征提取,得到所述第一字向量对应的第一语义向量,以及所述多个第二字向量分别对应的第二语义向量,所述第二语义向量与所述第一语义向量的维度相同,所述第一语义向量的维度小于所述第一字向量的维度;
[0027]获取所述第一语义向量与各个第二语义向量之间的余弦相似度,得到所述第一字向量分别与多个第二字向量之间的相似度。
[0028]在一种可能的实施方式中,所述基于所述目标字向量对应的语义获取所述目标语音数据的语义,包括:
[0029]基于第二深度神经网络获取所述目标语音数据对应的情感语义;
[0030]获取将所述目标字向量对应的语义与所述情感语义进行结合后的组合语义,将所述组合语义作为所述目标语音数据的语义。
[0031]第二方面,提供了一种获取语义的装置,所述装置包括:
[0032]第一获取模块,用于获取输入的目标语音数据;
[0033]识别表示模块,用于在对所述目标语音数据进行语音识别的过程中,识别所述目标语音数据对应的目标标签和文本,并将识别得到的文本表示为第一字向量,所述识别得到的文本为所述目标语音数据对应的部分文本或全部文本,所述目标标签指示所述目标语
音数据对应的用户群体特征;
[0034]第二获取模块,用于获取所述第一字向量与多个第二字向量中的各个第二字向量之间的相似度,所述多个第二字向量是通过对多个历史语音数据分别进行语音识别得到的,所述多个第二字向量中的任一第二字向量与所述第一字向量的维度相同,所述多个第二字向量分别包括对应的语义,所述多个历史语音数据分别对应的标签包括所述目标标签中的至少一个标签;
[0035]确定模块,用于确定所述多个第二字向量中与所述第一字向量的相似度最大的目标字向量;
[0036]第二获取模块,还用于基于所述目标字向量对应的语义获取所述目标语音数据的语义。
[0037]在一种可能的实施方式中,所述目标语音数据的全部文本为第一文本,所述目标字向量对应的历史语音数据的全部文本为第二文本,所述第一文本的内容少于所述第二文本。
[0038]在一种可能的实施方式中,所述装置还包括:
[0039]采集模块,用于通过埋点对历史语音输入行为进行数据采集,得到埋点数据,所述埋点数据包括所述多个历史语音数据以及各个历史语音数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种获取语义的方法,其特征在于,所述方法包括:获取输入的目标语音数据;在对所述目标语音数据进行语音识别的过程中,识别所述目标语音数据对应的目标标签和文本,并将识别得到的文本表示为第一字向量,所述识别得到的文本为所述目标语音数据对应的部分文本或全部文本,所述目标标签指示所述目标语音数据对应的用户群体特征;获取所述第一字向量与多个第二字向量中的各个第二字向量之间的相似度,所述多个第二字向量是通过对多个历史语音数据分别进行语音识别得到的,所述多个第二字向量中的任一第二字向量与所述第一字向量的维度相同,所述多个第二字向量分别包括对应的语义,所述多个历史语音数据分别对应的标签包括所述目标标签中的至少一个标签;确定所述多个第二字向量中与所述第一字向量的相似度最大的目标字向量;基于所述目标字向量对应的语义获取所述目标语音数据的语义。2.根据权利要求1所述的方法,其特征在于,所述目标语音数据的全部文本为第一文本,所述目标字向量对应的历史语音数据的全部文本为第二文本,所述第一文本的内容少于所述第二文本。3.根据权利要求1所述的方法,其特征在于,所述获取所述第一字向量与多个第二字向量中的各个第二字向量之间的相似度之前,还包括:通过埋点对历史语音输入行为进行数据采集,得到埋点数据,所述埋点数据包括所述多个历史语音数据以及各个历史语音数据对应的处理结果;对所述埋点数据中处理结果为成功的N个历史语音数据进行语音识别,得到所述N个历史语音数据分别对应的文本和标签,所述N为正整数;基于所述N个历史语音数据分别对应的文本和标签,获取所述多个第二字向量。4.根据权利要求3所述的方法,其特征在于,所述基于所述N个历史语音数据分别对应的文本和标签,获取所述多个第二字向量,包括:在所述N个历史语音数据中获取标签包括所述目标标签中的至少一个标签的M个历史语音数据,所述M为小于N的正整数;获取所述M个历史语音数据中重复出现的次数满足次数条件的P个历史语音数据,所述P为正整数;将所述P个历史语音数据分别对应的文本表示为所述多个第二字向量,将所述P个历史语音数据分别对应的语义作为所述多个第二字向量分别对应的语义。5.根据权利要求3所述的方法,其特征在于,所述获取所述第一字向量与多个第二字向量中的各个第二字向量之间的相似度之前,还包括:获取所述目标语音数据对应的环境信息,所述环境信息包括输入时间、输入地点或输入场景中的至少一种,所述多个历史语音数据为基于所述环境信息获取得到的;所述通过埋点对历史语音输入行为进行数据采集,得到埋点数据,包括:通过埋点对所述环境信...

【专利技术属性】
技术研发人员:任伟王吉
申请(专利权)人:北京梧桐车联科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1