本申请公开了一种语音智能响应的方法、语音智能响应的装置和语音智能响应的系统,涉及智能语音交互的技术领域,包括:通过对采集的唤醒指令声纹进行标签分类得到标签分类声纹并录入,然后根据实时接收到的待识别语音输入获取对应的声纹,接着将获取的待识别语音输入的声纹与预设类别标签中的声纹进行对比分析得到逐步分析结果,对待识别语音输入进行基础语义理解得到语义理解结果,最后对语义理解结果进行对话管理并对待识别用户进行相对应的响应,达到了提高语音智能响应与用户身份的关联性的效果。
【技术实现步骤摘要】
本申请涉及智能语音交互的,尤其涉及一种语音智能响应的方法、语音智能响应的装置和语音智能响应的系统。
技术介绍
1、参照如图1所示的语音助手架构,其包括5大模块。其中,语块分析层(qu层)为基本语义理解,对输入的语音输入做一些公共的基础语义理解,包含实体识别、文本分类、语义角色标注、语义检索、文本改写等。运营干预层主要是用于运营干预,在基础语义之上叠加运营指令。对话管理层(dm层)实现对话管理,这里的对话管理主要包含两个功能:一是会话分发和排序,二是多轮对话。其会利用当前语音输入(query)语义理解的结果、历史上下文、环境上下文来共同决定执行动作(action)和下一个状态。垂类bot层,包含了各个独立的bot(cr),分别处理各自领域的内容。后处理策略层中包含:客户端交互,推荐服务,对话策略等。最后,把得到的技能结果进行封装,得到客户端可以执行的结构体。
2、目前,qu(query chunking,语块分析)层一般会在端侧与云侧分布式部署,在大部分技术方案中,用户唤起设备后,设备会对语音进行第一次处理,将初步处理的结果(包括用户语音及上下文信息)作为语音输入传递给云端,云端系统进行第二次处理,给出回应。一些语音助手已经在qu层、运营干预层,dm层做了一些创新,可以针对用户个性化输入做出回应。
3、但从业务运营实践及专利检索的实践来看,目前技术方案对家庭场景支撑不足。一是通用的训练方案及海量数据,可以解决精准的语义识别,但不能解决不同家庭的问答习惯。二是没有将声纹、家庭角色与用户偏好标签之间建立联系。</p>
技术实现思路
1、本申请的主要目的在于提供一种语音智能响应的方法、语音智能响应的装置和语音智能响应的系统,旨在解决语音智能响应与用户身份的关联性低的技术问题。
2、为实现上述目的,本申请提出一种语音智能响应的方法,包括以下步骤:
3、对采集的预设家庭的唤醒指令声纹进行标签分类得到标签分类声纹并进行存储,所述预设家庭表示待识别用户和对应待识别家庭的集合,所述标签分类用于将唤醒指令声纹与预设类别标签建立映射关系,所述预设类别标签包括响应习惯标签、家庭角色标签和应答优先级标签;
4、对实时接收的待识别家庭的待识别用户的初始待识别语音输入进行预处理得到待识别语音输入,并对得到的待识别语音输入进行数量判定,若为单个待识别语音输入,则直接获取该待识别语音输入的声纹,否则进行应答优先级标签的匹配后获取该待识别语音输入的声纹;
5、将获取的待识别语音输入的声纹与预设类别标签中的声纹进行对比分析得到逐步分析结果,对待识别语音输入进行基础语义理解后得到语义理解结果,所述逐步分析结果包括响应习惯结果、家庭角色结果和应答优先级结果;
6、根据逐步分析结果和预设上下文对语义理解结果进行对话管理并对待识别用户进行相对应的响应。
7、在一实施例中,所述响应习惯标签用于描述预设家庭的问答习惯,所述响应习惯标签包括直接响应和二次确认;
8、所述家庭角色标签表示预设家庭的家庭角色;
9、所述应答优先级标签表示预设家庭设定的应答优先顺序。
10、在一实施例中,所述逐步分析结果的具体获取方法如下:
11、结合响应习惯标签将待识别语音输入的声纹与待识别家庭声纹进行对比分析得到响应习惯评估指数,若满足对应阈值,则判定待识别语音输入与该待识别家庭对应并得到响应习惯结果,所述响应习惯评估指数用于描述待识别语音输入的声纹的家庭匹配程度;
12、结合家庭角色标签将待识别语音输入的声纹与该待识别家庭的待识别用户声纹进行对比分析得到家庭角色评估指数,若满足对应阈值,则判定待识别语音输入与该待识别用户对应并得到家庭角色结果,所述家庭角色评估指数用于描述待识别语音输入的声纹的角色匹配程度;
13、结合应答优先级标签将待识别语音输入的声纹与待识别用户应答优先顺序声纹进行分析得到应答优先级评估指数,并对应答优先级评估指数最高的待识别语音输入进行优先响应得到应答优先级结果,所述应答优先级评估指数用于描述待识别语音输入的声纹的应答优先顺序匹配程度;
14、所述逐步分析结果包括响应习惯结果、家庭角色结果和应答优先级结果。
15、在一实施例中,所述响应习惯评估指数的具体获取方法如下:
16、获取预设家庭中待识别家庭的待识别语音输入的语音交互数据,所述语音交互数据包括语音交互频率、语音交互时长和语音交互准确率;
17、获取语音交互系数,所述语音交互系数用于描述语音交互数据相对于响应习惯评估指数的影响程度,所述语音交互系数包括频率系数、时长系数和准确率系数,所述频率系数表示语音交互频率的方差与语音交互数据总方差的比值,所述时长系数表示语音交互时长的方差与语音交互数据总方差的比值,所述准确率系数表示语音交互准确率的方差与语音交互数据总方差的比值;
18、根据获取的语音交互数据和语音交互系数计算待识别语音输入的声纹的响应习惯评估指数。
19、在一实施例中,所述家庭角色评估指数的具体获取方法如下:
20、获取待识别家庭中待识别用户的待识别语音输入的声纹,从获取的待识别语音输入的声纹中提取待识别语音输入的声纹对应的声纹特征向量,并获取声纹特征向量对应的参考声纹特征向量;
21、根据获取的数据并结合待识别用户的待识别语音输入计算待识别用户的家庭角色评估指数。
22、在一实施例中,所述应答优先级评估指数的具体获取方法如下:
23、对获取的待识别用户的多个待识别语音输入进行语音合并和语音排序,提取语音排序后的待识别语音输入的声纹并获取声纹分数,所述声纹分数表示对待识别语音输入的声纹的优先级评分;
24、根据语音排序的顺序构造水平矩阵并对水平矩阵进行标准化处理,获取水平矩阵中待识别语音输入的声纹的熵值获取待识别语音输入的声纹的熵权;
25、根据获取的声纹分数和待识别语音输入的声纹的熵权得到应答优先级评估指数。
26、在一实施例中,所述对话管理包括会话分配和多轮对话;
27、所述会话分配包括会话分发和会话排序,所述会话分发表示将待识别语音输入进行分发并获取相对应的响应,所述会话排序用于通过响应优先级标签对待识别语音输入进行重新排序。
28、在一实施例中,所述对待识别用户进行相对应的响应之后还包括以下步骤:
29、在待识别用户得到响应后,将待识别用户及对应的预设类别标签进行存储。
30、此外,为实现上述目的,本申请还提出一种采用上述任意一项所述的语音智能响应的方法的装置,包括声传感器、存储器和响应引擎;
31、所述声传感器用于采集唤醒指令声纹、初始待识别语音输入和待识别语音输入的声纹;
32、所述存储器用于存储预设类别标签、录入的标签分类声纹和待识别语音输入的语音交互数据;
33、所述响应引擎用于根据逐本文档来自技高网
...
【技术保护点】
1.一种语音智能响应的方法,其特征在于,包括以下步骤:
2.如权利要求1所述一种语音智能响应的方法,其特征在于:所述响应习惯标签用于描述预设家庭的问答习惯,所述响应习惯标签包括直接响应和二次确认;
3.如权利要求1所述一种语音智能响应的方法,其特征在于,所述逐步分析结果的具体获取方法如下:
4.如权利要求3所述一种语音智能响应的方法,其特征在于,所述响应习惯评估指数的具体获取方法如下:
5.如权利要求4所述一种语音智能响应的方法,其特征在于,所述家庭角色评估指数的具体获取方法如下:
6.如权利要求4所述一种语音智能响应的方法,其特征在于,所述应答优先级评估指数的具体获取方法如下:
7.如权利要求1所述一种语音智能响应的方法,其特征在于,所述对话管理包括会话分配和多轮对话;
8.如权利要求1所述一种语音智能响应的方法,其特征在于,所述对待识别用户进行相对应的响应之后还包括以下步骤:
9.一种采用权利要求1至8中任意一项所述的语音智能响应的方法的装置,其特征在于,包括声传感器、存储器和响应引擎;
10.一种语音智能响应的系统,其特征在于,所述语音智能响应系统包括:标签分类模块、数量判定模块、结果获取模块和对话响应模块;
...
【技术特征摘要】
1.一种语音智能响应的方法,其特征在于,包括以下步骤:
2.如权利要求1所述一种语音智能响应的方法,其特征在于:所述响应习惯标签用于描述预设家庭的问答习惯,所述响应习惯标签包括直接响应和二次确认;
3.如权利要求1所述一种语音智能响应的方法,其特征在于,所述逐步分析结果的具体获取方法如下:
4.如权利要求3所述一种语音智能响应的方法,其特征在于,所述响应习惯评估指数的具体获取方法如下:
5.如权利要求4所述一种语音智能响应的方法,其特征在于,所述家庭角色评估指数的具体获取方法如下:
6.如权利要求4所述一...
【专利技术属性】
技术研发人员:徐杰,孙鸽,杜明辉,汤益华,于征,蒋云,
申请(专利权)人:中移动金融科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。