智能语音助手的持续学习方法、装置、电子设备及介质制造方法及图纸

技术编号:36022732 阅读:26 留言:0更新日期:2022-12-21 10:19
本公开提供了一种智能语音助手的持续学习方法、装置、电子设备及存储介质,涉及人工智能以及语音技术等技术领域。具体实现方案为:获取用户的语音输入信息;获取智能语音助手基于所述用户的语音输入信息进行响应后,所述用户的反馈信息;基于所述用户的反馈信息,控制所述智能语音助手进行学习。本公开的技术,能够有效地提升智能语音助手的持续学习能力,优化和提升智能语音助手的性能。化和提升智能语音助手的性能。化和提升智能语音助手的性能。

【技术实现步骤摘要】
智能语音助手的持续学习方法、装置、电子设备及介质


[0001]本公开涉及计算机
,具体涉及人工智能以及语音技术等
,尤其涉及一种智能语音助手的持续学习方法、装置、电子设备及介质。

技术介绍

[0002]移动地图已经成为用户寻找最佳出行路线和获取导航服务必不可少的工具。目前智能手机提供的应用(application;app)交互的主流方式仍然是视觉+手动交互。用户通过手持操作和图形用户界面(Graphical User Interface;GUI)上的多点触摸手势控制来执行各种命令。然而,对于移动地图app来说,大量的交互场景发生在用户驾车过程中,视觉+手动的交互方式非常容易导致驾驶员分心。相关的研究表明,在驾驶过程中用手机执行视觉+手动操作会显著降低驾驶员的驾驶性能,并增加安全事件风险。
[0003]为了让用户能在驾车过程中方便且安全的进行导航操作,该领域中开发了一种智能语音助手,能够对移动地图用户的语音进行自动识别;并进一步基于语音识别的结果,进行自然语言理解;进而基于自然语言理解的结果,调取相应的技能,响应用户,实现为用户提供服务。整个过程,不用用户手动交互,能够有效地提升行车的安全性。

技术实现思路

[0004]本公开提供了一种智能语音助手的持续方法、装置、电子设备及介质。
[0005]根据本公开的一方面,提供了一种智能语音助手的持续学习方法,包括:
[0006]获取用户的语音输入信息;
[0007]获取智能语音助手基于所述用户的语音输入信息进行响应后,所述用户的反馈信息;
[0008]基于所述用户的反馈信息,控制所述智能语音助手进行学习。
[0009]根据本公开的另一方面,提供了一种智能语音助手的持续学习装置,包括:
[0010]获取模块,用于获取用户的语音输入信息;
[0011]所述获取模块,还用于获取智能语音助手基于所述用户的语音输入信息进行响应后,所述用户的反馈信息;
[0012]学习模块,用于基于所述用户的反馈信息,控制所述智能语音助手进行学习。
[0013]根据本公开的再一方面,提供了一种电子设备,包括:
[0014]至少一个处理器;以及
[0015]与所述至少一个处理器通信连接的存储器;其中,
[0016]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方面和任一可能的实现方式的方法。
[0017]根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方面和任一可能的实现方式的方
法。
[0018]根据本公开的再另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方面和任一可能的实现方式的方法。
[0019]根据本公开的技术,能够有效地提升智能语音助手的持续学习能力,优化和提升智能语音助手的性能。
[0020]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0021]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0022]图1是根据本公开第一实施例的示意图;
[0023]图2是根据本公开第二实施例的示意图;
[0024]图3是本实施例提供的一种智能语音助手的架构示意图;
[0025]图4是根据本公开第三实施例的示意图;
[0026]图5是根据本公开第四实施例的示意图;
[0027]图6是根据本公开第五实施例的示意图;
[0028]图7是用来实现本公开实施例的方法的电子设备的框图。
具体实施方式
[0029]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0030]显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
[0031]需要说明的是,本公开实施例中所涉及的终端设备可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)等智能设备;显示设备可以包括但不限于个人电脑、电视等具有显示功能的设备。
[0032]另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0033]现有技术中,可以由研发人员通过市场调研,对智能语音助手的原有功能进行升级,或者也可以通过开发并增加新功能,对其进行升级。整个升级的流程,需要工作人员手动实现,也就是说,现有技术中,仅能够在工作人员主观判断需要对智能语音助手进行升级时,才可以对智能语音助手进行升级,智能语音助手不具备持续学习的能力,导致现有技术的智能语音助手的性能较差。
[0034]图1是根据本公开第一实施例的示意图;如图1所示,本实施例提供一种智能语音
助手的持续学习方法,具体可以包括如下步骤:
[0035]S101、获取用户的语音输入信息;
[0036]S102、获取智能语音助手基于用户的语音输入信息进行响应后,用户的反馈信息;
[0037]S103、基于用户的反馈信息,控制智能语音助手进行学习。
[0038]本实施例的智能语音助手的持续学习方法的执行主体可以为智能语音助手的持续学习装置,该装置可以为电子实体,或者软件集成的应用。使用时,能够控制智能语音助手进行学习。
[0039]本实施例的智能语音助手,可以安装在电子地图等各种应用中,实现基于用户的语音输入,为用户提供服务。
[0040]本实施例中,可以在用户输入语音输入信息后,智能语音助手基于该用户的语音输入信息进行响应。此时,对应地可以获取到用户的反馈信息。例如,用户的反馈信息可以包括用户认可该响应,可以认为用户的请求得到满足。或者用户的反馈信息可以为用户在获取到响应后直接再次发起请求,此时可以认为用户不认可该响应,用户的请求没有得到满足。
[0041]进一步地,在本实施例中,基于用户的反馈信息,有针对性地对智能语音助手进行学习,进而优化智能语音助手的性能;而且随着反馈数据的不断产生,可以按照本实施例的上述步骤,基于反馈信息,控制智能语音助手本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能语音助手的持续学习方法,包括:获取用户的语音输入信息;获取智能语音助手基于所述用户的语音输入信息进行响应后,所述用户的反馈信息;基于所述用户的反馈信息,控制所述智能语音助手进行学习。2.根据权利要求1所述的方法,其中,获取智能语音助手基于所述用户的语音输入信息进行响应后,所述用户的反馈信息之后,基于所述用户的反馈信息,控制所述智能语音助手进行学习之前,所述方法还包括:确定所述用户的反馈信息标识所述用户为正反馈。3.根据权利要求2所述的方法,其中,基于所述用户的反馈信息,控制所述智能语音助手进行学习,包括:基于所述用户的反馈信息,构建自动语音识别模型、自然语言理解模型和/或技能决策模型的第一训练数据;分别基于所述自动语音识别模型、所述自然语言理解模型和/或所述技能决策模型的第一训练数据,相应地对所述智能语音助手中的所述自动语音识别模型、所述自然语言理解模型和/或所述技能决策模型进行训练。4.根据权利要求1所述的方法,其中,获取智能语音助手基于所述用户的语音输入信息进行响应后,所述用户的反馈信息之后,基于所述用户的反馈信息,控制所述智能语音助手进行学习之前,所述方法还包括:确定所述用户的反馈信息标识所述用户为负反馈。5.根据权利要求4所述的方法,其中,确定所述用户的反馈信息标识所述用户为负反馈,包括:获取所述智能语音助手基于所述用户的第一语音输入信息进行响应后,所述用户的第一反馈信息;若所述第一反馈信息标识用户未采纳所述智能语音助手的响应结果,确定所述用户的第一反馈信息为负反馈。6.根据权利要求5所述的方法,其中,基于所述用户的反馈信息,控制所述智能语音助手进行学习,包括:定位所述智能语音助手的学习信息;基于所述学习信息,控制所述智能语音助手进行学习。7.根据权利要求6所述的方法,其中,定位所述智能语音助手的学习信息,包括:获取所述用户在所述第一反馈信息后预设时间长度内输入的第二语音输入信息;获取所述智能语音助手基于所述用户的第二语音输入信息进行响应后,所述用户的第二反馈信息;确定所述第二反馈信息标识用户采纳所述智能语音助手的响应结果;若所述第二语音输入信息和所述第一语音输入信息的语义相似度小于预设相似度阈值,确定所述智能语音助手中的自动语音识别模型、自然语言理解模型或技能决策模型需要学习。8.根据权利要求7所述的方法,其中,确定所述智能语音助手中的自动语音识别模型、自然语言理解模型和/或技能决策模型需要学习,包括:
若所述自动语音识别模型基于所述第一语音输入信息,识别的第一识别结果信息的置信度小于预设置信度阈值,确定所述自动语音识别模型需要学习;若所述自然语言理解模型识别的第一识别信息和第二识别信息不同,确定所述自然语言理解模型需要学习;其中所述第一识别信息为所述自然语言理解模型基于所述第一语音输入信息识别的,所述第二识别信息为所述自然语言理解模型基于所述第二语音输入信息识别的;或若所述技能决策模型决策的第一技能和所述第二技能不同,确定所述技能决策模型需要学习;其中所述第一技能为所述技能决策模型基于所述第一识别信息决策的,所述第二技能为所述技能决策模型基于所述第二识别信息决策的。9.根据权利要求7或8所述的方法,其中,基于所述学习信息,对所述智能语音助手进行学习,包括:基于所述第一语音输入信息和所述第二语音输入信息,构建第二训练数据;基于所述第二训练数据,对所述自动语音识别模型、所述自然语言理解模型或所述技能决策模型进行训练。10.根据权利要求9所述的方法,其中,基于所述第一语音输入信息和所述第二语音输入信息,构建第二训练数据,包括:获取基于所述第一语音输入信息,所述自动语音识别模型、所述自然语言理解模型或者所述技能决策模型对应的第一输入信息;获取基于所述第二语音输入信息,所述自动语音识别模型、所述自然语言理解模型或者所述技能决策模型对应的第二输入信息;获取基于所述第二语音输入信息,所述自动语音识别模型、所述自然语言理解模型或者所述技能决策模型对应的第二输出信息;展示所述第一输入信息、所述第二输入信息以及所述第二输出信息,以供工作人员基于展示的信息,确定所述第一输入信息对应的第一理论输出信息;接收输入的所述第一理论输出信息;基于所述第一输入信息和所述第一理论输出信息,构建所述第二训练数据。11.根据权利要求6所述的方法,其中,定位所述智能语音助手的学习信息,还包括:确定所述自然语言理解模型基于所述第一语音输入信息的输出结果为未识别到信息;确定所述智能语音助手中的自然语言理解策略模板和所述自然语言理解模型需要学习。12.根据权利要求11所述的方法,其中,基于所述学习信息,对所述智能语音助手进行学习,包括:基于所述用户的第一语音输入信息,发出第一报警提示信息,所述第一报警提示信息中携带第一语音识别信息,以提示根据所述自然语言理解策略模板,无法识别所述第一语音识别信息;所述第一语义识别信息为用户输入所述第一语音输入信息时,所述自动语音识别模型识别的语音识别信息;接收所述第一语音识别信息对应的自然语言理解策略;将所述自然语言理解策略存入所述自然语言理解策略模板中。13.根据权利要求11所述的方法,其中,基于所述学习信息,控制所述智能语音助手进
行学习,包括:获取基于所述第一语音输入信息,所述自然语言理解模型对应的第三输入信息;发出携带所述第三输入信息的第二报警提示信息,以提示所述自然语言理解模型无法识别所述第三输入信息;接收输入的所述第三理论输出信息;基于所述第三输入信息和所述第三理论输出信息,构建第三训练数据;基于所述第三训练数据,对所述自然语言理解模型进行训练。14.根据权利要求6所述的方法,其中,定位所述智能语音助手的学习信息,还包括:确定所述技能决策模型输出结果为未决策到相应技能;确定所述智能语音助手中的技能策略需要学习。15.根据权利要求14所述的方法,其中,基于所述学习信息,控制所述智能语音助手进行学习,包括:基于所述用户的第一语音输入信息,发出第三报警提示信息,所述第三报警提示信息中携带所述第一语音输入信息对应的第三识别信息;所述第三识别信息为所述自然语言理解模型基于所述第一语音输入信息识别的;配置所述第三识别信息对应的所述技能策略,以扩充所述智能语音助手能够决策的技能。...

【专利技术属性】
技术研发人员:黄际洲王海峰王少磊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1