一种语音交互玩具,包括语音采集模块、处理模块、播放模块和文件存储模块;所述语音采集模块,与所述处理模块连接,用于获取用户的语音信号,将语音信号发送至处理模块;所述处理模块,用于对接收到的语音信号进行分析处理,根据处理结果在互动文件中查找对应的回复信息,并将所述回复信息发送至所述播放模块进行播放;所述播放模块,与所述处理模块连接,用于对所述回复信息进行播放;所述升级文件存储模块,与所述处理模块连接,用于存储升级文件。本发明专利技术公开的语音交互玩具,互动性强,而且容易升级。
【技术实现步骤摘要】
一种语音交互玩具
本专利技术涉及智能玩具领域,特别是一种语音交互玩具。
技术介绍
目前,在玩具市场中,能够发声的儿童玩具开始受到欢迎。然而,这些有声玩具大多数只能播放一些预先录制的声音和音乐,无法与儿童进行交流,只有简单的按钮来控制播放,这类儿童玩具仅仅是个有着玩具外形的播放器,功能有限,交互性不强。同时,目前市场上面的大部分语音交互玩具都是不可以升级的。即产品已经出厂了之后,功能就是固定的,没有办法改变。语言识别玩具很多都是用于教学的,通过语音识别和用户互动,用户可以在和玩具互动的过程中获取到一些知识。而获取到的知识是由互动的内容决定的。即如果互动的内容是固定,那么用户获取到的知识也是固定。
技术实现思路
针对上述问题,本专利技术旨在提供一种语音交互玩具。本专利技术的目的采用以下技术方案来实现:一种语音交互玩具,包括语音采集模块、处理模块、播放模块和文件存储模块;所述语音采集模块,与所述处理模块连接,用于接收用户的语音信号,将语音信号发送至处理模块;所述处理模块,用于对接收到的语音信号进行分析处理,根据处理结果在互动文件中查找对应的回复信息,并将所述回复信息发送至所述播放模块进行播放;所述播放模块,与所述处理模块连接,用于对所述回复信息进行播放;所述升级文件存储模块,与所述处理模块连接,用于存储升级文件。其中,所述对接收到的语音信号进行分析处理,包括:对所述语音信号进行识别处理以获得对应的文字数据;对所述的文字数据进行语义分析处理,并获取处理结果;其中,所述升级文件用于对所述互动文件中对应的部分进行替换,生成新的互动文件。其中,所述处理模块包括存储器,用于存储所述互动文件。本专利技术的有益效果为:本申请可使得用户能够通过玩具进行语音交互,提高了儿童学习的兴趣,家长能根据儿童感兴趣的方面制定交互信息的内容,能够有效地增加儿童获取的知识量。附图说明利用附图对本专利技术作进一步说明,但附图中的实施例不构成对本专利技术的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。图1本专利技术的框架结构图;图2是本专利技术处理模块的框架结构图。附图标记:语音采集模块1、处理模块2、播放模块3、升级文件存储模块4、语义分析单元22、语音处理单元20、语音增强子单元202、有声部分检测子单元204、特征提取子单元206和语音识别子单元208具体实施方式结合以下应用场景对本专利技术作进一步描述。一种语音交互玩具,参见图1,包括语音采集模块1、处理模块2、播放模块3和文件存储模块4;所述语音采集模块1,与所述处理模块2连接,用于获取用户的语音信号,将语音信号发送至处理模块2;所述处理模块2,用于对接收到的语音信号进行分析处理,根据处理结果在互动文件中查找对应的回复信息,并将所述回复信息发送至所述播放模块3进行播放;所述播放模块3,与所述处理模块2连接,用于对所述回复信息进行播放;所述升级文件存储模块4,与所述处理模块2连接,用于存储升级文件。进一步地,所述对接收到的语音信号进行分析处理,包括:对所述语音信号进行识别处理以获得对应的文字数据;对所述的文字数据进行语义分析处理,并获取处理结果。进一步地,所述升级文件用于对所述互动文件中对应的部分进行替换,生成新的互动文件。优选地,所述处理模块2包括存储器,用于存储所述互动文件。优选地,参见图2,所述处理模块2还包括语音处理单元20和语义分析单元22,所述语音处理单元20用于对获取到的语音信号进行识别处理;所述语义分析单元22用于对文字数据进行语义分析处理,获取处理结果。优选地,所述语音处理单元20包括依次连接的语音增强子单元202、有声部分检测子单元204、特征提取子单元206和语音识别子单元208,所述语音增强子单元202,用于对获取到的语音信号进行增强处理,获取纯净语音信号;所述有声部分检测子单元204,用于获取纯净语音信号中的有声部分;所述特征提取子单元206用于获取有声部分的语音特征参数;所述语音识别子单元208,用于根据有声部分中每一帧的语音特征参数进行语音识别。本专利技术上述实施例,可使得用户能够通过玩具进行语音交互,提高了儿童学习的兴趣,家长能根据儿童感兴趣的方面制定交互信息的内容,能够有效地增加儿童获取的知识量。优选地,所述语音增强子单元202,用于对获取到的语音信号进行增强处理,消除语音信号中的噪声,获取纯净语音信号,包括:(1)对获取到的语音信号进行分帧、加汉明窗处理,其中帧长为30ms;(2)分别对每一帧获取到的语音信号进行快速傅里叶变换,获取每一帧语音信号的频谱Xn(ejw),其中ejw表示频谱内相应的不同频率,n表示第n帧语音信号;(3)采用自定义噪声估值函数获取噪声的估计,具体为:式中,表示前n帧获得的噪声功率谱统计估计,ejw表示功率谱中相应的频率,其中的初始值|Xn(ejw)|2表示第n帧语音信号的功率谱;由此可得噪声幅度谱的初始平滑估计为即纯净语音信号幅度谱的初始平滑估计为(4)采用自定义纯净语音估值函数,依次获取每一帧语音信号中的纯净语音信号估计,具体为:其中,式中,表示第n帧的纯净语音信号幅度谱估计,ejw表示幅度谱或功率谱中相应的频率,|Xn(ejw)|表示第n帧的语音信号幅度谱,表示第n帧的噪声幅度谱估计,表示第n-1帧的噪声幅度谱的平滑估计,其中ω表示噪声变化速度因子,表示第n-1帧的纯净语音信号幅度谱的平滑估计,其中α表示增强因子,N表示语音信号分帧的总数;(5)对每一帧纯净语音信号估计进行逆傅里叶变换,获取纯净语音信号。本优选实施例,采用上述方法对获取到的语音信号进行增强,先根据语音信号自身的特性快速、准确地估计其中噪声信号的分量,然后采用上述估值函数获取语音信号中纯净的语音信号估计,能够有效、准确地去除噪声分量,增大语音信号的信噪比,提高质量;同时,采用上述方法进行语音增强,能同时对语音信号的无声部分进行除噪声处理,为之后的有声部分检测提供了保证。优选地,所述有声部分检测子单元204,用于获取纯净语音信号中的有声部分,包括:(1)对获取到的纯净语音信号进行分帧、加汉明窗处理,其中帧长为30ms;(2)分别对每一帧纯净语音信号进行快速傅里叶变换,获取每一帧纯净语音信号的频谱X′k(t),t=1,2,…,T,其中t表示t维频谱分量,T表示频谱分量的总维数,k表示第k帧语音信号;(3)采用自定义有声信号判决函数获取每一帧语音信号的有声判决值,具体为:其中,式中,logΛk表示第k帧为语音存在帧的有声判决值,Λk[X′k(t)]表示第k帧语音信号第t维频谱分量的似然比,T表示频谱分量的总维数,εk(t)表示第k帧语音信号的先验信噪比,γk(t)表示第k帧语音信号的后验信噪比,λs,k(t)和λn,k(t)分别表示第k帧纯净语音信号和噪声的第t维频谱分量,|Xk(t)|表示第k帧获取的语音信号第t维频谱分量;(4)若获取的有声判决值logΛk大于判决阈值ηk,则标记该帧为语音存在帧,其中,判决阈值ηk获取函数为:式中,ηk表示第k帧的判决阈值,K表示语音信号分帧的总数,σ表示阈值更新系数,表示第k帧的纯净语音信号幅度谱估计,表示第k帧的噪声幅度谱估计。(5)根据标记的语音存在帧组成纯净语音信号中的有声部分,其余部分记为无声本文档来自技高网...
【技术保护点】
一种语音交互玩具,其特征在于,包括语音采集模块、处理模块、播放模块和文件存储模块;所述语音采集模块,与所述处理模块连接,用于获取用户的语音信号,将语音信号发送至处理模块;所述处理模块,用于对接收到的语音信号进行分析处理,根据处理结果在互动文件中查找对应的回复信息,并将所述回复信息发送至所述播放模块进行播放;所述播放模块,与所述处理模块连接,用于对所述回复信息进行播放;所述升级文件存储模块,与所述处理模块连接,用于存储升级文件。
【技术特征摘要】
1.一种语音交互玩具,其特征在于,包括语音采集模块、处理模块、播放模块和文件存储模块;所述语音采集模块,与所述处理模块连接,用于获取用户的语音信号,将语音信号发送至处理模块;所述处理模块,用于对接收到的语音信号进行分析处理,根据处理结果在互动文件中查找对应的回复信息,并将所述回复信息发送至所述播放模块进行播放;所述播放模块,与所述处理模块连接,用于对所述回复信息进行播放;所述升级文件存储模块,与所述处理模块连接,用于存储升级文件。2.根据权利要求1所述的一种语音交互玩具,其特征在于,所述对接收到的语音信号进行分析处理,包括:对所述语音信号进行识别处理以获得对应的文字数据;对所述的文字数据进行语义分析处理,并获取处理结果。3.根据权利要求2所述的一种语音交互玩具,其特征在于,所述升级文件用于对所述互动文件中对应的部分进行替换,生成新的互动文件。4.根据权利要求3所述的一种语音交互玩具,其特征在于,所述处理模块包括存储器,用于存储所述互动文件。5.根据权利要求1所述的一种语音交互玩具,其特征在于,所述处理模块还包括语音处理单元和语义分析单元,所述语音处理单元用于对获取到的语音信号进行识别处理;所述语义分析单元用于对文字数据进行语义分析处理,获取处理结果。6.根据权利要求5所述的一种语音交互玩具,其特征在于,所述语音处理单元包括依次连接的语音增强子单元、有声部分检测子单元、特征提取子单元和语音识别子单元,所述语音增强子单元,用于对获取到的语音信号进行增强处理,获取纯净语音信号;所述有声部分检测子单元,用于获取纯净语音信号中的有声部分;所述特征提取子单元用于获取有声部分的语音特征参数;所述语音识别子单元,用于根据有声部分中每一帧的语音特征参数进行语音识别。7.根据权利要求6所述的一种语音交互玩具,其特征在于,所述语音增强子单元,用于对获取到的语音信号进行增强处理,消除语音信号中的噪声,获取纯净语音信号,包括:(1)对获取到的语音信号进行分帧、加窗处理;(2)分别对每一帧获取到的语音信号进行快速傅里叶变换,获取每一帧语音信号的频谱Xn(ejw),其中ejw表示频谱内相应的不同频率,n表示第n帧语音信号;(3)采用自定义噪声估值函数获取噪声的估计,具体为:式中,表示前n帧获得的噪声功率谱统计估计,ejw表示功率谱中相应的频率,其中的初始值表示第n帧语音信号的功率谱;由此可得噪声幅度谱的初始平滑估计为即纯净语音信号幅度谱的初始平滑估计为(4)采用自定义纯净语音估值函数,依次获取每一帧语音信号中的纯净语音信号估计,具体为:其中,
【专利技术属性】
技术研发人员:潘金文,
申请(专利权)人:潘金文,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。