推送语音数据的方法、终端、服务器及系统技术方案

技术编号:9240049 阅读:128 留言:0更新日期:2013-10-10 03:45
本发明专利技术公开了一种推送语音数据的方法、终端、服务器及系统,属于多媒体技术领域。方法包括:每隔预设时间获取一次背景噪音数据,并提取背景噪音数据的特征向量;将背景噪音数据的特征向量上传至服务器,由服务器根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据;接收服务器推送的语音数据。本发明专利技术通过获取背景噪音数据,并提取背景噪音数据的特征向量,进而将背景噪音数据的特征向量上传至服务器,由服务器确定特征向量对应的环境类型,并向终端推送与其相对应的语音数据,因此,可实现根据外部环境为用户推送语音数据,从而满足用户不同时间及地点的聆听需求,提高了用户体验。

【技术实现步骤摘要】
推送语音数据的方法、终端、服务器及系统
本专利技术涉及多媒体
,特别涉及一种推送语音数据的方法、终端、服务器及系统。
技术介绍
随着科学技术的飞速发展,越来越多具有语音数据播放功能的终端进入大众的视野。例如,MP3(MovingPictureExpertsGroupAudioLayerIII,运动图像专家组音频层3)播放器、手机及平板电脑等等。用户通过点击终端的物理按键或显示在终端屏幕上的虚拟按键可自由进行语音数据的手动选择。然而,当用户处在相对拥挤的环境或面对无屏幕显示的终端,其不愿或难以进行语音数据的手动选择时,为了提升用户体验及满足用户的聆听需求,如何自动进行语音数据推送,成为了本领域技术人员较为关注的一个问题。
技术实现思路
本专利技术实施例提供了一种推送语音数据的方法、终端、服务器及系统。所述技术方案如下:第一方面,提供了一种推送语音数据的方法,所述方法包括:每隔预设时间获取一次背景噪音数据,并提取所述背景噪音数据的特征向量;将所述背景噪音数据的特征向量上传至服务器,由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型,并向终端推送与所述环境类型相对应的语音数据;接收所述服务器推送的语音数据。较佳地,所述每隔预设时间获取一次背景噪音数据,包括:首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据;非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据;其中,所述第一预设时间长度小于所述第二预设时间长度。较佳地,所述提取所述背景噪音数据的特征向量,包括:对所述背景噪音数据进行解码,得到所述背景噪音数据的声音信号;提取所述声音信号的频谱特征,得到所述声音信号的特征向量。较佳地,所述得到所述背景噪音数据的声音信号之后,所述方法还包括:对得到的所述背景噪声数据的声音信号进行频域变换;所述提取所述声音信号的频谱特征,包括:提取进行频域变换后的所述声音信号的频谱特征。第二方面,提供了一种终端,所述终端包括:获取模块,用于每隔预设时间获取一次背景噪音数据;提取模块,用于提取所述获取模块获取到的背景噪音数据的特征向量;上传模块,用于将所述提取模块提取到的背景噪音数据的特征向量上传至服务器,由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型,并向终端推送与所述环境类型相对应的语音数据;接收模块,用于接收所述服务器推送的语音数据。较佳地,所述获取模块,包括:第一获取单元,用于在首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据;第二获取单元,用于在非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据;其中,所述第一预设时间长度小于所述第二预设时间长度。较佳地,所述提取模块用于对所述背景噪音数据进行解码,得到所述背景噪音数据的声音信号;提取所述声音信号的频谱特征,得到所述声音信号的特征向量。较佳地,所述终端还包括:变换模块,用于对得到的所述背景噪声数据的声音信号进行频域变换;所述提取模块用于提取进行频域变换后的所述声音信号的频谱特征。第三方面,还提供了一种推送语音数据的方法,所述方法包括:接收终端上传的背景噪音数据的特征向量;根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型;向所述终端推送与所述环境类型相对应的语音数据。较佳地,所述根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型之前,所述方法还包括:设置特征向量与环境类型的对应关系表,并将所述特征向量与环境类型的对应关系表进行存储;根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型,包括:根据所述背景噪音数据的特征向量查找所述特征向量与环境类型的对应关系表,获取所述背景噪音数据的特征向量对应的环境类型。较佳地,所述向所述终端推送与所述环境类型相对应的语音数据之前,所述方法还包括:设置环境类型与语音数据类型的对应关系;根据所述环境类型与语音数据类型的对应关系确定所述环境类型对应的语音数据类型;所述向所述终端推送与所述环境类型相对应的语音数据,包括:向所述终端推送与所述语音数据类型对应的语音数据。第四方面,提供了一种服务器,所述服务器包括:接收模块,用于接收终端上传的背景噪音数据的特征向量;第一确定模块,用于根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型;推送模块,用于向所述终端推送与所述环境类型相对应的语音数据。较佳地,所述服务器还包括:第一设置模块,用于设置特征向量与环境类型的对应关系表;存储模块,用于将所述第一设置模块设置的特征向量与环境类型的对应关系表进行存储;所述第一确定模块,包括:查找单元,用于根据所述背景噪音数据的特征向量查找所述特征向量与环境类型的对应关系表;获取单元,用于获取所述背景噪音数据的特征向量对应的环境类型。较佳地,所述服务器还包括:第二设置模块,用于设置环境类型与语音数据类型的对应关系;第二确定模块,用于根据所述第二设置模块设置的环境类型与语音数据类型的对应关系确定所述环境类型对应的语音数据类型;所述推送模块,用于向所述终端推送与所述语音数据类型对应的语音数据。第五方面,提供了一种推送语音数据的系统,所述系统包括:终端及服务器;其中,终端如上面所述的终端;所述服务器如上面所述的服务器。本专利技术技术方案带来的有益效果是:终端通过每隔预设时间获取一次背景噪音数据,并提取背景噪音数据的特征向量,进而将背景噪音数据的特征向量上传至服务器,由服务器根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据。因此,可实现自动根据外部环境为用户推送语音数据,从而满足用户不同时间及地点的聆听需求,提高了用户体验。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一提供的一种推送语音数据的方法流程图;图2是本专利技术实施例一提供的另一种推送语音数据的方法流程图;图3是本专利技术实施例二提供的一种推送语音数据的方法流程图;图4是本专利技术实施例三提供的一种终端的结构示意图;图5是本专利技术实施例三提供的一种获取模块的内部结构示意图;图6是本专利技术实施例三提供的另一种终端的结构示意图;图7是本专利技术实施例四提供的一种服务器的结构示意图;图8是本专利技术实施例四提供的另一种服务器的结构示意图;图9是本专利技术实施例四提供的一种第一确定模块的内部结构示意图;图10是本专利技术实施例四提供的又一种服务器的结构示意图;图11是本专利技术实施例五提供的一种推送语音数据的系统结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作较佳地详细描述。实施例一本专利技术实施例提供了一种推送语音数据的方法,以终端执行该方法的角度为例,参见图1,对本专利技术实施例提供的方法流程包括:101:每隔预设时间获取一次背景噪本文档来自技高网...
推送语音数据的方法、终端、服务器及系统

【技术保护点】
一种推送语音数据的方法,其特征在于,所述方法包括:每隔预设时间获取一次背景噪音数据,并提取所述背景噪音数据的特征向量;将所述背景噪音数据的特征向量上传至服务器,由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型,并向终端推送与所述环境类型相对应的语音数据;接收所述服务器推送的语音数据。

【技术特征摘要】
1.一种推送语音数据的方法,其特征在于,所述方法包括:每隔预设时间获取一次背景噪音数据,并对所述背景噪音数据进行解码,得到所述背景噪音数据的声音信号,提取所述声音信号的频谱特征,得到所述声音信号的特征向量;将所述背景噪音数据的特征向量上传至服务器,由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型,并向终端推送与所述环境类型和用户的喜好语音数据类型相对应的语音数据,所述喜好语音数据类型由所述服务器根据所述用户收听过的历史语音数据统计得到,所述对应关系是利用支持向量机机器学习方法进行机器学习后得到的;接收所述服务器推送的语音数据;其中,所述每隔预设时间获取一次背景噪音数据,包括:首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据;非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据;其中,所述第一预设时间长度小于所述第二预设时间长度。2.根据权利要求1所述的方法,其特征在于,所述得到所述背景噪音数据的声音信号之后,所述方法还包括:对得到的所述背景噪音数据的声音信号进行频域变换;所述提取所述声音信号的频谱特征,包括:提取进行频域变换后的所述声音信号的频谱特征。3.一种推送语音数据的终端,其特征在于,所述终端包括:获取模块,用于每隔预设时间获取一次背景噪音数据;提取模块,用于提取所述获取模块获取到的背景噪音数据的特征向量;上传模块,用于将所述提取模块提取到的背景噪音数据的特征向量上传至服务器,由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型,并向终端推送与所述环境类型和用户的喜好语音数据类型相对应的语音数据,所述喜好语音数据类型由所述服务器根据所述用户收听过的历史语音数据统计得到,所述对应关系是利用支持向量机机器学习方法进行机器学习后得到的;其中,所述获取模块,包括:第一获取单元,用于在首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据;第二获取单元,用于在非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据;其中,所述第一预设时间长度小于所述第二预设时间长度;所述提取模块用于对所述背景噪音数据进行解码,得到所述背景噪音数据的声音信号;提取所述声音信号的频谱特征,得到所述声音信号的特征向量。4.根据权利要求3所述的终端,其特征在于,所述终端还包括:变换模块,用于对得到的所述背景噪音数据的声音信号进行频域变换;所述提取模块用于提取进行频域变换后的所述声音信号的频谱特征。5.一种推送语音数据的方法,其特征在于,所述方法包括:接收终端上传的背景噪音数据的特征向量,所述终端在首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据,在非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据,所述第一预设时间长度小于所述第二预设时间长度,所述特征向量是由所述终端在对所述背景噪音数据进行解码,得到所述背景噪音数据的声音信号后,再提取所述声音信号的频谱特征得到的;根据预先存储的特征向量与环境类型...

【专利技术属性】
技术研发人员:郭涛蔡经伟刘伟
申请(专利权)人:北京小米科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1