本发明专利技术公开了一种基于语音交互的数字楼盘展示系统,包括语音特征提取模块、语音模型与模式匹配模块、控制模块,语音特征提取模块从语音波形中提取随时间变化的语音特征序列,语音模型与模式匹配模块在识别时将未知的语音特征同语音模型进行匹配与比较,计算未知语音的特征矢量序列和每个发音模板之间的距离并对识别结果进行语法、语义分析,控制模块通过语音模型与模式匹配模块输出的结果对计算机系统做出相应的户型展示控制。本发明专利技术具有适应环境能力强、识别率高的效果,能够在连续语音识别中去除语气词并对楼盘展示进行控制,通过语音交互实时展示楼盘的全貌。
【技术实现步骤摘要】
本专利技术语音识别领域,更具体的涉及一种能够语音交互的数字楼盘展示系统。
技术介绍
随着现代科学技术的迅猛发展,信息资源变得越来越重要,通信或信息交换已经 成为人类社会存在的必要条件,同时也成为了未来战场胜负的决定因素,语言是人类区别 于动物所特有的功能,而语音则是语言的语音表现,是人类传递信息最重要,最有效,最方 便的交换信息形式。一些语音识别系统相继问世,语音识别系统的任务就是让机器能够听 懂人类的语言,即通过一定的信号处理算法把人类的语音信号转变为相应的文本,指令或 控制信号,使机器具有与人类一样的听觉功能,能理解说话人的意图并迅速做出反应,从 而实现人机交互。现有技术中的语音交互技术中,从说话者与识别系统的相关性考虑,将语音识别 系统分为W下H类。 1、特定人语音识别系统:特定人语音识别系统用户需要事先对待识别的每一个 词条进行训练,在训练阶段,用户将词汇表中的每一个词依次说数遍,系统将其特征矢量序 列存入模板库中。在识别阶段,系统将输入语音的特征依次与模板库中的每一个模板进行 相似度比较,将相似度最高者作为识别结果输出。特定人识别系统识别的词条数目一般在 100条W下,识别性能随着识别词条数目的增加会有明显的下降,并且在不同的噪声环境 中,W及不同的时间,不同的用户生理、也理状态下,系统的性能都会受到明显的影响。 2、非特定人语音识别系统;非特定人语音识别系统采用基于统计模型的算法,系 统开发者事先采集大量的语音数据进行训练,得到语音模型。在识别阶段,机器将用户的输 入语音特征与通过语音模型构建的识别网络进行匹配解码,得到识别结果。 非特定人语音识别系统对于用户而言,不需要引入繁琐的训练过程,方便了用户 的使用;同时,它可W供不同的人使用,大大拓宽了产品的应用范围。另一方面,由于采用了 基于统计模型的算法,其稳健性和识别性能都比特定人识别系统大大地提高。非特定人识 别系统识别的词条数目可W达到1000条,识别性能不会随着识别词条数目的增加有明显 的下降,并且具有一定的抗噪能力。 3、多人识别系统;通常能识别一组人的语音,该系统通常要求对该组人的语音进 行学习,通常可W识别3~5个人的语音。现有技术中存在的问题是存在识别模式的选择时,由于特定人识别模式在使用前 需要进行语音模型的反复训练,且其识别的词条较少,不能满足需求,并且该些识别系统性 能的评测不太稳定,经常遇到干扰,性能会急剧下降,甚至无法识别。
技术实现思路
1、本专利技术的目的。 本专利技术为了解决现有展示系统的适应性差、识别模型有待提高、在连续语音识别 中去除语气词等问题,而提出了一种语音交互的数字楼盘展示系统。 2、本专利技术所采用的技术方案。 基于语音交互的数字楼盘展示系统,包括语音特征提取模块、语音模型与模式匹 配模块、控制模块,语音特征提取模块从语音波形中提取随时间变化的语音特征序列,语音 模型与模式匹配模块在识别时将未知的语音特征同语音模型进行匹配与比较,计算未知语 音的特征矢量序列和每个发音模板之间的距离并对识别结果进行语法、语义分析,控制模 块通过语音模型与模式匹配模块输出的结果对计算机系统做出相应的户型展示控制。2. 根据权利要求1所述的基于语音交互的数字楼盘展示系统,其特征在于:语音模型与模式 匹配模块包括预处理单元、特征提取单元、模式识别、训练单元,预处理单元包括预加重、分 窗与分峽和端点检测,用于从语音信号中提取有声段,抑制无声段对识别结果的影响;特征 提取单元用于保证类内距离最小和类间距离最大。 在本专利技术的一具体实施例中,所述的模式识别首先选取初始模型,确定初始参数, 对模型初始化后对状态序列进行分割,分割后每段用均值估计,判断模型是否收敛确定模 型,然后通过训练单元得到最终的控制结果。 在本专利技术的另一具体实施例中,预加重是提升语音信号的高频部分,利用一阶高 通滤波器,具体如下:其中//为预加重系数,优选的/I为0. 9375。 在本专利技术的另一具体实施例中,分窗与分峽单元,首先设定窗序列的长度,通过滑 动窗序列对原始语音信号分峽,并采用交叠分段方法,如果令原始语音信号为,窗函 数为tv〇:>,则加窗过程可W表示如下: F(?) =s{n) * uf{n}。 在本专利技术的另一具体实施例中,端点检测单元通过语音信号的短时能量和短时过 零率进行检测。 在本专利技术的另一具体实施例中,特征提取单元首先用离散傅里叶变换将语音信号 从时域转化到频域,之后对其对数能量谱用依照Mel刻度分布的滤波器组进行卷积,最后 对各个滤波器的输出构成的向量进行离散余弦变换,保证类内距离最小和类间距离最大。 3、本专利技术的有益效果。 本专利技术具有适应环境能力强、识别率高的效果,能够在连续语音识别中去除语气 词并对楼盘展示进行控制,通过语音交互实时展示楼盘的全貌。【附图说明】 图1为本专利技术的逻辑结构图。 图2为本专利技术预处理逻辑结构图。【具体实施方式】 为了使专利局的审查员尤其是公众能够更加清楚地理解本专利技术的技术实质和有 益效果,申请人将在下面w实施例的方式作详细说明,但是对实施例的描述均不是对本发 明方案的限制,任何依据本专利技术构思所作出的仅仅为形式上的而非实质性的等效变换都应 视为本专利技术的技术方案范畴。 实施例 如图1所示,基于语音交互的数字楼盘展示系统,包括语音特征提取模块、语音模 型与模式匹配模块、控制模块,语音特征提取模块从语音波形中提取随时间变化的语音特 征序列,语音模型与模式匹配模块是识别系统的底层模型,并且是语音识别系统中最关键 的一部分,语音模型通常由获取的语音特征通过训练产生,目的是为每个发音建立发音模 板,在识别时将未知的语音特征同语音模型进行匹配与比较,计算未知语音的特征矢量序 列和每个发音模板之间的距离并对识别结果进行语法、语义分析,语音模型与模式匹配模 块包括预处理单元、特征提取单元、模式识别、训练单元,预处理单元包括预加重、分窗与分 峽和端点检测,用于从语音信号中提取有声段,抑制无声段对识别结果的影响;特征提取单 元用于保证类内距离最小和类间距离最大。控制模块通过语音模型与模式匹配模块输出的 结果对计算机系统做出相应的户型展示控制。 所述的模式识别首先选取初始模型,确定初始参数,对模型初始化后对状态序列 进行分割,分割后每段用均值估计,判断模型是否收敛确定模型,然后通过训练单元得到最 终的控制结果。如图2所示,预处理单元包括预加重、分窗与分峽和端点检测: (1)预加重;是提升语音信号的高频部分,利用一阶高通滤波器,具体如下:其中为预加重系数为0. 9375。 (2)分窗与分峽单元;首先设定窗序列的长度,通过滑动窗序列对原始语音信号分 峽,并采用交叠分段方法,如果令原始语音信号为,窗函数为则加窗过程可 W表不如下: s(n) = s(n} * win}。 (3);端点检测单元通过语音信号的短时能量和短时过零率进行检测。 特征提取单元首先用离散傅里叶变换将语音信号从时域转化到频域,之后对其 对数能量谱用依照Mel刻度分布的滤波器组进行卷积,最后对各个滤波器的输出构成的向 量进行离散余弦变换,保证类内距离最小和类间距离最大。 本专利技术具有适应环境能力强、识别率高的效果,能够在连续语音识别中去除语气 词并对楼盘展本文档来自技高网...
【技术保护点】
一种基于语音交互的数字楼盘展示系统,其特征在于:包括语音特征提取模块、语音模型与模式匹配模块、控制模块,语音特征提取模块从语音波形中提取随时间变化的语音特征序列,语音模型与模式匹配模块在识别时将未知的语音特征同语音模型进行匹配与比较,计算未知语音的特征矢量序列和每个发音模板之间的距离并对识别结果进行语法、语义分析,控制模块通过语音模型与模式匹配模块输出的结果对计算机系统做出相应的户型展示控制。
【技术特征摘要】
【专利技术属性】
技术研发人员:廖永斌,
申请(专利权)人:苏州美谷视典软件科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。