向被声音启动的数据处理系统发送声音样本的方法和装置制造方法及图纸

技术编号：2889325 阅读：186 留言：0更新日期：2012-04-11 18:40

一种改善与至少一个带有语音识别系统的远程声音启动数据处理系统进行声音通信的方法，包括以下步骤：（ａ）把用户的声音特征存贮在一个无线传输装置的存储器中；（ｂ）响应声音启动命令，用声音启动该无线传输装置和远程语音识别系统；以及（ｃ）响应对无线传输装置和语音识别系统的启动，将声音特征从存储器传送给语音识别系统，从而使用户能与被声音启动的处理系统直接进行口头通信。（*该技术在2016年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及改进与语音识别系统的通信，更具体地说，是涉及向一个数据处理系统的一个依赖于说话者的语音识别系统传送声音样本的方法和装置，但不限于此。口语在人与人的通信以及人-机通信和机-人通信当中起到重要作用。例如，现代语音邮件系统、帮助系统、以及电视会议系统都把人的语音包括进去了。再有，随着技术继续更新，人的语音将在机/人通信中发挥更大的作用。特别是可以预见，一个无线ATM机(自动取款机)(或任何类型的无线机，如油泵、旅行信息亭、销售端点)将包含一个语音识别系统，从而用户只需向ATM机说话。本专利技术试图使用户容易而有效地与这类机器进行口头通信，而无需向这种机器插入卡片或任何其它类型的装置。传统的语音识别装置“听取”并理解人的语音。然而，为了具有可以接受的声音识别精度，传统的语音识别系统利用了所存储的用户声音样本。用户朗诵30个左右精心构造的句子，这些句子能抓住足够的声音特征，从而产生出声音样本。语音特征含有用户语音的韵律学特征，包括节奏、音调、变音和速度。传统的语音分析器处理语音样本，分离出每个双音(diphone)段的音频样本并确定特征韵律曲线。语音分析器使用众所周知的数字信号处理技术例如隐式马尔可夫模型，以产生出双音段和韵律曲线。所以，利用存储的语音样本，传统的语音识别系统有大约90％的准确率。然而，若每次用户想与一无线机器进行口头通信时都需要重复那30个句子，这将是很不利的。根据所给出的背景信息，对于大量用户而言，将会特别希望能够高效率地、有效地通过语音与无线交互相器进行远程通信，这对于他们是特别有利的。然而，这必须开发出一种技术或装置，使得...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：乔伊·李·克里那，斯考特·哈兰·伊森斯，里奇·李·珀斯通，乔恩·哈拉尔德·韦那，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人