语音识别装置及方法、以及半导体集成电路装置制造方法及图纸

技术编号：10369717 阅读：198 留言：0更新日期：2014-08-28 12:25

本发明专利技术涉及一种语音识别装置及方法、以及半导体集成电路装置，通过使语音识别中选择项信息的更新变容易从而适当限制选择项信息的范围以提高识别率、或者能应对较深的语音识别分级菜单。语音识别用的半导体集成电路装置包括：将表示单词或者语句的文本数据与指令一起接收并根据指令在转换列表中设定文本数据的转换候选设定部；从语音识别数据库中提取与在转换列表中所设定的文本数据表示的单词或者语句的至少一部分相对应的标准模式的标准模式提取部；提取所输入的语音信号的频率成分并生成表示频率成分的分布状态的特征模式的信号处理部；检测根据语音信号的至少一部分而生成的特征模式和标准模式的一致性并输出语音识别结果的一致检测部。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别装置及方法、以及半导体集成电路装置
本专利技术涉及一种语音识别装置以及语音识别方法，所述语音识别装置及语音识别方法作为自动贩卖机、家电产品、家用设备、车载装置(导航装置等)、以及移动终端等中的人机界面技术的一环，对语音进行识别，并实施与该识别结果相对应的响应及处理。并且，本专利技术涉及一种在这种语音识别装置中所使用的半导体集成电路装置等。
技术介绍
语音识别为一种如下的技术，S卩，通过对被输入的语音信号进行分析，并将作为该分析的结果而得出的特征模式、与根据被预先收录的语音信号而存储于语音识别数据库中的标准模式(也称为“模板”)进行对照，从而得到识别结果的技术。但是，在未对对照的范围设置限制的情况下，应当进行比较的特征模式与标准模式的组合将成为庞大的数量，从而为了得到识别结果而需要花费较多的时间，并且由于具有相似的标准模式的单词或者语句的数量也会变多，因此将会呈现出识别率降低的趋势。作为相关联的现有技术，在专利文献I中公开了一种如下的播放装置，其目的在于，不需要预先的准备或大量的词典，通过语音便能够指定应当播放的乐曲等的内容。该播放装置读取被存储在⑶中的TOC (Table Of Contents:目录表)数据内的曲名数据，预先将该曲名数据转换为与语音识别结果相同的格式以作为候选数据而进行保存，并将对语音输入的曲名实施语音识别处理而得到的结果与候选数据进行对照，并且对与匹配性最高的候选数据相对应的乐曲进行播放。其结果为，由于能够通过用户的语音来指定应当播放的乐曲，因此减少了由用户实施的显示确认及按钮操作等。在专利文献I的播放装置中，语音识别中...

【技术保护点】
一种半导体集成电路装置，具备：语音识别数据库存储部，其中存储有语音识别数据库，所述语音识别数据库中包括，表示在预定的语言中所使用的多个音素的频率成分的分布状态的标准模式；转换候选设定部，其将表示单词或者语句的文本数据与指令一起接收，并按照所述指令而在转换列表中设定文本数据；转换列表存储部，其中存储有所述转换列表；标准模式提取部，其从所述语音识别数据库中提取与由在所述转换列表中所设定的文本数据所表示的所述单词或者语句的至少一部分相对应的所述标准模式；信号处理部，其通过对所输入的语音信号实施傅立叶转换从而提取所述语音信号的频率成分，并生成表示所述语音信号的频率成分的分布状态的特征模式；一致检测部，其对根据所述语音信号的至少一部分而生成的所述特征模式、和从所述语音识别数据库中提取的所述标准模式之间的一致性进行检测，并输出语音识别结果，所述语音识别结果为，在成为转换候选的多个单词或者语句内确定出被检测为一致的单词或者语句的语音识别结果。

【技术特征摘要】
2013.02.25 JP 2013-034257;2013.03.05 JP 2013-042661.一种半导体集成电路装置，具备: 语音识别数据库存储部，其中存储有语音识别数据库，所述语音识别数据库中包括，表示在预定的语言中所使用的多个音素的频率成分的分布状态的标准模式；转换候选设定部，其将表示单词或者语句的文本数据与指令一起接收，并按照所述指令而在转换列表中设定文本数据；转换列表存储部，其中存储有所述转换列表；标准模式提取部，其从所述语音识别数据库中提取与由在所述转换列表中所设定的文本数据所表示的所述单词或者语句的至少一部分相对应的所述标准模式；信号处理部，其通过对所输入的语音信号实施傅立叶转换从而提取所述语音信号的频率成分，并生成表示所述语音信号的频率成分的分布状态的特征模式；一致检测部，其对根据所述语音信号的至少一部分而生成的所述特征模式、和从所述语音识别数据库中提取的所述标准模式之间的一致性进行检测，并输出语音识别结果，所述语音识别结果为，在成为转换候选的多个单词或者语句内确定出被检测为一致的单词或者语句的语音识别结果。2.如权利要求1所述的半导体集成电路装置，其中，还具备语音信号合成部，所述语音信号合成部接收表示针对于所述语音识别结果的响应内容的响应数据，并根据所述响应数据来合成输出语音信号。3.如权利要求1或2 所述的半导体集成电路装置，其中，所述信号处理部在所述语音信号的电平超过了预定的值时将语音检测信号激活。4.一种语音识别装置，具备: 权利要求1所述的半导体集成电路装置；控制部，其将表示所述单词或者语句的文本数据与指令一起发送至所述半导体集成电路装置。5.一种语音识别装置，具备: 权利要求2所述的半导体集成电路装置；控制部，其接收所述语音识别结果，并将所述响应数据、以及所述表示单词或者语句的文本数据，与所述指令一起发送至所述半导体集成电路装置。6.一种语音识别装置，具备: 权利要求3所述的半导体集成电路装置；控制部，其以如下的方式对所述半导体集成电路装置进行控制，即，在从所述语音检测信号被激活起的预定的期间内未得到表现出所述特征模式与所述标准模式之间的一致的语音识别结果的情况下，将应当向所述转换列中表追加的文本数据与所述指令一起发送至所述半导体集成电路装置，并实施一致检测。7.一种语音识别方法，包括如下步骤: 步骤(a)，将表示单词或者语句的文本数据与指令一起接收，并按照所述指令而在转换列表中设定文本数据；步骤(b)，从包括表示在预定的语言中所使用的多个音素的频率成分的分布状态的标准模式的语音识别数据库中，提取与由在所述转换列表中所设定的文本数据所表示的所述单词或者语句中的至少一部分相对应的所述标准模式；步骤(C)，通过对所输入的语音信号实施傅立叶转换从而提取所述语音信号的频率成分，并生成表示所述语音信号的频率成分的分布状态的特征模式；步骤(d)，对根据所述语音信号的至少一部分而生成的所述特征模式、和从所述语音识别数据库中提取的所述标准模式之间的一致性进行检测，并输出语音识别结果，所述语音识别结果为，在成为转换候选的多个单词或者语句内确定出被检测为一致的单词或者语句的语音识别结果。8.一种半导体集成电路装置，具备: 语音识别数据库存储部，其中存储有语音识别数据库，所述语音识别数据库包括，表示在预定的语言中所使用的多个音素的频率成分的分布状态的标准模式；转换信息设定部，其将表示成为转换候选的单词或者语句的文本...

【专利技术属性】
技术研发人员：野中勉，
申请(专利权)人：精工爱普生株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人