概率导向的容错式自然语言理解方法技术

技术编号：3047278 阅读：179 留言：0更新日期：2012-04-11 18:40

一种概率导向的容错式自然语言理解方法，将语言理解过程分为概念剖析及概念序列典范对比。前者利用以概念文法驱动的剖析器，将语音识别的结果剖析构建为概念剖析树群集合；后者以容错的解译器将概念剖析树群集合所含的概念序列与系统的概念序列典范做对比，找出最有可能的概念序列并转换成代表语者意图的语音框架。整个过程以概率导向的评分函数导引。当语音识别错误致使无法产生正确的概念序列时，藉此评分函数判断错误所在并尝试修复。（*该技术在2020年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种利用语音识别将语音数据转换成文字的方法，特别涉及一种当语音识别发生错误致使无法产生正确的概念序列时，藉由概率导向的评分函数判断错误之所在并且修复成为正确的概念序列的方法。自然语言理解(Natural Language Understanding)技术是将人类的语言文字转换成为电脑能够理解的数据格式，藉此，在不同的应用系统中，电脑能提供使用者不同需求的服务。例如，在机器翻译的应用中，将本国的文字翻译成他国的文字。自然语言理解技术除了可用于文字输入输出的自然语言应用系统外，亦可用于与语音相关的应用系统。普遍的做法是利用语音识别器先将语音数据转换成文字，再做自然语言理解的处理。一般而言，与语音相关的应用系统(例如口语交谈系统)都包含语音识别(Speech Recognition)模块与语言理解模块。语音识别模块是将使用者所说的话语(Utterance)转换成可能的语句集合(Word Sequence Set)，语言理解模块利用语言与应用领域的知识，分析此语句集合以判定使用者的意图，并表示成代表使用者意图的语意框架(Semantic Frame)。附图说明图1绘示理解使用者话语的流程图。举例“请问新竹今天早上会不会下雨”是使用者所说的话语信号(S100)，利用语音识别模块将话语信号转换成可能的语句集合(S102)，这些可能的语句集合即成为一组语句列表(S104)，如例句“请问新竹今天早上会不会下雨”所形成的语句列表有“请问新竹今天早上会不会下雨”、“气温新竹今天早上会不会下雨”与“请问新竹晴天早上会不会下雨”。接着，语言理解模块利用语言及应...

【技术保护点】
一种概率导向的容错式自然语言理解方法，包括：利用一语音识别模块将使用者所说的话语转换成可能的一语句集合；利用一概念文法将该语句集合剖析成为一概念剖析树群集合，该概念剖析树群集合包括一概念序列；加入一概念序列典范，其代表该概念文法所认知的合法的该概念序列；以及将该概念剖析树群集合所包括的该概念序列与该概念序列典范做对比，找出最有可能的该概念序列，并将该概念序列转换成为代表语者意图的一语意框架；其中在剖析该概念文法与对比该概念序列的过程是以一概率公式表示。

【技术特征摘要】
1.一种概率导向的容错式自然语言理解方法，包括利用一语音识别模块将使用者所说的话语转换成可能的一语句集合；利用一概念文法将该语句集合剖析成为一概念剖析树群集合，该概念剖析树群集合包括一概念序列；加入一概念序列典范，其代表该概念文法所认知的合法的该概念序列；以及将该概念剖析树群集合所包括的该概念序列与该概念序列典范做对比，找出最有可能的该概念序列，并将该概念序列转换成为代表语者意图的一语意框架；其中在剖析该概念文法与对比该概念序列的过程是以一概率公式表示。2.如权利要求1所述的概率导向的容错式自然语言理解方法，其中将该概念文法分为一静态文法与一动态文法，其中该静态文法是预先设定的且不随输入的该语句集合而改变的文法规则，该动态文法是以输入的该语句集合与该静态文法比较而产生的。3.如权利要求1所述的概率导向的容错式自然语言理解方法，其中使用一语句列表与一语词图网中二者择其一的形式以表示该语句集合。4.如权利要求1所述的概率导向的容错式自然语言理解方法，其中利用该概念序列典范所构建的一概念序列典范知识库可以人力确认剖析结果的正确性，亦可加入人为定义的合法的该概念序列，以补充一文字语料库的不足。5.如权利要求1所述的概率导向的容错式自然语言理解方法，其中该概率公式为，其中U表示使用者话语的一语音特征，W表示该语音识别模块输出的该语句集合中可能的一语词序列，F表示该系统文法定义中该语词序列的可能的一概念剖析树群，C表示对应于该概念剖析树群的该概念序列，K表示该概念序列典范，E表示将该概念序列典范修改为该概念序列的修改动作序列，表示使用者话语最有可能的该语词序列、该概念剖析树群、该概念序列、该概念序列典范与该修改动作序列的组合。6.如权利要求5所述的概率导向的容错式自然语言理解方法，其中该概率公式中的一第一概率项P(W，F，C，K，E|U)进一步推导为P(W，F，C，K，E|U)＝P(F，C，K，E|W，U)P(W|U)≈P(F，C，K，E|W)P(W|U)=P(W,F,C,K,E)P(W)P(U|W)P(W)P(U)=P(W,F,C,K,E)P(U|W)P(U)]]>其中假设P(F，C，K，E|W，U)≈P(F，C，K，E|W)，即给定该语词序列的状况下，该概念剖析树群、该概念序列、该概念序列典范及该修改动作序列与该语音特征的关联性可以忽略。7.如权利要求6所述的概率导向的容错式自然语言理解方法，其中藉由该语音识别模块利用一隐马尔可夫模型估算该第一概率项P(W，F，C，K，E|U)中的一第二概率项P(U|W)。8.如权利要求6所述的概率导向的容错式自然语言理解方法，其中该第一概率项P(W，F，C，K，E|U)中的一第三概率项P(W，F，C，K，E)的参数量过于庞大而无法直接估算，因此做以下的化简P(W，F，C，K，E)＝P(W，F|C，K，E)P(C，E|K)P(K)≈P(W，F|C)P(C，E|K)P(K)＝P(F|C)P(E|K)P(K)其中一第四概率项P(W，F|C，K，E)与一第五概率项P(W，F|C)假设为P(W，F|C，K，E)≈P(W，F|C)，即给定该概念序列时，生成该概念序列的该概念剖析树群及该语句序列与该概念序列典范的关联性可以忽略。9.如权利要求8所述的概率导向的容错式自然语言理解方法，其中在该第五概率项P(W，F|C)与一第六概率项P(F|C)由于该概念剖析树群的一终端节点为该语句序列，因此P(W，F|C)＝P(F|C)。10.如权利要求9所述的概率导向的容错式自...

【专利技术属性】
技术研发人员：林一中，
申请(专利权)人：财团法人工业技术研究院，
类型：发明
国别省市：71[中国|台湾]

全部详细技术资料下载我是这个专利的主人