概率导向的容错式自然语言理解方法技术

技术编号:3047278 阅读:166 留言:0更新日期:2012-04-11 18:40
一种概率导向的容错式自然语言理解方法,将语言理解过程分为概念剖析及概念序列典范对比。前者利用以概念文法驱动的剖析器,将语音识别的结果剖析构建为概念剖析树群集合;后者以容错的解译器将概念剖析树群集合所含的概念序列与系统的概念序列典范做对比,找出最有可能的概念序列并转换成代表语者意图的语音框架。整个过程以概率导向的评分函数导引。当语音识别错误致使无法产生正确的概念序列时,藉此评分函数判断错误所在并尝试修复。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种利用语音识别将语音数据转换成文字的方法,特别涉及一种当语音识别发生错误致使无法产生正确的概念序列时,藉由概率导向的评分函数判断错误之所在并且修复成为正确的概念序列的方法。自然语言理解(Natural Language Understanding)技术是将人类的语言文字转换成为电脑能够理解的数据格式,藉此,在不同的应用系统中,电脑能提供使用者不同需求的服务。例如,在机器翻译的应用中,将本国的文字翻译成他国的文字。自然语言理解技术除了可用于文字输入输出的自然语言应用系统外,亦可用于与语音相关的应用系统。普遍的做法是利用语音识别器先将语音数据转换成文字,再做自然语言理解的处理。一般而言,与语音相关的应用系统(例如口语交谈系统)都包含语音识别(Speech Recognition)模块与语言理解模块。语音识别模块是将使用者所说的话语(Utterance)转换成可能的语句集合(Word Sequence Set),语言理解模块利用语言与应用领域的知识,分析此语句集合以判定使用者的意图,并表示成代表使用者意图的语意框架(Semantic Frame)。附图说明图1绘示理解使用者话语的流程图。举例“请问新竹今天早上会不会下雨”是使用者所说的话语信号(S100),利用语音识别模块将话语信号转换成可能的语句集合(S102),这些可能的语句集合即成为一组语句列表(S104),如例句“请问新竹今天早上会不会下雨”所形成的语句列表有“请问新竹今天早上会不会下雨”、“气温新竹今天早上会不会下雨”与“请问新竹晴天早上会不会下雨”。接着,语言理解模块利用语言及应用领域的知识来分析这些语句列表(S106),判定语句列表哪一个语句是使用者的意图,并将此语句表示成代表使用者意图的语意框架(S108)。在传统的自然语言理解处理中,会依应用领域的特性设计分析语句的文法(Grammar),藉以剖析语句的结构并标注必要的消息,再转换为电脑能够理解的数据格式,例如语意框架。然而,在实际的应用中常常遇到不合系统文法的语句,尤其是在口语交谈系统的应用中,无法预测语音识别错误,更是令传统的文法分析无用武之地。为了能够分析不合法语句,剖析器(Parser)的强健性(Robustness)渐渐地受到重视。一般的作法是部分剖析(Partial Parsing)不合法语句,再由部分剖析的结果中选择特定的结构做后处理。采用这类方法的系统或多或少都会使用一些经验法则(Heuristics)来选择部分结构及做必要的后处理,这些经验法则往往都与应用系统本身紧密相关,难以被其他系统所利用。此外,部分剖析结构仅能提供粗浅的语言信息,在一些需要完整语言分析的应用中并不十分合用。因此,对不合法语句做错误修正便成为重要的课题。错误修正是将部分剖析结构修补成符合文法规范的结构,藉此能够根据错误的种类及内容做更好的后处理。错误修正的研究早期以规则导向(Rule-base)为主,近年来有利用统计模型的方法提出。以往的研究主要都是在系统文法定义的空间中搜寻最接近的完整剖析(Full Parse)结构,使用这类方法的前提是系统文法必须有很高的精确度,否则因包含许多合法但不合理的剖析结构使搜寻的空间变得非常大,修正后的完整剖析结构也可能是一个不合理的结果,即是在实际的应用中不可能出现的结果。然后,在一般系统文法的设计中,为了提高文法的涵盖率(Coverage)而牺牲精确度,使传统的错误修正方法无法充分发挥。有鉴于利用传统文法分析理解语音识别结果有上述困难,在口语交谈系统的应用中,近年来已扬弃传统文法分析中以句子为单位的完整剖析观念,已经采用词组概念分析的趋势。图2绘示概念剖析树群及对应的概念序列。词组概念分析是利用定义概念结构的概念文法(Concept Grammar),将不同的词组代换成不同的概念。例如,词组“请问”对应于概念“Query”,词组“新竹”对应于概念“City”,亦对应于概念“Location”以形成概念剖析树群(Forest of Concept Parses)122。再利用N-gram的统计方法,为语音识别的结果找出最有可能的概念序列(Concept Sequence)120。最后,根据这些阶段性的结果产生语意框架。一般而言,上述概念驱动式的语言理解方法中,系统文法仅规范如何构成个别的概念剖析树,对于概念序列的组合并不以文法规则去限定,而是以N-gram的概率模型来估算各种概念序列的可能性,因此,并无不合法语句(Ill-formed Sentence)或不合法概念序列(Ill-formed Concept Sequence)的问题。此种做法的前提是正确的概念序列是包含在搜寻空间内,并且根据概率模型而被挑选出来。然而,由于语音识别技术的不完美,其所提供的语句集合未包含正确语词序列的错误是在所难免,而造成识别错误,尤其是识别即席语音(Spontaneous Speech)时,识别错误的情况更是严重。当语音识别错误发生时,语言理解模块只能在众多错误的概念序列中挑选一个错误的概念序列。例如,当识别“请问新竹今天早上会不会下雨”时,因语音识别模块错误而输出的语句集合仅包含“气温新竹今天早上会不会下雨”及“请问新竹晴天早上会不会下雨”,那么语音识别模块只能在“Topic(气温)Location(新竹)Date(今天早上)Topic(会不会下雨)”及“Query(请问)Location(新竹)Topic(晴天)Date(早上会不会)Topic(下雨)”两个错误的概念序列中选择其一。上述概念驱动式的语言理解方法主要的问题是来自对概念序列没有做明确的规范,因此无法得知语音识别是否发生错误,更遑论修正错误。因此本专利技术提供一种,利用语料构建正确概念序列的知识库,藉由对比的方式,修复错误的概念序列。整个语言理解的过程是以一个概率导向的评分函数引导。此评分函数整合语音知识、文法知识与概念序列典范知识,用以检测语音识别是否发生错误,并在错误发生时,找出最佳的修正方法。本专利技术提供一种,其方法包括首先,利用语音识别模块将使用者所说的话语转换成可能的语句集合。其次,利用概念文法将语句集合剖析成为概念剖析树群集合(Concept Forest Set),此概念剖析树群集合包括概念序列。再者,加入概念序列典范,其代表概念文法所认知的合法的概念序列。以及,将概念剖析树群集合所包括的概念序列与概念序列典范做对比,找出最有可能的概念序列,并将概念序列转换成为代表语者意图的语意框架。其中在剖析概念文法与对比概念序列的过程是以一个概率公式表示。为让本专利技术的上述目的、特征、和优点能更明显易懂,下文特举较佳实施例,并配合附图,作详细说明如下附图的简单说明图1绘示理解使用者话语的流程图2绘示概念剖析树群及对应的概念序列;图3绘示将概念序列典范“Query Location Date Topic”修改为“TopicLocation Date Topic”的两种可能的修改动作序列;图4绘示概率导向的容错式语言理解方法的方块图;图5绘示各语词的语音分数;图6绘示静态文法(Statical Grammar)与动态文法(DynamicalGrammar);图7绘示概念剖析树群的图例;图8绘示概念本文档来自技高网...

【技术保护点】
一种概率导向的容错式自然语言理解方法,包括: 利用一语音识别模块将使用者所说的话语转换成可能的一语句集合; 利用一概念文法将该语句集合剖析成为一概念剖析树群集合,该概念剖析树群集合包括一概念序列; 加入一概念序列典范,其代表该概念文法所认知的合法的该概念序列;以及 将该概念剖析树群集合所包括的该概念序列与该概念序列典范做对比,找出最有可能的该概念序列,并将该概念序列转换成为代表语者意图的一语意框架; 其中在剖析该概念文法与对比该概念序列的过程是以一概率公式表示。

【技术特征摘要】
1.一种概率导向的容错式自然语言理解方法,包括利用一语音识别模块将使用者所说的话语转换成可能的一语句集合;利用一概念文法将该语句集合剖析成为一概念剖析树群集合,该概念剖析树群集合包括一概念序列;加入一概念序列典范,其代表该概念文法所认知的合法的该概念序列;以及将该概念剖析树群集合所包括的该概念序列与该概念序列典范做对比,找出最有可能的该概念序列,并将该概念序列转换成为代表语者意图的一语意框架;其中在剖析该概念文法与对比该概念序列的过程是以一概率公式表示。2.如权利要求1所述的概率导向的容错式自然语言理解方法,其中将该概念文法分为一静态文法与一动态文法,其中该静态文法是预先设定的且不随输入的该语句集合而改变的文法规则,该动态文法是以输入的该语句集合与该静态文法比较而产生的。3.如权利要求1所述的概率导向的容错式自然语言理解方法,其中使用一语句列表与一语词图网中二者择其一的形式以表示该语句集合。4.如权利要求1所述的概率导向的容错式自然语言理解方法,其中利用该概念序列典范所构建的一概念序列典范知识库可以人力确认剖析结果的正确性,亦可加入人为定义的合法的该概念序列,以补充一文字语料库的不足。5.如权利要求1所述的概率导向的容错式自然语言理解方法,其中该概率公式为 ,其中U表示使用者话语的一语音特征,W表示该语音识别模块输出的该语句集合中可能的一语词序列,F表示该系统文法定义中该语词序列的可能的一概念剖析树群,C表示对应于该概念剖析树群的该概念序列,K表示该概念序列典范,E表示将该概念序列典范修改为该概念序列的修改动作序列, 表示使用者话语最有可能的该语词序列、该概念剖析树群、该概念序列、该概念序列典范与该修改动作序列的组合。6.如权利要求5所述的概率导向的容错式自然语言理解方法,其中该概率公式中的一第一概率项P(W,F,C,K,E|U)进一步推导为P(W,F,C,K,E|U)=P(F,C,K,E|W,U)P(W|U)≈P(F,C,K,E|W)P(W|U)=P(W,F,C,K,E)P(W)P(U|W)P(W)P(U)=P(W,F,C,K,E)P(U|W)P(U)]]>其中假设P(F,C,K,E|W,U)≈P(F,C,K,E|W),即给定该语词序列的状况下,该概念剖析树群、该概念序列、该概念序列典范及该修改动作序列与该语音特征的关联性可以忽略。7.如权利要求6所述的概率导向的容错式自然语言理解方法,其中藉由该语音识别模块利用一隐马尔可夫模型估算该第一概率项P(W,F,C,K,E|U)中的一第二概率项P(U|W)。8.如权利要求6所述的概率导向的容错式自然语言理解方法,其中该第一概率项P(W,F,C,K,E|U)中的一第三概率项P(W,F,C,K,E)的参数量过于庞大而无法直接估算,因此做以下的化简P(W,F,C,K,E)=P(W,F|C,K,E)P(C,E|K)P(K)≈P(W,F|C)P(C,E|K)P(K)=P(F|C)P(E|K)P(K)其中一第四概率项P(W,F|C,K,E)与一第五概率项P(W,F|C)假设为P(W,F|C,K,E)≈P(W,F|C),即给定该概念序列时,生成该概念序列的该概念剖析树群及该语句序列与该概念序列典范的关联性可以忽略。9.如权利要求8所述的概率导向的容错式自然语言理解方法,其中在该第五概率项P(W,F|C)与一第六概率项P(F|C)由于该概念剖析树群的一终端节点为该语句序列,因此P(W,F|C)=P(F|C)。10.如权利要求9所述的概率导向的容错式自...

【专利技术属性】
技术研发人员:林一中
申请(专利权)人:财团法人工业技术研究院
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1