建立基于语法模型的语义分析器的方法技术

技术编号：3046479 阅读：247 留言：0更新日期：2012-04-11 18:40

一种智能信息处理技术领域的建立基于语法模型的语义分析器的方法，利用电话拨号系统的高层语义信息，建立语法模型，并把这种语法模型应用于语义分析，自动切分拼音流，将拼音汉字转换和语义分析有机结合起来，包括语法模型的建立、语义分析算法两个方面。本发明专利技术提出了一种利用语法模型中的高层语义信息来切分拼音流的方法，这是一种可以排除歧义切分语句的语义分析器。该分析器对语法规则内的句子和超出语法规则的句子，都能很好地分析出语义信息。（*该技术在2024年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术是一种涉及智能信息处理
的建立语义分析器的方法，具体涉及一种。
技术介绍
典型的对话系统由语音识别、自然语言理解、对话管理、自然语言生成、语音合成等模块组成。自然语言理解模块的研究由来已久，目前研究主流为用基于规则的语言理解方法来实现，即根据已有的文法进行句法语义分析，其基础是形式语言理论。常见的自然语言理解模块主要用上下文无关文法CFG(Context Free Grammar)描述和分析处理书面语。口语与书面语相比有其特点句式较简单，句法结构较随意，常伴有多种口语语言现象(重复、修正、指代、省略等)。而汉语口语与英语口语相比，句式更灵活，语序更随意。传统的CFG文法很难有效地表示汉语口语地诸多现象。而涉及到语音的口语对话系统还包括噪音、含混不清、口头语、吃音、音变等等口语语音现，所以口语对话是自然语言理解技术实现的难点，但是也是应用系统适用性的关键点。口语中，人们的语言很随意，可以省略、更正、倒叙等等，这些口语现象是传统的单单基于词法分析的理解系统所难以解决的，而引入基于关键语义的技术却可以很好地解决。由于以上种种因素，完全基于语法规则的CFG的语音识别器是脆弱的，经文献检索发现，Hacioglu，K等人在《Acoustics，Speech and Signal Processing，2001 IEEE》Volume1，2001 Page(s)537-540vol.1上发表的“Dialog-context dependent language modeling combining n-grams andstochastic cont...

【技术保护点】
一种建立基于语法模型的语义分析器的方法，其特征在于，利用电话拨号系统的高层语义信息，建立语法模型，并把这种语法模型应用于语义分析，自动切分拼音流，将拼音汉字转换和语义分析有机结合起来，包括语法模型的建立、语义分析算法两个方面：（１）所述的语法模型，是一个带有权重的概念转移网络，表示着概念和概念间的转移，整个语法由一层一层的语法规则组成，表示了电话拨号系统的高层语义信息，构成了二元的语义概念转移网络ＢＳＣＴＮ，概念间的转移由语法模型中的语法规则来规定，语法模型中的每一个概念称为“语法概念”，每一个语法概念对应于各层中语法属性；（２）所述的语义分析算法，主要是应用于“拨号系统”中的三个排歧规则：排歧规则一：根据语法模型ＢＳＣＴＮ，运用宽松的语法规则Ｇ０，对整句进行分析，排除违反语法规则的句子；排歧规则二：最长匹配原则，把含有最少语法概念的切分路径的状态令为‘１’，其余路径的状态令为‘０’，通过计算语法分数，选取语法分数最低的路径为最优路径；排歧规则三：符合语法规则的句子经过上述排歧处理后，得到了最优解释，但是若语句中含有超出词典或超出语法规则的词，则可能还存在着多条切分路径，要用手工分析进行判断。...

【技术特征摘要】
1.一种建立基于语法模型的语义分析器的方法，其特征在于，利用电话拨号系统的高层语义信息，建立语法模型，并把这种语法模型应用于语义分析，自动切分拼音流，将拼音汉字转换和语义分析有机结合起来，包括语法模型的建立、语义分析算法两个方面(1)所述的语法模型，是一个带有权重的概念转移网络，表示着概念和概念间的转移，整个语法由一层一层的语法规则组成，表示了电话拨号系统的高层语义信息，构成了二元的语义概念转移网络BSCTN，概念间的转移由语法模型中的语法规则来规定，语法模型中的每一个概念称为“语法概念”，每一个语法概念对应于各层中语法属性；(2)所述的语义分析算法，主要是应用于“拨号系统”中的三个排歧规则排歧规则一根据语法模型BSCTN，运用宽松的语法规则G0，对整句进行分析，排除违反语法规则的句子；排歧规则二最长匹配原则，把含有最少语法概念的切分路径的状态令为‘1’，其余路径的状态令为‘0’，通过计算语法分数，选取语法分数最低的路径为最优路径；排歧规则三符合语法规则的句子经过上述排歧处理后，得到了最优解释，但是若语句中含有超出词典或超出语法规则的词，则可能还存在着多条切分路径，要用手工分析进行判断。2.根据权利要求1所述的建立基于语法模型的语义分析器的方法，其特征是，所述的宽松的语法规则，定义为允许每一个语法概念后接超出词典和超出语法规则的词，定义这些词的语法属性为-1，并且能转移到子语法层中的其它所有的语法概念中去。3.根据权利要求1所述的建立基于语法模型的语义分析器的方法，其特征是，以下通过步骤对其作进一步的限定(1)根据电话拨号系统的句法特点，建立拨号系统的“语法概念”；(2)由“语法概念”建立包含电话拨号系统的高层...

【专利技术属性】
技术研发人员：朱杰，熊英，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：31[]

全部详细技术资料下载我是这个专利的主人