基于句子重写的语义分析方法及装置制造方法及图纸

技术编号：14953962 阅读：359 留言：0更新日期：2017-04-02 10:23

本发明专利技术提供一种基于句子重写的语义分析方法及装置。所述方法包括：将原句子重写为多个新句子；利用语义分析器分析每一个新句子生成的逻辑表达式；采用联合模型计算生成的逻辑表达式的分数，并选择分数最高的逻辑表达式。本发明专利技术能够通过句子重写对句子进行重新解析，进而使用与自然语言句子匹配的逻辑表达式进行语义分析，提高了准确性和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语义分析
，尤其涉及一种基于句子重写的语义分析方法及装置。
技术介绍
近年来，构建智能信息服务，如对话机器人、问答机器人、高考机器人、服务业机器人等已经成为工业界和学术界共同的热点。智能信息服务需要机器人能够理解人类的语言，包括人类提出的问题、人类提出的指令等。因此，如何把自然语言句子解析成机器可执行的形式化表示是实现智能信息服务的关键，又称为语义分析。现有的语义分析器根据词汇和语法形成最终的逻辑表达式，其中词汇是把自然语言词语映射到本体中的谓词；而语法负责把各个词汇按照一定的规则组合起来。在实现本专利技术的过程中，专利技术人发现现有技术中至少存在如下技术问题：由于自然语言表达的多样性，一个意思通常可以有多种表达。这样造成自然语言中的词语到本体中的谓词之间形成不匹配的情况，进而导致自然语言句子与逻辑表达式之间存在不匹配的情况。
技术实现思路
本专利技术提供的基于句子重写的语义分析方法及装置，能够通过句子重写对句子进行重新解析，进而使用与自然语言句子匹配的逻辑表达式进行语义分析，提高了准确性和鲁棒性。第一方面，本专利技术提供一种基于句子重写的语义分析方法，包括：将原句子重写为多个新句子；利用语义分析器分析每一个新句子生成的逻辑表达式；采用联合模型计算生成的逻辑表达式的分数，并选择分数最高的逻辑表达式。可选地，所述将句子重写为多个新句子包括：对于一个词语对应多个谓词的句子使用词典替换词语重写为新句子；对于一个复杂的表达式对应一个谓语言的句子使用模板替换重写为新句子。可选地，所述采用联合模型计算生成的逻辑表达式的分数，并选择分数最高的逻辑表达式...
基于句子重写的语义分析方法及装置

【技术保护点】
一种基于句子重写的语义分析方法，其特征在于，包括：将原句子重写为多个新句子；利用语义分析器分析每一个新句子生成的逻辑表达式；采用联合模型计算生成的逻辑表达式的分数，并选择分数最高的逻辑表达式。

【技术特征摘要】
1.一种基于句子重写的语义分析方法，其特征在于，包括：将原句子重写为多个新句子；利用语义分析器分析每一个新句子生成的逻辑表达式；采用联合模型计算生成的逻辑表达式的分数，并选择分数最高的逻辑表达式。2.根据权利要求1所述的方法，其特征在于，所述将句子重写为多个新句子包括：对于一个词语对应多个谓词的句子使用词典替换词语重写为新句子；对于一个复杂的表达式对应一个谓语言的句子使用模板替换重写为新句子。3.根据权利要求1所述的方法，其特征在于，所述采用联合模型计算生成的逻辑表达式的分数，并选择分数最高的逻辑表达式包括：将句子重写部分和语义分析部分进行联合建模，构建联合的打分函数为：score(x,x′,d)＝θ·φ(x,x′,d)＝θ1·φ(x,x′)+θ2·φ(x′,d)其中：x是原句子；x′进行句子重写后的新句子；d是语义分析过程；θ，θ1，θ2是训练过程中学习的参数向量；φ是自动提取的特征函数。4.根据权利要求3所述的方法，其特征在于，参数向量θ1的更新公式为：θ1←θ1+ηR(htarget*)δ(x,x′*)]]>参数向量的θ2更新公式为：θ2←θ2+ηR(htarget)Σt=1Tδ(htarget)]]>其中：η是迭代步长，用来限制参数更新的幅度；R是价值函数，用来衡量最终逻辑表达式是否正确；htarget是目标推理过程；是训练中的最佳目标推理过程；x′*是训练中的最佳新句子。5...

【专利技术属性】
技术研发人员：孙乐，韩先培，陈波，
申请(专利权)人：中国科学院软件研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人