基于句子重写的语义分析方法及装置制造方法及图纸

技术编号:14953962 阅读:336 留言:0更新日期:2017-04-02 10:23
本发明专利技术提供一种基于句子重写的语义分析方法及装置。所述方法包括:将原句子重写为多个新句子;利用语义分析器分析每一个新句子生成的逻辑表达式;采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式。本发明专利技术能够通过句子重写对句子进行重新解析,进而使用与自然语言句子匹配的逻辑表达式进行语义分析,提高了准确性和鲁棒性。

【技术实现步骤摘要】

本专利技术涉及语义分析
,尤其涉及一种基于句子重写的语义分析方法及装置
技术介绍
近年来,构建智能信息服务,如对话机器人、问答机器人、高考机器人、服务业机器人等已经成为工业界和学术界共同的热点。智能信息服务需要机器人能够理解人类的语言,包括人类提出的问题、人类提出的指令等。因此,如何把自然语言句子解析成机器可执行的形式化表示是实现智能信息服务的关键,又称为语义分析。现有的语义分析器根据词汇和语法形成最终的逻辑表达式,其中词汇是把自然语言词语映射到本体中的谓词;而语法负责把各个词汇按照一定的规则组合起来。在实现本专利技术的过程中,专利技术人发现现有技术中至少存在如下技术问题:由于自然语言表达的多样性,一个意思通常可以有多种表达。这样造成自然语言中的词语到本体中的谓词之间形成不匹配的情况,进而导致自然语言句子与逻辑表达式之间存在不匹配的情况。
技术实现思路
本专利技术提供的基于句子重写的语义分析方法及装置,能够通过句子重写对句子进行重新解析,进而使用与自然语言句子匹配的逻辑表达式进行语义分析,提高了准确性和鲁棒性。第一方面,本专利技术提供一种基于句子重写的语义分析方法,包括:将原句子重写为多个新句子;利用语义分析器分析每一个新句子生成的逻辑表达式;采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式。可选地,所述将句子重写为多个新句子包括:对于一个词语对应多个谓词的句子使用词典替换词语重写为新句子;对于一个复杂的表达式对应一个谓语言的句子使用模板替换重写为新句子。可选地,所述采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式包括:将句子重写部分和语义分析部分进行联合建模,构建联合的打分函数为:score(x,x′,d)=θ·φ(x,x′,d)=θ1·φ(x,x′)+θ2·φ(x′,d)其中:x是原句子;x′进行句子重写后的新句子;d是语义分析过程;θ,θ1,θ2是训练过程中学习的参数向量;φ是自动提取的特征函数。进一步地,参数向量θ1的更新公式为:参数向量的θ2更新公式为:其中:η是迭代步长,用来限制参数更新的幅度;R是价值函数,用来衡量最终逻辑表达式是否正确;htarget是目标推理过程;是训练中的最佳目标推理过程;x′*是训练中的最佳新句子。第二方面,本专利技术提供一种基于句子重写的语义分析装置,包括:重写单元,用于将原句子重写为多个新句子;分析单元,用于利用语义分析器分析每一个新句子生成的逻辑表达式;计算单元,用于采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式。可选地,所述重写单元,用于将句子重写为多个新句子包括:第一替换单元,用于对于一个词语对应多个谓词的句子使用词典替换词语重写为新句子;第二替换单元,用于对于一个复杂的表达式对应一个谓语言的句子使用模板替换重写为新句子。可选地,所述计算单元,用于采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式包括:将句子重写部分和语义分析部分进行联合建模,构建联合的打分函数为:score(x,x′,d)=θ·φ(x,x′,d)=θ1·φ(x,x′)+θ2·φ(x′,d)其中:x是原句子;x′进行句子重写后的新句子;d是语义分析过程;θ,θ1,θ2是训练过程中学习的参数向量;φ是自动提取的特征函数。进一步地,参数向量θ1的更新公式为:参数向量的θ2更新公式为:其中:η是迭代步长,用来限制参数更新的幅度;R是价值函数,用来衡量最终逻辑表达式是否正确;htarget是目标推理过程;是训练中的最佳目标推理过程;x′*是训练中的最佳新句子。本专利技术实施例提供的基于句子重写的语义分析方法及装置,能够通过句子重写对句子进行重新解析,进而使用与自然语言句子匹配的逻辑表达式进行语义分析,提高了准确性和鲁棒性。附图说明图1为本专利技术一实施例提供的基于句子重写的语义分析方法的流程图;图2为本专利技术一实施例提供的基于句子重写的语义分析装置的结构示意图;图3为本专利技术另一实施例提供的基于句子重写的语义分析装置的重写单元的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提供一种基于句子重写的语义分析方法,如图1所示,所述方法包括:S101、将原句子重写为多个新句子;其中,所述将句子重写为多个新句子包括:对于一个词语对应多个谓词的句子使用词典替换词语重写为新句子;对于一个复杂的表达式对应一个谓语言的句子使用模板替换重写为新句子。S102、利用语义分析器分析每一个新句子生成的逻辑表达式;S103、采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式。其中,所述采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式包括:将句子重写部分和语义分析部分进行联合建模,构建联合的打分函数为:score(x,x′,d)=θ·φ(x,x′,d)=θ1·φ(x,x′)+θ2·φ(x′,d)其中:x是原句子;x′进行句子重写后的新句子;d是语义分析过程;具体地,语义分析过程d代表所使用的所有词典以及所有组合规则。θ,θ1,θ2是训练过程中学习的参数向量;φ是自动提取的特征函数。具体地,自动提取的特征函数φ指抽取特征的函数,其中特征为人工定义的多个特征。本专利技术提取的特征有两类:一类是句子重写过程中产生的特征,例如:被替换的词,使用的模板对;一类是语义分析过程中产生的特征,例如:所使用的词汇,所使用的组合规则。进一步地,参数向量θ1的更新公式为:参数向量的θ2更新公式为:其中:η是迭代步长,用来限制参数更新的幅度,例如:0.001;R是价值函数,用来衡量最终逻辑表达式是否正确;具体地,价值函数R为0~1之间的一个值,值越大结果越正确,其中0表示得到的结果完全错误,1表示得到的结果完全正确;htarget是目标推理过程;是训练中的最佳目标推理过程;x′*是训练中的最佳新句子。具体地,本专利技术实施例提供的基于句子重写的语义分析方法,将原句子重写为多个新句子;利用语义分析器分析每一个新句子生成的逻辑表达式;采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式。本专利技术能够通过句子重写对句子进行重新解析,进而使用与自然语言句子匹配的逻辑表达式进行语义分析,提高了准确性和鲁棒性。本专利技术实施例还提供一种基于句子重写的语义分析装置,如图2所示,所述装置包括:重写单元201,用于将原句子重写为多个新句子;分析单元202,用于利用语义分析器分析每一个新句子生成的逻辑表达式;计算单元203,用于采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式。本专利技术实施例提供的基于句子重写的语义分析装置,将原句子重写为多个新句子;利用语义分析器分析每一个新句子生成的逻辑表达式;采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式。本专利技术能够通过句子重写对句子进行重新解析,进而使用与自然语言句子匹配的逻辑表达式进行语义分析,提高了准确性和鲁棒性。本文档来自技高网...
基于句子重写的语义分析方法及装置

【技术保护点】
一种基于句子重写的语义分析方法,其特征在于,包括:将原句子重写为多个新句子;利用语义分析器分析每一个新句子生成的逻辑表达式;采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式。

【技术特征摘要】
1.一种基于句子重写的语义分析方法,其特征在于,包括:将原句子重写为多个新句子;利用语义分析器分析每一个新句子生成的逻辑表达式;采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式。2.根据权利要求1所述的方法,其特征在于,所述将句子重写为多个新句子包括:对于一个词语对应多个谓词的句子使用词典替换词语重写为新句子;对于一个复杂的表达式对应一个谓语言的句子使用模板替换重写为新句子。3.根据权利要求1所述的方法,其特征在于,所述采用联合模型计算生成的逻辑表达式的分数,并选择分数最高的逻辑表达式包括:将句子重写部分和语义分析部分进行联合建模,构建联合的打分函数为:score(x,x′,d)=θ·φ(x,x′,d)=θ1·φ(x,x′)+θ2·φ(x′,d)其中:x是原句子;x′进行句子重写后的新句子;d是语义分析过程;θ,θ1,θ2是训练过程中学习的参数向量;φ是自动提取的特征函数。4.根据权利要求3所述的方法,其特征在于,参数向量θ1的更新公式为:θ1←θ1+ηR(htarget*)δ(x,x′*)]]>参数向量的θ2更新公式为:θ2←θ2+ηR(htarget)Σt=1Tδ(htarget)]]>其中:η是迭代步长,用来限制参数更新的幅度;R是价值函数,用来衡量最终逻辑表达式是否正确;htarget是目标推理过程;是训练中的最佳目标推理过程;x′*是训练中的最佳新句子。5...

【专利技术属性】
技术研发人员:孙乐韩先培陈波
申请(专利权)人:中国科学院软件研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1