语义分析方法及终端设备技术

技术编号:21454123 阅读:24 留言:0更新日期:2019-06-26 04:50
本发明专利技术适用于人工智能技术领域,提供了一种语义分析方法及终端设备,其中,所述方法包括:获取待处理自然语言语句;提取待处理自然语言语句中的命名实体,确定所述命名实体对应的统一标识符;将待处理自然语言语句中的所述命名实体替换为所述统一标识符;将命名实体替换为统一标识符后的待处理自然语言语句转化成预设逻辑格式语句;确定转化成所述预设逻辑格式语句的待处理自然语言语句中的占位符,利用所述命名实体填充确定的占位符;分解填充占位符后的待处理自然语言语句,并根据分解结果执行相应动作,可以减少人力物力投入,加快自然语言分析领域的数据处理速度,提高语义分析输出结果的可实现性,适合应用。

【技术实现步骤摘要】
语义分析方法及终端设备
本专利技术属于人工智能
,尤其涉及一种语义分析方法及终端设备。
技术介绍
随着人工智能的发展,现阶段各个领域都开始了相应的应用,从个人助手,智能音箱,智能电视,智能客服等等方面,都需要使用到自然语义分析相关的技术,目的是为了让计算机可以理解用户语言所表达的内容,从而可以对用户的需求做出响应。自从神经网络技术近年取得飞速发展以来,自然语义分析所用的技术和手段也开始转变,但是从本质上来说,使用神经网络只是从数据拟合方面提高了其各个阶段数据输出的准确概率,其方法和思想依然是基于“分词,词性标注,命名实体识别,词槽标注”等思想的不同组合来实现自然语义主体思想的提取,其过程涉及到的数据处理、数据标注过程繁多,需要大量人力物力,且最后的输出结果可实现性不高,因为其词槽输出的词语从数量级来说太大,比如“把音量放大10”这句话来说,这个“增加数值”的动作就可以有很多不同的词语或短句来表达这一个意思,比如:“增加、放大、大一点、大一些、再大点”……等等,所以基于这种思想的自然语义分析通常只能应用在有限的业务领域中,比如音箱领域。如果放在开放领域来看,那么词槽的数量级应该在十万甚至百万级别,根本无法完全实现。
技术实现思路
有鉴于此,本专利技术实施例提供了一种语义分析方法及终端设备,以解决现有语义分析技术其过程涉及到的数据处理、数据标注过程繁多,需要大量人力物力,且最后的输出结果可实现性不高的问题。本专利技术实施例的第一方面提供了一种语义分析方法,包括:获取待处理自然语言语句;提取所述待处理自然语言语句中的命名实体,确定所述命名实体对应的统一标识符;将所述待处理自然语言语句中的所述命名实体替换为所述统一标识符;将命名实体替换为统一标识符后的待处理自然语言语句转化成预设逻辑格式语句;确定转化成所述预设逻辑格式语句的待处理自然语言语句中的占位符,利用所述命名实体填充确定的占位符;分解填充占位符后的待处理自然语言语句,并根据分解结果执行相应动作。可选的,所述提取所述待处理自然语言语句中的命名实体,确定所述命名实体对应的统一标识符包括:采用命名实体识别技术提取所述待处理自然语言语句中的命名实体;根据预存的语句命名实体与语句统一标识符的对应关系,确定所述命名实体对应的统一标识符。可选的,所述预设逻辑格式语句为S=∑(V,N,∑(C)),C=[N=N/L],其中,S代表所述预设逻辑格式语句,V代表动词,N代表名词,C代表条件限定短语,L代表量词,∑代表范围内元素可重复,C中包含有占位符。可选的,所述分解填充占位符后的待处理自然语言语句,并根据分解结果执行相应动作包括:获取所述预设逻辑格式语句的语法规则;根据所述语法规则分解填充占位符后的待处理自然语言语句,并根据分解结果执行相应动作。可选的,所述将命名实体替换为统一标识符后的待处理自然语言语句转化成预设逻辑格式语句包括:获取将命名实体替换为统一标识符后的待处理自然语言语句中的动词、名词、条件限定短语和量词;根据将命名实体替换为统一标识符后的待处理自然语言语句确定获取的条件限定短语中的占位符;根据获取的动词、名词、条件限定短语、量词,以及确定的占位符,将命名实体替换为统一标识符后的待处理自然语言语句转化成所述预设逻辑格式语句。本专利技术实施例的第二方面提供了一种语义分析装置,包括:语句获取单元,用于获取待处理自然语言语句;命名实体提取单元,用于提取所述待处理自然语言语句中的命名实体;命名实体替换单元,用于确定所述命名实体对应的统一标识符,将所述待处理自然语言语句中的所述命名实体替换为所述统一标识符;语句转化单元,用于将命名实体替换为统一标识符后的待处理自然语言语句转化成预设逻辑格式语句;占位符填充单元,用于确定转化成所述预设逻辑格式语句的待处理自然语言语句中的占位符,利用所述命名实体填充确定的占位符;语句分解处理单元,用于分解填充占位符后的待处理自然语言语句,并根据分解结果执行相应动作。可选的,所述命名实体提取单元,还用于采用命名实体识别技术提取所述待处理自然语言语句中的命名实体;所述命名实体替换单元,还用于根据预存的语句命名实体与语句统一标识符的对应关系,确定所述命名实体对应的统一标识符。可选的,所述预设逻辑格式语句为S=∑(V,N,∑(C)),C=[N=N/L],其中,S代表所述预设逻辑格式语句,V代表动词,N代表名词,C代表条件限定短语,L代表量词,∑代表范围内元素可重复,C中包含有占位符。本专利技术实施例的第三方面提供了一种语义分析终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述语义分析方法的步骤。本专利技术实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述语义分析方法的步骤。本专利技术实施例与现有技术相比存在的有益效果是:本专利技术实施例在获取待处理自然语言语句后,提取待处理自然语言语句中的命名实体,确定提取的命名实体对应的统一标识符,将待处理自然语言语句中的命名实体替换为上述统一标识符,然后将命名实体替换为统一标识符后的待处理自然语言语句转化成预设逻辑格式语句,确定转化成预设逻辑格式语句的待处理自然语言语句中的占位符,利用上述命名实体填充确定的占位符,最后分解填充占位符后的待处理自然语言语句,并根据分解结果执行相应动作。由于本专利技术基于语言词汇量收敛和转译的思想,将百万量级词汇的自然语言收敛聚合到一种新的量级较小的逻辑格式语言,使其信息精简,词汇减少,所表达的主体内容不变,可以减少人力物力投入,加快自然语言分析领域的数据处理速度,提高语义分析输出结果的可实现性,适合应用。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种语义分析方法的示意流程图;图2是本专利技术另一实施例提供的一种语义分析方法的示意流程图;图3是本专利技术实施例提供的自然语言转化成逻辑格式语句的示意图;图4是本专利技术再一实施例提供的一种语义分析方法的示意流程图;图5是本专利技术又一实施例提供的一种语义分析方法的示意流程图;图6是本专利技术实施例提供的一种语义分析装置的示意性框图;图7是本专利技术另一实施例提供的一种语义分析装置示意性框图;图8是本专利技术实施例提供的一种语义分析终端设备的示意性框图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。参见图1,图1是本专利技术实施例提供的一种语义分析方法的示意流程图,在该实施例中,以终端的角度触发为例进行说明,这里,终端可以为智能手机、平板电脑等移动终端。如图1所示,在该实施例中,终端的处本文档来自技高网...

【技术保护点】
1.一种语义分析方法,其特征在于,包括:获取待处理自然语言语句;提取所述待处理自然语言语句中的命名实体,确定所述命名实体对应的统一标识符;将所述待处理自然语言语句中的所述命名实体替换为所述统一标识符;将命名实体替换为统一标识符后的待处理自然语言语句转化成预设逻辑格式语句;确定转化成所述预设逻辑格式语句的待处理自然语言语句中的占位符,利用所述命名实体填充确定的占位符;分解填充占位符后的待处理自然语言语句,并根据分解结果执行相应动作。

【技术特征摘要】
1.一种语义分析方法,其特征在于,包括:获取待处理自然语言语句;提取所述待处理自然语言语句中的命名实体,确定所述命名实体对应的统一标识符;将所述待处理自然语言语句中的所述命名实体替换为所述统一标识符;将命名实体替换为统一标识符后的待处理自然语言语句转化成预设逻辑格式语句;确定转化成所述预设逻辑格式语句的待处理自然语言语句中的占位符,利用所述命名实体填充确定的占位符;分解填充占位符后的待处理自然语言语句,并根据分解结果执行相应动作。2.如权利要求1所述的语义分析方法,其特征在于,所述提取所述待处理自然语言语句中的命名实体,确定所述命名实体对应的统一标识符包括:采用命名实体识别技术提取所述待处理自然语言语句中的命名实体;根据预存的语句命名实体与语句统一标识符的对应关系,确定所述命名实体对应的统一标识符。3.如权利要求1所述的语义分析方法,其特征在于,所述预设逻辑格式语句为S=∑(V,N,∑(C)),C=[N=N/L],其中,S代表所述预设逻辑格式语句,V代表动词,N代表名词,C代表条件限定短语,L代表量词,∑代表范围内元素可重复,C中包含有占位符。4.如权利要求1所述的语义分析方法,其特征在于,所述分解填充占位符后的待处理自然语言语句,并根据分解结果执行相应动作包括:获取所述预设逻辑格式语句的语法规则;根据所述语法规则分解填充占位符后的待处理自然语言语句,并根据分解结果执行相应动作。5.如权利要求3所述的语义分析方法,其特征在于,所述将命名实体替换为统一标识符后的待处理自然语言语句转化成预设逻辑格式语句包括:获取将命名实体替换为统一标识符后的待处理自然语言语句中的动词、名词、条件限定短语和量词;根据将命名实体替换为统一标识符后的待处理自然语言语句确定获取的条件限定短语中的占位符;根据获取的动词、名词、...

【专利技术属性】
技术研发人员:豆泽云
申请(专利权)人:TCL集团股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1