一种信息提取方法、设备及存储介质技术

技术编号:23346377 阅读:25 留言:0更新日期:2020-02-15 04:54
本发明专利技术提供了一种信息提取方法、设备及存储介质,包括:接收目标对象的语音任务语句,并对语音任务语句进行分词,得到语音任务语句的分词信息;根据分词信息,从语音任务语句中确定出实体;根据分词信息和实体,对语音任务语句进行功能分析,得到功能任务;根据预设任务与槽位的对应关系,以及功能任务,确定出功能任务对应的至少一个任务槽位;根据预设信息抽取配置文件和至少一个任务槽位,确定出与至少一个任务槽位对应的至少一个信息抽取模型;利用至少一个信息抽取模型、实体和分词信息,从实体提取关键信息,得到至少一个任务槽位对应的至少一个关键信息。通过本发明专利技术,能够提供对槽位对应的关键信息提取的准确度。

An information extraction method, equipment and storage medium

【技术实现步骤摘要】
一种信息提取方法、设备及存储介质
本专利技术涉及自然语言处理技术,尤其涉及一种信息提取方法、设备及存储介质。
技术介绍
随着语音识别技术的发展,已经存在越来越多的智能化设备能够对用户的语音指令进行识别,并根据用户的语音指令完成相应的功能。智能化设备在对用户的语音指令进行识别时,需要先从用户的语音指令中提取出用户的意图,然后对意图中的槽位进行关键信息的抽取,进而对用户的需求进行响应。然而,常用的对槽位进行关键信息的抽取方式是针对一个意图,采用单独的信息抽取模型来对不同槽位的关键信息进行抽取,导致对槽位的关键信息抽取的准确度较低,进而影响对用户需求响应的准确度。
技术实现思路
本专利技术实施例提供一种信息提取方法、设备及存储介质,提高对槽位对应的关键信息抽取的准确度,提升用户需求响应的准确度。本专利技术实施例的技术方案是这样实现的:第一方面,本专利技术实施例提供一种信息提取方法,包括:接收目标对象的语音任务语句,并对所述语音任务语句进行分词,得到所述语音任务语句的分词信息;所述目标对象为发出语音任务语句的用户;根据所述分词信息,从所述语音任务语句中确定出实体;根据所述分词信息和所述实体,对所述语音任务语句进行功能分析,得到功能任务;所述功能任务表征语音任务语句中对应的功能;根据预设任务与槽位的对应关系,以及所述功能任务,确定出所述功能任务对应的至少一个任务槽位;所述任务槽位表征执行所述功能任务时对应的信息的类别;根据预设信息抽取配置文件和所述至少一个任务槽位,确定出与所述至少一个任务槽位对应的至少一个信息抽取模型;所述预设信息抽取配置文件中为所述任务槽位和所述信息抽取模型设置了对应关系;利用所述至少一个信息抽取模型、所述实体和所述分词信息,从所述实体提取关键信息,得到所述至少一个任务槽位对应的至少一个关键信息;所述关键信息指执行功能任务时对应的信息。第二方面,本专利技术实施例提供一种信息提取装置,包括:接收模块,用于接收目标对象的语音任务语句;所述目标对象为发出语音任务语句的用户;实体确定模块,用于对所述语音任务语句进行分词,得到所述语音任务语句的分词信息;根据所述分词信息,从所述语音任务语句中确定出实体;处理模块,用于根据所述分词信息和所述实体,对所述语音任务语句进行功能分析,得到功能任务;所述功能任务表征语音任务语句中对应的功能;根据预设任务与槽位的对应关系,以及所述功能任务,确定出所述功能任务对应的至少一个任务槽位;所述任务槽位表征执行所述功能任务时对应的信息的类别;根据预设信息抽取配置文件和所述至少一个任务槽位,确定出与所述至少一个任务槽位对应的至少一个信息抽取模型;所述预设信息抽取配置文件中为所述任务槽位和所述信息抽取模型设置了对应关系;提取模块,用于利用所述至少一个信息抽取模型、所述实体和所述分词信息,从所述实体提取关键信息,得到所述至少一个任务槽位对应的至少一个关键信息;所述关键信息指执行功能任务时对应的信息。第三方面,本专利技术实施例提供一种信息提取设备,包括:存储器,用于存储可执行信息提取指令;处理器,用于执行所述存储器中存储的可执行信息提取指令时,实现本专利技术实施例提供的信息提取方法。第四方面,本专利技术实施例提供一种存储介质,存储有可执行信息提取指令,用于引起处理器执行时,实现本专利技术实施例提供的信息提取方法。本专利技术实施例具有以下有益效果:本专利技术实施例中,接收目标对象的语音任务语句,并对语音任务语句进行分词,得到语音任务语句的分词信息;目标对象为发出语音任务语句的用户;根据分词信息,从语音任务语句中确定出实体;根据分词信息和实体,对语音任务语句进行功能分析,得到功能任务;功能任务表征语音任务语句中对应的功能;根据预设任务与槽位的对应关系,以及功能任务,确定出功能任务对应的至少一个任务槽位;任务槽位表征执行功能任务时对应的信息的类别;根据预设信息抽取配置文件和至少一个任务槽位,确定出与至少一个任务槽位对应的至少一个信息抽取模型;预设信息抽取配置文件中为任务槽位和信息抽取模型设置了对应关系;利用至少一个信息抽取模型、实体和分词信息,从实体提取关键信息,得到至少一个任务槽位对应的至少一个关键信息;关键信息指执行功能任务时对应的信息。通过上述实现方式,能够接收目标对象的语音任务语句,并对语音任务语句进行分词,得到分词信息,根据根刺信息从语音任务语句中确定出实体,并根据分词信息和实体,分析出语音任务语句的功能任务,之后,终端能够为所确定出的功能任务确定出至少一个任务槽位,并根据预设信息抽取配置文件,为每个任务槽位确定出其所适用的信息抽取模型,得到至少一个信息抽取模型,最后利用每个任务槽位所适用的信息抽取模型、实体以及分词信息,得到每个任务槽位对应的关键信息,如此,通过利用任务槽位所适用的信息抽取模型进行关键信息的提取,能够提高任务槽位所对应的关键信息抽取的准确度,从而提高对用户需求响应的准确度。附图说明图1是本专利技术实施例提供的对话场景中的信息提取方法的可选的应用模式的示意图;图2是本专利技术实施例提供的信息提取方法中的终端的结构示意图;图3是本专利技术实施例提供的一种信息提取方法的一个可选的流程示意图一;图4是本专利技术实施例提供的利用序列标注模型进行槽位标签预测的示意图;图5是本专利技术实施例提供的一种信息提取方法的一个可选的流程示意图二;图6是本专利技术实施例提供的一种创建功能任务的示意图;图7(a)是本专利技术实施例提供的查询火车票功能的预设信息抽取配置文件的示意图一;图7(b)是本专利技术实施例提供的查询火车票功能的预设信息抽取配置文件的示意图二;图8(a)是本专利技术实施例提供的在查询火车票时的对话场景示意图;图8(b)是本专利技术实施例提供的在查询火车票时的关键信息提取示意图;图8(c)是本专利技术实施例提供的在查询火车票时的查询结果示意图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步地详细描述,所描述的实施例不应视为对本专利技术的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本专利技术实施例能够以除了在这里图示或描述的以外的顺序实施。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本专利技术实施例的目的,不是旨在限制本专利技术。对本专利技术实施例进行进一步详细本文档来自技高网
...

【技术保护点】
1.一种信息提取方法,其特征在于,包括:/n接收目标对象的语音任务语句,并对所述语音任务语句进行分词,得到所述语音任务语句的分词信息;所述目标对象为发出语音任务语句的用户;/n根据所述分词信息,从所述语音任务语句中确定出实体;/n根据所述分词信息和所述实体,对所述语音任务语句进行功能分析,得到功能任务;所述功能任务表征语音任务语句中对应的功能;/n根据预设任务与槽位的对应关系,以及所述功能任务,确定出所述功能任务对应的至少一个任务槽位;所述任务槽位表征执行所述功能任务时对应的信息的类别;/n根据预设信息抽取配置文件和所述至少一个任务槽位,确定出与所述至少一个任务槽位对应的至少一个信息抽取模型;所述预设信息抽取配置文件中为所述任务槽位和所述信息抽取模型设置了对应关系;/n利用所述至少一个信息抽取模型、所述实体和所述分词信息,从所述实体提取关键信息,得到所述至少一个任务槽位对应的至少一个关键信息;所述关键信息指执行功能任务时对应的信息。/n

【技术特征摘要】
1.一种信息提取方法,其特征在于,包括:
接收目标对象的语音任务语句,并对所述语音任务语句进行分词,得到所述语音任务语句的分词信息;所述目标对象为发出语音任务语句的用户;
根据所述分词信息,从所述语音任务语句中确定出实体;
根据所述分词信息和所述实体,对所述语音任务语句进行功能分析,得到功能任务;所述功能任务表征语音任务语句中对应的功能;
根据预设任务与槽位的对应关系,以及所述功能任务,确定出所述功能任务对应的至少一个任务槽位;所述任务槽位表征执行所述功能任务时对应的信息的类别;
根据预设信息抽取配置文件和所述至少一个任务槽位,确定出与所述至少一个任务槽位对应的至少一个信息抽取模型;所述预设信息抽取配置文件中为所述任务槽位和所述信息抽取模型设置了对应关系;
利用所述至少一个信息抽取模型、所述实体和所述分词信息,从所述实体提取关键信息,得到所述至少一个任务槽位对应的至少一个关键信息;所述关键信息指执行功能任务时对应的信息。


2.根据权利要求1所述的方法,其特征在于,所述分词信息中包含有至少一个分词片段和至少一个分词片段的词性信息;所述根据所述分词信息,从所述语音任务语句中确定出实体,包括:
根据所述分词信息中的至少一个分词片段中的每个分词片段,以及所述至少一个分词片段的词性信息中每个分词片段的词性信息,确定出所述至少一个分词片段对应的实体。


3.根据权利要求1至2任一项所述的方法,其特征在于,所述根据所述分词信息和所述实体,对所述语音任务语句进行功能分析,得到功能任务,包括:
利用预设功能识别规则模板对所述分词信息和所述实体进行匹配,得到所述功能任务;或者,
采用预设功能分类模型对所述分词信息和所述实体进行分析,得到所述功能任务。


4.根据权利要求1至3任一项所述的方法,其特征在于,所述至少一个信息抽取模型为序列标注模型;所述利用所述至少一个信息抽取模型、所述实体和所述分词信息,从所述实体中提取关键信息,得到所述至少一个任务槽位对应的至少一个关键信息,包括:
利用所述序列标注模型、所述分词信息和所述实体,为所述实体进行槽位标签预测,得到所述实体的槽位标签;
将所述槽位标签与所述至少一个任务槽位相同的实体,作为所述至少一个任务槽位对应的关键信息。


5.根据权利要求1至3任一项所述的方法,其特征在于,所述至少一个信息抽取模型为分类模型;所述利用所述至少一个信息抽取模型、所述实体和所述分词信息,从所述实体提取关键信息,得到所述至少一个任务槽位对应的至少一个关键信息,包括:
利用所述分类模型、所...

【专利技术属性】
技术研发人员:王明
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1