一种信息提取方法、设备及存储介质技术

技术编号：23346377 阅读：35 留言：0更新日期：2020-02-15 04:54

本发明专利技术提供了一种信息提取方法、设备及存储介质，包括：接收目标对象的语音任务语句，并对语音任务语句进行分词，得到语音任务语句的分词信息；根据分词信息，从语音任务语句中确定出实体；根据分词信息和实体，对语音任务语句进行功能分析，得到功能任务；根据预设任务与槽位的对应关系，以及功能任务，确定出功能任务对应的至少一个任务槽位；根据预设信息抽取配置文件和至少一个任务槽位，确定出与至少一个任务槽位对应的至少一个信息抽取模型；利用至少一个信息抽取模型、实体和分词信息，从实体提取关键信息，得到至少一个任务槽位对应的至少一个关键信息。通过本发明专利技术，能够提供对槽位对应的关键信息提取的准确度。

An information extraction method, equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
一种信息提取方法、设备及存储介质
本专利技术涉及自然语言处理技术，尤其涉及一种信息提取方法、设备及存储介质。
技术介绍
随着语音识别技术的发展，已经存在越来越多的智能化设备能够对用户的语音指令进行识别，并根据用户的语音指令完成相应的功能。智能化设备在对用户的语音指令进行识别时，需要先从用户的语音指令中提取出用户的意图，然后对意图中的槽位进行关键信息的抽取，进而对用户的需求进行响应。然而，常用的对槽位进行关键信息的抽取方式是针对一个意图，采用单独的信息抽取模型来对不同槽位的关键信息进行抽取，导致对槽位的关键信息抽取的准确度较低，进而影响对用户需求响应的准确度。
技术实现思路
本专利技术实施例提供一种信息提取方法、设备及存储介质，提高对槽位对应的关键信息抽取的准确度，提升用户需求响应的准确度。本专利技术实施例的技术方案是这样实现的：第一方面，本专利技术实施例提供一种信息提取方法，包括：接收目标对象的语音任务语句，并对所述语音任务语句进行分词，得到所述语音任务语句的分词信息；所述目标对象为发出语音任务语句的用户；根据所述分词信息，从所述语音任务语句中确定出实体；根据所述分词信息和所述实体，对所述语音任务语句进行功能分析，得到功能任务；所述功能任务表征语音任务语句中对应的功能；根据预设任务与槽位的对应关系，以及所述功能任务，确定出所述功能任务对应的至少一个任务槽位；所述任务槽位表征执行所述功能任务时对应的信息的类别；根据预设信息抽取配置文件和...

【技术保护点】
1.一种信息提取方法，其特征在于，包括：/n接收目标对象的语音任务语句，并对所述语音任务语句进行分词，得到所述语音任务语句的分词信息；所述目标对象为发出语音任务语句的用户；/n根据所述分词信息，从所述语音任务语句中确定出实体；/n根据所述分词信息和所述实体，对所述语音任务语句进行功能分析，得到功能任务；所述功能任务表征语音任务语句中对应的功能；/n根据预设任务与槽位的对应关系，以及所述功能任务，确定出所述功能任务对应的至少一个任务槽位；所述任务槽位表征执行所述功能任务时对应的信息的类别；/n根据预设信息抽取配置文件和所述至少一个任务槽位，确定出与所述至少一个任务槽位对应的至少一个信息抽取模型；所述预设信息抽取配置文件中为所述任务槽位和所述信息抽取模型设置了对应关系；/n利用所述至少一个信息抽取模型、所述实体和所述分词信息，从所述实体提取关键信息，得到所述至少一个任务槽位对应的至少一个关键信息；所述关键信息指执行功能任务时对应的信息。/n

【技术特征摘要】
1.一种信息提取方法，其特征在于，包括：
接收目标对象的语音任务语句，并对所述语音任务语句进行分词，得到所述语音任务语句的分词信息；所述目标对象为发出语音任务语句的用户；
根据所述分词信息，从所述语音任务语句中确定出实体；
根据所述分词信息和所述实体，对所述语音任务语句进行功能分析，得到功能任务；所述功能任务表征语音任务语句中对应的功能；
根据预设任务与槽位的对应关系，以及所述功能任务，确定出所述功能任务对应的至少一个任务槽位；所述任务槽位表征执行所述功能任务时对应的信息的类别；
根据预设信息抽取配置文件和所述至少一个任务槽位，确定出与所述至少一个任务槽位对应的至少一个信息抽取模型；所述预设信息抽取配置文件中为所述任务槽位和所述信息抽取模型设置了对应关系；
利用所述至少一个信息抽取模型、所述实体和所述分词信息，从所述实体提取关键信息，得到所述至少一个任务槽位对应的至少一个关键信息；所述关键信息指执行功能任务时对应的信息。

2.根据权利要求1所述的方法，其特征在于，所述分词信息中包含有至少一个分词片段和至少一个分词片段的词性信息；所述根据所述分词信息，从所述语音任务语句中确定出实体，包括：
根据所述分词信息中的至少一个分词片段中的每个分词片段，以及所述至少一个分词片段的词性信息中每个分词片段的词性信息，确定出所述至少一个分词片段对应的实体。

3.根据权利要求1至2任一项所述的方法，其特征在于，所述根据所述分词信息和所述实体，对所述语音任务语句进行功能分析，得到功能任务，包括：
利用预设功能识别规则模板对所述分词信息和所述实体进行匹配，得到所述功能任务；或者，
采用预设功能分类模型对所述分词信息和所述实体进行分析，得到所述功能任务。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述至少一个信息抽取模型为序列标注模型；所述利用所述至少一个信息抽取模型、所述实体和所述分词信息，从所述实体中提取关键信息，得到所述至少一个任务槽位对应的至少一个关键信息，包括：
利用所述序列标注模型、所述分词信息和所述实体，为所述实体进行槽位标签预测，得到所述实体的槽位标签；
将所述槽位标签与所述至少一个任务槽位相同的实体，作为所述至少一个任务槽位对应的关键信息。

5.根据权利要求1至3任一项所述的方法，其特征在于，所述至少一个信息抽取模型为分类模型；所述利用所述至少一个信息抽取模型、所述实体和所述分词信息，从所述实体提取关键信息，得到所述至少一个任务槽位对应的至少一个关键信息，包括：
利用所述分类模型、所...

【专利技术属性】
技术研发人员：王明，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人