表格问答数据的处理方法、装置及电子设备制造方法及图纸

技术编号:37077430 阅读:18 留言:0更新日期:2023-03-29 19:53
本发明专利技术提供了一种表格问答数据的处理方法、装置及电子设备,通过获取用户输入的携带有指标的问题文本数据;提取问题文本数据中的语义类别,并基于语义类别确定反馈模板,其中,语义类别包括属性特征、条件特征和实体特征;从预先存储的数据库中提取语义类别对应的指标数据;将指标数据拼接至反馈模板中,以使用户得到问题文本数据对应的反馈结果。本发明专利技术根据问题文本数据中的语义类别,将其对应的指标数据按照反馈模板进行反馈,以问答形式进行回复,问答的形式相对于报表可以与用户进行信息交互,充分利用对话的上下文信息帮助用户以更低的时间成本直观精准地找到相关业务指标,提高用户查询指标的效率和精准度。高用户查询指标的效率和精准度。高用户查询指标的效率和精准度。

【技术实现步骤摘要】
表格问答数据的处理方法、装置及电子设备


[0001]本专利技术涉及数据处理
,尤其涉及一种表格问答数据的处理方法、装置及电子设备。

技术介绍

[0002]工业上许多业务仍然用表格的方式存储数据进行指标的统计分析,传统的可视化方法采用数据报表的形式。这种方式缺乏业务人员与系统的直接交互,面对大量的指标报表时,业务人员很难快速找到自己关注的指标数据,一旦报表字段与业务人员的理解有出入,其甚至不知道哪个报表是自己所要查询的。因此,本申请提出一种指标统计方法,通过自然语言的问题表述形式实现,可以通过语义理解的方式,将多样化的指标含义表述快速匹配到业务人员查询的标准指标上,大大提高查询效率和成功率。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种表格问答数据的处理方法、装置及电子设备,可以提高查询效率和成功率。
[0004]第一方面,本专利技术实施例提供了一种表格问答数据的处理方法,该方法包括:获取用户输入的携带有指标的问题文本数据;提取问题文本数据中的语义类别,并基于语义类别确定反馈模板,其中,语义类别包括属性特征、条件特征和实体特征;从预先存储的数据库中提取语义类别对应的指标数据;将指标数据拼接至反馈模板中,以使用户得到问题文本数据对应的反馈结果。
[0005]结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,从预先存储的数据库中提取语义类别对应的指标数据的步骤,包括:基于语义类别对应的类别参数,确定问题文本数据对应的问题类别,得到问题类别对应的数据提取模板;将语义类别填充至数据提取模板的模板槽位中,构建预定义的数据查询逻辑;使用预先设置的提取模型执行数据查询逻辑,从预先存储的数据库中提取语义类别对应的指标数据。
[0006]结合第一方面,本专利技术实施例提供了第一方面的第二种可能的实施方式,其中,基于语义类别对应的类别参数,确定问题文本数据对应的问题类别,得到问题类别对应的数据提取模板的步骤,包括:根据语义类别中的条件特征,确定问题文本数据对应的问题主类别;基于语义类别中的属性特征,从问题主类别中确定问题子类别;根据问题子类别关联的问题类型参数,得到问题文本数据对应的数据提取模板。
[0007]结合第一方面,本专利技术实施例提供了第一方面的第三种可能的实施方式,其中,数据库包括实体表格;实体表格对应于语义类别的实体特征;使用预先设置的提取模型执行数据查询逻辑,从预先存储的数据库中提取语义类别对应的指标数据的步骤,包括:根据语义类别中的属性特征,从实体表格中确定属性特征对应的值域区间;根据语义类别对应的实体特征,从值域区间中确定实体特征对应的单元格项;将单元格项中的单元格数据确定为语义类别对应的指标数据。
[0008]结合第一方面,本专利技术实施例提供了第一方面的第四种可能的实施方式,其中,将指标数据拼接至反馈模板中,以使用户得到问题文本数据对应的反馈结果的步骤,包括:将语义类别对应的指标数据填充至反馈模板对应的反馈槽位中,并将每个反馈槽位中的指标数据与反馈模板进行拼接,得到问题文本数据对应的反馈结果。
[0009]结合第一方面,本专利技术实施例提供了第一方面的第五种可能的实施方式,其中,获取用户输入的携带有指标的问题文本数据的步骤之后,方法还包括:对问题文本数据进行预处理,将问题文本数据转换为标准形式的问题文本数据;其中,预处理包括文本清洗和分词处理。
[0010]结合第一方面,本专利技术实施例提供了第一方面的第六种可能的实施方式,其中,对问题文本数据进行预处理的步骤,包括:提取问题文本数据中的数字参数和/或字符参数;根据预先存储的映射表,将问题文本数据中的数字参数和/或字符参数转换为对应的标准形式。
[0011]结合第一方面,本专利技术实施例提供了第一方面的第七种可能的实施方式,其中,对问题文本数据进行预处理的步骤,还包括:提取问题文本数据中的语义实体;根据预先定义的同义词库,将语义实体解析为提取模型对应的目标语义。
[0012]第二方面,本专利技术实施例还提供一种表格问答数据的处理装置,该装置应用于上述方法,该装置包括:信息获取模块,用于获取用户输入的携带有指标的问题文本数据;数据解析模块,用于提取问题文本数据中的语义类别,并基于语义类别确定反馈模板,其中,语义类别包括属性特征、条件特征和实体特征;提取模块,用于从预先存储的数据库中提取语义类别对应的指标数据;输出模块,用于将指标数据拼接至反馈模板中,以使用户得到问题文本数据对应的反馈结果。
[0013]第三方面,本专利技术实施例还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述表格问答数据的处理方法。
[0014]本专利技术实施例带来了以下有益效果:
[0015]本专利技术提供的一种表格问答数据的处理方法、装置及电子设备,将用户提出的问题文本数据分成实体特征、属性特征和条件特征三种语义类别,再根据语义类别确定反馈模板,并将抽取的指标数据拼接至反馈模版形成回复,以问答形式进行问题反馈,将表格问答形式用于指标数据的可视化,问答的形式相对于报表可以与用户进行信息交互,基于该形式的可视化反馈可以充分利用对话的上下文信息帮助用户以更低的时间成本直观精准地找到相关业务指标,提高用户查询指标的效率和精准度。
[0016]本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
[0017]为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0018]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体
实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本专利技术实施例提供的一种表格问答数据的处理方法的流程图;
[0020]图2为本专利技术实施例提供的另一种表格问答数据的处理方法的流程图;
[0021]图3为本专利技术实施例提供的一种表格问答数据的处理装置的结构示意图;
[0022]图4为本专利技术实施例提供的另一种表格问答数据的处理装置的结构示意图;
[0023]图5为本专利技术实施例提供的一种电子设备的结构示意图。
具体实施方式
[0024]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0025]工业上许多业务仍然用表格的方式存储数据进行指标的统计分析,传统的可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格问答数据的处理方法,其特征在于,所述方法包括:获取用户输入的携带有指标的问题文本数据;提取所述问题文本数据中的语义类别,并基于所述语义类别确定反馈模板,其中,所述语义类别包括属性特征、条件特征和实体特征;从预先存储的数据库中提取所述语义类别对应的指标数据;将所述指标数据拼接至所述反馈模板中,以使用户得到所述问题文本数据对应的反馈结果。2.根据权利要求1所述的方法,其特征在于,所述从预先存储的数据库中提取所述语义类别对应的指标数据的步骤,包括:基于所述语义类别对应的类别参数,确定所述问题文本数据对应的问题类别,得到所述问题类别对应的数据提取模板;将所述语义类别填充至所述数据提取模板的模板槽位中,构建预定义的数据查询逻辑;使用预先设置的提取模型执行所述数据查询逻辑,从预先存储的数据库中提取所述语义类别对应的指标数据。3.根据权利要求2所述的方法,其特征在于,所述基于所述语义类别对应的类别参数,确定所述问题文本数据对应的问题类别,得到所述问题类别对应的数据提取模板的步骤,包括:根据所述语义类别中的条件特征,确定所述问题文本数据对应的问题主类别;基于所述语义类别中的属性特征,从所述问题主类别中确定问题子类别;根据所述问题子类别关联的问题类型参数,得到所述问题文本数据对应的数据提取模板。4.根据权利要求2所述的方法,其特征在于,所述数据库包括实体表格;所述实体表格对应于所述语义类别的实体特征;所述使用预先设置的提取模型执行所述数据查询逻辑,从预先存储的数据库中提取所述语义类别对应的指标数据的步骤,包括:根据所述语义类别中的属性特征,从所述实体表格中确定所述属性特征对应的值域区间;根据所述语义类别对应的实体特征,从所述值域区间中确定所述实体特征对应的单元格项;将所述单元格项中的单元格数据确定为所述语义类别对应的指标数据。5.根据权利要求1所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:张晗杜新凯吕超谷姗姗张云皓
申请(专利权)人:阳光保险集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1