System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据查询方法、装置、计算机设备和存储介质制造方法及图纸_技高网

数据查询方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:42190101 阅读:5 留言:0更新日期:2024-07-30 18:40
本申请涉及一种数据查询方法、装置、计算机设备和存储介质,涉及大数据技术领域。所述方法包括:获取对业务应用中的对话交互页面输入的用户提问文本;用户提问文本为目标用户对业务数据的数据查询需求的自然语言表达;对用户提问文本进行检索要素提取处理,得到待检索文本;在预设业务数据库中,根据待检索文本中的意图关键词进行数据检索,得到多个检索结果,并基于目标用户的操作行为数据调整多个检索结果的排序,得到与业务数据相匹配的检索结果集合;根据目标用户的数据权限信息和检索结果集合,生成用户提问文本对应的数据查询结果。采用本方法能够为用户在海量业务数据中快速查找到所需数据,降低了用数门槛,有效提升了用数效率。

【技术实现步骤摘要】

本申请涉及大数据,特别是涉及一种数据查询方法、装置、计算机设备、存储介质和计算机程序产品。


技术介绍

1、随着金融领域数字化发展,数据资产不断累积,企业数据资产的类型和量级得到了较大提升,但同时也对业务人员、管理人员分析、挖掘、利用海量的数据资产带来了更高难度。

2、面对海量的报表和指标数据,传统的数据查询方式需要用户在掌握输入条件的前提下才能呈现相应的数据结果。由于指标管理体系下,数据覆盖领域广、不同领域专业性强、指标业务规则较为复杂、口径繁多,业务人员查询相应的数据需要熟知业务指标含义并选择相应功能模块,通过规范性选择、输入等操作方式进行交互以获取处理结果。传统方法对用户的用数门槛要求高,导致海量数据无法得到有效利用,难以为用户提供高效的决策信息。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提升用数效率的数据查询方法、装置、计算机设备、存储介质和计算机程序产品。

2、第一方面,本申请提供了一种数据查询方法,包括:

3、获取对业务应用中的对话交互页面输入的用户提问文本;所述用户提问文本为目标用户对业务数据的数据查询需求的自然语言表达;

4、对所述用户提问文本进行检索要素提取处理,得到待检索文本;所述待检索文本包含与所述业务数据关联的意图关键词;

5、在预设业务数据库中,根据所述待检索文本中的意图关键词进行数据检索,得到多个检索结果,并基于所述目标用户的操作行为数据调整所述多个检索结果的排序,得到与所述业务数据相匹配的检索结果集合;

6、根据所述目标用户的数据权限信息和所述检索结果集合,生成所述用户提问文本对应的数据查询结果;所述数据查询结果用于在所述对话交互页面中渲染展示出所述业务数据的链接信息,所述链接信息用于在所述预设业务数据库中访问所述业务数据。

7、在其中一个实施例中,所述对所述用户提问文本进行检索要素提取处理,得到待检索文本,包括:

8、对所述用户提问文本进行检索要素提取处理,提取出与所述业务数据关联的意图关键词;所述检索要素提取处理包括分词处理、噪声去除、缺失值处理、特征提取中的至少一项;

9、基于与所述业务数据关联的意图关键词,得到所述待检索文本。

10、在其中一个实施例中,所述在预设业务数据库中,根据所述待检索文本中的意图关键词进行数据检索,得到多个检索结果,包括:

11、将所述待检索文本中的意图关键词与所述预设业务数据库中的索引进行相似度计算,得到满足相似度条件的多个检索结果。

12、在其中一个实施例中,所述将所述待检索文本中的意图关键词与所述预设业务数据库中的索引进行相似度计算,得到满足相似度条件的多个检索结果,包括:

13、按照预设词袋模型,对所述意图关键词与所述预设业务数据库中的索引逐一计算相似度;所述预设词袋模型为基于所述预设业务数据库中指标数据和报表数据所构建的字典生成的词袋模型;

14、获取相似度排序符合预设排序范围的检索结果,作为所述多个检索结果。

15、在其中一个实施例中,所述方法还包括:

16、根据所述预设业务数据库中指标数据和报表数据,构建数据语料;

17、基于所述数据语料进行分词与停用词补充处理的结果,构建所述字典;

18、根据所述字典生成的词袋模型,以及所述词袋模型的词频与逆文本频率指数值,得到所述预设词袋模型;所述词频与逆文本频率指数值用于计算所述意图关键词与所述预设业务数据库中索引的相似度。

19、在其中一个实施例中,所述基于所述目标用户的操作行为数据调整所述多个检索结果的排序,得到与所述业务数据相匹配的检索结果集合,包括:

20、根据所述目标用户的操作行为数据,确定行为特征参数;所述操作行为数据为基于所述目标用户在所述业务应用中对历史数据查询结果的操作行为得到的;

21、采用搜索与数据分析引擎,按照所述行为特征参数调整所述多个检索结果的排序,得到所述检索结果集合。

22、在其中一个实施例中,所述根据所述目标用户的数据权限信息和所述检索结果集合,生成所述用户提问文本对应的数据查询结果,包括:

23、根据所述检索结果集合中携带的所述目标用户的标识信息,获取所述目标用户的数据权限信息;

24、按照所述数据权限信息对所述检索结果集合进行数据权限过滤,得到过滤后检索结果;

25、将所述过滤后检索结果与所述预设业务数据库中的数据链接进行关联,得到所述数据查询结果。

26、第二方面,本申请还提供了一种数据查询装置,包括:

27、用户提问文本获取模块,用于获取对业务应用中的对话交互页面输入的用户提问文本;所述用户提问文本为目标用户对业务数据的数据查询需求的自然语言表达;

28、检索要素提取模块,用于对所述用户提问文本进行检索要素提取处理,得到待检索文本;所述待检索文本包含与所述业务数据关联的意图关键词;

29、数据检索模块,用于在预设业务数据库中,根据所述待检索文本中的意图关键词进行数据检索,得到多个检索结果,并基于所述目标用户的操作行为数据调整所述多个检索结果的排序,得到与所述业务数据相匹配的检索结果集合;

30、数据查询结果生成模块,用于根据所述目标用户的数据权限信息和所述检索结果集合,生成所述用户提问文本对应的数据查询结果;所述数据查询结果用于在所述对话交互页面中渲染展示出所述业务数据的链接信息,所述链接信息用于在所述预设业务数据库中访问所述业务数据。

31、在其中一个实施例中,所述检索要素提取模块包括:

32、意图关键词提取子模块,用于对所述用户提问文本进行检索要素提取处理,提取出与所述业务数据关联的意图关键词;所述检索要素提取处理包括分词处理、噪声去除、缺失值处理、特征提取中的至少一项;

33、待检索文本得到子模块,用于基于与所述业务数据关联的意图关键词,得到所述待检索文本。

34、在其中一个实施例中,所述数据检索模块包括:

35、索引检索子模块,用于将所述待检索文本中的意图关键词与所述预设业务数据库中的索引进行相似度计算,得到满足相似度条件的多个检索结果。

36、在其中一个实施例中,所述索引检索子模块包括:

37、相似度计算单元,用于按照预设词袋模型,对所述意图关键词与所述预设业务数据库中的索引逐一计算相似度;所述预设词袋模型为基于所述预设业务数据库中指标数据和报表数据所构建的字典生成的词袋模型;

38、多个检索结果得到单元,用于获取相似度排序符合预设排序范围的检索结果,作为所述多个检索结果。

39、在其中一个实施例中,所述装置还包括:

40、数据语料构建模块,用于根据所述预设业务数据库中指标数据和报表数据,构建数据语料;

41、字典构建模块,用于基于所述数据语本文档来自技高网...

【技术保护点】

1.一种数据查询方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述用户提问文本进行检索要素提取处理,得到待检索文本,包括:

3.根据权利要求1所述的方法,其特征在于,所述在预设业务数据库中,根据所述待检索文本中的意图关键词进行数据检索,得到多个检索结果,包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述待检索文本中的意图关键词与所述预设业务数据库中的索引进行相似度计算,得到满足相似度条件的多个检索结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述目标用户的操作行为数据调整所述多个检索结果的排序,得到与所述业务数据相匹配的检索结果集合,包括:

7.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户的数据权限信息和所述检索结果集合,生成所述用户提问文本对应的数据查询结果,包括:

8.一种数据查询装置,其特征在于,所述装置包括:

9.根据权利要求8所述的装置,其特征在于,所述检索要素提取模块包括:

10.根据权利要求8所述的装置,其特征在于,所述数据检索模块包括:

11.根据权利要求10所述的装置,其特征在于,所述索引检索子模块包括:

12.根据权利要求11所述的装置,其特征在于,所述装置还包括:

13.根据权利要求8所述的装置,其特征在于,所述数据检索模块包括:

14.根据权利要求8所述的装置,其特征在于,所述数据查询结果生成模块包括:

15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

17.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种数据查询方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述用户提问文本进行检索要素提取处理,得到待检索文本,包括:

3.根据权利要求1所述的方法,其特征在于,所述在预设业务数据库中,根据所述待检索文本中的意图关键词进行数据检索,得到多个检索结果,包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述待检索文本中的意图关键词与所述预设业务数据库中的索引进行相似度计算,得到满足相似度条件的多个检索结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述目标用户的操作行为数据调整所述多个检索结果的排序,得到与所述业务数据相匹配的检索结果集合,包括:

7.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户的数据权限信息和所述检索结果集合,生成所述用户提问文本对应的数据查询结果,包括:

8.一种数据查询装置,其特征在于,所述装置包括:<...

【专利技术属性】
技术研发人员:王雪峰蒋英杰洪耀辉蒋梅群王雪凝彭薇雯
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1