一种统计数据的查询方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24853129 阅读:24 留言:0更新日期:2020-07-10 19:07
本申请提供了一种统计数据的查询方法、装置、电子设备及存储介质,其中,该方法包括:接收用户端输入的查询信息;将查询信息划分为至少一个查询词条;针对每个查询词条,从预设的词条索引库中查找与该查询词条对应的词条索引文件;基于查找到的词条索引文件确定该查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系;基于每个查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系,确定查询信息与各个原始统计数据之间的匹配度;根据确定的匹配度从各个原始统计数据中选取目标统计数据,并返回至用户端。采用上述方案,能够实现统计数据高效且针对性的查询。

【技术实现步骤摘要】
一种统计数据的查询方法、装置、电子设备及存储介质
本申请涉及数据处理
,具体而言,涉及一种统计数据的查询方法、装置、电子设备及存储介质。
技术介绍
统计数据作为一种表示地理区域自然经济要素特征、规模、结构、水平等指标的数据,可以为城市或地区管理过程中的各种分析和决策提供数据支持。其中,上述统计数据不仅可以包括统计指标及其对应的指标值,还可以涵盖有地区、时间等相关信息,如全国国内生产总值(GrossDomesticProduct,GDP)的同比增长率为3.8、河南省2018年度的GDP为4.81万亿元等。可知,统计数据的表现形式较为复杂,除此之外,还存在各种类型的统计数据。如何从大量种类丰富的统计数据中查询得到用户所需的数据成为当下需要解决的问题。
技术实现思路
有鉴于此,本申请的目的在于提供一种统计数据的查询方法、装置、电子设备及存储介质,以实现统计数据高效且针对性的查询。第一方面,本申请提供了一种统计数据的查询方法,所述方法包括:接收用户端输入的查询信息;将所述查询信息划分为至少一个查询词条;针对每个查询词条,从预设的词条索引库中查找与该查询词条对应的词条索引文件;基于查找到的词条索引文件确定该查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系;基于每个查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系,确定所述查询信息与各个原始统计数据之间的匹配度;根据确定的匹配度从各个原始统计数据中选取目标统计数据,并返回至所述用户端。在一种实施方式中,按照以下步骤生成所述词条索引库:获取各个原始统计数据;针对每个原始统计数据,将该原始统计数据划分为至少一个统计词条;基于每个原始统计数据划分后的至少一个统计词条,确定统计词条组;针对统计词条组中的每个统计词条,确定该统计词条所属的至少一个原始统计数据;建立该统计词条与该统计词条所属的至少一个原始统计数据之间的匹配关系;基于建立的所述匹配关系确定与该统计词条对应的词条索引文件;将统计词条组中的各个统计词条对应的词条索引文件进行组合,存储至预设的词条索引库。在一种实施方式中,所述基于建立的所述匹配关系确定与该统计词条对应的词条索引文件,包括:针对统计词条组中的每个统计词条,基于建立的所述匹配关系确定该统计词条与每个原始统计数据之间的匹配值;按照原始统计数据的预设排列顺序将各个匹配值进行合并,得到与该统计词条对应的匹配向量;根据统计词条组中的每个统计词条对应的匹配向量,生成与该统计词条对应的词条索引文件。在一种实施方式中,所述基于建立的所述匹配关系确定该统计词条与每个原始统计数据之间的匹配值,包括:针对每个原始统计数据,若所述统计词条组中的任一个统计词条出现在该原始统计数据中,则确定该统计词条与该原始统计数据之间的匹配值为1;若所述统计词条组中的各个统计词条未出现在该原始统计数据中,则确定该统计词条与该原始统计数据之间的匹配值为0;所述根据统计词条组中的每个统计词条对应的匹配向量,生成与该统计词条对应的词条索引文件,包括:根据统计词条组中的每个统计词条对应的匹配向量,确定与该匹配向量中取值为1的匹配值对应的至少一个原始统计数据;确定所述至少一个原始统计数据中每相邻的两个原始统计数据之间的排列编号差值;基于各个相邻的两个原始统计数据之间的排列编号差值,生成与该统计词条对应的词条索引文件。在一种实施方式中,所述基于每个查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系,确定所述查询信息与各个原始统计数据之间的匹配度,包括:针对所述查询信息中的每个查询词条,基于该查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系,确定该查询词条所属的至少一个原始统计数据;基于各个查询词条所属的至少一个原始统计数据,确定原始统计数据组;针对所述原始统计数据组中的每个原始统计数据,确定所述查询信息中所属该原始统计数据的查询词条的个数;基于所述个数确定所述查询信息与该原始统计数据之间的匹配度。在一种实施方式中,所述根据确定的匹配度从各个原始统计数据中选取目标统计数据,包括:将匹配度最高的原始统计数据作为目标统计数据;或者,将匹配度排列在预设名次之前的原始统计数据作为目标统计数据。在一种实施方式中,若选取出的目标统计数据有多个,且多个目标统计数据对应的匹配度相同,则在根据确定的匹配度从各个原始统计数据中选取目标统计数据之后,返回至所述用户端之前,还包括:针对多个目标统计数据中的每个目标统计数据,确定该目标统计数据中,与所述查询信息对应的统计词条所在位置;按照与所述查询信息对应的统计词条所在位置由前至后的顺序,对各个目标统计数据进行排序;将排序后的多个目标统计数据返回至所述用户端。第二方面,本申请还提供了一种统计数据的查询装置,所述装置包括:接收模块,用于接收用户端输入的查询信息;划分模块,用于将所述查询信息划分为至少一个查询词条;查找模块,用于针对每个查询词条,从预设的词条索引库中查找与该查询词条对应的词条索引文件;基于查找到的词条索引文件确定该查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系;确定模块,用于基于每个查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系,确定所述查询信息与各个原始统计数据之间的匹配度;选取模块,用于根据确定的匹配度从各个原始统计数据中选取目标统计数据,并返回至所述用户端。第三方面,本申请还提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令时实现如第一方面及其各种实施方式任一所述统计数据的查询方法的步骤。第四方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面及其各种实施方式任一所述统计数据的查询方法的步骤。采用上述方案,其在接收到用户端输入的查询信息之后,可以将该查询信息划分为至少一个查询词条,然后可以针对每个查询词条,从预设的词条索引库中查找与该查询词条对应的词条索引文件,并基于查找到的词条索引文件确定该查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系,最后基于每个查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系,确定所述查询信息与各个原始统计数据之间的匹配度,并根据确定的匹配度从各个原始统计数据中选取目标统计数据,并返回至所述用户端。上述方案能够先进行词条拆分,再基于词条索引文件进行查询词条与原始统计数据之间的匹配关系的确定,以进一步确定查询信息与原始统计数据之间的匹配度,最后能够基于匹配度确定最终的查询结果,从而能够实现统计数据高效且针对性的查询。本文档来自技高网...

【技术保护点】
1.一种统计数据的查询方法,其特征在于,所述方法包括:/n接收用户端输入的查询信息;/n将所述查询信息划分为至少一个查询词条;/n针对每个查询词条,从预设的词条索引库中查找与该查询词条对应的词条索引文件;基于查找到的词条索引文件确定该查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系;/n基于每个查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系,确定所述查询信息与各个原始统计数据之间的匹配度;/n根据确定的匹配度从各个原始统计数据中选取目标统计数据,并返回至所述用户端。/n

【技术特征摘要】
1.一种统计数据的查询方法,其特征在于,所述方法包括:
接收用户端输入的查询信息;
将所述查询信息划分为至少一个查询词条;
针对每个查询词条,从预设的词条索引库中查找与该查询词条对应的词条索引文件;基于查找到的词条索引文件确定该查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系;
基于每个查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系,确定所述查询信息与各个原始统计数据之间的匹配度;
根据确定的匹配度从各个原始统计数据中选取目标统计数据,并返回至所述用户端。


2.根据权利要求1所述的查询方法,其特征在于,按照以下步骤生成所述词条索引库:
获取各个原始统计数据;
针对每个原始统计数据,将该原始统计数据划分为至少一个统计词条;
基于每个原始统计数据划分后的至少一个统计词条,确定统计词条组;
针对统计词条组中的每个统计词条,确定该统计词条所属的至少一个原始统计数据;建立该统计词条与该统计词条所属的至少一个原始统计数据之间的匹配关系;基于建立的所述匹配关系确定与该统计词条对应的词条索引文件;
将统计词条组中的各个统计词条对应的词条索引文件进行组合,存储至预设的词条索引库。


3.根据权利要求2所述的查询方法,其特征在于,所述基于建立的所述匹配关系确定与该统计词条对应的词条索引文件,包括:
针对统计词条组中的每个统计词条,基于建立的所述匹配关系确定该统计词条与每个原始统计数据之间的匹配值;按照原始统计数据的预设排列顺序将各个匹配值进行合并,得到与该统计词条对应的匹配向量;
根据统计词条组中的每个统计词条对应的匹配向量,生成与该统计词条对应的词条索引文件。


4.根据权利要求3所述的查询方法,其特征在于,所述基于建立的所述匹配关系确定该统计词条与每个原始统计数据之间的匹配值,包括:
针对每个原始统计数据,若所述统计词条组中的任一个统计词条出现在该原始统计数据中,则确定该统计词条与该原始统计数据之间的匹配值为1;若所述统计词条组中的各个统计词条未出现在该原始统计数据中,则确定该统计词条与该原始统计数据之间的匹配值为0;
所述根据统计词条组中的每个统计词条对应的匹配向量,生成与该统计词条对应的词条索引文件,包括:
根据统计词条组中的每个统计词条对应的匹配向量,确定与该匹配向量中取值为1的匹配值对应的至少一个原始统计数据;
确定所述至少一个原始统计数据中每相邻的两个原始统计数据之间的排列编号差值;
基于各个相邻的两个原始统计数据之间的排列编号差值,生成与该统计词条对应的词条索引文件。


5.根据权利要求1所述的查询方法,其特征...

【专利技术属性】
技术研发人员:王卓飞白欢朋蒋兴荣曾曲
申请(专利权)人:北京华通人商用信息有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1