用自然语言表达式定义跨越数据库中多行数据的数据可视化计算制造技术

技术编号:33883132 阅读:22 留言:0更新日期:2022-06-22 17:14
一种在包括显示器、一个或更多个处理器和存储器的计算设备处执行的方法。该方法包括接收用于指定数据源的用户输入。该方法包括在图形用户界面的第一区域中接收指定与数据源相关的自然语言命令的第一用户输入。该设备基于所述第一用户输入来确定自然语言命令包括表计算表达式。根据该确定,该方法识别数据源中的第二数据字段,根据第二数据字段针对日期范围内的每个时间段来聚合第一数据字段的值。计算针对每个连续的时间段对而聚合的值之间的相应差值。生成并显示数据可视化。生成并显示数据可视化。生成并显示数据可视化。

【技术实现步骤摘要】
【国外来华专利技术】用自然语言表达式定义跨越数据库中多行数据的数据可视化计算
[0001]相关申请
[0002]本申请要求于2019年9月6日提交的标题为“Interface Defaults for Vague Modifiers in Natural Language Interfaces for Visual Analysis”的序列号为62/897,187的美国临时申请的优先权,该美国临时申请通过引用以其整体并入本文。
[0003]本申请与以下申请相关,其中每一个申请都通过引用以其整体并入本文:(i)2017年4月12日提交的标题为“Systems and Methods of Using Natural Language Processing for Visual Analysis of a Data Set”的第15/486,265号美国专利申请;(ii)2017年11月6日提交的标题为“Systems and Methods of Using Natural Language Processing for Visual Analysis of a Data Set”的第15/804,991号美国专利申请;(iii)2018年5月11日提交的标题为“Applying Natural Language Pragmatics in a Data Visualization User Interface”的第15/978,062号美国专利申请;(iv)2018年12月13日提交的标题为“Identifying Intent in Visual Analytical Conversations”的第16/219,406号美国专利申请;(v)2018年9月18日提交的标题为“Analyzing Natural Language Expressions in a Data Visualization User Interface”的第16/134,892号美国专利申请;(vi)2018年5月11日提交的标题为“Data Visualization User Interface Using Cohesion of Sequential Natural Language Commands”的第15/978,066号美国专利申请;(vii)2018年5月11日提交的标题为“Updating Displayed Data Visualizations According to Identified Conversation Centers in Natural Language Commands”的第15/978,067号美国专利申请;(viii)2018年10月21日提交的标题为“Determining Levels of Details for Data Visualizations Using Natural Language Constructs”的第16/166,125号美国专利申请;(ix)2018年9月18日提交的标题为“Natural Language Interface for Building Data Visualizations,Including Cascading Edits to Filter Expressions”的第16/134,907号美国专利申请;(x)2018年12月27日提交的标题为“Analyzing Underspecified Natural Language Utterances in a Data Visualization User Interface”的第16/234,470号美国专利申请;(xi)2019年10月14日提交的标题为“Incremental Updates to Natural Language Expressions in a Data Visualization User Interface”的第16/601,437号美国专利申请;(xii)2019年11月11日提交的标题为“Using Refinement Widgets for Data Fields Referenced by Natural Language Expressions in a Data Visualization User Interface”的第16/680,431号美国专利申请,以及2015年7月16日提交的标题为“Systems and Methods for using Multiple Aggregation Levels in a Single Data Visualization”的第14/801,750号美国专利申请。


[0004]所公开的实施方式总体上涉及数据可视化,并且更具体地涉及使用户能够与数据
可视化进行交互并使用自然语言表达式来分析数据的系统、方法和用户界面。
[0005]背景
[0006]数据可视化应用程序使用户能够直观地理解数据集。对数据集的可视分析(包括分布、趋势、离群值和其他因子)对于制定业务决策非常重要。一些数据集是非常大的或复杂的,且包括许多数据字段。可以使用各种工具(包括具有多种数据可视化的仪表板和帮助执行可视分析任务的自然语言界面)来帮助理解和分析数据。
[0007]概述
[0008]使用自然语言表达式来生成数据可视化为用户提供了对数据可视化特征的更大可访问性,包括更新字段和改变数据的过滤方式。自然语言界面使用户能够在经过很少训练或不经过训练的情况下开发有价值的数据可视化。
[0009]需要改进的系统和方法来支持和细化自然语言与可视分析系统的交互。本公开描述了通过解析包括表计算表达式(table calculation expressions)的自然语言话语来提高自然语言界面的有效性的数据可视化平台。该数据可视化应用程序使用由中间语言(在本文中也被称为ArkLang)施加的句法和语义约束来解析自然语言话语。中间语言将自然语言话语翻译成由数据可视化应用程序处理的查询,以生成有用的数据可视化。因此,中间语言减轻了用户的认知负担,并产生了更有效的人机界面。本公开还描述了使用户能够使用会话操作和细化微件(refinement widget)来更新现有数据可视化的数据可视化应用程序。因此,这样的方法和界面减轻了用户的认知负担,并产生了更有效的人机界面。对于电池供电的设备,这样的方法和界面节省了电力并增加了电池充电间隔的时间。这样的方法和界面可以补充或替换用于使数据可视化的传统方法。根据本说明书中的描述和附图,其他实施方式和优点对于本领域技术人员来说可能是明显的。
[0010]根据一些实施方式,一种方法在包括显示器的计算设备处执行。计算设备包括一个或更多个处理器以及存储器。存储器存储被配置用于由一个或更多个处理器执行的一个或更多个程序。该方法包括接收用于指定数据源的用户输入。该方法包括在图形用户界面的第一区域中接收第一用户输入,该第一用户输入指定与数据源相关的自然语言命令。该设备基于第一用户输入来确定自然语言命令包括表计算表达式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种使用自然语言对数据集进行可视分析的方法,包括:在计算设备处执行以下操作,所述计算设备具有显示器、一个或更多个处理器和存储器,所述存储器存储被配置为由所述一个或更多个处理器执行的一个或更多个程序:接收指定数据源的用户输入;在图形用户界面的第一区域中接收第一用户输入,所述第一用户输入指定与所述数据源相关的自然语言命令;基于所述第一用户输入来确定所述自然语言命令包括表计算表达式,其中,所述表计算表达式指定来自所述数据源的第一数据字段的聚合的值在连续的时间段内的变化,并且所述时间段中的每一个表示相同的时间量;根据所述确定:识别所述数据源中的第二数据字段,其中,所述第二数据字段不同于所述第一数据字段,并且所述第二数据字段跨越包括所述时间段的日期范围;根据所述第二数据字段,针对所述日期范围内的所述时间段中的每一个来聚合所述第一数据字段的值;针对每个连续的时间段对来计算所述聚合的值之间的相应差值;生成包括多个数据标记的数据可视化,所述数据标记中的每一个对应于针对在所述日期范围内的所述时间段中的每一个而计算的差值之一;和显示所述数据可视化。2.根据权利要求1所述的方法,其中,所述时间段是:年、季度、月、周或日。3.根据权利要求1所述的方法,还包括在所述图形用户界面中显示来自所述数据源的字段名称。4.根据权利要求1所述的方法,其中,针对每个连续的时间段对来计算所述聚合的值之间的相应差值包括:计算所述聚合的值之间的绝对差值;或计算所述聚合的值之间的百分比差值。5.根据权利要求4所述的方法,其中,绝对差值和百分比差值被显示为所述图形用户界面中的用户可选择的选项。6.根据权利要求1所述的方法,其中,所述第一数据字段是度量。7.根据权利要求1所述的方法,其中,确定所述自然语言命令包括表计算表达式包括:解析所述自然语言命令;和根据与上下文无关的语法形成中间表达式,包括在所述自然语言命令中识别计算类型。8.根据权利要求7所述的方法,其中,所述中间表达式包括所述计算类型、聚合表达式和来自所述数据源的寻址字段。9.根据权利要求8所述的方法,还包括:根据确定所述中间表达式省略了用于生成所述数据可视化的足够信息,使用一个或更多个推断规则来推断与所述数据源相关联的省略信息,所述一个或更多个推断规则基于所述与上下文无关的语法所施加的句法和语义约束。10.根据权利要求8所述的方法,其中,所述第二数据字段是所述寻址字段。
11.根据权利要求1所述的方法,还包括:接收将所述连续时间段从第一时间段修改为第二时间段的第二用户输入,其中,所述第一时间段中的每一个表示相同的第一时间量,而所述第二时间段中的每一个表示相同的第二时间量;和响应于所述第二用户输入:针对所述第二时间段中的每一个,聚合所述第一数据字段在所述第二时间量内的值;针对连续的第二时间段对来计算所述聚合的值之间的相应第一差值;生成包括多个第二数据标记的第二数据可视化,所述第二数据标记中的每一个对应于针对在所述日期范围内的所述第二时间段中的每一个而计算的第一差值;和显示所述第二数据可视化。12.根据权利要求11所述的方法,其中,所述第二用户输入包括用于将所述时间段从所述第一时间量替换为所述第二时间量的用户命令;和所述方法还包括:在所述图形用户界面的所述第一区域中接收所述第二用户输入。13.根据权利要求11所述的方法,其中,所述第二用户输入包括在所述图形用户界面的第二区域处用户对所述第一时间量的选择,所述第二区域不同于所述第一区域。14.根据权利要求1所述的方法,还包括:在所述第一区域中接收第三用户输入,所述第三用户输入指定与...

【专利技术属性】
技术研发人员:埃利亚娜
申请(专利权)人:塔谱软件公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1