数据分析系统中搜索查询的验证技术方案

技术编号:22978629 阅读:17 留言:0更新日期:2020-01-01 00:52
公开了一种用于检查搜索查询的计算机实现的方法,所述搜索查询用于在事件序列分析系统中从记录的集合检索信息。该方法包括接收搜索查询,该搜索查询包括多个谓词以及一个或多个约束,每个约束与复数谓词相关联,其中每个谓词被指定为肯定或否定,并且多个谓词与一个或多个约束一起形成逻辑图。该方法还包括从所述图中生成子图,该子图包括在搜索查询的多个谓词中被指定为肯定的一个或多个谓词。该方法还包括确定子图是否具有复数组件,以及响应于确定子图具有复数组件,使搜索查询无效。

Verification of search query in data analysis system

【技术实现步骤摘要】
【国外来华专利技术】数据分析系统中搜索查询的验证
技术介绍
本公开一般涉及数据分析,更具体地,涉及用于检查用于从数据分析系统中的记录集合中检索信息的搜索查询的技术。由于在各种领域中每天每时都在记录大量数据,因此已经进行了大量努力来开发技术以从记录集合中提取有意义信息。事件序列分析是用于从事件序列数据中检索有意义的模式的技术。这种事件序列数据的示例可以包括医院中的临床数据、社交网络服务中的消息数据等。在事件序列分析中使用的搜索查询可以包括一个或多个谓词,每个谓词用于检索键值对的列表,以及两个谓词之间的约束,每个谓词用于从两个谓词的列表中提取具有某种时间关系的元素对。由于其复杂性,通常已经开发了图形用户界面,用户可以在其上本能地创建搜索查询以从事件序列数据中提取期望的模式。但是,在典型的图形用户界面中,用户对查询的操作的组合可能会得到一种会导致用户不期望的结果的查询。这种实际上无用的查询即使它在语法上是正确的(即,无论用户的意图如何,它都可以给出一些结果),也被认为是无效的。关于用于创建搜索查询的图形用户界面,已经开发了基于正则表达式用于创建对数据序列的查询的可视化查询界面(例如,E.Zgraggen等人:用于查询和探索事件序列的可视化正则表达式(VisualRegularExpressionsforQueryingandExploringEventSequences)。CHI'15:第33届计算系统人为因素年度ACM会议论文集(CHI'15:Proceedingsofthe33rdAnnualACMConferenceonHumanFactorsinComputingSystems):2683-2692,2015)。在该文献中,已经提出了一种基于触摸的系统,其以易理解的方式提出正则表达式的完整表达能力并且已经提出了将查询规范与结果可视化进行交织。然而,该文献没有提到上述结果查询的无效性。需要一种计算机实现的方法、相关的计算机系统和计算机程序产品,能够不实际发布搜索查询就检查搜索查询的有效性,以便不给出与用户的意图不一致的结果。
技术实现思路
根据本专利技术的实施例,提供了一种用于检查用于从记录集合中检索信息的搜索查询的计算机实现的方法。该方法包括接收包括多个谓词和一个或多个约束的搜索查询,每个约束与复数(plural)谓词相关联,每个谓词被指定为肯定或否定,多个谓词与一个或多个约束一起形成逻辑图。该方法还包括从图中生成子图,该子图包括在搜索查询的多个谓词中被指定为肯定的一个或多个谓词。该方法还包括确定子图是否具有复数组件,并且响应于子图被确定为具有复数组件而使搜索查询无效。根据本专利技术实施例的方法,即使搜索查询包括被指定为否定的谓词,这通常使得难以注意到搜索查询的无效性,也可以检查搜索查询的有效性,而不需要通过实际发出搜索查询等待从记录集合中获得的结果。在优选实施例中,该方法还包括,响应于确定子图具有复数组件,通过在属于子图中的不同组件的一对谓词之间添加新约束并且在图中具有通过指定为否定的一个或多个谓词相互连接来提供备选查询。从而,用户可以及时地获得基于原始搜索查询修改的备选查询,以便给出预期与原始搜索查询相比更符合用户意图的结果。在其他优选实施例中,该方法还包括通过指定为否定的一个或多个谓词从该对谓词之间的两个或更多个约束导出新约束的内容。因此,用户可以获得具有新约束的备选查询,该新约束取决于要用新约束添加的谓词对之间的两个或更多个约束。在进一步的其他优选实施例中,导出包括在一对谓词之间的两个或更多个约束的组合的必要条件中计算最强约束作为新约束的内容。因此,用户可以获得具有新约束的备选查询,该新约束预期是从该对谓词之间的两个或更多个约束获得的可能约束中的适当约束。本文还描述并要求保护与本专利技术的一个或多个方面有关的计算机系统和计算机程序产品。根据本专利技术的另一实施例,提供了一种用于检查用于从记录的集合中检索信息的搜索查询的计算机实现的方法。该方法包括接收包括多个谓词以及一个或多个约束的搜索查询,每个谓词被指定为肯定或否定,每个约束与复数谓词相关联,多个谓词与一个或多个约束一起形成逻辑图。该方法还包括从图中生成子图,该子图包括在搜索查询中的多个谓词中被指定为肯定的一个或多个谓词。该方法还包括在子图中找到一对谓词以使得该对谓词中的谓词属于子图中的不同组件的方式。该方法还包括,响应于找到该对谓词,在该对谓词之间添加新约束以提供备选查询,其中新约束具有从图中该对谓词之间的两个或更多个约束导出的内容。根据本专利技术另一实施例的方法,即使搜索查询包括被指定为否定的谓词,用户也可以及时获得备选查询,以便给出预期比原始搜索查询与用户的意图更匹配的结果,而无需等待通过实际发布搜索查询从记录的集合中检索的结果。新约束可以具有内容,取决于要用新约束添加的谓词对之间的两个或更多个约束。根据本专利技术的另一个实施例,提供了一种用于提供用户界面的计算机程序产品,在该用户界面上用于从记录的集合中检索信息的搜索查询是可编辑的。该计算机程序产品包括计算机可读存储介质,该计算机可读存储介质具有嵌入其中的程序指令,并且该程序指令可由计算机执行以使计算机执行以下方法。该方法包括提供用户界面的屏幕,在该屏幕上以图的形式图形地表示搜索查询。搜索查询中的每个谓词由节点表示。与搜索查询中的复数谓词相关联的每个约束由边表示。通过屏幕上的操作将每个谓词指定为肯定或否定。该方法还包括:如果包括在搜索查询中指定为肯定的一个或多个谓词的子图具有复数组件,则通知当前正在显示的搜索查询是无效的。根据本专利技术实施例的计算机程序产品,即使搜索查询包括指定为否定的谓词,可以向用户通知搜索查询的有效性,无需通过发出搜索查询而等待从记录的集合获得的实际结果。通过本专利技术的技术实现了附加的特征和优点。本文详细描述了本专利技术的其他实施方案和方面,并将其视为要求保护的专利技术的一部分。附图说明在说明书结论的权利要求中特别指出并清楚地要求保护被视为本专利技术的主题。从以下结合附图的详细描述中,本专利技术的前述和其他特征和优点是显而易见的,其中:图1示出了根据本专利技术示例性实施例的事件序列分析系统的框图;图2A示出了在根据本专利技术示例性实施例的事件序列分析系统中管理的事件序列数据的数据结构;图2B描述了用于从事件序列数据中检索与搜索查询匹配的元素列表的事件序列分析和查询处理的搜索查询的简单示例;图3A和3B示出了具有用于事件序列分析的否定谓词的搜索查询的示例以及从事件序列数据中检索与搜索查询匹配的元素列表的查询处理的示例;图4描述了根据本专利技术的示例性实施例的用于检查用于从事件序列数据检索信息的搜索查询的过程的流程图;图5描述了根据本专利技术示例性实施例的用于校正搜索查询以提供备选搜索查询的过程的流程图;图6A、6B、6C和6D描述了根据本专利技术示例性实施例的校正搜索查询的处理的示例;图7描述了根据本专利技术示例性实施例的用于从事件序列数据中检索与备选有效搜索查询匹配的元素列表的事件序列分析和查询处理的备本文档来自技高网
...

【技术保护点】
1.一种用于检查用于从记录的集合中检索信息的搜索查询的计算机实现的方法,该方法包括:/n接收包括多个谓词和一个或多个约束的搜索查询,每个约束与复数谓词相关联,每个谓词被指定为肯定或否定,所述多个谓词与所述一个或多个约束一起形成逻辑图;/n从所述图中生成子图,该子图包括在所述搜索查询的所述多个谓词中被指定为肯定的一个或多个谓词;以及/n响应于确定所述子图具有复数组件,使所述搜索查询无效。/n

【技术特征摘要】
【国外来华专利技术】20170531 US 15/609,2461.一种用于检查用于从记录的集合中检索信息的搜索查询的计算机实现的方法,该方法包括:
接收包括多个谓词和一个或多个约束的搜索查询,每个约束与复数谓词相关联,每个谓词被指定为肯定或否定,所述多个谓词与所述一个或多个约束一起形成逻辑图;
从所述图中生成子图,该子图包括在所述搜索查询的所述多个谓词中被指定为肯定的一个或多个谓词;以及
响应于确定所述子图具有复数组件,使所述搜索查询无效。


2.如权利要求1所述的方法,其中,所述方法还包括:
响应于确定所述子图具有复数组件,通过在属于所述子图中的不同组件的一对谓词之间添加新约束来进一步提供备选查询,其中该对谓词在所述图中通过一个或多个指定为否定的谓词彼此连接。


3.如权利要求2所述的方法,其中,所述方法还包括:
通过指定为否定的所述一个或多个谓词,从该对谓词之间的两个或更多个约束导出所述新约束的内容。


4.如权利要求3所述的方法,其中,所述导出包括:
在该对谓词之间的所述两个或更多个约束的组合的必要条件中计算最强约束作为所述新约束的内容。


5.如权利要求3所述的方法,其中,所述两个或更多个约束包括与所述两个或更多个约束相关联的该对谓词之间的时间间隔或距离的区间,并且所述推导包括:
生成表示该对谓词之间的两个或更多个约束的部分结构;
找到在所述部分结构中串行排列的第一对约束;
通过使用具有第一备选区间的第一备选约束替换所述部分结构中的所述第一对约束,所述第一备选区间从所述第一对约束的开始的总和开始并且以所述第一对约束的结束的总和结束;以及
从获得的所述部分结构计算所述新约束的所述内容。


6.如权利要求3所述的方法,其中,所述两个或更多个约束包括与所述两个或更多个约束相关联的该对谓词之间的时间间隔或距离的区间,并且所述推导包括:
生成表示该对谓词之间的所述两个或更多个约束的部分结构;
找到在所诉部分结构中并行排列的第二对约束;
通过使用具有第二备选区间的第二备选约束替换所述部分结构中的所述第二对约束,所述第二备选区间从所述第二对约束的最大开始开始并且在所述第二对约束的最小端处结束;以及
从获得的所述部分结构计算所述新约束的所述内容。


7.如权利要求3所述的方法,其中,所述导出包括:
生成表示该对谓词之间的所述两个或更多个约束的部分结构;
找到串行排列的第一对约束;
通过使用第一备选约束替换所述第一对约束,使得存在满足所述第一对约束中的两个或更多个约束的中间谓词;
找到并行排列的第二对约束;
通过使用第二备选约束替换所述第二对约束,使得所述第二备选约束是所述第二对约束中的所述两个或更多个约束的结合;以及
从获得的所述部分结构计算所述新约束的所述内容。


8.如权利要求2所述的方法,其中提供所述备选查询包括:
使用所述新约束更新所述子图;以及
响应于所述子图被确定为连接的,提议从所述搜索查询使用所述新约束修改的备选查询;或者
响应于所述子图被确定为未连接的,重复执行所述添加和所述更新,直到所述子图变成连接的。


9.如权利要求2所述的方法,其中,所述方法还包括:
响应于所述图被确定为未连接的,使所述搜索查询无效并放弃提供所述备选查询;或者
响应于所述图被确定为连接的,确定所述搜索查询有效并且确定所述子图具有单个组件。


10.如权利要求1所述的方法,其中通过图形用户界面接收所述搜索查询,在所述图形用户界面上所述搜索查询是可编辑的,并且所述备选查询由所述图形用户界面中的视觉提示呈现,所述视觉提示指示被建议添加的所述新约束的位置。


11.如权利要求1所述的方法,其中在所述图和所述子图上,每个谓词由节点表示,并且每个约束由边表示,并且每个指定为否定的谓词是谓词的否定,每个谓词用于从集合中检索列表,每个约束用于从与每个约束相关联的谓词的相应列表中提取满足约束的一对相应元素。


12.如权利要求2所述的方法,其中,所述方法还包括:
为所述备选搜索查询中的每个谓词检索所述记录的所述集合中的列表;
对于所述备选搜索查询中的相同类型的一对谓词之间的每个约束,提取满足来自与每个约束相关联的所述谓词的相应列表的每个约束的一对相应元素,使得针对相同类型的谓词检索的相应列表被链接;以及
对于在所述备选搜索查询中指定为肯定的第一谓词对和指定为否定的第二谓词之间的每个约束,从对应于所述第一谓词的列表中移除满足每个约束的元素。


13.一种用于检查用于从记录的集合中检索信息的搜索查询的计算机实现的方法,该方法包括:
接收包括多个谓词和一个或多个约束的搜索查询,每个约束与复数谓词相关联,每个谓词被指定为肯定或否定,所述多个谓词与所述一个或多个约束一起形成逻辑图形;
从所述图中生成子图,该子图包括在所述搜索查询的所述多个谓词中被指定为肯定的一个或多个谓词;
在所述子图中找到一对谓词,使得该对谓词中的一个或多个谓词属于所述子图中的不同组件;以及<...

【专利技术属性】
技术研发人员:宅间大介伊川洋平
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1