【技术实现步骤摘要】
【国外来华专利技术】数据分析系统中搜索查询的验证
技术介绍
本公开一般涉及数据分析,更具体地,涉及用于检查用于从数据分析系统中的记录集合中检索信息的搜索查询的技术。由于在各种领域中每天每时都在记录大量数据,因此已经进行了大量努力来开发技术以从记录集合中提取有意义信息。事件序列分析是用于从事件序列数据中检索有意义的模式的技术。这种事件序列数据的示例可以包括医院中的临床数据、社交网络服务中的消息数据等。在事件序列分析中使用的搜索查询可以包括一个或多个谓词,每个谓词用于检索键值对的列表,以及两个谓词之间的约束,每个谓词用于从两个谓词的列表中提取具有某种时间关系的元素对。由于其复杂性,通常已经开发了图形用户界面,用户可以在其上本能地创建搜索查询以从事件序列数据中提取期望的模式。但是,在典型的图形用户界面中,用户对查询的操作的组合可能会得到一种会导致用户不期望的结果的查询。这种实际上无用的查询即使它在语法上是正确的(即,无论用户的意图如何,它都可以给出一些结果),也被认为是无效的。关于用于创建搜索查询的图形用户界面,已经开发了基于正则表达式用于创建对数据序列的查询的可视化查询界面(例如,E.Zgraggen等人:用于查询和探索事件序列的可视化正则表达式(VisualRegularExpressionsforQueryingandExploringEventSequences)。CHI'15:第33届计算系统人为因素年度ACM会议论文集(CHI'15:Proceedingsofthe33rdAnnualACMConferenceonHumanFa ...
【技术保护点】
1.一种用于检查用于从记录的集合中检索信息的搜索查询的计算机实现的方法,该方法包括:/n接收包括多个谓词和一个或多个约束的搜索查询,每个约束与复数谓词相关联,每个谓词被指定为肯定或否定,所述多个谓词与所述一个或多个约束一起形成逻辑图;/n从所述图中生成子图,该子图包括在所述搜索查询的所述多个谓词中被指定为肯定的一个或多个谓词;以及/n响应于确定所述子图具有复数组件,使所述搜索查询无效。/n
【技术特征摘要】
【国外来华专利技术】20170531 US 15/609,2461.一种用于检查用于从记录的集合中检索信息的搜索查询的计算机实现的方法,该方法包括:
接收包括多个谓词和一个或多个约束的搜索查询,每个约束与复数谓词相关联,每个谓词被指定为肯定或否定,所述多个谓词与所述一个或多个约束一起形成逻辑图;
从所述图中生成子图,该子图包括在所述搜索查询的所述多个谓词中被指定为肯定的一个或多个谓词;以及
响应于确定所述子图具有复数组件,使所述搜索查询无效。
2.如权利要求1所述的方法,其中,所述方法还包括:
响应于确定所述子图具有复数组件,通过在属于所述子图中的不同组件的一对谓词之间添加新约束来进一步提供备选查询,其中该对谓词在所述图中通过一个或多个指定为否定的谓词彼此连接。
3.如权利要求2所述的方法,其中,所述方法还包括:
通过指定为否定的所述一个或多个谓词,从该对谓词之间的两个或更多个约束导出所述新约束的内容。
4.如权利要求3所述的方法,其中,所述导出包括:
在该对谓词之间的所述两个或更多个约束的组合的必要条件中计算最强约束作为所述新约束的内容。
5.如权利要求3所述的方法,其中,所述两个或更多个约束包括与所述两个或更多个约束相关联的该对谓词之间的时间间隔或距离的区间,并且所述推导包括:
生成表示该对谓词之间的两个或更多个约束的部分结构;
找到在所述部分结构中串行排列的第一对约束;
通过使用具有第一备选区间的第一备选约束替换所述部分结构中的所述第一对约束,所述第一备选区间从所述第一对约束的开始的总和开始并且以所述第一对约束的结束的总和结束;以及
从获得的所述部分结构计算所述新约束的所述内容。
6.如权利要求3所述的方法,其中,所述两个或更多个约束包括与所述两个或更多个约束相关联的该对谓词之间的时间间隔或距离的区间,并且所述推导包括:
生成表示该对谓词之间的所述两个或更多个约束的部分结构;
找到在所诉部分结构中并行排列的第二对约束;
通过使用具有第二备选区间的第二备选约束替换所述部分结构中的所述第二对约束,所述第二备选区间从所述第二对约束的最大开始开始并且在所述第二对约束的最小端处结束;以及
从获得的所述部分结构计算所述新约束的所述内容。
7.如权利要求3所述的方法,其中,所述导出包括:
生成表示该对谓词之间的所述两个或更多个约束的部分结构;
找到串行排列的第一对约束;
通过使用第一备选约束替换所述第一对约束,使得存在满足所述第一对约束中的两个或更多个约束的中间谓词;
找到并行排列的第二对约束;
通过使用第二备选约束替换所述第二对约束,使得所述第二备选约束是所述第二对约束中的所述两个或更多个约束的结合;以及
从获得的所述部分结构计算所述新约束的所述内容。
8.如权利要求2所述的方法,其中提供所述备选查询包括:
使用所述新约束更新所述子图;以及
响应于所述子图被确定为连接的,提议从所述搜索查询使用所述新约束修改的备选查询;或者
响应于所述子图被确定为未连接的,重复执行所述添加和所述更新,直到所述子图变成连接的。
9.如权利要求2所述的方法,其中,所述方法还包括:
响应于所述图被确定为未连接的,使所述搜索查询无效并放弃提供所述备选查询;或者
响应于所述图被确定为连接的,确定所述搜索查询有效并且确定所述子图具有单个组件。
10.如权利要求1所述的方法,其中通过图形用户界面接收所述搜索查询,在所述图形用户界面上所述搜索查询是可编辑的,并且所述备选查询由所述图形用户界面中的视觉提示呈现,所述视觉提示指示被建议添加的所述新约束的位置。
11.如权利要求1所述的方法,其中在所述图和所述子图上,每个谓词由节点表示,并且每个约束由边表示,并且每个指定为否定的谓词是谓词的否定,每个谓词用于从集合中检索列表,每个约束用于从与每个约束相关联的谓词的相应列表中提取满足约束的一对相应元素。
12.如权利要求2所述的方法,其中,所述方法还包括:
为所述备选搜索查询中的每个谓词检索所述记录的所述集合中的列表;
对于所述备选搜索查询中的相同类型的一对谓词之间的每个约束,提取满足来自与每个约束相关联的所述谓词的相应列表的每个约束的一对相应元素,使得针对相同类型的谓词检索的相应列表被链接;以及
对于在所述备选搜索查询中指定为肯定的第一谓词对和指定为否定的第二谓词之间的每个约束,从对应于所述第一谓词的列表中移除满足每个约束的元素。
13.一种用于检查用于从记录的集合中检索信息的搜索查询的计算机实现的方法,该方法包括:
接收包括多个谓词和一个或多个约束的搜索查询,每个约束与复数谓词相关联,每个谓词被指定为肯定或否定,所述多个谓词与所述一个或多个约束一起形成逻辑图形;
从所述图中生成子图,该子图包括在所述搜索查询的所述多个谓词中被指定为肯定的一个或多个谓词;
在所述子图中找到一对谓词,使得该对谓词中的一个或多个谓词属于所述子图中的不同组件;以及<...
【专利技术属性】
技术研发人员:宅间大介,伊川洋平,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。