用于大潜在异质数据集统计在线分析的系统和/或方法技术方案

技术编号:9839968 阅读:155 留言:0更新日期:2014-04-02 03:15
一些实施例涉及利用复杂事件处理技术(CEP)进行缓存行为及参数的统计分析,例如,关于大潜在异质数据集(例如“大数据”)。一个专用的流挖掘装置在缓存上注册监听者,接收缓存操作的通知。对于选定的元素属性,第一模型估计属性值的概率密度函数,传送属性值分布的明确估计。第二模型分析元素在缓存中停留的时间(“有效性”)。有效性与属性值分布相结合。一个有意义的分析模型(缓存元素模型)可通过结合额外的有效性摘要统计与属性值分布而得到,该模型针对特定范围的属性值描述元素在缓存中停留的时长,以及值是如何分布的。这可以被用于通知管理任务,例如,缓存参数的优化。

【技术实现步骤摘要】

【技术保护点】
一种在一段分析时间范围内分析计算机系统缓存行为及参数的方法,包括:从第一流上接收指示有关各个元素及缓存的各缓存操作已完成的通知,每个所述操作都有操作类型,操作类型被指定为对各元素的插入、更新、或移除操作中的一种;而且对每个已接收并可从中获得选定目标元素属性的通知:从各通知中提取关于各元素键值的信息、各选定的目标元素属性、各操作类型和与各操作相关的各个时间戳;和利用提取出的信息计算值和有效性分布模型;其中值分布模型的计算,与给定通知和相关给定元素有关,其包括:更新已插入但还未移除和/或更新的元素的时间缓冲器,为给定元素收录一条记录,时间缓冲器定义了在计算值分布模型中需要考虑的元素范围;和根据时间缓冲器中的元素计算选定的目标属性的值分布;和其中有效性模型的计算,与给定通知和相关给定元素有关,其包括:当给定元素具有插入操作类型时忽略给定通知;计算给定元素的有效性值作为第一和第二时间戳的差。对于移除操作类型,第一时间戳指示给定元素被移除的时间,而第二时间戳指示给定元素被插入的时间,和对于更新操作,第一时间戳指示旧元素被移除而给定元素被插入的时间,第二时间戳指示旧元素被插入的时间;当有效性值大于相应分析时间范围的窗口尺寸时忽略给定通知;和当有效性值小于或者等于窗口尺寸时:决定分析时间范围的时间分区,即与给定元素相关的目标属性应该落入的分区;发布事件至第二流,事件指明有效性值和决定的时间分区; 和执行第二流上的查询,以获得分区中有效性值的摘要统计。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:迈克尔·卡马特克里斯多夫·海因茨尤尔根·克莱默托拜厄斯·里门施耐德里
申请(专利权)人:德商赛克公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1