跟踪数据世系。方法可在包括多个互连的系统的网络计算环境中实施,其中数据在这些系统之间共享。方法包括访问数据集。数据集与世系元数据相关联。世系元数据包括指示数据的原始源的数据、已对数据集执行了操作的一个或多个中间实体和对数据集执行的操作的本质。第一实体对数据集执行一操作。作为对数据集执行第一操作的结果,该方法包括更新世系元数据以指示第一实体对数据集执行了该操作。该方法进一步包括提供用于确定世系元数据是否由于该世系元数据已发生了以下中的至少一个而已受损的功能:被从与数据集的关联中移除、被破坏或是不完整的。
【技术实现步骤摘要】
【国外来华专利技术】背景背景和相关技术计算机和计算系统已经影响了现代生活的几乎每个方面。计算机通常涉及工作、休闲、保健、运输、娱乐、家政管理等。现代计算系统具有生成、存储和/或处理大量数据的能力。例如,数据可通过耦合到传感器、web服务,或其它数据源的数据收集机制来收集。可对原始数据进行操作以创建甚至更多数据。之前仅以非数字形式可用的数据(诸如,纸质的书、报纸和杂志存档、电影图片和/或电影、手写或打字写入的记录等)可被数字化并存储在计算机存储系统中。大容量存储是非常便宜的,因此这些数据可被保存长的时间段,而无需破坏这些数据来回收存储空间,从而允许以小成本来实际上无限期地保存这些数据。因此,大量数据可被生成并累积。此外,计算系统功能还可以通过计算系统经由网络连接互连到其他计算系统的能力来增强。网络连接可包括,但不仅限于,经由有线或无线以太网的连接,蜂窝式连接,或者甚至通过串行、并行、USB或其它连接的计算机到计算机的连接。这些连接允许计算系统访问其他计算系统上的服务,并快速且有效地从其他计算系统接收应用数据。在给定大量数据可用并且各计算系统的互连本质的情况下,计算系统可具有对来自多个不同源的大量数据的访问。跟踪数据的世系(例如,源和历史)是难以解决的问题。例如,数据可被从系统取出、被操纵并被放回该系统。该数据在从系统出来时发生了什么、或者该数据来自何处以及在接收该数据之前该数据发生了什么可能是难以理解和跟踪的。在此要求保护的主题不限于解决任何缺点或仅在诸如上述环境中操作的各个实施例。相反,提供该背景仅用以示出在其中可实践在此描述的部分实施例的一个示例性
简要概述本文中示出的一个实施例包括可在包括多个互连的系统的网络计算环境中实施的方法,其中数据在这些系统之间共享。该方法包括用于跟踪数据世系的动作。该方法包括访问数据集。数据集与世系元数据相关联。世系元数据包括指示数据的原始源的数据、已对数据集执行了操作的一个或多个中间实体和对数据集执行的操作的本质。该方法进一步包括确定世系元数据由于以下中的至少一个而已受损:被从与数据集的关联中移除、被破坏或是不完整的。作为确定世系元数据已受损的结果,该方法进一步包括使数据集无效。本文中示出的另一实施例包括可在包括多个互连的系统的网络计算环境中实施的方法,其中数据在这些系统之间共享。该方法包括用于跟踪数据世系的动作。该方法包括访问数据集。数据集与世系元数据相关联。世系元数据包括指示该数据的原始源的数据、已对数据集执行了操作的一个或多个中间实体和对数据集执行的操作的本质。第一实体对数据集执行一操作。作为对数据集执行第一操作的结果,该方法包括更新世系元数据以指示第一实体对数据集执行了该操作。该方法进一步包括提供用于确定该世系元数据是否由于世系元数据已发生了以下中的至少一个而已受损的功能:被从与数据集的关联中移除、被破坏或是不完整的。提供本概述是为了以简化的形式介绍将在以下具体实施方式中进一步描述的概念选择。本概述不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。将在以下的描述中阐述另外的特征和优点,并且部分特征和优点可从该描述中显而易见,或者可从本文教导的实践中获知。本专利技术的特征和优点可以通过在所附权利要求中特别指出的手段和组合来实现并获取。本专利技术的特征将从以下描述和所附权利要求书中变得完全显而易见,或者可通过如下所述对本发明的实践而获知。附图说明为了描述可获得本主题的上述和其它优点和特征的方式,将通过参考附图中示出的本主题的具体实施例来呈现以上简要描述的本主题的更具体描述。应该理解,这些附图仅描绘了各典型实施例,因此其不应被认为是对范围的限制,各实施例将通过使用附图用附加特征和详情来描述并解释,在附图中:图1A示出了创建世系元数据并将世系元数据嵌入在数据集中的系统;图1B示出了创建并处理世系元数据的中央管控实体;图2示出了跟踪数据世系的方法;以及图3示出了跟踪数据世系的另一个方法。详细描述本文中描述的一些实施例实现使世系元数据与数据集相关联的能力。世系元数据可包括数据集的最终源和/或在数据集的寿命内或在数据集的寿命的某时段内已对数据集执行的操作。如果世系元数据由于诸如以下原因而变得受损:变得与数据集不相关联、变得被破坏、由于稍后对数据集执行的未被记录的操作而变得不完整、由于数据本身变得被破坏使得世系元数据不再准确地描述数据集的状态等,则可使该数据集无效或者以其他方式用较低层次的状态来处理该数据集。例如,数据集可被完全丢弃。替换地或另选地,数据集可被标记为无效,尽管该数据集可能仍然是可读的,但可能在向用户显示时用该数据集为无效的指示进行了注释。用于将数据集与世系元数据相关联的功能可按多种不同的方式实现。例如,如图1A所示,数据集106可被注释以便包括世系元数据112来作为与该数据集包括在一起的元数据。替换地或另选地,如图1B所示,外部服务118可使世系元数据122与数据集106相关联,但可将世系元数据与数据集分开地存储,并可将世系元数据与数据集的关联与环境中的各个实体分开地维护。这可例如在环境中的各实体不包括用于处理数据集的注释的本机能力时被实现。一些实施例可在以下环境中实施:该环境包括大量由不同数据提供者提供的不同且不相关的数据源,但在该环境中,数据由单个提供者通过对可从中提供数据的各数据提供者具有访问的数据平台从各数据源提供。一个这样的数据平台是可从华盛顿州雷蒙德市的微软公司获得的WindowsMarketplace。现在参考图1A,示出了一示例。该示例示出了第一实体102。该第一实体包括数据库104。数据库104可存储各种数据集。在特定示例中,数据集106被示出。数据集106是由数据库104向模块108提供的。模块108对数据集106执行各种动作。实体102包括世系元数据模块110。世系元数据模块110包括用于生成世系元数据112的功能。由模块110中的世系元数据生成的世系元数据112可包括各种信息片段,诸如关于实体102的信息、关于模块108所执行的操作的信息等。一般来说,世系信息可包括关于什么操作被执行、谁执行了这些操作以及这些操作何时被执行的信息。在图1A所示的示例中,世系元数据112被嵌入在数据集106中。数据集106和嵌入的世系元数据可被传送至第二实体114。在一些实施例中,数据集106和世系元数据1本文档来自技高网...
【技术保护点】
一种在包括多个互连的系统的网络计算环境中跟踪数据世系的方法,其中数据在所述系统之间共享,所述方法包括:访问数据集,所述数据集与世系元数据相关联,所述世系元数据包括指示所述数据的原始源的数据、已对该数据集执行了操作的一个或多个中间实体、以及对所述数据集执行的操作的本质;在第一实体处,对所述数据集执行操作;作为对所述数据集执行第一操作的结果,更新所述世系元数据以指示所述第一实体对所述数据集执行了所述操作;以及提供用于确定所述世系元数据是否由于所述世系元数据已发生了以下中的至少一个而已受损的功能:被从与所述数据集的关联中移除、被破坏或是不完整的。
【技术特征摘要】
【国外来华专利技术】2012.07.10 US 13/545,3981.一种在包括多个互连的系统的网络计算环境中跟踪数据世系的方法,其
中数据在所述系统之间共享,所述方法包括:
访问数据集,所述数据集与世系元数据相关联,所述世系元数据包括指示
所述数据的原始源的数据、已对该数据集执行了操作的一个或多个中间实体、
以及对所述数据集执行的操作的本质;
在第一实体处,对所述数据集执行操作;
作为对所述数据集执行第一操作的结果,更新所述世系元数据以指示所述
第一实体对所述数据集执行了所述操作;以及
提供用于确定所述世系元数据是否由于所述世系元数据已发生了以下中
的至少一个而已受损的功能:被从与所述数据集的关联中移除、被破坏或是不
完整的。
2.如权利要求1所述的方法,其特征在于,提供用于确定所述世系元数据
是否已受损的功能包括对所述数据集和所述世系元数据执行校验和。
3.如权利要求1所述的方法,其特征在于,提供用于确定所述世系元数据
是否已受损的功能包括使用加密密钥来签署所述数据集和所述世系元...
【专利技术属性】
技术研发人员:C·林斯伯格,R·J·鲍,O·卡斯,
申请(专利权)人:微软公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。