可追踪式数据稽核装置及方法制造方法及图纸

技术编号:16301488 阅读:95 留言:0更新日期:2017-09-26 19:35
本案是一种可追踪式数据稽核装置及方法,可追踪式数据稽核装置储存一原始数据集合。该原始数据集合包含多笔纪录且定义有多个字段。各纪录具有多个项目一对一地对应至该等字段。该等字段被区分为一识别敏感子集及一识别不敏感子集。可追踪式数据稽核装置对与该识别敏感子集中的该等字段对应的各该项目施加一去识别化操作以产生一发布数据集合,且储存该原始数据集合的一稽核日志。该稽核日志包含一日期、一消费者识别码、该原始数据集合的一识别码及多个证据。各该证据为该发布数据集合的该等纪录其中之一。

Traceable data auditing device and method

The case is a traceable data auditing device and method, and a traceable data audit device stores an original data set. The raw data set contains multiple records and defines multiple fields. Each record has multiple items corresponding to the fields one by one. The fields are distinguished as an identifying sensitive subset and an identifying insensitive subset. Traceable audit data corresponding to the identification device and the sensitive sub field of the project applied to identify operation to generate a published data set, and storing the audit log of the original data set. The audit log contains a date, a consumer identification code, an identification code of the original data set, and a plurality of evidence. One of these records of which the evidence is set.

【技术实现步骤摘要】
可追踪式数据稽核装置及方法
本专利技术系关于一种可追踪式数据稽核装置及方法。更具体而言,本专利技术系关于一种在去识别程序(de-identificationprocedure)期间添加可追踪式信息的可追踪式数据稽核装置及方法。
技术介绍
随着计算机科技的快速发展,愈来愈多企业收集、储存、运用及组织计算机中的各种信息/数据。由于该等大量数据/信息中可能藏有商机、研究议题等等,因此某些企业贩卖其数据以获取金钱利益。使用者可能自一企业购买数据(称为“发布数据”),再将该数据的副本散布给其他使用者,此举意味着其他使用者免费地获得该等数据。目前不存在一种可追踪一发布数据的技术以供数据市场使用。在此情况下,即使企业的管理者怀疑某些数据可能源自于其公司,亦无法加以证明。有鉴于此,如何在不严重损坏一发布数据的精确度的情况下追踪该发布数据乃为本
亟需努力的目标。
技术实现思路
本专利技术的一目的在于提供一种可追踪式数据稽核装置,该可追踪式数据稽核装置包含一储存单元、一接口及一处理单元,其中该处理单元电性连接至该储存单元及该接口。该储存单元储存一原始数据集合及多个现有稽核日志,该原始数据集合包含多笔纪录且定义有多个字段。各该纪录具有多个项目一对一地对应至该等字段,该等字段被区分为一第一识别敏感子集及一第一识别不敏感子集。该接口接收对该原始数据集合的一请求,其中该请求对应至一消费者识别码。该处理单元因应该请求而对与该第一识别敏感子集中的该等字段对应的各该项目施加一去识别化操作(de-identificationoperation)以产生一发布数据集合,并将该原始数据集合的一稽核日志储存于该储存单元中作为该等现有稽核日志其中之一。该稽核日志包含一日期、该消费者识别码、该原始数据集合的一识别码以及多个证据(evidence),且各该证据为该发布数据集合的该等纪录其中之一。该接口更递送该发布数据集合,该接口更接收一泄漏数据集合。该泄漏数据集合包含多个泄露纪录且定义有多个字段,各该泄露纪录具有多个项目一对一地对应至该泄漏数据集合的该等字段,该泄漏数据集合的该等字段被区分为一第二识别敏感子集及一第二识别不敏感子集。该处理单元更藉由将各该现有稽核日志的多个字段正规化以及选择具有至少一字段与该泄漏数据集合的该等字段其中之一相同的该等现有稽核日志来确定一已过滤稽核日志集合,该处理单元更将各该泄露纪录中对应至该第二识别不敏感子集的该等项目与该已过滤稽核日志集合的各该现有稽核日志的该等证据中对应至该第一识别不敏感子集的该等项目比对,藉此确定一已过滤泄漏数据集合;该处理单元更将该已过滤泄漏数据集合的各该泄露纪录中对应至该第二识别敏感子集的该等项目与该已过滤稽核日志集合的各该现有稽核日志的该等证据中对应至该第一识别敏感子集的该等项目比对,藉此计算该已过滤稽核日志集合的各该现有稽核日志的一可信度因子。本专利技术的另一目的在于提供一种用于一电子装置的可追踪式数据稽核方法。该电子装置储存一原始数据集合及多笔现有稽核日志。该原始数据集合包含多笔纪录且定义有多个字段。各该纪录具有多个项目一对一地对应至该等字段。该等字段被区分为一第一识别敏感子集及一第一识别不敏感子集。该可追踪式数据稽核方法包含以下步骤:(a)接收对于该原始数据集合的一请求,其中该请求对应至一消费者识别码,(b)因应该请求而对与该第一识别敏感子集中的该等字段对应的各该项目施加一去识别化操作以产生一发布数据集合,(c)将该原始数据集合的一稽核日志储存于该电子装置作为该等现有稽核日志其中之一,其中该稽核日志包含一日期、该消费者识别码、该原始数据集合的一识别码以及多个证据,且各该证据为该发布数据集合的该等纪录其中之一,(d)递送该发布数据集合,(e)接收一泄漏数据集合,其中该泄漏数据集合包含多笔泄露纪录且定义有多个字段,各该泄露纪录具有多个项目一对一地对应至该泄漏数据集合的该等字段,该泄漏数据集合的该等字段被区分为一第二识别敏感子集及一第二识别不敏感子集,(f)藉由将各该现有稽核日志的多个字段正规化以及选择具有至少一个字段与该泄漏数据集合的该等字段其中之一相同的该等现有稽核日志来确定一已过滤稽核日志集合,(g)将各该泄露纪录中对应至该第二识别不敏感子集的该等项目与该已过滤稽核日志集合的各该现有稽核日志的该等证据中对应至该第一识别不敏感子集的该等项目比对,藉此确定一已过滤泄漏数据集合,以及(h)将该已过滤泄漏数据集合的各该泄露纪录中对应至该第二识别敏感子集的该等项目与该已过滤稽核日志集合的各该现有稽核日志的该等证据中对应至该第一识别敏感子集的该等项目比对,藉此计算该已过滤稽核日志集合的各该现有稽核日志的一可信度因子。根据本专利技术的技术,当存在对于一原始数据集合的一请求时,本专利技术会对识别敏感子集中的各字段所对应的各项目施加去识别化操作以产生该原始数据集合的一发布版本(例如:一发布数据集合)。各该去识别化操作能够使一项目去识别化并将可追踪式信息插入该项目。随着该发布版本的产生,本专利技术储存该发布版本的一稽核日志。该稽核日志包含一日期、消费者识别码、该原始数据集合的一识别码以及多个证据。由于该稽核日志中的各该证据为该发布版本的纪录其中之一,故各该证据可被视为该发布数据集合的一指纹(fingerprint)。一旦存在一泄露数据集合,本专利技术便能够藉由比对该泄露数据集合与现有稽核日志而辨识出数据泄露的源头。基于本专利技术的运作机制,该原始数据集合的该发布数据集合为可追踪的。以下结合图式阐述本专利技术的详细技术及实施方式,使本专利技术所属
中具有通常知识者能理解所请求保护的专利技术的特征。附图说明图1A系描绘第一实施例的一可追踪式数据稽核装置1的示意图;图1B系描绘原始数据集合10的示意图;图1C系描绘一舍入法函数操作;图1D系描绘一舍入法函数操作的具体范例;图1E系描绘加密操作的示意图;图1F系描绘发布数据集合14的示意图;图1G系描绘稽核日志16的示意图;图1H系描绘泄露数据集合18的示意图;图2A系描绘第二实施例的可追踪式数据稽核方法的流程图;图2B系描绘与一舍入法函数操作相关的步骤;以及图2C系描绘原始数据集合的一上传程序的流程图。符号说明1:可追踪式数据稽核装置10:原始数据集合11:储存单元12a、……、12b:现有稽核日志13:接口14:发布数据集合15:处理单元16:稽核日志18:泄露数据集合102:请求160:日期162:消费者识别码164:识别码166a、……、166b:证据D_1、D_2、……、D_Q:泄露纪录E:误差边界F_1、F_2、F_4、F_5、……、F_N:字段F_1、F_2、C_3、F_4、F_5、……、C_P:字段I_11、I_12、I_14、I_15、……、I_1N:项目I_11’、I_12’、……、I_1N:项目I_M1、I_M2、I_M4、I_M5、……、I_MN:项目I_M1’、I_M2’、……、I_MN:项目J_11、J_12、J_13、J_14、J_15、……、J_1P:项目J_Q1、J_Q2、J_Q3、J_Q4、J_Q5、……、J_QP:项目K:随机加密密钥M:倍数R_1、……、R_M:纪录R_1’、……、R_M’:纪录S1:识别敏感子集S2:识别不敏感子集S3本文档来自技高网
...
可追踪式数据稽核装置及方法

【技术保护点】
一种可追踪式数据稽核装置,其特征在于包含:一储存单元,储存有一原始数据集合及多笔现有稽核日志,该原始数据集合包含多笔纪录且定义有多个字段,各该纪录具有多个项目一对一地对应至该等字段,该等字段被区分为一第一识别敏感子集及一第一识别不敏感子集;一接口,接收对该原始数据集合的一请求,该请求对应至一消费者识别码;以及一处理单元,电性连接至该储存单元及该接口,且因应该请求而对与该第一识别敏感子集中的该等字段对应的各该项目施加一去识别化操作以产生一发布数据集合,并将该原始数据集合的一稽核日志储存于该储存单元作为该等现有稽核日志其中之一,其中该稽核日志包含一日期、该消费者识别码、该原始数据集合的一识别码以及多个证据,其中各该证据为该发布数据集合的该等纪录其中之一,其中,该接口更递送该发布数据集合,该接口更接收一泄漏数据集合,该泄漏数据集合包含多笔泄露纪录且定义有多个字段,各该泄露纪录具有多个项目一对一地对应至该泄漏数据集合的该等字段,该泄漏数据集合的该等字段被区分为一第二识别敏感子集及一第二识别不敏感子集,其中,该处理单元更藉由将各该现有稽核日志的多个字段正规化以及选择具有至少一字段与该泄漏数据集合的该等字段其中之一相同的该等现有稽核日志来确定一已过滤稽核日志集合,其中,该处理单元更将各该泄露纪录中对应至该第二识别不敏感子集的该等项目与该已过滤稽核日志集合的各该现有稽核日志的该等证据中对应至该第一识别不敏感子集的该等项目比对,藉此确定一已过滤泄漏数据集合,以及其中,该处理单元更将该已过滤泄漏数据集合的各该泄露纪录中对应至该第二识别敏感子集的该等项目与该已过滤稽核日志集合的各该现有稽核日志的该等证据中对应至该第一识别敏感子集的该等项目进行比对,藉此计算该已过滤稽核日志集合的各该现有稽核日志的一可信度因子。...

【技术特征摘要】
2016.03.16 US 15/072,2471.一种可追踪式数据稽核装置,其特征在于包含:一储存单元,储存有一原始数据集合及多笔现有稽核日志,该原始数据集合包含多笔纪录且定义有多个字段,各该纪录具有多个项目一对一地对应至该等字段,该等字段被区分为一第一识别敏感子集及一第一识别不敏感子集;一接口,接收对该原始数据集合的一请求,该请求对应至一消费者识别码;以及一处理单元,电性连接至该储存单元及该接口,且因应该请求而对与该第一识别敏感子集中的该等字段对应的各该项目施加一去识别化操作以产生一发布数据集合,并将该原始数据集合的一稽核日志储存于该储存单元作为该等现有稽核日志其中之一,其中该稽核日志包含一日期、该消费者识别码、该原始数据集合的一识别码以及多个证据,其中各该证据为该发布数据集合的该等纪录其中之一,其中,该接口更递送该发布数据集合,该接口更接收一泄漏数据集合,该泄漏数据集合包含多笔泄露纪录且定义有多个字段,各该泄露纪录具有多个项目一对一地对应至该泄漏数据集合的该等字段,该泄漏数据集合的该等字段被区分为一第二识别敏感子集及一第二识别不敏感子集,其中,该处理单元更藉由将各该现有稽核日志的多个字段正规化以及选择具有至少一字段与该泄漏数据集合的该等字段其中之一相同的该等现有稽核日志来确定一已过滤稽核日志集合,其中,该处理单元更将各该泄露纪录中对应至该第二识别不敏感子集的该等项目与该已过滤稽核日志集合的各该现有稽核日志的该等证据中对应至该第一识别不敏感子集的该等项目比对,藉此确定一已过滤泄漏数据集合,以及其中,该处理单元更将该已过滤泄漏数据集合的各该泄露纪录中对应至该第二识别敏感子集的该等项目与该已过滤稽核日志集合的各该现有稽核日志的该等证据中对应至该第一识别敏感子集的该等项目进行比对,藉此计算该已过滤稽核日志集合的各该现有稽核日志的一可信度因子。2.如权利要求1所述的可追踪式数据稽核装置,其特征在于,当一待处理项目为一数字时,该去识别化操作为一舍入法函数操作,该处理单元根据一倍数来决定一误差边界,且该处理单元以该倍数将该待处理项目舍入为一已舍入数字、产生一受界于该误差边界的随机误差以及合成该随机误差及该已舍入数字。3.如权利要求2所述的可追踪式数据稽核装置,其特征在于,合成该随机误差及该已舍入数字是将该随机误差加至该已舍入数字或自该已舍入数字减去该随机误差。4.如权利要求2所述的可追踪式数据稽核装置,其特征在于,该误差边界为该倍数的一半。5.如权利要求1所述的可追踪式数据稽核装置,其特征在于,当一待处理项目为一文字时,该去识别化操作为一加密操作,且该处理单元以一随机加密密钥加密该待处理项目的一子集,藉此达到对该待处理项目施加该去识别化操作。6.如权利要求5所述的可追踪式数据稽核装置,其特征在于,该处理单元更以一系统公共密钥加密该随机加密密钥,且该稽核日志更包含该已加密随机加密密钥。7.如权利要求目1所述的可追踪式数据稽核装置,其特征在于,该接口更自一第一公司的一第一使用者接收该原始数据集合,自一第二使用者接收一组去识别化规则,接收一表示该原始数据集合...

【专利技术属性】
技术研发人员:郭彦宏叶子玮郑光晏
申请(专利权)人:财团法人资讯工业策进会
类型:发明
国别省市:中国台湾,71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1