The case is a traceable data auditing device and method, and a traceable data audit device stores an original data set. The raw data set contains multiple records and defines multiple fields. Each record has multiple items corresponding to the fields one by one. The fields are distinguished as an identifying sensitive subset and an identifying insensitive subset. Traceable audit data corresponding to the identification device and the sensitive sub field of the project applied to identify operation to generate a published data set, and storing the audit log of the original data set. The audit log contains a date, a consumer identification code, an identification code of the original data set, and a plurality of evidence. One of these records of which the evidence is set.
【技术实现步骤摘要】
可追踪式数据稽核装置及方法
本专利技术系关于一种可追踪式数据稽核装置及方法。更具体而言,本专利技术系关于一种在去识别程序(de-identificationprocedure)期间添加可追踪式信息的可追踪式数据稽核装置及方法。
技术介绍
随着计算机科技的快速发展,愈来愈多企业收集、储存、运用及组织计算机中的各种信息/数据。由于该等大量数据/信息中可能藏有商机、研究议题等等,因此某些企业贩卖其数据以获取金钱利益。使用者可能自一企业购买数据(称为“发布数据”),再将该数据的副本散布给其他使用者,此举意味着其他使用者免费地获得该等数据。目前不存在一种可追踪一发布数据的技术以供数据市场使用。在此情况下,即使企业的管理者怀疑某些数据可能源自于其公司,亦无法加以证明。有鉴于此,如何在不严重损坏一发布数据的精确度的情况下追踪该发布数据乃为本
亟需努力的目标。
技术实现思路
本专利技术的一目的在于提供一种可追踪式数据稽核装置,该可追踪式数据稽核装置包含一储存单元、一接口及一处理单元,其中该处理单元电性连接至该储存单元及该接口。该储存单元储存一原始数据集合及多个现有稽核日志,该原始数据集合包含多笔纪录且定义有多个字段。各该纪录具有多个项目一对一地对应至该等字段,该等字段被区分为一第一识别敏感子集及一第一识别不敏感子集。该接口接收对该原始数据集合的一请求,其中该请求对应至一消费者识别码。该处理单元因应该请求而对与该第一识别敏感子集中的该等字段对应的各该项目施加一去识别化操作(de-identificationoperation)以产生一发布数据集合,并将该原始数据集合的一稽 ...
【技术保护点】
一种可追踪式数据稽核装置,其特征在于包含:一储存单元,储存有一原始数据集合及多笔现有稽核日志,该原始数据集合包含多笔纪录且定义有多个字段,各该纪录具有多个项目一对一地对应至该等字段,该等字段被区分为一第一识别敏感子集及一第一识别不敏感子集;一接口,接收对该原始数据集合的一请求,该请求对应至一消费者识别码;以及一处理单元,电性连接至该储存单元及该接口,且因应该请求而对与该第一识别敏感子集中的该等字段对应的各该项目施加一去识别化操作以产生一发布数据集合,并将该原始数据集合的一稽核日志储存于该储存单元作为该等现有稽核日志其中之一,其中该稽核日志包含一日期、该消费者识别码、该原始数据集合的一识别码以及多个证据,其中各该证据为该发布数据集合的该等纪录其中之一,其中,该接口更递送该发布数据集合,该接口更接收一泄漏数据集合,该泄漏数据集合包含多笔泄露纪录且定义有多个字段,各该泄露纪录具有多个项目一对一地对应至该泄漏数据集合的该等字段,该泄漏数据集合的该等字段被区分为一第二识别敏感子集及一第二识别不敏感子集,其中,该处理单元更藉由将各该现有稽核日志的多个字段正规化以及选择具有至少一字段与该泄漏数据集合 ...
【技术特征摘要】
2016.03.16 US 15/072,2471.一种可追踪式数据稽核装置,其特征在于包含:一储存单元,储存有一原始数据集合及多笔现有稽核日志,该原始数据集合包含多笔纪录且定义有多个字段,各该纪录具有多个项目一对一地对应至该等字段,该等字段被区分为一第一识别敏感子集及一第一识别不敏感子集;一接口,接收对该原始数据集合的一请求,该请求对应至一消费者识别码;以及一处理单元,电性连接至该储存单元及该接口,且因应该请求而对与该第一识别敏感子集中的该等字段对应的各该项目施加一去识别化操作以产生一发布数据集合,并将该原始数据集合的一稽核日志储存于该储存单元作为该等现有稽核日志其中之一,其中该稽核日志包含一日期、该消费者识别码、该原始数据集合的一识别码以及多个证据,其中各该证据为该发布数据集合的该等纪录其中之一,其中,该接口更递送该发布数据集合,该接口更接收一泄漏数据集合,该泄漏数据集合包含多笔泄露纪录且定义有多个字段,各该泄露纪录具有多个项目一对一地对应至该泄漏数据集合的该等字段,该泄漏数据集合的该等字段被区分为一第二识别敏感子集及一第二识别不敏感子集,其中,该处理单元更藉由将各该现有稽核日志的多个字段正规化以及选择具有至少一字段与该泄漏数据集合的该等字段其中之一相同的该等现有稽核日志来确定一已过滤稽核日志集合,其中,该处理单元更将各该泄露纪录中对应至该第二识别不敏感子集的该等项目与该已过滤稽核日志集合的各该现有稽核日志的该等证据中对应至该第一识别不敏感子集的该等项目比对,藉此确定一已过滤泄漏数据集合,以及其中,该处理单元更将该已过滤泄漏数据集合的各该泄露纪录中对应至该第二识别敏感子集的该等项目与该已过滤稽核日志集合的各该现有稽核日志的该等证据中对应至该第一识别敏感子集的该等项目进行比对,藉此计算该已过滤稽核日志集合的各该现有稽核日志的一可信度因子。2.如权利要求1所述的可追踪式数据稽核装置,其特征在于,当一待处理项目为一数字时,该去识别化操作为一舍入法函数操作,该处理单元根据一倍数来决定一误差边界,且该处理单元以该倍数将该待处理项目舍入为一已舍入数字、产生一受界于该误差边界的随机误差以及合成该随机误差及该已舍入数字。3.如权利要求2所述的可追踪式数据稽核装置,其特征在于,合成该随机误差及该已舍入数字是将该随机误差加至该已舍入数字或自该已舍入数字减去该随机误差。4.如权利要求2所述的可追踪式数据稽核装置,其特征在于,该误差边界为该倍数的一半。5.如权利要求1所述的可追踪式数据稽核装置,其特征在于,当一待处理项目为一文字时,该去识别化操作为一加密操作,且该处理单元以一随机加密密钥加密该待处理项目的一子集,藉此达到对该待处理项目施加该去识别化操作。6.如权利要求5所述的可追踪式数据稽核装置,其特征在于,该处理单元更以一系统公共密钥加密该随机加密密钥,且该稽核日志更包含该已加密随机加密密钥。7.如权利要求目1所述的可追踪式数据稽核装置,其特征在于,该接口更自一第一公司的一第一使用者接收该原始数据集合,自一第二使用者接收一组去识别化规则,接收一表示该原始数据集合...
【专利技术属性】
技术研发人员:郭彦宏,叶子玮,郑光晏,
申请(专利权)人:财团法人资讯工业策进会,
类型:发明
国别省市:中国台湾,71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。