当前位置: 首页 > 专利查询>广州大学专利>正文

针对多轮次数据投毒攻击的OptimizedTruthFinder方法技术

技术编号:35433324 阅读:19 留言:0更新日期:2022-11-03 11:39
本发明专利技术涉及数据投毒技术领域,且公开了针对多轮次数据投毒攻击的Optimized TruthFinder方法,平台发布任务为24小时每个整点由N个工人对某个物体的M个属性进行观察,N个工人接受任务后,平台对N个工人的权重进行初始化,初始化方式为平均权重,每个工人的权重为当工人观测结束后,将观测数据提交到平台中去。该针对多轮次数据投毒攻击的Optimized TruthFinder方法,可以防御隐藏

【技术实现步骤摘要】
针对多轮次数据投毒攻击的Optimized TruthFinder方法


[0001]本专利技术涉及数据投毒
,具体为针对多轮次数据投毒攻击的 Optimized TruthFinder方法。

技术介绍

[0002]群智感知是指在物联网环境下,利用人们具备的嵌入传感设备的移动设 备,通过发布众包任务来收集生活中各种类型的数据的新型数据收集模式, 其本质是众包在物联网中的表示形式,群智感知系统通过分发给具备传感器 的普通用户一系列传感任务,来收集数据并进行数据分析工作,每个接受任 务的个体作为参与群智感知任务的普通工人参与数据聚合,由于工人的传感 设备质量以及工人动态移动等因素影响,工人提交的数据并不能保证全部准 确。群智感知活动中一个极其重要的步骤是使用真值发现算法来解决数据冲 突问题,通过数据聚合找到最贴近Ground Truth(地面真值)的真值,真值 发现的基本思想为:1、如果一个事实是由许多值得信赖的用户提供的,则它 大概率是真实的;2、如果一个事实与许多值得信赖的用户提供的事实相冲突, 则它是真实的概率就很小,基于这个原理,真值发现对每个工人的可信度进 行评估,可信度为工人在参与数据聚合中的权重,真值发现采用迭代的方法 不断更新工人的权重和真值,直到收敛或满足某个预设条件。
[0003]采用源过滤和源估计的方法提前过滤掉误差大的工人数据技术,并未详 细展开阈值如何设置,没有给出合理的解释,无法整明该技术的通用性,即 阙值和其他参数之间的关系,如何设定阈值才合理,其次,该技术假设工人 之间独立感知数据,然而在数据投毒攻击中,恶意工人的数据之间存在很强 的关联性,最后该技术基于单次的数据投毒攻击,并没考虑多轮次数据投毒 场景,另外传统的TruthFinder仅能抵御单次的数据投毒攻击,它更多的考 虑该工人在当前的工作表现,而在多轮次的数据投毒工作中,工人在前几轮 的工作表现也相当重要,传统的TruithFinder在多轮次数据投毒场景中对于 工人的权重设置震荡过大。

技术实现思路

[0004](一)解决的技术问题
[0005]针对现有技术的不足,本专利技术提供了针对多轮次数据投毒攻击的 Optimized TruthFinder方法,具备可以防御隐藏以及攻击策略的数据投毒攻 击,缓解传统TruthFinder对于工人权重设置震荡过大的问题。本专利技术充分 考虑了多轮次的数据投毒攻击场景,考虑了恶意工人可能会采取隐藏行为来 获得高权重的情况,对传统TruthFinder的权重更新做了进一步限制,使得 恶意工人很难在短时间获取高的权重等优点,解决了现有采用源过滤和源估 计的方法提前过滤掉误差大的工人数据技术,并未详细展开阈值如何设置, 没有给出合理的解释,无法整明该技术的通用性,即阙值和其他参数之间的 关系,如何设定阈值才合理,其次,该技术假设工人之间独立感知数据,然 而在数据投毒攻击
中,恶意工人的数据之间存在很强的关联性,最后该技术 基于单次的数据投毒攻击,并没考虑多轮次数据投毒场景的问题。
[0006](二)技术方案
[0007]为实现上述防御多轮次的数据投毒攻击,有效缓解传统TruthFinder对 于工人权重设置震荡过大的目的,本专利技术提供如下技术方案:针对多轮次数 据投毒攻击的Optimized TruthFinder方法,其特征在于,包括以下步骤:
[0008]S1、任务发布
[0009]平台发布任务为24小时每个整点由N个工人对某个物体的M个属性进行 观察,N个工人接受任务后,平台对N个工人的权重进行初始化,初始化方式 为平均权重,每个工人的权重为
[0010]S2、数据提交
[0011]当工人观测结束后,将观测数据提交到平台中去,平台将工人数据和工 人权重提交给Optimized TruthFinder。
[0012]S3、计算真值
[0013]Optimized TruthFinder利用观测数据和工人权重来计算真值, Optimized TruthFinder首先执行传统TruthFinder的两步迭代式:首先使用 加权平均来计算更新聚合值合值随后使用第一步求得的聚 合值来进一步更新每个工人的可信度,信度,表示工 人i对属性m提供的观察数据与聚合值之间的距离,w
i
的计算方 式为:
[0014]S4、动作选择
[0015]恶意工人根据策略选择下一轮的动作,动作为攻击或者隐藏,本专利技术使 用的策略为隐藏一次攻击一次,攻击时,恶意工人的数据为:μ=0.25,隐藏时,数据为:
[0016]S5、新数据提交
[0017]到达下一个整点时,工人提交新的观测数据,普通工人提交正常数据, 恶意工人提交数据平台收集完数据后连同保存的权重一同提交给TruthFinder。
[0018]S6、任务结束
[0019]当时间为24点时,任务结束,结束运行。
[0020]优选的,所述步骤S3中,当达到收敛条件后或者达到预设的最大允许迭 代次数,η
=20,可以得到收敛后的工人权重集合和聚合值集合紧接着计算单个工人的观测值距离聚合值的偏移量D
i

[0021][0022]进而可以计算得到工人的平均偏移量:
[0023][0024]优选的,所述步骤S3中,当工人偏移量D
i,m
大于平均偏移量D
mean,m
时,意味着该工人提交的数据相误差很大,需要降低该工人的权重,反之则增加其权重,计算方式如下:
[0025][0026]即为工人本次聚合的最终权重,根据计算最终的真值:
[0027][0028]计算完成后,OptimizedTruthFinder公布真值并将工人权重保存在平台中。
[0029]优选的,所述步骤S1中,所述在任务开启时,平台平均初始化所有工人的权重,每次任务开启需要接受任务的工人在24小时内,每个整点时提交对所有属性的观察数据。
[0030]优选的,所述步骤S2中,平台收集完工人的观测数据后,将数据和工人权重提交给OptimizedTruthFinder,OptimizedTruthFinder利用观测数据和工人权重进行权重更新和真值的计算,计算完成后返回真值给所有工人,并更新每个工人的权重作为下一时刻工人的初始权重。
[0031]优选的,所述步骤S4中,恶意工人设计恶意数据,首先根据攻击策略明确本次需要采取攻击动作还是隐藏动作,攻击策略为隐藏一次攻击一次,因此当整点为奇数时,提交正常数据,当整点为偶数时,选择攻击动作。
[0032]优选的,所述所述步骤S4中,本专利技术设置μ=0.25,表示恶意数据偏离GroundTruth的幅度为25%。
[0033]优选的,所述所述步骤S6中,当任务未完成时,平台继续收集所有工人的观察值(正常工人和恶意工人),并将观察值和平台中保存的每个工人的权重一起提交给OptimizedTruthFinder,Optim本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.针对多轮次数据投毒攻击的Optimized TruthFinder方法,其特征在于,包括以下步骤:S1、任务发布平台发布任务为24小时每个整点由N个工人对某个物体的M个属性进行观察,N个工人接受任务后,平台对N个工人的权重进行初始化,初始化方式为平均权重,每个工人的权重为S2、数据提交当工人观测结束后,将观测数据提交到平台中去,平台将工人数据和工人权重提交给Optimized TruthFinder。S3、计算真值Optimized TruthFinder利用观测数据和工人权重来计算真值,Optimized TruthFinder首先执行传统TruthFinder的两步迭代式:首先使用加权平均来计算更新聚合值值随后使用第一步求得的聚合值来进一步更新每个工人的可信度,度,表示工人i对属性m提供的观察数据与聚合值之间的距离,w
i
的计算方式为:S4、动作选择恶意工人根据策略选择下一轮的动作,动作为攻击或者隐藏,本发明使用的策略为隐藏一次攻击一次,攻击时,恶意工人的数据为:μ=0.25,隐藏时,数据为:S5、新数据提交到达下一个整点时,工人提交新的观测数据,普通工人提交正常数据,恶意工人提交数据平台收集完数据后连同保存的权重一同提交给TruthFinder。S6、任务结束当时间为24点时,任务结束,结束运行。2.根据权利要求1所述的针对多轮次数据投毒攻击的Optimized TruthFinder方法,其特征在于,所述步骤S3中,当达到收敛条件后或者达到预设的最大允许迭代次数,η=20,可以得到收敛后的工人权重集合和聚合值集合紧接着计算单个工人的观测值距离聚合值的偏移量D
i

进而可以计算得到工人的平均偏移量:3.根据权利要求2所述的针对多轮次数据投毒攻击的Optimized TruthFinder方法,其特征在于,所述步骤S3中,当工人偏移量D
i,m
大于平均偏移量D
mean,m
时,意味着该工人提交的数据相误差...

【专利技术属性】
技术研发人员:李默涵张宏妞孙彦斌田志宏顾钊铨韩伟红唐可可李树栋仇晶
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1