针对多轮次数据投毒攻击的OptimizedTruthFinder方法技术

技术编号：35433324 阅读：19 留言：0更新日期：2022-11-03 11:39

本发明专利技术涉及数据投毒技术领域，且公开了针对多轮次数据投毒攻击的Optimized TruthFinder方法，平台发布任务为24小时每个整点由N个工人对某个物体的M个属性进行观察，N个工人接受任务后，平台对N个工人的权重进行初始化，初始化方式为平均权重，每个工人的权重为当工人观测结束后，将观测数据提交到平台中去。该针对多轮次数据投毒攻击的Optimized TruthFinder方法，可以防御隐藏

全部详细技术资料下载

【技术实现步骤摘要】
针对多轮次数据投毒攻击的Optimized TruthFinder方法

[0001]本专利技术涉及数据投毒
，具体为针对多轮次数据投毒攻击的 Optimized TruthFinder方法。

技术介绍

[0002]群智感知是指在物联网环境下，利用人们具备的嵌入传感设备的移动设备，通过发布众包任务来收集生活中各种类型的数据的新型数据收集模式，其本质是众包在物联网中的表示形式，群智感知系统通过分发给具备传感器的普通用户一系列传感任务，来收集数据并进行数据分析工作，每个接受任务的个体作为参与群智感知任务的普通工人参与数据聚合，由于工人的传感设备质量以及工人动态移动等因素影响，工人提交的数据并不能保证全部准确。群智感知活动中一个极其重要的步骤是使用真值发现算法来解决数据冲突问题，通过数据聚合找到最贴近Ground Truth(地面真值)的真值，真值发现的基本思想为：1、如果一个事实是由许多值得信赖的用户提供的，则它大概率是真实的；2、如果一个事实与许多值得信赖的用户提供的事实相冲突，则它是真实的概率就很小，基于这个原理，真值发现对每个工人的可信度进行评估，可信度为工人在参与数据聚合中的权重，真值发现采用迭代的方法不断更新工人的权重和真值，直到收敛或满足某个预设条件。
[0003]采用源过滤和源估计的方法提前过滤掉误差大的工人数据技术，并未详细展开阈值如何设置，没有给出合理的解释，无法整明该技术的通用性，即阙值和其他参数之间的关系，如何设定阈值才合理，其次，该技术假设工人之间独立感知...

【技术保护点】

【技术特征摘要】
1.针对多轮次数据投毒攻击的Optimized TruthFinder方法，其特征在于，包括以下步骤：S1、任务发布平台发布任务为24小时每个整点由N个工人对某个物体的M个属性进行观察，N个工人接受任务后，平台对N个工人的权重进行初始化，初始化方式为平均权重，每个工人的权重为S2、数据提交当工人观测结束后，将观测数据提交到平台中去，平台将工人数据和工人权重提交给Optimized TruthFinder。S3、计算真值Optimized TruthFinder利用观测数据和工人权重来计算真值，Optimized TruthFinder首先执行传统TruthFinder的两步迭代式：首先使用加权平均来计算更新聚合值值随后使用第一步求得的聚合值来进一步更新每个工人的可信度，度，表示工人i对属性m提供的观察数据与聚合值之间的距离，w
i
的计算方式为：S4、动作选择恶意工人根据策略选择下一轮的动作，动作为攻击或者隐藏，本发明使用的策略为隐藏一次攻击一次，攻击时，恶意工人的数据为：μ＝0.25，隐藏时，数据为：S5、新数据提交到达下一个整点时，工人提交新的观测数据，普通工人提交正常数据，恶意工人提交数据平台收集完数据后连同保存的权重一同提交给TruthFinder。S6、任务结束当时间为24点时，任务结束，结束运行。2.根据权利要求1所述的针对多轮次数据投毒攻击的Optimized TruthFinder方法，其特征在于，所述步骤S3中，当达到收敛条件后或者达到预设的最大允许迭代次数，η＝20，可以得到收敛后的工人权重集合和聚合值集合紧接着计算单个工人的观测值距离聚合值的偏移量D
i
：
进而可以计算得到工人的平均偏移量：3.根据权利要求2所述的针对多轮次数据投毒攻击的Optimized TruthFinder方法，其特征在于，所述步骤S3中，当工人偏移量D
i，m
大于平均偏移量D
mean，m
时，意味着该工人提交的数据相误差...

【专利技术属性】
技术研发人员：李默涵，张宏妞，孙彦斌，田志宏，顾钊铨，韩伟红，唐可可，李树栋，仇晶，
申请(专利权)人：广州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人