本发明专利技术公开一种基于比特币交易分析的Tor非法用户去匿名化方法,该方法包括:Tor隐藏服务比特币地址发现、隐藏服务数据采集、比特币地址提取和Tor非法隐藏服务自动化识别。Tor隐藏服务比特币地址发现利用分布式爬虫技术采集隐藏服务站点数据,结合比特币地址构造原理和正则表达式从隐藏服务页面中提取有效比特币地址;Tor非法隐藏服务自动化识别利用机器学习训练文本多分类模型实现自动化识别Tor非法隐藏服务站点;比特币地址获取通过分析非法隐藏服务比特币历史交易记录,获取Tor非法交易用户比特币地址集合;Tor非法交易用户去匿名化基于比特币钱包标签数据和社交平台用户信息,实现Tor非法交易用户的去匿名化。实现Tor非法交易用户的去匿名化。实现Tor非法交易用户的去匿名化。
【技术实现步骤摘要】
一种基于比特币交易分析的Tor非法用户去匿名化方法
[0001]本专利技术涉及涉及一种去匿名化技术,属于匿名网络(Anonymity Network)和区块链(Blockchain)
,具体涉及一种基于比特币交易分析的Tor非法用户去匿名化方法。
技术介绍
[0002]在信息化技术高速发展的当下,网络威胁也在迅速增加,人们越来越重视互联网上的隐私和匿名。Tor作为当前最受欢迎的匿名通信系统,可以很好地保护客户端和服务端的通信关系。Tor良好的匿名性和大用户量,使得Tor成为了犯罪分子从事非法活动的温床。在Tor隐藏服务中充斥着大量的毒品枪支销售、儿童色情传播、信用卡诈骗的非法活动和交易。与此同时,比特币利用假名和不可链接性隐藏了真实用户与比特币地址之间的关系,为比特币交易提供了匿名性。这些特性促使Tor非法隐藏服务大规模使用比特币进行交易以隐藏交易双方身份。Chainalysis报告显示,2021年用于Tor非法交易的比特币总额超过21亿美元。因此,围绕比特币的去匿名化分析具有重要的研究意义。一些研究证明了比特币证明比特币并不是完全匿名的,比特币的匿名性缺陷,为实现Tor非法隐藏服务用户去匿名化带来可能。
技术实现思路
[0003]专利技术目的:针对Tor非法隐藏服务中大规模使用比特币进行交易以隐藏交易双方身份的问题,本专利技术提出一种基于比特币交易分析的Tor非法用户去匿名化方法,该方法收集隐藏服务信息并提取非法隐藏服务比特币地址,利用比特币历史交易记录形成Tor非法交易用户比特币地址集合,结合比特币钱包标签数据和社交平台用户信息,关联Tor非法交易用户比特币地址的钱包标签和社交平台用户身份。
[0004]本专利技术采用如下技术方案:
[0005]一种基于比特币交易分析的Tor非法用户去匿名化方法,该方法包括如下步骤:
[0006](1)Tor隐藏服务比特币地址发现:利用分布式爬虫技术采集隐藏服务站点数据,结合比特币地址构造原理和正则表达式从隐藏服务页面中提取有效比特币地址;
[0007](2)Tor非法隐藏服务自动化识别:利用机器学习训练文本多分类模型实现自动化识别Tor非法隐藏服务站点;
[0008](3)Tor非法交易用户比特币地址获取:通过分析非法隐藏服务比特币历史交易记录,获取Tor非法交易用户比特币地址集合;
[0009](4)Tor非法交易用户去匿名化:通过比特币钱包标签数据和社交平台用户信息,实现Tor非法交易用户的去匿名化。
[0010]进一步地,所述步骤(1)具体包括:
[0011](11)隐藏服务数据采集:收集Ahmia站点提供的隐藏服务地址作为种子节点,采用Scrapy
‑
Redis分布式爬虫框架采集Tor隐藏服务数据,从爬取的页面中提取.onion链接,保
存未爬取的链接到爬虫任务队列;
[0012](12)比特币地址提取:通过分析比特币地址生成过程涉及的加密算法、哈希算法和编码方式,得到不同类型地址的字符串特征,设计正则表达式从隐藏服务页面中提取符合特征的比特币地址,通过对提取的比特币地址进行解码校验判断是否有效。
[0013]进一步地,所述步骤(2)具体包括:
[0014](21)对隐藏服务HTML文档进行数据清洗和文本分词,去除HTML文档中的script脚本、style样式表、标签,将字符串文本转换成单词列表,对于每个单词,进行词性还原和去停用词;
[0015](22)基于预处理的文本数据构建词袋模型,将文本转换成向量,利用文档频次法进行特征选取,结合TF
‑
IDF加权技术实现特征加权;
[0016](23)对隐藏服务非法类别进行细粒度划分,例如:毒品、黑市、信用卡等,其他隐藏服务统一分类为其他,利用支持向量机训练文本多分类模型,利用模型预测隐藏服务类别。
[0017]进一步地,所述步骤(3)具体包括:
[0018](31)设计比特币多输入启发式聚类算法,聚类非法隐藏服务比特币地址,获取更多属于非法隐藏服务的比特币地址集合;
[0019](32)获取非法隐藏服务比特币地址集合的历史交易数据,把所有与非法隐藏服务比特币地址有过交易的比特币地址作为Tor非法隐藏服务比特币地址集合。
[0020]进一步地,所述步骤(4)具体包括:
[0021](41)将收集的Tor非法交易用户比特币地址与WalletExplorer站点提供的比特币地址钱包标签数据进行匹配;
[0022](42)利用Google搜索、Twitter搜索、Facebook搜索以及收集BitcoinTalk用户个人信息页数据,判断Tor非法交易用户比特币地址是否出现在Twitter、Facebook和BitcoinTalk平台。
[0023]有益效果:本专利技术与现有技术相比,其显著优点是:
[0024]1.主动收集较为隐秘的非法隐藏服务比特币地址,自动化标记非法隐藏服务并识别非法隐藏服务比特币地址。
[0025]2.设计比特币多输入启发式聚类算法工作流程,获取更多Tor非法隐藏服务比特币地址集合,利用比特币交易记录,收集Tor非法交易用户的比特币地址集合。
[0026]3.关联Tor非法交易用户比特币地址的钱包标签和社交平台用户身份,去匿名化程序Tor非法交易用户,为了解和追溯Tor非法用户提供帮助。
附图说明
[0027]图1是本专利技术基于比特币交易分析去匿名化Tor非法交易用户的总体方案设计图。
[0028]图2是本专利技术在Tor隐藏服务比特币地址发现中的隐藏服务数据采集流程图。
[0029]图3是本专利技术在Tor非法交易用户比特币地址获取中的比特币地址聚类流程图。
具体实施方式
[0030]以下将结合具体实施例对本专利技术提供的技术方案进行详细说明,应理解下述具体实施方式仅用于说明本专利技术而不用于限制本专利技术的范围。
[0031]本专利技术提供了一种基于比特币交易分析的Tor非法用户去匿名化方法,如图1所示,该技术分为四个部分,分别是Tor隐藏服务比特币地址发现、Tor非法隐藏服务自动化识别、Tor非法交易用户比特币地址获取和Tor非法交易用户去匿名化。具体包括:
[0032]1、Tor隐藏服务比特币地址发现
[0033]Tor隐藏服务比特币地址发现包括隐藏服务数据采集和比特币地址提取两个步骤。
[0034]隐藏服务数据采集:如图2,收集Ahmia站点提供的隐藏服务地址作为种子节点,采用Scrapy
‑
Redis分布式爬虫框架实现Tor隐藏服务站点数据的爬取,爬虫客户端将访问结果和站点内容封装成JSON格式,发送给Kafka消息队列,消息队列处理程序从KafKa读取消息,如果访问站点成功,则将页面内容以HTML文件格式保存到NAS存储节点,并从站点内容中提取所有.onion链接,在通过Redis布隆过滤器进行去重后,将未爬取链接保存到Redis本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于比特币交易分析的Tor非法用户去匿名化方法,其特征在于,该方法包括如下步骤:(1)Tor隐藏服务比特币地址发现:利用分布式爬虫技术采集隐藏服务站点数据,结合比特币地址构造原理和正则表达式从隐藏服务页面中提取有效比特币地址;(2)Tor非法隐藏服务自动化识别:利用机器学习训练文本多分类模型实现自动化识别Tor非法隐藏服务站点;(3)Tor非法交易用户比特币地址获取:通过分析非法隐藏服务比特币历史交易记录,获取Tor非法交易用户比特币地址集合;(4)Tor非法交易用户去匿名化:通过比特币钱包标签数据和社交平台用户信息,实现Tor非法交易用户的去匿名化。2.根据权利要求1所述的一种基于比特币交易分析的Tor非法用户去匿名化方法,其特征在于,所述步骤(1)具体包括:(11)隐藏服务数据采集:收集Ahmia站点提供的隐藏服务地址作为种子节点,采用Scrapy
‑
Redis分布式爬虫框架采集Tor隐藏服务数据,从爬取的页面中提取.onion链接,保存未爬取的链接到爬虫任务队列;(12)比特币地址提取:通过分析比特币地址生成过程涉及的加密算法、哈希算法和编码方式,得到不同类型地址的字符串特征,设计正则表达式从隐藏服务页面中提取符合特征的比特币地址,通过对提取的比特币地址进行解码校验判断是否有效。3.根据权利要求1所述的一种基于比特币交易分析的Tor非法用户去匿名化方法,其特征在于,所述步骤(2)具体包括:(21)对隐藏服...
【专利技术属性】
技术研发人员:杨明,张珩,顾晓丹,凌振,戴文轩,
申请(专利权)人:东南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。