一种区块链交易识别系统技术方案

技术编号:38136667 阅读:5 留言:0更新日期:2023-07-08 09:48
本发明专利技术公开了一种区块链交易识别系统,该系统包括连接建立、消息获取、聚类、实体事务子图确定、特征矩阵确定、模型训练这些模块;本地客户端建立区块链网络节点连接,获取链上交易数据;在本地客户端通过启发式方法,对原始交易数据进行构图,得到实体事务图;对实体事务图进行子图提取得到实体事务子图,重构实体事务子图中的样本的邻接矩阵;通过N_motif图以及分类器进行特征提取得到特征矩阵;将实体事务子图中的样本的邻接矩阵和实体事务图的特征矩阵作为图学习输入,经过GCN和全连接层,得到分类预测模型。本发明专利技术提高了提取特征的质量、区块链中交易分类结果的置信度、模型的训练效率。练效率。练效率。

【技术实现步骤摘要】
一种区块链交易识别系统


[0001]本专利技术涉及人工智能
,特别是一种区块链交易识别系统。

技术介绍

[0002]区块链的另一大特性是它的匿名性,在区块链网络中,各个用户都使用假名进行交易,同时在交易的过程中不需要任何用户的私人信息,这是区块链天然的匿名性。而为了交易信息的安全,防止被他人窃取,研究人员不断的提出匿名技术来提高数据隐私性,尽可能的保护用户隐私。
[0003]为加强网络空间治理,维护法治社会秩序,对区块链中特定用户或机构进行去匿名化是十分有必要的。
[0004]目前的研究中,去匿名化方法主要包括启发式聚类、聚类算法和神经网络三类。启发式聚类通常由人为主观判断,从而制定聚类规则。聚类算法通常对目标进行相似度计算,将相似度相近的目标进行聚簇。神经网络通常由权重传递函数进行特征提取,而后不断调整相关参数,降低损失函数值,最终达到聚簇目的。
[0005]由于目前的方法大多数都是通过原始交易数据的基本特征进行去匿名化,并没有过多挖掘其隐藏特征,对于最终得到的去匿名化结果有较大影响。同时由于区块链中交易数据的巨大,直接使用数据进行训练,必然存在模型训练效率不高的问题,因此目前的去匿名化方法还存在改进的空间。

技术实现思路

[0006]本专利技术的目的在于提供一种提取特征质量高、区块链中交易分类预测结果置信度高、训练效率高的区块链交易识别系统。
[0007]实现本专利技术能够目的的技术解决方案为:一种区块链交易识别系统,针对交易的传播过程,采用启发式方法和分类器挖掘交易事务传播过程中的隐藏参数,结合挖掘出的隐藏参数作为特征进行图学习,以此进行交易识别,该系统包括:
[0008]连接建立模块,用于本地客户端向网络的DNS种子节点进行访问,获取网络的对等节点IP,与对等节点建立连接,加入网络;
[0009]消息获取模块,用于本地客户端向网络中的对等节点发起通信,获取mempool消息,即获取该节点整个内存池中的交易;
[0010]聚类模块,用于将消息获取模块获取的交易数据中交易事务输入地址和输出地址视为天然的地址交易图,本地客户端通过启发式方法对输入输出地址进行聚类,将类簇称为实体,将经过启发式方法聚类后的地址事务图称为实体事务图;
[0011]实体事务子图确定模块,用于通过本地客户端对实体事务图进行子图提取,得到实体事务子图,并重构实体事务子图中的样本的邻接矩阵,用实体事务子图作为后续图学习的输入;
[0012]特征矩阵确定模块,用于通过本地客户端对每一笔交易事务采用N_motif图进行
特征提取,同时通过分类器进行交易类别预测,将N_motif图获得隐藏特征和分类器的预测结果结合原始数据得到特征矩阵;特征矩阵包括:交易输入地址个数、交易输出地址个数、交易总输入值、交易总输出值、交易费用、是否属于Coinbase交易所、交易时间戳、实体接受交易事务的个数、实体发起交易事务的个数、是否是实体内交易、分类器所得交易分类置信度;
[0013]模型训练模块,用于通过本地客户端将实体事务子图中的样本的邻接矩阵和特征矩阵作为图学习模型的输入,并使用交叉熵损失函数经过GCN和全连接层进行特征权重训练,得到最终的分类预测模型进行交易识别。
[0014]本专利技术与现有技术相比,其显著优点为:(1)本专利技术利用启发式聚类方法、分类器算法以及N_motif图对原始数据进行特征提取,提高了特征质量,相比于仅仅使用原始数据特征进行机器学习的方法,提高了分类结果的置信度;(2)本专利技术利用图学习思想,对其输入进行子图分解,以子图作为样本输入进行训练,避免了将完整的图作为输入导致数据量过大而致使学习效率低下,提高了图学习效率。
附图说明
[0015]图1是本专利技术区块链交易识别系统的工作流程图。
[0016]图2是本实施例中与网络建立连接获取交易事务数据的流程示意图。
[0017]图3是本实施例中利用原始数据构建实体事务图的流程示意图。
[0018]图4是本实施例中通过1_motif、2_motif图进行特征提取的流程示意图。
[0019]图5是本实施例中特征提取的流程示意图。
[0020]图6是本实施例中GCN图学习的流程示意图。
具体实施方式
[0021]结合图1,本专利技术一种区块链交易识别系统,针对的交易的传播过程,采用启发式方法和分类器挖掘交易事务传播过程中的隐藏参数,结合挖掘出的隐藏参数作为特征进行图学习,以此进行交易识别,该系统包括:
[0022]连接建立模块,用于本地客户端向网络的DNS种子节点进行访问,获取网络的对等节点IP,与对等节点建立连接,加入网络;
[0023]消息获取模块,用于本地客户端向网络中的对等节点发起通信,获取mempool消息,即获取该节点整个内存池中的交易;
[0024]聚类模块,用于将消息获取模块获取的交易数据中交易事务输入地址和输出地址视为天然的地址交易图,本地客户端通过启发式方法对输入输出地址进行聚类,将类簇称为实体,将经过启发式方法聚类后的地址事务图称为实体事务图;
[0025]实体事务子图确定模块,用于通过本地客户端对实体事务图进行子图提取,得到实体事务子图,并重构实体事务子图中的样本的邻接矩阵,用实体事务子图作为后续图学习的输入;
[0026]特征矩阵确定模块,用于通过本地客户端对每一笔交易事务采用N_motif图进行特征提取,同时通过分类器进行交易类别预测,将N_motif图获得隐藏特征和分类器的预测结果结合原始数据得到特征矩阵;特征矩阵包括:交易输入地址个数、交易输出地址个数、
交易总输入值、交易总输出值、交易费用、是否属于Coinbase交易所、交易时间戳、实体接受交易事务的个数、实体发起交易事务的个数、是否是实体内交易、分类器所得交易分类置信度;
[0027]模型训练模块,用于通过本地客户端将实体事务子图中的样本的邻接矩阵和特征矩阵作为图学习模型的输入,并使用交叉熵损失函数经过GCN和全连接层进行特征权重训练,得到最终的分类预测模型进行交易识别,预测未知交易事务是否属于交易。
[0028]作为一种具体示例,聚类模块中,本地客户端通过启发式方法对输入输出地址进行聚类,将类簇称为实体,将经过启发式方法聚类后的地址事务图称为实体事务图,具体如下:
[0029]有向加权二部图建立子模块,用于将原始数据建模为地址

事务的有向加权二部图H=(A,T,L),其中a∈A代表地址,t∈T代表地址间的事务,l∈L表示地址和事务之间的边;将边划分为传入事务的边和传出事务的边,i代表传入边,o代表传出边;
[0030]实体事务图建立子模块,用于将实体e由一组地址完全表征,其中实体e代表逻辑用户;通过启发式方法,将地址

事务图转化为实体事务图g=(E,T
e
,L
e
),其中e∈E代表一个实体,t∈T
e
代表实体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种区块链交易识别系统,其特征在于,针对的交易的传播过程,采用启发式方法和分类器挖掘交易事务传播过程中的隐藏参数,结合挖掘出的隐藏参数作为特征进行图学习,以此进行交易识别,该系统包括:连接建立模块,用于本地客户端向网络的DNS种子节点进行访问,获取网络的对等节点IP,与对等节点建立连接,加入网络;消息获取模块,用于本地客户端向网络中的对等节点发起通信,获取mempool消息,即获取该节点整个内存池中的交易;聚类模块,用于将消息获取模块获取的交易数据中交易事务输入地址和输出地址视为天然的地址交易图,本地客户端通过启发式方法对输入输出地址进行聚类,将类簇称为实体,将经过启发式方法聚类后的地址事务图称为实体事务图;实体事务子图确定模块,用于通过本地客户端对实体事务图进行子图提取,得到实体事务子图,并重构实体事务子图中的样本的邻接矩阵,用实体事务子图作为后续图学习的输入;特征矩阵确定模块,用于通过本地客户端对每一笔交易事务采用N_motif图进行特征提取,同时通过分类器进行交易类别预测,将N_motif图获得隐藏特征和分类器的预测结果结合原始数据得到特征矩阵;特征矩阵包括:交易输入地址个数、交易输出地址个数、交易总输入值、交易总输出值、交易费用、是否属于Coinbase交易所、交易时间戳、实体接受交易事务的个数、实体发起交易事务的个数、是否是实体内交易、分类器所得交易分类置信度;模型训练模块,用于通过本地客户端将实体事务子图中的样本的邻接矩阵和特征矩阵作为图学习模型的输入,并使用交叉熵损失函数经过GCN和全连接层进行特征权重训练,得到最终的分类预测模型进行交易识别。2.根据权利要求1所述的区块链交易识别系统,其特征在于,聚类模块中,本地客户端通过启发式方法对输入输出地址进行聚类,将类簇称为实体,将经过启发式方法聚类后的地址事务图称为实体事务图,具体如下:有向加权二部图建立子模块,用于将原始数据建模为地址

事务的有向加权二部图H=(A,T,L),其中a∈A代表地址,t∈T代表地址间的事务,l∈L表示地址和事务之间的边;将边划分为传入事务的边和传出事务的边,i代表传入边,o代表传出边;实体事务图建立子模块,用于将实体e由一组地址完全表征,其中实体e代表逻辑用户;通过启发式方法,将地址

事务图转化为实体事务图g=(E,T
e
,L
e
),其中e∈E代表一个实体,t∈T
e
代表实体之间的交易,l∈L
e
代表实体和事务之间的边;将边划分为传入事务的边和传出事务的边,I
e
代表传入边,O
e
代表传出边。3.根据权利要求2所述的区块链交易识别系统,其特征在于,实体事务图建立子模块中所述的启发式方法,采用Co

spend clustering启发式方法,一个共同花费集群是由多个地址估计的,所有地址都为单个事务提供输入,即这些地址可视为统一实体。4.根据权利要求1所述的区块链交易识别系统,其特征在于,实体事务子图确定模块中,通过本地客户端对实体事务图进行子图提取,得到实体事务子图,并重构实体事务子图中的样本的邻接矩阵,具体如下:对于E中的每个实体,设置邻居数量的上限m
u
来控制事务子图的规模,如果e的邻居数量
小于阈值n
u
,则提取所有邻居及其之间的所有事务;否则计算并排序目标帐户与其邻居之间的总交易量,并选择前n
u
个邻居,提取这前n
u
个邻居及其之间的所有事务,得到E中的每个实体的邻接矩阵,即为实体事务图g的实体事务子图。5.根据权利要求1所述的区块链交易识别系统,其特征在于,特征矩阵确定模块中,通过本地客户端对每一笔交易事务采用N_motif图进行特征提取,同时通过分类器进行交易类别预测,将N_motif图获得隐藏特征和分类器的预测结果结合原始数据得到特征矩阵,具体如下:特征获取子模块,用于通过N_motif图从实体事务子图中获取新的特征;分类特征获取子模块,用于通过Adaboost分类方法,从实体事务图中获取分类特征;特征结合子模块,用于根据原始数据的样本特征,结...

【专利技术属性】
技术研发人员:韦志辉刘乐远黄婵颖颜克冬
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1