本发明专利技术公开一种基于eID和谱理论的跨平台虚拟资产交易审计方法,本技术的核心思想就是对跨平台虚拟资产的交易操作日志进行建模并构造审计规则库,然后结合eID技术利用交易属性对用户交易日志实现关联审计分析,最终获取理想的虚拟资产交易审计准确率,本技术在建立数据模型时充分考虑了数据相关属性的问题,并且能适应用户交易属性多变性和交易行为不确定性的特点。本技术通过构建规则库可以根据审计结果对其进行动态修正。在虚拟资产交易日志测试阶段,本技术的使用的检测方法不仅简单而且能获取较高的精度。
【技术实现步骤摘要】
基于eID和谱理论的跨平台虚拟资产交易审计方法
本技术属于网络与信息安全领域,具体涉及一种基于eID和谱理论的跨平台虚拟资产交易审计方法。
技术介绍
eID是电子身份证(electronicIDentity)的英文缩写,全称为公民网络电子身份标识,是居民身份证在网络上的异化形式。eID是网络上远程证明个人真实身份的权威性电子信息文件,由公安部公民网络身份识别系统签发(http://eid.cn/khatiseid.html)。它是由网民个人身份信息生成的一组唯一的网络标识符和数字证书,而网民真实信息保存在第三方可信机构。智能芯片卡把功能和用户的其他标识信息(如名称、e-mail、身份证号等)捆绑在一起,在网络上提供用户身份的验证信息,使得每个网民在网络虚拟环境中有且只有一个对应的真实身份。eID具有权威性、安全性和公信力,它避免了直接使用身份证导致的隐私泄漏问题,实现真正意义上的“前端匿名,后端实名”机制。目前,作为科技部的一个重大项目,eID在北京、上海等部分地区开始试运用,主要是对互联网上的远程身份进行识别与验证,如校园网络、电子商务、网络媒体,在线服务等等。北京邮电大学校园网已基本实现了基于eID的服务功能,并且取得了阶段性的成果。eID的使用为本技术的实现奠定了基础。虚拟资产交易审计主要是检测交易过程中的异常,即通过对虚拟资产交易相关日志进行关联分析,及时发现用户对虚拟资产的违规操作行为。异常审计是数据挖掘的重要内容,其实现方法有多种。基于分类的异常审计方法:基于分类的异常审计技术是一个两阶段过程,包括学习阶段和分类阶段。学习阶段,又称训练阶段,建立描述预先定义的数据类或概念集的分类器,通过有效的标记训练集构造分类器;分类阶段,又称测试阶段,利用分类器将一个测试对象标记为正常或异常。它的使用基于如下一般性假设:在给定的特征空间中,必能构造区分正常和异常数据类的分类器(TanPN,SteinbachM,KumarV.IntroductiontoDataMining[J].2006.)。基于最邻近的异常审计技术:给定特征空间中的数据集,可以使用距离度量来量化对象之间的相似性。直观地,远离其它对象的对象可以被视为异常,基于邻近性的方法假定:异常数据与它最近邻的邻近性显著偏离数据集中的其它数据与它们近邻之间的邻近性(ByersS,RafteryAE.Nearest-neighborclutterremovalforestimatingfeaturesinspatialpointprocesses[J].JournaloftheAmericanStatisticalAssociation,1998,93(442):577-584.)。统计学异常审计技术:统计学异常审计技术对数据的正常性做了假设。它们假定数据集中的正常对象由一个随机过程(生成模型)产生,因此,正常对象出现在该随机模型的高概率区域中,而低概率区域中的对象是异常的。该技术的一般思想是:学习一个拟合给定数据集的生成模型,然后识别该模型低概率区域中的对象,把它们视为异常(AggarkalCC,PhilipSY.OutlierDetectionkithUncertainData[C]//SDM.2008:483-493.)。信息论的异常审计技术:信息理论技术采用Kolmogorov复杂性、熵和相对熵等不同的信息论方法分析数据集中的信息量。该技术的使用基于以下事实:数据集中的异常会引发数据集信息量的不规则变化。信息论的异常检测技术的步骤如下:给定数据集D,找出该数据集的一个最小子集I,使得C(D)-C(D-I)的值最大,子集I中的数据被认为是异常,其中C(D)表示数据D的复杂性(KeoghE,LonardiS,RatanamahatanaCA.Tokardsparameter-freedatamining[C]//ProceedingsofthetenthACMSIGKDDinternationalconferenceonKnokledgediscoveryanddatamining.ACM,2004:206-215.)。基于谱理论的异常审计技术:谱技术通过一组包含数据集主要特征的属性找到数据的一种近似表示。基于谱的异常审计技术假设数据可以被映射到低维度的子空间中并且正常数据与异常数据有显著区别。因此该技术一般采用主成分分析法找到这样的子空间,在该子空间内,异常数据容易被识别(AgovicA,BanerjeeA,GangulyAR,etal.6AnomalyDetectioninTransportationCorridorsUsingManifoldEmbedding[J].KnokledgeDiscoveryfromSensorData,2008:81-105.)。在虚拟资产交易审计中,与虚拟资产有关的异常一般为情境异常,因为虚拟资产有多种类型,不同类型的虚拟资产属性不一样;并且不同的用户对同类虚拟资产的操作也不一样,这涉及虚拟资产交易平台的多样性。因此,虚拟资产的审计包含两方面内容:虚拟资产操作日志的审计和虚拟资产属性信息的审计。因此单一地使用上述某种技术对虚拟资产的交易进行异常审计并不科学,也很难获得较高的检测准确率。现有的异常审计方法侧重于审计数据的转移属性或频率属性,却很少关注数据的相关属性。
技术实现思路
针对现有技术的缺陷,本技术在建立数据模型时就充分考虑了数据相关属性的问题,并且能适应用户交易属性多变性和交易行为不确定性的特点。本技术通过使用谱理论方法构建可以根据审计结果对其进行动态修正的审计规则库,并结合eID技术实现对虚拟资产交易的跨平台审计。在虚拟资产交易日志测试阶段,本技术使用的检测方法不仅简单而且能获取较高的精度。本技术的核心思想就是对虚拟资产的交易操作日志进行建模并构造审计规则库,然后结合eID技术利用交易属性对用户交易日志实现关联审计分析,最终获取理想的虚拟资产交易审计准确率。本专利技术方案如下:步骤1、给定某类虚拟资产的正常交易日志记录,称之为训练集;对于该训练集,根据eID的唯一性,对其进行预处理:合并相同eID用户的交易日志,将交易操作转化为时序数据,统计每个eID用户的交易属性信息,形成用户交易属性信息库Φ;步骤2、为用户的交易操作日志建立数学模型:将每名eID用户的交易操作时序数据进行分割,分割长度为l;此外,将日志记录中互不相同操作的个数记为N,这样可以为每个l长的交易操作序列创建N×N大小的矩阵Cl;该矩阵的横纵坐标都是不同类型的操作,而矩阵元素就是对应的操作对在窗口尺寸h内出现的频数,即h个连续操作中某操作对出现的次数;矩阵Cl的每个元素代表了操作对之间的关联度;步骤3、利用谱理论抽取用户交易操作行为主特征:由训练集转化得到的矩阵集为C={C1,C2,…,Cn},大小都是N×N的,通过等式(1)计算均值矩阵Cmean,n是训练集中时序数据段的总数;矩阵集C中的每个矩阵减去均值矩阵Cmean得到新的矩阵集C′;对于C′中的N×N矩阵Ci′,可以改写为1×N2的向量即1≤i≤n,构造协方差矩阵E,大小是N2×N2,矩阵E元素的本文档来自技高网...
【技术保护点】
一种基于eID和谱理论的跨平台虚拟资产交易审计方法,其特征在于,包括以下步骤:步骤1、给定某类虚拟资产的正常交易日志记录,称之为训练集;对于该训练集,根据eID的唯一性,对其进行预处理:合并相同eID用户的交易日志,将交易操作转化为时序数据,统计每个eID用户的交易属性信息,形成用户交易属性信息库Φ;步骤2、为用户的交易操作日志建立数学模型:将每名eID用户的交易操作时序数据进行分割,分割长度为l;此外,将日志记录中互不相同操作的个数记为N,这样可以为每个l长的交易操作序列创建N×N大小的矩阵Cl;该矩阵的横纵坐标都是不同类型的操作,而矩阵元素就是对应的操作对在窗口尺寸h内出现的频数,即h个连续操作中某操作对出现的次数;矩阵Cl的每个元素代表了操作对之间的关联度;步骤3、利用谱理论抽取用户交易操作行为主特征:由训练集转化得到的矩阵集为大小都是N×N的,通过等式(1)计算均值矩阵Cmean,n是训练集中时序数据段的总数;Cmean=1nΣi=1nCi---(1)]]>矩阵集中的每个矩阵减去均值矩阵Cmean得到新的矩阵集;对于中的N×N矩阵Ci’,可以改写为1×N2的向量,即Ci^=[Ci,(1,1),Ci,(1,2),...,Ci,(2,1),...,Ci,(N,N)],]]>1≤i≤n,构造协方差矩阵Ε,大小是N2×N2,矩阵E元素的含义就是操作对与操作对之前关联度;E=Σi=1nC^iTCi^---(2)]]>根据PCA方法计算矩阵E的特征值为λi和相应的特征向量vi(1≤i≤N2,λ1≥…≥);根据谱理论和矩阵E的性质可知,v1,v2,…,构成N2×N2维空间的一组正交基,从N2个特征向量中选择前k个,使得这k个特征的主成分贡献率达到预定阈值η,即Σi=1kλiΣi=1N2λi≥η---(3)]]>这k个特征向量就代表了用户交易行为的主特征;步骤4、通过用户交易行为主特征构建审计规则库;任何虚拟资产交易日志转化的时序数据矩阵都可以用向量积xi=vi·C^T1≤i≤k---(4)]]>计算它在k个特征向量构成的主特征空间中的坐标表示,记为X=(x1,…,xk),其中N×N的C改写成1×N2的,通过上式计算,任何高维的时序数据矩阵都可以转化为主特征空间的坐标表示,达到了降维的目的;Σi=1kxiVi=Σi=1k(Ai+Bi)=Σi=1kAi+Σi=1kBi---(5)]]>其中Ai中的元素由xiCi中元素大于阈值α的值构成,其余的构成Bi;正因子模块Ai反映了在正常交易过程中用户最有可能的产生操作序列,而Bi则反映了最不可能出现的操作序列;通过式(4)、(5)计算中每个矩阵在主特征空间中的坐标表示并构成正因子模块组和负因子模块组这样就构成了虚拟资产交易日志审计规则库;步骤5、虚拟资产交易操作和交易属性关联审计:对于任一待检测的用户虚拟资产交易时序数据s,首先根据用户使用的eID在交易属性信息库Φ中查询s相关操作的属性发生概率是否都达到预先设定的阈值ζ,若达到则按步骤2构建矩阵M,否则就在矩阵M中未达到阈值ζ的属性关联操作所在的行或列加上惩罚因子θ,θ值由实际应用确定;然后减去均值矩阵Cmean得到M′,并根据式(4),式(5)计算该时序数据的正负因子模块Ai‘和Bi’;最后对于和中的每一组模块,根据下列等式计算用户此段虚拟资产交易日志正常与否的判断值,对于审计判定值ε,有如下审计规则:若且则审计为正常;若且则审计为异常;若且i.若则审计为正常;ii.否则审计为异常;若且i.若则审计为异常ii.否则审计为正常;步骤6、算法修正,若本技术判断正确且审计结果为正常,则将用户相应交易操作属性信息加入属性信息库Φ,并根据用户eID进行概率统计;若本技术判断错误且审计结果为正常,则将用户时序数据的生成的负因子模块加入负因子模块组;若本技术判断错误且审计结果为异常,则将用户时序数据的生成的正因子模块加入负因子模块组。...
【技术特征摘要】
1.一种基于eID和谱理论的跨平台虚拟资产交易审计方法,其特征在于,包括以下步骤:步骤1、给定某类虚拟资产的正常交易日志记录,称之为训练集;对于该训练集,根据eID的唯一性,对其进行预处理:合并相同eID用户的交易日志,将交易操作转化为时序数据,统计每个eID用户的交易属性信息,形成用户交易属性信息库Φ;步骤2、为用户的交易操作日志建立数学模型:将每名eID用户的交易操作时序数据进行分割,分割长度为l;此外,将日志记录中互不相同操作的个数记为N,这样可以为每个l长的交易操作序列创建N×N大小的矩阵Cl;该矩阵的横纵坐标都是不同类型的操作,而矩阵元素就是对应的操作对在窗口尺寸h内出现的频数,即h个连续操作中某操作对出现的次数;矩阵Cl的每个元素代表了操作对之间的关联度;步骤3、利用谱理论抽取用户交易操作行为主特征:由训练集转化得到的矩阵集为C={C1,C2,…,Cn},Ci都是N×N的,1≤i≤n,通过等式(1)计算均值矩阵Cmean,n是训练集中时序数据段的总数;矩阵集C中的每个矩阵减去均值矩阵Cmean得到新的矩阵集C′;对于C′中的N×N矩阵Ci′,可以改写为1×N2的向量即构造协方差矩阵E,大小是N2×N2,矩阵E元素的含义就是操作对与操作对之前关联度;根据PCA方法计算矩阵E的特征值为λi和相应的特征向量根据谱理论和矩阵E的性质可知,构成N2×N2维空间的一组正交基,从N2个特征向量中选择前k个,使得这k个特征的主成分贡献率达到预定阈值η,即这k个特征向量就代表了用户交易行为的主特征;步骤4、通过用户交易行为主特征构建审计规则库;任何虚拟资产交易日志转化的时序数据矩阵都可以...
【专利技术属性】
技术研发人员:全拥,贾焰,韩伟红,李爱平,周斌,杨树强,李树栋,黄九鸣,李虎,邓璐,姬炳帅,刘斐,
申请(专利权)人:中国人民解放军国防科学技术大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。