商品交易质量的检测方法和装置制造方法及图纸

技术编号:15895919 阅读:35 留言:0更新日期:2017-07-28 20:06
本申请提出一种商品交易质量的检测方法和装置,该商品交易质量的检测方法包括:获取实时日志系统采集的成交日志;获取预先生成的识别模型;根据所述识别模型,对所述成交日志进行识别,识别出所述成交日志中的作弊交易。该方法能够快速的识别出作弊交易。

Method and device for detecting quality of commodity transaction

The invention provides a method and a device for detecting a commodity quality, including the quality detection method of commodity trading: the transaction log for real-time log system acquisition; get the recognition model of pre generated; according to the recognition model of the transaction log to identify, identify the transaction log transaction cheating. This method can recognize cheating transactions quickly.

【技术实现步骤摘要】
商品交易质量的检测方法和装置
本申请涉及互联网
,尤其涉及一种商品交易质量的检测方法和装置。
技术介绍
在统计一些互联网特征信息时,如搜索实时计算排序特征、个性化实时计算行为特征、推荐实时计算推荐因子、实时计算销量属性等过程中容易受到用户异常作弊行为影响,导致各处导流业务排序结果异常,造成作弊用户(卖家)获得大量正常流量,正常用户(卖家)无法获得引流,造成交易系统瘫痪,影响业务正常发展。相关技术中,通常是基于统计分析数据特征,检测商品交易质量。但是,这种方式会存在2天或2小时以上的延迟。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的一个目的在于提出一种商品交易质量的检测方法,该方法可以快速的识别出作弊交易。本申请的另一个目的在于提出一种商品交易质量的检测装置。为达到上述目的,本申请第一方面实施例提出的商品交易质量的检测方法,包括:获取实时日志系统采集的成交日志;获取预先生成的识别模型;根据所述识别模型,对所述成交日志进行识别,识别出所述成交日志中的作弊交易。本申请第一方面实施例提出的商品交易质量的检测方法,通过获取识别模型,采用识别模型对实时采集的成交日志进行识别,可以保证对作弊交易的实时识别,从而可以快速识别出作弊交易。为达到上述目的,本申请第二方面实施例提出的商品交易质量的检测装置,包括:第一获取模块,用于获取实时日志系统采集的成交日志;第二获取模块,用于获取预先生成的识别模型;识别模块,用于根据所述识别模型,对所述成交日志进行识别,识别出所述成交日志中的作弊交易。本申请第二方面实施例提出的商品交易质量的检测装置,通过获取识别模型,采用识别模型对实时采集的成交日志进行识别,可以保证对作弊交易的实时识别,从而可以快速识别出作弊交易。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本申请一实施例提出的商品交易质量的检测方法的流程示意图;图2是本申请实施例对应的系统结构示意图;图3是本申请实施例中生成识别模型并采用识别模型进行识别的示意图;图4是本申请实施例中根据决策树模型识别的流程示意图;图5是本申请实施例中根据团伙信息熵模型识别的流程示意图;图6是本申请另一实施例提出的商品交易质量的检测装置的结构示意图;图7是本申请另一实施例提出的商品交易质量的检测装置的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本申请一实施例提出的商品交易质量的检测方法的流程示意图。参见图1,该方法包括:S11:获取实时日志系统采集的成交日志。其中,参见图2,为本实施例提出的检测方法对应的系统的结构示意图。如图2所述,该系统包括:实时日志系统21和流式计算系统22。实时日志系统21用于实时采集线上的成交日志,并在采集到成交日志后实时发送给流式计算系统22。流式计算系统22用于对成交日志进行实时识别,从成交日志中识别出作弊交易。另外,流式计算系统还可以用于执行其他的与成交日志相关的处理,例如,进行推荐排序、个性化排序、大型促销活动等。例如,参见图2,流式计算系统22可以包括:交易质量评估系统和非交易质量评估系统,其中,交易质量评估系统用于从成交日志中识别出作弊交易,非交易质量评估系统例如包括:推荐排序系统、个性化排序系统、大促投放系统等。另外,该系统还可以包括存储系统,以存储流式计算系统所需的数据。例如,流式计算系统22可以根据成交日志中的买家ID从存储系统中获取买家团伙标签。S12:获取预先生成的识别模型。本实施例中,识别模型包括决策树模型和团伙信息熵模型。其中,决策树模型用于识别个体炒作的作弊交易,团伙信息熵模型用于识别团伙炒作的作弊交易。S13:根据所述识别模型,对所述成交日志中的商品交易进行识别,识别出所述成交日志中的作弊交易。如图2所示,流式计算系统的日志流模块接收到实时日志系统发送的成交日志后,可以将成交日志推送给流式计算系统的其他子模块,其他子模块包括交易评估系统和非交易评估系统,交易评估系统用于识别成交日志中的作弊交易,非交易评估系统是根据成交日志进行处理的系统,例如包括:推荐排序系统、个性化排序系统和大促投放系统等。交易评估系统接收到成交日志后,可以对成交日志进行分析,识别出作弊交易。交易评估系统在识别时,根据决策树模型和团伙信息熵模型进行识别。具体的,可以先根据决策树模型识别出个体炒作的作弊交易,再采用团伙信息熵模型对非个体炒作的作弊交易进行识别,识别出团伙炒作的作弊交易。如图3所示,决策树模型和团伙信息熵模型是在训练模块31完成的,在用于识别作弊交易的预测模块32中,采用训练时生成的识别模型进行识别。一些实施例中,参见图4,生成决策树模型的流程可以包括:S41:获取训练样本。其中,训练样本包括:历史作弊交易和历史正常交易,历史作弊交易可以具体是指历史的个体炒作的作弊交易。训练样本可以记录在历史的成交日志中,流式计算系统可以从历史的成交日志中获取到训练样本。S42:获取所述训练样本的静态属性特征,并计算每个静态属性特征的信息增益。流式计算系统对应每个训练样本可以解析出其对应的静态属性特征。静态属性特征是对交易特征中的连续性变量离散化后得到的。交易特征例如包括:订单价格、类目、交易类型、支付金额、改价比例、红包支付、买家ID、卖家ID、商品ID、B/C类型、PC/无线类型等信息。信息增益的计算公式是:信息熵的计算公式是:其中,U为信息熵主体,n是特征取值范围,pi为对象U某种时间发生概率,V(A)为静态属性特征中属性A的值域,S是样本集合,Sv是S中属性A上值等于v的样本集合。S43:根据信息增益最大原则,生成决策树模型。例如,采用信息增益最大的特征分裂节点,直到树的深度到达上限,从而生成决策树模型。相应的,参见图4,在预测阶段,采用决策树模型识别作弊交易的流程可以包括:S44:对所述成交日志进行解析,获取当前交易的静态属性特征。其中,可以分别将成交日志中的每个交易作为当前交易,从而完成对每个交易的识别。对应每个当前交易,可以对当前交易的交易特征进行实时离散化,得到静态属性特征。交易特征例如包括:订单价格、类目、交易类型、支付金额、改价比例、红包支付、买家ID、卖家ID、商品ID、B/C类型、PC/无线类型等信息。S45:根据当前交易的静态属性特征遍历决策树模型,得到作弊分数。其中,在训练阶段得到的决策树模型的每个叶子节点中可以记录正常交易的个数和作弊交易的个数。通过对决策树模型的遍历,可以将当前待识别的交易对应到一个叶子节点,在对应到一个叶子节点后,可以从该叶子节点中获取正常交易的个数和作弊交易的个数,比如分别用M和N表示,从而可以将作弊概率(N/(M+N))确定为当前交易的作弊分数。S46:本文档来自技高网...
商品交易质量的检测方法和装置

【技术保护点】
一种商品交易质量的检测方法,其特征在于,包括:获取实时日志系统采集的成交日志;获取预先生成的识别模型;根据所述识别模型,对所述成交日志中的商品交易进行识别,识别出所述成交日志中的作弊交易。

【技术特征摘要】
1.一种商品交易质量的检测方法,其特征在于,包括:获取实时日志系统采集的成交日志;获取预先生成的识别模型;根据所述识别模型,对所述成交日志中的商品交易进行识别,识别出所述成交日志中的作弊交易。2.根据权利要求1所述的方法,其特征在于,所述识别模型包括:决策树模型和团伙信息熵模型,所述根据所述识别模型,对所述成交日志中的商品交易进行识别,识别出所述成交日志中的作弊交易,包括:采用所述决策树模型对所述成交日志中的商品交易进行识别,识别出个体炒作的作弊交易;采用所述团伙信息熵模型对所述成交日志中的非个体炒作的作弊交易进行识别,识别出团伙炒作的作弊交易。3.根据权利要求2所述的方法,其特征在于,还包括:生成决策树模型,所述生成决策树模型,包括:获取训练样本;获取所述训练样本的静态属性特征,并计算每个静态属性特征的信息增益;根据信息增益最大原则,生成决策树模型。4.根据权利要求3所述的方法,其特征在于,所述采用所述决策树模型对所述成交日志中的商品交易进行识别,识别出个体炒作的作弊交易,包括:对所述成交日志进行解析,获取当前交易的静态属性特征;根据当前交易的静态属性特征遍历决策树模型,得到作弊分数;当所述作弊分数大于预设值时,识别出所述当前交易是个体炒作的作弊交易。5.根据权利要求2所述的方法,其特征在于,还包括:生成团伙信息熵模型,所述生成团伙信息熵模型,包括:获取训练样本;获取所述训练样本对应的买家团伙标签,并获取买家团伙标签对应的成交量,以及获取所述训练样本对应的团伙信息熵;根据训练样本对应的成交量和团伙信息熵,生成团伙信息熵模型。6...

【专利技术属性】
技术研发人员:徐嘉明李朝林轩
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1