渠道中的用户检测方法和装置制造方法及图纸

技术编号:15912732 阅读:39 留言:0更新日期:2017-08-01 23:23
本发明专利技术提供了一种渠道中的用户检测方法,包括:获取渠道分发的应用中用户触发进行访问所上报的多种属性,所述用户是所述渠道分发的任意应用所新增的用户;所述用户之间根据所述多种属性进行层次聚类得到预设数目的用户类,所述用户分别归属于各用户类;根据各用户类中用户的行为属性去除绝对真实用户归属的用户类;对所述用户类中的用户进行模糊判别,以判别得到可疑虚假用户。此外,还提供了一种渠道中的用户检测装置。上述渠道中的用户检测方装置法和装置能够准确识别渠道下刷量工具的使用,并且准确识别渠道中掺杂的部分虚假用户。

Method and device for detecting user in channel

The present invention provides a user detection method, a channel includes: acquiring user application in a variety of distribution channels trigger access attributes reported, the user is arbitrary application of the distribution channels of the new user; the user according to the various properties of hierarchical clustering are preset number the user, the user belongs to the user; according to the properties of user behavior in each user to remove absolutely true user belonging to the class of user; the user in the user to determine the fuzzy identification, users get suspicious false. In addition, a user detection device in a channel is also provided. The user detection method, the device and the device in the above channel can accurately identify the use of a brush measuring tool in a channel, and accurately identify the partially adulterated users in the channel.

【技术实现步骤摘要】
渠道中的用户检测方法和装置
本专利技术涉及互联网应用
,特别涉及一种渠道中的用户检测方法和装置。
技术介绍
渠道中刷量工具的使用时有发生,以通过刷量工具生成应用的虚假用户,以造成该应用由此渠道得到大量用户的虚假现象。现有的刷量工具可以利用模拟器随意伪造机器参数,也可以通过编写程序脚本来模拟真实用户行为,修改真机参数,驱动趁机运行,这些行为已经与真实的用户行为没有差别。针对此情况,现有的解决方案是对渠道效果进行评估,用以实现评估的数据可以是留存率、终端分布情况、IP地址聚集情况等。例如,真实用户的留存曲线是一条平滑的指数衰减曲线,如若某一应用的留存曲线存在陡升或者陡降的异常波动,则可判定当前渠道下使用了刷量工具。同理,如果当前渠道下终端分布与大盘的终端分布不一致,则也可判定当前渠道下使用了刷量工具。但是,随着刷量工具的迭代更新,其也会基于各种数据的整体特点来进行真实用户行为的模拟,依赖于某些数据的整体表现的现有的解决方案将无法准确地识别渠道下是否使用刷量工具,更无法对掺杂了部分虚假用户的渠道进行识别。
技术实现思路
基于此,有必要提供一种渠道中的用户检测方法,所述方法能够准确识别渠道下刷量工具的使用,并且准确识别渠道中掺杂的部分虚假用户。此外,还有必要提供一种渠道中的用户检测装置,所述装置能够准确识别渠道下刷量工具的使用,并且准确识别渠道中掺杂的部分虚假用户。为解决上述技术问题,将采用如下技术方案:一种渠道中的用户检测方法,包括:获取渠道分发的应用中用户触发进行访问所上报的多种属性,所述用户是所述渠道分发的任意应用所新增的用户;所述用户之间根据所述多种属性进行层次聚类得到预设数目的用户类,所述用户分别归属于各用户类;根据各用户类中用户的行为属性去除绝对真实用户归属的用户类;对所述用户类中的用户进行模糊判别,以判别得到可疑虚假用户。一种渠道中的用户检测装置,包括:属性获取模块,用于获取渠道分发的应用中用户触发进行访问所上报的多种属性,所述用户是所述渠道分发的任意应用所新增的用户;层次聚类模块,用于所述用户之间根据所述多种属性进行层次聚类得到预设数目的用户类,所述用户分别归属于各用户类;真实用户去除模块,用于根据各用户类中用户的行为属性去除绝对真实用户归属的用户类;模糊判别模块,用于对所述用户类中的用户进行模糊判别,以判别得到可疑虚假用户。由上述技术方案可知,下载自一渠道的应用触发运行时对于该种应用而言,将随着应用运行中用户触发进行访问的各种行为上报多种属性,此时,对于渠道而言,针对其所分发的任意一种应用,都能够得到此种应用新增的用户所上报的多种属性,在新增的用户之间,根据多种属性进行新增的用户的层次聚类得到预设数目的用户类,根据各用户类中用户的行为属性去除绝对真实用户归属的用户类,并对余下的用户类进行用户的模糊判别,以得到可疑虚假用户,此过程是基于用户粒度而实现的,不仅能够准确识别渠道下刷量工具的使用,也能够准确识别渠道中掺杂的部分虚假用户,由此减少了对渠道的误伤和漏报。附图说明图1是一个实施例中渠道中的用户检测方法的流程图;图2是另一个实施例中渠道中的用户检测方法的流程图;图3是图1中用户之间根据多种属性进行层次聚类得到预设数目的用户类的方法流程图;图4是图1中根据各用户类中用户的行为属性去除绝对真实用户归属的用户类的方法流程图;图5是对用户类中的用户进行模糊判别,以判别得到可疑虚假用户的方法流程图;图6是一个实施例中渠道中的用户检测装置的结构示意图;图7是另一个实施例中渠道中的用户检测装置的结构示意图;图8是图6中层次聚类模块的结构示意图;图9是图6中真实用户去除模块的结构示意图;图10是图6中模糊判别模块的结构示意图;图11是本专利技术实施例中的运行环境示意框图。具体实施方式体现本专利技术特征与优点的典型实施方式将在以下的说明中详细叙述。应理解的是本专利技术能够在不同的实施方式上具有各种的变化,其皆不脱离本专利技术的范围,且其中的说明及图示在本质上是当作说明之用,而非用以限制本专利技术。如前所述的,随着互联网应用的发展,种类繁多的应用通过渠道发布并推广,用户可通过任一渠道下载得到所需要的应用,任意一种应用在渠道中的发布和推广均需要支付一定的费用,例如,对于渠道提供的应用,每新增一个用户,开发者将付给渠道一个费用。由此便有了刷量工具的存在,该刷量工具用于为渠道中某些应用制造虚假用户,由此来骗取费用。因此,对于渠道和应用的开发者而言,刷量工具使用的检测就显得尤为重要。但是,由于现有的刷量工具越来越能够逼真地模拟真实用户,渠道所获取到的各种统计数据在整体上与未使用刷量工具的情况下一致,进而渠道中准确检测是否使用了刷量工具将变得越来越困难。为避免渠道中使用刷量工具的漏报和误伤,以准确识别得到渠道中所存在的虚假用户,将提供了一种渠道中的用户检测方法。该方法依赖于计算机程序,该计算机程序将运行于计算机系统之上,计算机系统可以运行于智能手机、平板电脑、个人电脑和笔记本电脑等终端中。在一个实施例中,具体的,该渠道中的用户检测方法如图1所示,包括:步骤110,获取渠道分发的应用中用户触发进行访问所上报的多种属性,用户是渠道分发的任意应用所新增的用户。渠道拥有各种应用和用户,其能够进行应用分发,例如,各种为用户提供应用的平台即可称之为渠道。对于开发的应用,都将按照其即将使用的渠道预设设置不同的版本,即每一即将使用的渠道都有对应的版本,并通过相应的渠道版本进行标识。需要首先说明的是,本专利技术所指的用户以及新增的用户均是渠道以及应用中的身份标识,其将作为渠道中任一应用的下载者和使用者,并以身份标识的数据形式存在。该身份标识将是基于渠道所提供的帐号体系而得到的,因此,同一用户在此渠道所下载和使用的多种应用都将对应于一相同的身份标识,以便于对此用户进行检测,进而衡量渠道当前的状况。对于渠道分发的任意一种应用,终端在运行此应用并进行此应用的访问时,将在此应用中触发用户的各种行为,例如,通过一设定的网络接入方式与后台的服务器进行网络交互的行为。此应用将对应得到多种属性,并上报。与之相对应的,在对一渠道所进行的用户检测中,针对分发的各种应用,都能够为每一种应用获取得到各用户上报的多种属性,并由此提取该种应用的新增的用户所上报的多种属性。应用中用户触发进行访问所上报的多种属性包括用户在应用中的行为属性、软件环境属性、硬件环境属性和网络环境属性等多个方面的属性,其可根据实际运营的需要进行设定。需要说明的是,由于渠道中相同用户在各种应用中均以相同身份标识的形式存在,因此,对于一种应用而言为新增的用户,相对其它某些应用而言,将是早已经存在的用户。步骤130,用户之间根据多种属性进行层次聚类得到预设数目的用户类,用户分别归属于各用户类。针对渠道中任意一种应用,将获取得到该种应用中新增的用户上报的多种属性,此新增的用户中,以多种属性为输入,进行用户之间的层次聚类,得到预设数目的用户类,其中,预设数目即为用户之间层次聚类的目标。层次聚类所得到的用户类包括了一个或者多个用户,其中,用户类所包括的多个用户将是相互之间匹配的用户,并且在多种属性上具备相似性。步骤150,根据各用户类中用户的行为属性去除绝对真实用户归属的用户类。获取各用户类中用户的行为属性,该行为本文档来自技高网...
渠道中的用户检测方法和装置

【技术保护点】
一种渠道中的用户检测方法,其特征在于,包括:获取渠道分发的应用中用户触发进行访问所上报的多种属性,所述用户是所述渠道分发的任意应用所新增的用户;所述用户之间根据所述多种属性进行层次聚类得到预设数目的用户类,所述用户分别归属于各用户类;根据各用户类中用户的行为属性去除绝对真实用户归属的用户类;对所述用户类中的用户进行模糊判别,以判别得到可疑虚假用户。

【技术特征摘要】
1.一种渠道中的用户检测方法,其特征在于,包括:获取渠道分发的应用中用户触发进行访问所上报的多种属性,所述用户是所述渠道分发的任意应用所新增的用户;所述用户之间根据所述多种属性进行层次聚类得到预设数目的用户类,所述用户分别归属于各用户类;根据各用户类中用户的行为属性去除绝对真实用户归属的用户类;对所述用户类中的用户进行模糊判别,以判别得到可疑虚假用户。2.根据权利要求1所述的方法,其特征在于,所述用户之间根据所述多种属性进行层次聚类得到预设数目的用户类的步骤之前,所述方法还包括:根据预置的绝对虚假用户强属性,在进行多种属性上报的用户中识别与所述绝对虚假用户强属性相符的用户;去除所述与绝对虚假用户强属性相符的用户。3.根据权利要求1所述的方法,其特征在于,所述用户之间根据多种属性进行层次聚类得到预设数目的用户类的步骤包括:将每一用户归为一用户类;两两匹配所述用户类,并将最为匹配的两个用户类合并,直至用户类的数目达到预设数目。4.根据权利要求1所述的方法,其特征在于,所述根据各用户类中用户的行为属性去除绝对真实用户归属的用户类的步骤包括:获取所述用户的行为属性,所述行为属性是通过所述渠道分发所有应用中所述用户触发的行为得到的;根据所述行为属性中绝对真实用户行为属性识别绝对真实用户归属的用户类,并去除所述绝对真实用户归属的用户类。5.根据权利要求1所述的方法,其特征在于,所述对所述用户类中的用户进行模糊判别,以判别得到可疑虚假用户的步骤包括:根据预置的虚假用户弱规则对所述用户类进行模糊判别,以得到所述用户类相对虚假用户的隶属度;根据所述隶属度得到所述用户类包含的用户为可疑虚假用户的判别结果。6.一种...

【专利技术属性】
技术研发人员:孔蓓蓓熊健杨剑鸣
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1