本发明专利技术实施例提供了一种数据处理方法和装置,所述的方法包括:基于用户对应用的操作行为计算不同用户之间的相似度;以用户为顶点,以两个用户之间的相似度为两个相邻顶点的边长,建立各用户之间的用户传播图;将已确定属性标签的用户作为源用户,将所述属性标签标注为所述源用户在所述用户传播图对应顶点的传播属性;将未确定属性标签的用户作为目标用户,按照所述用户传播图查找所述目标用户对应顶点的相邻顶点,依据所述相邻顶点的传播属性预测所述目标用户的属性标签。采用属性标签标注用户的特征,通过用户传播图提高用户特征的标注效率。
【技术实现步骤摘要】
本专利技术涉及数据处理
,特别是涉及一种数据处理方法和一种数据处理装置。
技术介绍
应用程序(Application,APP)指的是各种客户端软件程序,用户在使用如智能手机、平板电脑以及笔记本电脑等终端时,通常可以安装各种应用程序,通过应用程序执行各种操作,如玩游戏、浏览网页、观看视频等。第三方应用平台能够为用户提供应用,即用户可以在第三方应用平台中浏览应用,以及下载应用。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的数据处理方法和相应的数据处理装置。依据本专利技术实施例的一个方面,提供了一种数据处理方法,包括:基于用户对应用的操作行为计算不同用户之间的相似度;以用户为顶点,以两个用户之间的相似度为两个相邻顶点的边长,建立各用户之间的用户传播图;将已确定属性标签的用户作为源用户,将所述属性标签标注为所述源用户在所述用户传播图对应顶点的传播属性;将未确定属性标签的用户作为目标用户,按照所述用户传播图查找所述目标用户对应顶点的相邻顶点,依据所述相邻顶点的传播属性预测所述目标用户的属性标签。可选的,所述基于用户对应用的操作行为计算不同用户之间的相似度,包括:基于用户对应用的操作行为确定用户向量,按照两个用户向量之间的距离计算对应两个用户之间的相似度。可选的,所述操作行为包括:浏览行为和下载行为;所述基于用户对应用的操作行为确定用户向量,按照两个用户向量之间的距离计算对应两个用户之间的相似度,包括:基于用户对应用的下载行为确定第一向量,以及基于用户对应用的浏览行为确定第二向量;选取两个用户,按照操作行为分别计算所述两个用户对应第一向量之间的第一距离,以及第二向量之间的第二距离;按照权重对所述第一距离和第二距离进行加权求和,确定所述两个用户之间的相似度。可选的,还包括:基于用户对应用的操作行为确定所述用户在每个属性维度下的属性倾向信息,其中,所述属性倾向信息包括:所述属性维度对应的各类别和每个类别的属性倾向值;按照属性倾向信息确定所述用户在每个属性维度的属性向量,将各属性向量作为所述用户的属性标签。可选的,按照所述用户传播图查找所述目标用户对应顶点的相邻顶点,包括:确定目标用户在所述用户传播图中对应的顶点;在所述用户传播图中查找所述目标用户对应顶点的相邻顶点,其中,所述相邻顶点的传播属性中标注有属性标签。可选的,依据所述相邻顶点的传播属性预测所述目标用户的属性标签,包括:按照所述目标用户对应顶点与相邻顶点之间的相似度,将所述相邻顶点的属性标签传播给所述目标用户对应顶点,预测所述目标用户的属性标签。可选的,还包括:基于所述属性标签为用户推送推荐信息,其中,所述推荐信息包括:与所述属性标签匹配的应用。根据本专利技术的另一个方面,还提供了一种数据处理装置,包括:相似度计算模块,用于基于用户对应用的操作行为计算不同用户之间的相似度;传播图建立模块,用于以用户为顶点,以两个用户之间的相似度为两个相邻顶点的边长,建立各用户之间的用户传播图;传播属性标注模块,用于将已确定属性标签的用户作为源用户,将所述属性标签标注为所述源用户在所述用户传播图对应顶点的传播属性;属性标签预测模块,用于将未确定属性标签的用户作为目标用户,按照所述用户传播图查找所述目标用户对应顶点的相邻顶点,依据所述相邻顶点的传播属性预测所述目标用户的属性标签。可选的,所述相似度计算模块,用于基于用户对应用的操作行为确定用户向量,按照两个用户向量之间的距离计算对应两个用户之间的相似度。可选的,所述操作行为包括:浏览行为和下载行为;所述相似度计算模块,包括:向量确定子模块,用于基于用户对应用的下载行为确定第一向量,以及基于用户对应用的浏览行为确定第二向量;距离计算子模块,用于选取两个用户,按照操作行为分别计算所述两个用户对应第一向量之间的第一距离,以及第二向量之间的第二距离;相似度确定子模块,用于按照权重对所述第一距离和第二距离进行加权求和,确定所述两个用户之间的相似度。可选的,还包括:属性标签预确定模块,用于基于用户对应用的操作行为确定所述用户在每个属性维度下的属性倾向信息,其中,所述属性倾向信息包括:所述属性维度对应的各类别和每个类别的属性倾向值;按照属性倾向信息确定所述用户在每个属性维度的属性向量,将各属性向量作为所述用户的属性标签。可选的,所述属性标签预测模块,包括:顶点查找子模块,用于确定目标用户在所述用户传播图中对应的顶点;在所述用户传播图中查找所述目标用户对应顶点的相邻顶点,其中,所述相邻顶点的传播属性中标注有属性标签。可选的,所述属性标签预测模块,包括:预测子模块,用于按照所述目标用户对应顶点与相邻顶点之间的相似度,将所述相邻顶点的属性标签传播给所述目标用户对应顶点,预测所述目标用户的属性标签。可选的,还包括:推荐模块,用于基于所述属性标签为用户推送推荐信息,其中,所述推荐信息包括:与所述属性标签匹配的应用。用户对应用的操作能够体现出用户的特征从而确定不同用户之间的相似度,从而以用户为顶点以两个相邻顶点的边长构建用户传播图,基于用户传播图中已确定属性标签的源用户,预测相邻顶点对应目标用户的属性标签,采用属性标签标注用户的特征,通过用户传播图提高用户特征的标注效率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本专利技术一个实施例的数据处理方法实施例的步骤流程图;图2示出了根据本专利技术另一个实施例的数据处理方法实施例的步骤流程图;图3示出了根据本专利技术一个实施例的数据处理装置实施例的结构框图;图4示出了根据本专利技术另一个实施例的数据处理装置实施例的结构框图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。实施例一参照图1,示出了根据本专利技术一个实施例的数据处理方法实施例的步骤流程图,具体可以包括如下步骤:步骤102,基于用户对应用的操作行为计算不同用户之间的相似度。用户在使用终端,通常会安装各种应用程序(简称应用)执行各种操作,因此会登录第三方应用平台进行应用的下载,第三方应用平台上可以记录用户对应用的各种操作行为,例如浏览使用应用,又如下载应用等。基于用户对应用的操作行为计算不同用户之间的相似度,即按照用户操作的相似性,如是否下载或浏览相同的应用,可以确定任意两个用户之间的相似度。步骤104,以用户为顶点,以两个用户之间的相似度为两个相邻顶点的边长,建立各用户之间的用户传播图。本实施例中,按照用户对应用的操作行为可能确定出用户自身的特征,例如用户的性别本文档来自技高网...
【技术保护点】
一种数据处理方法,包括:基于用户对应用的操作行为计算不同用户之间的相似度;以用户为顶点,以两个用户之间的相似度为两个相邻顶点的边长,建立各用户之间的用户传播图;将已确定属性标签的用户作为源用户,将所述属性标签标注为所述源用户在所述用户传播图对应顶点的传播属性;将未确定属性标签的用户作为目标用户,按照所述用户传播图查找所述目标用户对应顶点的相邻顶点,依据所述相邻顶点的传播属性预测所述目标用户的属性标签。
【技术特征摘要】
1.一种数据处理方法,包括:基于用户对应用的操作行为计算不同用户之间的相似度;以用户为顶点,以两个用户之间的相似度为两个相邻顶点的边长,建立各用户之间的用户传播图;将已确定属性标签的用户作为源用户,将所述属性标签标注为所述源用户在所述用户传播图对应顶点的传播属性;将未确定属性标签的用户作为目标用户,按照所述用户传播图查找所述目标用户对应顶点的相邻顶点,依据所述相邻顶点的传播属性预测所述目标用户的属性标签。2.如权利要求1所述的方法,其特征在于,所述基于用户对应用的操作行为计算不同用户之间的相似度,包括:基于用户对应用的操作行为确定用户向量,按照两个用户向量之间的距离计算对应两个用户之间的相似度。3.如权利要求2所述的方法,其特征在于,所述操作行为包括:浏览行为和下载行为;所述基于用户对应用的操作行为确定用户向量,按照两个用户向量之间的距离计算对应两个用户之间的相似度,包括:基于用户对应用的下载行为确定第一向量,以及基于用户对应用的浏览行为确定第二向量;选取两个用户,按照操作行为分别计算所述两个用户对应第一向量之间的第一距离,以及第二向量之间的第二距离;按照权重对所述第一距离和第二距离进行加权求和,确定所述两个用户之间的相似度。4.如权利要求1所述的方法,其特征在于,还包括:基于用户对应用的操作行为确定所述用户在每个属性维度下的属性倾向信息,其中,所述属性倾向信息包括:所述属性维度对应的各类别和每个类别的属性倾向值;按照属性倾向信息确定所述用户在每个属性维度的属性向量,将各属性
\t向量作为所述用户的属性标签。5.如权利要求4所述的方法,其特征在于,按照所述用户传播图查找所述目标用户对应顶点的相邻顶点,包括:确定目标用户在所述用户传播图中对应的顶点;在所述用户传播图中查找所述目标用户...
【专利技术属性】
技术研发人员:罗维,
申请(专利权)人:北京奇虎科技有限公司,奇智软件北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。