本发明专利技术涉及一种用户选取方法,该用户选取方法包括:获取每个种子用户的特征标签向量;根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心;获取所述每个类别的信息对应的特征权值向量;获取潜在用户群中的每个潜在用户的特征标签向量;根据所述潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户。上述方法可使得所选取出的目标用户的精准度更高。此外,还对应提供了一种用户选取装置。
【技术实现步骤摘要】
本专利技术涉及信息处理
,特别是涉及一种用户选取方法和装置。
技术介绍
随着大数据应用的发展,即时通信和社交应用平台中存储了大量的用户信息,比如用户的喜好、年龄、职业和需求等等,而这些用户信息对于是否可进行信息的推送,比如商品广告等信息的推送,有着重要的参考价值。传统的技术方案中,通常都是对所获取的海量用户进行简单的筛选,比如筛选出浏览过与服务商准备推送的信息相同或相似的用户,作为目标用户,并向其投放相关服务商的推送信息。而现实中,由于每个用户都是一个独立的存在,具有多样化的特性,仅通过这种简单的筛选所确定的用于投放信息的目标用户不够精准。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高目标用户选取的精准度的用户选取方法和装置。一种用户选取方法,所述方法包括:获取每个种子用户的特征标签向量;根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心;获取所述每个类别的信息对应的特征权值向量;获取潜在用户群中的每个潜在用户的特征标签向量;根据所述潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户。一种用户选取装置,所述装置包括:特征标签向量获取模块,用于获取每个种子用户的特征标签向量;聚类中心计算模块,用于根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心;特征权值向量获取模块,用于获取所述每个类别的信息对应的特征权值向量;所述特征标签向量获取模块还用于获取潜在用户群中的每个潜在用户的特征标签向量;第一距离计算模块,用于根据所述潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;目标用户选取模块,用于从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户。上述用户选取方法和装置,根据所获取的每个种子用户的特征向量以及预设的第一数量的信息类别,计算出每个类别的信息对应的聚类中心,然后根据潜在用户的特征标签向量、特征权值向量以及所计算出的聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;再从所计算出的所有潜在用户的第一距离中选取距离最短的第二数量的潜在用户,作为可向该目标用户发送相应的推送信息的目标用户。由于该第一距离可反映出对应潜在用户与相应类别信息的匹配程度,且距离越小,则说明越适合向该用户发送相应类别的信息,从而使得所选取出的目标用户更加精准。附图说明图1为一个实施例中用户选取方法的应用环境图;图2为一个实施例中用于实现用户选取方法的服务器的内部结构图;图3为一个实施例中用户选取方法的流程示意图;图4为一个实施例中聚类的示意图;图5为一个实施例中根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心的步骤的流程示意图;图6为一个实施例中获取每个类别的信息对应的特征权值向量的步骤的流程示意图;图7为一个实施例中根据反馈信息更新每个类别的信息对应的聚类中心和特征权值向量的步骤的流程示意图;图8为一个实施例中根据反馈信息更新每个类别的信息对应的聚类中心和特征权值向量的步骤的流程示意图;图9为一个实施例中用户选取装置的结构框图;图10为另一个实施例中用户选取装置的结构框图;图11为又一个实施例中用户选取装置的结构框图;图12为一个实施例中聚类中心计算模块的结构框图;图13为一个实施例中特征权值向量获取模块的结构框图;图14为再一个实施例中用户选取装置的结构框图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例所提供的用户选取方法可应用于如图1所示的应用场景中。参考图1所示,客户终端110可通过预先设置的网络与服务器120进行交互。客户终端110为需要向用户发送推送信息的服务商的终端,包括但不限于具有通信功能的智能手机、平板电脑、掌上电脑等设备。服务器120为存储有大量的用户信息的社交、即时通信或购物等平台的服务器,该大量的用户即构成一个潜在用户群。服务器120中的每个潜在用户均具有多个特征信息,根据该多个特征信息可构成特征标签向量,通过该特征标签向量可反映用户的特征。客户终端110可向服务器120发送用于选取合适的用户的选取请求,以便于向所选取的用户发送相关的推送信息。服务器120可根据该请求来获取每个种子用户的特征标签向量,种子用户一般为购买过或收藏过服务商的相关产品的用户;根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心。其中,第一数量与该服务商准备推荐的信息所包含的种类数量相匹配,每种类别的信息均对应具有一个聚类中心。服务器120中还设有与特征标签向量对应的特征权值向量,根据潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;然后从第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户,从而实现了对用户的选取。在一个实施例中,图1中的服务器120的内部结构如图2所示,该服务器包括通过系统总线连接的处理器、存储介质、内存和网络接口。其中,该服务器的存储介质存储有操作系统、数据库和一种用户选取装置。数据库用于存储数据,如存储每个潜在用户的特征标签向量、每个类别的信息的聚类中心以及特征权值向量等。该操作系统用于实现一种用户选取方法。该服务器的处理器用于提供计算和控制能力,支撑整个接入服务器的运行。该服务器的内存为存储介质中的用户选取系统的运行提供环境。该服务器的网络接口用于与外部的终端或服务器通过网络连接通信,比如接收终端110发送的选取请求或向所选取的用户对应的终端发送推送信息等。在一个实施例中,如图3所示,提供了一种用户选取方法,该方法可应用于如图1所示的服务器中,具体包括以下步骤:步骤302,获取每个种子用户的特征标签向量。本实施例中,服务器可预先接收服务商的客户终端所发送的用户选取请求,该用户选取请求中包含服务商所需推送信息的具体分类、以及一定数量的种子用户的特征信息,并根据服务商所提供的种子用户的特征信息构建对应的特征标签向量。其中,该推送信息可为任意信息,对推送信息所分的类别的数量即为第一数量。以推送信息为服装信息为例,当该具体分类被分为男士服装、女士服装和儿童服装三类时,则相应的第一数量即为3。以推送信息为体育用品为例,当该具体分类被分为篮球、足球、排球和网球四类时,则相应的第一数量即为4。种子用户为服务器所提供的样本用户,种子用户一般为购买过或收藏过服务商的相关产品的用户,种子用户的数量可为10000、50000等任意数量,所有数量的种子用户则构成一个种子用户群。特征信息可包括用户的年龄、性别、职业、收入、学历、所在城市以及购物习惯等其中的一种或多种。服务器可按照预设量化规则对每个种子用户的特征信息进行相应的量化,根据预设的所需类型的特征标签构建对应种子用户的特征标签向量。特征标签向量是具有一定长度的维度,其每个维度上的参数均对应表征本文档来自技高网...
【技术保护点】
一种用户选取方法,其特征在于,所述方法包括:获取每个种子用户的特征标签向量;根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心;获取所述每个类别的信息对应的特征权值向量;获取潜在用户群中的每个潜在用户的特征标签向量;根据所述潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户。
【技术特征摘要】
1.一种用户选取方法,其特征在于,所述方法包括:获取每个种子用户的特征标签向量;根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心;获取所述每个类别的信息对应的特征权值向量;获取潜在用户群中的每个潜在用户的特征标签向量;根据所述潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户。2.根据权利要求1所述的方法,其特征在于,所述根据所述每个潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离的步骤,包括:根据分类模型对所述潜在用户群中的特征标签向量进行筛选;计算筛选出的每个潜在用户和每个类别的聚类中心的第一距离。3.根据权利要求1所述的方法,其特征在于,所述从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户的步骤,包括:分别对每个类别对应的第一距离进行单独排名;从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为所述目标用户。4.根据权利要求1所述的方法,其特征在于,在所述从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户的步骤之后,还包括:向所述目标用户的终端发送与对应类别相匹配的推送信息。5.根据权利要求4所述的方法,其特征在于,在所述向所述目标用户发送与对应类别相匹配的推送信息的步骤之后,还包括:获取所述目标用户的反馈信息;根据所述反馈信息更新每个类别的信息对应的聚类中心和特征权值向量。6.根据权利要求5所述的方法,其特征在于,所述根据所述反馈信息更新每个类别的信息对应的聚类中心和特征权值向量的步骤,包括:根据所述反馈信息确定所述目标用户是否为种子用户;当所述目标用户为种子用户时,将所述目标用户的特征标签向量加入到对应类别的聚类中;更新所述聚类的中心点,将更新后的中心点作为对应类别信息的聚类中心。7.根据权利要求5所述的方法,其特征在于,所述根据所述反馈信息更新每个类别的信息对应的聚类中心和特征权值向量的步骤,包括:根据所述反馈信息对所述目标用户划分所属样本向量集;根据划分后的样本向量集,按照预设模型进行训练学习,更新特征权值向量。8.根据权利要求1所述的方法,其特征在于,在所述从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户的步骤之后,还包括:将所述目标用户的信息发送给客户终端,以使所述客户终端推...
【专利技术属性】
技术研发人员:章志青,吴佳明,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。