本发明专利技术公开了匹配数据的方法、装置、设备和计算机可读介质,涉及计算机技术领域。该方法的一具体实施方式包括:针对已获取数据的用户,按照用户信息、已获取数据的参数和所述用户浏览记录,结合二分类模型,判断所述用户会再次获取数据;采用预设分类模型,将所述用户按照再次获取数据的概率分为多类;针对所述概率大于预设阈值的分类用户,结合所述分类用户的历史浏览记录和历史获取记录,确定所述分类用户的待获取数据和所述分类用户的相似用户;按照所述分类用户的待获取数据、所述相似用户、所述分类用户的历史浏览时间和历史浏览渠道,为所述分类用户匹配数据。该实施方式能够提高匹配数据的准确率。提高匹配数据的准确率。提高匹配数据的准确率。
【技术实现步骤摘要】
匹配数据的方法、装置、设备和计算机可读介质
[0001]本专利技术涉及计算机
,尤其涉及一种匹配数据的方法、装置、设备和计算机可读介质。
技术介绍
[0002]随着人工智能技术浪潮的到来,机器学习与深度学习的应用日益成熟,人工智能结合的行业已经逐步发展为智能、数字、科技护体的新形态。
[0003]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:采用常规匹配数据的方式,随机选择客户并统一发送消息,导致匹配数据的准确率较低。
技术实现思路
[0004]有鉴于此,本专利技术实施例提供一种匹配数据的方法、装置、设备和计算机可读介质,能够提高匹配数据的准确率。
[0005]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种匹配数据的方法,包括:
[0006]针对已获取数据的用户,按照用户信息、已获取数据的参数和所述用户浏览记录,结合二分类模型,判断所述用户会再次获取数据;
[0007]采用预设分类模型,将所述用户按照再次获取数据的概率分为多类;
[0008]针对所述概率大于预设阈值的分类用户,结合所述分类用户的历史浏览记录和历史获取记录,确定所述分类用户的待获取数据和所述分类用户的相似用户;
[0009]按照所述分类用户的待获取数据、所述相似用户、所述分类用户的历史浏览时间和历史浏览渠道,为所述分类用户匹配数据。
[0010]所述用户信息包括以下一种或多种:用户标识、年龄、性别和收入权重;
[0011]所述用户浏览记录包括以下一种或多种:预设时间段内的浏览总次数、预设时间段内的浏览总时长和预设时间段内的访问页面数量和是否N天活跃,N是大于等于1的实数。
[0012]所述预设分类模型是依据再次获取训练数据的等级、用户信息、用户浏览记录和已获取训练数据确定的,所述再次获取训练数据的等级是基于复购率或已购保单数量确定。
[0013]所述分类用户的相似用户是基于概率大于预设阈值的分类用户的历史浏览记录和历史获取记录确定的。
[0014]所述针对所述概率大于预设阈值的分类用户,结合所述分类用户的历史浏览记录和历史获取记录,确定所述分类用户的待获取数据和所述分类用户的相似用户,包括:
[0015]针对所述概率大于预设阈值的分类用户,结合所述分类用户的历史浏览记录、浏览行为的评分、历史获取记录和获取行为的评分,确定所述分类用户的待获取数据;
[0016]基于所述分类用户的待获取数据,选择出所述分类用户的相似用户。
[0017]所述按照所述分类用户的待获取数据、所述相似用户、所述分类用户的历史浏览
时间和历史浏览渠道,为所述分类用户匹配数据,包括:
[0018]按照所述分类用户的历史浏览时间和历史浏览渠道,确定发送数据的预设时间和所述预设时间的预设渠道;
[0019]将所述分类用户的待获取数据和所述相似用户的已获取数据,作为匹配数据;
[0020]按照所述预设渠道和所述预设时间,发送所述匹配数据。
[0021]所述结合二分类模型,判断所述客户用户会再次获取数据之前,还包括:
[0022]在所述用户信息、所述已获取数据的参数和所述用户浏览记录中,剔除高相关性的参数。
[0023]根据本专利技术实施例的第二方面,提供了一种匹配数据的装置,包括:
[0024]判断模块,用于针对已获取数据的用户,按照用户信息、已获取数据的参数和所述用户浏览记录,结合二分类模型,判断所述用户会再次获取数据;
[0025]分类模块,用于采用预设分类模型,将所述用户按照再次获取数据的概率分为多类;
[0026]数据模块,用于针对所述概率大于预设阈值的分类用户,结合所述分类用户的历史浏览记录和历史获取记录,确定所述分类用户的待获取数据和所述分类用户的相似用户;
[0027]匹配模块,用于按照所述分类用户的待获取数据、所述相似用户、所述分类用户的历史浏览时间和历史浏览渠道,为所述分类用户匹配数据。
[0028]根据本专利技术实施例的第三方面,提供了一种匹配数据的电子设备,包括:
[0029]一个或多个处理器;
[0030]存储装置,用于存储一个或多个程序,
[0031]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述的方法。
[0032]根据本专利技术实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述的方法。
[0033]上述专利技术中的一个实施例具有如下优点或有益效果:针对已获取数据的用户,按照用户信息、已获取数据的参数和所述用户浏览记录,结合二分类模型,判断所述用户会再次获取数据;采用预设分类模型,将所述用户按照再次获取数据的概率分为多类;针对所述概率大于预设阈值的分类用户,结合所述分类用户的历史浏览记录和历史获取记录,确定所述分类用户的待获取数据和所述分类用户的相似用户;按照所述分类用户的待获取数据、所述相似用户、所述分类用户的历史浏览时间和历史浏览渠道,为所述分类用户匹配数据。
[0034]首先,利用二分类模型在已获取数据中,筛选出会再次获取数据的用户。再摒除大量非再次获取数据的用户的情况下,采用预设分类模型分类再次获取数据的用户。上述分类的用户数量远远小于原始用户的数量,因而缩短匹配数据的时间。
[0035]其次,针对再次获取数据的用户,一方面从该用户自身出发预测待获取数据,另一个从相似用户出发获取数据,进而提高匹配数据的准确率。
[0036]上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
[0037]附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:
[0038]图1是根据本专利技术实施例的匹配数据的方法的主要流程的示意图;
[0039]图2是根据本专利技术实施例的判断用户会再次获取数据的流程示意图;
[0040]图3是根据本专利技术实施例的确定分类用户的待获取数据和分类用户的相似用户的流程示意图;
[0041]图4是根据本专利技术实施例的为分类用户匹配数据的流程示意图;
[0042]图5是根据本专利技术实施例的筛选用户的示意图;
[0043]图6是根据本专利技术实施例的发送任务的示意图;
[0044]图7是根据本专利技术实施例的匹配数据的装置的主要结构的示意图;
[0045]图8是本专利技术实施例可以应用于其中的示例性系统架构图;
[0046]图9是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
[0047]以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种匹配数据的方法,其特征在于,包括:针对已获取数据的用户,按照用户信息、已获取数据的参数和所述用户浏览记录,结合二分类模型,判断所述用户会再次获取数据;采用预设分类模型,将所述用户按照再次获取数据的概率分为多类;针对所述概率大于预设阈值的分类用户,结合所述分类用户的历史浏览记录和历史获取记录,确定所述分类用户的待获取数据和所述分类用户的相似用户;按照所述分类用户的待获取数据、所述相似用户、所述分类用户的历史浏览时间和历史浏览渠道,为所述分类用户匹配数据。2.根据权利要求1所述匹配数据的方法,其特征在于,所述用户信息包括以下一种或多种:用户标识、年龄、性别和收入权重;所述用户浏览记录包括以下一种或多种:预设时间段内的浏览总次数、预设时间段内的浏览总时长和预设时间段内的访问页面数量和是否N天活跃,N是大于等于1的实数。3.根据权利要求1所述匹配数据的方法,其特征在于,所述预设分类模型是依据再次获取训练数据的等级、用户信息、用户浏览记录和已获取训练数据确定的,所述再次获取训练数据的等级是基于复购率或已购保单数量确定。4.根据权利要求1所述匹配数据的方法,其特征在于,所述分类用户的相似用户是基于概率大于预设阈值的分类用户的历史浏览记录和历史获取记录确定的。5.根据权利要求1所述匹配数据的方法,其特征在于,所述针对所述概率大于预设阈值的分类用户,结合所述分类用户的历史浏览记录和历史获取记录,确定所述分类用户的待获取数据和所述分类用户的相似用户,包括:针对所述概率大于预设阈值的分类用户,结合所述分类用户的历史浏览记录、浏览行为的评分、历史获取记录和获取行为的评分,确定所述分类用户的待获取数据;基于所述分类用户的待获取数据,选择出所述分类用户的相似用户。6.根据权利要求1...
【专利技术属性】
技术研发人员:张雪冰,
申请(专利权)人:泰康在线财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。