用于确定目标信息的数据处理系统技术方案

技术编号:31235570 阅读:17 留言:0更新日期:2021-12-08 10:17
本发明专利技术涉及一种用于确定目标信息的数据处理系统,实现步骤S1、基于第一数据库、第二数据库和第三数据库构建多个模型样本训练数据,输入预设的目标信息预测模型框架中进行训练,确定所述目标信息预测模型框架中每一输入特征信息对应的权重,生成目标信息预测模型;步骤S2、基于每一待测信息id和该待测信息id对应的信息类型id、目标用户id、所述第一数据库和第二数据库,构建该待测信息id对应的输入特征向量并输入所述目标信息预测模型中,得到对应的信息预测值;步骤S3、将所有待测信息id对应的信息预测值按从大到小的顺序排序,将排在前M个的待测信息id确定为目标信息id。本发明专利技术提高了向用户推送的目标信息的准确性和实时性。高了向用户推送的目标信息的准确性和实时性。高了向用户推送的目标信息的准确性和实时性。

【技术实现步骤摘要】
用于确定目标信息的数据处理系统


[0001]本专利技术涉及数据处理
,尤其涉及一种用于确定目标信息的数据处理系统。

技术介绍

[0002]个性化信息是根据用户的浏览兴趣来向用户推荐相关的信息,由于推荐的信息和用户的兴趣密切相关,可以有效地提高用户体验,让用户更容易接受,避免了信息投放的中带宽和流量的浪费,提高了信息投放的效率。
[0003]现有的信息推荐方法往往基于用户的基本资料、用户对信息的历史访问、历史点击行为信息等信息确定的历史兴趣信息进行信息推送。但是,用户在不同的时间段对应兴趣信息是动态变化的,且可能对应多个兴趣信息,例如,用户在旅行时段内,则对应的兴趣信息为旅游信息,交通信息;用户在假期时段内,对应的兴趣信息为娱乐信息和餐饮信息。因此,现有的确定目标推送信息的技术并未充分考虑用户的实时兴趣信息,向用户推送的目标信息的准确性低、实时性差。

技术实现思路

[0004]本专利技术目的在于,提供一种用于确定目标信息的数据处理系统,提高了向用户推送的目标信息的准确性和实时性。
[0005]根据本专利技术第一方面,提供了一种用于确定目标信息的数据处理系统,包括第一数据库、第二数据库、第三数据库、存储有计算机程序的存储器和处理器,所述第一数据库用于存储用户静态属性特征记录,所述用户静态属性特征记录包括用户id、N个用户静态属性特征字段和上报时间信息字段,N为大于等于1的正整数;所述第二数据库用于存储用户动态兴趣信息记录,所述用户动态兴趣标签记录包括用户id、一个或多个兴趣id和上报时间信息字段,所述第二数据库实时更新;所述第三数据库用于存储样本用户点击信息记录,所述样本用户点击信息记录包括样本用户id、信息id和该信息id对应的一个或多个信息类型id;所述处理器在执行所述计算机程序时,实现以下步骤:
[0006]步骤S1、基于所述第一数据库、第二数据库和第三数据库构建多个模型样本训练数据,输入预设的目标信息预测模型框架中进行训练,确定所述目标信息预测模型框架中每一输入特征信息对应的权重,生成目标信息预测模型,所述样本训练数据包括正样本训练数据和负样本训练数据;
[0007]步骤S2、基于每一待测信息id和该待测信息id对应的信息类型id、目标用户id、所述第一数据库和第二数据库,构建该待测信息id对应的输入特征向量并输入所述目标信息预测模型中,得到对应的信息预测值;
[0008]步骤S3、将所有待测信息id对应的信息预测值按从大到小的顺序排序,将排在前预设M个的待测信息id确定为目标信息id,M为大于等于1的正整数。
[0009]本专利技术与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本专利技术
提供的一种用于确定目标信息的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
[0010]本专利技术能够基于用户实时的兴趣id、用户属性信息、待测信息id和对应的信息类别等多个维度的特征信息,来确定目标信息,提高了向用户推送的目标信息的准确性和实时性。
[0011]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
[0012]图1为本专利技术实施例提供的确定目标信息的数据处理流程图。
具体实施方式
[0013]为更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的一种用于确定目标信息的数据处理系统的具体实施方式及其功效,详细说明如后。
[0014]本专利技术实施例提供了一种用于确定目标信息的数据处理系统,包括第一数据库、第二数据库、第三数据库、存储有计算机程序的存储器和处理器,所述第一数据库用于存储用户静态属性特征记录,所述用户静态属性特征记录包括用户id、N个用户静态属性特征字段和上报时间信息字段,N为大于等于1的正整数,作为示例用户的静态属性特征包括年龄、性别、移动终端设备型号、职业等,可以理解的是,第一数据库是相对静态的数据库,为了提高系统的准确性,也可定时对第一数据库进行更新,但更新频率远低于第二数据库。所述第二数据库用于存储用户动态兴趣信息记录,所述用户动态兴趣标签记录包括用户id、一个或多个兴趣id和上报时间信息字段,所述第二数据库实时更新,作为示例,兴趣标签具体可包括旅游、美食、科技、游戏、娱乐和金融等。所述第三数据库用于存储样本用户点击信息记录,所述样本用户点击信息记录包括样本用户id、信息id和该信息id对应的一个或多个信息类型id,需要说明的是,同一个信息id是可能同时属于多个类别的,因为了提高系统的精确度,可以将信息id和信息id类别的维度同时考虑进来,作为构建输入特征的基础,从而大大提升系统确定目标信息的准确性。所述处理器在执行所述计算机程序时,如图1所示,实现以下步骤:
[0015]步骤S1、基于所述第一数据库、第二数据库和第三数据库构建多个模型样本训练数据,输入预设的目标信息预测模型框架中进行训练,确定所述目标信息预测模型框架中每一输入特征信息对应的权重,生成目标信息预测模型,所述样本训练数据包括正样本训练数据和负样本训练数据;
[0016]步骤S2、基于每一待测信息id和该待测信息id对应的信息类型id、目标用户id、所述第一数据库和第二数据库,构建该待测信息id对应的输入特征向量并输入所述目标信息预测模型中,得到对应的信息预测值;
[0017]步骤S3、将所有待测信息id对应的信息预测值按从大到小的顺序排序,将排在前预设M个的待测信息id确定为目标信息id,M为大于等于1的正整数。
[0018]可以理解的是,M值具体根据应用场景需求来设定,例如在信息推送场景,需要从多个待推送信息中选择一个目标信息来向用户推送,则M可以取1,所述步骤S3中将信息预测值最大的待测信息id确定为目标信息id,所述步骤S3之后还可包括:
[0019]步骤S4、将所述目标信息id对应的信息推送给所述目标用户id对应的移动终端进行展示。
[0020]本专利技术实施例能够基于用户实时的兴趣id、用户属性信息、待测信息id和对应的信息类别等多个维度的特征信息,来确定目标信息,提高了向用户推送的目标信息的准确性和实时性。
[0021]作为一种实施例,所述目标信息预测模型输入特征向量结构包括第一特征向量段、第二特征向量段和第三特征向量段,其中,所述第一特征向量段基于所述第一数据库生成,所述第二特征向量段基于所述第二数据库生成,样本训练数据的第三特征向量段基于所述第三数据库生成,待测信息id对应的第三特征向量段基于所述待测信息id和待测信息id对应的信息类型id生成。
[0022]作为一种实施例,所述第二数据库中包括X个兴趣id,所述第三数据库包括Y个信息id和Z个信息类型id,所述输入特征向量为(N+X+Y+Z)维度向量,其中,所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于确定目标信息的数据处理系统,其特征在于,包括第一数据库、第二数据库、第三数据库、存储有计算机程序的存储器和处理器,所述第一数据库用于存储用户静态属性特征记录,所述用户静态属性特征记录包括用户id、N个用户静态属性特征字段和上报时间信息字段,N为大于等于1的正整数;所述第二数据库用于存储用户动态兴趣信息记录,所述用户动态兴趣标签记录包括用户id、一个或多个兴趣id和上报时间信息字段,所述第二数据库实时更新;所述第三数据库用于存储样本用户点击信息记录,所述样本用户点击信息记录包括样本用户id、信息id和该信息id对应的一个或多个信息类型id;所述处理器在执行所述计算机程序时,实现以下步骤:步骤S1、基于所述第一数据库、第二数据库和第三数据库构建多个模型样本训练数据,输入预设的目标信息预测模型框架中进行训练,确定所述目标信息预测模型框架中每一输入特征信息对应的权重,生成目标信息预测模型,所述样本训练数据包括正样本训练数据和负样本训练数据;步骤S2、基于每一待测信息id和该待测信息id对应的信息类型id、目标用户id、所述第一数据库和第二数据库,构建该待测信息id对应的输入特征向量并输入所述目标信息预测模型中,得到对应的信息预测值;步骤S3、将所有待测信息id对应的信息预测值按从大到小的顺序排序,将排在前预设M个的待测信息id确定为目标信息id,M为大于等于1的正整数。2.根据权利要求1所述的系统,其特征在于,所述目标信息预测模型输入特征向量结构包括第一特征向量段、第二特征向量段和第三特征向量段,所述第一特征向量段基于所述第一数据库生成,所述第二特征向量段基于所述第二数据库生成,样本训练数据的第三特征向量段基于所述第三数据库生成,待测信息id对应的第三特征向量段基于所述待测信息id和待测信息id对应的信息类型id生成。3.根据权利要求2所述的系统,其特征在于,所述第二数据库中包括X个兴趣id,所述第三数据库包括Y个信息id和Z个信息类型id,所述输入特征向量为(N+X+Y+Z)维度向量,其中,所述第一特征向量段为N维度的特征向量,所述第二特征向量为X维度的特征向量,所述第三特征向量为(Y+Z)维度的特征向量。4.根据权利要求3所述的系统,其特征在于,所述步骤S1包括:步骤S11、从所述第三数据库中获取一条样本用户点击信息记录中的样本用户id、信息id、对应的信息类型id和上报时间,将所述第三特征向量对应的(Y+Z)维度的特征向量中,对应的信息id特征值设置为1,其他信息id特征值设置为0,对应的信息类型id特征值设置为1,其他信息类型id特征值设置为0,生成该条样本用户点击信息记录对应的第三特征向量;步骤S12、基于该条样本用户点击信息记录对应的样本用户id从所述第一数据库中获取对应的N个静态属性特征,并进行分箱处理和编码处理后,生成对应的第一特征向量;步骤S13、基于该条样本用户点击信息记录对应的样本用户id和上报时间,从所述第二数据库中获取对应的兴趣id,并将所述第二特征向量段对应的X维度的特征向量中,对应的兴趣id特征值设置为1,其他特征值设置为0,生成对应的第二特征向量;步骤S14...

【专利技术属性】
技术研发人员:张静雅朱金星张波
申请(专利权)人:杭州云信智策科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1