用于确定目标信息的数据处理系统技术方案

技术编号：31235570 阅读：17 留言：0更新日期：2021-12-08 10:17

本发明专利技术涉及一种用于确定目标信息的数据处理系统，实现步骤S1、基于第一数据库、第二数据库和第三数据库构建多个模型样本训练数据，输入预设的目标信息预测模型框架中进行训练，确定所述目标信息预测模型框架中每一输入特征信息对应的权重，生成目标信息预测模型；步骤S2、基于每一待测信息id和该待测信息id对应的信息类型id、目标用户id、所述第一数据库和第二数据库，构建该待测信息id对应的输入特征向量并输入所述目标信息预测模型中，得到对应的信息预测值；步骤S3、将所有待测信息id对应的信息预测值按从大到小的顺序排序，将排在前M个的待测信息id确定为目标信息id。本发明专利技术提高了向用户推送的目标信息的准确性和实时性。高了向用户推送的目标信息的准确性和实时性。高了向用户推送的目标信息的准确性和实时性。

全部详细技术资料下载

【技术实现步骤摘要】
用于确定目标信息的数据处理系统

[0001]本专利技术涉及数据处理
，尤其涉及一种用于确定目标信息的数据处理系统。

技术介绍

[0002]个性化信息是根据用户的浏览兴趣来向用户推荐相关的信息，由于推荐的信息和用户的兴趣密切相关，可以有效地提高用户体验，让用户更容易接受，避免了信息投放的中带宽和流量的浪费，提高了信息投放的效率。
[0003]现有的信息推荐方法往往基于用户的基本资料、用户对信息的历史访问、历史点击行为信息等信息确定的历史兴趣信息进行信息推送。但是，用户在不同的时间段对应兴趣信息是动态变化的，且可能对应多个兴趣信息，例如，用户在旅行时段内，则对应的兴趣信息为旅游信息，交通信息；用户在假期时段内，对应的兴趣信息为娱乐信息和餐饮信息。因此，现有的确定目标推送信息的技术并未充分考虑用户的实时兴趣信息，向用户推送的目标信息的准确性低、实时性差。

技术实现思路

[0004]本专利技术目的在于，提供一种用于确定目标信息的数据处理系统，提高了向用户推送的目标信息的准确性和实时性。
[0005]根据本专利技术第一方面，提供了一种用于确定目标信息的数据处理系统，包括第一数据库、第二数据库、第三数据库、存储有计算机程序的存储器和处理器，所述第一数据库用于存储用户静态属性特征记录，所述用户静态属性特征记录包括用户id、N个用户静态属性特征字段和上报时间信息字段，N为大于等于1的正整数；所述第二数据库用于存储用户动态兴趣信息记录，所述用户动态兴趣标签记录包括用户id、一个或多个兴趣id和上报...

【技术保护点】

【技术特征摘要】
1.一种用于确定目标信息的数据处理系统，其特征在于，包括第一数据库、第二数据库、第三数据库、存储有计算机程序的存储器和处理器，所述第一数据库用于存储用户静态属性特征记录，所述用户静态属性特征记录包括用户id、N个用户静态属性特征字段和上报时间信息字段，N为大于等于1的正整数；所述第二数据库用于存储用户动态兴趣信息记录，所述用户动态兴趣标签记录包括用户id、一个或多个兴趣id和上报时间信息字段，所述第二数据库实时更新；所述第三数据库用于存储样本用户点击信息记录，所述样本用户点击信息记录包括样本用户id、信息id和该信息id对应的一个或多个信息类型id；所述处理器在执行所述计算机程序时，实现以下步骤：步骤S1、基于所述第一数据库、第二数据库和第三数据库构建多个模型样本训练数据，输入预设的目标信息预测模型框架中进行训练，确定所述目标信息预测模型框架中每一输入特征信息对应的权重，生成目标信息预测模型，所述样本训练数据包括正样本训练数据和负样本训练数据；步骤S2、基于每一待测信息id和该待测信息id对应的信息类型id、目标用户id、所述第一数据库和第二数据库，构建该待测信息id对应的输入特征向量并输入所述目标信息预测模型中，得到对应的信息预测值；步骤S3、将所有待测信息id对应的信息预测值按从大到小的顺序排序，将排在前预设M个的待测信息id确定为目标信息id，M为大于等于1的正整数。2.根据权利要求1所述的系统，其特征在于，所述目标信息预测模型输入特征向量结构包括第一特征向量段、第二特征向量段和第三特征向量段，所述第一特征向量段基于所述第一数据库生成，所述第二特征向量段基于所述第二数据库生成，样本训练数据的第三特征向量段基于所述第三数据库生成，待测信息id对应的第三特征向量段基于所述待测信息id和待测信息id对应的信息类型id生成。3.根据权利要求2所述的系统，其特征在于，所述第二数据库中包括X个兴趣id，所述第三数据库包括Y个信息id和Z个信息类型id，所述输入特征向量为(N+X+Y+Z)维度向量，其中，所述第一特征向量段为N维度的特征向量，所述第二特征向量为X维度的特征向量，所述第三特征向量为(Y+Z)维度的特征向量。4.根据权利要求3所述的系统，其特征在于，所述步骤S1包括：步骤S11、从所述第三数据库中获取一条样本用户点击信息记录中的样本用户id、信息id、对应的信息类型id和上报时间，将所述第三特征向量对应的(Y+Z)维度的特征向量中，对应的信息id特征值设置为1，其他信息id特征值设置为0，对应的信息类型id特征值设置为1，其他信息类型id特征值设置为0，生成该条样本用户点击信息记录对应的第三特征向量；步骤S12、基于该条样本用户点击信息记录对应的样本用户id从所述第一数据库中获取对应的N个静态属性特征，并进行分箱处理和编码处理后，生成对应的第一特征向量；步骤S13、基于该条样本用户点击信息记录对应的样本用户id和上报时间，从所述第二数据库中获取对应的兴趣id，并将所述第二特征向量段对应的X维度的特征向量中，对应的兴趣id特征值设置为1，其他特征值设置为0，生成对应的第二特征向量；步骤S14...

【专利技术属性】
技术研发人员：张静雅，朱金星，张波，
申请(专利权)人：杭州云信智策科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人