信息推荐方法、装置、设备及存储介质制造方法及图纸

技术编号:35099506 阅读:12 留言:0更新日期:2022-10-01 17:05
本申请实施例提供一种信息推荐方法、装置、设备及存储介质,至少应用于人工智能技术和云技术领域,其中,方法包括:获取目标对象的离线统计数据;基于预定义词典,对所述离线统计数据进行信息编码处理,得到二进制离线文件;通过通用数据服务,对所述二进制离线文件进行数据加载,形成所述目标对象的通用词典;通过在线信息服务,基于所述通用词典从待推荐信息中确定目标推荐信息,并向所述目标对象推荐所述目标推荐信息。通过本申请,能够极大地减少相似数据加载和解析的重复开发工作,提高数据加载的效率,从而提高信息推荐的效率。从而提高信息推荐的效率。从而提高信息推荐的效率。

【技术实现步骤摘要】
信息推荐方法、装置、设备及存储介质


[0001]本申请实施例涉及互联网
,涉及但不限于一种信息推荐方法、装置、设备及存储介质。

技术介绍

[0002]目前,在信息流推荐产品中,通常是通过深度学习模型,在云端线上服务根据对象特征对召回的文章、视频、广告等物品进行打分排序,最终选择出候选物品进行推荐。其中,云端线上服务使用的深度学习模型需要使用两方面的内容:一方面是数据库内存储或终端加载的用户实时行为和用户静态属性特征;另一方面是索引服务存储或终端加载的物品侧信息。云端线上服务加载用户和物品信息时,一般采用词典的形式实现。
[0003]相关技术中,基于云端线上服务进行信息推荐的方式,不同的云端线上服务所需加载的词典格式多变,且离线文件分发量大;同时,云端线上服务为了匹配离线数据格式,需要为每个词典开发耦合的数据结构,且随着所需词典数量增多,数据结构种类也会增加,且加载时间长。由此可见,相关技术中的方法,相同的词典内容会在云端线上服务被重复加载而造成内存空间的浪费,且云端线上服务在加载词典内容时,会极大的降低数据加载的效率,从而降低信息推荐的效率。

技术实现思路

[0004]本申请实施例提供一种信息推荐方法、装置、设备及存储介质,至少应用于人工智能技术和云
,通过将信息推荐过程中的词典信息的加载转移到通用数据服务中进行,能够极大地减少相似数据加载和解析的重复开发工作,提高数据加载的效率,从而提高信息推荐的效率。
[0005]本申请实施例的技术方案是这样实现的:
[0006]本申请实施例提供一种信息推荐方法,所述方法包括:
[0007]获取目标对象的离线统计数据;
[0008]基于预定义词典,对所述离线统计数据进行信息编码处理,得到二进制离线文件;
[0009]通过通用数据服务,对所述二进制离线文件进行数据加载,形成所述目标对象的通用词典;
[0010]通过在线信息服务,基于所述通用词典从待推荐信息中确定目标推荐信息,并向所述目标对象推荐所述目标推荐信息。
[0011]本申请实施例提供一种信息推荐装置,所述装置包括:
[0012]获取模块,用于获取目标对象的离线统计数据;
[0013]信息编码模块,用于基于预定义词典,对所述离线统计数据进行信息编码处理,得到二进制离线文件;
[0014]数据加载模块,用于通过通用数据服务,对所述二进制离线文件进行数据加载,形成所述目标对象的通用词典;
[0015]信息推荐模块,用于通过在线信息服务,基于所述通用词典从待推荐信息中确定目标推荐信息,并向所述目标对象推荐所述目标推荐信息。
[0016]在一些实施例中,所述装置还包括:配置页面显示模块,用于在基于预定义词典,对所述离线统计数据进行信息编码处理之前,在当前界面上显示配置页面;注册模块,用于响应于针对所述配置页面的配置操作,注册所述预定义词典的词典配置;写入模块,用于将所述词典配置写入至预设数据库中,形成所述预定义词典。
[0017]在一些实施例中,所述词典配置至少包括通用数据结构协议;所述信息编码模块还用于:确定所述通用数据结构协议定义的数据结构;按照所述数据结构,对所述离线统计数据中的每一子数据依次进行序列化处理,生成至少一个二进制数据对象;确定每一所述子数据对应的关键词和所述关键词对应的关键词字段;基于每一所述子数据的关键词字段和所述二进制数据对象,对所述预定义词典进行填充处理,形成所述二进制离线文件。
[0018]在一些实施例中,所述二进制数据对象包括定长区和变长区;所述信息编码模块还用于:确定所述离线统计数据中的每一子数据的多个字段的值;按照所述数据结构,依次将每一所述字段的值填入至所述定长区和所述变长区中的至少一个,对应生成一个所述二进制数据对象。
[0019]在一些实施例中,所述信息编码模块还用于:将每一所述字段的值填入至所述定长区的对应位置,生成具有定长类型的所述二进制数据对象;或者,将所述字段的值填入至所述变长区,且将变长内容的长度填入至所述变长区,生成具有变长类型的所述二进制数据对象;其中,所述变长区的起始位置作为所述变长区内实际存储位置的偏移,且所述偏移被填入至所述定长区;或者,确定全部字段中的重复字段对应的重复数量;并将所述重复数量和所述重复字段的值填入至所述变长区,生成具有重复结构的所述二进制数据对象;其中,所述变长区的起始位置作为所述变长区内实际存储位置的偏移,且所述偏移被填入至所述定长区;或者,基于所述定长类型、所述变长类型和所述重复结构的二进制数据对象的构造方式,对全部字段的值进行递归构造,形成递归构造结果;并将所述递归构造结果填入至所述变长区,生成具有自定义结构的所述二进制数据对象;其中,所述变长区的起始位置作为所述变长区内实际存储位置的偏移,且所述偏移被填入至所述定长区。
[0020]在一些实施例中,所述信息编码模块还用于:以每一所述子数据的关键词字段为键,且以所述子数据对应的二进制数据对象为值,形成键值对;将所述离线统计数据对应的全部键值对依次插入至所述预定义词典中,形成所述二进制离线文件。
[0021]在一些实施例中,所述预定义词典包括索引区和二进制结构;所述信息编码模块还用于:将所述键值对中的关键词字段插入至所述索引区;将所述键值对中的二进制数据对象插入至所述二进制结构中,形成所述二进制离线文件。
[0022]在一些实施例中,所述数据加载模块还用于:调用所述通用数据服务获取所述二进制离线文件;将所述二进制离线文件加载至预设内存的连续空间中,形成所述目标对象的通用词典。
[0023]在一些实施例中,所述预设内存的连续空间包括多个具有不同层级的片;每一所述片由多个存储单元块组成;所述二进制离线文件包括多个子文件数据;所述数据加载模块还用于:确定每一所述子文件数据对应的数据大小;基于所述子文件数据的数据大小,从所述预设内存的连续空间的多个存储单元块中,确定目标存储单元块;将每一所述子文件
数据存储至对应的目标存储单元块中,形成所述目标对象的通用词典。
[0024]在一些实施例中,每一所述片中的多个存储单元块具有相同的存储空间大小;所述数据加载模块还用于:确定每一所述片对应的存储空间大小;从所述预设内存的连续空间的不同层级的片中,将存储空间大小大于或等于所述子文本数据的数据大小的片确定为待存储片;其中,所述待存储片的数量为一个或多个;当所述待存储片的数量为多个时,将具有空余的存储单元块且具有最小层级的待存储片,确定为目标片;将所述目标片中的空余的存储单元块,确定为所述目标存储单元块。
[0025]在一些实施例中,每一所述存储单元块具有一虚拟地址;所述虚拟地址包括所述存储单元块对应的片的片序号、和所述存储单元块在所述片中的块号偏移;所述数据加载模块还用于:基于所述子文件数据的数据大小,从所述预设内存的连续空间的多个存储单元块中,确定目标存储单元块和所述目标存储单元块的虚拟地址;确定每一所述子文件数据对应的目标存储单元块的虚拟地址本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息推荐方法,其特征在于,所述方法包括:获取目标对象的离线统计数据;基于预定义词典,对所述离线统计数据进行信息编码处理,得到二进制离线文件;通过通用数据服务,对所述二进制离线文件进行数据加载,形成所述目标对象的通用词典;通过在线信息服务,基于所述通用词典从待推荐信息中确定目标推荐信息,并向所述目标对象推荐所述目标推荐信息。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在基于预定义词典,对所述离线统计数据进行信息编码处理之前,在当前界面上显示配置页面;响应于针对所述配置页面的配置操作,注册所述预定义词典的词典配置;将所述词典配置写入至预设数据库中,形成所述预定义词典。3.根据权利要求2所述的方法,其特征在于,所述词典配置至少包括通用数据结构协议;所述基于预定义词典,对所述离线统计数据进行信息编码处理,得到二进制离线文件,包括:确定所述通用数据结构协议定义的数据结构;按照所述数据结构,对所述离线统计数据中的每一子数据依次进行序列化处理,生成至少一个二进制数据对象;确定每一所述子数据对应的关键词和所述关键词对应的关键词字段;基于每一所述子数据的关键词字段和所述二进制数据对象,对所述预定义词典进行填充处理,形成所述二进制离线文件。4.根据权利要求3所述的方法,其特征在于,所述二进制数据对象包括定长区和变长区;按照所述数据结构,对所述离线统计数据中的每一子数据依次进行序列化处理,生成至少一个二进制数据对象,包括:确定所述离线统计数据中的每一子数据的多个字段的值;按照所述数据结构,依次将每一所述字段的值填入至所述定长区和所述变长区中的至少一个,对应生成一个所述二进制数据对象。5.根据权利要求4所述的方法,其特征在于,所述按照所述数据结构,依次将每一所述字段的值填入至所述定长区和所述变长区中的至少一个,对应生成一个所述二进制数据对象,包括:将每一所述字段的值填入至所述定长区的对应位置,生成具有定长类型的所述二进制数据对象;或者,将所述字段的值填入至所述变长区,且将变长内容的长度填入至所述变长区,生成具有变长类型的所述二进制数据对象;其中,所述变长区的起始位置作为所述变长区内实际存储位置的偏移,且所述偏移被填入至所述定长区;或者,确定全部字段中的重复字段对应的重复数量;并将所述重复数量和所述重复字段的值填入至所述变长区,生成具有重复结构的所述二进制数据对象;其中,所述变长区的起始位
置作为所述变长区内实际存储位置的偏移,且所述偏移被填入至所述定长区;或者,基于所述定长类型、所述变长类型和所述重复结构的二进制数据对象的构造方式,对全部字段的值进行递归构造,形成递归构造结果;并将所述递归构造结果填入至所述变长区,生成具有自定义结构的所述二进制数据对象;其中,所述变长区的起始位置作为所述变长区内实际存储位置的偏移,且所述偏移被填入至所述定长区。6.根据权利要求3所述的方法,其特征在于,所述基于每一所述子数据的关键词字段和所述二进制数据对象,对所述预定义词典进行填充处理,形成所述二进制离线文件,包括:以每一所述子数据的关键词字段为键,且以所述子数据对应的二进制数据对象为值,形成键值对;将所述离线统计数据对应的全部键值对依次插入至所述预定义词典中,形成所述二进制离线文件。7.根据权利要求6所述的方法,其特征在于,所述预定义词典包括索引区和二进制结构;所述将所述离线统计数据对应的全部键值对依次插入至所述预定义词典中,形成所述二进制离线文件,包括:将所述键值对中的关键词字段插入至所述索引区;将所述键值对中的二进制数据对象插入至所述二进制结构中,形成所述二进制离线文件。8.根据权利要求1所...

【专利技术属性】
技术研发人员:张睿
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1