推荐模型的训练方法、信息推荐方法、装置、设备及介质制造方法及图纸

技术编号:31981195 阅读:23 留言:0更新日期:2022-01-20 01:38
本公开涉及一种推荐模型的训练方法及装置、信息推荐方法及装置、电子设备及计算机可读介质,属于机器学习技术领域。该推荐模型的训练方法包括:将所有终端划分为终端对并生成密钥;对各个终端的特征进行分箱后计算特征的统计信息;根据特征统计信息与终端的密钥,得到终端中每个特征的加密统计信息以及各个特征的总体统计信息;将训练样本集合作为决策树模型中的节点,并根据总体统计信息确定目标分裂点;根据目标分裂点对决策树进行分裂后,重新计算训练样本集合中各个特征的统计信息并确定下一目标分裂点,直到满足预设条件时停止迭代,得到终端的推荐模型。本公开通过在模型训练过程中对终端的特征统计信息进行加密,可以保护用户隐私。以保护用户隐私。以保护用户隐私。

【技术实现步骤摘要】
推荐模型的训练方法、信息推荐方法、装置、设备及介质


[0001]本公开涉及机器学习
,具体而言,涉及一种推荐模型的训练方法及装置、信息推荐方法及装置、电子设备及计算机可读介质。

技术介绍

[0002]用户的个性化推荐是提升用户体验的一个重要手段,目前所使用的用户个性化推荐方法,都是基于用户的行为数据,或者社会关系网络等信息进行推荐的。
[0003]在目前的用户个性化推荐方法中,由于涉及到用户隐私等敏感数据的获取和传输,因此,很可能会造成用户隐私泄露等安全问题。
[0004]鉴于此,本领域亟需一种能够保障数据安全和用户隐私的推荐模型的训练方法以及信息推荐方法。
[0005]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的目的在于提供一种推荐模型的训练方法及装置、信息推荐方法及装置、电子设备及计算机可读介质,进而至少在一定程度上保护数据安全和用户隐私。
[0007]根据本公开的第一个方面,提供一种推荐模型的训练方法,包括:
[0008]将所有终端划分为两两一对的终端对,并生成各个所述终端对应的密钥,其中,所述终端对中的两个终端的密钥互为相反数;
[0009]获取各个所述终端的用户行为数据,根据所述用户行为数据得到各个所述终端中的特征,将所述终端中的特征作为所述终端对应的训练样本集合,并对所述特征进行分箱后计算所述特征的统计信息;r/>[0010]根据所述终端中每个特征的统计信息与所述终端的密钥,得到所述终端中每个特征的加密统计信息,并根据所有所述终端中每个特征的加密统计信息得到各个所述特征对应的总体统计信息;
[0011]将所述训练样本集合作为决策树模型中的节点,并根据所述总体统计信息确定所述决策树模型的目标分裂点,其中,所述目标分裂点为本次分裂使用的特征以及对应的特征值;
[0012]根据所述目标分裂点对所述决策树模型中的节点进行分裂后,重新计算所述训练样本集合中各个特征的统计信息并确定下一目标分裂点,直到所述终端中的特征满足预设条件时停止迭代,得到所述终端的推荐模型。
[0013]在本公开的一种示例性实施例中,所述生成各个所述终端对应的密钥,其中,所述终端对中的两个终端的密钥互为相反数,包括:
[0014]生成所述终端对中的两个终端对应的元组数据,所述元组数据中包含所述终端对中的两个终端的密钥正负标识;
[0015]根据所述终端对应的元组数据生成所述终端对应的初始密钥,并根据所述初始密钥和所述密钥正负标识得到所述终端对应的密钥。
[0016]在本公开的一种示例性实施例中,所述对所述特征进行分箱后计算所述特征的统计信息,包括:
[0017]获取各个所述终端中每个特征的特征值,并根据所有所述终端中每个特征的特征值,确定各个所述特征的综合最大值和综合最小值;
[0018]根据各个所述特征的综合最大值和综合最小值对所述特征进行分箱,得到各个所述特征的综合分箱结果;
[0019]根据各个所述特征的综合分箱结果得到各个所述终端的终端分箱结果,并根据所述终端分箱结果计算所述终端中所述特征的统计信息。
[0020]在本公开的一种示例性实施例中,所述根据所有所述终端中每个特征的特征值,确定各个所述特征的综合最大值和综合最小值,包括:
[0021]获取各个所述终端中每个特征的特征值,并根据所述特征值得到所述终端中每个所述特征对应的特征值对;
[0022]根据所有所述终端中每个所述特征对应的特征值对,确定各个所述特征的综合最大值和综合最小值。
[0023]在本公开的一种示例性实施例中,所述根据所述特征值得到所述终端中每个所述特征对应的特征值对,包括:
[0024]根据所述终端中每个所述特征的特征值,得到所述终端中每个所述特征的终端最大值和终端最小值;
[0025]根据所述特征的取值区间得到所述特征的干扰参数,并根据所述特征的终端最大值和终端最小值以及所述干扰参数得到所述特征对应的特征值对。
[0026]根据本公开的第二个方面,提供一种信息推荐方法,包括:
[0027]获取终端的用户行为数据,并将所述终端的用户行为数据输入所述终端的推荐模型中,其中,所述推荐模型是通过上述任意一项所述的推荐模型的训练方法得到的;
[0028]根据所述终端的推荐模型的输出结果,得到所述终端对应的推荐信息。
[0029]根据本公开的第三方面,提供一种推荐模型的训练装置,包括:
[0030]终端密钥生成模块,用于将所有终端划分为两两一对的终端对,并生成各个所述终端对应的密钥,其中,所述终端对中的两个终端的密钥互为相反数;
[0031]统计信息确定模块,用于获取各个所述终端的用户行为数据,根据所述用户行为数据得到各个所述终端中的特征,将所述终端中的特征作为所述终端对应的训练样本集合,并对所述特征进行分箱后计算所述特征的统计信息;
[0032]统计信息加密模块,用于根据所述终端中每个特征的统计信息与所述终端的密钥,得到所述终端中每个特征的加密统计信息,并根据所有所述终端中每个特征的加密统计信息得到各个所述特征对应的总体统计信息;
[0033]分裂节点确定模块,用于将所述训练样本集合作为决策树模型中的节点,并根据所述总体统计信息确定所述决策树模型的目标分裂点,其中,所述目标分裂点为本次分裂使用的特征以及对应的特征值;
[0034]推荐模型迭代模块,用于根据所述目标分裂点对所述决策树模型中的节点进行分
裂后,重新计算所述训练样本集合中各个特征的统计信息并确定下一目标分裂点,直到所述终端中的特征满足预设条件时停止迭代,得到所述终端的推荐模型。
[0035]根据本公开的第四方面,提供一种信息推荐装置,包括:
[0036]用户信息获取模块,用于获取终端的用户行为数据,并将所述终端的用户行为数据输入所述终端的推荐模型中,其中,所述推荐模型是通过上述推荐模型的训练装置得到的;
[0037]推荐信息确定模块,用于根据所述终端的推荐模型的输出结果,得到所述终端对应的推荐信息。
[0038]根据本公开的第五方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的推荐模型的训练方法或信息推荐方法。
[0039]根据本公开的第六方面,提供一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的推荐模型的训练方法或信息推荐方法。
[0040]本公开示例性实施例可以具有以下有益效果:
[0041]本公开示例实施方式的推荐模型的训练方法中,通过在终端以终端对的形式生成对应的密钥,并在获取各个终端的统计信息时,通过密钥对终端的统计信息进行加密,然后基于所有终端本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种推荐模型的训练方法,其特征在于,包括:将所有终端划分为两两一对的终端对,并生成各个所述终端对应的密钥,其中,所述终端对中的两个终端的密钥互为相反数;获取各个所述终端的用户行为数据,根据所述用户行为数据得到各个所述终端中的特征,将所述终端中的特征作为所述终端对应的训练样本集合,并对所述特征进行分箱后计算所述特征的统计信息;根据所述终端中每个特征的统计信息与所述终端的密钥,得到所述终端中每个特征的加密统计信息,并根据所有所述终端中每个特征的加密统计信息得到各个所述特征对应的总体统计信息;将所述训练样本集合作为决策树模型中的节点,并根据所述总体统计信息确定所述决策树模型的目标分裂点,其中,所述目标分裂点为本次分裂使用的特征以及对应的特征值;根据所述目标分裂点对所述决策树模型中的节点进行分裂后,重新计算所述训练样本集合中各个特征的统计信息并确定下一目标分裂点,直到所述终端中的特征满足预设条件时停止迭代,得到所述终端的推荐模型。2.根据权利要求1所述的推荐模型的训练方法,其特征在于,所述生成各个所述终端对应的密钥,其中,所述终端对中的两个终端的密钥互为相反数,包括:生成所述终端对中的两个终端对应的元组数据,所述元组数据中包含所述终端对中的两个终端的密钥正负标识;根据所述终端对应的元组数据生成所述终端对应的初始密钥,并根据所述初始密钥和所述密钥正负标识得到所述终端对应的密钥。3.根据权利要求1所述的推荐模型的训练方法,其特征在于,所述对所述特征进行分箱后计算所述特征的统计信息,包括:获取各个所述终端中每个特征的特征值,并根据所有所述终端中每个特征的特征值,确定各个所述特征的综合最大值和综合最小值;根据各个所述特征的综合最大值和综合最小值对所述特征进行分箱,得到各个所述特征的综合分箱结果;根据各个所述特征的综合分箱结果得到各个所述终端的终端分箱结果,并根据所述终端分箱结果计算所述终端中所述特征的统计信息。4.根据权利要求3所述的推荐模型的训练方法,其特征在于,所述根据所有所述终端中每个特征的特征值,确定各个所述特征的综合最大值和综合最小值,包括:获取各个所述终端中每个特征的特征值,并根据所述特征值得到所述终端中每个所述特征对应的特征值对;根据所有所述终端中每个所述特征对应的特征值对,确定各个所述特征的综合最大值和综合最小值。5.根据权利要求4所述的推荐模型的训练方法,其特征在于,所述根据所述特征值得到所述终端中每个所述特征对应的特征值对,包括:根据所述终端中每个所述特征的特征值,得到...

【专利技术属性】
技术研发人员:陈康付华峥陈翀
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1