一种基于联邦学习的客群画像方法及装置制造方法及图纸

技术编号:37993024 阅读:7 留言:0更新日期:2023-06-30 10:07
本申请实施例通过提供一种基于联邦学习的客群画像方法及装置,涉及数据移动通信技术领域。基于联邦学习的客群画像方法通过获取DPI日志数据,分析DPI日志数据,得到ur1、mdn、userID,建立userID和mdn的映射关系;对POI位置信息进行编码,调整编码位数;对样本集进行加密样本对齐,通过联邦学习的方式进行联合建模。通过下发userID确保合作内容规性,通过geohash编码增加调整位置精度的灵活性,降低位置距离计算的复杂性,通过纵向联邦学习,在保证双方原始数据安全性前提下,实现数据融合,得到客群画像,与现有技术相比业务更符合合规要求、安全性更高、计算方法更灵活、画像精准性更高。准性更高。准性更高。

【技术实现步骤摘要】
一种基于联邦学习的客群画像方法及装置


[0001]本专利技术涉及数据移动通信
,尤其涉及一种基于联邦学习的客群画像方法及装置。

技术介绍

[0002]随着《数据安全法》《网络安全法》以及《个人信息保护法》的相继出台及落地,数据无法直接买卖交易,任何组织、个人收集数据,应当采取合法、正当的方式,不得窃取或者以其他非法方式获取数据。法律、行政法规对收集、使用数据的目的、范围有规定的,应当在法律、行政法规规定的目的和范围内收集、使用数据。随着大数据的进一步发展,重视数据隐私和安全已经成为了世界性的趋势,同时,大多数行业数据呈现数据孤岛现象,如何在满足用户隐私保护、数据安全和政府法规的前提下,进行跨组织的数据合作是困扰人工智能从业者的一大难题。传统的机器学习算法需要用户将源数据上传到高算力的云服务器上集中训练,这种方式导致了数据流向的不可控和敏感数据泄露问题,联邦学习能够在多方数据源聚合的场景下协同训练全局最优模型,将机器学习的数据存储和模型训练阶段转移至本地用户,仅与中心服务器交互模型更新的方式有效保障了用户的隐私安全。
[0003]通过联邦学习的方式能解实现对原始数据的保护,在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习,但是合作授权方面依赖于合同约定、人工抽查,加大了人工审计工作量,且存在合规风险;在位置计算方面通过电子围栏技术需要大量计算。

技术实现思路

[0004]本申请实施例通过提供一种基于联邦学习的客群画像方法及装置,解决了现有技术中位置计算复杂度、精度调整不灵活、授权链路不完整的问题,实现了联合画像刻画,精准补齐用户画像。
[0005]本申请实施例提供了一种基于联邦学习的客群画像方法,用于运营商,包括以下步骤:
[0006]S1、获取DPI日志数据,分析DPI日志数据,得到ur1、mdn、userID,建立userID和mdn的映射关系;
[0007]S2、对POI位置信息进行编码,调整编码位数;
[0008]S3、对样本集进行加密样本对齐,通过联邦学习的方式进行联合建模。
[0009]进一步地,所述S1具体包括以下步骤:
[0010]S11、获取合作方指定域名的DPI日志数据;
[0011]S12、分析指定域名的DPI日志数据,得到ur1、mdn;
[0012]S13、按照协商规则,分析ur1,得到userID;
[0013]S14、建立userID和mdn的映射关系。
[0014]进一步地,所述S11中指定域名为abc.com,所述S13中协商规则为mu&userid=。
[0015]进一步地,所述S2具体包括以下步骤:
[0016]S21、对指定的POI位置信息进行geohash编码,按照精度要求调整编码位数;
[0017]S22、通过信令数据得到访问过指定物理范围的mdn;
[0018]S23、根据所述S1的映射关系得到所述S22mdn对应的userID。
[0019]进一步地,所述S22中若编码为6位,则指定物理范围为:网格宽度1.22km,网格高度0.61km。
[0020]进一步地,所述S3具体包括以下步骤:
[0021]S31、对自由样本集userID和访问过指定区域的userID进行加密样本对齐;
[0022]S32、对样本集合进行纵向联邦学习联合建模。
[0023]进一步地,所述S32中样本集合包括:合作方提供的特征及标签,运营商提供特征。
[0024]进一步地,所述合作方提供的特征为:用户使用app的时长、使用app次数、终端品牌,所述合作方提供的标签为:是否为高净值高消费用户。
[0025]进一步地,所述运营商提供特征包括:用户性别、年龄、在网时长、套餐金额、常住地稳定性、上网行为。
[0026]一种基于联邦学习的客群画像装置,包括映射关系模块、位置编码模块、联邦学习模块,其中:
[0027]映射关系模块,用于获取DPI日志数据,分析DPI日志数据,得到ur1、mdn、userID,建立userID和mdn的映射关系;
[0028]位置编码模块,用于对POI位置信息进行编码,调整编码位数;
[0029]联邦学习模块,用于对样本集进行加密样本对齐,通过联邦学习的方式进行联合建模。
[0030]本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0031]通过合作方下发用户ID的方式,确保建模时用到的是合作方授权的用户,确保合作内容规性,解决了授权链路不完整的问题;
[0032]通过geohash编码的方式进行位置计算,解决了现有技术位置计算复杂度、精度调整不灵活的问题,增加调整位置精度的灵活性,降低位置距离计算的复杂性;
[0033]通过纵向联邦学习的方式进行数据交互,保证原始数据的安全性,实现数据融合,为数据流通提供安全的模式,提升用户画像精准性,与现有技术相比更符合合规要求、安全性更高、计算方法更灵活、画像精准性更高。
附图说明
[0034]图1为本专利技术基于联邦学习的客群画像方法流程图;
[0035]图2为本专利技术合作方和运营商建立客群画像模型流程图。
具体实施方式
[0036]本专利技术依托于运营商DPI数据及信令数据,提出了一种基于联邦学习的客群画像方法,通过合作方下发userID,运营商获取合作方指定域名的DPI日志数据,通过geohash编码的方式增加调整位置精度的灵活性,通过纵向联邦学习的方式进行联合建模,在保证双方原始数据安全性前提下,实现数据融合,得到客群画像,相对于现有技术,能有效保证数
据交互动作的安全及原始数据的安全,更符合合规要求、安全性更高、计算方法更灵活、画像精准性更高。
[0037]为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0038]一种基于联邦学习的客群画像方法,用于运营商,包括以下步骤:
[0039]S1、获取DPI日志数据,分析DPI日志数据,得到ur1、mdn、userID,建立userID和mdn的映射关系;
[0040]S2、对POI位置信息进行编码,调整编码位数;
[0041]S3、对样本集进行加密样本对齐,通过联邦学习的方式进行联合建模。
[0042]在本实施例中,如图1所示,合作方下发唯一用户id:userID,运营商获取合作方指定域名的DPI日志数据,获取DPI日志数据中的ur1、手机号码mdn,从ur1中按照协商规则获取合作方下发的userID,建立userID和mdn的映射关系,对合作方指定的POI位置信息进行编码,按照精度要求调整编码位数,通过加密样本对齐的方式进行样本集求交,合作方提供用户的特征及标签,运营商提供标签,通过联邦学习的方式进行联合建模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的客群画像方法,其特征在于,用于运营商,包括以下步骤:S1、获取DPI日志数据,分析DPI日志数据,得到ur1、mdn、userID,建立userID和mdn的映射关系;S2、对POI位置信息进行编码,调整编码位数;S3、对样本集进行加密样本对齐,通过联邦学习的方式进行联合建模。2.如权利要求1所述的一种基于联邦学习的客群画像方法,其特征在于,所述S1具体包括以下步骤:S11、获取合作方指定域名的DPI日志数据;S12、分析指定域名的DPI日志数据,得到ur1、mdn;S13、按照协商规则,分析ur1,得到userID;S14、建立userID和mdn的映射关系。3.如权利要求2所述的一种基于联邦学习的客群画像方法,其特征在于:所述S11中指定域名为abc.com,所述S13中协商规则为mu&userid=。4.如权利要求1所述的一种基于联邦学习的客群画像方法,其特征在于,所述S2具体包括以下步骤:S21、对指定的POI位置信息进行geohash编码,按照精度要求调整编码位数;S22、通过信令数据得到访问过指定物理范围的mdn;S23、根据所述S1的映射关系得到所述S22mdn对应的userID。5.如权利要求4所述的一种基于联邦学习的客群画像方法,其特征在于,所述S22中若编码...

【专利技术属性】
技术研发人员:刘天琪
申请(专利权)人:天翼云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1