System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种获取目标用户画像的方法、装置、介质及设备制造方法及图纸_技高网

一种获取目标用户画像的方法、装置、介质及设备制造方法及图纸

技术编号:43274420 阅读:7 留言:0更新日期:2024-11-12 16:00
本发明专利技术为一种获取目标用户画像的方法、装置、介质及设备,涉及数据处理技术领域,包括:获取初始用户ID列表和初始用户ID列表对应的目标特征向量列表集;根据目标特征向量列表集,构建目标训练模型;获取目标用户ID对应的目标特征数据列表;将目标特征数据列表输入至目标训练模型中,获取目标用户ID对应的目标画像;可知,将用户对应的不同类型的特征数据统一转换成向量,用于大语言模型的训练,避免了用户数据的来源多样、格式不一造成数据不标准化的问题,通过大语言模型理解相应的语义关系,获取到数据与数据之间的关联性,提高了获取到目标用户画像的准确性。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别是涉及一种获取目标用户画像的方法、装置、介质及设备


技术介绍

1、随着大数据和人工智能的迅猛发展,数字时代的用户数据变得前所未有的丰富和复杂,在此背景下,如何准确地描述用户画像,构建能够还原反应用户特征的模型,成为当前重要的焦点和研究方向,其中,用户画像是大数据领域重要的应用,其目标是在很多的维度上建立针对用户的描述性标签属性,从而利用这些标签属性对用户多方面的真实个人特征进行勾勒,进而发掘用户需求,分析用户偏好,并通过匹配用户画像提供给用户更高效和更有针对性的信息输送以及更贴近个人习惯的用户体验。

2、现有技术中获取目标用户画像的方法为通过用户调研和统计分析获取用户对应的文本特征数据,利用机器学习算法对获取到的文本特征数据进行语义识别训练,获取到用户对应的目标画像,上述,因数据来源有限导致构建出的用户画像不够全面,机器学习不能满足用户数据类型和规模迅速增加的需求,未考虑将数据标准化,降低了获取到目标用户画像的准确性。


技术实现思路

1、针对上述技术问题,本专利技术采用的技术方案为一种获取目标用户画像的方法,所述方法包括如下步骤:

2、获取初始用户id列表和初始用户id列表对应的目标特征向量列表集,其中,获取初始用户id列表对应的目标特征向量列表集中包括如下步骤:

3、获取每个初始用户id对应的初始特征数据列表。

4、根据初始特征数据列表,获取初始用户id对应的第一数据列表和第二数据列表,其中,所述第一数据列表包括若干个第一数据,所述第一数据为序列数据,所述第二数据列表包括若干个第二数据,其中,所述第二数据为文本数据。

5、根据第一数据列表和第二数据列表,获取每个初始用户id对应的目标特征向量列表。

6、根据目标特征向量列表集,构建目标训练模型。

7、获取目标用户id对应的目标特征数据列表。

8、将目标特征数据列表输入至目标训练模型中,获取目标用户id对应的目标画像。

9、本专利技术还提供了一种获取目标用户画像的装置,所述装置包括:

10、第一执行模块,获取初始用户id列表和初始用户id列表对应的目标特征向量列表集,其中,所述第一执行模块包括:

11、第一获取模块,用于获取每个初始用户id对应的初始特征数据列表。

12、第二获取模块,用于根据初始特征数据列表,获取初始用户id对应的第一数据列表和第二数据列表。

13、第三获取模块,用于根据第一数据列表和第二数据列表,获取每个初始用户id对应的目标特征向量列表。

14、第二执行模块,根据目标特征向量列表集,构建目标训练模型。

15、第三执行模块,获取目标用户id对应的目标特征数据列表。

16、第四执行模块,将目标特征数据列表输入至目标训练模型中,获取目标用户id对应的目标画像。

17、本专利技术还提供了一种非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现上述的获取目标用户画像的方法。

18、本专利技术还提供了一种电子设备,包括处理器和上述的非瞬时性计算机可读存储介质。

19、本专利技术至少具有以下有益效果:获取初始用户id列表和初始用户id列表对应的目标特征向量列表集;根据目标特征向量列表集,构建目标训练模型;获取目标用户id对应的目标特征数据列表;将目标特征数据列表输入至目标训练模型中,获取目标用户id对应的目标画像;可知,将用户对应的不同类型的特征数据统一转换成向量,用于大语言模型的训练,避免了用户数据的来源多样、格式不一造成数据不标准化的问题,通过大语言模型理解相应的语义关系,获取到数据与数据之间的关联性,提高了获取到目标用户画像的准确性。

本文档来自技高网...

【技术保护点】

1.一种获取目标用户画像的方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的获取目标用户画像的方法,其特征在于,所述初始用户ID列表包括若干个初始用户ID,其中,所述初始用户ID为表征初始用户的唯一标识。

3.根据权利要求1所述的获取目标用户画像的方法,其特征在于,根据第一数据列表和第二数据列表,获取每个初始用户ID对应的目标特征向量列表包括如下步骤:

4.根据权利要求1所述的获取目标用户画像的方法,其特征在于,所述初始特征数据列表包括若干个初始特征数据,其中,所述初始特征数据为获取到的初始用户ID对应的初始用户在当前时刻之前与初始特征相关的数据。

5.根据权利要求1所述的获取目标用户画像的方法,其特征在于,所述目标特征数据列表包括若干个目标特征数据,其中,所述目标特征数据为获取到的目标用户ID对应的目标用户在当前时刻之前与目标特征相关的数据。

6.一种获取目标用户画像的装置,其特征在于,所述装置包括:

7.根据权利要求6所述的获取目标用户画像的装置,其特征在于,所述初始用户ID列表包括若干个初始用户ID,其中,所述初始用户ID为表征初始用户的唯一标识。

8.根据权利要求6所述的获取目标用户画像的装置,其特征在于,所述第三获取模块包括:

9.根据权利要求6所述的获取目标用户画像的装置,其特征在于,所述初始特征数据列表包括若干个初始特征数据,其中,所述初始特征数据为获取到的初始用户ID对应的初始用户在当前时刻之前与初始特征相关的数据。

10.根据权利要求6所述的获取目标用户画像的装置,其特征在于,所述目标特征数据列表包括若干个目标特征数据,其中,所述目标特征数据为获取到的目标用户ID对应的目标用户在当前时刻之前与目标特征相关的数据。

11.一种非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序,其特征在于,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-5中任意一项所述的获取目标用户画像的方法。

12.一种电子设备,其特征在于,包括处理器和权利要求11中所述的非瞬时性计算机可读存储介质。

...

【技术特征摘要】

1.一种获取目标用户画像的方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的获取目标用户画像的方法,其特征在于,所述初始用户id列表包括若干个初始用户id,其中,所述初始用户id为表征初始用户的唯一标识。

3.根据权利要求1所述的获取目标用户画像的方法,其特征在于,根据第一数据列表和第二数据列表,获取每个初始用户id对应的目标特征向量列表包括如下步骤:

4.根据权利要求1所述的获取目标用户画像的方法,其特征在于,所述初始特征数据列表包括若干个初始特征数据,其中,所述初始特征数据为获取到的初始用户id对应的初始用户在当前时刻之前与初始特征相关的数据。

5.根据权利要求1所述的获取目标用户画像的方法,其特征在于,所述目标特征数据列表包括若干个目标特征数据,其中,所述目标特征数据为获取到的目标用户id对应的目标用户在当前时刻之前与目标特征相关的数据。

6.一种获取目标用户画像的装置,其特征在于,所述装置包括:

7.根据权利要求6所述的获取目标用户画像的装置,其特征在于,...

【专利技术属性】
技术研发人员:陈建斌段永康熊林
申请(专利权)人:每日互动股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1