基于维度紧缩的大数据智能云获客系统技术方案

技术编号：42005301 阅读：23 留言：0更新日期：2024-07-12 12:26

本发明专利技术涉及大数据技术领域，具体涉及基于维度紧缩的大数据智能云获客系统，所述系统包括：数据获取单元、维度紧缩单元、用户画像构建单元和智能推送单元；所述数据获取单元，用于从大数据云端获取用户数据集合；所述维度紧缩单元，用于将用户数据集合中的每个用户数据中的每个特征数据转换为一个数值型数据；所述用户画像构建单元，用于对用户数据集合进行基于马尔科夫随机游走矩阵的空间聚类，以生成该聚类中心所对应的用户数据的用户画像；所述智能推送单元，用于根据用户数据的用户画像，为每个用户进行对应内容的推送。本发明专利技术通过精准获取用户数据、高效处理和分析数据、准确构建用户画像以及个性化推送，为企业提供了高效的用户获客方案。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及大数据，具体涉及基于维度紧缩的大数据智能云获客系统。

技术介绍

1、随着互联网的普及和信息化时代的到来，数据已经成为了当今社会最宝贵的资源之一。随着大数据技术的发展，人们对于数据的需求和应用也日益增长。特别是在商业领域，数据的获取、处理和分析已经成为了企业获取竞争优势的重要手段之一。在这样的背景下，针对大数据的智能化应用逐渐成为了人们关注的焦点。

2、在过去的几年里，已经涌现出了一些针对大数据的智能化系统和平台。这些系统主要包括数据采集、处理、分析和应用等环节，以满足用户在不同领域的需求。以下是一些已经公开的现有技术：

3、大数据采集系统：传统的大数据采集系统主要通过网络爬虫、传感器等手段，收集网络上的各种数据，并将其存储到数据库中。这些数据可能来自于网站、社交媒体、移动应用等各个方面，具有多样性和海量性。

4、大数据处理平台：为了处理这些海量的数据，已经出现了许多大数据处理平台，例如hadoop、spark等。这些平台采用了分布式计算的架构，能够对大规模数据进行高效的处理和分析。

5、数据挖掘和机器学习算法：为了从海量的数据中挖掘出有用的信息，研究人员提出了许多数据挖掘和机器学习算法。这些算法包括聚类、分类、回归、关联规则挖掘等，能够帮助用户发现数据中的模式和规律。

6、推荐系统：随着电子商务的发展，推荐系统已经成为了各大电商平台的核心功能之一。这些系统通过分析用户的历史行为和偏好，向用户推荐他们可能感兴趣的商品或服务，从而提高销售额和用户满意度。>

7、虽然现有技术在大数据领域取得了一定的成就，但仍然存在一些问题需要解决：传统的数据采集方式可能无法保证数据的精准性和全面性，特别是在需要获取实时数据或者特定领域的数据时，存在一定的局限性。尽管大数据处理平台可以处理海量数据，但在处理复杂的数据结构和多样的数据类型时，仍然存在一定的效率问题。尤其是对于需要实时分析的场景，现有技术往往无法满足要求。现有的推荐系统虽然能够根据用户的历史行为和偏好进行推荐，但仍然存在一定的准确性问题。特别是在面对冷启动和数据稀疏的情况下，推荐系统的性能会大打折扣。在个性化推荐和精准营销等场景中，需要建立用户的精准画像，以便更好地理解用户需求和行为。然而，现有技术往往无法从海量数据中准确地构建用户画像，存在一定的局限性。

技术实现思路

1、本专利技术的主要目的是提供基于维度紧缩的大数据智能云获客系统，通过精准获取用户数据、高效处理和分析数据、准确构建用户画像以及个性化推送，为企业提供了高效的用户获客方案。

2、为解决上述技术问题，本专利技术提供基于维度紧缩的大数据智能云获客系统，所述系统包括：数据获取单元、维度紧缩单元、用户画像构建单元和智能推送单元；所述数据获取单元，用于从大数据云端获取用户数据集合，用户数据集合中包括多个用户数据，每个用户数据为一个高维向量，其每个元素为用户的特征数据；所述维度紧缩单元，用于将用户数据集合中的每个用户数据中的每个特征数据转换为一个数值型数据，然后对用户数据集合中的用户数据进行维度紧缩，以降低用户数据之间的空间距离；所述用户画像构建单元，用于对用户数据集合进行基于马尔科夫随机游走矩阵的空间聚类，以此将用户数据集合中的每个用户数据划分为不同的类别，不同类别的用户数据具备不同的聚类中心，为每个聚类中心分配一个标签，以生成该聚类中心所对应的用户数据的用户画像；所述智能推送单元，用于根据用户数据的用户画像，为每个用户进行对应内容的推送。

3、进一步的，所述用户的特征数据的种类至少包括：年龄、性别、地址、婚姻状态、收入、第一偏好关键词、第二偏好关键词、第三偏好关键词、第一偏好网址、第二偏好网址和第三偏好网址；不同类别的用户特征数据对应的数值型数据具备不同的位数；统一类别的用户特征数据对应的数值型数据具备相同位数。

4、进一步的，所述维度紧缩单元，将用户数据集合中的每个用户数据进行维度紧缩的方法包括：根据用户数据集合中的用户数据，构建一个邻接矩阵；所述邻接这个矩阵描述了每个用户数据之间的相似度，使用相似性度量来填充邻接矩阵的元素；基于邻接矩阵构建转移概率矩阵；通过迭代计算转移概率矩阵的幂，得到平稳分布矩阵；使用平稳分布矩阵来计算拉普拉斯特征映射，得到拉普拉斯特征空间；将用户数据集合中的每个用户数据映射到拉普拉斯特征空间中，以实现维度紧缩。

5、进一步的，相似性度量通过如下公式进行计算：

6、

7、其中，aij表示用户数据i和j之间的相似度，它是邻接矩阵a中的一个元素；uik和ujk：分别表示用户数据i和用户数据j的第k个特征数据对应的数值型数据；和分别表示用户数据i和用户数据j的特征数据对应的数值型数据的加和后平均值；m表示每个用户数据的特征数据的数量。

8、进一步的，使用如下公式，基于邻接矩阵构建转移概率矩阵：

9、

10、其中，pij表示转移概率矩阵中的第i行第j列元素；设定迭代次数为t，再通过如下公式，计算得到平稳分布矩阵为p，其中每个元素为使用如下公式计算得到：

11、

12、进一步的，设l为拉普拉斯矩阵，d为度矩阵，其中：

13、dii＝∑j aij，l＝dp-a；

14、再使用如下公式计算稀疏拉普拉斯矩阵：

15、

16、然后，计算的前b个最小特征向量构成的矩阵u；将用户数据集合中的每个用户数据映射到拉普拉斯特征空间中，以实现维度的紧缩；对于每个用户数据xi，其在拉普拉斯特征空间中的表示为yi＝utxi；

17、进一步的，用户画像构建单元，对用户数据集合进行基于马尔科夫随机游走矩阵的空间聚类的方法包括：定义空间图模型g＝(v，e，w)，其中v表示节点集合，e表示边集合，w表示权重矩阵；节点vi∈v对应于yi，而边eij∈e表示节点vi和vj之间的连接；权重矩阵w是一个对称矩阵，表示节点之间的距离；采用局部敏感哈希方法计算节点之间的相似度矩阵局部敏感哈希方法基于哈希函数将距离在设定值内的节点映射到同一桶中，然后通过计算每个桶中的相似度来构建相似度矩阵；引入一个动态权重系数β，通过下式计算节点之间的转移概率矩阵

18、

19、其中，wij表示权重矩阵w的元素；oij为转移概率矩阵o中的第i行，第j列的元素；计算随机游走矩阵mij为游走矩阵m中的第i行第j列元素；使用特征值分解方法计算随机游走矩阵m的马尔科夫链稳态分布π；根据马尔科夫链稳态分布π，初始化聚类中心；采用π的前z个大的分量对应的节点作为初始的聚类中心，其中z是聚类中心的数量；使用预设的聚类中心更新方式更新初始的聚类中心；引入一个收敛判据，根据聚类中心的变化率来判断算法是否收敛；如果聚类中心的变化率小于收敛判据，则算法收敛，将每个节点分配给最近的聚类中心，形成最终的聚类结果。

20、进一步的，使用如下公式，计算游走矩阵：引入一个动态系数γ，通过下式计算本文档来自技高网...

【技术保护点】

1.基于维度紧缩的大数据智能云获客系统，其特征在于，所述系统包括：数据获取单元、维度紧缩单元、用户画像构建单元和智能推送单元；所述数据获取单元，用于从大数据云端获取用户数据集合，用户数据集合中包括多个用户数据，每个用户数据为一个高维向量，其每个元素为用户的特征数据；所述维度紧缩单元，用于将用户数据集合中的每个用户数据中的每个特征数据转换为一个数值型数据，然后对用户数据集合中的用户数据进行维度紧缩，以降低用户数据之间的空间距离；所述用户画像构建单元，用于对用户数据集合进行基于马尔科夫随机游走矩阵的空间聚类，以此将用户数据集合中的每个用户数据划分为不同的类别，不同类别的用户数据具备不同的聚类中心，为每个聚类中心分配一个标签，以生成该聚类中心所对应的用户数据的用户画像；所述智能推送单元，用于根据用户数据的用户画像，为每个用户进行对应内容的推送。

2.如权利要求1所述的基于维度紧缩的大数据智能云获客系统，其特征在于，所述用户的特征数据的种类至少包括：年龄、性别、地址、婚姻状态、收入、第一偏好关键词、第二偏好关键词、第三偏好关键词、第一偏好网址、第二偏好网址和第三偏好网址；不同

3.如权利要求2所述的基于维度紧缩的大数据智能云获客系统，其特征在于，所述维度紧缩单元，将用户数据集合中的每个用户数据进行维度紧缩的方法包括：根据用户数据集合中的用户数据，构建一个邻接矩阵；所述邻接这个矩阵描述了每个用户数据之间的相似度，使用相似性度量来填充邻接矩阵的元素；基于邻接矩阵构建转移概率矩阵；通过迭代计算转移概率矩阵的幂，得到平稳分布矩阵；使用平稳分布矩阵来计算拉普拉斯特征映射，得到拉普拉斯特征空间；将用户数据集合中的每个用户数据映射到拉普拉斯特征空间中，以实现维度紧缩。

4.如权利要求3所述的基于维度紧缩的大数据智能云获客系统，其特征在于，相似性度量通过如下公式进行计算：

5.如权利要求4所述的基于维度紧缩的大数据智能云获客系统，其特征在于，使用如下公式，基于邻接矩阵构建转移概率矩阵：

6.如权利要求5所述的基于维度紧缩的大数据智能云获客系统，其特征在于，设L为拉普拉斯矩阵，D为度矩阵，其中：

7.如权利要求6所述的基于维度紧缩的大数据智能云获客系统，其特征在于，用户画像构建单元，对用户数据集合进行基于马尔科夫随机游走矩阵的空间聚类的方法包括：定义空间图模型G＝(V，E，W)，其中V表示节点集合，E表示边集合，W表示权重矩阵；节点vi∈V对应于yi，而边eij∈E表示节点vi和vj之间的连接；权重矩阵W是一个对称矩阵，表示节点之间的距离；采用局部敏感哈希方法计算节点之间的相似度矩阵局部敏感哈希方法基于哈希函数将距离在设定值内的节点映射到同一桶中，然后通过计算每个桶中的相似度来构建相似度矩阵；引入一个动态权重系数β，通过下式计算节点之间的转移概率矩阵

8.如权利要求7所述的基于维度紧缩的大数据智能云获客系统，其特征在于，使用如下公式，计算游走矩阵：引入一个动态系数γ，通过下式计算随机游走矩阵

9.如权利要求8所述的基于维度紧缩的大数据智能云获客系统，其特征在于，预设的聚类中心更新方式为：

...

【技术特征摘要】

2.如权利要求1所述的基于维度紧缩的大数据智能云获客系统，其特征在于，所述用户的特征数据的种类至少包括：年龄、性别、地址、婚姻状态、收入、第一偏好关键词、第二偏好关键词、第三偏好关键词、第一偏好网址、第二偏好网址和第三偏好网址；不同类别的用户特征数据对应的数值型数据具备不同的位数；统一类别的用户特征数据对应的数值型数据具备相同位数。

3.如权利要求2所述的基于维度紧缩的大数据智能云获客系统，其特征在于，所述维度紧缩单元，将用户数据集合中的每个用户数据进行维度紧缩的方法包括：根据用户数据集合中的用户数据，构建一个邻接矩阵；所述邻接这个矩阵描述了每个用户数据之间的相似度，使用相似性度量来填充邻接矩阵的元素；基于邻接矩阵构建转移...

【专利技术属性】
技术研发人员：赵随，
申请(专利权)人：兰州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人