System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及大数据分析,更具体地说,本申请涉及一种基于大数据的用户行为分析方法及系统。
技术介绍
1、随着信息化时代数据的爆炸式增长和计算能力的飞速提升,大数据分析已逐渐成为现代科技社会的一个关键技术,传统的数据处理方法已无法应对来自各类数据源的海量、快速、复杂且多样化的数据,其中,大数据分析主要依赖分布式计算、云存储和先进的算法处理架构,用于高效存储与并行处理数据,此外,大数据分析还为推动个性化推荐、商业决策优化和智能预测等创新领域提供关键动力。
2、现有的大数据分析通过多种技术手段实现对海量数据的处理与分析,在查询行为分析中,自然语言处理技术用于理解和分析用户输入的搜索词及其意图,从而精准分析用户的兴趣和行为模式,通过分析这些数据,互联网搜索服务平台可以实现个性化推荐和用户行为预测,提升用户体验和商业价值;然而,用户在进行搜索行为时,往往通过简单和模糊的描述性查询短语表达自基于大数据的用户行为分析系统的查询需求,查询系统难以准确捕捉用户真实的关注点和兴趣偏好,其次,用户使用查询短语进行查询时的兴趣偏好是动态变化的,对于一个关键查询主题都会出现多个兴趣查询方向的变化,现有的传统查询方法难以适应这些变化,因此,如何精准捕捉用户的查询短语,并对查询短语的搜索兴趣指向作出关联归类,从而实现对用户搜索行为模式的准确分析成为了业界面临的难题。
技术实现思路
1、本申请提供一种基于大数据的用户行为分析方法及系统,可精准捕捉用户的查询短语,并对查询短语的搜索兴趣指向作出关联归类,从而
2、第一方面,本申请提供一种基于大数据的用户行为分析方法,包括如下步骤:
3、从互联网搜索服务平台的大数据中心获取目标用户在互联网搜索服务平台的查询日志;
4、从所述查询日志中提取目标用户进行查询时的多个主题标签以及各个主题标签的长尾查询数据;
5、选定一个主题标签作为选定主题标签,根据选定主题标签的长尾查询数据确定目标用户在选定主题标签下进行长尾查询时的多个行为兴趣度,进而基于互联网搜索服务平台的查询兴趣指数和所有的行为兴趣度确定选定主题标签的多个查询兴趣子标签;
6、将每个查询兴趣子标签与选定主题标签进行查询指向性关联,进而得到选定主题标签对应的多个指向关联向量,根据所有指向关联向量确定目标用户在选定主题标签下进行长尾查询时的行为趋势特征,继续确定目标用户在剩余主题标签下进行长尾查询时的行为趋势特征;
7、获取当前时刻目标用户在互联网搜索服务平台上输入的查询词组,将所述查询词组与每个主题标签下的行为趋势特征进行查询匹配,得到目标用户的查询行为特征;
8、将所述目标用户的查询行为特征上传至用户行为分析中心。
9、在一些实施例中,从所述查询日志中提取目标用户进行查询时的多个主题标签以及各个主题标签的长尾查询数据具体包括:
10、从所述查询日志中提取多个查询关键词;
11、对所有的查询关键词进行标签聚类,得到目标用户进行查询时的多个主题标签;
12、选取一个主题标签作为选定主题标签,将选定主题标签中各个查询关键词在所述查询日志中对应的长尾查询记录组合为选定主题标签的长尾查询数据;
13、继续确定剩余主题标签的长尾查询数据。
14、在一些实施例中,对所有的查询关键词进行标签聚类,得到目标用户进行查询时的多个主题标签具体包括:
15、确定每个查询关键词之间的语义相似性;
16、基于每个查询关键词之间的语义相似性使用聚类算法对所有的查询关键词进行相似性分组,得到多个查询相似组;
17、确定每个查询相似组的主题标签,进而得到目标用户进行查询时的多个主题标签。
18、在一些实施例中,根据选定主题标签的长尾查询数据确定目标用户在选定主题标签下进行长尾查询时的多个行为兴趣度具体包括:
19、从选定主题标签的长尾查询数据中选取一个长尾查询词作为选定长尾查询词;
20、基于所述长尾查询数据确定选定长尾查询词的行为模式频度;
21、确定选定长尾查询词在所述长尾查询数据中的兴趣权重;
22、依据所述行为模式频度和所述兴趣权重确定目标用户在选定主题标签下进行选定长尾查询词查询时的行为兴趣度;
23、继续确定目标用户在选定主题标签下进行剩余长尾查询词查询时的行为兴趣度。
24、在一些实施例中,基于互联网搜索服务平台的查询兴趣指数和所有的行为兴趣度确定选定主题标签的多个查询兴趣子标签具体包括:
25、获取互联网搜索服务平台的查询兴趣指数;
26、基于所述查询兴趣指数和各个行为兴趣度对选定主题标签进行查询行为分析,得到选定主题标签的多个查询行为粘度;
27、依据所有的查询行为粘度确定选定主题标签的多个查询兴趣子标签。
28、在一些实施例中,将每个查询兴趣子标签与选定主题标签进行查询指向性关联,进而得到选定主题标签对应的多个指向关联向量具体包括:
29、选取一个查询兴趣子标签作为选定查询兴趣子标签;
30、确定选定查询兴趣子标签与选定主题标签在目标用户的历史搜索记录中的标签共现率;
31、对选定查询兴趣子标签进行指向性分析,得到选定查询兴趣子标签在选定主题标签下的关联指向性;
32、获取目标用户对选定查询兴趣子标签的标签响应度;
33、基于所述标签共现率、所述关联指向性和所述标签响应度确定选定查询兴趣子标签对于选定主题标签的指向关联向量;
34、继续确定选定主题标签对应的多个指向关联向量。
35、在一些实施例中,根据所有指向关联向量确定目标用户在选定主题标签下进行长尾查询时的行为趋势特征具体包括:
36、确定所有指向关联向量的多个关联相似度;
37、对所有的关联相似度进行特征分解,得到选定主题标签下的多个行为趋势度和多个行为特征;
38、基于所有的行为趋势度和所有的行为特征确定目标用户在选定主题标签下进行长尾查询时的行为趋势特征。
39、第二方面,本申请提供一种基于大数据的用户行为分析系统,包括:
40、获取模块,用于从互联网搜索服务平台的大数据中心获取目标用户在互联网搜索服务平台的查询日志;
41、处理模块,用于从所述查询日志中提取目标用户进行查询时的多个主题标签以及各个主题标签的长尾查询数据;
42、所述处理模块,还用于选定一个主题标签作为选定主题标签,根据选定主题标签的长尾查询数据确定目标用户在选定主题标签下进行长尾查询时的多个行为兴趣度,进而基于互联网搜索服务平台的查询兴趣指数和所有的行为兴趣度确定选定主题标签的多个查询兴趣子标签;
43、所述处理模块,还用于将每个查询兴趣子标签与选定主题标签进行查询指向性关联,进而得到选定主题本文档来自技高网...
【技术保护点】
1.一种基于大数据的用户行为分析方法,其特征在于,包括如下步骤:
2.如权利要求1所述的方法,其特征在于,从所述查询日志中提取目标用户进行查询时的多个主题标签以及各个主题标签的长尾查询数据具体包括:
3.如权利要求2所述的方法,其特征在于,对所有的查询关键词进行标签聚类,得到目标用户进行查询时的多个主题标签具体包括:
4.如权利要求1所述的方法,其特征在于,根据选定主题标签的长尾查询数据确定目标用户在选定主题标签下进行长尾查询时的多个行为兴趣度具体包括:
5.如权利要求1所述的方法,其特征在于,基于互联网搜索服务平台的查询兴趣指数和所有的行为兴趣度确定选定主题标签的多个查询兴趣子标签具体包括:
6.如权利要求1所述的方法,其特征在于,将每个查询兴趣子标签与选定主题标签进行查询指向性关联,进而得到选定主题标签对应的多个指向关联向量具体包括:
7.如权利要求1所述的方法,其特征在于,根据所有指向关联向量确定目标用户在选定主题标签下进行长尾查询时的行为趋势特征具体包括:
8.一种基于大数据的用户行为分析
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有代码,所述处理器被配置为获取所述代码,并执行如权利要求1至7任一项所述的基于大数据的用户行为分析方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于大数据的用户行为分析方法。
...【技术特征摘要】
1.一种基于大数据的用户行为分析方法,其特征在于,包括如下步骤:
2.如权利要求1所述的方法,其特征在于,从所述查询日志中提取目标用户进行查询时的多个主题标签以及各个主题标签的长尾查询数据具体包括:
3.如权利要求2所述的方法,其特征在于,对所有的查询关键词进行标签聚类,得到目标用户进行查询时的多个主题标签具体包括:
4.如权利要求1所述的方法,其特征在于,根据选定主题标签的长尾查询数据确定目标用户在选定主题标签下进行长尾查询时的多个行为兴趣度具体包括:
5.如权利要求1所述的方法,其特征在于,基于互联网搜索服务平台的查询兴趣指数和所有的行为兴趣度确定选定主题标签的多个查询兴趣子标签具体包括:
6.如权利要求1所述的方法,其特征在于,...
【专利技术属性】
技术研发人员:张焕新,廖子平,
申请(专利权)人:广州市互诺计算机科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。