System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 自动地对搜索活动进行重新结构化制造技术_技高网

自动地对搜索活动进行重新结构化制造技术

技术编号:42845585 阅读:14 留言:0更新日期:2024-09-27 17:15
为了自动地将关键字映射到着陆页,一种系统获得包括内容项的组的初始集的数据集,组中的每一个被映射到着陆页的初始集中的相应着陆页,并且内容项中的每一个与初始关键字词汇表中的一个或多个关键字相关联;基于所获得的数据集来生成经缩减数据集,这包括:(i)基于着陆页的初始集使用与相应着陆页相关联的链接的参数来生成着陆页的经缩减集,(ii)对关键字进行聚类以确定与数据集相关联的主题的集,以及(iii)生成组的经缩减集,包括识别组之间的在主题集中包括的主题中的重叠。所述系统还使用所生成的数据结构来将接收到的搜索词映射到内容项中的一个或多个。

【技术实现步骤摘要】
【国外来华专利技术】

本公开涉及搜索活动(campaign)的结构化,并且具体涉及用于与web资源的着陆页相关的搜索词的压缩和重新结构化(restructuring)的方法和系统。


技术介绍

1、提供搜索服务的计算系统可以提供与搜索查询相关的搜索结果和第三方内容两者。例如,用户可以经由网站或专用应用来访问搜索引擎,并提交包括一个或多个搜索词的搜索查询。响应于搜索查询,系统可以识别响应所述查询的搜索结果以及与搜索词相关的第三方内容。系统可以提供第三方内容作为搜索活动的一部分,以将流量引导到与产品、服务、应用等相关的某个着陆页。

2、搜索服务的运营商可以鉴于各种定量指标来设计搜索活动以提供第三方内容项。此类指标的示例包括点击率(ctr)、每次点击成本(cpc)、每次获取成本(cpa)、转化率等。搜索活动可以包括多个第三方内容项组,每一组都与某个意图的消息相关联。系统可以针对每一组或主题存储关键字集,以促进针对包括这些关键字或相关的关键字的查询来选择相关的第三方内容。在一些情况下,第三方内容的提供者可以对这些关键字进行竞标。

3、建立和维护有效搜索活动所需的数据集通常很大。在设计此类数据集中的低效会导致关键字在多个活动中重复,从而将过多数量的活动和/或内容组映射到相同着陆页,在多个活动和组中复制第三方内容的相同文本等。用于支持自动竞标以及关键字到第三方内容和着陆页的自动映射的低效数据结构会导致较慢的处理时间、过多存储器使用以及错误。


技术实现思路

1、本公开的技术的示例实施方案是一种自动地将关键字映射到着陆页的方法。所述方法包括:获得包括内容项的组的初始集的数据集,组中的每一个被映射到着陆页的初始集中的相应着陆页,并且内容项中的每一个与初始关键字词汇表中的一个或多个关键字相关联;基于所获得的数据集而生成经缩减数据集,生成包括:基于着陆页的初始集使用与相应着陆页相关联的链接的参数来生成着陆页的经缩减集,对关键字进行聚类以确定与数据集相关联的主题的集,以及生成组的经缩减集,包括识别组之间的在主题的集中包括的主题中的重叠。所述方法还包括使用经缩减数据集来将接收到的搜索词映射到内容项中的一个或多个。

本文档来自技高网...

【技术保护点】

1.一种自动地将关键字映射到着陆页的方法,所述方法包括:

2.如权利要求1所述的方法,其中生成着陆页的所述经缩减集包括基于第一着陆页和第二着陆页的一个或多个路径参数来确定所述第一着陆页和所述第二着陆页与公共资源相对应。

3.如权利要求1所述的方法,其中生成着陆页的所述经缩减集包括基于第一着陆页和第二着陆页的一个或多个查询参数来确定所述第一着陆页和所述第二着陆页与公共资源相对应。

4.如前述权利要求中任一项所述的方法,其中对所述关键字进行聚类包括应用Word2Vec矢量化。

5.如前述权利要求中任一项所述的方法,其中对所述关键字进行聚类包括计算轮廓分数。

6.如前述权利要求中任一项所述的方法,其中对所述关键字进行聚类包括应用无监督聚类技术。

7.如前述权利要求中任一项所述的方法,其中对所述关键字进行聚类包括应用TF-IDF矢量化来识别词汇表外(OOV)字。

8.如前述权利要求中任一项所述的方法,还包括:

9.如权利要求8所述的方法,其中生成所述经缩减关键字词汇表包括应用模糊匹配来缩减所述初始关键字词汇表中的所述关键字的数量。

10.如权利要求9所述的方法,其中所述模糊匹配的所述应用包括:

11.如权利要求9所述的方法,其中所述模糊匹配的所述应用包括:

12.如权利要求11所述的方法,其中所述经缩减关键字词汇表的所述生成包括:

13.如权利要求12所述的方法,还包括:

14.一种系统,包括:

...

【技术特征摘要】
【国外来华专利技术】

1.一种自动地将关键字映射到着陆页的方法,所述方法包括:

2.如权利要求1所述的方法,其中生成着陆页的所述经缩减集包括基于第一着陆页和第二着陆页的一个或多个路径参数来确定所述第一着陆页和所述第二着陆页与公共资源相对应。

3.如权利要求1所述的方法,其中生成着陆页的所述经缩减集包括基于第一着陆页和第二着陆页的一个或多个查询参数来确定所述第一着陆页和所述第二着陆页与公共资源相对应。

4.如前述权利要求中任一项所述的方法,其中对所述关键字进行聚类包括应用word2vec矢量化。

5.如前述权利要求中任一项所述的方法,其中对所述关键字进行聚类包括计算轮廓分数。

6.如前述权利要求中任一项所述的方法,其中对所述关键字进行聚类...

【专利技术属性】
技术研发人员:V·维尔马
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1