一种扩展词对的筛选方法及装置制造方法及图纸

技术编号:13105636 阅读:61 留言:0更新日期:2016-03-31 11:54
本申请公开了一种扩展词对的筛选方法,用以解决在用户行为不够丰富的场景下,按照现有的扩展词对确定方式能够确定出的扩展词对的数量较小的问题。方法包括:获得至少两个查询词对;从所述至少两个查询词对中,确定包含的各查询词在特定时间段内的共现次数小于第一次数阈值的查询词对;从确定出的查询词对中,选取符合设置的扩展词对必要条件的查询词对作为扩展词对。本申请还公开一种扩展词对的筛选装置。

【技术实现步骤摘要】

本申请涉及计算机
,尤其涉及一种扩展词对的筛选方法及装置
技术介绍
目前,在至少一些网站上,广告主为了在其上推广商品,往往会"购买"一些关键 词,送些被购买的关键词也称为"竞价词"化id-word)。后续用户W竞价词或其他词作为查 询词(query)对商品进行搜索时,若搜索到推广商品的信息(也称为曝光)并进行了点击, 则广告扣费系统会按照与用户使用的查询词相匹配的竞价词计费标准,从广告主账户中扣 取单次点击广告费。 -般地,W竞价词作为查询词而搜索到推广商品的信息的情况,被称为"精确匹 配";而W其他词作为查询词而搜索到推广商品的信息的情况,被称为"扩展匹配"。 针对扩展匹配而言,为了确定与查询词相匹配的竞价词计费标准,首先需要确定 与查询词相匹配的竞价词。其中,单个竞价词W及与该单个竞价词相匹配的单个查询词构 成的词对可称为"扩展词对"。特别地,扩展词对所包含的两个词都有可能是竞价词。 现有技术中,扩展词对可W是基于用户行为确定的。具体实现方式如下: 首先,针对一些查询词,判断用户是否根据该些查询词中的每个查询词,分别实现 了对于同一商品信息执行特定行为,其中,送里所说的特定行为一般为搜索行为、点击行 为、下单行为(电子商务网站特有)或反馈行为(比如用户发表对于商品的评价)等; 若判断结果为是,则根据竞价词数据库,确定由该些查询词中的查询词两两组合 而成的查询词对中,是否分别存在竞价词; 最后,从存在竞价词的查询词对中,选取包含的各查询词在特定时间段内被单个 用户均用作搜索依据的次数不小于规定次数阔值的查询词对,作为扩展词对。其中,被单个 用户均作为搜索依据的次数称为"共现次数"。 上述扩展词对确定方式存在的缺陷在于,在用户行为不够丰富的场景下,满足包 含的各查询词在特定时间段内的共现次数不小于规定次数阔值的查询词对数量较小,进而 导致确定出的扩展词对的数量较小,有可能不能满足实际需求。
技术实现思路
本申请实施例提供一种扩展词对的筛选方法,用W解决在用户行为不够丰富的场 景下,按照现有的扩展词对确定方式能够确定出的扩展词对的数量较小的问题。 本申请实施例还提供一种扩展词对的筛选装置,用W解决在用户行为不够丰富的 场景下,按照现有的扩展词对确定方式能够确定出的扩展词对的数量较小的问题。 本申请实施例采用下述技术方案: 一种扩展词对的筛选方法,包括:获得至少两个查询词对;其中,每个查询词对包 含至少一个作为竞价词的查询词;从所述至少两个查询词对中,确定包含的各查询词在特 定时间段内的共现次数小于第一次数阔值的查询词对;从确定出的查询词对中,选取符合 设置的扩展词对必要条件的查询词对作为扩展词对。 一种扩展词对的筛选装置,包括:获得单元,用于获得至少两个查询词对;其中, 每个查询词对包含至少一个作为竞价词的查询词;第一确定单元,用于从获得单元获得的 所述至少两个查询词对中,确定包含的各查询词在特定时间段内的共现次数小于第一次数 阔值的查询词对;选取单元,用于从第一确定单元确定出的查询词对中,选取符合设置的扩 展词对必要条件的查询词对作为扩展词对。 本申请实施例采用的上述至少一个技术方案能够达到W下有益效果: 由于可W根据设置的扩展词对必要条件,从包含的各查询词在特定时间段内的共 现次数小于第一次数阔值的查询词对中,选取出作为扩展词对的查询词,从而即便是在用 户行为不够丰富,因而导致包含的各查询词在特定时间段内的共现次数不小于规定次数阔 值的查询词对数量较小的场景下,也可W得到较多的扩展词对,解决在该场景下按照现有 的扩展词对确定方式能够确定出的扩展词对的数量较小的问题。【附图说明】 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申 请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中: 图1为本申请实施例提供的一种扩展词对的筛选方法的具体流程示意图; 图2为本申请实施例提供的另一种扩展词对的筛选方法的具体流程示意图; 图3为本申请实施例提供的一种扩展词对的筛选装置的具体结构示意图。【具体实施方式】 为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及 相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一 部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。 W下结合附图,详细说明本申请各实施例提供的技术方案。 为了解决在用户行为不够丰富的场景下,按照现有的扩展词对确定方式能够确定 出的扩展词对的数量较小的问题,本申请实施例提供一种扩展词对的筛选方法。该方法的 具体流程示意图如图1所示,包括如下步骤: 步骤11,获得至少两个查询词对。其中,每个查询词对包含至少一个作为竞价词的查询词。 步骤12,从通过执行步骤11而获得的所述至少两个查询词对中,确定包含的各查 询词在特定时间段内的共现次数小于第一次数阔值的查询词对。 送里所说的特定时间段可W是一个或多个session,也可W是规定的其他时间段 (比如最近Η个月),等等。特别地,在一种特定的实施方式中,该至少两个查询词对来自于 不同用户session。比如,获得的至少两个查询词对中,至少包括;在特定时间段内被第一 用户用作搜索依据的第一查询词对,W及在特定时间段内被第二用户用作搜索依据的第二 查询词对。 其中,session是指单个用户终端在特定状态下与通信对端(往往是网站服务器) 进行的通信所持续的时间长度,通常是指从用户终端登录到网站至退出网站所经过的时间 长度。 当获得的所述至少两个查询词对来自于不同用户session时,步骤12的具体实现 过程可W包括下述子步骤: 针对所述至少两个查询词对中的、在特定时间段内仅被单个用户用作搜索依据的 各查询词对分别执行:确定该查询词对在特定时间段内被单个用户用作搜索依据的次数; 并 针对所述至少两个查询词对中的、在特定时间段内被至少两个用户用作搜索依据 的各查询词对分别执行:确定该查询词对在特定时间段内分别被各个用户用作搜索依据的 次数总和; 然后,根据针对所述至少两个查询词对中的、在特定时间段内仅被单个用户用作 搜索依据的各查询词对所确定出的次数,W及确定出的各次数总和,确定包含的各查询词 在特定时间段内的共现次数小于第一次数阔值的查询词对。 本申请实施例中,对于包含的各查询词在特定时间段内的共现次数大于或等于第 一次数阔值的查询词对可W认为是高置信度词对,可W直接将送些查询词对作为扩展词 对。对于包含的各查询词在特定时间段内的共现次数小于第一次数阔值的查询词对可W认 为是低置信度词对,可W作进一步的挖掘,详述如下。 步骤13,从通过执行步骤12而确定出的查询词对(即低置信度词对)中,选取符 合设置的扩展词对必要条件的查询词对作为扩展词对。 采用本申请实施例提供的上述方法,由于可W根据设置的扩展词对必要条件,从 包含的各查询词在特定时间段内的共现次数小于第一次数阔值的查询词对中,选取出作为 扩展词对的查询词,从而即便是在用户行为不够丰富,进当前第1页1 2 3 4&n本文档来自技高网
...

【技术保护点】
一种扩展词对的筛选方法,其特征在于,包括:获得至少两个查询词对;其中,每个查询词对包含至少一个作为竞价词的查询词;从所述至少两个查询词对中,确定包含的各查询词在特定时间段内的共现次数小于第一次数阈值的查询词对;从确定出的查询词对中,选取符合设置的扩展词对必要条件的查询词对作为扩展词对。

【技术特征摘要】

【专利技术属性】
技术研发人员:何炜李波林锋
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1