本申请提供了一种搜索结果的生成方法和装置,所述方法包括:依据用户输入的查询关键词搜索相应的网页信息;针对各网页信息对应的信息发布者,提取该信息发布者发布的所有网页信息中,比重大于预设阀值的第一指定字段或第二指定字段,将所述第一指定字段的核心词,作为该信息发布者的第一属性对应的属性值,第二指定字段作为第二属性对应的属性值;提取符合预设条件的网页信息作为搜索结果,所述预设条件为,所述网页信息对应的第一属性与所述查询关键词相匹配,或所述网页信息对应的第二属性与所述查询关键词相匹配。本申请可以减少向服务器发送请求的次数,减轻服务器的负载。
【技术实现步骤摘要】
一种搜索结果的生成方法及装置
本申请涉及网络通信技术,特别是涉及一种搜索结果的生成方法和装置。
技术介绍
现有的搜索系统中,以电子商务网站搜索为例,当用户在搜索页面输入搜索关键词进行检索时,搜索引擎将查询词与供应信息数据库中的供应信息进行匹配,对与查询词文本相似或语义相似的供应信息,依据点击率进行排序,将排名靠前的供应信息返回给用户。以上现有技术中存在的问题是,由于搜索供应信息的时候仅仅针对搜索关键词和供应信息进行匹配,部分供应商为了增加商品曝光,会发布一些虚假的供应信息欺骗买家。例如某商家主营产品是钢琴,为了吸引更多人购买钢琴,就在网页上投放了标题为供应某热门手机的网页信息,买家点击相应链接却发现大量的关于钢琴的网页信息,不符合买家的购买意图,浪费了买家的搜索时间,进而增加了向服务器发送请求的次数,加重了服务器的负载。因此,目前需要本领域技术人员解决的一个技术问题就是,提供一种搜索结果的生成机制,以减少向服务器发送请求的次数,减轻服务器的负载。
技术实现思路
本申请所要解决的技术问题是提供一种搜索结果的生成方法,以减少向服务器发送请求的次数,减轻服务器的负载。本申请还提供了一种搜索结果的生成装置,用以保证上述方法在实际中的应用及实现。为了解决上述问题,本申请公开了一种搜索结果的生成方法,包括:依据用户输入的查询关键词搜索相应的网页信息;针对各网页信息对应的信息发布者,提取该信息发布者发布的所有网页信息中,比重大于预设阀值的第一指定字段或第二指定字段,将所述第一指定字段的核心词,作为该信息发布者的第一属性对应的属性值,第二指定字段作为第二属性对应的属性值;提取符合预设条件的网页信息作为搜索结果,所述预设条件为,所述网页信息对应的第一属性与所述查询关键词相匹配,或所述网页信息对应的第二属性与所述查询关键词相匹配。优选的,所述第一属性为主营产品,所述第二属性为主营行业;所述第一指定字段为供应产品词,所述第二指定字段为所属行业。优选的,所述网页信息为供应信息时,所述网页信息包括供应产品词、所属行业、商品属性、发布者信息,所述发布者信息包括供应商地址、公司名称、主营产品和主营行业。优选的,在针对各供应信息,统计其供应商的主营产品或主营行业之前,所述方法还包括:过滤与所述查询关键词的相似度小于预设相似度的网页信息。优选的,所述网页信息与查询关键词的相似度通过以下步骤获取:分别提取各网页信息和查询关键词中的核心产品词;由各核心产品词在不同点击类目中点击率,计算各网页信息与查询关键词的相似度。优选的,所述方法还包括:将所述搜索结果进行排序后在页面展示。优选的,所述方法还包括:依据各信息发布者的第一属性和第二属性对其发布者信息进行更新。优选的,所述信息发布者为广告主,所述将提取的网页信息进行排序的步骤包括:分别统计所述查询关键词在各网页信息中的特征信息,所述特征信息包括网页信息中查询关键词的位置信息,以及查询关键词与网页信息的相关度;由所述特征信息和点击概率预测模型,获取各网页信息的预测点击概率,所述点击概率预测模型包括不同的特征信息对应的预测点击概率的统计值;按照所述预测点击概率和查询关键词价格的乘积,对各网页信息进行排序。本申请还提供了一种搜索结果的生成装置,包括:网页信息搜索模块,用于依据用户输入的查询关键词搜索相应的网页信息;属性值统计模块,用于针对各网页信息对应的信息发布者,提取该信息发布者发布的所有网页信息中,比重大于预设阀值的第一指定字段或第二指定字段,将所述第一指定字段的核心词,作为该信息发布者的第一属性对应的属性值,第二指定字段作为第二属性对应的属性值;搜索结果提取模块,用于提取符合预设条件的网页供息作为搜索结果,所述预设条件为,所述网页信息对应的第一属性与所述查询关键词相匹配,或所述网页信息对应的第二属性与所述查询关键词相匹配。优选的,所述装置还包括:网页信息过滤模块,用于过滤与所述查询关键词的相似度小于预设相似度的网页信息。与现有技术相比,本申请具有以下优点:依据本申请,依据查询关键词搜索供应信息后,在过滤掉与查询关键词相似度较低的搜索结果后,找出供应商的主营产品和主营行业,将主营产品包括查询关键词对应的产品,或主营行业包括查询关键词对应行业的供应信息作为搜索结果,即搜索结果中的供应信息均是以查询关键词中的产品作为主营产品,或是主营行业的相关产品。若某供应商发布所查询产品的虚假交易信息,可以通过找出其主营产品和主营行业并非所需查询的产品,来过滤掉其供应信息,增加了与买家的购买意图的相关性,节约了用户的搜索时间。并且,由于在搜索结果中剔除了与主营产品,或主营行业不相关的供应信息,因此搜索引擎服务器向发起搜索请求的客户端传输搜索结果数据时,就相应的减少了传输的数据量(虚假交易信息被过滤掉,传输的数据量必然减少),导致网络传输速度加快,避免网络堵塞。此外,本申请还可以对各供应信息的点击概率进行预测,并依据预测点击概率和查询关键词的出价对供应信息排序后进行展示,提高了搜索结果的点击率。同时,依据各供应商的主营产品和主营行业对其供应商信息进行更新,可以减少因为客户更新不及时导致信息遗漏的问题。附图说明图1是本申请的一种搜索结果的生成方法实施例1的流程图;图2是本申请的一种搜索结果的生成方法实施例2的流程图;图3是本申请的一种搜索结果的生成装置实施例1的结构框图;图4是本申请的一种搜索结果的生成装置实施例2的结构框图。具体实施方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。参考图1,示出了本申请的一种搜索结果的生成方法实施例1的流程图,具体可以包括以下步骤:步骤101、依据用户输入的查询关键词搜索相应的网页信息。用户在搜索页面输入查询关键词进行检索时,搜索引擎会将查询关键词与预置的网页信息数据库进行匹配,将与查询关键词文本相似或语义相近的网页信息,提取出来作为初步搜索结果。在本申请中,所述网页信息可以为供应信息。步骤102、针对各网页信息对应的信息发布者,提取该信息发布者发布的所有网页信息中,比重大于预设阀值的第一指定字段或第二指定字段,将所述第一指定字段的核心词,作为该信息发布者的第一属性对应的属性值,第二指定字段作为第二属性对应的属性值。其中,所述第一指定字段的核心词可以是核心产品词。其中,所述第一属性为主营产品,所述第二属性为主营行业,所述第一指定字段为供应产品词(例如可以是供应诺基亚手机),所述第二指定字段为所属行业(例如可以是通信设备),相应的,可以将第一指定字段的核心产品词作为第一属性的属性值(例如,第一指定字段为“供应诺基亚手机”,提取的核心产品词为“手机”,可以将手机作为主营产品的属性值),第二指定字段作为第二属性的属性值(例如,第二指定字段为“通信设备”,将“通信设备”作为主营行业的属性值)。在本申请中,所述网页信息为供应信息时,可以包括供应产品词、所属行业、商品属性、发布者等信息,其中发布者信息为供应商信息。每条供应信息可以对应相同的商品名称,但商品属性可以不一致。其中,所述发布者信息可以包括供应商地址、公司名称、主营产品和主营行业等信息。例如,用户搜索手机的供应信息,其中一条供应信息包括:供应诺基亚手机所属行业:通信本文档来自技高网...
【技术保护点】
一种搜索结果的生成方法,其特征在于,包括:依据用户输入的查询关键词搜索相应的网页信息;针对各网页信息对应的信息发布者,提取该信息发布者发布的所有网页信息中,比重大于预设阀值的第一指定字段或第二指定字段,将所述第一指定字段的核心词,作为该信息发布者的第一属性对应的属性值,第二指定字段作为第二属性对应的属性值;提取符合预设条件的网页信息作为搜索结果,所述预设条件为,所述网页信息对应的第一属性与所述查询关键词相匹配,或所述网页信息对应的第二属性与所述查询关键词相匹配。
【技术特征摘要】
1.一种搜索结果的生成方法,其特征在于,包括:依据用户输入的查询关键词搜索相应的网页信息;针对各网页信息对应的信息发布者,提取该信息发布者发布的所有网页信息中,比重大于预设阀值的第一指定字段或第二指定字段,将所述第一指定字段的核心词,作为该信息发布者的第一属性对应的属性值,第二指定字段作为第二属性对应的属性值;提取符合预设条件的网页信息作为搜索结果,所述预设条件为,所述网页信息对应的第一属性与所述查询关键词相匹配,或所述网页信息对应的第二属性与所述查询关键词相匹配。2.如权利要求1所述的方法,其特征在于,所述第一属性为主营产品,所述第二属性为主营行业;所述第一指定字段为供应产品词,所述第二指定字段为所属行业。3.如权利要求2所述的方法,其特征在于,所述网页信息为供应信息时,所述网页信息包括供应产品词、所属行业、商品属性、发布者信息,所述发布者信息包括供应商地址、公司名称、主营产品和主营行业。4.如权利要求1所述的方法,其特征在于,在针对各供应信息,统计其供应商的主营产品或主营行业之前,所述方法还包括:过滤与所述查询关键词的相似度小于预设相似度的网页信息。5.如权利要求4所述的方法,其特征在于,所述网页信息与查询关键词的相似度通过以下步骤获取:分别提取各网页信息和查询关键词中的核心产品词;由各核心产品词在不同点击类目中点击率,计算各网页信息与查询关键词的相似度。6.如权利要求1所述的方法,其特征在于,还包括:将所...
【专利技术属性】
技术研发人员:韩小梅,宋超,韦袆,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。