【技术实现步骤摘要】
本申请涉及数据搜索领域,更具体地涉及一种数据搜索处理方法及系统。
技术介绍
随着互联网基础设施不断完善和计算机网络技术的不断普及,在线网络搜索各类特定的数据信息逐渐成为普通网民最常用的一种方式。当数据量非常庞大时,用户可以在搜索引擎的用户界面上点击选择类目、或输入搜索查询词等,由搜索引擎迅速找到自己想要的数据对象。在搜索引擎的用户界面上,用户输入关键词或者选择类目,搜索引擎会返回搜索到的包含一个或多个数据对象(搜索结果)的展示列表。通常,每个数据对象的展示信息中可以包括数据对象的一个或多个属性及其属性值以及其他参数等信息。当搜索引擎搜索到数据对象后,可以依据数据对象的各个属性及属性值,对数据对象进行排序和展示。例如:数据对象可以包括身份标识ID、图片、描述、标号等属性,以及及对应的内容,即属性值,如:ID的具体编号、具体的图片内容、描述的具体内容和字数、标号大小等。由此,搜索引擎可以根据图片多少、描述字数多少或者标号大小等对数据对象进行排序,并展示数据对象的图片、描述、标号。通常,在展示出来的数据对象一个或多个属性的属性值中,往往有一个或几个属性对用户的下一步的操作处理影响较大。比如,在期末考试成绩搜索引擎中,用户会对搜索到的某个学生的总成绩这一属性更关注。又比如,在商品搜索引擎中,用户往往会对搜索得到某个商品对象的价格给予较多的关注。当用户通过商品搜索引擎搜索得到商品对象的价格高低(属性值)超出 ...
【技术保护点】
一种数据搜索处理方法,其特征在于,包括:接收当前用户发出的搜索请求以获取所述搜索请求中包含的查询词;统计所述查询词对应的搜索结果中的数据对象上发生的历史操作信息;选取所述数据对象的一项属性作为指定属性,生成所述查询词对应的历史操作信息涉及的数据对象在所述指定属性上的属性值的概率分布模型;利用所述概率分布模型,计算当前用户发出的搜索请求对应的搜索结果中的每一数据对象在指定属性上的属性值对应的概率;使用所述概率调整搜索结果中的数据对象的输出排序。
【技术特征摘要】
1.一种数据搜索处理方法,其特征在于,包括:
接收当前用户发出的搜索请求以获取所述搜索请求中包含的查询词;
统计所述查询词对应的搜索结果中的数据对象上发生的历史操作信息;
选取所述数据对象的一项属性作为指定属性,生成所述查询词对应的历
史操作信息涉及的数据对象在所述指定属性上的属性值的概率分布模型;
利用所述概率分布模型,计算当前用户发出的搜索请求对应的搜索结果
中的每一数据对象在指定属性上的属性值对应的概率;
使用所述概率调整搜索结果中的数据对象的输出排序。
2.根据权利要求1所述的方法,其特征在于,选取所述数据对象的一
项属性作为指定属性,生成所述查询词对应的历史操作信息涉及的数据对象
在所述指定属性上的属性值的概率分布模型,包括:
周期性地对收集的所述历史操作信息,进行预处理,确定历史操作信息
中的查询词以及对应的数据对象的指定属性上的属性值,并形成查询词与该
查询词相应的历史操作信息涉及的数据对象在该指定属性上的属性值的预定
格式记录;
根据预定格式记录中的属性值,利用概率分布模型拟合算法,生成与预
定格式记录中的属性值概率分布模型,并以键值对方式存储该查询词和所述
概率分布模型的对应关系。
3.根据权利要求1-2之一所述的方法,其特征在于,使用所述概率调整
搜索结果中的数据对象的输出排序,包括:
以每个数据对象的所述概率作为排序逻辑的分值计算中的特征值,计算
每个数据对象的排序分值,将搜索结果中的数据对象按照排序分值所指示的
先后次序,显示输出到当前发出搜索请求的用户。
4.根据权利要求1所述的方法,其特征在于,所述历史操作信息包括
用户操作涉及的数据对象对应的查询词及该数据对象在指定属性上的属性值。
5.根据权利要求4所述的方法,其特征在于,所述概率分布模型为双
高斯概率模型,所述生成所述查询词对应的历史操作信息涉及的数据对象在
所述指定属性上的属性值的概率分布模型包括:利用所述查询词对应的历史
操作信息对所述概率分布模型进行拟合,确定所述概率分布模型的模型参数。
6.一种数据搜索处理系统,其特征在于,包括:搜索前端、日志收集
器、数据分析平台、数据存储系统、搜索引擎;其中,
搜索前端接收当前用户发出的搜索请求以获取所述搜索请求中包含的
查询词,并转发当前用户发出的搜索请求给查询分析器;
日志收集器,收集用户在查询词对应的搜索结果中的数据对象上的历史
操作信息,;
数据分析平台,以数据对象的一项属性作为指定属性,利用存储的...
【专利技术属性】
技术研发人员:王勇,陈曦,林建国,唐海红,曾安祥,曾晓一,潘春香,王义,王波,顾洋,徐盈辉,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。