搜索结果排序方法、装置、设备及介质制造方法及图纸

技术编号：35577635 阅读：12 留言：0更新日期：2022-11-12 16:03

本发明专利技术涉及智能决策技术领域，公开了一种搜索结果排序方法、装置、设备及介质，包括：接收用户终端发送的搜索请求，并确定对应搜索对象；获取当前用户的第一初始画像特征、当前用户点击搜索对象的行为特征，以及所有搜索对象的第二初始画像特征；将第一初始画像特征和第二初始画像特征中的连续型变量转换为分散型变量，分别得到第一目标画像特征和第二目标画像特征；基于第一目标画像特征、行为特征、第二目标画像特征及当前搜索对象特征，通过训练好的搜索预测模型计算各搜索对象的点击概率；按照点击概率由高到低排序，并选取排序靠前的指定数目个搜索对象作为搜索结果。能够对搜索对象的点击率进行准确计算，具有良好的搜索结果预测能力。预测能力。预测能力。

全部详细技术资料下载

【技术实现步骤摘要】
搜索结果排序方法、装置、设备及介质

[0001]本专利技术涉及智能决策
，尤其涉及一种搜索结果排序方法、装置、设备及介质。

技术介绍

[0002]随着网络技术的发展，越来越多的人在采用网上问诊的方式进行寻医问药。所以，很多关于健康、医疗方面的应用程序、app和小程序等便应运而生，如平安银行应用app上的健康医疗项目。而这些应用是否好用，能否真正帮助有问诊需要的人，则很大程度上决定于相应app平台是否能够推荐合适的医生。
[0003]现有技术中，当用户搜索医生问诊时，相应app平台通常按照医生的点击率进行排序，然后将排序最靠前的数位医生进行推荐展示。但是，现有的对医生的搜索排序方案均存在特征交叉能力和特征部署性能不得兼顾的缺点，不能对用户想要咨询的医生进行很好的预测，以致于推荐的医生不甚合适，无法满足用户需求等。

技术实现思路

[0004]本专利技术提供一种搜索结果排序方法、装置、计算机设备及介质，能够对搜索对象的点击率进行准确计算，具有良好的搜索结果预测能力。
[0005]第一方面，提供了一种搜索结果排序方法，包括：
[0006]接收用户终端发送的搜索请求，并确定所述搜索请求对应的搜索对象；
[0007]获取当前用户的第一初始画像特征、所述当前用户点击所述搜索对象的行为特征，以及所有所述搜索对象的第二初始画像特征；
[0008]将所述第一初始画像特征中和所述第二初始画像特征中的连续型变量，均转换为分散型变量，分别得到第一目标画像特征和第二目标画像特征；r/>[0009]基于所述第一目标画像特征、所述行为特征、所述第二目标画像特征及当前搜索对象特征，通过训练好的搜索预测模型计算各所述搜索对象的点击概率；
[0010]按照所述点击概率由高到低排序，并选取排序靠前的指定数目个搜索对象作为搜索结果。
[0011]第二方面，提供了一种搜索结果排序装置，包括：
[0012]请求接收模块，用于接收用户终端发送的搜索请求，并确定所述搜索请求对应的搜索对象；
[0013]数据获取模块，用于获取当前用户的第一初始画像特征、所述当前用户点击所述搜索对象的行为特征，以及所有所述搜索对象的第二初始画像特征；
[0014]变量转化模块，用于将所述第一初始画像特征中和所述第二初始画像特征中的连续型变量，均转换为分散型变量，分别得到第一目标画像特征和第二目标画像特征；
[0015]点击率计算模块，用于基于所述第一目标画像特征、所述行为特征、所述第二目标画像特征及当前搜索对象特征，通过训练好的搜索预测模型计算各所述搜索对象的点击概
率；
[0016]结果确定模块，用于按照所述点击概率由高到低排序，并选取排序靠前的指定数目个搜索对象作为搜索结果。
[0017]第三方面，提供了一种计算机设备，包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述搜索结果排序方法的步骤。
[0018]第四方面，提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现上述搜索结果排序方法的步骤。
[0019]上述搜索结果排序方法、装置、计算机设备及存储介质所实现的方案中，可以通过用户终端接收用户的搜索请求，并确定搜索请求对应的搜索对象；然后获取当前用户的第一初始画像特征、当前用户点击搜索对象的行为特征，以及所有搜索对象的第二初始画像特征；并将第一初始画像特征中和第二初始画像特征中的连续型变量，均转换为分散型变量，分别得到第一目标画像特征和第二目标画像特征；然后基于第一目标画像特征、行为特征、第二目标画像特征及当前搜索对象特征，通过训练好的搜索预测模型计算各搜索对象的点击概率；并按照点击概率由高到低排序，选取排序靠前的指定数目个搜索对象作为搜索结果，最后可将搜索结果通过用户终端展示给用户。如此，在获取当前用户的第一初始画像特征、当前用户点击搜索对象的行为特征，以及所有搜索对象的第二初始画像特征之后，先将第一初始画像特征中和第二初始画像特征中的连续型变量，均转换为分散型变量，可以提高特征的交叉性能，从而减少了模型学习难度，避免模型学习过程中出现过拟合现象，继而有效提升了搜索预测模型的预测能力，使得该搜索预测模型的预测结果更加准确，能够向用户终端提供更适合当前用户的搜索对象，提升用户体验效果。
附图说明
[0020]为了更清楚地说明本专利技术实施例的技术方案，下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本专利技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
[0021]图1是本专利技术一实施例中搜索结果排序方法的一应用环境示意图；
[0022]图2是本专利技术一实施例中搜索结果排序方法的一流程示意图；
[0023]图3是本专利技术一实施例中一种搜索预测模型的结构示意图；
[0024]图4是本专利技术一实施例中搜索结果排序装置的一结构示意图；
[0025]图5是本专利技术一实施例中计算机设备的一结构示意图；
[0026]图6是本专利技术一实施例中计算机设备的另一结构示意图。
具体实施方式
[0027]下面将结合本专利技术实施例中的附图，对本专利技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本专利技术一部分实施例，而不是全部的实施例。基于本专利技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本专利技术保护的范围。
[0028]专利技术人研究发现，目前业内主流的搜索排序模型主要包括三个流派，一种是基于少量特征的传统的逻辑回归(LR)模型，一种是基于数百个特征的机器学习树模型或者树模型的衍生，例如：GBDT(Gradient Boosting Decision Tree，梯度提升决策树)，XGBOOST(eXtreme Gradient Boosting，极限梯度提升)，LightGBM(light Gradient Boosting Machine，轻量的梯度提升机)，CatBoost(Catgorical+Boost，)等。还有一种是基于大量稀疏特征的Embedding+MLP深度学习模型架构。但是，上述三种方案仍有如下缺点，以致于推荐的医生不甚合适，无法满足用户需求。
[0029]1)逻辑回归(LR)模型易于开发和部署，但是特征交叉能力差，没法表达高纬特征；
[0030]2)树模型特征交叉能力强，但是部署性能差，而且对于稀疏的类别型变量没法很好的进行编码表达；
[0031]3)Embedding+MLP的深度学习流派可以对稀疏的类别型变量进行编码，但是对大量的数值型连续变量的交叉能力较弱，只依靠MLP全连接层甚至难以超过传统的树模型。
[0032]基于上述发现，本专利技术实施例提供了一种搜索结果排序方法，可应用在如图1的应用环境中，其中，用户终端可以但不限于是各本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种搜索结果排序方法，其特征在于，包括：接收用户终端发送的搜索请求，并确定所述搜索请求对应的搜索对象；获取当前用户的第一初始画像特征、所述当前用户点击所述搜索对象的行为特征，以及所有所述搜索对象的第二初始画像特征；将所述第一初始画像特征中和所述第二初始画像特征中的连续型变量，均转换为分散型变量，分别得到第一目标画像特征和第二目标画像特征；基于所述第一目标画像特征、所述行为特征、所述第二目标画像特征及当前搜索对象特征，通过训练好的搜索预测模型计算各所述搜索对象的点击概率；按照所述点击概率由高到低排序，并选取排序靠前的指定数目个搜索对象作为搜索结果。2.如权利要求1所述的搜索结果排序方法，其特征在于，所述搜索预测模型为深度兴趣网络模型，包括离散化层和FM层；将所述第一初始画像特征中和所述第二初始画像特征中的连续型变量，均转换为分散型变量，分别得到第一目标画像特征和第二目标画像特征，包括：通过所述离散化层将所述第一初始画像特征中连续型变量转换为第一分散型变量，将所述第二初始画像特征中的连续型变量转换为第二分散型变量；通过所述FM层分别对所述第一分散型变量和所述第二分散型变量进行交叉，得到所述第一目标画像特征和所述第二目标画像特征。3.如权利要求2所述的搜索结果排序方法，其特征在于，通过所述离散化层将所述第一初始画像特征中连续型变量转换为第一分散型变量，将所述第二初始画像特征中的连续型变量转换为第二分散型变量，包括：通过所述离散化层对所述第一初始画像特征中连续型变量进行WOE分箱，并对分箱后的变量进行嵌入式编码，生成第一分散型变量；通过所述离散化层对所述第二初始画像特征中连续型变量进行WOE分箱，并对分箱后的变量进行嵌入式编码，生成第二分散型变量。4.如权利要求3所述的搜索结果排序方法，其特征在于，所述搜索预测模型还包括注意力层和稠密层；所述基于所述第一目标画像特征、所述行为特征、所述第二目标画像特征及所述当前搜索对象特征，通过训练好的搜索预测模型计算各所述搜索对象的点击概率，包括：通过所述注意力层对所述行为特征和所述当前搜索对象特征进行处理，降低数据维度，提取有效特征数据；基于所述第一目标画像特征、所述第二目标画像特征及所述有效特征数据，通过所述稠密层计算各所述搜索对象的点击概率。5.如权利要求1所述的搜索结果排序方法，其特征在于，所述搜索对象包括医生；所述当前搜索对象特征包括当前医生的ID信息、所属科室的ID信息、所属医院的ID信息；所述获取当前用户的第一初始画像特征、所述当前用户点击所述搜索对象的行为特征，以及所有所...

【专利技术属性】
技术研发人员：薛忠源，
申请(专利权)人：康键信息技术深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人