本发明专利技术实施例提供了一种排序模型的训练方法和装置,其中的方法包括:根据排序模型,对用户搜索请求对应的搜索结果进行排序,得到对应的搜索排序结果;根据用户针对所述搜索排序结果的点击反馈,确定所述排序模型对应的搜索点击率;根据所述搜索点击率,按照预置的参数更新算法,对所述排序模型的模型参数进行更新。本发明专利技术实施例可以在用户行为偏好发生变化时能够自动调整模型参数以适应用户的点击行为,相对于现有技术需要重新构建数据集,可以提高训练模型参数的效率。
【技术实现步骤摘要】
本专利技术设及网络
,特别是设及一种排序模型的训练方法和装置。
技术介绍
随着互联网应用的发展,捜索处理技术已经成为互联网最主要的应用之一。例如, 捜索引擎可W根据用户输入的关键词捜索得到符合该关键词特征的所有网页,再根据排序 模型对捜索结果进行排序,最后W超级链接的方式向用户展示排序后的捜索结果,用户点 击相应的链接就可W进入相应的网络资源网站,从而找到所需信息。然而,上述捜索到的结 果通常数W百万计,通过排序模型将内容最相关的捜索结果排在前面,因此,如何对排序模 型中的参数进行训练,W优化排序模型,从而得到更加符合用户需求的排序结果,一直是学 术界和工业界的研究热点。 目前,通常采用基于规则的方法或者基于机器学习的方法对排序模型进行训练。 其中,基于规则的方法,即通过线上AB测试,人工调整模型参数,该方法需要耗费大量的人 力、时间来确定模型参数,由于训练成本太高,使得获取的模型参数很难达到最优;此外,在 用户行为发生变化时,需要重新训练模型参数,导致训练模型参数的效率较低。 而基于机器学习的方法,可W不借助于人工调整模型参数,而是自动训练模型参 数,该方法称为LTR(LearningToRank,学习排序)。具体地,LTR通过构建排序数据集,采 用机器学习算法如支持向量机的排序学习算法RankSVM等自动训练模型参数,从而使得模 型参数相对于数据集达到最优。然而,LTR的排序效果严重依赖于数据集的质量,而构建数 据集又是一件耗时耗力的工作,而且在用户行为发生变化时,也需要重新构建数据集,从而 导致训练模型参数的效率较低。【专利技术内容】本专利技术实施例提供一种排序模型的训练方法和装置,用W解决现有技术中训练模 型参数效率较低的问题,W提高训练模型参数的效率。 为了解决上述问题,本专利技术实施例公开了一种排序模型的训练方法,包括: 根据排序模型,对用户捜索请求对应的捜索结果进行排序,得到对应的捜索排序 结果; 根据用户针对所述捜索排序结果的点击反馈,确定所述排序模型对应的捜索点击 率. 根据所述捜索点击率,按照预置的参数更新算法,对所述排序模型的模型参数进 行更新。 优选地,所述根据排序模型,对用户捜索请求对应的捜索结果进行排序,得到对应 的捜索排序结果的步骤,包括: 向具有相同模型和不同参数的多个排序模型中的任意一个,发送来自用户的用户 捜索请求; 接收来自所述排序模型的所述用户捜索请求对应的捜索排序结果。 优选地,所述根据所述捜索点击率,按照预置的参数更新算法,对所述排序模型的 模型参数进行更新的步骤,包括: 根据所述捜索点击率,按照预置的参数更新算法,对所述排序模型的模型参数进 行更新,直到各排序模型对应的捜索点击率达到稳定值。 优选地,所述根据用户针对所述捜索排序结果的点击反馈,确定所述排序模型对 应的捜索点击率的步骤,包括: 收集所述捜索排序结果对应的用户捜索次数和用户点击次数; 根据所述用户点击次数与所述用户捜索次数的比值,确定捜索点击率。 优选地,所述预置的参数更新算法为梯度下降算法; 所述根据所述捜索点击率,按照预置的参数更新算法,对所述排序模型的模型参 数进行更新的步骤,包括: 确定所述各排序模型的初始参数; 确定所述各排序模型对应的捜索点击率; 根据所述各排序模型对应的捜索点击率,按照梯度下降算法更新所述各排序模型 的初始参数,直到所述初始参数达到稳定值。 优选地,所述方法还包括: 根据更新后的排序模型,对用户捜索请求对应的捜索结果进行排序,得到优化后 的捜索排序结果。 依据本专利技术的另一个方面,公开了一种排序模型的训练装置,包括: 排序模块,用于根据排序模型,对用户捜索请求对应的捜索结果进行排序,得到对 应的捜索排序结果; 反馈模块,用于根据用户针对所述捜索排序结果的点击反馈,确定所述排序模型 对应的捜索点击率;及 更新模块,用于根据所述捜索点击率,按照预置的参数更新算法,对所述排序模型 的模型参数进行更新。 优选地,所述排序模块,包括: 请求发送子模块,用于向具有相同模型和不同参数的多个排序模型中的任意一 个,发送来自用户的用户捜索请求; 结果接收子模块,用于接收来自所述排序模型的所述用户捜索请求对应的捜索排 序结果。 优选地,所述更新模块,包括: 更新子模块,用于根据所述捜索点击率,按照预置的参数更新算法,对所述排序模 型的模型参数进行更新,直到各排序模型对应的捜索点击率达到稳定值。 优选地,所述反馈模块,包括: 收集子模块,用于收集所述捜索排序结果对应的用户捜索次数和用户点击次数;计算子模块,用于根据所述用户点击次数与所述用户捜索次数的比值,确定捜索 点击率。 优选地,所述预置的参数更新算法为梯度下降算法; 所述更新模块,包括: 初始化子模块,用于确定所述各排序模型的初始参数; 点击率确定子模块,用于确定所述各排序模型对应的捜索点击率; 迭代更新子模块,用于根据所述各排序模型对应的捜索点击率,按照梯度下降算 法更新所述各排序模型的初始参数,直到所述初始参数达到稳定值。 优选地,所述装置还包括: 优化排序模块,用于根据更新后的排序模型,对用户捜索请求对应的捜索结果进 行排序,得到优化后的捜索排序结果。 本专利技术实施例包括W下优点: W45] 在本专利技术实施例中,根据用户针对捜索排序结果的点击反馈得到排序模型的捜索 点击率,W及根据捜索点击率对排序模型的模型参数进行更新,可W在用户行为偏好发生 变化时能够自动调整模型参数W适应用户的点击行为,相对于现有技术需要重新构建数据 集,可W提高训练模型参数的效率。【附图说明】 图1示出了本专利技术的一种排序模型的训练方法实施例一的步骤流程图; 图2示出了本专利技术的一种排序模型的训练系统的结构示意图; W48]图3示出了本专利技术的一种排序模型的训练方法实施例二的步骤流程图; 图4示出了本专利技术的一种排序模型的训练装置实施例的结构框图。【具体实施方式】 为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本专利技术作进一步详细的说明。 阳0川 实施例一 参照图1,示出了本专利技术的一种排序模型的训练方法实施例一的步骤流程图,具体 可W包括: 步骤101、根据排序模型,对用户捜索请求对应的捜索结果进行排序,得到对应的 捜索排序结果; 本专利技术实施例可适用于为用户提供捜索服务,并且将捜索得到的相关信息展示给 用户的各种应用场景,比如百度、谷歌、雅虎等捜索引擎或者具有捜索功能的其他场景,本 专利技术对于具体的捜索场景不加W限制。为了便于描述,W下均W捜索引擎为例进行说明,其 它应用场景相互参照即可。 在具体应用中,捜索引擎可W获取服务器中与用户捜索请求相应的内容;具体地, 首先可W对用户捜索请求对应的捜索词进行分词,得到多个关键词,然后,通过释放大量的 抓取程序,获取互联网上的网页,并按照网页相关性原理在每一个关键词和所有相关的网 页之间建立一个对应关系,储存在服务器的数据库中。运样,在用户在捜索引擎中输入捜索 词(例如"刘德华主演的电影")进行捜索时,就可W在服务器中捜索找到与关键词"刘德 华"W当前第1页1 2 3 4 本文档来自技高网...
【技术保护点】
一种排序模型的训练方法,其特征在于,包括:根据排序模型,对用户搜索请求对应的搜索结果进行排序,得到对应的搜索排序结果;根据用户针对所述搜索排序结果的点击反馈,确定所述排序模型对应的搜索点击率;根据所述搜索点击率,按照预置的参数更新算法,对所述排序模型的模型参数进行更新。
【技术特征摘要】
【专利技术属性】
技术研发人员:胡军,陈英傑,王天畅,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。