对象级垂直搜索引擎个性化排序算法iRank制造技术

技术编号：6838702 阅读：664 留言：0更新日期：2012-04-11 18:40

对象级垂直搜索引擎个性化排序算法iRank本发明专利技术公开一种对象级垂直搜索引擎的个性化推荐算法iRank，该算法其基本思想是：对垂直领域对象级搜索引擎排序算法和用户行为进行深入细致的研究，通过收集垂直领域的信息构建行业本体库模型，运用数据挖掘领域情感分析和Eyetrack技术(互联网用户在当前页面的停留时间)收集用户行为信息，统计并构建用户趣模型和相似用户模型，最后将基于用户兴趣模型和相似用户模型的个性化推荐算法结合到搜索引擎的排序中。iRank算法可以智能地对对象级搜索引擎语义信息检索结果进行个性化的排序，影响返回对象的排序得分，实现对象集结果上的不同用户间的个性化排序。与传统搜索引擎的排序算法(PageRank，HITS)相比增加搜索引擎对用户兴趣的应变能力，有极大实际应用价值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及对象级垂直搜索引擎领域中个性化搜索结果相关性排序的算法研究。
技术介绍
时代的发展，使得互联网网页规模以人类难以想象的速度爆炸性膨胀，信息过剩、注意力稀缺的主要矛盾进一步深化。传统通用搜索的问题也越来越突出和深化，主要问题是无效信息过多(噪音数据多)、有效信息不足、有效信息非结构化、返回结果无个性化优化机制。下一代搜索引擎的发展趋势是更加智能，其中最重要的分支是对象级垂直搜索。在所垂直的领域，该技术能够为用户提供比通用搜索更多的领域内相关有效信息。在所垂直的领域内，该技术为用户提供的都是经过整理的、结构化的对象信息，从而大大降低无效信息的比例。个性化搜索引擎排序是指在普通搜索引擎相关性排序基础上，根据用户的背景，使用记录和兴趣等调整排序算法，针对不同的用户提供不同的服务。与传统搜索引擎的排序算法(PageRank，HITS)相比，得利对象级垂直搜索引擎个性化排序算法iRank根据用户浏览网页时的行为和用户的特征信息，运用数据挖掘和个性化推荐技术预测用户对信息的需求，智能地对信息检索结果进行个性化的排序，为用户提供个性化的信息服务，增加搜索引擎对用户兴趣的应变能力，有极大市场应用前景。
技术实现思路
本专利技术提出一种对象级垂直搜索引擎的个性化推荐算法iRank，该算法将基于用户兴趣模型和相似用户模型的个性化推荐算法结合到对象级搜索引擎传统的语义排序算法中，影响返回对象的排序得分，实现对象集结果上的不同用户间的个性化排序。具体流程请看附图1。1.本专利技术中定义的一些基本数据结构。Ditem 每个对象化实体，包括餐馆、图书、商场等。2) f...

【技术保护点】
行基于用户相似度模型的个性化推荐排序，包括ｕｓｅｒ－ｉｔｅｍ矩阵和协同过滤个性化推荐器。等子模型。用户兴趣模型：用于构建用户和本体库对象之间喜好兴趣关系，并对语义模型排序结进行基于用户兴趣模型的个性化推荐排序，包括情感分析器和ｅｙｅｔｒａｃｋ分析器。相似用户模型：用于构建结构化用户之间的相似度信息，并对用户兴趣模型排序结果再进１．对象级垂直搜索引擎个性化排序算法ｉＲａｎｋ包括：行业本体库模型：用于构建本行业对象级信息库，包括每个对象的基本结构化信息和对象之间的相似度信息。语义分析模型：用于对输入关键词进行语义级搜索匹配，包括切词、同义词、查找匹配和相关度排序模型

【技术特征摘要】

【专利技术属性】
技术研发人员：倪毅，张惟师，
申请(专利权)人：得利在线信息技术北京有限公司，
类型：发明
国别省市：11

全部详细技术资料下载我是这个专利的主人