The invention discloses a data filter and push system, including: the score collection module for collecting user data value, and the formation of score matrix; preprocessing module, used to score into preferred relative value, and the formation of relative value preference matrix; similarity measure module; according to priority select user relative value matrix to calculate user similarity; and a push module, according to the preference similarity calculated nearest neighbor set of user goals, and the data will be pushed to the user; pre processing module is respectively connected with the score collection module and similarity metric connection module, similarity measurement module is connected with a push module. Compared with the existing technique, the invention has the beneficial effects that: the invention is the user demand for data filtering and push on, because of the similarity score difference can solve the inconsistency of the habit, which can more accurately find similar users, so that data can be precise push, can efficiently filter the redundant information.
【技术实现步骤摘要】
一种数据过滤和推送系统
本专利技术涉及互联网
,具体涉及一种数据过滤和推送系统。
技术介绍
互联网是人们进行信息共享的一个最有效的工具。而随着网络中的信息爆炸式的增长,让用户开始困惑的己经不是有没有所需要的信息,而是如何能够获取自己真正所需要的信息。为帮助用户获取信息,首先产生了信息获取的研究。它可以让用户根据自己的信急需求,方便地找到在信息内容上与之匹配的网络资源,例如数据库的网络检索系统、网络目录、网络搜索引擎等。目前,最主要的表达形式就是关键字、词所构成的查询式。这种简单而有效的信息获取方式曾经一度给用户带来了极大便利,众多门户网站的兴起就是这种应用的典型代表。但随着网络信息内容的极度膨胀,这种方式的弊端也日益显现一方面,基于关键词的检索方式难以满足用户不同层次的查询需求,用户往往陷入无法用合适的关键词表达自己需求的尴尬境地之中另一方面,随着网络信息资源的日益膨胀,检索结果中存在越来越多的非相关信息,使得信息获取的精度不足。虽然优秀搜索引擎提供了大量的信息资源,但由于网上信息极度庞杂,用户面对查到的少则几百条多则上万条甚至更多的“信息”导航,要确定哪个网址符合要求就很困难。在带宽和用户时间都有限的情况下,必然导致用户查找信息犹如大海捞针。特别是对于那些迫切需要查找信息的行业专业人士来说,找到一种能够在信息海洋中自动获取实用、准确、精炼和优质信息的方法就显得十分必要。鉴于上述缺陷,本专利技术创作者经过长时间的研究和实践终于获得了本专利技术。
技术实现思路
为解决上述技术缺陷,本专利技术采用的技术方案在于,提供一种一种数据过滤和推送系统,其特征在于,其 ...
【技术保护点】
一种数据过滤和推送系统,其特征在于,其包括:一评分收集模块,用于收集用户对数据的评分值,并形成评分值矩阵;一预处理模块,用于将评分值转化为优先选择相对值,并形成优先选择相对值矩阵;一相似性度量模块;用于根据多用户的优先选择相对值矩阵计算出用户的偏好相似度;以及一推送模块,用于根据偏好相似度计算出用户目标的最近邻集合,并将数据推送至用户;所述预处理模块分别与所述评分收集模块和相似性度量模块连接,所述相似性度量模块还与所述推送模块连接。
【技术特征摘要】
1.一种数据过滤和推送系统,其特征在于,其包括:一评分收集模块,用于收集用户对数据的评分值,并形成评分值矩阵;一预处理模块,用于将评分值转化为优先选择相对值,并形成优先选择相对值矩阵;一相似性度量模块;用于根据多用户的优先选择相对值矩阵计算出用户的偏好相似度;以及一推送模块,用于根据偏好相似度计算出用户目标的最近邻集合,并将数据推送至用户;所述预处理模块分别与所述评分收集模块和相似性度量模块连接,所述相似性度量模块还与所述推送模块连接。2.如权利要求1所述的数据过滤和推送系统,其特征在于,所述评分收集模块用于计算用户的优先选择相对值的公式如下:M(R)=X(R)+Y(R)/2其中,M(R)代表了用户对评分为R的项目的优先选择程度,X(R)表示评分小于R的项目数所占评分过的项目数的比例,Y(R)表示评分等于R的项目数占用户所评分过的项目数的比例。3.如权利要求2所述的数据过滤和推送系统,其特征在于,所述相似性度量模块用于计算用户之间的相似性计算公式如下:其中,表示用户a和用户b之间的相似性,Ma,c表示...
【专利技术属性】
技术研发人员:龚邦松,杨仕龙,
申请(专利权)人:宁波高新区甬港现代创业服务有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。