基于用户偏好的物联网数据的推荐方法技术

技术编号:32644131 阅读:15 留言:0更新日期:2022-03-12 18:22
本发明专利技术涉及基于用户偏好的物联网数据的推荐方法,包括步骤:S1:构建用户注册个人信息的兴趣度模型,分析用户注册信息;S2:分别根据点击次数、浏览时间、保存与否进行分析用户偏好信息,并构建数据类型模型进行权重和操作行为兴趣度分析,从而获得用户偏好信息;S3:分析邻近用户对同一项目的兴趣度,并判断邻近用户的偏好信息的相似度;S4:根据检索项目信息分析用户检索项目相似性,从而根据用户偏好给出检索结果。该方法引入协同过滤推荐算法的思想,通过对用户注册信息和检索操作行为的分析来计算用户的偏好信息;综合用户、检索项目间相似性,使检索系统根据某个用户的邻近用户,为其提供相似性较高的推荐结果作为检索反馈结果。结果。结果。

【技术实现步骤摘要】
基于用户偏好的物联网数据的推荐方法


[0001]本专利技术涉及物联网大数据
,尤其涉及一种基于用户偏好的物联网数据的推荐方法。

技术介绍

[0002]物联网是将各式各样的传感器设备和信息相关技术充分地嵌入到电力、工业、农业、家居、交通、物流等各行各业的基础设施当中的新一代的异构融合网络。在这个异构网络融合的物联网中,存在着具有超强计算、处理和控制能力的计算机集群,人类以更加精确和动态的方式,对存在于物联网中的所有用户、物体、设施实行及时的经营、掌管和协调。
[0003]随着物联网应用规模的扩大,传感器设备涉及世界上任何物体,几乎所有物体都可以连接到物联网环境中,所以物联网数据量必将呈几何级数增长。物联网海量数据使用户共享资源更加丰富,同时也使用户检索成为一个严峻的专业问题,面对如此庞大的数据量并不具备足够充分的承载能力,不能使用户迅速便捷的找到自己所需的资源,这就亟需我们对现有的检索服务进行改进、提高其承载能力。
[0004]随着物联网技术的发展,异构网络融合的影响,为了实现物联网中海量异构数据灵活安全,快速便捷的资源共享,从这些规模庞大的异构信息中筛选出用户所需的信息的同时,又确保异构数据的独立性,用户需要对嵌入到物联网中的传感器设备所采集到的海量异构数据进行统一的管理和有效的检索。

技术实现思路

[0005]本专利技术提供一种基于用户偏好的物联网数据的推荐方法,能够在海量的物联网异构数据中,根据用户的偏好,筛选出用户可能感兴趣的资源。
[0006]为解决上述问题,本专利技术采用的技术方案为:该基于用户偏好的物联网数据的推荐方法,包括以下步骤:
[0007]S1:构建用户注册个人信息的兴趣度模型,分析用户注册信息;
[0008]S2:分别根据点击次数、浏览时间、保存与否进行分析用户偏好信息,并构建数据类型模型进行权重和操作行为兴趣度分析,从而获得用户偏好信息;
[0009]S3:分析邻近用户对同一项目的兴趣度,并判断邻近用户的偏好信息的相似度;
[0010]S4:根据检索项目信息分析用户检索项目相似性,结合用户偏号,获得检索结果。
[0011]采用上述技术方案,为了使用户在物联网海量异构数据中找到满足自己需求和感兴趣的资源,引入协同过滤推荐算法的思想,使用户对检索项目进行评分;通过对用户注册个人信息和检索操作行为的分析来计算用户的偏好信息;该技术方案充分考虑用户、检索项目间相似性,将用户和检索项目看成一个协同作用的检索网络,使检索系统可以根据某个用户的邻近用户,为该用户提供相似性较高的推荐结果作为检索反馈结果。
[0012]作为本专利技术的优选技术方案,所述步骤S1的具体步骤为:
[0013]S11:利用向量空间模型表示法构建用户注册个人信息的兴趣度模型;
[0014]S12:采用TFIDF词频算法进行词条权重分析。
[0015]作为本专利技术的优选技术方案,所述步骤S11的具体步骤为:
[0016]S111:利用向量空间模型表示法(VectorSpaceModel)定义用户注册个人信息的兴趣度模型(UserInterestModel,UIM),用UIM=(K,W)表示;其中,K表示用户注册信息关键词,W表示注册信息对应的权重值;
[0017]当检索客户端进行注册时,根据用户提供的个人信息(包括用户年龄、用户性别、职业、喜好等),UIM一定程度上反映了用户真实兴趣度,UIM表示为:
[0018]UIM={年龄,性别,职业,兴趣1,兴趣2,兴趣3,

};
[0019]S112:根据向量空间表示法,将用户注册信息表示成一个n维特征向量
[0020]Hobby:Hobby={(k1,w1),(k2,w2),(k3,w3),(k4,w4)}(1);
[0021]其中k1,k2,k3,k4分别表示用户年龄、用户性别、用户职业、用户爱好,W1,W2,W3,W4分别表示每一部分特征的权重值,其中用户年龄为1,用户性别为1,用户职业为0.8,用户爱好为0.5,每一维分量由注册信息关键词及其权重值构成,所述权重值表示用户注册信息在某个概念兴趣中的重要程度;若某一特征项,用户未给出个人信息时,则该项权重值设置为0。
[0022]作为本专利技术的优选技术方案,所述步骤S12具体包括:
[0023]S121:采用TFIDF词频算法的公式为:
[0024][0025]其中,W
ii
表示词条t
i
在文档d
i
中出现的频率,idf
i
是逆文档频率;
[0026]当采用TFIDF算法对网页源代码标记进行重要程度统计时,其中TF_K表示关键字词频向量,即:
[0027]TF_K=(tf_k1,tf_k2,tf_k3,...,tf_k
n
)(3);
[0028]S122:根据向量权重的计算得出词频兴趣度;再根据公式(4)获得注册信息兴趣度RI,公式为:RI=Hobby=TF_K(4)。
[0029]作为本专利技术的优选技术方案,所述步骤S2的具体步骤为:
[0030]S21:从第一次检索开始,用户检索到某个检索项目时,对其点击次数表示为:
[0031][0032]其中,f
ij
为用户i点击某个检索项目j的次数,为点击同类型检索项目的总次数;
[0033]S22:从第一次检索开始,用户i浏览某个检索项目j的时间长短表示为:
[0034][0035]其中,t
ij
为用户浏览某个检索项目j的时长,为浏览同类型检索项目的总时长;
[0036]S23:分析用户对某个检索项目是否保存,设定S=2记录保存;S=1记录不保存,结合用户检索项目的操作行为,计算操作行为兴趣度OIT;公式为:
[0037]OIT=y1×
f+y2×
t+y3×
S(7);
[0038]其中,y
k
(1≤k≤n)表示各操作行为的权重,取值为权重值y
k
=0.33;
[0039]S24:定义数据类型模型TypeM,将TFIDF词频算法引入到检索项目数据类型的权重计算中,对用户更喜好的数据类型进行分析(对用户更喜好的数据类型加以衡量);公式为:
[0040]TypeM=<ty
j
,tyw
j
>(8);
[0041]其中:ty
j
表示被检索项目的数据类型,tyw
j
检索项目j在全部数据类型中的权重值;从而得到考虑检索项目类型的操作行为兴趣度OI:
[0042]OI=OIT
×
TypeM(9);
[0043]S25:一次检索结束后,根据用户对检索系统反馈的检索结果进行统计,即对应的检索项目进行满意程度的评分,这个过程中,用户只本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户偏好的物联网数据的推荐方法,其特征在于,包括以下步骤:S1:构建用户注册个人信息的兴趣度模型,分析用户注册信息;S2:分别根据点击次数、浏览时间、保存与否进行分析用户偏好信息,并构建数据类型模型进行权重和操作行为兴趣度分析,从而获得用户偏好信息;S3:分析邻近用户对同一项目的兴趣度,并判断邻近用户的偏好信息的相似度;S4:根据检索项目信息分析用户检索项目相似性,结合用户偏号,获得检索结果。2.根据权利要求1所述的基于用户偏好的物联网数据的推荐方法,其特征在于,所述步骤S1的具体步骤为:S11:利用向量空间模型表示法构建用户注册个人信息的兴趣度模型;S12:采用TFIDF词频算法进行词条权重分析。3.根据权利要求2所述的基于用户偏好的物联网数据的推荐方法,其特征在于,所述步骤S11的具体步骤为:S111:利用向量空间模型表示法定义用户注册个人信息的兴趣度模型UIM,表示为UIM=(K,W);其中,K表示用户注册信息关键词,W表示注册信息对应的权重值;当检索客户端进行注册时,根据用户提供的个人信息,UIM表示为:UIM={年龄,性别,职业,兴趣1,兴趣2,兴趣3,

};S112:根据向量空间表示法,将用户注册信息表示成一个n维特征向量Hobby:Hobby={(k1,w1),(k2,w2),(k3,w3),(k4,w4)}(1);其中k1,k2,k3,k4分别表示用户年龄、用户性别、用户职业、用户爱好,W1,W2,W3,W4分别表示每一部分特征的权重值。4.根据权利要求3所述的基于用户偏好的物联网数据的推荐方法,其特征在于,所述步骤S12具体包括:S121:TFIDF词频算法公式为:其中,W
ii
表示词条t
i
在文档d
i
中出现的频率,idf
i
是逆文档频率;当采用TFIDF算法对网页源代码标记进行重要程度统计时,其中TF_K表示关键字词频向量,即:TF_K=(tf_k1,tf_k2,tf_k3,...,tf_k
n
)(3);S122:根据向量权重的计算得出词频兴趣度;再根据公式(4)获得注册信息兴趣度RI,公式为:RI=HObby
×
TF_K(4)。5.根据权利要求1所述的基于用户偏好的物联网数据的推荐方法,其特征在于,所述步骤S2的具体步骤为:S21:从第一次检索开始,用户检索到某个检索项目时,对其点击次数表示为:其中,f
ij
为用户i点击某个检索项目j的次数,为点击同类型检索项目的总次数;
S22:从第一次检索开始,用户i浏览某个检索项目j的时间长短表示为:其中,t
ij
为用户浏览某个检索项目j的时长,为浏览同类型检索项目的总时长;S23:分析用户对某个检索项目是否保存,设定S=2记录保存;S=1记录不保存,结合用户检索项目的操作行为,计算操作行为兴趣度OIT;公式为:OIT=y1×
f+y2×
t+y3×
S(7);其中,y
k
(1≤k≤n)表示各操作行为的权重;S24:定义数据类型模型TypeM,将TFIDF词频算法引入到检索项目数据类型的权重计算中,对用户更喜好的数据类型进行分析;公式为:TypeM=<ty
j
,tyw
j
)(8);其中:ty
j
表示被检索项目的数据类型,tyw
j
检索项目j在全部数据类型中的权重值;从而得到考虑检索项目类型的操作行为兴趣度OI:OI=OIT
×...

【专利技术属性】
技术研发人员:陈大龙文超凡孟维
申请(专利权)人:南京华苏科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1