System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及智能匹配算法,具体而言,涉及一种基于关联规则挖掘算法的智能匹配方法和系统。
技术介绍
1、随着网络技术的发展和普及,越来越多的人选择通过网购来获取信息和购买电子产品;网络上提供了丰富的产品信息、用户评价和比较功能,使消费者可以在家中或任何地方便利地了解电子产品的功能特点,并作出购买决策,这种便利性和信息的即时性,显著地促进了人们对电子产品的网购行为;
2、目前电子产品的市场变化比较快,大量的电子产品更新换代,导致用户需要花更多的时间和精力才能找到特定的电子产品,这无疑降低用户的使用体验;
3、为了解决上述缺陷,现提供一种基于关联规则挖掘算法的智能匹配方法。
技术实现思路
1、根据本申请的一个方面,提供了一种基于关联规则挖掘算法的智能匹配方法,该方法包括以下步骤:
2、r1:采集用户数据;此外,还通过接收到的关联标签对更新的电子产品进行更新分析以判断是否需要进行关联标签的电子产品更新,并生成采集指令;
3、r2:关联挖掘模块通过对用户数据进行关联规则挖掘以得到用户的关联标签以及关联标签对应的偏好评估指数,并将其发送至r1和r3;
4、r3:通过将用户输入的检索词与用户的关联标签进行综合分析以得到匹配值,依据匹配值对用户进行电子产品推送;具体匹配步骤为:
5、步骤一:当接收到用户输入的检索词时,利用自然语言处理技术提取检索词的关键词,再利用tf-idf算法计算关键词与数据库内所有电子产品的标签、特征词和产
6、步骤二:调取用户对应的各关联标签以及各关联标签对应的偏好评估指数,任取其中一个初选产品,将初选产品与用户的关联标签进行比对,当初选产品对应的标签全部属于关联标签时,则统计初选产品对应的标签总数,并将其记为全重叠标签数量q1,将全重叠标签对应的偏好评估指数进行均值计算得到全重叠值记为ah1;当初选产品对应的标签部分与关联标签相同时,则统计初选产品对应的标签总数记为q2以及其与关联标签相同的标签数量,并将其记半重叠标签数量q3,将半重叠标签对应的偏好评估指数进行均值计算得到半重叠值记为ah2;当初选产品对应的标签全部不属于关联标签时,则统计初选产品对应的标签总数,并将其记为孤岛标签数量q4;利用设定公式
7、进行计算得到初选产品与用户的关联标签之间的关联值qr,其中分别为r1、r2、r3分别为设定的比例系数;
8、步骤三:将初选产品的重要分数zf和关联值qr代入设定的公式zq=r4×zf+r5×qr进行计算得到初选产品的匹配值zq,其中r4、r5分别为设定的比例系数;将各初选产品按照其对应的匹配值进行先后排序得到推荐列表,依据推荐列表发送至用户端。
9、可选的,采集指令的生成过程具体为:
10、于更新的电子产品中选取存在关联标签的电子产品记为关联产品,并分别统计各关联产品的标签中存在关联标签的数量记为ni,其中i=1,2,3……i,i取值为正整数,i表示的是关联产品的总数量,i表示的是其中任意一个关联产品的序号;分别计算每个关联产品对应的标签总数记为bi;将ni和bi代入设定的公式进行计算得到关联产品的相关值nbi,其中a1、a2分别为设定的比例系数;
11、将关联产品的相关值与设定的相关区间进行比较分析得到关联产品累计值,当关联产品累计值大于设定的累计阈值时,则生成采集指令,并控制采集各关联标签下的电子产品以及其对应的产品数据,其中产品数据包括电子产品所涉及的标签、各标签下所涉及的特征词和产品介绍。
12、可选的,关联产品累计值的计算过程为:
13、将关联产品的相关值与设定的相关区间进行比较分析以将相关值对应的关联产品分为高度相关、中度相关和低度相关,分别统计高度相关、中度相关和低度相关的累计次数,并将其分别记为g1、g2、g3;将高度相关、中度相关和低度相关对应的相关值分别进行求和计算得到高度相关值、中度相关值和低度相关值,并将其分别记为g4、g5、g6;
14、将g1、g2、g3、g4、g5、g6代入设定的公式
15、进行计算得到关联产品累计值ga,其中b1、b2、b3、a3、a4、a5分别为设定的比例系数,且a3>a4>a5>0。
16、可选的,对用户数据进行关联规则挖掘的具体步骤为:
17、401:获取用户数据,其中数据包括用户浏览次数以及每次浏览对应的浏览开始时刻、浏览结束时刻以及电子产品对应的标签和特征词;
18、402:将浏览的电子产品按照其对应的标签进行分类以得到若干个浏览标签、各浏览标签下的电子产品以及各电子产品的浏览开始时刻和浏览结束时刻;并据此进行特征词重叠分析得到特征词集中值;
19、403:将浏览标签下的各电子产品的浏览开始时刻和浏览结束时刻进行时间差值计算得到浏览时长,并据此进行浏览集中度分析得到浏览集中值;
20、404:提取各浏览标签下的各电子产品的浏览开始时刻和浏览结束时刻,并将其在时间横轴上标注得到时间留痕图,并据此进行浏览频度分析得到浏览频度值;
21、405:将浏览标签的特征词集中值ad、浏览集中值ld和浏览频度值hd通过设定的公式ah=f1×ad+f2×ld+f3×hd进行计算得到偏好评估指数ah,其中f1、f2、f3分别为设定的比例系数;由此可得各浏览标签对应的偏好评估指数,当偏好评估指数大于设定的偏好阈值时,则将偏好评估指数对应的浏览标签记为关联标签;由此可得用户的关联标签以及关联标签对应的偏好评估指数,并将其分别发送至智能匹配模块和数据库。
22、可选的,特征词重叠分析的具体过程为:
23、任选其中一个浏览标签以及其对应的若干个电子产品,提取若干个电子产品的浏览标签对应的特征词,当存在两个浏览标签下的特征词重叠时,则该特征词对应的重叠次数增加一次,由此可得各特征词的重叠次数记为aj,其中j=1,2,3……j,j取值为正整数,j表示的是不同特征词的总数量,j表示的是其中任意一个特征词的序号;利用设定的公式进行计算得到特征词集中值ad,其中d1、d2分别为设定的比例系数,为各特征词的重叠次数均值。
24、可选的,浏览集中度分析的具体过程为:
25、将浏览标签下的各电子产品的浏览开始时刻和浏览结束时刻进行时间差值计算得到浏览时长,并将其与设定的时长区间进行比较分析以将浏览时长对应的浏览标签分为高集中浏览、中集中浏览和低集中浏览,分别统计高集中浏览、中集中浏览和低集中浏览的累计次数,并将其分别记为l1、l2、l3;将高集中浏览、中集中浏览和低集中浏览对应的浏览时长分别进行求和计算得到高集中值、中集中值和低集中值,并将其分别记为l4、l5、l6;
26、将l1、l2、l3、l4、l5、l6代入设本文档来自技高网...
【技术保护点】
1.一种基于关联规则挖掘算法的智能匹配方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于关联规则挖掘算法的智能匹配方法,其特征在于,采集指令的生成过程具体为:
3.根据权利要求2所述的一种基于关联规则挖掘算法的智能匹配方法,其特征在于,关联产品累计值的计算过程为:
4.根据权利要求1所述的一种基于关联规则挖掘算法的智能匹配方法,其特征在于,对用户数据进行关联规则挖掘的具体步骤为:
5.根据权利要求4所述的一种基于关联规则挖掘算法的智能匹配方法,其特征在于,特征词重叠分析的具体过程为:
6.根据权利要求5所述的一种基于关联规则挖掘算法的智能匹配方法,其特征在于,浏览集中度分析的具体过程为:
7.根据权利要求6所述的一种基于关联规则挖掘算法的智能匹配方法,其特征在于,浏览频度分析的具体过程为:
8.一种基于关联规则挖掘算法的智能匹配系统,其特征在于应用于如权利要求1-7中任一项所述的一种基于关联规则挖掘算法的智能匹配方法,该系统包括:智能推荐匹配平台和用户端,其中智能推荐匹配平台内置有
...【技术特征摘要】
1.一种基于关联规则挖掘算法的智能匹配方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于关联规则挖掘算法的智能匹配方法,其特征在于,采集指令的生成过程具体为:
3.根据权利要求2所述的一种基于关联规则挖掘算法的智能匹配方法,其特征在于,关联产品累计值的计算过程为:
4.根据权利要求1所述的一种基于关联规则挖掘算法的智能匹配方法,其特征在于,对用户数据进行关联规则挖掘的具体步骤为:
5.根据权利要求4所述的一种基于关联规则挖掘算法的智能匹配方法,其特...
【专利技术属性】
技术研发人员:尤胜荣,张佳佳,
申请(专利权)人:元数科技江苏有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。