兴趣点分析方法及装置制造方法及图纸

技术编号:29020446 阅读:15 留言:0更新日期:2021-06-26 05:21
本发明专利技术公开了一种兴趣点分析方法及装置,涉及数据处理技术领域,其中,该方法包括:获得出行轨迹记录数据;对所述出行轨迹记录数据进行次数压缩处理;将次数压缩处理后的出行轨迹记录数据进行编码,得到对应的数字序列;将所述数字序列输入预先建立的word2vec神经网络模型进行训练,确定训练好的所述word2vec神经网络模型的权重矩阵;根据所述权重矩阵,进行兴趣点分析。本发明专利技术能够解决现有兴趣点分析方法存在数据量过大,时间复杂度过高的问题。时间复杂度过高的问题。时间复杂度过高的问题。

【技术实现步骤摘要】
兴趣点分析方法及装置


[0001]本专利技术涉及数据处理
,尤其涉及一种兴趣点分析方法及装置。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]用户行为是具有关联性的,通过用户一段时间去过的地点序列,获取地点之间的关联性,可以得到一个地点的用户会去的以及去过的可能地点。这就是目前一个非常热门的研究课题兴趣点(Point of Interest,简称POI)分析。
[0004]现有技术中通常统计关注事件组在全量数据中发生的次数,例如,1000个用户中有100个用户一段时间内都去过医院和药店,则(医院,药店)的频次为100,如果此时(医院,甜品店)的频次为20,可以得出药店相比于甜品店和医院更相关。考虑事物发生的时序性时,则需保留整条时间上的行为链。但是这种方法存在数据量过大,时间复杂度过高的问题。
[0005]针对上述问题,目前尚未提出有效的解决方案。

技术实现思路

[0006]本专利技术实施例中提供了一种兴趣点分析方法,用以解决现有兴趣点分析方法存在数据量过大,时间复杂度过高的问题,该方法包括:
[0007]获得出行轨迹记录数据;
[0008]对所述出行轨迹记录数据进行次数压缩处理;
[0009]将次数压缩处理后的出行轨迹记录数据进行编码,得到对应的数字序列;
[0010]将所述数字序列输入预先建立的word2vec神经网络模型进行训练,确定训练好的所述word2vec神经网络模型的权重矩阵;
[0011]根据所述权重矩阵,进行兴趣点分析。
[0012]进一步地,出行轨迹记录数据包括:地点经纬度信息。
[0013]进一步地,对所述出行轨迹记录数据进行次数压缩处理,包括:
[0014]利用shrink函数对所述出行轨迹记录数据中重复的部分进行次数压缩处理。
[0015]进一步地,所述shrink函数为:对数函数向下取整。
[0016]进一步地,所述的兴趣点分析方法,还包括:
[0017]按预设窗口长度对所述数字序列进行取窗口处理;
[0018]将所述数字序列输入预先建立的word2vec神经网络模型进行训练,包括:将进行取窗口处理的数字序列输入预先建立的word2vec神经网络模型进行训练。
[0019]进一步地,所述word2vec神经网络模型包括:CBOW模型或LSTM模型。
[0020]进一步地,根据所述权重矩阵,进行兴趣点分析,包括:
[0021]根据所述权重矩阵,确定每个地点对应的向量;
[0022]根据所述向量,确定向量夹角数据;
[0023]根据所述向量夹角数据,进行兴趣点分析。
[0024]本专利技术实施例中提供了一种兴趣点分析装置,用以解决现有兴趣点分析方法存在数据量过大,时间复杂度过高的问题,该装置包括:
[0025]数据获得模块,用于获得出行轨迹记录数据;
[0026]数据压缩模块,用于对所述出行轨迹记录数据进行次数压缩处理;
[0027]数据编码模块,用于将次数压缩处理后的出行轨迹记录数据进行编码,得到对应的数字序列;
[0028]模型训练模块,用于将所述数字序列输入预先建立的word2vec神经网络模型进行训练,确定训练好的所述word2vec神经网络模型的权重矩阵;
[0029]兴趣点分析模块,用于根据所述权重矩阵,进行兴趣点分析。
[0030]进一步地,出行轨迹记录数据包括:地点经纬度信息。
[0031]进一步地,所述数据压缩模块进一步用于:
[0032]利用shrink函数对所述出行轨迹记录数据中重复的部分进行次数压缩处理。
[0033]进一步地,所述shrink函数为:对数函数向下取整。
[0034]进一步地,所述的兴趣点分析装置,还包括:
[0035]取窗口处理模块,用于按预设窗口长度对所述数字序列进行取窗口处理;
[0036]所述模型训练模块进一步用于:将进行取窗口处理的数字序列输入预先建立的word2vec神经网络模型进行训练。
[0037]进一步地,所述word2vec神经网络模型包括:CBOW模型或LSTM模型。
[0038]进一步地,所述兴趣点分析模块进一步用于:
[0039]根据所述权重矩阵,确定每个地点对应的向量;
[0040]根据所述向量,确定向量夹角数据;
[0041]根据所述向量夹角数据,进行兴趣点分析。
[0042]本专利技术实施例中还提供了一种计算机设备,所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述兴趣点分析方法。
[0043]本专利技术实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述兴趣点分析方法的计算机程序。
[0044]本专利技术实施例通过获得出行轨迹记录数据;对所述出行轨迹记录数据进行次数压缩处理;将次数压缩处理后的出行轨迹记录数据进行编码,得到对应的数字序列;将所述数字序列输入预先建立的word2vec神经网络模型进行训练,确定训练好的所述word2vec神经网络模型的权重矩阵;根据所述权重矩阵,进行兴趣点分析。本专利技术实施例通过对出行轨迹记录数据进行次数压缩处理实现了重复地点的平滑,进而根据处理后的数据进行编码和模型训练,从而有效缩减了数据量,解决了现有兴趣点分析方法存在数据量过大,时间复杂度过高的问题。
附图说明
[0045]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0046]图1为本专利技术实施例中提供的一种兴趣点分析方法流程图;
[0047]图2~图3为本专利技术具体实施例中兴趣点分析过程示意图;
[0048]图4为本专利技术实施例中提供的一种兴趣点分析装置示意图;
[0049]图5为本专利技术实施例中提供的一种电子设备示意图。
具体实施方式
[0050]为使本专利技术实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本专利技术实施例做进一步详细说明。在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定。
[0051]首先对本专利技术实施例中涉及的技术用于进行解释:
[0052]Embedding:Embedding指用一个低维稠密向量“表示”一个对象,这里说的对象可以是一个词、一个商品,也可以是一部电影等等。Embedding过后的向量包含了对象的某些特征,且不同对象的Embedding向量相似度(cosine)能够反映对象之间的相似性。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种兴趣点分析方法,其特征在于,包括:获得出行轨迹记录数据;对所述出行轨迹记录数据进行次数压缩处理;将次数压缩处理后的出行轨迹记录数据进行编码,得到对应的数字序列;将所述数字序列输入预先建立的word2vec神经网络模型进行训练,确定训练好的所述word2vec神经网络模型的权重矩阵;根据所述权重矩阵,进行兴趣点分析。2.如权利要求1所述的兴趣点分析方法,其特征在于,出行轨迹记录数据包括:地点经纬度信息。3.如权利要求1所述的兴趣点分析方法,其特征在于,对所述出行轨迹记录数据进行次数压缩处理,包括:利用shrink函数对所述出行轨迹记录数据中重复的部分进行次数压缩处理。4.如权利要求3所述的兴趣点分析方法,其特征在于,所述shrink函数为:对数函数向下取整。5.如权利要求1所述的兴趣点分析方法,其特征在于,还包括:按预设窗口长度对所述数字序列进行取窗口处理;将所述数字序列输入预先建立的word2vec神经网络模型进行训练,包括:将进行取窗口处理的数字序列输入预先建立的word2vec神经网络模型进行训练。6.如权利要求1所述的兴趣点分析方法,其特征在于,所述word2vec神经网络模型包括:CBOW模型或LSTM模型。7.如权利要求1所述的兴趣点分析方法,其特征在于,根据所述权重矩阵,进行兴趣点分析,包括:根据所述权重矩阵,确定每个地点对应的向量;根据所述向量,确定向量夹角数据;根据所述向量夹角数据,进行兴趣点分析。8.一种兴趣点分析装置,其特征在于,包括:数据获得模块,用于获得出行轨迹记录数据;数据压缩模块,用于对所述出行轨迹记录数据进行次数压缩处理;数据编码模块,用于将次数压缩处理后的出行轨迹记录...

【专利技术属性】
技术研发人员:聂砂罗奕康戴菀庭郭赜王典李萌王伊妍刘海贾国琛
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1