一种用户出行数据处理方法、装置及电子设备制造方法及图纸

技术编号:37143223 阅读:15 留言:0更新日期:2023-04-06 21:52
本申请提供的用户出行数据处理方案,在进行用户出行数据处理时,将用户的原始出行数据输入数据子模型,获得预设格式的出行明细数据;构建对应用户的出行知识图谱,出行知识图谱包括对应原始出行数据的事件节点、对应出行明细数据的数据节点、对应出行时空数据的时空标签节点和对应出行特征的特征标签节点以及节点之间的关系边;调用指标子模型根据用户的出行知识图谱中的事件节点、数据节点、时空节点和关系边,计算用户的出行指标值;根据出行指标值确定用户的标签特征节点的出行特征。通过本公开的方案,以不断构建用户出行知识图谱,基于图进行关联分析、算法挖掘,关联效率和分析效率都会更高,可以更有效、更准确的挖掘乘客潜在的出行特征。乘客潜在的出行特征。乘客潜在的出行特征。

【技术实现步骤摘要】
一种用户出行数据处理方法、装置及电子设备


[0001]本专利技术涉及数据处理
,具体涉及一种用户出行数据处理方法、装置及电子设备。

技术介绍

[0002]随着城市化进程的逐步加速,近年来,我国城市轨道交通行业得到了高速的发展,大量的客流形成了大量的客流、票务等相关数据,如果未构建乘客画像等系统,这些数据就是零散的数据,仅为没有定向的数据,数据价值较低,造成了大量数据资源的浪费。为了从这些数据中分析每个乘客、某一类乘客群体的出行特征,进而为相关乘客提供精准化、差异化个的个性化服务,地铁公司纷纷开始构建乘客画像系统。
[0003]分析乘客出行特征是构建乘客画像系统中最重要、最复杂、也是最难的一个环节,目前存在一些聚类算法技术分析乘客出行特征的方法,这类方法往往面临计算复杂度高,实施难度大等特点。
[0004]某些实现方案是采用非监督学习算法K

MEANS中的k

均值算法来进行乘客聚类,完成乘客行为特征的分析。通常方法如下:
[0005]1>数据预处理:对原始数据进行了合并和整理,得到乘客出行记录,每条乘客出行记录包含:乘客出行进站站点、进站刷卡时间、出站站点和出站刷卡时间;
[0006]2>特征提取:根据乘客出行记录,进行行人站点、时间等属性的聚类,获得乘客出行特征;
[0007]3>乘客聚类:根据乘客出行特征,进行乘客聚类,获得乘客群体的出行特征。
[0008]现有的分析乘客出行特征的方案使用聚类算法,计算复杂度太高;算法模型的参数调整复杂,存在技术实现难度大的技术问题。

技术实现思路

[0009]有鉴于此,本公开实施例提供一种用户出行数据处理方法、装置及电子设备,至少部分解决现有技术中存在的问题。
[0010]第一方面,本公开实施例提供了一种用户出行数据处理方法,包括:
[0011]调用出行数据处理模型,其中,所述出行数据处理模型包括数据子模型、指标子模型和图谱子模型;
[0012]将用户的原始出行数据输入所述数据子模型,获得预设格式的出行明细数据;
[0013]构建对应所述用户的出行知识图谱,其中,所述出行知识图谱包括对应原始出行数据的事件节点、对应出行明细数据的数据节点、对应出行时空数据的时空标签节点和对应出行特征的特征标签节点以及节点之间的关系边;
[0014]调用所述指标子模型根据所述用户的出行知识图谱中的事件节点、数据节点、时空节点和关系边,计算所述用户的出行指标值;
[0015]根据所述出行指标值确定所述用户的标签特征节点的出行特征。
[0016]根据本公开实施例的一种具体实现方式,所述调用出行数据处理模型的步骤之前,所述方法还包括:
[0017]构建数据子模型、指标子模型和图谱子模型;
[0018]设定数据子模型的字段识别规则和字段格式处理规则;
[0019]设定指标子模型的指标类型、指标层级关联以及指标计算规则;
[0020]定义所述图谱子模型的各节点对应的实体类型和节点之间的边类型。
[0021]根据本公开实施例的一种具体实现方式,指标类型包括基础指标和复合指标,指标计算规则包括基础指标到复合指标的第一类计算规则和复合指标到出行特征的第二类计算规则,所述调用所述指标子模型根据所述用户的出行知识图谱中的事件节点、数据节点、时空节点和关系边,计算所述用户的出行指标值的步骤,包括:
[0022]调用指标子模型根据根据所述用户的出行知识图谱中的事件节点、数据节点、时空节点和关系边确定各基础指标的基础指标值;
[0023]根据各基础指标值、指标层级关联和各复合指标的第一类计算规则,计算各复合指标的复合指标值;
[0024]根据各复合指标的复合指标值和第二类计算规则,计算所述用户的出行指标值。
[0025]根据本公开实施例的一种具体实现方式,所述根据各复合指标的复合指标值和第二类计算规则,计算所述用户的出行指标值的步骤之后,所述方法还包括:
[0026]按照时序特征将基础指标值、复合指标值和出行指标值进行存储。
[0027]根据本公开实施例的一种具体实现方式,出行明细数据至少包括所述用户的用户标识、起止站点标识和出行时间;和/或,
[0028]数据节点包括对应用户标识的用户名数据节点、对应起始站点或者终止站点的站点数据节点、对应出行线路的线路数据节点或者对应出行票卡的票卡数据节点;和/或,
[0029]时空标签节点包括时间标签节点和空间标签节点;和/或,
[0030]出行特征包括出行稳定性特征。
[0031]第二方面,本公开实施例提供了一种用户出行数据处理装置,包括:
[0032]调用模块,用于调用出行数据处理模型,其中,所述出行数据处理模型包括数据子模型、指标子模型和图谱子模型;
[0033]处理模块,用于将用户的原始出行数据输入所述数据子模型,获得预设格式的出行明细数据;
[0034]构建模块,用于构建对应所述用户的出行知识图谱,其中,所述出行知识图谱包括对应原始出行数据的事件节点、对应出行明细数据的数据节点、对应出行时空数据的时空标签节点和对应出行特征的特征标签节点以及节点之间的关系边;
[0035]计算模块,用于调用所述指标子模型根据所述用户的出行知识图谱中的事件节点、数据节点、时空节点和关系边,计算所述用户的出行指标值;
[0036]确定模块,用于根据所述出行指标值确定所述用户的标签特征节点的出行特征。
[0037]根据本公开实施例的一种具体实现方式,所述构建模块还用于:
[0038]构建数据子模型、指标子模型和图谱子模型;
[0039]设定数据子模型的字段识别规则和字段格式处理规则;
[0040]设定指标子模型的指标类型、指标层级关联以及指标计算规则;
[0041]定义所述图谱子模型的各节点对应的实体类型和节点之间的边类型。
[0042]根据本公开实施例的一种具体实现方式,指标类型包括基础指标和复合指标,指标计算规则包括基础指标到复合指标的第一类计算规则和复合指标到出行特征的第二类计算规则,所述计算模块用于:
[0043]调用指标子模型根据根据所述用户的出行知识图谱中的事件节点、数据节点、时空节点和关系边确定各基础指标的基础指标值;
[0044]根据各基础指标值、指标层级关联和各复合指标的第一类计算规则,计算各复合指标的复合指标值;
[0045]根据各复合指标的复合指标值和第二类计算规则,计算所述用户的出行指标值。
[0046]根据本公开实施例的一种具体实现方式,所述装置还包括存储模块,所述存储模块用于:
[0047]按照时序特征将基础指标值、复合指标值和出行指标值进行存储。
[0048]第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
[0049]所述电子本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户出行数据处理方法,其特征在于,包括:调用出行数据处理模型,其中,所述出行数据处理模型包括数据子模型、指标子模型和图谱子模型;将用户的原始出行数据输入所述数据子模型,获得预设格式的出行明细数据;构建对应所述用户的出行知识图谱,其中,所述出行知识图谱包括对应原始出行数据的事件节点、对应出行明细数据的数据节点、对应出行时空数据的时空标签节点和对应出行特征的特征标签节点以及节点之间的关系边;调用所述指标子模型根据所述用户的出行知识图谱中的事件节点、数据节点、时空节点和关系边,计算所述用户的出行指标值;根据所述出行指标值确定所述用户的标签特征节点的出行特征。2.根据权利要求1所述的方法,其特征在于,所述调用出行数据处理模型的步骤之前,所述方法还包括:构建数据子模型、指标子模型和图谱子模型;设定数据子模型的字段识别规则和字段格式处理规则;设定指标子模型的指标类型、指标层级关联以及指标计算规则;定义所述图谱子模型的各节点对应的实体类型和节点之间的边类型。3.根据权利要求2所述的方法,其特征在于,指标类型包括基础指标和复合指标,指标计算规则包括基础指标到复合指标的第一类计算规则和复合指标到出行特征的第二类计算规则,所述调用所述指标子模型根据所述用户的出行知识图谱中的事件节点、数据节点、时空节点和关系边,计算所述用户的出行指标值的步骤,包括:调用指标子模型根据根据所述用户的出行知识图谱中的事件节点、数据节点、时空节点和关系边确定各基础指标的基础指标值;根据各基础指标值、指标层级关联和各复合指标的第一类计算规则,计算各复合指标的复合指标值;根据各复合指标的复合指标值和第二类计算规则,计算所述用户的出行指标值。4.根据权利要求3所述的方法,其特征在于,所述根据各复合指标的复合指标值和第二类计算规则,计算所述用户的出行指标值的步骤之后,所述方法还包括:按照时序特征将基础指标值、复合指标值和出行指标值进行存储。5.根据权利要求4所述的方法,其特征在于,出行明细数据至少包括所述用户的用户标识、起止站点标识和出行时间;和/或,数据节点包括对应用户标识的用户名数据节点、对应起始站点或者终止站点的站点数据节点、对应出行线路的线路数据节点或者对应出行票卡的票卡数据节点;和/...

【专利技术属性】
技术研发人员:宋继峰张侃吴贵虎张龙王春勇
申请(专利权)人:北京乐码仕智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1