本发明专利技术公开了一种项集挖掘方法及装置,包括以下步骤:第一步,首先采集大货车的车辆行驶数据和故障类型,得到具有故障类标记的大货车故障类型数据集;第二步,根据大货车每次相同类型故障发生时的行驶数据,得到具有故障类标记的行驶数据集;第三步,确定行驶数据集集合中每个类型参数数据的频繁概率,并按照频繁概率将大货车行驶数据集集集合中的类型参数数据进行排序;第四步,根据大货车行驶数据集所包括高频繁概率的类型参数数据,确定大货车行驶故障规律。本发明专利技术可从获取的大量车辆故障数据中,挖掘出行驶数据与故障类之间的隐藏关系,能够及时并有效地确定车辆发生故障的零部件,确定故障类型及故障原因,防止故障恶化而产生重大事故,显著提高了故障诊断准确率。显著提高了故障诊断准确率。显著提高了故障诊断准确率。
【技术实现步骤摘要】
一种项集挖掘方法及装置
[0001]本专利技术涉及数据挖掘
,尤其涉及一种项集挖掘方法及装置。
技术介绍
[0002]为了发现不同数据项之间的关联规则,需要进行目标数据项集的挖掘。项集(英文:Itemsets)是由至少一个数据项构成的集合,用于表征数据库中内在的一种关联规则。HUIM(High
‑
Utility Itemsets Mining,高效用项集挖掘)作为一种常见的数据挖掘方式,用于从数据库中挖掘出由不同数据项组成的效用值较高的项集。在现有的基于HUIM的算法中,根据不同数据项各自对应的效用值,计算数据库中各个项集对应的效用值,当该项集对应的效用值大于或等于预设效用值时,确定该项集为高效用项集并进行挖掘,从而实现从数据库中挖掘出高效用的项集。
[0003]随着现代网络技术的发展,数据成指数增长,对海量数据进行必要的挖掘和处理,为用户提供有价值的信息,以此指导用户做出相应的技术决策和经营管理显得尤为重要。关联分析通常用来描述数据中强关联特征的模式,即发现隐藏在大型数据集中的因果联系,其应用包括在生物医学领域找出具有相关功能的基因组、在网页挖掘中识别用户一起访问的网页、在地球科学中理解地球气候系统不同元素之间的因果联系、在购物数据中挖掘用户的购物习惯等
[0004]但现有技术中,不能及时挖掘出大货车行驶过程中的故障规律,使得大货车在复杂和环境多变情况下行驶时,可能产生导致大货车故障预警不及时、不准确的问题。
技术实现思路
[0005]本专利技术提供了一种项集挖掘方法及装置,以解决上述
技术介绍
中提出的问题。
[0006]为了实现上述目的,本专利技术采用了如下技术方案:
[0007]一种项集挖掘方法,包括以下步骤:
[0008]第一步,首先采集大货车的车辆行驶数据和故障类型,得到具有故障类标记的大货车故障类型数据集;
[0009]第二步,根据大货车每次相同类型故障发生时的行驶数据,得到具有故障类标记的行驶数据集;
[0010]第三步,确定行驶数据集集合中每个类型参数数据的频繁概率,并按照频繁概率将大货车行驶数据集集集合中的类型参数数据进行排序;
[0011]第四步,根据大货车行驶数据集所包括高频繁概率的类型参数数据,确定大货车行驶故障规律。
[0012]作为本技术方案的进一步改进方案:通过设置在大货车上的多个传感器,获取设定区域、设定时间段内大货车的行驶数据。
[0013]作为本技术方案的进一步改进方案:行驶数据包括车辆发生故障时各零部件的相关参数数据和车辆环境数据。
[0014]作为本技术方案的进一步改进方案:车辆环境数据包括车辆的振动幅度与频率,车辆周围空气的温度与湿度,车辆位置处的海拔高度。
[0015]作为本技术方案的进一步改进方案:各零部件的相关参数数据包括发动机油量、发动机冷却液液面高度、制动液液面高度、离合器总泵液面高度、皮带振动幅度、轮胎气压、蓄电池电池状态等。
[0016]作为本技术方案的进一步改进方案:行驶数据为故障发生时前三个小时内的行驶数据。
[0017]本专利技术实施例还提供了一种项集挖掘装置,包括:
[0018]第一数据处理模块,用于采集大货车的车辆行驶数据和故障类型,得到具有故障类标记的大货车故障类型数据集;
[0019]第二数据处理模块,用于根据大货车每次相同类型故障发生时的行驶数据,得到具有故障类标记的行驶数据集;
[0020]第三数据处理模块,用于确定行驶数据集集合中每个类型参数数据的频繁概率,并按照频繁概率将大货车行驶数据集集集合中的类型参数数据进行排序;
[0021]第四评估预测模块,用于根据大货车行驶数据集所包括高频繁概率的类型参数数据,确定大货车行驶故障规律。
[0022]本专利技术实施例还提供了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的项集挖掘方法。
[0023]本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任一项所述的项集挖掘方法。
[0024]与现有技术相比,本专利技术的有益效果是:
[0025]本专利技术实施例提供了一种项集挖掘方法,从获取的大量车辆故障数据中,挖掘出行驶数据与故障类之间的隐藏关系,能够及时并有效地确定车辆发生故障的零部件,确定故障类型及故障原因,防止故障恶化而产生重大事故,显著提高了故障诊断准确率。
[0026]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,并可依照说明书的内容予以实施,以下以本专利技术的较佳实施例并配合附图详细说明如后。本专利技术的具体实施方式由以下实施例及其附图详细给出。
附图说明
[0027]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0028]图1是本专利技术提供的一种终端设备的一个优选实施例的结构示意图。
具体实施方式
[0029]以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。在下列段落中参照附图以举例方式更具体地描述本专利技术。根据下面说明和权利要求书,本专利技术的优点和特征将更清楚。需说明的是,附图均采用非常简化
的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本专利技术实施例的目的。
[0030]需要说明的是,当组件被称为“固定于”另一个组件,它可以直接在另一个组件上或者也可以存在居中的组件。当一个组件被认为是“连接”另一个组件,它可以是直接连接到另一个组件或者可能同时存在居中组件。当一个组件被认为是“设置于”另一个组件,它可以是直接设置在另一个组件上或者可能同时存在居中组件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
[0031]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
[0032]本专利技术实施例中,一种项集挖掘方法,包括以下步骤:
[0033]第一步,首先采集大货车的车辆行驶数据和故障类型,得到具有故障类标记的大货车故障类型数据集;
[0034]第二步,根据大货车每次相同类型故障发生时的行驶数据,得到具有故障类标记的行驶数据集;
[0035]第三步,确定行驶数据集集合中每个类型参数数据的频繁概率,并按照频繁概率将大货车行驶数据集集集合中的类型参数数据进行排序;
[0036]第四步,根据大货车行驶数据集所包括高频繁概率的本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种项集挖掘方法,其特征在于,包括以下步骤:第一步,首先采集大货车的车辆行驶数据和故障类型,得到具有故障类标记的大货车故障类型数据集;第二步,根据大货车每次相同类型故障发生时的行驶数据,得到具有故障类标记的行驶数据集;第三步,确定行驶数据集集合中每个类型参数数据的频繁概率,并按照频繁概率将大货车行驶数据集集集合中的类型参数数据进行排序;第四步,根据大货车行驶数据集所包括高频繁概率的类型参数数据,确定大货车行驶故障规律。2.根据权利要求1所述的一种项集挖掘方法,其特征在于,通过设置在大货车上的多个传感器,获取设定区域、设定时间段内大货车的行驶数据。3.根据权利要求2所述的一种项集挖掘方法,其特征在于,行驶数据包括车辆发生故障时各零部件的相关参数数据和车辆环境数据。4.根据权利要求3所述的一种项集挖掘方法,其特征在于,车辆环境数据包括车辆的振动幅度与频率,车辆周围空气的温度与湿度,车辆位置处的海拔高度。5.根据权利要求3所述的一种项集挖掘方法,其特征在于,各零部件的相关参数数据包括发动机油量、发动机冷却液液面高度、制动液液面高度、离合器总泵液面高度、皮带振动幅度、轮胎气压...
【专利技术属性】
技术研发人员:李星,王志臻,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。