本发明专利技术公开了一种银行频繁项模式挖掘方法,包括以下步骤:从银行系统运行信息中获取银行系统的系统状态信息;从系统状态信息中抽取系统特征,并从系统特征中提取出相关联的文本频繁项;根据相关联的文本频繁项挖掘出银行频繁项模式;根据银行频繁项模式生成银行系统的分析结果。该挖掘方法不仅可以给银行的后台服务改进提供参考,而且可以对银行故障排除方法的决策给出建议,提高了银行系统的可靠性,简单便捷。本发明专利技术还公开了一种银行频繁项模式挖掘系统。
【技术实现步骤摘要】
本专利技术涉及计算机应用
,特别涉及一种银行频繁项模式挖掘方法及挖掘系统。
技术介绍
银行作为经营货币信贷业务的依法成立的金融机构,由于其安全高效等特性广泛为人们所使用。作为一个如此重要的系统,其安全性和高效性就显得尤为重要,其中安全性更是银行系统的命脉,但是即便如此,银行方面大规模的故障仍时有发生。并且大规模的故障往往不是由前台的工作失误造成的,因为银行前台周全的交易步骤几乎可以杜绝人为失误的发生,而即使失误发生也是一两笔交易的小规模的错误。大规模的故障往往都是由后台的系统的故障造成的。因此,想要更加有效的避免银行故障的发生,应该着重从后台系统下手。但是银行后台系统往往十分复杂,造成故障的原因更是多种多样,例如,银行之间的链接网络,后端记录数据的数据库,用于运行交易程序的服务器等等产生故障。而其中的一个故障往往会造成一系列的连锁反应,比如,当数据库发生瘫痪时,所有的交易请求就会开始堆积,从而导致服务器的资源不足;相反,如果服务器的内存产生泄漏,那么渐渐的系统资源会越来越少,从而导致数据库的运行所需资源不足,最终瘫痪。由此可见,后端的系统相关性相当复杂,想要通过规则方法直接分析出故障产生的原因几乎不可能。故障产生的次数虽然稀少,但是并不是无规律可循,根据银行方面的经验,在故障发生之前往往系统会产生一些异常的状态,而系统的状态往往比故障更加容易监测,因此可以通过实时的监测分析系统的参数,从而预测故障将会何时发生,这也是人工智能中的一个重要的研究领域。一个准确的故障预测可以在故障发生之前提前给人们做出警告,从而可以使用例如故障排查、数据备份以及软件硬件设备重启等恰当的方式进行应对。评价一个系统的稳定性可以从可靠性和可用性两个指标来评价。这里可靠性是指系统发生故障的几率,对于银行系统来说可靠性往往是很高的,即极少的情况会发生故障,因此从可靠性的角度很难对系统的性能做出一个提升;而可用性是指故障后,系统恢复所需要的时间的长短,这个性能指标在实际使用的过程中也是十分重要的。通过故障预测方法可以提前预测采取对应措施,从而在一定的可靠性的条件下,加速系统恢复速度,提升系统的可用性,改善系统性能。另一方面,既然知道了和故障相关的一些系统参数,则可以通过对这些参数进行人为限制和调整从而在预先的避免故障的发生,在一定的程度上提高系统的可靠性。另一方面如果故障已经发生,则需要寻找一种方法来排除故障,首先可以直接重启机器,或者可以检测故障发生的位置解决造成故障的问题等等。这些方法之间的选择和很多因素有关,但最主要的是在故障发生的过程中银行会损失的交易量的多少。如果当前是一个交易的高峰期,那么往往会选择直接重启系统,使得系统尽快恢复;如果当前交易并不那么密集,则可以选择逐一排除,找到故障源头分析故障原因,尝试避免同样的故障下次发生。由于银行系统的私密性,因此很难找到针对于银行交易系统的故障预测相关文献。但是故障预测这个问题一直是人工智能领域的一个大方向。人们对于系统故障的预测方法研究历史已经超过了30年,随着系统不断的变得复杂,故障预测的方法也在与时俱进的发展,随着近几年的研究,预测故障的方法大致可以归纳成为以下的流程:数据采集、关键特征提取、降维处理、模型训练、算法评价。其中,银行后台日志中大量银行系统运行信息蕴含了大量的系统状态信息,一些固定模式往往与某种系统状态相关。如何挖掘这些固定模式并据此预测系统趋势、挖掘出重要信息就成为了重要课题。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种银行频繁项模式挖掘方法,该方法可以提高了银行系统的可靠性,简单便捷。本专利技术的另一个目的在于提出一种银行频繁项模式挖掘系统。为达到上述目的,本专利技术一方面实施例提出了一种银行频繁项模式挖掘方法,包括以下步骤:从银行系统运行信息中获取银行系统的系统状态信息;从所述系统状态信息中抽取系统特征,并从所述系统特征中提取出相关联的文本频繁项;根据所述相关联的文本频繁项挖掘出银行频繁项模式;根据所述银行频繁项模式生成所述银行系统的分析结果。本专利技术实施例的银行频繁项模式挖掘方法,可以从银行后台交易日志抽取多种相关信息并挖掘此类相关信息之间的关联,以此为依据进行日志挖掘与分析,通过模式识别发现潜在故障并进行预警,不仅可以给银行的后台服务改进提供参考,而且可以对银行故障排除方法的决策给出建议,提高了银行系统的可靠性,简单便捷。另外,根据本专利技术上述实施例的银行频繁项模式挖掘方法还可以具有以下附加的技术特征:其中,在本专利技术的一个实施例中,所述系统状态信息包括交易信息、日期信息、往日同期信息和交易增幅信息。进一步地,在本专利技术的一个实施例中,所述从所述系统特征中提取出相关联的文本频繁项,进一步包括:根据交易日志的余弦相似性进行相似度分析,以提取出所述相关联的交易日志。进一步地,在本专利技术的一个实施例中,所述从所述系统状态信息中抽取系统特征,进一步包括:通过关联规则挖掘的方法提取出所述系统特征中多个频繁项;获取频繁项集和所述频繁项集中每个频繁项的支持度,以进行相似度分析。进一步地,在本专利技术的一个实施例中,通过连接步和剪枝步得到所述频繁项集。为达到上述目的,本专利技术另一方面实施例提出了一种银行频繁项模式挖掘系统,包括:获取模块,用于从银行系统运行信息中获取银行系统的系统状态信息;抽取模块,用于从所述系统状态信息中抽取系统特征,并从所述系统特征中提取出相关联的文本频繁项;挖掘模块,用于根据所述相关联的文本频繁项挖掘出银行频繁项模式;生成模块,用于根据所述银行频繁项模式生成所述银行系统的分析结果。本专利技术实施例的银行频繁项模式挖掘系统,可以从银行后台交易日志抽取多种相关信息并挖掘此类相关信息之间的关联,以此为依据进行日志挖掘与分析,通过模式识别发现潜在故障并进行预警,不仅可以给银行的后台服务改进提供参考,而且可以对银行故障排除方法的决策给出建议,提高了银行系统的可靠性,简单便捷。另外,根据本专利技术上述实施例的银行频繁项模式挖掘系统还可以具有以下附加的技术特征:其中,在本专利技术的一个实施例中,所述系统状态信息包括交易信息、日期信息、往日同期信息和交易增幅信息。进一步地,在本专利技术的一个实施例中,所述挖掘模块进一步用于根据交易日志的余弦相似性进行相似度分析,以提取出所述相关联的交易日志。进一步地,在本专利技术的一个实施例中,所述挖掘模块还用于通过关联规则挖掘的方法提取出所述系统特征中多个频繁项,并且获取频繁项集和所述频繁项集中每个频繁项的支持度,以进行相似度分析。进一步地,在本专利技术的一个实施例中,通过连接步和剪枝步得到所述频繁项集。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本专利技术实施例的银行频繁项模式挖掘方法的流程图;图2为根据本专利技术一个实施例的频繁项挖掘算法的流程示意;图3为根据本专利技术实施例的银行频繁项模式挖掘系统的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同本文档来自技高网...
【技术保护点】
一种银行频繁项模式挖掘方法,其特征在于,包括以下步骤:从银行系统运行信息中获取银行系统的系统状态信息;从所述系统状态信息中抽取系统特征,并从所述系统特征中提取出相关联的文本频繁项;根据所述相关联的文本频繁项挖掘出银行频繁项模式;以及根据所述银行频繁项模式生成所述银行系统的分析结果。
【技术特征摘要】
1.一种银行频繁项模式挖掘方法,其特征在于,包括以下步骤:从银行系统运行信息中获取银行系统的系统状态信息;从所述系统状态信息中抽取系统特征,并从所述系统特征中提取出相关联的文本频繁项;根据所述相关联的文本频繁项挖掘出银行频繁项模式;以及根据所述银行频繁项模式生成所述银行系统的分析结果。2.根据权利要求1所述的银行频繁项模式挖掘方法,其特征在于,所述系统状态信息包括交易信息、日期信息、往日同期信息和交易增幅信息。3.根据权利要求1所述的银行频繁项模式挖掘方法,其特征在于,所述从所述系统特征中提取出相关联的文本频繁项,进一步包括:根据交易日志的余弦相似性进行相似度分析,以提取出所述相关联的交易日志。4.根据权利要求3所述的银行频繁项模式挖掘方法,其特征在于,所述从所述系统状态信息中抽取系统特征,进一步包括:通过关联规则挖掘的方法提取出所述系统特征中多个频繁项;获取频繁项集和所述频繁项集中每个频繁项的支持度,以进行相似度分析。5.根据权利要求4所述的银行频繁项模式挖掘方法,其特征在于,通过连接步和剪枝步得到所述频...
【专利技术属性】
技术研发人员:徐华,詹立雄,邓俊辉,石炎军,孙晓民,楼浩,郭京生,李佳,张帆,
申请(专利权)人:清华大学,北京银信长远科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。