基于推理技术的数据挖掘的方法技术

技术编号:30409518 阅读:25 留言:0更新日期:2021-10-20 11:24
本发明专利技术属于推理技术的数据挖掘技术领域,尤其涉及基于推理技术的数据挖掘的方法,设立数据库云盘,将数据库云盘设置自动收集模块、分拣模块和加密模块,通过数据库云盘的自动收集模块自动在全网自动收集需要挖掘的数据相关信息,收集好的相关数据通过分拣模块进行快速的分类和识别,分拣模块将根据日期时间和数据种类进行快速的分类。该基于推理技术的数据挖掘的方法,能够通过建立数据库初期,通过自动收集模块、分拣模块、加密模块、展示模块、删改模块、恢复模块、屏蔽模块、分类模块和识别模块,就能对手机的数据进行初步的挖掘和整理,便于后期在收集数据的基础上进行挖掘,能够有效的初步达到数据挖掘结果针对性好的目的。效的初步达到数据挖掘结果针对性好的目的。效的初步达到数据挖掘结果针对性好的目的。

【技术实现步骤摘要】
基于推理技术的数据挖掘的方法


[0001]本专利技术涉及推理技术的数据挖掘
,具体为基于推理技术的数据挖掘的方法。

技术介绍

[0002]需要是专利技术之母。近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。
[0003]数据挖掘是人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,作出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,作出正确的决策。知识发现过程由以下三个阶段组成:数据准备;数据挖掘;结果表达和解释。数据挖掘可以与用户或知识库交互。
[0004]现有的数据挖掘结果针对性较差,不能在根据关键的数据得到关键的结构,只能得到相对应的数据,需要进行人工检索和筛选,效率较低,且得到的关键数据,不一定为最终的挖掘结果,因此需要进行改进。

技术实现思路

[0005]本专利技术的目的在于提供基于推理技术的数据挖掘的方法,以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的,本专利技术提供如下技术方案:基于推理技术的数据挖掘的方法,包括以下步骤:
[0007]S1、构建数据库
[0008]设立数据库云盘,将数据库云盘设置自动收集模块、分拣模块和加密模块,通过数据库云盘的自动收集模块自动在全网自动收集需要挖掘的数据相关信息,收集好的相关数据通过分拣模块进行快速的分类和识别,分拣模块将根据日期时间和数据种类进行快速的分类,分类完成后分拣模块将分类好的数据中无效、错误和不能使用的数据进行删除和修改,从而再通过加密模块将处理后的数据进行快速的加密最终储存在数据库内。
[0009]S2、检索初步挖掘数据
[0010]进行挖掘数据输时,根据提供的第一关键数据和第二关键数据在数据库内进行检索,从而根据数据库提供的相关联的数据进行初步的筛选,筛选后得到的初步挖掘出来的数据,建立权重积分模型,根据权重积分模型得到相对重要的关键数据。
[0011]S3、挖掘处理数据
[0012]根据步骤S2中得到的关键数据将其通过MapReduce处理,通过指定关键输用来处
理键值对(Key/Value)的map函数来生成一个中间键值对集合,然后,再指定一个reduce函数,它用来合并所有的具有相同中间key的中间value,得到相应的数据处理结果。
[0013]S4、推理挖掘数据
[0014]根据步骤S3作用得到的MapReduce处理数据处理结果,在通过步骤S2从而数据库内得到一个反向的关键数据,在将得到的反向的关键数据输入到步骤S3中进行MapReduce处理得到一个相应的反向数据处理结果,将得到的数据和反向数据建立一个中心图形和周边图形元素,根据得到的中心图形元素和周边图形元素进行分析,从而得到最终推理的数据,即为最终需要挖掘的数据。
[0015]S5、知识图谱推理
[0016]对数据壳内的数据建立正常的正向数据检索挖掘和反向的反向数据挖掘,在正向数据检索挖掘过程中,通过正向数据推理数据挖掘和反向符号推理挖掘,对数据建立双向的推理挖掘,当数据挖掘到后结束,当数据没有挖掘到查找出问题,进行排难处理并同时解决困难,困难解决后如果数据正常挖掘到后结束,在反向数据检索挖掘过程中,通过反向数据推理和反向子模块推理对数据进行挖掘,反向数据挖掘到将其移动至正向数据检索挖掘,从而得到挖掘数据并结束,未挖掘到查找出问题,进行排难处理并同时解决困难,从而挖掘出数据并结束。
[0017]S6、建模
[0018]根据特征变量库构建特征变量宽表,进行同质性检查,再对特征变量变量过滤,过滤完成后进行变量粗选,然后进行WOE/IV计算、相关性计算和PSI计算,同时可以直接根据特征变量宽表进行计算,计算得到的结果进行筛选,筛选后得到建模宽表,再根据建模宽表进行样本排除,排出后通过变量分箱,再根据变量分箱进行模型训练和自动模型生成。
[0019]优选的,所述步骤S1中数据库为百度云盘和阿里云盘,设立的输云盘在自动收集模块、分拣模块和加密模块基础上增设有删改模块、恢复模块、屏蔽模块和展示模块,且展示模块对应加密模块设置有解密模块,分拣模块设置有分类模块和识别模块。
[0020]优选的,所述数据发射端信号连接有自动收集模块、分拣模块和加密模块接收端,所述分拣模块发射端信号连接有识别模块和分类模块接收端,所述数据库发射端信号连接有展示模块、删改模块、恢复模块和屏蔽模块接收端,所述展示模块发射端信号连接有解密模块接收端。
[0021]优选的,所述解密模块发射端信号连接有加密模块接收端,所述删改模块、恢复模块和屏蔽模块发射端信号连接有分拣模块。
[0022]优选的,所述数据库通过以太网和交换机信号连接有自动收集模块、分拣模块、加密模块、展示模块、删改模块、恢复模块、屏蔽模块、分类模块和识别模块,且数据库信号连接有单片机和处理器。
[0023]优选的,所述步骤S2中,第一关键数据和第二关键数据为随机指定的数据,且针对检索挖掘数据在数据库上增设有检索模块。
[0024]优选的,所述步骤S3中,MapReduce能够允许提供一个可选的Combiner函数,在数据通过网络发送之前,可以通过该函数将数据进行部分合并,得到最终的数据处理结果。
[0025]优选的,所述步骤S4中,在设定的一个反向数据不能得到最终有效的数据时,可以通过设置多个反向数据,进行步骤S2从而数据库内得到多个反向的关键数据,在将得到的
反向的关键数据输入到步骤S3中进行MapReduce处理得到多个相应的反向数据处理结果,最终进行比较,得到有效的挖掘数据。
[0026]与现有技术相比,本专利技术的有益效果是:
[0027]1、该基于推理技术的数据挖掘的方法,能够通过建立数据库初期,通过自动收集模块、分拣模块、加密模块、展示模块、删改模块、恢复模块、屏蔽模块、分类模块和识别模块,就能对手机的数据进行初步的挖掘和整理,便于后期在收集数据的基础上进行挖掘,能够有效的初步达到数据挖掘结果针对性好的目的。
[0028]2、该基于推理技术的数据挖掘的方法,通过检索模块,进行初步挖掘,能够在建立权重积分模型,根据权重积分模型得到相对重要的关键数据,进一步对数据进行了针对性的准确挖掘,有效的避免了后期的需要人工的检索和筛选,达到了效率高的目的。
[0029]3、该基于推理技术的数据挖掘的方法,通过推理挖掘数据,能够通过不同的方向在数据库内得到关键数据,在将得到的关键数据输入到步骤S3中进行MapReduce处理得到一个相应的反向数据处理结果,将得到的不同数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于推理技术的数据挖掘的方法,其特征在于,包括以下步骤:S1、构建数据库设立数据库云盘,将数据库云盘设置自动收集模块、分拣模块和加密模块,通过数据库云盘的自动收集模块自动在全网自动收集需要挖掘的数据相关信息,收集好的相关数据通过分拣模块进行快速的分类和识别,分拣模块将根据日期时间和数据种类进行快速的分类,分类完成后分拣模块将分类好的数据中无效、错误和不能使用的数据进行删除和修改,从而再通过加密模块将处理后的数据进行快速的加密最终储存在数据库内。S2、检索初步挖掘数据进行挖掘数据输时,根据提供的第一关键数据和第二关键数据在数据库内进行检索,从而根据数据库提供的相关联的数据进行初步的筛选,筛选后得到的初步挖掘出来的数据,建立权重积分模型,根据权重积分模型得到相对重要的关键数据。S3、挖掘处理数据根据步骤S2中得到的关键数据将其通过MapReduce处理,通过指定关键输用来处理键值对(Key/Value)的map函数来生成一个中间键值对集合,然后,再指定一个reduce函数,它用来合并所有的具有相同中间key的中间value,得到相应的数据处理结果。S4、推理挖掘数据根据步骤S3作用得到的MapReduce处理数据处理结果,在通过步骤S2从而数据库内得到一个反向的关键数据,在将得到的反向的关键数据输入到步骤S3中进行MapReduce处理得到一个相应的反向数据处理结果,将得到的数据和反向数据建立一个中心图形和周边图形元素,根据得到的中心图形元素和周边图形元素进行分析,从而得到最终推理的数据,即为最终需要挖掘的数据。S5、知识图谱推理对数据壳内的数据建立正常的正向数据检索挖掘和反向的反向数据挖掘,在正向数据检索挖掘过程中,通过正向数据推理数据挖掘和反向符号推理挖掘,对数据建立双向的推理挖掘,当数据挖掘到后结束,当数据没有挖掘到查找出问题,进行排难处理并同时解决困难,困难解决后如果数据正常挖掘到后结束,在反向数据检索挖掘过程中,通过反向数据推理和反向子模块推理对数据进行挖掘,反向数据挖掘到将其移动至正向数据检索挖掘,从而得到挖掘数据并结束,未挖掘到查找出问题,进行排难处理并同时解决困难,从而挖掘出数据。S6、建模根据特征变量库构建特征变量宽表,进行同质性检查,再对特征变量变量过滤,过滤完成后进行变量粗选,然后进行WOE...

【专利技术属性】
技术研发人员:祖玉宁
申请(专利权)人:上海硕恩网络科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1