基于机器学习的数据预测处理方法、装置和计算机设备制造方法及图纸

技术编号:21456347 阅读:28 留言:0更新日期:2019-06-26 05:34
本申请涉及一种基于机器学习的数据预测处理方法、装置和计算机设备。所述方法包括:接收终端发送的数据预测请求,数据预测请求包括请求类型和请求信息;识别请求信息中的字段因子,根据请求类型和字段因子获取多个目标因素数据,目标因素数据包括多个字段数据;对目标因素数据进行特征处理和特征提取,得到多个字段数据对应的特征向量;根据请求类型获取预设的数据预测模型,通过数据分析模型对特征变量进行训练和分析,得到多个指标数据和对应的预测值;根据多个指标数据和对应的预测值生成的预测结果数据,并将预测结果数据推送至终端。采用本方法能够有效提高对数据分析和预测的准确率。

【技术实现步骤摘要】
基于机器学习的数据预测处理方法、装置和计算机设备
本申请涉及计算机
,特别是涉及一种基于机器学习的数据预测处理方法、装置和计算机设备。
技术介绍
流行性传染病是指由各种致病性微生物或病原体引起的具有传染性的疾病,如登革热、流行性病毒感冒、脑膜炎、霍乱等。由于传染病具有传播的特性,能在较短的时间内广泛蔓延,是危害人类身体健康,威胁人类生命安全的重要疾病。例如,登革热(dengue)是登革病毒经蚊媒传播引起的急性虫媒传染病,起病骤降危害大。登革热周发病人数波动较频繁,虽然每年有一定的爆发期规律,但波动周期紊乱不固定,波动幅度变换很大,因此3-5年长期预测的误差较难控制,预测难度非常高。随着计算机技术的迅速发展,出现了一些通过对已有的数据进行分析,从而对发病情况进行预测。但现有的方式中对发病情况进行分析的数据源较少,而影响发病情况的因素较多且有不稳定型,导致对数据进行分析预测的准确率较低。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够有效提高对数据分析和预测的准确率的基于机器学习的数据预测处理方法、装置和计算机设备。一种基于机器学习的数据预测处理方法,所述方法包括:接收终端发送的数据预测请求,所述数据预测请求包括请求类型和请求信息;识别所述请求信息中的字段因子,根据所述请求类型和所述字段因子获取多个目标因素数据,所述目标因素数据包括多个字段数据;对所述目标因素数据进行特征处理和特征提取,得到所述多个字段数据对应的特征向量;根据所述请求类型获取预设的数据预测模型,通过所述数据分析模型对所述特征变量进行训练和分析,得到多个指标数据和对应的预测值;根据所述多个指标数据和对应的预测值生成的预测结果数据,并将所述预测结果数据推送至所述终端。在其中一个实施例中,所述对所述目标因素数据进行特征处理和特征提取,得到所述多个字段数据对应的特征变量的步骤,包括:对所述目标因素数据对应的多个字段数据进行向量化,得到多个字段数据对应的特征向量;对所述特征变量进行衍生处理,得到处理后的多个特征向量;根据预设的目标函数计算所述特征向量的多个特征维度值;根据预设的距离算法和所述特征维度值计算多个特征向量之间的相似度;提取出所述相似度达到预设阈值的特征向量。在其中一个实施例中,所述获取预设的数据预测模型的步骤之前,还包括:获取多个历史因素数据,根据所述多个历史因素数据生成对应的训练集数据和验证集数据;对所述训练集数据中的多个历史因素数据进行聚类分析,得到聚类结果;对所述聚类结果进行特征提取,提取出多个特征变量;获取预设的神经网络模型,通过所述神经网络模型对所述训练集数据进行训练,得到多个特征变量对应的特征维度值和权重,根据多个特征变量对应的特征维度值和权重构建初始数据预测模型;利用所述验证集数据对所述数据预测模型进行进一步训练和验证,直到所述验证集数据中满足预设阈值的数量达到预设比值时,则停止训练,得到所需的数据预测模型。在其中一个实施例中,所述通过所述数据分析模型对所述特征变量进行训练和分析,得到多个指标数据和对应的预测值的步骤,包括:将所述多个特征向量作为所述数据预测模型的输入,根据所述数据预测模型中的预设函数计算多个特征向量对应的权重;计算多个特征向量与目标特征数据之间的相关性;根据所述特征向量的权重和所述相关性进行回归分析,并通过所述数据预测模型中的输出层输出多个指标数据和对应的预测值。在其中一个实施例中,所述方法还包括:根据预设频率从预设数据库中获取多个历史因素数据;对多个历史因素数据进行聚类分析,得到分析结果;根据所述分析结果进行特征选择,得到多个特征变量;根据预设的算法计算多个特征变量的权重;根据多个特征变量和对应的权重对所述数据预测模型进行优化调整。在其中一个实施例中,所述方法还包括:根据所述请求类型获取预设的集成函数;根据所述预测结果数据中的多个预设时序参数和对应的预测值通过所述集成函数集成对应的视图预测数据;对所述视图预测数据添加事件类型标识和对应的接口调用参数,并将所述视图预测数据发送至所述终端。一种基于机器学习的数据预测处理装置,所述装置包括:请求接收模块,用于接收终端发送的数据预测请求,所述数据预测请求包括请求类型和请求信息;数据获取模块,用于识别所述请求信息中的字段因子,根据所述请求类型和所述字段因子获取多个目标因素数据,所述目标因素数据包括多个字段数据;特征处理模块,用于对所述目标因素数据进行特征处理和特征提取,得到所述多个字段数据对应的特征向量;数据预测模块,用于根据所述请求类型获取预设的数据预测模型,通过所述数据分析模型对所述特征变量进行训练和分析,得到多个指标数据和对应的预测值;结果数据生成模块,用于根据所述多个指标数据和对应的预测值生成的预测结果数据,并将所述预测结果数据推送至所述终端。在其中一个实施例中,所述数据预测模块还用于将所述多个特征向量作为所述数据预测模型的输入,根据所述数据预测模型中的预设函数计算多个特征向量对应的权重;计算多个特征向量与目标特征数据之间的相关性;根据所述特征向量的权重和所述相关性进行回归分析,并通过所述数据预测模型中的输出层输出多个指标数据和对应的预测值。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本申请任意一个实施例中提供的基于机器学习的数据预测处理方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请任意一个实施例中提供的基于机器学习的数据预测处理方法的步骤。上述基于机器学习的数据预测处理方法、装置和计算机设备,终端可以向服务器发送数据预测请求,数据预测请求包括请求类型和请求信息,服务器接收终端发送的数据预测请求后,识别请求信息中的字段因子,进而根据请求类型和字段因子获取多个目标因素数据,目标因素数据包括了多个字段数据。服务器则对目标因素数据进行特征处理和特征提取,得到多个字段数据对应的特征向量。服务器进一步根据请求类型获取预设的数据预测模型,通过数据分析模型对多个特征向量进行分析,得到多个指标数据和对应的预测值,由此能够有效地对目标数据进行预测分析。服务器进而根据多个指标数据和对应的预测值生成预测结果数据,将预测结果数据推送至对应的终端。服务器提取出目标因素数据中的特征向量后,通过数据预测模型进行分析,准确有效地预测未来一段时间内目标数据的发展趋势,由此能够有效提高数据分析和预测的准确率。附图说明图1为一个实施例中基于机器学习的数据预测处理方法的应用场景图;图2为一个实施例中基于机器学习的数据预测处理方法的流程示意图;图3为一个实施例中构建和训练数据预测模型步骤的流程示意图;图4为一个实施例中对数据预测模型进行优化的步骤的流程示意图;图5为一个实施例中基于机器学习的数据预测处理装置的结构框图;图6为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的基于机器学习的数据预测处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。本文档来自技高网...

【技术保护点】
1.一种基于机器学习的数据预测处理方法,所述方法包括:接收终端发送的数据预测请求,所述数据预测请求包括请求类型和请求信息;识别所述请求信息中的字段因子,根据所述请求类型和所述字段因子获取多个目标因素数据,所述目标因素数据包括多个字段数据;对所述目标因素数据进行特征处理和特征提取,得到所述多个字段数据对应的特征向量;根据所述请求类型获取预设的数据预测模型,通过所述数据分析模型对所述特征变量进行训练和分析,得到多个指标数据和对应的预测值;根据所述多个指标数据和对应的预测值生成的预测结果数据,并将所述预测结果数据推送至所述终端。

【技术特征摘要】
1.一种基于机器学习的数据预测处理方法,所述方法包括:接收终端发送的数据预测请求,所述数据预测请求包括请求类型和请求信息;识别所述请求信息中的字段因子,根据所述请求类型和所述字段因子获取多个目标因素数据,所述目标因素数据包括多个字段数据;对所述目标因素数据进行特征处理和特征提取,得到所述多个字段数据对应的特征向量;根据所述请求类型获取预设的数据预测模型,通过所述数据分析模型对所述特征变量进行训练和分析,得到多个指标数据和对应的预测值;根据所述多个指标数据和对应的预测值生成的预测结果数据,并将所述预测结果数据推送至所述终端。2.根据权利要求1所述的方法,其特征在于,所述对所述目标因素数据进行特征处理和特征提取,得到所述多个字段数据对应的特征变量的步骤,包括:对所述目标因素数据对应的多个字段数据进行向量化,得到多个字段数据对应的特征向量;对所述特征变量进行衍生处理,得到处理后的多个特征向量;根据预设的目标函数计算所述特征向量的多个特征维度值;根据预设的距离算法和所述特征维度值计算多个特征向量之间的相似度;提取出所述相似度达到预设阈值的特征向量。3.根据权利要求1所述的方法,其特征在于,所述获取预设的数据预测模型的步骤之前,还包括:获取多个历史因素数据,根据所述多个历史因素数据生成对应的训练集数据和验证集数据;对所述训练集数据中的多个历史因素数据进行聚类分析,得到聚类结果;对所述聚类结果进行特征提取,提取出多个特征变量;获取预设的神经网络模型,通过所述神经网络模型对所述训练集数据进行训练,得到多个特征变量对应的特征维度值和权重,根据多个特征变量对应的特征维度值和权重构建初始数据预测模型;利用所述验证集数据对所述数据预测模型进行进一步训练和验证,直到所述验证集数据中满足预设阈值的数量达到预设比值时,则停止训练,得到所需的数据预测模型。4.根据权利要求1所述的方法,其特征在于,所述通过所述数据分析模型对所述特征变量进行训练和分析,得到多个指标数据和对应的预测值的步骤,包括:将所述多个特征向量作为所述数据预测模型的输入,根据所述数据预测模型中的预设函数计算多个特征向量对应的权重;计算多个特征向量与目标特征数据之间的相关性;根据所述特征向量的权重和所述相关性进行回归分析,...

【专利技术属性】
技术研发人员:陈娴娴阮晓雯徐亮
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1