基于机器学习的数据预测处理方法、装置和计算机设备制造方法及图纸

技术编号：21456347 阅读：28 留言：0更新日期：2019-06-26 05:34

本申请涉及一种基于机器学习的数据预测处理方法、装置和计算机设备。所述方法包括：接收终端发送的数据预测请求，数据预测请求包括请求类型和请求信息；识别请求信息中的字段因子，根据请求类型和字段因子获取多个目标因素数据，目标因素数据包括多个字段数据；对目标因素数据进行特征处理和特征提取，得到多个字段数据对应的特征向量；根据请求类型获取预设的数据预测模型，通过数据分析模型对特征变量进行训练和分析，得到多个指标数据和对应的预测值；根据多个指标数据和对应的预测值生成的预测结果数据，并将预测结果数据推送至终端。采用本方法能够有效提高对数据分析和预测的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于机器学习的数据预测处理方法、装置和计算机设备
本申请涉及计算机
，特别是涉及一种基于机器学习的数据预测处理方法、装置和计算机设备。
技术介绍
流行性传染病是指由各种致病性微生物或病原体引起的具有传染性的疾病，如登革热、流行性病毒感冒、脑膜炎、霍乱等。由于传染病具有传播的特性，能在较短的时间内广泛蔓延，是危害人类身体健康，威胁人类生命安全的重要疾病。例如，登革热(dengue)是登革病毒经蚊媒传播引起的急性虫媒传染病，起病骤降危害大。登革热周发病人数波动较频繁，虽然每年有一定的爆发期规律，但波动周期紊乱不固定，波动幅度变换很大，因此3-5年长期预测的误差较难控制，预测难度非常高。随着计算机技术的迅速发展，出现了一些通过对已有的数据进行分析，从而对发病情况进行预测。但现有的方式中对发病情况进行分析的数据源较少，而影响发病情况的因素较多且有不稳定型，导致对数据进行分析预测的准确率较低。
技术实现思路
基于此，有必要针对上述技术问题，提供一种能够有效提高对数据分析和预测的准确率的基于机器学习的数据预测处理方法、装置和计算机设备。一种基于机器学习的数据预测处理方法，所述方法包括：接收终端发送的数据预测请求，所述数据预测请求包括请求类型和请求信息；识别所述请求信息中的字段因子，根据所述请求类型和所述字段因子获取多个目标因素数据，所述目标因素数据包括多个字段数据；对所述目标因素数据进行特征处理和特征提取，得到所述多个字段数据对应的特征向量；根据所述请求类型获取预设的数据预测模型，通过所述数据分析模型对所述特征变量进行训练和分析，得到多个指标数据和对应的预测值；根据...

【技术保护点】
1.一种基于机器学习的数据预测处理方法，所述方法包括：接收终端发送的数据预测请求，所述数据预测请求包括请求类型和请求信息；识别所述请求信息中的字段因子，根据所述请求类型和所述字段因子获取多个目标因素数据，所述目标因素数据包括多个字段数据；对所述目标因素数据进行特征处理和特征提取，得到所述多个字段数据对应的特征向量；根据所述请求类型获取预设的数据预测模型，通过所述数据分析模型对所述特征变量进行训练和分析，得到多个指标数据和对应的预测值；根据所述多个指标数据和对应的预测值生成的预测结果数据，并将所述预测结果数据推送至所述终端。

【技术特征摘要】
1.一种基于机器学习的数据预测处理方法，所述方法包括：接收终端发送的数据预测请求，所述数据预测请求包括请求类型和请求信息；识别所述请求信息中的字段因子，根据所述请求类型和所述字段因子获取多个目标因素数据，所述目标因素数据包括多个字段数据；对所述目标因素数据进行特征处理和特征提取，得到所述多个字段数据对应的特征向量；根据所述请求类型获取预设的数据预测模型，通过所述数据分析模型对所述特征变量进行训练和分析，得到多个指标数据和对应的预测值；根据所述多个指标数据和对应的预测值生成的预测结果数据，并将所述预测结果数据推送至所述终端。2.根据权利要求1所述的方法，其特征在于，所述对所述目标因素数据进行特征处理和特征提取，得到所述多个字段数据对应的特征变量的步骤，包括：对所述目标因素数据对应的多个字段数据进行向量化，得到多个字段数据对应的特征向量；对所述特征变量进行衍生处理，得到处理后的多个特征向量；根据预设的目标函数计算所述特征向量的多个特征维度值；根据预设的距离算法和所述特征维度值计算多个特征向量之间的相似度；提取出所述相似度达到预设阈值的特征向量。3.根据权利要求1所述的方法，其特征在于，所述获取预设的数据预测模型的步骤之前，还包括：获取多个历史因素数据，根据所述多个历史因素数据生成对应的训练集数据和验证集数据；对所述训练集数据中的多个历史因素数据进行聚类分析，得到聚类结果；对所述聚类结果进行特征提取，提取出多个特征变量；获取预设的神经网络模型，通过所述神经网络模型对所述训练集数据进行训练，得到多个特征变量对应的特征维度值和权重，根据多个特征变量对应的特征维度值和权重构建初始数据预测模型；利用所述验证集数据对所述数据预测模型进行进一步训练和验证，直到所述验证集数据中满足预设阈值的数量达到预设比值时，则停止训练，得到所需的数据预测模型。4.根据权利要求1所述的方法，其特征在于，所述通过所述数据分析模型对所述特征变量进行训练和分析，得到多个指标数据和对应的预测值的步骤，包括：将所述多个特征向量作为所述数据预测模型的输入，根据所述数据预测模型中的预设函数计算多个特征向量对应的权重；计算多个特征向量与目标特征数据之间的相关性；根据所述特征向量的权重和所述相关性进行回归分析，...

【专利技术属性】
技术研发人员：陈娴娴，阮晓雯，徐亮，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人