大数据智能设备进行数据提取工作方法技术

技术编号:19861638 阅读:30 留言:0更新日期:2018-12-22 12:39
本发明专利技术提出了一种大数据智能设备进行数据提取工作方法,包括如下步骤:S1,根据遗传算法形成特定区域患者疾病形成的计算模型,通过对疾病种类预测以及选择医院频率预测形成初步计算条件;S2,设置患者分布的权重规则条件,形成患者分布的目标函数构建体系,从而筛选出患者诊断分布结果;S3,根据患者诊断分布结果形成均衡图划分算法,最终对患者诊断布局做出准确提炼。

【技术实现步骤摘要】
大数据智能设备进行数据提取工作方法
本专利技术涉及计算机数据挖掘领域,尤其涉及一种大数据智能设备进行数据提取工作方法。
技术介绍
当今社会,患者希望通过先进的技术手段进行疾病的诊断和治疗,但是又苦于到医院门诊就医时候人满为患的烦恼,这就催生了通过远程进行诊断疾病的方法,但是现有技术进行医生匹配或者药物查询信息匹配度并不准确,也不能完全智能准确匹配患者的症状信息,以及患者诊断的数据收集工作,这就亟需本领域技术人员解决相应的技术问题。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种大数据智能设备进行数据提取工作方法。为了实现本专利技术的上述目的,本专利技术提供了一种大数据智能设备进行数据提取工作方法,包括如下步骤:S1,根据遗传算法形成特定区域患者疾病形成的计算模型,通过对疾病种类预测以及选择医院频率预测形成初步计算条件;S2,设置患者分布的权重规则条件,形成患者分布的目标函数构建体系,从而筛选出患者诊断分布结果;S3,根据患者诊断分布结果形成飞跃式均衡图划分算法,最终对患者诊断布局做出准确提炼。优选的,所述S1包括:S1-1,疾病诊断预测模型:其中,a1为初期诊断记录值;a2为中期诊断记录值;a3为晚期诊断记录值;wa为疾病诊断程度权重,pi为疾病动态变化趋势量;ri为疾病治疗完成量;为疾病动态变化随机干扰分量,γ为平衡系数,m为正整数;S1-2,选择医院频率预测模型:其中,b1为街道诊所就医频率预测值;b2为区级医院就医频率预测值;b3为二级甲等医院就医频率预测值;b4为三级甲等医院就医频率预测值;R为诊断周期分量;Vj为诊断出诊率随机干扰分量,t为响应周期,为诊断偏差因子,μ为诊断费用消耗增量因子,β为延误诊断影响系数,Ψ为正态适度响应值,Aj为诊断次数动态预测值。优选的,所述S2包括:S2-1,对于患者分布考虑到各种特性之间的相关性,定义N为诊断后确诊数据,L为诊断后未确诊数据,M为未诊断数据,Sk为病症种类分量,B为偏移值,为诊断后确诊数据限制函数,为诊断后未确诊数据限制函数,为未诊断数据限制函数,患者诊断后确诊实例xk,患者诊断后未确诊实例yk,患者未诊断实例zk,构建相关性权重规则如下:xk,yk∈N+Lorxk,yk,zk∈N+L+M;S2-2,进行患者分布目标函数构建,形成患者诊断数据的目标函数算法如下:w为诊断次数的偏置项,δ为诊断数据噪声,Pi(k)为患者诊断医院选择过程向量,k为患者数量,eW为迭代分量,字母W为区分度,下标i为正整数;用该目标函数来度量过程向量Ci(k)的平滑状态值;得到的平滑部分和高斯混合模型的似然估计进行线性组合,其中为患者诊断后确诊估计因子,为患者诊断后未确诊估计因子,为患者未诊断估计因子,为患者诊断后确诊获取样本,为患者诊断后未确诊获取样本,为患者未诊断获取样本,为患者诊断后确诊损失样本,为患者诊断后未确诊损失样本,为患者未诊断损失样本,该算法不仅考虑了数据的正态分布信息,也考虑了数据间的几何结构信息通过度量平滑度最终将患者分布相关度进行优化划分做准备。优选的,所述S3包括:S3-1,采用标签传播的方法,每次迭代过程中进行患者相关度匹配,从而对患者诊断过程中提炼出相关患者经常入住的医院和医院级别;S3-2,为了防止过大的提炼数据集出现,对数据集的规模以及迭代次数进行了限制,每个数据集规模条件为TV为获取诊断数据的极值,τ表示数据集获取系数,r为诊断样本分类数,Z为正整数;S3-3,载入提炼数据集规模条件进行累加之后,如果其中为提炼诊断符合度,形成最大值的提炼数据集把患者诊断数据进行收集。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:通过对疾病种类预测以及选择医院频率预测形成初步计算条件;从而筛选出患者诊断分布结果;该算法不仅考虑了数据的正态分布信息,也考虑了数据间的几何结构信息通过度量平滑度最终将患者分布相关度进行优化划分做准备;然后完成最大值的提炼数据集,把患者诊断数据进行收集整理。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术工作流程图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。如图1所示,一种大数据智能设备进行数据提取工作方法,其特征在于,包括如下步骤:S1,根据遗传算法形成特定区域患者疾病形成的计算模型,通过对疾病种类预测以及选择医院频率预测形成初步计算条件;S2,设置患者分布的权重规则条件,形成患者分布的目标函数构建体系,从而筛选出患者诊断分布结果;S3,根据患者诊断分布结果形成均衡图划分算法,最终对患者诊断布局做出准确提炼。优选的,所述S1包括:S1-1,疾病诊断预测模型:其中,a1为初期诊断记录值;a2为中期诊断记录值;a3为晚期诊断记录值;wa为疾病诊断程度权重,pi为疾病动态变化趋势量;ri为疾病治疗完成量;为疾病动态变化随机干扰分量,γ为平衡系数,m为正整数;S1-2,选择医院频率预测模型:其中,b1为街道诊所就医频率预测值;b2为区级医院就医频率预测值;b3为二级甲等医院就医频率预测值;b4为三级甲等医院就医频率预测值;R为诊断周期分量;Vj为诊断出诊率随机干扰分量,t为响应周期,为诊断偏差因子,μ为诊断费用消耗增量因子,β为延误诊断影响系数,Ψ为正态适度响应值,Aj为诊断次数动态预测值。优选的,所述S2包括:S2-1,对于患者分布考虑到各种特性之间的相关性,定义N为诊断后确诊数据,L为诊断后未确诊数据,M为未诊断数据,Sk为病症种类分量,B为偏移值,为诊断后确诊数据限制函数,为诊断后未确诊数据限制函数,为未诊断数据限制函数,患者诊断后确诊实例xk,患者诊断后未确诊实例yk,患者未诊断实例zk,构建相关性权重规则如下:xk,yk∈N+Lorxk,yk,zk∈N+L+M;S2-2,进行患者分布目标函数构建,形成患者诊断数据的目标函数算法如下:w为诊断次数的偏置项,δ为诊断数据噪声,Pi(k)为患者诊断医院选择过程向量,k为患者数量,eW为迭代分量,字母W为区分度,下标i为正整数;用该目标函数来度量过程向量Ci(k)的平滑状态值;得到的平滑部分和高斯混合模型的似然估计进行线性组合,其中为患者诊断后确诊估计因子,为患者诊断后未确诊估计因子,为患者未诊断估计因子,为患者诊断后确诊获取样本,为患者诊断后未确诊获取样本,为患者未诊断获取样本,为患者诊断后确诊损失样本,为患者诊断后未确诊损失样本,为患者未诊断损失样本,该算法不仅考虑了数据的正态分布信息,也考虑了数据间的几何结构信息通过度量平滑度最终将患者分布相关度进行优化划分做准备。优选的,所述S3包括:S3-1,采用标签传播的方法,每次迭代过程中进行患者相关度匹配,从而对患者诊断过程中提炼出相关患者经常入住的医院和医院级别;S3-2,为了防止过大的提炼数据集出现,对数据集的规模以及迭代次数进行了限制,每个本文档来自技高网...

【技术保护点】
1.一种大数据智能设备进行数据提取工作方法,其特征在于,包括如下步骤:S1,根据遗传算法形成特定区域患者疾病形成的计算模型,通过对疾病种类预测以及选择医院频率预测形成初步计算条件;S2,设置患者分布的权重规则条件,形成患者分布的目标函数构建体系,从而筛选出患者诊断分布结果;S3,根据患者诊断分布结果形成飞跃式均衡图划分算法,最终对患者诊断布局做出准确提炼。

【技术特征摘要】
1.一种大数据智能设备进行数据提取工作方法,其特征在于,包括如下步骤:S1,根据遗传算法形成特定区域患者疾病形成的计算模型,通过对疾病种类预测以及选择医院频率预测形成初步计算条件;S2,设置患者分布的权重规则条件,形成患者分布的目标函数构建体系,从而筛选出患者诊断分布结果;S3,根据患者诊断分布结果形成飞跃式均衡图划分算法,最终对患者诊断布局做出准确提炼。2.根据权利要求1所述的大数据智能设备进行数据提取工作方法,其特征在于,所述S1包括:S1-1,疾病诊断预测模型:其中,a1为初期诊断记录值;a2为中期诊断记录值;a3为晚期诊断记录值;wa为疾病诊断程度权重,pi为疾病动态变化趋势量;ri为疾病治疗完成量;为疾病动态变化随机干扰分量,γ为平衡系数,m为正整数;S1-2,选择医院频率预测模型:其中,b1为街道诊所就医频率预测值;b2为区级医院就医频率预测值;b3为二级甲等医院就医频率预测值;b4为三级甲等医院就医频率预测值;R为诊断周期分量;Vj为诊断出诊率随机干扰分量,t为响应周期,为诊断偏差因子,μ为诊断费用消耗增量因子,β为延误诊断影响系数,Ψ为正态适度响应值,Aj为诊断次数动态预测值。3.根据权利要求1所述的大数据智能设备进行数据提取工作方法,其特征在于,所述S2包括:S2-1,对于患者分布考虑到各种特性之间的相关性,定义N为诊断后确诊数据,L为诊断后未确诊数据,M为未诊断数据,Sk为病症种类分量,B为偏移值,为诊断后确诊数据限制函数,为诊断后未确诊数据限制函数,为未诊断数据限制函数,...

【专利技术属性】
技术研发人员:刘玉蓉
申请(专利权)人:重庆市智权之路科技有限公司
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1