【技术实现步骤摘要】
基于算法和区块链的生物大数据分析、疾病精准识别分类预测系统
[0001]本专利技术创造涉及生物大数据领域,具体涉及一种基于算法和区块链的生物大数据分析、疾病精准识别分类预测系统。
技术介绍
[0002]随着高通量生物技术的快速发展,使得生物医学领域产生了大量不同类型的生物数据,这些生物数据中包含医生和研究人员用来了解病人患有何种疾病的信息,并确定应该用于临床管理的可能治疗方案,因此,这些生物数据对了解人类生物学和我们遇到的疾病至关重要。通过生物技术的进步,生物技术中的信息现在可以被轻易的提取,导致大量的数字数据以机器可读的形式被捕获。这种生物特异性的“数据化”产生不同类型的生物数据,反映疾病中正在发生的分子事件。在建立个性化的疾病治疗框架时,必须以有意义和可操作的方式来对生物大数据进行分析,从而从生物大数据中捕获疾病信息。
[0003]支持向量机是数据挖掘中的一种技术,利用最优化的方法使其可以处理机器学习相关问题,这种方法在最近几年取得了很大的发展,成为了解决“过学习”和“维数灾难”等问题的重要方法。将支持向量机用于疾病预测中,能够有效的研究生物大数据和疾病之间的关联,从而实现对疾病的有效预测。而支持向量机存在参数选择的问题,参数选择的不同会直接影响支持向量机的预测精度和泛化能力。近年来不少学者对支持向量机中参数寻优的方法进行改进,基于布谷鸟算法对支持向量机的参数寻优的效果相较其他方法更为优秀,但同样也存在一些不足,如布谷鸟算法寻优精度不够高,收敛速度较慢等。
技术实现思路
[0004]针对上 ...
【技术保护点】
【技术特征摘要】
1.基于算法和区块链的生物大数据分析、疾病精准识别分类预测系统,其特征在于,包括多个数据端、区块链存储模块和生物数据分析平台;数据端:包括用户登录单元、数据上传单元和健康报告显示单元,用户在用户登录单元通过登录密码在数据端进行登录,用户在登录数据端后通过数据上传单元向区块链存储模块和生物数据分析平台上传用户的身份信息和用户的生物数据,所述健康报告显示单元用于显示数据端接收到的用户的健康报告;区块链存储模块:用于存储各数据端上传的生物数据;生物数据分析平台:包括生物数据库、数据预处理单元、数据分析单元和健康报告生成单元,所述生物数据库中存储有带疾病标签的生物大数据,并按照给定的更新周期调取区块链存储模块中未被调取的生物大数据进行存储,从而对生物数据库中的生物大数据进行更新,将更新后的生物数据库中的生物大数据输入至数据预处理单元,所述数据预处理单元在每次接收到新的生物大数据时,对接收到的生物大数据进行归一化处理,并采用半监督聚类算法将归一化处理后的生物大数据进行聚类,从而对所述生物大数据中未带疾病标签的生物数据进行标记,将聚类所得的各个类作为样本子集输入至数据分析单元,数据分析单元在接收到新的样本子集时,根据所述新的样本子集和其对应的疾病标签对支持向量机重新进行训练和测试,从而建立基于生物数据的疾病预测模型,所述健康报告生成单元用于将接收到的用户的生物数据写入当前的疾病预测模型中,并根据疾病预测模型的输出结果生成用户的健康报告,将生成的用户的健康报告传输至用户对应的数据端,并在健康报告显示单元进行显示。2.根据权利要求1所述的基于算法和区块链的生物大数据分析、疾病精准识别分类预测系统,其特征在于,所述用户的健康报告包括用户的身份信息和用户的疾病标签。3.根据权利要求1所述的基于算法和区块链的生物大数据分析、疾病精准识别分类预测系统,其特征在于,所述生物数据库包括有标签生物数据库和无标签生物数据库,所述有标签生物数据库用于存储带疾病标签的生物大数据,所述无标签生物数据库每隔给定的更新周期在区块链存储模块中调取未被调取的生物大数据进行存储,从而对无标签生物数据库中的生物大数据进行更新,将有标签生物数据库中的生物大数据和更新后的无标签生物数据库中的生物大数据输入数据预处理单元。4.根据权利要求1所述的基于算法和区块链的生物大数据分析、疾病精准识别分类预测系统,其特征在于,利用布谷鸟算法对数据分析单元的支持向量机的惩罚因子和核函数参数进行寻优。5.根据权利要求4所述的基于算法和区块链的生物大数据分析、疾病精准识别分类预测系统,其特征在于,在所述布谷鸟算法中,设x
i
(t)表示种群中的第i个鸟巢在第t次采用莱维飞行模式进行更新后保留下来的位置,X
i
(t)表示种群中的第i个鸟巢在第t次迭代更新后保留下来的位置,p
a
表示发现概率,鸟巢位置x
i
(t)随机产生0到1之间的随机数rand,当该随机数rand≤p
a
时,则X
i
(t)=x
i
(t);当该随机数rand>p
a
时,则采用下列方式确定X
i
(t)的值:设x
j
(t)表示种群中第j个鸟巢在第t次采用莱维飞行模式进行更新后保留下来的位置,当鸟巢位置x
j
(t)满足:f(x
j
(t))<f(x
i
(t))时,则将鸟巢位置x
j
(t)加入到集合M
i
(t)中,其中,M
i
(t)表示种群中相较于鸟巢位置x
i
(t)的较优鸟巢位置集合,f(x
j
(t))表示鸟巢位置x
j
(t)对应的适应度函数值,f(x
i
(t))表示鸟巢位置x
i
(t)对应的适应度函数值;将集合M
i
(t)中的鸟巢位置按照其距离鸟巢位置x
i
(...
【专利技术属性】
技术研发人员:罗学敏,李益非,樊心敏,
申请(专利权)人:云南升玥信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。