System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及医疗,具体为一种盆底疾病数据挖掘系统、方法及存储介质。
技术介绍
1、随着信息技术的迅猛发展,数据的生成速度变得越来越快,数据量也呈现出爆炸性增长,多模态的盆底诊断和治疗手段也越来越多,对应所采集到的多模态数据也越来越多,对处理此海量的数据的复杂非线性关系、数据模型和关联性等问题成了重中之重。
2、在这种背景下,从海量的盆底数据中提取出有价值的信息和知识,是当下研究的重点。在盆底疾病中,所检查科目多、数据量诊断的各项数据之间相互独立,难以形成一体的、不便于医生观察和医疗科研人员大、维度高且结构复杂,难以建模分析,目前院端所获取的盆底疾病检查和研究的统一数据库,因而可能会给医疗决策准确性和个性化治疗效果带来负面的影响,而且在盆底疾病数据挖掘领域,通常会使用决策树的方法,常规的决策树算法倾向于生成复杂的模型,此模型在训练数据上表现良好,但在新数据上的性能下降,缺乏泛化能力,从而过度拟合了训练数据中的噪声和异常值。采用神经网络处理复杂的非线性关系时,有训练耗时和参数设置敏感等问题,而且神经网络的黑箱性质也意味着其决策过程难以解释和理解。
技术实现思路
1、本专利技术的目的在于提供一种盆底疾病数据挖掘系统、方法及存储介质,以解决上述
技术介绍
中提出的问题。
2、在一个实施方式中,为了解决上述技术问题,本专利技术提供如下技术方案:一种盆底疾病数据挖掘方法,该方法包括以下步骤:
3、步骤s1、将采集到的盆底疾病用户数据进行建库建表整理存储,并对其
4、步骤s2、使用模式集成方法将来自盆底检查科室、盆底检查项目、其他检查项目结果的数据组合成盆底数据集,并检测数据的冲突检测和冲突解决;
5、步骤s3、对盆底数据集进行数据降维,对数据进行去冗降维处理,降低模式集成处理后的盆底数据集维度;
6、步骤s4、对降维后的盆底疾病数据进行聚类分析,根据盆底数据集的数据相似性和差异性以及聚类进行划分,对数据进行深层次整理;
7、步骤s5、对输出症候对应的所有检查条目中的权重与诊断正确率进行计算,将盆底数据集中的数据进行深层次的数据除冗;
8、步骤s6、对盆底医疗数据进行数据挖掘,并将挖掘的数据进行存储,通过指令响应完成数据操作。
9、进一步的,根据上述技术方案,在步骤s1中,对盆底疾病用户数据库中的数据进行隐私保护使用paillier同态加密对数据加密,加密使用如下公式:
10、
11、其中,k为盆底疾病用户数据库解密的秘钥,x、y分别代表不同的加密信息,ek(·)表示使用秘钥为k后的加密结果,上式表示,左右两边的加密操作等效;
12、paillier同态加密方案的过程为:选取两个素数p和q以及整数g∈(z/n2z)*,令n=p·q,定义函数l(x):
13、
14、gcd(l(gμmod(n2)),n2)=1
15、其中,n、g为公钥,μ是私钥,z是集合群,是zn中所有可逆元素的模n同余类所构成的集合群,gcd(*)表示计算其中数字的最大公约数;
16、模反元素μ的计算过程如下:
17、μ(n)=lcm((p-1)/(q-1))
18、其中,μ(n)为私钥,lcm(*)表示最小公倍数;
19、加密过程为:对于明文m∈zn,选取随机数密文c=e(m)=gmrnmodn2;
20、敏感信息加密后的解密过程为:对应密文c,对应明文为:
21、
22、中文或英文的字符使用ascii码进行转码再加密,隐私疾病数据值直接加密,加密过程为:
23、rawdataec=encryption(rawdata)
24、解密过程为:
25、rawdata=decryption(rawdataec)
26、其中,rawdataec表示为加密后的数据,encryption表示为加密,rawdata表示为原始数据,decryption表示为解密。
27、通过上述的方法,可以将盆底疾病用户数据库中的隐私信息例如:姓名、重点隐私疾病数据值等。其中,中文或英文的字符可以使用ascii码进行转码再加密,隐私疾病数据值可以直接加密。
28、进一步的,根据上述技术方案,在步骤s2中,所述使用模式集成方法将来自多个盆底检查科室、多个盆底检查项目、多个其他检查项目结果的数据组合成盆底数据集;
29、使用模式集成方法对数据进行冲突检测和冲突解决;具体过程为,对预处理后去除噪声、处理缺失值和异常值的数据进行必要的格式化和标准化,保证不同数据源的数据在格式和单位上保持一致,对比来自不同数据源的数据值查找不一致的地方,使用常规的基于规则的方法、统计学方法或机器学习算法和技术,以识别和解决冲突;
30、将盆底检查的数据进行集成、规约、统一单位、填充遗漏值和噪音数据转化为平滑数据,自动识别相同字符串和重复数据,对其数据进行删除和标记;模式集成和数据规约的转化过程用以下公式:
31、data_corr=corr(rawdataec)
32、其中,corr(2)表示计算数据的相关性,rawdataec表示为加密后的数据,data_corr表示为加密后数据的相关性;
33、使用pearson相关系数衡量变量间的线性关系,计算公式如下:
34、
35、其中,x和y表示在rawdata原始数据中的两个模态的数据,和表示对于x和y的平均值,r值表示pearson相关系数,该值的大小表示两种数据的相关强弱关系。
36、通过模式集成方法,将来自多个盆底检查科室、多个盆底检查项目、多个其他检查项目结果的数据组合成盆底数据集。具体地,将盆底超声中数据例如:宫体大小、形态状态、子宫内膜厚度、是否有明显异常回声、静息状态残余尿量、膀胱尿道后角、尿道倾斜角、膀胱经参考线相对位置等,盆底功能评估中的肌电数据例如:前后静息肌电值、快肌肌电平均值、慢肌肌电平均值、变异性等,盆底压力评估中的压力数据等海量数据。
37、进一步的,根据上述技术方案,在步骤s3中,所述盆底数据集进行数据降维过程为:
38、使用pca方法对步骤s2转化的data_corr数据进行降维处理,对于数据集data_corr,设有m个样本,每个样本有n个维度,该假设样本表达式为:
39、
40、其中,x1,x2,...,xm代表不同维度上的样本数据,fn表示不同横向数据下的特征;
41、对于数据中的每个维度计算所有样本均值,将每个维度进行去中心化,具体为:
42、
43、数据去中心化后,每个维度下的均值均为0,将每个维度中每2个组合成一个矩阵,可以得到一个n2的协方差矩阵,表示如下:
44、
45、其本文档来自技高网...
【技术保护点】
1.一种盆底疾病数据挖掘方法,其特征在于,所述盆底疾病数据挖掘方法包括以下步骤:
2.根据权利要求1所述的一种盆底疾病数据挖掘方法,其特征在于:在步骤S1中,所述对盆底疾病用户数据库中的数据进行隐私保护过程如下:
3.根据权利要求1所述的一种盆底疾病数据挖掘方法,其特征在于:在步骤S2中,所述模式集成方法包括:
4.根据权利要求1所述的一种盆底疾病数据挖掘方法,其特征在于:在步骤S3中,所述盆底数据集进行数据降维过程为:
5.根据权利要求1所述的一种盆底疾病数据挖掘方法,其特征在于:在步骤S4中,所述盆底疾病数据进行聚类分析过程为:
6.根据权利要求1所述的一种盆底疾病数据挖掘方法,其特征在于:在步骤S5中,所述输出症候对应的所有检查条目中权重与诊断正确率进行计算公式如下:
7.根据权利要求1所述的一种盆底疾病数据挖掘方法,其特征在于:在步骤S6中,所述盆底医疗数据进行数据挖掘过程为:
8.一种盆底疾病数据挖掘系统,应用于权利要求1-7任意一项所述的一种盆底疾病数据挖掘方法,其特征在于:所述挖掘系
9.根据权利要求8所述的一种盆底疾病数据挖掘系统,其特征在于:所述挖掘系统还包括数据降维模块、聚类分析模块和数据挖掘模块;
10.一种存储介质,其特征在于:所述存储介质上存储有计算机指令,所述计算机指令被处理器执行时,可实现权利要求1-7中任一步骤所述的一种盆底疾病数据挖掘方法的数据操作。
...【技术特征摘要】
1.一种盆底疾病数据挖掘方法,其特征在于,所述盆底疾病数据挖掘方法包括以下步骤:
2.根据权利要求1所述的一种盆底疾病数据挖掘方法,其特征在于:在步骤s1中,所述对盆底疾病用户数据库中的数据进行隐私保护过程如下:
3.根据权利要求1所述的一种盆底疾病数据挖掘方法,其特征在于:在步骤s2中,所述模式集成方法包括:
4.根据权利要求1所述的一种盆底疾病数据挖掘方法,其特征在于:在步骤s3中,所述盆底数据集进行数据降维过程为:
5.根据权利要求1所述的一种盆底疾病数据挖掘方法,其特征在于:在步骤s4中,所述盆底疾病数据进行聚类分析过程为:
6.根据权利要求1所述的一种盆底疾病数据挖掘方法,其特征在于:在步骤s5中,所述输出症候对...
【专利技术属性】
技术研发人员:吕志伟,马掌印,毕正扬,李苗,
申请(专利权)人:南京麦澜德医疗科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。