本公开提供了一种异质性疾病病患特征数据的处理方法、装置、设备及介质,其特征在于,所述方法包括:获取同一异质性疾病的多个病患的多个特征的数据;根据所述特征的医学含义确定所述特征的分类阈值,根据所述特征的分类阈值将所述特征对应的所述多个病患的数据进行分组;确定所述特征的各分组的数据量占所述特征的总数据量的比例;确定所述特征的任一分组对应的所述比例不满足比例阈值时,重新对所述特征对应的所述多个病患的数据进行分组;基于重新分组后的各特征的各分组包含的病患特征数据,对所述多个病患进行聚类分析。对所述多个病患进行聚类分析。对所述多个病患进行聚类分析。
【技术实现步骤摘要】
异质性疾病病患特征数据的处理方法、装置、设备及介质
[0001]本公开涉及数据处理
,尤其涉及一种异质性疾病病患特征数据的处理方法、装置、设备及介质。
技术介绍
[0002]异质性医疗状况或异质性疾病是指具有多种病因的医疗状况,如肝炎或糖尿病。异质性疾病通常根据病因分为内型和亚型,内型是根据功能或者病理生理学的机制来进行定义,亚型是通过在临床上收集到的特征来进行定义。通过分析病患的血糖水平、肝脏脂肪含量、体脂分布、血脂水平和遗传风险等关键代谢参数,发现二型糖尿病有六种前期亚型,这六种亚型糖尿病分别有不同的临床特征表现,并且具有不同程度的发病风险。因此,通过对病患的关键代谢参数进行数据分析,可以很好地帮助医生对异质性疾病的亚型特征进行分析。
[0003]在现有技术中,对异质性疾病的病患数据进行处理分析的过程通常为:对收集的病患数据仅仅进行简单的标准化处理后就进行聚类分析,从而导致得到的聚类分析结果的准确度较低。
技术实现思路
[0004]本公开提供了一种异质性疾病病患特征数据的处理方法、装置、设备及介质,以至少解决现有技术中存在的以上技术问题。
[0005]根据本公开的第一方面,提供了一种异质性疾病病患特征数据的处理方法,所述方法包括:获取同一异质性疾病的多个病患的多个特征的数据;根据所述特征的医学含义确定所述特征的分类阈值,根据所述特征的分类阈值将所述特征对应的所述多个病患的数据进行分组;确定所述特征的各分组的数据量占所述特征的总数据量的比例;确定所述特征的任一分组对应的所述比例不满足比例阈值时,重新对所述特征对应的所述多个病患的数据进行分组;基于重新分组后的各特征的各分组包含的病患特征数据,对所述多个病患进行聚类分析。
[0006]在一可实施方式中,所述重新对所述特征对应的所述多个病患的数据进行分组,包括:根据所述特征的医学含义调整所述分类阈值的大小,按照调整后的分类阈值重新将所述特征对应的所述多个病患的数据进行分组。
[0007]在一可实施方式中,确定无法调整所述分类阈值时,将所述特征对应的所述多个病患的数据从小到大进行排序后,按照设定的每个分组对应的比例进行分组。
[0008]在一可实施方式中,根据所述特征的分类阈值将所述特征对应的所述多个病患的数据进行分组,包括:按照所述特征的分类阈值或调整后的分类阈值对所述特征对应的所述多个病患的数据进行分组时,得到第一分组和第二分组,所述第一分组包括的特征的数据小于所述分类阈值,第二分组包括的各特征数据大于等于所述分类阈值。
[0009]在一可实施方式中,对所述多个病患进行聚类分析之前,该方法还包括:为所述第
一分组中各病患的数据分配第一分值,为所述第二分组中各病患的数据分配第二分值,所述第一分值小于所述第二分值,以根据所述第一分值和第二分值形成每一患者的特征向量,并基于所述特征向量进行聚类分析。
[0010]在一可实施方式中,所述方法还包括:根据所述聚类分析结果,当确定所述聚类分析结果不满足预设条件时,再次重新根据所述特征的医学含义确定所述特征的分类阈值的个数,按照调整后的分类阈值重新将所述特征对应的所述多个病患的数据进行分组。
[0011]在一可实施方式中,再次重新根据所述特征的医学含义确定所述特征的分类阈值的个数,按照调整后的分类阈值重新将所述特征对应的所述多个病患的数据进行分组,包括:再次重新根据所述特征的医学含义确定所述特征的分类阈值的个数,所述分类阈值包括第一分类阈值和第二分类阈值,第一分类阈值小于所述第二分类阈值;根据所述第一分类阈值和第二分类阈值对所述特征对应的所述多个病患的数据进行分组,得到第一分组、第二分组和第三分组;所述第一分组包括的各病患的数据小于所述第一分类阈值,所述第二分组包括的各病患的数据大于等于所述第一分类阈值且小于所述第二分类阈值,所述第三分组包括的各病患的数据大于等于所述第二分类阈值。
[0012]在一可实施方式中,对所述多个病患进行聚类分析之前,该方法还包括:为所述第一分组中各病患的数据分配第一分值,为所述第二分组中各病患的数据分配第二分值,为所述第三分组中各病患的数据分配第三分值,所述第一分值小于所述第二分值,所述第二分值小于所述第三分值,以根据所述第一分值、第二分值和第三分值形成每一患者的特征向量,并基于所述特征向量进行聚类分析。
[0013]根据本公开的第二方面,提供了一种异质性疾病病患特征数据的处理装置,其特征在于,所述装置包括:获取单元,用于获取同一异质性疾病的多个病患的多个特征的数据;分组单元,用于根据所述特征的医学含义确定所述特征的分类阈值,根据所述特征的分类阈值将所述特征对应的所述多个病患的数据进行分组;确定单元,用于确定所述特征的各分组的数据量占所述特征的总数据量的比例;所述分组单元,在确定所述特征的任一分组对应的所述比例不满足比例阈值时,还用于重新对所述特征对应的所述多个病患的数据进行分组;聚类分析单元,用于基于重新分组后的各特征的各分组包含的病患特征数据,对所述多个病患进行聚类分析。
[0014]根据本公开的第三方面,提供了一种设备,包括:
[0015]至少一个处理器;以及
[0016]与所述至少一个处理器通信连接的存储器;其中,
[0017]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。
[0018]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开所述的方法。
[0019]本公开的异质性疾病病患特征数据的处理方法、装置、设备及介质,通过将同一异质性疾病的多个病患的多个特征的数据,根据特征的医学含义,确定对应的分类阈值并进行分组,使得每个特征下的数据在分组后仍保留了相应的医学含义。判断每个分组中病患数据占总数据量的比例,并在确定特征的任一分组对应的所述比例不满足比例阈值时,重新对所述特征对应的多个病患的数据进行分组,如此,保证每个分组所占的比例均衡。基于
分组后病患数据进行聚类分析,如此,得到的聚类分析结果也同样结合了医学知识的判断,同时提高了聚类分析结果的准确度。
[0020]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0021]通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
[0022]在附图中,相同或对应的标号表示相同或对应的部分。
[0023]图1示出了本公开实施例异质性疾病病患特征数据的处理方法的实现流程示意图;
[0024]图2示出了本公开实施例聚类方法的实现流程示意图;
[0025]图3示出了本公开实施例异质性疾病病患特征数据的本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种异质性疾病病患特征数据的处理方法,其特征在于,所述方法包括:获取同一异质性疾病的多个病患的多个特征的数据;根据所述特征的医学含义确定所述特征的分类阈值,根据所述特征的分类阈值将所述特征对应的所述多个病患的数据进行分组;确定所述特征的各分组的数据量占所述特征的总数据量的比例;确定所述特征的任一分组对应的所述比例不满足比例阈值时,重新对所述特征对应的所述多个病患的数据进行分组;基于重新分组后的各特征的各分组包含的病患特征数据,对所述多个病患进行聚类分析。2.根据权利要求1所述异质性疾病病患特征数据的处理方法,所述重新对所述特征对应的所述多个病患的数据进行分组,包括:根据所述特征的医学含义调整所述分类阈值的大小,按照调整后的分类阈值重新将所述特征对应的所述多个病患的数据进行分组。3.根据权利要求2所述异质性疾病病患特征数据的处理方法,所述方法还包括:确定无法调整所述分类阈值时,将所述特征对应的所述多个病患的数据从小到大进行排序后,按照设定的每个分组对应的比例进行分组。4.根据权利要求1或2所述异质性疾病病患特征数据的处理方法,其特征在于,根据所述特征的分类阈值将所述特征对应的所述多个病患的数据进行分组,包括:按照所述特征的分类阈值或调整后的分类阈值对所述特征对应的所述多个病患的数据进行分组时,得到第一分组和第二分组,所述第一分组包括的特征的数据小于所述分类阈值,第二分组包括的各特征数据大于等于所述分类阈值。5.根据权利要求4所述异质性疾病病患特征数据的处理方法,其特征在于,对所述多个病患进行聚类分析之前,该方法还包括:为所述第一分组中各病患的数据分配第一分值,为所述第二分组中各病患的数据分配第二分值,所述第一分值小于所述第二分值,以根据所述第一分值和第二分值形成每一患者的特征向量,并基于所述特征向量进行聚类分析。6.根据权利要求1或2所述异质性疾病病患特征数据的处理方法,其特征在于,所述方法还包括:根据所述聚类分析结果,当确定所述聚类分析结果不满足预设条件时,再次重新根据所述特征的医学含义确定所述特征的分类阈值的个数,按照调整后的分类阈值重新将所述特征对应的所述多个病患的数据进行分组。7.根据权利要求6所述的异质性疾病病患特征数据的处理方法,其特征在于,再次重新根据所述特征的医学含义确定所述特征的...
【专利技术属性】
技术研发人员:崔梦璇,王尧,
申请(专利权)人:医渡云北京技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。