System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及医疗保健信息学,具体涉及一种呼吸道传染病的早期医疗信息辅助挖掘方法。
技术介绍
1、疾病根据病原体的不同和临床表现的特点,具有不同的传播方式、潜伏期和临床处理方法。通过对早期信息进行数据挖掘,可以提前发现和预警呼吸道传染病的爆发和流行趋势,有助于采取早期干预和控制措施,从而减少疾病的传播和影响范围。然而,现有数据挖掘算法在进行建模时依赖于静态的数据快照,并且假定数据分布和特征不会显著变化。在实际情况中,病原体也会不断进化以适应环境,其早期的呼吸道传染病特征也可能发生变化。此外,现有数据挖掘算法在进行挖掘时往往局限于基本的数据汇总和统计分析,缺乏对于数据之间更深层次的关联分析。这可能导致在进行医疗诊断的过程中缺乏足够的精度。
技术实现思路
1、本专利技术提供一种呼吸道传染病的早期医疗信息辅助挖掘方法,以解决现有的问题。
2、本专利技术的一种呼吸道传染病的早期医疗信息辅助挖掘方法采用如下技术方案:
3、本专利技术一个实施例提供了一种呼吸道传染病的早期医疗信息辅助挖掘方法,该方法包括以下步骤:
4、获取每个患者病历信息登记的时间、特征向量,所述特征向量包含多个病症信息;
5、根据任意两个特征向量的余弦相似度获取所有社区;所述社区包含若干个患者的所有病症信息;根据每个社区中包含的所有病症信息中每种病症信息出现的频率,从每个社区中的所有病症信息中筛选出特征词汇信息构成每个社区的目标特征向量;
6、根据每个患者病历信息登
7、根据预设阈值范围及特征词汇信息在每个季度中的出现频率,获取每个特征词汇信息的频谱图是否存在周期性;根据每个特征词汇信息在每个季度中的出现频率,获取每个特征词汇信息当前时刻的瞬时斜率;
8、根据预设阈值范围、每个特征词汇信息在每个季度中的出现频率、第一斜率、当前时刻的瞬时斜率、每个社区中的出现频率及频谱图是否存在周期性,获取每个特征词汇信息的主流程度;根据每个社区中所有特征词汇信息的主流程度,获取每个社区目标特征向量的主流程度;根据每个社区目标特征向量的时效性与每个社区目标特征向量的主流程度,获取每个社区目标特征向量的参考性;
9、根据每个社区目标特征向量的参考性进行数据挖掘,输出挖掘结果。
10、进一步地,所述根据任意两个特征向量的余弦相似度获取所有社区,包括的具体步骤如下:
11、在所有患者的特征向量中,计算任意两个患者的特征向量的余弦相似度;
12、以任意两个特征向量余弦相似度的倒数为距离,对所有患者的特征向量进行聚类,得到若干聚类簇;
13、按聚类簇中含特征向量的个数对聚类簇进行排序,并按从大到小的顺序依次命名为第一社区,第二社区,以此类推。
14、进一步地,所述根据每个社区中包含的所有病症信息中每种病症信息出现的频率,从每个社区中的所有病症信息中筛选出特征词汇信息构成每个社区的目标特征向量,包括的具体步骤如下:
15、获取每个社区中包含的所有病症信息,统计每个社区中每种病症信息出现的频率,将病症信息出现次数大于第一预设阈值的病症信息,记为特征词汇信息;
16、将每个社区的所有特征词汇信息构成一个向量,并记为每个社区的目标特征向量。
17、进一步地,所述根据每个患者病历信息登记的时间,获取每个社区目标特征向量的时效性,包括的具体步骤如下:
18、将每个患者病历信息登记的时间,作为每个患者特征向量对应的时间;
19、计算每个社区中所有特征向量的对应时间与当前时刻的时间间隔的均值,记为每个社区目标特征向量的时效性。
20、进一步地,所述根据每个社区的目标特征向量和预设阈值范围,获取特征词汇信息在每个季度中的出现频率及第一斜率,包括的具体步骤如下:
21、获取每个社区目标特征向量的每个特征词汇信息在一年内每个季度所有患者的所有病症信息中出现的频率,作为每个特征词汇信息在每个季度中的出现频率;
22、根据每个社区目标特征向量的每个特征词汇信息在每个季度中出现的频率,获取每个特征词汇信息的频率-时间散点图拟合直线的斜率,所述频率-时间散点图的横坐标为季度,纵坐标为频率;
23、当任意一个特征词汇信息拟合直线的斜率不在预设阈值范围内时,将所述任意一个特征词汇信息拟合直线的斜率,记为第一斜率。
24、进一步地,所述根据预设阈值范围及特征词汇信息在每个季度中的出现频率,获取每个特征词汇信息的频谱图是否存在周期性,包括的具体步骤如下:
25、当每个特征词汇信息拟合直线的斜率在预设阈值范围内时,将每个特征词汇信息的频率-时间散点图曲线拟合后进行傅里叶变换得到每个特征词汇信息的频谱图,横坐标为频率,纵坐标为幅值,并得到频谱图是否存在周期性的判断结果。
26、进一步地,所述根据每个特征词汇信息在每个季度中的出现频率,获取每个特征词汇信息当前时刻的瞬时斜率,包括的具体步骤如下:
27、将第v个特征词汇信息在当前时刻所在季度中出现的频率减去第v个特征词汇信息在当前时刻所在季度的前一个季度中出现的频率的差值,记为每个特征词汇信息当前时刻的瞬时斜率。
28、进一步地,所述根据预设阈值范围、每个特征词汇信息在每个季度中的出现频率、第一斜率、当前时刻的瞬时斜率、每个社区中的出现频率及频谱图是否存在周期性,获取每个特征词汇信息的主流程度,包括的具体步骤如下:
29、当每个特征词汇信息的拟合直线的斜率不在预设阈值范围内时,主流程度为每个特征词汇信息的第一斜率与每个特征词汇信息在当前时刻所在季度的前一个季度中每个特征词汇信息的出现频率乘积的归一化值;
30、当每个特征词汇信息的拟合直线斜率在预设阈值范围内,且具有周期性时,主流程度为每个特征词汇信息当前时刻的瞬时斜率与当前时刻到当前时刻所在季度的前一个季度的初始时刻的时间间隔乘积的归一化值;
31、当每个特征词汇信息的拟合直线斜率在预设阈值范围内,且不具有周期性时,主流程度为每个特征词汇信息在所有社区中出现频率的均值。
32、进一步地,所述根据每个社区中所有特征词汇信息的主流程度,获取每个社区目标特征向量的主流程度,包括的具体步骤如下:
33、将每个社区中所有特征词汇信息的主流程度的均值,记为每个社区目标特征向量的主流程度。
34、进一步地,所述根据每个社区目标特征向量的时效性与每个社区目标特征向量的主流程度,获取每个社区目标特征向量的参考性,包括的具体步骤如下:
35、将每个社区目标特征向量的时效性与每个社区目标特征向量的主流程度乘积的归一值,记为每个社区目标特征向量的参考性。
36、本专利技术的技术方案的有益效果是:本专利技术通过分析数据样本中的本文档来自技高网...
【技术保护点】
1.一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,所述根据任意两个特征向量的余弦相似度获取所有社区,包括的具体步骤如下:
3.根据权利要求1所述一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,所述根据每个社区中包含的所有病症信息中每种病症信息出现的频率,从每个社区中的所有病症信息中筛选出特征词汇信息构成每个社区的目标特征向量,包括的具体步骤如下:
4.根据权利要求1所述一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,所述根据每个患者病历信息登记的时间,获取每个社区目标特征向量的时效性,包括的具体步骤如下:
5.根据权利要求1所述一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,所述根据预设阈值范围及特征词汇信息在每个季度中的出现频率,获取每个特征词汇信息的频谱图是否存在周期性,包括的具体步骤如下:
6.根据权利要求5所述一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,所述根据预设阈值
7.根据权利要求1所述一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,所述根据每个社区中所有特征词汇信息的主流程度,获取每个社区目标特征向量的主流程度,包括的具体步骤如下:
8.根据权利要求1所述一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,所述根据每个社区目标特征向量的时效性与每个社区目标特征向量的主流程度,获取每个社区目标特征向量的参考性,包括的具体步骤如下:
...【技术特征摘要】
1.一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,所述根据任意两个特征向量的余弦相似度获取所有社区,包括的具体步骤如下:
3.根据权利要求1所述一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,所述根据每个社区中包含的所有病症信息中每种病症信息出现的频率,从每个社区中的所有病症信息中筛选出特征词汇信息构成每个社区的目标特征向量,包括的具体步骤如下:
4.根据权利要求1所述一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,所述根据每个患者病历信息登记的时间,获取每个社区目标特征向量的时效性,包括的具体步骤如下:
5.根据权利要求1所述一种呼吸道传染病的早期医疗信息辅助挖掘方法,其特征在于,所述根据预设阈值范围及特...
【专利技术属性】
技术研发人员:童佳兵,李泽庚,王新汝,张西安,杨勤军,杨程,方莉,童祥丽,高雅婷,张念志,
申请(专利权)人:安徽中医药大学第一附属医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。