System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及预测异常流程环节,具体涉及一种肾脏病生物样本库的样本信息溯源方法。
技术介绍
1、肾脏病是一种影响肾功能和结构的疾病,为了研发出对肾脏病进行有效治疗的药物,需要对肾脏病生物样本进行研究。在对肾脏病生物样本进行研究的过程中要确保肾脏病生物样本的有效性和正常性,在实际情况中肾脏病生物样本从采集到研究的过程中容易出现丢失和污染等异常现象,为了避免肾脏病生物样本出现异常,需要对肾脏病生物样本从采集、分发、使用和销毁等全过程进行溯源,分析具体环节流程的异常情况,及时增加风险管控,有效避免造成肾脏病生物样本异常的原因。
2、在现有方法中通过fp树(frequent pattern tree)对异常肾脏病生物样本的流程信息进行溯源,根据人为设定的支持度阈值预测出异常环节流程,及时对肾脏病生物样本的相关异常流转流程做出处理和风险规避,降低肾脏病生物样本的异常现象。但在实际情况中人为设定的支持度阈值不准确,通过fp树(frequent pattern tree)对异常肾脏病生物样本的流程信息进行溯源的过程中,过大或者过小的支持度阈值都会导致异常环节流程预测不准确,导致无法准确预测出容易造成肾脏病生物样本异常的流转流程,进而无法准确及时进行异常风险的处理和规避,无法有效降低肾脏病生物样本出现异常现象。
技术实现思路
1、为了解决人为设定的支持度阈值不准确,导致异常环节流程预测不准确,进而无法有效降低肾脏病生物样本出现异常的技术问题,本专利技术的目的在于提供一种肾脏病生物样本库
2、本专利技术实施例提供了一种肾脏病生物样本库的样本信息溯源方法,该方法包括以下步骤:
3、获取每个异常肾脏病生物样本流转的流程并构建fp树;对于预设支持度阈值集合中的任一个支持度阈值,通过该支持度阈值对fp树进行处理,获取最大频繁项集;
4、基于每个最大频繁项集所对应路径在fp树中的每个节点的数值和深度,获取每个最大频繁项集的参考权重;
5、根据所述参考权重,获取该支持度阈值的合理程度;
6、基于合理程度获取最佳支持度阈值,根据最佳支持度阈值预测肾脏病生物样本的异常流程环节。
7、进一步地,所述参考权重的获取方法为:
8、对于任一个最大频繁项集,将该最大频繁项集所对应路径作为目标路径,将目标路径中的节点根据数值大小进行划分,获得第一类别和第二类别;其中,第一类别中节点的数值较大,第二类别中节点的数值较小;
9、根据第一类别与第二类别之间节点的数值差异,获取目标路径上节点的相似程度;
10、将第二类别中数值最大的节点作为目标路径的分割节点,根据所述分割节点与其在fp树中相同深度的其他节点之间的数值差异、以及所述分割节点在fp树中所处深度上所有节点的数量,获取第一类别的第一异常可能程度;
11、将第二类别中数值最小的节点作为目标路径的终点,根据第二类别中节点的数值的波动情况、以及所述终点在fp树中所处深度的下一深度上的节点的数值与第二类别中节点的数值的相似情况,获取第二类别的第二异常可能程度;
12、根据所述相似程度、所述第一异常可能程度和所述第二异常可能程度,获取该最大频繁项集的整体异常程度;
13、根据所述终点在fp树中的深度和目标路径中的每个节点的数值,获取该最大频繁项集的重要程度;
14、将所述整体异常程度与所述重要程度的乘积,作为该最大频繁项集的参考权重。
15、进一步地,所述相似程度的获取方法为:
16、获取第一类别中所有节点的数值的均值,作为第一参考值;
17、获取第二类别中所有节点的数值的均值,作为第二参考值;
18、将第一参考值与第二参考值的差值进行负相关且归一化的结果,作为目标路径上节点的相似程度。
19、进一步地,所述第一异常可能程度的获取方法为:
20、将所述分割节点在fp树中的深度作为目标深度,获取目标深度上除所述分割节点外其他所有节点的数值的均值,作为第一特征值;
21、将所述分割节点的数值与第一特征值的差值,作为第一类别的参考异常程度;
22、将目标深度上所有节点的数量的倒数与参考异常程度的乘积进行归一化的结果,作为第一类别的第一异常可能程度。
23、进一步地,所述第二异常可能程度的获取方法为:
24、将第二类别中节点的数值的标准差进行负相关且归一化的结果,作为第二类别的初始异常可能程度;
25、获取第二类别中节点的数值的方差,作为第一方差;
26、获取所述终点在fp树中所处深度的下一深度上的所有节点的数值与第二类别中节点的数值的方差,作为第二方差;
27、将第一方差与第二方差的差值绝对值进行归一化的结果,作为第二类别的修正权重;
28、将第二类别的修正权重与初始异常可能程度的乘积,作为第二类别的第二异常可能程度。
29、进一步地,所述整体异常程度的获取方法为:
30、获取所述第一异常可能程度和所述第二异常可能程度的均值,作为该最大频繁项集的整体异常可能程度;
31、将所述相似程度与整体异常可能程度的乘积,作为该最大频繁项集的整体异常程度。
32、进一步地,所述重要程度的获取方法为:
33、将目标路径中的所有节点的数值的均值与所述终点在fp树中的深度的比值,作为该最大频繁项集的重要程度。
34、进一步地,所述合理程度的获取方法为:
35、将所有最大频繁项集的参考权重的均值,作为该支持度阈值的合理程度。
36、进一步地,所述最佳支持度阈值的获取方法为:
37、将最大的合理程度对应的支持度阈值,作为最佳支持度阈值。
38、进一步地,所述异常流程环节的获取方法为:
39、通过最佳支持度阈值对fp树进行处理,将此时获取的每个最大频繁项集均作为目标项集;
40、获取每个正常肾脏病生物样本流转的流程并构建fp树作为参考fp树,通过最佳支持度阈值对参考fp树进行处理,将此时获取的每个最大频繁项集均作为参考项集;
41、将每个目标项集与每个参考项集进行比较,将不与参考项集相同的目标项集所对应路径的流程环节,作为肾脏病生物样本的异常流程环节。
42、本专利技术具有如下有益效果:
43、本专利技术根据异常肾脏病生物样本流转的流程构建fp树,避免了正常肾脏病生物样本的干扰,有利于高效分析出造成肾脏病生物样本异常的流程;为了获取出合理的支持度阈值,使得准确预测出造成肾脏病生物样本异常的流程环节,进而对于预设支持度阈值集合中的任一个支持度阈值,通过该支持度阈值对fp树进行处理,获取最大频繁项集,避免对重复出现的流程环节进行分析;为了准确分析该支持度阈值是否合理,进而基于每个最大频繁项集所对应路径在fp树中的每本文档来自技高网...
【技术保护点】
1.一种肾脏病生物样本库的样本信息溯源方法,其特征在于,该方法包括以下步骤:
2.如权利要求1所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述参考权重的获取方法为:
3.如权利要求2所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述相似程度的获取方法为:
4.如权利要求2所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述第一异常可能程度的获取方法为:
5.如权利要求2所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述第二异常可能程度的获取方法为:
6.如权利要求2所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述整体异常程度的获取方法为:
7.如权利要求2所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述重要程度的获取方法为:
8.如权利要求1所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述合理程度的获取方法为:
9.如权利要求1所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述最佳支持
10.如权利要求1所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述异常流程环节的获取方法为:
...【技术特征摘要】
1.一种肾脏病生物样本库的样本信息溯源方法,其特征在于,该方法包括以下步骤:
2.如权利要求1所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述参考权重的获取方法为:
3.如权利要求2所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述相似程度的获取方法为:
4.如权利要求2所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述第一异常可能程度的获取方法为:
5.如权利要求2所述的一种肾脏病生物样本库的样本信息溯源方法,其特征在于,所述第二异常可能程度的获取方法为:
6.如...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。