System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种转移性乳腺癌数据预处理方法技术_技高网

一种转移性乳腺癌数据预处理方法技术

技术编号:42902234 阅读:11 留言:0更新日期:2024-09-30 15:17
本发明专利技术涉及一种转移性乳腺癌数据预处理方法,属于数据处理技术领域,本发明专利技术包括获取乳腺癌患者的蛋白质信号时序序列;获取不同迭代尺度下的原始信号的所有IMF分量信号,获取每个IMF分量信号的分布特征提取因子和对原始信号的贡献率;根据每个IMF分量信号的分解成分单一性获取每个IMF分量信号的收敛分解成分单一性的相关性;根据每个迭代尺度下的原始信号目标程度获取最优迭代尺度和通过最优迭代尺度获取去噪后的乳腺癌患者的蛋白质信号序列四个主要步骤。本发明专利技术可获取每个迭代尺度下的原始信号目标程度,使得所有复杂的噪声成分向前两个IMF分量信号中集中,降低对噪声信号处理的复杂程度,并提高转移性乳腺癌数据的预处理精度。

【技术实现步骤摘要】

本专利技术属于数据处理,具体的说,涉及一种转移性乳腺癌数据预处理方法


技术介绍

1、转移性乳腺癌是指癌细胞从原发肿瘤转移到身体其他部位的一种情况,与乳腺癌相关的数据集可能包括多种类型的信息,其中信号数据是其中的一部分;信号数据包括与肿瘤相关的生物信号,比如蛋白质信号;由于实验或者测量过程中的各种因素随机或系统性的会造成误差,也即噪声,进而会掩盖真实的生物学信号,可以通过去除噪声来提高数据的质量和分析的准确性;由于噪声信号的频率具有复杂性,因此可以利用固有时间尺度分解算法(intrinsic time decomposition,itd)对蛋白质信号进行分析。

2、现有的时间尺度分解算法是以相邻的极值点作为分解迭代时间尺度的迭代尺度选择,使得不同频率的噪声出现在分量信号中,使得信号噪声的位置难以确定,进而增大后续对信号进行去噪声处理操作的复杂程度。


技术实现思路

1、为了克服
技术介绍
中存在的问题,本专利技术提供了一种转移性乳腺癌数据预处理方法,可获取每个迭代尺度下的原始信号目标程度,使得所有复杂的噪声成分向前两个imf分量信号中集中,降低对噪声信号处理的复杂程度,并提高转移性乳腺癌数据的预处理精度。

2、为实现上述目的,本专利技术是通过如下技术方案实现的:

3、所述的转移性乳腺癌数据预处理方法,包括以下步骤:

4、s1,获取乳腺癌患者组织样本的蛋白质含量,形成蛋白质信号时序序列,记为原始信号;

5、 s2,对原始信号进行不同迭代时间尺度的分解,获取不同迭代尺度下的原始信号的所有imf分量信号,并获取每个imf分量信号的分布特征提取因子,根据每个imf分量信号与原始信号之间的分布特征提取因子的差异,获取每个imf分量信号对原始信号的贡献率;

6、s3,将每个imf分量信号划分为分量信号段,根据所有分量信号段内信号幅值的变化情况,获取每个imf分量信号的分解成分单一性;根据每个imf分量信号的分解成分单一性,获取每个imf分量信号的收敛分解成分单一性的相关性;

7、s4,根据每个迭代时间尺度下的原始信号的每个imf分量信号对原始信号的贡献率和收敛分解成分单一性的相关性,获取每个迭代尺度下的原始信号目标程度;根据原始信号目标程度的大小筛选出所有迭代尺度中的最优迭代尺度;通过最优迭代尺度获取去噪后的乳腺癌患者的蛋白质信号序列。

8、进一步的,根据每个imf分量信号的频谱信号的分布情况,获取每个imf分量信号的分布特征提取因子,具体方法为:将每个imf分量信号划分为若干个单峰信号,获取每个单峰信号的幅值和频宽;则第个imf分量信号的分布特征提取因子的计算方法为:

9、;

10、式中,表示第个imf分量信号的分布特征提取因子;表示第个imf分量信号的所有单峰信号的幅值的方差;表示第个imf分量信号的所有单峰信号的数量;表示第个imf分量信号的第个单峰信号的频宽。

11、进一步的,获取每个单峰信号的幅值和频宽的具体方法为:利用快速傅里叶变换获取原始信号的所有imf分量信号的频谱信号,将每个imf分量信号的频谱信号的所有极小值作为分割点,将任意相邻两个分割点之间的频谱信号段作为imf分量信号的一个单峰信号,进而将每个imf分量信号划分为若干个单峰信号;每个imf分量信号的每个单峰信号中的极大值点的纵坐标作为每个imf分量信号的每个单峰信号的幅值;将第个imf分量信号的第个单峰信号的幅值与0.5的乘积记为第一高度,将过第一高度的水平线命名为第一高度水平线,将第个单峰信号与第一高度水平线的两个交叉点作为单峰信号的两个分界点,将第个单峰信号的两个分界点的横坐标的差值的绝对值作为第个单峰信号的频宽。

12、进一步的,每个imf分量信号对原始信号的贡献率的获取方法为:将第个imf分量信号的任意两个相邻的极值点之间的横坐标的差值的绝对值,作为第个imf分量信号的一个时间差;将原始信号的任意两个相邻的极值点之间的横坐标的差值的绝对值,作为原始信号的一个时间差,则第个imf分量信号对原始信号的贡献率的计算方法为:

13、

14、式中,表示第个imf分量信号对原始信号的贡献率;表示第个imf分量信号的分布特征提取因子;表示原始信号的分布特征提取因子;表示第个imf分量信号的所有时间差的总数量;表示原始信号的所有时间差的总数量;表示第个imf分量信号的第个时间差;表示原始信号的第个时间差;表示第个imf分量信号的蛋白质信号最大值;表示第个imf分量信号的蛋白质信号最小值;表示原始信号的蛋白质信号最小值;表示原始信号的蛋白质信号最大值。

15、进一步的,将每个imf分量信号划分为若干个分量信号段的方法为,将每个imf分量信号的所有极值点作为分段点,将任意相邻两个分段点之间的信号段作为imf分量信号的一个分量信号段,进而将每个imf分量信号划分为若干个分量信号段。

16、进一步的,获取每个imf分量信号的分解成分单一性的方法为:获取第个imf分量信号的第个分量信号段的特征频率;则第个imf分量信号的分解成分单一性的计算方法为:

17、

18、式中,表示第个imf分量信号的分解成分单一性;表示第个imf分量信号的所有分量信号段的总数量;表示第个imf分量信号的第个分量信号段的特征频率;表示原始信号的所有imf分量信号的总数量;表示以自然常数为底数的对数函数。

19、进一步的,所述获取第个imf分量信号的第个分量信号段的特征频率的方法为:将第个分量信号段内所有蛋白质信号的标准差,作为第个imf分量信号的第个分量信号段的特征值;在所有imf分量信号的中,将所有与第个imf分量信号的第个分量信号段的特征值相等的imf分量信号的第个分量信号段的总数量,记为第一数量;将第一数量与所有imf分量信号的总数量的比值,作为第个imf分量信号的第个分量信号段的特征频率。

20、进一步的,获取每个imf分量信号的收敛分解成分单一性的相关性的方法为:获取第个imf分量信号的收敛量数据集合和单一性数据集合;则第个imf分量信号的收敛分解成分单一性的相关性的计算方法为:

21、

22、式中,表示第个imf分量信号的收敛分解成分单一性的相关性;表示第个imf分量信号的收敛量数据集合;表示单一性数据集合;表示第个imf分量信号的收敛量数据集合与单一性数据集合之间的协方差;表示第个imf分量信号的收敛量数据集合的标准差;表示单一性数据集合的标准差;表示取绝对值。

23、进一步的,获取第个imf分量信号的收敛量数据集合和单一性数据集合的方法为:获取第个imf分量信号的第个分量信号段的上包络线和下包络线,将上包络线和下包络线的均值,作为第个imf分量信号的第个分量信号段的均值包络线,将第个imf分量信号的第个分量信号段内所有纵坐标之和,作为第个imf分量信号的第个分量信号段的均值包络线收敛量;将第个imf分量信号的所有分量信号本文档来自技高网...

【技术保护点】

1.一种转移性乳腺癌数据预处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的转移性乳腺癌数据预处理方法,其特征在于,根据每个IMF分量信号的频谱信号的分布情况,获取每个IMF分量信号的分布特征提取因子,具体方法为,

3.根据权利要求2所述的转移性乳腺癌数据预处理方法,其特征在于,获取每个单峰信号的幅值和频宽的具体方法为:

4.根据权利要求1至3任一项所述的转移性乳腺癌数据预处理方法,其特征在于,每个IMF分量信号对原始信号的贡献率的获取方法为,

5.根据权利要求4所述的转移性乳腺癌数据预处理方法,其特征在于,将每个IMF分量信号划分为若干个分量信号段的方法为,将每个IMF分量信号的所有极值点作为分段点,将任意相邻两个分段点之间的信号段作为IMF分量信号的一个分量信号段,进而将每个IMF分量信号划分为若干个分量信号段。

6.根据权利要求4所述的转移性乳腺癌数据预处理方法,其特征在于,获取每个IMF分量信号的分解成分单一性的方法为,

7.根据权利要求6所述的转移性乳腺癌数据预处理方法,其特征在于,所述获取第个IMF分量信号的第个分量信号段的特征频率的方法为,

8.根据权利要求4所述的转移性乳腺癌数据预处理方法,其特征在于,获取每个IMF分量信号的收敛分解成分单一性的相关性的方法为,

9.根据权利要求8所述的转移性乳腺癌数据预处理方法,其特征在于,获取第个IMF分量信号的收敛量数据集合和单一性数据集合的方法为:

10.根据权利要求4所述的转移性乳腺癌数据预处理方法,其特征在于,获取每个迭代尺度下的原始信号目标程度的方法为:

...

【技术特征摘要】

1.一种转移性乳腺癌数据预处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的转移性乳腺癌数据预处理方法,其特征在于,根据每个imf分量信号的频谱信号的分布情况,获取每个imf分量信号的分布特征提取因子,具体方法为,

3.根据权利要求2所述的转移性乳腺癌数据预处理方法,其特征在于,获取每个单峰信号的幅值和频宽的具体方法为:

4.根据权利要求1至3任一项所述的转移性乳腺癌数据预处理方法,其特征在于,每个imf分量信号对原始信号的贡献率的获取方法为,

5.根据权利要求4所述的转移性乳腺癌数据预处理方法,其特征在于,将每个imf分量信号划分为若干个分量信号段的方法为,将每个imf分量信号的所有极值点作为分段点,将任意相邻两个分段点之间的信号段作为imf分量信号的一个分量...

【专利技术属性】
技术研发人员:李莉王建军曹俊宇郭宸君刘志娟王菡蕊芝曾伟杨颖
申请(专利权)人:云南省第一人民医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1