一种医学图像特征亚组分析方法及系统技术方案

技术编号:32833595 阅读:60 留言:0更新日期:2022-03-26 20:50
本发明专利技术涉及一种医学图像特征亚组分析方法及系统,先获取多个医学图像样本中每一所述样本对应的观测数据,观测数据包括第一类图像特征、第二类图像特征以及响应变量。然后以所有样本对应的观测数据作为目标函数的输入,以令目标函数取最小值为目标,计算得到第一层亚组的第一回归系数集合以及第二层子亚组的第二回归系数集合,最后基于第一回归系数集合和第二回归系数集合得到所有样本的亚组分析结果,进而可以生成包含子亚组的嵌套式层次性结构,在多个层次上对样本进行分类,提供更多的相似性信息,辅助组织病理学的图像诊断。辅助组织病理学的图像诊断。辅助组织病理学的图像诊断。

【技术实现步骤摘要】
一种医学图像特征亚组分析方法及系统


[0001]本专利技术涉及亚组分析
,特别是涉及一种医学图像特征亚组分析方法及系统。

技术介绍

[0002]在组织病理学的影像分析中,一些样本存在一定的亚组结构,不同亚组在其效应上是截然不同的,故不同样本存在特征、状态和分布上的差异,形成异质性,不再满足同分布的条件,给影像诊断带来困难,采用亚组分析方法可以克服这种困难。亚组分析方法主要可以分为有监督亚组分析和无监督亚组分析两大类,没有响应变量y时为无监督亚组分析,其主要基于聚类进行亚组分析,可细分为基于距离的聚类、基于密度的聚类和基于模型的聚类三种。针对响应变量y的不同类型可将有监督亚组分析分为两类,y只用于标记样本所属亚组类别时为联合图模型估计,y为回归响应变量时为亚组回归分析。
[0003]然而,现有的亚组回归分析方法都是对回归系数进行优化并施加对回归系数的惩罚,得到的是将回归系数相同的样本划分为同一亚组的结果,所得的结果是单一结构的,即将所有样本划分为几种亚组,无法生成具有子亚组的层次性亚组结构。

技术实现思路

[0004]本专利技术的目的是提供一种医学图像特征亚组分析方法及系统,可以生成包含子亚组的嵌套式层次性结构,在多个层次上对样本进行分类,提供更多的相似性信息,辅助组织病理学的图像诊断。
[0005]为实现上述目的,本专利技术提供了如下方案:
[0006]一种医学图像特征亚组分析方法,所述亚组分析方法包括:
[0007]获取多个医学图像样本中每一所述样本对应的观测数据;所述观测数据包括第一类图像特征、第二类图像特征以及响应变量;
[0008]以所有所述样本对应的观测数据作为目标函数的输入,以令所述目标函数取最小值为目标,计算得到第一层亚组的第一回归系数集合以及第二层子亚组的第二回归系数集合;所述第一回归系数集合包括每一所述样本对应的第一回归系数;所述第二回归系数集合包括每一所述样本对应的第二回归系数;
[0009]基于所述第一回归系数集合和所述第二回归系数集合得到所有所述样本的亚组分析结果。
[0010]一种医学图像特征亚组分析系统,所述亚组分析系统包括:
[0011]观测数据获取模块,用于获取多个医学图像样本中每一所述样本对应的观测数据;所述观测数据包括第一类图像特征、第二类图像特征以及响应变量;
[0012]回归系数计算模块,用于以所有所述样本对应的观测数据作为目标函数的输入,以令所述目标函数取最小值为目标,计算得到第一层亚组的第一回归系数集合以及第二层子亚组的第二回归系数集合;所述第一回归系数集合包括每一所述样本对应的第一回归系
数;所述第二回归系数集合包括每一所述样本对应的第二回归系数;
[0013]亚组分析模块,用于基于所述第一回归系数集合和所述第二回归系数集合得到所有所述样本的亚组分析结果。
[0014]根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:
[0015]本专利技术提供一种医学图像特征亚组分析方法及系统,先获取多个医学图像样本中每一所述样本对应的观测数据,观测数据包括第一类图像特征、第二类图像特征以及响应变量。然后以所有样本对应的观测数据作为目标函数的输入,以令目标函数取最小值为目标,计算得到第一层亚组的第一回归系数集合以及第二层子亚组的第二回归系数集合,最后基于第一回归系数集合和第二回归系数集合得到所有样本的亚组分析结果,进而可以生成包含子亚组的嵌套式层次性结构,在多个层次上对样本进行分类,提供更多的相似性信息,辅助组织病理学的图像诊断。
附图说明
[0016]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1为本专利技术实施例1所提供的亚组分析方法的方法流程图;
[0018]图2为本专利技术实施例1所提供的特征提取步骤的方法流程图;
[0019]图3为本专利技术实施例2所提供的亚组分析系统的系统框图。
具体实施方式
[0020]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]本专利技术的目的是提供一种含有层次结构的医学图像特征亚组分析方法及系统,可以生成包含子亚组的嵌套式层次性结构,在多个层次上对样本进行分类,提供更多的相似性信息,辅助组织病理学的图像诊断。
[0022]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0023]实施例1:
[0024]现有的亚组回归分析方法主要用混合回归模型,在给定自变量x的情况下,响应变量y服从某种混合分布f(y;x),如下:
[0025][0026]其中,K0是混合分布的阶数;π
k
是混合分布的比例,满足非负性和归一性;f(
·
)是一类分布的密度函数;θ
k
(x)=h(x
T
β
k
),h(
·
)为联系函数,β
k
是回归系数;φ
k
是散度系数。
[0027]在得到观测样本(x1,y1)......(x
n
,y
n
)的情况下,优化即极大化如下目标函数得
到结果:
[0028][0029]之后基于融合惩罚的改良方法被提出,此方法可自动识别亚组数目并进行划分:
[0030][0031]式中,β为回归系数;μ
i
为截距;p(
·
,λ)为凹惩罚函数,其中λ为正则化惩罚参数,用以调节惩罚力度。每个样本都对应一个截距项参数,惩罚项是对样本间截距项的差进行惩罚,若压缩到零则认为这两个样本属于同一亚组,此方法证明使用融合惩罚的异质分析方法可以估计亚组数目和对应的回归系数并实现亚组划分。
[0032]之后又有研究,在上有的融合惩罚方法基础上,将惩罚对象从截距项拓展为所有回归系数:
[0033][0034]先假定每个样本都对应一组回归系数,使用此种惩罚方式可以将回归系数相等的样本划分为同一亚组。
[0035]在现有的医学图像检测中,以肺腺癌为例,图像特征可分为两类,第一类为比较直观的在临床上具有明确含义的特征,来自临床医生经验上认为对疾病诊断特别重要的图像视觉特征,此类特征在肺腺癌预后具有重要意义但特征数量有限而导致可能失去某些有用信息。第二类是使用数字成像软件进行特征提取和平滑后生成的特征,特点是不依赖医生经验且具有高维的特性,可以获取更多潜在的信息,但此类特征没本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医学图像特征亚组分析方法,其特征在于,所述亚组分析方法包括:获取多个医学图像样本中每一所述样本对应的观测数据;所述观测数据包括第一类图像特征、第二类图像特征以及响应变量;以所有所述样本对应的观测数据作为目标函数的输入,以令所述目标函数取最小值为目标,计算得到第一层亚组的第一回归系数集合以及第二层子亚组的第二回归系数集合;所述第一回归系数集合包括每一所述样本对应的第一回归系数;所述第二回归系数集合包括每一所述样本对应的第二回归系数;基于所述第一回归系数集合和所述第二回归系数集合得到所有所述样本的亚组分析结果。2.根据权利要求1所述的亚组分析方法,其特征在于,所述获取多个医学图像样本中每一所述样本对应的观测数据具体包括:对于每一医学图像样本,对组织进行检测,以获取医学图像样本和所述样本的响应变量;对所述样本进行处理,分别得到有标签图像和无标签图像;所述有标签图像为在所述样本上人工添加区域内细胞类型后所得到的图像;所述无标签图像即为原始样本;对所述有标签图像进行特征提取,得到第一类图像特征;对所述无标签图像进行特征提取,得到第二类图像特征。3.根据权利要求2所述的亚组分析方法,其特征在于,所述对所述有标签图像进行特征提取,得到第一类图像特征具体包括:利用深度学习的细胞分类工具ConvPath在所述有标签图像中进行细胞类型的识别,得到细胞类型图;利用OpenCV对所述细胞类型图中每一种细胞的周长和面积进行提取,得到第一类图像特征。4.根据权利要求2所述的亚组分析方法,其特征在于,所述对所述无标签图像进行特征提取,得到第二类图像特征具体包括:对所述无标签图像进行切分,得到多个切分子图像;利用CellProfiler对随机选取的若干个所述切分子图像进行特征提取和平滑,得到第二类图像特征。5.根据权利要求1所述的亚组分析方法,其特征在于,在以所有所述样本对应的观测数据作为目标函数的输入,以令所述目标函数取最小值为目标,计算得到第一层亚组的第一回归系数集合以及第二层子亚组的第二回归系数集合之前,所述亚组分析方法包括:建立所述观测数据对应的观测模型;所述观测模型为第一类图像特征、第二类图像特征以及响应变量之间的关联关系;基于所述观测模型建立目标函数。6.根据权利要求5所述的亚组分析方法,其特征在于,所述观测模型包括:其中,y
i
为响应变量;x
i
为第一类图像特征;β
i
为第一回归系数;z
i
为第二类图像特征;γ
i
为第二回归系数;∈

【专利技术属性】
技术研发人员:张三国翟浩然任明旸孙鑫凯
申请(专利权)人:中国科学院大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1