当前位置: 首页 > 专利查询>张小雷专利>正文

一种基于数据标准化和经验贝叶斯的放射组学特征的多中心效应协调算法和软件制造技术

技术编号:38704090 阅读:14 留言:0更新日期:2023-09-08 14:44
本发明专利技术涉及一种基于数据标准化和经验贝叶斯的放射组学特征的多中心效应协调算法和软件,提出了一种称为Category

【技术实现步骤摘要】
一种基于数据标准化和经验贝叶斯的放射组学特征的多中心效应协调算法和软件


[0001]本专利技术涉及医学图像处理中放射组学特征的
,具体涉及一种基于数据标准化和经验贝叶斯的全新算法,用于协调多中心放射组学特征。

技术介绍

[0002]放射组学是一种基于医学影像的定量分析方法,通过计算机算法提取图像中的大量特征,并将这些特征与疾病诊断、预后等相关信息相结合,以发现影像中潜在的生物标志物和治疗响应指标。它的应用范围广泛,包括肿瘤检测和诊断、肿瘤分型、治疗响应评估、个体化治疗等。放射组学特征的提取和分析是放射组学的核心内容之一,也是目前医学影像学研究的热点之一。然而,将放射组学特征应用于来自不同站点的数据可能会面临挑战,因为不同站点的扫描仪和采集协议及参数存在差异。这些差异可能导致成像特征的强度、纹理和形状不同,从而影响放射组学特征及其预测能力。因此,对来自不同机构的医学图像进行放射组学特征的对齐对于开发诊断和预后生物标志物是至关重要的,以便将研究成果可靠地转化为临床实践。为了解决这一问题,多中心协调(ComBat)算法是一种用于消除不同来源的数据批次效应的统计方法,特别是在基因表达数据的分析中被广泛应用。ComBat算法通过对数据的均衡化,使得不同批次之间的数据具有一致的分布特性,从而减少批次效应的影响。然而,放射组学特征和基因数据在概念、数学定义和意义等方面有所不同,因此需要开发一种有效的多中心协调方法来消除放射组学特征的多中心效应。这有助于建立协调的多中心大型数据集和开展大规模研究。为了解决这个问题,需要改进创新ComBat算法,以便它能够适用于放射组学特征数据,并保持数据在协调前后的再现性和鉴别力。这将有助于促进放射组学数据的多中心研究和应用,为个体化医疗、精准诊断和治疗提供更加可靠的方法和手段。

技术实现思路

[0003]本专利技术采用改进的Comabt算法(Category

Combat)来协调来自不同扫描仪、扫描设备、采集参数和重建协议的医学图像的放射组学特征。通过该算法可以解决放射组学特征中存在的多中心效应。该算法能够移除不同中心的放射组学特征数据的差异性,得一个具有大规模的协调的多中心放射组学特征数据。这对于开展大规模放射组学研究和个体化医疗具有重要意义。
[0004]本专利技术Category

Combat多中心协调算法设计如下:
[0005]Category

Combat数学建模:
[0006]假设放射组学特征的中心 i∈1,2,

,m和样本 j 和特征 f∈1,2,

,N和类别 c∈1,2,

,C,我们设计的Category

Combat模型如下:(1)Category

Combat模型设计了来表示所有的放射组学特征的值。它设计了
为按照类别进行分组的样本均值,两个矩阵分别是和,为保留相关信息矩阵,为消除相关因素的影响矩阵。和为和矩阵的回归向量。为矩阵的级联。和为特征的多中心效应的加和误差项和乘数误差项。为误差项它可以被假设为一个标准正态分布,它的期望为零方差是。
[0007]标准化数据:Category

Combat采用不同类别分组估计参数。它使用矩估计和最小二乘法估计了参数,和。其中,中心i和样本j和特征f 和事件结果分组c,之后估计了样本特征矩阵的方差,。标准化数据可以可以被计算通过下面公式2:(2)
[0008]经验贝叶斯过程假设符合参数为的N()正态分布。符合正态分布N(),符合逆伽马分布Inverse Gamma()。对超参数,采用矩估计的方法进行参数估计。而后基于上述的分布假设我们使用经验贝叶斯参数估计方法,进一步的对参数的后验参数估计的结果为: and
ꢀꢀ
= [0009]的后验分布参数和后,进一步的最终Category

Combat多中心补偿公式可以根据公式相似的方法给出:= () +
ꢀꢀꢀꢀꢀꢀꢀ
(3)
[0010]本专利技术提出了一种名为“Category

Combat”的新算法,用于解决CT图像中多中心放射组学特征的差异性问题。Category

Combat算法采用更适合的位置表示方案,使用数据类别的中心来替代特征的中心,从而确保协调的特征保持出色的鉴别力。此外,该算法引入了特征再现性调整参数,能够有效地调整协调特征的再现性。Category

Combat能够协调放射组学特征的多中心效应,同时保持或提高特征的再现性和鉴别力。本专利技术还通过设计条件矩阵作为协变量来保留相关的生物学特性。在处理放射组学特征时,Category

Combat可以移除固定的和随机的噪声因素,同时保留所需的生物学特性因素。因此,该专利技术重新设计了条件矩阵的形式,使其包含噪声因素矩阵和生物学特性因素矩阵。
[0011]本专利技术能够为多中心放射组学研究提供一种新的工具。它可以整合来自不同中心的医学影像数据集,方便研究人员进行大规模数据研究和机器学习分析。更轻松地识别各种疾病的生物标志物并制定个性化治疗计划。我们预计 Category

Combat 将提高放射组学分析的质量和可靠性,这对患者护理和临床研究具有重要意义。
[0012]本专利技术的软件设计如下:本专利技术的软件采用Python语言编写,并使用免费开源程序包编写所有功能模块。软件架构采用分层架构,如图1所示。主程序调用用户UI界面,收集和检查用户输入的参数和要求,并将其传递给参数采集模块。参数采集模块链接业务逻辑核心,负责多中心协调算法对放射组学特征协调的实现。文件储存模块接收协调后的特征数据并将其储存为文件格式。此外,该程序还留有APP服务接口,以便进行拓展。
[0013]如图2所示,主程序负责初始化用户界面和所有模块的初始化,然后调用所有模块进入服务状态。首先加载用户界面,等待用户输入,然后加载数据标准化模块、贝叶斯估计模块和数据协调模块,进入待命状态。当用户输入模型参数后,主程序调用参数检查功能对输入的参数格式进行检查。如果参数检查通过,则将参数值传递给数据标准化模块。数据标准化模块对所有数据进行标准化处理,得到标准化数据矩阵。标准化数据矩阵传递给贝叶斯估计模块,执行经验贝叶斯参数估计,得到数据分布的先验参数和后验参数。根据估计出的参数进行最终的数据协调。协调后的数据进行格式转换,转换为易于存储的数据。该模块的数学建模过程依据公式 1。
[0014]如图3所示,业务逻辑核心主要包括数据标准化模块和贝叶斯估计数据协调模块。数据标准化模块基于 Python 3.7 的 pandas、numpy 和 math 库开发。首先,该模块需要进行初始化处理,接受用户界面输入的参数,并对参数的格式进行检查。接着,模块将对用户输入的 CT 图像的扫描仪、生产厂商、采集参数和重建协议等本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据标准化和经验贝叶斯的放射组学特征的多中心效应协调算法和软件,包括以下步骤:a) 从不同医疗中心、扫描设备和采集参数中收集医学图像数据;b) 将收集到的医学图像数据分为不同的类别;c) 对每个类别的数据进行标准化处理,包括消除多中心效应的影响;d) 根据类别分组的数据,使用经验贝叶斯模型进行特征分析和建模;e) 输出特征分析结果,包括特征权重和特征分类器。2.根据权利要求1所述方法,消除多中心效应的算法设计的公式和创新点:建立一个保留矩阵和一个消除矩阵;按照类别为中心对放射组学特征进行标准化;一种用于放射组学特征分析和数据协调处理的软件,包括以下模块:a) 用户UI界面模块,用...

【专利技术属性】
技术研发人员:张小雷刘海虹董现玲魏林栋
申请(专利权)人:张小雷
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1