本发明专利技术属于细胞定位技术领域,具体涉及一种数据集构建方法、细胞定位方法、系统及存储介质。本发明专利技术的数据集构建方法包括将点标注的细胞数据集转化为反映每个细胞的位置和尺度信息的数据集,和/或,将提供实例分割标注的细胞数据集转化为反映每个细胞的位置和尺度信息的数据集。通过上述方法构建的数据集可用于细胞定位模型的训练,能够有效提升细胞定位模型的准确性。本发明专利技术能够促进了细胞精确定位和计数的发展,具有很好的应用前景。具有很好的应用前景。具有很好的应用前景。
【技术实现步骤摘要】
一种数据集构建方法、细胞定位方法、系统及存储介质
[0001]本专利技术属于细胞定位
,具体涉及一种数据集构建方法、细胞定位方法、系统及存储介质。
技术介绍
[0002]细胞定位,即预测图像中每个细胞的具体位置,并得出图像所包含的细胞数量。在生物学和医学中,显微图像分析是一个非常重要的研究领域,细胞定位便是其中一个重要分支。由于基于传统图像处理的细胞分割技术的鲁棒性不足,而细胞形态大小差别较大,很难适应细胞定位技术的要求。随着人工智能技术的发展,尤其是深度学习技术的普及,利用深度学习技术直接预测细胞的位置信息正逐渐成为一种新的辅助诊疗手段。
[0003]在细胞定位任务中,人们希望数据集不仅能提供图像中的细胞总数,还要能提供每个细胞在图像中所占的区域大小,这样有助于深度学习模型更加准确地预测细胞的位置从而提升定位精度。然而,现有的用于细胞定位任务的数据集普遍只点标注或实例分割中的其中一种。
[0004]为了克服上述困难,在现有技术中,训练深度学习模型时以每张图像中点标注的点坐标为圆心生成统一大小的圆来反映细胞的大小,作为定位任务的监督信息。然而,由于细胞并不是都是一样的大小,因此用等大的圆来反映细胞的尺度信息是不太合理的。因此,通过上述方法训练得到的模型在预测性能上仍然有所不足。
技术实现思路
[0005]针对现有技术中的问题,本专利技术提供一种数据集构建方法、细胞定位方法、系统及存储介质,实现将现有技术中的只含有点标注的细胞数据集和只含有细胞实例分割标注的细胞数据集转化为同时包含细胞位置信息和细胞尺寸信息的数据集,利用本专利技术构建的数据集进行细胞定位模型的训练,能够得到具有更好预测性能的细胞定位模型,提高模型预测准确性。
[0006]一种数据集构建方法,包括如下步骤:
[0007]步骤1,采用分割模型对待转换数据集中的原始图像进行分割,得到分割图像;
[0008]步骤2,将待转换数据集中的点标注的坐标与对应的分割图像进行位置关系分析,得到反映每个细胞位置和尺度信息的mask图像;所述mask图像中,通过圆表示细胞的尺度信息,通过所述圆的圆心表示细胞的位置信息;
[0009]步骤3,将所有原始图像的mask图像构成数据集。
[0010]优选的,步骤2具体包括:
[0011]步骤2.1,将每一个点标注的坐标与分割图像的二值图像进行对比,若点标注的坐标落入所述二值图像的前景,则执行步骤2.2;若点标注的坐标落入所述二值图像的背景,则执行步骤2.3;
[0012]步骤2.2,提取所述前景边缘,计算所述点标注的坐标与前景边缘的最短距离,以
所述点标注的坐标作为圆心,以所述最短距离为半径在mask图像上作圆;
[0013]步骤2.3,计算步骤2.2得到的所有圆的平均半径,以所述点标注的坐标作为圆心,以所述平均半径在mask图像上作圆。
[0014]优选的,步骤2.2中,提取所述前景边缘的方法采用Opencv中的findContours实现。
[0015]优选的,步骤2.2中,计算所述最短距离的方法采用Opencv中的pointPolygonTest实现。
[0016]本专利技术还提供一种数据集构建方法,包括如下步骤:
[0017]步骤a,将待转换数据集中的实例分割标注中的每一个实例单独放入二值图像中;
[0018]步骤b,对所述二值图像进行距离变换分析,将属于同一原始图像的实例的距离变换分析结果放入同一张mask图像,得到反映每个细胞位置和尺度信息的mask图像;所述mask图像中,通过圆表示细胞的尺度信息,通过所述圆的圆心表示细胞的位置信息;
[0019]步骤c,将所有原始图像的mask图像构成数据集。
[0020]优选的,步骤b中的具体包括对所述二值图像的每一个前景区域进行以下操作:
[0021]步骤b1,进行距离变换,得到质心,以及质心到区域边界的距离集合;
[0022]步骤b2,以质心为圆心,距离集合的平均数为半径在mask图像上作圆。
[0023]优选的,所述距离变换通过Opencv中的distanceTransform实现。
[0024]本专利技术还提供一种细胞定位方法,包括:采用机器学习模型对细胞图像进行细胞定位,其中,用于训练所述机器学习模型的数据集是以上述数据集构建方法构建得到的。
[0025]本专利技术还提供一种细胞定位系统,包括:
[0026]输入模块,用于输入细胞图像和/或细胞数据集;
[0027]模型训练模块,用于按照上述数据集构建方法构建数据集,并利用所述数据集训练机器学习模型;
[0028]定位模块,用于采用所述机器学习模型对细胞图像进行细胞定位;
[0029]输出模块,用于输出细胞定位结果。
[0030]本专利技术还提供一种计算机可读存储介质,其上存储有用于实现上述数据集构建方法的计算机程序,或用于实现上述细胞定位方法的计算机程序。
[0031]现有细胞数据集通常只有点标注或实质分割标注中的一种,因而无法直接用于细胞定位任务的机器学习模型训练,针对该问题,本专利技术提供了将只有点标注或实质分割标注的数据集转化为同时反映每个细胞的位置和尺度信息的数据集的方法。通过将细胞抽象为圆形,以圆的大小来反映细胞的大小,实现了用统一的标准,即圆的半径,来反映细胞的尺度信息,便于深度学习模型进行训练。通过该方法构建的数据集可作为细胞定位任务使用的专用数据集,其训练得到的细胞定位模型具有更好的预测性能。本专利技术极大程度上促进了细胞精确定位和计数的发展,具有很好的应用前景。
[0032]显然,根据本专利技术的上述内容,按照本领域的普通技术知识和惯用手段,在不脱离本专利技术上述基本技术思想前提下,还可以做出其它多种形式的修改、替换或变更。
[0033]以下通过实施例形式的具体实施方式,对本专利技术的上述内容再作进一步的详细说明。但不应将此理解为本专利技术上述主题的范围仅限于以下的实例。凡基于本专利技术上述内容所实现的技术均属于本专利技术的范围。
附图说明
[0034]图1为本专利技术实施例1对于含有点标注的待转换数据集进行处理的流程示意图;
[0035]图2为本专利技术实施例1对于含有实例分割标注的待转换数据集进行处理的流程示意图;
[0036]图3为本专利技术实施例1中生成的数据集目录示意图;
[0037]图4为本专利技术实施例1中6组原始图像与mask图像的实例图。
具体实施方式
[0038]需要特别说明的是,实施例中未具体说明的数据采集、传输、储存和处理等步骤的算法,以及未具体说明的硬件结构、电路连接等均可通过现有技术已公开的内容实现。
[0039]实施例1细胞定位数据集构建方法
[0040]本实施例提供一种用于细胞定位的数据集的构建方法,流程示意图如图1、图2所示,主要包括五个步骤:模型训练与预测、位置关系分析、实例提取、距离变换分析、mask图像生成。具体包括如下步骤:
...
【技术保护点】
【技术特征摘要】
1.一种数据集构建方法,其特征在于,包括如下步骤:步骤1,采用分割模型对待转换数据集中的原始图像进行分割,得到分割图像;步骤2,将待转换数据集中的点标注的坐标与对应的分割图像进行位置关系分析,得到反映每个细胞位置和尺度信息的mask图像;所述mask图像中,通过圆表示细胞的尺度信息,通过所述圆的圆心表示细胞的位置信息;步骤3,将所有原始图像的mask图像构成数据集。2.按照权利要求1所述的数据集构建方法,其特征在于:步骤2具体包括:步骤2.1,将每一个点标注的坐标与分割图像的二值图像进行对比,若点标注的坐标落入所述二值图像的前景,则执行步骤2.2;若点标注的坐标落入所述二值图像的背景,则执行步骤2.3;步骤2.2,提取所述前景边缘,计算所述点标注的坐标与前景边缘的最短距离,以所述点标注的坐标作为圆心,以所述最短距离为半径在mask图像上作圆;步骤2.3,计算步骤2.2得到的所有圆的平均半径,以所述点标注的坐标作为圆心,以所述平均半径在mask图像上作圆。3.按照权利要求2所述的数据集构建方法,其特征在于:步骤2.2中,提取所述前景边缘的方法采用Opencv中的findContours实现。4.按照权利要求2所述的数据集构建方法,其特征在于:步骤2.2中,计算所述最短距离的方法采用Opencv中的pointPolygonTest实现。5.一种数据集构建方法,其特征在于,包括如下步骤:步骤a,将待转换数据集中的实例分割标注中的每一个实例单独放入二值图像中;步骤b,对所述二值图像进行距离变换分析,将属于同一原始图像的实例的距离变换...
【专利技术属性】
技术研发人员:步宏,张铖洋,陈杰,周恩惟,李波,
申请(专利权)人:成都华西精准医学产业技术研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。