一种处理长尾数据的语义分割方法技术

技术编号：35189984 阅读：15 留言：0更新日期：2022-10-12 18:07

一种处理长尾数据的语义分割方法，该方法基于语义分割处理系统，语义分割系统包括存储器和处理器，处理器包括存储控制器和寄存器，存储器包括网络库，分割算法库，样本采样方法库，以及配套的应用算法库，该语义分割方法包括，基础配适步骤和样本处理及机器学习步骤，基础配适步骤包括，存储控制器调用样本采用方法库，对目标数据集E进行锁定，并在目标数据E中提取样本B，处理器将所述目标数据E和所述样本B存储在所述寄存器；存储控制器调用网络库调用OCR

全部详细技术资料下载

【技术实现步骤摘要】
一种处理长尾数据的语义分割方法

[0001]本专利技术属于视觉识别
，涉及一种语义分割方法，具体为处理长尾数据的语义分割方法。

技术介绍

[0002]视觉识别任务中真实样本的类别分布通常不是均匀分布，符合长尾分布，即头部类别具有较多样本实例，尾部类别具有较少样本。长尾分布会导致深度学习模型将在很大程度上由少数头部类主导，在尾部的少样本类别上它的性能则会大大降低。
[0003]长尾分布在真实世界中是广泛存在的，当CNN模型面临长尾分布的数据集时，性能会显著下降。目前的方法：一种策略是一阶段方法，利用重新平衡的思想，如重采样、类别感知采样、重复因子抽样等，通过增加少数样本的采样率或减少高频类别的采样率来平衡各类别在特征表达中的贡献，但这种方法有造成过拟合的风险，甚至会扭曲原始数据的分布；另一种是二阶段方法，在后续分类器学习的时候进行class
‑
balanced sampling learning。这个方法规避了一阶段的弊端，但对分类器决策边界的调整有较高要求，且需要较为繁琐的超参数调整。

技术实现思路

[0004]本专利技术提出了一种处理长尾数据的语义分割方法，本方案综合了多种方法，能高效的处理长尾数据对模型性能的影响。
[0005]本专利技术的技术方案如下：
[0006]一种处理长尾数据的语义分割方法，该方法基于语义分割处理系统，所述语义分割系统包括存储器和处理器，所述处理器包括存储控制器和寄存器，所述存储器包括网络库，分割算法库，样本采样方法库，以及配...

【技术保护点】

【技术特征摘要】
1.一种处理长尾数据的语义分割方法，该方法基于语义分割处理系统，所述语义分割系统包括存储器和处理器，所述处理器包括存储控制器和寄存器，其特征在于，所述存储器包括网络库，分割算法库，样本采样方法库，以及配套的应用算法库，该语义分割方法包括，基础配适步骤和样本处理及机器学习步骤，所述基础配适步骤包括，所述存储控制器调用样本采用方法库，对目标数据集E进行锁定，并在目标数据E中提取样本B，所述处理器将所述目标数据E和所述样本B存储在所述寄存器；所述存储控制器调用网络库调用OCR
‑
HRNet32作为基础网络，将基础网络输入所述寄存器，并将所述目标数据E和所述样本B与OCR
‑
HRNet32相适配；所述样本处理及机器学习步骤包括，所述存储控制器调用所述分割算法库中视觉处理方法，并将所述视觉处理方法与OCR
‑
HRNet32相适配，所述视觉处理方法包括所存储的平衡马赛克数据增强、加权采样和复制粘贴数据增强法，所述处理器通过所述视觉处理方法对样本B(b1，b2，
……
b
n
)进行处理，并根据样本B中b1，b2，
……
b
n
，的迭代反馈，强化及其学习。2.根据权利要求1所述的一种处理长尾数据的语义分割方法，其特征在于，所述样本处理及机器学习步骤包括，对b
i
进行图像层面处理，调用平衡马赛克数据增强方法和加权采样方法对bi处理；再对b
i
进行像素层面的处理，复制粘贴数据增强法，实现被处理图像的数据增强，在对b
i
的数据进行复制时，强化对尾部数据优先级程度；优化正负样本梯度的均衡性，通过惩罚简单样本的梯度，强化对困难样本的重视程度，进一步加强尾部类别的置信度；所述处理器将b
i
作为处理完成的数据存储入所述寄存器，并对b
i+1
重复上述步骤，当对所述样本B全部完成处理后，检验每个样本B的准确率，并通过检验结果反馈至所述分割算法库，用于对机器学习算法的优化。3.根据权利要求2所述的一种处理长尾数据的语义...

【专利技术属性】
技术研发人员：周祖煜，白博文，张澎彬，林波，陈煜人，莫志敏，张浩，李天齐，刘俊，
申请(专利权)人：杭州领见数字农业科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人