System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于数据合成和颜色空间学习的行人重识别方法技术_技高网

基于数据合成和颜色空间学习的行人重识别方法技术

技术编号:44926718 阅读:8 留言:0更新日期:2025-04-08 19:06
本发明专利技术公开了一种基于数据合成和颜色空间学习的行人重识别方法,包括如下步骤:采集多摄像头下的行人数据并标注,构建行人数据集;将行人数据集输入到扩散模型中进行数据合成;输入至颜色空间学习模块,生成映射到新颜色空间的颜色转换图像;对骨干网络进行训练;使用训练好的骨干网络对输入图像进行特征提取,并存入特征库;对行人图像进行特征提取,计算提取出的特征与特征库中特征的余弦距离并排序,生成候选行人列表。本发明专利技术基于扩散模型和颜色空间学习技术,构建多属性扩增数据集,优化骨干网络训练与特征检索,显著提升行人重识别的精度、鲁棒性和跨摄像头适应能力。

【技术实现步骤摘要】

本专利技术涉及行人重识别领域,尤其涉及一种基于数据合成和颜色空间学习的行人重识别方法


技术介绍

1、在智能安防、公共安全和智慧城市建设等应用背景下,行人重识别作为一项跨摄像头图像检索任务得到了广泛关注。该任务的目标是在多摄像头环境下的庞大数据库中快速检索与给定输入行人图像在身份特征上匹配的目标行人图像。然而,要满足行人重识别模型的训练和优化需求,需要构建一个大规模、场景多样、人物姿态、服饰和背景变化丰富的行人数据集。传统的数据采集与标注过程往往需要大量的人力和时间投入,而且由于实际拍摄条件受场景和摄像头部署限制,数据集中往往存在同质化现象。许多现有行人重识别数据集采集于校园或类似的单一场景,导致数据上下文过于集中,缺乏更丰富的真实世界多样性。这种同质化的训练数据难以支撑模型在更复杂和多变的真实环境中达到理想的性能,同时限制了行人重识别技术的进一步发展。

2、为了解决数据缺乏多样性这一问题,研究人员一直在探索行人数据合成方法。传统方案中,一些研究尝试通过构建虚拟环境、使用手工制作的三维人物模型以及模拟不同视点、姿势、照明和背景来生成虚拟行人数据。然而,这类方法存在不可忽视的缺陷。首先,人工构建的虚拟场景和3d模型难以完全逼近现实世界的复杂度与随机性,导致虚拟数据与真实数据在统计分布和特征呈现上存在明显的领域差距。其次,虚拟数据的数量和多样性也难以与真实数据相匹敌,这限制了合成数据对行人重识别任务的实质帮助。尽管可以通过不断增加虚拟场景和模型的复杂性来提升数据的多样性,但这样的方法往往带来更高的构建成本和时间消耗,难以满足实际应用的快速迭代需求。

3、另一类较为常用的数据合成方案是采用gan网络进行图像风格或样式转换,通过将通用数据集的图像风格迁移至行人数据集的分布上,从而获得可用于训练的合成数据。然而,这类方法仍然难以消除通用数据与行人数据集之间的巨大领域差异。虽然gan网络在图像生成领域有一定优势,但将任意图像集转化为高保真且具有显著行人特征的高质量数据集仍具有相当难度。此外,gan网络生成的图像在细节和身份保持上常常存在不足,不能保证生成图像与原始数据在身份特征层面的一致性,从而影响行人重识别模型的训练效果。

4、除了数据合成技术需要进一步突破之外,不同摄像头下成像特性与光照条件差异所导致的颜色空间偏差也是行人重识别过程面临的挑战。尤其在夜间或弱光条件下,红外摄像头拍摄的图像与白天rgb摄像头捕获的彩色图像之间存在巨大差异。这种差异不仅体现在整体亮度和对比度上,更体现在颜色空间和成像模态的本质差别。简单地在特征空间对rgb与红外特征进行投影,往往不足以消除两种模态间的鸿沟。另一种思路是尝试使用图像生成方法将rgb图像转化为红外风格或者反向转换,但这种方法会增加计算成本,并可能在转换过程中引入噪声和伪影,进而影响模型训练的稳定性与特征表达的纯净性。

5、因此,面对上述问题,亟需一种能够兼顾数据多样性提升和颜色空间适配的综合方法。一方面,在数据合成环节需要具备更先进的图像生成与编辑能力,能够在保持行人身份特征一致的前提下引入未曾在原始数据集中出现的新属性,从而得到更加丰富和具备高保真度的扩增数据集。另一方面,在颜色空间学习环节需要探索更为灵活的颜色转换策略,以应对多摄像头数据集中复杂多变的成像条件和颜色偏差。这包括从通道级别对颜色信息进行重新组合和映射,引入非线性激活函数、卷积处理以及归一化步骤,使得数据在颜色空间上更为一致,减少跨模态和跨设备条件下的特征偏移。

6、总之,现有技术在数据合成与颜色空间学习两方面尚存在明显不足:在数据合成方面,传统的虚拟建模和gan样式迁移难以打破领域差距,缺乏灵活性与高度真实感的多样属性注入;在颜色空间适应方面,简单的图像生成或者特征投影策略很难有效解决rgb与ir模态下的巨大色彩差异。只有在这两个方向上同步发力,研发出一种基于数据合成与颜色空间学习的行人重识别方法,才能有效弥补现有技术的缺陷,为行人重识别任务提供更加丰富、真实、多样化且颜色分布适应性更强的训练数据。


技术实现思路

1、本专利技术的一个目的在于提出一种基于数据合成和颜色空间学习的行人重识别方法,本专利技术通过扩散模型进行数据合成,在颜色空间学习环节,通过对图像进行通道替换、通道交换及通道拼接,并结合非线性激活函数与一阶卷积操作对颜色分布进行细粒度调整,使映射后的图像在多摄像头和复杂光照条件下呈现更统一且适应模型训练的色彩空间,有效降低跨模态、跨场景条件下的特征偏移,通过在骨干网络中引入非局部模块与多重损失函数进行训练,模型在捕捉全局特征依赖关系和精确辨识身份特征方面得到强化,提高在不同场景下的识别精度与鲁棒性。

2、根据本专利技术实施例的一种基于数据合成和颜色空间学习的行人重识别方法,包括如下步骤:

3、s1、采集多摄像头下的行人数据并标注,构建行人数据集;

4、s2、将行人数据集输入到扩散模型中进行数据合成,并与行人数据集组成扩增数据集;

5、s3、将扩增数据集输入至颜色空间学习模块,生成映射到新颜色空间的颜色转换图像,并构建颜色转换数据集;

6、s4、将颜色转换数据集输入到骨干网络中,对骨干网络进行训练;

7、s5、使用训练好的骨干网络对输入图像进行特征提取,并存入特征库;

8、s6、获取待查询的行人图像,对行人图像进行特征提取,计算提取出的特征与特征库中特征的余弦距离并排序,生成候选行人列表。

9、可选的,所述s1具体包括:

10、s11、将多摄像头采集的视频流输入至yolov8目标检测模型中,对视频中的行人进行检测;

11、s12、根据yolov8模型的检测结果,从视频流中裁切出每个行人的图像区域,生成单独的行人图片;

12、s13、对裁切后的行人图片按照不同的身份进行赋予唯一的身份标识id;

13、s14、根据分配的身份id对行人图片进行分类,将具有相同身份id的行人图片归类在同一类别下;

14、s15、根据行人图片和所对应的id标签,构建行人数据集,形成输入图像序列。

15、可选的,所述s2具体包括:

16、s21、使用图像序列标注模型blip2来生成输入图像序列的文本提示,调整注意力机制使blip2模型更加关注人物图像的属性,所述属性包括携带的物品和人物动作;

17、s22、在blip2模型生成的文本提示中加入身份信息,在特征层面上建立输入图像序列的身份信息与文本提示之间的强关系,确保生成图像的id一致性;

18、s23、对文本提示进行细化,增强局部细节和全局上下文信息,并使用预训练的clip文本编码器对文本提示进行嵌入,生成嵌入向量;

19、s24、将嵌入向量输入到预训练的stable diffusion模型中生成属性参考集,所述属性参考集引入了输入图像序列中未出现的新属性,所述新属性包括不同的服装、携带物品、动作、摄像机角度和场景;...

【技术保护点】

1.一种基于数据合成和颜色空间学习的行人重识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于数据合成和颜色空间学习的行人重识别方法,其特征在于,所述S1具体包括:

3.根据权利要求1所述的一种基于数据合成和颜色空间学习的行人重识别方法,其特征在于,所述S2具体包括:

4.根据权利要求2所述的一种基于数据合成和颜色空间学习的行人重识别方法,其特征在于,所述S24具体包括:

5.根据权利要求1所述的一种基于数据合成和颜色空间学习的行人重识别方法,其特征在于,所述S3具体包括:

6.根据权利要求1所述的一种基于数据合成和颜色空间学习的行人重识别方法,其特征在于,所述S4具体包括:

7.根据权利要求1所述的一种基于数据合成和颜色空间学习的行人重识别方法,其特征在于,所述S5具体包括:

8.根据权利要求1所述的一种基于数据合成和颜色空间学习的行人重识别方法,其特征在于,所述S6具体包括:

【技术特征摘要】

1.一种基于数据合成和颜色空间学习的行人重识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于数据合成和颜色空间学习的行人重识别方法,其特征在于,所述s1具体包括:

3.根据权利要求1所述的一种基于数据合成和颜色空间学习的行人重识别方法,其特征在于,所述s2具体包括:

4.根据权利要求2所述的一种基于数据合成和颜色空间学习的行人重识别方法,其特征在于,所述s24具体包括:

5....

【专利技术属性】
技术研发人员:李公平王超方千慧郭明现谭雨婷
申请(专利权)人:中电信数智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1