System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及强化深度学习图像处理领域,特别是一种基于熵值分析的多图片综合保质压缩方法。
技术介绍
1、在机器视觉应用中,通常需要对原始图像进行一定的压缩。首先,机器视觉系统常需处理大量图像数据,例如工业自动化中,生产线摄像头每秒拍摄数百张图像,压缩可以显著减少存储空间需求,降低硬件成本。其次,在实时监控和安全系统中,压缩图像可加快数据传输速度,确保系统迅速响应,提升安防摄像头在网络中的监控能力。此外,在自动驾驶汽车中,压缩技术降低了后续处理时的计算负担,使图像识别和物体检测算法更高效,提升行车安全性。同时,在低带宽环境下,如无人机监视任务中,压缩技术能够有效减少网络带宽占用,保证重要信息的传输。综上所述,图像压缩在机器视觉中不仅提升了存储和传输效率,还优化了计算性能,是实现高效智能处理的关键步骤。
2、然而在机器视觉应用中,如自动驾驶车辆识别、安防监控等领域,图像的视觉数据信息有效性极为关键。压缩过程中信息的丢失可能导致图像的实用价值大幅下降,如对象识别模型(例如 yolo算法)在处理压缩后的图像时,因为图像细节的丢失,可能无法准确识别或定位对象。若不进行图像压缩,由于图像中的视觉数据有着大量的冗余信息,这些冗余信息不仅对图像的实用价值没有贡献,还大大增加了图像的体积导致不必要的存储资源和传输时间消耗。此外,传统的压缩方法往往对所有图像使用固定的压缩策略,未能考虑到图像内容复杂度和在具体应用中的实际需求。这种“一刀切”的方法无法有效平衡压缩效率与图像有效视觉信息保留,导致在重要图像场景下
3、为了解决这些问题,亟需一种创新的图像压缩方法。
技术实现思路
1、为解决上述问题,本申请提出了一种创新的图像压缩方法,该方法的核心在于将图像的信息熵引入图像压缩的考虑范围之中,根据图像的信息熵、图像原始大小、自动驾驶处理负载等信息动态调整压缩比例,以实现在减少图像体积的同时,尽可能保留图像中的有效视觉数据信息。通过引入强化学习技术,该方法能够自主学习和适应不同图像的最佳压缩策略,从而最大限度地保留图像的实用价值。尤其是在需要高精度图像识别和处理的应用场景中,能够显著提高压缩图像的有效性和实用性。
2、本专利技术提供的一种基于熵值分析的多图片综合保质压缩方法,具体步骤如下:
3、s1、对机器视觉应用中产生的图片进行信息熵分析计算得到图片的信息熵;
4、s2、将图片的信息熵、图片大小以及机器视觉设备与强化学习技术相结合,通过强化学习训练,得到相应的 dqn网络,机器视觉设备用 dqn网络来对产生的图片进行处理,得到目标的压缩比例,得到机器视觉应用中图片的目标压缩方案。
5、优选的,对机器视觉应用中产生的图片进行信息熵分析计算得到图片的信息熵的表达式为:
6、;
7、其中,为图片的信息熵,代表像素对在图片中出现的概率。
8、优选的,其中,的计算公式如下:
9、;
10、其中,像素对中表示滑动窗口内中心像素的灰度值, b是不包括中心像素的滑动窗口内像素的平均灰度值,是像素对在整个图片所有像素中出现的频率,是像素数,为一个特定的视觉数据处理任务,相当于一个图片,中的表示图片本身的次序。
11、优选的,s2的具体内容包括为对 dqn的状态 state定义、 dqn的动作 action定义和 dqn的奖励 reward定义;
12、其中,对 dqn的状态 state定义的具体内容为:
13、定义状态 state为,其中 e表示图像的信息熵,反映图像的复杂度和信息量, s代表图像的原始大小,代表机器视觉设备在同一时刻产生的需要处理的图片个数;
14、其中,对 dqn的动作 action定义的具体内容为:
15、对于一个原始图片, dqn对其做出的 action为:
16、;
17、优选的, dqn的奖励 reward的具体内容为:
18、对于图片处理任务,定义图片处理任务从产生,计算图片信息熵,进行压缩到被特定应用 yolo处理完成的时间为,处理结果准确率为;
19、定义图片处理任务被处理完成后,被特定应用处理的图片个数一共为;
20、进而定义一个特定的图片处理任务被处理完成后, dqn得到的 reward为:
21、。
22、优选的, dqn的网络训练步骤为:
23、步骤1、初始化 dqn的 q网络以及经验回放池 d;
24、步骤2开始多轮次训练;
25、步骤2中开始多轮次训练的具体内容为:
26、步骤2.1、从外界环境中得到第一个 state,为(,,);
27、步骤2.2、 dqn有ε的概率随机选择一个动作,或者以1-ε概率选择值为 argmax_a'q( state,a')的动作,将已经选择的动作记为;
28、步骤2.3、 dqn执行动作,得到奖励,然后从外界得到新状态 next_state,随后将( state, , ,next_state)元组存储到经验回放池 d,将从外界得到的新状态 next_ state设置为当前的 本文档来自技高网...
【技术保护点】
1.一种基于熵值分析的多图片综合保质压缩方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于熵值分析的多图片综合保质压缩方法,其特征在于,对机器视觉应用中产生的图片进行信息熵分析计算得到图片的信息熵的表达式为:
3.根据权利要求2所述的一种基于熵值分析的多图片综合保质压缩方法,其特征在于,其中,的计算公式如下:
4.根据权利要求3所述的一种基于熵值分析的多图片综合保质压缩方法,其特征在于,S2的具体内容包括对DQN的状态state定义、DQN的动作action定义和DQN的奖励reward定义。
5.根据权利要求4所述的一种基于熵值分析的多图片综合保质压缩方法,其特征在于,对DQN的状态state定义的具体内容为:
6.根据权利要求5所述的一种基于熵值分析的多图片综合保质压缩方法,其特征在于,对DQN的动作action定义的具体内容为:
7.根据权利要求6所述的一种基于熵值分析的多图片综合保质压缩方法,其特征在于,DQN的奖励reward的具体内容为:
8.根据权利要求7所述的一种基
9.根据权利要求8所述的一种基于熵值分析的多图片综合保质压缩方法,其特征在于,DQN的网络训练步骤为:
10.根据权利要求9所述的一种基于熵值分析的多图片综合保质压缩方法,其特征在于,步骤2中开始多轮次训练的具体内容为:
...【技术特征摘要】
1.一种基于熵值分析的多图片综合保质压缩方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于熵值分析的多图片综合保质压缩方法,其特征在于,对机器视觉应用中产生的图片进行信息熵分析计算得到图片的信息熵的表达式为:
3.根据权利要求2所述的一种基于熵值分析的多图片综合保质压缩方法,其特征在于,其中,的计算公式如下:
4.根据权利要求3所述的一种基于熵值分析的多图片综合保质压缩方法,其特征在于,s2的具体内容包括对dqn的状态state定义、dqn的动作action定义和dqn的奖励reward定义。
5.根据权利要求4所述的一种基于熵值分析的多图片综合保质压缩方法,其特征在于,对dqn的状态state定义的具...
【专利技术属性】
技术研发人员:朱超,周怡航,陈霄,王小园,冯凌云,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。