System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种图像的感兴趣区域确定方法及相关装置制造方法及图纸_技高网

一种图像的感兴趣区域确定方法及相关装置制造方法及图纸

技术编号:43985086 阅读:5 留言:0更新日期:2025-01-10 20:08
一种图像的感兴趣区域确定方法,应用于视频编码过程。在该方法中,通过复用视频编码过程中所求得的运动向量以及第二图像的ROI来确定第一图像的ROI,实现了视频编码信息的有效利用,保证仅需少量计算操作即可获得图像的ROI,避免了通过AI模型来识别图像中的ROI,有效地降低了确定图像ROI所需的处理资源且提高了确定图像ROI的效率,保证视频编码的正常执行。

【技术实现步骤摘要】

本申请实施例涉及图像处理,尤其涉及一种图像的感兴趣区域确定方法及相关装置


技术介绍

1、随着网络的普及,视频传输在社会的各个领域中越来越常见。在一些特定的场景中(例如安防场景以及多媒体场景),视频传输已经成为了不可或缺的角色。

2、一般地,在视频传输过程中,为了降低需要传输的视频数据量,通常会对视频进行编码处理,从而实现对视频数据的压缩。在相关技术中,为了进一步降低压缩后的视频数据的数据量,采用了感兴趣区域(region of interest,roi)编码技术来对视频进行编码。roi编码技术具体是识别视频中每个图像的roi,从而为图像中的roi和非roi赋予不同的压缩参数,保证图像中的roi质量的前提下,进一步降低图像中的非roi的质量,从而实现进一步降低压缩后的视频数据的数据量。

3、然而,相关技术中的roi编码技术是通过人工智能(artificial intelligence,ai)模型来识别图像中的roi,需要耗费较多的处理资源且识别时间较长,容易影响正常的视频编码过程。


技术实现思路

1、本申请提供了一种图像的感兴趣区域确定方法,能够有效地降低确定图像roi所需的处理资源且提高了确定图像roi的效率,保证视频编码的正常执行。

2、本申请第一方面提供一种图像的感兴趣区域确定方法,该方法应用于视频编码过程。具体地,该方法包括:首先,获取第一图像对应的运动向量集合,运动向量集合是通过对第一图像和第二图像执行帧间预测得到的,且运动向量集合包括第一图像中的多个图像块对应的运动向量。具体地,运动向量集合包括多个运动向量,且多个运动向量与第一图像中的多个图像块一一对应。每个运动向量分别用于表示第一图像中的图像块相对于第二图像中的匹配图像块的位移量。

3、其中,第一图像和第二图像属于同一个视频中的图像,且第二图像在视频中的显示顺序位于第一图像之前,例如第二图像为第一图像的前一帧图像。此外,第二图像的编码顺序也是在第一图像之前,即第二图像是先于第一图像进行编码的。在对第一图像进行编码时,第二图像已经编码完毕。

4、然后,获取第二图像的roi。由于第二图像是位于第一图像之前的已编码的图像,因此第二图像的roi也是在第二图像编码过程已经确定好的。

5、最后,基于运动向量集合和第二图像的roi,确定第一图像的roi。由于运动向量集合中记录了第一图像中的图像块相较于第二图像中的匹配图像块之间的位移情况,因此针对于第二图像中的roi,可以基于运动向量集合查找得到第二图像中的roi所包括的匹配图像块在第一图像中所对应的图像块,进而将第二图像中的roi在第一图像中所对应的图像块集合视为第一图像的roi。

6、本方案中,通过对视频中的第一图像和第二图像执行帧间预测来获得第一图像对应的运动向量,从而获得第一图像中的图像块相较于第二图像的位移情况。并且,在获得第二图像的roi的情况下,基于第一图像对应的运动向量,即可获知第一图像的roi相较于第二图像的roi的位移情况,进而确定第一图像的roi。

7、总的来说,本方案通过复用视频编码过程中所求得的运动向量以及第二图像的roi来确定第一图像的roi,实现了视频编码信息的有效利用,保证仅需少量计算操作即可获得图像的roi,避免了通过ai模型来识别图像中的roi,有效地降低了确定图像roi所需的处理资源且提高了确定图像roi的效率,保证视频编码的正常执行。

8、在一种可能的实现方式中,第一图像的roi是基于运动向量集合对第二图像的roi进行移动后确定的。由于第一图像和第二图像的大小是相同的,第二图像的roi在第二图像中的位置也是确定的,因此基于运动向量集合对第二图像的roi进行移动后,则可以得到第二图像的roi在第一图像中所对应的图像块集合的位置,进而获得第一图像中的roi所在的位置。

9、本方案中,复用视频编码过程中所求得的运动向量以及第二图像的roi,能够通过基于运动向量来移动第二图像的roi,进而确定第一图像的roi,实现了视频编码信息的有效利用,保证仅需少量计算操作即可获得图像的roi,有效地降低了确定图像roi所需的处理资源。

10、在一种可能的实现方式中,基于运动向量集合和第二图像的roi确定第一图像的roi,具体包括:基于运动向量集合确定第二图像的roi的位移情况,即基于运动向量集合能够确定第二图像的roi需要进行怎样的位移才能够到达第一图像中对应的图像块所在的位置;然后,基于所确定的位移情况对第二图像的roi进行移动,得到第二图像的roi移动后的目标位置,该目标位置用于指示第一图像的roi。也就是说,在确定目标位置后,即可确定第一图像的roi。

11、本方案中,通过将第二图像的roi视为第一图像的roi的匹配图像块,并通过运动向量集合查找到第一图像的roi相对于第二图像的roi的位移情况,即可通过移动第二图像的roi来确定第一图像的roi的位置,从而实现以简单快捷的方式确定第一图像的roi。

12、在一种可能的实现方式中,第一图像的roi用于在视频编码中确定第一图像中的不同区域的量化参数。例如,在对第一图像进行编码时,采用较大的量化参数来对第一图像的非roi进行压缩编码,并采用较小的量化参数来对第一图像的roi进行压缩编码。

13、本方案中,通过采用不同的量化参数来分别对第一图像中的roi和非roi进行压缩编码,能够使得第一图像中的roi保留较多的细节,第一图像中的非roi则保留较少的细节,从而在保证第一图像中roi质量的同时,减小第一图像编码后的数据量。

14、在一种可能的实现方式中,运动向量集合是基于视频编码过程中的帧间预测步骤得到的,且运动向量集合还用于执行视频编码过程中的变换步骤。具体来说,视频编码过程包括图像分块、帧间预测、变换、量化以及熵编码等步骤,本实施例中是在执行正常的视频编码步骤的过程中,还额外输出帧间预测所得到的运动向量来执行后续的roi确定步骤。

15、本方案中,通过复用在视频编码过程执行帧间预测所得到的运动向量来实现确定第一图像的roi,而无需执行额外的计算步骤来获得运动向量,有效地减少了确定roi所带来的计算开销。

16、在一种可能的实现方式中,本申请提供的图像的感兴趣区域确定方法应用于视频编码器,该视频编码器还用于执行常规的编码步骤,例如帧间预测、变换、量化以及熵编码等编码步骤。

17、本方案中,通过视频编码器来同时实现常规的视频编码流程以及确定图像roi的过程,能够避免视频编码器与其他的硬件交互,提高了视频编码的效率,且视频编码过程不会受到确定图像roi过程的影响,有效地降低了视频编码的时延。

18、在一种可能的实现方式中,在确定第一图像的roi之后,可以将第一图像的roi存储于寄存器中,该寄存器用于在编码第一图像之后的图像时提供第一图像的roi。也就是说,在对第一图像之后的图像进行编码时,还可以基于第一图像的roi来确定本文档来自技高网...

【技术保护点】

1.一种图像的感兴趣区域确定方法,其特征在于,所述方法应用于视频编码过程,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一图像的ROI是基于所述运动向量集合对所述第二图像的ROI进行移动后确定的。

3.根据权利要求1或2所述的方法,其特征在于,所述基于所述运动向量集合和所述第二图像的ROI,确定所述第一图像的ROI,包括:

4.根据权利要求1-3任意一项所述的方法,其特征在于,所述第一图像的ROI用于在视频编码中确定所述第一图像中的不同区域的量化参数。

5.根据权利要求1-4任意一项所述的方法,其特征在于,所述运动向量集合是基于视频编码过程中的帧间预测步骤得到的,且所述运动向量集合还用于执行所述视频编码过程中的变换步骤。

6.根据权利要求1-5任意一项所述的方法,其特征在于,所述方法应用于视频编码器。

7.根据权利要求1-6任意一项所述的方法,其特征在于,所述方法还包括:

8.根据权利要求1-7任意一项所述的方法,其特征在于,所述第二图像的ROI是基于所述视频中位于所述第二图像之前的第三图像的ROI得到的。

9.根据权利要求1-7任意一项所述的方法,其特征在于,所述第二图像为所述视频中的关键帧,所述第二图像的ROI是通过人工智能AI模型对所述第二图像进行识别得到的。

10.根据权利要求1-9任意一项所述的方法,其特征在于,所述第一图像的获取场景为以下的任意一个场景:安防场景、多媒体场景、自动驾驶场景以及工业控制场景。

11.一种图像的感兴趣区域确定装置,其特征在于,所述装置应用于视频编码过程,所述装置包括:

12.根据权利要求11所述的装置,其特征在于,所述第一图像的ROI是基于所述运动向量集合对所述第二图像的ROI进行移动后确定的。

13.根据权利要求11或12所述的装置,其特征在于,所述处理模块,具体用于:

14.根据权利要求11-13任意一项所述的装置,其特征在于,所述第一图像的ROI用于在视频编码中确定所述第一图像中的不同区域的量化参数。

15.根据权利要求11-14任意一项所述的装置,其特征在于,所述运动向量集合是基于视频编码过程中的帧间预测步骤得到的,且所述运动向量集合还用于执行所述视频编码过程中的变换步骤。

16.根据权利要求11-15任意一项所述的装置,其特征在于,所述装置为视频编码器。

17.根据权利要求11-16任意一项所述的装置,其特征在于,所述处理模块,还用于:

18.一种图像的感兴趣区域确定装置,其特征在于,包括存储器和处理器;所述存储器存储有代码,所述处理器被配置为执行所述代码,当所述代码被执行时,所述装置执行如权利要求1至10任意一项所述的方法。

19.一种计算机存储介质,其特征在于,所述计算机存储介质存储有指令,所述指令在由计算机执行时使得所述计算机实施权利要求1至10任意一项所述的方法。

20.一种计算机程序产品,其特征在于,所述计算机程序产品存储有指令,所述指令在由计算机执行时使得所述计算机实施权利要求1至10任意一项所述的方法。

...

【技术特征摘要】

1.一种图像的感兴趣区域确定方法,其特征在于,所述方法应用于视频编码过程,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一图像的roi是基于所述运动向量集合对所述第二图像的roi进行移动后确定的。

3.根据权利要求1或2所述的方法,其特征在于,所述基于所述运动向量集合和所述第二图像的roi,确定所述第一图像的roi,包括:

4.根据权利要求1-3任意一项所述的方法,其特征在于,所述第一图像的roi用于在视频编码中确定所述第一图像中的不同区域的量化参数。

5.根据权利要求1-4任意一项所述的方法,其特征在于,所述运动向量集合是基于视频编码过程中的帧间预测步骤得到的,且所述运动向量集合还用于执行所述视频编码过程中的变换步骤。

6.根据权利要求1-5任意一项所述的方法,其特征在于,所述方法应用于视频编码器。

7.根据权利要求1-6任意一项所述的方法,其特征在于,所述方法还包括:

8.根据权利要求1-7任意一项所述的方法,其特征在于,所述第二图像的roi是基于所述视频中位于所述第二图像之前的第三图像的roi得到的。

9.根据权利要求1-7任意一项所述的方法,其特征在于,所述第二图像为所述视频中的关键帧,所述第二图像的roi是通过人工智能ai模型对所述第二图像进行识别得到的。

10.根据权利要求1-9任意一项所述的方法,其特征在于,所述第一图像的获取场景为以下的任意一个场景:安防场景、多媒体场景、自动驾驶场景以及工业控制场景。

1...

【专利技术属性】
技术研发人员:范彬彬王涛孙依然
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1