图像模型的训练方法、视频的处理方法、设备及存储介质技术

技术编号：41912131 阅读：19 留言：0更新日期：2024-07-05 14:14

本发明专利技术公开了一种二值化图像模型的训练方法、视频的处理方法、电子设备及存储介质。其中，方法包括：获取至少一个视频中的每个视频对应的至少一帧图像；将所述至少一帧图像中的每帧图像进行灰度化处理，得到所述每帧图像对应的灰度化图像；判断所述灰度化图像是否存在颜色干扰；在所述灰度化图像存在颜色干扰的情况下，将所述灰度化图像中每个像素点的灰度值进行翻转，得到所述灰度化图像对应的至少一个区域；确定所述至少一个区域中每个区域对应的二值化参数，利用所述二值化参数对所述二值化图像模型进行训练。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机，尤其涉及一种图像模型的训练方法、视频的处理方法、设备及存储介质。

技术介绍

1、相关技术中，为了对视频中的文本进行识别，通常对彩色视频图像进行灰度图二值化时，但目前转换方法得到的文本容易模糊或在空白区域会产生黑色的块，影响观感；或者对图像直接进行卷积网络建模，但无法同时得到去除水印、褶皱和污渍的图片，可能形成错误的文本识别。因此，对于如何提高图像中文本的可识别度，目前没有有效的解决方案。

技术实现思路

1、为解决现有存在的技术问题，本专利技术实施例提供一种二值化图像模型的训练方法和视频的处理方法。

2、为达到上述目的，本专利技术实施例的技术方案是这样实现的：

3、第一方面，本专利技术实施例提供了一种二值化图像模型的训练方法，所述方法包括：

4、获取至少一个视频中每个视频对应的至少一帧图像；

5、将所述至少一帧图像中的每帧图像进行灰度化处理，得到所述每帧图像对应的灰度化图像；

6、判断所述灰度化图像是否存在颜色干扰；

7、在所述灰度化图像存在颜色干扰的情况下，将所述灰度化图像中每个像素点的灰度值进行翻转，得到所述灰度化图像对应的至少一个区域；

8、确定所述至少一个区域中每个区域对应的二值化参数，利用所述二值化参数对所述二值化图像模型进行训练。

9、在上述方案中，所述获取至少一个视频中的每个视频个的至少一帧图像，包括：

10、获取所述每个视频中的文本；>

11、对所述文本进行解码处理，得到所述每个视频对应的至少一帧图像。

12、在上述方案中，所述判断所述灰度化图像是否存在颜色干扰，包括：

13、对所述灰度化图像进行分块处理，得到所述灰度化图像对应的至少一个子灰度化图像；

14、确定所述至少一个子灰度化图像中的每个子灰度化图像和像素点参数；

15、在所述像素点参数大于第一预设阈值的情况下，确定大于所述第一预设阈值的像素点参数对应的第一子灰度化图像；

16、获取所述第一子灰度化图像的第一灰度值；

17、在所述第一灰度值大于第二预设阈值的情况下，确定所述灰度化图像存在颜色干扰；

18、在所述像素点参数小于或等于所述第一预设阈值以及所述第一灰度值小于或等于所述第二预设阈值的情况下，确定所述灰度化图像不存在颜色干扰。

19、在上述方案中，所述确定所述至少一个区域中每个区域对应的二值化参数，包括：

20、获取所述每个区域对应的像素点参数；

21、基于所述每个区域对应的像素点参数确定所述至少一个区域中每个区域对应的二值化参数。

22、在上述方案中，所述方法还包括：

23、确定所述至少一个区域中的第一区域、第二区域和第三区域；

24、获取所述第一区域对应的第一二值化参数、所述第二区域对应的第二二值化参数、所述第三区域对应的第三二值化参数；

25、利用所述第一二值化参数、所述第二二值化参数、所述第三二值化参数对所述二值化图像进行训练。

26、第二方面，本专利技术实施例还提供一种视频的处理方法，所述方法包括：

27、获取待处理视频对应的至少一帧图像；

28、将所述至少一帧图像中的每帧图像输入至二值化图像模型，得到所述每帧图像对应的二值化值；

29、基于所述二值化值对所述待处理视频中的文本进行增强；

30、其中，所述二值化图像模型基于本专利技术实施例提供的二值化图像模型的训练方法训练得到。

31、在上述方案中，所述方法还包括：

32、获取所述待处理视频中的文本；对所述文本进行解码处理，得到所述待处理视频对应的至少一帧图像。

33、在上述方案中，所述方法还包括：

34、获取与所述每帧图像对应的第一数据；所述第一数据至少包括三原色rgb图像；

35、将所述rgb图像输入至所述二值化图像模型，得到第一帧的二值化图像以及与所述第一帧相邻的第二帧的二值化图像；

36、基于所述第一帧的二值化图像和所述第二帧的二值化图像确定所述第一帧的二值化值；

37、根据所述第一帧的二值化值对所述待处理视频中的文本进行增强。

38、第三方面，本专利技术实施例还提供一种二值化图像模型的训练装置，包括：

39、第一获取单元，用于获取至少一个视频中的每个视频对应的至少一帧图像；

40、灰度化处理单元，用于将所述至少一帧图像中的每帧图像进行灰度化处理，得到所述每帧图像对应的灰度化图像；

41、判断单元，用于判断所述灰度化图像是否存在颜色干扰；

42、翻转单元，用于在所述灰度化图像存在颜色干扰的情况下，将所述灰度化图像中每个像素点的灰度值进行翻转，得到所述灰度化图像对应的至少一个区域；

43、确定单元，用于确定所述至少一个区域中每个区域对应的二值化参数，利用所述二值化参数对所述二值化图像模型进行训练。

44、第四方面，本专利技术实施例还提供一种视频的处理装置，包括：

45、第二获取单元，用于获取待处理视频对应的至少一帧图像；

46、输入单元，用于将所述至少一帧图像中的每帧图像输入至二值化图像模型，得到所述每帧图像对应的二值化值；

47、增强单元，用于基于所述二值化值对所述待处理视频中的文本进行增强；

48、其中，所述二值化图像模型基于本专利技术实施例提供的二值化图像模型的训练方法训练得到。

49、第五方面，本专利技术实施例还提供一种电子设备，包括存储器，用于存储可执行指令；

50、处理器，用于执行所述存储中存储的可执行指令时，实现本专利技术实施例提供的二值化图像模型的训练方法、或实现本专利技术实施例提供的视频的处理方法。

51、第六方面，本专利技术实施例还提供一种存储介质，所述存储介质存储有可执行指令，当所述可执行指令被至少一个处理器执行时，实现本专利技术实施例提供的二值化图像模型的训练方法、或实现本专利技术实施例提供的视频的处理方法。

52、本申请提供了一种二值化图像模型的训练方法和视频的处理方法。其中，所述二值化图像模型的训练方法包括：获取至少一个视频中每个视频对应的至少一帧图像；将所述至少一帧图像中的每帧图像进行灰度化处理，得到所述每帧图像对应的灰度化图像；判断所述灰度化图像是否存在颜色干扰；在所述灰度化图像存在颜色干扰的情况下，将所述灰度化图像中每个像素点的灰度值进行翻转，得到所述灰度化图像对应的至少一个区域；确定所述至少一个区域中每个区域对应的二值化参数，利用所述二值化参数对所述二值化图像模型进行训练。本实施例中，通过判断所述灰度化图像是否存在颜色干扰，在所述灰度化图像存在颜色干扰的情况下，将所述灰度化图像中每个像素点的灰度值进行翻转，得到所述灰度化图像对应的至少一个区域，确定所述至少一个区域中每个区本文档来自技高网...

【技术保护点】

1.一种二值化图像模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取至少一个视频中的每个视频对应的至少一帧图像，包括：

3.根据权利要求1所述的方法，其特征在于，所述判断所述灰度化图像是否存在颜色干扰，包括：

4.根据权利要求1所述的方法，其特征在于，所述确定所述至少一个区域中每个区域对应的二值化参数，包括：

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

6.一种视频的处理方法，其特征在于，所述方法包括：

7.根据权利要求6所述的方法，其特征在于，所述获取待处理视频对应的至少一帧图像，包括：

8.根据权利要求6所述的方法，其特征在于，所述方法还包括：

9.一种电子设备，其特征在于，包括：

10.一种存储介质，其特征在于，所述存储介质存储有可执行指令，当所述可执行指令被至少一个处理器执行时，实现权利要求1至5任一项所述的二值化图像模型的训练方法、或实现权利要求6至8任一项所述的视频的处理方法。

【技术特征摘要】

1.一种二值化图像模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取至少一个视频中的每个视频对应的至少一帧图像，包括：

3.根据权利要求1所述的方法，其特征在于，所述判断所述灰度化图像是否存在颜色干扰，包括：

4.根据权利要求1所述的方法，其特征在于，所述确定所述至少一个区域中每个区域对应的二值化参数，包括：

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

6.一种...

【专利技术属性】
技术研发人员：阳海件，严飞军，许冬瑾，池庆国，陈翔，武泽宇，
申请(专利权)人：中移杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人