图像处理方法、装置、电子设备、可读存储介质及程序产品制造方法及图纸

技术编号：44230716 阅读：8 留言：0更新日期：2025-02-11 13:34

本公开关于一种图像处理方法、装置、电子设备、可读存储介质及程序产品，包括：基于目标商品的第一商品图像，生成用于控制目标商品的商品背景的文本提示信息；获取目标商品的掩码图像，将所述掩码图像、所述目标商品的第二商品图像和所述文本提示信息输入图像生成模型，得到以所述目标商品为前景，以基于所述文本提示信息生成的图像为背景的目标图像。该方法以文本提示信息和目标商品的掩码图像为条件，通过图像生成模型实现背景的生成，可实现对目标商品的背景的自动化更换，提高商品的展示效果。并且，引入第二商品图像作为显式图像语义条件，能够实现背景区域和商品主体之间的和谐过渡，解决现有技术中背景与商品边界明显的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及计算机视觉，尤其涉及一种图像处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

1、随着电子商务的飞速发展，如何在众多商品中脱颖而出成为了厂商和电商平台追求的目标。商品展示效果直接影响消费者的购买意愿，尤其是商品图片背景。传统的商品图片背景处理通常需要设计师手工操作，耗时耗力且难以满足多样化的需求。

技术实现思路

1、本公开提供一种图像处理方法、装置、电子设备、存储介质及程序产品，以至少解决相关技术中处理商品图片背景的方法耗时耗力且难以满足多样化的需求的问题。本公开的技术方案如下：

2、根据本公开实施例的第一方面，提供一种图像处理方法，包括：

3、基于目标商品的第一商品图像，生成文本提示信息；所述文本提示信息用于控制生成所述目标商品的商品背景；

4、获取所述目标商品的掩码图像，将所述掩码图像、所述目标商品的第二商品图像和所述文本提示信息输入图像生成模型，得到目标图像；所述目标图像以所述目标商品为前景，以基于所述文本提示信息生成的图像为背景。

5、在一示例性实施例中，所述将所述掩码图像、所述目标商品的第二商品图像和所述文本提示信息输入图像生成模型，得到目标图像，包括：

6、分别对所述掩码图像和所述第二商品图像进行编码处理，得到掩码图像编码和商品图像编码；

7、将所述掩码图像编码、所述商品图像编码和所述文本提示信息输入所述图像生成模型，得到所述目标图像。

8、在一示例性实

9、所述将所述掩码图像编码、所述商品图像编码和所述文本提示信息输入所述图像生成模型，得到目标图像，包括：

10、将所述文本提示信息输入所述图像生成模型中的所述文本编码器，得到文本编码；

11、将所述文本编码和所述商品图像编码输入所述unet网络的编码模块和解码模块，以及将所述掩码图像编码输入所述unet网络的解码模块，得到与所述文本提示信息相对应的潜在图像表示；

12、将所述潜在图像表示输入所述生成网络，生成所述目标图像。

13、在一示例性实施例中，所述基于目标商品的第一商品图像，生成文本提示信息，包括：

14、将所述目标商品的第一商品图像输入多模态大语言模型进行处理，得到所述文本提示信息。

15、在一示例性实施例中，所述获取所述目标商品的掩码图像，包括：

16、对所述目标商品的第一商品图像或第二商品图像进行基于所述目标商品的分割处理，得到所述掩码图像；所述掩码图像中包含所述目标商品的完整特征。

17、在一示例性实施例中，所述第一商品图像和所述第二商品图像均为以所述目标商品为前景，以任意图像为背景的图像。

18、根据本公开实施例的第二方面，提供一种图像处理装置，包括：

19、信息生成单元，被配置为执行基于目标商品的第一商品图像，生成文本提示信息；所述文本提示信息用于控制生成所述目标商品的商品背景；

20、图像生成单元，被配置为执行获取所述目标商品的掩码图像，将所述掩码图像、所述目标商品的第二商品图像和所述文本提示信息输入图像生成模型，得到目标图像；所述目标图像以所述目标商品为前景，以基于所述文本提示信息生成的图像为背景。

21、在一示例性实施例中，所述图像生成单元，还被配置为执行分别对所述掩码图像和所述第二商品图像进行编码处理，得到掩码图像编码和商品图像编码；将所述掩码图像编码、所述商品图像编码和所述文本提示信息输入所述图像生成模型，得到所述目标图像。

22、在一示例性实施例中，所述图像生成模型包括文本编码器、unet网络和生成网络；所述图像生成单元，还被配置为执行将所述文本提示信息输入所述图像生成模型中的所述文本编码器，得到文本编码；将所述文本编码和所述商品图像编码输入所述unet网络的编码模块和解码模块，以及将所述掩码图像编码输入所述unet网络的解码模块，得到与所述文本提示信息相对应的潜在图像表示；将所述潜在图像表示输入所述生成网络，生成所述目标图像。

23、在一示例性实施例中，所述信息生成单元，还被配置为执行将所述目标商品的第一商品图像输入多模态大语言模型进行处理，得到所述文本提示信息。

24、在一示例性实施例中，所述图像生成单元，还被配置为执行对所述目标商品的第一商品图像或第二商品图像进行基于所述目标商品的分割处理，得到所述掩码图像；所述掩码图像中包含所述目标商品的完整特征。

25、在一示例性实施例中，所述第一商品图像和所述第二商品图像均为以所述目标商品为前景，以任意图像为背景的图像。

26、根据本公开实施例的第三方面，提供一种电子设备，包括：

27、处理器；

28、用于存储所述处理器可执行指令的存储器；

29、其中，所述处理器被配置为执行所述指令，以实现如上任一项所述的方法。

30、根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如上任一项所述的方法。

31、根据本公开实施例的第五方面，提供一种计算机程序产品，所述计算机程序产品中包括指令，所述指令被电子设备的处理器执行时，使得所述电子设备能够执行如上任一项所述的方法。

32、本公开的实施例提供的技术方案至少带来以下有益效果：

33、基于目标商品的第一商品图像，生成用于控制生成目标商品的商品背景的文本提示信息；获取目标商品的掩码图像，将掩码图像、目标商品的第二商品图像和文本提示信息输入图像生成模型，得到以目标商品为前景，以基于文本提示信息生成的图像为背景的目标图像。该方法以文本提示信息和目标商品的掩码图像为条件，通过图像生成模型实现背景的生成，由此可实现对目标商品的背景的自动化更换，提高商品的展示效果。进一步地，通过基于商品图像自动生成提示信息，可以有效提升提示的多样性和具体性，实现商品与背景的灵活适配。进一步地，引入第二商品图像作为显式图像语义条件，能够实现背景区域和商品主体之间的和谐过渡，解决现有技术中背景与商品边界明显的问题。

34、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

本文档来自技高网...

【技术保护点】

1.一种图像处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述掩码图像、所述目标商品的第二商品图像和所述文本提示信息输入图像生成模型，得到目标图像，包括：

3.根据权利要求2所述的方法，其特征在于，所述图像生成模型包括文本编码器、Unet网络和生成网络；

4.根据权利要求1所述的方法，其特征在于，所述基于目标商品的第一商品图像，生成文本提示信息，包括：

5.根据权利要求1所述的方法，其特征在于，所述获取所述目标商品的掩码图像，包括：

6.根据权利要求1-5任一项所述的方法，其特征在于，所述第一商品图像和所述第二商品图像均为以所述目标商品为前景，以任意图像为背景的图像。

7.一种图像处理装置，其特征在于，包括：

8.一种电子设备，其特征在于，包括：

9.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至6中任一项所述的图像处理方法。

10.一种计算机程序产品，包括

...

【技术特征摘要】

1.一种图像处理方法，其特征在于，包括：

3.根据权利要求2所述的方法，其特征在于，所述图像生成模型包括文本编码器、unet网络和生成网络；

4.根据权利要求1所述的方法，其特征在于，所述基于目标商品的第一商品图像，生成文本提示信息，包括：

5.根据权利要求1所述的方法，其特征在于，所述获取所述目标商品的掩码图像，包括：

6.根据权利要求...

【专利技术属性】
技术研发人员：陈敏捷，李岩，张迪，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人