System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 图像生成方法、装置、设备、存储介质及产品制造方法及图纸_技高网

图像生成方法、装置、设备、存储介质及产品制造方法及图纸

技术编号:42526594 阅读:9 留言:0更新日期:2024-08-27 19:36
本发明专利技术属于图像生成技术领域,公开了一种图像生成方法、装置、设备、存储介质及产品。本发明专利技术通过对接收到的正向文本进行特征提取,获得正向文本特征,正向文本为用户在图像生成界面中输入的非英文文本,用于表征生成的图像包含的图像特征;根据正向文本特征进行特征推理,获得图像隐空间表征;根据图像隐空间表征生成图像。由于并非采用翻译的形式,而是通过提取文本特征进行特征推理,生成图像隐空间表征,再根据图像隐空间表征生成图像,避免了因语种差异的翻译歧义导致的图像生成错误的问题,提高了图像生成对非英文输入的支持效果。

【技术实现步骤摘要】

本专利技术涉及图像生成,尤其涉及一种图像生成方法、装置、设备、存储介质及产品


技术介绍

1、图像生成是aigc的重要领域,而目前图像生成界面(stable diffusion web ui,简称webui)在科研和社区应用非常广泛。而原始webui只支持英文输入,不支持非英文输入,若需要使用其他语种的输入(如中文输入),则需要通过额外设置插件将中文翻译成英文再进行图像生成,但是这种情况下可能会出现翻译歧义问题,如将“起重机”翻译成“crane”后进行图像生成,会生成一张鹤的图片。


技术实现思路

1、本专利技术的主要目的在于提供一种图像生成方法、装置、设备、存储介质及产品,旨在解决现有技术图像生成对非英文输入支持较差,图像生成错误率高的技术问题。

2、为实现上述目的,本专利技术提供了一种图像生成方法,所述方法包括以下步骤:

3、对接收到的正向文本进行特征提取,获得正向文本特征,所述正向文本为用户在图像生成界面中输入的非英文文本,用于表征生成的图像包含的图像特征;

4、根据所述正向文本特征进行特征推理,获得图像隐空间表征;

5、根据所述图像隐空间表征生成图像。

6、可选的,所述根据所述正向文本特征进行特征推理,获得图像隐空间表征的步骤之前,还包括:

7、通过界面插件的脚本加载模块加载文生图模型;

8、所述根据所述正向文本特征进行特征推理,获得图像隐空间表征的步骤,包括:

9、通过所述文生图模型根据所述正向文本特征进行特征推理,获得图像隐空间表征。

10、可选的,所述文生图模型包括旁支网络及主干网络;

11、所述通过所述文生图模型根据所述正向文本特征进行特征推理,获得图像隐空间表征的步骤,包括:

12、通过所述旁支网络根据所述正向文本特征进行特征推理,获得旁支推理结果;

13、通过所述主干网络根据所述旁支推理结果进行二次推理,获得图像隐空间表征。

14、可选的,所述文生图模型还包括生成网络;

15、所述根据所述图像隐空间表征生成图像的步骤,包括:

16、通过所述生成网络根据所述图像隐空间表征生成图像。

17、可选的,所述根据所述正向文本特征进行特征推理,获得图像隐空间表征的步骤之前,还包括:

18、对接收到的负向文本进行特征提取,获得负向文本特征,所述负向文本为用户在图像生成界面中输入的非英文文本,用于表征生成的图像不包含的图像特征;

19、所述根据所述正向文本特征进行特征推理,获得图像隐空间表征的步骤,包括:

20、根据所述正向文本特征及所述负向文本特征进行特征推理,获得图像隐空间表征。

21、可选的,所述根据所述正向文本特征及所述负向文本特征进行特征推理,获得图像隐空间表征的步骤,包括:

22、对所述正向文本特征及所述负向文本特征进行特征比对,获得特征相似度;

23、若所述特征相似度小于或等于预设相似度阈值,则根据所述正向文本特征及所述负向文本特征进行特征推理,获得图像隐空间表征。

24、可选的,所述根据所述图像隐空间表征生成图像的步骤之后,还包括:

25、对生成的图像中至少一个图像目标进行特征提取,获得各图像目标对应的图像目标特征;

26、将所述图像目标特征与所述正向文本特征进行匹配,获得各图像目标对应的第一特征关联度;

27、若各图像目标对应的第一特征关联度均小于第一关联度阈值,则返回所述根据所述正向文本特征及所述负向文本特征进行特征推理,获得图像隐空间表征的步骤。

28、可选的,所述将所述图像目标特征与所述正向文本特征进行匹配,获得特征关联度的步骤之后,还包括:

29、若存在至少一个对应的第一特征关联度大于或等于第一关联度阈值的图像目标,则将所述图像目标特征与所述负向文本特征进行匹配,获得各图像目标对应的第二特征关联度;

30、若存在至少一个对应的第二特征关联度大于或等于第二关联度阈值的图像目标,则返回所述根据所述正向文本特征及所述负向文本特征进行特征推理,获得图像隐空间表征的步骤。

31、可选的,所述对接收到的正向文本进行特征提取,获得正向文本特征的步骤,包括:

32、对接收到的正向文本进行语种识别,获得文本语种;

33、获取所述文本语种对应的特征提取模型;

34、通过所述特征提取模型对所述正向文本进行特征提取,获得正向文本特征。

35、可选的,所述获取所述文本语种对应的特征提取模型的步骤,包括:

36、检测语种模型映射表中是否存在所述文本语种对应的映射记录;

37、若存在,则从所述文本语种对应的映射记录中提取模型标识;

38、根据所述模型标识查找所述文本语种对应的特征提取模型。

39、可选的,所述根据所述正向文本特征进行特征推理,获得图像隐空间表征的步骤,包括:

40、通过预设噪声生成算法生成噪声数据;

41、根据所述正向文本特征及所述噪声数据进行特征推理,获得图像隐空间表征。

42、此外,为实现上述目的,本专利技术还提出一种图像生成装置,所述图像生成装置包括:

43、接收模块,用于对接收到的正向文本进行特征提取,获得正向文本特征,所述正向文本为用户在图像生成界面中输入的非英文文本,用于表征生成的图像包含的图像特征;

44、推理模块,用于根据所述正向文本特征进行特征推理,获得图像隐空间表征;

45、生成模块,用于根据所述图像隐空间表征生成图像。

46、可选的,所述推理模块,还用于通过界面插件的脚本加载模块加载文生图模型;

47、所述推理模块,还用于通过所述文生图模型根据所述正向文本特征进行特征推理,获得图像隐空间表征。

48、可选的,所述文生图模型包括旁支网络及主干网络;

49、所述推理模块,还用于通过所述旁支网络根据所述正向文本特征进行特征推理,获得旁支推理结果;通过所述主干网络根据所述旁支推理结果进行二次推理,获得图像隐空间表征。

50、可选的,所述文生图模型还包括生成网络;

51、所述生成模块,还用于通过所述生成网络根据所述图像隐空间表征生成图像。

52、可选的,所述接收模块,还用于对接收到的负向文本进行特征提取,获得负向文本特征,所述负向文本为用户在图像生成界面中输入的非英文文本,用于表征生成的图像不包含的图像特征;

53、所述推理模块,还用于根据所述正向文本特征及所述负向文本特征进行特征推理,获得图像隐空间表征。

54、可选的,所述推理模块,还用于对所述正向文本特征及所述负向文本特征进行特征比对,获得特征相似度;若所述特征相似度小于或等于预设相似度阈值,则根据所述正向文本特征及所述本文档来自技高网...

【技术保护点】

1.一种图像生成方法,其特征在于,所述图像生成方法包括以下步骤:

2.如权利要求1所述的图像生成方法,其特征在于,所述根据所述正向文本特征进行特征推理,获得图像隐空间表征的步骤之前,还包括:

3.如权利要求2所述的图像生成方法,其特征在于,所述文生图模型包括旁支网络及主干网络;

4.如权利要求3所述的图像生成方法,其特征在于,所述文生图模型还包括生成网络;

5.如权利要求1所述的图像生成方法,其特征在于,所述根据所述正向文本特征进行特征推理,获得图像隐空间表征的步骤之前,还包括:

6.如权利要求5所述的图像生成方法,其特征在于,所述根据所述正向文本特征及所述负向文本特征进行特征推理,获得图像隐空间表征的步骤,包括:

7.一种图像生成装置,其特征在于,所述图像生成装置包括:

8.一种图像生成设备,其特征在于,所述图像生成设备包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的图像生成程序,所述图像生成程序被处理器执行时实现如权利要求1-6中任一项所述的图像生成方法的步骤。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有图像生成程序,所述图像生成程序执行时实现如权利要求1-6中任一项所述的图像生成方法的步骤。

10.一种计算机程序产品,其特征在于,所述计算机程序产品包括图像生成程序,所述图像生成程序执行时实现如权利要求1-6中任一项所述的图像生成方法的步骤。

...

【技术特征摘要】

1.一种图像生成方法,其特征在于,所述图像生成方法包括以下步骤:

2.如权利要求1所述的图像生成方法,其特征在于,所述根据所述正向文本特征进行特征推理,获得图像隐空间表征的步骤之前,还包括:

3.如权利要求2所述的图像生成方法,其特征在于,所述文生图模型包括旁支网络及主干网络;

4.如权利要求3所述的图像生成方法,其特征在于,所述文生图模型还包括生成网络;

5.如权利要求1所述的图像生成方法,其特征在于,所述根据所述正向文本特征进行特征推理,获得图像隐空间表征的步骤之前,还包括:

6.如权利要求5所述的图像生成方法,其特征在于,所述根据所述正向文本特征及所述负向文本特征进行特征推理,获得图像...

【专利技术属性】
技术研发人员:黄泽涛杨亦威刘山源冷大炜
申请(专利权)人:北京鸿享技术服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1