显示设备及基于大模型的三维立体图像生成方法技术

技术编号：43708750 阅读：27 留言：0更新日期：2024-12-18 21:20

本申请一些实施例提供一种显示设备及基于大模型的三维立体图像生成方法，所述方法响应于用户输入的图像生成指令，获取图像生成指令对应的图像描述文本，并将图像描述文本输入至文本编码器，以获得特征编码集，其中，图像描述文本用于描述生成图像的形状和空间位置，特征编码集包括特征编码，特征编码包括草图编码、拓扑编码和拉伸编码。再将特征编码集输入至图像生成器，以生成目标图像，图像生成器为根据特征编码集生成三维立体图像的生成对抗网络模型。所述方法可以利用文本编码器将用户输入的图像描述文本转换为特征编码集，并利用图像生成器根据特征编码集生成三维立体图像，提高生成目标图像的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及显示设备，尤其涉及一种显示设备及基于大模型的三维立体图像生成方法。

技术介绍

1、显示设备是一种能够显示图像信息的终端设备，通过显示设备的语音识别技术和图像生成技术，可以实现根据用户的语音指令生成三维立体图像的功能。例如，用户向显示设备输入“请生成一个正方体在一个圆锥体下方的立体图像”的语音指令，显示设备将语音指令转化为文本描述信息，并利用文生图模型根据文本描述信息生成相应的图像。在生成的图像中，包括一个正方体和一个圆锥体，并且正方体位于圆锥体的下方。

2、但由于文生图模型在理解用户语义方面存在局限，导致生成的三维立体图像与用户的描述存在偏差。并且文生图模型无法准确控制三维立体图像的图像布局，导致生成图像的位置、尺寸和形状不准确，影响用户体验。

技术实现思路

1、本申请一些实施例中提供一种显示设备及基于大模型的三维立体图像生成方法，以解决文生图模型生成的三维立体图像准确率低的问题。

2、第一方面，本申请一些实施例提供一种显示设备，包括：显示器和控制器。所述显示器被配置为显示用户界面，所述控制器被配置为执行以下步骤：

3、响应于用户输入的图像生成指令，获取所述图像生成指令对应的图像描述文本，所述图像描述文本用于描述生成图像的形状和空间位置；

4、将所述图像描述文本输入至文本编码器，以获得特征编码集，所述文本编码器为根据编码规则将所述图像描述文本转换为特征编码的深度学习模型，所述特征编码集包括特征编码，所述特征编码包括草图编码、

5、将所述特征编码集输入至图像生成器，以获得目标图像，并控制所述显示器显示所述目标图像，所述图像生成器为根据特征编码集生成三维立体图像的生成对抗网络模型。

6、第二方面，本申请一些实施例还提供一种基于大模型的三维立体图像生成方法，应用于第一方面所述的显示设备，所述显示设备包括显示器和控制器，所述方法包括：

7、响应于用户输入的图像生成指令，获取所述图像生成指令对应的图像描述文本，所述图像描述文本用于描述生成图像的形状和空间位置；

8、将所述图像描述文本输入至文本编码器，以获得特征编码集，所述文本编码器为根据编码规则将所述图像描述文本转换为特征编码的深度学习模型，所述特征编码集包括特征编码，所述特征编码包括草图编码、拓扑编码和拉伸编码，所述草图编码用于表征所述生成图像的坐标信息，所述拓扑编码用于表征所述生成图像的曲线类型，所述拉伸编码用于表征所述生成图像的空间结构，所述草图编码、所述拓扑编码和所述拉伸编码之间具有关联关系；

9、将所述特征编码集输入至图像生成器，以获得目标图像，并控制所述显示器显示所述目标图像，所述图像生成器为根据特征编码集生成三维立体图像的生成对抗网络模型。

10、由以上技术方案可知，本申请一些实施例提供一种显示设备及基于大模型的三维立体图像生成方法，所述方法可以响应于用户输入的图像生成指令，获取图像生成指令对应的图像描述文本，并将图像描述文本输入至文本编码器，以获得特征编码集，以及将特征编码集输入至图像生成器，以获得目标图像，再控制显示器显示目标图像。其中，图像描述文本用于描述生成图像的形状和空间位置；文本编码器为根据编码规则将图像描述文本转换为特征编码的深度学习模型，特征编码集包括特征编码，特征编码包括草图编码、拓扑编码和拉伸编码，草图编码用于表征生成图像的坐标信息，拓扑编码用于表征生成图像的曲线类型，拉伸编码用于表征生成图像的空间结构，草图编码、拓扑编码和拉伸编码之间具有关联关系；图像生成器为根据特征编码集生成三维立体图像的生成对抗网络模型。所述方法可以利用文本编码器将用户输入的图像描述文本转换为特征编码集，并利用图像生成器根据特征编码集生成三维立体图像，提高生成目标图像的准确率。

本文档来自技高网...

【技术保护点】

1.一种显示设备，其特征在于，包括：

2.根据权利要求1所述的显示设备，其特征在于，所述控制器执行获取所述图像生成指令对应的图像描述文本后，还被配置为：

3.根据权利要求2所述的显示设备，其特征在于，所述控制器执行将所述图像描述文本输入至文本编码器，以获得特征编码集，具体被配置为：

4.根据权利要求3所述的显示设备，其特征在于，所述控制器执行利用所述几何体参数信息标记所述单一几何体的坐标信息，以生成所述单一几何体的特征编码前，还被配置为：

5.根据权利要求4所述的显示设备，其特征在于，所述控制器执行利用所述几何体参数信息标记所述单一几何体的坐标信息，以生成所述单一几何体的特征编码，具体被配置为：

6.根据权利要求5所述的显示设备，其特征在于，所述控制器执行根据所述二维几何元素的二维坐标生成草图编码后，还被配置为：

7.根据权利要求6所述的显示设备，其特征在于，所述控制器执行根据所述二维几何元素的二维坐标生成草图编码，具体被配置为：

8.根据权利要求1所述的显示设备，其特征在于，所述图像生成器包括鉴

9.根据权利要求1所述的显示设备，其特征在于，所述控制器执行控制所述显示器显示所述目标图像后，还被配置为：

10.一种基于大模型的三维立体图像生成方法，其特征在于，应用于权利要求1-9任一项所述的显示设备，所述方法包括：

...

【技术特征摘要】

1.一种显示设备，其特征在于，包括：

2.根据权利要求1所述的显示设备，其特征在于，所述控制器执行获取所述图像生成指令对应的图像描述文本后，还被配置为：

3.根据权利要求2所述的显示设备，其特征在于，所述控制器执行将所述图像描述文本输入至文本编码器，以获得特征编码集，具体被配置为：

【专利技术属性】
技术研发人员：廖嘉璇，尚治成，
申请(专利权)人：海信电子科技武汉有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人