卡通形象生成方法、装置及计算机设备制造方法及图纸

技术编号：39194144 阅读：11 留言：0更新日期：2023-10-27 08:41

本申请实施例提供的卡通形象生成方法、装置及计算机设备，涉及视频图像处理技术领域。首先，提取真人图像中的文本描述信息；接着，接收用于生成卡通形象的表情基参数；然后，将文本描述信息和表情基参数输入包括低秩自适因子模型和卡通稳定扩散技术子模型的卡通形象生成模型中进行预测，得到真人图像对应的卡通形象。相对于现有技术中生成对抗网络GAN生成卡通形象的方式，采用由低秩自适因子模型和卡通稳定扩散技术子模型相结合的卡通形象生成模型可以在全局特征和细节特征上对真人进行较好的还原，具有较高的真实感，如此可以优化卡通形象生成效果，提升用户的交互体验。提升用户的交互体验。提升用户的交互体验。

全部详细技术资料下载

【技术实现步骤摘要】
卡通形象生成方法、装置及计算机设备

[0001]本申请涉及互联网直播
，具体而言，涉及一种卡通形象生成方法、装置及计算机设备。

技术介绍

[0002]随着移动互联网技术以及网络通信技术的不断发展，网络直播在人们的日常工作及生活中得到了迅速的发展及应用。目前，常见的直播方式包括基于主播真人的直播互动方法和基于虚拟主播(比如，卡通形象)的直播互动方式，在某些场景下，基于虚拟主播的直播互动方式更受观众的青睐。在基于虚拟主播的直播互动方式中，采用图像处理技术将主播真人转换为卡通形象，常常会因卡通形象的细节特征控制不到位(比如，卡通形象的面部微表情与真人主播的面部微表情差异较大)而影响直播效果，如何使生成的卡通形象的特征与真人主播的特征保持一致是本领域技术人员需要重点关注的问题。

技术实现思路

[0003]为了解决上述技术问题，本申请提供一种卡通形象生成方法、装置及计算机设备。
[0004]第一方面，本申请实施例提供一种卡通形象生成方法，所述方法包括：
[0005]对待处理的真人图像进行信息提取，得到用于描述所述真人图像的文本描述信息；
[0006]接收用于生成所述卡通形象的表情基参数；
[0007]将所述文本描述信息和所述表情基参数作为输入信息输入到预先训练好的卡通形象生成模型中；
[0008]通过所述预先训练好的卡通形象生成模型中低秩自适因子模型的模型参数和卡通稳定扩散技术子模型的模型参数对所述输入信息进行预测，生成所述待处理的真人图像对应的卡通形象。
...

【技术保护点】

【技术特征摘要】
1.一种卡通形象生成方法，其特征在于，所述方法包括：对待处理的真人图像进行信息提取，得到用于描述所述真人图像的文本描述信息；接收用于生成所述卡通形象的表情基参数；将所述文本描述信息和所述表情基参数作为输入信息输入到预先训练好的卡通形象生成模型中；通过所述预先训练好的卡通形象生成模型中低秩自适因子模型的模型参数和卡通稳定扩散技术子模型的模型参数对所述输入信息进行预测，生成所述待处理的真人图像对应的卡通形象。2.如权利要求1所述的卡通形象生成方法，其特征在于，所述通过所述预先训练好的卡通形象生成模型中低秩自适因子模型的模型参数和卡通稳定扩散技术子模型的模型参数对所述输入信息进行预测，生成所述待处理的真人图像对应的卡通形象的步骤，包括：采用所述低秩自适因子模型的模型参数对所述输入信息进行预测，生成所述待处理的真人图像对应的卡通形象细节特征信息；采用卡通稳定扩散技术子模型的模型参数对所述输入信息进行预测，生成所述待处理的真人图像对应的卡通形象整体特征信息；由所述卡通形象细节特征信息和所述卡通形象整体特征信息生成所述待处理的真人图像对应的卡通形象。3.如权利要求1所述的卡通形象生成方法，其特征在于，在所述通过所述预先训练好的卡通形象生成模型中低秩自适因子模型的模型参数和卡通稳定扩散技术子模型的模型参数对所述输入信息进行预测，生成所述待处理的真人图像对应的卡通形象的步骤之后，所述方法还包括：对所述卡通形象进行优化处理，其中，所述优化处理包括亮度调整、对比度调整及颜色调整之中的至少一种。4.如权利要求1
‑
3中任意一项所述的卡通形象生成方法，其特征在于，所述卡通形象生成模型通过以下步骤训练获得：构建卡通形象的训练样本集，其中，所述训练样本集包括多个卡通形象图像样本以及与每个所述卡通形象图像样本对应的图像标注信息；采用所述训练样本集对包括低秩自适因子模型和卡通稳定扩散技术子模型的预测模型进行训练，得到所述训练好的卡通形象生成模型。5.如权利要求4所述的卡通形象生成方法，其特征在于，所述构建卡通形象的训练样本集的步骤，包括：从三维挂件资源库中选择适用于不同场景和风格的三维挂件元素，其中，所述三维挂件元素包括服饰、配饰和发型；构建一可控且具有拓扑结构的人脸模型；通过表情基参数控制所述人脸模型得到卡通化人脸，通过搭配所述三维挂件元素生成不同的卡通形象图像样本；对不同的所述卡通形象图像样本进行图像标注得到图像标注信息，所述图像标注信息包括表情基参数、与真人图像中表情的对应关系以及对应的三维挂件元素信息；由不同的所述卡通形象图像样本以及对应的图像标注信息组成所述训练样本集。
6....

【专利技术属性】
技术研发人员：芦爱余，谢鸿华，
申请(专利权)人：广州虎牙科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人