广告生成方法、装置、计算机可读介质及电子设备制造方法及图纸

技术编号：39253667 阅读：16 留言：0更新日期：2023-10-30 12:05

本申请属于广告设计技术领域，涉及一种广告生成方法、装置、计算机可读介质及电子设备，包括：获取图片素材和广告文案，对所述广告文案进行语音合成以生成与所述广告文案对应的语音信息；获取虚拟主播模型，根据所述广告文案或者所述语音信息确定与所述虚拟主播模型对应的展示参数，并根据所述图片素材、所述语音信息和所述展示参数对所述虚拟主播模型进行渲染生成虚拟主播口播视频；基于所述虚拟主播口播视频创建广告。本申请一方面能够减少人力成本，另一方面能够提升广告的多样性，而不受模板设计师的创意思路的限制，避免了PAG视频模板种类少所导致的图片素材、广告文案与模板的匹配度差的问题。板的匹配度差的问题。板的匹配度差的问题。

全部详细技术资料下载

【技术实现步骤摘要】
广告生成方法、装置、计算机可读介质及电子设备

[0001]本申请属于广告制作
，具体涉及一种广告生成方法、广告生成装置、计算机可读介质以及电子设备。

技术介绍

[0002]随着科学技术的进步，广告形式也由原始的以纸张、广告板为载体的广告演变到了现在的互联网广告。互联网广告在制作时，通常需要基于视频广告素材进行制作，广告主可以将广告文案、图片素材以及相关信息插入到视频广告素材中，以生成广告。
[0003]现有的视频广告素材基本都是基于开源动画效果方案PAG(Portable Animated Graphics)生成的，并且需要依赖模板设计师生产大量的PAG视频模板。PAG视频模板的制作过程是非常耗费人力成本的，并且视频模板的多样式也受到模板创意思路的限制，会导致广告主使用图片素材匹配视频模板生成的视频样式不够多，在根据广告主所提供的素材匹配PAG视频模板时，可能存在模板与素材的匹配度差的问题，并且如果广告主频繁使用相同的图片素材来生成视频素材，所生成的视频素材的多样式是有限的，终端用户对生成的视频广告感知重复，敏感度降低，最终导致广告效果逐渐变差。

技术实现思路

[0004]本申请的目的在于提供一种广告生成方法、广告生成装置、计算机可读介质以及电子设备，能够克服相关技术中存在的制作视频模板需要耗费大量人力成本，广告样式少、效果差的问题。
[0005]本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。
[0006]根据本申请实施例的一个方面，...

【技术保护点】

【技术特征摘要】
1.一种广告生成方法，其特征在于，包括：获取图片素材和广告文案，对所述广告文案进行语音合成以生成与所述广告文案对应的语音信息；获取虚拟主播模型，根据所述广告文案或者所述语音信息确定与所述虚拟主播模型对应的展示参数，并根据所述图片素材、所述语音信息和所述展示参数对所述虚拟主播模型进行渲染生成虚拟主播口播视频；基于所述虚拟主播口播视频创建广告。2.根据权利要求1所述的方法，其特征在于，所述对所述广告文案进行语音合成以生成与所述广告文案对应的语音信息，包括：获取广告投放渠道，根据所述广告投放渠道确定视频播放时长；对所述广告文案进行语音合成以生成所述语音信息，并且所述语音信息的时长小于或等于所述视频播放时长。3.根据权利要求1或2所述的方法，其特征在于，所述根据所述广告文案进行语音合成以生成与所述广告文案对应的语音信息，包括：采用从文本到语音算法对所述广告文案进行语音合成，以生成所述语音信息。4.根据权利要求1所述的方法，其特征在于，所述展示参数包括所述虚拟主播口播视频每个图像帧中与所述虚拟主播模型对应的口型、表情参数和动作参数；所述根据所述广告文案确定与所述虚拟主播模型对应的展示参数，包括：根据预设规则将所述广告文案划分为多个广告文案段，各所述广告文案段对应不同的图像帧；根据各所述广告文案段中的元音信息驱动生成与所述虚拟主播模型对应的口型；将各所述广告文案段分别输入至文本识别模型中，通过所述文本识别模型对各所述广告文案段进行特征提取，以输出与各所述广告文案段对应的情绪信息和意图信息；根据所述情绪信息确定与所述虚拟主播模型对应的表情参数，并根据所述意图信息确定与所述虚拟主播模型对应的动作参数。5.根据权利要求1所述的方法，其特征在于，所述展示参数包括所述虚拟主播口播视频每个图像帧中与所述虚拟主播模型对应的口型、表情参数和动作参数；所述根据所述广告文案确定与所述虚拟主播模型对应的展示参数，包括：根据预设规则将所述语音信息划分为多个语音信息片段，各所述语音信息片段对应不同的所述图像帧；根据各所述语音信息片段中的元音信息驱动生成与所述虚拟主播模型对应的口型；将各所述语音信息片段输入至语音识别模型中，通过所述语音识别模型对各所述语音信息片段进行特征提取，以输出与各所述语音信息片段对应的情绪信息和意图信息；根据所述情绪信息确定与所述虚拟主播模型对应的表情参数，并根据所述意图信息确定与所述虚拟主播模型对应的动作参数。6.根据权利要求4所述的方法，其特征在于，所述根据各所述广告文案段中的元音信息驱动生成与所述虚拟主播模型对应的口型，包括：按序提取各所述广告文案段中的元音音素，形成元音序列；根据所述元音序列驱动生成与所述虚拟主播模型对应的口型。
7.根据权利要求5所述的方法，其特征在于，所述根据各所述语音信息片段中的元音信息驱动生成与所述虚拟主播模型对应的口型，包括：按序提取各所述语音信息片段中的元音音素，形成元音序列；根据所述元音序列驱动生成与所述虚拟主播模型对应的口型。8.根据权利要求4或5所述的方法，其特征在于，所述根据所述情绪信息确定与所述虚拟主播模型对应的表情参数，并根据所述意图信息确定与所述...

【专利技术属性】
技术研发人员：严计升，杨秀金，吴恒冠，钱靖，庄涵，吴高，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人