广告生成方法、装置、计算机可读介质及电子设备制造方法及图纸

技术编号:39253667 阅读:9 留言:0更新日期:2023-10-30 12:05
本申请属于广告设计技术领域,涉及一种广告生成方法、装置、计算机可读介质及电子设备,包括:获取图片素材和广告文案,对所述广告文案进行语音合成以生成与所述广告文案对应的语音信息;获取虚拟主播模型,根据所述广告文案或者所述语音信息确定与所述虚拟主播模型对应的展示参数,并根据所述图片素材、所述语音信息和所述展示参数对所述虚拟主播模型进行渲染生成虚拟主播口播视频;基于所述虚拟主播口播视频创建广告。本申请一方面能够减少人力成本,另一方面能够提升广告的多样性,而不受模板设计师的创意思路的限制,避免了PAG视频模板种类少所导致的图片素材、广告文案与模板的匹配度差的问题。板的匹配度差的问题。板的匹配度差的问题。

【技术实现步骤摘要】
广告生成方法、装置、计算机可读介质及电子设备


[0001]本申请属于广告制作
,具体涉及一种广告生成方法、广告生成装置、计算机可读介质以及电子设备。

技术介绍

[0002]随着科学技术的进步,广告形式也由原始的以纸张、广告板为载体的广告演变到了现在的互联网广告。互联网广告在制作时,通常需要基于视频广告素材进行制作,广告主可以将广告文案、图片素材以及相关信息插入到视频广告素材中,以生成广告。
[0003]现有的视频广告素材基本都是基于开源动画效果方案PAG(Portable Animated Graphics)生成的,并且需要依赖模板设计师生产大量的PAG视频模板。PAG视频模板的制作过程是非常耗费人力成本的,并且视频模板的多样式也受到模板创意思路的限制,会导致广告主使用图片素材匹配视频模板生成的视频样式不够多,在根据广告主所提供的素材匹配PAG视频模板时,可能存在模板与素材的匹配度差的问题,并且如果广告主频繁使用相同的图片素材来生成视频素材,所生成的视频素材的多样式是有限的,终端用户对生成的视频广告感知重复,敏感度降低,最终导致广告效果逐渐变差。

技术实现思路

[0004]本申请的目的在于提供一种广告生成方法、广告生成装置、计算机可读介质以及电子设备,能够克服相关技术中存在的制作视频模板需要耗费大量人力成本,广告样式少、效果差的问题。
[0005]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0006]根据本申请实施例的一个方面,提供一种广告生成方法,该方法包括:获取图片素材和广告文案,对所述广告文案进行语音合成以生成与所述广告文案对应的语音信息;获取虚拟主播模型,根据所述广告文案或者所述语音信息确定与所述虚拟主播模型对应的展示参数,并根据所述图片素材、所述语音信息和所述展示参数对所述虚拟主播模型进行渲染生成虚拟主播口播视频;基于所述虚拟主播口播视频创建广告。
[0007]根据本申请实施例的一个方面,提供一种广告生成装置,该装置包括:语音合成模块,用于获取图片素材和广告文案,对所述广告文案进行语音合成以生成与所述广告文案对应的语音信息;视频生成模块,用于获取虚拟主播模型,根据所述广告文案或者所述语音信息确定与所述虚拟主播模型对应的展示参数,并根据所述图片素材、所述语音信息和所述展示参数对所述虚拟主播模型进行渲染生成虚拟主播口播视频;广告创建模块,用于基于所述虚拟主播口播视频创建广告。
[0008]在本申请的一些实施例中,基于以上技术方案,所述语音合成模块配置为:获取广告投放渠道,根据所述广告投放渠道确定视频播放时长;对所述广告文案进行语音合成以生成所述语音信息,并且所述语音信息的时长小于或等于所述视频播放时长。
[0009]在本申请的一些实施例中,基于以上技术方案,所述语音合成模块还配置为:采用从文本到语音算法对所述广告文案进行语音合成,以生成所述语音信息。
[0010]在本申请的一些实施例中,所述展示参数包括所述虚拟主播口播视频每个图像帧中与所述虚拟主播模型对应的口型、表情参数和动作参数;基于以上技术方案,所述视频生成模块包括:第一分段单元,语音根据预设规则将所述广告文案划分为多个广告文案段,各所述广告文案段对应不同的图像帧;第一口型获取单元,用于根据各所述广告文案段中的元音信息驱动生成与所述虚拟主播模型对应的口型;第一识别单元,用于将各所述广告文案段分别输入至文本识别模型中,通过所述文本识别模型对各所述广告文案段进行特征提取,以输出与各所述广告文案段对应的情绪信息和意图信息;第一参数确定单元,用于根据所述情绪信息确定与所述虚拟主播模型对应的表情参数,并根据所述意图信息确定与所述虚拟主播模型对应的动作参数。
[0011]在本申请的一些实施例中,所述虚拟主播展示参数包括所述虚拟主播口播视频每个图像帧中与虚拟主播模型对应的口型、表情参数和动作参数;基于以上技术方案,所述视频生成模块包括:第二分段单元,用于根据预设规则将所述语音信息划分为多个语音信息片段,各所述语音信息片段对应不同的所述图像帧;第二口型获取单元,用于根据各所述语音信息片段中的元音信息驱动生成与所述虚拟主播模型对应的口型;第二识别单元,用于将各所述语音信息片段输入至语音识别模型中,通过所述语音识别模型对各所述语音信息片段进行特征提取,以输出与各所述语音信息片段对应的情绪信息和意图信息;第二参数确定单元,用于根据所述情绪信息确定与所述虚拟主播模型对应的表情参数,并根据所述意图信息确定与所述虚拟主播模型对应的动作参数。
[0012]在本申请的一些实施例中,基于以上技术方案,所述第一口型获取单元配置为:按序提取各所述广告文案段中的元音音素,形成元音序列;根据所述元音序列驱动生成与所述虚拟主播模型对应的的口型。
[0013]在本申请的一些实施例中,基于以上技术方案,所述第二口型获取单元配置为:按序提取各所述语音信息片段中的元音音素,形成元音序列;根据所述元音序列驱动生成与所述虚拟主播模型对应的的口型。
[0014]在本申请的一些实施例中,基于以上技术方案,所述第一参数确定单元和第二参数确定单元配置为:获取与所述虚拟主播模型对应的情绪

表情映射表和意图

动作映射表;将所述情绪信息与所述情绪

表情映射表进行匹配,以获取与所述情绪信息对应的表情参数;将所述意图信息与所述意图

动作映射表进行匹配,以获取与所述意图信息对应的动作参数。
[0015]在本申请的一些实施例中,基于以上技术方案,所述视频生成模块配置为:调用虚拟引擎,通过所述虚拟引擎将各所述图像帧对应的虚拟主播的口型、表情参数和动作参数灌入到所述虚拟主播模型中,渲染生成原始口播视频;将所述原始口播视频覆盖在所述图片素材之上,并插入所述语音信息,以生成所述虚拟主播口播视频。
[0016]在本申请的一些实施例中,基于以上技术方案,所述广告生成装置还包括:信息获取模块,用于在根据所述广告文案或者所述语音信息确定虚拟主播展示参数之前,获取与所述广告文案对应的广告主信息;判断模块,用于判断虚拟主播模型库中是否存在与所述广告主信息对应的定制虚拟主播模型;模型获取模块,用于当判定存在时,获取所述定制虚
拟主播模型,用于生成所述虚拟主播口播视频;当判定不存在时,获取与所述广告文案对应的行业类型,并从所述虚拟主播模型库中获取与所述行业类型匹配的虚拟主播模型,用于生成所述虚拟主播口播视频。
[0017]在本申请的一些实施例中,基于以上技术方案,所述广告生成装置还包括:预览版视频生成模块,用于在根据所述图片素材、所述语音信息和所述虚拟主播展示参数渲染生成虚拟主播口播视频之前,根据所述虚拟主播展示参数渲染生成预览版视频,并生成与所述预览版视频对应的预览版视频URL;预览数据构建模块,用于生成与所述语音信息对应的语音URL,根据所述图片素材、所述语音URL和所述预览版视频URL构建预览数据,并将所述预览数据发送至本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种广告生成方法,其特征在于,包括:获取图片素材和广告文案,对所述广告文案进行语音合成以生成与所述广告文案对应的语音信息;获取虚拟主播模型,根据所述广告文案或者所述语音信息确定与所述虚拟主播模型对应的展示参数,并根据所述图片素材、所述语音信息和所述展示参数对所述虚拟主播模型进行渲染生成虚拟主播口播视频;基于所述虚拟主播口播视频创建广告。2.根据权利要求1所述的方法,其特征在于,所述对所述广告文案进行语音合成以生成与所述广告文案对应的语音信息,包括:获取广告投放渠道,根据所述广告投放渠道确定视频播放时长;对所述广告文案进行语音合成以生成所述语音信息,并且所述语音信息的时长小于或等于所述视频播放时长。3.根据权利要求1或2所述的方法,其特征在于,所述根据所述广告文案进行语音合成以生成与所述广告文案对应的语音信息,包括:采用从文本到语音算法对所述广告文案进行语音合成,以生成所述语音信息。4.根据权利要求1所述的方法,其特征在于,所述展示参数包括所述虚拟主播口播视频每个图像帧中与所述虚拟主播模型对应的口型、表情参数和动作参数;所述根据所述广告文案确定与所述虚拟主播模型对应的展示参数,包括:根据预设规则将所述广告文案划分为多个广告文案段,各所述广告文案段对应不同的图像帧;根据各所述广告文案段中的元音信息驱动生成与所述虚拟主播模型对应的口型;将各所述广告文案段分别输入至文本识别模型中,通过所述文本识别模型对各所述广告文案段进行特征提取,以输出与各所述广告文案段对应的情绪信息和意图信息;根据所述情绪信息确定与所述虚拟主播模型对应的表情参数,并根据所述意图信息确定与所述虚拟主播模型对应的动作参数。5.根据权利要求1所述的方法,其特征在于,所述展示参数包括所述虚拟主播口播视频每个图像帧中与所述虚拟主播模型对应的口型、表情参数和动作参数;所述根据所述广告文案确定与所述虚拟主播模型对应的展示参数,包括:根据预设规则将所述语音信息划分为多个语音信息片段,各所述语音信息片段对应不同的所述图像帧;根据各所述语音信息片段中的元音信息驱动生成与所述虚拟主播模型对应的口型;将各所述语音信息片段输入至语音识别模型中,通过所述语音识别模型对各所述语音信息片段进行特征提取,以输出与各所述语音信息片段对应的情绪信息和意图信息;根据所述情绪信息确定与所述虚拟主播模型对应的表情参数,并根据所述意图信息确定与所述虚拟主播模型对应的动作参数。6.根据权利要求4所述的方法,其特征在于,所述根据各所述广告文案段中的元音信息驱动生成与所述虚拟主播模型对应的口型,包括:按序提取各所述广告文案段中的元音音素,形成元音序列;根据所述元音序列驱动生成与所述虚拟主播模型对应的口型。
7.根据权利要求5所述的方法,其特征在于,所述根据各所述语音信息片段中的元音信息驱动生成与所述虚拟主播模型对应的口型,包括:按序提取各所述语音信息片段中的元音音素,形成元音序列;根据所述元音序列驱动生成与所述虚拟主播模型对应的口型。8.根据权利要求4或5所述的方法,其特征在于,所述根据所述情绪信息确定与所述虚拟主播模型对应的表情参数,并根据所述意图信息确定与所述...

【专利技术属性】
技术研发人员:严计升杨秀金吴恒冠钱靖庄涵吴高
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1