视频直播间的内容显示控制方法及装置制造方法及图纸

技术编号:26386245 阅读:29 留言:0更新日期:2020-11-19 23:55
本公开关于一种视频直播间的内容显示控制方法及装置。其中,一种视频直播间的内容显示控制方法包括:接收视频直播间的观众端发送的第一音频流;通过对所述第一音频流进行语音识别,获取所述第一音频流对应的第一目标文本信息;根据预设的文本信息与动作组的对应关系,获取与所述第一目标文本信息对应的第一目标动作组;基于所述第一目标动作组,生成所述虚拟对象的第一动画影像信息,并发送给所述视频直播间的各个观众端。

【技术实现步骤摘要】
视频直播间的内容显示控制方法及装置
本公开涉及计算机及互联网
,尤其涉及一种视频直播间的内容显示控制方法及装置。
技术介绍
随着网络技术和终端技术的发展,网络直播得到了广泛的推广,已经成为了人们生活中一种非常常用的娱乐方式。现有视频直播时,若想在直播视频中加入一些动画表情,则需要使用已存储的动画,而无法做到视频直播者与虚拟对象实时互动。例如:视频直播者若想要虚拟对象在直播间做出欢迎的动作,则只能向服务器提交已经制作好的虚拟对象做欢迎动作的动画,而无法实时控制虚拟对象的动作。由此可见,在相关技术中,无法实现视频直播者与虚拟对象实时互动,从而影响直播效果和观看效果。
技术实现思路
本公开提供一种视频直播间的内容显示控制方法及装置,用以实现视频直播者与虚拟对象实时互动,从而提高直播效果和观看效果。本公开的技术方案如下:根据本公开实施例的第一方面,提供一种视频直播间的内容显示控制方法,包括:接收视频直播间的观众端发送的第一音频流;通过对所述第一音频流进行语音识别,获取所述第一音频流对应的第一目标文本信息;根据预设的文本信息与动作组的对应关系,获取与所述第一目标文本信息对应的第一目标动作组;基于所述第一目标动作组,生成所述虚拟对象的第一动画影像信息,并发送给所述视频直播间的各个观众端。可选地,所述通过对所述音频流进行语音识别,获取所述第一音频流对应的目标文本信息,包括:将所述第一音频流进行数字信号处理,得到非压缩的波形数据;按照预设粒度,对所述波形数据进行拆分;采用预设的转换算法,获取拆分后的各段波形数据对应的声学特征信息;采用预设的解码算法,对各段波形数据对应的声学特征信息进行解码,得到所述第一音频流对应的第一目标文本信息。可选地,所述根据预设的文本信息与动作组的对应关系,获取与所述第一目标文本信息对应的第一目标动作组,包括:查找所述第一目标文本信息中的目标关键词,其中,所述预设关键词为预设关键词集合中的一个或多个关键词,所述预设关键词集中包含所述对应关系中的文本信息;获取所述对应关系中与所述目标关键词对应的所述第一目标动作组。可选地,所述第一目标动作组中包括虚拟对象的一组动画图片;基于所述第一目标动作组,生成所述虚拟对象的第一动画影像信息,并发送给所述视频直播间的各个观众端,包括:基于所述第一目标动作组中包括的所述虚拟对象的一组动画图片,生成所述虚拟对象的第一动画影像信息;将所述虚拟对象的第一动画影像信息与当前待发送的音视频信息进行合成;将合成后的音视频信息发送给所述视频直播间的各个观众端。可选地,在所述接收视频直播间的观众端发送的第一音频流之前,所述方法还包括:将所述虚拟对象的图像信息发送给所述视频直播间的各个观众端。可选地,所述虚拟对象的一组动画图片用于描述所述虚拟对象的一个或多个关键顶点的运动。可选地,所述方法还包括:接收所述视频直播间的主播端发送的第二音频流;通过对所述第二音频流进行语音识别,获取所述第二音频流对应的第二目标文本信息;根据所述对应关系,获取与所述第二目标文本信息对应的第二目标动作组;基于所述第二目标动作组,生成所述虚拟对象的第二动画影像信息;将所述虚拟对象的第二动画影像信息发送给所述视频直播间的各个观众端。根据本公开实施例的第二方面,提供一种视频直播间的内容显示控制方法,包括:视频直播间的观众端接收输入第一音频流,所述第一音频流用于控制所述视频直播间的播放界面上的虚拟对象;将所述第一音频流发送给服务器;接收所述服务器返回的第一动画影像信息,其中,所述第一动画影像信息为所述服务器根据所述第一音频流对应的第一目标文本信息生成的;在所述播放界面上播放所述第一动画影像。可选地,接收所述服务器返回的第一动画影像信息,包括:接收所述服务器发送的合成音视频信息,其中,所述合成音视频信息为所述服务器将所述第一动画影像信息与当前发送给所述观众端的音视频信息进行合成后得到的。根据本公开实施例的第三方面,提供一种视频直播间的内容显示控制装置,包括:第一接收单元,被配置为执行接收视频直播间的观众端发送的第一音频流;第一获取单元,被配置为执行通过对所述第一音频流进行语音识别,获取所述第一音频流对应的第一目标文本信息;第二获取单元,被配置为执行根据预设的文本信息与动作组的对应关系,获取与所述第一目标文本信息对应的第一目标动作组;生成单元,被配置为执行基于所述第一目标动作组,生成所述虚拟对象的第一动画影像信息;第一发送单元,被配置为执行将所述第一动画影像信息发送给所述视频直播间的各个观众端。可选地,所述第一获取单元通过对所述音频流进行语音识别,获取所述第一音频流对应的目标文本信息,包括:将所述第一音频流进行数字信号处理,得到非压缩的波形数据;按照预设粒度,对所述波形数据进行拆分;采用预设的转换算法,获取拆分后的各段波形数据对应的声学特征信息;采用预设的解码算法,对各段波形数据对应的声学特征信息进行解码,得到所述第一音频流对应的第一目标文本信息。可选地,所述第二获取单元根据预设的文本信息与动作组的对应关系,获取与所述第一目标文本信息对应的第一目标动作组,包括:查找所述第一目标文本信息中的目标关键词,其中,所述预设关键词为预设关键词集合中的一个或多个关键词,所述预设关键词集中包含所述对应关系中的文本信息;获取所述对应关系中与所述目标关键词对应的所述第一目标动作组。可选地,所述第一目标动作组中包括虚拟对象的一组动画图片;所述装置还包括:合成单元,被配置为执行将所述虚拟对象的第一动画影像信息与当前待发送的音视频信息进行合成;所述第一发送单元发送给所述视频直播间的各个观众端,包括:将合成后的音视频信息发送给所述视频直播间的各个观众端。可选地,所述第一发送单元还被配置为执行在所述接收视频直播间的观众端发送的第一音频流之前,将所述虚拟对象的图像信息发送给所述视频直播间的各个观众端。可选地,所述第一接收单元还配置为执行接收所述视频直播间的主播端发送的第二音频流;所述第一获取单元还配置为执行通过对所述第二音频流进行语音识别,获取所述第二音频流对应的第二目标文本信息;所述第二获取单元还配置为执行根据所述对应关系,获取与所述第二目标文本信息对应的第二目标动作组;所述生成单元还配置为执行基于所述第二目标动作组,生成所述虚拟对象的第二动画影像信息;所述第一发送单元还配置为执行将所述第二动画影像信息发送给所述视频直播间的各个观众端。根据本公开实施例的第四方面,提供一种视频直播间的内容显示控制装置,包括:第二接收单元,被配置为执行接收输入第一音频流,所述第一音频流用于控制所述视频直播间的播放界面上的虚拟对象;第二发送单元,被配置为执行将所述第一音频流发送给服务器;所述第二接收单元还被配置为执行接收所述服务器返回的第一动画影像信息,其中,所述第一动画影像信息为所述服务器根据所述第一音频流对应的第一目标文本信息生成的;播放单元,被配置为执行在所述播放界面上播放所述第一动画影像。可选地,所述第二接收单元接收所述服务器返回本文档来自技高网...

【技术保护点】
1.一种视频直播间的内容显示控制方法,其特征在于,包括:/n接收视频直播间的观众端发送的第一音频流;/n通过对所述第一音频流进行语音识别,获取所述第一音频流对应的第一目标文本信息;/n根据预设的文本信息与动作组的对应关系,获取与所述第一目标文本信息对应的第一目标动作组;/n基于所述第一目标动作组,生成所述虚拟对象的第一动画影像信息,并发送给所述视频直播间的各个观众端。/n

【技术特征摘要】
1.一种视频直播间的内容显示控制方法,其特征在于,包括:
接收视频直播间的观众端发送的第一音频流;
通过对所述第一音频流进行语音识别,获取所述第一音频流对应的第一目标文本信息;
根据预设的文本信息与动作组的对应关系,获取与所述第一目标文本信息对应的第一目标动作组;
基于所述第一目标动作组,生成所述虚拟对象的第一动画影像信息,并发送给所述视频直播间的各个观众端。


2.根据权利要求1所述的方法,其特征在于,所述根据预设的文本信息与动作组的对应关系,获取与所述第一目标文本信息对应的第一目标动作组,包括:
查找所述第一目标文本信息中的目标关键词,其中,所述目标关键词为预设关键词集合中的一个或多个关键词,所述预设关键词集中包含所述对应关系中的文本信息;
获取所述对应关系中与所述目标关键词对应的所述第一目标动作组。


3.根据权利要求1所述的方法,其特征在于,所述第一目标动作组中包括虚拟对象的一组动画图片;
基于所述第一目标动作组,生成所述虚拟对象的第一动画影像信息,并发送给所述视频直播间的各个观众端,包括:
基于所述第一目标动作组中包括的所述虚拟对象的一组动画图片,生成所述虚拟对象的第一动画影像信息;
将所述虚拟对象的第一动画影像信息与当前待发送的音视频信息进行合成;
将合成后的音视频信息发送给所述视频直播间的各个观众端。


4.根据权利要求1至3任一项所述的方法,其特征在于,在所述接收视频直播间的观众端发送的第一音频流之前,所述方法还包括:
将所述虚拟对象的图像信息与当前待发送的音视频信息进行合成,将合成后的音视频信息发送给所述视频直播间的各个观众端。


5.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
接收所述视频直播间的主播端发送的第二音频流;
通过对所述第二音频流进行语音识别,获取所述第二音频流对应的第二目标文本信息;
根据所述对应关系,获取与所述第二目标文本信息对应的第二目标动作组;
基于所述第二目标动作组,生成所述虚拟对象的第二动画影像信息,并发送给所述视频直播间的各个观众端。


6.一种视频直播间...

【专利技术属性】
技术研发人员:李浩王聪
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1