一种用于生成短视频的方法与装置、输入设备制造方法及图纸

技术编号:16219878 阅读:60 留言:0更新日期:2017-09-16 02:16
本发明专利技术的目的是提供一种用于生成短视频的方法与装置。本发明专利技术获取一个或多个图片以及用户对所述一个或多个图片的一个或多个语音信息;根据所述语音信息的内容,确定与所述语音信息相对应的字幕信息;根据所述语音信息的语音特征和/或语义特征,确定与所述图片和/或所述字幕信息所对应的展示特效;根据所述字幕信息以及所述展示特效,将所述图片与语音信息生成短视频。与现有技术相比,本发明专利技术能够更加富有创造性地表达情感,提高了输入行为的多样性,增加了图片的趣味性、智能性,使得用户的表现形式更加丰富且具有吸引力,改善了用户体验。

A method and apparatus for generating short video

The object of the present invention is to provide a method and apparatus for generating short video. The present invention obtains one or more pictures and users of the one or more images of one or more of the voice information; according to the speech information content, determine the subtitle information corresponding to the voice information; according to the phonetic features of the voice information and / or semantic features, determine corresponding with the pictures and / or the subtitle information display effects; according to the caption information and the display effects, the picture and voice information to generate a short video. Compared with the prior art, the invention can be more creative expression of emotion, improve the diversity of input behavior, increased interest and intelligence of the picture, which forms the richer and more attractive to users, improve the user experience.

【技术实现步骤摘要】
一种用于生成短视频的方法与装置
本专利技术涉及计算机
,尤其涉及一种生成短视频的技术。
技术介绍
在现有技术中,输入法主要包括emoji、颜文字、表情图、GIF图等以图片的形式存在的表情,而在论坛、微博等由用户生成内容的场景下,主要包括以各种静态或动态图片形式存在的表情。这种表情均是固定的单张图片或GIF图,用户在发送表情时,直接选择发送即可。然而由于表情图所蕴含的内容是固定的,若用户想要对此进行补充,或希望声情并茂地表达与该表情图对应的情感时,则需要单独地输入文字或语音等来加重情感表达。进一步地,用户也可以单独制作短视频来作为新的表情图,然而一般的短视频制作需要用户拍摄一段短视频并将其转换为表情图,或是利用图像处理软件将多个图片、视频、音频或字幕进行组合,这种方法对于用户而言过于复杂,相比直接发送表情图而言,制作成本较高。因此,用户仍然习惯采用各自独立的表情图、语音、文字等来表达内容,从而导致了表达效率较低且形式单一。
技术实现思路
本专利技术的目的是提供一种用于生成短视频的方法与装置。根据本专利技术的一个方面,提供了一种用于生成短视频的方法,其中,该方法包括以下步骤:a获取一个或多个图片以及用户对所述一个或多个图片的一个或多个语音信息;b根据所述语音信息的内容,确定与所述语音信息相对应的字幕信息;c根据所述语音信息的语音特征和/或语义特征,确定与所述图片和/或所述字幕信息所对应的展示特效;d根据所述字幕信息以及所述展示特效,将所述图片与语音信息生成短视频。可选地,所述步骤c包括:-根据所述语音信息的语音特征和/或语义特征,结合根据所述图片的图片特征,确定与所述图片和/或所述字幕信息所对应的展示特效。可选地,所述步骤c包括:-根据所述语音信息的语音特征和/或语义特征,结合所述语音信息的语音长度,确定与所述图片和/或所述字幕信息所对应的展示特效。可选地,该方法还包括:x根据所述语音信息以及所述图片,确定与所述图片相关联的一个或多个相关图片;其中,该方法还包括:-根据所述字幕信息以及所述展示特效,将所述图片、所述相关图片与所述语音信息,生成一个或多个相关短视频。可选地,所述步骤x包括:x1确定与所述图片相关联的相关图片数量;-根据所述语音信息、所述图片以及所述相关图片数量,确定与所述图片相关联的一个或多个相关图片。可选地,所述步骤x1包括以下至少任一项:-根据所述语音信息的语音长度,确定与所述图片相关联的相关图片数量;-根据所述语音信息的语音特征,确定与所述图片相关联的相关图片数量;-根据所述语音信息的语义特征,确定与所述图片相关联的相关图片数量。可选地,该方法还包括:-获取所述用户的一个或多个历史语音信息,确定与所述用户相对应的用户语音特征库;其中,所述步骤c包括:-根据所述用户语音特征库,确定与所述语音信息相对应的语音特征;-根据所述语音特征和/或所述语音信息的语义特征,确定与所述图片和/或所述字幕信息所对应的展示特效。可选地,该方法还包括:-根据所述短视频所对应的应用的相关配置信息,将所述短视频转存为一种或多种应用可用格式;-将所述短视频以所述应用可用格式添加在所述应用中。可选地,所述展示特效包括一种或多种动态效果。根据本专利技术的另一方面,还提供了一种用于生成短视频的生成装置,其中,所述生成装置包括:获取装置,用于获取一个或多个图片以及用户对所述一个或多个图片的一个或多个语音信息;字幕确定装置,用于根据所述语音信息的内容,确定与所述语音信息相对应的字幕信息;特效确定装置,用于根据所述语音信息的语音特征和/或语义特征,确定与所述图片和/或所述字幕信息所对应的展示特效;视频生成装置,用于根据所述字幕信息以及所述展示特效,将所述图片与语音信息生成短视频。可选地,所述特效确定装置用于:-根据所述语音信息的语音特征和/或语义特征,结合根据所述图片的图片特征,确定与所述图片和/或所述字幕信息所对应的展示特效。可选地,所述特效确定装置用于:-根据所述语音信息的语音特征和/或语义特征,结合所述语音信息的语音长度,确定与所述图片和/或所述字幕信息所对应的展示特效。可选地,所述生成装置还包括:相关图片确定装置,用于根据所述语音信息以及所述图片,确定与所述图片相关联的一个或多个相关图片;其中,所述生成装置还包括:相关视频生成装置,用于根据所述字幕信息以及所述展示特效,将所述图片、所述相关图片与所述语音信息,生成一个或多个相关短视频。可选地,所述相关图片确定装置包括:数量确定单元,用于确定与所述图片相关联的相关图片数量;关联确定单元,用于根据所述语音信息、所述图片以及所述相关图片数量,确定与所述图片相关联的一个或多个相关图片。可选地,所述数量确定单元用于以下至少任一项:-根据所述语音信息的语音长度,确定与所述图片相关联的相关图片数量;-根据所述语音信息的语音特征,确定与所述图片相关联的相关图片数量;-根据所述语音信息的语义特征,确定与所述图片相关联的相关图片数量。可选地,所述生成装置还包括:历史获取装置,用于获取所述用户的一个或多个历史语音信息,确定与所述用户相对应的用户语音特征库;其中,所述特效确定装置用于:-根据所述用户语音特征库,确定与所述语音信息相对应的语音特征;-根据所述语音特征和/或所述语音信息的语义特征,确定与所述图片和/或所述字幕信息所对应的展示特效。可选地,所述生成装置还包括:转存装置,用于根据所述短视频所对应的应用的相关配置信息,将所述短视频转存为一种或多种应用可用格式;添加装置,用于将所述短视频以所述应用可用格式添加在所述应用中。可选地,所述展示特效包括一种或多种动态效果。根据本专利技术的又一方面,还提供了一种输入设备,包括如上述任一项所述的生成装置。与现有技术相比,本专利技术获取一个或多个图片以及用户对所述一个或多个图片的一个或多个语音信息;根据所述语音信息的内容,确定与所述语音信息相对应的字幕信息;根据所述语音信息的语音特征和/或语义特征,确定与所述图片和/或所述字幕信息所对应的展示特效;根据所述字幕信息以及所述展示特效,将所述图片与语音信息生成短视频。从而,本专利技术通过根据所述语音信息的语音特征和/或语意特征,确定与所述图片和/或所述字幕信息所对应的展示特效,将图片转换为短视频,能够更加富有创造性地表达情感,提高了输入行为的多样性,增加了图片的趣味性、智能性,使得用户的表现形式更加丰富且具有吸引力,改善了用户体验。而且,本专利技术还可以根据所述语音信息的语音特征和/或语义特征,结合根据所述图片的图片特征,确定与所述图片和/或所述字幕信息所对应的展示特效;或者,根据所述语音信息的语音特征和/或语义特征,结合所述语音信息的语音长度,确定与所述图片和/或所述字幕信息所对应的展示特效。从而本专利技术使得所确定的展示特效与图片与语音更加贴合,提高了表现效果及可视性,进一步提高了吸引力,改善了用户体验。而且,本专利技术还可以根据所述语音信息以及所述图片,确定与所述图片相关联的一个或多个相关图片;根据所述字幕信息以及所述展示特效,将所述图片、所述相关图片与所述语音信息,生成一个或多个相关短视频。从而,本专利技术能够为用户生成多种相关短视频,减少了用户寻找图片的操作,提高了获取信息的效率,提供给用户更多的选择,进一步提高了吸引力,改本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/62/201710278060.html" title="一种用于生成短视频的方法与装置、输入设备原文来自X技术">用于生成短视频的方法与装置、输入设备</a>

【技术保护点】
一种用于生成短视频的方法,其中,该方法包括以下步骤:a获取一个或多个图片以及用户对所述一个或多个图片的一个或多个语音信息;b根据所述语音信息的内容,确定与所述语音信息相对应的字幕信息;c根据所述语音信息的语音特征和/或语义特征,确定与所述图片和/或所述字幕信息所对应的展示特效;d根据所述字幕信息以及所述展示特效,将所述图片与语音信息生成短视频。

【技术特征摘要】
1.一种用于生成短视频的方法,其中,该方法包括以下步骤:a获取一个或多个图片以及用户对所述一个或多个图片的一个或多个语音信息;b根据所述语音信息的内容,确定与所述语音信息相对应的字幕信息;c根据所述语音信息的语音特征和/或语义特征,确定与所述图片和/或所述字幕信息所对应的展示特效;d根据所述字幕信息以及所述展示特效,将所述图片与语音信息生成短视频。2.根据权利要求1所述的方法,其中,所述步骤c包括:-根据所述语音信息的语音特征和/或语义特征,结合根据所述图片的图片特征,确定与所述图片和/或所述字幕信息所对应的展示特效。3.根据权利要求1或2所述的方法,其中,所述步骤c包括:-根据所述语音信息的语音特征和/或语义特征,结合所述语音信息的语音长度,确定与所述图片和/或所述字幕信息所对应的展示特效。4.根据权利要求1至3中任一项所述的方法,其中,该方法还包括:x根据所述语音信息以及所述图片,确定与所述图片相关联的一个或多个相关图片;其中,该方法还包括:-根据所述字幕信息以及所述展示特效,将所述图片、所述相关图片与所述语音信息,生成一个或多个相关短视频。5.根据权利要求4所述的方法,其中,所述步骤x包括:x1确定与所述图片相关联的相关图片数量;-根据所述语音信息、所述图片以及所述相关图片数量,确定与所述图片相关联的一个或多个相关图片。6.根据权利要求5所述的方法,其中,所述步骤x1包括以下至少任一项:-根据所述语音信息的语音长度,确定与所述图片相关联的相关图片数量;-根据所述语音信息的语音特征,确定与所述图片相关联的相关图片数量;-根据所述语音信息的语义特征,确定与所述图片相关联的相关图片数量。7.根据权利要求1至6中任一项所述的方法,其中,该方法还包括:-获取所述用户的一个或多个历史语音信息,确定与所述用户相对应的用户语音特征库;其中,所述步骤c包括:-根据所述用户语音特征库,确定与所述语音信息相对应的语音特征;-根据所述语音特征和/或所述语音信息的语义特征,确定与所述图片和/或所述字幕信息所对应的展示特效。8.根据权利要求1至7中任一项所述的方法,其中,该方法还包括:-根据所述短视频所对应的应用的相关配置信息,将所述短视频转存为一种或多种应用可用格式;-将所述短视频以所述应用可用格式添加在所述应用中。9.根据权利要求1至8中任一项所述的方法,其中,所述展示特效包括一种或多种动态效果。10.一种用于生成短视频的生成装置,其中,所述生成装置包括:获取装置,用于获取一个或多个图片以及用户对所述一个或多个图片的一个或多个语音信息;字幕确定装置,用于根据所述语音信息的内容,确...

【专利技术属性】
技术研发人员:门文
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1