自动视频生成方法、装置及电子设备和芯片系统制造方法及图纸

技术编号：34441745 阅读：18 留言：0更新日期：2022-08-06 16:32

本发明专利技术提供一种视频生成方法，其特征在于，包括：获取视频流，并且在所述视频流中确定多个检测帧；对每一检测帧进行多对象检测，得到多个检测框；对所述多个检测框进行跟踪匹配，得到对应于检测对象的彼此关联的检测框数据；对彼此关联的检测框进行特征识别，得到表征检测对象的目标键值及相应的视频数据；利用所述目标键值和所述视频数据，生成与特定识别对象对应的视频。对象对应的视频。对象对应的视频。

全部详细技术资料下载

【技术实现步骤摘要】
自动视频生成方法、装置及电子设备和芯片系统

[0001]本申请涉及视频跟踪
，具体而言，涉及一种自动视频生成方法、装置及电子设备和芯片系统。

技术介绍

[0002]随着全民健身的理念日益普及，人们参加体育活动的热情日益高涨。人们在参加体育活动享受运动带来的乐趣的同时，也希望将自己在活动过程中的精彩瞬间记录下来，从而上传到社交网站与朋友分享，或者保存为美好的回忆。
[0003]事实上，不止参加体育活动，很多场景下都有生成个性化视频的需求，例如参观旅游景区、博物馆、展馆等场所的活动或视频监控领域。基于旅游景区、博物馆、展馆等安装的视频采集设备会记录每个用户的视频信息，甚至还能记录部分音频信息。如果能将采集到的视频按照用户、家庭或团队等组织进行自动记录、剪辑、选取背景音乐、转场渲染并最终提供给用户生成好的视频内容，就可以大大方便用户记录参观的美好内容，同时可以方便地携带。
[0004]传统的视频生产方法，常见的有两种：一种是通过人工来识别并进行打点标注，然后将视频素材和标注信息送入视频生产模块中渲染出所需的视频结果，这种方法需要多人多天的工作量才能完成识别，生产效率低，成本高。
[0005]另一种结合深度学习的自动视频生成的方法，需要先通过摄像头拍摄画面，再依赖人脸识别技术，通过识别人脸，并提取对应人脸所在视频片段完成最终合成。然而，这种视频采集方式可以应用的场景有限，特别是在不能通过人脸识别提取人脸素材的使用场景下，难以自动生成视频。
[0006]特别是对于例如在用户带着安全帽、护目...

【技术保护点】

【技术特征摘要】
1.一种视频生成方法，其特征在于，包括：获取视频流，并且在所述视频流中确定多个检测帧；对每一检测帧进行多对象检测，得到多个检测框；对所述多个检测框进行跟踪匹配，得到对应于检测对象的彼此关联的检测框数据；对彼此关联的检测框进行特征识别，得到表征检测对象的目标键值及相应的视频数据；和利用所述目标键值和所述视频数据，生成与特定识别对象对应的视频。2.根据权利要求1所述的视频生成方法，其中，所述“对每一检测帧进行多对象检测，得到多个检测框”包括：对每一检测帧进行多对象检测，得到分别对应于多个检测对象的多个第一数据序列，每个第一数据序列包括与检测对象的至少一个识别目标分别对应的至少一个检测框，所述至少一个检测框包括第一检测框。3.根据权利要求2所述的视频生成方法，其中，所述“对所述多个检测框进行跟踪匹配，得到对应于检测对象的彼此关联的检测框数据”包括：对检测帧的每个第一数据序列的所述第一检测框进行跟踪匹配，得到多个第二数据序列，每一个第二数据序列包括彼此关联的至少第一检测框数据。4.根据权利要求3所述的视频生成方法，其中，所述“对彼此关联的检测框进行特征识别，得到表征检测对象的目标键值及相应的视频数据”包括：针对每一个第二数据序列中的检测框数据进行特征识别，并且通过优势判断规则，得到表征检测对象的目标键值，生成第三数据序列，每一个第三数据序列包括所述目标键值和对应的视频数据。5.根据权利要求4所述的视频生成方法，其中，所述第一数据序列包括：帧号、第一检测框序号、以及至少第一检测框的四个角的位置数据和类别。6.根据权利要求4 所述的视频生成方法，其中，所述第二数据序列包括帧号和识别对象序号，以便根据帧号和识别对象序号去引用相应的第一数据序列，获得帧数据。7.根据权利要求4 所述的视频生成方法，其中，所述第三数据序列包括表征识别对象特征的多个键值、以及与之对应的视频流的开始位置和视频流的结束位置。8.根据权利要求2所述的视频生成方法，其中，所述“对每一检测帧进行多对象检测”包括：利用深度神经网络对每一检测帧进行多对象检测。9.根据权利要求3所述的视频生成方法，其中，所述“对检测帧的每个第一数据序列的所述第一检测框进行跟踪匹配”包括：利用卡尔曼滤波得到当前检测帧的所述第一检测框在后一检测帧中的预测位置；基于所述预测位置对所述后一检测帧的所有第一检测框进行过滤;将过滤得到的所述后一检测帧的第一检测框与所述当前检测帧的所述第一检测框进行匹配，从而得到所述彼此关联的第一检测框数据。10.根据权利要求9所述的视频生成方法，其中，所述卡尔曼滤波的状态向量包括跳帧参数，用于表征检测帧之间的间隔帧数量。11.根据权利要求4所述的视频生成方法，其中，
若所述检测对象为人物对象，则所述第一检测框为人体对象框；若所述检测对象为车辆对象，则所述第一检测框为车体对象框。12.根据权利要求3所述的视频生成方法，其中，所述“对检测帧的每个第一数据序列的所述第一检测框进行跟踪匹配，得到多个第二数据序列”包括：将相邻帧中运动方向、距离和第一检测框的外形尺寸落入预定范围内的第一检测框关联起来，由此得到多个第二数据序列。13.根据权利要求4所述的视频生成方法，其中，所述至少一个检测框还包括：对应检测对象的其他识别目标的其他检测框，所述其他检测框位于所述第一检测框范围内。14.根据权利要求13所述的视频生成...

【专利技术属性】
技术研发人员：余刚，贾艳军，李广群，
申请(专利权)人：北京凯利时科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人