【技术实现步骤摘要】
基于人工智能芯片的视频播放方法、编码方法及相关装置
[0001]本申请涉及人工智能芯片领域,尤其涉及一种基于人工智能芯片视频播放方法、编码方法及相关装置。
技术介绍
[0002]人工智能芯片,也被称为AI加速器或计算卡,是指专门用于处理人工智能应用中的大量计算任务的模块(其他非计算任务仍由CPU负责)。比如视频处理领域。
[0003]随着视频内容的丰富性,单个音频无法承载视频内容的表达。在目前火热的短视频领域,短短的十几秒中,单音频无法满足图像内容信息的表达。比如:正常录制的视频中有多个人,其中只有一个人在说话,而其他人此时的内心感受是无法通过音频表达的。
技术实现思路
[0004]本申请实施例提供一种基于人工智能芯片的视频播放方法、编码方法及相关装置,有利于解决上述技术问题。
[0005]第一方面,本申请实施例提供一种基于人工智能芯片的视频播放方法,包括:
[0006]获取第一图像及与第一图像对应的音频索引图像,音频索引图像包括多个第一区域,多个第一区域分别与多个音频信号对应,多个第一区域分别与第一图像中的多个对象对应,第一图像为视频中的任一帧;获取多个音频片段,多个音频片段分别为多个音频信号中的第一时间段对应的部分;第一时间段为第一图像在视频中对应的时间段;从第一图像中的多个对象获取第一图像的目标对象,第一图像的目标对象为第一图像的多个对象中用户感兴趣的对象;根据第一图像的目标对象从多个音频片段中确定出目标音频片段,目标音频片段为多个音频片段中第二区域对应的音频片段,第二区 ...
【技术保护点】
【技术特征摘要】
1.一种基于人工智能芯片的视频播放方法,其特征在于,包括:获取第一图像及与所述第一图像对应的音频索引图像,所述音频索引图像包括多个第一区域,所述多个第一区域分别与多个音频信号对应,所述多个第一区域分别与所述第一图像中的多个对象对应,所述第一图像为所述视频中的任一帧;获取多个音频片段,所述多个音频片段分别为所述多个音频信号中的第一时间段对应的部分;所述第一时间段为所述第一图像在所述视频中对应的时间段;从所述第一图像中的多个对象确定第一图像的目标对象,所述第一图像的目标对象为所述第一图像的多个对象中用户感兴趣的对象;根据所述第一图像的目标对象从所述多个音频片段中确定出目标音频片段,所述目标音频片段为所述多个音频片段中第二区域对应的音频片段,所述第二区域为所述第一图像对应的音频索引图像的多个第一区域中,与所述第一图像的目标对象相对应的区域,所述第二图像的时间戳在所述第一图像的时间戳之前;播放所述第一图像和所述目标音频片段。2.根据权利要求1所述的方法,其特征在于,所述音频索引图像包括多个第一区域中,每个第一区域内的像素值均相同,且任意两个第一区域内的像素值不相同;所述多个第一区域的像素值分别用于指示所述多个音频信号。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一图像的目标对象从所述多个音频片段中确定出目标音频片段,包括:根据所述第一图像的目标对象从多个第一区域中确定所述目标对象对应的第一区域;获取所述目标对象对应的第一区域内的像素值;将所述目标对象对应的第一区域内的像素值所指示的音频信号第一时间段对应的音频片段确定为所述目标音频片段。4.根据权利要求3所述的方法,其特征在于,所述从所述第一图像中的多个对象确定第一图像的目标对象,包括:在检测用户针对所述第一图像的多个对象中第一对象的操作指令后,确定所述第一对象为所述第一图像的目标对象;或者,获取所述第一图像中所述用户的人眼关注区域,将所述用户的人眼关注区域包括的对象确定为所述第一图像的目标对象。5.根据权利要求1
‑
4任一项所述的方法,其特征在于,所述第一图像的尺寸与所述音频索引图像的尺寸相等,或者所述音频索引图像的尺寸小于所述第一图像的尺寸。6.根据权利要求1
‑
5任一项所述的方法,其特征在于,所述获取第一图像及与所述第一图像对应的音频索引图像,包括:从解码设备中获取所述第一图像及与所述第一图像对应的音频索引图像;或者,从第一码流中解码出所述第一图像及与所述第一图像对应的音频索引图像;所述获取多个音频片段,包括:从所述解码设备中获取所述多个音频片段;或者,从第二码流中解码出所述多个音频片段;或者,从所述第二码流中解码得到所述多个音频信号,从所述多个音频信号中获取所述多个
音频片段。7.一种基于人工智能芯片的视频编码方法,其特征在于,包括:获取第一图像,根据所述第一图像构建所述第一图像对应的音频索引图像,所述音频索引图像包括多个第一区域,所述多个第一区域分别与多个...
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:寒武纪昆山信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。