基于人工智能芯片的视频播放方法、编码方法及相关装置制造方法及图纸

技术编号：37507939 阅读：19 留言：0更新日期：2023-05-07 09:46

本申请涉及人工智能芯片领域，具体涉及一种基于人工智能芯片的视频播放方法、编码方法及相关设备，其中，对于视频的每帧图像，构建对应的音频索引图像，并建立音频索引图像中多个区域与多个音频信号的映射关系，使得在播放该视频时，可以基于音频索引图像中多个区域与多个音频信号的映射关系确定用户针对视频图像中的感兴趣的对象所占据区域对应的音频信号，从而实现用户可以选择播放自己感兴趣对象的音频，提升了用户体验。提升了用户体验。提升了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于人工智能芯片的视频播放方法、编码方法及相关装置

[0001]本申请涉及人工智能芯片领域，尤其涉及一种基于人工智能芯片视频播放方法、编码方法及相关装置。

技术介绍

[0002]人工智能芯片，也被称为AI加速器或计算卡，是指专门用于处理人工智能应用中的大量计算任务的模块(其他非计算任务仍由CPU负责)。比如视频处理领域。
[0003]随着视频内容的丰富性，单个音频无法承载视频内容的表达。在目前火热的短视频领域，短短的十几秒中，单音频无法满足图像内容信息的表达。比如：正常录制的视频中有多个人，其中只有一个人在说话，而其他人此时的内心感受是无法通过音频表达的。

技术实现思路

[0004]本申请实施例提供一种基于人工智能芯片的视频播放方法、编码方法及相关装置，有利于解决上述技术问题。
[0005]第一方面，本申请实施例提供一种基于人工智能芯片的视频播放方法，包括：
[0006]获取第一图像及与第一图像对应的音频索引图像，音频索引图像包括多个第一区域，多个第一区域分别与多个音频信号对应，多个第一区域分别与第一图像中的多个对象对应，第一图像为视频中的任一帧；获取多个音频片段，多个音频片段分别为多个音频信号中的第一时间段对应的部分；第一时间段为第一图像在视频中对应的时间段；从第一图像中的多个对象获取第一图像的目标对象，第一图像的目标对象为第一图像的多个对象中用户感兴趣的对象；根据第一图像的目标对象从多个音频片段中确定出目标音频片段，目标音频片段为多个音频片段中第二区域对应的音频片段，第二区...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能芯片的视频播放方法，其特征在于，包括：获取第一图像及与所述第一图像对应的音频索引图像，所述音频索引图像包括多个第一区域，所述多个第一区域分别与多个音频信号对应，所述多个第一区域分别与所述第一图像中的多个对象对应，所述第一图像为所述视频中的任一帧；获取多个音频片段，所述多个音频片段分别为所述多个音频信号中的第一时间段对应的部分；所述第一时间段为所述第一图像在所述视频中对应的时间段；从所述第一图像中的多个对象确定第一图像的目标对象，所述第一图像的目标对象为所述第一图像的多个对象中用户感兴趣的对象；根据所述第一图像的目标对象从所述多个音频片段中确定出目标音频片段，所述目标音频片段为所述多个音频片段中第二区域对应的音频片段，所述第二区域为所述第一图像对应的音频索引图像的多个第一区域中，与所述第一图像的目标对象相对应的区域，所述第二图像的时间戳在所述第一图像的时间戳之前；播放所述第一图像和所述目标音频片段。2.根据权利要求1所述的方法，其特征在于，所述音频索引图像包括多个第一区域中，每个第一区域内的像素值均相同，且任意两个第一区域内的像素值不相同；所述多个第一区域的像素值分别用于指示所述多个音频信号。3.根据权利要求2所述的方法，其特征在于，所述根据所述第一图像的目标对象从所述多个音频片段中确定出目标音频片段，包括：根据所述第一图像的目标对象从多个第一区域中确定所述目标对象对应的第一区域；获取所述目标对象对应的第一区域内的像素值；将所述目标对象对应的第一区域内的像素值所指示的音频信号第一时间段对应的音频片段确定为所述目标音频片段。4.根据权利要求3所述的方法，其特征在于，所述从所述第一图像中的多个对象确定第一图像的目标对象，包括：在检测用户针对所述第一图像的多个对象中第一对象的操作指令后，确定所述第一对象为所述第一图像的目标对象；或者，获取所述第一图像中所述用户的人眼关注区域，将所述用户的人眼关注区域包括的对象确定为所述第一图像的目标对象。5.根据权利要求1
‑
4任一项所述的方法，其特征在于，所述第一图像的尺寸与所述音频索引图像的尺寸相等，或者所述音频索引图像的尺寸小于所述第一图像的尺寸。6.根据权利要求1
‑
5任一项所述的方法，其特征在于，所述获取第一图像及与所述第一图像对应的音频索引图像，包括：从解码设备中获取所述第一图像及与所述第一图像对应的音频索引图像；或者，从第一码流中解码出所述第一图像及与所述第一图像对应的音频索引图像；所述获取多个音频片段，包括：从所述解码设备中获取所述多个音频片段；或者，从第二码流中解码出所述多个音频片段；或者，从所述第二码流中解码得到所述多个音频信号，从所述多个音频信号中获取所述多个
音频片段。7.一种基于人工智能芯片的视频编码方法，其特征在于，包括：获取第一图像，根据所述第一图像构建所述第一图像对应的音频索引图像，所述音频索引图像包括多个第一区域，所述多个第一区域分别与多个...

【专利技术属性】
技术研发人员：请求不公布姓名，
申请(专利权)人：寒武纪昆山信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人