用于处理多媒体播放界面的方法、装置、设备及介质制造方法及图纸

技术编号:32705290 阅读:15 留言:0更新日期:2022-03-20 08:00
本公开涉及用于处理多媒体播放界面的方法、装置、设备及介质。公开了一种用于处理多媒体播放界面的方法,包括:从经由多媒体播放界面播放的多媒体内容中获取语音数据;对语音数据进行语音识别处理并从语音识别处理的结果中提取关键词;选择与所提取的关键词相关联的视觉对象;以及将所选择的视觉对象显示在多媒体播放界面上。体播放界面上。体播放界面上。

【技术实现步骤摘要】
用于处理多媒体播放界面的方法、装置、设备及介质


[0001]本公开涉及多媒体
,并且更具体地,涉及用于处理多媒体播放界面的方法、装置、设备及介质。

技术介绍

[0002]越来越多的用户期望将多媒体内容(例如,视频、音频等)变得更加丰富、有趣。以视频为例,许多用户会在剪辑视频时手动向视频的画面添加“贴纸”(例如,卡通图画、花体字、动画等等)。在之后的视频重放期间,这些“贴纸”会在视频播放的同时出现,从而增加视频的趣味性。

技术实现思路

[0003]在下文中给出了关于本公开的简要概述,以便提供关于本公开的一些方面的基本理解。但是,应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分,也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念,以此作为稍后给出的更详细描述的前序。
[0004]根据本公开的第一方面,提供了一种用于处理多媒体播放界面的方法,该方法包括:从经由多媒体播放界面播放的多媒体内容中获取语音数据;对语音数据进行语音识别处理并从语音识别处理的结果中提取关键词;选择与所提取的关键词相关联的视觉对象;以及将所选择的视觉对象显示在多媒体播放界面上。
[0005]根据本公开的第二方面,提供了一种用于处理多媒体播放界面的装置,该装置包括:语音获取单元,被配置为从经由多媒体播放界面播放的多媒体内容中获取语音数据;关键词提取单元,被配置为对由语音获取单元获取的语音数据进行语音识别处理并从语音识别处理的结果中提取关键词;视觉对象选择单元,被配置为选择与由关键词提取单元提取的关键词相关联的视觉对象;以及视觉对象显示单元,被配置为将由视觉对象选择单元选择的视觉对象显示在多媒体播放界面上。
[0006]根据本公开的第三方面,提供了一种用于处理多媒体播放界面的设备。该设备包括:一个或多个处理器;以及存储计算机可执行指令的存储器,计算机可执行指令在被一个或多个处理器执行时使得一个或多个处理器执行根据本公开的第一方面所述的方法。
[0007]根据本公开的第四方面,提供了一种其上存储有计算机可执行指令的非瞬态存储介质,计算机可执行指令在被计算机执行时使得计算机执行根据本公开的第一方面所述的方法。
附图说明
[0008]构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。在附图中阐述的实施例本质上是说明性和示例性的,并不旨在限制本公开。当结合以下附图阅读时,可以清楚地理解以下对示例性实施例的详细描述,其中相似的
结构用相似的附图标记指示,并且其中:
[0009]图1是示出根据本公开的实施例的用于处理多媒体播放界面的方法的流程图;
[0010]图2A和图2B示意性地示出了根据本公开的实施例的关键词库和视觉对象库的示例;
[0011]图3A至图3C示意性地示出了通过根据本公开的实施例的用于处理多媒体播放界面的方法处理的多媒体播放界面的示例;
[0012]图4A至图4F示意性地示出了根据本公开的实施例的视觉对象在多媒体播放界面上的可显示区域的确定过程;
[0013]图5是示出根据本公开的实施例的用于处理多媒体播放界面的装置的示意性框图;以及
[0014]图6是示出根据本公开的实施例的用于处理多媒体播放界面的设备的示意性框图。
具体实施方式
[0015]现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
[0016]同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
[0017]以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
[0018]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0019]在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其他示例可以具有不同的值。
[0020]为了使多媒体内容(例如,视频、音频等)变得更加丰富、有趣,许多用户会在处理多媒体内容时在用于播放多媒体内容的多媒体播放界面上添加视觉对象以进行美化装饰。本文所描述的视觉对象可以是指可视觉显示在多媒体播放界面上的对象,其例如可以基于文本、图形和/或其组合,并且可以是静态的或动态的。视觉对象例如可以是但不限于花体字、卡通图画、动画等等。可以在多媒体播放界面上添加这样的视觉对象,使得这些视觉对象可以像“贴纸”一样“张贴”在多媒体播放界面上。结果,在播放多媒体内容时,这些视觉对象会在多媒体播放界面播放多媒体内容的同时出现在多媒体播放界面上,以增加多媒体内容的趣味性,从而丰富用户在观看多媒体内容时的体验。然而,这样添加的“贴纸”往往需要用户通过手动操作来进行选择和放置,耗时费力。
[0021]本公开的一方面提供了一种用于处理多媒体播放界面的方法,可以对播放多媒体内容的多媒体播放界面自动进行美化装饰并将视觉对象自然地呈现在多媒体播放界面的合适位置,不仅可以快速便捷地向用户呈现装饰后的效果,大大地节约了用户的操作成本,还可以将合适的视觉对象呈现在合适位置处,满足用户对多媒体内容的处理需求。
[0022]本文所描述的多媒体内容例如可以是音频或视频等。本文所描述的多媒体播放界
面例如可以是多媒体内容的摄制界面,也可以是多媒体内容的直播界面,还可以是已录制的多媒体内容的播放界面,等等。例如,多媒体播放界面可以是进行音频播放的音频播放界面,或可以是进行视频播放的视频播放界面。在本公开的实施例中,主要以该多媒体播放界面为视频播放界面为例进行非限制性详细说明,但本领域技术人员能够理解,本公开可以应用于任何合适的多媒体播放界面。
[0023]下面参考图1描述根据本公开的实施例的用于处理多媒体播放界面的示例方法100。在一些实施例中,方法100可以应用于但不限于应用于终端设备。本公开的实施例中的终端设备例如可以是智能手机、平板电脑、智能可穿戴设备、计算机、个人数字助理(PDA)等具有语音处理功能和多媒体播放功能的智能终端。
[0024]如图1所示,方法100包括以下步骤S102、步骤S104、步骤S106和步骤S108。
[0025]步骤S102:从经由多媒体播放界面播放的多媒体内容中获取语音数据。
[0026]步骤S104:对语音数据进行语音识别处理并从语音识别处理的结果中提取关键词。
[0027]步骤S106:选择与所提取的关键词相关联的视觉对象。
[0028]步骤S108:将所选择的视觉对象显示在多媒体播放界面上。
[0029]通过方法100可以将视觉对象适时适地地显示在多媒体播放界面上,所呈现的视觉对象与多媒体内容的语音数据密切关联,增本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于处理多媒体播放界面的方法,包括:从经由所述多媒体播放界面播放的多媒体内容中获取语音数据;对所述语音数据进行语音识别处理并从语音识别处理的结果中提取关键词;选择与所提取的关键词相关联的视觉对象;以及将所选择的视觉对象显示在所述多媒体播放界面上。2.根据权利要求1所述的方法,其中,提取关键词包括将所述语音识别处理的结果与关键词库中的每个关键词进行匹配,并将所述关键词库中的与所述语音识别处理的结果匹配的关键词确定为要提取的关键词。3.根据权利要求1所述的方法,其中,与所提取的关键词相关联的视觉对象选自针对所述关键词定义的视觉对象库,所述视觉对象库包括表示所述关键词的视觉对象。4.根据权利要求3所述的方法,其中,所述视觉对象库包括多个视觉对象组,每个视觉对象组对应于多个风格中的一个风格并且包括表示所提取的关键词的至少一个视觉对象,并且其中,选择与所提取的关键词相关联的视觉对象包括:确定用于所述多媒体内容的风格;以及从所述视觉对象库中的与用于所述多媒体内容的所述风格对应的视觉对象组中选择要显示在所述多媒体播放界面上的视觉对象。5.根据权利要求1所述的方法,其中,所选择的视觉对象在所述多媒体内容播放期间被显示在所述多媒体播放界面上的次数不超过预定次数阈值。6.根据权利要求1所述的方法,其中,从所...

【专利技术属性】
技术研发人员:张骞蒋林王晓斌
申请(专利权)人:伊普西龙信息科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1