基于媒体内容中的语音度来确定光效果制造技术

技术编号：29688286 阅读：26 留言：0更新日期：2021-08-13 22:13

一种方法，包括获得（101）媒体内容信息以及获得（103，109）指示音频部分中的语音度的信息。媒体内容信息包括媒体内容和/或通过分析媒体内容确定的信息，并且基于对媒体内容的音频部分的分析来确定语音度。该方法进一步包括确定（107，113）在媒体内容正被呈现时音频部分应该被使用来确定要呈现的一个或多个光效果的程度，以及确定（117）这些光效果。该程度基于语音度来确定，并且光效果根据该程度而基于对音频部分的分析（115）、并基于对媒体内容的视频部分的分析来确定。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于媒体内容中的语音度来确定光效果
本专利技术涉及一种用于确定在媒体内容正被呈现时要呈现的一个或多个光效果的系统，所述一个或多个光效果基于对所述媒体内容的分析来确定。本专利技术进一步涉及一种确定在媒体内容正被呈现时要呈现的一个或多个光效果的方法，所述一个或多个光效果基于对所述媒体内容的分析来确定。本专利技术还涉及一种使得计算机系统能够执行这种方法的计算机程序产品。
技术介绍
连接的光系统（诸如PhilipsHue）的通用性保持增长，向用户提供越来越多的特征。这些新特征包括上下文感知、智能自动化行为、新的光使用形式（诸如娱乐）等。例如，Hue娱乐通过使用光脚本或通过基于音频和/或视频分析创建光效果来增强观看电影、听音乐和/或玩游戏的体验。后者是用Hue娱乐应用程序HueSync实现的，HueSync使用颜色提取算法自动创建光效果。用于娱乐的理想照明系统支持并增强具体内容的体验。当前，聚焦于低层次的图像统计，诸如颜色值和图像运动。然而，这些统计没有考虑场景的语义维度。在统计上几乎相同的两个场景可以传达截然不同的意义。没有上下文，就不可能判断草地中空长椅的图像的语义（预期）意义，例如，它可以是旨在传达美好夏日或与家人在公园中散步的图像。然而，当一个人考虑到图像的来源是殡仪馆时，图像具有不同的维度，也许是悲伤、或悲痛的维度。在没有媒体内容的上下文的情况下，基于媒体内容呈现光效果经常导致次优的光效果。WO2007/119277A1公开了一种设备，该设备在视频正被呈现时控制光设备来呈现光效...

【技术保护点】
1.一种用于确定在媒体内容正被呈现时要呈现的一个或多个光效果的系统（1），所述一个或多个光效果基于对所述媒体内容的分析来确定，所述系统（1）包括：/n-至少一个输入接口（3）；/n-至少一个输出接口（4）；和/n-至少一个处理器（5），被配置为：/n-使用所述至少一个输入接口（3）来获得媒体内容，/n-确定在所述媒体内容正被呈现时要在一个或多个光源（13-17）上呈现的一个或多个光效果，所述一个或多个光效果基于以下来确定：/n-对所述媒体内容的音频部分的分析，和/n-对所述媒体内容的视频部分的分析，以及/n-使用所述至少一个输出接口（4）来控制所述一个或多个光源（13-17）以呈现所述一个或多个光效果，/n其中所述处理器（5）被进一步配置成：/n-获得指示所述音频部分中的语音度的信息，所述语音度基于对所述音频部分的所述分析来确定；/n-确定所述音频部分应该被使用来确定所述一个或多个光效果的程度，所述程度基于所述确定的语音度来确定；以及/n-根据所述音频部分应该被使用来确定所述一个或多个光效果的所述确定的程度，基于所述音频部分的强度和/或响度来确定所述一个或多个光效果的亮度和/或色度。/n...

【技术特征摘要】
【国外来华专利技术】20190125 EP 19/153,773.7;20190109 US 62/790,2191.一种用于确定在媒体内容正被呈现时要呈现的一个或多个光效果的系统（1），所述一个或多个光效果基于对所述媒体内容的分析来确定，所述系统（1）包括：
-至少一个输入接口（3）；
-至少一个输出接口（4）；和
-至少一个处理器（5），被配置为：
-使用所述至少一个输入接口（3）来获得媒体内容，
-确定在所述媒体内容正被呈现时要在一个或多个光源（13-17）上呈现的一个或多个光效果，所述一个或多个光效果基于以下来确定：
-对所述媒体内容的音频部分的分析，和
-对所述媒体内容的视频部分的分析，以及
-使用所述至少一个输出接口（4）来控制所述一个或多个光源（13-17）以呈现所述一个或多个光效果，
其中所述处理器（5）被进一步配置成：
-获得指示所述音频部分中的语音度的信息，所述语音度基于对所述音频部分的所述分析来确定；
-确定所述音频部分应该被使用来确定所述一个或多个光效果的程度，所述程度基于所述确定的语音度来确定；以及
-根据所述音频部分应该被使用来确定所述一个或多个光效果的所述确定的程度，基于所述音频部分的强度和/或响度来确定所述一个或多个光效果的亮度和/或色度。

2.如权利要求1所述的系统（1），其中所述音频部分中的所述语音度是通过确定所述音频部分中的语音量并基于所述语音量将所述音频部分分类为主要是语音或主要是非语音来确定的。

3.如权利要求2所述的系统（1），其中所述至少一个处理器（5）被配置为根据所述音频部分被分类为主要是语音而将第一程度确定为所述程度并且根据所述音频部分被分类为主要是非语音而将第二程度确定为所述程度，所述第二程度指示应该基于所述音频部分的强度和/或响度来确定所述一个或多个光效果的亮度和/或色度，并且所述第一程度指示不应该基于所述音频部分的强度和/或响度来确定所述一个或多个光效果的亮度和/或色度。

4.如权利要求2所述的系统（1），其中所述至少一个处理器（5）被配置为根据所述音频部分被分类为主要是语音而使用第一亮度和/或色度范围并根据所述音频部分被分类为主要是非语音而使用第二亮度和/或色度范围来确定所述一个或多个光效果，所述第一亮度和/或色度范围具有比所述第二亮度和/或色度范围更低的平均亮度和/或色度。

5.如权利要求1所述的系统（1），其中通过将所述音频部分分类为多个类别（51，53，55，57）中的一个类别来确定所述音频部分中的所述语音度，所述多个类别（51，53，55，57）包括以下中的至少两种：交谈（57）、低语、尖叫（55）、叙述、歌唱（51）、剧情语音、和非剧情语音。

6.如权利要求5所述的系统（1），其中所述至少一个处理器（5）...

【专利技术属性】
技术研发人员：T·博拉，D·V·阿利亚克赛尤，A·L·J·坎普，
申请(专利权)人：昕诺飞控股有限公司，
类型：发明
国别省市：荷兰;NL

全部详细技术资料下载我是这个专利的主人