对话检测制造技术

技术编号：14191511 阅读：108 留言：0更新日期：2016-12-15 09:57

公开了涉及检测在计算设备上呈现内容期间的对话，并且响应于检测到所述对话采取一个或多个动作的各实施例。在一个示例中，音频数据流被从一个或多个传感器接收，基于该音频数据流检测第一用户和第二用户之间的对话，以及响应于检测到该对话通过该计算设备修改数字内容项的呈现。

Dialogue detection

The invention relates to a dialogue that involves detecting the presentation of content on a computing device, and in response to the implementation of one or more actions of the session. In one example, the audio data stream is received from one or more sensors, the audio data stream between the first user and the second user based on conversations and in response to the detection of the dialogue through the computing device to modify the digital content item presentation.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】概述公开了涉及检测在计算设备上呈现内容期间的对话，并且响应于检测到所述对话采取一个或多个动作的各实施例。在一个示例中，音频数据流被从一个或多个传感器接收，基于该音频数据流检测第一用户和第二用户之间的对话，以及响应于检测到该对话通过该计算设备修改数字内容项的呈现。提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的一些概念。本
技术实现思路
并不旨在标识所要求保护主题的关键特征或必要特征，也不旨在用于限制所要求保护主题的范围。而且，所要求保护的主题不限于解决该公开的任一部分中所注的任何或全部缺点的实现方式。附图简述图1示出了经由头戴式显示器(HMD)设备的数字内容项的呈现的示例。图2示出了与另一人的对话的图1的HMD设备的佩戴者。图3-5示出了响应于检测到佩戴者和另一人的对话可对图1的数字内容呈现做出的示例修改。图6示出了数字内容项的另一示例呈现。图7示出了与另一人进行对话的图6的用户。图8示出了响应于检测到用户和另一人之间的对话可对图6的数字内容呈现做出的示例修改。图9示出了对话检测处理流水线的示例。图10示出了描绘用于检测对话的方法的示例的流程图。图11示出了示例HMD设备。图12示出示例计算系统。详细描述计算设备可被用来呈现各种形式的数字内容。在一些情况下，计算设备可按照令人沉浸并全神贯注的方式提供内容，诸如通过显示三维(3D)图像和/或全息图像。而且，这样的视觉内容可与音频内容的呈现相组合以提供更令人沉浸的体验。随着计算设备变得更加便携，数字内容呈现可在不同于传统娱乐设定的设定中被消费。因此，在这种计算设备的用户可以在内容呈现期间参与与其他人的对话。...
对话检测

【技术保护点】
一种用于在计算设备上检测用户之间的对话的方法，所述方法包括：接收来自一个或多个传感器的音频数据流；基于所述音频数据流检测第一用户和第二用户之间的对话；以及响应于检测到所述对话，修改数字内容项的呈现。

【技术特征摘要】
【国外来华专利技术】2014.04.17 US 14/255,8041.一种用于在计算设备上检测用户之间的对话的方法，所述方法包括：接收来自一个或多个传感器的音频数据流；基于所述音频数据流检测第一用户和第二用户之间的对话；以及响应于检测到所述对话，修改数字内容项的呈现。2.如权利要求1所述的方法，其特征在于，检测第一用户和第二用户之间的对话包括：检测所述音频数据流中的语音活动，确定所述语音活动包括人类语言的片段，以及确定人类语言的片段在不同源位置之间交替。3.如权利要求2所述的方法，其特征在于，所述一个或多个传感器包括话筒阵列，所述话筒阵列包括多个话筒，并且其中确定人类语言的片段的源位置包括向所述话筒阵列的多个音频样本应用波束成形空间滤波器以估计所述不同源位置。4.如权利要求2所述的方法，其特征在于，检测第一用户和第二用户之间的对话进一步包括确定人类语言的片段在指定韵律范围内出现。5.如权利要求2所述的方法，其特征在于，检测第一用户和第二用户之间的对话进一步包括确定人类语言的片段在阈值时间段内在不同源位置之间交替。6.如权利要求2所述的方法，其特征在于，进一步包括：确定人类语言的一个或多个片段是由电子音频设备提供的，以及在确定人类语言的片段在不同源位置之间交替时，忽略由所述电子音频设备提供的人类语言的一个或多个片段。7.如权利要求1所述的方法，其特征在于，所述数字内容项包括...

【专利技术属性】
技术研发人员：A·C·汤姆林，J·保罗维奇，E·M·圭布勒，J·斯科特，C·布朗，J·W·普鲁姆，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人