基于描述性模型的自动决策制造技术

技术编号：27193089 阅读：28 留言：0更新日期：2021-01-31 11:39

在一个实施例中，一种方法包括访问来自一个或更多个不同输入源的输入数据。输入源包括：一个或更多个摄像机、一个或更多个麦克风以及由社交网络系统维护的社交图。基于输入数据为当前音频

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于描述性模型的自动决策
[0001]优先权
[0002]本申请根据35 U.S.C.
§
119(e)要求2018年10月5日提交的第16/153,613号美国专利申请和2018年4月10日提交的第62/655,751号美国临时专利申请的权益，其通过引用结合于此。

[0003]本公开总体上涉及视频会议。
[0004]背景
[0005]可以包括社交网络网站的社交网络系统可以使它的用户(例如个人或组织)能够与它交互以及通过它彼此交互。社交网络系统可以利用来自用户的输入来在社交网络系统中创建并存储与用户相关联的用户简档(user profile)。用户简档可以包括用户已经输入的信息。根据用户的隐私设置，信息可以是公开的或私有的，并且可以包括人口统计信息、通信渠道(communication-channel)信息和关于用户个人兴趣的信息。社交网络系统还可以用来自用户的输入和许可来创建并存储用户与社交网络系统的其他用户的关系的记录，以及提供服务(例如，发帖墙(wall post)、照片分享、事件组织、消息传送、游戏或广告)以便于在用户之间或当中的社交互动。
[0006]社交网络系统可以通过一个或更多个网络向用户的移动设备或其他计算设备发送与它的服务相关的内容或消息。用户还可以在用户的移动设备或其他计算设备上安装软件应用，用于访问用户的用户简档和在社交网络系统内的其他数据。社交网络系统可以生成一组个性化的内容对象以显示给用户，例如关连(connect)到该用户的其他用户的汇集的动态(st...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括：访问来自一个或更多个不同输入源的输入数据，所述输入源包括：一个或更多个摄像机、一个或更多个麦克风以及由社交网络系统维护的社交图；基于所述输入数据，生成当前音频-视频通信会话的当前描述性模型，所述当前描述性模型包括关于以下项的一个或更多个描述性特征：(1)与所述当前音频-视频通信会话相关联的环境，(2)所述环境中的一个或更多个人，或者(3)与所述当前音频-视频通信会话相关联的一个或更多个上下文元素；基于所述一个或更多个描述性特征为所述当前音频-视频通信会话生成一个或更多个指令；和向与所述一个或更多个摄像机和所述一个或更多个麦克风相关联的计算设备发送所述一个或更多个指令。2.根据权利要求1所述的方法，其中，关于与所述当前音频-视频通信会话相关联的环境的所述一个或更多个描述性特征包括：所述环境中的一面或更多面墙中的每一面墙的位置；所述环境中的一个或更多个门中的每一个门的位置；所述环境的类别；和所述环境中的一个或更多个对象中的每一个对象的位置。3.根据权利要求1所述的方法，其中，对于所述一个或更多个人中的每个人员，关于所述一个或更多个人的所述一个或更多个描述性特征包括：所述当前音频-视频通信会话的参与度度量；和所述人员与所述一个或更多个人中的至少一个其他人员之间的亲和力。4.根据权利要求3所述的方法，其中，所述一个或更多个人中的每个人员的参与度度量至少部分地基于所述人员说的字数、所述人员和所述计算设备之间的物理距离、所述人员在所述当前音频-视频通信系统期间在所述环境中的时间量、或者与所述人员相关联的社交图数据。5.根据权利要求1所述的方法，还包括基于已经在所述环境中发生的多个过去的音频-视频通信会话生成历史描述性模型，其中，所述一个或更多个描述性特征至少部分地基于所述历史描述性模型。6.根据权利要求1所述的方法，其中，所述一个或更多个指令包括向视觉目标拉近、向视觉目标平移、将麦克风波束形成为音频目标、或将场景切换到视觉目标的指令。7.根据权利要求1所述的方法，其中，与所述当前音频-视频通信会话相关联的一个或更多个上下文元素包括所述当前音频-视频通信会话在一天中的时间、所述当前音频-视频通信会话的数据或与所述当前音频-视频通信会话相关联的事件。8.一个或更多个计算机可读非暂时性存储介质，其体现软件，所述软件在被执行时可操作来：访问来自一个或更多个不同输入源的输入数据，所述输入源包括：一个或更多个摄像机、一个或更多个麦克风以及由社交网络系统维护的社交图；基于所述输入数据，生成当前音频-视频通信会话的当前描述性模型，所述当前描述性模型包括关于以下项的一个或更多个描述性特征：(1)与所述当前音频-视频通信会话相关
联的环境，(2)所述环境中的一个或更多个人，或者(3)与所述当前音频-视频通信会话相关联的一个或更多个上下文元素；基于所述一个或更多个描述性特征为所述当前音频-视频通信会话生成一个或更多个指令；和向与所述一个或更多个摄像机和所述一个或更多个麦克风相关联的计算设备发送所述一个或更多个指令。9.根据权利要求8所述的介质，其中，关于与所述当前音频-视频通信会话相关联的环境的所述一个或更多个描述性特征包括：所述环境中的一面或更多面墙中的每一面墙的位置；所述环境中的一个或更多个门中的每一个门的位置；所述环境的类别；和所述环境中的一个或更多个对象中的每一个对象的位置。10.根据权利要求8所述的介质，其中，对于所述一个或更多个人中的每个人员，关于所述一个或更多个人的所述一个或更多个描述性特征包括：所述当前音频-视频通信会话的参与度度量；和所述人员与所述一个或更多个人中的至少一个其他人员之间的亲和力。11.根据权利要求10所述的介质，其中，所述一个或更多个人中的每个人员的参与度度量至少部分地基于所述人员说的字数、所述人员和所述计算设备之间的物理距离、所述人员在所述当前音频-视频通信系统期间在所述环境中的时间量、或者与所述人员相关联的社交图数据。12.根据权利要求8所述的介质，其中，所述软件在被执行时还可操作来基于已经在所述环境中发生的多个过去的音频-视频通信会话生成历史描述性模型，其中，所述一个或更多个描述性特征至少部分地基于所述历史描述性模型。13.根据权利要求8所述的介质，其中，所述一个或更多个指令包括向视觉目标拉近、向视觉目标平移、将麦克风波束形成为音频目标、或将场景切换到视觉目标的指令。14.根据权利要求8所述的介质，其中，与所述当前音频-视频通信会话相关联的一个或更多个上下文元素包括所述当前音频-视频通信会话在一天中的时间、所述当前音频-视频通信会话的数据或与所述当前音频-视频通信会话相关联的事件。15.一种系统，包括：一个或更多个处理器；和一个或更多个计算机可读非暂时性存储介质，其耦合到一个或更多个所述处理器，并且包括指令，所述指令当由一个或更多个所述处理器执行时可操作来使所述系统：访问来自一个或更多个不同输入源的输入数据，所述输入源包括：一个或更多个摄像机、一个或更多个麦克风以及由社交网络系统维护的社交图；基于所述输入数据，生成当前音频-视频通信会话的当前描述性模型，所述当前描述性模型包括关于以下项的一个或更多个描述性特征：(1)与所述当前音频-视频通信会话相关联的环境，(2)所述环境中的一个或更多个人，或者(3)与所述当前音频-视频通信会话相关联的一个或更多个上下文元素；基于所述一个或更多个描述性特征为所述当前音频-视频通信会话生成一个或更多个
指令；和向与所述一个或更多个摄像机和所述一个或更多个麦克风相关联的计算设备发送所述一个或更多个指令。16.根据权利要求15所述的系统，其中，关于与所述当前音频-视频通信会话相关联的环境的所述一个或更多个描述性特征包括：所述环境中的一面或更多面墙中的每一面墙的位置；所述环境中的一个或更多个门中的每一个门的位置；所述环境的类别；和所述环境中的一个或更多个对象中的每一个对象的位置。17.根据权利要求15所述的系统，其中，对于所述一个或更多个人中的每个人员，关于所述一个或更多个人的所述一个或更多个描述性特征包括：所述当前音频-视频通信会话的参与度度量；和所述人员与所述一个或更多个人中的至少一个其他人员之间的亲和力。18.根据权利要求17所述的系统，其中，所述一个或更多个人中的每个人员的参与度度量至少部分地基于所述人员说的字数、所述人员和所述计算设备之间的物理距离、所述人员在所述当前音频-视频通信系统期间在所述环境中的时间量、或者与所述人员相关联的社交图数据。19.根据权利要求15所述的系统，其中，所述处理器在执行所述指令时还可操作来基于已经在所述环境中发生的多个过去的音频-视频通信会话生成历史描述性模型，其中，所述一个或更多个描述性特征至少部分地基于所述历史描述性模型。20.根据权利要求15所述的系统，其中，所述一个或更多个指令包括向视觉目标拉近、向视觉目标平移、将麦克风波束形成为音频目标、或将场景切换到视觉目标的指令。21.一种方法，包括：访问来自一个或更多个不同输入源的输入数据，所述输入源包括：一个或更多个摄像机、一个或更多...

【专利技术属性】
技术研发人员：詹森，
申请(专利权)人：脸谱公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人