活动说话者标识制造技术

技术编号：4625882 阅读：167 留言：0更新日期：2012-04-11 18:40

描述了用于标识音频事件中的客户机的过程。在一示例中，媒体服务器可基于输入水平来对提供音频的客户机进行排序。标识符可以与客户机相关联以标识在事件中提供输入的客户机。经排序的客户机可被包括在列表中，该列表可被插入到携带音频内容的分组首部中。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】背景媒体会议参与者可能难以标识其他会议参与者。参与者可能不熟悉说话者的话音或参与者的面孔或者音频交换可能使收听者混淆。在后一种情况下，如果若干参与者同时说话或者如果在多个参与者之间存在快速交换，则无论是否正在说话，收听者都可能被混淆。在某些情况下，说话者可包括他/她的名字“这/他是Bob，...”或者收听者可询问在前说话者的身份。该问题的复杂性可随着说话或提供音频输入的参与者的数量的增加而提高。虽然收听者可从对话中的“上下文线索”中导出说话者的身份，但在某些情况下，参与者可能不会了解哪些参与者正在提供音频输入。另外，可能期望最小化带宽消耗或者用于携带信息的数据吞吐量。例如，虽然用于传输数据的物理连接可具有额外的吞吐量，但消耗通信链路资源可减少对其他数据传输可用的吞吐量，或者可能在用户恰巧具有有限的网络带宽的情况下影响会议音频数据传输。如果媒体会议改进不是“向后兼容的”，则对该改进的接受可能是有限的。例如，如果修改与现有协议和版本不相容，则用户可能必须获得已更新的版本以便与实现经修改版本的参与者进行通信和/或寻求组织批准。上述情形可能抑制对经修改的技术的接受。概述描述了用于标识音频或音频/视频事件中的客户机的过程。在一示例中，媒体服务器可基于输入电平来对提供音频的客户机进行排序。标识符可以与客户机相关联以标识在事件中提供输入的客户机。经排序的客户机可被包括在列表中，该列表可被插入到携带音频内容的...

【技术保护点】
一种方法，包括：　根据一个或多个音频输入客户机中所包括的单独的音频输入客户机所提供的输入来对所述一个或多个音频输入客户机进行排序（３０６）；　将标识符与所述单独的音频输入客户机相关联（３０４）；以及　将一个或多个音频输入客户机标识符的有序列表插入到分组首部中（３０８）。

【技术特征摘要】
【国外来华专利技术】US 2007-6-12 11/761,9631.一种方法，包括：
根据一个或多个音频输入客户机中所包括的单独的音频输入客户机所提
供的输入来对所述一个或多个音频输入客户机进行排序(306)；
将标识符与所述单独的音频输入客户机相关联(304)；以及
将一个或多个音频输入客户机标识符的有序列表插入到分组首部中
(308)。
2.如权利要求1所述的方法，其特征在于，所述列表被插入到所述分组首
部中的实时传输协议(RTP)贡献源列表(CSRC)中。
3.如权利要求1所述的方法，其特征在于，排序由主机通过混合音频流来
确定以使得所述列表从当前活动音频输入客户机降序排列。
4.如权利要求1所述的方法，其特征在于，还包括发送对应于所述单独的
客户机的规范名(CNAME)和映射到所述CNAME的同步源(SSRC)标识
(310)。
5.如权利要求4所述的方法，其特征在于，所述CNAME及相关联的SSRC
从对应于所述单独的客户机的实时控制协议(RTCP)记录中获取。
6.如权利要求5所述的方法，其特征在于，所述CNAME及相关联的SSRC
在RTCP分组中被发送到收听客户机。
7.如权利要求1所述的方法，其特征在于，还包括将所述CNAME和SSRC
存储在收听客户机的本地存储器中(312)。
8.如权利要求1所述的方法，其特征在于，主要客户机基于能级、静默时
间段的持续时间、持续时间或分组大小中的至少一个来确定。
9.如权利要求1所述的方法，其特征在于，还包括如果所述客户机在会话
中改变源传输地址，则用客户机规范名(CNAME)来更新所述同步源(SSRC)
标识。
10.一种方法，包括：
基于单独的活动音频客户机对会议的参与来对所述会议中的一个或多个
活动音频客户机的列表进行排序(404)，所述单独的活动音频客户机与规范
名(CNAME)和同步源...

【专利技术属性】
技术研发人员：RJ克林恩，HM卡恩，D库克利卡，
申请(专利权)人：微软公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人