一种用于人物标识的方法和技术设备。该方法包括:检测视频帧中的个人分段;从个人分段中提取用于若干特征类别的特征矢量集合;生成所提取的特征矢量集合的个人特征模型;以及向人物标识模型池传输个人特征模型。该解决方案可以提供更广泛的人物标识。
【技术实现步骤摘要】
【国外来华专利技术】
本申请一般涉及基于视频的模型创建。特别地,本申请涉及来自基于视频模型的 人物标识。
技术介绍
社交媒体使得对于人物标识的需要已经增加。社交媒体用户将图像和视频上传至 显现在图像和视频中的他们的社交媒体账户和标签。这可以手动地完成,然而自动的人物 标识方法也已经被开发。 人物标识可以基于静止图像,其中例如个人的面部被计算以找到用于面部的某些 特征。虽然一些已知的人物标识方法依赖于面部识别,然而其中一些面向用于改善面部识 别精确度的面部模型更新解决方案。由于这些方法基于面部可检测性,所以应当理解,如果 面部不可见,则不能够识别个人。一些已知的人物标识方法使用步态识别与面部识别的融 合。有两种用于执行这一操作的解决方案-其中一些将步态识别用于候选者选择并且将面 部识别用于最终识别,其中一些融合步态和面部的特征用于组合的模型训练。在这样的解 决方案中,等同地趋近步态特征和面部特征是不合理的。 因此,需要一种用于更广泛的人物标识的解决方案。
技术实现思路
现在,已经专利技术了一种能够缓解以上问题的改进的方法和实现该方法的技术设 备。 根据第一方面,一种方法包括:检测视频帧中的个人分段;从个人分段中提取用 于若干特征类别的特征矢量集合;生成所提取的特征矢量集合的个人特征模型;以及向人 物标识模型池传输个人特征模型。解决方案可以提供更广泛的人物标识。 根据一种实施例,若干特征类别涉及以下各项的任意组合:面部特征、步态特征、 声音特征、手部特征、身体特征。 根据一种实施例,通过从个人分段定位面部并且估计面部的姿态来提取面部特征 矢量。 根据一种实施例,从步态描述图提取步态特征矢量,步态特征图通过组合归一化 的剪影来生成,剪影从包含个人的整个身体的个人分段的每个帧来分段。 根据一种实施例,通过检测包括个人的特写的个人分段以及检测个人是否正在说 话并且如果是则提取声音以确定声音特征矢量,来确定声音特征矢量。 根据一种实施例,个人特征模型用于在人物标识模型池中寻找对应的个人特征模 型。 根据一种实施例,如果对应的个人特征模型未找到,则将新的个人特征模型创兼 职人物标识模型池。 根据一种实施例,如果对应的个人特征模型被找到,则用所传输的个人特征模型 来更新对应的个人特征模型。 根据一种实施例,个人特征模型用于寻找相关联的个人特征模型。 根据一种实施例,相关联的个人特征模型通过确定个人特征模型的位置信息或时 间信息或位置信息和时间信息二者并且通过寻找与信息中的至少一个信息匹配的相关联 的个人特征模型而被找到。 根据一种实施例,如果模型属于相同的个人,则将个人特征模型与相关联的个人 特征模型合并。 根据第二方面,一种装置包括至少一个处理器、包括计算机程序代码的存储器,存 储器和计算机程序代码被配置成通过至少一个处理器引起装置至少执行以下操作:检测视 频帧中的个人分段;从个人分段中提取用于若干特征类别的特征矢量集合;生成所提取的 特征矢量集合的个人特征模型;以及向人物标识模型池传输个人特征模型。 根据第三方面,一种装置,包括:用于检测视频帧中的个人分段的装置;用于从个 人分段中提取用于若干特征类别的特征矢量集合的装置;用于生成所提取的特征矢量集合 的个人特征模型的装置;以及用于向人物标识模型池传输个人特征模型的装置。 根据第四方面,一种系统包括至少一个处理器、包括计算机程序代码的存储器,存 储器和计算机程序代码被配置成通过至少一个处理器引起系统至少执行以下操作:检测视 频帧中的个人分段;从个人分段中提取用于若干特征类别的特征矢量集合;生成所提取的 特征矢量集合的个人特征模型;以及向人物标识模型池传输个人特征模型。 根据第五方面,一种在非暂态计算机可读介质上实施的计算机程序产品,包括被 配置成当在至少一个处理器上执行时引起装置或系统执行以下操作的计算机程序代码:检 测视频帧中的个人分段;从个人分段中提取用于若干特征类别的特征矢量集合;生成所提 取的特征矢量集合的个人特征模型;以及向人物标识模型池传输个人特征模型。【附图说明】 下面,将参考附图详细描述本专利技术的各种实施例,在附图中: 图1示出根据一种实施例的装置的简化的框图; 图2示出根据一种实施例的装置的布局; 图3示出根据一种实施例的系统配置; 图4示出来自视频帧的个人提取的示例; 图5示出视频帧中的人体检测的示例; 图6示出从视频帧中提取的各种特征矢量的示例; 图7示出根据一种实施例的识别模型创建/更新方法; 图8示出用于识别模型创建的情况的示例;以及 图9示出用于识别模型更新的情况的示例。【具体实施方式】 下面,公开多尺度人物标识方法,其组合使用面部识别、步态识别、声音识别、姿势 识别等以创建新的模型并且更新人物标识模型池中的现有模型。另外,实施例提出基于其 模型特征距离连同位置和时间信息来计算波形的关联以促进模型池中的手动模型校正。要 在多尺度人物标识方法中使用的图像帧可以由电子装置来捕获,电子装置的示例在图1和 2中图示。 装置或电子设备50可以是例如无线通信系统的移动终端或者用户设备。然而,应 当理解,本专利技术的实施例可以在能够捕获图像数据(或者静止图像或者视频图像)的任何 电子设备或装置内实现。装置50可以包括用于容纳和保护设备的外壳30。装置50还可 以包括液晶显示器形式的显示器32。在本专利技术的其他实施例中,显示器可以是合适显示图 像或视频的任意合适的显示技术。装置50还可以包括小键盘34。在本专利技术的其他实施例 中,可以采用任意合适的数据或用户界面机制。例如,可以将用户界面实现为作为触敏显示 器的部分的虚拟键盘或者数据输入系统。装置可以包括麦克风36或者能够作为数字或模 拟信号输入的任意合适的音频输入。装置50还可以包括在本专利技术的实施例中可以是以下 各项中的任一项的音频输出设备:耳机38、扬声器、或者模拟音频或数字音频输出连接。装 置50还可以包括电池40 (或者在本专利技术的其他实施例中,设备可以由诸如太阳能电池、燃 料电池或时钟发生器等任意合适的移动能量设备来供电)。装置还可以包括能够记录或捕 获图像和/或视频或者可以连接到一个相机的相机42。在一些实施例中,装置50还可以包 括用于到其他设备的近距离视线通信的红外端口。在其他实施例中,装置50还可以包括诸 如例如蓝牙无线连接或USB/火线有线连接等任意合适的近距离通信解决方案。 装置50可以包括用于控制装置50的控制器56或处理器。控制器56可以连接到 存储器56,存储器56在本专利技术的实施例中可以存储图像形式的数据和音频数据二者和/或 还可以存储用于在控制器56上实现的指令。控制器56还可以连接到适合用于执行音频和 /或视频数据的编码和解码或者帮助由控制器56来执行的编码和解码的编解码器电路54。 装置50还可以包括读卡器48和智能卡46,例如用于提供用户信息并且适合用于 提供用于用户在网络处的认证和授权的认证信息的UICC和UICC阅读器。 装置50可以包括连接到控制器并且适当前第1页1 2 3 4 本文档来自技高网...
【技术保护点】
一种方法,包括:检测视频帧中的个人分段;从所述个人分段中提取用于若干特征类别的特征矢量集合;生成所提取的特征矢量集合的个人特征模型;向人物标识模型池传输所述个人特征模型。
【技术特征摘要】
【国外来华专利技术】
【专利技术属性】
技术研发人员:汪孔桥,李江伟,徐磊,J·于奥帕尼米,
申请(专利权)人:诺基亚技术有限公司,
类型:发明
国别省市:芬兰;FI
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。