面向跨媒体新闻检索的人脸-人名对齐方法及系统技术方案

技术编号：7662622 阅读：298 留言：0更新日期：2012-08-09 07:10

本发明专利技术属于跨媒体信息检索技术领域，具体为跨媒体新闻检索中基于图像特征和文本语义的人脸-人名对齐方法与系统。本发明专利技术包括四个主要算法：人名重要性评估算法、基于Web挖掘的多模态信息发现算法、人脸集内聚度度量算法和多模态对齐组合优化算法。本发明专利技术使用相关的图像特征和文本语义处理方法，同时建立相关数学模型，对新闻图像搜索进行优化，包括通过多级别深层次的文本语义分析，有效的人脸-人名对齐评估机制，具有问题针对性的组合优化。本发明专利技术对于在大规模且多样性新闻图像基础上，考虑图像高层语义信息而进行高效图像检索具有非常重要的意义，能够提高检索相关性，增强用户体验，在跨媒体信息检索领域具有广泛的应用价值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于跨媒体信息检索
，具体涉及一种特定媒体一多模态新闻跨媒体检索方法及系统。
技术介绍
随着网络的普及和图像设备的大众化，迅速增强的数字采集技术与存储交付能力导致在线和离线的图像数据呈爆炸性扩增，尤其是那些带有文本标注的新闻图像资源。正因为此类信息的来源越来越丰富，使得针对新闻图像资源实施更加有效的检索、组织和分析变得非常重要。一方面，由于新闻图像及其对应的文本标注通常是以人为主题进行描述，因此这使得用户通过使用一个完善有效的检索系统来查询一个特定人的相关新闻图像成为更为紧迫的一种需求3]。而当前仅仅主要利用文本检索方式进行相应处理，即简单利用伴随新闻图像一同出现的文本标注信息与查询人名的字符匹配情况进行人脸图像返回，其所返回的检索结果中通常包含很多与该查询人名无关的人脸图像，其检索性能并不理想。因此，为尽可能检索出关于某个特定人对应的正确新闻图像资源，有必要从文本语义级别深层次分析包含该特定检索人名的文本标注的语义信息，并融合与该文本标注相对应图像的视觉信息(特别是人脸视觉信息)来提高检索性能。另一方面，由于此类多模态新闻图像信息已经越来越广泛地被应用到各种研究和工程中，利用具有明确语义信息的图像数据作为数据分析源及用于其它相关用途，因此很有必要将多模态信息所对应的底层视觉特征与高层语义特征相关联，挖掘出二者之间的相互关联关系。而当前主要通过人工标注的方式来定义和描述具有特定底层视觉特征的图像数据所对应的相关语义信息，但人工标注的方式需要耗费非常大的时间代价。同时，由于标注过程带有明显的人为主观性，可能在一定程度上导致视觉特征和语义特...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：张玥杰，吴伟，金城，薛向阳，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人