System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于多媒体信息处理中的图文匹配领域,具体涉及一种面向单类别低信息量数据的图文匹配方法。
技术介绍
1、在多媒体信息处理领域,图像和文本是广泛使用且易于获取的数据模态类型,以往的匹配方法大多针对单一模态,如文本-文本匹配,图像-图像匹配。随着大数据时代的来临,单一模态的匹配已经不能满足用户的需求,多模态匹配(图像-文本、音频-视频等)应运而生。考虑到环境、设备等原因,样本采集过程中得到的数据可能不是特别完备,所收集的数据包含的信息量较低,这些低信息量的数据由于提供的特征并不充分,导致其特征判别能力的下降,进而影响图文匹配任务的准确率。另一方面,包含多类标签的图文数据由于提供了丰富的标记信息,有助于提高图文匹配任务的性能。然而,由于人工标记的困难,获取多类标签数据的代价较高,真实环境中往往仅能获取到单类别属性标签的图文数据,即每对图文样本仅包含一种类别属性,这也在标签层面导致了数据的低信息量。现有的图文匹配方法在这类数据上的表现欠佳,需要有效的新颖技术方法解决单类别低信息量数据的图文匹配问题。
技术实现思路
1、为了解决上述问题,本专利技术提供了一种面向单类别低信息量数据的图文匹配方法,所述方法包括步骤:
2、将数据集划分为训练集、测试集。
3、用高斯核函数对训练集、测试集的低信息量数据进行核化处理。
4、构造针对单类别低信息量数据图文匹配问题的目标函数和投影学习公式。
5、利用优化算法1优化目标函数,得到哈希码矩阵b。
...【技术保护点】
1.一种面向单类别低信息量数据的图文匹配方法,所述方法包括步骤:
2.根据权利要求1所述的一种面向单类别低信息量数据的图文匹配方法,其特征在于,将数据集划分为训练集和测试集。
3.根据权利要求1所述的一种面向单类别低信息量数据的图文匹配方法,其特征在于,将所述高斯核函数定义为:
4.根据权利要求1所述的一种面向单类别低信息量数据的图文匹配方法,其特征在于,所述目标函数为:
5.根据权利要求1所述的一种面向单类别低信息量数据的图文匹配方法,其特征在于,提出的优化算法1总结如下:
6.根据权利要求1所述的一种面向单类别低信息量数据的图文匹配方法,其特征在于,提出的优化算法2总结如下:
7.根据权利要求1所述的一种面向单类别低信息量数据的图文匹配方法,其特征在于,利用上述步骤得到的哈希码矩阵B和哈希投影矩阵H1、H2对测试集进行测试并计算图文匹配的平均准确率。
【技术特征摘要】
1.一种面向单类别低信息量数据的图文匹配方法,所述方法包括步骤:
2.根据权利要求1所述的一种面向单类别低信息量数据的图文匹配方法,其特征在于,将数据集划分为训练集和测试集。
3.根据权利要求1所述的一种面向单类别低信息量数据的图文匹配方法,其特征在于,将所述高斯核函数定义为:
4.根据权利要求1所述的一种面向单类别低信息量数据的图文匹配方法,其特征在于,所述目标函数为:
...【专利技术属性】
技术研发人员:李骜,谢委衡,邵春锐,许浩越,程媛,杨海陆,
申请(专利权)人:哈尔滨理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。