一种基于相似性矩阵融合的音频数据检索方法技术

技术编号:9381842 阅读:203 留言:0更新日期:2013-11-28 00:13
本发明专利技术涉及一种基于相似性矩阵融合的音频数据检索方法,其特征在于:首先,计算不同种类音频数据特征的拉普拉斯矩阵;其次,计算不同种类音频数据拉普拉斯矩阵的特征值和特征向量,分别找出这些拉普拉斯矩阵中前M个最大特征值所对应的特征向量;第三,分别计算不同种类音频数据特征向量的相似性矩阵,将特征向量的相似性矩阵的对应元素相乘得到融合后的相似性矩阵,第四,对每个查询目标音频数据,利用融合后的相似性矩阵得到每个音频数据的分数,将音频数据按照分数从高到低排序,在前若干个排好序的音频数据中,统计其中与目标音频数据属于同一类别的音频数据数量,计算检索准确率。利用本发明专利技术方法,可以实现多种音频数据特征的融合检索,融合后的检索准确率比融合前有了大幅提高。

【技术实现步骤摘要】

【技术保护点】
一种基于相似性矩阵融合的音频数据检索方法,其特征在于步骤如下:步骤1:利用计算N个音频数据的特征X1,X2,...,XN的相似性矩阵W1;利用计算N个音频数据的特征Y1,Y2,...,YN的相似性矩阵W2;其中,X1,X2,...,XN表示第1、2和N个音频数据的第一种特征;Y1,Y2,...,YN表示第1、2和N个音频数据的第二种特征;表示矩阵W1第i行和第j列的元素;i=1,2,...,N,j=1,2,...,N,N>0;σ>0为常数;Xi,Xj表示第i个和第j个音频数据的第一种特征;上标T表示向量转置;表示矩阵W2第i行和第j列的元素;Yi,Yj表示第i个和第j个音频数据的第二种特征;步骤2:利用计算W1的拉普拉斯矩阵L1,利用计算W2的拉普拉斯矩阵L2;其中,D1表示对角线矩阵,其元素di,j1=Σt=1Nwi,t1i=j0i≠j;t=1,2,...,N;表示矩阵W1的第i行第t列的元素;D2表示对角线矩阵,其元素di,j2=Σt=1Nwi,t2i=j0i≠j;t=1,2,...,N;表示矩阵W2的第i行第t列的元素;步骤3:计算拉普拉斯矩阵L1和L2的特征值和特征向量,选取前M个最大特征值所对应的特征向量U1,U2,...,UM和V1,V2,...,VM;其中,M≥1表示常数;U1,U2,...,UM表示属于L1的大小为N×1的特征向量;V1,V2,...,VM表示属于L2的大小为N×1的特征向量;步骤4:构造矩阵P=[U1?U2...UM]和Q=[V1?V2...VM];计算[K1?K2...KN]T和[L1?L2...LN]T的相似性矩阵S1和S2,S1的元素计算公式为S2的元素计算公式为si,j2=exp(Li-Lj)T×(Li-Lj)σ2;其中,K1,K2,...,KN表示矩阵P的第1,2,...,N行元素;L1,L2,...,LN表示矩阵Q的第1,2,...,N行元素;表示矩阵S1第i行和第j列的元素;表示矩阵S2第i行和第j列 的元素;步骤5:将相似性矩阵S1和S2的对应元素相乘得到融合后的相似性矩阵S;步骤6:利用公式r=β(I?λS)?1T计算N个音频数据检索的分数向量r,并将N个音频数据按照分数大小从高到低排列,得到排序后的N个音频数据;其中,r=(r1,r2,...,rN)表示N个音频数据利用融合后的相似性矩阵进行检索的得分向量,r1,r2,...,rN表示第1,2,...,N个音频数据的得分;β=1?λ表示常数;λ>0表示常数;T=[t1,...,tN]T表示检索时的查询向量,ti=1表示第i个音频数据为所要查找的目标音频数据,否则ti=0。FDA00003609522300011.jpg,FDA00003609522300012.jpg,FDA00003609522300013.jpg,FDA00003609522300014.jpg,FDA00003609522300015.jpg,FDA00003609522300016.jpg,FDA00003609522300018.jpg,FDA000036095223000110.jpg,FDA000036095223000111.jpg,FDA000036095223000113.jpg,FDA000036095223000114.jpg...

【技术特征摘要】

【专利技术属性】
技术研发人员:韩军伟吉祥郭雷胡新韬
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1