一种基于特征码的多媒体文件身份识别方法技术

技术编号:24995687 阅读:26 留言:0更新日期:2020-07-24 17:58
本发明专利技术公开了本发明专利技术提供一种基于特征码的多媒体文件身份识别方法,包括如下步骤:一、客户端采集原始多媒体文件并发起识别请求;二、处理器接收到来自于客户端的多媒体文件识别请求,并对多媒体文件的格式进行识别;三,图片、音频以及视频文件的特征点检测提取;四、客户端采集用于匹配的多媒体文件向处理器发起请求;五、处理器接收请求并对该匹配的多媒体文件执行步骤二和步骤三;六、处理器比对原始多媒体文件和匹配多媒体文件的特征点,并计算匹配度,将结果反馈给客户端。本发明专利技术方法效率高,将复杂的多媒体比对简化为简单的稳定特征码比对,缩减人为或机器比对的时间。

【技术实现步骤摘要】
一种基于特征码的多媒体文件身份识别方法
本专利技术涉及多媒体文件识别领域,具体涉及一种基于特征码的多媒体文件身份识别方法。
技术介绍
互联网多媒体文件包括图片、文字、声音、视频等,由于其以数字编码形式存在于网络载体上,所以复制传播变得十分简单,迅速。而在传播过程中产生出了越来越多的侵权纠纷,因此如何防范侵权案例的发生,如果做到快速鉴别侵权行为,就是在现有技术的基础上所要解决的问题。众所周知,不论是即时通信工具(如微信)还是信息交互式网站(如微博),都无法从根本上杜绝图片侵权行为的发生源头。毕竟多媒体文件数据量巨大,在侵权发生前不能做到有效的一一比对并告知侵权风险。传统多媒体需要大量的存储空间,成本巨高,而且文件分布在网络各个角落,导致比对时间周期非常长。
技术实现思路
本专利技术要解决的技术问题是提供一种效率高,能将复杂的多媒体文件比对简化为简单的稳定特征码的比对,能缩短人为或机器比对的时间的基于特征码的多媒体文件身份识别方法。为了解决上述技术问题,本专利技术采用以下技术方案:本专利技术提供一种基于特征码的多媒体文件身份识别方法,包括如下步骤:一、客户端采集原始多媒体文件并发起识别请求;二、处理器接收到来自于客户端的多媒体文件识别请求,并对多媒体文件的格式进行识别;(1)若得出识别的多媒体文件格式为图片文件,则进行以下操作;若是该多媒体图片文件为彩色图像,将对其进行灰度化处理:对灰度化处理后的多媒体图片文件进行图像滤波处理;<br>对该多媒体图片文件进行文件结构分析及形状描述;对该多媒体图片文件进行图片特征点检测及提取;(2)若得出识别的多媒体文件格式为音频文件,则进行以下操作:对该多媒体音频文件进行音频滤波处理;对该多媒体音频文件进行音频特征点检测及提取;(3)若得出识别的多媒体文件格式为视频文件,则进行以下操作对该多媒体视频文件进行画面提取;提取该多媒体视频文件中对应的图片文件和音频文件提取;对提取到的图片文件执行步骤(1);对提取到的音频文件执行步骤(2);整合上述步骤中提取到的图片特征点和音频特征点;三、客户端采集用于匹配的多媒体文件向处理器发起请求;四、处理器接收请求并对该匹配的多媒体文件执行步骤二;五、处理器比对原始多媒体文件和匹配多媒体文件的特征点,并计算匹配度,将结果反馈给客户端;所述步骤(1)中图片特征点检测及提取包括以下步骤:a1、通过微分函数识别不受光照、尺度变化而改变的极值点,该极值点为候选特征点;a2、通过拟合判别在候选特征点的基础上过滤掉稳定性较差的候选特征点;a3、给选出的特征点分配多个向量方向;a4、根据分配的向量方向在每个确定的特征点的邻域内计算出旋转不变特性;所述步骤(2)中音频特征点检测及提取包括以下步骤:b1、取声音的能量值随时间改变的幅度,然后对幅度取平方即可得到短时能量,作为音频文件的一个特性;b2、计算每帧内音频信号穿过零值的次数,即短时过零率作为音频文件的第二个特性;b3、计算信号的关联程度,即短时自相关函数作为音频文件的第三个特性。进一步的,所述步骤二中多媒体文件识别通过采集文件头识别文件格式,图片文件包括jpg、png、tif、bmp等文件头;音频文件包括wav、flac、ape、alac、cda、mp3、aac等文件头;视频文件包括rm、rmvb、mpeg1-4、mov、mtv、dat、wmv、avi等文件头。进一步的,所述步骤(1)中图片灰度化处理是将彩色图像的R、G、B三个分量的像素值相等,且像素值最大为255,最小为0,使得彩色图像转化为灰色图像。进一步的,所述步骤(1)中图像滤波处理采用非线性的滤波,增强图像,且结合图像的空间邻近度和像素值相似度进行折中处理,同时考虑空域信息和灰度相似性。进一步的,所述步骤(1)中图片文件结构分析及形状描述采用二值图像检索轮廓,且非零像素作为1处理,零像素保存不变。进一步的,所述步骤(2)中音频滤波处理采用线性相位特性滤波器设计;对不同频率的正弦波所产生的相移和正弦波的频率描述成直线关系,且在滤波器通道内的信号通过滤波器后,除了由相移特性的斜率决定的延时外,可以不失真地保留通带内的全部信号。进一步的,所述步骤a1具体包括如下步骤:c1、通过高斯尺度空间来表示多尺度,且一张图像的高斯尺度空间可以由其和不同的高斯卷积得到:L(x,yσ)=G(x,y,σ)*I(x,y)其中x和y分别为样本点,б为尺度空间参数,L(x,y,б)为高斯尺度空间,G(x,y,б)为高斯核函数:尺度空间参数通过高斯正态分布函数的标准差得到,该值越大得到的尺度就越大;为了减少计算量,系统根据图像的大小对大图选择差分高斯来计算:D(x,y,σ)=L(x,y,kσ)-L(x,y,σ)对图像的每层进行高斯计算,计算完成后按照从大到小,从下到上的原则排列;c2、然后将相邻的排列进行相减得到响应图像;c3、遍历响应图像空间上的每个点,将这个点与它所在的相邻点进行比较,只有当点的灰度值大于或者小于所有领域点灰度值时才可以确定该点为特征点;进一步的,所述步骤b1中短时能量的计算为:其中n表示点,x(n)为音频信号,w(n)为窗函数,STE为短时能量计算的结果值。进一步的,所述步骤b2中短时过零率的计算为:其中x(n)为音频信号,sgn[]为符号函数,ZCR为短时过零率计算的结果值。进一步的,所述步骤b3中短时自相关函数的计算为:其中,xi(n)表示音频信号的第i帧,L表示音频信号分帧后每帧的长度,K为延迟量,STAF为短时自相关函数计算的结果值。本专利技术的有益效果在于:1、本专利技术方法效率高,将复杂的多媒体比对简化为简单的稳定特征码比对,缩减人为或机器比对的时间。2、本专利技术方法应用广,稳定特征码的比对不仅可应用于多媒体侵权,亦可应用于互联网健康发展和国防安全,如:反动图片、视频和言论等。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例中多媒体文件身份识别方法流程图。具体实施方式为了更好地阐述该专利技术的内容,下面通过具体实施例对本专利技术进一步的验证。特在此说明,实施例只是为更直接地描述本专利技术,它们只是本专利技术的一部分,不能对本专利技术构成任何限制。如图1所示,本专利技术实施例提供一种基于特征码的多媒体文件身份识别方法,包括如下步骤:一、客户端采本文档来自技高网...

【技术保护点】
1.一种基于特征码的多媒体文件身份识别方法,其特征在于,包括如下步骤:/n一、客户端采集原始多媒体文件并发起识别请求;/n二、处理器接收到来自于客户端的多媒体文件识别请求,并对多媒体文件的格式进行识别;/n(1)若得出识别的多媒体文件格式为图片文件,则进行以下操作;/n若是该多媒体图片文件为彩色图像,将对其进行灰度化处理:/n对灰度化处理后的多媒体图片文件进行图像滤波处理;/n对该多媒体图片文件进行文件结构分析及形状描述;/n对该多媒体图片文件进行图片特征点检测及提取;/n(2)若得出识别的多媒体文件格式为音频文件,则进行以下操作:/n对该多媒体音频文件进行音频滤波处理;/n对该多媒体音频文件进行音频特征点检测及提取;/n(3)若得出识别的多媒体文件格式为视频文件,则进行以下操作/n对该多媒体视频文件进行画面提取;/n提取该多媒体视频文件中对应的图片文件和音频文件提取;/n对提取到的图片文件执行步骤(1);/n对提取到的音频文件执行步骤(2);/n整合上述步骤中提取到的图片特征点和音频特征点;/n三、客户端采集用于匹配的多媒体文件向处理器发起请求;/n四、处理器接收请求并对该匹配的多媒体文件执行步骤二;/n五、处理器比对原始多媒体文件和匹配多媒体文件的特征点,并计算匹配度,将结果反馈给客户端;/n所述步骤(1)中图片特征点检测及提取包括以下步骤:/na1、通过微分函数识别不受光照、尺度变化而改变的极值点,该极值点为候选特征点;/na2、通过拟合判别在候选特征点的基础上过滤掉稳定性较差的候选特征点;/na3、给选出的特征点分配若干向量方向;/na4、根据分配的向量方向在每个确定的特征点的邻域内计算出旋转不变特性;/n所述步骤(2)中音频特征点检测及提取包括以下步骤:/nb1、取声音的能量值随时间改变的幅度,然后对幅度取平方即可得到短时能量,作为音频文件的一个特性;/nb2、计算每帧内音频信号穿过零值的次数,即短时过零率作为音频文件的第二个特性;/nb3、计算信号的关联程度,即短时自相关函数作为音频文件的第三个特性。/n...

【技术特征摘要】
1.一种基于特征码的多媒体文件身份识别方法,其特征在于,包括如下步骤:
一、客户端采集原始多媒体文件并发起识别请求;
二、处理器接收到来自于客户端的多媒体文件识别请求,并对多媒体文件的格式进行识别;
(1)若得出识别的多媒体文件格式为图片文件,则进行以下操作;
若是该多媒体图片文件为彩色图像,将对其进行灰度化处理:
对灰度化处理后的多媒体图片文件进行图像滤波处理;
对该多媒体图片文件进行文件结构分析及形状描述;
对该多媒体图片文件进行图片特征点检测及提取;
(2)若得出识别的多媒体文件格式为音频文件,则进行以下操作:
对该多媒体音频文件进行音频滤波处理;
对该多媒体音频文件进行音频特征点检测及提取;
(3)若得出识别的多媒体文件格式为视频文件,则进行以下操作
对该多媒体视频文件进行画面提取;
提取该多媒体视频文件中对应的图片文件和音频文件提取;
对提取到的图片文件执行步骤(1);
对提取到的音频文件执行步骤(2);
整合上述步骤中提取到的图片特征点和音频特征点;
三、客户端采集用于匹配的多媒体文件向处理器发起请求;
四、处理器接收请求并对该匹配的多媒体文件执行步骤二;
五、处理器比对原始多媒体文件和匹配多媒体文件的特征点,并计算匹配度,将结果反馈给客户端;
所述步骤(1)中图片特征点检测及提取包括以下步骤:
a1、通过微分函数识别不受光照、尺度变化而改变的极值点,该极值点为候选特征点;
a2、通过拟合判别在候选特征点的基础上过滤掉稳定性较差的候选特征点;
a3、给选出的特征点分配若干向量方向;
a4、根据分配的向量方向在每个确定的特征点的邻域内计算出旋转不变特性;
所述步骤(2)中音频特征点检测及提取包括以下步骤:
b1、取声音的能量值随时间改变的幅度,然后对幅度取平方即可得到短时能量,作为音频文件的一个特性;
b2、计算每帧内音频信号穿过零值的次数,即短时过零率作为音频文件的第二个特性;
b3、计算信号的关联程度,即短时自相关函数作为音频文件的第三个特性。


2.根据权利要求1所述的基于特征码的多媒体文件身份识别方法,其特征在于,所述步骤二中多媒体文件识别通过采集文件头识别文件格式。


3.根据权利要求1所述的基于特征码的多媒体文件身份识别方法,其特征在于,所述步骤(1)中图片灰度化处理是将彩色图像的R、G、B三个分量的像素值相等,且像素值最大为255,最小为0,即将彩色图像转化为灰色图像。


4.根据权利要求1所述的基于特征码的多媒体文件身份识别方法,其特征在于,所述步骤(1)中图像...

【专利技术属性】
技术研发人员:罗尉
申请(专利权)人:湖南搜云网络科技股份有限公司
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1