本申请适用于计算机技术领域,提供了一种文件匹配方法、装置、电子设备和计算机可读存储介质。其中,上述文件匹配方法包括:分别获取待匹配的两个文件的指纹信息,所述指纹信息用于通过不同的标识描述对应文件中不同文件内容的分布情况;对所述两个文件的指纹信息进行比对,得到每种标识的匹配结果;根据所述匹配结果,确定所述两个文件之间文件内容的匹配分数。本申请的实施例可以提高文件匹配的准确性。性。性。
【技术实现步骤摘要】
文件匹配方法、装置、电子设备和计算机可读存储介质
[0001]本申请属于计算机
,尤其涉及一种文件匹配方法、装置、电子设备和计算机可读存储介质。
技术介绍
[0002]文件匹配是指对相关联的两个文件进行匹配,例如将字幕文件与音频、视频等文件进行匹配。
[0003]相关技术中,文件匹配通常是通过文件的名称、时长等属性信息进行匹配。一些情况下,用户可以对文件的属性信息进行更改,导致文件匹配时准确性较低。
技术实现思路
[0004]本申请实施例提供一种文件匹配方法、装置、电子设备和计算机可读存储介质,可以解决相关技术中文件匹配时准确性较低的问题。
[0005]本申请实施例第一方面提供一种文件匹配方法,包括:分别获取待匹配的两个文件的指纹信息,所述指纹信息用于通过不同的标识描述对应文件中不同文件内容的分布情况;对所述两个文件的指纹信息进行比对,得到每种标识的匹配结果;根据所述匹配结果,确定所述两个文件之间文件内容的匹配分数。
[0006]本申请实施例第二方面提供的一种文件匹配装置,包括:获取单元,用于分别获取待匹配的两个文件的指纹信息,所述指纹信息用于通过不同的标识描述对应文件中不同文件内容的分布情况;比对单元,用于对所述两个文件的指纹信息进行比对,得到每种标识的匹配结果;确定单元,用于根据所述匹配结果,确定所述两个文件之间文件内容的匹配分数。
[0007]本申请实施例第三方面提供一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述文件匹配方法的步骤。
[0008]本申请实施例第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述文件匹配方法的步骤。
[0009]本申请实施例第五方面提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述第一方面中所述的文件匹配方法。
[0010]在本申请的实施方式中,通过分别获取待匹配的两个文件的指纹信息,其中,指纹信息用于通过不同的标识描述对应文件中不同文件内容的分布情况,然后,对两个文件的指纹信息进行比对,得到每种标识的匹配结果,并根据匹配结果,确定两个文件之间文件内容的匹配分数,使得文件匹配可以根据不同文件内容的分布情况确定匹配分数,对于文件内容相同而属性信息不同的文件,或者文件内容不同而属性信息相同的文件,匹配分数都可以更准确地反映两个文件之间的匹配程度,因此可以提高文件匹配时的准确性。
附图说明
[0011]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0012]图1是本申请实施例提供的一种文件匹配方法的实现流程示意图;
[0013]图2是本申请实施例提供的一种字幕指纹的生成方法的具体实现流程示意图;
[0014]图3是本申请实施例提供的步骤S203的具体实现流程示意图;
[0015]图4是本申请实施例提供的更新标识的具体实现流程示意图;
[0016]图5是本申请实施例提供的一种音频指纹的生成方法的具体实现流程示意图;
[0017]图6是本申请实施例提供的人声分离的具体实现流程示意图;
[0018]图7是本申请实施例提供的进行采样点和时间段的匹配的具体实现流程示意图;
[0019]图8是本申请实施例提供的根据每个采样点的振幅,确定目标时间段的具体实现流程示意图;
[0020]图9是本申请实施例提供的步骤S103的具体实现流程示意图;
[0021]图10是本申请实施例提供的调整匹配分数的第一具体流程示意图;
[0022]图11是本申请实施例提供的调整匹配分数的第二具体流程示意图;
[0023]图12是本申请实施例提供的一种文件匹配装置的结构示意图;
[0024]图13是本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0025]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护。
[0026]相关技术中,文件匹配通常是通过文件的名称、时长等属性信息进行匹配。一些情况下,用户可以对文件的属性信息进行更改,导致容易将文件内容相同而属性信息不同的文件确认为不关联的文件,或者将文件内容不同而属性信息相同的文件确认为相关联的文件,文件匹配时准确性较低。
[0027]鉴于此,本申请提出一种文件匹配方法,能够可以根据不同文件内容的分布情况确定匹配分数,使得匹配分数都可以更准确地反映两个文件之间的匹配程度,能够提高文件匹配时的准确性。
[0028]为了说明本申请的技术方案,下面通过具体实施例来进行说明。
[0029]图1示出了本申请实施例提供的一种文件匹配方法的实现流程示意图,该方法可以应用于电子设备上,可适用于需提高将文件匹配时的准确性的情形。
[0030]在本申请的实施方式中,上述电子设备可以为计算机、手机、车载设备、音视频播放设备(或称为播放器)等智能设备,对此本申请不做限制。
[0031]具体的,上述文件匹配方法可以包括以下步骤S101至步骤S103。
[0032]步骤S101,分别获取待匹配的两个文件的指纹信息。
[0033]其中,待匹配的两个文件是指需要进行文件匹配的两个文件。在本申请的实施方式中,上述两个文件可以为相同类型或不同类型的文件,具体可以为视频文件、音频文件、字幕文件等,对此本申请不做限制。
[0034]具体的,电子设备可以将用户在电子设备上选中的两个文件作为待匹配的两个文件。电子设备也可以将特定文件作为其中一个文件,并将多个候选文件依次作为另一个文件,从而为特定文件匹配相关联的文件。例如,可以将视频文件作为其中一个文件,将多个字幕文件依次作为另一个文件,从而在多个字幕文件中为视频文件匹配相关联的字幕文件。对此本申请不做限制。
[0035]应理解,每个文件可以包括不同的文件内容,例如,字幕文件可以包括字幕部分和非字幕部分,视频文件和音频文件可以包括人声部分和背景声(非人声)部分。在本申请的实施方式中,指纹信息可用于通过不同的标识描述对应文件中不同文件内容的分布情况。
[0036]具体而言,若两个文件中包括字幕文件,指纹信息可用于通过不同的标识描述字幕文件中字幕部分与非字幕部分的分布情况。若两个文件中包括音视频文件时,指纹信息用于通过不同的标识描述所述音视频文件中人声部分与背景声部分的分布情况。
[0037]其中,上述本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种文件匹配方法,其特征在于,包括:分别获取待匹配的两个文件的指纹信息,所述指纹信息用于通过不同的标识描述对应文件中不同文件内容的分布情况;对所述两个文件的指纹信息进行比对,得到每种标识的匹配结果;根据所述匹配结果,确定所述两个文件之间文件内容的匹配分数。2.如权利要求1所述的文件匹配方法,其特征在于,所述根据所述匹配结果,确定所述两个文件之间文件内容的匹配分数,包括:根据所述两个文件的指纹信息,确定每个文件的少数因子,所述少数因子为对应文件中文件内容占比低于占比阈值的文件内容的标识;获取每种标识分别对应的默认权重;若所述两个文件的少数因子相同,则增大所述少数因子的默认权重,得到所述少数因子的融合权重;根据所述融合权重,对所述匹配结果进行加权融合,得到所述匹配分数。3.如权利要求2所述的文件匹配方法,其特征在于,在所述根据所述融合权重,对所述匹配结果进行加权融合,得到所述匹配分数之后,还包括:计算所述两个文件中指纹信息的总长度之间的第一比值;根据所述第一比值,对所述匹配分数进行调整。4.如权利要求2所述的文件匹配方法,其特征在于,在所述根据所述融合权重,对所述匹配结果进行加权融合,得到所述匹配分数之后,还包括:获取所述两个文件的指纹信息中跳变沿的出现频率,所述跳变沿表示所述指纹信息内相邻的标识为不同标识;若所述出现频率低于频率阈值,则计算所述出现频率与所述频率阈值的第二比值;根据所述第二比值,对所述匹配分数进行调整。5.如权利要求2所述的文件匹配方法,其特征在于,在所述根据所述两个文件的指纹信息,确定每个文件的少数因子之后,所述文件匹配方法还包括:若所述两个文件的少数因子不相同,则将所述默认权重作为所述融合权重;根据所述融合权重,对所述匹配结果进行加权融合,得到所述匹配分数。...
【专利技术属性】
技术研发人员:苑鹏飞,邓志明,
申请(专利权)人:迅雷计算机深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。