版权检测方法技术

技术编号:39730431 阅读:13 留言:0更新日期:2023-12-17 23:34
本申请提供一种版权检测方法

【技术实现步骤摘要】
版权检测方法、装置、存储介质及电子设备


[0001]本申请涉及版权保护领域,具体而言,涉及一种版权检测方法

装置

存储介质及电子设备


技术介绍

[0002]以音频为特色的有声平台,通过让书本“开口说话”,成功打造创新型数字阅读空间有声图书馆;然而,伴随而来的问题是音频有声书版权侵权投诉的增加,为了保护版权持有者的权益,需要一种高效准确的方法来检测音频有声书中的版权侵权行为

[0003]目前主要将待检测音频的文本与不具有版权的黑样本进行匹配,从而确定待检测音频是否侵权

然而,实践过程中发现,存在一些具有版权的白样本,其内容与黑样本相似,这就导致容易将包含白样本内容的待检测音频误判为侵权


技术实现思路

[0004]为了克服现有技术中的至少一个不足,本申请提供一种版权检测方法

装置

存储介质及电子设备,具体包括:
[0005]第一方面,本申请提供一种版权检测方法,所述方法包括:
[0006]获取待检测音频;
[0007]计算所述待检测音频与黑白样本集中的黑样本以及每篇白样本之间的内容相似度,其中,所述黑样本表示不具有版权的文本,每篇白样本表示与所述黑样本的内容相似的文本;
[0008]根据所述待检测音频与黑白样本集中的黑样本以及每篇白样本之间的内容相似度,确定所述待检测音频对所述黑样本的侵权程度

[0009]结合第一方面的可选实施方式,所述根据所述待检测音频与黑白样本集中的黑样本以及每篇白样本之间的内容相似度,确定所述待检测音频对所述黑样本的侵权程度,包括:
[0010]若所述待检测音频与所述黑样本之间的内容相似度大于相似阈值,则获取所述待检测音频与每篇白样本之间的最大内容相似度;
[0011]若所述最大内容相似度大于或者等于所述待检测音频与所述黑样本之间的内容相似度,则确定所述待检测音频疑似侵犯所述黑样本的版权

[0012]结合第一方面的可选实施方式,所述根据所述待检测音频与黑白样本集中的黑样本以及每篇白样本之间的内容相似度,确定所述待检测音频对所述黑样本的侵权程度,包括:
[0013]若所述待检测音频与所述黑样本之间的内容相似度大于相似阈值,则获取所述待检测音频与每篇白样本之间的最大内容相似度;
[0014]若所述最大内容相似度小于所述待检测音频与所述黑样本之间的内容相似度,则确定所述待检测音频侵犯所述黑样本的版权

[0015]结合第一方面的可选实施方式,所述待检测音频为待检测专辑中的任意一条音频,所述方法还包括:
[0016]根据每条待检测音频与所述黑样本之间的内容相似度,得到所述待检测专辑与所述黑样本之间的第一综合相似度,其中,所述第一综合相似度表征所述待检测专辑整体上与所述黑样本之间的最大相似度;
[0017]对于每篇白样本,根据每条待检测音频与所述白样本之间的内容相似度,得到所述待检测专辑与所述白样本之间的第二综合相似度,其中,所述第二综合相似度表征所述待检测专辑整体上与所述白样本之间的最大相似度;
[0018]根据所述第一综合相似度以及所述待检测专辑与全部白样本之间的第二综合相似度,确定所述待检测专辑对所述黑样本的侵权程度

[0019]结合第一方面的可选实施方式,所述根据所述第一综合相似度与全部白样本对应的第二综合相似度,确定所述待检测专辑是否侵犯所述黑样本的版权,包括:
[0020]从所述待检测专辑与全部白样本对应的第二综合相似度中,确定出最大的目标综合相似度;
[0021]若所述第一综合相似度大于相似阈值,并且,所述目标综合相似度大于所述第一综合相似度,则确定所述待检测专辑疑似侵犯所述黑样本的版权

[0022]结合第一方面的可选实施方式,所述根据每条待检测音频与所述黑样本之间的内容相似度,得到所述待检测专辑与所述黑样本之间的第一综合相似度,包括:
[0023]将全部待检测音频与所述黑样本之间的内容相似度进行聚类,得到所述待检测专辑与所述黑样本之间的第一综合相似度

[0024]结合第一方面的可选实施方式,所述计算所述待检测音频与黑白样本集中的黑样本以及每篇白样本之间的内容相似度,包括:
[0025]获取所述待检测音频中的待检测文本;
[0026]调用预先训练的大语言模型对所述检测文本进行处理,得到所述待检测文本与黑白样本集中的黑样本以及每篇白样本之间的内容相似度,其中,所述预先训练的大语言模型通过所述黑样本与全部白样本进行训练获得

[0027]第二方面,本申请还提供一种版权检测装置,所述装置包括:
[0028]文本模块,用于获取待检测音频对应的待检测音频;
[0029]相似模块,用于计算所述待检测音频与黑白样本集中的黑样本以及每篇白样本之间的内容相似度,其中,所述黑样本表示不具有版权的文本,每篇白样本表示与所述黑样本的内容相似的文本;
[0030]侵权模块,用于根据所述待检测音频与黑白样本集中的黑样本以及每篇白样本之间的内容相似度,确定所述待检测音频对所述黑样本的侵权程度

[0031]结合第二方面的可选实施方式,所述侵权模块还具体用于:
[0032]若所述待检测音频与所述黑样本之间的内容相似度大于相似阈值,则获取所述待检测音频与每篇白样本之间的最大内容相似度;
[0033]若所述最大内容相似度大于或者等于所述待检测音频与所述黑样本之间的内容相似度,则确定所述待检测音频疑似侵犯所述黑样本的版权

[0034]结合第二方面的可选实施方式,所述侵权模块还具体用于:
[0035]若所述待检测音频与所述黑样本之间的内容相似度大于相似阈值,则获取所述待检测音频与每篇白样本之间的最大内容相似度;
[0036]若所述最大内容相似度小于所述待检测音频与所述黑样本之间的内容相似度,则确定所述待检测音频侵犯所述黑样本的版权

[0037]结合第二方面的可选实施方式,所述待检测音频为待检测专辑中的任意一条音频,所述侵权模块还具体用于:
[0038]根据每条待检测音频与所述黑样本之间的内容相似度,得到所述待检测专辑与所述黑样本之间的第一综合相似度;
[0039]对于每篇白样本,根据每条待检测音频与所述白样本之间的内容相似度,得到所述待检测专辑与所述白样本之间的第二综合相似度;
[0040]根据所述第一综合相似度以及所述待检测专辑与全部白样本之间的第二综合相似度,确定所述待检测专辑对所述黑样本的侵权程度

[0041]结合第二方面的可选实施方式,所述侵权模块还具体用于:
[0042]从所述待检测专辑与全部白样本对应的第二综合相似度中,确定出最大的目标综合相似度;
[0043]若所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种版权检测方法,其特征在于,所述方法包括:获取待检测音频;计算所述待检测音频与黑白样本集中的黑样本以及每篇白样本之间的内容相似度,其中,所述黑样本表示不具有版权的文本,每篇白样本表示与所述黑样本的内容相似的文本;根据所述待检测音频与黑白样本集中的黑样本以及每篇白样本之间的内容相似度,确定所述待检测音频对所述黑样本的侵权程度
。2.
根据权利要求1所述的版权检测方法,其特征在于,所述根据所述待检测音频与黑白样本集中的黑样本以及每篇白样本之间的内容相似度,确定所述待检测音频对所述黑样本的侵权程度,包括:若所述待检测音频与所述黑样本之间的内容相似度大于相似阈值,则获取所述待检测音频与每篇白样本之间的最大内容相似度;若所述最大内容相似度大于或者等于所述待检测音频与所述黑样本之间的内容相似度,则确定所述待检测音频疑似侵犯所述黑样本的版权
。3.
根据权利要求1所述的版权检测方法,其特征在于,所述根据所述待检测音频与黑白样本集中的黑样本以及每篇白样本之间的内容相似度,确定所述待检测音频对所述黑样本的侵权程度,包括:若所述待检测音频与所述黑样本之间的内容相似度大于相似阈值,则获取所述待检测音频与每篇白样本之间的最大内容相似度;若所述最大内容相似度小于所述待检测音频与所述黑样本之间的内容相似度,则确定所述待检测音频侵犯所述黑样本的版权
。4.
根据权利要求1所述的版权检测方法,其特征在于,所述待检测音频为待检测专辑中的任意一条音频,所述方法还包括:根据每条待检测音频与所述黑样本之间的内容相似度,得到所述待检测专辑与所述黑样本之间的第一综合相似度,其中,所述第一综合相似度表征所述待检测专辑整体上与所述黑样本之间的最大相似度;对于每篇白样本,根据每条待检测音频与所述白样本之间的内容相似度,得到所述待检测专辑与所述白样本之间的第二综合相似度,其中,所述第二综合相似度表征所述待检测专辑整体上与所述白样本之间的最大相似度;根据所述第一综合相似度以及所述待检测专辑与全部白样本之间的第二综合相似度,确定所述待检测专辑对所述黑样本的侵权程度
。5.
根据权利要求4...

【专利技术属性】
技术研发人员:余相君邬雨可娄向文罗欢刘蔺飞
申请(专利权)人:喜大上海网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1