电子水印嵌入装置、电子水印嵌入方法及计算机可读记录介质制造方法及图纸

技术编号:12778087 阅读:132 留言:0更新日期:2016-01-27 20:32
本发明专利技术的电子水印嵌入装置具备:合成声音生成部,其按照所输入的文本,输出合成声音和合成声音所包含的音素的时刻信息;推定部,其推定在上述所输入的文本中是否包含潜在风险表达,输出被推定为包含上述潜在风险表达的潜在风险区间;嵌入控制部,其通过使上述潜在风险区间与上述时刻信息相对应,来确定并输出上述合成声音中的电子水印的嵌入时刻;以及嵌入部,其对上述合成声音,在由上述合成声音的上述嵌入时刻指定的时刻嵌入电子水印。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术的实施方式设及电子水印嵌入装置、电子水印嵌入方法及电子水印嵌入程 序。
技术介绍
用近年的声音信号处理技术可W合成各种声音,例如通过合成后的声音,产生了 使用熟人声音的假冒和/或名人声音的非法利用等危险性。另外,由于能够容易地生成与 他人相似的声音(相似声),未来也无法否定使用熟人声音的假冒欺诈和/或非法利用名人 声音的名誉损害等犯罪行为增加的可能性。为了防止运些犯罪于未然,开发了通过在合成 音嵌入电子水印来与真人发声区别、检测合成音的非法利用的技术。 专利文献1 :日本专利第3812848号公报 专利文献2:日本特开平11-85766号公报 另外,在使用声音合成技术作成相似声的媒体内容中包含W歧视用语和/或源褒 表达为代表的禁止播放表达或者联想到犯罪的表达等的情况下,若误使用该内容,则有可 能发展为相似声本人的信用问题。因而,在可W生成运样的合成声音的装置中,需要在包含 禁止播放用语等的情况下边保持声音的品质边嵌入能够高精度地检测的电子水印的功能, 但是并未研究出有效的方法。
技术实现思路
本专利技术的实施方式是鉴于上述而提出的,其目的在于提供可W抑制声音的品质降 低并且嵌入检测精度高的电子水印的电子水印嵌入装置。 为了解决上述问题,达到目的,本专利技术的实施方式具备:合成声音生成部,其按照 所输入的文本,输出合成声音和合成声音所包含的音素的时刻信息;推定部,其推定在上述 所输入的文本中是否包含潜在风险表达,输出被推定为包含上述潜在风险表达的潜在风险 区间;嵌入控制部,其通过使上述潜在风险区间与上述时刻信息相对应,来确定并输出上述 合成声音中的电子水印的嵌入时刻;W及嵌入部,其对上述合成声音,在由上述合成声音的 上述嵌入时刻指定的时刻的特定的频带嵌入电子水印。【附图说明】 图1是表示第1实施方式的电子水印嵌入装置的功能构成的方框图。 图2是表示第1实施方式的加入水印声音生成部的详细构成的方框图。 图3是说明第1实施方式的加入水印声音生成部中的水印的嵌入方法的图。 图4是表示第2实施方式的电子水印嵌入装置的功能构成的方框图。 图5是表示第3实施方式的电子水印嵌入装置的功能构成的方框图。 图6是表示第4实施方式的电子水印嵌入装置的功能构成的方框图。 图7是表示各实施方式的电子水印嵌入装置的硬件构成的方框图。【具体实施方式】 阳〇1引(第1实施方式)W下,参照【附图说明】电子水印嵌入装置的实施方式。图1是表示电子水印嵌入装 置的功能构成的方框图。如图1所示,电子水印嵌入装置1具备推定部101、合成声音生成 部102、嵌入控制部103和加入水印声音生成部104。电子水印嵌入装置1输入包含文字信 息的输入文本10,输出嵌入了电子水印的合成声音17。推定部101从外部取得输入文本 10。W下,所谓"潜在风险区间",定义为使用"潜在风险表达"的声音区间,将满足下述的单 词、表达、语境定义为"潜在风险表达"。 ·W歧视用语和/或源褒表达为代表的不适于播放的单词、表达、语境 ?联想到假冒欺诈等犯罪和/或其计划的单词、表达、语境 ?有可能与他人的名誉损害有关的单词、表达、语境 推定部101根据输入文本10判定潜在风险区间,确定该区间的危险度。但是,输 入文本10也可W是将通过进行文本分析而获得的韵律信息用文本形式表达出来的中间语 言信息。在潜在风险区间的判定中,例如考虑W下的方法。 ?预先存储列举了潜在风险表达的列表,检索在输入文本10是否包含列表中的表 达的方法 ?预先存储列举了潜在风险表达的列表,检索在进行了语素分析的输入文本10是 否包含列表中的表达的方法 阳02引 ?学习包含潜在风险表达的单词排列(N-gram)的出现概率,对输入文本10的单词 排列使用似然进行判定的方法 ?在推定部101使用判断输入文本10是否可成为潜在风险表达的意图理解模块进 行判定的方法 阳0巧]在潜在风险区间的危险度的确定中,如W下所例示可有各种方法。 阳0%] ?对在列举了潜在风险表达的列表中列举的各潜在风险表达分配危险度,计算输 入文本10中与列表一致的潜在风险表达的危险度的方法 ?通过使包含潜在风险表达的各单词排列(N-gram)与危险度对应,对输入文本10 中出现的潜在风险表达分配危险度的方法 ?在意图理解模块中,通过使危险度与可成为潜在风险表达的各语境对应,在输入 文本10可成为潜在风险表达的情况下,对该语境分配危险度的方法 推定部101将潜在风险区间11及潜在风险表达的危险度12向嵌入控制部103输 出。 合成声音生成部102从外部取得输入文本10。合成声音生成部102从输入文本 10提取音素串、暂停、音拍(mora)数、重音等韵律信息,生成合成声音13。为了与嵌入电子 水印的时刻对应,需要各音素发声的时刻信息。因此,合成声音生成部102使用从输入文本 10提取的音素串、暂停、音拍数等输出音素时刻信息。合成声音生成部102向加入水印声音 生成部104输出合成声音13,向嵌入控制部103输出合成声音13的音素时刻信息14。 嵌入控制部103W从推定部101输出的潜在风险区间11、潜在风险表达的危险度 12和从合成声音生成部102输出的音素时刻信息14作为输入。嵌入控制部103将从推定 部101输出的潜在风险表达的危险度12改变为水印强度15。危险度12越高,水印强度15 设定得越高。水印强度具有如下特征:若水印强度大则噪声耐性和/或编解码器耐性提高、 水印的检测精度提高,另一方面人听到时会感觉到刺耳的声音。本实施方式的目的在于高 精度地检测在合成声音13中包含的若被滥用则危险度高的潜在风险表达。因此,优选即使 产生稍微的音质劣化也将水印强度设定得高。另外,也可W不基于危险度12来设定水印强 度15,而将包含潜在风险表达的区间的水印强度15 -律设定成高的值。 嵌入控制部103根据潜在风险区间11和音素时刻信息14,计算水印的嵌入时刻 16。所谓嵌入时刻16,指W水印强度15指定的强度嵌入前述的电子水印的时刻的信息。嵌 入控制部103将水印强度15和嵌入时刻16向加入水印声音生成部104输出。 加入水印声音生成部104W从合成声音生成部102输出的合成声音13、从嵌入控 制部103输出的水印强度15和嵌入时刻16作为输入。加入水印声音生成部104在由嵌入 时刻16指定的时刻,通过W水印强度15指定的强度对合成声音13嵌入电子水印,来生成 加入水印合成声音17。 W下,说明加入水印声音生成部104中的水印的嵌入方法。作为电子水印的嵌入 方法,需要满足W下2点条件: (1)是在加入水印合成声音17的生成时,可W在潜在风险区间内嵌入水印且检测 水印的方法 似是能够调整嵌入水印的强度的方法 参照图2说明能够实施满足上述2个条件的电子水印的嵌入方法的加入水印声音 生成部104的详细功能构成。如图2所示,加入水印声音生成部104具备提取部201、变换 应用部202、嵌入部203、逆变换应用部204和再合成部205。 提取部201从外部取得合成声音13。提取部201通过从合成声音13按单位时间 切出时间长2Τ(例如,2Τ= 64毫秒)的声音波形,来生成时刻(t)的单位声音帖21。另 夕F,在W后的说明中,时间长2T本文档来自技高网...

【技术保护点】
一种电子水印嵌入装置,其特征在于,具备:合成声音生成部,其按照所输入的文本,输出合成声音和合成声音所包含的音素的时刻信息;推定部,其推定在上述所输入的文本中是否包含潜在风险表达,输出被推定为包含上述潜在风险表达的潜在风险区间;嵌入控制部,其通过使上述潜在风险区间与上述时刻信息相对应,来确定并输出上述合成声音中的电子水印的嵌入时刻;以及嵌入部,其对上述合成声音,在由上述合成声音的上述嵌入时刻指定的时刻嵌入电子水印。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:中村匡伸森田真弘
申请(专利权)人:株式会社东芝
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1