声音合成装置制造方法及图纸

技术编号:4123498 阅读:173 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供能以用户所期待的读音及声调输出声音的声音合成装置。该声音合成装置包括:声调词典(11),该声调词典(11)将用于记述语言的记述信息及表示读法的读音信息、与对该语言的读音的声调进行规定的声调信息相互对应来加以存储;声调词典检索部(12),该声调词典检索部(12)从声调词典中检索与从外部输入的记述信息及读音信息对应的声调信息,并获取附加该检索出的声调信息后的读音信息即带声调的读音信息;声音合成部(13),该声音合成部(13)根据由声调词典检索部获取到的带声调的读音信息来合成声音波形;及声音重放部(14),该声音重放部(14)根据由声音合成部合成后的声音波形来重放声音。

【技术实现步骤摘要】

本专利技术涉及例如在汽车导航装置等中输出引导声音等的声音合成装 置,特别是涉及对输出的声音的声调进行控制的技术。
技术介绍
以往,已知有被称为TTS(Text-to-Speech;文本声音转换)的技术,该 TTS推断日文的汉字和假名夹杂的和汉混淆文的读音和声调并进行朗读。 作为利用了该技术的装置,专利文献1披露了能够利用文本声音转换将接 收到的电子邮件正确无误地加以朗读的电子邮件终端装置。该电子邮件终端装置在个人信息适应变换部中,使用电子邮件的邮件 地址、和姓名等个人信息,对应于个人信息对接收到的电子邮件信息进行 修正,并添加补充信息。然后,在通报单元的文本声音转换部中,对该信 息加工后的电子邮件进行文本声音转换并加以通报。专利文献l:日本专利特开2001—325191号公报然而,在上述的现有技术中,例如对于"三田"这样的记述存在诸如"卄 ^夕',,或"S夕,,的多种读法的单词,并不一定能够如用户所期待的那样朗读, 有可能会发生误读。另一方面,为了防止误读,已知有使用仅由不包含声调信息的"读音" 构成的读音信息来进行朗读的方法,但根据该方法,存在如下问题,艮口, 朗读变得无声调而平坦,难以让人听懂。
技术实现思路
本专利技术是为了解决上述问题而完成的,提供一种能以用户所期待的读 音及声调输出声音的声音合成装置。为了解决上述问题,本专利技术的声音合成装置包括声调词典,该声调3词典将记述语言的记述信息及表示读法的读音信息、与对该语言的读音的 声调进行规定的声调信息相互对应来加以存储;声调词典检索部,该声调 词典检索部从声调词典中检索与从外部输入的记述信息及读音信息对应的 声调信息,并获取附加该检索出的声调信息后的读音信息即带声调的读音 信息;声音合成部,该声音合成部根据由声调词典检索部获取到的带声调的读音信息来合成声音波形;及声音重放部,该声音重放部根据由声音合 成部合成后的声音波形来重放声音。根据本专利技术的声音合成装置,由于采用如下结构,即,从声调词典中 读出与从外部输入的记述信息及读音信息对应的带声调的读音信息,根据 该读出的带声调的读音信息产生声音,因此不会发生误读,而且能以用户 所期待的声调输出声音,附图说明图1是表示本专利技术的实施方式1的声音合成装置的结构的方框图。图2是表示应用了本专利技术的实施方式1的声音合成装置的汽车导航装 置的结构的方框图。图3是表示应用了本专利技术的实施方式1的声音合成装置的汽车导航装 置中使用的登录地信息编辑画面的例子的图。图4是表示将本专利技术的实施方式1的声音合成装置应用于汽车导航装 置时的声调词典检索部中执行的处理的流程图。图5是用于说明应用了本专利技术的实施方式1的声音合成装置的汽车导 航装置的动作的图。图6是表示本专利技术的实施方式2的声音合成装置的结构的方框图。图7是表示应用了本专利技术的实施方式2的声音合成装置的汽车导航装 置的结构的方框图。图8是表示应用了本专利技术的实施方式2的声音合成装置的汽车导航装 置中使用的登录地信息编辑画面的例子的图。图9是表示将本专利技术的实施方式2的声音合成装置应用于汽车导航装 置时的声调词典检索部中执行的处理的流程图。4图10是用于说明应用了本专利技术的实施方式2的声音合成装置的汽车导航装置的动作的图。 标号说明1、 la声音合成装置,11声调词典,12、 12a声调词典检索部, 13 声音合成部,14声音重放部,15声调检索失败处理部具体实施方式下面,参照附图详细说明本专利技术的实施方式。 实施方式1.图1是表示本专利技术的实施方式1的声音合成装置1的结构的方框图。 该声音合成装置l包括声调词典11、声调词典检索部12、声音合成部13、 及声音重放部14。声调词典11将用于记述语言的记述信息及表示读法的读音信息、与对 该语言的读音的声调进行规定的声调信息相互对应来加以存储。声调词典 检索部12对该声调词典11进行访问。声调词典检索部12将从外部输入的记述信息及读音信息发送到声调词 典11,从声调词典11中检索与这些信息对应的声调信息,获取附加该检索 出的声调信息后的读音信息(以下称为"带声调的读音信息")。由该声调词典 检索部12获取到的带声调的读音信息被发送到声音合成部13。声音合成部13根据从声调词典检索部12发送来的带声调的读音信息 来合成声音波形。由该声音合成部B合成后的声音波形被发送到声音重放 部14。声音重放部14例如由扬声器构成,根据从声音合成部13发送来的声 音波形输出声音。图2是表示应用了本专利技术的实施方式1的声音合成装置1的汽车导航 装置的结构的方框图。该汽车导航装置包括声音合成装置1、登录地信息编 辑部21、及登录地引导处理部22。登录地信息编辑部21将如图3所示的登录地信息编辑画面输出到未图 示的显示装置。用户可使用该登录地信息编辑画面,输入登录地的记述和读音。图3示出输入"自宅,,作为登录地的记述、输入"y夕夕,,作为登录地的 读音的例子。登录地信息编辑部21将使用该登录地信息编辑画面输入的登 录地的记述及读音加以存储,以分别作为登录地的记述信息及读音信息。 该登录地信息编辑部21中存有的记述信息及读音信息被登录地引导处理部 22读出。登录地引导处理部22在检测出由从未图示的当前位置检测装置获取到 的当前位置数据所示的当前位置接近登录地的情况下,从登录地信息编辑 部21中读出与该登录地对应的记述信息及读音信息,发送到声音合成装置 1。由此,如上所述,在声音合成装置1中合成声音并加以输出。接着,参照图4所示的流程图及图2所示的汽车导航装置的方框图, 以声调词典检索部12中执行的处理为中心,说明应用于上述汽车导航装置 的实施方式1的声音合成装置1的动作。现假设利用登录地信息编辑部21的处理己登录如图3所示的登录地信 息。登录地引导处理部22在检测出接近登录地时,从登录地信息编辑部21 中,将作为该登录地的记述信息存有的"自宅"及作为读音信息存有的"7', 夕"加以读出,发送到声音合成装置1的声调词典检索部12。声调词典检索部12首先从登录地引导处理部22接受记述信息"自宅" 和读音信息"、 '夕夕,,(步骤STll)。接着,声调词典检索部12从声调词典U 中,检索与记述信息"自宅"及读音信息"y'夕,"对应的声调信息(步骤ST12)。 在该步骤ST12中,若检索出对应的声调信息,则声调词典检索部12从声 调词典11获取带声调的读音信息"-'夂^"。带声调的读音信息的声调位置 用"'"符号来表示。接着,声调词典检索部12将步骤ST12中从声调词典11获取到的带声 调的读音信息"、"夕夕,,发送到声音合成部13(步骤ST13)。此后,声音合成 部13根据从声调词典检索部12发送来的带声调的读音信息"'7''》,"来合 成声音波形,并将其发送到声音重放部14。声音重放部14根据从声音合成 部13发送来的声音波形,输出声音。由此,如图5所示,在当前位置(本 车位置)接近登录地时,不会发生误读,而且以适当的声调输出读作"^夕夕,, 的合成声音。如上所述,根据本专利技术的实施方式1的声音合成装置,由于采用如下 结构,即,从声调词典11中读出与从外部输入的记述信息及读音信息对应 的带声调的读音信息,而产生声音,因此不会发生误读,而且能以用户所 期待的声调输出声本文档来自技高网...

【技术保护点】
一种声音合成装置,其特征在于,包括: 声调词典,该声调词典将记述语言的记述信息及表示读法的读音信息、与对该语言的读音的声调进行规定的声调信息相互对应来加以存储; 声调词典检索部,该声调词典检索部从所述声调词典中检索与从外部输入的 记述信息及读音信息对应的声调信息,并获取附加该检索出的声调信息后的读音信息即带声调的读音信息; 声音合成部,该声音合成部根据由所述声调词典检索部获取到的带声调的读音信息来合成声音波形;及 声音重放部,该声音重放部根据由所述声音合 成部合成后的声音波形来重放声音。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:竹里尚嘉古田训藤井洋一
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1