发音诊断装置、发音诊断方法、存储媒介、以及发音诊断程序制造方法及图纸

技术编号:3044372 阅读:158 留言:0更新日期:2012-04-11 18:40
本发明专利技术的发音诊断装置是以,含有各声音语言体系的各个构成音素发音时的关于等调音属性的期望发音调音属性值的调音属性数据、由发音者发出的语音信号抽出音响特征,基于抽出的音响特征推定调音属性的属性值,通过比较推定的属性值与期望的调音属性数据对发音者的发音进行判定为特征的。这里的调音属性是指,口腔内舌、嘴唇、声门、小舌、鼻腔、牙齿、腭的状态的任意一个或者至少含有一个这些调音器官状态的组合、调音器官状态的用力方式、以及呼气状况的组合。这里的音响特征是指,频率特征值、音量、持续时间、它们的变化量或者它们的变化模式以及最少含有一个这些参数的组合。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术是关于发音诊断装置、发音诊断方法、存储媒介、以及发音诊断程序的技术。 己有技术水平
技术介绍
已知的作为诊断发音者发音的发音诊断装置是,提取发音者对单词发音的语音信号, 从数据库里将与此语音信号最为接近的单词拼写抽出,再将抽出的单词向发音者提示的装 置(参考专利文献l)。专利文献1特开平11-202889号公报
技术实现思路
然而,上述发音诊断装置是通过将发音者对单词的发音与己登录的单词拼写对应来进 行发音诊断的。对于构成单词的各个音素,发音时发音器官是否处于正确的状态、是否使 用了正确的调音方式则不能诊断出来。因此,作为本专利技术的目的,就是提供能够诊断发音时发音器官是否处于正确状态、是 否使用了正确的发音方式的发音诊断装置、发音诊断方法、以及发音诊断程序和存储有所 使用的发音属性数据的媒介。本专利技术的一个构成的发音诊断装置,提供了有各声音语言体系的各个构成音素发音时 的关于调音属性的期望发音的调音属性值的调音属性数据、由发音者发出的语音信号而得 到音响特征的抽出方式、基于上述抽出的音响特征推定上述调音属性的属性值的属性值推 定方法、通过比较上述推定属性值与期望发音的调音属性数据,对发音者的发音进行判定 的方法。这里的调音属性是指,舌的高低、舌的位置、舌的形状、舌的动作、嘴唇的形状、嘴唇的张开方式、嘴唇的动作、声门的状态、声带的状态、小舌的状态、鼻腔的状态、上 下牙齿的位置、腭的状态、鄂的动作等的其中之一或者最少含有一个这些调音器官状态的 组合,上述的调音器官状态的用力方式以及呼气状况的组合。这里的音响特征是指,由发 音者发出的语音信号而得到的频率特征值、音量、持续时间、它们的变化量或者它们的变 化模式以及最少含有一个这些参数的组合。对于上述发音诊断装置,能够更加完善发音者的发音诊断结果输出方式则更好。 本专利技术的另一构成的发音诊断装置,提供了抽出发音因素的音响特征的音响特征抽出 方式、按照抽出的音素音响特征,根据各声音语言体系的各个构成音素的发音调音属性而 形成分布的调音属性分布形成方式、以阈值来判定的,以调音属性分布形成方式区分的调 音属性的调音属性判定方法。这里的音响特征是指,由发音者发出的语音信号而得到的频 率特征值、音量、持续时间、它们的变化量或者它们的变化模式以及最少含有一个这些参 数的组合。这里的调音属性是指,舌的高低、舌的位置、舌的形状、舌的动作、嘴唇的形 状、嘴唇的张开方式、嘴唇的动作、声门的状态、声带的状态、小舌的状态、鼻腔的状态、 上下牙齿的位置、腭的状态、鄂的动作等的其中之一或者最少含有一个这些调音器官状态 的组合,上述的调音器官状态的用力方式以及呼气状况的组合。本专利技术的又一构成的发音诊断装置,提供了抽出类似发音的音响特征的音响特征抽出 方式、按照抽出的类似音素的一方的音响特征,根据各声音语言体系的各个构成音素的发 音调音属性而形成分布的第1调音属性分布形成方式、按照抽出的类似音素的另一方的音 响特征,根据发音者的发音调音属性而形成分布的第2调音属性分布形成方式、以第l阈 值来判定由第1调音属性分布形成方式区分的调音属性的第1调音属性判定方法、以第2 阈值来判定由第2调音属性分布形成方式区分的调音属性的第2调音属性判定方法。这里 的音响特征是指,由发音者发出的语音信号而得到的频率特征值、音量、持续时间、它们 的变化量或者它们的变化模式以及最少含有一个这些参数的组合。这里的调音属性是指, 舌的高低、舌的位置、舌的形状、舌的动作、嘴唇的形状、嘴唇的张开方式、嘴唇的动作、 声门的状态、声带的状态、小舌的状态、鼻腔的状态、上下牙齿的位置、腭的状态、鄂的动作等的其中之一或者最少含有一个这些调音器官状态的组合,上述的调音器官状态的用 力方式以及呼气状况的组合。对于上述发音诊断装置,能够预备使调音属性判定方法中使用的阈值可变的阈值可变 方法则更好。上述发音诊断装置诊断的音素如果能适用于子音则更好。本专利技术的又一构成的发音诊断方法,提供了由发音者发出的语音信号而得到音响特征 的抽出工程、基于上述抽出的音响特征推定上述关于调音属性的属性值的属性推定工程、 比较上述的推定属性值与具有各声音语言体系的各个构成音素发音时的关于调音属性的 期望发音调音属性值的调音属性数据而进行判定的工程。这里的音响特征是指,由发音者 发出的语音信号而得到的频率特征值、音量、持续时间、它们的变化量或者它们的变化模 式以及最少含有一个这些参数的组合。这里的调音属性是指,舌的高低、舌的位置、舌的 形状、舌的动作、嘴唇的形状、嘴唇的张开方式、嘴唇的动作、声门的状态、声带的状态、 小舌的状态、鼻腔的状态、上下牙齿的位置、腭的状态、鄂的动作等的其中之一或者最少 含有一个这些调音器官状态的组合,上述的调音器官状态的用力方式以及呼气状况的组合o本专利技术的又一构成的发音诊断方法,提供了抽出发音因素的音响特征的音响特征抽出 工程、按照上述抽出的音素音响特征,根据各声音语言体系的各个构成音素的发音调音属 性而形成分布的调音属性分布形成工程、以阈值来判定的,以上述调音属性分布形成方式 区分的调音属性的调音属性判定工程。这里的音响特征是指,由发音者发出的语音信号而 得到的频率特征值、音量、持续时间、它们的变化量或者它们的变化模式以及最少含有一 个这些参数的组合。这里的调音属性是指,舌的高低、舌的位置、舌的形状、舌的动作、 嘴唇的形状、嘴唇的张开方式、嘴唇的动作、声门的状态、声带的状态、小舌的状态、鼻 腔的状态、上下牙齿的位置、腭的状态、鄂的动作等的其中之一或者最少含有一个这些调 音器官状态的组合,上述的调音器官状态的用力方式以及呼气状况的组合。本专利技术的又一构成的发音诊断方法,提供了抽出类似发音的音响特征的音响特征抽出 工程、按照上述抽出的类似音素的一方的音响特征,根据各声音语言体系的各个构成音素的发音调音属性而形成分布的第1调音属性分布形成工程、按照上述抽出的类似音素的另 一方的音响特征,根据发音者的发音调音属性而形成分布的第2调音属性分布形成工程、 以第1阈值来判定由上述第1调音属性分布形成方式区分的调音属性的第1调音属性判定 工程、以第2阈值来判定由上述第2调音属性分布形成方式区分的调音属性的第2调音属 性判定工程。这里的音响特征是指,由发音者发出的语音信号而得到的频率特征值、音量、 持续时间、它们的变化量或者它们的变化模式以及最少含有一个这些参数的组合。这里的 调音属性是指,舌的高低、舌的位置、舌的形状、舌的动作、嘴唇的形状、嘴唇的张开方 式、嘴唇的动作、声门的状态、声带的状态、小舌的状态、鼻腔的状态、上下牙齿的位置、 腭的状态、鄂的动作等的其中之一或者最少含有一个这些调音器官状态的组合,上述的调 音器官状态的用力方式以及呼气状况的组合。对于上述发音诊断方法,能够提供使调音属性判定工程中使用的阈值可变的阈值可变 工程则更好。本专利技术的又一构成的存储媒介,最少存储了有各声音语言体系的各个构成音素的发音 属性的调音属性数据库、有推定调音属性值中使用的阈值的阈值数据库、单词区分组成数 据库、特征轴数据库和矫正内容数据库的其中的一个。根据本专利技术,可以推定调音器官状态及调音方式的状态,即调音属性状态。所以,由 本专利技术可以诊断在发音过程中调音器本文档来自技高网...

【技术保护点】
提供了有各声音语言体系的各个构成音素发音时的关于调音属性的期望发音的调音属性值的调音属性数据、由发音者发出的语音信号而得到音响特征的抽出方式、基于上述抽出的音响特征推定上述调音属性的属性值的属性值推定方法、通过比较上述推定属性值与期望发音的调音属性数据,对发音者的发音进行判定的方法的发音诊断装置。这里的调音属性是指,舌的高低、舌的位置、舌的形状、舌的动作、嘴唇的形状、嘴唇的张开方式、嘴唇的动作、声门的状态、声带的状态、小舌的状态、鼻腔的状态、上下牙齿的位置、腭的状态、鄂的动作等的其中之一或者最少含有一个这些调音器官状态的组合,上述的调音器官状态的用力方式以及呼气状况的组合。这里的音响特征是指,由发音者发出的语音信号而得到的频率特征值、音量、持续时间、它们的变化量或者它们的变化模式以及最少含有一个这些参数的组合。

【技术特征摘要】
【国外来华专利技术】JP 2005-9-29 285217/2005;JP 2006-5-26 147171/20061.提供了有各声音语言体系的各个构成音素发音时的关于调音属性的期望发音的调音属性值的调音属性数据、由发音者发出的语音信号而得到音响特征的抽出方式、基于上述抽出的音响特征推定上述调音属性的属性值的属性值推定方法、通过比较上述推定属性值与期望发音的调音属性数据,对发音者的发音进行判定的方法的发音诊断装置。这里的调音属性是指,舌的高低、舌的位置、舌的形状、舌的动作、嘴唇的形状、嘴唇的张开方式、嘴唇的动作、声门的状态、声带的状态、小舌的状态、鼻腔的状态、上下牙齿的位置、腭的状态、鄂的动作等的其中之一或者最少含有一个这些调音器官状态的组合,上述的调音器官状态的用力方式以及呼气状况的组合。这里的音响特征是指,由发音者发出的语音信号而得到的频率特征值、音量、持续时间、它们的变化量或者它们的变化模式以及最少含有一个这些参数的组合。1. 提供了有各声音语言体系的各个构成音素发音时的关于调音属性的期望发音的调 音属性值的调音属性数据、由发音者发出的语音信号而得到音响特征的抽出方式、基于上 述抽出的音响特征推定上述调音属性的属性值的属性值推定方法、通过比较上述推定属性 值与期望发音的调音属性数据,对发音者的发音进行判定的方法的发音诊断装置。这里的 调音属性是指,舌的高低、舌的位置、舌的形状、舌的动作、嘴唇的形状、嘴唇的张开方 式、嘴唇的动作、声门的状态、声带的状态、小舌的状态、鼻腔的状态、上下牙齿的位置、 腭的状态、鄂的动作等的其中之一或者最少含有一个这些调音器官状态的组合,上述的调 音器官状态的用力方式以及呼气状况的组合。这里的音响特征是指,由发音者发出的语音 信号而得到的频率特征值、音量、持续时间、它们的变化量或者它们的变化模式以及最少 含有一个这些参数的组合。2. 把提供输出发音者发音诊断结果的方法作为特征的申请项1中记载的发音诊断装置。3. 提供了抽出发音因素的音响特征的音响特征抽出方式、按照上述抽出的音素音响 特征,根据各声音语言体系的各个构成音素的发音调音属性而形成分布的调音属性分布形 成方式、以阈值来判定的,以上述调音属性分布形成方式区分的调音属性的调音属性判定 方法的发音诊断装置。这里的音响特征是指,由发音者发出的语音信号而得到的频率特征 值、音量、持续时间、它们的变化量或者它们的变化模式以及最少含有一个这些参数的组 合。这里的调音属性是指,舌的高低、舌的位置、舌的形状、舌的动作、嘴唇的形状、嘴 唇的张开方式、嘴唇的动作、声门的状态、声带的状态、小舌的状态、鼻腔的状态、上下 牙齿的位置、腭的状态、鄂的动作等的其中之一或者最少含有一个这些调音器官状态的组 合,上述的调音器官状态的用力方式以及呼气状况的组合。4. 提供了抽出类似发音的音响特征的音响特征抽出方式、按照上述抽出的类似音素 的一方的音响特征,根据各声音语言体系的各个构成音素的发音调音属性而形成分布的第 l调音属性分布形成方式、按照上述抽出的类似音素的另一方的音响特征,根据发音者的 发音调音属性而形成分布的第2调音属性分布形成方式、以第1阈值来判定由上述第1调音属性分布形成方式区分的调音属性的第1调音属性判定方法、以第2阈值来判定由上述 第2调音属性分布形成方式区分的调音属性的第2调音属性判定方法的发音诊断装置。这 里的音响特征是指,由发音者发出的语音信号而得到的频率特征值、音量、持续时间、它 们的变化量或者它们的变化模式以及最少含有一个这些参数的组合。这里的调音属性是 指,舌的高低、舌的位置、舌的形状、舌的动作、嘴唇的形状、嘴唇的张开方式、嘴...

【专利技术属性】
技术研发人员:奥村真知儿岛宏明大村浩
申请(专利权)人:独立行政法人产业技术综合研究所奥村真知
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利