本发明专利技术涉及语音合成技术领域,提供了一种基于语义检索的文语转换方法及系统。本发明专利技术的方法和系统中,首先同时使用正向最大匹配和逆向最大匹配,几乎全部的非歧义字段都可以被切分出,大大提高了文本切分的准确度,改善了语音合成效果。此外,本发明专利技术将文本切分方法与传统的基于语义的信息检索方法相结合,借鉴信息检索技术中对于关键词的处理方式,来进行歧义字段的处理,可有效提高歧义字段自动识别的效率和准确度,大大提高语音合成的效果。
【技术实现步骤摘要】
本专利技术涉及语音合成
,特别涉及一种基于语义检索的文语转换方法及系统。
技术介绍
语音合成是通过机械的、电子的方法产生人造语音的技术,语音合成和语音识别技术是实现人机语音通信等高级人机交互方式的关键技术。语音合成的目的是将任意信息实时转化为标准流畅的语音朗读出来,涉及声学、语言学、数字信号处理、计算机等多个领域的技术,是信息处理领域的一项前沿技术。语音合成要让计算机能够自动产生高清晰度、 高自然度的连续语音,这与传统的声音回放技术有着本质的区别。传统的声音回放设备,如磁带录音机等,是通过预先录制声音然后回放来实现语音重现的;这种方式无论是在内容、 存储、传输或者方便性、及时性等方面都存在很大的限制。而通过计算机进行的语音合成则可以在任何时候将任意信息转换成具有高自然度的语音,从而真正实现人机之间的智能交互。文语转换(Text to Speech)技术隶属于语音合成,是将计算机设备自动产生的或是外部输入的文字信息转变为可以听得懂的、流利的汉语(或其他语种,视具体需求而定) 口语输出的技术,文语转换系统实际上可以看作是一个人工智能系统。为了合成出高质量的语言,除了依赖于各种规则,包括语义学规则、词汇规则、语音学规则外,还必须对文字的内容有很好的理解,这也涉及到自然语言理解的问题。文语转换过程通常包括语言学处理、 韵律处理和声学处理几个方面,一个好的文语转换系统应能输出音质清晰、自然流畅的语音,而不是简单的语音合成,这需要系统能够对文本进行语言学的分析,确定文本中关于语音的字、词、句的区分以方便后续韵律处理的调整。目前的文语转换系统中,多数是结合词典对文本全文进行遍历,按最大匹配长度识别词语和短句从而对文本进行切分。但由于文本中通常存在大量的歧义字段(即可能存在多种识别方式的字段),由于歧义字段造成的文本切分的多样性,给自动分词带来了极大的困难,目前大多的文语转换技术,都不得不把歧义字段的每一个字都切分为一个词,在每个词之间都插入停顿间隔标记,而导致合成的语音一字一断,不自然的停顿较多,机械性极强,与人类自然流畅的发音相去甚远,这也是限制文语转换技术发展的最大瓶颈。
技术实现思路
(一)要解决的技术问题本专利技术为了解决现有技术中对歧义字段自动识别效果不佳的问题,提供了一种基于语义检索的文语转换方法及系统,可以有效地自动切分文本中的歧义字段,显著提高合成语音的质量。( 二 )技术方案为实现上述目的,一方面,本专利技术提供一种基于语义检索的文语转换方法,所述方法包括步骤Si,对输入的文本信息分别进行正向最大匹配和逆向最大匹配;S2,对比两种匹配方式对文本切分的结果,将切分相同的文本字串直接作为切分结果执行步骤S6 S7 ;对切分不同的文本字串执行步骤S3 S7 ;S3,提取每一文本字串中的最大交集型歧义切分字段;S4,对每一歧义切分字段进行语义检索;S5,根据语义检索匹配情况识别每一歧义切分字段作为切分结果;S6,根据切分结果进行单词的语音韵律处理;S7,将经过韵律处理的全部单词按文本顺序合成为语音输出。优选地,步骤S3中,通过计算文本字串中歧义字段前后边界处的汉字间的互信息来提取最大交集型歧义切分字段。优选地,步骤S4中,所述语义检索包括S401,在采用资源描述框架对本体模型进行形式化表示的基础上进行每一歧义切分字段的定性推理,实现歧义切分字段的语义扩展;S402,用Voronoi图形式化表示本体模型的基础上进行语义扩展后的歧义切分字段的定量推理,得到歧义切分字段与扩展后语义概念的语义相似度;S403,采用词汇关联度对扩展后语义概念进行检索,判断歧义切分字段能否表达出明确的语义概念。优选地,步骤S403中,在本体实例中进行检索。优选地,步骤S5中,歧义切分字段能够表达出明确的语义概念时作为完整词切分,歧义切分字段不能表达出明确的语义概念时切分为单字组合。另一方面,本专利技术还同时提供一种基于语义检索的文语转换系统,所述系统包括正向最大匹配模块和逆向最大匹配模块,分别对输入的文本信息进行正向最大匹配和逆向最大匹配;匹配结果比对模块,对比两种匹配方式对文本切分的结果,将切分相同的文本字串直接作为切分结果交给韵律处理模块;将切分不同的文本字串交给提取模块;提取模块,根据匹配结果比对模块提供的文本字串提取其中的最大交集型歧义切分字段交给语义检索模块;语义检索模块,对每一歧义切分字段进行语义检索;匹配识别模块,根据语义检索匹配情况识别每一歧义切分字段作为切分结果交给韵律处理模块;韵律处理模块,根据切分结果进行单词的语音韵律处理;语音合成模块,将经过韵律处理的全部单词按文本顺序合成为语音输出。优选地,所述提取模块中,通过计算文本字串中歧义字段前后边界处的汉字间的互信息来提取最大交集型歧义切分字段。优选地,所述语义检索模块进一步包括定性推理模块,在采用资源描述框架对本体模型进行形式化表示的基础上进行每一歧义切分字段的定性推理,实现歧义切分字段的语义扩展;定量推理模块,用Voronoi图形式化表示本体模型的基础上进行语义扩展后的歧义切分字段的定量推理,得到歧义切分字段与扩展后语义概念的语义相似度;概念检索模块,采用词汇关联度对扩展后语义概念进行检索,判断歧义切分字段能否表达出明确的语义概念。优选地,所述概念检索模块中,在本体实例中进行检索。优选地,所述匹配识别模块中,歧义切分字段能够表达出明确的语义概念时作为完整词切分,歧义切分字段不能表达出明确的语义概念时切分为单字组合。(三)有益效果利用本专利技术的方法和系统,将文本切分方法与传统的基于语义的信息检索方法相结合,借鉴信息检索技术中对于关键词的处理方式,来进行歧义字段的处理,可有效提高歧义字段自动识别的效率和准确度,大大提高语音合成的效果。附图说明图1为本专利技术中基于语义检索的文语转换方法的流程图。 具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本专利技术保护的范围。本专利技术的目的是将文语转换方法与传统的语义检索方法相结合,借鉴语义检索术中对于关键词的处理方式,来进行歧义字段的处理。将技术成熟的基于本体的语义搜索方法引入到文语转换中,只需根据具体知识领域向已经建好的本体模型中扩充少量实例即可,而无需对语义搜索做出任何改动,也无需再去检索文本,使得系统较易实现,大大降低了开发成本。下面根据附图1对本专利技术的基于语义检索的文语转换方法进行说明。在图1中, 基于语义检索的文语转换方法的完整流程为Sl 对输入的文本信息分别进行正向最大匹配和逆向最大匹配;S2:对比两种匹配方式对文本切分的结果,将切分相同的文本字串直接作为切分结果执行步骤S6 ;对切分不同的文本字串执行步骤S3 S7 ;S3 提取每一文本字串中的最大交集型歧义切分字段;S4 对每一歧义切分字段进行语义检索;S5 根据语义检索匹配情况识别每一歧义切分字段作为切分结果;S6 根据切分结果进行单词的语音韵律处理;S7 将经过韵律处理的全部单词按文本顺序合成为语音输出。其中,步骤Sl中,正向最大匹配是指按文本的自然顺序(自然阅本文档来自技高网...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:傅泽田,李鑫星,张领先,温皓杰,李道亮,刘雪,
申请(专利权)人:中国农业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。