一种将语音转换为文字的方法及装置制造方法及图纸

技术编号:10248189 阅读:182 留言:0更新日期:2014-07-24 02:22
本发明专利技术公开了一种将语音转换为文字的方法及装置,方法包括:接收输入的语音,并识别所述语音中各个元素;根据所述元素与文字映射关系,获取所述元素所映射的文字,并输出所述文字。通过上述方式,本发明专利技术能够快速地将语音转换为文字。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种将语音转换为文字的方法及装置,方法包括:接收输入的语音,并识别所述语音中各个元素;根据所述元素与文字映射关系,获取所述元素所映射的文字,并输出所述文字。通过上述方式,本专利技术能够快速地将语音转换为文字。【专利说明】一种将语音转换为文字的方法及装置
本专利技术涉及语音识别
,特别是涉及一种将语音转换为文字的方法及装置。
技术介绍
在很多场合,例如:会议、培训、采访等等,需要对谈话的内容进行记录,通常情况下,谈话的内容是由记录人员或者采访记者进行手写记录。而人谈话的速度通常快于人手写速度,为了避免记录中漏掉部份内容,记录人员还采用录音记录谈话内容,生成录音文件。在会议、培训或者采访结束后,记录人员或者专业翻译人员需要播放录音文件,收听录音,然后将听到的语音书写为文字。通过人工收听录音,并将录音转化为文字的方式,工作效率低,浪费时间。若录音文件过多,则不单耗费时间,还会耗费大量的劳动力,人力成本过高。
技术实现思路
本专利技术主要解决的技术问题是提供一种将语音转换为文字的方法及装置,能够快速地将语音转换为文字。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种将语音转换为文字的方法,包括接收输入的语音,并识别所述语音中各个元素;根据所述元素与文字映射关系,获取所述元素所映射的文字,并输出所述文字。其中,所述元素为所述语音中的单音节语音;所述元素与文字映射关系包括标准语音与文字的映射关系;所述识别所述语音中各个元素的步骤包括:将所述语音划分为多个单音节语音,其中,所述一个单语节语音对应所述语音中的一个音节;所述根据所述元素与文字映射关系,获取所述元素所映射的文字,并输出所述文字的步骤包括:获取所述语音的声音参数,其中,所述声音参数包括语音的频率、振幅和相位;根据所述声音参数判断所述语音是标准语音还是地方语音;若所述语音为标准语音,则根据标准语音与文字的映射关系,获取所述单音节语音所映射的文字,生成所述语音所对应的所有文字。其中,所述元素与文字映射关系还包括地方语音与文字的映射关系;所述方法还包括:若所述语音是为地方语音,则根据地方语音与文字的映射关系,获取所述单音节语音所映射的文字,生成所述语音所对应的所有文字。其中,所述方法还包括:判断所述两个单音节语音之间间隔的时间是否超过预定时间;若所述两个单音节语音之间间隔的时间超过预定时间,则在所述两个单音节语音所对应的两个文字之间标记符号。其中,若所述单音节语音所映射的文字的数量为多个,则分别将所述文字以及与所述文字相邻的文字组成词组;在词组库中查找是否存在所述词组;若存在所述词组,则将组成所述词组的所述文字作为所述单音节语音所对应的文字。为了解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种将语音转换为文字的装置,包括接入识别模块,用于接收输入的语音,并识别所述语音的各个元素;映射模块,用于根据所述元素与文字映射关系,获取所述元素所映射的文字,并输出所述文字。其中,所述元素为所述语音中的单音节语音;所述元素与文字映射关系包括标准语音与文字的映射关系;所述接收识别模块,具体用于接收输入的所述语音,并将所述语音划分为多个单音节语音,其中,所述一个单语节语音对应所述语音中的一个音节;所述映射模块包括:获取单元,用于获取所述语音的声音参数,其中,所述声音参数包括语音的频率、振幅和相位;判断单元,用于根据所述声音参数判断所述语音是标准语音还是地方语音;第一映射单元,用于在所述判断单元判断到所述语音是标准语音时,根据标准语音与文字的映射关系,获取所述单音节语音所映射的文字,生成所述语音所对应的所有文字。其中,所述元素与文字映射关系还包括地方语音与文字的映射关系;所述映射模块还包括:第二映射单元,用于在所述判断单元判断到所述语音是地方语音时,根据地方语音与文字的映射关系,获取所述单音节语音所映射的文字,生成所述语音所对应的所有文字。其中,所述装置还包括:判断模块,用于判断所述两个单音节语音之间间隔的时间是否超过预定时间;符号标记模块,用于在所述判断模块判断到所述两个单音节语音之间间隔的时间超过预定时间时,在所述两个单音节语音所对应的两个文字之间标记符号。其中,所述装置还包括组成模块,用于在所述单音节语音所映射的文字的数量为多个时,分别将所述单音节语音所映射的文字和与所述文字相邻的文字组成词组;查找模块,用于在词组库中查找是否存在所述词组;设置模块,用于在所述查找模块在词组库中找到所述词组,将组成所述词组的所述文字作为所述单音节语音所对应的文字。本专利技术的有益效果是:区别于现有技术的情况,本专利技术预先建立语音与文字的映射关系,在接收到语音后,根据语音与文字的映射关系获取语音所映射的文字,从而快速地将语音转换为文字,并不需要人为收听语音,然后将语音转换为文字,节省人力成本,进而节省成本。【专利附图】【附图说明】图1是本专利技术将语音转换为文字第一实施方式的结构示意图;图2是本专利技术将语音转换为文字第二实施方式的结构示意图;图3是本专利技术将语音转换为文字的方法实施方式的流程图;图4是本专利技术将语音转换为文字的方法实施方式中根据声音参数选择映射关系后,将语音转换为文字的示意图。【具体实施方式】下面结合附图和实施方式对本专利技术进行详细说明。请参阅图1,如图所示,将语音转换为文字的装置包括接收识别模块202和映射模块 203。接收识别模块202接收输入的语音,并识别语音的各个元素,其中,语音可为先前录制好的录音,也可以为即场输入的语音。映射模块203根据元素与文字映射关系,获取元素所映射的文字。根据元素与文字映射关系,方便而简单,能够快速地将语音转换为文字。在本专利技术实施方式中,该元素可为单语节语音,当然,在其他替代实施方式中,该元素也可以为词组、成语等等;元素与文字映射关系包括标准语音与文字的映射关系、地方语音与文字的映射关系,其中,标准语音与文字的映射关系表中记录所有文字与其标准发音的映射关系,地方语音与文字的映射关系表中记录所有文字与其地方发音的映射关系;则接收识别模块202具体用于接收输入的语音,并将语音划分为多个单音节语音,其中,一个单语节语音对应语音中的一个音节。值得说明的是:一个文字仅具有一个音节,例如:汉字,每个汉字仅具有一个音节,由元音和辅音组成,又例如:英文字母,每一个英文字母仅具有一个音节。无论是中文、英文,还是其他语言,由于各个地区的生活习惯不同一样,同一种语言会衍生出各种不同的地方语言。地方语言带强烈的地方语音,与标准语言的标准语音相t匕,地方语音的口音问题非常严重,同一个文字,发音可能完全不一样,因此,在做语音与文字转换时,还需要区分标准语语音和地方语音,则映射模块203包括获取单元2031、判断单元2032、第一映射单元2033和第二映射单元2034。获取单元2031获取语音的声音参数,其中,声音参数包括语音的频率、振幅和相位。判断单元2032根据声音参数判断语音是标准语音还是地方语音。标准语音和地方语音均有各自独特频率、振幅和相位,根据频率、振幅和相位即可判断语音是地方语音还是标准语音。在判断单元2032判断到语音是标准语音时,第一映射单元2033根据标准语音与文字的映射关系,获取单音节语音所映射的文字,生成语音本文档来自技高网...

【技术保护点】
一种将语音转换为文字的方法,其特征在于,所述方法包括:接收输入的语音,并识别所述语音中各个元素;根据所述元素与文字映射关系,获取所述元素所映射的文字,并输出所述文字。

【技术特征摘要】

【专利技术属性】
技术研发人员:朴宁
申请(专利权)人:深圳如果技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1