一种语音采集设备制造技术

技术编号:29276576 阅读:12 留言:0更新日期:2021-07-13 18:12
本实用新型专利技术公开了一种语音采集设备,针对现有的需要人工采集及标注音频而导致的工作量大及效率低的问题,通过录入器预先记录录音者的个人信息;显示器显示需要录制的词条及词条的显示方式;音频采集器根据设置的采样频率、采样位数及声道数,采集录音者根据显示器中的词条发出的语音;音频处理器识别音频采集器采集的语音,并将识别后的语音显示器显示的词条进行对比;以及存储器自动存储所述音频处理器传送的音频文件,并以词条‑个人信息的方式进行命名。提升语音采集和标注的效率,减少人工,节约时间和成本。

【技术实现步骤摘要】
一种语音采集设备
本技术属于语音采集的
,尤其涉及一种语音采集设备。
技术介绍
声音是一种由物体振动而产生的波,当物体振动时,使周围的窄气不断地压缩和放松,并向周围扩散,这就是声波,人可以听到的的声音频率范围是20Hz~20kHz。人可以听到声音的三个要素是音强、音调和音色,其中音强是声音的强度,取决于声间的振幅;音调与声音的频率有关,频率高则声音高,频率低则声音低;音色是由混入基音的泛音决定的。每个基音又都有固有的频率和不同音强的泛音,从而使得每个声音都具有特殊的音色效果。音频技术包括音频采集(模拟音转换为计算机识别的数字信号)、语音解码/编码、文字-声音的转换、音乐合成、语音识别与理解、音频数据传输、音频视频同步、音频效果与编辑等。通常实现计算机语音输出有两种方法,分别是录音/重放和文字-声音转换。其中,音频数据的采集,常见方法有3种:直接获取已有音频、利用音频处理软件捕获截取声音、用麦克风录制声音。对于用麦克风录制声音,目前常用的方式是人工对着一张纸去一个一个念,然后念一个词条保存并命名一个音频,效率极低。也有通过全部念完词条,然后人工一个一个切割并标注音频。以上两种方式都需要大量的人工和时间,工作效率低,不能满足人们的需求。
技术实现思路
本技术的目的是提供一种语音采集设备,解决人工采集及标注音频工作量大及效率低的问题。为解决上述问题,本技术的技术方案为:一种语音采集设备,包括:录入器,用于预先记录录音者的个人信息;所述个人信息包括性别、年龄、地区;显示器,用于显示需要录制的词条及词条的显示方式;音频采集器,用于根据设置的采样频率、采样位数及声道数,采集录音者根据所述显示器中的词条发出的语音;音频处理器,用于识别所述音频采集器采集的语音,并将识别后的语音与所述显示器显示的词条进行对比;存储器,用于自动存储所述音频处理器传送的音频文件,并以词条-个人信息的方式进行命名。根据本技术一实施例,所述录入器为带输入法或个人信息选择项的触摸屏。根据本技术一实施例,所述录入器为键盘。根据本技术一实施例,所述显示器上设有数据输入接口,所述数据输入接口用于导入需要录制的词条。根据本技术一实施例,所述显示器上设有词条列表选择键及显示方式选择键。根据本技术一实施例,所述音频处理器包括停顿检测件及词条对比件;所述停顿检测件用于检测所述音频采集器采集的语音是否存在达到预设时长的停顿,若存在,则停止采集语音,进行语音识别;所述词条对比件用于将所述停顿检测件识别的语音与所述显示器显示的词条进行对比,判断是否一致,若一致,则进行音频标注后传送给所述存储器;若不一致,则丢弃语音。本技术由于采用以上技术方案,使其与现有技术相比具有以下的优点和积极效果:1)本技术一实施例中的语音采集设备,针对现有的需要人工采集及标注音频而导致的工作量大及效率低的问题,通过录入器,预先记录录音者的个人信息;显示器,显示需要录制的词条及词条的显示方式;音频采集器,根据设置的采样频率、采样位数及声道数,采集录音者根据显示器中的词条发出的语音;音频处理器,识别音频采集器采集的语音,并将识别后的语音显示器显示的词条进行对比;以及存储器,自动存储所述音频处理器传送的音频文件,并以词条-个人信息的方式进行命名。提升语音采集和标注的效率,减少人工,节约时间和成本。2)本技术一实施例中的语音采集设备,其存储器会根据录音者的个人信息来自动命名,不需要人工对音频文件逐个命名,极大减少了人工成本,也方便后续对音频文件的筛选。附图说明图1为本技术一实施例中的语音采集设备的示意图。附图标记说明:1:录入器;2:显示器;3:音频采集器;4:音频处理器;5:存储器。具体实施方式以下结合附图和具体实施例对本技术提出的一种语音采集设备作进一步详细说明。根据下面说明和权利要求书,本技术的优点和特征将更清楚。本实施例提供了一种语音采集设备,请参看图1,该语音采集设备包括:录入器1,用于预先记录录音者的个人信息;该个人信息包括姓名、性别、年龄、地区。该个人信息用于后续对音频文件的命名,方便后续对音频文件的筛选或检索。实际应用中,该录入器1可以是带输入法或个人信息选择项的触摸屏,也可以是键盘。显示器2,用于显示需要录制的词条及词条的显示方式。显示器2可以提示的方式提醒录入者需要录制的词条。显示器2上设有数据输入接口,该数据输入接口用于导入需要录制的词条。显示器2上还设有词条列表选择键及显示方式选择键。这里的词条可通过数据输入接口导入,用户可通过词条列表选择键选择需要录制的词条,也可通过显示方式选择键,选择顺序显示或随机显示。另外,根据实际需要,在显示器2上还可设置对词条进行增加、删除、查找或修改的功能键。音频采集器3,用于根据设置的采样频率、采样位数及声道数,采集录音者根据显示器2中的词条发出的语音。该音频采集器3的采样频率可以设为16KHz,采样位数设为16位(高保真音质),声道数可设为单声道。当然,根据需要,其采样频率、采样位数及声道数也可设为其他的值。音频处理器4,用于识别音频采集器3采集的语音,并将识别后的语音与所述显示器2显示的词条进行对比。该音频处理器4包括停顿检测件及词条对比件;其中,停顿检测件用于检测音频采集器3采集的语音是否存在达到预设时长的停顿,若存在,则停止采集语音,进行语音识别。该停顿检测件根据每帧语音数据的能量来判断语音还是静音(停顿),出现连的能量比较小的就判定为静音(停顿)。若该静音的时长达到预设时长(如2s),则停止对语音的采集,开始对已经采集的语音进行识别。词条对比件用于将停顿检测件识别的语音与显示器2显示的词条进行对比,判断是否一致,若一致,则进行音频标注后传送给存储器5,显示器2按顺序显示下一个词条;若不一致,则丢弃该语音,显示器2重复该词条的显示。存储器5,用于自动存储音频处理器4传送的音频文件,并以词条-个人信息的方式进行命名。如录音者的个人信息为性别男,年龄18,地区浙江杭州,正在录制的词条为打开照明,则其音频文件命名为:dakaizhaoming-Y18-zheA-X(X代表女性,Y代表男性,数字代表年龄,zheA代表浙江杭州,X代表该词条的第几次录音)。下面简要介绍一下该语音采集设备的工作过程:首先录入录音者的性别、年龄、地区等个人相关信息,录音者根据显示器显示的词条读出该词条,音频采集器和音频处理器对语音进行采集和判断处理(主要判断录音者是否停顿和朗读的词条是否与显示器提示的词条相同)当音频处理器判断录音者出现了停顿,则停止录音并开始对该段录音进行语音识别,判断录音内容是否与显示器提示的词条一致,如果一致则保存该段录音并根据录入的该录音者的性别、年龄、地区依据命名规则进行命名保存,保存完成后,显示器显示下一个词条本文档来自技高网...

【技术保护点】
1.一种语音采集设备,其特征在于,包括:/n录入器,用于预先记录录音者的个人信息;所述个人信息包括性别、年龄、地区;/n显示器,用于显示需要录制的词条及词条的显示方式;/n音频采集器,用于根据设置的采样频率、采样位数及声道数,采集录音者根据所述显示器中的词条发出的语音;/n音频处理器,用于识别所述音频采集器采集的语音,并将识别后的语音与所述显示器显示的词条进行对比;/n存储器,用于自动存储所述音频处理器传送的音频文件,并以词条-个人信息的方式进行命名。/n

【技术特征摘要】
1.一种语音采集设备,其特征在于,包括:
录入器,用于预先记录录音者的个人信息;所述个人信息包括性别、年龄、地区;
显示器,用于显示需要录制的词条及词条的显示方式;
音频采集器,用于根据设置的采样频率、采样位数及声道数,采集录音者根据所述显示器中的词条发出的语音;
音频处理器,用于识别所述音频采集器采集的语音,并将识别后的语音与所述显示器显示的词条进行对比;
存储器,用于自动存储所述音频处理器传送的音频文件,并以词条-个人信息的方式进行命名。


2.如权利要求1所述的语音采集设备,其特征在于,所述录入器为带输入法或个人信息选择项的触摸屏。


3.如权利要求1所述的语音采集设备,其特征在于,所述...

【专利技术属性】
技术研发人员:邹凯文
申请(专利权)人:上海深聪半导体有限责任公司
类型:新型
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1