语音采集方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：19483267 阅读：19 留言：0更新日期：2018-11-17 10:57

本发明专利技术公开了一种语音采集方法、装置、计算机设备及存储介质，所述方法包括：在接收到用户通过通讯应用平台的应用账号发送的语料获取请求时，选取对应的初始语料，并获取用户的身份标识信息，在接收到开始录音的请求后，调用通讯应用平台的应用账号的录音功能进行录音，得到录音文件，并调用通讯应用平台的应用账号的离线语音识别功能，将该录音文件转化为目标文本，使用文本匹配算法，将该目标文本与初始语料进行匹配，得到文本相似度，若该文本相似度大于或等于预设的相似度阈值，则将录音文件、身份标识信息和它们之间的映射关系存入到数据库，从而实现了使用通讯应用平台的应用账号对语音数据进行快速采集，提高了语音数据的采集效率。

全部详细技术资料下载

【技术实现步骤摘要】
语音采集方法、装置、计算机设备及存储介质
本专利技术涉及计算机
，尤其涉及一种语音采集方法、装置、计算机设备及存储介质。
技术介绍
随着科技的进步和计算机网络技术的飞速发展，声纹识别技术和语音识别技术越来越受人们的青睐，其中声纹识别技术用于方便快捷地确定说话人身份，语音识别技术用于在将自然语音进行识别转化成文字，声纹识别技术和语音识别技术都需要采集大量的说话人信息和说话人对应的语音信息，用来进行模型的训练。当前，语音采集主要通过使用专业录音设备进行语音录取，得到录音文件，然后人工标记录音文件对应的说话人，这种人工方式不能及时清除掉不合格的录音，且操作麻烦，使得采集效率低，同时，这种人工采集方式不适用于对距离较远的人员进行语音采集，若需要对不同地区的人员同时进行语音采集，只能通过购置多台录音设备，浪费了大量采集成本。
技术实现思路
基于此，有必要针对上述技术问题，提供一种基于通讯应用平台的应用账号提高语音采集效率和节约采集成本的语音采集方法、装置、计算机设备及存储介质。一种语音采集方法，包括：若接收到用户通过通讯应用平台的应用账号发送的语料获取请求，则获取所述语料获取请求中包含的基础语料和所述用户的身份标识信息；从所述基础语料对应的基础语料库中随机选取一条语料，作为初始语料，并显示在所述通讯应用平台的应用账号的界面上；若接收到所述用户通过所述通讯应用平台的应用账号发送的开始录音请求，则使用预设的录音调用框架，调用所述通讯应用平台的应用账号的录音功能进行录音并生成录音文件；若接收到所述用户通过所述通讯应用平台的应用账号发送的终止录音请求，则使用预设的语音识别...

【技术保护点】
1.一种语音采集方法，其特征在于，所述语音采集方法包括：若接收到用户通过通讯应用平台的应用账号发送的语料获取请求，则获取所述语料获取请求中包含的基础语料和所述用户的身份标识信息；从所述基础语料对应的基础语料库中随机选取一条语料，作为初始语料，并显示在所述通讯应用平台的应用账号的界面上；若接收到所述用户通过所述通讯应用平台的应用账号发送的开始录音请求，则使用预设的录音调用框架，调用所述通讯应用平台的应用账号的录音功能进行录音并生成录音文件；若接收到所述用户通过所述通讯应用平台的应用账号发送的终止录音请求，则使用预设的语音识别调用框架，调用所述通讯应用平台的应用账号的离线语音识别功能将所述录音文件转化为目标文本；对所述目标文本与所述初始语料进行文本相似度匹配，得到所述目标文本与所述初始语料之间的文本相似度；若所述文本相似度大于或等于预设相似度阈值，则建立所述录音文件与所述身份标识信息之间的映射关系，并对应保存所述录音文件、所述身份标识信息和所述映射关系。

【技术特征摘要】
1.一种语音采集方法，其特征在于，所述语音采集方法包括：若接收到用户通过通讯应用平台的应用账号发送的语料获取请求，则获取所述语料获取请求中包含的基础语料和所述用户的身份标识信息；从所述基础语料对应的基础语料库中随机选取一条语料，作为初始语料，并显示在所述通讯应用平台的应用账号的界面上；若接收到所述用户通过所述通讯应用平台的应用账号发送的开始录音请求，则使用预设的录音调用框架，调用所述通讯应用平台的应用账号的录音功能进行录音并生成录音文件；若接收到所述用户通过所述通讯应用平台的应用账号发送的终止录音请求，则使用预设的语音识别调用框架，调用所述通讯应用平台的应用账号的离线语音识别功能将所述录音文件转化为目标文本；对所述目标文本与所述初始语料进行文本相似度匹配，得到所述目标文本与所述初始语料之间的文本相似度；若所述文本相似度大于或等于预设相似度阈值，则建立所述录音文件与所述身份标识信息之间的映射关系，并对应保存所述录音文件、所述身份标识信息和所述映射关系。2.如权利要求1所述的语音采集方法，其特征在于，所述若接收到所述用户通过所述通讯应用平台的应用账号发送的开始录音请求，则使用预设的录音调用框架，调用所述通讯应用平台的应用账号的录音功能进行录音并生成录音文件包括：若接收到所述开始录音请求，则向所述通讯应用平台发送预设的配置信息，其中，所述配置信息用于对开始录音请求进行权限验证；若接收到所述通讯应用平台发送的授权成功消息，则向所述通讯应用平台发送启用预设的音频接口的指令，使得所述用户使用所述通讯应用平台的应用账号的录音功能进行录音并生成录音文件。3.如权利要求1或2所述的语音采集方法，其特征在于，所述对所述目标文本与所述初始语料进行文本相似度匹配，得到所述目标文本与所述初始语料之间的文本相似度包括：根据预设的正则表达式，确定所述初始语料中的标点符号；对所述标点符号进行删除处理，将得到的文本内容作为目标语料；使用动态规划算法，对所述目标文本和所述目标语料进行相似度计算，得到所述文本相似度。4.如权利要求3所述的语音采集方法，其特征在于，所述使用动态规划算法，对所述目标文本和所述目标语料进行相似度计算，得到所述文本相似度包括：将所述目标文本中的字符依序存入一维数组Xa中，将所述目标语料中的字符依序存入一维数组Yb中，其中，a为所述目标文本的字符个数，b为所述目标语料的字符个数；使用如下公式计算Xa的第i位与Yb的第j位之前的公共子序列长度L(i,j)：其中，若same(Xi,Yj)在Xi与Yj相同时，取值为1，否则，same(Xi,Yj)在Xi与Yj不相同时，取值为0，max{L(i-1,j-1)+same(Xi,Yj),L(i-1,j),L(i,j-1)}为取L(i-1,j-1)+same(Xi,Yj)、L(i-1,j)和L(i,j-1)三个表达式中的最大值，i和j均为正整数，且i≤a，j≤b；对所述公共子序列长度进行递归回溯，得到所述公共子序列长度的集合，并从所述集合中获取值最大的公共子序列长度l，作...

【专利技术属性】
技术研发人员：黄锦伦，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人