语音转写方法、装置、设备以及存储介质制造方法及图纸

技术编号：34520763 阅读：16 留言：0更新日期：2022-08-13 21:10

本公开提供了一种语音转写方法、装置、设备以及存储介质，涉及数据处理领域，尤其涉及语音技术领域。具体实现方案为：确定在第一网络环境下，上传待转写音频所占用的第一时长；在第一时长大于预设时长的情况下，从接收的转写请求中获取待转写音频的存储地址，其中，存储地址为在第二网络环境下，接收待转写音频并存储待转写音频的存储空间所对应的存储地址，第一网络环境下的第一数据传输速度小于第二网络环境下的第二数据传输速度；从存储地址拉取对应的待转写音频；对待转写音频进行语音转写。本公开解决了在有网络限制的环境下无法实现大音频文件的语音转写的技术问题。现大音频文件的语音转写的技术问题。现大音频文件的语音转写的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
语音转写方法、装置、设备以及存储介质

[0001]本公开涉及数据处理
，尤其涉及语音
具体而言，涉及一种语音转写方法、装置、设备以及存储介质。

技术介绍

[0002]在内网环境下，对服务间请求的连接时长、请求内容的大小有一定的限制。相关技术中，在这种情况下进行大音频文件的转文字服务时，通过直接上传音频文件进行语音转写，再获取对应的转写结果，在有网络限制的环境下无法实现大音频文件的语音转写。

技术实现思路

[0003]本公开提供了一种用于语音转写方法、装置、设备以及存储介质。
[0004]根据本公开的一方面，提供了一种语音转写方法，包括：确定在第一网络环境下，上传待转写音频所占用的第一时长；在第一时长大于预设时长的情况下，从接收的转写请求中获取待转写音频的存储地址，其中，存储地址为在第二网络环境下，接收待转写音频并存储待转写音频的存储空间所对应的存储地址，第一网络环境下的第一数据传输速度小于第二网络环境下的第二数据传输速度；从存储地址拉取对应的待转写音频；对待转写音频进行语音转写。
[0005]可选地，从存储地址拉取对应的待转写音频，包括：调用转写请求对应的转写接口，并从转写接口中的存储地址中拉取待转写音频。
[0006]可选地，对待转写音频进行语音转写，包括：获取待转写音频的处理状态；在处理状态为全部转写完成的情况下，确定待转写音频转写结束。
[0007]可选地，从转写接口中的存储地址中拉取待转写音频之后，方法还包括：接收转写接口返回的事件标识，其中，每次...

【技术保护点】

【技术特征摘要】
1.一种语音转写方法，包括：确定在第一网络环境下，上传待转写音频所占用的第一时长；在所述第一时长大于预设时长的情况下，从接收的转写请求中获取所述待转写音频的存储地址，其中，所述存储地址为在第二网络环境下，接收所述待转写音频并存储所述待转写音频的存储空间所对应的存储地址，所述第一网络环境下的第一数据传输速度小于所述第二网络环境下的第二数据传输速度；从所述存储地址拉取对应的所述待转写音频；对所述待转写音频进行语音转写。2.根据权利要求1所述的方法，其中，从所述存储地址拉取对应的所述待转写音频，包括：调用所述转写请求对应的转写接口，并从所述转写接口中的所述存储地址中拉取所述待转写音频。3.根据权利要求2所述的方法，其中，对所述待转写音频进行语音转写，包括：获取所述待转写音频的处理状态；在所述处理状态为全部转写完成的情况下，确定所述待转写音频转写结束。4.根据权利要求2所述的方法，其中，从所述转写接口中的所述存储地址中拉取所述待转写音频之后，所述方法还包括：接收所述转写接口返回的事件标识，其中，每次进行语音转写的待转写音频与所述事件标识一一对应。5.根据权利要求4所述的方法，其中，对所述待转写音频进行语音转写，包括：接收目标对象通过所述事件标识发起的对转写详情接口的轮询请求；返回所述转写详情接口中的对所述待转写音频的处理状态；在所述处理状态为处理完成的情况下，将转写结果返回至所述目标对象。6.根据权利要求5所述的方法，其中，在所述处理状态为以下情况之一的情况下，拒绝接收目标对象通过所述事件标识发起的对所述转写详情接口的轮询请求，包括：所述待转写音频处理失败、所述待转写音频处理成功、所述轮询请求达到轮询的第一预设条件。7.根据权利要求1所述的方法，其中，还包括：在所述存储地址中的所述待转写音频为多个音频片段的情况下，分别获取所述多个音频片段的标识；所述从所述存储地址拉取对应的所述待转写音频包括：依次从所述存储地址拉取所述多个音频片段，并在拉取到的音频片段的标识为结束标识的情况下，确定所述待转写音频已经拉取完毕。8.根据权利要求1所述的方法，其中，从所述存储地址拉取对应的所述待转写音频，包括：在所述存储地址中的所述待转写音频为单个连续音频的情况下，从所述存储地址拉取所述待转写音频，并在所述待转写音频满足以下任一条件的情况下，确定所述待转写音频读取完毕：已读取的待转写音频的数据量达到预设数据量；所述待转写音频的读取时长大于预设时长。9.根据权利要求7或8所述的方法，其中，对所述待转写音频进行语音转写，包括：
按照预设方式对所述待转写音频进行分组，得到...

【专利技术属性】
技术研发人员：黄伟琦，夏帅，江鹏，唐睿坚，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人