语音转写方法、装置、设备以及存储介质制造方法及图纸

技术编号:34520763 阅读:16 留言:0更新日期:2022-08-13 21:10
本公开提供了一种语音转写方法、装置、设备以及存储介质,涉及数据处理领域,尤其涉及语音技术领域。具体实现方案为:确定在第一网络环境下,上传待转写音频所占用的第一时长;在第一时长大于预设时长的情况下,从接收的转写请求中获取待转写音频的存储地址,其中,存储地址为在第二网络环境下,接收待转写音频并存储待转写音频的存储空间所对应的存储地址,第一网络环境下的第一数据传输速度小于第二网络环境下的第二数据传输速度;从存储地址拉取对应的待转写音频;对待转写音频进行语音转写。本公开解决了在有网络限制的环境下无法实现大音频文件的语音转写的技术问题。现大音频文件的语音转写的技术问题。现大音频文件的语音转写的技术问题。

【技术实现步骤摘要】
语音转写方法、装置、设备以及存储介质


[0001]本公开涉及数据处理
,尤其涉及语音
具体而言,涉及一种语音转写方法、装置、设备以及存储介质。

技术介绍

[0002]在内网环境下,对服务间请求的连接时长、请求内容的大小有一定的限制。相关技术中,在这种情况下进行大音频文件的转文字服务时,通过直接上传音频文件进行语音转写,再获取对应的转写结果,在有网络限制的环境下无法实现大音频文件的语音转写。

技术实现思路

[0003]本公开提供了一种用于语音转写方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种语音转写方法,包括:确定在第一网络环境下,上传待转写音频所占用的第一时长;在第一时长大于预设时长的情况下,从接收的转写请求中获取待转写音频的存储地址,其中,存储地址为在第二网络环境下,接收待转写音频并存储待转写音频的存储空间所对应的存储地址,第一网络环境下的第一数据传输速度小于第二网络环境下的第二数据传输速度;从存储地址拉取对应的待转写音频;对待转写音频进行语音转写。
[0005]可选地,从存储地址拉取对应的待转写音频,包括:调用转写请求对应的转写接口,并从转写接口中的存储地址中拉取待转写音频。
[0006]可选地,对待转写音频进行语音转写,包括:获取待转写音频的处理状态;在处理状态为全部转写完成的情况下,确定待转写音频转写结束。
[0007]可选地,从转写接口中的存储地址中拉取待转写音频之后,方法还包括:接收转写接口返回的事件标识,其中,每次进行语音转写的待转写音频与事件标识一一对应。
[0008]可选地,对待转写音频进行语音转写,包括:接收目标对象通过事件标识发起的对转写详情接口的轮询请求;返回转写详情接口中的对待转写音频的处理状态;在处理状态为处理完成的情况下,将转写结果返回至目标对象。
[0009]可选地,在处理状态为以下情况之一的情况下,拒绝接收目标对象通过事件标识发起的对转写详情接口的轮询请求,包括:待转写音频处理失败、待转写音频处理成功、轮询请求达到轮询的第一预设条件。
[0010]可选地,还包括:在存储地址中的待转写音频为多个音频片段的情况下,分别获取多个音频片段的标识;从存储地址拉取对应的待转写音频包括:依次从存储地址拉取多个音频片段,并在拉取到的音频片段的标识为结束标识的情况下,确定待转写音频已经拉取完毕。
[0011]可选地,从存储地址拉取对应的待转写音频,包括:在存储地址中的待转写音频为单个连续音频的情况下,从存储地址拉取待转写音频,并在待转写音频满足以下任一条件的情况下,确定待转写音频读取完毕:已读取的待转写音频的数据量达到预设数据量;待转
写音频的读取时长大于预设时长。
[0012]可选地,对待转写音频进行语音转写,包括:按照预设方式对待转写音频进行分组,得到多组待转写子音频,其中,预设方式为流式读取中按照单位数据量对待转写音频进行分组,多组待转写子音频之间存在先后顺序;依据先后顺序依次读取多组待转写子音频;对多组待转写子音频进行语音转写,得到与多组待转写子音频对应的多组转写结果。
[0013]根据本公开的另一方面,提供了一种用于语音转写的交互方法,包括:展示人机交互界面,其中,人机交互界面中设置有第一区域,第一区域用于展示从存储地址中拉取的待转写音频,存储地址为从接收的转写请求中获取的待转写音频在存储空间的存储地址;响应于对第一区域中的目标控件的触发指令,采用上述语音转写方法对待转写音频进行转写,并展示转写结果。
[0014]可选地,人机交互界面中设置有第二区域,第二区域用于展示对待转写音频的转写过程进行配置的配置属性。
[0015]根据本公开的另一方面,提供了一种语音转写装置,包括:确定模块,用于确定在第一网络环境下,上传待转写音频所占用的第一时长;获取模块,用于在第一时长大于预设时长的情况下,从接收的转写请求中获取待转写音频的存储地址,其中,存储地址为在第二网络环境下,由存储空间接收待转写音频并存储待转写音频的存储地址,第一网络环境下的第一数据传输速度小于第二网络环境下的第二数据传输速度;拉取模块,用于从存储地址拉取对应的待转写音频;转写模块,用于对待转写音频进行语音转写。
[0016]根据本公开的另一方面,提供了一种用于语音转写的交互装置,包括:第一展示模块,用于展示人机交互界面,人机交互界面中设置有第一区域,第一区域用于展示从存储地址中拉取的待转写音频,存储地址为从接收的转写请求中获取的待转写音频在存储空间的存储地址;处理模块,用于响应于对第一区域中的目标控件的触发指令,采用上述语音转写方法对待转写音频进行转写;第二展示模块,用于展示转写结果。
[0017]根据本公开的又一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述方法。
[0018]根据本公开的再一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述语音转写方法。
[0019]根据本公开的再一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现上述方法。
[0020]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0021]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0022]图1是根据本公开第一实施例的一种语音转写方法的流程图;
[0023]图2是根据本公开第二实施例的确定待转写音频转写结束的流程图;
[0024]图3是根据本公开第二实施例的获取待转写音频的处理状态的流程图;
[0025]图4是根据本公开第二实施例的确定拉取全部的待转写音频的流程图;
[0026]图5是根据本公开第二实施例的对多组待转写音频进行语音转写的流程图;
[0027]图6是根据本公开第三实施例的一种语音转写装置的结构图;
[0028]图7a是根据本公开第四实施例的一种用于语音转写的交互界面示意图;
[0029]图7b是根据本公开第四实施例的一种语音转写的流程示意图;
[0030]图7c是根据本公开第五实施例的一种用于语音转写的交互装置的结构图;
[0031]图8是用来实现本公开实施例的语音转写方法的电子设备的框图。
具体实施方式
[0032]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0033]首先,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音转写方法,包括:确定在第一网络环境下,上传待转写音频所占用的第一时长;在所述第一时长大于预设时长的情况下,从接收的转写请求中获取所述待转写音频的存储地址,其中,所述存储地址为在第二网络环境下,接收所述待转写音频并存储所述待转写音频的存储空间所对应的存储地址,所述第一网络环境下的第一数据传输速度小于所述第二网络环境下的第二数据传输速度;从所述存储地址拉取对应的所述待转写音频;对所述待转写音频进行语音转写。2.根据权利要求1所述的方法,其中,从所述存储地址拉取对应的所述待转写音频,包括:调用所述转写请求对应的转写接口,并从所述转写接口中的所述存储地址中拉取所述待转写音频。3.根据权利要求2所述的方法,其中,对所述待转写音频进行语音转写,包括:获取所述待转写音频的处理状态;在所述处理状态为全部转写完成的情况下,确定所述待转写音频转写结束。4.根据权利要求2所述的方法,其中,从所述转写接口中的所述存储地址中拉取所述待转写音频之后,所述方法还包括:接收所述转写接口返回的事件标识,其中,每次进行语音转写的待转写音频与所述事件标识一一对应。5.根据权利要求4所述的方法,其中,对所述待转写音频进行语音转写,包括:接收目标对象通过所述事件标识发起的对转写详情接口的轮询请求;返回所述转写详情接口中的对所述待转写音频的处理状态;在所述处理状态为处理完成的情况下,将转写结果返回至所述目标对象。6.根据权利要求5所述的方法,其中,在所述处理状态为以下情况之一的情况下,拒绝接收目标对象通过所述事件标识发起的对所述转写详情接口的轮询请求,包括:所述待转写音频处理失败、所述待转写音频处理成功、所述轮询请求达到轮询的第一预设条件。7.根据权利要求1所述的方法,其中,还包括:在所述存储地址中的所述待转写音频为多个音频片段的情况下,分别获取所述多个音频片段的标识;所述从所述存储地址拉取对应的所述待转写音频包括:依次从所述存储地址拉取所述多个音频片段,并在拉取到的音频片段的标识为结束标识的情况下,确定所述待转写音频已经拉取完毕。8.根据权利要求1所述的方法,其中,从所述存储地址拉取对应的所述待转写音频,包括:在所述存储地址中的所述待转写音频为单个连续音频的情况下,从所述存储地址拉取所述待转写音频,并在所述待转写音频满足以下任一条件的情况下,确定所述待转写音频读取完毕:已读取的待转写音频的数据量达到预设数据量;所述待转写音频的读取时长大于预设时长。9.根据权利要求7或8所述的方法,其中,对所述待转写音频进行语音转写,包括:
按照预设方式对所述待转写音频进行分组,得到...

【专利技术属性】
技术研发人员:黄伟琦夏帅江鹏唐睿坚
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1