音频转写文件生成方法、相关设备及可读存储介质技术

技术编号:26175294 阅读:31 留言:0更新日期:2020-10-31 14:07
本申请公开了一种音频转写文件生成方法、相关设备及可读存储介质。基于上述方案,可以将音频数据,以及,与该音频数据对应的转写结果数据,存储至一个音频转写文件中,该音频转写文件中包括至少一个文件单元,每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段,各文件单元中的音频数据片段组成该音频数据;各文件单元中的转写结果数据片段组成该转写结果数据。当用户需要时,将该音频转写文件提供给用户,用户对该音频转写文件进行解析即可得到音频数据,以及,与音频数据对应的转写结果数据。

Audio transcribed file generation method, related equipment and readable storage medium

【技术实现步骤摘要】
音频转写文件生成方法、相关设备及可读存储介质
本申请涉及数据处理
,更具体的说,是涉及一种音频转写文件生成方法、相关设备及可读存储介质。
技术介绍
随着语音识别技术的发展,音频转写技术应运而生,基于音频转写技术对音频进行处理,可以得到与音频对应的转写结果。目前,音频,以及,音频对应的转写结果是分别存储的,用户如果需要应用音频及其对应的转写结果,需要分别将存储有音频的文件及存储有音频对应的转写结果的文件,提供给用户,用户再分别对两个文件进行解析,才能得到音频及其对应的转写结果。因此,对音频以及音频对应的转写结果的存储方式进行优化,显得尤为必要。
技术实现思路
鉴于上述问题,本申请提出了一种音频转写文件生成方法、相关设备及可读存储介质。具体方案如下:一种音频转写文件生成方法,包括:获取音频数据,以及,与所述音频数据对应的转写结果数据;对所述音频数据及所述转写结果数据进行解析,得到至少一个文件单元,每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段,各所述文件单元中的音频数据片段组成所述音频数据;各所述文件单元中的转写结果数据片段组成所述转写结果数据;根据各所述文件单元,生成音频转写文件。可选地,所述对所述音频数据及所述转写结果数据进行解析,得到至少一个文件单元,包括:对所述转写结果数据进行解析,获取至少一个转写结果数据片段;根据各转写结果数据片段对应的音频起始时间和音频结束时间,对所述音频数据进行解析,获取至少一个音频数据片段;基于所述至少一个转写结果数据片段,以及,所述至少一个音频数据片段,获取至少一个文件单元。可选地,所述基于所述至少一个转写结果数据片段,以及,所述至少一个音频数据片段,获取至少一个文件单元,包括:针对每个转写结果数据片段,将所述转写结果数据片段,以及,与其对应的音频数据片段组合生成一个文件单元;或者,针对每个转写结果数据片段,将所述转写结果数据片段,以及,与其对应的音频数据片段进行组合,生成一个文件单元;针对所述音频数据片段中,不存在对应转写结果数据片段的每个音频数据片段,生成一个文件单元,该文件单元中的转写结果数据片段为空。可选地,所述根据各所述文件单元,生成音频转写文件,包括:根据各所述文件单元,生成第一音频转写文件;所述第一音频文件包括第一文件头信息和至少一个文件块,所述第一文件头信息包括文件头总大小,所述音频数据的信息,所述转写结果数据的信息,以及各所述文件块的大小;或者;根据各所述文件单元,生成第二音频转写文件;所述第二音频文件包括第二文件头信息和各所述文件单元,所述第二文件头信息包括文件头总大小,所述音频数据的信息以及所述转写结果数据的信息。可选地,所述根据各所述文件单元,生成第一音频转写文件,包括:将各所述文件单元,划分为至少一个文件块;根据所述音频数据、所述转写结果数据、各所述文件块,确定所述第一文件头信息;基于各所述文件块和所述第一文件头信息,生成第一音频转写文件。可选地,所述根据各所述文件单元,生成第二音频转写文件,包括:根据所述音频数据、所述转写结果数据,确定所述第二文件头信息;基于各所述文件单元和所述第二文件头信息,生成第二音频转写文件。可选地,在基于各所述文件块和所述第一文件头信息,生成第一音频转写文件之后,所述方法还包括:读取所述第一音频转写文件的第一文件头信息;根据所述第一音频转写文件的第一文件头信息,确定所述第一音频转写文件中各文件块的起始位置和结束位置;针对每一文件块,从所述文件块的起始位置开始至结束位置,依次读取所述文件块中的各文件单元,得到每个文件单元包含的音频数据片段以及音频转写数据片段。可选地,在基于各所述文件块和所述第二文件头信息,生成第二音频转写文件之后,所述方法还包括:读取所述第二音频转写文件的第二文件头信息;根据所述第二音频转写文件的第二文件头信息,确定所述第二音频转写文件中文件单元的起始位置;从所述文件单元的起始位置开始,依次读取所述文件块中的各文件单元,得到每个文件单元包含的音频数据片段以及音频转写数据片段。一种音频转写文件生成装置,包括:获取单元,用于获取音频数据,以及,与所述音频数据对应的转写结果数据;解析单元,用于对所述音频数据及所述转写结果数据进行解析,得到至少一个文件单元,每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段,各所述文件单元中的音频数据片段组成所述音频数据;各所述文件单元中的转写结果数据片段组成所述转写结果数据;音频转写文件生成单元,用于根据各所述文件单元,生成音频转写文件。可选地,所述解析单元,包括:转写结果数据解析单元,用于对所述转写结果数据进行解析,获取至少一个转写结果数据片段;音频数据解析单元,用于根据各转写结果数据片段对应的音频起始时间和音频结束时间,对所述音频数据进行解析,获取至少一个音频数据片段;文件单元生成单元,用于基于所述至少一个转写结果数据片段,以及,所述至少一个音频数据片段,获取至少一个文件单元。可选地,所述文件单元生成单元,包括:第一文件单元生成单元,用于针对每个转写结果数据片段,将所述转写结果数据片段,以及,与其对应的音频数据片段组合生成一个文件单元;或者,第二文件单元生成单元,用于针对每个转写结果数据片段,将所述转写结果数据片段,以及,与其对应的音频数据片段进行组合,生成一个文件单元;针对所述音频数据片段中,不存在对应转写结果数据片段的每个音频数据片段,生成一个文件单元,该文件单元中的转写结果数据片段为空。可选地,所述音频转写文件生成单元,包括:第一音频转写文件生成单元,用于根据各所述文件单元,生成第一音频转写文件;所述第一音频文件包括第一文件头信息和至少一个文件块,所述第一文件头信息包括文件头总大小,所述音频数据的信息,所述转写结果数据的信息,以及各所述文件块的大小;或者;第二音频转写文件生成单元,用于根据各所述文件单元,生成第二音频转写文件;所述第二音频文件包括第二文件头信息和各所述文件单元,所述第二文件头信息包括文件头总大小,所述音频数据的信息以及所述转写结果数据的信息。可选地,所述第一音频转写文件生成单元,包括:划分单元,用于将各所述文件单元,划分为至少一个文件块;第一文件头信息确定单元,用于根据所述音频数据、所述转写结果数据、各所述文件块,确定所述第一文件头信息;第一音频转写文件生成子单元,用于基于各所述文件块和所述第一文件头信息,生成第一音频转写文件。可选地,所述第二音频转写文件生成单元,包括:第二文件头信息确定单元,用于根据所述音频数据、所述转写结果数据,确定所述第二文件头信息;第二音频转写文件生成子单元,用于基本文档来自技高网...

【技术保护点】
1.一种音频转写文件生成方法,其特征在于,包括:/n获取音频数据,以及,与所述音频数据对应的转写结果数据;/n对所述音频数据及所述转写结果数据进行解析,得到至少一个文件单元,每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段,各所述文件单元中的音频数据片段组成所述音频数据;各所述文件单元中的转写结果数据片段组成所述转写结果数据;/n根据各所述文件单元,生成音频转写文件。/n

【技术特征摘要】
1.一种音频转写文件生成方法,其特征在于,包括:
获取音频数据,以及,与所述音频数据对应的转写结果数据;
对所述音频数据及所述转写结果数据进行解析,得到至少一个文件单元,每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段,各所述文件单元中的音频数据片段组成所述音频数据;各所述文件单元中的转写结果数据片段组成所述转写结果数据;
根据各所述文件单元,生成音频转写文件。


2.根据权利要求1所述的方法,其特征在于,所述对所述音频数据及所述转写结果数据进行解析,得到至少一个文件单元,包括:
对所述转写结果数据进行解析,获取至少一个转写结果数据片段;
根据各转写结果数据片段对应的音频起始时间和音频结束时间,对所述音频数据进行解析,获取至少一个音频数据片段;
基于所述至少一个转写结果数据片段,以及,所述至少一个音频数据片段,获取至少一个文件单元。


3.根据权利要求2所述的方法,其特征在于,所述基于所述至少一个转写结果数据片段,以及,所述至少一个音频数据片段,获取至少一个文件单元,包括:
针对每个转写结果数据片段,将所述转写结果数据片段,以及,与其对应的音频数据片段组合生成一个文件单元;
或者,
针对每个转写结果数据片段,将所述转写结果数据片段,以及,与其对应的音频数据片段进行组合,生成一个文件单元;
针对所述音频数据片段中,不存在对应转写结果数据片段的每个音频数据片段,生成一个文件单元,该文件单元中的转写结果数据片段为空。


4.根据权利要求1所述的方法,其特征在于,所述根据各所述文件单元,生成音频转写文件,包括:
根据各所述文件单元,生成第一音频转写文件;所述第一音频文件包括第一文件头信息和至少一个文件块,所述第一文件头信息包括文件头总大小,所述音频数据的信息,所述转写结果数据的信息,以及各所述文件块的大小;
或者;
根据各所述文件单元,生成第二音频转写文件;所述第二音频文件包括第二文件头信息和各所述文件单元,所述第二文件头信息包括文件头总大小,所述音频数据的信息以及所述转写结果数据的信息。


5.根据权利要求4所述的方法,其特征在于,所述根据各所述文件单元,生成第一音频转写文件,包括:
将各所述文件单元,划分为至少一个文件块;
根据所述音频数据、所述转写结果数据、各所述文件块,确定所述...

【专利技术属性】
技术研发人员:田志强曹亚苏文畅王玮
申请(专利权)人:安徽听见科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1