音频转写文件生成方法、相关设备及可读存储介质技术

技术编号：26175294 阅读：31 留言：0更新日期：2020-10-31 14:07

本申请公开了一种音频转写文件生成方法、相关设备及可读存储介质。基于上述方案，可以将音频数据，以及，与该音频数据对应的转写结果数据，存储至一个音频转写文件中，该音频转写文件中包括至少一个文件单元，每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段，各文件单元中的音频数据片段组成该音频数据；各文件单元中的转写结果数据片段组成该转写结果数据。当用户需要时，将该音频转写文件提供给用户，用户对该音频转写文件进行解析即可得到音频数据，以及，与音频数据对应的转写结果数据。

Audio transcribed file generation method, related equipment and readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
音频转写文件生成方法、相关设备及可读存储介质
本申请涉及数据处理
，更具体的说，是涉及一种音频转写文件生成方法、相关设备及可读存储介质。
技术介绍
随着语音识别技术的发展，音频转写技术应运而生，基于音频转写技术对音频进行处理，可以得到与音频对应的转写结果。目前，音频，以及，音频对应的转写结果是分别存储的，用户如果需要应用音频及其对应的转写结果，需要分别将存储有音频的文件及存储有音频对应的转写结果的文件，提供给用户，用户再分别对两个文件进行解析，才能得到音频及其对应的转写结果。因此，对音频以及音频对应的转写结果的存储方式进行优化，显得尤为必要。
技术实现思路
鉴于上述问题，本申请提出了一种音频转写文件生成方法、相关设备及可读存储介质。具体方案如下：一种音频转写文件生成方法，包括：获取音频数据，以及，与所述音频数据对应的转写结果数据；对所述音频数据及所述转写结果数据进行解析，得到至少一个文件单元，每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段，各所述文件单元中的音频数据片段组成所述音频数据；各所述文件单元中的转写结果数据片段组成所述转写结果数据；根据各所述文件单元，生成音频转写文件。可选地，所述对所述音频数据及所述转写结果数据进行解析，得到至少一个文件单元，包括：对所述转写结果数据进行解析，获取至少一个转写结果数据片段；根据各转写结果数据片段对应的音频起始时间和音频结束时间，对所述音频数据进行解析，获取至少一个...

【技术保护点】
1.一种音频转写文件生成方法，其特征在于，包括：/n获取音频数据，以及，与所述音频数据对应的转写结果数据；/n对所述音频数据及所述转写结果数据进行解析，得到至少一个文件单元，每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段，各所述文件单元中的音频数据片段组成所述音频数据；各所述文件单元中的转写结果数据片段组成所述转写结果数据；/n根据各所述文件单元，生成音频转写文件。/n

【技术特征摘要】
1.一种音频转写文件生成方法，其特征在于，包括：
获取音频数据，以及，与所述音频数据对应的转写结果数据；
对所述音频数据及所述转写结果数据进行解析，得到至少一个文件单元，每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段，各所述文件单元中的音频数据片段组成所述音频数据；各所述文件单元中的转写结果数据片段组成所述转写结果数据；
根据各所述文件单元，生成音频转写文件。

2.根据权利要求1所述的方法，其特征在于，所述对所述音频数据及所述转写结果数据进行解析，得到至少一个文件单元，包括：
对所述转写结果数据进行解析，获取至少一个转写结果数据片段；
根据各转写结果数据片段对应的音频起始时间和音频结束时间，对所述音频数据进行解析，获取至少一个音频数据片段；
基于所述至少一个转写结果数据片段，以及，所述至少一个音频数据片段，获取至少一个文件单元。

3.根据权利要求2所述的方法，其特征在于，所述基于所述至少一个转写结果数据片段，以及，所述至少一个音频数据片段，获取至少一个文件单元，包括：
针对每个转写结果数据片段，将所述转写结果数据片段，以及，与其对应的音频数据片段组合生成一个文件单元；
或者，
针对每个转写结果数据片段，将所述转写结果数据片段，以及，与其对应的音频数据片段进行组合，生成一个文件单元；
针对所述音频数据片段中，不存在对应转写结果数据片段的每个音频数据片段，生成一个文件单元，该文件单元中的转写结果数据片段为空。

4.根据权利要求1所述的方法，其特征在于，所述根据各所述文件单元，生成音频转写文件，包括：
根据各所述文件单元，生成第一音频转写文件；所述第一音频文件包括第一文件头信息和至少一个文件块，所述第一文件头信息包括文件头总大小，所述音频数据的信息，所述转写结果数据的信息，以及各所述文件块的大小；
或者；
根据各所述文件单元，生成第二音频转写文件；所述第二音频文件包括第二文件头信息和各所述文件单元，所述第二文件头信息包括文件头总大小，所述音频数据的信息以及所述转写结果数据的信息。

5.根据权利要求4所述的方法，其特征在于，所述根据各所述文件单元，生成第一音频转写文件，包括：
将各所述文件单元，划分为至少一个文件块；
根据所述音频数据、所述转写结果数据、各所述文件块，确定所述...

【专利技术属性】
技术研发人员：田志强，曹亚，苏文畅，王玮，
申请(专利权)人：安徽听见科技有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人