本发明专利技术提供了一种音频数据的文本显示方法和装置,该方法包括:如果获取到音频数据,对音频数据进行语音识别,得到文本数据;对文本数据进行预处理,得到多个文本片段;针对每个文本片段,按照预设文本长度和预设时间间隔,对当前文本片段进行文本分割,得到当前文本片段对应的至少一个子文本;对每个文本片段对应的子文本进行排序,并显示排序结果。该方式中,按照预设文本长度和预设时间间隔分割通话记录对应的文本数据,使得展示的每个子文本内容不会太密集,文本的展示形式更美观,结果更易读,同时该方式可帮助用户快速了解录音内容,通过生成并展示录音文本,联动播放文本对应录音,避免了听录音效率低,看文本易丢失信息的问题。问题。问题。
【技术实现步骤摘要】
音频数据的文本显示方法和装置
[0001]本专利技术涉及计算机信息
,尤其是涉及一种音频数据的文本显示方法和装置。
技术介绍
[0002]当用户需要了解通话内容时,看文本比听录音的效率要高很多,但是文本表达的信息可能与录音存在一定偏差。因而,相关技术中提供了一种展示通话录音内容的方法,该方法对通话录音进行自动语音识别,得到带角色和时间戳信息的文本,并将角色一次发话作为一个气泡,但得到的角色定位结果比较粗糙,如一次发话过程有较长的停顿,那么播放时停顿会以静音形式消耗时间;其次,角色一次发话内容较多时,一个气泡中内容会比较密集,阅读体验较差,比如出现看串行问题。
技术实现思路
[0003]本专利技术的目的在于提供一种音频数据的文本显示方法和装置,以解决听录音效率低,看文本丢失信息的问题。
[0004]第一方面,本专利技术提供一种音频数据的文本显示方法,该方法包括:如果获取到音频数据,对音频数据进行语音识别,得到文本数据;对文本数据进行预处理,得到多个文本片段;针对每个文本片段,按照预设文本长度和预设时间间隔,对当前文本片段进行文本分割,得到当前文本片段对应的至少一个子文本;对每个文本片段对应的子文本进行排序,并显示排序结果。
[0005]在可选的实施方式中,上述按照预设文本长度和预设时间间隔,对当前文本片段进行文本分割,得到当前文本片段对应的至少一个子文本的步骤,包括:根据当前文本片段所包含字符的长度和预设文本长度,确定当前文本片段分割后的子文本所包含的目标字符数量;基于当前文本片段对应的时间区间和预设时间间隔,确定当前文本片段分割后的子本文的目标时间长度;根据目标字符数量和目标时间长度,对当前文本片段进行分割,以将当前文本片段分割为至少一个子文本。
[0006]在可选的实施方式中,上述根据当前文本片段所包含字符的长度和预设文本长度,确定当前文本片段分割后的子文本所包含的目标字符数量的步骤,包括:对当前文本片段所包含字符的长度与预设文本长度相除的结果进行向上取整,得到第一数值;将第一数值确定为当前文本片段被分割为子文本的分割数量;将当前文本片段所包含字符的长度与第一数值相除的结果,确定为目标字符数量;
[0007]上述基于当前文本片段对应的时间区间和预设时间间隔,确定当前文本片段分割后的子本文的目标时间长度的步骤,包括:对当前文本片段对应的时间区间与预设时间间隔相除的结果进行向上取整,得到第二数值;将第二数值确定为当前文本片段被分割为子文本的分割数量;将当前文本片段对应的时间区间与第二数值相除的结果,确定为目标时间长度。
[0008]在可选的实施方式中,每个文本片段所包含的字符均对应有时间戳;上述根据目标字符数量和目标时间长度,对当前文本片段进行分割,以将当前文本片段分割为至少一个子文本的步骤,包括:从当前文本片段中取出第一个字符;根据从当前文本片段中取出的字符,构建当前子文本;基于第一个字符对应的时间戳,确定当前子文本对应的字符长度和持续时长;如果字符长度小于目标字符数量且持续时长小于目标时间长度,从当前文本片段中取出第一个字符的下一个字符,将第一个字符的下一个字符确定为新的第一个字符,继续执行根据从当前文本片段中取出的字符,构建当前子文本的步骤,直到当前文本片段中的所有字符均选取完成。
[0009]在可选的实施方式中,如果字符长度不小于目标字符数量,或者持续时长不小于目标时间长度,输出当前子文本,将当前子文本确定为候选文本;判断候选文本的结尾处是否包含有预设分割符;如果不包含,从候选文本的结尾处开始回放字符,直到候选文本的结尾处为预设分割符;如果包括,将候选文本作为当前文本片段的子文本,将当前文本片段中候选文本后的字符确定为新的当前文本片段,继续执行从当前文本片段中取出第一个字符的步骤,直到当前文本片段中的所有字符均选取完成。
[0010]在可选的实施方式中,如果从候选文本的结尾处开始回放字符,无法使得候选文本的结尾处为预设分割符,则扩展候选文本,直到扩展后的候选文本的结尾处为预设分割符。
[0011]在可选的实施方式中,上述将当前子文本确定为候选文本的步骤之后,上述方法还包括:判断候选文本中相邻字符之间的时间间隔是否超过预设分割间隔;如果超过,从超过预设分割间隔的两个相邻字符的位置,将候选文本分割成两个子文本。
[0012]在可选的实施方式中,每个文本片段所包含的字符均对应有角色对象和时间戳;上述方法还包括:将每个子文本的第一个字符对应的时间戳,确定为播放子文本对应的通话音频的定位点。
[0013]在可选的实施方式中,上述对文本数据进行预处理,得到多个文本片段的步骤,包括:纠正文本数据中的拼写错误,得到纠正后的文本数据;对纠正后的文本数据进行时间插值,得到文本数据中每个字符对应的时间戳;按照角色对象,对时间插值后的文本数据进行调整,得到对话形式的文本数据。
[0014]第二方面,本专利技术提供一种音频数据的文本显示装置,该装置包括:语音识别模块,用于如果获取到音频数据,对音频数据进行语音识别,得到文本数据;预处理模块,用于对文本数据进行预处理,得到多个文本片段;文本分割模块,用于针对每个文本片段,按照预设文本长度和预设时间间隔,对当前文本片段进行文本分割,得到当前文本片段对应的至少一个子文本;文本显示模块,用于对每个文本片段对应的子文本进行排序,并显示排序结果。
[0015]本专利技术实施例带来了以下有益效果:
[0016]本专利技术提供的一种音频数据的文本显示方法和装置,如果获取到音频数据,对音频数据进行语音识别,得到文本数据;进而对文本数据进行预处理,得到多个文本片段;再针对每个文本片段,按照预设文本长度和预设时间间隔,对当前文本片段进行文本分割,得到当前文本片段对应的至少一个子文本;然后对每个文本片段对应的子文本进行排序,并显示排序结果。该方式中,按照预设文本长度和预设时间间隔分割通话记录对应的文本数
据,使得展示的每个子文本内容不会太密集,文本的展示形式更美观,结果更易读,同时该方式可帮助用户快速了解录音内容,通过生成并展示录音文本,联动播放文本对应录音,避免了听录音效率低,看文本易丢失信息的问题。
[0017]本专利技术的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本专利技术的上述技术即可得知。
[0018]为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施方式,并配合所附附图,作详细说明如下。
附图说明
[0019]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本专利技术实施例提供的一种音频数据的文本显示方法的流程图;
[0021]图2为本专利技术实施例提供的另一种音频数据的文本显示方法的本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种音频数据的文本显示方法,其特征在于,所述方法包括:如果获取到音频数据,对所述音频数据进行语音识别,得到文本数据;对所述文本数据进行预处理,得到多个文本片段;针对每个所述文本片段,按照预设文本长度和预设时间间隔,对当前文本片段进行文本分割,得到所述当前文本片段对应的至少一个子文本;对每个所述文本片段对应的子文本进行排序,并显示排序结果。2.根据权利要求1所述的方法,其特征在于,所述按照预设文本长度和预设时间间隔,对当前文本片段进行文本分割,得到所述当前文本片段对应的至少一个子文本的步骤,包括:根据所述当前文本片段所包含字符的长度和所述预设文本长度,确定所述当前文本片段分割后的子文本所包含的目标字符数量;基于所述当前文本片段对应的时间区间和所述预设时间间隔,确定所述当前文本片段分割后的子本文的目标时间长度;根据所述目标字符数量和所述目标时间长度,对所述当前文本片段进行分割,以将所述当前文本片段分割为至少一个子文本。3.根据权利要求2所述的方法,其特征在于,所述根据所述当前文本片段所包含字符的长度和所述预设文本长度,确定所述当前文本片段分割后的子文本所包含的目标字符数量的步骤,包括:对所述当前文本片段所包含字符的长度与所述预设文本长度相除的结果进行向上取整,得到第一数值;将所述第一数值确定为所述当前文本片段被分割为子文本的分割数量;将所述当前文本片段所包含字符的长度与所述第一数值相除的结果,确定为所述目标字符数量;所述基于所述当前文本片段对应的时间区间和所述预设时间间隔,确定所述当前文本片段分割后的子本文的目标时间长度的步骤,包括:对所述当前文本片段对应的时间区间与所述预设时间间隔相除的结果进行向上取整,得到第二数值;将所述第二数值确定为所述当前文本片段被分割为子文本的分割数量;将所述当前文本片段对应的时间区间与所述第二数值相除的结果,确定为所述目标时间长度。4.根据权利要求2所述的方法,其特征在于,每个所述文本片段所包含的字符均对应有时间戳;所述根据所述目标字符数量和所述目标时间长度,对所述当前文本片段进行分割,以将所述当前文本片段分割为至少一个子文本的步骤,包括:从所述当前文本片段中取出第一个字符;根据从所述当前文本片段中取出的字符,构建当前子文本;基于所述第一个字符对应的时间戳,确定所述当前子文本对应的字符长度和持续时长;如果所述字符长度小于所述目标字符数量且所述持续时长小于所述目标时间长度,从所述当前文本片段中取出所述第一个字符的下一个字符,将所述第一个字...
【专利技术属性】
技术研发人员:王建辉,杜新凯,吕超,史祎凡,崔术丰,吴岩,李根,
申请(专利权)人:阳光保险集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。