TTS语音对应字幕的滚动方法、装置及存储介质制造方法及图纸

技术编号:35117831 阅读:13 留言:0更新日期:2022-10-05 09:45
本申请公开了一种TTS语音对应字幕的滚动方法、装置及存储介质。其中该方法包括:根据与音频文件对应的所有字幕的总高度和待绘制的屏幕画面中所显示的字幕的最大显示高度,确定字幕的滚动起始位置的第一百分比值,其中音频文件为经由文本转语音技术得到的音频文件;在绘制当前帧的屏幕画面的情况下,确定音频文件的当前播放进度的第二百分比值;在判定第二百分比值大于第一百分比值的情况下,根据所有字幕的总高度、滚动起始位置以及当前播放进度,确定与当前帧的屏幕画面对应的滚动条的滚动位置,其中滚动条用于在屏幕画面中滚动显示所有字幕;以及根据滚动位置,对滚动条的位置进行设置。行设置。行设置。

【技术实现步骤摘要】
TTS语音对应字幕的滚动方法、装置及存储介质


[0001]本申请涉及字幕处理
,特别是涉及一种TTS语音对应字幕的滚动方法、装置及存储介质。

技术介绍

[0002]TTS是Text To Speech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。TTS语音,通俗讲就是经由文本转语音技术得到的语音。在一些特殊场景下,播放这种TTS语音文件的时候,需要滚动展示与之对应字幕。但是由于这些场景下的TTS语音文件是根据文字转化临时生成的,其无法如同歌曲一样,提前对字幕的滚动时间设定,即无法按照预设的显示时间显示对应的字幕。因此无法对与TTS语音文件对应的字幕进行平滑、精准滚动。
[0003]针对上述的现有技术中存在的由于TTS语音文件是根据文字转化临时生成的,无法提前设定与TTS语音文件对应的字幕的显示时间,从而无法对与TTS语音文件对应的字幕进行平滑、精准滚动的技术问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本公开的实施例提供了一种TTS语音对应字幕的滚动方法、装置及存储介质,以至少解决现有技术中存在的由于TTS语音文件是根据文字转化临时生成的,无法提前设定与TTS语音文件对应的字幕的显示时间,从而无法对与TTS语音文件对应的字幕进行平滑、精准滚动的技术问题。
[0005]根据本公开实施例的一个方面,提供了一种TTS语音对应字幕的滚动方法,包括:根据与音频文件对应的所有字幕的总高度和待绘制的屏幕画面中所显示的字幕的最大显示高度,确定字幕的滚动起始位置的第一百分比值,其中音频文件为经由文本转语音技术得到的音频文件;在绘制当前帧的屏幕画面的情况下,确定音频文件的当前播放进度的第二百分比值;在判定第二百分比值大于第一百分比值的情况下,根据所有字幕的总高度、滚动起始位置以及当前播放进度,确定与当前帧的屏幕画面对应的滚动条的滚动位置,其中滚动条用于在屏幕画面中滚动显示所有字幕;以及根据滚动位置,对滚动条的位置进行设置。
[0006]根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
[0007]根据本公开实施例的另一个方面,还提供了一种TTS语音对应字幕的滚动装置,包括:第一确定模块,用于根据与音频文件对应的所有字幕的总高度和待绘制的屏幕画面中所显示的字幕的最大显示高度,确定字幕的滚动起始位置的第一百分比值,其中音频文件为经由文本转语音技术得到的音频文件;第二确定模块,用于在绘制当前帧的屏幕画面的情况下,确定音频文件的当前播放进度的第二百分比值;第三确定模块,用于在判定第二百分比值大于第一百分比值的情况下,根据所有字幕的总高度、滚动起始位置以及当前播放
进度,确定与当前帧的屏幕画面对应的滚动条的滚动位置,其中滚动条用于在屏幕画面中滚动显示所有字幕;以及设置模块,用于根据滚动位置,对滚动条的位置进行设置。
[0008]根据本公开实施例的另一个方面,还提供了一种TTS语音对应字幕的滚动装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:根据与音频文件对应的所有字幕的总高度和待绘制的屏幕画面中所显示的字幕的最大显示高度,确定字幕的滚动起始位置的第一百分比值,其中音频文件为经由文本转语音技术得到的音频文件;在绘制当前帧的屏幕画面的情况下,确定音频文件的当前播放进度的第二百分比值;在判定第二百分比值大于第一百分比值的情况下,根据所有字幕的总高度、滚动起始位置以及当前播放进度,确定与当前帧的屏幕画面对应的滚动条的滚动位置,其中滚动条用于在屏幕画面中滚动显示所有字幕;以及根据滚动位置,对滚动条的位置进行设置。
[0009]在本公开实施例中,首先通过与经由文本转语音技术得到的音频文件对应的所有字幕的总高度和待绘制的屏幕画面中所显示的字幕的最大显示高度,确定字幕的滚动起始位置的值,然后确定经由文本转语音技术得到的音频文件的当前播放进度,最后根据所有字幕的总高度、滚动起始位置以及当前播放进度,确定与当前帧的屏幕画面对应的滚动条的滚动位置,从而对当前帧的屏幕画面中的滚动条的位置进行精准设置。通过将完成滚动条位置的准确设置的所有帧的屏幕画面连贯起来,就实现了可以根据TTS语音的播放进度对屏幕显示的字幕进行平滑、精准滚动的技术效果。进而解决了现有技术中存在的由于TTS语音文件是根据文字转化临时生成的,无法提前设定与TTS语音文件对应的字幕的显示时间,从而无法对与TTS语音文件对应的字幕进行平滑、精准滚动的技术问题。
附图说明
[0010]此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
[0011]图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;
[0012]图2是根据本公开实施例1所述的TTS语音对应字幕的滚动方法的流程示意图;
[0013]图3a是根据本公开实施例1所述的待绘制的屏幕画面中所显示的字幕的最大显示高度的示意图;
[0014]图3b是根据本公开实施例1所述的与音频文件对应的所有字幕的总高度的示意图;
[0015]图3c是根据本公开实施例1所述的根据计算得到的滚动位置对滚动条的位置进行设置后显示出来的字幕的一个示意图;
[0016]图3d是根据本公开实施例1所述的根据计算得到的滚动位置对滚动条的位置进行设置后显示出来的字幕的另一个示意图;
[0017]图3e是根据本公开实施例1所述的根据计算得到的滚动位置对滚动条的位置进行设置后显示出来的字幕的另一个示意图;
[0018]图4是根据本公开实施例1所述的每行字幕对应的音频片段以及音频播放进度的示意图;
[0019]图5是根据本公开实施例1所述的TTS语音对应字幕的滚动方法的整体流程示意图;
[0020]图6是根据本公开实施例2所述的TTS语音对应字幕的滚动装置的示意图;以及
[0021]图7是根据本公开实施例3所述的TTS语音对应字幕的滚动装置的示意图。
具体实施方式
[0022]为了使本
的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
[0023]需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种TTS语音对应字幕的滚动方法,其特征在于,包括:根据与音频文件对应的所有字幕的总高度和待绘制的屏幕画面中所显示的字幕的最大显示高度,确定所述字幕的滚动起始位置的第一百分比值,其中所述音频文件为经由文本转语音技术得到的音频文件;在绘制当前帧的屏幕画面的情况下,确定所述音频文件的当前播放进度的第二百分比值;在判定所述第二百分比值大于所述第一百分比值的情况下,根据所述所有字幕的总高度、所述滚动起始位置以及所述当前播放进度,确定与所述当前帧的屏幕画面对应的滚动条的滚动位置,其中所述滚动条用于在所述屏幕画面中滚动显示所述所有字幕;以及根据所述滚动位置,对所述滚动条的位置进行设置。2.根据权利要求1所述的方法,其特征在于,根据与音频文件对应的所有字幕的总高度和待绘制的屏幕画面中所显示的字幕的最大显示高度,确定所述字幕的滚动起始位置的第一百分比值的操作,包括:计算所述字幕的最大显示高度与所述所有字幕的总高度的比值;以及将所述比值的二分之一值确定为所述第一百分比值。3.根据权利要求1所述的方法,其特征在于,根据所述所有字幕的总高度、所述滚动起始位置以及所述当前播放进度,确定与所述当前帧的屏幕画面对应的滚动条的滚动位置的操作,包括:求取所述当前播放进度与所述滚动起始位置之间的差值;以及根据所述差值和所述所有字幕的总高度,确定与所述当前帧的屏幕画面对应的滚动条的滚动位置。4.根据权利要求1所述的方法,其特征在于,在绘制当前帧的屏幕画面的情况下,确定所述音频文件的当前播放进度的操作,包括:从预设的用于播放所述音频文件的系统API工具类获取当前播放的音频文件的当前播放长度和所述音频文件的总长度;以及根据所获取的当前播放长度和所述总长度,确定所述音频文件的当前播放进度。5.根据权利要求1所述的方法,其特征在于,还包括:根据每行字幕的行宽与所述所有字幕的行宽总和的比例,从所述音频文件中确定每行字幕对应的音频片段;根据每行字幕所对应的音频片段在所述音频文件中的音频位置,确定在完成每行字幕的显示的时刻下所述音频文件的音频播放进度;根据所述音频播放进度和所述当前播放进度,确定所述当前帧的屏幕画面中显示的字幕的染色范围;以及根据所确定的染色范围,对所述当前帧的屏幕画面中显示的字幕进行染色。6.根据权利要求5所述的方法,其特征在于,根据所述音频播放进度和所述当前播放进度,确定所述当前帧的屏幕画面中显示的...

【专利技术属性】
技术研发人员:刘腾腾王洪斌夏溧蒋宁吴海英杨磊
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1