System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 同传质量评测方法及相关装置、设备和存储介质制造方法及图纸_技高网

同传质量评测方法及相关装置、设备和存储介质制造方法及图纸

技术编号:44080709 阅读:12 留言:0更新日期:2025-01-17 16:14
本申请公开了一种同传质量评测方法及相关装置、设备和存储介质,其中,同传质量评测方法包括:基于目标语音的同传文本进行切分,得到若干子文本;获取目标语音中与子文本相对应子语音的刷字数据;其中,子语音的刷字数据包括:子语音在同传过程中从首次出字到逐渐修正直至最终翻译为子文本的若干文本;基于子语音的刷字数据,分析得到子语音的同传质量分;基于各个子语音的同传质量分,融合得到表征目标语音同传质量的目标分值。上述方案,能够在流式同传的应用场景下,提升同传质量评测的准确性。

【技术实现步骤摘要】

本申请涉及自然语言处理,特别是涉及一种同传质量评测方法及相关装置、设备和存储介质


技术介绍

1、得益于机器学习的不断发展,将大模型应用至同声传译已经取得相当程度进展。不同于传统同传,大模型同传要求在用户输入语音的同时,直接流式生成对应的翻译结果,而无需经过识别再翻译。因此,端到端地评测同传质量显得尤为重要。

2、但是,现有评测方式通常适用于传统同传,若应用于大模型同传,则将难以真实反映同传质量。有鉴于此,如何在流式同传的应用场景下,提升同传质量评测的准确性,成为亟待解决的问题。


技术实现思路

1、本申请主要解决的技术问题是提供一种同传质量评测方法及相关装置、设备和存储介质,能够在流式同传的应用场景下,提升同传质量评测的准确性。

2、为了解决上述技术问题,本申请第一方面提供了一种同传质量评测方法,包括:基于目标语音的同传文本进行切分,得到若干子文本;获取目标语音中与子文本相对应子语音的刷字数据;其中,子语音的刷字数据包括:子语音在同传过程中从首次出字到逐渐修正直至最终翻译为子文本的若干文本;基于子语音的刷字数据,分析得到子语音的同传质量分;基于各个子语音的同传质量分,融合得到表征目标语音同传质量的目标分值。

3、为了解决上述技术问题,本申请第二方面提供了一种同传质量评测装置,包括:文本切分模块、数据获取模块、质量分析模块和评分融合模块,文本切分模块,用于基于目标语音的同传文本进行切分,得到若干子文本;数据获取模块,用于获取目标语音中与子文本相对应子语音的刷字数据;其中,子语音的刷字数据包括:子语音在同传过程中从首次出字到逐渐修正直至最终翻译为子文本的若干文本;质量分析模块,用于基于子语音的刷字数据,分析得到子语音的同传质量分;评分融合模块,用于基于各个子语音的同传质量分,融合得到表征目标语音同传质量的目标分值。

4、为了解决上述技术问题,本申请第三方面提供了一种电子设备,至少包括相互耦接的存储器和处理器,存储器中至少存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的同传质量评测方法。

5、为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面的同传质量评测方法。

6、上述方案,基于目标语音的同传文本进行切分,得到若干子文本,获取目标语音中与子文本相对应子语音的刷字数据,且子语音的刷字数据包括:子语音在同传过程中从首次出字到逐渐修正直至最终翻译为子文本的若干文本,再基于子语音的刷字数据,分析得到子语音的同传质量分,进而基于各子语音的同传质量分,融合得到表征目标语音同传质量的目标分值,故一方面通过将同传文本划分为若干子文本,再对每一子文本分别相对应子语音进行同传质量评价并最终进行分值融合,相较于结合目标语音及其同传文本进行整体质量评测而言,能够进一步细化评测粒度,有助于在一定程度上提升同传质量评测的准确性,另一方面在对每一子语音进行评测时由于结合子语音的刷字数据,且刷字数据包括子语音在同传过程中从首次出字到逐渐修正直至最终翻译为子文本的若干文本,故在对子语音进行同传质量评测过程中能够关注同传过程,有助于在流式同传的应用场景下衡量刷字过程中的同传质量。故此,能够在流式同传的应用场景下,提升同传质量评测的准确性。

本文档来自技高网...

【技术保护点】

1.一种同传质量评测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于目标语音的同传文本进行切分,得到若干子文本,包括:

3.根据权利要求1所述的方法,其特征在于,在同传质量以出字响应时间为评价指标的情况下,所述基于所述子语音的刷字数据,分析得到所述子语音的同传质量分,包括:

4.根据权利要求1所述的方法,其特征在于,在同传质量以结果响应时间为评价指标的情况下,所述基于所述子语音的刷字数据,分析得到所述子语音的同传质量分,包括:

5.根据权利要求1所述的方法,其特征在于,在同传质量以刷字比作为评价指标的情况下,所述基于所述子语音的刷字数据,分析得到所述子语音的同传质量分,包括:

6.根据权利要求1所述的方法,其特征在于,在同传质量以跳变度作为评价指标的情况下,所述基于所述子语音的刷字数据,分析得到所述子语音的同传质量分,包括:

7.根据权利要求6所述的方法,其特征在于,所述基于所述当前文本与所述参考文本各自的总长度,得到第一长度,包括:

8.根据权利要求1所述的方法,其特征在于,所述基于各个所述子语音的同传质量分,融合得到表征所述目标语音同传质量的目标分值,包括:

9.根据权利要求1至8任一项所述的方法,其特征在于,同传质量以若干种评价指标进行评测,且所述若干种评价指标包括:出字响应时间、结果响应时间、刷字比、跳变度中至少一者;

10.一种同传质量评测装置,其特征在于,包括:

11.一种电子设备,其特征在于,至少包括相互耦接的存储器和处理器,所述存储器中至少存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至9任一项所述的同传质量评测方法。

12.一种计算机可读存储介质,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至9任一项所述的同传质量评测方法。

...

【技术特征摘要】

1.一种同传质量评测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于目标语音的同传文本进行切分,得到若干子文本,包括:

3.根据权利要求1所述的方法,其特征在于,在同传质量以出字响应时间为评价指标的情况下,所述基于所述子语音的刷字数据,分析得到所述子语音的同传质量分,包括:

4.根据权利要求1所述的方法,其特征在于,在同传质量以结果响应时间为评价指标的情况下,所述基于所述子语音的刷字数据,分析得到所述子语音的同传质量分,包括:

5.根据权利要求1所述的方法,其特征在于,在同传质量以刷字比作为评价指标的情况下,所述基于所述子语音的刷字数据,分析得到所述子语音的同传质量分,包括:

6.根据权利要求1所述的方法,其特征在于,在同传质量以跳变度作为评价指标的情况下,所述基于所述子语音的刷字数据,分析得到所述子语音的同传质量分,包括:

7...

【专利技术属性】
技术研发人员:田定书李如子殷运鹏张蔡辉王浩洋高建清刘聪
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1