便携式翻译设备的数据交互方法、装置、设备及存储介质制造方法及图纸

技术编号：44767226 阅读：5 留言：0更新日期：2025-03-26 12:48

本申请公开了一种便携式翻译设备的数据交互方法、装置、设备及存储介质，涉及大数据资源服务技术领域，方法通过分词算法对录音数据进行分词处理，得到具有若干个分词子数据的待处理数据集；通过分类算法将待处理数据集中的每个分词子数据分类至各自声纹重合概率最高的标准发音中；构建Transformer模型并基于所使用语种对录音数据进行翻译，得到基于目标语种的标准发音并输出至便携式翻译设备以进行播放。本申请通过分类算法和分词算法协同对拾音获取到的原始录音数据进行实时识别和实时处理，再通过Transformer模型对处理后的音频数据进行翻译，相比于传统的大语言模型，本申请的翻译内容更为准确、上下文更为通顺。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及大数据资源服务，尤其涉及一种便携式翻译设备的数据交互方法、装置、设备及存储介质。

技术介绍

1、随着国际化交流的持续进行，跨语言交流对于工业、商业、科技、文化等各个领域都变得越来越重要。对于跨国企业以及国际合作项目来说，面对面语言翻译技术可以大幅提高交流效率、工作效率等，节省了大量的时间和人力成本。

2、目前为了提高多语种之间的实时交流，通常采用具有实时翻译的便携装置，大部分具有实时翻译的便携装置通常以机器翻译大语言模型通过向基础的大语言模型提供示例来激活模型的翻译能力，这种大语言模型提供了一种无需训练的翻译方法，可以根据特定翻译需求(如特定领域翻译)进行快速部署，然而这种方法受到固定参数的制约，限制了其适应性和翻译深度。

技术实现思路

1、本申请的主要目的在于提供一种便携式翻译设备的数据交互方法、装置、设备及存储介质，以解决现有技术中大语言模型翻译不准确的问题。

2、为了实现上述目的，本申请提供了如下技术方案：

3、一种便携式翻译设备的数据交互方法，所述数据交互方法应用于佩戴有便携式翻译设备的人员，所述数据交互方法包括：

4、步骤s1，根据预设策略构建语言数据库，所述语言数据库包括所有国家官方通用语言语种的标准发音；

5、步骤s2，响应于所述便携式翻译设备的语音触发信号，基于所述语音触发信号持续录制人员发音形成录音数据；

6、步骤s3，通过分词算法对录音数据进行分词处理，得到具有若干个分词子数据的待处理数据集；

7、步骤s4，通过分类算法将所述待处理数据集中的每个分词子数据分类至各自声纹重合概率最高的标准发音中；

8、步骤s5，基于同一个待处理数据集获取所有分词子数据所对应的官方通用语言语种，并将出现次数最多的官方通用语言语种定义为所述录音数据的所使用语种；

9、步骤s6，构建transformer模型并基于所述所使用语种对所述录音数据进行翻译，得到基于目标语种的标准发音；

10、步骤s7，将基于目标语种的标准发音输出至所述便携式翻译设备以进行播放。

11、作为本申请的进一步改进，步骤s2，响应于所述便携式翻译设备的语音触发信号，基于所述语音触发信号持续录制人员发音形成录音数据，包括：

12、步骤s21，获取同一个用户的若干个历史录音数据；

13、步骤s22，通过分词算法分别对每个历史录音数据进行分词处理，得到具有若干个历史分词子数据的待处理历史数据集；

14、步骤s23，将所述待处理历史数据集按照预设比例划分为训练集和样本集；

15、步骤s24，将所述训练集输入至预设神经网络模型并进行训练，得到语言习惯预测模型；

16、步骤s25，将所述样本集输入至所述语言习惯预测模型，得到语言习惯预测值；

17、步骤s26，将所述语言习惯预测值定义为同一个用户的录音数据。

18、作为本申请的进一步改进，步骤s24，将所述训练集输入至预设神经网络模型并进行训练，得到语言习惯预测模型，包括：

19、步骤s241，定义所述预设神经网络模型的拓扑关系，所述拓扑关系包括依次信号连接的输入层、隐含层、输出层；

20、步骤s242，将所述训练集输出至所述输入层，通过最小二乘估计法对所述训练集进行训练，并基于每一次训练分别获取一次所述样本集与当前次的训练结果的均方根误差；

21、步骤s243，获取所述样本集与所有训练结果的均方根误差中的极小值；

22、步骤s244，获取与所述极小值对应的训练结果以作为所述语言习惯预测模型。

23、作为本申请的进一步改进，步骤s3，通过分词算法对录音数据进行分词处理，得到具有若干个分词子数据的待处理数据集，包括：

24、步骤s31，通过sentencepiece软件对所述录音数据进行分词处理，以寻找所述录音数据的分词点；

25、步骤s32，基于所有分词点将所述录音数据分割为若干个分词；

26、步骤s33，通过解码时间标签分别对每个分词进行标记，基于一个标记得到一个分词子数据。

27、作为本申请的进一步改进，步骤s4，通过分类算法将所述待处理数据集中的每个分词子数据分类至各自声纹重合概率最高的标准发音中，包括：

28、步骤s41，定义所述待处理数据集x＝{x1,x2,…,xj,…,xm}，xj为第j个分词子数据，m为所有分词子数据的个数；

29、步骤s42，根据所述所有国家官方通用语言语种的数量定义类别集合c＝{y1,y2,…,yk,…,yn}，其中，yk为所述类别集合c中的第k个官方通用语言语种，n为所有国家官方通用语言语种的数量；

30、步骤s43，根据式(1)计算第j个分词子数据分别在每个官方通用语言语种下的条件概率：

31、

32、其中，p(x|yk)为在第k个官方通用语言语种基于所述待处理数据集x的条件概率；p(yk)为第k个官方通用语言语种的边缘概率；p(xj|yk)为第k个官方通用语言语种下第j个分词子数据的条件概率；

33、步骤s44，分别将每个分词子数据分类至各自的条件概率最高的官方通用语言语种中。

34、作为本申请的进一步改进，步骤s6，构建transformer模型并基于所述所使用语种对所述录音数据进行翻译，得到基于目标语种的标准发音，包括：

35、步骤s61，分别获取每个分词子数据的表示向量；

36、步骤s62，基于同一个待处理数据集构建包含有所有标识向量的单词表示向量矩阵；

37、步骤s63，将所述单词表示向量矩阵输入至所述transformer模型的encoderblock中，通过至少六个encoder block后得到同一个待处理数据集的编码信息矩阵；

38、步骤s64，将所述编码信息矩阵输入至所述transformer模型的decoder block中；

39、步骤s65，通过至少六个decoder block基于依次寻找所述编码信息矩阵每个编码信息所对应的目标语种分词；

40、步骤s66，依次组合所有目标语种分词得到基于目标语种的标准发音。

41、作为本申请的进一步改进，步骤s7，将基于目标语种的标准发音输出至所述便携式翻译设备以进行播放，之后，包括：

42、步骤s8，将所述录音数据、基于目标语种的标准发音存储至所述便携式翻译设备以及云端中。

43、为了实现上述目的，本申请还提供了如下技术方案：

44、一种便携式翻译设备的数据交互装置，所述数据交互装置应用于如上述的便携式翻译设备的数据交互方法，所述数据交互装置包括：

45、语言数据库构建模块，用于根据预设策略构建语言数据库，所述语言数据库包括所有国家官方通用语言语种的标准发音；...

【技术保护点】

1.一种便携式翻译设备的数据交互方法，所述数据交互方法应用于佩戴有便携式翻译设备的人员，其特征在于，所述数据交互方法包括：

2.根据权利要求1所述的数据交互方法，其特征在于，步骤S2，响应于所述便携式翻译设备的语音触发信号，基于所述语音触发信号持续录制人员发音形成录音数据，包括：

3.根据权利要求2所述的数据交互方法，其特征在于，步骤S24，将所述训练集输入至预设神经网络模型并进行训练，得到语言习惯预测模型，包括：

4.根据权利要求1所述的数据交互方法，其特征在于，步骤S3，通过分词算法对录音数据进行分词处理，得到具有若干个分词子数据的待处理数据集，包括：

5.根据权利要求1所述的数据交互方法，其特征在于，步骤S4，通过分类算法将所述待处理数据集中的每个分词子数据分类至各自声纹重合概率最高的标准发音中，包括：

6.根据权利要求1所述的数据交互方法，其特征在于，步骤S6，构建Transformer模型并基于所述所使用语种对所述录音数据进行翻译，得到基于目标语种的标准发音，包括：

7.根据权利要求1所述的数据交互

8.一种便携式翻译设备的数据交互装置，所述数据交互装置应用于如权利要求1至7中任一项所述的便携式翻译设备的数据交互方法，其特征在于，所述数据交互装置包括：

9.一种电子设备，其特征在于，包括处理器，以及与所述处理器耦接的存储器，所述存储器存储有可被所述处理器执行的程序指令；所述处理器执行所述存储器存储的所述程序指令时实现如权利要求1至7中任一项所述的一种便携式翻译设备的数据交互方法。

10.一种存储介质，其特征在于，所述存储介质内存储有程序指令，所述程序指令被处理器执行时能够实现如权利要求1至7中任一项所述的一种便携式翻译设备的数据交互方法。

...

【技术特征摘要】

1.一种便携式翻译设备的数据交互方法，所述数据交互方法应用于佩戴有便携式翻译设备的人员，其特征在于，所述数据交互方法包括：

2.根据权利要求1所述的数据交互方法，其特征在于，步骤s2，响应于所述便携式翻译设备的语音触发信号，基于所述语音触发信号持续录制人员发音形成录音数据，包括：

3.根据权利要求2所述的数据交互方法，其特征在于，步骤s24，将所述训练集输入至预设神经网络模型并进行训练，得到语言习惯预测模型，包括：

4.根据权利要求1所述的数据交互方法，其特征在于，步骤s3，通过分词算法对录音数据进行分词处理，得到具有若干个分词子数据的待处理数据集，包括：

5.根据权利要求1所述的数据交互方法，其特征在于，步骤s4，通过分类算法将所述待处理数据集中的每个分词子数据分类至各自声纹重合概率最高的标准发音中，包括：

6.根据权利要求1所述的数据交互方法，其特征在于，步骤s6，...

【专利技术属性】
技术研发人员：陈丰，白中状，杨盼盼，蔡志鹏，杨燕，杨金贵，
申请(专利权)人：云南滇能智慧能源有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人