多人对话语音转录方法、装置、设备、介质及程序产品制造方法及图纸

技术编号：42130041 阅读：23 留言：0更新日期：2024-07-25 00:44

本申请公开了一种多人对话语音转录方法、装置、设备、介质及程序产品，涉及信息领域，以解决现有多人对话转录技术转录效果较差的问题。该方法包括：客户端接收服务端发送的多人对话场景下的即时消息，包含说话人身份标识、第一对话文本及其状态属性；在对话页面视图中显示的多人对话数据中存在说话人身份标识对应的对话文本的情况下，根据预先存储的第二对话文本的状态属性，利用第一对话文本更新多人对话数据中说话人身份标识对应的对话文本，以更新对话页面视图，第二对话文本为多人对话数据中说话人身份标识对应的最后一条对话文本。本申请实施例能够确保多人对话文本按说话人和说话状态合理有序且不重复地显示，提升多人对话转录文本效果。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及信息领域，尤其涉及一种多人对话语音转录方法、装置、设备、介质及程序产品。

技术介绍

1、在一些对多人语音对话进行实时文本转录的应用场景下，例如，多人在线会议等场景下，需要将多人对话语音转录成文本形式的会议纪要，现有的技术方案是简单的将多人对话语音按接收时间转换成文本，并将文本内容逐条放入到列表视图组件中，这样，导致最终在客户端上展示的大量、多人的实时对话文本，存在断句换行不合常理、多人对话顺序混乱以及部分内容重复显示等诸多问题。可见，现有多人对话转录技术的转录效果较差。

技术实现思路

1、本申请实施例提供一种多人对话语音转录方法、装置、设备、介质及程序产品，以解决现有多人对话转录技术的转录效果较差的问题。

2、第一方面，本申请实施例提供了一种多人对话语音转录方法，包括：

3、接收服务端发送的多人对话场景下的即时消息，其中，所述即时消息包含说话人身份标识、第一对话文本和所述第一对话文本的状态属性，所述第一对话文本为所述服务端接收到的对话语音信息对应的对话文本，所述状态属性用于指示对话文本的语句完整性；

4、在对话页面视图中显示的多人对话数据中存在所述说话人身份标识对应的对话文本的情况下，根据预先存储的第二对话文本的状态属性，利用所述第一对话文本更新所述多人对话数据中所述说话人身份标识对应的对话文本，以更新所述对话页面视图，其中，所述第二对话文本为接收所述第一对话文本之前所述多人对话数据中存在的所述说话人身份标识对应的最后一条对话文本。p>

5、可选地，所述接收服务端发送的多人对话场景下的即时消息之后，所述方法还包括：

6、在所述多人对话数据中不存在所述说话人身份标识对应的对话文本的情况下，将所述说话人身份标识和所述第一对话文本作为一条新增对话数据加载至所述多人对话数据。

7、可选地，所述根据预先存储的第二对话文本的状态属性，利用所述第一对话文本更新所述多人对话数据中所述说话人身份标识对应的对话文本，包括：

8、在所述第二对话文本的状态属性为中间态的情况下，利用所述第一对话文本替换所述第二对话文本，并记录所述第一对话文本的状态属性，其中，所述第一对话文本包含所述第二对话文本，所述中间态指示对话文本的语句不完整；

9、在所述第二对话文本的状态属性为最终态的情况下，将所述说话人身份标识和所述第一对话文本作为一条新增对话数据加载至所述多人对话数据，并记录所述第一对话文本的状态属性，其中，所述最终态指示对话文本的语句完整。

10、可选地，所述接收服务端发送的多人对话场景下的即时消息之前，所述方法还包括：

11、创建说话人集合、新增对话列表和最终对话列表，其中，所述新增对话列表用于存储新增对话数据，所述最终对话列表用于存储所述多人对话数据；

12、所述接收服务端发送的多人对话场景下的即时消息之后，所述根据预先存储的第二对话文本的状态属性，利用所述第一对话文本更新所述多人对话数据中所述说话人身份标识对应的对话文本之前，所述方法还包括：

13、在非首次接收所述服务端的即时消息的情况下，清空所述新增对话列表；

14、所述在对话页面视图中显示的多人对话数据中存在所述说话人身份标识对应的对话文本的情况下，根据预先存储的第二对话文本的状态属性，利用所述第一对话文本更新所述多人对话数据中所述说话人身份标识对应的对话文本，包括：

15、在所述说话人集合不为空，且所述说话人集合中包含所述说话人身份标识的情况下，根据所述说话人集合中存储的所述说话人身份标识关联的第二对话文本的状态属性，利用所述第一对话文本更新所述最终对话列表中所述说话人身份标识对应的对话文本。

16、可选地，所述接收服务端发送的多人对话场景下的即时消息之前，所述方法还包括：

17、创建说话人集合、新增对话列表和最终对话列表，其中，所述新增对话列表用于存储新增对话数据，所述最终对话列表用于存储所述多人对话数据；

18、所述接收服务端发送的多人对话场景下的即时消息之后，所述将所述说话人身份标识和所述第一对话文本作为一条新增对话数据加载至所述多人对话数据之前，所述方法还包括：

19、在非首次接收所述服务端的即时消息的情况下，清空所述新增对话列表；

20、所述在所述多人对话数据中不存在所述说话人身份标识对应的对话文本的情况下，将所述说话人身份标识和所述第一对话文本作为一条新增对话数据加载至所述多人对话数据，包括：

21、在所述说话人集合为空，或者在所述说话人集合不为空，且所述说话人集合中不包含所述说话人身份标识的情况下，将所述说话人身份标识和所述第一对话文本作为一条新增对话数据存入所述新增对话列表，以及将所述说话人身份标识和所述第一对话文本的状态属性关联存入所述说话人集合，并将所述新增对话列表添加至所述最终对话列表。

22、可选地，所述在所述第二对话文本的状态属性为中间态的情况下，利用所述第一对话文本替换所述第二对话文本，包括：

23、在所述第二对话文本的状态属性为中间态的情况下，按照所述中间态对应的定时更新间隔时间，利用所述第一对话文本替换所述第二对话文本；

24、所述在所述第二对话文本的状态属性为最终态的情况下，将所述说话人身份标识和所述第一对话文本作为一条新增对话数据加载至所述多人对话数据，包括：

25、在所述第二对话文本的状态属性为最终态的情况下，按照所述最终态对应的定时更新间隔时间，将所述说话人身份标识和所述第一对话文本作为一条新增对话数据加载至所述多人对话数据。

26、可选地，所述方法还包括：

27、在当前所述多人对话数据的大小超过预设阈值的情况下，按所述多人对话数据中各条对话数据的对话时间先后顺序，删除所述多人对话数据中的前n条对话数据，n为正整数。

28、可选地，所述方法还包括：

29、在接收到针对所述对话页面视图的加载历史对话数据的操作的情况下，基于所述对话页面视图顶部的对话数据的时间点，从所述服务端获取所述时间点之前的预设数量的历史对话数据，并在所述对话页面视图中加载显示所述预设数量的历史对话数据。

30、第二方面，本申请实施例还提供另一种多人对话语音转录方法，由服务端执行，所述方法包括：

31、接收第一客户端发送的在多人对话场景下采集的对话语音信息；

32、将所述对话语音信息转换成即时消息，其中，所述即时消息包含说话人身份标识、所述对话语音信息对应的第一对话文本，以及所述第一对话文本的状态属性，所述状态属性用于指示对话文本的语句完整性；

33、向第二客户端发送所述即时消息。

34、可选地，所述将所述对话语音信息转换成即时消息，包括：

35、将所述对话语音信息转换成第一对话文本，并确定所述对话语音信息对应的说话人身份标识；

36、对所述对话语音信本文档来自技高网...

【技术保护点】

1.一种多人对话语音转录方法，其特征在于，由客户端执行，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述接收所述服务端发送的多人对话场景下的即时消息之后，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，所述根据预先存储的第二对话文本的状态属性，利用所述第一对话文本更新所述多人对话数据中所述说话人身份标识对应的对话文本，包括：

4.根据权利要求1所述的方法，其特征在于，所述接收服务端发送的多人对话场景下的即时消息之前，所述方法还包括：

5.根据权利要求2所述的方法，其特征在于，所述接收服务端发送的多人对话场景下的即时消息之前，所述方法还包括：

6.一种多人对话语音转录方法，其特征在于，由服务端执行，所述方法包括：

7.根据权利要求6所述的方法，其特征在于，所述将所述对话语音信息转换成即时消息，包括：

8.一种电子设备，包括：收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序；其特征在于，所述处理器，用于读取存储器中的程序实现如权利要求1至5中任一项

9.一种计算机可读存储介质，用于存储计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的多人对话语音转录方法中的步骤；或者实现如权利要求6至7中任一项所述的多人对话语音转录方法中的步骤。

10.一种计算机程序产品，其特征在于，包括计算机指令，所述计算机指令被处理器执行时实现如权利要求1至7中任一项所述的方法中的步骤。

...

【技术特征摘要】

1.一种多人对话语音转录方法，其特征在于，由客户端执行，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述接收所述服务端发送的多人对话场景下的即时消息之后，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，所述接收服务端发送的多人对话场景下的即时消息之前，所述方法还包括：

5.根据权利要求2所述的方法，其特征在于，所述接收服务端发送的多人对话场景下的即时消息之前，所述方法还包括：

6.一种多人对话语音转录方法，其特征在于，由服务端执行，所述方法包括：

7.根据权利要求6所...

【专利技术属性】
技术研发人员：徐楠，郭啸，李伯龙，刘小东，刘宏，
申请(专利权)人：咪咕文化科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人