System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种内容检测方法、系统、设备及介质技术方案_技高网

一种内容检测方法、系统、设备及介质技术方案

技术编号:43405386 阅读:10 留言:0更新日期:2024-11-22 17:44
本申请提供了一种内容检测方法、系统、设备及介质,该方法包括:持续接收语言模型流式输出的输出内容;根据设定的采样策略,从已输出的输出内容中,确定内容切片;对内容切片进行内容检测,获得内容切片的检测结果;将经过内容检测的输出内容传输至客户端,以使输出内容在客户端以流式输出的方式展示。在该方法中,在语言模型采用流式输出的方式进行内容输出的过程中,能够实现“边输出边检测”,提升内容检测的实时性。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种内容检测方法、系统、电子设备以及计算机可读存储介质。


技术介绍

1、随着计算机技术的快速发展,数字助手应运而生。用户可以通过人机对话的方式与数字助手进行交互,具体地,用户可以通过数字助手输入问题信息,数字助手通过分析问题信息,可以生成针对该问题信息的回复信息,从而实现人机对话。

2、通常情况下,考虑到回复信息较长,数字助手可以采用流式输出的方式进行内容输出,并将输出内容以流式输出的方式传输至客户端,避免用户长时间的等待。

3、相关技术中,为了避免回复信息中存在不适当内容(例如是不希望向用户呈现的内容),在回复信息生成完成后,可以针对回复信息进行内容检测。然而,在上述内容检测的过程中,从回复信息生成至内容检测完成之间的耗时较长,难以保证内容检测的实时性。


技术实现思路

1、本申请提供了一种内容检测方法。该方法能够在语言模型流式输出回复信息的过程中进行内容检测,提升内容检测的实时性。本申请还提供了上述方法对应的系统、电子设备、计算机可读存储介质以及计算机程序产品。

2、第一方面,本申请提供了一种内容检测方法,所述方法包括:

3、持续接收语言模型流式输出的输出内容;

4、根据设定的采样策略,从已输出的所述输出内容中,确定内容切片;内容切片

5、对所述内容切片进行内容检测,获得所述内容切片的检测结果;

6、将经过内容检测的所述输出内容传输至客户端,以使所述输出内容在所述客户端以流式输出的方式展示。

7、在一些可能的实现方式中,所述根据设定的采样策略,从已输出的所述输出内容中,确定内容切片,包括:

8、根据设定的滑动窗口和/或设定的步程,从已输出的所述输出内容中,确定内容切片;其中,所述滑动窗口用于确定所述内容切片中回复字符的数量,所述步程用于确定两次相邻内容检测的内容切片之间的差异。

9、在一些可能的实现方式中,所述根据设定的滑动窗口和/或设定的步程,从已输出的所述输出内容中,确定内容切片,包括:

10、根据设定的步程,在字符序列中向后移动设定的滑动窗口;其中,所述字符序列由已输出的所述输出内容中的多个回复字符组成;

11、响应于所述滑动窗口中所述回复字符的数量达到所述滑动窗口的长度,将所述滑动窗口中的所述回复字符确定为内容切片。

12、在一些可能的实现方式中,所述方法还包括:

13、响应于所述语言模型开始流式输出所述输出内容,确定所述滑动窗口在所述字符序列中的位置为所述字符序列的前端;

14、响应于所述滑动窗口中所述回复字符的数量达到第一预设长度,将所述滑动窗口中的所述回复字符确定为第一次内容检测的内容切片,其中,所述第一预设长度小于所述滑动窗口的长度。

15、在一些可能的实现方式中,在完成所述第一次内容检测后,所述方法还包括:

16、保持所述滑动窗口在所述字符序列中的位置;

17、响应于所述滑动窗口中所述回复字符的数量达到所述滑动窗口的长度,将所述滑动窗口中的所述回复字符确定为第二次内容检测的内容切片。

18、在一些可能的实现方式中,所述对所述内容切片进行内容检测,获得所述内容切片的检测结果,包括:

19、将所述内容切片输入内容检测模型,接收所述内容检测模型输出的检测结果;其中,所述内容检测模型具有自然语言分析能力。

20、在一些可能的实现方式中,所述方法还包括:

21、根据所述内容切片的检测结果,确定针对所述内容切片的处理策略;其中,所述处理策略包括以下至少一种:用于指示所述语言模型是否继续流式输出所述输出内容的策略、用于指示是否呈现所述输出内容的策略、用于指示呈现内容的策略。

22、在一些可能的实现方式中,所述检测结果表征所述内容切片通过内容检测,所述根据所述内容切片的检测结果,确定针对所述内容切片的处理策略,包括:

23、指示所述语言模型继续流式输出所述输出内容;以及,

24、指示所述客户端在对话页面中呈现目标回复字符;其中,所述对话页面用于与数字助手进行交互,所述目标回复字符为所述内容切片中未在所述对话页面呈现的回复字符。

25、在一些可能的实现方式中,所述检测结果表征所述内容切片未通过内容检测,所述根据所述内容切片的检测结果,确定针对所述内容切片的处理策略,包括:

26、指示所述语言模型停止流式输出所述输出内容;以及,

27、指示所述客户端将对话页面中已呈现的回复字符替换为默认字符。

28、第二方面,本申请提供了一种内容检测系统,所述系统包括:

29、接收模块,用于持续接收语言模型流式输出的输出内容;

30、确定模块,用于根据设定的采样策略,从已输出的所述输出内容中,确定内容切片;

31、检测模块,用于对所述内容切片进行内容检测,获得所述内容切片的检测结果;

32、传输模块,用于将经过内容检测的所述输出内容传输至客户端,以使所述输出内容在所述客户端以流式输出的方式展示。

33、在一些可能的实现方式中,所述确定模块具体用于:

34、根据设定的滑动窗口和/或设定的步程,从已输出的所述输出内容中,确定内容切片;其中,所述滑动窗口用于确定所述内容切片中回复字符的数量,所述步程用于确定两次相邻内容检测的内容切片之间的差异。

35、在一些可能的实现方式中,所述确定模块具体用于:

36、根据设定的步程,在字符序列中向后移动设定的滑动窗口;其中,所述字符序列由已输出的所述输出内容中的多个回复字符组成;

37、响应于所述滑动窗口中所述回复字符的数量达到所述滑动窗口的长度,将所述滑动窗口中的所述回复字符确定为内容切片。

38、在一些可能的实现方式中,所述确定模块还用于:

39、响应于所述语言模型开始流式输出所述输出内容,确定所述滑动窗口在所述字符序列中的位置为所述字符序列的前端;

40、响应于所述滑动窗口中所述回复字符的数量达到第一预设长度,将所述滑动窗口中的所述回复字符确定为第一次内容检测的内容切片,其中,所述第一预设长度小于所述滑动窗口的长度。

41、在一些可能的实现方式中,在完成所述第一次内容检测后,所述确定模块还用于:

42、保持所述滑动窗口在所述字符序列中的位置;

43、响应于所述滑动窗口中所述回复字符的数量达到所述滑动窗口的长度,将所述滑动窗口中的所述回复字符确定为第二次内容检测的内容切片。

44、在一些可能的实现方式中,所述检测模块具体用于:

45、将所述内容切片输入内容检测模型,接收所述内容检测模型输出的检测结果;其中,所述内容检测模型具有自然语言分析能力。

46、在一些可能的实现方式中,所述确定模块还用于:

4本文档来自技高网...

【技术保护点】

1.一种内容检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据设定的采样策略,从已输出的所述输出内容中,确定内容切片,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据设定的滑动窗口和/或设定的步程,从已输出的所述输出内容中,确定内容切片,包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,在完成所述第一次内容检测后,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述对所述内容切片进行内容检测,获得所述内容切片的检测结果,包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.根据权利要求7所述的方法,其特征在于,所述检测结果表征所述内容切片通过内容检测,所述根据所述内容切片的检测结果,确定针对所述内容切片的处理策略,包括:

9.根据权利要求7所述的方法,其特征在于,所述检测结果表征所述内容切片未通过内容检测,所述根据所述内容切片的检测结果,确定针对所述内容切片的处理策略,包括:

10.一种内容检测系统,其特征在于,所述系统包括:

11.一种电子设备,其特征在于,所述电子设备包括处理器和存储器;

12.一种计算机可读存储介质,其特征在于,包括指令,所述指令指示电子设备执行如权利要求1至9中任一项所述的方法。

...

【技术特征摘要】

1.一种内容检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据设定的采样策略,从已输出的所述输出内容中,确定内容切片,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据设定的滑动窗口和/或设定的步程,从已输出的所述输出内容中,确定内容切片,包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,在完成所述第一次内容检测后,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述对所述内容切片进行内容检测,获得所述内容切片的检测结果,包括:

7.根据权利要求1所...

【专利技术属性】
技术研发人员:陶钧天诸捷胡皓宇许磊胡晓鸣林建文
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1