System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文本处理方法及装置制造方法及图纸_技高网

文本处理方法及装置制造方法及图纸

技术编号:41176249 阅读:2 留言:0更新日期:2024-05-07 22:12
本说明书实施例提供了文本处理方法及装置,其中,一种文本处理方法包括:获取输入的对话文本;若所述对话文本的文本长度大于预设长度阈值,对所述对话文本进行拆分处理,得到所述对话文本的多个对话语料;对所述多个对话语料中的各对话语料进行意图识别,得到所述各对话语料的对话意图;按照所述各对话语料在所述对话文本中的文本位置,对所述对话意图进行组合处理,得到所述对话文本的意图序列;根据所述各对话语料的语料长度对所述意图序列进行掩码处理,得到所述对话文本的文本意图。采用本申请实施例能够提升对话文本的意图识别的有效性和准确度。

【技术实现步骤摘要】

本申请涉及文本处理,尤其涉及一种文本处理方法及装置


技术介绍

1、随着人工智能技术的不断发展,用户在与智能客服进行交互的过程中可输入对话文本,智能客服针对该对话文本做出响应;而为了对对话文本做出响应,需要识别对话文本的意图,了解用户的实际需求,才能根据意图对对话文本做出反馈,以解答用户在对话文本中所要呈现出的问题,在此过程中,对意图识别的识别处理能力提出了更高的要求。


技术实现思路

1、第一方面,本申请实施例提供了一种文本处理方法,包括:

2、获取输入的对话文本;

3、若所述对话文本的文本长度大于预设长度阈值,对所述对话文本进行拆分处理,得到所述对话文本的多个对话语料;

4、对所述多个对话语料中的各对话语料进行意图识别,得到所述各对话语料的对话意图;

5、按照所述各对话语料在所述对话文本中的文本位置,对所述对话意图进行组合处理,得到所述对话文本的意图序列;

6、根据所述各对话语料的语料长度对所述意图序列进行掩码处理,得到所述对话文本的文本意图。

7、可以看出,在本申请实施例中,在输入的对话文本的文本长度大于预设长度阈值的情况下,对对话文本进行拆分处理得到对话文本的多个对话语料,再对多个对话语料中各对话语料进行意图识别得到各对话语料的对话意图,以此通过将对话文本拆分为多个对话语料进行意图识别,提升意图识别的便捷性和有效性,避免文本长度过长降低意图识别的准确度,在此基础上,根据各对话语料在对话文本中的文本位置对各对话语料的对话意图进行组合处理,得到对话文本的意图序列,并根据各对话语料的语料长度对意图序列进行掩码处理得到对话文本的文本意图,以此,借助语料长度识别意图序列中各对话意图的重要性,从而通过按照重要性对意图序列进行掩码处理来提升对话文本的文本意图的针对性和有效性,避免直接将意图序列作为对话文本的文本意图导致文本意图过多继而增加对话交互次数,从而提升用户的对话体验。

8、第二方面,本申请实施例提供了一种文本处理装置,包括:

9、文本获取模块,用于获取输入的对话文本;

10、拆分模块,用于若所述对话文本的文本长度大于预设长度阈值,对所述对话文本进行拆分处理,得到所述对话文本的多个对话语料;

11、意图识别模块,用于对所述多个对话语料中的各对话语料进行意图识别,得到所述各对话语料的对话意图;

12、组合模块,用于按照所述各对话语料在所述对话文本中的文本位置,对所述对话意图进行组合处理,得到所述对话文本的意图序列;

13、掩码模块,用于根据所述各对话语料的语料长度对所述意图序列进行掩码处理,得到所述对话文本的文本意图。

14、第三方面,本申请实施例提供了一种计算机设备,包括:处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行第一方面所述的文本处理方法。

15、第四方面,本申请实施例提供了一种计算机可读存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现如第一方面所述的文本处理方法。

本文档来自技高网...

【技术保护点】

1.一种文本处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述多个对话语料中的任一对话语料,采用如下方式进行意图识别:

3.根据权利要求2所述的方法,其特征在于,所述基于所述语料向量确定所述任一对话语料的对话意图,包括:

4.根据权利要求1所述的方法,其特征在于,所述按照所述各对话语料在所述对话文本中的文本位置,对所述对话意图进行组合处理,得到所述对话文本的意图序列,包括:

5.根据权利要求1所述的方法,其特征在于,所述多个对话语料中的任一对话语料的语料长度,基于所述任一对话语料在所述对话文本中的起始位置和终止位置确定得到。

6.根据权利要求1所述的方法,其特征在于,所述根据所述各对话语料的语料长度对所述意图序列进行掩码处理,得到所述对话文本的文本意图,包括:

7.根据权利要求1所述的方法,其特征在于,还包括:

8.一种文本处理装置,其特征在于,所述装置包括:

9.一种计算机设备,其特征在于,所述设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现如权利要求1-7任一项所述的文本处理方法。

...

【技术特征摘要】

1.一种文本处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述多个对话语料中的任一对话语料,采用如下方式进行意图识别:

3.根据权利要求2所述的方法,其特征在于,所述基于所述语料向量确定所述任一对话语料的对话意图,包括:

4.根据权利要求1所述的方法,其特征在于,所述按照所述各对话语料在所述对话文本中的文本位置,对所述对话意图进行组合处理,得到所述对话文本的意图序列,包括:

5.根据权利要求1所述的方法,其特征在于,所述多个对话语料中的任一对话语料的语料长度,基于所述任一对话语料在...

【专利技术属性】
技术研发人员:白安琪
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1