System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文本处理方法、装置、设备、介质及产品制造方法及图纸_技高网

一种文本处理方法、装置、设备、介质及产品制造方法及图纸

技术编号:45035094 阅读:0 留言:0更新日期:2025-04-18 17:16
本申请提供了一种文本处理方法、装置、设备、介质及产品,该方法包括:获取第一文本;从第一文本中提取关键词,获得第一关键词;分别对第一文本和第一关键词进行分词处理,获得第一文本的分词结果和第一关键词的分词结果;根据第一文本的分词结果和第一关键词的分词结果,确定第一关键词的校验结果。在该方法中,结合两个分词结果,对关键词提取进行校验,避免提取到的关键词有误。由于分词处理的执行速度较快,如此,在不影响关键词提取效率的情况下,提升关键词提取的准确程度。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种文本处理方法、装置、电子设备、计算机可读存储介质以及计算机程序产品。


技术介绍

1、随着计算机技术的不断发展,对于文本处理的方式逐渐多样化,例如,在一些业务中,可以从文本中提取关键词。

2、相关技术中,从文本中提取关键词的准确程度较低,如何提升关键词提取的准确程度成为亟待解决的问题。


技术实现思路

1、本申请提供了一种文本处理方法。该方法能够在不影响关键词提取效率的情况下,提升关键词提取的准确程度。本申请还提供了上述方法对应的装置、电子设备、计算机可读存储介质以及计算机程序产品。

2、第一方面,本申请提供了一种文本处理方法,该方法包括:

3、获取第一文本;

4、从所述第一文本中提取关键词,获得第一关键词;

5、分别对所述第一文本和所述第一关键词进行分词处理,获得所述第一文本的分词结果和所述第一关键词的分词结果;

6、根据所述第一文本的分词结果和所述第一关键词的分词结果,确定所述第一关键词的校验结果。

7、在一些可能的实现方式中,所述从所述第一文本中提取关键词,获得第一关键词,包括:

8、生成第一提示词;其中,所述第一提示词包括所述第一文本和指示从所述第一文本中提取关键词的信息;

9、将所述第一提示词发送至语言模型,接收所述语言模型返回的第一关键词。

10、在一些可能的实现方式中,所述分别对所述第一文本和所述第一关键词进行分词处理,获得所述第一文本的分词结果和所述第一关键词的分词结果,包括:

11、将所述第一文本发送至分词模型,接收所述分词模型返回的所述第一文本的分词结果;以及,将所述第一关键词发送至所述分词模型,接收所述分词模型返回的所述第一关键词的分词结果。

12、在一些可能的实现方式中,所述根据所述第一文本的分词结果和所述第一关键词的分词结果,确定所述第一关键词的校验结果,包括:

13、根据所述第一文本的分词结果中分隔符所在的位置,以及,所述第一关键词的分词结果中分隔符所在的位置,确定所述第一关键词的校验结果;其中,所述分隔符用于指示不同分词。

14、在一些可能的实现方式中,在所述根据所述第一文本的分词结果和所述第一关键词的分词结果,确定所述第一关键词的校验结果之前,所述方法还包括:

15、在与所述第一关键词相邻的第一位置和第二位置,插入所述分隔符;其中,所述第一位置位于所述第一关键词之前,所述第二位置位于所述第一关键词之后。

16、在一些可能的实现方式中,所述根据所述第一文本的分词结果和所述第一关键词的分词结果,确定所述第一关键词的校验结果,包括:

17、响应于所述第一文本的分词结果和所述第一关键词的分词结果匹配,确定表征所述第一关键词正确的校验结果;

18、否则,确定表征所述第一关键词不正确的校验结果。

19、在一些可能的实现方式中,所述第一文本的分词结果和所述第一关键词的分词结果以分隔符指示,所述响应于所述第一文本的分词结果和所述第一关键词的分词结果匹配,确定表征所述第一关键词正确的校验结果,包括:

20、响应于所述第一文本的分词结果中所述分隔符所在的位置与所述第一关键词的分词结果中所述分隔符所在的位置相同,确定表征所述第一关键词正确的校验结果。

21、第二方面,本申请提供了一种文本处理装置,该装置包括:

22、获取模块,用于获取第一文本;

23、提取模块,用于从所述第一文本中提取关键词,获得第一关键词;

24、分词模块,用于分别对所述第一文本和所述第一关键词进行分词处理,获得所述第一文本的分词结果和所述第一关键词的分词结果;

25、确定模块,用于根据所述第一文本的分词结果和所述第一关键词的分词结果,确定所述第一关键词的校验结果。

26、在一些可能的实现方式中,所述提取模块具体用于:

27、生成第一提示词;其中,所述第一提示词包括所述第一文本和指示从所述第一文本中提取关键词的信息;

28、将所述第一提示词发送至语言模型,接收所述语言模型返回的第一关键词。

29、在一些可能的实现方式中,所述分词模块具体用于:

30、将所述第一文本发送至分词模型,接收所述分词模型返回的所述第一文本的分词结果;以及,将所述第一关键词发送至所述分词模型,接收所述分词模型返回的所述第一关键词的分词结果。

31、在一些可能的实现方式中,所述确定模块具体用于:

32、根据所述第一文本的分词结果中分隔符所在的位置,以及,所述第一关键词的分词结果中分隔符所在的位置,确定所述第一关键词的校验结果;其中,所述分隔符用于指示不同分词。

33、在一些可能的实现方式中,所述分词模块还用于:

34、在与所述第一关键词相邻的第一位置和第二位置,插入所述分隔符;其中,所述第一位置位于所述第一关键词之前,所述第二位置位于所述第一关键词之后。

35、在一些可能的实现方式中,所述确定模块具体用于:

36、响应于所述第一文本的分词结果和所述第一关键词的分词结果匹配,确定表征所述第一关键词正确的校验结果;

37、否则,确定表征所述第一关键词不正确的校验结果。

38、在一些可能的实现方式中,所述第一文本的分词结果和所述第一关键词的分词结果以分隔符指示,所述确定模块具体用于:

39、响应于所述第一文本的分词结果中所述分隔符所在的位置与所述第一关键词的分词结果中所述分隔符所在的位置相同,确定表征所述第一关键词正确的校验结果。

40、第三方面,本申请提供了一种电子设备,所述电子设备包括处理器和存储器。所述处理器、所述存储器进行相互的通信。所述处理器用于执行所述存储器中存储的指令,以使得电子设备执行如第一方面或第一方面的任一种实现方式中的文本处理方法。

41、第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,所述指令指示电子设备执行上述第一方面或第一方面的任一种实现方式所述的文本处理方法。

42、第五方面,本申请提供了一种包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备执行上述第一方面或第一方面的任一种实现方式所述的文本处理方法。

43、本申请在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。

44、从以上技术方案可以看出,本申请具有以下优点:

45、本申请提供了一种文本处理方法,该方法首先获取第一文本,从第一文本中提取关键词,获得第一关键词,接着,分别对第一文本和第一关键词进行分词处理,获得第一文本的分词结果和第一关键词的分词结果,根据第一文本的分词结果和第一关键词的分词结果,确定第一关键词的校验结果。

46、在该方法中,针本文档来自技高网...

【技术保护点】

1.一种文本处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述从所述第一文本中提取关键词,获得第一关键词,包括:

3.根据权利要求1所述的方法,其特征在于,所述分别对所述第一文本和所述第一关键词进行分词处理,获得所述第一文本的分词结果和所述第一关键词的分词结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述第一文本的分词结果和所述第一关键词的分词结果,确定所述第一关键词的校验结果,包括:

5.根据权利要求4所述的方法,其特征在于,在所述根据所述第一文本的分词结果和所述第一关键词的分词结果,确定所述第一关键词的校验结果之前,所述方法还包括:

6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据所述第一文本的分词结果和所述第一关键词的分词结果,确定所述第一关键词的校验结果,包括:

7.根据权利要求6所述的方法,其特征在于,所述第一文本的分词结果和所述第一关键词的分词结果以分隔符指示,所述响应于所述第一文本的分词结果和所述第一关键词的分词结果匹配,确定表征所述第一关键词正确的校验结果,包括:

8.一种文本处理装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器;

10.一种计算机可读存储介质,其特征在于,包括指令,所述指令指示电子设备执行如权利要求1至7中任一项所述的方法。

11.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机可读指令,所述计算机可读指令用于实现权利要求1至7任一项所述的方法。

...

【技术特征摘要】

1.一种文本处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述从所述第一文本中提取关键词,获得第一关键词,包括:

3.根据权利要求1所述的方法,其特征在于,所述分别对所述第一文本和所述第一关键词进行分词处理,获得所述第一文本的分词结果和所述第一关键词的分词结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述第一文本的分词结果和所述第一关键词的分词结果,确定所述第一关键词的校验结果,包括:

5.根据权利要求4所述的方法,其特征在于,在所述根据所述第一文本的分词结果和所述第一关键词的分词结果,确定所述第一关键词的校验结果之前,所述方法还包括:

6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据所述...

【专利技术属性】
技术研发人员:沈毅叶青马文佳
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1