System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及文本处理,尤其涉及一种文本语义相似性的判断方法、电子设备、存储介质及产品。
技术介绍
1、随着文本处理技术的飞速发展,通过比较两个文本在语义上的相似程度,能够在各种应用场景中实现高效、准确的信息处理和决策制定。
2、目前,对两段文本的语义进行相似性判断时,通常是使用预设的模型分别提取两段文本的句向量特征,进而根据预设的相似性函数算法,来计算两段文本的句向量特征的语义相似性。
3、但是,上述方式判断的两段文本的语义相似性不够准确,影响用户体验。
技术实现思路
1、本申请实施例提供的文本语义相似性的判断方法、电子设备、存储介质及产品,用以提高两段文本语义相似性判断结果的准确性。
2、第一方面,本申请实施例提供一种文本语义相似性的判断方法,包括:
3、获取目标文本以及与所述目标文本相似的标准文本;
4、计算所述目标文本与所述标准文本的相似度;
5、若所述相似度超过预设的相似度阈值,则对所述目标文本中包括的数字与所述标准文本中包括的数字进行一致性判断,得到数字的判断结果;
6、若所述数字的判断结果指示一致,则对所述目标文本中包括的命名体与所述标准文本中包括的命名体进行一致性判断,得到命名体的判断结果;
7、若所述命名体的判断结果指示一致,则输出用于指示所述目标文本的语义与所述标准文本的语义相似的提示信息。
8、在一种可能的实施方式中,所述对所述目标文本中包括的数字与所述标准
9、基于预设的正则匹配算法,根据所述目标文本中出现的数字的顺序,依次提取所述目标文本中包括的数字,以及根据所述标准文本中出现的数字的顺序,依次提取所述标准文本中包括的数字;
10、根据提取顺序,将所述目标文本中包括的数字依次与所述标准文本中包括的数字进行一致性判断,得到所述数字的判断结果;
11、其中,所述数字的判断结果用于指示所述目标文本中包括的数字与所述标准文本中包括的数字是否相同。
12、在一种可能的实施方式中,所述对所述目标文本中包括的命名体与所述标准文本中包括的命名体进行一致性判断,得到命名体的判断结果,包括:
13、基于预设的第一语言模型,设置命名体包含的实体对象的标签;
14、基于所述实体对象的标签,根据所述目标文本中出现的标签的顺序,依次识别所述目标文本中包括的命名体,以及根据所述标准文本中出现的标签的顺序,依次识别所述标准文本中包括的命名体;
15、根据识别顺序,将所述目标文本中包括的命名体依次与所述标准文本中包括的命名体进行一致性判断,得到所述命名体的判断结果;
16、其中,所述命名体的判断结果用于指示所述目标文本中包括的命名体与所述标准文本中包括的命名体是否相同。
17、在一种可能的实施方式中,所述计算所述目标文本与所述标准文本的相似度,包括:
18、基于预设的第二语言模型,获取所述目标文本的句子向量特征以及所述标准文本的句子向量特征;
19、基于预设的余弦函数算法,对所述目标文本的句子向量特征以及所述标准文本的句子向量特征进行相似度计算,得到所述相似度。
20、在一种可能的实施方式中,所述获取目标文本以及与所述目标文本相似的标准文本之后,还包括:
21、基于预设的比较算法,对所述目标文本与所述标准文本进行文字内容相似性判断,得到判断结果,所述判断结果无法指示所述目标文本中包括的数字和命名体是否与所述标准文本中包括的数字和命名体一致;
22、若所述判断结果指示所述目标文本与所述标准文本的文字内容相似,则执行所述计算所述目标文本与所述标准文本的相似度的步骤。
23、在一种可能的实施方式中,所述方法还包括:
24、若所述命名体的判断结果指示不一致,则输出用于指示所述目标文本的语义与所述标准文本的语义不相似的提示信息。
25、第二方面,本申请实施例提供一种文本语义相似性的判断装置,包括:
26、获取模块,用于获取目标文本以及与所述目标文本相似的标准文本;
27、计算模块,用于计算所述目标文本与所述标准文本的相似度;
28、判断模块,用于若所述相似度超过预设的相似度阈值,则对所述目标文本中包括的数字与所述标准文本中包括的数字进行一致性判断,得到数字的判断结果;
29、所述判断模块,还用于若所述数字的判断结果指示一致,则对所述目标文本中包括的命名体与所述标准文本中包括的命名体进行一致性判断,得到命名体的判断结果;
30、输出模块,用于若所述命名体的判断结果指示一致,则输出用于指示所述目标文本的语义与所述标准文本的语义相似的提示信息。
31、第三方面,本申请实施例提供一种电子设备,包括:存储器,处理器;
32、所述存储器存储计算机执行指令;
33、所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如上第一方面各种可能的实施方式。
34、第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上第一方面各种可能的实施方式。
35、第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上第一方面各种可能的实施方式。
36、本申请实施例提供的文本语义相似性的判断方法、电子设备、存储介质及产品,通过获取目标文本以及与目标文本相似的标准文本,若目标文本与标准文本的相似度超过预设的相似度阈值,则说明目标文本与标准文本的文字内容存在相似性,进而对目标文本中包括的数字与标准文本中包括的数字进行一致性判断,若一致,则说明目标文本与标准文本中包括的数字相同,进而对目标文本中包括的命名体与标准文本中包括的命名体进行一致性判断,若一致,则说明目标文本与标准文本中的命名体相同,最终输出用于指示目标文本的语义与标准文本的语义相似的提示信息。本申请通过判断目标文本与标准文本中的文字内容、数字以及命名体,通过进行多次判断,提高了目标文本的语义与标准文本的语义相似性判断的准确性。
本文档来自技高网...【技术保护点】
1.一种文本语义相似性的判断方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述目标文本中包括的数字与所述标准文本中包括的数字进行一致性判断,得到数字的判断结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述目标文本中包括的命名体与所述标准文本中包括的命名体进行一致性判断,得到命名体的判断结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述计算所述目标文本与所述标准文本的相似度,包括:
5.根据权利要求4所述的方法,其特征在于,所述获取目标文本以及与所述目标文本相似的标准文本之后,还包括:
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
7.一种文本语义相似性的判断装置,其特征在于,包括:
8.一种电子设备,其特征在于,包括:存储器,处理器;
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-6任一项所述的文本语义相似性的判断方
10.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-6任一项所述的文本语义相似性的判断方法。
...【技术特征摘要】
1.一种文本语义相似性的判断方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述目标文本中包括的数字与所述标准文本中包括的数字进行一致性判断,得到数字的判断结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述目标文本中包括的命名体与所述标准文本中包括的命名体进行一致性判断,得到命名体的判断结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述计算所述目标文本与所述标准文本的相似度,包括:
5.根据权利要求4所述的方法,其特征在于,所述获取目标文本以及与所述目标文本相似的标准文...
【专利技术属性】
技术研发人员:何晓霞,颜巍,张铎,纪根苗,
申请(专利权)人:中国人民财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。