System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种合同分类方法、设备及介质技术_技高网

一种合同分类方法、设备及介质技术

技术编号:44018085 阅读:3 留言:0更新日期:2025-01-15 01:02
本申请公开了一种合同分类方法、设备及介质,方法包括:对合同文本进行特征提取,得到所述合同文本的特征关键词;对所述特征关键词进行转换,得到所述合同文本的语义表示;在具有多个合同文本时,根据每个合同文本的特征关键词与语义表示,通过孪生神经网络技术计算每个合同文本之间的语义相似度;根据每个合同文本之间的语义相似度,对多个合同文本进行分类。提高合同分类准确性和效率。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种合同分类方法、设备及介质


技术介绍

1、在当前数字化时代,合同管理系统已经成为企业办公中不可或缺的一部分。在合同管理中,合同文本的分类是非常重要的任务。

2、目前,合同分类方法通常依赖于人工阅读和理解合同文本,或者简单的关键词分类,容易受到主观因素的影响,并且无法深度分析合同文本存在的内部语义,导致合同分类结果的准确性和效率低。


技术实现思路

1、本申请实施例提供一种合同分类方法、设备及介质,用于解决合同分类结果的准确性和效率低的问题。

2、本申请实施例采用下述技术方案:

3、一方面,本申请实施例提供了一种合同分类方法,该方法包括:对合同文本进行特征提取,得到所述合同文本的特征关键词;对所述特征关键词进行转换,得到所述合同文本的语义表示;在具有多个合同文本时,根据每个合同文本的特征关键词与语义表示,通过孪生神经网络技术计算每个合同文本之间的语义相似度;根据每个合同文本之间的语义相似度,对多个合同文本进行分类。

4、一个示例中,所述对合同文本进行特征提取,得到所述合同文本的特征关键词,具体包括:获取样本合同文本与所述样本合同文本的样本特征关键词;将所述样本合同文本作为样本输入,将样本特征关键词作为样本标签,对文本提取循环神经网络架构进行训练,得到文本提取循环神经网络模型;将所述合同文本输入至所述文本提取循环神经网络模型,得到所述合同文本的特征关键词。

5、一个示例中,所述对所述特征关键词进行转换,得到所述合同文本的语义表示,具体包括:根据无标注样本文本数据集,对初始双向编码器表征模型进行自监督训练,得到预训练的双向编码器表征模型;根据样本合同文本的样本特征关键词以及所述样本特征关键词的样本语义表示,生成有标注样本数据集;根据所述有标注样本数据集对所述预训练的双向编码器表征模型进行微调训练,得到双向编码器表征模型;将所述特征关键词输入至所述双向编码器表征模型,得到所述合同文本的语义表示。

6、一个示例中,所述根据每个合同文本的特征关键词与语义表示,通过孪生神经网络技术计算每个合同文本之间的语义相似度,具体包括:获取样本合同文本的样本特征关键词和样本语义表示,以及样本合同文本之间的样本语义相似度;将所述样本合同文本、所述样本合同文本的样本特征关键词和样本语义表示作为样本输入,将样本合同文本之间的样本语义相似度作为样本标签,对相似度孪生神经网络模型架构进行训练,得到相似度孪生神经网络模型;将每个合同文本、每个合同文本的特征关键词与语义表示输入至所述相似度孪生神经网络模型,得到每个合同文本之间的语义相似度。

7、一个示例中,所述根据每个合同文本之间的语义相似度,对多个合同文本进行分类,具体包括:获取样本合同文本和样本合同文本之间的样本语义相似度,以及样本合同文本的样本类别;将所述样本合同文本和样本合同文本之间的样本语义相似度作为样本输入,将样本合同文本的样本类别作为样本标签,分类卷积神经网络模型架构进行训练,得到分类卷积神经网络模型;将每个合同文本以及每个合同文本之间的语义相似度输入至所述分类卷积神经网络模型,得到合同文本的类别。

8、一个示例中,所述根据每个合同文本之间的语义相似度,对多个合同文本进行分类之后,所述方法还包括:对用户的查询请求进行解析,得到查询关键词;在合同数据库中,计算所述查询关键词与每个合同文本的特征关键词之间的匹配度;按照匹配度从高到低的顺序,对合同进行排序;按照从高到低的顺序,以预设数量个合同为条件,在合同排序中,选取待展示合同排序,并将所述待展示合同排序反馈至用户。

9、一个示例中,所述计算所述查询关键词与每个合同文本的特征关键词之间的匹配度,具体包括:在预先构建的标准词典中,对查询关键词进行匹配,得到所述查询关键词的标准关键词;在所述标准词典中,对每个合同文本的特征关键词进行匹配,得到每个合同文本的标准特征关键词;将所述标准关键词与所述标准特征关键词进行对比,确定共同关键词;根据共同关键词的数量,确定每个合同的匹配度。

10、一个示例中,所述方法还包括:在具有一个合同文本时,将所述合同文本输出至合同文本临时存储区;在接收到其他合同文本时,将所述合同文本与所述其他合同文本进行合同分类。

11、另一方面,本申请实施例提供了一种合同分类设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一项所述的一种合同分类方法。

12、另一方面,本申请实施例提供了一种合同分类非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令能够执行上述任一项所述的一种合同分类方法。

13、本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:

14、能够通过提取合同文本的特征关键词和语义表示,深度挖掘合同文本内部的语义,进一步计算每个合同文本之间的语义相似度,可以通过利用自然语言处理和语义相似度技术,有效地处理合同文本之间的复杂语义关系,能够更快速准确地将同类别的合同归类到相应的类别中,避免了人工分类主观性强的问题,提高了分类的准确性和效率。

本文档来自技高网...

【技术保护点】

1.一种合同分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对合同文本进行特征提取,得到所述合同文本的特征关键词,具体包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述特征关键词进行转换,得到所述合同文本的语义表示,具体包括:

4.根据权利要求1所述的方法,其特征在于,所述根据每个合同文本的特征关键词与语义表示,通过孪生神经网络技术计算每个合同文本之间的语义相似度,具体包括:

5.根据权利要求1所述的方法,其特征在于,所述根据每个合同文本之间的语义相似度,对多个合同文本进行分类,具体包括:

6.根据权利要求1所述的方法,其特征在于,所述根据每个合同文本之间的语义相似度,对多个合同文本进行分类之后,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述计算所述查询关键词与每个合同文本的特征关键词之间的匹配度,具体包括:

8.根据权利要求1所述的方法,其特征在于,所述方法还包括:

9.一种合同分类设备,其特征在于,包括:

10.一种合同分类非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令能够执行上述权利要求1-8任一项所述的一种合同分类方法。

...

【技术特征摘要】

1.一种合同分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对合同文本进行特征提取,得到所述合同文本的特征关键词,具体包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述特征关键词进行转换,得到所述合同文本的语义表示,具体包括:

4.根据权利要求1所述的方法,其特征在于,所述根据每个合同文本的特征关键词与语义表示,通过孪生神经网络技术计算每个合同文本之间的语义相似度,具体包括:

5.根据权利要求1所述的方法,其特征在于,所述根据每个合同文本之间的语义相似度,对多个合同文本进行分...

【专利技术属性】
技术研发人员:丛支斌丁军马士中徐同明郝坦宾赵玉海张敦雪唐昌明
申请(专利权)人:浪潮通用软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1