System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种合同变更终止原因分类方法、系统、设备及存储介质技术方案_技高网

一种合同变更终止原因分类方法、系统、设备及存储介质技术方案

技术编号:41305657 阅读:4 留言:0更新日期:2024-05-13 14:51
本发明专利技术公开了一种合同变更终止原因分类方法、系统、设备及存储介质,包括:获取合同变更原因文本数据;根据合同变更原因文本数据构建数据词典;获取待分类合同文本,并将待分类合同文本输入至预设的One‑hot模型,得到待分类合同文本对应的变更原因文本向量;变更原因文本向量用于标记待分类合同文本对应在数据词典的位置;将变更原因文本向量输入预设的transformer模型,得到待分类合同文本对应的合同变更原因和合同变更类型。本发明专利技术能够降低分类模型的算力消耗并且提高分类模型的特征识别能力,使得分类更加高效和精确,减少工作人员的审批时间,提高审批效率。

【技术实现步骤摘要】

本专利技术涉及合同变更原因分类,尤其是涉及一种合同变更终止原因分类方法、系统、设备及存储介质


技术介绍

1、现有技术使用人力将原因文本与现有的原因类别进行对比,然后再对变更终止原因类型和变更终止类型进行归类,不仅耗费人力,而且准确率不高。

2、同时现有的机器学习方法针对大量的合同文本数据,需要消耗大量算力进行机器学习,同时学习得到的机器学习模型的准确率也不高,存在较高的误分类率。


技术实现思路

1、本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术提出一种合同变更终止原因分类方法、系统、设备及存储介质,能够降低分类模型的算力消耗并且提高分类模型的特征识别能力,使得合同变更终止原因分类方法能够更加高效和精确,减少工作人员的审批时间,提高审批效率。

2、第一方面,本专利技术的实施例提供了一种合同变更终止原因分类方法,包括:

3、获取合同变更原因文本数据;

4、根据所述合同变更原因文本数据构建数据词典;

5、获取待分类合同文本,并将所述待分类合同文本输入至预设的one-hot模型,得到所述待分类合同文本对应的变更原因文本向量;所述变更原因文本向量用于标记所述待分类合同文本对应在所述数据词典的位置;

6、将所述变更原因文本向量输入预设的transformer模型,得到所述待分类合同文本对应的合同变更原因和合同变更类型。

7、根据本专利技术实施例的方法,至少具有如下有益效果:

8、本方法首先通过合同变更原因文本数据构建数据词典,通过使用数据词典收集合同变更原因文本数据,便于后续通过较小的数据内存记载文本数据,减小内存占用和模型训练时的算力紧张,提供低成本且准确的数据基础;然后通过将待分类合同文本输入至预设的one-hot模型,得到变更原因文本向量,通过变更原因文本向量记载待分类合同文本对应在数据词典的位置,能够节省大量文本数据占用的内存,同时为后续transformer模型的训练提供更容易收敛的特征,加快transformer模型的收敛速度,降低算力成本;最后通过变更原因文本向量输入transformer模型,通过transformer模型能够快速识别待分类合同文本对应的合同变更原因和合同变更类型,同时能够根据不同的任务场景调整不同训练方向的transformer模型,使得具有较好的泛化能力,高精度要求的transformer模型也能保证更加准确的分类结果。

9、根据本专利技术的一些实施例,所述根据所述合同变更原因文本数据构建数据词典,包括:

10、对所述合同变更原因文本数据进行数据清洗,得到合同变更原因文本清洗数据;所述数据清洗包括去除重复和异常数据;

11、通过所述合同变更原因文本清洗数据构建所述数据词典;

12、定义所述数据词典的转换数据函数,以使所述转换数据函数根据所述待分类合同文本得到所述待分类合同文本对应在所述数据词典的位置。

13、根据本专利技术的一些实施例,所述将所述待分类合同文本输入至预设的one-hot模型,得到所述待分类合同文本对应的变更原因文本向量,包括:

14、将所述待分类合同文本输入所述转换数据函数,得到所述待分类合同文本对应在所述数据词典的位置;

15、将所述位置通过所述one-hot模型的one-hot编码表达法,得到所述变更原因文本向量。

16、根据本专利技术的一些实施例,所述变更原因文本向量为多维向量;所述多维向量与所述数据词典的长度相等,并且在所述数据词典的每个响应位置均设置有寄存器,所述多维向量用于记载所述寄存器的赋值。

17、根据本专利技术的一些实施例,所述transformer模型通过如下方式得到:

18、获取已分类合同文本集;

19、将所述已分类合同文本集通过所述one-hot模型处理,得到已分类合同文本向量集;

20、将所述已分类合同文本向量集随机分配,得到训练集和测试集;

21、通过所述训练集训练所述transformer模型,直到达到所述transformer模型的收敛条件,并通过所述测试集验证所述transformer模型收敛完成。

22、根据本专利技术的一些实施例,所述将所述变更原因文本向量输入预设的transformer模型,得到所述待分类合同文本对应的合同变更原因和合同变更类型,包括:

23、将所述变更原因文本向量输入所述transformer模型中的嵌入层,得到所述变更原因文本向量对应的词语文本;

24、将所述词语文本和所述词语文本输入至所述transformer模型中的位置编码层,得到所述词语文本的位置顺序;

25、根据所述位置顺序得到所述待分类合同文本对应的合同变更原因和合同变更类型。

26、根据本专利技术的一些实施例,在所述将所述变更原因文本向量输入预设的transformer模型,得到所述待分类合同文本对应的合同变更原因和合同变更类型之后,所述合同变更终止原因分类方法还包括:

27、通过回退率降比和审批时长降比计算所述合同变更原因和所述合同变更类型的有效性结果;所述回退率降比和所述审批时长降比的计算公式包括:

28、

29、

30、

31、

32、

33、

34、其中,α表示回退率降比;r2表示运用合同变更终止原因分类方法后合同变更终止申请的回退率;n2表示运用合同变更终止原因分类方法后合同变更终止申请的回退数量;nt表示申请合同变更终止申请的数量;r1表示运用合同变更终止原因分类方法前合同变更终止申请的回退率;n1表示运用合同变更终止原因分类方法前合同变更终止申请的回退数量;β表示审批时长降比;t2表示运用合同变更终止原因分类方法后每份合同变更终止申请的平均审批时长;tt2表示运用合同变更终止原因分类方法后所有合同变更终止申请的总审批时长;t1表示运用合同变更终止原因分类方法前每份合同变更终止申请的平均审批时长;tt1表示运用合同变更终止原因分类方法前每份合同变更终止申请的平均审批时长。

35、第二方面,本专利技术的实施例提供了一种合同变更终止原因分类系统,包括:

36、合同变更原因文本数据获取模块,用于获取合同变更原因文本数据;

37、数据词典构建模块,用于根据所述合同变更原因文本数据构建数据词典;

38、one-hot模型计算模块,用于获取待分类合同文本,并将所述待分类合同文本输入至预设的one-hot模型,得到所述待分类合同文本对应的变更原因文本向量;所述变更原因文本向量用于标记所述待分类合同文本对应在所述数据词典的位置;

39、transformer模型计算模块,用于将所述变更原因文本向量输入预设的transformer模型,得到所述待分类合同文本对应的合同变更原因和合同变更类型。

40、第三方面本文档来自技高网...

【技术保护点】

1.一种合同变更终止原因分类方法,其特征在于,所述合同变更终止原因分类方法包括:

2.根据权利要求1所述的合同变更终止原因分类方法,其特征在于,所述根据所述合同变更原因文本数据构建数据词典,包括:

3.根据权利要求2所述的合同变更终止原因分类方法,其特征在于,所述将所述待分类合同文本输入至预设的One-hot模型,得到所述待分类合同文本对应的变更原因文本向量,包括:

4.根据权利要求3所述的合同变更终止原因分类方法,其特征在于,所述变更原因文本向量为多维向量;所述多维向量与所述数据词典的长度相等,并且在所述数据词典的每个响应位置均设置有寄存器,所述多维向量用于记载所述寄存器的赋值。

5.根据权利要求1所述的合同变更终止原因分类方法,其特征在于,所述transformer模型通过如下方式得到:

6.根据权利要求1所述的合同变更终止原因分类方法,其特征在于,所述将所述变更原因文本向量输入预设的transformer模型,得到所述待分类合同文本对应的合同变更原因和合同变更类型,包括:

7.根据权利要求1所述的合同变更终止原因分类方法,其特征在于,在所述将所述变更原因文本向量输入预设的transformer模型,得到所述待分类合同文本对应的合同变更原因和合同变更类型之后,所述合同变更终止原因分类方法还包括:

8.一种合同变更终止原因分类系统,其特征在于,所述合同变更终止原因分类系统包括:

9.一种电子设备,其特征在于:包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求1至7任一项所述的合同变更终止原因分类方法。

10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7任一项所述的合同变更终止原因分类方法。

...

【技术特征摘要】

1.一种合同变更终止原因分类方法,其特征在于,所述合同变更终止原因分类方法包括:

2.根据权利要求1所述的合同变更终止原因分类方法,其特征在于,所述根据所述合同变更原因文本数据构建数据词典,包括:

3.根据权利要求2所述的合同变更终止原因分类方法,其特征在于,所述将所述待分类合同文本输入至预设的one-hot模型,得到所述待分类合同文本对应的变更原因文本向量,包括:

4.根据权利要求3所述的合同变更终止原因分类方法,其特征在于,所述变更原因文本向量为多维向量;所述多维向量与所述数据词典的长度相等,并且在所述数据词典的每个响应位置均设置有寄存器,所述多维向量用于记载所述寄存器的赋值。

5.根据权利要求1所述的合同变更终止原因分类方法,其特征在于,所述transformer模型通过如下方式得到:

6.根据权利要求1所述的合同变更终止原因分类方法,其特征在于,所述将所述变更原因文本向量输入预设的transformer模...

【专利技术属性】
技术研发人员:张博张志东赵冰鑫陈正向少斌吴素丹崔凌菲
申请(专利权)人:南方电网供应链广东有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1