本发明专利技术公开了一种合同风险检测方法、装置、电子设备及存储介质。一种合同风险检测方法,包括:获取合同文本;合同文本包括多个段落;对合同文本进行命名实体识别,进而从合同文本中筛选出包含合同实体的段落;从包含合同实体的段落中提取合同实体信息;根据合同实体信息采用规则与深度学习相融合的方式进行合同风险检测,得到合同风险点。本发明专利技术采用规则与深度学习相融合的方式进行合同风险检测,具有深度学习模型的泛化能力以及规则的专业性,不仅提高了深度学习模型的检测速度,而且也提升了检测的准确度,降低了专家系统的成本,有效地提升了合同风险点的检测能力和效率,解决了合同风险检测速度慢、泛化性能不足、准确度不高的问题。不高的问题。不高的问题。
【技术实现步骤摘要】
一种合同风险检测方法、装置、电子设备及存储介质
[0001]本专利技术属于风险检测领域,更具体地,涉及一种合同风险检测方法、装置、电子设备及存储介质。
技术介绍
[0002]合同约定了当事人之间的权利义务关系,具有法律效力,涉及合同当事人的利益。实际中,合同签署之后,往往会因为一些原因导致合同未能成功履行,或者双方在合同履行过程中产生纠纷而导致法律诉讼。因此,合同风险审查是很有必要的。
[0003]一般合同的审查工作依赖经验,且会占据很多人力资源。随着深度学习等领域发展,智能合同审查模型能替代人力进行合同风险检测。然而合同的文本长度具有不确定性,导致一般的深度模型在长合同文本上进行推理计算所需的时间急剧上升,造成用户使用的感受不佳。一些使用专家系统的模型所需要的经验成本太高,并且模型的泛化能力不足,对于关键字稍作更改,就会导致合同风险检测失败。
[0004]可见,现有技术中存在合同风险检测速度慢、泛化性能不足、准确度不高的问题。
技术实现思路
[0005]针对相关技术的缺陷,本专利技术提供一种合同风险检测方法、装置、电子设备及存储介质,旨在解决相关技术中存在的合同风险检测速度慢、泛化性能不足、准确度不高的问题。
[0006]所述技术方案如下:
[0007]根据本申请的一个方面,一种合同风险检测方法,包括:获取合同文本;所述合同文本包括多个段落;对所述合同文本进行命名实体识别,进而从所述合同文本中筛选出包含合同实体的段落;从所述包含合同实体的段落中提取合同实体信息;根据所述合同实体信息采用规则与深度学习相融合的方式进行合同风险检测,得到合同风险点。
[0008]根据本申请的一个方面,一种合同风险检测装置,包括:获取模块,用于获取合同文本;所述合同文本包括多个段落;实体识别模块,用于对所述合同文本进行命名实体识别,进而从所述合同文本中筛选出包含合同实体的段落;信息提取模块,用于从所述包含合同实体的段落中提取合同实体信息;检测模块,用于根据所述合同实体信息采用规则与深度学习相融合的方式进行合同风险检测,得到合同风险点。
[0009]根据本申请的一个方面,一种电子设备,包括:至少一个处理器、至少一个存储器、以及至少一条通信总线,其中,存储器上存储有计算机程序,处理器通过通信总线读取存储器中的计算机程序;计算机程序被处理器执行时实现如上所述的合同风险检测方法。
[0010]根据本申请的一个方面,一种存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上所述的合同风险检测方法。
[0011]根据本申请的一个方面,一种计算机程序产品,计算机程序产品包括计算机程序,计算机程序存储在存储介质中,计算机设备的处理器从存储介质读取计算机程序,处理器
执行计算机程序,使得计算机设备执行时实现如上所述的合同风险检测方法。
[0012]本专利技术具有如下有益效果:
[0013]本专利技术采用规则与深度学习相融合的方式进行合同风险检测,具有深度学习模型的泛化能力以及规则的专业性,不仅提高了深度学习模型的检测速度,而且也提升了检测的准确度,降低了专家系统的成本,有效地提升了合同风险点的检测能力和效率,解决了现有技术中存在的合同风险检测速度慢、泛化性能不足、准确度不高的问题。
附图说明
[0014]图1是本申请实施例提供的一种合同风险检测方法的实施环境的示意图;
[0015]图2是本申请实施例提供的一种合同风险检测方法的流程图;
[0016]图3是根据一示例性实施例示出的一种合同风险检测装置的结构框图;
[0017]图4是根据一示例性实施例示出的一种电子设备的结构框图。
具体实施方式
[0018]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。此外,下面所描述的本专利技术各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0019]请参阅图1,其示出了本申请实施例提供的一种合同风险检测方法的实施环境的示意图,该实施环境包括终端102和服务器104。
[0020]其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0021]合同文本被输入终端102之后,服务器104通过通信网络从终端102获取合同文本,筛选出包含合同实体的段落并且提取合同实体信息,根据合同实体信息采用规则与深度学习相融合的方式进行合同风险检测,得到合同风险点,服务器104通过通信网络将合同风险点发送至终端102。
[0022]请参阅图2,其示出了本申请实施例提供的一种合同风险检测方法,该方法适用于计算机设备,该计算机设备可以是图1所示出实施环境中的服务器104,还可以是终端102。
[0023]如图2所示,该方法可以包括以下步骤:
[0024]步骤200,获取合同文本;合同文本包括多个段落。
[0025]常见的合同文本一般是DOC及DOCX格式,这些格式可以通过POI(Office文档的Java处理包)进行读取,其中,读取过程保留原始文档的信息,例如目录等,将有利于后续步骤的处理。
[0026]在一种可能的实施方式,步骤200之后,对合同文本进行预处理,包括:
[0027]步骤201,对合同文本进行清洗预处理。
[0028]由于不同的合同文本结构各有不同,其中有许多不标准的地方,清洗预处理主要包括但不限于对其中的空格、特殊符号、停用词进行处理。
[0029]清洗预处理是为了减少额外的无用信息,加快后续步骤中的命名实体识别。
[0030]步骤220,对合同文本进行命名实体识别,进而从合同文本中筛选出包含合同实体的段落。
[0031]命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。
[0032]在一种可能的实施方式,使用基于注意力的双向编码器(BERT)分析语义信息识别合同实体,进而从合同文本中筛选出包含合同实体的段落。
[0033]包含合同实体的段落相较于原始合同文本已经减少,使得合同实体信息提取的范围减小,加快合同实体信息提取的速度。
[0034]步骤240,从包含合同实体的段落中提取合同实体信息。
[0035]在一种可能的实施方式,使用基于注意力的双向编码器BERT处理后经过双向长短期记忆网络BiLSTM处理,最终通过条件随机场算法CRF计算,获得最终的合同实体信息。
[0036]步骤260,根据合本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种合同风险检测方法,其特征在于,包括:获取合同文本;所述合同文本包括多个段落;对所述合同文本进行命名实体识别,进而从所述合同文本中筛选出包含合同实体的段落;从所述包含合同实体的段落中提取合同实体信息;根据所述合同实体信息采用规则与深度学习相融合的方式进行合同风险检测,得到合同风险点。2.如权利要求1所述的方法,其特征在于,所述根据所述合同实体信息采用规则与深度学习相融合的方式进行合同风险检测,得到合同风险点,包括:采用专家系统对所述合同实体信息进行处理,筛选出与风险点有关的信息;采用深度学习对所述与风险点有关的信息进行处理,检测出合同风险点。3.如权利要求2所述的方法,其特征在于,所述采用专家系统对所述合同实体信息进行处理,筛选出与风险点有关的信息,包括:使用基于注意力的双向编码器BERT结合全连接神经网络计算出<实体,关系,实体>的三元组信息,得到与风险点有关的信息。4.如权利要求2所述的方法,其特征在于,所述采用专家系统对所述合同实体信息进行处理,筛选出与风险点有关的信息,包括:使用正则表达式对所述合同实体信息进行处理,筛选出与风险点有关的段落集作为与风险点有关的信息。5.如权利要求1所述的方法,其特征在于,所述从所述包含合同实体的段落中提取合同实体信息,包括:对所述包含合同实体的段落使用基于注意力的双向编码器BERT处理后,再经过双向长短期记忆网络BiLS...
【专利技术属性】
技术研发人员:高恒源,杨敏,雷宇,
申请(专利权)人:深圳得理科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。