一种合同文本中风险信息的提示方法、装置及设备制造方法及图纸

技术编号:28037342 阅读:25 留言:0更新日期:2021-04-09 23:19
本申请实施例公开了一种合同文本中风险信息的提示方法、装置及设备,通过获取目标合同文本,从目标合同文本中选取目标词汇;获取目标合同文本中的目标语句;将目标词汇和目标语句作为待识别文本。将待识别文本输入业务分类模型,得到待识别文本对应的业务类型;根据待识别文本所属的业务类型确定目标合同文本的目标业务类型。最后,从风险信息数据库中检索与目标业务类型对应的风险信息;将风险信息发送至终端并显示。通过业务分类模型可以得到较为准确的目标合同文件的目标业务类型。根据目标合同文本的目标业务类型,可以从风险信息数据库中得到目标业务类型对应的较为完全的风险信息进行提示,便于合同审核人员识别法律风险点。

【技术实现步骤摘要】
一种合同文本中风险信息的提示方法、装置及设备
本申请涉及计算机
,具体涉及一种合同文本中风险信息的提示方法、装置及设备。
技术介绍
在合同中存在着合约不能在法律范围内无效且无法履行,或者合约订立不当等原因引起的法律风险。在合同正式使用之前,需要对起草的合同进行审查,以确保合同中不具有法律风险点。目前,通常是法律部门的专业合同审核人员对起草的合同进行审查,人为审查合同中的法律风险点并进行修改。合同中的法律风险点不易审核,人为审查合同中的法律风险点的效率较低,并且容易出现法律风险点的遗漏。
技术实现思路
有鉴于此,本申请实施例提供一种合同文本中风险信息的提示方法、装置及设备,能够根据合同的业务类型,向合同审核人员提示对应的法律风险点,便于对合同的法律风险点进行识别。为解决上述问题,本申请实施例提供的技术方案如下:第一方面,本申请提供一种合同文本中风险信息的提示方法,所述方法包括:获取目标合同文本,利用预先确定的业务常用词汇从所述目标合同文本中选取目标词汇;获取所述目标合同文本中的目标语句;将所述目标词汇和所述目标语句作为待识别文本;将所述待识别文本输入业务分类模型,得到所述待识别文本对应的业务类型;所述业务分类模型用于确定待识别文本所属的业务类型;根据所述待识别文本所属的业务类型确定所述目标合同文本的目标业务类型;从风险信息数据库中检索与所述目标业务类型对应的风险信息;将所述风险信息发送至终端,以使所述终端显示所述风险信息。在一种可能的实现方式中,所述业务分类模型的训练过程包括:获取语料文本;其中,所述语料文本是根据确定业务类型的待提取合同文本生成的;从所述语料文本中选取业务常用词汇作为待训练词汇;利用所述业务常用词汇所属的业务类型对所述待训练词汇进行业务标签标记;获取所述语料文本中的待训练语句;所述待训练语句是具有业务标签的语句;将所述待训练词汇、所述待训练词汇对应的业务标签、所述待训练语句以及所述待训练语句对应的业务标签作为训练数据;利用所述训练数据训练生成业务分类模型;所述业务分类模型采用具有注意力机制的循环神经网络;其中,词汇权重是根据词汇注意力权重和词汇业务相关性权重确定的,语句权重是根据语句注意力权重和语句业务相关性权重确定的。在一种可能的实现方式中,所述方法还包括:获取所述目标合同文本中的辅助文本;所述辅助文本包括合同段落、合同总字数、表格文本和下划线文本中的一个或者多个;所述将所述目标词汇和所述目标语句作为待识别文本,包括:将所述目标词汇、所述目标语句和所述辅助文本作为待识别文本。在一种可能的实现方式中,所述业务分类模型的训练过程包括:获取语料文本;其中,所述语料文本是根据确定业务分类的合同文本生成的;从所述语料文本中选取业务常用词汇作为待训练词汇;利用所述业务常用词汇所属的业务类型对所述待训练词汇进行业务标签标记;获取所述语料文本中的待训练语句;所述待训练语句是具有业务标签的语句;获取所述语料文本中待训练辅助文本,所述待训练辅助文本包括合同段落、合同总字数、表格文本和下划线文本中的一个或者多个;将所述待训练词汇、所述待训练词汇对应的业务标签、所述待训练语句、所述待训练语句对应的业务标签、所述待训练辅助文本以及所述待训练辅助文本对应的业务标签作为训练数据;所述待训练辅助文本对应的业务标签是根据所述待训练辅助文本所属的合同的业务类型确定的;利用所述训练数据训练生成业务分类模型;所述业务分类模型采用具有注意力机制的循环神经网络;其中,词汇权重是根据词汇注意力权重和词汇业务相关性权重确定的,语句权重是根据语句注意力权重和语句业务相关性权重确定的。在一种可能的实现方式中,所述方法还包括:获取标记业务类型的待提取合同文本;对所述待提取合同文本进行分词处理,得到第一分词结果;从所述第一分词结果中去除停用词,得到第二分词结果;对所述待提取合同文本进行分句处理,得到分句结果;获取所述待提取合同文本的辅助文本,得到辅助文本提取结果;根据所述第二分词结果、所述分句结果和所述辅助文本提取结果生成语料文本。在一种可能的实现方式中,所述方法还包括:根据所述业务分类模型输出的待识别文本对应的业务类型判断所述业务分类模型是否满足预设条件;若不满足,利用所述目标合同文本对所述语料文本进行更新;利用更新后的语料文本对所述业务分类模型进行训练,直到训练结果满足预设条件,得到优化后的业务分类模型。第二方面,本申请提供一种合同文本中风险信息的提示装置,所述装置包括:第一获取单元,用于获取目标合同文本,利用预先确定的业务常用词汇从所述目标合同文本中选取目标词汇;第二获取单元,用于获取所述目标合同文本中的目标语句;第一生成单元,用于将所述目标词汇和所述目标语句作为待识别文本;识别单元,用于将所述待识别文本输入业务分类模型,得到所述待识别文本对应的业务类型;所述业务分类模型用于确定待识别文本所属的业务类型;确定单元,用于根据所述待识别文本所属的业务类型确定所述目标合同文本的目标业务类型;检索单元,用于从风险信息数据库中检索与所述目标业务类型对应的风险信息;发送单元,用于将所述风险信息发送至终端,以使所述终端显示所述风险信息。在一种可能的实现方式中,所述业务分类模型的训练过程包括:获取语料文本;其中,所述语料文本是根据确定业务类型的待提取合同文本生成的;从所述语料文本中选取业务常用词汇作为待训练词汇;利用所述业务常用词汇所属的业务类型对所述待训练词汇进行业务标签标记;获取所述语料文本中的待训练语句;所述待训练语句是具有业务标签的语句;将所述待训练词汇、所述待训练词汇对应的业务标签、所述待训练语句以及所述待训练语句对应的业务标签作为训练数据;利用所述训练数据训练生成业务分类模型;所述业务分类模型采用具有注意力机制的循环神经网络;其中,词汇权重是根据词汇注意力权重和词汇业务相关性权重确定的,语句权重是根据语句注意力权重和语句业务相关性权重确定的。在一种可能的实现方式中,所述装置还包括:第三获取单元,用于获取所述目标合同文本中的辅助文本;所述辅助文本包括合同段落、合同总字数、表格文本和下划线文本中的一个或者多个;所述第一生成单元,具体用于将所述目标词汇、所述目标语句和所述辅助文本作为待识别文本。在一种可能的实现方式中,所述业务分类模型的训练过程包括:获取语料文本;其中,所述语料文本是根据确定业务分类的合同文本生成的;从所述语料文本中选取业务常用词汇作为待训练词汇;利用所述业务常用词汇所属的业务类型对所述待训练词汇进行业务标签标记;获取所述语料文本中的待训练语句;所述待训练语句是具有业务标签的语句;...

【技术保护点】
1.一种合同文本中风险信息的提示方法,其特征在于,所述方法包括:/n获取目标合同文本,利用预先确定的业务常用词汇从所述目标合同文本中选取目标词汇;/n获取所述目标合同文本中的目标语句;/n将所述目标词汇和所述目标语句作为待识别文本;/n将所述待识别文本输入业务分类模型,得到所述待识别文本对应的业务类型;所述业务分类模型用于确定待识别文本所属的业务类型;/n根据所述待识别文本所属的业务类型确定所述目标合同文本的目标业务类型;/n从风险信息数据库中检索与所述目标业务类型对应的风险信息;/n将所述风险信息发送至终端,以使所述终端显示所述风险信息。/n

【技术特征摘要】
1.一种合同文本中风险信息的提示方法,其特征在于,所述方法包括:
获取目标合同文本,利用预先确定的业务常用词汇从所述目标合同文本中选取目标词汇;
获取所述目标合同文本中的目标语句;
将所述目标词汇和所述目标语句作为待识别文本;
将所述待识别文本输入业务分类模型,得到所述待识别文本对应的业务类型;所述业务分类模型用于确定待识别文本所属的业务类型;
根据所述待识别文本所属的业务类型确定所述目标合同文本的目标业务类型;
从风险信息数据库中检索与所述目标业务类型对应的风险信息;
将所述风险信息发送至终端,以使所述终端显示所述风险信息。


2.根据权利要求1所述的方法,其特征在于,所述业务分类模型的训练过程包括:
获取语料文本;其中,所述语料文本是根据确定业务类型的待提取合同文本生成的;
从所述语料文本中选取业务常用词汇作为待训练词汇;利用所述业务常用词汇所属的业务类型对所述待训练词汇进行业务标签标记;
获取所述语料文本中的待训练语句;所述待训练语句是具有业务标签的语句;
将所述待训练词汇、所述待训练词汇对应的业务标签、所述待训练语句以及所述待训练语句对应的业务标签作为训练数据;
利用所述训练数据训练生成业务分类模型;所述业务分类模型采用具有注意力机制的循环神经网络;其中,词汇权重是根据词汇注意力权重和词汇业务相关性权重确定的,语句权重是根据语句注意力权重和语句业务相关性权重确定的。


3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标合同文本中的辅助文本;所述辅助文本包括合同段落、合同总字数、表格文本和下划线文本中的一个或者多个;
所述将所述目标词汇和所述目标语句作为待识别文本,包括:
将所述目标词汇、所述目标语句和所述辅助文本作为待识别文本。


4.根据权利要求3所述的方法,其特征在于,所述业务分类模型的训练过程包括:
获取语料文本;其中,所述语料文本是根据确定业务分类的合同文本生成的;
从所述语料文本中选取业务常用词汇作为待训练词汇;利用所述业务常用词汇所属的业务类型对所述待训练词汇进行业务标签标记;
获取所述语料文本中的待训练语句;所述待训练语句是具有业务标签的语句;
获取所述语料文本中待训练辅助文本,所述待训练辅助文本包括合同段落、合同总字数、表格文本和下划线文本中的一个或者多个;
将所述待训练词汇、所述待训练词汇对应的业务标签、所述待训练语句、所述待训练语句对应的业务标签、所述待训练辅助文本以及所述待训练辅助文本对应的业务标签作为训练数据;所述待训练辅助文本对应的业务标签是根据所述待训练辅助文本所属的合同的业务类型确定的;
利用所述训练数据训练生成业务分类模型;所述业务分类模型采用具有注意力机制的循环神经网络;其中,词汇权重是根据词汇注意力权重和词汇业务相关性权重确定的,语句权重是根据语句注意力权重和语句业务相关性权重确定的。


5.根据权利要求2或4所述的方法,其特...

【专利技术属性】
技术研发人员:周成阳谢波单冉冉钟齐
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1