法律知识图谱构建方法及相关设备技术

技术编号:30637790 阅读:30 留言:0更新日期:2021-11-04 00:25
本公开提供一种法律知识图谱构建方法及相关设备,该方法包括:通过对法律法规的法律内容进行分类,确定一级节点和二级节点,基于与每个所述二级节点相关联的法律法规,构建以该二级节点为根节点的子图谱;对所述子图谱的节点分别进行聚合计算和相似度计算,重构所述子图谱;基于所述一级节点、所述二级节点和经过重构的所述子图谱构建初始法律知识图谱;基于法律知识相关文件通过实体抽取得到游离节点;将所述初始法律知识图谱的节点作为第一类别标签,通过经过预训练的第一多类别分类模型对所述游离节点进行分类,并将所述游离节点关联到所述初始法律知识图谱的相应节点上,以得到所述法律知识图谱。到所述法律知识图谱。到所述法律知识图谱。

【技术实现步骤摘要】
法律知识图谱构建方法及相关设备


[0001]本公开涉及知识图谱
,尤其涉及一种法律知识图谱构建方法及相关设备。

技术介绍

[0002]司法领域是以公检法等国家司法机关及司法人员依照法定职权和法定程序,运用法律处理案件的专业领域。近年来,司法领域积极运用大数据、云计算、人工智能等先进技术,深入业务场景解决痛点问题,有效提升办案质效、辅助司法管理、服务群众诉讼,加速推进司法智慧化、数字化、现代化转型升级。
[0003]人工智能本质是提升和解放生产力的问题,人工智能中的认知智能和行为智能与生产力相对应,而知识图谱结合自然语言处理则是发展认知智能的基础。应用于司法领域,法律知识图谱的构建则是实现智慧司法不可或缺的基础工程。法律知识图谱将法律领域中的实体、属性和关系进行体系化梳理,并建立逻辑关联,通过知识图谱和大数据技术进行数据挖掘,辅助决策,洞察知识领域动态发展规律。基于法律知识图谱,通过技术手段可实现司法业务场景的智能应用,解决“案多人少”等现实问题,为司法人员办案提供高效参考和科学依据。但是,目前法律知识图谱的构建还不够完善,无法对法律咨询和法律搜索等司法领域的应用提供基础保障。

技术实现思路

[0004]有鉴于此,本公开的目的在于提出一种法律知识图谱构建方法及相关设备。
[0005]基于上述目的,本公开提供了一种法律知识图谱构建方法,包括:通过对法律法规的法律内容进行分类,确定一级节点;基于所述一级节点根据相关法律法规确定二级节点,所述二级节点为所述一级节点的子节点;基于与每个所述二级节点相关联的法律法规,构建以该二级节点为根节点的子图谱;对所述子图谱的节点分别进行聚合计算和相似度计算,重构所述子图谱;基于所述一级节点、所述二级节点和经过重构的所述子图谱构建初始法律知识图谱;基于法律知识相关文件通过实体抽取得到游离节点;将所述初始法律知识图谱的节点作为第一类别标签,通过经过预训练的第一多类别分类模型对所述游离节点进行分类,并将所述游离节点关联到所述初始法律知识图谱的相应节点上,以得到所述法律知识图谱。
[0006]进一步的,所述一级节点包括:民事、刑事、商事、经济、行政和宪法。
[0007]进一步的,所述基于与每个所述二级节点相关联的法律法规,构建以该二级节点为根节点的子图谱,包括:
从与所述二级节点相关联的第一类法律文件中提取关键词,构建所述子图谱。
[0008]进一步的,对所述子图谱的节点进行聚合计算和相似度计算,重构所述子图谱,包括:将所述子图谱的节点作为第二类别标签,通过经过预训练的第二多标签分类模型对与所述子图谱关联的法律语料进行分类,基于分类结果确定聚合节点,所述聚合节点作为所述二级节点下的三级节点,与所述聚合节点关联的所述子图谱中的节点作为所述聚合节点的子节点;从与所述二级节点相关联的第二类法律文件中提取关键词,将所述关键词作为候选节点,通过对所述候选节点和所述子图谱中的节点进行相似度计算,将所述候选节点关联到所述子图谱的相应节点上。
[0009]进一步的,基于法律知识相关文件通过实体抽取得到游离节点,包括:通过预训练模型Bert对法律知识相关文件中的语句进行编码,得到该语句中每个字的字向量表示;通过BIO标注法对所述字向量表示进行标注并得到所述字向量表示的第三类别标签,基于所述第三类别标签通过前馈神经网络生成所述字向量表示的得分向量;基于条件随机场和所述得分向量得到所述字向量表示对应的最终第三类别标签;基于所述最终第三类别标签确定游离节点。
[0010]进一步的,所述将所述初始法律知识图谱的节点作为第一类别标签,通过经过预训练的第一多类别分类模型对所述游离节点进行分类,包括:通过预训练模型Bert对与所述游离节点关联的文本语句进行编码,得到所述文本语句的句子向量表示;基于所述第一类别标签通过所述第一多类别分类模型对所述句子向量表示进行分类,确定所述句子向量表示的所述第一类别标签,将所述第一类别标签作为所述游离节点的第一类别标签。
[0011]进一步的,所述将所述游离节点关联到所述初始法律知识图谱的相应节点上,以得到所述法律知识图谱,包括:通过自顶向下或自底向上的关联方法将所述游离节点关联到所述初始法律知识图谱的相应节点上。
[0012]基于同一专利技术构思,本公开还提供了一种法律知识图谱构建装置,包括:一级节点确定模块,被配置为通过对法律法规的法律内容进行分类,确定一级节点;二级节点确定模块,被配置为基于所述一级节点根据相关法律法规确定二级节点,所述二级节点为所述一级节点的子节点;子图谱构建模块,被配置为基于与每个所述二级节点相关联的法律法规,构建以该二级节点为根节点的子图谱;子图谱重构模块,被配置为对所述子图谱的节点分别进行聚合计算和相似度计算,重构所述子图谱;初始法律知识图谱构建模块,被配置为基于所述一级节点、所述二级节点和经过重构的所述子图谱构建初始法律知识图谱;
游离节点提取模块,被配置为基于法律知识相关文件通过实体抽取得到游离节点;法律知识图谱构建模块,被配置为将所述初始法律知识图谱的节点作为第一类别标签,通过经过预训练的第一多类别分类模型对所述游离节点进行分类,并将所述游离节点关联到所述初始法律知识图谱的相应节点上,以得到所述法律知识图谱。
[0013]基于同一专利技术构思,本公开还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如上所述的方法。
[0014]基于同一专利技术构思,本公开还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行如上所述的方法。
[0015]从上面所述可以看出,本公开提供的法律知识图谱构建方法及相关设备,基于深度学习的要素抽取方法,结合法律专家和人工抽取建立法律知识图谱表示体系,提出一套法律知识图谱的构建方法。该法律知识图谱通过信息抽取,将以纯文本形式存在的法律数据结构化,为法律咨询和法律搜索等一系列司法领域的应用提供了基础保障。
附图说明
[0016]为了更清楚地说明本公开或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1为本公开实施例的法律知识图谱构建方法的流程示意图;图2为本公开实施例的子图谱构建的示意图;图3为本公开实施例的子图谱节点聚合的示意图;图4为本公开实施例的经过相似度计算的子图谱重构的示意图;图5为本公开实施例的法律知识图谱构建装置的结构示意图;图6为本公开实施例的电子设备的结构示意图。
具体实施方式
[0018]为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
[0019]需要说明的是,除非另外定义,本公开实施例使用的技术术语或者科本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种法律知识图谱构建方法,包括:通过对法律法规的法律内容进行分类,确定一级节点;基于所述一级节点根据相关法律法规确定二级节点,所述二级节点为所述一级节点的子节点;基于与每个所述二级节点相关联的法律法规,构建以该二级节点为根节点的子图谱;对所述子图谱的节点分别进行聚合计算和相似度计算,重构所述子图谱;基于所述一级节点、所述二级节点和经过重构的所述子图谱构建初始法律知识图谱;基于法律知识相关文件通过实体抽取得到游离节点;将所述初始法律知识图谱的节点作为第一类别标签,通过经过预训练的第一多类别分类模型对所述游离节点进行分类,并将所述游离节点关联到所述初始法律知识图谱的相应节点上,以得到所述法律知识图谱。2.根据权利要求1所述的方法,其中,所述一级节点包括:民事、刑事、商事、经济、行政和宪法。3.根据权利要求1所述的方法,其中,所述基于与每个所述二级节点相关联的法律法规,构建以该二级节点为根节点的子图谱,包括:从与所述二级节点相关联的第一类法律文件中提取关键词,构建所述子图谱。4.根据权利要求1所述的方法,其中,对所述子图谱的节点进行聚合计算和相似度计算,重构所述子图谱,包括:将所述子图谱的节点作为第二类别标签,通过经过预训练的第二多标签分类模型对与所述子图谱关联的法律语料进行分类,基于分类结果确定聚合节点,所述聚合节点作为所述二级节点下的三级节点,与所述聚合节点关联的所述子图谱中的节点作为所述聚合节点的子节点;从与所述二级节点相关联的第二类法律文件中提取关键词,将所述关键词作为候选节点,通过对所述候选节点和所述子图谱中的节点进行相似度计算,将所述候选节点关联到所述子图谱的相应节点上。5.根据权利要求1所述的方法,其中,基于法律知识相关文件通过实体抽取得到游离节点,包括:通过预训练模型Bert对法律知识相关文件中的语句进行编码,得到该语句中每个字的字向量表示;通过BIO标注法对所述字向量表示进行标注并得到所述字向量表示的第三类别标签,基于所述第三类别标签通过前馈神经网络生成所述字向量表示的得分向量;基于条件随机场和所述得分向量得到所述字向量表示对应的最终第三类别标签;...

【专利技术属性】
技术研发人员:朵思惟余梓飞张程华张艳丽
申请(专利权)人:天津汇智星源信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1