当前位置: 首页 > 专利查询>浙江大学专利>正文

一种法庭辩论智能辅助法官回复生成方法和系统技术方案

技术编号:34890533 阅读:36 留言:0更新日期:2022-09-10 13:49
本发明专利技术公开了一种法庭辩论智能辅助法官回复生成方法和系统,属于法律人工智能领域。获取给定的对话历史内容和争议焦点,以及每一个争议焦点对应的争议焦点类型标注,利用编码器获取对话历史内容的语义表示;构建知识记忆单元,利用若干个可训练的嵌入矩阵生成基于争议焦点类型的记忆内容,将记忆内容存储到知识记忆单元的记忆单元槽中;利用基于注意力机制的解码器进行解码,在每一步的解码过程中获取上下文向量、记忆单元读出向量以及上一解码步生成的单词,直至解码结束,生成法官回复内容。该模型在给定对话历史内容和对立历史中的争议焦点的基础上,生成法官的回复。生成法官的回复。生成法官的回复。

【技术实现步骤摘要】
一种法庭辩论智能辅助法官回复生成方法和系统


[0001]本专利技术涉及法律人工智能领域,具体涉及一种法庭辩论智能辅助法官回复生成方法。

技术介绍

[0002]近年来,随着以裁判文书为代表的司法大数据的不断公开以及自然语言处理技术的不断突破,如何将人工智能应用在司法领域,辅助司法工作者提升案件处理的效率和公平性,成为法律智能研究的一个热点。在司法实践的庭审环节中,法官会按照有关庭审规定和案由向原告和被告提出案情相关的问题,原告和被告将根据这些问题就案件详情分别进行陈述、答辩以及证据交换等行为。运用人工智能技术分析对话历史信息,为法官提供回复内容,可以提高法院的审理效率,减轻司法人员的负担。
[0003]在庭审辩论中,原被告之间会存在一些争议焦点,法官的回复往往要考虑到这些争议焦点。现有的对话回复生成系统不具备这一功能。为了实现这一功能,本专利技术将提出一种根据庭审对话历史信息,生成法官回复的方法,该方法可以为司法人员提供庭审智能辅助功能。

技术实现思路

[0004]本专利技术的目的在于解决现有需求,为了辅助司法人员在庭审中考虑到当事人在辩论中的争议焦点进行问话,本专利技术提供了一种法庭辩论智能辅助法官回复生成方法。
[0005]本专利技术所采用的具体技术方案是:
[0006]一种法庭辩论智能辅助法官回复生成方法,包括:
[0007]获取给定的对话历史内容和争议焦点,以及每一个争议焦点对应的争议焦点类型标注,利用编码器获取对话历史内容的语义表示;
[0008]构建知识记忆单元,利用若干个可训练的嵌入矩阵生成基于争议焦点类型的记忆内容,将记忆内容存储到知识记忆单元的记忆单元槽中;
[0009]利用基于注意力机制的解码器进行解码,在每一步的解码过程中获取上下文向量、记忆单元读出向量以及上一解码步生成的单词,直至解码结束,生成法官回复内容。
[0010]进一步的,所述的编码器、解码器和知识记忆单元采用端到端的方式进行训练,在训练过程中,将对话历史内容、对话历史内容的争议焦点类型标注、法官回复内容作为训练样本,以对话历史内容作为编码器输入,以对话历史内容的争议焦点类型标注作为知识记忆单元的输入,以法官回复内容作为解码器的输出标签。
[0011]一种法庭辩论智能辅助法官回复生成系统,用于实现上述的法庭辩论智能辅助法官回复生成方法。
[0012]本专利技术具备的有益效果:
[0013]本专利技术提出了一种法庭辩论智能辅助法官回复生成方法,不同于现有的对话回复生成模型,本专利技术利用知识记忆单元存储对话历史中的争议焦点,并将其集成到编码器


码器网络中。具体来说,本专利技术将使用一个对话编码器编码庭审对话历史内容。之后,本专利技术设计了一个知识记忆单元将编码后的对话历史内容和争议焦点内容存入其中。最后,本专利技术设计了一个语言解码器,在解码过程中,其融合知识记忆单元里的内容和对话历史内容,并采用拷贝机制,生成对应的法官回复内容。
[0014]现有的对话回复生成方法没有考虑对话辩论中争议焦点的标注信息。本专利技术提出的方法利用了对话辩论中争议焦点的标注信息,克服了现有方法的相关缺陷。
附图说明
[0015]图1为根据一示例性实施例示出的知识记忆单元的结构示意图;
[0016]图2为根据一示例性实施例示出的法庭辩论智能辅助法官回复生成方法的示意图;
[0017]图3是根据一示例性实施例示出的用于实现法庭辩论智能辅助法官回复生成方法的电子设备终端结构图。
具体实施方式
[0018]下面结合附图和具体实施方式对本专利技术做进一步阐述和说明。附图仅为本专利技术的示意性图解,附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器系统和/或微控制器系统中实现这些功能实体。
[0019]附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0020]除另作定义外,本申请所涉及的技术术语或者科学术语应具有本申请所属
具备一般技能的人所理解的一般含义。在本申请中的“一”、“一个”、“一种”、“该”、“这些”等类似的词并不表示数量上的限制,它们可以是单数或者复数。在本申请中所涉及的术语“包括”、“包含”、“具有”及其任何变体,其目的是涵盖不排他的包含;在本申请中所涉及的“连接”、“相连”、“耦接”等类似的词语并不限定于物理的或机械连接,而可以包括电气连接,无论是直接连接还是间接连接。
[0021]如图2所示,本专利技术提出了一种法庭辩论智能辅助法官回复生成方法,包括以下步骤:
[0022]步骤一、针对一篇法庭辩论对话文本,采样抽取若干数据样本。每个数据样本由对话历史内容、对话历史内容的争议焦点类型标注、法官回复内容构成。
[0023]采样过程中,首先确定对话文本中某个语句为法官回复内容,该语句的角色标注必须为法官;然后将该句之前的若干句语句作为对话历史内容,其中对话历史内容中至少有一个语句必须有争议焦点类型标注,可以存在多个语句有争议焦点类型标注,每个争议焦点类型标注可以包含不定个数的类型标签,如某个语句的争议焦点类型标注包含两个类型标签,为“本金争议”、“还清部分借款本金”。
[0024]本步骤中,如表1所示,截取了一篇法庭辩论对话文本的部分内容,以最后一处角
色标注为法官的语句为例,将其作为法官回复内容,并将最后一句语句之前的四句作为对话历史内容,所述的对话历史内容中存在具有争议焦点内容“双方实际借款金额是多少”,符合采样要求;该示例中的对话历史内容的争议焦点类型标注包括了四级分类标签,分别为“本金争议”、“借贷合意”、“书面协议or电子协议”、“缺乏借款的意思表示”。
[0025]表1:数据样本示例。
[0026][0027]步骤二、构建一个深度神经网络编码器对对话历史内容进行编码,得到一组编码后的对话内容。所述的深度神经网络编码器包括词嵌入、角色嵌入、长短期记忆网络编码器。
[0028]本步骤中,深度神经网络编码器的具体工作流程如下:
[0029]将对话历史内容作为源语句输入,每个词都用一个预训练的词嵌入w表示,并用角色嵌入r对词所属的说话人信息(原告/被告/法官)进行编码,将词嵌入和角色嵌入的结构拼接起来作为词级别的语义表示将词级别的语义表示输入到长短期记忆网络编码器Enc中,得到编码后的对话历史内容的语义表示H={h1,h2,

,h
i
,

,h
M
},其中h
i
表示对话历史内容第i个词的隐藏层状态,M表示对话历史内容的长度。
[0030]步骤三、构建一个知识记忆单元,所述知识记忆单元的结构如图1所示。本步骤中,知识记忆单元由K+本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种法庭辩论智能辅助法官回复生成方法,其特征在于,包括:获取给定的对话历史内容和争议焦点,以及每一个争议焦点对应的争议焦点类型标注,利用编码器获取对话历史内容的语义表示;构建知识记忆单元,利用若干个可训练的嵌入矩阵生成基于争议焦点类型的记忆内容,将记忆内容存储到知识记忆单元的记忆单元槽中;利用基于注意力机制的解码器进行解码,在每一步的解码过程中获取上下文向量、记忆单元读出向量以及上一解码步生成的单词,直至解码结束,生成法官回复内容。2.根据权利要求1所述的一种法庭辩论智能辅助法官回复生成方法,其特征在于,所述的编码器包括词嵌入层、角色嵌入层和长短期记忆网络层,在编码过程中,利用词嵌入层获取对话历史内容的词嵌入w,利用角色嵌入层获取对话历史内容所属的说话人信息r,将对话历史内容的词嵌入w与对话历史内容所属的说话人信息r拼接后作为长短期记忆网络层的输入,得到词级别的对话历史内容的语义表示3.根据权利要求1所述的一种法庭辩论智能辅助法官回复生成方法,其特征在于,所述的知识记忆单元由K+1个可训练的嵌入矩阵C=(C1,...,C
K+1
)以及同样数量的记忆单元槽组成,其中表示第k个可训练的嵌入矩阵,K是记忆单元中最大的跳数,|V|是词典的大小,d
emb
是嵌入的维度。4.根据权利要求3所述的一种法庭辩论智能辅助法官回复生成方法,其特征在于,利用若干个可训练的嵌入矩阵生成基于争议焦点类型的记忆内容的过程为:给定某一对话历史内容中存在的若干个争议焦点及其争议焦点类型标注,利用标签嵌入层对每一个争议焦点对应的若干个争议焦点类型标注进行嵌入,得到每一个争议焦点的初始知识表示;利用K+1个可训练的嵌入矩阵和每一个争议焦点的初始知识表示,生成记忆内容存储到知识记忆单元的记忆单元槽中,计算公式如下:k=1,,2,...,K,K+1其中,是第k跳的记忆槽第i个位置的单元内容,第i个位置对应第i个争议焦点;C
k
(.)表示由第k个可训练的嵌入矩阵进行处理,B(
·
)表示词袋计算,m
i
为第i个争议焦点的初始知识表示,K是记忆单元中最大的跳数;在每一跳中遍历所有的争议焦点,即可得到当前跳的记忆槽存储的单元内容在每一跳中遍历所有的争议焦点,即可得到当前跳的记忆槽存储的单元内容表示第k跳的记忆槽存储的单元内容,n为争议焦点的数量。5.根据权利要求4所述的一种法庭辩论智能辅助法官回复生成方法,其特征在于,在所述的将记忆内容存储到知识记忆单元的记忆单元槽中之后,还包括更新写入查询向量的过程,具体为:将经过编码的对话历史内容的语义表示H中最后一个词的隐藏层状态h
M
作为初始写入查询向量q1,写入查询向量可以循环进行K跳计算,在每一跳中分别计算针对每一个争议焦点的记忆单元注意力权重,该权重决定了当前跳的某一记忆单元内容关于当前跳的写入查询向量的相似性程度:
其中,q
k
是对应第k跳的写入查询向量;上角标T表示转置,表示第k跳的记忆槽第i个位置的权重;更新每一跳的写入查询向量:模型通过将注意力权重在c
k+1
上进行加权求和,得到第k跳的输出o
k
,并和第k跳的写入查询向量q
k
相加,更新为新一跳的写入查询向量q
k+1
:q
k+1
=q
k
+o
k
通过该步骤的计算,得到了K+1个记忆单元槽存储的内容c=(c1,...,c
K+1
),并得到最终的写入查询向量q
K+1
。6.根据权利要求1所述的一种法庭辩论智能辅助法官回复生成方法,其特...

【专利技术属性】
技术研发人员:郑济元赵洲
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1