争议焦点的标注分类方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:21571557 阅读:29 留言:0更新日期:2019-07-10 15:25
本申请涉及人工智能技术领域,应用于智慧城市行业,特别是涉及一种争议焦点的标注分类方法、装置、计算机设备和存储介质。一个实施例中的方法包括:获取焦点定位规则以及裁判文书样本,根据焦点定位规则对裁判文书样本进行焦点位置标注,得到带标注的裁判文书样本,提取带标注的裁判文书样本中的争议焦点,并获取分类模型以及争议焦点的类型列表,根据分类模型以及争议焦点的类型列表,对提取的争议焦点进行分类,得到提取的争议焦点的自动分类结果。这样可以实现自动对焦点进行标注分类,可以大幅减少专业标注人员的工作量,通过模型对焦点进行标注分类,可以有效缩短标注分类周期,提高标注分类的工作效率。

Labeling and Classification Method, Device, Computer Equipment and Storage Medium of Dispute Focus

【技术实现步骤摘要】
争议焦点的标注分类方法、装置、计算机设备和存储介质
本申请涉及人工智能
,特别是涉及一种争议焦点的标注分类方法、装置、计算机设备和存储介质。
技术介绍
裁判文书用于记载人民法院审理过程和结果,是诉讼活动结果的载体,也是人民法院确定和分配当事人实体权利义务的凭证。传统的,需要人工对裁判文书中的争议焦点进行定位分类,由于专业性强、培训难、标注量大等特点,往往较难在短时间内完成任务,导致标注分类工作效率低。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高工作效率的争议焦点的标注分类方法、装置、计算机设备和存储介质。一种争议焦点的标注分类方法,所述方法包括:获取焦点定位规则以及裁判文书样本,所述焦点定位规则用于定位裁判文书的焦点位置;根据所述焦点定位规则对所述裁判文书样本进行焦点位置标注,得到带标注的裁判文书样本;提取所述带标注的裁判文书样本中的争议焦点,并获取分类模型以及争议焦点的类型列表;根据所述分类模型以及所述争议焦点的类型列表,对提取的争议焦点进行分类,得到所述提取的争议焦点的自动分类结果。在一个实施例中,所述分类模型包括规则模型以及相似度模型,所述根据所述分类模型以及所述争议焦点的类型列表,对提取的争议焦点进行分类,得到所述提取的争议焦点的自动分类结果,包括:根据所述争议焦点的类型列表、所述规则模型以及提取的争议焦点,得到所述规则模型对应的焦点类型侯选集;根据所述争议焦点的类型列表、所述相似度模型以及提取的争议焦点,得到所述相似度模型对应的焦点类型侯选集;根据所述规则模型对应的焦点类型侯选集以及所述相似度模型对应的焦点类型侯选集,得到提取的争议焦点对应的焦点类型。在一个实施例中,所述根据所述争议焦点的类型列表、所述规则模型以及提取的争议焦点,得到所述规则模型对应的焦点类型侯选集,包括:通过所述规则模型对提取的争议焦点进行去除冗余词和共有词处理,并进行同义词转换处理;根据所述争议焦点的类型列表,统计已处理的争议焦点中各类型的争议焦点,生成焦点类型关键词字典;获取所述裁判文书样本中的焦点句,对所述焦点句进行去除冗余词以及同义词转换处理;获取已处理的焦点句中的焦点描述词,将所述焦点描述词依次与所述焦点类型关键词字典进行比较,得到各焦点描述词属于所述焦点类型关键词字典中争议焦点类型的概率值;遍历所述焦点类型关键词字典,选取概率值大于预设阈值的争议焦点类型作为规则模型的焦点类型侯选集。在一个实施例中,所述根据所述争议焦点的类型列表、所述相似度模型以及提取的争议焦点,得到所述相似度模型对应的焦点类型侯选集,包括:通过相似度模型对提取出的争议焦点进行去除冗余词和共有词处理,并进行同义词转换处理;根据所述争议焦点的类型列表,统计已处理的争议焦点中各类型的争议焦点,生成焦点关键词;将所述焦点关键词中的各争议焦点转换为争议焦点词向量,以争议焦点词向量的均值作为争议焦点句向量,得到焦点类型句向量;获取所述裁判文书样本中的焦点句,将所述焦点句转换为焦点描述句向量;将所述焦点描述句向量遍历所述焦点类型句向量,通过相似度计算得到焦点类型的距离值,选取距离值满足预设条件的焦点类型作为相似度模型的焦点类型侯选集。在一个实施例中,所述根据所述规则模型对应的焦点类型侯选集以及所述相似度模型对应的焦点类型侯选集,得到提取的争议焦点对应的焦点类型,包括:求取所述规则模型对应的焦点类型侯选集以及所述相似度模型对应的焦点类型侯选集的交集;当所述交集中焦点类型的个数为1时,将所述交集中的焦点类型作为提取的争议焦点对应的焦点类型。在一个实施例中,所述求取所述规则模型对应的焦点类型侯选集以及所述相似度模型对应的焦点类型侯选集的交集之后,还包括:当所述交集中焦点类型的个数大于1时,获取各个焦点类型的概率值以及对应的距离值;计算所述各个焦点类型的概率值与对应距离值倒数的乘积,将乘积最大的焦点类型作为提取的争议焦点对应的焦点类型。在一个实施例中,所述求取所述规则模型对应的焦点类型侯选集以及所述相似度模型对应的焦点类型侯选集的交集之后,还包括:当所述交集中焦点类型的个数为0时,获取各个焦点类型的概率值;将概率值最大的焦点类型作为提取的争议焦点对应的焦点类型。一种争议焦点的标注分类装置,所述装置包括:规则获取模块,用于获取焦点定位规则以及裁判文书样本,所述焦点定位规则用于定位裁判文书的焦点位置;样本标注模块,用于根据所述焦点定位规则对所述裁判文书样本进行焦点位置标注,得到带标注的裁判文书样本;焦点提取模块,用于提取所述带标注的裁判文书样本中的争议焦点,并获取分类模型以及争议焦点的类型列表;焦点分类模块,用于根据所述分类模型以及所述争议焦点的类型列表,对提取的争议焦点进行分类,得到所述提取的争议焦点的自动分类结果。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取焦点定位规则以及裁判文书样本,所述焦点定位规则用于定位裁判文书的焦点位置;根据所述焦点定位规则对所述裁判文书样本进行焦点位置标注,得到带标注的裁判文书样本;提取所述带标注的裁判文书样本中的争议焦点,并获取分类模型以及争议焦点的类型列表;根据所述分类模型以及所述争议焦点的类型列表,对提取的争议焦点进行分类,得到所述提取的争议焦点的自动分类结果。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取焦点定位规则以及裁判文书样本,所述焦点定位规则用于定位裁判文书的焦点位置;根据所述焦点定位规则对所述裁判文书样本进行焦点位置标注,得到带标注的裁判文书样本;提取所述带标注的裁判文书样本中的争议焦点,并获取分类模型以及争议焦点的类型列表;根据所述分类模型以及所述争议焦点的类型列表,对提取的争议焦点进行分类,得到所述提取的争议焦点的自动分类结果。上述争议焦点的标注分类方法、装置、计算机设备和存储介质,通过获取焦点定位规则以及裁判文书样本,根据焦点定位规则对裁判文书样本进行焦点位置标注,得到带标注的裁判文书样本,提取带标注的裁判文书样本中的争议焦点,并获取分类模型以及争议焦点的类型列表,根据分类模型以及争议焦点的类型列表,对提取的争议焦点进行分类,得到提取的争议焦点的自动分类结果,这样可以实现自动对焦点进行标注分类,可以大幅减少专业标注人员的工作量,通过模型对焦点进行标注分类,可以有效缩短标注分类周期,提高标注分类的工作效率。附图说明图1为一个实施例中争议焦点的标注分类方法的流程示意图;图2为一个实施例中焦点分类步骤的流程示意图;图3为一个实施例中规则模型焦点类型候选集获取步骤的流程示意图;图4为一个实施例中相似度模型焦点类型候选集获取步骤的流程示意图;图5为一个实施例中焦点类型确定步骤的流程示意图;图6为一个实施例中争议焦点的标注分类装置的结构框图;图7为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。在一个实施例中,如图1所示,提供了一种争议焦点的标注分类方法,包括以下步骤:步骤102,获取焦点定位规则以及裁判文书样本本文档来自技高网...

【技术保护点】
1.一种争议焦点的标注分类方法,所述方法包括:获取焦点定位规则以及裁判文书样本,所述焦点定位规则用于定位裁判文书的焦点位置;根据所述焦点定位规则对所述裁判文书样本进行焦点位置标注,得到带标注的裁判文书样本;提取所述带标注的裁判文书样本中的争议焦点,并获取分类模型以及争议焦点的类型列表;根据所述分类模型以及所述争议焦点的类型列表,对提取的争议焦点进行分类,得到所述提取的争议焦点的自动分类结果。

【技术特征摘要】
1.一种争议焦点的标注分类方法,所述方法包括:获取焦点定位规则以及裁判文书样本,所述焦点定位规则用于定位裁判文书的焦点位置;根据所述焦点定位规则对所述裁判文书样本进行焦点位置标注,得到带标注的裁判文书样本;提取所述带标注的裁判文书样本中的争议焦点,并获取分类模型以及争议焦点的类型列表;根据所述分类模型以及所述争议焦点的类型列表,对提取的争议焦点进行分类,得到所述提取的争议焦点的自动分类结果。2.根据权利要求1所述的方法,其特征在于,所述分类模型包括规则模型以及相似度模型,所述根据所述分类模型以及所述争议焦点的类型列表,对提取的争议焦点进行分类,得到所述提取的争议焦点的自动分类结果,包括:根据所述争议焦点的类型列表、所述规则模型以及提取的争议焦点,得到所述规则模型对应的焦点类型侯选集;根据所述争议焦点的类型列表、所述相似度模型以及提取的争议焦点,得到所述相似度模型对应的焦点类型侯选集;根据所述规则模型对应的焦点类型侯选集以及所述相似度模型对应的焦点类型侯选集,得到提取的争议焦点对应的焦点类型。3.根据权利要求2所述的方法,其特征在于,所述根据所述争议焦点的类型列表、所述规则模型以及提取的争议焦点,得到所述规则模型对应的焦点类型侯选集,包括:通过所述规则模型对提取的争议焦点进行去除冗余词和共有词处理,并进行同义词转换处理;根据所述争议焦点的类型列表,统计已处理的争议焦点中各类型的争议焦点,生成焦点类型关键词字典;获取所述裁判文书样本中的焦点句,对所述焦点句进行去除冗余词以及同义词转换处理;获取已处理的焦点句中的焦点描述词,将所述焦点描述词依次与所述焦点类型关键词字典进行比较,得到各焦点描述词属于所述焦点类型关键词字典中争议焦点类型的概率值;遍历所述焦点类型关键词字典,选取概率值大于预设阈值的争议焦点类型作为规则模型的焦点类型侯选集。4.根据权利要求2所述的方法,其特征在于,所述根据所述争议焦点的类型列表、所述相似度模型以及提取的争议焦点,得到所述相似度模型对应的焦点类型侯选集,包括:通过相似度模型对提取出的争议焦点进行去除冗余词和共有词处理,并进行同义词转换处理;根据所述争议焦点的类型列表,统计已处理的争议焦点中各类型的争议焦点,生成焦点关键词;将所述焦点关键词中的各争议焦点转换为争议焦点词向量,以争议焦点词...

【专利技术属性】
技术研发人员:朱昱锦徐国强邱寒
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1