System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于法律知识图谱的语义搜索方法、设备及介质技术_技高网

基于法律知识图谱的语义搜索方法、设备及介质技术

技术编号:44082565 阅读:2 留言:0更新日期:2025-01-17 16:16
本发明专利技术公开了基于法律知识图谱的语义搜索方法、设备及介质,涉及法律语义搜索技术领域,解决当前法律搜索系统使用时需要民众提供较为准确的关键词组,一旦输入范围较大的查询词组,民众很难从众多检索结果得到自身想要的查询结果的问题,语义搜索方法具体如下:步骤S1,获取用户终端输入的原始查询语句;步骤S2,对输入的原始查询语句进行初步处理;步骤S3,利用法律知识图谱将初步处理后的原始查询语句进行映射关联;步骤S4,将查询要素与查询结果集进行交叉匹配,基于交叉匹配结果得到原始查询语句的查询结果,本发明专利技术基于法律知识图谱实现法律条文和法律知识的准确搜索。

【技术实现步骤摘要】

本专利技术属于语义检索,具体是基于法律知识图谱的语义搜索方法、设备及介质


技术介绍

1、目前,民众在进行法律咨询时,为民众提供一个高效精准的法律搜索系统,能够有效缓解人工法律服务资源的不足,虽然当下存在的一些法律搜索系统,法律搜索时大多需要民众提供较为准确的关键词组,一旦输入范围较大的查询词组,法律搜索系统将会为民众反馈大量的检索结果,民众很难从众多检索结果得到自身想要的查询结果,与为广大民众提供精准法律线上援助的想法背道而驰;

2、为此,本专利技术提出基于法律知识图谱的语义搜索方法、设备及介质。


技术实现思路

1、有鉴于上述问题,本申请旨在提供一种基于法律知识图谱的语义搜索方法、设备及介质,用以解决现有技术中当前的法律搜索系统使用时需要民众提供较为准确的关键词组,一旦输入范围较大的查询词组,将会为民众反馈大量的检索结果,民众很难从众多检索结果得到自身想要的查询结果,与为广大民众提供精准法律线上援助的想法背道而驰的问题。

2、第一方面,本专利技术的目的可以通过以下技术方案实现:基于法律知识图谱的语义搜索方法,语义搜索方法具体如下:

3、步骤s1,获取用户终端输入的原始查询语句;

4、步骤s2,对输入的原始查询语句进行初步处理;

5、步骤s3,利用法律知识图谱将初步处理后的原始查询语句进行映射关联;

6、步骤s4,将查询要素与查询结果集进行交叉匹配,基于交叉匹配结果得到原始查询语句的查询结果。

7、在一种可能的实施方式中,所述步骤s2中初步处理包括如下具体过程:

8、步骤s21,去除原始查询语句中的标点符号和特殊符号;

9、步骤s22,将去除标点符号和特殊符号的原始查询语句进行分词;

10、步骤s23,将分词后原始查询语句中的重复字符进行删除。

11、在一种可能的实施方式中,原始查询语句的分词算法具体为:基于条件随机场的分词算法;

12、重复字符的删除算法具体为:双端队列重复语句筛除算法。

13、在一种可能的实施方式中,法律知识图谱包括上层索引、中层索引和底层索引,每个上层索引、中层索引和底层索引均设置有对应的索引字符。

14、在一种可能的实施方式中,所述步骤s3包括如下子步骤:

15、步骤s31,将初步处理后原始查询语句每个字符标定为查询要素;

16、步骤s32,查询要素利用文本形态相似算法在法律知识图谱中匹配得到对应的查询结果;其中,查询要素可以对应一个查询结果,也可以对应多个查询结果;

17、步骤s33,将查询要素的查询结果归纳至查询结果集中,并将查询要素与查询结果集建立映射链接,实现原始查询语句与查询结果集的映射关联;

18、步骤s34,按照以上步骤,得到所有查询要素对应的查询结果集。

19、在一种可能的实施方式中,查询结果的得到过程具体为:

20、步骤s321,将查询要素中的每个字符逐一与索引层对应的索引字符进行比对;

21、步骤s322,若查询要素中的每个字符与索引层对应的索引字符的相似度超过设定阈值,则将索引字符作为查询要素的查询结果;

22、步骤s323,若查询要素中的每个字符与索引层对应的索引字符的相似度未超过设定阈值,则将对应索引字符进行剔除。

23、在一种可能的实施方式中,所述步骤s4包括如下子步骤:

24、步骤s41,将查询要素与其他查询要素对应的查询结果集逐一进行交叉匹配;

25、步骤s42,若查询要素与其他查询要素对应查询结果集中任一查询结果相匹配,则将对应查询结果集进行保留,并将其他查询要素对应查询结果集中相匹配的查询结果标定为近似查询结果;

26、若查询要素与其他查询要素对应查询结果集中所有查询结果均不匹配,则将对应查询结果集进行剔除;

27、步骤s43,将近似查询结果作为查询要素与其他查询要素组合查询后的查询结果。

28、在一种可能的实施方式中,所述步骤s4还包括如下子步骤:

29、步骤s44,将保留下来的查询结果集的查询要素作为下一交叉匹配的对象,下一查询要素与保留下来的查询结果集中的近似查询结果进行匹配;

30、步骤s45,若下一查询要素与保留下来的查询结果集中的近似查询结果不匹配,则将近似查询结果进行剔除,若下一查询要素与保留下来的查询结果集中的近似查询结果相匹配,则再次进行交叉匹配直至查询要素交叉匹配完毕;

31、步骤s46,当近似查询结果符合所有查询要素,则将近似查询结果标定为原始查询语句的查询结果。

32、第二方面,本专利技术还提供一种电子设备,所述电子设备包括:

33、存储器,存储有一计算机程序;

34、处理器,与所述存储器通信相连,当所述计算机程序被处理器执行时,实现所述的语义搜索方法。

35、第三方面,本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的语义搜索方法。

36、综上所述,由于采用了上述技术方案,本专利技术的有益效果是:

37、本专利技术首先获取用户终端输入的原始查询语句,而后对输入的原始查询语句进行初步处理,在初步处理后,利用法律知识图谱将初步处理后的原始查询语句进行映射关联,并将查询要素与查询结果集进行交叉匹配,最后基于交叉匹配结果得到原始查询语句的查询结果,本专利技术基于法律知识图谱实现法律条文和法律知识的准确搜索。

本文档来自技高网...

【技术保护点】

1.基于法律知识图谱的语义搜索方法,其特征在于,语义搜索方法具体如下:

2.根据权利要求1所述的基于法律知识图谱的语义搜索方法,其特征在于,所述步骤S2中初步处理包括如下具体过程:

3.根据权利要求2所述的基于法律知识图谱的语义搜索方法,其特征在于,原始查询语句的分词算法具体为:基于条件随机场的分词算法;

4.根据权利要求2所述的基于法律知识图谱的语义搜索方法,其特征在于,法律知识图谱包括上层索引、中层索引和底层索引,每个上层索引、中层索引和底层索引均设置有对应的索引字符。

5.根据权利要求4所述的基于法律知识图谱的语义搜索方法,其特征在于,所述步骤S3包括如下子步骤:

6.根据权利要求5所述的基于法律知识图谱的语义搜索方法,其特征在于,查询结果的得到过程具体为:

7.根据权利要求1所述的基于法律知识图谱的语义搜索方法,其特征在于,所述步骤S4包括如下子步骤:

8.根据权利要求7所述的基于法律知识图谱的语义搜索方法,其特征在于,所述步骤S4还包括如下子步骤:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至8任一项所述的语义搜索方法。

...

【技术特征摘要】

1.基于法律知识图谱的语义搜索方法,其特征在于,语义搜索方法具体如下:

2.根据权利要求1所述的基于法律知识图谱的语义搜索方法,其特征在于,所述步骤s2中初步处理包括如下具体过程:

3.根据权利要求2所述的基于法律知识图谱的语义搜索方法,其特征在于,原始查询语句的分词算法具体为:基于条件随机场的分词算法;

4.根据权利要求2所述的基于法律知识图谱的语义搜索方法,其特征在于,法律知识图谱包括上层索引、中层索引和底层索引,每个上层索引、中层索引和底层索引均设置有对应的索引字符。

5.根据权利要求4所述的基于法律知识图谱的语义搜索方...

【专利技术属性】
技术研发人员:杜博文
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1