法律法规编码生成的方法、数据库构建的方法及装置制造方法及图纸

技术编号:37403241 阅读:25 留言:0更新日期:2023-04-30 09:30
本发明专利技术实施例涉及编码技术研究领域,公开了法律法规编码生成的方法、数据库构建的方法及装置;编码生成的方法包括:基于预先设定的名称编码规则对发布信息进行编码以得到相应法律法规的名称编码信息;基于预先设定的内容编码规则对法律法规内容信息进行编码以得到相应法律法规内容的内容编码信息;名称编码信息以及内容编码信息构成待编码法律法规信息的编码信息。本发明专利技术的法律法规编码的方法通过采用多级编码的方式能够较好的完成对法律法规内容的编码及更新,便于其他各个系统进行识别引证且信息整合成本较低,且该编码方式也同时具备兼顾唯一性、通用性、简易性、一致性及可读性的特点。读性的特点。读性的特点。

【技术实现步骤摘要】
法律法规编码生成的方法、数据库构建的方法及装置


[0001]本专利技术涉及自然语言处理技术研究领域,具体涉及法律法规编码生成的方法、数据库构建的方法及装置。

技术介绍

[0002]目前,法律、法规、部门规章、规范性文件(以下简称法律法规)虽然会有发文字号,但由于历史原因,存在规则不一、重复编号(如“主席令第八十八号”,存在第八届、第十三届的情况)等情况。人们在引证时,通常使用法律法规名称和发文字号的方式来描述,这种方式虽然对阅读者友好,但不便于信息系统使用,特别在多个独立系统进行数据汇聚融合时,由于各系统编码规则不一,导致整合成本极高。因此,设计一种便于进行信息整合引证的方案成为本领域技术人员亟待解决的技术问题。

技术实现思路

[0003]针对上述缺陷,本专利技术公开了法律法规编码生成的方法、数据库构建的方法及装置,通过采用多级编码的方式能够较好的完成对法律法规内容的编码及更新,便于其他各个系统进行识别引证且信息整合成本较低,且该编码方式也同时具备兼顾唯一性、通用性、简易性、一致性及可读性的特点。
[0004]本专利技术实施例第一方面公开了一种法律法规编码生成的方法,包括:获取待编码法律法规信息,所述待编码法律法规信息包括发布信息和法律法规内容信息;基于预先设定的名称编码规则对所述发布信息进行编码以得到相应法律法规的名称编码信息;基于预先设定的内容编码规则对所述法律法规内容信息进行编码以得到相应法律法规内容的内容编码信息;所述名称编码信息以及内容编码信息构成所述待编码法律法规信息的编码信息。<br/>[0005]作为一种可选的实施方式,在本专利技术实施例第一方面中,所述发布信息包括发布单位信息、发布日期信息和发布名称信息;所述名称编码规则包括效力等级映射关系、区划代码映射关系、名称定义规则以及时间定义规则;所述基于预先设定的名称编码规则对所述发布信息进行编码以得到相应法律法规的名称编码信息,包括:识别所述发布单位信息得到所述待编码法律法规信息的效力等级信息,基于所述效力等级信息与效力等级映射关系,得到发布信息的效力等级编码;识别所述发布单位信息得到所述待编码法律法规信息的行政区划信息,基于所述行政区划信息与区划代码映射关系得到发布信息的区划编码;基于所述发布名称信息与所述名称定义规则,得到发布信息的名称编码;基于所述发布日期信息与所述时间定义规则,得到发布信息的时间编码;所述发
布信息的效力等级编码、发布信息的区划编码、发布信息的名称编码以及发布信息的时间编码共同构成相应法律法规的名称编码信息。
[0006]作为一种可选的实施方式,在本专利技术实施例第一方面中,所述基于所述发布名称信息与所述名称定义规则,得到发布信息的名称编码的步骤,包括:对所述发布名称信息进行字符过滤操作以得到过滤的发布名称信息;所述字符过滤操作包括时间数字过滤、标点字符过滤和特殊文字过滤,且在所述特殊文字过滤中,当该特殊文字出现在设定位置时才进行过滤操作,否则不执行特殊字符过滤;根据所述名称定义规则对经过过滤的发布名称信息采用逆向编码的方式对发布名称信息中预设数量的字符进行排列以得到相应的名称编码。
[0007]作为一种可选的实施方式,在本专利技术实施例第一方面中,所述预设数量为10;所述根据所述名称定义规则对经过过滤的发布名称信息采用逆向编码的方式对发布名称信息中预设数量的字符进行排列以得到相应的名称编码,包括:对经过过滤的发布名称信息进行字符识别以确定相应字符信息;当所述字符信息为文字信息时,则获取与所述文字信息对应的拼音首字母,以及各个拼音首字母在发布名称信息中的第一位置信息;当所述字符信息为数字或字母时,则获取相应的数字或字母,以及各个数字或字母在发布名称信息中的第二位置信息;根据所述第一位置信息和第二位置信息采用逆向编码的方式对所述拼音首字母、数字或字母进行排列以得到相应的名称编码,当所述字符信息的数量不大于10时,则在名称编码中增加占位符直至总体编码位数为10。
[0008]作为一种可选的实施方式,在本专利技术实施例第一方面中,所述基于所述发布名称信息与所述名称定义规则,得到发布信息的名称编码,还包括:提取经过过滤的发布名称信息中各个字符信息;根据预设的数字字母对应表来确定各个字符信息对应的表示值;基于所述表示值以及加权因子计算公式确定各个字符位置的加权因子,所述加权因子计算公式为:W
i
=2
(i

1)
(mod11),其中W
i
为加权因子;根据防重码计算公式以及换算关系表确定得到相应的防重码,其中,所述换算关系表为防重码与防重数值之间的映射关系表,所述防重码与所述防重数值一一对应,所述防重码计算公式为: X
31
=;其中, X
31
为防重码,a
i
为字符信息对应的表示值,W
i
为个各个字符表示值对应的加权因子,i为所述过滤的发布名称信息各个字符从左至右的位置序号。
[0009]作为一种可选的实施方式,在本专利技术实施例第一方面中,所述编码生成的方法,还包括:当检测到所述发布日期信息缺失时,读取所述待编码法律法规信息的实施时间信息进行日期编码;所述法律法规的内容信息包括层级名称信息,所述层级名称信息包括层级名称与层级序号;所述基于预先设定的内容编码规则对所述法律法规内容信息进行编码以得到相
应法律法规内容的内容编码信息,包括,根据层级名称信息以及层级代码映射关系确定层级代码,所述层级名称信息与层级代码一一对应;所述层级代码与所述层级序号构成所述内容编码信息。
[0010]本专利技术实施例第二方面公开一种法律法规的数据库构建方法,包括:获取法律法规信息以及通过如本专利技术实施例第一方面公开的法律法规编码的方法所获得的对应的编码信息;将所述法律法规信息与相应的编码信息进行关联存储。
[0011]本专利技术实施例第三方面公开一种法律法规编码生成的装置,包括:输入模块:用于获取待编码法律法规信息,所述待编码法律法规信息包括发布信息和法律法规内容信息;第一编码模块:用于对所述发布信息进行编码以得到相应法律法规的名称编码信息;第二编码模块:用于对所述法律法规内容信息进行编码以得到相应法律法规内容的内容编码信息;输出模块:用于根据所述名称编码信息与内容编码信息输出所述待编码法律法规信息的编码信息。
[0012]本专利技术实施例第四方面公开一种电子设备,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行本专利技术实施例第一方面公开的法律法规编码生成的方法。
[0013]本专利技术实施例第五方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本专利技术实施例第一方面公开的法律法规编码生成的方法。
[0014]与现有技术相比,本专利技术实施例具有以下有益效果:本专利技术的法律法规编码的方法通过将法律法规的编码分为两部分,第一部分是对法律法规发布信息的编码,第二部分是对法律法规内容信息的编码;其中第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种法律法规编码生成的方法,其特征在于,包括:获取待编码法律法规信息,所述待编码法律法规信息包括发布信息和法律法规内容信息;基于预先设定的名称编码规则对所述发布信息进行编码以得到相应法律法规的名称编码信息;基于预先设定的内容编码规则对所述法律法规内容信息进行编码以得到相应法律法规内容的内容编码信息;所述名称编码信息以及内容编码信息构成所述待编码法律法规信息的编码信息。2.根据权利要求1所述的法律法规编码生成的方法,其特征在于,所述发布信息包括发布单位信息、发布日期信息和发布名称信息;所述名称编码规则包括效力等级映射关系、区划代码映射关系、名称定义规则以及时间定义规则;所述基于预先设定的名称编码规则对所述发布信息进行编码以得到相应法律法规的名称编码信息,包括:对所述发布信息进行分类识别以得到发布单位信息、发布日期信息和发布名称信息;识别所述发布单位信息得到所述待编码法律法规信息的效力等级信息,基于所述效力等级信息与效力等级映射关系,得到发布信息的效力等级编码;识别所述发布单位信息得到所述待编码法律法规信息的行政区划信息,基于所述行政区划信息与区划代码映射关系得到发布信息的区划编码;基于所述发布名称信息与所述名称定义规则,得到发布信息的名称编码;基于所述发布日期信息与所述时间定义规则,得到发布信息的时间编码;所述发布信息的效力等级编码、发布信息的区划编码、发布信息的名称编码以及发布信息的时间编码共同构成相应法律法规的名称编码信息。3.根据权利要求2所述的法律法规编码生成的方法,其特征在于,所述基于所述发布名称信息与所述名称定义规则,得到发布信息的名称编码的步骤,包括:对所述发布名称信息进行字符过滤操作以得到过滤的发布名称信息;所述字符过滤操作包括时间数字过滤、标点字符过滤和特殊文字过滤,且在所述特殊文字过滤中,当该特殊文字出现在设定位置时才进行过滤操作,否则不执行特殊字符过滤;根据所述名称定义规则对经过过滤的发布名称信息采用逆向编码的方式对发布名称信息中预设数量的字符进行排列以得到相应的名称编码。4.根据权利要求3所述的法律法规编码生成的方法,其特征在于,所述预设数量为10;所述根据所述名称定义规则对经过过滤的发布名称信息采用逆向编码的方式对发布名称信息中预设数量的字符进行排列以得到相应的名称编码,包括:对经过过滤的发布名称信息进行字符识别以确定相应字符信息;当所述字符信息为文字信息时,则获取与所述文字信息对应的拼音首字母,以及各个拼音首字母在发布名称信息中的第一位置信息;当所述字符信息为数字或字母时,则获取相应的数字或字母,以及各个数字或字母在发布名称信息中的第二位置信息;根据所述第一位置信息和第二位置信息采用逆向编码的方式对所述拼音首字母、数字或字母进行排列以得到相应的名称编码,当所述字符信息的数量不大于10时,则在名称编
码中增加占位符直至总体编码...

【专利技术属性】
技术研发人员:刘伟刘柏军
申请(专利权)人:广东远景信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1