针对法务信息的大数据仓库存储、分析、提取系统技术方案

技术编号:24708041 阅读:77 留言:0更新日期:2020-06-30 23:58
本发明专利技术涉及大数据处理领域,具体涉及一种针对法务信息的大数据仓库存储、分析、提取系统,包括:输入模块,用于发送用户的法律需求的数据请求;运行模块,用于接收用户的法律需求的数据请求并进行运行;获取模块,用于获取具有条件信息的数据请求,并发送条件信息;提取模块,用于接收条件信息,并根据条件信息提取运行的结果;输出模块,用于实时输出提取的运行结果。本发明专利技术在高峰期时能够降低服务器的CPU的占用率、提高响应速率,防止系统卡死、崩溃,从而提高用户的体验。

【技术实现步骤摘要】
针对法务信息的大数据仓库存储、分析、提取系统
本专利技术涉及法律服务领域,具体涉及一种针对法务信息的大数据仓库存储、分析、提取系统。
技术介绍
随着人们的法律意识逐渐增强,公检法机构都出台了各种法务咨询、查询系统,以便于公众能够及时获取最新的法律动态。文件CN110059193A,公开了一种基于法律语义件与文书大数据统计分析的法律咨询系统,涉及司法
,具体是一种面向司法领域的可以与用户进行多轮自然语言交互,动态生成咨询报告,解决用户法律问题的系统;基于海量机器预标注裁判文书数据集,通过引入神经网络模型来为用户提供了一个可以通过口语化问答的方式描述自身所遇到的法律问题的交互方式,通过自然文本信息抽取的技术使得可以为用户提供基于不断新增的法律文本而生成的定制化咨询报告。摆脱了以往基于专家系统的只能提供事先录入的固定的问卷与答案组合的法律咨询,更加贴近人工咨询的效果。由于我国幅员辽阔、人数众多,服务器在用户对法律服务的需求高峰期需要对海量的数据进行提取、分析以及备份等处理,这会占用服务器很大的CPU使用率,降低服务器的响应速度,同时影响用户的体验。
技术实现思路
本专利技术在于提供一种针对法务信息的大数据仓库存储、分析、提取系统,解决了现有法律服务系统在用户对法律服务的需求高峰期时,服务器CPU使用率占用高、响应速度低、用户体验差的技术问题。本专利技术提供的基础方案为一种针对法务信息的大数据仓库存储、分析、提取系统,包括:输入模块,用于发送用户的法律需求的数据请求;运行模块,用于接收用户的法律需求的数据请求并进行运行;获取模块,用于获取具有条件信息的数据请求,并发送条件信息;提取模块,用于接收条件信息,并根据条件信息提取运行的结果;输出模块,用于实时输出提取的运行结果。本专利技术的工作原理在于:服务器首先判断用户访问量是否超过预设的阈值,若超过预设的阈值,则为高峰期。当用户访问处于高峰期时,服务器根据用户的法律需求数据请求进行模拟运行,运行完毕后不直接提取运行结果。而是先提取数据请求中的条件信息,然后根据条件信息分批、先后提取运行结果,这样就降低了服务器CPU的占用率。本专利技术的优点在于:在高峰期时能够降低服务器的CPU的占用率,防止系统卡死、崩溃,从而提高用户的体验。本专利技术通过根据数据请求的条件信息分批次、先后提取运行结果,而不是同时提取运行结果,缓解了系统运行的压力,提高了运行的速率。进一步,运行模块还用于获取服务器CPU的即时性使用率,若获取的服务器CPU的即时性使用率大于第一阈值,则分批运行数据请求;保证每批数据请求运行时,服务器CPU的即时性使用率小于等于第一阈值。这样可以保证服务器CPU的使用率总是保持在第一阈值以下,而且第一阈值可以人为设定。比如,在平时将第一阈值设为较低的值,在高峰期将第一阈值设为较高的值,这样可以尽可能提高系统的响应速率。进一步,运行模块还用于获取用户的法律需求的数据请求中的即时性数据,并将数据请求按照其即时性要求的高低进行排序。这样便于系统根据即时性要求按序进行处理,缓解运行压力。进一步,运行模块还用于识别用户的法律需求对应的法律领域与具体类别。根据我国的法律体系,案件可分为民事、刑事与行政三个法律领域,不同的法律领域处理的程序与规则存在极大的不同。另一方面,每个法律领域又包含若干个具体类别。比如民事法律领域就包括合同、侵权、物权、婚姻等多个具体类别,每个具体类别的案件又有其独特的规则。因此,有必要进行区分,便于系统有条不紊、高效地运行。进一步,运行模块还用于对用户的法律需求的数据请求进行聚类。对于每个具体类别的案件,虽然用户的需求各异、种类繁多,但某些用户的需求在本质上存在极大的共同点。采用聚类算法分出的同一个类型的用户有很大的相似性,相似的用户皆被并入到同一类型中。这样可以减少每个具体类别中用户的种类,便于对这些用户的法律需求集中进行处理,从而提高效率、降低服务器的压力。进一步,运行模块还用于检测用户法律需求的所包含的行为目标。这样便于深入分析用户需求,提炼出对用户真正有指导作用的信息。进一步,还包括储存模块,用于储存用户的法律需求的数据请求和运行结果数据。这样可以收集大量的用户需求信息,从而为系统的优化提供大样本的数据。进一步,还包括学习模块,用于优化系统的算法。这样便于系统根据用户的法律需求的数据请求和运行结果数据获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。进一步,还包括反馈模块,用于追问用户,并根据用户的回答进行反馈。这样便于尽可能获取解答用户问题所需的各项信息,从而对运行结果进行修正。进一步,还包括评价模块,用于收集用户对系统的评价、建议与意见。通过了解用户的评价、建议与意见,便于对系统进行改进,从而提高用户的体验。附图说明图1为本专利技术针对法务信息的大数据仓库存储、分析、提取系统实施例一的系统结构框图。图2为本专利技术针对法务信息的大数据仓库存储、分析、提取系统实施例二的系统结构框图。具体实施方式下面通过具体实施方式进一步详细的说明。实施例一本专利技术针对法务信息的大数据仓库存储、分析、提取系统实施例基本如附图1所示,包括输入模块、运行模块、获取模块、提取模块和输出模块。在某个时刻,有很多用户(如说,有20000人)同时在法律智能服务机器人的输入端输入各自的法律需求,该输入端可以是输入界面。然后这些法律需求的数据请求被发送到运行模块,该运行模块为一台服务器。服务器接收到这20000人的法律需求的数据请求后,首先通过数据请求中的关键词识别这20000用户的法律需求对应的法律领域与具体类别。比如说,服务器识别出这20000个用户中有15000个属于民事案件,有4000个属于刑事案件,有1000个属于行政案件。在这15000个民事案件中有7000个属于合同纠纷,有3000个属于侵权纠纷,有2000个属于婚姻纠纷,还有3000个属于物权纠纷。在4000个刑事案件中,危害公共安全的有500个,破坏社会主义市场经济的500个,侵犯公民人身权利、民主权利的1000个,财产犯罪的2000个。然后,对每个具体类别中用户的法律需求的数据请求进行聚类。本实施例采用k均值聚类算法(k-meansclusteringalgorithm)进行聚类。在进行聚类前,需要提取每个用户需求的数据请求中的关键词,本实施例采用TF-IDF算法,具体详细步骤可参考现有技术。关键词提取完毕后,就可进行聚类。第一步,随机选取K个关键词作为初始的聚类中心;第二步,把每个对象分配给距离它最近的聚类中心;第三步,重新计算聚类中心;第四步,若收敛,输出聚类结果;若不收敛,执行第一步。关于聚类算法的具体详细过程,也可参考现有技术。比如说,在7000个合同纠纷中提取出的关键词有“材料”、“货物”、“交付”、“利息”、“贷款”、“担保”、“租金”、“续租”、“转租”…聚类算法会把含有“材料”、“货物”、“交付”等关键词的合同纠纷归入买卖合同本文档来自技高网...

【技术保护点】
1.针对法务信息的大数据仓库存储、分析、提取系统,其特征在于:包括:输入模块,用于发送用户的法律需求的数据请求;运行模块,用于接收用户的法律需求的数据请求并进行运行;获取模块,用于获取具有条件信息的数据请求,并发送条件信息;提取模块,用于接收条件信息,并根据条件信息提取运行的结果;输出模块,用于实时输出提取的运行结果。/n

【技术特征摘要】
1.针对法务信息的大数据仓库存储、分析、提取系统,其特征在于:包括:输入模块,用于发送用户的法律需求的数据请求;运行模块,用于接收用户的法律需求的数据请求并进行运行;获取模块,用于获取具有条件信息的数据请求,并发送条件信息;提取模块,用于接收条件信息,并根据条件信息提取运行的结果;输出模块,用于实时输出提取的运行结果。


2.根据权利要求1所述的针对法务信息的大数据仓库存储、分析、提取系统,其特征在于:运行模块还用于获取服务器CPU的即时性使用率,若获取的服务器CPU的即时性使用率大于第一阈值,则分批运行数据请求;保证每批数据请求运行时,服务器CPU的即时性使用率小于等于第一阈值。


3.根据权利要求2所述的针对法务信息的大数据仓库存储、分析、提取系统,其特征在于:运行模块还用于获取用户的法律需求的数据请求中的即时性数据,并将数据请求按照其即时性要求的高低进行排序。


4.根据权利要求3所述的针对法务信息的大数据仓库存储、分析、提取系统,其特征在于:运行模块还用于识别用户的法律需求对应的法律...

【专利技术属性】
技术研发人员:吴怡
申请(专利权)人:重庆百事得大牛机器人有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1