一种基于知识图谱的查询分析系统技术方案

技术编号:25396753 阅读:15 留言:0更新日期:2020-08-25 23:01
本发明专利技术公开了一种基于知识图谱的查询分析系统,包括:语音识别模块,用于将用户所说的语音转化为文字;查询分析模块,与所述语音识别模块连接,基于知识图谱和法律领域本体模型的查询分析来理解用户所描述的问题并得出结果;结果输出模块,与所述查询分析模块连接,将结果经过语音合成将文字转换成自然流畅的语言返回给用户。本发明专利技术采取软硬件结合的方式,前台向用户展示后台分析处理的数据,利用知识图谱、法律领域本体模型,能够根据用户提供的信息精确地分析,为用户提供对应的法律法规,同时因为带有智能分析功能,可以通过用户输入的信息进行判断分析,将相关的法律法规以及涉及的相关刑罚信息展示出来。

【技术实现步骤摘要】
一种基于知识图谱的查询分析系统
本专利技术属于基于知识图谱的查询分析的
,尤其涉及一种基于知识图谱的查询分析系统。
技术介绍
随着人们法律意识的提高,人们对法律的关注度越来越高,使得法律法规、法律案件分析变成了当代社会的主流问题。如何快速分析出案件涉及到的法律法规,是一种迫切需要解决的需求。传统的法律查询系统只能做到单纯的文字输入,并不能进行语音输入和智能分析。并且只能单一的法律法规查询,并不能做到案件的分析。
技术实现思路
基于以上现有技术的不足,本专利技术所解决的技术问题在于提供一种基于知识图谱的查询分析系统,采取软硬件结合的方式,前台向用户展示后台分析处理的数据,利用知识图谱、法律领域本体模型,能够根据用户提供的信息精确地分析,为用户提供对应的法律法规,同时因为带有智能分析功能,可以通过用户输入的信息进行判断分析,将相关的法律法规以及涉及的相关刑罚信息展示出来。为了解决上述技术问题,本专利技术通过以下技术方案来实现:本专利技术提供一种基于知识图谱的查询分析系统,包括:语音识别模块,用于将用户所说的语音转化为文字;查询分析模块,与所述语音识别模块连接,基于知识图谱和法律领域本体模型的查询分析来理解用户所描述的问题并得出结果;结果输出模块,与所述查询分析模块连接,将结果经过语音合成将文字转换成自然流畅的语言返回给用户。可选的,所述语音识别模块包括预处理单元、特征提取单元以及模式匹配单元。进一步的,所述预处理单元对输入的原始语音信号进行端点检测,包括预滤波、采样与量化、加窗、分帧、端点检测和预加重,滤除其中不必要的信息及噪声。进一步的,所述特征提取单元采用的语音特征参数为线性预测倒谱系数和Mel频率倒谱参数。进一步的,所述模式匹配单元采用概率密度函数计算语音参数对HMM模型的输出概率,通过搜索最佳状态序列,以最大后验概率为准则找到识别结果。可选的,所述查询分析模块选用BiLSTM算法模型,通过SPARQL语言查询知识库,得到分析结果。可选的,所述结果输出模块为服务器端,服务器接收语音后通过语音识别技术将语音转换,通过知识图谱语义搜索和法律领域本体模型对和案件进行查询知识库并分析,整合符合条件的信息,并将结果经过语音合成将文字转换成自然流畅的语言返回给用户。由上,本专利技术提供的一种基于知识图谱的查询分析系统,具有方便、精准的优点,并且能够根据用户的需求进行系统全面的查询分析推理,至少具有如下有益效果:(1)、将法律法规查询将与用户查询内容相关的所有法律法规进行展示。(2)、快速根据案件进行相关法律法规查询,通过对法律案件的关键点进行案件分析,给用户提供案件关键点涉及到的法律法规,以便用户进行整理分析。根据案件所呈现出关键点给出案件可能类型,借此可以快速帮助用户进行案情梳理。(3)、根据输入的案件类型分析出对应的刑罚、处罚,以及一般性的证据条件:解决用户在既定案件下的证据梳理问题以及案件刑罚问题。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下结合优选实施例,并配合附图,详细说明如下。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例的附图作简单地介绍。图1为本专利技术的基于知识图谱的查询分析系统的流程图;图2为本专利技术的语音识别模块的识别框图。具体实施方式下面结合附图详细说明本专利技术的具体实施方式,其作为本说明书的一部分,通过实施例来说明本专利技术的原理,本专利技术的其他方面、特征及其优点通过该详细说明将会变得一目了然。在所参照的附图中,不同的图中相同或相似的部件使用相同的附图标号来表示。本专利技术主要是利用知识图谱技术、法律领域本体模型、隐马尔科夫模型结合语音识别技术,能够帮助用户快速查询法律法条,有效分析法律案件涉及到的法律法规,以及对案情的梳理和证据分析。本专利技术包括了两部分:前端部分和后端部分。前端部分主要用作于获取用户的查询信息和用户选择的操作类别,并接受后端服务器的响应的数据,并进行数据的展示。具体包括语音识别模块,用于将用户所说的语音转化为文字;查询分析模块,与所述语音识别模块连接,基于知识图谱和法律领域本体模型的查询分析来理解用户所描述的问题并得出结果;结果输出模块,与所述查询分析模块连接,将结果经过语音合成将文字转换成自然流畅的语言返回给用户。前端将通过网页版、app版对不同应用用户提供相应服务。通过Ajax来获取后端返回的两种数据,一种是图谱数据,一种是文本和图片数据。前端硬件需要对相应的数据进行可视化展示。后端部分是在服务器中运行如下描述的语音识别功能模块、基于知识图谱的查询分析功能模块、智能算法推荐模块。在后端服务器中优选地采用阿里云nginx服务器作为后端服务器,采用Vue为web服务框架。其功能模块描述如下:在前端硬件端可以实时的监测用户的语音输入,通过系统监测预设的语言内容可以触发系统记录用户的语音输入,待检测到用户输入完成后,即将此次的语音内容发送至后端服务器中。本专利技术使用的语音识别技术主要方法是隐马尔科夫模型(HMM)。HMM拥有较高的识别率,语音识别模块包括预处理单元、特征提取单元以及模式匹配单元3个部分,其描述如下:(1)预处理单元:对输入的原始语音信号进行端点检测,包括预滤波、采样与量化、加窗、分帧、端点检测和预加重等,滤除其中不必要的信息及噪声。有效的端点检测不仅能使处理时间减到最小,而且能排除无声段的噪声干扰,从而使识别系统具有良好的识别性能。预加重的目的是平滑信号以消除声道模型中的极点带来的影响,便于进行频谱分析或声道采样参数分析。一般通过传递函数为Hz=1-az-1的滤波器对其滤波。设n时刻的语音采样值为x(n),经过预加重处理后为其中,为预加重系数。加窗分帧是为提取特征参数做准备。(2)特征提取单元:为了去除语音识别中的冗余信息,获得说话人的基本特征的有用信息,需要对语音信号进行分析处理,这一过程就是特征提取。因此,要求特征提取后的信息必须能够有效地区分不同的说话人,且对同一说话人的变化保持相对稳定。目前主要采用的语音特征参数为线性预测倒谱系数(LPCC)和Mel频率倒谱参数(MFCC)。由于MFCC能够比较充分利用人耳的听觉特性,同时研究表明MFCC参数能够比LPCC参数更好地提高系统的识别性能,因此选用MFCC参数作为语音特征。(3)模式匹配单元:隐式马尔可夫模型(HMM)是马尔科夫链的一种。声学中各个相对稳定的发音单位(可以是一个完整的音节、声母、韵母或更精细的音素)对应于HMM中的隐含状态。状态是未知的,但是可以通过观察序列(一帧帧的MFCC参数)得到。匹配方法上采用概率密度函数计算语音参数对HMM模型的输出概率,通过搜索最佳状态序列,以最大后验概率为准则找到识别结果。语音识别中,一个HMM模型应包含4个状本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的查询分析系统,其特征在于,包括:/n语音识别模块,用于将用户所说的语音转化为文字;/n查询分析模块,与所述语音识别模块连接,基于知识图谱和法律领域本体模型的查询分析来理解用户所描述的问题并得出结果;/n结果输出模块,与所述查询分析模块连接,将结果经过语音合成将文字转换成自然流畅的语言返回给用户。/n

【技术特征摘要】
1.一种基于知识图谱的查询分析系统,其特征在于,包括:
语音识别模块,用于将用户所说的语音转化为文字;
查询分析模块,与所述语音识别模块连接,基于知识图谱和法律领域本体模型的查询分析来理解用户所描述的问题并得出结果;
结果输出模块,与所述查询分析模块连接,将结果经过语音合成将文字转换成自然流畅的语言返回给用户。


2.如权利要求1所述的基于知识图谱的查询分析系统,其特征在于,所述语音识别模块包括预处理单元、特征提取单元以及模式匹配单元。


3.如权利要求2所述的基于知识图谱的查询分析系统,其特征在于,所述预处理单元对输入的原始语音信号进行端点检测,包括预滤波、采样与量化、加窗、分帧、端点检测和预加重,滤除其中不必要的信息及噪声。


4.如权利要求2所述的基于知识图谱的查询分析系统,其...

【专利技术属性】
技术研发人员:王星孙一鑫陈吉唐楠楠
申请(专利权)人:辽宁工程技术大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1