用于法律咨询的日常语言识别方法技术

技术编号:24756377 阅读:23 留言:0更新日期:2020-07-04 09:13
本发明专利技术涉及法律咨询技术领域,具体涉及一种用于法律咨询的日常语言识别方法,包括步骤:S1、输入法律咨询的语音;S2、提取关键词,分析语境,根据语境分析关键词的含义;S3、根据关键词的含义,进行矫正或者替换,将日常语言转化为法律术语;S4、识别语音的法律意义;S5、进行前置判断与后续判断。本发明专利技术根据用户进行法律咨询的语境,分析关键词在日常生活中的含义,再根据关键词在日常生活中的含义将其转换为法律术语。在用户采用通俗化、口语化、日常化的方式进行法律咨询时,能够准确地识别出用户所表达的意思,从而提高法律机器人咨询的效率与准确性。

Daily language recognition for legal consultation

【技术实现步骤摘要】
用于法律咨询的日常语言识别方法
本专利技术涉及法律咨询
,具体涉及一种用于法律咨询的日常语言识别方法。
技术介绍
目前我国社会正处于产业转型的阶段,人们对于法律服务的需求也日益增加。法律工作者每天疲于应付各种各样的法律咨询,法律服务机器人应运而生,民众可以通过法律机器人享受免费、精准、及时、有效的法律服务。文件CN109108989A,公开了一种语义识别的法律服务专用机器人,涉及法律咨询领域,包括机器人本体以及设置在机器人本体内的服务器;所述机器人本体,包括用来采集咨询问题的采集端;所述服务器,包括用来对咨询问题进行法律语义提取的语义识别模块,所述语义识别模块包括存储并实时更新有多个法律词汇的词汇存储模块;语义识别模块从咨询问题中提取词语,并将每个词语与词汇存储模块中的法律词汇进行对比,用匹配成功的法律词汇替换咨询问题中的词语。该专利技术能够及时获知咨询者所表达的法律意思,进而快速提供针对性的法律服务。我国绝大部分人文化程度低,全国本科以上学历的不到5%。当用户遇到法律问题进行法律咨询时,难以用规范的、相对专业的语言进行表达;相反,总是用通俗化、口语化、日常化的方式进行描述。因此,法律机器人难以直接理解其中的含义。比如说,提到“ding金”时,机器人难以识别到底是“定金”,还是“订金”;而“定金”和“订金”在法律上的含义截然不同,对当事人权利、义务的影响也是极大的。
技术实现思路
本专利技术提供一种用于法律咨询的日常语言识别方法,解决了用户进行法律咨询时,采用通俗化、口语化、日常化的方式进行描述,导致法律机器人难以直接理解其中含义的技术问题。本专利技术提供的基础方案为:用于法律咨询的日常语言识别方法,包括步骤:S1、输入法律咨询的语音;S2、提取语音中的关键词,分析语境,根据语境分析关键词的含义;S3、根据关键词的含义,结合日常交流习惯进行矫正或者替换,将日常语言转化为法律术语;S4、识别语音的法律意义;S5、首先,进行前置判断:若包含不超过20%或者一次性付清的信息,则输出定金;若包含超过20%或者多次付清的信息,则输出订金;若前置判断不能确定是订金还是定金,则进行后续判断:输出定金、订金和不知道三个选项供用户选择,若用户选择定金或者订金,则输出结果;若用户选择不知道,则根据约定的信息进行判断。本专利技术的工作原理在于:根据用户进行法律咨询的语境,分析关键词在日常生活中的含义,再根据关键词在日常生活中的含义将其转换为法律术语。本专利技术的优点在于:通过语境能够精确地捕捉用户所表达的关键词的含义,从而能够将其精确地将用户表达的关键词与法律术语进行匹配,从而准确地识别出用户所表达的意思。本专利技术在用户采用通俗化、口语化、日常化的方式进行法律咨询时,能够准确地识别出用户所表达的意思,从而提高法律机器人咨询的效率与准确性。进一步,步骤S1具体包括:S11、输入法律咨询的语音;S12、对语音进行降噪处理。通常语音中包括两类噪声:一类是物理噪声;二类是信息噪声。物理噪声,比如杂音;信息噪声,比如没有实际意义的语气词;将这些噪声去掉,有利于提高语音信息的洁净度,从而提高后续处理的精确度。进一步,步骤S2具体包括:S21、提取第一类关键词;S22、提取第二类关键词;S23、提取五要素,根据五要素生成语境;S24、结合语境分析第一类关键词和第二类关键词的语义。五要素包括何人、何时、何地、何因、何事,汉语博大精深,同样的词语在不同的场合有时会具有截然不同的含义。比如说“意思”这个词,“找人托关系,需要意思一下”,“这个单词什么意思”,这两个句子中的意思就具有不同的含义。因此,结合语境,才能准确地把握关键词的含义。进一步,步骤S21具体包括:S21a、显示音高曲线、共振峰曲线和音强曲线;S21b、获取A类关键词、B类关键词以及C类关键词为第一类关键词。A类关键词指音高较高的词,B类关键词指说话时长较长的词,C类关键词指出现次数较多的词。当人们用语言表述某件事时,对于重要的部分,要么语气会加强,音调升高;要么放慢语速,说话持续时间较长;要么反复强调。这些词语可能含有比较重要的信息,对其进行分析,有利于精确把握用户表达的含义。进一步,步骤S22具体包括:S22a、对语音进行划分,得到若干个词语;S22b、获取法律语料库;S22c、计算法律语料库中每个词语在语音中的tf值J以及在法律语料库中的idf值K;S22d、根据tf值及idf值计算权重γ;γ=K*lg(J*W+1);其中,W为预设的生僻词系数,且W≥1;S22e、选出预设个数权重最大的词语作为第二类关键词。tf-idf是一种统计方法,用以评估某字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率呈反比下降。如果某个词或短语在语音中出现的频率tf高,那么该词语作为关键词就具有很好的类别区分能力,该词语就适合用来分类。因此,这样挑选出的关键词用于把握用户的法律意图。进一步,步骤S3具体包括:S31、识别关键词语义;S32、根据语义并依据日常交流习惯对关键词进行矫正或者替换;S33、将矫正或者替换后的关键词转化为法律术语。由于日常口语的表述与规范表述有所不同,有必要结合语义和日常交流习惯进行矫正或者替换。这样有利于精确地转化为法律术语。进一步,步骤S4具体包括:S41、抽取语音的时间特征;S42、提取每个时间点所对应的关键特征;S43、根据事件的发展规律识别含义。只提取关键特征进行识别,有利于降低无用信息的干扰;通过理清时间的先后顺序,有利于还原案情事实。进一步,还包括步骤S6,反馈和修正;具体包括:S61、将识别出的含义以文本或者语音的方式输出,并提醒用户再次确认;S62、若用户确认含义正确,则输出结果;若用户确认含义有误,则重新执行步骤S2-S5,直到用户确认含义正确。通过这样的反馈和修正过程,可以最大限度地提高识别的准确率。进一步,还包括步骤S7,学习与优化;具体包括:S71、储存关键词、法律术语和识别出的含义;S72、采用机器学习算法进行优化。这样有利于优化系统,提高效率。进一步,步骤S1中,若语音中包含有方言,先将方言转换为普通话。由于我国幅员辽阔,方言数量众多,统一转化为普通话,有利于提高分析的效率。附图说明图1为本专利技术用于法律咨询的日常语言识别方法实施例的流程图。具体实施方式下面通过具体实施方式进一步详细的说明:实施例1本专利技术用于法律咨询的日常语言识别方法实施例基本如附图1所示:包括步骤:S1、输入法律咨询的语音;S2、提取关键词,分析语境,根据语境分析关键词的含义;S3、根据关键词的含义,进行矫正或者替换,将日常语言转化为法律术语;S4、识别语音的法律意义并输出结果。本实施例中,张三与李四存在合同纠纷。内容大致这样:“…张三于2010年6月1日向李四购买河沙5吨,于当日签订了河沙买卖合同,合同约定15日内李四将河沙保质保量运到张三家本文档来自技高网...

【技术保护点】
1.用于法律咨询的日常语言识别方法,其特征在于:包括步骤:S1、输入法律咨询的语音;S2、提取语音中的关键词,分析语境,根据语境分析关键词的含义;S3、根据关键词的含义,结合日常交流习惯进行矫正或者替换,将日常语言转化为法律术语;S4、识别语音的法律意义;S5、首先,进行前置判断:若包含不超过20%或者一次性付清的信息,则输出定金;若包含超过20%或者多次付清的信息,则输出订金;若前置判断不能确定是订金还是定金,则进行后续判断:输出定金、订金和不知道三个选项供用户选择,若用户选择定金或者订金,则输出结果;若用户选择不知道,则根据约定的信息进行判断。/n

【技术特征摘要】
1.用于法律咨询的日常语言识别方法,其特征在于:包括步骤:S1、输入法律咨询的语音;S2、提取语音中的关键词,分析语境,根据语境分析关键词的含义;S3、根据关键词的含义,结合日常交流习惯进行矫正或者替换,将日常语言转化为法律术语;S4、识别语音的法律意义;S5、首先,进行前置判断:若包含不超过20%或者一次性付清的信息,则输出定金;若包含超过20%或者多次付清的信息,则输出订金;若前置判断不能确定是订金还是定金,则进行后续判断:输出定金、订金和不知道三个选项供用户选择,若用户选择定金或者订金,则输出结果;若用户选择不知道,则根据约定的信息进行判断。


2.根据权利要求1所述的用于法律咨询的日常语言识别方法,其特征在于:步骤S1具体包括:S11、输入法律咨询的语音;S12、对语音进行降噪处理。


3.根据权利要求2所述的用于法律咨询的日常语言识别方法,其特征在于:步骤S2具体包括:S21、提取第一类关键词;S22、提取第二类关键词;S23、提取五要素,根据五要素生成语境;S24、结合语境分析第一类关键词和第二类关键词的语义。


4.根据权利要求3所述的用于法律咨询的日常语言识别方法,其特征在于:步骤S21具体包括:S21a、显示音高曲线、共振峰曲线和音强曲线;S21b、获取A类关键词、B类关键词以及C类关键词为第一类关键词。


5.根据权利要求4所述的用于法律咨询的日常语言识别方法,其特征在于:步骤S22具体包括:S22a、对语音进行划分,得到若干个词语;S22b、获取法...

【专利技术属性】
技术研发人员:吴怡
申请(专利权)人:重庆百事得大牛机器人有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1