一种基于警情信息的异常词组检测方法、系统及存储介质技术方案

技术编号：33126374 阅读：50 留言：0更新日期：2022-04-17 00:36

本发明专利技术公开了一种基于警情信息的异常词组检测方法、系统及存储介质，其方法包括步骤：获取警情信息并对所述警情信息进行分词处理得到若干个高频词组；接收统计周期，根据所述统计周期对各个所述高频词组进行时序数据聚合，得到每个所述高频词组对应的时间序列信息；分别对每个所述高频词组对应的时间序列信息进行离散分析，将各个所述高频词组对应的时间序列信息中离群的所述统计周期作为异常周期，得到存在所述异常周期的异常词组。本发明专利技术可以检测警情信息中各个高频词组在不同时间维度上的异常，便于辅助警情研判和决策。便于辅助警情研判和决策。便于辅助警情研判和决策。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于警情信息的异常词组检测方法、系统及存储介质

[0001]本专利技术涉及接警数据处理
，特别涉及一种基于警情信息的异常词组检测方法及系统。

技术介绍

[0002]在警务工作中接警、处警、反馈等场合每时每刻会产生大量的长文本描述信息，这些文本信息结构复杂，内容多样，其中蕴含的高价值信息如果可以准确的提取并利用到警情分析、研判和决策中，将大幅提高警务机关的治安管理的质量和效率。
[0003]目前针对接处警过程中产生的文本信息通常采用开源分词器对文本信息进行分词处理，并提取出警用关键词后，将提取结果发送给接警员和警情研究部门，供相关人员进行分析。但是这种方法的提取结果通常会包含过多的干扰词组，例如多数接处警消息中均会出现如“报警”、“受伤”、“出血”等关键词，这些关键词在大多数周期时间段内出现的频率均很高，对警情分析没有正面作用，只会作为干扰词影响分析结果，单一获取接处警文本信息中的高频词，不与之前的相同周期时间段进行比较，无法检测到各个词组在不同时间维度上的异常，对警情信息分析提供的参考价值不大。
[0004]为解决现有对警情信息处理过程无法检测词组在不同时间维度上的异常，对警情信息分析提供的参考价值不大的技术问题，目前需要一种基于警情信息的异常词组检测方法，在时间维度上监测警情信息中出现的词组异常，便于辅助警情研判和决策。

技术实现思路

[0005]为解决现有对警情信息处理过程无法检测词组在不同时间维度上的异常，对警情信息分析提供的参考价值不大的技术问题，本专利技术提供一种基...

【技术保护点】

【技术特征摘要】
1.一种基于警情信息的异常词组检测方法，其特征在于，包括步骤：获取警情信息并对所述警情信息进行分词处理得到若干个高频词组；接收统计周期，根据所述统计周期对各个所述高频词组进行时序数据聚合，得到每个所述高频词组对应的时间序列信息；分别对每个所述高频词组对应的时间序列信息进行离散分析，将各个所述高频词组对应的时间序列信息中离群的所述统计周期作为异常周期，得到存在所述异常周期的异常词组。2.根据权利要求1所述的一种基于警情信息的异常词组检测方法，其特征在于，所述的得到每个所述高频词组对应的时间序列信息之后，还包括：提取所述警情信息中当前所述统计周期内的实时警情信息，并获取所述实时警情信息中若干个当前高频词组及其对应的所述时间序列信息；根据全部所述高频词组对应的时间序列信息，对每个当前高频词组及其对应的所述时间序列信息进行离散分析，得到存在所述异常周期的所述当前高频词组。3.根据权利要求1所述的一种基于警情信息的异常词组检测方法，其特征在于，所述的获取警情信息并对所述警情信息进行分词处理得到若干个高频词组，具体包括：获取警用词典、警用停词表，以及预设的警用分词器，将所述警用词典和所述警用停词表输入所述警用分词器；通过所述警用分词器对所述警情信息进行分词处理得到若干个第一分词词组；将全部所述第一分词词组导入大数据集群和全文检索引擎，进行全量高频词统计得到若干个第二分词词组；将第二分词词组作为所述高频词组。4.根据权利要求3所述的一种基于警情信息的异常词组检测方法，其特征在于，所述第一分词词组包括至少一个警用数据标签，所述数据标签包括辖区信息、辖区单位和案件类别；所述的进行全量高频词统计得到若干个所述第二分词词组之后，还包括：根据所述警用数据标签对若干个所述第二分词词组过滤，得到若干个第三分词词组；将所述第三分词词组作为所述高频词组。5.根据权利要求4所述的一种基于警情信息的异常词组检测方法，其特征在于，所述的得到若干个第三分词词组之后，还包括：预设第一排序序号阈值；将各个所述第三分词词组按词频数由大到小进行排序，并整合生成词频列表；统计所述词频列表中所述词频数排序序号小于所述第一排序序号阈...

【专利技术属性】
技术研发人员：杨博，杜渂，何之栋，梁铮，王聚全，索涛，邱祥平，雷霆，彭明喜，陈健，周赵云，刘琦，郑佳，李帅帅，穆青，侯俊丞，
申请(专利权)人：迪爱斯信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人