一种基于人工智能分词技术的警情数据治理方法技术

技术编号：27102113 阅读：25 留言：0更新日期：2021-01-25 18:47

本发明专利技术公开了一种基于人工智能分词技术的警情数据治理方法，包括：利用第一警情数据治理模型提取原始训练集的特征；其中，所述原始训练集包括警情数据信息和对应的分词标签信息；根据所述原始数据集的特征分词含义特性，进行聚类；根据聚类结果筛选出困难样本；将所述困难样本添加至所述原始训练集，得到目标训练集；利用所述目标训练集对所述第一警情数据治理模型进行训练，得到第二警情数据治理模型；当获取到待治理警情数据，则利用所述第二警情数据治理模型输出对应的治理结果。本发明专利技术所公开的警情数据治理方法，通过挖掘出的困难样本改变原始数据集中的样本分布，能够增加对困难样本的关注度，从而提升警情数据治理的准确度。确度。确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于人工智能分词技术的警情数据治理方法

[0001]本专利技术涉及数据治理方法
，尤其涉及一种基于人工智能分词技术的警情数据治理方法。

技术介绍

[0002]随着城市和经济的发展，接处警工作量日益繁忙，多年接处警工作，产生大量的警情数据，警情作为公安机关的第一手资源，有着全面、丰富的信息资源，不仅能多维度的从宏观上反映社会治安形势，从微观上更是能具体到某一条警情或者某一类警情，针对警情信息的研判和挖掘，可以帮助公安机会分析社会治安形势、发现治安工作焦点、科学调整警力部署、实施定向精确打击、评估公安工作绩效，使公安机关各个管理部门的有效基于警情信息分享的协同整治治安，从而达到辅助决策预防打击的最终目标。然后由于诸多原因，警情数据质量良莠不齐，无法直接进行数据挖掘，进而发现历史警情的规律与价值，从而对当前工作进行有效改进提升。对于庞大的历史警情数据，需要提供基于人工智能的信息化系统，对数据进行治理和数据质量核查。

技术实现思路

[0003]为解决
技术介绍
中存在的技术问题，本专利技术提出一种基于人工智能分词技术的警情数据治理方法。
[0004]本专利技术提出的一种基于人工智能分词技术的警情数据治理方法，包括：
[0005]利用第一警情数据治理模型提取原始训练集的特征；其中，所述原始训练集包括警情数据信息和对应的分词标签信息；
[0006]根据所述原始数据集的特征分词含义特性，进行聚类；
[0007]根据聚类结果筛选出困难样本；
[0008]将所述困难样本添加...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能分词技术的警情数据治理方法，其特征在于，包括：利用第一警情数据治理模型提取原始训练集的特征；其中，所述原始训练集包括警情数据信息和对应的分词标签信息；根据所述原始数据集的特征分词含义特性，进行聚类；根据聚类结果筛选出困难样本；将所述困难样本添加至所述原始训练集，得到目标训练集；利用所述目标训练集对所述第一警情数据治理模型进行训练，得到第二警情数据治理模型；当获取到待治理警情数据，则利用所述第二警情数据治理模型输出对应的治理结果。2.根据权利要求1所述的基于人工智能分词技术的警情数据治理方法，其特征在于，所述利用第一警情数据治理模型提取原始训练集的特征之前，还包括：利用同一预设训练集分别对不同的初始模型进行训练，得到多个训练后模型；不同的所述初始模型基于不同的警情数据分词算法；基于预设测评指标对全部所述训练后模型进行测评，确定出警情数据治理精确度最高的训练后模型，得到所述第一警情数据治理模型。3.根据权利要求1所述的基于人工智能分词技术的警情数据治理方法，其特征在于，所述根据所述原始数据集的特征分词含义特性，进行聚类，包括：根据所述原始数据集的特征分词含义特性，利用Kmeans算法进行聚类。4.根据权利要求1所述的基于人工智能分词技术的警情数...

【专利技术属性】
技术研发人员：高坤祥，
申请(专利权)人：安徽中科新辰技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人