The embodiment of the invention discloses a new large data label production method and device, wherein the method comprises: acquiring the data to be analyzed of the suspected target object; extracting the fact label of the data to be analyzed; the fact label includes the attributes, behaviors, relationships and trajectories of the suspected target object; and mining the fact label to obtain the fact label. Model labels, including statistical labels, element labels, language labels and adjoint labels of the suspected target, are input into the preset model to obtain the predictive labels of the suspected target. The invention is based on ontology theory (entity relation tag) and human brain cognitive world process as a basis, with the massive data source of suspected target object as support, using the cutting-edge algorithm as a tool, realizes the mining and construction of the tag system, and constructs a new tag system for public security technical investigation.
【技术实现步骤摘要】
一种新大数据标签生产方法及装置
本专利技术涉及技侦
,尤其涉及一种新大数据标签生产方法及装置。
技术介绍
目前公安技侦行业已实现对资源数据通过物理重组或逻辑映射的方式进行重新分类形成价值信息库,形成了人员、物品、群体、行为、轨迹、关系、区域、案件等八大库。原始数据来源包括了运营商分光数据、电子围栏、运营商电查、寄递、开户资料和公安网资源等。标签的数据来源与技侦要素资源库的八大类资源,需要将之按照标签体系的分层分类结构进行映射。现有技术的体系多侧重于广告、电商、内容类的互联网商业体系,以社会安全公安技侦领域的标签体系在现有行业还处于单一模型、零散挖掘、部分缺失、尚未成体系的分散状态。因此,在技侦领域内,还缺乏一种全面准确生成标签的方法。
技术实现思路
本专利技术实施例提供了一种新大数据标签生产方法及装置,为公安技侦提供了一套新的标签体系。根据本专利技术的一个方面,提供一种新大数据标签生产方法,包括:获取涉嫌目标对象的待分析数据;提取所述待分析数据的事实标签,所述事实标签包括所述涉嫌目标对象的属性、行为、关系和轨迹;对所述事实标签进行挖掘,得到模型标签,所述模型标签包括所述涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;将所述模型标签输入预置模型中,得到所述涉嫌目标对象的预测标签。优选地,所述根据所述事实标签进行挖掘具体包括:S1:将所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容与语言库中的预置文本进行匹配,得到所述涉嫌目标对象的语种标签;S2:对所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容进行要素提取,得到所述涉嫌目标对象的要素标签;S3: ...
【技术保护点】
1.一种新大数据标签生产方法,其特征在于,包括:获取涉嫌目标对象的待分析数据;提取所述待分析数据的事实标签,所述事实标签包括所述涉嫌目标对象的属性、行为、关系和轨迹;对所述事实标签进行挖掘,得到模型标签,所述模型标签包括所述涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;将所述模型标签输入预置模型中,得到所述涉嫌目标对象的预测标签。
【技术特征摘要】
1.一种新大数据标签生产方法,其特征在于,包括:获取涉嫌目标对象的待分析数据;提取所述待分析数据的事实标签,所述事实标签包括所述涉嫌目标对象的属性、行为、关系和轨迹;对所述事实标签进行挖掘,得到模型标签,所述模型标签包括所述涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;将所述模型标签输入预置模型中,得到所述涉嫌目标对象的预测标签。2.根据权利要求1所述的新大数据标签生产方法,其特征在于,所述根据所述事实标签进行挖掘具体包括:S1:将所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容与语言库中的预置文本进行匹配,得到所述涉嫌目标对象的语种标签;S2:对所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容进行要素提取,得到所述涉嫌目标对象的要素标签;S3:对所述涉嫌目标对象的行为的次数进行统计运算,得到所述涉嫌目标对象的统计标签;S4:获取与所述涉嫌目标对象相关的伴随者和/或伴随物品,确定所述伴随者和/或伴随物品的轨迹为第二轨迹,确定所述涉嫌目标对象的轨迹为第一轨迹,根据所述第一轨迹和所述第二轨迹的吻合度确定所述涉嫌目标对象的伴随标签;S5:将所述统计标签、所述要素标签、所述语种标签和所述伴随标签组成所述涉嫌目标对象的模型标签。3.根据权利要求1所述的新大数据标签生产方法,其特征在于,还包括:获取所述涉嫌目标对象的自定义标签,所述自定义标签包括所述涉嫌目标对象的自定义属性、自定义行为、自定义关系和自定义轨迹;选择所述自定义标签与所述事实标签存在区别的部分标记更新至所述事实标签中。4.根据权利要求1至3任意一项所述的新大数据标签生产方法,其特征在于,所述预置模型为朴素贝叶斯或逻辑回归模型或相关向量机模型或随机森林模型。5.一种新大数据标签生产装置,其特征在于,包括:第一获取模块,用于获取涉嫌目标对象的待分析数据;提取模块,用于提取所述待分析数据的事实标签,所述事实标签包括所述涉嫌目标对象的属性、行为、关系和轨迹;挖掘模块,用于对所述事实...
【专利技术属性】
技术研发人员:邱晓贤,林国强,章武盛,周义豪,罗以攀,黄文杰,赵亨利,王松林,袁伟林,
申请(专利权)人:广州汇智通信技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。