一种新大数据标签生产方法及装置制造方法及图纸

技术编号:18732261 阅读:29 留言:0更新日期:2018-08-22 02:59
本发明专利技术实施例公开了一种新大数据标签生产方法及装置,其中,该方法包括:获取涉嫌目标对象的待分析数据;提取待分析数据的事实标签,事实标签包括涉嫌目标对象的属性、行为、关系和轨迹;对事实标签进行挖掘,得到模型标签,模型标签包括涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;将模型标签输入预置模型中,得到涉嫌目标对象的预测标签。本发明专利技术基于本体论的理论(实体‑关系‑标签)和人类大脑认知世界的过程作为依据,以涉嫌目标对象的海量数据源为支撑,利用前沿算法为工具,实现标签体系的挖掘建设,为公安技侦构建了一套新的标签体系。

A new big data label production method and device

The embodiment of the invention discloses a new large data label production method and device, wherein the method comprises: acquiring the data to be analyzed of the suspected target object; extracting the fact label of the data to be analyzed; the fact label includes the attributes, behaviors, relationships and trajectories of the suspected target object; and mining the fact label to obtain the fact label. Model labels, including statistical labels, element labels, language labels and adjoint labels of the suspected target, are input into the preset model to obtain the predictive labels of the suspected target. The invention is based on ontology theory (entity relation tag) and human brain cognitive world process as a basis, with the massive data source of suspected target object as support, using the cutting-edge algorithm as a tool, realizes the mining and construction of the tag system, and constructs a new tag system for public security technical investigation.

【技术实现步骤摘要】
一种新大数据标签生产方法及装置
本专利技术涉及技侦
,尤其涉及一种新大数据标签生产方法及装置。
技术介绍
目前公安技侦行业已实现对资源数据通过物理重组或逻辑映射的方式进行重新分类形成价值信息库,形成了人员、物品、群体、行为、轨迹、关系、区域、案件等八大库。原始数据来源包括了运营商分光数据、电子围栏、运营商电查、寄递、开户资料和公安网资源等。标签的数据来源与技侦要素资源库的八大类资源,需要将之按照标签体系的分层分类结构进行映射。现有技术的体系多侧重于广告、电商、内容类的互联网商业体系,以社会安全公安技侦领域的标签体系在现有行业还处于单一模型、零散挖掘、部分缺失、尚未成体系的分散状态。因此,在技侦领域内,还缺乏一种全面准确生成标签的方法。
技术实现思路
本专利技术实施例提供了一种新大数据标签生产方法及装置,为公安技侦提供了一套新的标签体系。根据本专利技术的一个方面,提供一种新大数据标签生产方法,包括:获取涉嫌目标对象的待分析数据;提取所述待分析数据的事实标签,所述事实标签包括所述涉嫌目标对象的属性、行为、关系和轨迹;对所述事实标签进行挖掘,得到模型标签,所述模型标签包括所述涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;将所述模型标签输入预置模型中,得到所述涉嫌目标对象的预测标签。优选地,所述根据所述事实标签进行挖掘具体包括:S1:将所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容与语言库中的预置文本进行匹配,得到所述涉嫌目标对象的语种标签;S2:对所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容进行要素提取,得到所述涉嫌目标对象的要素标签;S3:对所述涉嫌目标对象的行为的次数进行统计运算,得到所述涉嫌目标对象的统计标签;S4:获取与所述涉嫌目标对象相关的伴随者和/或伴随物品,确定所述伴随者和/或伴随物品的轨迹为第二轨迹,确定所述涉嫌目标对象的轨迹为第一轨迹,根据所述第一轨迹和所述第二轨迹的吻合度确定所述涉嫌目标对象的伴随标签;S5:将所述统计标签、所述要素标签、所述语种标签和所述伴随标签组成所述涉嫌目标对象的模型标签。优选地,本专利技术提供的一种新大数据标签生产方法还包括:获取所述涉嫌目标对象的自定义标签,所述自定义标签包括所述涉嫌目标对象的自定义属性、自定义行为、自定义关系和自定义轨迹;选择所述自定义标签与所述事实标签存在区别的部分标记更新至所述事实标签中。优选地,所述预置模型为朴素贝叶斯或逻辑回归模型或相关向量机模型或随机森林模型。根据本专利技术的另一个方面,提供一种新大数据标签生产装置,包括:第一获取模块,用于获取涉嫌目标对象的待分析数据;提取模块,用于提取所述待分析数据的事实标签,所述事实标签包括所述涉嫌目标对象的属性、行为、关系和轨迹;挖掘模块,用于对所述事实标签进行挖掘,得到模型标签,所述模型标签包括所述涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;评价模块,用于将所述模型标签输入预置模型中,得到所述涉嫌目标对象的预测标签。优选地,所述挖掘模块具体包括:匹配单元,用于将所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容与语言库中的预置文本进行匹配,得到所述涉嫌目标对象的语种标签;提取单元,用于对所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容进行要素提取,得到所述涉嫌目标对象的要素标签;统计单元,用于对所述涉嫌目标对象的行为的次数进行统计运算,得到所述涉嫌目标对象的统计标签;确定单元,用于获取与所述涉嫌目标对象相关的伴随者和/或伴随物品,确定所述伴随者和/或伴随物品的轨迹为第二轨迹,确定所述涉嫌目标对象的轨迹为第一轨迹,根据所述第一轨迹和所述第二轨迹的吻合度确定所述涉嫌目标对象的伴随标签;组成单元,用于将所述统计标签、所述要素标签、所述语种标签和所述伴随标签组成所述涉嫌目标对象的模型标签。优选地,本专利技术提供的一种新大数据标签生产装置还包括:第二获取模块,用于获取所述涉嫌目标对象的自定义标签,所述自定义标签包括所述涉嫌目标对象的自定义属性、自定义行为、自定义关系和自定义轨迹;更新模块,用于选择所述自定义标签与所述事实标签存在区别的部分标记更新至所述事实标签中。优选地,所述预置模型为朴素贝叶斯或逻辑回归模型或相关向量机模型或随机森林模型。根据本专利技术的另一方面,提供一种新大数据标签生产装置,包括:存储器,以及耦接至所述存储器的处理器;所述处理器被配置为基于存储在所述存储器设备中的指令,执行如以上所述的新大数据标签生产方法。根据本专利技术的另一方面,提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现以上所述的新大数据标签生产方法。从以上技术方案可以看出,本专利技术实施例具有以下优点:本专利技术实施例提供了一种新大数据标签生产方法及装置,其中,该方法包括:获取涉嫌目标对象的待分析数据;提取待分析数据的事实标签,事实标签包括涉嫌目标对象的属性、行为、关系和轨迹;对事实标签进行挖掘,得到模型标签,模型标签包括涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;将模型标签输入预置模型中,得到涉嫌目标对象的预测标签。本专利技术基于本体论的理论(实体-关系-标签)和人类大脑认知世界的过程作为依据,以涉嫌目标对象的海量数据源为支撑,利用前沿算法为工具,实现标签体系的挖掘建设,为公安技侦构建了一套新的标签体系。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。图1为本专利技术实施例提供的一种新大数据标签生产方法的一个实施例的流程示意图;图2为本专利技术实施例提供的一种新大数据标签生产方法的另一实施例的流程示意图;图3为本专利技术实施例提供的一种新大数据标签生产装置的一个实施例的结构示意图。具体实施方式本专利技术实施例提供了一种新大数据标签生产方法及装置,为公安技侦提供了一套新的标签体系。为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。请参阅图1,本专利技术提供的一种新大数据标签生产方法的一个实施例,包括:101、获取涉嫌目标对象的待分析数据;102、提取待分析数据的事实标签,事实标签包括涉嫌目标对象的属性、行为、关系和轨迹;103、对事实标签进行挖掘,得到模型标签,模型标签包括涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;104、将模型标签输入预置模型中,得到涉嫌目标对象的预测标签。本专利技术实施例提供了一种新大数据标签生产方法,包括:获取涉嫌目标对象的待分析数据;提取待分析数据的事实标签,事实标签包括涉嫌目标对象的属性、行为、关系和轨迹;对事实标签进行挖掘,得到模型标签,模型标签包括涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;将模型标签输入预置模型中,得到涉嫌目标对象的预测标签。本专利技术基于本体论的理论(实体-关系-标签)本文档来自技高网...

【技术保护点】
1.一种新大数据标签生产方法,其特征在于,包括:获取涉嫌目标对象的待分析数据;提取所述待分析数据的事实标签,所述事实标签包括所述涉嫌目标对象的属性、行为、关系和轨迹;对所述事实标签进行挖掘,得到模型标签,所述模型标签包括所述涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;将所述模型标签输入预置模型中,得到所述涉嫌目标对象的预测标签。

【技术特征摘要】
1.一种新大数据标签生产方法,其特征在于,包括:获取涉嫌目标对象的待分析数据;提取所述待分析数据的事实标签,所述事实标签包括所述涉嫌目标对象的属性、行为、关系和轨迹;对所述事实标签进行挖掘,得到模型标签,所述模型标签包括所述涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;将所述模型标签输入预置模型中,得到所述涉嫌目标对象的预测标签。2.根据权利要求1所述的新大数据标签生产方法,其特征在于,所述根据所述事实标签进行挖掘具体包括:S1:将所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容与语言库中的预置文本进行匹配,得到所述涉嫌目标对象的语种标签;S2:对所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容进行要素提取,得到所述涉嫌目标对象的要素标签;S3:对所述涉嫌目标对象的行为的次数进行统计运算,得到所述涉嫌目标对象的统计标签;S4:获取与所述涉嫌目标对象相关的伴随者和/或伴随物品,确定所述伴随者和/或伴随物品的轨迹为第二轨迹,确定所述涉嫌目标对象的轨迹为第一轨迹,根据所述第一轨迹和所述第二轨迹的吻合度确定所述涉嫌目标对象的伴随标签;S5:将所述统计标签、所述要素标签、所述语种标签和所述伴随标签组成所述涉嫌目标对象的模型标签。3.根据权利要求1所述的新大数据标签生产方法,其特征在于,还包括:获取所述涉嫌目标对象的自定义标签,所述自定义标签包括所述涉嫌目标对象的自定义属性、自定义行为、自定义关系和自定义轨迹;选择所述自定义标签与所述事实标签存在区别的部分标记更新至所述事实标签中。4.根据权利要求1至3任意一项所述的新大数据标签生产方法,其特征在于,所述预置模型为朴素贝叶斯或逻辑回归模型或相关向量机模型或随机森林模型。5.一种新大数据标签生产装置,其特征在于,包括:第一获取模块,用于获取涉嫌目标对象的待分析数据;提取模块,用于提取所述待分析数据的事实标签,所述事实标签包括所述涉嫌目标对象的属性、行为、关系和轨迹;挖掘模块,用于对所述事实...

【专利技术属性】
技术研发人员:邱晓贤林国强章武盛周义豪罗以攀黄文杰赵亨利王松林袁伟林
申请(专利权)人:广州汇智通信技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1