一种获取目标对象人物关系及关系亲密度的算法模型制造技术

技术编号：26689643 阅读：38 留言：0更新日期：2020-12-12 02:38

本发明专利技术提出一种获取目标对象人物关系及关系亲密度的算法模型。它包括若干前端采集设备、服务器、磁盘阵列、大数据组件等。其中前端采集设备主要用于辅助采集各类互联网app个人使用数据，服务器结合大数据组件对获取的数据进行清洗、入库和算法模型计算，磁盘阵列用于存储入库的各类app个人使用数据，大数据组件包括：Hadoop、Flume、Kafka、ElasticSearch等。本发明专利技术的算法模型多维度考虑现实因素计算目标对象与其关系人的亲密度，并根据数据特征判断各关系人的关系类别，适应现实场景和环境，能较准确的锁定关系人并提供相关辅助信息，为案件侦查提供重要支撑。

全部详细技术资料下载

【技术实现步骤摘要】
一种获取目标对象人物关系及关系亲密度的算法模型
本专利技术涉及终端辅助采集设备领域，尤其涉及一种获取目标对象人物关系及关系亲密度的算法模型。技术背景人物关系对案件侦办提供重要的技术支持。本专利技术中采集的数据是互联网各类app的个人使用信息，人物关系可以提取其中的个人信息、联系人信息(关系人)、各类消费订单信息(给关系人下单)、通讯记录、寄递往来信息等，对这些社交足迹数据进行分析挖掘可以较准确的得到人物关系及关系亲密度。计算关系人的亲密度需要多维度考虑设计计算模型，判断关系类别需要提取关系数据的特征，设定关系人类别特征规则并进行匹配。针对关系人亲密度，考虑的维度主要有：(1)关系数据发生时间与当前时间差。关系数据发生的时间越久远，则其在计算亲密度是权重越小。(2)关系数据提取次数。关系数据提取次数越大，则其亲密度会越大。(3)关系数据源个数。关系数据源越多，则其亲密度会越大。(4)关系数据源权重。不同数据源的权重有所区别，比如记录名片的app中的联系人很多都是工作关系产生的，关系基本都不怎么亲密，这类数据源的权重就会低一些，而某些数据中存在紧急联系人，那该联系人基本就是比较亲密的关系人。(5)关系数据中存在明确关系类别。对于能够提取明确关系类别的关系人其亲密度会被明显增大。针对数据中未能提取到关系人类别的，通过相关数据特征对关系类别进行匹配判断，考虑的相关特征有：关系人亲密度、关系人标签(年龄、籍贯等)、关系行为类型(如订单类型)、关系发生时间(如订...

【技术保护点】
1.一种获取目标对象人物关系及关系亲密度的算法模型，其特征在于，包括：若干前端数据采集设备、服务器、磁盘阵列、大数据组件；其中前端采集设备主要用于辅助采集各类互联网app个人使用数据；服务器结合大数据组件对获取的数据进行清洗、入库和算法模型计算；磁盘阵列用于存储入库的各类app个人使用数据。/n

【技术特征摘要】
1.一种获取目标对象人物关系及关系亲密度的算法模型，其特征在于，包括：若干前端数据采集设备、服务器、磁盘阵列、大数据组件；其中前端采集设备主要用于辅助采集各类互联网app个人使用数据；服务器结合大数据组件对获取的数据进行清洗、入库和算法模型计算；磁盘阵列用于存储入库的各类app个人使用数据。

2.一种获取目标对象人物关系及关系亲密度的算法模型，其中包括基于关系人信息的关系人聚合算法，对于待聚类关系数据记录集，计算两两记录之间(无方向性)的关系人相似度，两条记录中相同字段值的相似性贡献值为相同字符占比(除特殊隐藏字符外有不相同的字符或值长度不相同则该字段相似性贡献值为0)，得到两两记录之间的相似度之后依据相似度进行聚类，设定一个相似度阈值(如0.8)，将相似度大于0.8的数据记录聚为一类(一个关系人)，如果某条记录可归为两个不同的类(即该记录与这两个类中的某条记录的相似度都大于0.8)，则选择相似度大的那一类，每一个类赋予一个唯一标识id，则该类中的每条记录就对应该类标识id。

3.一种获取目标对象人物关系及关系亲密度的算法模型，其中包括关系亲密度的算法模型，其特征在于，多维度考虑现实因素计算目标对象与其关系人的亲密度。
针对每一个关系人的关系数据集合，首先计算这个集合中每一条数据的权重，这里需要考虑的因素有关系发生时间与当前时间差以及该条数...

【专利技术属性】
技术研发人员：严俊，
申请(专利权)人：武汉白虹软件科技有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人