用户关系识别方法及装置制造方法及图纸

技术编号:27224790 阅读:25 留言:0更新日期:2021-02-04 11:46
本发明专利技术实施例公开了一种用户关系识别方法及装置,以解决现有技术中对居缘关系的识别准确性较低、使用范围不广泛、成本高昂等问题。该方法包括:采集待识别用户对在第一指定时间段内的通信数据;根据通信数据,确定待识别用户对之间的通信关系数据;根据通信关系数据,利用预先建立的关系识别模型确定待识别用户对之间是否具有居缘关系。该技术方案在识别居缘关系时,能够基于移动通信系统采集居缘关系识别所需的通信数据,无需额外的硬件数据,因此数据获取成本较低;此外,该技术方案利用预先建立的关系识别模型确定待识别用户之间是否具有居缘关系,而无需人工设定相关判定条件和阈值,从而提高了识别效率、提升了识别的精准度。准度。准度。

【技术实现步骤摘要】
用户关系识别方法及装置


[0001]本专利技术涉及移动通信
,尤其涉及一种用户关系识别方法及装置。

技术介绍

[0002]移动通信技术的飞速发展使得手机的普及率日益提升,移动通信已经成为我们社会交往的重要途径之一。对于移动通信行业,识别用户居缘关系有着非常重要的意义,如促进家庭业务套餐的精准营销。移动通信系统中丰富的通话数据、MR(MeasurementReport,测量报告)数据客观反映了广大用户的居缘关系特征。这里的居缘关系是比照血缘关系、地缘关系、业缘关系、趣缘关系等提出的,是以居住在一起为联结纽带的一种人际关系。
[0003]现有的用户关系识别主要集中在家庭关系的识别上,而对于居缘关系的识别基本空白。居缘关系虽然不等同于家庭关系,例如,合租的用户之间一般不存在家庭关系。但由于大部分家庭会选择居住在一起,使得居缘关系与家庭关系仍有很大的重叠,因此在进行居缘关系识别时,需要参考家庭关系识别的方法。而现有的家庭关系识别方法大多存在准确性较低、使用范围不广泛、成本高昂等不足,如果将以上方法运用在居缘关系的识别上也会出现相同的不足。

技术实现思路

[0004]本专利技术实施例提供一种用户关系识别方法及装置,以解决现有技术中对居缘关系的识别准确性较低、使用范围不广泛、成本高昂等问题。
[0005]为解决上述技术问题,本专利技术实施例是这样实现的:
[0006]第一方面,本专利技术实施例提供了一种用户关系识别方法,包括:
[0007]采集待识别用户对在第一指定时间段内的通信数据;所述通信数据包括所述待识别用户对中的各用户的话单数据和/或测量报告数据;
[0008]根据所述通信数据,确定所述待识别用户对之间的通信关系数据;所述通信关系数据包括所述待识别用户对之间的通话行为特征和/或通信环境相似度;
[0009]根据所述通信关系数据,利用预先建立的关系识别模型确定所述待识别用户对之间是否具有居缘关系;所述关系识别模型根据多个样本用户对之间的样本通信关系数据及各所述样本用户对之间是否具有居缘关系的信息训练得到;所述居缘关系指居住在同一地理空间的用户关系。
[0010]第二方面,本专利技术实施例还提供了一种用户关系识别装置,包括:
[0011]采集模块,采集待识别用户对在第一指定时间段内的通信数据;所述通信数据包括所述待识别用户对中的各用户的话单数据和/或测量报告数据;
[0012]第一确定模块,根据所述通信数据,确定所述待识别用户对之间的通信关系数据;所述通信关系数据包括所述待识别用户对之间的通话行为特征和/或通信环境相似度;
[0013]第二确定模块,根据所述通信关系数据,利用预先建立的关系识别模型确定所述待识别用户对之间是否具有居缘关系;所述关系识别模型根据多个样本用户对之间的样本
通信关系数据及各所述样本用户对之间是否具有居缘关系的信息训练得到;所述居缘关系指居住在同一地理空间的用户关系。
[0014]第三方面,本专利技术实施例还提供了一种用户关系识别设备,包括:
[0015]存储器,存储有计算机程序指令;
[0016]处理器,当所述计算机程序指令被所述处理器执行时实现如上述任一项所述的用户关系识别方法。
[0017]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括指令,当所述指令在计算机上运行时,使得所述计算机执行如上述任一项所述的用户关系识别方法。
[0018]在本专利技术实施例中,该技术方案在识别居缘关系时,能够基于移动通信系统采集居缘关系识别所需的通信数据(包括待识别用户对中的各用户的话单数据和/或测量报告数据),使得居缘关系识别所需的数据维度丰富、数据质量可靠,且无需额外的硬件数据,因此数据获取成本较低;此外,根据采集到的通信数据能够确定出待识别用户对之间的通话行为特征和/或通信环境相似度,由于通话行为特征和/或通信环境相似度能够在一定程度上体现用户是否居住在同一地理空间,因此本方案实现了居缘关系识别的准确性;再者,该技术方案根据待识别用户对之间的通信关系数据,利用预先建立的关系识别模型确定待识别用户之间是否具有居缘关系,而无需人工设定相关判定条件和阈值,即可自动化地识别用户居缘关系,从而大幅度提高识别效率、提升识别的精准度。
附图说明
[0019]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本专利技术的一个实施例中一种用户关系识别方法的示意性流程图。
[0021]图2是本专利技术的一个实施例中话单数据和测量报告数据的采集设备架构图。
[0022]图3是本专利技术的一个实施例中通信关系数据的确定设备架构图。
[0023]图4是本专利技术的一个实施例中关系识别模型的确定设备架构图。
[0024]图5是本专利技术的另一个实施例中一种用户关系识别方法的示意性流程图。
[0025]图6是本专利技术的一个实施例中一种用户关系识别装置的结构示意图。
[0026]图7是本专利技术的一个实施例中应用的网络设备的结构示意图。
具体实施方式
[0027]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]图1是本专利技术的一个实施例中一种用户关系识别方法的示意性流程图。图1的方法可包括:
[0029]S102,采集待识别用户对在第一指定时间段内的通信数据。
[0030]其中,待识别用户对包括两个用户,其表征形式可包括多种,如由两个用户的用户名拼接组成、由两个用户分别对应的通讯号码拼接组成等。通信数据包括待识别用户对中的各用户的话单数据和/或测量报告数据。话单数据可由各运营商的服务器采集,测量报告数据可由各运营商的网络设备或基站进行软件采集。
[0031]为确保居缘关系的识别准确性,第一指定时间段优选为最近一段时间,例如可以是最近一周、最近一个月、最近一年等。
[0032]S104,根据通信数据,确定待识别用户对之间的通信关系数据。
[0033]其中,通信关系数据包括待识别用户对之间的通话行为特征和/或通信环境相似度。
[0034]S106,根据通信关系数据,利用预先建立的关系识别模型确定待识别用户对之间是否具有居缘关系。
[0035]其中,关系识别模型根据多个样本用户对之间的样本通信关系数据及各样本用户对之间是否具有居缘关系的信息训练得到;居缘关系指居住在同一地理空间的用户关系。
[0036]在本专利技术实施例中,该技术方案在识别居缘关系时,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户关系识别方法,其特征在于,包括:采集待识别用户对在第一指定时间段内的通信数据;所述通信数据包括所述待识别用户对中的各用户的话单数据和/或测量报告数据;根据所述通信数据,确定所述待识别用户对之间的通信关系数据;所述通信关系数据包括所述待识别用户对之间的通话行为特征和/或通信环境相似度;根据所述通信关系数据,利用预先建立的关系识别模型确定所述待识别用户对之间是否具有居缘关系;所述关系识别模型根据多个样本用户对之间的样本通信关系数据及各所述样本用户对之间是否具有居缘关系的信息训练得到;所述居缘关系指居住在同一地理空间的用户关系。2.根据权利要求1所述的方法,其特征在于,所述话单数据包括通讯号码、双方通话时间、双方通话时长、通话主被叫方中的至少一项;所述通话行为特征包括通讯号码对标识、通话总次数、通话次均时长、相同联系人数目中的至少一项。3.根据权利要求2所述的方法,其特征在于,所述根据所述通信数据,确定所述待识别用户对之间的通信关系数据,包括以下至少一项:按照预设拼接方式将所述各用户的通讯号码拼接在一起,得到所述待识别用户对的通讯号码对标识;利用所述待识别用户对在所述第一指定时间段内的通话总时长除以所述通话总次数,得到所述待识别用户对之间的所述通话次均时长;分别确定所述各用户的通话联系人;将所述各用户的通话联系人进行取交集操作,得到所述待识别用户对之间的相同联系人数目。4.根据权利要求2所述的方法,其特征在于,所述根据所述通信数据,确定所述待识别用户对之间的通信关系数据之前,还包括:删除所述话单数据中的异常数据;和/或,删除所述通讯号码之前的指定类字符;其中,所述异常数据包括非用户号码、非法号码中的至少一项。5.根据权利要求1所述的方法,其特征在于,所述测量报告数据包括通讯号码、与服务小区的连接时间、所连接的服务小区的小区识别码、所述服务小区的信号接收功率、所述服务小区的信号接收质量、所述服务小区的邻区的信号接收功率、所述邻区的信号接收质量中的至少一项;所述通信环境相似度包括在第二指定时间段内所述待识别用户对连接的所述小区识别码的相同率、所述待识别用户对连接的相同小区总时长、所述待识别用户对连接的服务小区的信号接收功率相似度、所述待识别用户对连接的服务小区的信号接收质量相似度、所述待识别用户对对应的邻区相似度、所述待识别用户对对应的邻区信号接收功率相似度、所述待识别用户对对应的邻区信号接收质量相似度中的至少一项。6.根据权利要求5所述的方法,其特征在于,所述根据所述通信数据,确定所述待识别用户对之间的通信关系数据,包括以下至少一项:确定在所述第二指定时间段内所述待识别用户对连接的所述小区识别码的相同次数;将...

【专利技术属性】
技术研发人员:赵爽薛飞陈荣平张靓戴传智
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1