亲密度确定方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24209278 阅读:21 留言:0更新日期:2020-05-20 16:05
本发明专利技术公开了一种亲密度确定方法、装置、计算机设备和存储介质。其中,所述方法包括:获取个体的社交数据,对该社交数据进行分析,分析出个体之间的社交数据中的特征数据,根据显著变量的正负相关性,从该特征数据中选取出与亲密度呈正负相关性的相关性特征数据,对该呈正负相关性的相关性特征数据按照预设的准则进行亲密度打标,从打标后的相关性特征数据中选择出重要特征数据,构建关联该重要特征数据的亲密度评分模型,以及根据该亲密度评分模型,对个体之间的社交数据进行亲密度评分,能够实现将人与人之间的亲密度进行数值量化。

Intimacy determination method, device, computer equipment and storage medium

【技术实现步骤摘要】
亲密度确定方法、装置、计算机设备和存储介质
本专利技术涉及数据处理
,特别是涉及一种亲密度确定方法、装置、计算机设备和存储介质。
技术介绍
亲密度是通过一个具体的分值体现用户和好友互动的热度。现有的亲密度确定方案,一般是根据以往的经验以及常用变量的权重来确定的,无法实现将人与人之间的亲密度进行数值量化。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种亲密度确定方法、装置、计算机设备和存储介质,能够实现将人与人之间的亲密度进行数值量化。根据本专利技术的一个方面,提供一种亲密度确定方法,包括:获取个体的社交数据;其中,所述社交数据类别包括通讯录数据、通话记录数据和无线上网数据;根据所述获取的社交数据,对个体之间的社交数据进行分析,分析出所述个体之间的社交数据中具有交集的特征数据;根据显著变量的正负相关性,从所述特征数据中选取出与亲密度呈正负相关性的相关性特征数据;对所述相关性特征数据按照预设的准则进行亲密度打标;从打标后的相关性特征数据中选择出重要特征数据;构建关联所述重要特征数据的亲密度评分模型;根据所述亲密度评分模型,对所述个体之间的社交数据进行亲密度评分。其中,所述对所述相关性特征数据按照预设的准则进行亲密度打标,包括:选取所述相关性特征数据前预设比例数据,再对选取后的相关性特征数据按照预设的概率数准则进行亲密度打标。其中,所述构建关联所述重要特征数据的亲密度评分模型,包括:用分箱方式,将所述重要特征数据进行离散化,将离散化后的重要特征数据中的多状态的离散变量合并成少状态的离散变量,和将所述经合并成少状态的离散变量后的重要特征数据采用证据权重编码的方式,将预测类别的集中度的属性作为编码的数值,把所述经合并成少状态的离散变量后的重要特征数据的特征的值规范到相近的尺度上,和采用信息价值的方式,选取区分度高的变量,和采用线性回归模型,计算亲密度的分值刻度的比率,根据训练集训练得到亲密度评分模型的参数。其中,所述构建关联所述重要特征数据的亲密度评分模型,还包括:将所述进行亲密度打标的打标结果与所述进行的亲密度评分的评分结果进行比较得到比较结果,根据所述得到的比较结果对所述进行的亲密度评分的评分结果进行准确率计算。其中,在所述将所述进行亲密度打标的打标结果与所述进行的亲密度评分的评分结果进行比较得到比较结果,根据所述得到的比较结果对所述进行的亲密度评分的评分结果进行准确率计算之后,还包括:根据所述进行的准确率计算得到的准确率结果,训练所述构建的亲密度评分模型使所述计算得到的准确率结果达到预设的阈值。根据本专利技术的另一个方面,提供一种亲密度确定装置,包括:获取模块、分析模块、选取模块、打标模块、选择模块、构建模块和评分模块;所述获取模块,用于获取个体的社交数据;其中,所述社交数据类别包括通讯录数据、通话记录数据和无线上网数据;所述分析模块,用于根据所述获取的社交数据,对个体之间的社交数据进行分析,分析出所述个体之间的社交数据中具有交集的特征数据;所述选取模块,用于根据显著变量的正负相关性,从所述特征数据中选取出与亲密度呈正负相关性的相关性特征数据;所述打标模块,用于对所述相关性特征数据按照预设的准则进行亲密度打标;所述选择模块,用于从打标后的相关性特征数据中选择出重要特征数据;所述构建模块,用于构建关联所述重要特征数据的亲密度评分模型;所述评分模块,用于根据所述亲密度评分模型,对所述个体之间的社交数据进行亲密度评分。其中,所述打标模块,具体用于:选取所述相关性特征数据前预设比例数据,再对选取后的相关性特征数据按照预设的概率数准则进行亲密度打标。其中,所述构建模块,具体用于:采用分箱方式,将所述重要特征数据进行离散化,将离散化后的重要特征数据中的多状态的离散变量合并成少状态的离散变量,和将所述经合并成少状态的离散变量后的重要特征数据采用证据权重编码的方式,将预测类别的集中度的属性作为编码的数值,把所述经合并成少状态的离散变量后的重要特征数据的特征的值规范到相近的尺度上,和采用信息价值的方式,选取区分度高的变量,和采用线性回归模型,计算亲密度的分值刻度的比率,根据训练集训练得到亲密度评分模型的参数。其中,所述亲密度确定装置,还包括:计算模块;所述计算模块,用于将所述进行亲密度打标的打标结果与所述进行的亲密度评分的评分结果进行比较得到比较结果,根据所述得到的比较结果对所述进行的亲密度评分的评分结果进行准确率计算。其中,所述亲密度确定装置,还包括:训练模块;所述训练模块,用于根据所述进行的准确率计算得到的准确率结果,训练所述构建的亲密度评分模型使所述计算得到的准确率结果达到预设的阈值。根据本专利技术的又一个方面,提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述亲密度确定方法的步骤。根据本专利技术的再一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的亲密度确定方法的步骤。可以发现,以上方案,可以获取个体的社交数据,该社交数据类别可包括通讯录数据、通话记录数据和无线上网数据等,和可以对该社交数据进行分析,分析出个体之间的社交数据中的特征数据,和可以根据显著变量的正负相关性,从该特征数据中选取出与亲密度呈正负相关性的相关性特征数据,和可以对该相关性特征数据按照预设的准则进行亲密度打标,得到模型训练集,和可以从打标后的相关性特征数据中选择出重要特征数据,和可以构建关联该重要特征数据的亲密度评分模型,以及可以根据该亲密度评分模型,对个体之间的社交数据进行亲密度评分,能够实现将人与人之间的亲密度进行数值量化。进一步的,以上方案,选取所述相关性特征数据前预设比例数据,再对选取后的相关性特征数据按照预设的概率数准则进行亲密度打标,这样的好处是能够防止后续计算证据权重编码出现无穷大的情况,使得亲密度评分模型更加光滑。进一步的,以上方案,可以采用分箱方式,将该重要特征数据进行离散化,将离散化后的重要特征数据中的多状态的离散变量合并成少状态的离散变量,和将该经合并成少状态的离散变量后的重要特征数据采用证据权重WOE编码的方式,将预测类别的集中度的属性作为编码的数值,把该经合并成少状态的离散变量后的重要特征数据的特征的值规范到相近的尺度上,和采用信息价值的方式,选取区分度高的变量,和采用线性回归模型,计算亲密度的分值刻度的比率,根据训练集训练得到亲密度评分模型的参数,这样的好处是能够便于通过该构建的亲密度评分模型,将人与人之间的亲密度进行数值量化。进一步的,以上方案,可以将该进行亲密度打标的打标结果与该进行的亲密度评分的评分结果进行比较得到比较结果,根据该得到的比较结果对该进行的亲密度评分的评分结果进行准确率计算,这样的好处是能够实现对人与人之间的亲密度进行亲密度评分的评分结果的准确率进行计算。进一步的,以上方案,可以根据该进行的准确率计算得到的准确率结果,训练该构建的亲密度评分模型使该计算得到的准确率结果达到预设本文档来自技高网...

【技术保护点】
1.一种亲密度确定方法,其特征在于,包括:/n获取个体的社交数据;其中,所述社交数据类别包括通讯录数据、通话记录数据和无线上网数据;/n对所述社交数据进行分析,分析出个体之间的社交数据中的特征数据;/n根据显著变量的正负相关性,从所述特征数据中选取出与亲密度呈正负相关性的相关性特征数据;/n对所述相关性特征数据按照预设的准则进行亲密度打标;/n从打标后的相关性特征数据中选择出重要特征数据;/n构建关联所述重要特征数据的亲密度评分模型;/n根据所述亲密度评分模型,对所述个体之间的社交数据进行亲密度评分。/n

【技术特征摘要】
1.一种亲密度确定方法,其特征在于,包括:
获取个体的社交数据;其中,所述社交数据类别包括通讯录数据、通话记录数据和无线上网数据;
对所述社交数据进行分析,分析出个体之间的社交数据中的特征数据;
根据显著变量的正负相关性,从所述特征数据中选取出与亲密度呈正负相关性的相关性特征数据;
对所述相关性特征数据按照预设的准则进行亲密度打标;
从打标后的相关性特征数据中选择出重要特征数据;
构建关联所述重要特征数据的亲密度评分模型;
根据所述亲密度评分模型,对所述个体之间的社交数据进行亲密度评分。


2.根据权利要求1所述的亲密度确定方法,其特征在于,所述对所述相关性特征数据按照预设的准则进行亲密度打标,包括:
选取所述相关性特征数据前预设比例数据,再对选取后的相关性特征数据按照预设的概率数准则进行亲密度打标。


3.根据权利要求1所述的亲密度确定方法,其特征在于,所述构建关联所述重要特征数据的亲密度评分模型,包括:
采用分箱方式,将所述重要特征数据进行离散化,将离散化后的重要特征数据中的多状态的离散变量合并成少状态的离散变量,和将所述经合并成少状态的离散变量后的重要特征数据采用证据权重编码的方式,将预测类别的集中度的属性作为编码的数值,把所述经合并成少状态的离散变量后的重要特征数据的特征的值规范到相近的尺度上,和采用信息价值的方式,选取区分度高的变量,和采用线性回归模型,计算亲密度的分值刻度的比率,根据训练集训练得到亲密度评分模型的参数。


4.根据权利要求1至3任意一项所述的亲密度确定方法,其特征在于,所述构建关联所述重要特征数据的亲密度评分模型,还包括:
将所述进行亲密度打标的打标结果与所述进行的亲密度评分的评分结果进行比较得到比较结果,根据所述得到的比较结果对所述进行的亲密度评分的评分结果进行准确率计算。


5.根据权利要求4所述的亲密度确定方法,其特征在于,在所述将所述进行亲密度打标的打标结果与所述进行的亲密度评分的评分结果进行比较得到比较结果,根据所述得到的比较结果对所述进行的亲密度评分的评分结果进行准确率计算之后,还包括:
根据所述进行的准确率计算得到的准确率结果,训练...

【专利技术属性】
技术研发人员:陈粮阳
申请(专利权)人:浙江大搜车软件技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1