This application relates to a group information classification method, device, computer equipment and storage medium in the field of artificial intelligence. The method includes: receiving classification task, which carries group identification; acquiring group information according to the group identification, identifying the first continuous variable and discrete variable corresponding to the group information; continuous processing of the discrete variable to obtain the second continuous variable corresponding to the group information; and taking the first continuous variable and the second continuous variable as the first continuous variable. The standardized variables corresponding to the group information are obtained by standardization processing, and the standardized variables corresponding to the group information are clustered to obtain the classification results corresponding to the group information. This method can avoid the influence of distance weight division between different types of variables on the classification results of group information, and improve the accuracy of the classification results of group information.
【技术实现步骤摘要】
群体信息分类方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种群体信息分类方法、装置、计算机设备和存储介质。
技术介绍
企业针对不同的业务需求,需要通过对群体进行类型划分,以此了解不同群体的特征。在进行类型划分时,涉及到的信息包括与群体信息对应的连续变量和离散变量。在传统方式中,通过度量连续变量两两之间的距离及离散变量两两之间的距离,将度量出的两种类型变量的距离进行权重划分,得到最终的聚类结果,从而得到群体分类结果。但是,对于权重的大小并不能准确地进行计算,导致权重的不同使群体分类结果不准确。
技术实现思路
基于此,有必要针对上述技术问题,提供一种提高群体信息对应的分类结果的准确性的群体信息分类方法、装置、计算机设备和存储介质。一种群体信息分类方法,所述方法包括:接收分类任务,所述分类任务携带群体标识;根据所述群体标识获取群体信息,识别所述群体信息对应的第一连续变量以及离散变量;对所述离散变量进行连续化处理,得到所述群体信息对应的第二连续变量;将所述第一连续变量以及第二连续变量进行标准化处理,得到所述群体信息对应的标准化变量;将所述群体信息对应的标准化变量进行聚类,得到所述群体信息对应的分类结果。在其中一个实施例中,所述对所述离散变量进行连续化处理包括:在所述群体信息中获取与所述离散变量对应的多个维度;对所述离散变量对应的多个维度进行编码,得到所述群体信息对应的第二连续变量。在其中一个实施例中,所述将所述第一连续变量以及第二连续变量进行标准化处理,得到所述群体信息对应的标准化变量包括:计算所述群体信息中所述第一连续变量以及第二连续变量的 ...
【技术保护点】
1.一种群体信息分类方法,所述方法包括:接收分类任务,所述分类任务携带群体标识;根据所述群体标识获取群体信息,识别所述群体信息对应的第一连续变量以及离散变量;对所述离散变量进行连续化处理,得到所述群体信息对应的第二连续变量;将所述第一连续变量以及第二连续变量进行标准化处理,得到所述群体信息对应的标准化变量;将所述群体信息对应的标准化变量进行聚类,得到所述群体信息对应的分类结果。
【技术特征摘要】
1.一种群体信息分类方法,所述方法包括:接收分类任务,所述分类任务携带群体标识;根据所述群体标识获取群体信息,识别所述群体信息对应的第一连续变量以及离散变量;对所述离散变量进行连续化处理,得到所述群体信息对应的第二连续变量;将所述第一连续变量以及第二连续变量进行标准化处理,得到所述群体信息对应的标准化变量;将所述群体信息对应的标准化变量进行聚类,得到所述群体信息对应的分类结果。2.根据权利要求1所述的方法,其特征在于,所述对所述离散变量进行连续化处理包括:在所述群体信息中获取与所述离散变量对应的多个维度;对所述离散变量对应的多个维度进行编码,得到所述群体信息对应的第二连续变量。3.根据权利要求1所述的方法,其特征在于,所述将所述第一连续变量以及第二连续变量进行标准化处理,得到所述群体信息对应的标准化变量包括:计算所述群体信息对应的第一连续变量以及第二连续变量的均值及标准差;根据所述第一连续变量以及第二连续变量、均值、标准差以及预设关系,得到所述群体信息对应的标准化变量。4.根据权利要求1所述的方法,其特征在于,所述将所述群体信息对应的标准化变量进行聚类,得到所述群体信息对应的分类结果包括:对所述群体信息对应的标准化变量进行距离度量;根据度量后的标准化变量之间的距离对所述标准化变量进行聚类,得到多种标准化变量类型;根据所述多种标准化变量类型获取所述群体信息对应的分类结果。5.根据权利要求1-4任意一项所述的方法,其特征在于,所述方法还包括:对所述群体信息对应的分类结果进行分析,得到多种群体类...
【专利技术属性】
技术研发人员:邓悦,金戈,徐亮,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。