用户分类的方法、装置、设备及存储介质制造方法及图纸

技术编号:32829745 阅读:18 留言:0更新日期:2022-03-26 20:39
本申请涉及人工智能技术领域,本申请公开了一种用户分类的方法、装置、设备及存储介质,通过将获取的用户数据项目中的缺失数据项目进行填充,并将填充后的特殊数据项目和常规数据项目输入训练后的初次分类模型进行分类处理,得到初次分类结果;由于包括特殊数据项目,会导致最终分类结果的偏差,将合初次分类结果进行对应的权重调整,并加权求和得到用户分类结果,提高了用户分类的稳定性,从而保证了分类结果的精确性。类结果的精确性。类结果的精确性。

【技术实现步骤摘要】
用户分类的方法、装置、设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种用户分类的方法、装置、计算机设备及存储介质。

技术介绍

[0002]通过将用户的数据进行合理的收集,并根据用户数据进行分类评分,可提高对用户信用体系的完善,了解用户的需求以及办理业务对应的风险。在获取大量用户数据作为变量进行分类时,容易出现所获取的用户数据类型的固化的问题,当增加多种新的用户数据类型,新增的用户数据类型的信息价值参差不齐,从而导致分类的稳定性降低,影响评分的精确度。

技术实现思路

[0003]本申请提供一种用户分类的方法、装置、计算机设备及存储介质,解决了现有技术在增加新的用户数据类型完善用户分类时,用户分类稳定性降低的问题。
[0004]第一方面,本申请实施例提供了一种用户分类的方法,包括:
[0005]获取用户数据项目集合,识别所述用户数据项目集合中的缺失数据项目和常规数据项目,得到多个缺失数据项目和多个常规数据项目;
[0006]通过特殊值填充法将多个所述缺失数据项目填充为多个特殊数据项目;
[0007]将多个所述特殊数据项目和多个所述常规数据项目输入所述训练后的初级分类模型进行初次分类处理,得到初次分类结果集合,其中,所述初次分类结果集合中包括多个初次分类结果;
[0008]通过训练后的用户分类模型对所述初次分类结果集合中的每个所述初次分类结果进行权重调整后,利用加权求和算法进行处理,得到用户分类结果。
[0009]第二方面,本申请实施例还提供了一种用户分类的装置,包括:
[0010]获取模块,获取用户数据项目集合,识别所述用户数据项目集合中的缺失数据项目和常规数据项目,得到多个缺失数据项目和多个常规数据项目;
[0011]缺失数据填充模块,通过特殊值填充法将多个所述缺失数据项目填充为多个特殊数据项目;
[0012]初次分类模块,将多个所述特殊数据项目和多个所述常规数据项目输入训练后的初级分类模型进行初次分类处理,得到初次分类结果集合,其中,所述初次分类结果集合中包括多个初次分类结果;
[0013]用户分类模块,通过训练后的用户分类模型对所述初次分类结果集合中的每个所述初次分类结果进行权重调整后,利用加权求和算法进行处理,得到用户分类结果。
[0014]第三方面,本申请实施例还提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述用户分类的方法的步骤。
[0015]第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述用户分类的方法的步骤。
[0016]本申请提供的用户分类的方法、装置、计算机设备及存储介质,其中,一种用户分类的方法,通过将获取的用户数据项目中的缺失数据项目进行填充,并将填充后的特殊数据项目和常规数据项目输入训练后的初次分类模型进行分类处理,得到初次分类结果;由于包括特殊数据项目,会导致最终分类结果的偏差,将合初次分类结果进行对应的权重调整,并加权求和得到用户分类结果,提高了用户分类的稳定性,从而保证了分类结果的精确性。
附图说明
[0017]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是本申请一实施例提供的一种用户分类的方法的应用环境示意图;
[0019]图2是本申请一实施例提供的一种用户分类的方法的实现流程图;
[0020]图3是本申请一实施例提供的一种用户分类的方法中步骤S30的流程图;
[0021]图4是本申请一实施例提供的一种用户分类的方法中步骤S301的流程图;
[0022]图5是本申请一实施例提供的用户分类的装置的结构示意图;
[0023]图6是本申请一实施例提供的计算机设备的示意图。
具体实施方式
[0024]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0025]本申请实施例提供的用户分类的方法,可应用在如图1示出的应用环境中。如图1所示,客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
[0026]本实施例提供的用户分类的方法可以由服务端执行,例如,通过客户端将用户数据项目集合发送至服务端,服务端基于该用户数据项目集合,执行本实施例提供的用户分类的方法,进而得到用户分类处理后的用户分类结果,最后将该用户分类结果发送至客户端。
[0027]在图1之外的一些场景中,还可以是由客户端执行该用户分类的方法,直接根据客户端的用户数据项目集合,通过执行本实施例提供的用户分类的方法,得到用户分类处理
后的用户分类结果,然后将该用户分类结果发送至服务端进行存储。
[0028]本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0029]人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0030]图2示出了本申请一实施例提供的用户分类的方法的实现流程图。如图2所示,提供一种用户分类的方法,其技术方案主要包括以下步骤S10

S40:
[0031]步骤S10、获取用户数据项目集合,识别所述用户数据项目集合中的缺失数据项目和常规数据项目,得到多个缺失数据项目和多个常规数据项目。
[0032]在步骤S10中,为了获得更为准确的分类结果,一般通过获取项目更为全面的用户数据,进而提高用户分类结果的准确性。但增加用户数据的采集范围时,通常会存在部分项目数据缺失的问题,将所获取的数据分为缺失数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户分类的方法,其特征在于,包括:获取用户数据项目集合,识别所述用户数据项目集合中的缺失数据项目和常规数据项目,得到多个缺失数据项目和多个常规数据项目;通过特殊值填充法将多个所述缺失数据项目填充为多个特殊数据项目;将多个所述特殊数据项目和多个所述常规数据项目输入训练后的初级分类模型进行初次分类处理,得到初次分类结果集合,其中,所述初次分类结果集合中包括多个初次分类结果;通过训练后的用户分类模型对所述初次分类结果集合中的每个所述初次分类结果进行权重调整后,利用加权求和算法进行处理,得到用户分类结果。2.如权利要求1所述的用户分类的方法,其特征在于,所述将多个所述特殊数据项目和多个所述常规数据项目输入训练后的初级分类模型进行初次分类处理,得到包括多个初次分类结果的初次分类结果集合,包括;通过所述训练后的初级分类模型根据各所述常规数据项目的IV值进行初次分类处理,得到所述常规数据项目对应的常规数据初次分类结果;通过所述训练后的初级分类模型中的WOE编码单元对各所述特殊数据项目进行初次分类处理,得到所述特殊数据项目对应的特殊数据初次分类结果;将各所述特殊数据初次分类结果和各所述常规数据初次分类结果进行整合,得到初次分类结果集合。3.如权利要求2所述的用户分类的方法,其特征在于,所述通过所述训练后的初级分类模型根据各所述常规数据项目的IV值进行初次分类处理,得到所述常规数据项目对应的常规数据初次分类结果,包括:根据各所述常规数据项目的IV值对所述常规数据项目进行分类处理,得到强IV值数据项目和弱IV值数据项目;利用所述训练后的初级分类模型中的机器学习单元将各所述弱IV值数据项目进行特征增强处理;利用所述训练后的初级分类模型中的评分卡单元对所述特征增强处理的弱IV值数据项目和强IV值数据项目进行初次分类处理,得到所述常规数据初次分类结果。4.如权利要求2所述的用户分类的方法,其特征在于,所述通过训练后的用户分类模型对多个所述初次分类结果进行权重调整后,利用加权求和算法进行处理,得到用户分类结果,包括:通过多个所述常规数据初次分类结果进行归一化,得到常规数据归一化值;通过多个初次分类结果进行归一化,得到全部数据归一化值;利用所述常规数据归一化值与所述全部数据归一化值的比值调整所述初次分类结果的权重,并利用加权求和算法计算出所述用户分类结果。5.如权利要求4所述的用户分类的方法,其特征在于,所述利用所述常规数据归一化值与所述全部数据归一化值的比值调整所述初次分类结果的权重,并利用加权求和算法计算出所述用户分类结果,包括:通过如下公式对所述常规数据初次分类结果进行归一化处理,得到所述常规数据归一化值,公式为τ=∑
i
ω
i
σ
i
,其中τ为所述常规数据归一化值,ω
i
为第i个初次分类结果权重,
σ
i
为常规数据初次分类结果的标准...

【专利技术属性】
技术研发人员:柯虹
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1