当前位置: 首页 > 专利查询>三明学院专利>正文

一种网贷风险行为分析检测方法、装置、设备和存储介质制造方法及图纸

技术编号:23605271 阅读:68 留言:0更新日期:2020-03-28 06:13
本发明专利技术公开了一种网贷风险行为分析检测方法、装置、设备及计算机存储介质,方法包括:采集用户在预设时间段的上网日志,以获得日志信息;其中,所述日志信息包括预先设置的关键词信息;根据所述关键词信息,以构建网贷风险行为分析特征;提取网贷网站的文本信息,并与所述网贷风险行为分析特征进行匹配;在匹配成功后,通过高斯混合聚类算法对所述网贷网站进行网贷风险行为分析检测。本发明专利技术根据多维度挖掘恶意访问的表现特征,结合高斯混合聚类算法对网贷行为做出分析判断,提高了识别精度以及效率。

An analysis and detection method, device, equipment and storage medium of network loan risk behavior

【技术实现步骤摘要】
一种网贷风险行为分析检测方法、装置、设备和存储介质
本专利技术涉及计算机
,尤其涉及一种网贷风险行为分析检测方法、装置、设备和存储介质。
技术介绍
目前,随着当前网贷平台风险分析的欺骗技术越来越成熟,以及各类网贷网站的急剧增加,导致依靠人工来评估网贷行为产生的风险不再有效。因此,出现了各种基于行为的校园贷风险行为分析检测技术,例如通过建立SVM、Logit、判别分析模型来识别P2P网贷问题平台,并利用比较问题平台和正常平台的各项识别指标的均值来判读正常平台与问题平台;通过机器语言算法先得出一套P2P平台风险的最优指标组合,利用所选的变量对其指标进行因子分析并得到其指标值,然后对600多家的P2P平台按指标分配后得到综合得分并进行评价排序,得到排名最前的50家网贷平台,最后根据模型建立的平台风险评价体系进行风险预测。但是上述方法中通过对比分析法及指标分配法对网贷网站进行识别,其识别精度、效率相对低且智能化水平较低。
技术实现思路
针对上述问题,本专利技术的目的在于提供一种网贷风险行为分析检测方法、装置、设备和存储介质,本专利技术根据多维度挖掘恶意访问的表现特征,结合高斯混合聚类算法对网贷行为做出分析判断,提高了识别精度以及效率。本专利技术第一方面提供了一种网贷风险行为分析检测方法,包括:采集用户在预设时间段的上网日志,以获得日志信息;其中,所述日志信息包括预先设置关键词的关键词信息;根据所述关键词信息,以构建网贷风险行为分析特征;提取网贷网站的文本信息,并与所述网贷风险行为分析特征进行匹配;在匹配成功后,通过高斯混合聚类算法对所述网贷网站进行网贷风险行为分析检测。优选地,在所述根据所述关键词信息,以构建网贷风险行为分析特征的步骤之后,在所述提取网贷网站的文本信息,并与所述网贷风险行为分析特征进行匹配的步骤之前,还包括:基于深度包检测的应用识别算法,识别所有网站的应用标签类型;根据所述网站的应用标签类型,将网站进行区分分类,以获取分类后的网贷网站。优选地,提取网贷网站的文本信息,并与所述网贷风险行为分析特征进行匹配,具体为:通过多变潜在语义索引文本敏感特征抽取算法对网贷网站的文本信息进行提取,并将提取后的文本信息与所述网贷风险行为分析特征进行匹配。优选地,所述在匹配成功后,通过高斯混合聚类算法对所述网贷网站进行网贷风险行为分析检测,具体为:在匹配成功后,对所述匹配后的文本信息进行距离度量以及性能指标测量;将距离度量以及性能指标测量后的文本信息,基于高斯混合聚类算法,检测所述网贷网站进行网贷风险行为。优选地,采用VDM对匹配后的文本信息进行距离度量,距离度量表达式为:mu,a为在属性上取值为μ的文本样本数,mu,a,i为在第i个样本簇中属性μ上取值为a的样本数,k为文本特征样本簇数,VDMp(a,b)为μ上的a和b两个离散值之间的VDM度量距离。本专利技术实施例还提供了一种网贷风险行为分析检测装置,包括:采集单元,用于采集用户在预设时间段的上网日志,以获得日志信息;其中,所述日志信息包括预先设置的关键词信息;构建单元,用于根据所述关键词信息,以构建网贷风险行为分析特征;提取单元,用于提取网贷网站的文本信息,并与所述网贷风险行为分析特征进行匹配;检测单元,用于在匹配成功后,通过高斯混合聚类算法对所述网贷网站进行网贷风险行为分析检测。优选地,还包括:识别单元,用于基于深度包检测的应用识别算法,识别所有网站的应用标签类型;区分分类单元,用于根据所述网站的应用标签类型,将网站进行区分分类,以获取分类后的网贷网站。提取网贷网站的文本信息,并与所述网贷风险行为分析特征进行匹配,具体为:通过多变潜在语义索引文本敏感特征抽取算法对网贷网站的文本信息进行提取,并将提取后的文本信息与所述网贷风险行为分析特征进行匹配。优选地,检测单元,具体包括:距离度量以及性能指标测量模块,用于在匹配成功后,对所述匹配后的文本信息进行距离度量以及性能指标测量;网贷风险行为检测模块,用于将距离度量以及性能指标测量后的文本信息,基于高斯混合聚类算法,检测所述网贷网站进行网贷风险行为。优选地,采用VDM对匹配后的文本信息进行距离度量,距离度量表达式为:mu,a为在属性上取值为μ的文本样本数,mu,a,i为在第i个样本簇中属性μ上取值为a的样本数,k为文本特征样本簇数,VDMp(a,b)为μ上的a和b两个离散值之间的VDM度量距离。本专利技术第三方面还提供了一种网贷风险行为分析检测设备,包括处理器、存储器以及存储在所述存储器内的计算机程序,所述计算机程序能够被所述处理器执行以实现上述实施例所述的网贷风险行为分析检测方法。本专利技术第四方面还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述实施例所述的网贷风险行为分析检测方法。实施本专利技术实施例,具有如下有益技术效果:本专利技术以用户在预设时间段的上网日志,获得包括预先设置关键词的关键词信息,构建构建网贷风险行为分析特征,提取网贷网站的文本信息,并与所述网贷风险行为分析特征进行匹配,然后结合高斯混合聚类算法对网贷行为做出分析判断,提高了识别精度以及效率。附图说明为了更清楚地说明本专利技术的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术第一实施例提供的一种网贷风险行为分析检测方法的流程示意图。图2是本专利技术实施例提供的某高校的校园网络出口部署拓扑图。图3是本专利技术实施例提供的某校园贷用户的检测信息示意图。图4是本专利技术第二实施例提供的一种网贷风险行为分析检测装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1至图3,本专利技术第一实施例提供了一种网贷风险行为分析检测方法,其可由网贷风险行为分析检测设备(以下简称“分析检测设备”)来执行,特别的,由网贷风险行为分析检测设备内的一个或多个处理器来执行,并至少包括如下步骤:S101,采集用户在预设时间段的上网日志,以获得日志信息;其中,所述日志信息包括预先设置关键词的关键词信息。在本实施例中,所述关键词为用户搜索网贷敏感词,包括网贷敏感词特征信息以及网贷标题敏感词特征信息,其中,所述网贷敏感词特征信息包括网贷、贷款、信贷、借贷、借钱、信用贷等。所述网贷标题敏感词特征信息包括本文档来自技高网...

【技术保护点】
1.一种网贷风险行为分析检测方法,其特征在于,包括:/n采集用户在预设时间段的上网日志,以获得日志信息;其中,所述日志信息包括预先设置关键词的关键词信息;/n根据所述关键词信息,以构建网贷风险行为分析特征;/n提取网贷网站的文本信息,并与所述网贷风险行为分析特征进行匹配;/n在匹配成功后,通过高斯混合聚类算法对所述网贷网站进行网贷风险行为分析检测。/n

【技术特征摘要】
1.一种网贷风险行为分析检测方法,其特征在于,包括:
采集用户在预设时间段的上网日志,以获得日志信息;其中,所述日志信息包括预先设置关键词的关键词信息;
根据所述关键词信息,以构建网贷风险行为分析特征;
提取网贷网站的文本信息,并与所述网贷风险行为分析特征进行匹配;
在匹配成功后,通过高斯混合聚类算法对所述网贷网站进行网贷风险行为分析检测。


2.根据权利要求1所述的网贷风险行为分析检测方法,其特征在于,在所述根据所述关键词信息,以构建网贷风险行为分析特征的步骤之后,在所述提取网贷网站的文本信息,并与所述网贷风险行为分析特征进行匹配的步骤之前,还包括:
基于深度包检测的应用识别算法,识别所有网站的应用标签类型;
根据所述网站的应用标签类型,将网站进行区分分类,以获取分类后的网贷网站。


3.根据权利要求1所述的网贷风险行为分析检测方法,其特征在于,提取网贷网站的文本信息,并与所述网贷风险行为分析特征进行匹配,具体为:
通过多变潜在语义索引文本敏感特征抽取算法对网贷网站的文本信息进行提取,并将提取后的文本信息与所述网贷风险行为分析特征进行匹配。


4.根据权利要求1所述的网贷风险行为分析检测方法,其特征在于,所述在匹配成功后,通过高斯混合聚类算法对所述网贷网站进行网贷风险行为分析检测,具体为:
在匹配成功后,对所述匹配后的文本信息进行距离度量以及性能指标测量;
将距离度量以及性能指标测量后的文本信息,基于高斯混合聚类算法,检测所述网贷网站进行网贷风险行为。


5.根据权利要求4所述的网...

【专利技术属性】
技术研发人员:余建林志兴
申请(专利权)人:三明学院
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1