System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,特别涉及一种基于图算法的企业识别方法,装置、设备及存储介质。
技术介绍
1、发掘企业间的关联关系需要大规模的节点、关系及关系种类采集,在现有的解决方案中通常只使用了一些公开数据用于图的构建,并基于该图构造后续应用。但是图的节点和关系是不完整的,因此基于图的后续算法和应用也会缺乏准确性。
2、现有技术在基于图的算法的后续应用的层面上通常为无监督算法,缺乏标签数据作为后续应用的支撑,后续应用往往缺乏准确性。并且部分现有解决方案在构建图或应用图时采用了较为简单的构建方式和主观性较强的业务指标模型,这可能解决部分特定业务场景下的应用问题,但其适应性往往存在一定问题。
技术实现思路
1、有鉴于此,本专利技术的目的在于提供一种基于图算法的企业识别方法,装置、设备及存储介质,可以通过图算法构建并筛选样本,并且可以基于构建的特征从企业的关联企业中筛选出具有购买意向的企业。其具体方案如下:
2、第一方面,本申请公开了一种基于图算法的企业识别方法,应用于企业识别系统,包括:
3、基于采集的目标企业的目标企业数据构建企业无向图,并确定所述企业无向图关联的目标企业子图,以通过预设图算法对所述目标企业子图进行社群划分,得到与所述目标企业对应的若干关联企业子团;
4、分别构建所述若干关联企业子团对应的若干特征信息,并基于所述若干特征信息以及历史成交数据生成样本集;
5、利用所述样本集以及历史未成交数据对待训练企业预测模型进行训练
6、可选的,所述基于采集的目标企业的目标企业数据构建企业无向图,包括:
7、通过网络爬虫爬取公开数据源的网络企业数据,并采集本地数据库中的历史企业数据,以将所述历史企业数据以及所述网络企业数据确定为目标企业数据;
8、基于所述目标企业数据构建企业无向图。
9、可选的,所述确定所述企业无向图关联的目标企业子图,以通过预设图算法对所述目标企业子图进行社群划分,得到与所述目标企业对应的若干关联企业子团,包括:
10、通过预设社群挖掘算法对所述企业无向图进行处理,以确定所述企业无向图关联的无向企业子图;
11、将所述无向企业子图转换为有向图,并通过鲁汶算法对得到的目标企业子图进行社群划分,以确定与所述目标企业对应的若干关联企业子团。
12、可选的,所述分别构建所述若干关联企业子团对应的若干特征信息,并基于所述若干特征信息以及历史成交数据生成样本集,包括:
13、分别为所述若干关联子团构建相对应的数量特征信息、类别特征信息以及时间特征信息;
14、获取本地数据库的历史成交数据,以基于所述历史成交数据以及所述数量特征信息、所述类别特征信息以及所述时间特征信息构建样本集。
15、可选的,所述基于所述历史成交数据以及所述数量特征信息、所述类别特征信息以及所述时间特征信息构建样本集,包括:
16、通过半监督学习算法确定所述历史成交数据中的正样本以及负样本,以通过所述正样本以及所述数量特征信息、所述类别特征信息以及所述时间特征信息构建集构建正样本集,并通过所述负样本以及所述数量特征信息、所述类别特征信息以及所述时间特征信息构建集构建负样本集。
17、可选的,所述利用所述样本集以及历史未成交数据对待训练企业预测模型进行训练,以通过得到的训练后企业预测模型对所述若干关联企业子团进行购买意向预测,以识别具有购买意向的目标企业子团,包括:
18、获取历史未成交数据,并通过历史未成交数据以及所述样本集对待训练企业预测模型进行训练,以得到训练后企业预测模型;
19、通过所述训练后企业预测模型对所述若干关联企业子团进行购买意向概率预测,以通过得到的购买意向概率识别具有购买意向的目标企业子团。
20、可选的,所述通过所述训练后企业预测模型对所述若干关联企业子团进行购买意向概率预测,以通过得到的购买意向概率识别具有购买意向的目标企业子团,包括:
21、通过所述训练后企业预测模型对所述若干关联企业子团进行购买意向概率预测,以得到与所述若干关联企业子团对应的若干购买意向概率;
22、对所述若干购买意向概率进行加权平均处理,并从得到的若干处理后购买意向概率中提取概率数值大于预设概率阈值的目标购买意向概率;
23、确定与所述目标购买意向概率对应的目标企业子团,并确定与所述目标企业子团对应的目标企业。
24、第二方面,本申请公开了一种基于图算法的企业识别装置,应用于企业识别系统,包括:
25、关联子团确定模块,用于基于采集的目标企业的目标企业数据构建企业无向图,并确定所述企业无向图关联的目标企业子图,以通过预设图算法对所述目标企业子图进行社群划分,得到与所述目标企业对应的若干关联企业子团;
26、样本集生成模块,用于分别构建所述若干关联企业子团对应的若干特征信息,并基于所述若干特征信息以及历史成交数据生成样本集;
27、目标子团识别模块,用于利用所述样本集以及历史未成交数据对待训练企业预测模型进行训练,以通过得到的训练后企业预测模型对所述若干关联企业子团进行购买意向预测,以识别具有购买意向的目标企业子团。
28、第三方面,本申请公开了一种电子设备,包括:
29、存储器,用于保存计算机程序;
30、处理器,用于执行所述计算机程序以实现如前述的基于图算法的企业识别方法。
31、第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现如前述的基于图算法的企业识别方法。
32、本申请中,首先基于采集的目标企业的目标企业数据构建企业无向图,并确定所述企业无向图关联的目标企业子图,以通过预设图算法对所述目标企业子图进行社群划分,得到与所述目标企业对应的若干关联企业子团,然后分别构建所述若干关联企业子团对应的若干特征信息,并基于所述若干特征信息以及历史成交数据生成样本集,最后利用所述样本集以及历史未成交数据对待训练企业预测模型进行训练,以通过得到的训练后企业预测模型对所述若干关联企业子团进行购买意向预测,以识别具有购买意向的目标企业子团。由此可见,通过本申请的方法,需要在采集到目标企业数据后,根据目标企业数据构建企业无向图,然后确定与企业无向图对应的企业子图,并对企业子图进行划分,以得到若干关联企业子团,并且可以通过构建的特征信息生成样本集,以通过生成的样本集对待训练企业预测模型进行训练,并通过得到的训练后企业预测模型对关联企业子团进行购买意向预测,识别具有购买意向的目标企业子团。这样一来,可以通过图算法构建并筛选样本,并且可以基于构建的特征从企业的关联企业中筛选出具有购买意向的企业。
本文档来自技高网...【技术保护点】
1.一种基于图算法的企业识别方法,其特征在于,应用于企业识别系统,包括:
2.根据权利要求1所述的基于图算法的企业识别方法,其特征在于,所述基于采集的目标企业的目标企业数据构建企业无向图,包括:
3.根据权利要求1所述的基于图算法的企业识别方法,其特征在于,所述确定所述企业无向图关联的目标企业子图,以通过预设图算法对所述目标企业子图进行社群划分,得到与所述目标企业对应的若干关联企业子团,包括:
4.根据权利要求1所述的基于图算法的企业识别方法,其特征在于,所述分别构建所述若干关联企业子团对应的若干特征信息,并基于所述若干特征信息以及历史成交数据生成样本集,包括:
5.根据权利要求4所述的基于图算法的企业识别方法,其特征在于,所述基于所述历史成交数据以及所述数量特征信息、所述类别特征信息以及所述时间特征信息构建样本集,包括:
6.根据权利要求1至5任一项所述的基于图算法的企业识别方法,其特征在于,所述利用所述样本集以及历史未成交数据对待训练企业预测模型进行训练,以通过得到的训练后企业预测模型对所述若干关联企业子团进行购买意
7.根据权利要求6所述的基于图算法的企业识别方法,其特征在于,所述通过所述训练后企业预测模型对所述若干关联企业子团进行购买意向概率预测,以通过得到的购买意向概率识别具有购买意向的目标企业子团,包括:
8.一种基于图算法的企业识别装置,其特征在于,应用于企业识别系统,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于图算法的企业识别方法。
...【技术特征摘要】
1.一种基于图算法的企业识别方法,其特征在于,应用于企业识别系统,包括:
2.根据权利要求1所述的基于图算法的企业识别方法,其特征在于,所述基于采集的目标企业的目标企业数据构建企业无向图,包括:
3.根据权利要求1所述的基于图算法的企业识别方法,其特征在于,所述确定所述企业无向图关联的目标企业子图,以通过预设图算法对所述目标企业子图进行社群划分,得到与所述目标企业对应的若干关联企业子团,包括:
4.根据权利要求1所述的基于图算法的企业识别方法,其特征在于,所述分别构建所述若干关联企业子团对应的若干特征信息,并基于所述若干特征信息以及历史成交数据生成样本集,包括:
5.根据权利要求4所述的基于图算法的企业识别方法,其特征在于,所述基于所述历史成交数据以及所述数量特征信息、所述类别特征信息以及所述时间特征信息构建样本集,包...
【专利技术属性】
技术研发人员:涂昶,黄志苹,刘子星,王伟萍,徐煌,
申请(专利权)人:税友软件集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。