类别预测方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号:33466855 阅读:18 留言:0更新日期:2022-05-19 00:45
本申请公开了一种类别预测方法、装置、计算机设备及计算机可读存储介质,涉及人工智能技术领域,通过实际供销关系构建拓扑网络,计算拓扑网络的邻接矩阵、结构相似度矩阵和皮尔逊相似度进而得到最终的相似度矩阵,有效提高了模型在类别预测中的效率和准确率。所述方法包括:在多个目标工单数据中,提取已知购买目标产品的产品类型的目标工单数据作为样本数据,将提取后剩余的目标工单数据作为待预测数据;依据所述样本数据构建样本拓扑网络,依据所述待预测数据构建测试拓扑网络;计算所述样本拓扑网络的样本相似度矩阵,对所述样本相似度矩阵进行非负矩阵分解,得到类别预测模型;将所述测试拓扑网络输入至所述类别预测模型,得到预测类别结果。得到预测类别结果。得到预测类别结果。

【技术实现步骤摘要】
类别预测方法、装置、计算机设备及计算机可读存储介质


[0001]本申请涉及人工智能
,特别是涉及一种类别预测方法、装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]随着互联网技术的不断进步,复合型农业经济的不断发展,农业从事着往往同时经营着多种农产品,如牲畜、水产、农作物等。农业从事者往往因此具有多种或特定某种农险产品的购买倾向。
[0003]相关技术中,保险销售平台会派遣相关工作人员实地获取农业从事者的经营信息,进而为农业从事者推荐合适的险种。或者使用大数据的方式调取工单信息,得到农业从事者的实际经营信息,依据实际经营信息建立预测模型对未购买保险产品的农业从事者进行险种预测,实现定向推销。
[0004]在实现本申请的过程中,专利技术人发现相关技术中至少存在以下技术问题:
[0005]利用农业从事者的实际经营信息进行预测,往往只能预测出农业从事者已经购买的产品,导致现有机器学习模型进行类别预测输出的预测结果的效率和准确率低。

技术实现思路

[0006]有鉴于此,本申请提供了一种类别预测方法、装置、计算机设备及计算机可读存储介质,主要目的在于解决目前利用农业从事者的实际经营信息进行预测,只能预测出与实际经营相关的产品类别,难以揭示不同农业从事者潜在的需求属性,进而导致现有机器学习模型进行类别预测输出的预测结果准确率低的问题。
[0007]依据本申请第一方面,提供了一种类别预测方法,该方法包括:
[0008]在多个目标工单数据中,提取已知购买目标产品的产品类型的目标工单数据作为样本数据,将提取后剩余的目标工单数据作为待预测数据;
[0009]依据所述样本数据构建样本拓扑网络,依据所述待预测数据构建测试拓扑网络;
[0010]计算所述样本拓扑网络的样本相似度矩阵,对所述样本相似度矩阵进行非负矩阵分解,得到类别预测模型,所述样本相似度矩阵是将所述样本拓扑网络的邻接矩阵、结构相似度矩阵和皮尔逊相似度矩阵按照预设权重进行加权相加得到;
[0011]将所述测试拓扑网络输入至所述类别预测模型,得到预测类别结果。
[0012]可选地,所述依据所述样本数据构建样本拓扑网络,依据所述待预测数据构建测试拓扑网络;,包括:
[0013]分别提取所述样本数据和所述待预测数据对应的人员信息作为样本人员信息和待预测人员信息,将所述样本人员信息和所述待预测人员信息进行聚合,得到目标人员信息;
[0014]对所述目标人员信息进行数据识别,得到不同人员之间的供销关系,将所述人员作为网络节点,为存在所述供销关系的网络节点构建关联边,得到多个目标工单数据的目
标拓扑网络;
[0015]在所述目标拓扑网络中提取所述样本人员信息对应的样本网络节点和所述样本网络节点在所述目标拓扑网络中存在的样本关联边,聚合所述样本网络节点和所述样本关联边,得到所述样本拓扑网络;
[0016]在所述目标拓扑网络中选取所述待预测人员信息对应的待预测网络节点和所述待预测网络节点在所述目标拓扑网络中存在的待预测关联边,聚合所述外预测网络节点和所述待预测关联边,得到所述待预测拓扑网络。
[0017]可选地,计算所述样本拓扑网络的邻接矩阵,包括:
[0018]对所述样本拓扑网络中的样本网络节点进行编号,提取第一目标编号的第一目标网络节点和第二目标网络节点,所述第一目标编号是取值为任意的两个数值编号;
[0019]在所述样本拓扑网络中查询所述第一目标网络节点和所述第二目标网络节点的目标关联边,若所述第一目标网络节点和所述第二目标网络节点之间存在所述目标关联边,则设置所述第一目标网络节点和所述第二目标网络节点之间的邻接数值为第一预设数值,若所述第一目标网络节点和所述第二目标网络节点之间不存在所述目标关联边,则设置所述第一目标网络节点和所述第二目标网络节点之间的邻接数值为第二预设数值;
[0020]遍历所述样本网络节点,得到所述样本拓扑网络的邻接矩阵。
[0021]可选地,计算所述结构相似度矩阵,包括:
[0022]基于图元统计算法,统计得出所述样本拓扑网络中全部样本网络节点的自轨道向量,得到多个自轨道向量;
[0023]对所述多个自轨道向量中每个自轨道向量的向量数列进行数列编号,提取指定数列编号对应的指定数列值,得到多个指定数列值,所述指定数列编号的取值为任意数值;
[0024]计算所述多个指定数列值的指定向量均值和指定向量方差;
[0025]对所述样本拓扑网络中的网络节点进行编号,提取第二目标编号的第三目标网络节点和第四目标网络节点,所述第二目标编号是取值为任意的两个数值编号;
[0026]在所述第三目标网络节点的自轨道向量中提取所述指定数列编号对应的第一目标数列值,计算所述第一目标数列值与所述指定向量均值的差值,计算所述差值与所述指定向量方差的向量比值;
[0027]遍历所述第一目标网络节点的自轨道向量的向量数列,计算每个所述向量数列的向量比值,得到多个向量比值;
[0028]将所述多个向量比值作为所述第一目标网络节点的第一统计自轨道向量;
[0029]在所述第二目标网络节点的自轨道向量中提取所述指定数列编号对应的第二目标数列值,计算所述第二目标数列值与所述指定向量均值的差值,计算所述差值与所述指定向量方差的向量比值;
[0030]遍历所述第二目标节点的自轨道向量的向量数列,计算每个所述向量数列的向量比值,得到多个向量比值,将所述多个向量比值作为所述第二目标网络节点的第二统计自轨道向量;
[0031]计算所述第一统计自轨道向量和所述第二统计自轨道向量的余弦值,将所述余弦值作为所述第一目标网络节点与所述第二目标网络节点之间的结构相似性值;
[0032]遍历所述样本拓扑网络中的网络节点,得到多个结构相似性值,将所述多个结构
相似性值作为所述样本拓扑网络的结构相似度矩阵。
[0033]可选地,计算所述皮尔逊相似度矩阵,包括:
[0034]对所述样本拓扑网络中的网络节点进行编号,提取第三目标编号的第五目标网络节点和第六目标网络节点,所述第三目标编号是取值为任意的两个数值编号;
[0035]查询所述样本拓扑网络中所述网络节点的节点信息,统计供给类型的网络节点数量、购买类型的网络节点数量、所述第五目标网络节点对应的第一邻居节点的第一节点数量和所述第六目标网络节点对应的第二邻居节点的第二节点数量;
[0036]计算所述供给类型的网络节点数量与第一系数的第一乘积,计算所述第一节点数量和所述第二节点数量的乘积,将所述乘积与所述第一乘积相减,得到向量差值,所述第一系数为所述第一邻居节点和所述第二邻居节点的交集的数量;
[0037]计算所述乘积、第二系数和第三系数的第二乘积,计算所述第二乘积的开方,计算所述向量差值与所述开方的比值,将所述比值作为所述第一目标网络节点与所述第二目标网络节点之间的皮尔逊相似值,所述第二系数为所述供给类型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种类别预测方法,其特征在于,包括:在多个目标工单数据中,提取已知购买目标产品的产品类型的目标工单数据作为样本数据,将提取后剩余的目标工单数据作为待预测数据;依据所述样本数据构建样本拓扑网络,依据所述待预测数据构建测试拓扑网络;计算所述样本拓扑网络的样本相似度矩阵,对所述样本相似度矩阵进行非负矩阵分解,得到类别预测模型,所述样本相似度矩阵是将所述样本拓扑网络的邻接矩阵、结构相似度矩阵和皮尔逊相似度矩阵按照预设权重进行加权相加得到;将所述测试拓扑网络输入至所述类别预测模型,得到预测类别结果。2.根据权利要求1所述的方法,其特征在于,所述依据所述样本数据构建样本拓扑网络,依据所述待预测数据构建测试拓扑网络,包括:分别提取所述样本数据和所述待预测数据对应的人员信息作为样本人员信息和待预测人员信息,将所述样本人员信息和所述待预测人员信息进行聚合,得到目标人员信息;对所述目标人员信息进行数据识别,得到不同人员之间的供销关系,将所述人员作为网络节点,为存在所述供销关系的网络节点构建关联边,得到多个目标工单数据的目标拓扑网络;在所述目标拓扑网络中提取所述样本人员信息对应的样本网络节点和所述样本网络节点在所述目标拓扑网络中存在的样本关联边,聚合所述样本网络节点和所述样本关联边,得到所述样本拓扑网络;在所述目标拓扑网络中选取所述待预测人员信息对应的待预测网络节点和所述待预测网络节点在所述目标拓扑网络中存在的待预测关联边,聚合所述外预测网络节点和所述待预测关联边,得到所述待预测拓扑网络。3.根据权利要求1所述的方法,其特征在于,计算所述样本拓扑网络的邻接矩阵,包括:对所述样本拓扑网络中的样本网络节点进行编号,提取第一目标编号的第一目标网络节点和第二目标网络节点,所述第一目标编号是取值为任意的两个数值编号;在所述样本拓扑网络中查询所述第一目标网络节点和所述第二目标网络节点的目标关联边,若所述第一目标网络节点和所述第二目标网络节点之间存在所述目标关联边,则设置所述第一目标网络节点和所述第二目标网络节点之间的邻接数值为第一预设数值,若所述第一目标网络节点和所述第二目标网络节点之间不存在所述目标关联边,则设置所述第一目标网络节点和所述第二目标网络节点之间的邻接数值为第二预设数值;遍历所述样本网络节点,得到所述样本拓扑网络的邻接矩阵。4.根据权利要求1所述的方法,其特征在于,计算所述结构相似度矩阵,包括:基于图元统计算法,统计得出所述样本拓扑网络中全部样本网络节点的自轨道向量,得到多个自轨道向量;对所述多个自轨道向量中每个自轨道向量的向量数列进行数列编号,提取指定数列编号对应的指定数列值,得到多个指定数列值,所述指定数列编号的取值为任意数值;计算所述多个指定数列值的指定向量均值和指定向量方差;对所述样本拓扑网络中的网络节点进行编号,提取第二目标编号的第三目标网络节点和第四目标网络节点,所述第二目标编号是取值为任意的两个数值编号;在所述第三目标网络节点的自轨道向量中提取所述指定数列编号对应的第一目标数
列值,计算所述第一目标数列值与所述指定向量均值的差值,计算所述差值与所述指定向量方差的向量比值;遍历所述第一目标网络节点的自轨道向量的向量数列,计算每个所述向量数列的向量比值,得到多个向量比值;将所述多个向量比值作为所述第一目标网络节点的第一统计自轨道向量;在所述第二目标网络节点的自轨道向量中提取所述指定数列编号对应的第二目标数列值,计算所述第二目标数列值与所述指定向量均值的差值,计算所述差值与所述指定向量方差的向量比值;遍历所述第二目标节点的自轨道向量的向量数列,计算每个所述向量数列的向量比值,得到多个向量比值,将所述多个向量比值作为所述第二目标网络节点的第二统计自轨道向量;计算所述第一统计自轨道向量和所述第二统计自轨道向量的余弦值,将所述余弦值作为所述第一目标网络节点与所述第二目标网络节点之间的结构相似性值;遍历所述样本拓扑网络中的网络节点,得到多个结构相似性值,将所述多个结构相似性值作为所述样本拓扑网络...

【专利技术属性】
技术研发人员:陈雪娇
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1