一种物料数据归类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37384995 阅读:10 留言:0更新日期:2023-04-27 07:25
本申请涉及数据处理技术领域,具体提供一种物料数据归类方法、装置、电子设备及存储介质,旨在提高物料数据归类效率。其中,物料数据归类方法包括:接收用户输入的关键词;基于预先训练的生成式对抗网络中的生成器为关键词生成多个近义词;其中,生成式对抗网络包括生成器和判别器,生成式对抗网络是根据判别结果和物料数据命中率训练得到的,判别结果是训练期间判别器对生成器生成的序列进行判别的结果,物料数据命中率是训练期间利用生成器生成的序列进行查询时目标物料数据的查询命中率;接收用户对近义词的选择操作,分别利用关键词和每个被选中的近义词对物料数据进行查询,将查询到的物料数据划归为一个类别。查询到的物料数据划归为一个类别。查询到的物料数据划归为一个类别。

【技术实现步骤摘要】
一种物料数据归类方法、装置、电子设备及存储介质


[0001]本申请涉及数据处理领域,具体地,涉及一种物料数据归类方法、装置、电子设备及存储介质。

技术介绍

[0002]企业为了追求高质量和高效率发展,通常会引入精细化管理理念,对企业运营期间产生的海量数据进行分类和管理。对于大型的生产型企业而言,在生产端所需管理的数据包括物料数据、产品数据、人员数据等。其中,由于大型的生产型企业针对同一物料通常会选择多个供应商,由多个供应商同时供应同一种物料,但是由于不同供应商各自对物料的命名方式或文字说明(以下统称为物料数据)存在差异,导致企业从各个供应商搜集的物料数据难以归类。
[0003]现有技术中,为了对物料数据进行归类,通常的做法是人工对关键词进行扩展,然后基于关键词和人工扩展的近义词对物料数据进行查询,然后将查询结果划归为一类。但是人工扩展近义词时需要消耗较大人力,并且人工扩展的近义词虽然可能与关键词的相似度高,但是人工扩展的近义词可能与物料数据库的关联性低,导致同一类的物料数据仅能查询出一小部分,影响物料数据的归类效率。

技术实现思路

[0004]本申请实施例中提供了一种物料数据归类方法、装置、电子设备及存储介质,旨在提高物料数据的归类效率。
[0005]根据本申请实施例的第一个方面,提供了一种物料数据归类方法,该方法包括:接收用户输入的用于查询物料数据的关键词;基于预先训练的生成式对抗网络中的生成器为关键词生成多个近义词;其中,生成式对抗网络包括生成器和判别器,生成式对抗网络是根据判别结果和物料数据命中率训练得到的,判别结果是训练期间判别器对生成器生成的序列进行判别的结果,物料数据命中率是训练期间利用生成器生成的序列进行查询时目标物料数据的查询命中率;接收用户对近义词的选择操作,分别利用关键词和每个被选中的近义词对物料数据进行查询,将查询到的物料数据划归为一个类别。
[0006]可选地,该方法还包括:根据判别结果和物料数据命中率对生成式对抗网络的生成器进行训练,并根据判别结果对生成式对抗网络的判别器进行训练。
[0007]可选地,根据判别结果和物料数据命中率对生成式对抗网络的生成器进行训练,并根据判别结果对生成式对抗网络的判别器进行训练的步骤包括:重复N次执行以下步骤S1至S3:S1.将随机噪声和样本关键词输入生成器,获得生成器生成的序列;S2.基于蒙特卡洛搜索方法对序列进行补全,得到完整序列,并通过判别器对完整序列进行判别,得到判别结果,以及根据判别结果生成奖励值;S3.利用序列对物
料数据进行查询,得到物料查询结果;计算N个奖励值的平均值,作为第一奖励值;统计N个物料查询结果对目标物料数据的查询命中率,并根据查询命中率计算第二奖励值;其中,目标物料数据是与样本关键词匹配的物料数据;根据第一奖励值的平均值和第二奖励值更新生成器,并根据第一奖励值更新判别器。
[0008]可选地,N次中的每一次执行步骤S1时,输入生成器的随机噪声是不一致的,输入生成器的样本关键词是一致的。
[0009]可选地,根据第一奖励值和第二奖励值更新生成器的步骤包括:根据第一奖励值和第二奖励值两者各自的权重,对第一奖励值和第二奖励值进行加权求和;根据加权求和结果更新生成器;其中,在训练期间,第一奖励值的权重和第二奖励值的权重随第一奖励值的变化幅度而调整,第一奖励值的变化幅度越平缓,第一奖励值的权重越小,第二奖励值的权重越大。
[0010]可选地,第一奖励值的权重随着训练轮次的增加而逐渐减小,第二奖励值的权重随着训练轮次的增加而逐渐增大,第一奖励值的权重具有预设下限值,第二奖励值的权重具有预设上限值,预设下限值与预设上限值的相加结果等于1。
[0011]可选地,该方法还包括:显示未被查询到的剩余物料数据;接收用户对剩余物料数据的手动归类操作,并根据用户对剩余物料数据的手动归类操作,将剩余物料数据划归至相应类别。
[0012]根据本申请实施例的第二个方面,提供了一种物料数据归类装置,该装置包括:关键词接收模块,用于接收用户输入的用于查询物料数据的关键词;近义词生成模块,用于基于预先训练的生成式对抗网络中的生成器为关键词生成多个近义词;其中,生成式对抗网络包括生成器和判别器,生成式对抗网络是根据判别结果和物料数据命中率训练得到的,判别结果是训练期间判别器对生成器生成的序列进行判别的结果,物料数据命中率是训练期间利用生成器生成的序列进行查询时目标物料数据的查询命中率;物料数据查询模块,用于接收用户对近义词的选择操作,分别利用关键词和每个被选中的近义词对物料数据进行查询,将查询到的物料数据划归为一个类别。
[0013]根据本申请实施例的第三个方面,提供了一种电子设备,该电子设备包括处理器、存储器及存储在存储器上并能够在处理器上运行的计算机程序,计算机程序被处理器执行时实现上述任一项所述的物料数据归类方法。
[0014]根据本申请实施例的第四个方面,提供了一种计算机可读存储介质,该存储介质上存储有计算机程序,该程序被处理器执行时实现上述任一项所述的物料数据归类方法。
[0015]采用本申请实施例中提供的物料数据归类方法,用户仅需要输入用于查询物料数据的关键词,就可以利用预先训练的生成式对抗网络中的生成器为关键词生成多个近义词,接着用户从多个近义词选择一部分或全部近义词进行查询操作,就能查询出相应的物
料数据并归类,从而有效节省物料数据归类任务所需消耗的人力,提升物料数据归类效率。并且,由于生成式对抗网络是根据判别结果和物料数据命中率训练得到的,其中,判别结果是训练期间判别器对生成器生成的序列进行判别的结果,物料数据命中率是训练期间利用生成器生成的序列进行查询时目标物料数据的查询命中率,因此利用生成式对抗网络的生成器所生成的近义词不仅与关键词的相似度高,而且与物料数据库的关联性也较,利用这些近义词进行查询时,能使得同一类的物料数据具有更高的查询命中率,进一步提升物料数据的归类效率。此外,本申请中用户需要从生成器生成的多个近义词中选择近义词对物料数据进行查询,从而能对用户行为进行约束,提升数据管理的规范性。
附图说明
[0016]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是本申请一实施例提供的物料数据归类方法的流程示意图;图2是本申请一实施例提供的SseqGAN的结构示意图;图3是本申请提供的物料归类装置的结构示意图。
[0017]图中:310关键词接收模块,320近义词生成模块,330物料数据查询模块。
具体实施方式
[0018]在介绍本公开实施例之前,应当说明的是:本公开部分实施例被描述为处理流程,虽然流程的各个操作步骤可能被冠以顺序的步骤编号,但是其中的操作步骤可以被并行地、并发地或者同时实施。
[0019]本公开实施例中可能使用了术语“第一”、“第二”等等来描述各个特征,但是这些特征不应当受这些术语限制。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种物料数据归类方法,其特征在于,所述方法包括:接收用户输入的用于查询物料数据的关键词;基于预先训练的生成式对抗网络中的生成器为所述关键词生成多个近义词;其中,所述生成式对抗网络包括所述生成器和判别器,所述生成式对抗网络是根据判别结果和物料数据命中率训练得到的,所述判别结果是训练期间所述判别器对所述生成器生成的序列进行判别的结果,所述物料数据命中率是训练期间利用所述生成器生成的序列进行查询时目标物料数据的查询命中率;接收用户对所述近义词的选择操作,分别利用所述关键词和每个被选中的近义词对物料数据进行查询,将查询到的物料数据划归为一个类别。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述判别结果和所述物料数据命中率对所述生成式对抗网络的生成器进行训练,并根据所述判别结果对所述生成式对抗网络的判别器进行训练。3.根据权利要求2所述的方法,其特征在于,所述根据所述判别结果和所述物料数据命中率对所述生成式对抗网络的生成器进行训练,并根据所述判别结果对所述生成式对抗网络的判别器进行训练的步骤包括:重复N次执行以下步骤S1至S3:S1.将随机噪声和样本关键词输入所述生成器,获得所述生成器生成的序列;S2.基于蒙特卡洛搜索方法对所述序列进行补全,得到完整序列,并通过所述判别器对所述完整序列进行判别,得到判别结果,以及根据判别结果生成奖励值;S3.利用所述序列对物料数据进行查询,得到物料查询结果;计算N个所述奖励值的平均值,作为第一奖励值;统计N个物料查询结果对目标物料数据的查询命中率,并根据所述查询命中率计算第二奖励值;其中,所述目标物料数据是与所述样本关键词匹配的物料数据;根据所述第一奖励值和所述第二奖励值更新所述生成器,并根据所述第一奖励值更新所述判别器。4.根据权利要求3所述的方法,其特征在于,所述N次中的每一次执行步骤S1时,输入所述生成器的随机噪声是不一致的,输入所述生成器的样本关键词是一致的。5.根据权利要求3所述的方法,其特征在于,所述根据所述第一奖励值和所述第二奖励值更新所述生成器的步骤包括:根...

【专利技术属性】
技术研发人员:段效亮马乐
申请(专利权)人:山东中翰软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1