工单数据处理方法、装置、服务器及可读存储介质制造方法及图纸

技术编号:32877123 阅读:46 留言:0更新日期:2022-04-02 12:09
本申请提供一种工单数据处理方法、装置、服务器及可读存储介质。该方法包括:服务器可以以固定周期从工单管理系统中获取在当前周期内生成的工单数据集合。服务器可以获取每一工单数据对应的关键词集合。服务器可以根据所述工单数据、所述工单数据的所述关键词集合和所述业务词库,确定所述关键词集合中每一述关键词的目标权重。服务器可以根据该关键词集合和每一关键词的权重,确定该工单向量的工单向量集合。服务器可以将这些工单向量与聚类中心集合中的聚类中心进行匹配,确定这些工单数据是否属于该聚类中心集合中的类别。本申请的方法,提高了工单数据的分类准确率,提高工单数据的处理效率。据的处理效率。据的处理效率。

【技术实现步骤摘要】
工单数据处理方法、装置、服务器及可读存储介质


[0001]本申请涉及计算机领域,尤其涉及一种工单数据处理方法、装置、服务器及可读存储介质。

技术介绍

[0002]在通信领域中,工单通常应用于设备的维修或者维护。面对这些工单,除了需要合理派发,对这些工单进行复盘也是极其重要的。
[0003]在工单复盘过程中,对工单进行分类是其中重要的一环。现有技术中,工单管理系统通常需要人工完成对工单数据的分类和统计。
[0004]显然,现在有技术存在工单数据的处理效率低的问题。

技术实现思路

[0005]本申请提供一种工单数据处理方法、装置、服务器及可读存储介质,用以解决现在有技术中工单数据的处理效率低的问题。
[0006]第一方面,本申请提供一种工单数据处理方法,包括:
[0007]获取工单数据集合,并根据业务词库和停用词库对所述工单数据集合中的每一工单数据进行分词,得到所述工单数据的关键词集合;
[0008]根据所述工单数据、所述工单数据的所述关键词集合和所述业务词库,确定所述关键词集合中每一述关键词的目标权重;
[0009]根据所述工单数据的所述关键词集合和所述关键词集合中每一所述关键词的目标权重,确定所述工单数据的工单向量;
[0010]使用预设聚类算法和聚类中心集合,对所述工单向量进行聚类分析,确定所述工单向量对应的工单数据的所属类别,所述聚类中心集合中包括至少一个聚类中心,每一所述聚类中心对应于一个类别。
[0011]可选地,所述对所述工单数据进行分词,得到所述工单数据的多个关键词,包括:
[0012]使用业务词库对所述工单数据进行分词,得到所述工单数据的关键词集合;
[0013]使用停用词库对所述工单数据的关键词集合进行数据清洗。
[0014]可选地,所述根据所述工单数据、所述工单数据的所述关键词和所述业务词库,确定每一所述关键词的目标权重,包括:
[0015]根据每一所述关键词在所述工单数据中的词频和逆向文件频率,确定每一所述关键词的第一权重;
[0016]根据每一所述关键词与所述业务词库中业务词的匹配程度,确定每一所述关键词的第二权重;
[0017]根据每一所述关键词在所述工单数据中的位置,确定每一所述关键词的第三权重;
[0018]根据预设系数、所述第一权重、所述第二权重和所述第三权重,确定每一所述关键
词的目标权重。
[0019]可选地,所述方法,还包括:
[0020]当所述工单向量不属于所述聚类中心集合中任一类别时,计算所述工单向量所属类别的聚类中心,并将所述聚类中心添加到所述聚类中心集合中。
[0021]可选地,所述方法,还包括:
[0022]当所述工单是数据的一关键词不在业务词库中时,将所述关键词作为新的业务词添加到所述业务词库中。
[0023]可选地,所述方法,还包括:
[0024]根据业务词库中每一业务词的出现频率,确定所述业务词的活跃值;
[0025]当一业务词的活跃频率连续两次小于预设阈值时,删除所述业务词。
[0026]可选地,使用预设聚类算法和聚类中心集合,对所述工单向量进行聚类分析之前,所述方法,还包括:
[0027]获取工单样本集,所述工单样本集中包括每一所述工单数据的工单向量和类别标签;
[0028]使用预设聚类算法对所述工单向量和所述类型标签进行聚类,得到聚类中心集合,所述聚类中心集合中包括至少一个聚类中心。
[0029]第二方面,本申请提供一种工单数据处理装置,包括:
[0030]获取模块,用于获取工单数据集合,并根据业务词库和停用词库对所述工单数据集合中的每一工单数据进行分词,得到所述工单数据的关键词集合;
[0031]处理模块,用于根据所述工单数据、所述工单数据的所述关键词集合和所述业务词库,确定所述关键词集合中每一述关键词的目标权重;根据所述工单数据的所述关键词集合和所述关键词集合中每一所述关键词的目标权重,确定所述工单数据的工单向量;使用预设聚类算法和聚类中心集合,对所述工单向量进行聚类分析,确定所述工单向量对应的工单数据的所属类别,所述聚类中心集合中包括至少一个聚类中心,每一所述聚类中心对应于一个类别。
[0032]可选地,所述处理模块,具体用于:
[0033]使用业务词库对所述工单数据进行分词,得到所述工单数据的关键词集合;
[0034]使用停用词库对所述工单数据的关键词集合进行数据清洗。
[0035]可选地,所述处理模块,具体用于:
[0036]根据每一所述关键词在所述工单数据中的词频和逆向文件频率,确定每一所述关键词的第一权重;
[0037]根据每一所述关键词与所述业务词库中业务词的匹配程度,确定每一所述关键词的第二权重;
[0038]根据每一所述关键词在所述工单数据中的位置,确定每一所述关键词的第三权重;
[0039]根据预设系数、所述第一权重、所述第二权重和所述第三权重,确定每一所述关键词的目标权重。
[0040]可选地,所述处理模块,还用于:
[0041]当所述工单向量不属于所述聚类中心集合中任一类别时,计算所述工单向量所属
类别的聚类中心,并将所述聚类中心添加到所述聚类中心集合中。
[0042]可选地,所述处理模块,还用于:
[0043]当所述工单是数据的一关键词不在业务词库中时,将所述关键词作为新的业务词添加到所述业务词库中。
[0044]可选地,所述处理模块,还用于:
[0045]根据业务词库中每一业务词的出现频率,确定所述业务词的活跃值;
[0046]当一业务词的活跃频率连续两次小于预设阈值时,删除所述业务词。
[0047]可选地,所述处理模块,还用于:
[0048]获取工单样本集,所述工单样本集中包括每一所述工单数据的工单向量和类别标签;
[0049]使用预设聚类算法对所述工单向量和所述类型标签进行聚类,得到聚类中心集合,所述聚类中心集合中包括至少一个聚类中心。
[0050]第三方面,本申请提供一种服务器,包括:存储器和处理器;
[0051]所述存储器用于存储计算机程序;所述处理器用于根据所述存储器存储的计算机程序执行第一方面及第一方面任一种可能的设计中的工单数据处理方法。
[0052]第四方面,本申请提供一种可读存储介质,可读存储介质中存储有计算机程序,当服务器的至少一个处理器执行该计算机程序时,服务器执行第一方面及第一方面任一种可能的设计中的工单数据处理方法。
[0053]第五方面,本申请提供一种计算机程序产品,所述计算机程序产品包括计算机程序,当服务器的至少一个处理器执行该计算机程序时,服务器执行第一方面及第一方面任一种可能的设计中的工单数据处理方法。
[0054]本申请提供的工单数据处理方法,通过以固定周期从工单管理系统中获取在当前周期内生成的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种工单数据处理方法,其特征在于,所述方法包括:获取工单数据集合,并根据业务词库和停用词库对所述工单数据集合中的每一工单数据进行分词,得到所述工单数据的关键词集合;根据所述工单数据、所述工单数据的所述关键词集合和所述业务词库,确定所述关键词集合中每一述关键词的目标权重;根据所述工单数据的所述关键词集合和所述关键词集合中每一所述关键词的目标权重,确定所述工单数据的工单向量;使用预设聚类算法和聚类中心集合,对所述工单向量进行聚类分析,确定所述工单向量对应的工单数据的所属类别,所述聚类中心集合中包括至少一个聚类中心,每一所述聚类中心对应于一个类别。2.根据权利要求1所述的方法,其特征在于,所述对所述工单数据进行分词,得到所述工单数据的多个关键词,包括:使用业务词库对所述工单数据进行分词,得到所述工单数据的关键词集合;使用停用词库对所述工单数据的关键词集合进行数据清洗。3.根据权利要求1所述的方法,其特征在于,所述根据所述工单数据、所述工单数据的所述关键词和所述业务词库,确定每一所述关键词的目标权重,包括:根据每一所述关键词在所述工单数据中的词频和逆向文件频率,确定每一所述关键词的第一权重;根据每一所述关键词与所述业务词库中业务词的匹配程度,确定每一所述关键词的第二权重;根据每一所述关键词在所述工单数据中的位置,确定每一所述关键词的第三权重;根据预设系数、所述第一权重、所述第二权重和所述第三权重,确定每一所述关键词的目标权重。4.根据权利要求1

3中任一项所述的方法,其特征在于,所述方法,还包括:当所述工单向量不属于所述聚类中心集合中任一类别时,计算所述工单向量所属类别的聚类中心,并将所述聚类中心添加到所述聚类中心集合中。5.根据权利要求1

3中任一项所述的方...

【专利技术属性】
技术研发人员:闫慎悦戚勇王铮王金钗李铁军
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1