一种市民热线工单智能派单方法技术

技术编号：40263316 阅读：7 留言：0更新日期：2024-02-02 22:52

本发明专利技术属于工单派单技术领域，提供了一种市民热线工单智能派单方法，包括：数据预处理单元、筛选派单单元、文本规则挖掘派单单元和训练单元，所述数据预处理单元用于对不同分类规则等工单数据进行分类整合，所述文本规则挖掘派单单元用于对不符合特殊工单的情况，进行文本规则挖掘派单；通过业务规则分类方法，并根据工单涉及的业务类别分别构建深度学习分类模型，对认定的特殊工单直接派发，不符合直接派发的工单按照工单内容特征进行分类，若工单满足该类提取出的规则，直接根据规则输出派单结果，否则将工单输入该类别下的自训练的分类模型后得到派单结果；实现了工单的智能派发，从而无需人工进行分配，提升了派单效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于工单派单，更具体地说是一种根据市民热线工单内容进行智能派单的方法。

技术介绍

1、随着社会发展，由于市民诉求内容复杂多变、单位职责交叉、主责部门种类多、部门工单数量分布不均衡、工单特征不明显等特点，基于规则的分类方式会随着工单特征的变化不断调整，导致后期维护成本高，例如关键词等规则。基于传统的机器学习方法，对于复杂工单的特征提取效果较差；以及工单的数量以及复杂度提升，导致人工派单成本上升，同时还存在派单效率等方面的问题，亟需一种采用文本分类技术的智能派单方法能够实现派单工作的降本增效。

技术实现思路

1、本专利技术提供一种市民热线工单智能派单方法，通过对原始工单数据进行合适的预处理，并用对复杂任务学习能力更强的深度学习模型代替传统机器学习模型，设计出一套适用于市民热线派发的模型，用于缓解上述
技术介绍
中提到的问题。

2、本专利技术具体的技术方案如下：

3、一种市民热线工单智能派单方法，所述智能派单方法步骤如下：

4、s1：建立智能派单系统，通过系统对市民热线中获取的工单数据进行预处理，根据不同的数据类型进行划分并用标签标记，对相似的部门工单用相同的标签标记；

5、s2：特殊工单筛选，对于含有特殊字符的工单进行直接派单；

6、s3：文本规则挖掘派单，通过建立文本规则，对分类的工单按照文本规则进行提取，记录所有规则形成规则库；

7、s4：训练系统模型进行派单，对不符合s2和s3中派单方式的，训练派单系统模型进行单独派单；

8、s5：智能派单，根据分类号的工单，系统根据工单的类型自动选择s2、s3和s4中任意一种的派单方式进行派单。

9、作为本专利技术的一种技术方案，智能派单系统包括：

10、数据预处理单元，所述数据预处理单元用于对不同分类规则、特性以及不同的主责部门的工单数据进行分类整合，并对相同或相似的主责部门工单数据进行合并，以相同的标签进行标记；

11、筛选派单单元，所述筛选派单单元用于筛选出需要单独处理的特殊工单；

12、文本规则挖掘派单单元，所述文本规则挖掘派单单元用于对不符合特殊工单的情况，进行文本规则挖掘派单；

13、训练单元，所述训练单元对不符合所述筛选派单单元和所述文本规则挖掘派单单元的情况，根据不同类别的工单进行训练，学习派单方式。

14、作为本专利技术的一种技术方案，所述数据预处理单元根据工单内容特征进行划分，重点字段包括：工单编号、工单内容、工单地址、工单所述类别和主责部门；

15、设数据预处理单元中的训练数据为t，训练数据t中的任意文本有其工单内容特征f＝{f1,f2,...}(例如是否包含某些关键词；文本长度等)、工单所属类别l＝{l1,l2,...}(例如噪音扰民、经济纠纷等)和主责部门d＝{d1,d2,...}(例如住建局、卫健委等)，根据其文本特征f，将原始数据分为使每一类数据集中数据的工单内容特征相同,例如根据工单诉求将工单分为咨询、投诉、表扬三类；或者根据工单内容是否涉及重大事件将工单分为涉及与不涉及两类。

16、智能派单的目的就是将工单文本t分派到部门职能吻合的部门d上，但是由于地域性的影响，有些部门虽然名称编号不同，但是职能类似且处理的工单也一样，例如a街道办事处与b街道办事处，不易直接进行分类；在训练分类模型时，这些数据会影响模型准确率，故将具有相似职能的部门进行合并，以相同的标签代替，在最终的派单结果中再根据工单中的地址、部门级别等信息进行还原，合并完成后主责部门集合变为d′＝{d′1,d′2,d′3,...}。

17、作为本专利技术的一种技术方案，所述文本规则挖掘派单单元中的文本规则定义方式如下：

18、根据所述数据预处理单元中分类的数据，设定数据集合ti＝{t1,t2,...}，文本ti为集合ti中的第i个文本，其自身类别为lm、主责部门为d′n，形成lm―d′n关系对，所有以lm开头、d′n结尾的关系对数量为card(lm―d′n)，仅以lm开头的关系对数量为card(lm―d′)，其提取条件为为：

19、

20、记录满足上述条件的lm―d′n关系为分类规则，在进行智能派单时，将属于集合ti内所有lm类别的工单直接分到部门d′n，记录所有规则进而构建成规则库。

21、作为本专利技术的一种技术方案，所述训练单元针对不同类型的数据集合t1、t2等，选用bert+softmax作为分类模型进行训练。

22、作为本专利技术的一种技术方案，所述训练单元的训练步骤分为：

23、(1)数据集划分，训练划分过程中保证每个部门下的工单数量相同；对每个部门抽取相同数量的工单设x件，若该部门下的工单数量大于x，则进行随机抽样；若该部门下工单数量小于等于x，则通过同义词替换、随机交换词序、随机删除词、随机插入词等手段对原始数据进行文本增强，在扩充后的数据中抽取x条；其中x的具体取值根据每个类别下数据分布情况确定；

24、(2)输入表示转换，将对划分好的训练集ti中所有文本t进行切词和去通用词等预处理操作，同时设置文本最大长度lmax，对于那些长度len(t)超出的lmax的文本，截取该文本的前lmax个词；利用训练好的bert预训练模型对预处理后的文本数据集ti进行向量化，得到每条文本的词向量表达随后将词向量输入bert中tokenembedding层、segment embedding层和position embedding层，分别得到向量编码v1、句子编码v2和位置编码v3，最后将v1、v2和v3相加输入到双向transformer层中，得到最终的文本特征表达s。

25、(3)fi ne-tuni ng微调，使用训练数据对bert模型进行微调：将bert模型的输出传入一个全连接层，然后使用激活函数将其映射到一个低维的中间特征向量，最后通过softmax分类器将中间特征向量映射到每个结果标签的概率分布；

26、(4)损失计算与优化，使用交叉熵损失函数计算预测结果与实际结果之间的差异，并通过反向传播算法更新模型参数，直到模型收敛；

27、(5)预测，在模型训练完成后，使用该模型进行分类时，模型接收工单文本信息，输入的文本经过与训练过程预处理步骤和输入表示转换后，将其输入到bert模型得到中间特征向量，再通过softmax分类器得到预测结果概率分布，模型最终输出工单派往各个部门的概率。

28、与现有技术相比，本专利技术具有如下有益效果：

29、1、本专利技术通过摒弃单一文本分类的方法，定制一套业务规则分类方法，并根据工单涉及的业务类别分别构建深度学习分类模型，综合实现工单的智能派发，提升派单效率和降低了派单成本。

30、2、本专利技术通过设计一种让智能派单准确率更高的方案，针对目前该领域派单分类方法单一、准确率不高等情况，根据市民热线表单内容，首先对认定的特殊工单直接派发，不符本文档来自技高网...

【技术保护点】

1.一种市民热线工单智能派单方法，其特征在于，所述智能派单方法步骤如下：

2.如权利要求1所述市民热线工单智能派单系统，其特征在于，智能派单系统包括：

3.如权利要求2所述市民热线工单智能派单方法，其特征在于：所述数据预处理单元根据工单内容特征进行划分，重点字段包括：工单编号、工单内容、工单地址、工单所述类别和主责部门。

4.如权利要求2所述市民热线工单智能派单方法，其特征在于：所述文本规则挖掘派单单元中的文本规则定义方式如下：

5.如权利要求4所述市民热线工单智能派单方法，其特征在于：所述训练单元针对不同类型的数据集合T1、T2等，选用bert+softmax作为分类模型进行训练。

6.如权利要求5所述市民热线工单智能派单方法，其特征在于：所述训练单元的训练步骤分为：

【技术特征摘要】

1.一种市民热线工单智能派单方法，其特征在于，所述智能派单方法步骤如下：

2.如权利要求1所述市民热线工单智能派单系统，其特征在于，智能派单系统包括：

4.如权利...

【专利技术属性】
技术研发人员：易黎，孙士琦，杨灿，张薇，薛璐璐，
申请(专利权)人：上海烽烁科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人