分阶段质检的数据分类方法、装置、设备及存储介质制造方法及图纸

技术编号:28126910 阅读:20 留言:0更新日期:2021-04-19 11:42
本发明专利技术涉及人工智能技术领域,公开了分阶段质检的数据分类方法、装置、设备及存储介质,用于解决质检数据不均衡的问题,从而提高质检的准确率。分阶段质检的数据分类方法包括:获取待质检数据,待质检数据为文本数据;将待质检数据输入第一阶段的违规数据识别模型中,生成二分类数据,第一阶段的违规数据识别模型为二分类模型;根据二分类数据对待质检数据添加头部标识符和尾部标识符,并输入第二阶段的违规数据分类模型中结合注意力机制进行违规数据分类,生成违规类型数据,第二阶段的违规数据分类模型为BERT模型;将违规类型数据传输至目标终端,目标终端为发出待质检数据的终端。此外,本发明专利技术还涉及区块链技术,待质检数据可存储于区块链中。存储于区块链中。存储于区块链中。

【技术实现步骤摘要】
分阶段质检的数据分类方法、装置、设备及存储介质


[0001]本专利技术涉及神经网络
,尤其涉及一种分阶段质检的数据分类方法、装置、设备及存储介质。

技术介绍

[0002]各行业产品的销售机构通常要通过录音、录像等技术手段采集视听资料、电子数据,从而记录和保存各行业产品销售过程中的关键环节,以便实现销售行为可回放、重要信息可查询、问题责任可确认的效果。在对这种记录销售过程进行质检时,存在速度慢、成本高的问题。因此很多公司引入计算机技术对销售过程的行为进行质检。
[0003]很多公司引入人工智能技术,从而实现业务数据实时对接、话术实时自动拼接、实时智能质检、后台话术模板自由配置,有效助力各行业交易规范化,提升各行业的经营效益。但是,在采用人工智能模型进行实时智能质检时,由于违规数据与无违规数据存在不均衡的问题,从而导致质检的准确率较低。

技术实现思路

[0004]本专利技术提供了一种分阶段质检的数据分类方法、装置、设备及存储介质,用于解决质检数据不均衡的问题,从而提高质检的准确率。
[0005]本专利技术第一方面提供了一种分阶段质检的数据分类方法,包括:获取待质检数据,所述待质检数据为文本数据;将所述待质检数据输入第一阶段的违规数据识别模型中,生成二分类数据,所述第一阶段的违规数据识别模型为二分类模型;根据所述二分类数据对所述待质检数据添加头部标识符和尾部标识符,并输入第二阶段的违规数据分类模型中,结合注意力机制进行违规数据分类,生成违规类型数据,所述第二阶段的违规数据分类模型为BERT模型;将所述违规类型数据传输至目标终端,所述目标终端为发出所述待质检数据的终端。
[0006]可选的,在本专利技术第一方面的第一种实现方式中,所述将所述待质检数据输入第一阶段的违规数据识别模型中,生成二分类数据,所述第一阶段的违规数据识别模型为二分类模型包括:将所述待质检数据输入第一阶段的违规数据识别模型,在循环神经网络中对所述待质检数据进行特征提取,生成第一文本特征向量,所述第一阶段的违规数据识别模型为二分类模型;将所述第一文本特征向量输入全连接层中,结合激活函数,生成二分类数据。
[0007]可选的,在本专利技术第一方面的第二种实现方式中,所述将所述待质检数据输入第一阶段的违规数据识别模型,在循环神经网络中对所述待质检数据进行特征提取,生成第一文本特征向量,所述第一阶段的违规数据识别模型为二分类模型包括:将所述待质检数据输入第一阶段的违规数据识别模型中,结合预置的向量空间模型生成文本向量矩阵,所述第一阶段的违规数据识别模型为二分类模型;将所述文本向量矩阵输入循环神经网络中结合激活函数进行特征提取,生成第一文本特征向量。
[0008]可选的,在本专利技术第一方面的第三种实现方式中,所述将所述第一文本特征向量输入全连接层中,结合激活函数,生成二分类数据包括:将所述第一文本特征向量输入全连接层中进行特征加权,生成文本分类得分;结合激活函数对所述文本分类得分进行计算,生成目标分类概率,并基于所述目标分类概率确定二分类数据。
[0009]可选的,在本专利技术第一方面的第四种实现方式中,所述根据所述二分类数据对所述待质检数据添加头部标识符和尾部标识符,并输入第二阶段的违规数据分类模型中,结合注意力机制进行违规数据分类,生成违规类型数据,所述第二阶段的违规数据分类模型为BERT模型包括:判断所述二分类数据是否为违规数据;若所述二分类数据为违规数据,则对所述待质检数据添加头部标识符和尾部标识符,并输入第二阶段的违规数据分类模型,结合注意力机制进行违规数据分类,生成违规类型数据,所述第二阶段的违规数据分类模型为BERT模型。
[0010]可选的,在本专利技术第一方面的第五种实现方式中,所述若所述二分类数据为违规数据,则对所述待质检数据添加头部标识符和尾部标识符,并输入第二阶段的违规数据分类模型,结合注意力机制进行违规数据分类,生成违规类型数据,所述第二阶段的违规数据分类模型为BERT模型包括:若所述二分类数据为违规数据,则为所述待质检数据添加头部标识符和尾部标识符,生成处理后的待质检数据;将所述处理后的待质检数据输入第二阶段的违规数据分类模型,生成第二文本特征向量,所述第二文本特征向量包括多个单词特征向量;分别读取每两个相邻单词特征向量的向量距离,得到多个向量距离;结合注意力机制将所述多个向量距离转换为1,并结合所述头部标识符和所述尾部标识符对所述第二文本特征向量进行违规数据分类,生成违规类型数据。
[0011]可选的,在本专利技术第一方面的第六种实现方式中,在所述获取待质检数据,所述待质检数据为文本数据之前,所述分阶段质检的数据分类方法还包括:获取第一阶段训练数据以及第二阶段训练数据,所述第一阶段训练数据为二类标签数据,所述第二阶段训练数据为多类标签数据;采用所述第一阶段训练数据进行模型训练,生成第一阶段的违规数据识别模型,并采用所述第二阶段训练数据进行模型训练,生成第二阶段的违规数据分类模型。
[0012]本专利技术第二方面提供了一种分阶段质检的数据分类装置,包括:获取模块,用于获取待质检数据,所述待质检数据为文本数据;违规数据识别模块,用于将所述待质检数据输入第一阶段的违规数据识别模型中,生成二分类数据,所述第一阶段的违规数据识别模型为二分类模型;违规数据分类模块,用于根据所述二分类数据对所述待质检数据添加头部标识符和尾部标识符,并输入第二阶段的违规数据分类模型中,结合注意力机制进行违规数据分类,生成违规类型数据,所述第二阶段的违规数据分类模型为BERT模型;传输模块,用于将所述违规类型数据传输至目标终端,所述目标终端为发出所述待质检数据的终端。
[0013]可选的,在本专利技术第二方面的第一种实现方式中,所述违规数据识别模块包括:特征提取单元,用于将所述待质检数据输入第一阶段的违规数据识别模型,在循环神经网络中对所述待质检数据进行特征提取,生成第一文本特征向量,所述第一阶段的违规数据识别模型为二分类模型;二分类数据生成单元,用于将所述第一文本特征向量输入全连接层中,结合激活函数,生成二分类数据。
[0014]可选的,在本专利技术第二方面的第二种实现方式中,所述特征提取单元还可以具体
用于:将所述待质检数据输入第一阶段的违规数据识别模型中,结合预置的向量空间模型生成文本向量矩阵,所述第一阶段的违规数据识别模型为二分类模型;将所述文本向量矩阵输入循环神经网络中结合激活函数进行特征提取,生成第一文本特征向量。
[0015]可选的,在本专利技术第二方面的第三种实现方式中,二分类数据生成单元还可以具体用于:将所述第一文本特征向量输入全连接层中进行特征加权,生成文本分类得分;结合激活函数对所述文本分类得分进行计算,生成目标分类概率,并基于所述目标分类概率确定二分类数据。
[0016]可选的,在本专利技术第二方面的第四种实现方式中,违规数据分类模块包括:判断单元,用于判断所述二分类数据是否为违规数据;违规数据分类单元,若所述二分类数据为违规数据,则用于对所述待质检数据添加头部标识符和尾部标识符,并输入第二阶段的违本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分阶段质检的数据分类方法,其特征在于,所述分阶段质检的数据分类方法包括:获取待质检数据,所述待质检数据为文本数据;将所述待质检数据输入第一阶段的违规数据识别模型中,生成二分类数据,所述第一阶段的违规数据识别模型为二分类模型;根据所述二分类数据对所述待质检数据添加头部标识符和尾部标识符,并输入第二阶段的违规数据分类模型中,结合注意力机制进行违规数据分类,生成违规类型数据,所述第二阶段的违规数据分类模型为BERT模型;将所述违规类型数据传输至目标终端,所述目标终端为发出所述待质检数据的终端。2.根据权利要求1所述的分阶段质检的数据分类方法,其特征在于,所述将所述待质检数据输入第一阶段的违规数据识别模型中,生成二分类数据,所述第一阶段的违规数据识别模型为二分类模型包括:将所述待质检数据输入第一阶段的违规数据识别模型,在循环神经网络中对所述待质检数据进行特征提取,生成第一文本特征向量,所述第一阶段的违规数据识别模型为二分类模型;将所述第一文本特征向量输入全连接层中,结合激活函数,生成二分类数据。3.根据权利要求2所述的分阶段质检的数据分类方法,其特征在于,所述将所述待质检数据输入第一阶段的违规数据识别模型,在循环神经网络中对所述待质检数据进行特征提取,生成第一文本特征向量,所述第一阶段的违规数据识别模型为二分类模型包括:将所述待质检数据输入第一阶段的违规数据识别模型中,结合预置的向量空间模型生成文本向量矩阵,所述第一阶段的违规数据识别模型为二分类模型;将所述文本向量矩阵输入循环神经网络中结合激活函数进行特征提取,生成第一文本特征向量。4.根据权利要求2所述的分阶段质检的数据分类方法,其特征在于,所述将所述第一文本特征向量输入全连接层中,结合激活函数,生成二分类数据包括:将所述第一文本特征向量输入全连接层中进行特征加权,生成文本分类得分;结合激活函数对所述文本分类得分进行计算,生成目标分类概率,并基于所述目标分类概率确定二分类数据。5.根据权利要求1所述的分阶段质检的数据分类方法,其特征在于,所述根据所述二分类数据对所述待质检数据添加头部标识符和尾部标识符,并输入第二阶段的违规数据分类模型中,结合注意力机制进行违规数据分类,生成违规类型数据,所述第二阶段的违规数据分类模型为BERT模型包括:判断所述二分类数据是否为违规数据;若所述二分类数据为违规数据,则对所述待质检数据添加头部标识符和尾部标识符,并输入第二阶段的违规数据分类模型,结合注意力机制进行违规数据分类,生成违规类型数据,所述第二阶段的违规数据分类模型为BERT模型。6.根据权利要求5所述的分阶段...

【专利技术属性】
技术研发人员:赵焕丽徐国强
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1