分类模型确定方法、装置、设备及存储介质制造方法及图纸

技术编号：33953710 阅读：27 留言：0更新日期：2022-06-29 23:00

本申请提供的一种分类模型确定方法、装置、设备及存储介质，通过获取至少两个类别以及类别下的文本数据信息，得到原始训练集文本数据信息；对原始训练集文本数据信息进行特征处理，得到待添加的特征向量；其中，待添加的特征向量表征原始训练集文本数据信息的特征；将待添加的特征向量添加至基准分类模型中，得到校准分类模型；其中，基准分类模型是由原始训练集文本数据信息训练得到的。采用本技术方案，能够提升文本分类的精准度。能够提升文本分类的精准度。能够提升文本分类的精准度。

全部详细技术资料下载

【技术实现步骤摘要】
分类模型确定方法、装置、设备及存储介质

[0001]本申请涉及机器学习
，尤其涉及一种分类模型确定方法、装置、设备及存储介质。

技术介绍

[0002]文本分类是指对给出的文本给出一个或者多个类别标号，对文本进行比较准确或者高效地分类，文本分类常用于数据管理任务中，对于文本进行分类，可以使用户方便地浏览文本，并且可以通过文本类别来查询所需的文本。
[0003]但是，目前的文本分类采用的算法会出现分类精准度比较低的情况，因此，亟需一种文本分类算法，能够提升文本分类的精准度。

技术实现思路

[0004]本申请提供一种分类模型确定方法、装置、设备及存储介质，能够提升文本分类的精准度。
[0005]第一方面，本申请提供一种分类模型确定方法，包括：
[0006]获取至少两个类别以及所述类别下的文本数据信息，得到原始训练集文本数据信息；
[0007]对所述原始训练集文本数据信息进行特征处理，得到待添加的特征向量；其中，所述待添加的特征向量表征所述原始训练集文本数据信息的特征；
[0008]将所述待添加的特征向量添加至基准分类模型中，得到校准分类模型；其中，所述基准分类模型是由所述原始训练集文本数据信息训练得到的。
[0009]在一个示例中，对所述原始训练集文本数据信息进行特征处理，得到待添加的特征向量；其中，所述待添加的特征向量表征所述原始训练集文本数据信息的特征，包括：
[0010]对所述原始训练集文本数据信息进行文本预处理，得到文本预处理后的文本数据...

【技术保护点】

【技术特征摘要】
1.一种分类模型确定方法，其特征在于，所述方法包括：获取至少两个类别以及所述类别下的文本数据信息，得到原始训练集文本数据信息；对所述原始训练集文本数据信息进行特征处理，得到待添加的特征向量；其中，所述待添加的特征向量表征所述原始训练集文本数据信息的特征；将所述待添加的特征向量添加至基准分类模型中，得到校准分类模型；其中，所述基准分类模型是由所述原始训练集文本数据信息训练得到的。2.根据权利要求1所述的方法，其特征在于，对所述原始训练集文本数据信息进行特征处理，得到待添加的特征向量；其中，所述待添加的特征向量表征所述原始训练集文本数据信息的特征，包括：对所述原始训练集文本数据信息进行文本预处理，得到文本预处理后的文本数据信息；将文本预处理后的文本数据信息，提取至少两个特征向量，并将提取到的所述至少两个特征向量进行维度归一化处理，得到所述待添加的特征向量。3.根据权利要求2所述的方法，其特征在于，将提取到的所述至少两个特征向量进行维度归一化处理，得到所述待添加的特征向量，包括：将提取到的所述至少两个特征向量输入至前馈层，通过所述前馈层对所述至少两个特征向量进行维度归一化处理，得到所述待添加的特征向量。4.根据权利要求1
‑
3中任一项所述的方法，其特征在于，所述方法还包括：将所述原始训练集文本数据信息输入至所述校准分类模型中，通过所述分类校准模型输出每一个类别的调和平均值；根据所述每一个类别的调和平均值，确定调和平均值的均值；其中，所述调和平均值的均值用于表征所述校准分类模型的准确度。5.根据权利要求4所述的方法，其特征在于，通过所述分类校准模型输出每一个类别的调和平均值，包括：通过所述分类校准模型输...

【专利技术属性】
技术研发人员：刘建国，王迪，朱毅，
申请(专利权)人：海尔智家股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人