【技术实现步骤摘要】
一种基于稳健双深度支持向量回归的葡萄酒质量预测方法
[0001]本专利技术涉及一种人工智能领域,特别涉及一种基于稳健双深度支持向量回归的葡萄酒质量预测方法。
技术介绍
[0002]随着大数据的快速发展以及分类和回归算法的应用在现实世界中,如智能诊断,基因数据分类,人脸识别,流行病学预测,在收集的数据中总是不可避免地包含噪声或异常值,它们对模型性能的影响值得深入研究。数据集中的噪声或异常值直接影响了模型的泛化性能和分类精度。因此,如何处理含有噪声或异常值的数据集,以及如何设计具有强鲁棒性和高精度的模型是尤为重要的。
[0003]稳健回归是统计学稳健估计中的一类方法,其主要思路是在经典最小二乘回归的基础上降低模型对噪声或异常值的敏感度。现有研究中,专利CN113792748A公开了一种基于特征提取和双支持向量机的分类器创建方法及装置,通过对数据集中的样本进行特征提取,从而优化不同的任务,对各样本数据进行模糊化处理,以降低所述训练样本集中噪声或异常值对所属分类的隶属度,同时通过引入松弛变量平衡训练数据中的噪声或异常值的约束条件,以减小样本中噪声或异常值带来的影响;该研究忽略了样本点相对位置所提供的信息,而在模式识别中,测量每个样本点之间的相对位置是非常有意义的。专利CN108876001A公开了一种基于双支持向量机的短期电力负荷预测方法,将数据集中的样本分为训练集和测试集,对用于参数优化的训练集进行归一化处理,对归一化处理后的样本数据使用LBSA优化DW
‑
TSVR参数,最后采用基于LBSA参数优 ...
【技术保护点】
【技术特征摘要】
1.一种基于稳健双深度支持向量回归的葡萄酒质量预测方法,其特征在于:步骤如下:S1:葡萄酒数据集划分为训练集、测试集;S2:对训练集与测试集中的非挥发性酸度、挥发性酸度、柠檬酸浓度、残留糖浓度、氯化物浓度、游离二氧化硫浓度、总二氧化硫浓度、葡萄酒密度、pH值、硫酸盐浓度、酒精浓度进行预处理,分别获得训练集样本矩阵与测试集样本矩阵;S3:针对训练集和测试集中每个葡萄酒样本进行标记,标记出该葡萄酒样本的质量评分;S4:计算训练集和测试集中每个样本点的平均深度,分别获得训练集与测试集中所有样本点的平均深度;S5:TDSVR模型训练;S5.1:将训练集样本矩阵、训练集的质量评分和训练集中所有样本点的平均深度分别输入TDSVR模型,进行TDSVR模型训练;S5.2:利用拉格朗日乘子法和K.K.T条件求解TDSVR模型的模型参数,获得两个超平面,进而获得上界函数f1(x)与下界函数f2(x),并以此获得回归函数,完成TDSVR模型训练;S6:TDSVR模型测试;S6.1:测试集样本矩阵、测试集的质量评分和测试集中所有样本点的平均深度分别输入回归函数进行预测;获得均方误差RMSE,以及拟合优度R2;S6.2:利用网格搜索法调节TDSVR模型的模型参数,由网格搜索法筛选出均方误差RMSE最小且拟合优度R2最大的TDSVR模型的模型参数,最终生成TDSVR最优模型;S7:将测试集样本矩阵和测试集中所有样本点的平均深度分别输入TDSVR最优模型进行预测,输出葡萄酒质量预测评分,获得预测均方误差RMSE和预测拟合优度R2,进而判断TDSVR最优模型的预测精度。2.根据权利要求1所述的一种基于稳健双深度支持向量回归的葡萄酒质量预测方法,其特征在于:所述步骤S4中,平均深度的计算如下:设样本点x=(x1,x2···
,x
i
···
x
n
),x
i
∈R,R表示实数集;样本点x中的元素可以按升序排列得到如下顺序:x
(1)
,x
(2)
···
,x
(i)
···
x
(n)
,因此x
(i)
的升秩等于i;对于任意的x
i
,它的升秩可以表示为同理,若样本点中的元素按照降序排列,x
i
的降秩等于利用深度可同时描述元素的升秩和降秩,x
i
在样本点x=(x1,x2···
,x
i
···
x
n
)中x
i
的深度等于x
i
的升秩与降秩中的最小值,具体如下:对于包含n个特征和m个样本的数据集中第i个样本点的平均深度计算如下:其中,X∈R
m
×
n
,R
m
×
n
表示实数矩阵,所述样本点为行向量,表示第i个样本点中的第j列的深度。3.根据权利要求2所述的一种基于稳健双深度支持向量回归的葡萄酒质量预测方法,
其特征在于:步骤S5中TDSVR模型根据线性函数建立,TDSVR模型具体如下:TDSVR1:s.t(Aω1+eb1)
‑
(Y
‑
e∈1)≤ξ1,ξ1≥0TDSVR2:s.t(Y+e∈2)
‑<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。