当前位置: 首页 > 专利查询>西南大学专利>正文

一种基于稳健双深度支持向量回归的葡萄酒质量预测方法技术

技术编号:39325111 阅读:7 留言:0更新日期:2023-11-12 16:03
本发明专利技术公开了一种基于稳健双深度支持向量回归的葡萄酒质量预测方法,在双支持向量回归模型中引入平均深度建立稳健双深度支持向量回归模型,即TDSVR模型,并用于葡萄酒质量的预测,采用十折交叉验证方法进行实验,利用TDSVR模型获得均方误差RMSE与拟合优度R2;基于网格搜索法调节模型参数,生成TDSVR最优模型;最后利用TDSVR最优模型再次对测试集进行预测与对比,获得预测精度,实现葡萄酒质量的预测。本发明专利技术的有益效果是:充分利用样本点的相对位置信息,解决双支持回归向量中噪声和异常值导致的误差问题,改善总体趋势的拟合程度;同时实现风险结构最小化,获得更为完善的向量回归模型,成功地提高了向量回归模型的鲁棒性。棒性。棒性。

【技术实现步骤摘要】
一种基于稳健双深度支持向量回归的葡萄酒质量预测方法


[0001]本专利技术涉及一种人工智能领域,特别涉及一种基于稳健双深度支持向量回归的葡萄酒质量预测方法。

技术介绍

[0002]随着大数据的快速发展以及分类和回归算法的应用在现实世界中,如智能诊断,基因数据分类,人脸识别,流行病学预测,在收集的数据中总是不可避免地包含噪声或异常值,它们对模型性能的影响值得深入研究。数据集中的噪声或异常值直接影响了模型的泛化性能和分类精度。因此,如何处理含有噪声或异常值的数据集,以及如何设计具有强鲁棒性和高精度的模型是尤为重要的。
[0003]稳健回归是统计学稳健估计中的一类方法,其主要思路是在经典最小二乘回归的基础上降低模型对噪声或异常值的敏感度。现有研究中,专利CN113792748A公开了一种基于特征提取和双支持向量机的分类器创建方法及装置,通过对数据集中的样本进行特征提取,从而优化不同的任务,对各样本数据进行模糊化处理,以降低所述训练样本集中噪声或异常值对所属分类的隶属度,同时通过引入松弛变量平衡训练数据中的噪声或异常值的约束条件,以减小样本中噪声或异常值带来的影响;该研究忽略了样本点相对位置所提供的信息,而在模式识别中,测量每个样本点之间的相对位置是非常有意义的。专利CN108876001A公开了一种基于双支持向量机的短期电力负荷预测方法,将数据集中的样本分为训练集和测试集,对用于参数优化的训练集进行归一化处理,对归一化处理后的样本数据使用LBSA优化DW

TSVR参数,最后采用基于LBSA参数优化的DW

TSVR算法,在测试数据集上进行DW

TSVR模型的验证,计算短期电力负荷的预测结果。该研究并未考虑数据集中可能存在的噪声或离群值对回归结果造成的误差
[0004]现有技术的缺点是:缺少样本点相对位置的信息;数据集中存在的噪声或异常值使回归结果产生误差。

技术实现思路

[0005]针对现有技术存在的问题,本专利技术的目的在于提供一种解决双支持向量回归方法中噪声和异常值导致的误差问题,同时实现结构风险最小化的基于稳健双深度支持向量回归的葡萄酒质量预测方法。
[0006]其技术方案如下:
[0007]一种基于稳健双深度支持向量回归的葡萄酒质量预测方法,其关键在于:步骤如下:
[0008]S1:葡萄酒数据集划分为训练集、测试集;
[0009]S2:对训练集与测试集中的非挥发性酸度、挥发性酸度、柠檬酸浓度、残留糖浓度、氯化物浓度、游离二氧化硫浓度、总二氧化硫浓度、葡萄酒密度、pH值、硫酸盐浓度、酒精浓度进行预处理,分别获得训练集样本矩阵与测试集样本矩阵;
[0010]S3:针对训练集和测试集中每个葡萄酒样本进行标记,标记出该葡萄酒样本的质量评分;
[0011]S4:计算训练集和测试集中每个样本点的平均深度,分别获得训练集与测试集中所有样本点的平均深度;
[0012]S5:TDSVR模型训练;
[0013]S5.1:将训练集样本矩阵、训练集的质量评分和训练集中所有样本点的平均深度分别输入TDSVR模型,进行TDSVR模型训练;
[0014]S5.2:利用拉格朗日乘子法和K.K.T条件求解TDSVR模型的模型参数,获得两个超平面,进而获得上界函数f1(x)与下界函数f2(x),并以此获得回归函数,完成TDSVR模型训练;
[0015]S6:TDSVR模型测试;
[0016]S6.1:测试集样本矩阵、测试集的质量评分和测试集中所有样本点的平均深度分别输入回归函数进行预测;获得均方误差RMSE,以及拟合优度R2;
[0017]S6.2:利用网格搜索法调节TDSVR模型的模型参数,由网格搜索法筛选出均方误差RMSE最小且拟合优度R2最大的TDSVR模型的模型参数,最终生成TDSVR最优模型;
[0018]S7:将测试集样本矩阵和测试集中所有样本点的平均深度分别输入TDSVR最优模型进行预测,输出葡萄酒质量预测评分,获得预测均方误差RMSE和预测拟合优度R2,进而判断TDSVR最优模型的预测精度。
[0019]在双支持向量回归模型中引入平均深度建立TDSVR模型并用于葡萄酒质量的预测,采用十折交叉验证方法进行实验,利用TDSVR模型获得均方误差RMSE与拟合优度R2;利用均方误差RMSE的均值和方差以及拟合优度R2的均值和方差来评估模型的效果;基于网格搜索法调节模型参数,生成TDSVR最优模型;最后利用TDSVR最优模型对测试集进行预测,获得预测均方误差RMSE和预测拟合优度R2,进而判断TDSVR最优模型的预测精度。
[0020]进一步地:所述步骤S4中,平均深度的计算如下:
[0021]设样本点x=(x1,x2···
,x
i
···
x
n
),x
i
∈R,R表示实数集,x
i
表示第i个特征对应的数据,样本点x中的元素可以按升序排列得到如下顺序:x
(1)
,x
(2)
···
,x
(i)
···
x
(n)
,因此x
(i)
的升秩等于i;对于任意的x
i
,它的升秩可以表示为R
xi|x
;同理,若样本点中的元素按照降序排列,x
i
的降秩等于n+1

R
xi|x
;利用深度可同时描述元素的升秩和降秩,x
i
在样本点x=(x1,x2···
,x
i
···
x
n
)中x
i
的深度等于x
i
的升秩与降秩中的最小值,具体如下:
[0022][0023]对于包含n个特征和m个样本的数据集中第i个样本点的平均深度计算如下:
[0024][0025]其中,X∈R
m
×
n
,R
m
×
n
表示实数矩阵,所述样本点为行向量,表示第i个样本点中的第j列的深度
[0026]具体地:步骤S5中线性TDSVR模型根据线性函数建立,TDSVR模型具体如下:
[0027]TDSVR1:
[0028][0029]s.t(Aω1+eb1)

(Y

e∈1)≤ξ1,ξ1≥0
[0030]TDSVR2:
[0031][0032]s.t(Y+e∈2)

(Aω2+eb2)≤ξ2,ξ2≥0
[0033][0034]其中,Y代表葡萄酒的质量评分,A为样本矩阵,表示样本矩阵A中第i个样本点的平均深度,d
A
表示深度比率向量,表示平均深度比率,m1表示矩阵A的行数;ω1,ω2为两个超平面的超平面参数,b1,b2为两个超平面的截距;C本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于稳健双深度支持向量回归的葡萄酒质量预测方法,其特征在于:步骤如下:S1:葡萄酒数据集划分为训练集、测试集;S2:对训练集与测试集中的非挥发性酸度、挥发性酸度、柠檬酸浓度、残留糖浓度、氯化物浓度、游离二氧化硫浓度、总二氧化硫浓度、葡萄酒密度、pH值、硫酸盐浓度、酒精浓度进行预处理,分别获得训练集样本矩阵与测试集样本矩阵;S3:针对训练集和测试集中每个葡萄酒样本进行标记,标记出该葡萄酒样本的质量评分;S4:计算训练集和测试集中每个样本点的平均深度,分别获得训练集与测试集中所有样本点的平均深度;S5:TDSVR模型训练;S5.1:将训练集样本矩阵、训练集的质量评分和训练集中所有样本点的平均深度分别输入TDSVR模型,进行TDSVR模型训练;S5.2:利用拉格朗日乘子法和K.K.T条件求解TDSVR模型的模型参数,获得两个超平面,进而获得上界函数f1(x)与下界函数f2(x),并以此获得回归函数,完成TDSVR模型训练;S6:TDSVR模型测试;S6.1:测试集样本矩阵、测试集的质量评分和测试集中所有样本点的平均深度分别输入回归函数进行预测;获得均方误差RMSE,以及拟合优度R2;S6.2:利用网格搜索法调节TDSVR模型的模型参数,由网格搜索法筛选出均方误差RMSE最小且拟合优度R2最大的TDSVR模型的模型参数,最终生成TDSVR最优模型;S7:将测试集样本矩阵和测试集中所有样本点的平均深度分别输入TDSVR最优模型进行预测,输出葡萄酒质量预测评分,获得预测均方误差RMSE和预测拟合优度R2,进而判断TDSVR最优模型的预测精度。2.根据权利要求1所述的一种基于稳健双深度支持向量回归的葡萄酒质量预测方法,其特征在于:所述步骤S4中,平均深度的计算如下:设样本点x=(x1,x2···
,x
i
···
x
n
),x
i
∈R,R表示实数集;样本点x中的元素可以按升序排列得到如下顺序:x
(1)
,x
(2)
···
,x
(i)
···
x
(n)
,因此x
(i)
的升秩等于i;对于任意的x
i
,它的升秩可以表示为同理,若样本点中的元素按照降序排列,x
i
的降秩等于利用深度可同时描述元素的升秩和降秩,x
i
在样本点x=(x1,x2···
,x
i
···
x
n
)中x
i
的深度等于x
i
的升秩与降秩中的最小值,具体如下:对于包含n个特征和m个样本的数据集中第i个样本点的平均深度计算如下:其中,X∈R
m
×
n
,R
m
×
n
表示实数矩阵,所述样本点为行向量,表示第i个样本点中的第j列的深度。3.根据权利要求2所述的一种基于稳健双深度支持向量回归的葡萄酒质量预测方法,
其特征在于:步骤S5中TDSVR模型根据线性函数建立,TDSVR模型具体如下:TDSVR1:s.t(Aω1+eb1)

(Y

e∈1)≤ξ1,ξ1≥0TDSVR2:s.t(Y+e∈2)
‑<...

【专利技术属性】
技术研发人员:王华敏徐佳敏
申请(专利权)人:西南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1