【技术实现步骤摘要】
本专利技术涉及一种基于混沌灰狼优化的支持向量机方法,属于计算机科学领域。
技术介绍
目前网格搜索和梯度下降是支持向量机(SVM)最常用的两种参数优化方法。网格搜索是一种穷举搜索方法,它一般是通过设置合理的区间上下限和间隔步长对指定参数空间进行划分,然后对每个网格节点代表的参数组合进行训练和预测,将这些预测结果中取值最高的一组参数作为最终SVM模型的最佳参数。这种穷举式搜索方法虽然在一定程度上能保证得到给定参数空间内最优的参数组合,然而随着参数空间增大,其搜索效率会大大降低,特别是设置合理的区间和间隔步长值往往非常困难,从而大大降低了其可行性,而且模型也非常容易陷入局部最优值。梯度下降方法的一个主要缺点是它对初始值非常敏感,当初始参数设置离最优解非常远的时候,模型很容易收敛到局部最优解。近年来,基于元启发式的搜索算法凭借其独特的全局寻优能力而受到了学术和工业界的广泛关注,它们被普遍认为比传统寻优方法具有更大的机会找到全局最优解。目前已经提出多种基于元启发式算法的SVM训练算法来处理参数优化问题。因为SVM在具体应用时,其性能主要受核函数及自由参数影响。SVM中常用的核函数一般包括线性核函数、多项式核函数、径向基(RBF)核函数和sigmoid核函数等。在实际应用中,一般情况下选择基于RBF核函数的SVM。RBF核SVM主要涉及两个重要的参数C和γ。C是惩罚因子,它用于控制对错分样本惩罚的程度,起到控制训练误差和模型复杂度之间平衡的作用;C值越小,则对数据中误判样本的惩罚也越小,使得训练误差变大,因此结构风险也变大。相反,C值越大,对错分样本的约束程度就越大 ...
【技术保护点】
一种基于混沌灰狼优化的支持向量机方法,包括如下步骤:步骤1:收集待研究问题相关的数据;步骤2:利用公式(1)进行对收集数据进行标准化;si′=si-sminsmax-smin---(1)]]>式中,Si代表原始值,Si’代表标准化后的值,Smin代表极小值,Smax代表极大值;步骤3:利用混沌灰狼算法优化支持向量机的惩罚系数C和核宽γ;步骤4:基于步骤3获取的惩罚系数C和核宽γ值,构建下述公式(2)的识别模型f(x),其中的K(xi,xj)的具体形式如公式(3)所示,其中γ即为核宽,xj表示待测样本,xi(i=1...l)表示与支持向量对应的训练样本,yi(i=1...l)表示与上述训练样本对应的标签,b为阈值,αi是拉格朗日系数,sgn为符号函数;f(x)=sgn[g(x)]=sgn(Σi=1IaiyiK(xi,xj)+b)---(2)]]>K(xi,xj)=exp(‑γ|xi‑xj||2) (3)步骤5:基于步骤4所构建的模型对待分类样本进行分类和预测。
【技术特征摘要】
1.一种基于混沌灰狼优化的支持向量机方法,包括如下步骤:步骤1:收集待研究问题相关的数据;步骤2:利用公式(1)进行对收集数据进行标准化;si′=si-sminsmax-smin---(1)]]>式中,Si代表原始值,Si’代表标准化后的值,Smin代表极小值,Smax代表极大值;步骤3:利用混沌灰狼算法优化支持向量机的惩罚系数C和核宽γ;步骤4:基于步骤3获取的惩罚系数C和核宽γ值,构建下述公式(2)的识别模型f(x),其中的K(xi,xj)的具体形式如公式(3)所示,其中γ即为核宽,xj表示待测样本,xi(i=1...l)表示与支持向量对应的训练样本,yi(i=1...l)表示与上述训练样本对应的标签,b为阈值,αi是拉格朗日系数,sgn为符号函数;f(x)=sgn[g(x)]=sgn(Σi=1IaiyiK(xi,xj)+b)---(2)]]>K(xi,xj)=exp(-γ|xi-xj||2)(3)步骤5:基于步骤4所构建的模型对待分类样本进行分类和预测。2.根据权利要求1所述的基于混沌灰狼优化的支持向量机方法,其特征在于,步骤3包括如下子步骤:步骤3.1:参数初始化,包括对最大迭代次数T、灰狼群体中狼的头数n、C的搜索空间[Cmin,Cmax]和γ的搜索空间[γmin,γmax]进行初始化;步骤3.2:灰狼位置混沌初始化:首先随机产生第一只灰狼的位置X1=(x11,x12),然后从现存的混沌映射函数(公式(4))中选择一种合适的映射(Logistic映射)获得n-1只灰狼的位置,其中每只灰狼i的位置为Xi=(xi1,xi2);采用公式(5)将每一只灰狼的位置映射到设定的搜索范围内得到n只灰狼的位置X’i=(x’i1,x’i2)(i=1...n),其中x’i1表示灰狼i在当前位置时的C值,x’i2表示灰狼i在当前位置时的γ值;其中a1是小于b1的值,且Z’i∈[a1,b1];计算每只灰狼i的适应度fi,该适应度基于灰狼i当前位置的C和γ值,以内部K折交叉验证策略计算支持向量机的准确度ACC,并将该值作为灰狼i的适应度fi的值,将适应度fi由大到小排序,接着将适应度排在前三的三只狼的适应度值保存为向量F_best(fa,fb,fc)且将其位置作为三只头狼的位置,保存为P_best(X’a,X’b,X’c)并参照公式(10)至公式(19)对灰狼的位置进行更新,获得n只灰狼的位置X”i=(x”i1,x”i2)(i=1...n),采用公式(5)将每一只灰狼的位置映射到设定的搜索范围内得到n只灰狼的初始位置Xi_Initialization=(xi1,xi2)(i=1...n),至此灰狼位置混沌初始化完成;其中a,b,c的范围在[1,n]之间,ACC是基于K折交叉验证获取的平均准确度,根据公式(6)计算获得,其中acck表示每一折数据上计算获得的准确度;Z(i+1)=μ·Z(i)·(1-Z(i))(4)Z’i=a1+(b1-a1)·Zi(5)ACC=ΣK1acckK---(6)]]>步骤3.3:采取和步骤3.2中相同的C和γ编码方式后以内部K折交叉验证策略计算每一只...
【专利技术属性】
技术研发人员:陈慧灵,王名镜,赵学华,李强,沈立明,王科杰,蔡振闹,童长飞,
申请(专利权)人:温州大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。