一种混合GK聚类的红外光谱茶叶优劣鉴别方法技术

技术编号：15187071 阅读：224 留言：0更新日期：2017-04-19 04:18

本发明专利技术公开一种茶叶检测技术中混合GK聚类的红外光谱茶叶优劣鉴别方法，用线性判别分析法对压缩后的训练样本学习得到包含鉴别信息的训练样本和测试样本，对包含鉴别信息的测试样本运行模糊C均值聚类，得到初始模糊隶属度和初始聚类中心，先计算模糊散射矩阵和模糊隶属度值，再计算出典型值，根据典型值计算出聚类中心，分别计算包含鉴别信息的训练样本的平均值到测试样本的聚类中心的欧式距离，若聚类中心到训练茶叶的平均值的欧式距离最小则判定该聚类中心所属茶叶品种和这种训练样本的茶叶品种是相同品种，根据模糊隶属度值判定测试样本所属茶叶和类别；本发明专利技术将典型值增加进入函数中，可以大幅度降低处理噪声数据时出错的概率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及茶叶检测技术，具体涉及基于GK聚类和红外光谱技术的茶叶优劣鉴别方法。
技术介绍
在茶叶检测中，红外光谱检测是一种快速无损检测分析技术，常用中红外光谱仪检测茶叶，中红外光谱的波数范围在4000cm-1～400cm-1之间，大多数的无机化合物和有机化合物的化学键振动的基频均在此区域。不同的分子中官能团、化合物的类别和化合物的立体结构，其红外吸收光谱不尽相同。中红外光谱技术以其方便、快速、高效、无损、低成本等特点成为检测食品和药品的有效检测技术。常见的聚类方法有两种：硬聚类方法和软(模糊)聚类方法，硬聚类方法应用于聚类边界明显的情况；对于聚类边界不是很清晰的情况采用模糊聚类方法则更为合适，例如常用的模糊C均值聚类。GK聚类方法是由Gustafson和Kessel提出的一种聚类方法(见文献GustafsonDE,KesselWC.Fuzzyclusteringwithfuzzycovariancematrix[C]//ProceedingsoftheIEEECDC,SanDiego,1979:761～766)，目的是将数据集按照某种相似准则划分为若干个子集，通过聚类方法将大批数据分类为许多本质联系的簇；对于模糊C均值聚类未考虑数据集的结构这一缺陷进行了改进，采用模糊协方差矩阵对簇形状的距离测度具有局部自适应性，可以聚类多种簇形状的数据集。但是传统的GK聚类方法在聚类含噪声数据时，聚类准确率会因噪声数据而受到很大影响。而在用中红外光谱仪检测茶叶过程中会产生噪声信号，所采集得到的中红外光谱含有噪声信号，由于GK聚类方法对噪声敏感，因而在处理含噪声的茶叶...
一种混合GK聚类的红外光谱茶叶优劣鉴别方法

【技术保护点】
一种混合GK聚类的红外光谱茶叶优劣鉴别方法，采集茶叶样本红外光谱，将茶叶样本分为训练样本和测试样本，预处理茶叶样本红外光谱，然后压缩红外光谱数据，用线性判别分析法对压缩后的训练样本学习得到包含鉴别信息的训练样本和测试样本，对包含鉴别信息的测试样本运行模糊C均值聚类，得到初始模糊隶属度uik,0和初始聚类中心v0,0，其特征是还依序包括以下步骤：A、先计算第r次迭代时第i类的模糊散射矩阵Sfi,r和第r次迭代时的模糊隶属度值uik,r，再计算出第r次迭代时第k个测试样本隶属于第i类的典型值为第r‑1次迭代时测试样本xk到聚类中心vi,r‑1的距离范数，d为测试样本的维数，r为迭代次数，c为茶叶类别数，1≤i≤c，1≤k≤n，n为测试样本数；B、根据典型值tik,r计算出第r次迭代时的第i类的聚类中心m是权重指数值；C、计算所述包含鉴别信息的训练样本的平均值，再分别计算平均值到测试样本的聚类中心νi,r的欧式距离，若聚类中心到训练茶叶的平均值的欧式距离最小则判定该聚类中心所属茶叶品种和这种训练样本的茶叶品种是相同品种；D、根据模糊隶属度值uik,r判定测试样本xk所属茶叶和类别，若uik,...

【技术特征摘要】
1.一种混合GK聚类的红外光谱茶叶优劣鉴别方法，采集茶叶样本红外光谱，将茶叶样本分为训练样本和测试样本，预处理茶叶样本红外光谱，然后压缩红外光谱数据，用线性判别分析法对压缩后的训练样本学习得到包含鉴别信息的训练样本和测试样本，对包含鉴别信息的测试样本运行模糊C均值聚类，得到初始模糊隶属度uik,0和初始聚类中心v0,0，其特征是还依序包括以下步骤：A、先计算第r次迭代时第i类的模糊散射矩阵Sfi,r和第r次迭代时的模糊隶属度值uik,r，再计算出第r次迭代时第k个测试样本隶属于第i类的典型值为第r-1次迭代时测试样本xk到聚类中心vi,r-1的距离范数，d为测试样本的维数，r为迭代次数，c为茶叶类别数，1≤i≤c，1≤k≤n，n为测试样本数；B、根据典型值tik,r计算出第r次迭代时的第i类的聚类中心m是权重指数值；C、计算所述包含鉴别信息的训练样本的平均值，再分别计算平均值到测试样本的聚类中心νi,r的欧式距离，若聚类中心到训练茶叶的平均值的欧式距离最小则判定该聚类中心所属茶叶品种和这种训练样本的茶叶品种是相同品...

【专利技术属性】
技术研发人员：武小红，陈博文，武斌，孙俊，田潇瑜，戴春霞，杨梓耘，张伟，
申请(专利权)人：江苏大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人