一种改进型基因表达式编程-模糊C均值作物数据分类方法技术

技术编号：13625179 阅读：84 留言：0更新日期：2016-09-01 18:37

本发明专利技术公开了一种改进型基因表达式编程‑模糊C均值作物数据分类方法，使用自定义的相似度衡量计算公式并结合信息熵，计算作物数据属性的权值向量；使用加权的距离计算公式替代传统的欧式距离，并将基因表达式编程与模糊C均值算法相结合求出最佳的聚类中心对作物数据进行分类。本发明专利技术一方面能够更好地对作物数据间的距离进行衡量，大大提高分类结果的准确率；另一方面，能够以更少的迭代次数获得最佳的分类结果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及农业信息学领域，具体涉及一种改进型基因表达式编程-模糊C均值作物数据分类方法，适用于特征用实数描述的各种作物信息的分类或识别。
技术介绍
作物数据样本的分类或识别对于作物学研究和农业生产管理具有重要意义。聚类是实现分类与识别的主要方法，而在众多的聚类算法中，模糊C均值聚类(FCM)“Dunn J C.A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters[J].1973,3(3):32-57”因其算法简单且收敛速度快而被广泛使用，但使用欧式距离无法很好对多维数据进行距离衡量，同时容易陷入局部极值，所以分类准确率需要进一步提高。聚类的样本数据集往往具有多个描述属性的特征，每个特征对于样本被成功聚类的贡献程度有所不同，此时使用欧式距离或余弦相似度进行距离计算就略显不足。目前的改进思路大都是通过引入信息熵的概念设置权值，并对FCM中的距离计算式进行改写，如“王国伟,闫丽,姚玉霞.基于熵权法加权的模糊C均值聚类算法研究[J].农业网络信息,2010(8):148-150.”，聚类效果较用欧式距离时略有提高，但未考虑求解过程中的耗时问题。FCM算法采用梯度法求解极值，结果往往是局部最优，而得不到全局最优解。群体智能优化算法能够同时设定多组可行解，在求解过程中个体间相互影响、共同优化，不断趋近最优解，因而将FCM与此类算法结合是解决全局寻优的一种可行办法，例如专利“毛力,李引.基于量子粒子群优化改进的模糊C-均值聚类...

【技术保护点】
一种改进型基因表达式编程‑模糊C均值作物数据分类方法，其特征是按如下步骤进行：步骤1：将待分类的作物数据集合记为X＝{x1,x2,…,xi,…,xn}；xi表示第i个作物数据；且xi＝{xi1,xi2,…,xik,…,xip}；xik表示第i个作物数据的第k个属性；1≤i≤n；1≤k≤p；利用式(1)计算第i个作物数据xi与第j个作物数据xj之间的相似度si,j：si,j=e-d(xi,xj)p×μi,j---(1)]]>式(1)中，μi,j表示第i个作物数据xi与第j个作物数据xj之间的标准偏差；p表示作物数据属性的个数；d(xi,xj)表示第i个作物数据xi与第j个作物数据xj之间的距离，并有：d(xi,xj)=Σe=1p(xie,xje)m---(2)]]>式(2)中，m＝2或3；xie表示第i个作物数据的第e个属性；xje表示第j个作物数据的第e个属性；步骤2、利用式(3)计算第i个作物数据xi与第j个作物数据xj之间的信息熵Hi,j：Hi,j=-1ln2[si,j×lnsi,j+(1-si,j)×ln(1-si,...

【技术特征摘要】
1.一种改进型基因表达式编程-模糊C均值作物数据分类方法，其特征是按如下步骤...

【专利技术属性】
技术研发人员：江朝晖，李婷婷，闵文芳，饶元，马友华，
申请(专利权)人：安徽农业大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人