【技术实现步骤摘要】
本专利技术涉及一种玉米良种选育方法。
技术介绍
聚类是一种常见的数据分析工具,是指用数学的方法研究和处理给定对象,是多 元统计分析的一种。基于物以类聚的思想,它把大量数据点的集合分成若干类或簇,使 得每个类中的数据之间最大程度地相似,而不同类中的数据最大程度地不同,从而发现全 局的分布模式以及数据属性之间的相互关系。聚类分析的一个突出特点是处理巨大、复杂 的数据集,而且还可作为其他算法的预处理步骤。目前常用的聚类算法还有k-平均、k-模、 k-中心点、DIANA、 AGNES、 STING、 COBWEB等。 这些经典的聚类算法只能处理简单的、一般的数据,对于大型的、复杂的数据集效 果欠佳,于是很多改进的和新的算法不断被提出。比如,有文献提出了一种进化的基于多中 心的动态聚类算法,其中簇的数目不用预先制定,对于不同的簇可选择多个中心点,且由两 个目标函数进行评估,提高了算法对于具有特殊特性和特殊分布的数据集的应用;CUZ算 法改进了代表点的计算,不仅能有效地鉴别非圆形、非矩形形状的数据,还可以处理表面非 凸起形状的簇;GriDBSCAN算法通过在数据空间构造网格,先局部采用密度算法,后聚合产 生真正的簇,大大提高了DBSCAN的效率,降低了复杂度。还有一些新的算法,比如Yu Wei 等人提出的凝聚层次聚类算法,采用了 84维的空间序列来表示对象,通过对由两两对象间 的皮尔森系数构成的矩阵进行凝聚,最终可获得较有效的系统树图;在种群算法和智能体 的基础上提出的较新颖的蚂蚁算法,不必事先规定簇的数目,并且可通过计算局部的对象 而非全部对象的方法来减少算法整 ...
【技术保护点】
一种基于聚类-决策树的玉米良种选育方法,其特征是:包括下列步骤: (1)数据预处理:将选择的三个属性对应成空间中的三维点,利用聚类算法中的k-平均算法,计算子女表中所有的记录点和重心之间的距离,比较大小,最终将所有的记录聚为两个簇,并使每个簇内的记录有较大的相似度,而不同的簇有较大的相异度; (2)建立决策树:先离散化所选的三个属性的属性值,将它们分区成三类,并将千粒重作为分类属性,划分类别标记为低产、中产、高产,在输入全生育期、千粒重和小区产量这三个属性之后,根据欧氏距离公式: d(x↓[i],y↓[j])=(*(x↓[ik]-x↓[jk])↑[2])↑[1/2] 即可判断这个三维点属于哪个聚类簇,得出结论后,对这个簇进行ID3算法的数据挖掘,计算出全生育期属性和小区产量属性的信息增益值,并将具有较大增益的属性作为测试属性,在测试属性分段的子节点处,引出分支,划分整个记录集,再依次进行即可形成一个精简的决策树,其中属性S↓[k]的信息增益公式为: G(S↓[K])=h↓[s](s↓[j])-*(n↓[k]/n↓[j]×(-*n↓[ik]/n↓[k]×lo ...
【技术特征摘要】
一种基于聚类-决策树的玉米良种选育方法,其特征是包括下列步骤(1)数据预处理将选择的三个属性对应成空间中的三维点,利用聚类算法中的k-平均算法,计算子女表中所有的记录点和重心之间的距离,比较大小,最终将所有的记录聚为两个簇,并使每个簇内的记录有较大的相似度,而不同的簇有较大的相异度;(2)建立决策树先离散化所选的三个属性的属性值,将它们分区成三类,并将千粒重作为分类属性,划分类别标记为低产、中产、高产,在输入全生育期、千粒重和小区产量这三个属性之后,根据欧氏距离公式 <mrow><mi>d</mi><mrow> <mo>(</mo> <msub><mi>x</mi><mi>i</mi> </msub> <mo>,</mo> <msub><mi>y</mi><mi>j</mi> </msub> <mo>)</mo></mrow><mo>=</mo><msup> <mrow><mo>(</mo><munderover> <mi>Σ</mi> <mrow><mi>k</mi><mo>=</mo><mn>1</mn> </mrow> <mi>m</mi></munderover><msup> <mrow><mo>(</mo><msub> <mi>x</mi> <mi>ik</mi></msub><mo>-</mo><msub> <mi>x</mi> <mi>jk</mi></msub><mo>)</mo> </mrow> <mn>2</mn></msup><mo>)</mo> </mrow> <mfrac><mn>1</mn><mn>2</mn> </mfrac></msup> </mrow>即可判断这个三维点属于哪个聚类簇,得出结论后,对这个簇进行ID3算法的数据挖掘,计算出全生育期属性和小区产量属性的信息增益值,并将具有较大增益的属性作为测试属性,在测试属性分段的子节点处,引出分支,划分整个记录集,再依次进行即可形成一个精简的决策树,其中属性Sk的信息增益公式为 <mrow><mi>G</mi><mrow> <mo>(</mo> <msub><mi>S</mi><mi>K</mi> </msub> <mo>)</mo></mrow><mo>=</mo><msub> <mi>h</mi> <mi>s</mi></msub><mrow> <mo...
【专利技术属性】
技术研发人员:邱建林,季丹,陈建平,顾翔,李芬,
申请(专利权)人:邱建林,季丹,陈建平,顾翔,李芬,
类型:发明
国别省市:32[中国|江苏]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。