【技术实现步骤摘要】
本专利技术涉及互联网
,尤其涉及基于群体智能的行为聚类系统。
技术介绍
目前,互联网行业发展到一定的程度以后,专业化分工的过程也使其内部结构中产生了比较细致的分化,从而形成了整个互联网产业从低到高分成几个层次:处于不同层次的互联网企业具有不同的客户对象、服务手段和利润来源,这就自然地形成了目前互联网企业的不同商业模式。从目前互联网业界比较通用的角度来划分互联网产业的结构层次,或者说互联网企业的商业模式主要有以下几种:(1)接入与平台(Access and Platforms):这是互联网企业最初的业务形式之一。服务主要包括互联网接入(有线、无线接入服务)、虚拟主机、主机托管等。同时,部分这类企业还提供网站制作、维护等服务。(2)网上内容提供服务(Internet Content Provide):这项服务是指通过在互联网上建立网站向网络的用户(包括个人用户与企业用户)提供各种资讯、信息和社区服务的互联网服务。内容和社区服务类网站根据其所提供内容的广度和深度的不同又可以分为综合类网站和专业类网站两个大类;依据其提供内容的不同类别,又可以分为搜索引擎、门户以及虚拟社区等。(3)电子商务(E—Commerce):是利用Wbe技术、电子化手段在Internet网上完成商业贸易活动的新型方式。电子商务的发展非常迅速,根据商务活动产生的资为电子事物处理(无支付、无物流,如网上报税、网上办 ...
【技术保护点】
基于群体智能的行为聚类系统,其特征在于,该系统的数据表示包括数据结构和数据类型,采用K均值混合聚类算法;数据类型是一组值的集合和定义在这个值集合之上的一组操作的总称,与数据本身相关,包括数值性、布尔型、可分类型、混合型等;数据结构是数据的组织形式,通常指存储在计算机内存中的数据;本系统采用的聚类算法所用的数据主要有以下两种数据结构:1、矢量表示;2、相似矩阵表示;采用k均值混合聚类算法,将蚁群聚类算法与k均值聚类算法结合起来,该算法主要分成两个部分,第一部分进行蚁群聚类,第二部分用k均值算法收集蚁群聚类的结果,在k均值混合聚类算法中,相似度公式与蚁群聚类的基本模型及LF算法类似,但采用了更为简单的概率转换函数,它是两条斜率为k的直线,如下所示;pp=1-ϵf(Oi)≤01-k×f(Oi)0<f(Oi)≤1/k0+ϵf(Oi)>1/k]]>pd=1-ϵf(Oi)≥1/k k×f(Oi)0<f(Oi)<1/k0+ϵf(Oi)≤0]]>在基本模型中,概率转换函 ...
【技术特征摘要】
1.基于群体智能的行为聚类系统,其特征在于,该系统的数据表示包括
数据结构和数据类型,采用K均值混合聚类算法;
数据类型是一组值的集合和定义在这个值集合之上的一组操作的总称,
与数据本身相关,包括数值性、布尔型、可分类型、混合型等;
数据结构是数据的组织形式,通常指存储在计算机内存中的数据;本系
统采用的聚类算法所用的数据主要有以下两种数据结构:
1、矢量表示;2、相似矩阵表示;
采用k均值混合聚类算法,将蚁群聚类算法与k均值聚类算法结合起来,
该算法主要分成两个部分,第一部分进行蚁群聚类,第二部分用k均值算法
收集蚁群聚类的结果,在k均值混合聚类算法中,相似度公式与蚁群聚类的
基本模型及LF算法类似,但采用了更为简单的概率转换函数,它是两条斜
率为k的直线,如下所示;
pp=1-ϵf(Oi)≤01-k×f(Oi)0<f(Oi)≤1/k0+ϵf(Oi)>1/k]]>pd=1-ϵf(Oi)≥1/kk×f(Oi)0<f(Oi)<1/k0+ϵf(Oi)≤0]]>在基本模型中,概率转换函数的参数包括两个阈值常数k1和k2,并且阈
值常数的选取和实验数据相关密切,而在k均值混合聚类算法中,概率转换
函数只有k,并且通过实验证明,简化后概率转换函数的参数k并没有根据
实验数据变化而变化,因此新算法的概率转换函数变化同样减轻了算法参数
选取的复杂度,提高了算法的实用性,K均值混合聚类算法的运行过程如下:
算法:K均值混合聚类算法
输入:p个模式矢量
输出:被标记聚类类别的p个模式
方法:
步骤l:参数初始化,a,ant_number,k,R,size,dist.最大循环次数n,
标注类别值clusterno等;
步骤2:将待聚类模式随机分散于一个平面上,即随机赋给每一个模式一
对(x,y)坐标;
步骤3:给一组蚂蚁赋初始模式值,初始状态为无负载;
步骤4:for i=1,2…,n;
步骤4.1for j=1,2,…ant_number;
步骤4.1.1以本只蚂蚁初始模式对应坐标为中心,r为观察半径,利用
群体相似度公式计算此模式在观察半径范围内的群体相似度;
步骡4.1.2若本只蚂蚁无负载,则计算拾起概率pp;
步骤4.1.3与一随机概率pr相比较,若pp<pr,则蚂蚁不拾起此模式,
再随机赋给蚂蚁一个模式值,否则蚂蚁拾起此模式,蚂蚁状态改为有负载,
随机给蚂蚁一个新坐标;
步骤4.1.4若本只蚂蚁有负载,则计算放下概率pd;
步骤4.1.5与一随机概率pr相比较,若pd>pr则蚂蚁放下此模式,将蚂
蚁的坐标赋给此模式,蚂蚁状态改为无负载,再随机赋给蚂蚁一个模式值.否
则蚂蚁继续携带此模式,蚂蚁状态仍为有负载,再次随机给蚂蚁一个新坐标;
步骤5:for i=1,2…,pattern_num;//对于每一个模式
步骤5.1若此模式未被标注类别;
步骤5.1.1标注此模式的类别;
步骤5.1.2用同一类别标注值递归标注所有相距小于dist的模式,即在
平面上收集所有属于同一集簇的模式;
步骤5.1.3if同一集簇模式数大于1,类别标注值clusterno++;
else标注此模式为例外;
步骤6:生成聚类中心模板,即计算不包括例外的每一个聚类中心的平
均值;
步骤7:Repeat;
步骤7.1(再次)将每一个模式以距离最近的规则划分到所属聚类中
心;
步骤7.2更新聚类中心模板;
步骤8Until聚类中心模板没有变化;
k均值混合聚类算法主要包括两个阶段,第一阶段是实现基于群体智能
的聚类过程,第二阶段是以第一阶段得到的聚类中心均值模板和聚类中心个
数为参数,实现K均值聚类过程,当然在收集第一阶段聚类结果的时候,由
\t单个模式形成的聚类中心将不列为第二阶段的初始聚类中心模板。
2.根据权利要求1所述的基于群体智能的行为聚类系统,其特征在于,
所述的矢量表示是通过一个多维空间中的矢量来描述一个对象多方面的特
征,矢量的每个维度对应对象的一个特征,多个对象的矢量可以构成一个模
式矩阵(patter...
【专利技术属性】
技术研发人员:李臻,纪敏,
申请(专利权)人:上海市玻森数据科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。