本发明专利技术涉及信息处理领域中的一种基于自律学习SDL模型的聚类方法,其特征在于:被聚类的特征向量之间依照概率空间距离的尺度,每一类的聚类结果依照概率空间的最大概率尺度在函数映射与函数高斯分布的效果上取得聚类的最佳解。本方法的特点是:SDL模型的聚类可以考虑函数映射模型与函数高斯分布模型的融合,可以仿真深度学习的函数映射模型,实现高精度识别图像的能力,同时,又可以实现函数高斯分布模型的高度的泛化能力。本方法没有黑箱问题,不需要大的硬件支持,不需要大数据的标注,仅仅通过小数据的训练就可,因此性能高,导入成本低,便于大量普及。便于大量普及。便于大量普及。
【技术实现步骤摘要】
一种基于自律学习SDL模型的聚类方法
[0001]本专利技术属于人工智能领域中的一种基于自律学习SDL模型的聚类方法。
技术介绍
[0002]加拿大多伦多大学教授Hinton团队提出的“深度学习”(非专利文献1)在 IMAGENET的图像分类的测试数据集中获得了优异的成绩,引起世界的关注,因此掀起了本次人工智能的高潮。很多的研究人员力图用“深度学习”模型进行自动驾驶汽车的控制。代表的手法有“一天学会开车”(非专利文献2)。
[0003]作为“深度学习”的专利技术人Hinton在2017年9月在接受Axios网站采访时宣告:“我的观点是把它(反向传播)全部丢下,重起炉灶”,这是Hinton的玻尔兹曼机的梦想破灭,“深度学习”的黑箱问题不可解决,因此不适于广泛的普及最终要终结。
[0004]因此人们迫切的需要寻找替代”深度学习“的新一代人工智能模型,希望得到一个没有黑箱问题的,小数据的,概率的,迭代的机器学习模型。然而, Hinton预言的Capsule理论(非专利文献3)并没有得到预期的效果。
[0005]在深度学习被专利技术人否定之后,算法学派大崛起,一个题为:“一种人工智能新型神经网络的构建方法”(CN108510052A)的新一代人工智能自律学习SDL 模型被发表了。【非专利文献1】
[0006]A.Krizhevsky,I.Sutskever,Geoffrey E.Hinton:“ImageNet Classification with Deep Convolutional Neural Networks”,Advances in Neural Information Processing Systems 25:pp1097
‑
1105(2012).【非专利文献2】
[0007]A.Kendall,J.Hawke:
″
Learning to Drive in Day
″
, arXiv:1807.00412v2.[cs.LG]11 Sep.(2018).【非专利文献3】
[0008]S.Sabour,N.Frosst,Geoffrey E.Hinton:
″
Dynamic Routing Between Capsules
″
,arXiv:1710.09829v2.[cs.CV]7 Nov.(2017).【专利文献1】
[0009](CN108510052A)
[0010]上述(非专利文献1)的深度学习模型,在求解数据集时,需要穷举才能得到全局最佳,在这样大的组合空间里这是一个NPC问题。再有,通过概率梯度下降法SGD只能获得局域最佳解,很难达到全局最佳解。而且,SGD所获得局域最佳解,对深度学习的应用效果是随机性的,不能保证每一个SGD的解都是应用效果最好的解。由于全局最佳解不可能得到,SGD的局域最佳解是很不稳定的,只要数据有一点波动就会得到截然不同的解,这就是黑箱问题出现的原因。
[0011]再有,在穷举的计算上消耗了庞大的硬件开销,处理效率极低,硬件成本非常高,是大模型解决小任务的原因。深度学习由于是函数映射模型,在实际应用中,一位深度学习
算法人员要配100位标注人员,这完全是“人工的智能”,致使应用成本很高。再有就是深度学习受应用场景的限制,仅可以在图像识别,声音识别上发挥作用,不能应用于工业控制,自动驾驶汽车的控制等。
[0012]上述(非专利文献2)的采用无模型深度强化学习算法方法,用深度确定性策略梯度(deep deterministic policy gradients,DDPG)来解决车道跟踪任务。面对复杂的自动驾驶汽车的控制,该方法容易陷入控制的NPC问题,在实际工程应用上很困难。
[0013]上述(非专利文献3)的Capsule理论,用效果好的节点信息,增加权重值,效果不好的节点信息就降低权重值,作为迭代的方法,并通过公式化的方法计算结果等,其结果目前还没有展示出令人信服的,且Hinton本人所希望得到的真正的概率模型,以及强大的迭代效果。
[0014]上述(专利文献1)导入了在数学上最强大的高斯过程的理论,是概率的模型,是小数据的模型,也是高度迭代的模型。仅用很少的数据,就可以获得相当于函数映射的无穷个数据集的应用效果。系统规模可以无穷的扩展,计算复杂度接近线性。可以应用于任何领域。但是不具有深度学习函数映射模型那种可以扩大特征向量之间的间隔的特点。
技术实现思路
[0015]本专利技术的第一个目的是:提出一个通过算法既数理计算,仿真函数映射模型的深度学习,从而不需要通过组合获得数据训练最佳的解,提高系统的处理效率,降低了硬件的开销,解决了黑箱问题。
[0016]本专利技术的第二个目的是:提出一个将数理计算所仿真的深度学习,与SDL 高斯分布模型融合,函数的概率分布与函数的映射两种模型相结合,两种特点都能发挥,构建目前最强大的人工智能模型,推动人工智能的深入普及。
[0017]为实现上述至少一种目的,本专利技术提出如下技术方案。一种基于自律学习SDL模型的聚类方法,至少具备如下一个特征:(1)被聚类的特征向量之间依照概率空间距离的尺度;(2)每一类的聚类结果依照概率空间的最大概率尺度;(3)在函数映射与函数高斯分布的效果上取得聚类的最佳解。
[0018]而且,所述SDL模型的聚类算法是函数映射模型与高斯分布模型的融合的;通过概率尺度自组织,概率空间距离对特征向量进行最佳聚类的;直接给出特征值的各个概率空间的结果的聚类的;在函数映射特性与高斯分布特性之间获得最佳解的聚类算法。
[0019]而且,所述SDL模型的聚类算法是指:映射函数是包括线性函数,也可以是非线性的函数,还可以是随机函数,多种混合的映射函数中至少一种;或者是SDL模型的聚类算法。
[0020]而且,所述SDL模型的聚类算法是指:映射函数不只是经典的线性函数,经典的非线性的函数,经典的随机函数,特别是按照深度学习的SDG求解出的解的特点,考虑了深度学习对模式识别的精度的提高的作用,结合人为介入的手法,综合的构造出来的映射函数;映射函数中有包括数理运算形式的成分,有隶属函数的成分,有规则构建成分在内,还有SDL模型的聚类成分的至少一种,或多种成分的混合。
[0021]而且,所述SDL模型的聚类算法是指:最大几率的概率空间是通过概率尺度自组织算法得到的。
[0021]一种基于自律学习SDL模型的聚类方法,其特征在于是通过如下步骤实现的:(1)针对所有数据按照特征向量之间的欧几里德距离进行概率尺度自组织迭代,得到两个最大概率高斯分布(最大概率空间)的最大的概率值和最大概率尺度;(2)以上述得到的两个最大概率值为中心,与所有没有被聚类的数据,用概率空间距离为尺度,在这两个概率空间中进行对抗,分别把两个最大概率尺度以内的数据作为最终的两个聚类结果;(3)重复上述(1)~(2)处理直到全部数据被聚类完成。
[00本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于自律学习SDL模型的聚类方法,至少具备如下一个特征:(1)被聚类的特征向量之间依照概率空间距离的尺度;(2)每一类的聚类结果依照概率空间的最大概率尺度;(3)在函数映射与函数高斯分布的效果上取得聚类的最佳解。2.根据权利要求1所述的一种基于自律学习SDL模型的聚类方法,其特征在于:所述SDL模型的聚类算法是函数映射模型与高斯分布模型的融合的;通过概率尺度自组织,概率空间距离对特征向量进行最佳聚类的;直接给出特征值的各个概率空间的结果的聚类的;在函数映射特性与高斯分布特性之间获得最佳解的聚类算法。3.根据权利要求1所述的一种基于自律学习SDL模型的聚类方法,其特征在于:所述SDL模型的聚类算法是指:映射函数是包括线性函数,也可以是非线性的函数,还可以是随机函数,多种混合的映射函数中至少一种;或者是SDL模型的聚类算法。4.根据权利要求1所述的一种基于自律学习SDL模型的聚类方法,其特征在于:所述SDL模型的聚类算法是指:映射函数不只是经典的线性函数,经典的非线性的函数,经典的随机函数,特别是按照深度学习的SDG求解出的解的特点,考虑了深度学习对模式识别的精度的提高的作用,结合人为介入的手法,综合的构造出来的映射函数;映射函数中有包括数理运算形式的成分,有隶属函数的成分,有规则构建成分在内,还有SDL模型的聚类成分的至少一种,或多种成分的混合。5.根据权利要求1所述的一种基于自律学习SDL模型的聚类方法,其特征在于:所述SDL模型的聚类算法是指:映射函数的最大几率的概率空间,是通过概率尺度自组织算法得到的。6.一种基于自律学习SDL模型的聚类方法,其特征在于是通过如下步骤实现的:(1)针对...
【专利技术属性】
技术研发人员:顾泽苍,
申请(专利权)人:顾泽苍,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。