本发明专利技术涉及人工智能领域中的一种导入神经网络的非线性控制方法,其特征在于:人类在驾驶汽车的时候没有想到汽车是由具有生物意识的人设计的。尽管方向盘,油门,以及刹车的操作需要非线性的调节,但是谁也没有感觉到异常。因为从人眼睛那里感知到外界信息,同时通过生物意识自如的指挥手和脚操作方向盘或油门,形成一个非线性的闭环生物控制系统。这是现代控制理论所解决不了的。再有根据组合理论的应用经验,超过40个以上组合要素时就属于NP
【技术实现步骤摘要】
一种导入自律机器学习模型的神经网络的非线性控制方法
[0001]本专利技术属于人工智能领域中的一种导入自律机器学习SDL(Self
‑ꢀ
Discipline Learning)模型的神经网络的非线性控制方法。
技术介绍
[0002]针对自动驾驶汽车这一复杂系问题,人们始终希望导入人工智能模型,可 是在工程上适合控制的机器学习模型尚没有人提出过。
[0003]早在20多年前的上一次人工智能的高潮中,为了解决用传统的控制理论 不能实现自动驾驶的控制问题,日本将当时的知识库理论,与L.A.Zadeh提倡 的模糊数学理论(非专利文献1~6)
[1]~[6]相结合,成功的用模糊控制理论(非 专利文献7)解决了自动驾驶列车的控制问题。
[0004]加拿大多伦多大学教授Hinton团队提出的“深度学习”(非专利文献 8)在IMAGENET的图像分类的比赛中获胜,掀起了本次人工智能的高潮。很多 的研究人员力图用“深度学习”模型进行自动驾驶汽车的控制。代表的手法有
ꢀ“
一天学会开车”(非专利文献9),该方法采用无模型深度强化学习算法, 用深度确定性策略梯度(deep deterministic policy gradients,DDPG)来解 决车道跟踪任务。面对复杂的自动驾驶汽车的控制。
[0005]作为“深度学习”的专利技术人Hinton在2017年9月在接受Axios网站采访 时宣告:“我的观点是把它(反向传播)全部丢下,重起炉灶”,这是Hinton 的玻尔兹曼机的梦想破灭,“深度学习”的黑箱问题不可解决,因此不适于 控制上的应用最终要终结。
[0006]因此人们迫切的需要寻找替代”深度学习“的新一代人工智能模型,希望 得到一个可以用于控制的机器学习模型。然而,Hinton预言的Capsure理论 (非专利文献10)。
[0007]在机器学习模型上,聚类算法(非专利文献11~12)应该是一种无监督机 器学习的模型。
[0008]从另一个角度,采用现代控制理论中的动态系统辨识的方法,应用于汽车 的车辆参数估计,以及制动系统的控制(非专利文献13)。这种控制方法是利 用汽车最优运动规划与控制的动力学模型(Dynamic Modeling Analysis ofOptimal Motion Planning)所得到的输入与输出对应关系的数据,再从类似 最小二乘法中获得模型的最佳逼近参数。
[0009]【专利文献】
[0010]【非专利文献1~6】
[0011][1]L.A.Zadeh:“Fuzzy Sets”Information and Control 8,338
‑
353(1965)
[0012][2]Z.Gu,S.Yamada,K.Fukunaga,and and S.Yoneda:“A New Algorithm on VLSI
‑
Block Placement Using Fuzzy Theory”,Proc.JTC
‑
CSCC
’
90, pp599
‑
604(1990).
[0013][3]Z.GU,S.Yamada,and S.Yoneda:“A Decompos i ti on of VLSI Network Based on Fuzzy Clustering Theory”,Proc.JTC
‑
CSCC
’
91,pp.483
‑
488 (1991)
[0014][4]Z.GU,S.Yamada,and S.Yoneda:“A Fuzzy
‑
Theoretic Block Placement Algorithm for VLSI Design”,IEICE Trans,Vol.E
‑
74,No.10,pp,3065
‑ꢀ
3071(1991)
[0015][5]Z.Gu,S.Yamada,and S.Yoneda:“Timing Driven Placement Method Based on Fuzzy Theory”,IEICE Trans.,Vol.E75
‑
A,No.7,pp917
‑
919 (1992).
[0016][6]Z.Gu,S.Yamada,K.Fukunaga,and S.Yoneda:“A Fuzzy
‑
Theoretic Timing Driven Placement Method”,IEICE Trans.,Vol.E75
‑
A,No.10, pp1280
‑
1285(1992)
[0017]【非专利文献7】
[0018]松本:
″ファジィ
一制御
の
列車自動運転
システムヘの
応用”繊維機械学会誌 Vol.43,No.7(1990)
[0019]【非专利文献8】
[0020]A.Krizhevsky,I.Sutskever,Geoffrey E.Hinton:“ImageNet Classification with Deep Convolutional Neural Networks”,Advances in Neural Information Processing Systems 25:pp1097
‑
1105(2012).
[0021]【非专利文献9】
[0022]A.Kendall,J.Hawke:
″
Learning to Drive in Day
″
,
[0023]arXiv:1807.00412v2.[cs.LG]11 Sep.(2018).
[0024]【非专利文献10】
[0025]S.Sabour,N.Frosst,Geoffrey E.Hinton:
″
Dynamic Routing Between Capsules
″
,arXiv:1710.09829v2.[cs.CV]7Nov.(2017).
[0026]【非专利文献11
‑
12】
[0027]M.R.Anderberg:
″
Cluster Analysis for Applications
″
,Academic Press, Inc.(1973)
[0028]M.Ackerman,S.Ben
‑
David,D.Loker:
″
Characterization of linkage
‑ꢀ
based clustering
″
,In COLT 2010<本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种导入自律机器学习模型的神经网络的非线性控制方法,其特征是:在至少具有存储器,微处理器,输入与输出接口所构成的硬件模组与通过人为的对控制对象直接操作训练,所得到的可以反应控制现场的操作信息或控制轨迹信息的最大概率数据,或最佳数据;将最大几率值的数据,或高斯分布的期望值的数据,或最佳逼近值的数据存储于数据库中;针对每一个控制点通过调用相应的将最大几率值的数据,或高斯分布的期望值的数据,或最佳逼近值的数据使控制对象稳定的逼近训练的控制轨迹。2.根据权利要求1所述的一种导入自律机器学习模型的神经网络的非线性控制方法,其特征在于:自律机器学习模型的神经网络是指:具有感知层,神经层,控制层的自律学习模型的神经网络的算法软件的共同动作所实现的;通过人为的对控制对象的直接操作训练,所得到的控制现场的操作信息或控制轨迹信息通过硬件接口输入到软件构成的自律学习模型的神经网络的感知层的各个节点上;在感知层与神经层的各个节点上得出输入信息的最大几率值或回归分析值;从神经层输出的各个节点上的操作信息的最大几率值或回归分析值,通过控制层的各个输出节点输出给硬件接口,直接驱动控制对象动作;控制对象动作后的动作结果信息通过硬件接口输入给控制层的输入节点上,与神经层的控制轨迹的信息的最大几率值或回归分析值,与控制层输入的控制对象的控制结果信息进行比对得出闭环控制的调节量,进行闭环的微调节,在复数次的循环控制的微调节下,使控制对象接近目标信息的最大几率值或回归分析值。3.根据权利要求1所述的一种导入自律机器学习模型的神经网络的非线性控制方法,其特征在于:所述操作信息是指:自动驾驶汽车的包括方向盘的操作信息,油门操作信息,刹车操作信息在内的至少一种控制机构的操作状态信息;所述控制轨迹信息是指:包括与操作状态信息所对应的GPS的航向角信息,经度信息,纬度信息在内的至少一种控制轨迹信息。4.根据权利要求1所述的一种导入自律机器学习模型的神经网络的非线性控制方法,其特征在于:所述控制轨迹信息是指包括GPS的航向角信息,经度信息,纬度信息中至少一种信息,或者是包括x轴,y轴,z轴在内的至少一种笛卡尔坐标信息。5.根据权利要求1所述的一种导入自律机器学习模型的神经网络的非线性控制方法,其特征在于:所述最大几率值是通过概率尺度自组织的算法得到的。6.根据权利要求1所述的一种导入自律机器学习模型的神经网络的非线性控制方法,其特征在于:所述...
【专利技术属性】
技术研发人员:顾泽苍,
申请(专利权)人:顾泽苍,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。