找回密码
 立即注册

利用强化学习的自适应动态规划中的值迭代和策略迭代方法,神经网络控制方法,LQR状态

[复制链接]
发表于 2024-1-27 16:03:57 | 显示全部楼层 |阅读模式
利用强化学习的自适应动态规划中的值迭代和策略迭代方法,神经网络控制方法,LQR状态调节器最优控制方法,实现了三维倒立摆在飞行器上的稳定控制。鲁棒性很强,进行了高斯白噪声的扰动实验

文件列表:
Action.mat
Action2.mat
ControlwithNoise.m
Critic.mat
Critic2.mat
HDP.m
HDPMethod.m
LQRMethod.m
PolicyMethod.m
quadrotor.mat
QuadrotorAnimation.m
SingleHDP.m
train.m
Ux.mat
ValueMethod.m

运行例图:
01.png


利用强化学习的自适应动态规划中的值迭代和策略迭代方法,神经网络控制方法,LQR状态.rar (48.6 KB, 下载次数: 2, 售价: 30 积分)


回复

使用道具 举报

小黑屋|获取积分|网站地图|必过源码 ( 湘ICP备2020019413号-2 )

GMT+8, 2024-11-30 04:55 , Processed in 0.090291 second(s), 28 queries .

Powered by Biguo100

2006-2023 Biguo100 Team

快速回复 返回顶部 返回列表