Skip to content
/ RL Public

强化学习由浅入深小白教学片、从制作一个贪吃蛇游戏开始逐步上强化学习,目标是利用最少的资源实现强化学习的网络模型训练

License

Notifications You must be signed in to change notification settings

NocoldBob/RL

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 

Repository files navigation

RL

强化学习由浅入深小白教学片、从制作一个贪吃蛇游戏开始逐步上强化学习,目标是利用最少的资源实现强化学习的网络模型训练

贪吃蛇项目: 1.model.py 是模型文件,这里采用了卷积神经网络的方法设计SAC强化学习的模型,因为游戏环境是一个二维的平面,加上实体类型,就是三维的输入,可以视为灰度图信息处理

2.environment.py是环境的代码,主要设计游戏的逻辑和训练环境的互动规则以及奖励函数的设置,帮助引导AI快速学会游戏的规则,代码中包含预训练阶段的引导规则,有了预训练的模型后,可以删除规则继续通过修改奖励函数引导AI强化学习

3.main.py 训练的程序,主要是设置训练的基础超参数等,可以开启可视化查看游戏训练的进度(想要加快训练最好不开,想看阶段性效果可以执行play.py)

4.play.py 游戏测试代码,主要是帮助查看阶段性训练成果,可以调整帧率以帮助观察,可以更换不同的模型文件测试,注意超参数一致就可以了

详细教程

https://blog.csdn.net/bobwww123/article/details/138722671

About

强化学习由浅入深小白教学片、从制作一个贪吃蛇游戏开始逐步上强化学习,目标是利用最少的资源实现强化学习的网络模型训练

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages