RL

强化学习由浅入深小白教学片、从制作一个贪吃蛇游戏开始逐步上强化学习，目标是利用最少的资源实现强化学习的网络模型训练

贪吃蛇项目： 1.model.py 是模型文件，这里采用了卷积神经网络的方法设计SAC强化学习的模型，因为游戏环境是一个二维的平面，加上实体类型，就是三维的输入，可以视为灰度图信息处理

2.environment.py是环境的代码，主要设计游戏的逻辑和训练环境的互动规则以及奖励函数的设置，帮助引导AI快速学会游戏的规则，代码中包含预训练阶段的引导规则，有了预训练的模型后，可以删除规则继续通过修改奖励函数引导AI强化学习

3.main.py 训练的程序，主要是设置训练的基础超参数等，可以开启可视化查看游戏训练的进度（想要加快训练最好不开，想看阶段性效果可以执行play.py）

4.play.py 游戏测试代码，主要是帮助查看阶段性训练成果，可以调整帧率以帮助观察，可以更换不同的模型文件测试，注意超参数一致就可以了

详细教程

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
贪吃蛇		贪吃蛇
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md