GitHub - jaindeepali/Reinforcement-Learning-Algorithms: Python (Numpy + Tensorflow) implementations of common Reinforcement Learning algorithms.

This is a collection of Python (numpy + tensorflow) implementations of common RL algorithms.

MDP Solutions - Value Iteration, Policy Iteration, Fitted Value iteration through function approximation, Policy Gradient
Model-free Solutions - Q-Iteration, Q-Learning, Monte-Carlo Policy iteration, REINFORCE (Vanilla policy gradient), SARSA, n-Step SARSA, SARSA-Lambda, Actor-Critic, Deep Q-Network

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
mdp_offline_solutions		mdp_offline_solutions
rl_online_algorithms		rl_online_algorithms
.gitignore		.gitignore
README.md		README.md

Provide feedback