書籍『ゼロから作るDeep Learning ❹ 強化学習編』(オライリー・ジャパン)のサポートサイトです。本書籍で使用するソースコードがまとめられています。
本書の内容を確認するための「強化学習100題」を用意しています。
https://koki0702.github.io/dezero-p100/
| フォルダ名 | 説明 |
|---|---|
| ch01 | 1章で使用するソースコード |
| ... | ... |
| ch09 | 9章で使用するソースコード |
| common | 共通で使用するソースコード |
| notebooks | Jupyter Notebook形式のソースコード |
| pytorch | PyTorchに移植したソースコード |
本書のコードはJupyter Notebookでも用意しています。次の表にあるボタンをクリックすることで、Google ColabやKaggle Notebookなどのクラウドサービス上でNotebookを実行することができます。
| 章 | Colab | Kaggle | Studio Lab |
|---|---|---|---|
| 1章 バンディット問題 | |||
| 4章 動的計画法 | |||
| 5章 モンテカルロ法 | |||
| 6章 TD法 | |||
| 7章 ニューラルネットワークとQ学習 | |||
| 8章 DQN | |||
| 9章 方策勾配法 |
ソースコードを実行するには、下記のソフトウェアが必要です。
- Python 3.x(バージョン3系)
- NumPy
- Matplotlib
- OpenAI Gym
- DeZero (または PyTorch)
本書では、ディープラーニングのフレームワークとしてDeZeroを使います。DeZeroは「ゼロから作るDeep Learning」シリーズの3作目で作ったフレームワークです( pip install dezero からインストールできます)。
PyTorchを使った実装はpytorchフォルダにて提供しています。
各章のフォルダに該当するコードがあります。 実行するためには、下記のとおりPythonコマンドを実行します(どのディレクトリからでも実行できます)。
$ python ch01/avg.py
$ python ch08/dqn.py
$ cd ch09
$ python actor_critic.py
本リポジトリのソースコードはMITライセンスです。 商用・非商用問わず、自由にご利用ください。
本書の正誤情報は以下のページで公開しています。
https://github.com/oreilly-japan/deep-learning-from-scratch-4/wiki/errata
本ページに掲載されていない誤植など間違いを見つけた方は、[email protected]までお知らせください。
https://qiita.com/nishiys/items/3b8c1670891f745c5a81
https://qiita.com/haraken_qiita/items/6983d0ca8c0f76bd021a
https://sourceforge.net/projects/vcxsrv/ vcxsrv-64.1.20.14.0.installer.exe
xlaunch.exeという実行ファイルがあると思いますので, 起動します.
multiple window を選んで, 次へを選択 start no client を選んで, 次へを選択
clipboard を使用したければ, clipboardにチェックを入れます. Additional parameters for VcXsrv という入力フォームに -ac と入力して, 次へを選択します.
設定内容をC:\Program Files\VcXsrv\config.xlaunchに保存。
Explorerにてshell:startupを開く。 ショートカットの登録→ターゲット
C:\Program Files\VcXsrv\xlaunch.exe" -run "C:\Program Files\VcXsrv\config.xlaunch"
として登録
WSL2からVcXsrvに対して画面出力できるようにする。
$ vi ~/.bashrc
# 末尾に以下を登録して保存
# Show GUI to windows from WSL2
export DISPLAY=`hostname`.mshome.net:0.0
export LIBGL_ALWAYS_INDIRECT=1tkTest.pyとして保存。
from tkinter import *
root = Tk()
a = Label(root, text ="Hello World")
a.pack()
root.mainloop()$ python tkTest.pyでスクリプト実行
下記画面が出力されれば終了
$ sudo apt install qtwayland5
QT_QPA_PLATFORM="xcb"export QT_XCB_GL_INTEGRATION=none



