entity-neural-network
diff --git a/‎configs/codecraft/arena_medium.ron‎
Lines changed: 1 addition & 0 deletions b/‎configs/codecraft/arena_medium.ron‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎configs/xprun/train.ron‎
Lines changed: 0 additions & 3 deletions b/‎configs/xprun/train.ron‎
Lines changed: 0 additions & 3 deletions
diff --git a/‎configs/xprun/trainbc.ron‎
Lines changed: 0 additions & 3 deletions b/‎configs/xprun/trainbc.ron‎
Lines changed: 0 additions & 3 deletions
diff --git a/‎configs/xprun/traincc.ron‎
Lines changed: 0 additions & 3 deletions b/‎configs/xprun/traincc.ron‎
Lines changed: 0 additions & 3 deletions
diff --git a/‎enn_ppo/enn_ppo/tests/test_training.py‎
Lines changed: 18 additions & 1 deletion b/‎enn_ppo/enn_ppo/tests/test_training.py‎
Lines changed: 18 additions & 1 deletion
@@ -1,5 +1,6 @@
 // Achieves ~0.4 against eval opponent (old baseline: ~0.8-0.95): https://wandb.ai/entity-neural-network/enn-ppo/reports/Arena-Medium-baseline--VmlldzoxNzgwMTM1
 ExperimentConfig(
+    version: 1,
     env: (
         id: "CodeCraft",
         kwargs: "{\"objective\": \"ARENA_MEDIUM\", \"hardness\": 1.0, \"win_bonus\": 2.0, \"hidden_obs\": true}",
 
@@ -96,9 +96,6 @@ XpV0(
             env_secrets: {
                 "WANDB_API_KEY": "wandb-api-key",
             },
-            volumes: {
-                "/mnt/a/Dropbox/artifacts/xprun": "/mnt/xprun",
-            },
         )
     }
 )
@@ -69,9 +69,6 @@ XpV0(
             env_secrets: {
                 "WANDB_API_KEY": "wandb-api-key",
             },
-            volumes: {
-                "/mnt/a/Dropbox/artifacts/xprun": "/mnt/xprun",
-            },
         )
     }
 )
@@ -96,9 +96,6 @@ XpV0(
             env_secrets: {
                 "WANDB_API_KEY": "wandb-api-key",
             },
-            volumes: {
-                "/mnt/a/Dropbox/artifacts/xprun": "/mnt/xprun",
-            },
         ),
 
         "codecraftserver": (
 
@@ -1,9 +1,26 @@
+from hyperstate import StateManager
+
 from enn_ppo.config import RolloutConfig
-from enn_ppo.train import EnvConfig, OptimizerConfig, PPOConfig, TrainConfig, _train
+from enn_ppo.train import (
+    EnvConfig,
+    OptimizerConfig,
+    PPOConfig,
+    State,
+    TrainConfig,
+    initialize,
+    train,
+)
+from entity_gym.examples import ENV_REGISTRY
 from rogue_net.relpos_encoding import RelposEncodingConfig
 from rogue_net.rogue_net import RogueNetConfig
 
 
+def _train(cfg: TrainConfig) -> float:
+    sm = StateManager(TrainConfig, State, initialize, None)
+    sm._config = cfg
+    return train(sm, ENV_REGISTRY[cfg.env.id])
+
+
 def test_multi_armed_bandit() -> None:
     cfg = TrainConfig(
         total_timesteps=500,
Original file line number	Diff line number	Diff line change
`@@ -96,9 +96,6 @@ XpV0(`
`96`	`96`	`env_secrets: {`
`97`	`97`	`"WANDB_API_KEY": "wandb-api-key",`
`98`	`98`	`},`
`99`		`- volumes: {`
`100`		`- "/mnt/a/Dropbox/artifacts/xprun": "/mnt/xprun",`
`101`		`- },`
`102`	`99`	`)`
`103`	`100`	`}`
`104`	`101`	`)`
Original file line number	Diff line number	Diff line change
`@@ -69,9 +69,6 @@ XpV0(`
`69`	`69`	`env_secrets: {`
`70`	`70`	`"WANDB_API_KEY": "wandb-api-key",`
`71`	`71`	`},`
`72`		`- volumes: {`
`73`		`- "/mnt/a/Dropbox/artifacts/xprun": "/mnt/xprun",`
`74`		`- },`
`75`	`72`	`)`
`76`	`73`	`}`
`77`	`74`	`)`