tinyppo-snake · in-browser PPO training

tinyppo-snake

grid

Environment Sample

idle

Training metrics

0s

avg500 0 last 500 episodes

peak 0 best window

roll/s 0 20-step avg

progress 0 0 episodes

pol= — val= — ent= — gn= — kl= —

Scores

Events

Trained-policy roll-outs

0 · trained 0

grid delay 40 ms

parameter live updates waiting for first snapshot…

Initializing 3D renderer…

step # —

no tensor loaded

Configure runs

preset

idle

no runs yet