Sokoban RL Solver

This project applies Reinforcement Learning algorithms to solve Sokoban puzzles. The following algorithms have been implemented:

To solve a puzzle using one of our algorithms, run:

python .\solve_puzzle.py <puzzle_file> <algorithm>

Algorithms: monte_carlo, td_learning, reinforce, actor_critic

The following algorithms from stable_baselines3 are also available:

To solve a puzzle using a stable_baselines3 algorithm, run:

python .\sb3_solve_puzzle.py <puzzle_file> <algorithm>

Algorithms: PPO, A2C, DQN

Examples:

python .\solve_puzzle.py .\data\puzzles\level_1.txt monte_carlo

python .\sb3_solve_puzzle.py .\data\puzzles\level_2.txt PPO

To solve a puzzle using non-RL algorithms (BFS, A*...), cd into sokoban-solver-generator (a fork of xbandrade's repository ).

Name		Name	Last commit message	Last commit date
Latest commit History 149 Commits
data/puzzles		data/puzzles
sokoban-solver-generator		sokoban-solver-generator
src		src
.gitignore		.gitignore
Progress_Report.pdf		Progress_Report.pdf
Project_Proposal.pdf		Project_Proposal.pdf
README.md		README.md
Sokoban_RL_paper.pdf		Sokoban_RL_paper.pdf
requirements.txt		requirements.txt
sb3_solve_puzzle.py		sb3_solve_puzzle.py
solve_puzzle.py		solve_puzzle.py

Provide feedback