Meta-Learning Shared Hierarchies

python main.py --task AntBandits-v1 --num_subs 2 --macro_duration 1000 --num_rollouts 2000 --warmup_time 20 --train_time 30 --replay False AntAgent

The MLSH script works on any Gym environment that implements the randomizeCorrect() function. See the envs/ folder for examples of such environments.

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
.idea		.idea
envs		envs
mlsh_code		mlsh_code
rl_algs		rl_algs
.DS_Store		.DS_Store
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py

Provide feedback