MarioRL é um agente de Aprendizado por Reforço desenvolvido para aprender a jogar Super Mario Bros de forma autônoma. Utilizando técnicas avançadas de aprendizado profundo e otimizações eficientes, MarioRL busca alcançar um desempenho comparável aos modelos mais robustos com uma fração dos parâmetros.
- Técnica avançada de aprendizado profundo: Combina redes neurais duplas para estimar os valores de ação de maneira mais precisa.
- Melhora a eficiência de aprendizagem: Reduz o viés na estimativa do valor de ação, promovendo um aprendizado mais estável e eficiente.
- Estratégia robusta de melhoria de política: Garante atualizações de política seguras, evitando grandes mudanças que possam degradar o desempenho.
- Dinâmicas de aprendizado estáveis: Promove um treinamento mais consistente e confiável, facilitando a convergência do agente.
Para avaliar o desempenho do agente treinado, execute o script de teste:
python test.py
Para iniciar o processo de treinamento de um novo agente, utilize o seguinte comando:
python train.py
Explore o Jupyter Notebook para visualizar e interagir com o projeto de forma mais detalhada: