Jaguar: Uma Abordagem de Aprendizado por Reforço Profundo Multi-Agente Hierárquica com Transfer Learning para StarCraft II
Aprendizado por Reforço Profundo; StarCraft II; Multi-Agente; Transfer Learning; Arquitetura Hierárquica.
Jogos de Estratégia em Tempo Real são ambientes que geralmente simulam situações militares reais e apresentam uma série de desafios para o campo da Inteligência Artificial, como a alta complexidade e grande espaço de ações e estados, mapas parcialmente observáveis e o fato de lidarem com múltiplos agentes ao mesmo tempo, além das tarefas poderem ser realizadas no âmbito do microgerenciamento ou do macrogerenciamento. Em especial, o Aprendizado por Reforço tem se destacado na aplicação e evolução de técnicas capazes de lidar com esses desafios, especialmente com o advento do Aprendizado por Reforço Profundo. Foi realizada, então, uma revisão sistemática da literatura com o objetivo de entender e sumarizar quais ambientes, técnicas, ferramentas e arquiteturas compõem o estado da arte do Aprendizado por Reforço Profundo nos jogos de Estratégia em Tempo Real. Diante dos levantamentos obtidos pela revisão, este trabalho propõe desenvolver uma solução Multi-Agente Hierárquica focada no jogo StarCraft II, com o uso de Transfer Learning e técnicas de mascaramento de ações para permitir que o treinamento do agente consuma menos recursos e obtenha resultados satisfatórios para cenários mais complexos.