Combinando Técnicas do Aprendizado por Reforço Profundo
Aprendizado por Reforço, Aprendizado de Máquina, Aprendizado Profundo.
Os algoritmos de aprendizado por reforço permitem que agentes aprendam por experiência, sem a necessidade de um conhecimento prévio. Por esse motivo eles estão sendo largamente explorados. No entanto, aplicações modernas, como carros autônomos, exigem uma alta capacidade de generalização, o que demanda a combinação
desses algoritmos com aproximadores de funções. No ano de 2013 um novo algoritmo, chamado de DQN (Deep Q Network), causou grande impacto no meio acadêmico por obter resultados a nível de humanos em vários jogos do Atari 2600, utilizando, para isso, redes neurais artificiais. Consequentemente, surgiram novas linhas de pesquisa e novos algoritmos derivados foram propostos. Dentre os tais se destaca o FQF (Fully Parameterized Quantile Function), um algoritmo que alcançou resultados incríveis, mas que não explorou técnicas importantes que demonstraram sucesso em algoritmos anteriores. Sendo assim, esse trabalho busca propor um novo algoritmo, chamado de FQF++, que incorpora técnicas de outros trabalhos no FQF com a finalidade de produzir um novo algoritmo ainda melhor.