Banca de QUALIFICAÇÃO: JÚLIO CÉSAR MENDES DE RESENDE

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : JÚLIO CÉSAR MENDES DE RESENDE
DATA : 18/10/2021
HORA: 09:00
LOCAL: Via google meet
TÍTULO:

Combinando Técnicas do Aprendizado por Reforço Profundo


PALAVRAS-CHAVES:

Aprendizado por Reforço, Aprendizado de Máquina, Aprendizado Profundo.


PÁGINAS: 51
RESUMO:

Os algoritmos de aprendizado por reforço permitem que agentes aprendam por experiência, sem a necessidade de um conhecimento prévio. Por esse motivo eles estão sendo largamente explorados. No entanto, aplicações modernas, como carros autônomos, exigem uma alta capacidade de generalização, o que demanda a combinação
desses algoritmos com aproximadores de funções. No ano de 2013 um novo algoritmo, chamado de DQN (Deep Q Network), causou grande impacto no meio acadêmico por obter resultados a nível de humanos em vários jogos do Atari 2600, utilizando, para isso, redes neurais artificiais. Consequentemente, surgiram novas linhas de pesquisa e novos algoritmos derivados foram propostos. Dentre os tais se destaca o FQF (Fully Parameterized Quantile Function), um algoritmo que alcançou resultados incríveis, mas que não explorou técnicas importantes que demonstraram sucesso em algoritmos anteriores. Sendo assim, esse trabalho busca propor um novo algoritmo, chamado de FQF++, que incorpora técnicas de outros trabalhos no FQF com a finalidade de produzir um novo algoritmo ainda melhor.


MEMBROS DA BANCA:
Presidente - 1985872 - EDIMILSON BATISTA DOS SANTOS
Interna - 1777390 - CAROLINA RIBEIRO XAVIER
Externo ao Programa - 1652537 - MARCOS ANTONIO DE MATOS LAIA
Externo ao Programa - 1378612 - ERIVELTON GERALDO NEPOMUCENO
Notícia cadastrada em: 17/09/2021 09:55
SIGAA | NTInf - Núcleo de Tecnologia da Informação - | Copyright © 2006-2024 - UFSJ - sigaa01.ufsj.edu.br.sigaa01