Banca de QUALIFICAÇÃO: WESLEY SILVA GUIMARÃES

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : WESLEY SILVA GUIMARÃES
DATA : 25/04/2025
HORA: 14:00
LOCAL: On line
TÍTULO:

Validação de técnicas de visão computacional e aprendizado por reforço aplicadas ao jogo Chip’s and Dale


PALAVRAS-CHAVES:

aprendizado de máquina, agente, aprendizado por reforço, redes neurais, robótica.


PÁGINAS: null
RESUMO:

O campo de Machine Learning vem ganhando um espaço cada vez mais significativo no mundo moderno, tanto em ambientes físicos quanto em ambientes digitais. Uma área que vem se destacando é o Aprendizado por Reforço, que está se tornando cada vez mais influente em aplicações de Inteligência Artificial. Junto a este constante avanço, a robótica tem desenvolvido técnicas e conceitos cada vez mais sofisticados. É notável a integração crescente de conceitos de aprendizado de máquina em aplicações robóticas. Neste trabalho, propõe-se um estudo comparativo entre duas abordagens de aprendizado por reforço: o Q-learning e o Deep Q-Network
(DQN), será utilizado junto a ambas as abordagens um algoritmo de detecção de objetos em tempo real, conhecido como YOLO. Ambas as abordagens serão aplicadas em um ambiente de jogo clássico, o "Chip’n Dale Rescue Rangers", da plataforma NES, que servirá como um simulador análogo para avaliar o desempenho dos algoritmos em cenários dinâmicos e complexos. O jogo foi escolhido por sua natureza exploratória e pela presença de elementos que exigem tomada de decisões rápidas e precisas, como a coleta de itens e a evasão de inimigos. A primeira abordagem, baseada em Q-learning, utiliza uma tabela de estados discretizada para armazenar os valores Q, que representam a qualidade das ações em cada estado. Essa abordagem é simples e eficiente em ambientes com espaços de estado pequenos e discretos, mas pode enfrentar limitações em cenários mais complexos devido ao crescimento exponencial da tabela Q. A segunda abordagem, baseada em Deep Q-Network (DQN), utiliza uma rede neural convolucional (CNN) para aproximar a função Q, permitindo que o agente lide com espaços de estado contínuos e de alta dimensionalidade, como imagens brutas do ambiente. Além disso, o DQN incorpora técnicas como experiência replay e rede alvo (target network) para melhorar a estabilidade e a eficiência do treinamento. Ambas as abordagens serão avaliadas com base em métricas
como tempo médio por frame, precisão na detecção de objetos e recompensa acumulada por episódio. O objetivo é comparar o desempenho das duas técnicas em termos de eficiência, escalabilidade e capacidade de aprendizado em um ambiente dinâmico e desafiador. Este estudo não apenas destaca o potencial do aprendizado
por reforço na robótica e em sistemas autônomos, mas também abre caminho para futuras pesquisas sobre a integração de técnicas de visão computacional e aprendizado de máquina em cenários complexos. A comparação entre Q-learning e DQN fornecerá insights valiosos sobre a escolha da abordagem mais adequada para diferentes
tipos de problemas, contribuindo para o avanço da inteligência artificial e da autonomia de sistemas.


MEMBROS DA BANCA:
Presidente - 1985872 - EDIMILSON BATISTA DOS SANTOS
Interno - 1849229 - DANIEL LUIZ ALVES MADEIRA
Interna - 1777390 - CAROLINA RIBEIRO XAVIER
Externo ao Programa - 1652537 - MARCOS ANTONIO DE MATOS LAIA
Notícia cadastrada em: 04/04/2025 10:15
SIGAA | NTInf - Núcleo de Tecnologia da Informação - +55(32)3379-5824 | Copyright © 2006-2025 - UFSJ - sigaa01.ufsj.edu.br.sigaa01