Banca de DEFESA: RODRIGO RIBEIRO CAPUTO

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : RODRIGO RIBEIRO CAPUTO
DATA : 17/02/2020
HORA: 14:00
LOCAL: Sala 1.05 Campus CTAN
TÍTULO:

Deep learning aplicado a dados estruturados como cubos OLAP


PALAVRAS-CHAVES:

-


PÁGINAS: 90
RESUMO:

O processo de Descoberta de Conhecimento de Bases de Dados (KDD) aplicado em dados estruturados é um desafio onde diversas abordagens já há algum tempo conseguiram relativo sucesso. Muitas destas abordagens baseiam-se no Aprendizado de Máquina tradicional e seus paradigmas. Já o processamento de dados não-estruturados teve sua popularização apenas recentemente, com o surgimento do Deep Learning, uma abordagem baseada em Redes Neurais Artificiais (RNAs). Embora as RNAs não sejam um método
novo, a evolução do poder computacional de forma acessível, em especial através das GPUs, juntamente com o surgimento de técnicas cada vez mais eficientes de otimização, impulsionaram suas aplicações de uma forma extraordinária em domínios como processamento de imagens, áudio, linguagem natural, dentre outros. Este trabalho busca investigar como estas novas técnicas podem ser aplicadas a fim de melhorar os resultados em modelos gerados sobre dados estruturados. Desta investigação, surgiu a proposta da OlapNet, uma arquitetura de Rede Neural Convolucional (CNN) que baseia-se em operações implícitas de
cubos de dados como entrada. Formalmente identificou-se que esta arquitetura é capaz se superar os resultados de um grupo específico de transformações realizadas sobre os dados, permitindo em partes a automação da etapa de transformação de dados no processo de KDD. Para verificar a proposta empiricamente, foi utilizada uma amostra de dados de uma base real contendo dados anonimizados do histórico de endividamento dos clientes de uma instituição financeira. A partir destes dados, foi modelado um problema de classificação preditiva para estimar a probabilidade de um cliente qualquer contratar novos créditos nos próximos três meses. Assim, foram utilizados métodos tradicionais de Aprendizado de
Máquina e variações de CNNs, incluindo a proposta deste trabalho. Os resultados mostraram que em quase todos os casos as CNNs superam os métodos tradicionais, indicando que os Features Maps gerados a partir dos kernels convolucionais aprendidos pela rede são capazes de extrair características relevantes. Estes kernels não somente permitem extrair características, como reduzem a complexidade da rede ao delimitar uma vizinhança para cada pixel e diminuem a propensão de ocorrer overfitting. Dentre as CNNs testadas, a
OlapNet supera todos os outros métodos, indicando que a arquitetura proposta é bastante promissora.


MEMBROS DA BANCA:
Presidente - 1985872 - EDIMILSON BATISTA DOS SANTOS
Externo à Instituição - LAURENCE RODRIGUES DO AMARAL - UFU
Interno - 1674068 - LEONARDO CHAVES DUTRA DA ROCHA
Externo ao Programa - 2141453 - MICHELLI MARLANE SILVA LOUREIRO
Notícia cadastrada em: 11/02/2020 11:47
SIGAA | NTInf - Núcleo de Tecnologia da Informação - +55(32)3379-5824 | Copyright © 2006-2021 - UFSJ - sigaa02.ufsj.edu.br.sigaa02