Deep learning aplicado a dados estruturados como cubos OLAP
-
O processo de Descoberta de Conhecimento de Bases de Dados (KDD) aplicado em dados estruturados é um desafio onde diversas abordagens já há algum tempo conseguiram relativo sucesso. Muitas destas abordagens baseiam-se no Aprendizado de Máquina tradicional e seus paradigmas. Já o processamento de dados não-estruturados teve sua popularização apenas recentemente, com o surgimento do Deep Learning, uma abordagem baseada em Redes Neurais Artificiais (RNAs). Embora as RNAs não sejam um método
novo, a evolução do poder computacional de forma acessível, em especial através das GPUs, juntamente com o surgimento de técnicas cada vez mais eficientes de otimização, impulsionaram suas aplicações de uma forma extraordinária em domínios como processamento de imagens, áudio, linguagem natural, dentre outros. Este trabalho busca investigar como estas novas técnicas podem ser aplicadas a fim de melhorar os resultados em modelos gerados sobre dados estruturados. Desta investigação, surgiu a proposta da OlapNet, uma arquitetura de Rede Neural Convolucional (CNN) que baseia-se em operações implícitas de
cubos de dados como entrada. Formalmente identificou-se que esta arquitetura é capaz se superar os resultados de um grupo específico de transformações realizadas sobre os dados, permitindo em partes a automação da etapa de transformação de dados no processo de KDD. Para verificar a proposta empiricamente, foi utilizada uma amostra de dados de uma base real contendo dados anonimizados do histórico de endividamento dos clientes de uma instituição financeira. A partir destes dados, foi modelado um problema de classificação preditiva para estimar a probabilidade de um cliente qualquer contratar novos créditos nos próximos três meses. Assim, foram utilizados métodos tradicionais de Aprendizado de
Máquina e variações de CNNs, incluindo a proposta deste trabalho. Os resultados mostraram que em quase todos os casos as CNNs superam os métodos tradicionais, indicando que os Features Maps gerados a partir dos kernels convolucionais aprendidos pela rede são capazes de extrair características relevantes. Estes kernels não somente permitem extrair características, como reduzem a complexidade da rede ao delimitar uma vizinhança para cada pixel e diminuem a propensão de ocorrer overfitting. Dentre as CNNs testadas, a
OlapNet supera todos os outros métodos, indicando que a arquitetura proposta é bastante promissora.