Explorando o espaço de ordenação de variáveis por meio de coeficientes de correlação e seleção de atributos para otimização do aprendizado de redes Bayesianas
Redes Bayesianas, Aprendizado de Estruturas, Ordenação de Variáveis
O aprendizado de redes Bayesianas a partir de dados é um problema NP-Completo e não há métodos computacionais capazes de identificar a melhor solução para todos os problemas de aplicação. Uma restrição comum nestes algoritmos de aprendizado é a ordenação prévia das variáveis utilizadas na definição do problema. As ordenações das variáveis representam os possíveis relacionamentos entre as variáveis na formação da estrutura da rede Bayesiana que descreve o problema. Utilizando uma ordenação adequada das variáveis, os algoritmos de aprendizado são capazes de encontrar uma solução mais eficiente. Sendo assim, é proposto, neste trabalho, o uso de métodos de seleção de atributos e correlação para identificar uma ordenação adequada de variáveis, visando à otimização do aprendizado de estruturas de redes Bayesianas. Nos experimentos iniciais, foram aplicados o método de seleção de atributos chamado Boruta e os métodos de correlação de Pearson e Spearman para gerar diferentes ordenações que serviram de entrada para o K2. Os resultados apresentados sugerem que a metodologia proposta é promissora e pode melhorar o desempenho do algoritmo K2.