Evasão estudantil. COVID-19. Aprendizado de Máquina. CRISP-DM.
A evasão estudantil consiste no abandono dos estudos por parte de estudantes formalmente matriculados. Este fenômeno é influenciado por diferentes fatores, como a perda de interesse, dificuldades financeiras, falta de investimentos e políticas adequadas, entre outros. Os impactos da evasão alcançam diferentes níveis, desde a formação interrompida do estudante, o desperdício de recursos e até a sociedade, que perde um futuro profissional. Embora a análise da evasão seja uma tarefa complexa, o avanço de técnicas computacionais como inteligência artificial têm possibilitado a análise e inferência a partir de dados, visando a compreensão e até predição desse fenômeno. Este trabalho tem como objetivo prever a evasão no contexto do ensino superior da Universidade Federal de São João del-Rei (UFSJ) considerando períodos antes e durante a pandemia da COVID-19, através da aplicação de técnicas de aprendizado de máquina. Além disso, avaliar as principais variáveis relacionadas ao fenômeno da evasão em ambos os períodos em busca de diferenças. Dados de estudantes formados, evadidos e matriculados entre os anos de 2018 e 2021 dos cursos de graduação presencial da UFSJ são incluídos na análise e criação dos modelos de predição. Variáveis sociodemográficas, informações relacionadas ao curso e desempenho do estudante são selecionadas como possíveis preditoras. A análise inicial dos dados permitiu avaliar a qualidade dos dados disponíveis, a distribuição de frequência das variáveis e realizar sua preparação. A base de dados após a preparação conta com 10657 registros e 23 variáveis além da variável resposta, permitindo seguir para as próximas etapas da metodologia para criação de modelos de predição.