Workflows Multiagente com Small Language Models em ambientes HPC: análise de viabilidade, desempenho e reprodutibilidade no supercomputador Santos Dumont.
O avanço recente dos modelos de linguagem e das arquiteturas multiagente tem impulsionado o desenvolvimento de sistemas inteligentes capazes de executar tarefas complexas de forma colaborativa e distribuída. Entretanto, a utilização de Large Language Models (LLMs) em aplicações científicas ainda enfrenta desafios relacionados ao elevado custo computacional, consumo energético, dependência de serviços proprietários e riscos associados à privacidade dos dados processados. Nesse contexto, Small Language Models (SLMs) surgem como alternativa viável para execução local e em ambientes de Computação de Alto Desempenho (HPC), permitindo maior eficiência computacional e soberania tecnológica. Este trabalho propõe a adaptação e avaliação do framework multiagente DeerFlow 2.0 para execução distribuída no supercomputador Santos Dumont, utilizando o escalonador SLURM para gerenciamento de recursos computacionais em arquiteturas multi-nó e multi-GPU. A pesquisa investiga a integração de SLMs locais ao ambiente HPC, considerando bibliotecas modernas de inferência, mecanismos de orquestração multiagente e estratégias de paralelismo distribuído. Além disso, são avaliados aspectos relacionados ao desempenho, escalabilidade e utilização de recursos computacionais durante a execução de workflows inteligentes voltados à simplificação textual automática, onde são avaliados aspectos relacionados ao desempenho, escalabilidade, compatibilidade arquitetural e utilização de recursos computacionais durante a execução desses workflows multiagentes para a tarefa.