A qualidade de um sistema educacional depende, em grande medida, da qualidade de seus professores. E nos contextos mais vulneráveis, onde os recursos são limitados e as desigualdades se ampliam, apoiar a formação contínua dos docentes é uma tarefa urgente e complexa. Nos últimos anos, a Fundação ProFuturo fez disso sua razão de ser e atua em várias frentes para oferecer aos professores ferramentas digitais e programas formativos que lhes permitam aprimorar sua prática pedagógica e, com isso, a aprendizagem de milhões de crianças.
Uma dessas frentes é a pesquisa. Porque, além de ser uma organização educacional, a fundação investiga como os dados podem ajudar a compreender melhor o processo educativo. Por meio da Cátedra Telefónica ProFuturo-UPSA, Análise de Dados de Projetos Educacionais em Contextos Vulneráveis, a entidade criou um espaço de pesquisa aplicada em que estudantes universitários desenvolvem projetos que respondem a problemas reais da educação digital. Essa cátedra se consolidou como uma ponte entre a universidade e a ação social: um lugar onde a análise de dados, a inteligência artificial e as ciências da computação se colocam a serviço da melhoria educacional.
Neste artigo, apresentamos os resultados de dois trabalhos de conclusão de curso desenvolvidos nesse marco. O primeiro analisa mais de 250.000 registros da plataforma ProFuturo em cinco países latino-americanos para mapear os itinerários formativos dos docentes utilizando técnicas de graph mining. O segundo aplica algoritmos de machine learning e deep learning para prever a evasão nos cursos, alcançando taxas de acerto próximas a 90%.
Suas conclusões, além de oferecerem descobertas acadêmicas de grande interesse, permitem desenhar itinerários mais eficazes, antecipar riscos e otimizar recursos. Nas próximas linhas veremos como a pesquisa universitária pode se traduzir em soluções práticas para contar com mais e melhores professores nos lugares onde eles são mais necessários.
Análise de Dados na Educação
Cada vez que um professor acessa um curso digital, completa um módulo (ou o abandona no meio do caminho), deixa um rastro em forma de dado. Multiplicados por centenas de milhares de usuários e dezenas de países, esses rastros formam um fluxo de informações que, bem analisadas, podem revelar muito sobre como os docentes aprendem e do que necessitam. Assim, os registros acumulados se transformam em conhecimento útil para aprimorar a experiência formativa.
É aí que entra em cena a análise de dados. Nos últimos anos, o desenvolvimento de técnicas de machine learning, deep learning e mineração de dados abriu a porta para análises muito mais sofisticadas dos processos educativos. Hoje já é possível detectar padrões de comportamento, identificar fatores de risco e desenhar itinerários personalizados que se adaptem às necessidades de cada docente.
No caso do ProFuturo, essa capacidade analítica é especialmente valiosa. Sua plataforma, que funciona em contextos muito diversos e com milhares de professores em formação ao mesmo tempo, é capaz de coletar e armazenar milhões de dados das atividades que realizam. Antecipar a evasão, detectar cursos-chave nos trajetos de aprendizagem ou localizar gargalos são passos muito úteis para otimizar a oferta formativa e aumentar o impacto real nas salas de aula.
Os dois trabalhos de conclusão de curso (TCC) aqui apresentados são grandes exemplos disso. Ambos utilizam dados para melhorar a formação docente, mas abordam o desafio sob ângulos diferentes: um se concentra no caminho completo dos professores, e o outro no risco de perdê-los no percurso. Juntos, desenham um panorama complementar do que a análise de dados pode oferecer à educação digital.
Nos últimos anos, o desenvolvimento de técnicas de machine learning, deep learning e mineração de dados abriu a porta para análises muito mais sofisticadas dos processos educativos.
Itinerários Formativos de Docentes por meio do Graph Mining
O primeiro TCC analisa quais trajetórias os docentes seguem na plataforma ProFuturo e quais cursos fazem diferença no seu progresso. Para isso, o autor aplicou uma técnica amplamente utilizada em ciência de dados: a teoria dos grafos.
Nesse modelo, cada curso é representado como um nó, e os enlaces entre eles aparecem quando o mesmo docente cursou ambos. O resultado é um grafo: uma rede em que o tamanho dos nós reflete quantos professores passaram por aquele curso, e a espessura dos enlaces indica quantos seguiram o mesmo caminho. Ao analisar essa rede, surgem padrões que uma simples lista de registros jamais mostraria: quais cursos são mais centrais (nós de grande tamanho conectados a muitos outros), quais funcionam como “pontes” entre itinerários (aqueles que aparecem conectando diferentes comunidades de cursos) e quais grupos de cursos tendem a se agrupar de forma natural.
O estudo trabalhou com mais de 250.000 registros de docentes da Colômbia, Brasil, México, Peru e Chile. A partir daí, calcularam-se métricas de centralidade, intermediação e proximidade, e aplicou-se o algoritmo Girvan-Newman para detectar comunidades, ou seja, grupos de cursos que os docentes costumam cursar juntos com maior frequência e que revelam trajetórias naturais de aprendizagem além da organização formal do catálogo.
Por exemplo, a análise de grafos mostrou que os professores não se formam seguindo rotas arbitrárias, mas tendem a percorrer trajetórias bem definidas. Na Colômbia, a análise revelou duas comunidades destacadas em torno de Metodologias Educacionais Inovadoras. Dentro delas, apareceram itinerários muito seguidos, como o de competências digitais (de Áudio digital até Imagens interativas), cursado por dezenas de docentes, ou a rota que combina Aprendizagem cooperativa com Gamificação e níveis sucessivos de inovação.
No Peru, graças a um catálogo mais amplo (81 cursos), observaram-se trajetórias mais variadas e combinadas, com docentes alternando formação tecnológica e pedagógica. Por outro lado, no Chile, a oferta mais reduzida (48 cursos) limitou a rede de trajetórias, embora tenham sido identificadas sequências coerentes como Bullying escolar – Neurodidática – Dificuldades de aprendizagem. No Brasil e no México, surgiram itinerários consistentes em torno de competências digitais básicas e metodologias ativas, com cursos como Introdução à gamificação atuando como conector entre rotas.
O trabalho também propõe algumas sugestões metodológicas para refinar futuras análises: melhorar a atribuição de valores-limite que determinam quais cursos ou itinerários são representados, automatizar o cálculo das métricas da rede para facilitar seu uso em diferentes contextos, aperfeiçoar a categorização das comunidades detectadas e enriquecer a visualização dos grafos para que os resultados sejam mais claros e acessíveis.
Mais além dos resultados concretos, os achados desse TCC têm aplicações práticas evidentes para a gestão da formação docente no ProFuturo. Por exemplo:
- Dar prioridade estratégica aos cursos centrais. Os nós que aparecem no centro da rede — ou seja, cursos frequentados por muitos professores e conectados a numerosos itinerários — devem receber atenção especial. Isso implica mantê-los atualizados, garantir sua acessibilidade e reforçar seus materiais, porque funcionam como pilares estruturais da oferta.
- Formalizar itinerários recorrentes. As sequências de cursos que aparecem repetidamente em diferentes países constituem rotas de aprendizagem consolidadas na prática. Formalizá-las como itinerários recomendados pode ajudar a orientar melhor os novos docentes e aumentar as taxas de conclusão.
- Revisar os “cursos periféricos”. São aqueles pouco conectados ao restante da rede e que permanecem à margem do grafo. Isso não significa que não tenham valor, mas convida à reflexão: respondem a necessidades específicas? Deveriam ser integrados a itinerários mais amplos ou revisados para torná-los mais atraentes e relevantes?
- Adaptação por contexto. A análise comparativa entre países mostra diferenças claras: em alguns casos predominam as rotas digitais, em outros as pedagógicas. Não existe, portanto, um itinerário único válido para todos. Ajustar a oferta a cada contexto nacional pode aumentar tanto a participação quanto a eficácia dos programas.
- Base para decisões futuras. Mais além dos resultados imediatos, esse tipo de análise oferece ao ProFuturo uma ferramenta permanente para monitorar a evolução da formação, detectar mudanças nos padrões e planejar a ampliação do catálogo com base em evidências.
Previsão da evasão com Machine Learning
O segundo TCC aborda outro desafio fundamental da formação digital de professores: a evasão. Parte dos docentes que iniciam um curso o interrompe antes de concluí-lo. Compreender por que isso acontece e, sobretudo, antecipar o problema é essencial para desenhar programas mais eficazes.
O trabalho utiliza a plataforma Moodle do ProFuturo e aplica técnicas de aprendizado de máquina (machine learning) e estatística avançada para identificar quais docentes têm maior probabilidade de abandonar um curso: se pudermos prever a evasão com antecedência suficiente, é possível ativar mecanismos de apoio e aumentar a taxa de conclusão.
O estudo começou com a limpeza e preparação dos dados. A partir daí, foram identificadas e avaliadas múltiplas variáveis potencialmente relacionadas à evasão, como a frequência de acesso à plataforma, o número de atividades realizadas ou o tempo de conexão.
Para determinar quais variáveis eram mais relevantes na previsão da evasão, foram utilizadas técnicas estatísticas (como o teste do qui-quadrado e a informação mútua), bem como modelos preditivos (como a regressão logística e o Random Forest).
Os modelos preditivos aplicados aos dados da plataforma demonstraram que é possível antecipar com alta precisão (cerca de 90%) quais docentes irão interromper um curso. O achado mais marcante é que o decisivo não é simplesmente aprovar ou reprovar ao final, mas sim a evolução da participação durante o curso: acessos que se tornam menos frequentes, atividades que deixam de ser concluídas, interação que diminui com o tempo. Esses sinais precoces explicam muito melhor a evasão do que a nota final. Além disso, o modelo distingue entre aqueles que realmente abandonam e aqueles que apenas se atrasam, evitando inflar artificialmente o problema.
Os resultados desse TCC também oferecem um amplo leque de aplicações práticas para o ProFuturo:
- Sistemas de alerta precoce. Com modelos preditivos precisos, é possível gerar alertas automáticos quando um professor apresenta sinais de evasão, permitindo intervir a tempo.
- Estratégias personalizadas de retenção. Saber quais docentes têm maior risco facilita a alocação de recursos como tutorias específicas, lembretes ou reforço em conteúdos-chave.
- Otimização de recursos. Prever a evasão ajuda a concentrar esforços onde eles podem ter mais impacto, em vez de aplicar medidas gerais a toda a população.
- Melhoria da experiência formativa. Conhecer os fatores que mais influenciam a desistência permite redesenhar cursos mais atraentes e acessíveis.
A união entre pesquisa e ação social
Esses dois trabalhos de conclusão de curso apresentados no âmbito da Cátedra Telefónica ProFuturo UPSA apontam na mesma direção: os dados não são um produto colateral da educação digital, mas sim uma ferramenta para melhorá-la.
Mas mais além dos resultados concretos, o valor desses trabalhos reside no que eles representam: a união entre a pesquisa universitária e a ação social. O uso do conhecimento colocado a serviço de um objetivo maior: melhorar a qualidade educacional justamente onde ela é mais necessária.