Más y mejores docentes gracias a la analítica de datos

La formación de los docentes es uno de los grandes determinantes de la calidad educativa. Pero en muchos países vulnerables, mantener esa formación y evitar el abandono sigue siendo un reto. La Cátedra ProFuturo UPSA Telefónica ha analizado miles de registros de la plataforma digital de ProFuturo para entender cómo se forman los docentes y por qué algunos interrumpen el proceso. Los resultados apuntan a soluciones prácticas: itinerarios más eficaces, detección temprana del abandono y programas personalizados. Una demostración de cómo la investigación aplicada puede mejorar la educación allí donde más falta hace.

Más y mejores docentes gracias a la analítica de datos

La calidad de un sistema educativo depende, en buena medida, de la calidad de sus docentes. Y en los contextos más vulnerables, donde los recursos son limitados y las desigualdades se amplifican, apoyar la formación continua de los maestros es una tarea inaplazable y compleja. En los últimos años, la Fundación ProFuturo ha hecho de ello su razón de ser y trabaja en varios frentes para dotar a los docentes de herramientas digitales y programas formativos que les permitan mejorar su práctica pedagógica y, con ello, el aprendizaje de millones de niños.

Cátedra UPSA ProFuturoUno de esos frentes es la investigación. Porque, además de una organización educativa, esta fundación investiga cómo los datos pueden ayudar a comprender mejor el proceso educativo. A través de la Cátedra Telefónica ProFuturo-UPSA, Analítica de datos de proyectos educativos en entornos vulnerables, la entidad ha impulsado un espacio de investigación aplicada en el que estudiantes universitarios desarrollan proyectos que responden a problemas reales de la educación digital.

Esta cátedra se ha convertido en un puente entre la universidad y la acción social: un lugar donde la analítica de datos, la inteligencia artificial y las ciencias de la computación se ponen al servicio de la mejora educativa.

En este artículo presentamos los resultados de dos trabajos de fin de grado desarrollados en este marco. El primero analiza más de 250.000 registros de la plataforma de ProFuturo en cinco países latinoamericanos para mapear los itinerarios formativos de los docentes mediante técnicas de graph mining. El segundo aplica algoritmos de machine learning y deep learning para predecir el abandono en los cursos, alcanzando tasas de acierto cercanas al 90%.

Sus conclusiones, además de ofrecernos algunos hallazgos académicos más que interesantes, permiten diseñar itinerarios más eficaces, anticipar riesgos y optimizar recursos. En las próximas líneas veremos cómo la investigación universitaria puede traducirse en soluciones prácticas para contar con más y mejores docentes en los lugares donde más se necesitan.

Analítica de datos en educación

Cada vez que un docente accede a un curso digital, completa un módulo (o lo abandona a mitad de camino, deja una huella en forma de dato. Multiplicadas por cientos de miles de usuarios y decenas de países, esas huellas conforman un caudal de información que, bien analizado, puede revelar mucho sobre cómo aprenden y qué necesitan los profesores. De esta manera, los registros acumulados se transforman en conocimiento útil para mejorar la experiencia formativa.

Y ahí es donde entra en juego la analítica de datos. En los últimos años, el desarrollo de técnicas de machine learning, deep learning y minería de datos ha abierto la puerta a la elaboración de análisis mucho más sofisticados de los procesos educativos. Por ejemplo, hoy es posible detectar patrones de comportamiento, identificar factores de riesgo y diseñar itinerarios personalizados que se adapten a las necesidades de cada docente.

En el caso de ProFuturo, esta capacidad analítica es especialmente valiosa. Su plataforma, que funciona en contextos muy diversos y con miles de docentes en formación al mismo tiempo, es capaz de recolectar y almacenar millones de datos de las actividades que estos realizan. Anticipar el abandono, detectar cursos clave en los trayectos de aprendizaje o localizar cuellos de botella son pasos muy útiles para optimizar la oferta formativa y aumentar el impacto real en las aulas.

Los dos trabajos de fin de grado (TFG) que aquí se presentan son grandes ejemplos de esto. Ambos usan datos para mejorar la formación docente, pero lo abordan desde ángulos distintos: uno se centra en el camino completo de los docentes y el otro aborda el riesgo de perderlos por el camino. Y juntos dibujan un panorama complementario de lo que la analítica puede aportar a la educación digital.

En los últimos años, el desarrollo de técnicas de machine learning, deep learning y minería de datos ha abierto la puerta a la elaboración de análisis mucho más sofisticados de los procesos educativos.

Itinerarios formativos de docentes mediante graph mining

El primer TFG analiza qué trayectorias siguen los docentes en la plataforma de ProFuturo y qué cursos marcan la diferencia en su progreso. Para ello, el autor aplicó una técnica de análisis muy extendida en ciencia de datos: la teoría de grafos.

En este modelo, cada curso se representa como un nodo y los enlaces entre ellos aparecen cuando un mismo docente ha cursado ambos. El resultado es un grafo: una red en la que el tamaño de los nodos refleja cuántos docentes han pasado por ese curso y el grosor de los enlaces indica cuántos han seguido ese mismo camino. Al analizar esta red se obtienen patrones que una simple lista de registros nunca mostraría: qué cursos son más centrales (nodos de gran tamaño conectados a muchos otros), cuáles funcionan como “puentes” entre itinerarios (aquellos que aparecen enlazando distintas comunidades de cursos) y qué comunidades de cursos tienden a agruparse de manera natural.

El estudio trabajó con más de 250.000 registros de docentes de Colombia, Brasil, México, Perú y Chile. A partir de ahí se calcularon métricas de centralidad, intermediación y cercanía, y se aplicó un algoritmo (Girvan-Newman) para detectar comunidades, es decir, grupos de cursos que los docentes suelen cursar juntos con mayor frecuencia, y que revelan trayectorias naturales de aprendizaje más allá de la organización formal del catálogo.

Por ejemplo, el análisis de grafos permitió comprobar que los docentes no se forman siguiendo rutas arbitrarias, sino que tienden a recorrer trayectorias bien definidas. Así, en Colombia, el análisis mostró dos comunidades destacadas en torno a Metodologías Educativas Innovadoras. Dentro de ellas aparecieron itinerarios muy seguidos, como el de competencias digitales (desde Audio digital hasta Imágenes interactivas), cursado por decenas de docentes, o la ruta que combina Aprendizaje cooperativo con Gamificación y niveles sucesivos de innovación.

Los docentes en Perú, gracias a un catálogo más amplio (81 cursos), ejecutaban trayectorias más variadas y combinadas, con docentes que alternaban formación tecnológica y pedagógica. Sin embargo, en Chile,  la oferta reducida (48 cursos) limitó la red de trayectorias, aunque se identificaron secuencias coherentes como Acoso escolar Neurodidáctica Dificultades de aprendizaje. En Brasil y México, surgieron itinerarios consistentes en torno a competencias digitales básicas y metodologías activas, con cursos como Introducción a la gamificación actuando como conector entre rutas.

El trabajo también plantea algunas sugerencias metodológicas para afinar futuros análisis: mejorar la asignación de los valores umbrales que determinan qué cursos o itinerarios se representan, automatizar el cálculo de las métricas de red para facilitar su uso en distintos contextos, perfeccionar la categorización de comunidades detectadas y enriquecer la visualización de los grafos para que los resultados sean más claros y accesibles.

Más allá de los resultados concretos del análisis, los hallazgos de este TFG tienen aplicaciones prácticas evidentes para la gestión de la formación docente en ProFuturo. Por ejemplo:

  • Dar prioridad estratégica a los cursos identificados como centrales. Los nodos que aparecen en el centro de la red, esto es, aquellos cursados por muchos docentes y conectados con numerosos itinerarios, deben ser objeto de especial atención. Esto implica mantenerlos actualizados, garantizar su accesibilidad y reforzar sus materiales, porque funcionan como ejes estructurales de la oferta.
  • Formalizar los itinerarios recurrentes. Las secuencias de cursos que aparecen repetidamente en distintos países constituyen rutas de aprendizaje consolidadas en la práctica. Formalizarlas como itinerarios recomendados puede ayudar a guiar mejor a los nuevos docentes y aumentar las tasas de finalización.
  • Revisar los “cursos periféricos”. Son aquellos que aparecen poco conectados con el resto de la red y quedan en los márgenes del grafo. No significa que carezcan de valor, pero sí nos invitan a replantearnos su razón de ser: ¿responden a necesidades específicas? ¿Deberían integrarse en itinerarios más amplios o revisarse para hacerlos más atractivos y relevantes?
  • Adaptación por contexto. El análisis comparado entre países muestra diferencias claras: en unos casos predominan las rutas digitales, en otros las pedagógicas. No existe, por tanto, un itinerario único válido para todos. Ajustar la oferta a cada contexto nacional puede aumentar tanto la participación como la efectividad de los programas.
  • Base para decisiones futuras. Más allá de los resultados inmediatos, este tipo de análisis ofrece a ProFuturo una herramienta permanente para monitorizar la evolución de la formación, detectar cambios en los patrones y planificar la ampliación del catálogo con criterios basados en evidencias.

Predicción del abandono formativo con machine learning

El segundo TFG aborda otro reto fundamental de la formación digital docente: el abandono. Una parte de los profesores que inician un curso lo interrumpe antes de completarlo. Comprender por qué ocurre esto y, sobre todo, anticiparlo, es clave para diseñar programas más eficaces.

El TFG utiliza la plataforma Moodle de ProFuturo y aplica técnicas de aprendizaje automático (machine learning) y estadística avanzada para identificar qué docentes tienen mayor probabilidad de abandonar un curso: si podemos predecir el abandono con suficiente antelación, es posible activar mecanismos de apoyo y aumentar la tasa de finalización.

El trabajo comenzó con la limpieza y preparación de los datos. A partir de ahí, se identificaron y evaluaron múltiples variables potencialmente relacionadas con el abandono, como la frecuencia de acceso a la plataforma, el número de actividades realizadas o el tiempo de conexión.

Para determinar qué variables eran más relevantes a la hora de predecir el abandono, se usaron técnicas estadísticas (como la prueba de chi-cuadrado y la información mutua), así como modelos predictivos (como la regresión logística y el Random Forest).

Los modelos predictivos aplicados a los datos de la plataforma demostraron que es posible anticipar con alta precisión (un 90%) qué docentes interrumpirán un curso. El hallazgo más llamativo es que lo decisivo no es el simple hecho de aprobar o no aprobar al final, sino la evolución de la participación durante el curso: accesos que se espacian, actividades que dejan de completarse, interacción que disminuye con el tiempo. Esas señales tempranas explican mucho mejor el abandono que la nota final. El modelo, además, distingue entre quienes realmente abandonan y quienes simplemente se retrasan, lo que evita sobredimensionar el problema.

Los resultados de este TFG también ofrecen un buen abanico de aplicaciones prácticas para ProFuturo:

  • Sistemas de alerta temprana. Con modelos predictivos precisos, se pueden generar avisos automáticos cuando un docente muestra señales de abandono, lo que permitiría intervenir a tiempo.
  • Estrategias de retención personalizadas. Saber qué docentes tienen mayor riesgo facilita asignar recursos como tutorías específicas, recordatorios o refuerzo en contenidos clave.
  • Optimización de recursos. Predecir el abandono ayuda a concentrar esfuerzos donde más impacto pueden tener, en lugar de aplicar medidas generales a toda la población.
  • Mejora de la experiencia formativa. Conocer los factores que más influyen en la deserción permite rediseñar cursos más atractivos y accesibles.

La unión entre investigación y acción social

Estos dos trabajos de fin de grado presentados en el marco de la Cátedra Telefónica ProFuturo UPSA apuntan en la misma dirección: los datos no son un producto colateral de la educación digital, sino una herramienta para mejorarla.

Pero más allá de los resultados concretos, el valor de estos trabajos reside en lo que representan: la unión entre investigación universitaria y acción social. El uso del conocimiento para ponerlo al servicio de un objetivo mayor: mejorar la calidad educativa allí donde más se necesita.

También podría interesarte