fbpx
Educación SuperiorTecnología

Datos necesarios para un modelo de AI exitoso en Universidades

A menudo nos consultan cuánta información necesita un modelo de inteligencia artificial para realizar un buen análisis de datos. De hecho, la preocupación suele girar en torno a la creencia de no poseer información suficiente. La confusión que suele generar este tópico es común y por eso, queremos adentrarnos en el tema para aclarar dudas y derribar algunos mitos.

Para comenzar, veamos brevemente por qué la clave principal de todo el proceso es hacer hincapié en reunir información de calidad y no solamente, en reunir información.

Sabemos que la base de todo modelo predictivo es la información, pero que justamente, no termina allí. Para explicarlo de un modo simple, podemos referirnos al concepto GIGO (por sus siglas en inglés garbage in – garbage out). Este concepto explica de manera clara que, si la información que se recolecta no es de calidad, tampoco lo será el resultado que arroje el análisis: si entra basura, sale basura. Simplemente, para un buen resultado, los datos a analizar deben estar enfocados a lo que realmente necesitamos.

Así de fácil podemos comenzar mostrando la relevancia de una correcta recopilación de información para obtener un buen resultado. Es necesario ir en busca de datos útiles que se logren administrar correctamente para evitar perderse en un sinfín de datos que eventualmente no solo no llevan a ningún lado, sino que, además, suelen trabar el proceso. Toda información que no sea útil, sólo genera confusión.

No obstante, es necesario ver en detalle todos los factores que se ven involucrados para, una vez detectados los datos que sí son importantes, integrarlos de manera asertiva y eficiente con el fin de que arrojen resultados útiles.

Fuente u origen de datos: ¿qué tipos de datos se pueden conseguir?

Para adentrarnos en el tema, hablemos primero de los tipos de información que se recolectan y de dónde provienen. En primer lugar, debemos referirnos a información personal y demográfica que se obtiene a través de SIS, CRM y LMS de la institución.

En segundo lugar, debemos enfocarnos en datos de comportamiento. En este punto, nos referimos a la interacción entre el estudiante y las plataformas virtuales de la institución, como chatbot, plataformas de aprendizaje, seminarios en línea, encuestas, entre otras. Lo interesante de este apartado es que aquí podemos descubrir el interés del alumno por sus estudios y por la institución.

En tercer lugar, tenemos los datos de interacción o intercomunicación. Aquí, hacemos foco en los puntos de contacto del alumno con la institución. Es decir, vemos la relación del alumno con la gestión académica, cobranza, asesores académicos y demás. Como en esta interacción hay intercambio de llamadas, emails, WhatsApp, esta información queda registrada en un CRM. Es decir, de alguna manera debería estar disponible para todos.

Si bien recopilar e integrar los datos recabados de estas tres categorías da un buen resultado, no podemos decir que sea necesaria para construir modelos de rendimiento. Pero, si incluimos variedad de información socio-demográfica y económica, establecemos una buena base de datos para los algoritmos de aprendizaje automático.

Aunque estas variables tienden a ser principalmente predictivas en lugar de descriptivas, siguen siendo útiles para comprender la población estudiantil y las características que impulsan a esas personas a inscribirse, graduarse, etcétera.

Luego, una vez que esa base de datos esté disponible, podremos complementarla con información recabada de fuentes externas para así, asegurarnos de mirar todo el contexto en que ese alumno se mueve. Es decir, generar conocimientos que tienden a ser más prácticos al introducir características prescriptivas

De este modo, al entender al alumno y su interacción con la institución académica, pero, además, entender todo su contexto, será posible brindarle soluciones factibles y personalizadas.

Ahora bien, estos son conceptos básicos que probablemente ya conozcan. Pero, vale hacernos las siguientes preguntas: ¿Sirve realmente toda la información que entra? ¿Qué hacemos con todo este flujo de información que reunimos? Estas preguntas nos llevan al siguiente punto: enfocarse en una buena estructura de datos para tener toda la información organizada y así, saber qué sirve y qué no.

Cantidad vs calidad de información

Tener una buena base de datos es más que relevante, pero hasta cierto punto. O, mejor dicho, será relevante si es de buena calidad. ¿Qué quiere decir esto? Que es primordial entender que no toda información sirve y, más importante aún, que será clave decidir qué información de toda la que reunimos es realmente útil y debe ser analizada y cuál debe ser apartada para otro momento y otros usos.

Pero es precisamente aquí, en donde queremos poner nuestra atención para explicar cómo funciona.

Por supuesto, conseguir una base de datos organizada y completa no sucede de la noche a la mañana, por lo que debemos recordar que todo proceso tiene un principio. En materia de gobierno de datos, no solo es posible, sino que se debe iniciar el proceso con el caudal de información que ya exista, sin importar si es considerado “bajo”. Veamos el por qué:

Si bien al crear un modelo predictivo se comienza con la información que ya existe, se espera que con el paso del tiempo se susciten cambios y, eventualmente, nuevas variables comiencen a mostrarse. Hemos comprobado que comenzar con un bajo flujo de información y agregar las nuevas variables a medida que surgen nos da un buen resultado a lo largo de todo el proceso. Que ese agregado de variables sea paulatino es parte de la clave del éxito ya que el modelo predictivo de AI es justamente lo que nos ayuda a enfocarnos en la información que es realmente útil para nuestra institución.  

Para explicarlo mejor, podemos decir que la cantidad es importante hasta cierto punto. Es muy posible y probable que 25 variables demográficas / personales capturen adecuadamente la misma cantidad de información que 100 variables. Por ejemplo, una variedad de variables capturan la ubicación de un individuo, incluida la ciudad, estado, código postal, país, región, longitud, latitud, etc. Cada una de estas variables representa piezas de información muy similares, y una vez que se han incorporado algunos elementos , se vuelve menos importante introducir elementos adicionales. Lo mismo puede decirse de años de datos. En una situación ideal, se utilizarían 2-3 años de datos para construir modelos, pero un año de datos puede ser suficiente. 

De este modo, nos ahorramos grandes dolores de cabeza y frustración al enfocarnos desde el comienzo solo en la información que realmente sirve. También, al ir agregando variables de manera orgánica, será mucho más fácil entenderlas y, en consecuencia, buscar soluciones acordes.

Con este factor en mente, cabe destacar que es importante mantener esa calidad en la información a través del tiempo para que muestre resultados reales. Por ejemplo, es inevitable que a través del tiempo la forma de recabar información cambie de alguna manera. Aquí mismo es donde radica la importancia de los modelos predictivos. Si el modelo es bueno, será posible lograr una buena fluidez de recopilación de datos que facilitará el proceso para medir esas nuevas variables sin importar el contexto. De hecho, un buen modelo predictivo se nutrirá de nuevos contextos y variables.

Entonces, ¿qué información buscar?

La respuesta a esta pregunta resultará de lo que muestre la gestión de datos ya que depende de cada institución académica y las variables que se manejen. Por esto, ponemos foco en la importancia de comenzar con la información que ya existe y partir desde allí.  

Pero, hay un punto que vale la pena mencionar y es que para que los modelos hagan predicciones y prescripciones realistas nunca se deben cambiar o eliminar los datos existentes.

Por ejemplo, si se le ofrece ayuda financiera a un posible estudiante, pero este decide inscribirse en otro lugar, no sería correcto eliminar la ayuda ofrecida de los datos. Esa información dice algo sobre cuán efectiva es esa ayuda para ese tipo de estudiante en particular. Si bien esto puede parecer algo obvio, vemos en la práctica que es algo que sucede con regularidad.

Siguiendo este lineamiento, hablemos ahora de otro punto de preocupación relacionado con una gestión de datos que recopile información a gran escala. A raíz de esto, solemos recibir consultas sobre si manejar esa gran base de datos provoca que se pierda la personalización en la atención a los alumnos. En realidad, sucede todo lo contrario. Actualmente, la tecnología nos permite entender lo que cada alumno busca o necesita y brindarle las soluciones customizadas. Pero incluso, gracias a los modelos predictivos de AI, se puede ir un paso más allá y personalizar, por ejemplo, el medio por el que se le brinda esa solución. Es decir, al poder abarcar tanta información de manera ordenada y prolija, es posible adelantarse y ofrecer la posibilidad a cada estudiante de elegir cómo recibir esa información y cuándo. Ellos son los que nos dirán en qué momento desean recibir la información o por qué medio, por ejemplo.

Claramente, la inteligencia artificial tiene la capacidad de beneficiar y facilitar el camino para ambas partes. Después de todo, no debemos olvidar que ese alumno llega a nuestra institución buscando inscribirse a una carrera y, será decisivo tener la información que busca al alcance de su mano. Así como nosotros nos podemos beneficiar de AI para entender lo que un alumno necesita, ese alumno se beneficiará y nos elegirá si somos capaces de usar correctamente esa información y adelantarnos a sus problemáticas con soluciones factibles.

Para finalizar, solo queda recordar que lo importante al crear un modelo predictivo es simplemente empezar. Sin preocuparse tanto por la información que se tiene, sino por enfocarse en el proceso y lo que suceda en él. Será ese proceso el que nos indicará qué camino tomar según lo que nuestros estudiantes necesiten.

Si partimos de la base de que todo proceso lleva tiempo, podemos entender que simplemente hay que tomar la decisión de iniciar el camino y disfrutar el viaje con la certeza de que comenzar es el primer paso para gestionar de manera asertiva un modelo predictivo basado en AI.

close

Hola 👋
Un placer conocerte.

Regístrate gratis para recibir toda la información sobre eventos educativos, cursos, noticias y recursos para educadores.

¡No enviamos spam! Lee nuestra política de privacidad para más información.

Mostrar más

Ed Machina

Somos parte del vertical EdTech del grupo R’Evolution, con más de 25 años de trayectoria entre instituciones universitarias, terciarias, institutos técnicos y lifelong learning. En Ed Machina optimizamos la gestión educativa de las instituciones de educación superior, a través de analítica avanzada de datos y modelos predictivos con AI.

Publicaciones relacionadas

Deja un comentario

Botón volver arriba
X