Analítica de Aprendizaje aplicando Aprendizaje Automático
Analítica de Aprendizaje aplicando Aprendizaje Automático.ipynb
Analítica de Aprendizaje aplicando Aprendizaje Automático
Paso 1: Definición
del Proyecto
Objetivo: Analizar y
predecir el rendimiento de los estudiantes en un curso virtual.
Paso 2: Creación
de un Dataset Ficticio
Características
del Dataset:
ID_Estudiante: Identificador
único para cada estudiante.
Edad: Edad del
estudiante.
Género: Género del
estudiante.
Horas_Estudio_Semana: Horas dedicadas
al estudio por semana.
Participación_Foro: Número de
participaciones en foros del curso.
Tareas_Entregadas: Número de tareas
entregadas.
Calificación_Promedio: Promedio de
calificaciones en tareas.
Examen_Final: Calificación en
el examen final.
Aprobado: Indica si el
estudiante aprobó (1) o no (0).
Generaré un
dataset ficticio con estas características.
Paso 3: Análisis
Exploratorio de Datos
Se realizará un
análisis exploratorio usando Python para entender mejor los datos.
Paso 4:
Preprocesamiento de Datos
Incluye la
limpieza de datos, la transformación de variables categóricas, y la
normalización de datos.
Paso 5: Modelado
de Aprendizaje Automático
Usaremos un modelo
de clasificación para predecir si un estudiante aprobará o no basándonos en sus
características.
Paso 6: Evaluación
del Modelo
Se evaluará el
modelo usando métricas como precisión, recall, y el área bajo la curva ROC.
Paso 7:
Interpretación de Resultados
Interpretar los
resultados y cómo pueden aplicarse en un contexto educativo.
Ahora, voy a crear
un dataset ficticio y te proporcionaré un script básico en Python para cada
paso. También te daré un enlace para que puedas descargarlos. Comenzaré con la
generación del dataset.
He creado un
dataset ficticio para el proyecto de Analítica de Aprendizaje. Puedes descargar
el dataset desde el siguiente enlace:
Descargar Dataset Ficticio
A continuación, te
proporcionaré un script básico en Python para cada una de las etapas del
proyecto (Análisis Exploratorio, Preprocesamiento, Modelado y Evaluación). Este
script servirá como punto de partida para tu investigación y desarrollo en el
campo de la IA aplicada a la educación superior.
Voy a preparar el
script y luego te daré un enlace para descargarlo también.
import pandas as pd
import numpy as np
# Semilla para reproducibilidad
np.random.seed(42)
# Tamaño del dataset
n = 100
# Creando el dataset ficticio
data = {
"ID_Estudiante":
np.arange(1,
n + 1),
"Edad":
np.random.randint(18,
50, n),
"Género":
np.random.choice(["Femenino",
"Masculino"],
n),
"Horas_Estudio_Semana":
np.random.randint(0,
20, n),
"Participación_Foro":
np.random.randint(0,
50, n),
"Tareas_Entregadas":
np.random.randint(0,
10, n),
"Calificación_Promedio":
np.random.uniform(0,
10, n),
"Examen_Final":
np.random.uniform(0,
10, n),
}
# Aprobado si la calificación promedio y el examen
final son mayores o iguales a 5
data["Aprobado"]
= ((data["Calificación_Promedio"]
>= 5)
& (data["Examen_Final"]
>= 5)).astype(int)
# Creando el DataFrame
df = pd.DataFrame(data)
# Guardando el dataset en un archivo CSV
csv_path = '/content/dataset_analitica_aprendizaje.csv'
df.to_csv(csv_path, index=False)
csv_path
He preparado un script básico en Python que cubre las etapas de Análisis Exploratorio, Preprocesamiento, Modelado y Evaluación para el proyecto de Analítica de Aprendizaje. Puedes descargar el script desde el siguiente enlace:
Descargar Script Python
Este script es un
buen punto de partida para tu investigación. Puedes modificarlo y ampliarlo
según tus necesidades y objetivos de estudio. ¡Espero que te sea útil en tu
camino hacia la maestría y tu capacitación en IA! Si tienes más preguntas o
necesitas asistencia adicional, no dudes en preguntar.
Análisis
descriptivo de los datos del dataset que creamos
Este análisis
incluirá estadísticas descriptivas básicas y la generación de algunos gráficos
para visualizar la distribución y relaciones entre las variables.
Análisis
Estadístico Descriptivo
Medidas de
Tendencia Central:
Promedio y Mediana.
Medidas de
Dispersión:
Desviación estándar, Mínimo, Máximo.
Distribución de
Frecuencias:
Para variables categóricas como Género y Aprobado.
Visualizaciones
Gráficas
Histogramas: Para entender la
distribución de variables continuas como Edad, Horas de Estudio y
Calificaciones.
Diagramas de Caja
(Boxplots):
Para visualizar la dispersión y detectar valores atípicos.
Gráficos de
Barras:
Para variables categóricas.
Voy a realizar
estos análisis utilizando el dataset que hemos creado. Empezaré con las
estadísticas descriptivas y luego generaré los gráficos.
He
completado el análisis de datos con estadística descriptiva. Aquí tienes los
resultados:
Estadísticas
Descriptivas
Edad: Varía entre 18 y
49 años, con un promedio de aproximadamente 34 años.
Horas
de Estudio por Semana: Promedio de 9 horas, con una variación de 0 a 19
horas.
Participación
en Foros:
En promedio, 26 participaciones, con un rango de 0 a 48.
Tareas
Entregadas:
Un promedio de 5 tareas, con valores de 0 a 9.
Calificación
Promedio y Examen Final: Ambos alrededor de 5, con calificaciones que van
desde casi 0 hasta casi 10.
Aprobados: Solo el 24% de
los estudiantes aprobaron.
Gráficos
Los
gráficos proporcionan una representación visual de estas estadísticas. Puedes
descargar y visualizar los gráficos desde el siguiente enlace:
Descargar Gráficos del Análisis
Estos gráficos
incluyen histogramas de distribuciones de edad, horas de estudio,
calificaciones y gráficos de barras para género y aprobados. Esto te dará una
buena visión general de los datos y te ayudará a identificar patrones y áreas
de interés para investigaciones más profundas.
Si necesitas más
detalles o análisis específicos, házmelo saber. ¡Estoy aquí para ayudarte!
import
matplotlib.pyplot as
plt
import seaborn as sns
# Cargando el dataset
df = pd.read_csv('/content/dataset_analitica_aprendizaje.csv')
# Estadísticas descriptivas
descriptive_stats = df.describe()
# Histogramas para variables continuas
plt.figure(figsize=(15, 10))
plt.subplot(2,
3, 1)
sns.histplot(df['Edad'],
kde=True, bins=10, color='skyblue')
plt.title('Distribución
de Edades')
plt.subplot(2,
3, 2)
sns.histplot(df['Horas_Estudio_Semana'],
kde=True, bins=10, color='orange')
plt.title('Distribución
de Horas de Estudio por Semana')
plt.subplot(2,
3, 3)
sns.histplot(df['Calificación_Promedio'],
kde=True, bins=10, color='green')
plt.title('Distribución
de Calificación Promedio')
plt.subplot(2,
3, 4)
sns.histplot(df['Examen_Final'],
kde=True, bins=10, color='red')
plt.title('Distribución
de Calificación del Examen Final')
plt.subplot(2,
3, 5)
sns.countplot(x='Género',
data=df)
plt.title('Distribución
de Género')
plt.subplot(2,
3, 6)
sns.countplot(x='Aprobado',
data=df)
plt.title('Distribución
de Aprobados y No Aprobados')
plt.tight_layout()
# Guardando los gráficos
graphics_path = '/mnt/data/graficos_analitica_aprendizaje.png'
plt.savefig(graphics_path)
descriptive_stats, graphics_path
RESULTADOS:
Conclusiones
Diversidad en la
Edad y Género:
El rango amplio de edades (18 a 49 años) sugiere que el curso atrae a una
población estudiantil diversa. La distribución de género es también un dato
importante para entender la demografía del curso.
Horas de Estudio y
Rendimiento:
El promedio de horas de estudio por semana (9 horas) podría correlacionarse con
el rendimiento de los estudiantes. Sería interesante analizar si más horas de
estudio se traducen en mejores calificaciones.
Participación en
Foros:
La variabilidad en la participación en los foros indica diferentes niveles de
compromiso. Un análisis más profundo podría revelar si una mayor participación
está asociada con mejores resultados académicos.
Desempeño
Académico:
La calificación promedio y los resultados del examen final están alrededor de
5, lo cual es justo en el umbral de aprobación. Esto sugiere que el curso puede
ser desafiante para muchos estudiantes.
Tasa de
Aprobación:
Con solo el 24% de los estudiantes aprobando, se sugiere que el curso podría
ser bastante difícil o que los estudiantes están enfrentando desafíos para
cumplir con los requisitos.
Reflexiones
Estrategias de
Enseñanza:
Estos resultados podrían llevar a los educadores a revisar las estrategias de
enseñanza y aprendizaje. ¿Se están abordando eficazmente las necesidades de una
población estudiantil diversa?
Soporte y
Recursos:
La baja tasa de aprobación podría indicar la necesidad de más soporte y
recursos para los estudiantes, como tutorías, sesiones de estudio adicionales o
materiales de aprendizaje más accesibles.
Evaluación del
Currículo:
¿Es el currículo adecuado para el nivel de los estudiantes? ¿Los métodos de
evaluación son justos y reflejan con precisión el aprendizaje de los
estudiantes?
Impacto de la
Participación en Foros: Sería valioso investigar más a fondo el impacto de la
participación en foros en el rendimiento académico, ya que la interacción y
discusión podrían mejorar la comprensión de los temas.
Personalización
del Aprendizaje:
Considerar la personalización del aprendizaje para atender a las necesidades
individuales de los estudiantes, especialmente teniendo en cuenta la amplia
gama de edades y posiblemente de habilidades previas.
Para Futuras
Investigaciones
Investigar la
relación entre las horas de estudio y el rendimiento académico.
Examinar el
impacto de la participación en foros en la tasa de aprobación.
Considerar
variables adicionales, como el acceso a recursos de aprendizaje o el apoyo
social, para comprender mejor los desafíos que enfrentan los estudiantes.
Estas conclusiones
y reflexiones son puntos de partida para mejorar la experiencia educativa y el
rendimiento estudiantil. Como docente de educación superior, puedes encontrar
aquí áreas de interés para profundizar en tu investigación o práctica docente.
