Analítica de Aprendizaje aplicando Aprendizaje Automático

Analítica de Aprendizaje aplicando Aprendizaje Automático.ipynb

Volver

Analítica de Aprendizaje aplicando Aprendizaje Automático

Paso 1: Definición del Proyecto

Objetivo: Analizar y predecir el rendimiento de los estudiantes en un curso virtual.

Paso 2: Creación de un Dataset Ficticio

Características del Dataset:

ID_Estudiante: Identificador único para cada estudiante.

Edad: Edad del estudiante.

Género: Género del estudiante.

Horas_Estudio_Semana: Horas dedicadas al estudio por semana.

Participación_Foro: Número de participaciones en foros del curso.

Tareas_Entregadas: Número de tareas entregadas.

Calificación_Promedio: Promedio de calificaciones en tareas.

Examen_Final: Calificación en el examen final.

Aprobado: Indica si el estudiante aprobó (1) o no (0).

Generaré un dataset ficticio con estas características.

Paso 3: Análisis Exploratorio de Datos

Se realizará un análisis exploratorio usando Python para entender mejor los datos.

Paso 4: Preprocesamiento de Datos

Incluye la limpieza de datos, la transformación de variables categóricas, y la normalización de datos.

Paso 5: Modelado de Aprendizaje Automático

Usaremos un modelo de clasificación para predecir si un estudiante aprobará o no basándonos en sus características.

Paso 6: Evaluación del Modelo

Se evaluará el modelo usando métricas como precisión, recall, y el área bajo la curva ROC.

Paso 7: Interpretación de Resultados

Interpretar los resultados y cómo pueden aplicarse en un contexto educativo.

Ahora, voy a crear un dataset ficticio y te proporcionaré un script básico en Python para cada paso. También te daré un enlace para que puedas descargarlos. Comenzaré con la generación del dataset.

He creado un dataset ficticio para el proyecto de Analítica de Aprendizaje. Puedes descargar el dataset desde el siguiente enlace:

Descargar Dataset Ficticio

A continuación, te proporcionaré un script básico en Python para cada una de las etapas del proyecto (Análisis Exploratorio, Preprocesamiento, Modelado y Evaluación). Este script servirá como punto de partida para tu investigación y desarrollo en el campo de la IA aplicada a la educación superior.

Voy a preparar el script y luego te daré un enlace para descargarlo también.

import pandas as pd

import numpy as np

# Semilla para reproducibilidad

np.random.seed(42)

# Tamaño del dataset

n = 100

# Creando el dataset ficticio

data = {

"ID_Estudiante": np.arange(1, n + 1),

"Edad": np.random.randint(18, 50, n),

"Género": np.random.choice(["Femenino", "Masculino"], n),

"Horas_Estudio_Semana": np.random.randint(0, 20, n),

"Participación_Foro": np.random.randint(0, 50, n),

"Tareas_Entregadas": np.random.randint(0, 10, n),

"Calificación_Promedio": np.random.uniform(0, 10, n),

"Examen_Final": np.random.uniform(0, 10, n),

}

# Aprobado si la calificación promedio y el examen final son mayores o iguales a 5

data["Aprobado"] = ((data["Calificación_Promedio"] >= 5) & (data["Examen_Final"] >= 5)).astype(int)

# Creando el DataFrame

df = pd.DataFrame(data)

# Guardando el dataset en un archivo CSV

csv_path = '/content/dataset_analitica_aprendizaje.csv'

df.to_csv(csv_path, index=False)

csv_path

He preparado un script básico en Python que cubre las etapas de Análisis Exploratorio, Preprocesamiento, Modelado y Evaluación para el proyecto de Analítica de Aprendizaje. Puedes descargar el script desde el siguiente enlace:

Descargar Script Python

Este script es un buen punto de partida para tu investigación. Puedes modificarlo y ampliarlo según tus necesidades y objetivos de estudio. ¡Espero que te sea útil en tu camino hacia la maestría y tu capacitación en IA! Si tienes más preguntas o necesitas asistencia adicional, no dudes en preguntar.

Análisis descriptivo de los datos del dataset que creamos

Este análisis incluirá estadísticas descriptivas básicas y la generación de algunos gráficos para visualizar la distribución y relaciones entre las variables.

Análisis Estadístico Descriptivo

Medidas de Tendencia Central: Promedio y Mediana.

Medidas de Dispersión: Desviación estándar, Mínimo, Máximo.

Distribución de Frecuencias: Para variables categóricas como Género y Aprobado.

Visualizaciones Gráficas

Histogramas: Para entender la distribución de variables continuas como Edad, Horas de Estudio y Calificaciones.

Diagramas de Caja (Boxplots): Para visualizar la dispersión y detectar valores atípicos.

Gráficos de Barras: Para variables categóricas.

Voy a realizar estos análisis utilizando el dataset que hemos creado. Empezaré con las estadísticas descriptivas y luego generaré los gráficos.

He completado el análisis de datos con estadística descriptiva. Aquí tienes los resultados:

Estadísticas Descriptivas

Edad: Varía entre 18 y 49 años, con un promedio de aproximadamente 34 años.

Horas de Estudio por Semana: Promedio de 9 horas, con una variación de 0 a 19 horas.

Participación en Foros: En promedio, 26 participaciones, con un rango de 0 a 48.

Tareas Entregadas: Un promedio de 5 tareas, con valores de 0 a 9.

Calificación Promedio y Examen Final: Ambos alrededor de 5, con calificaciones que van desde casi 0 hasta casi 10.

Aprobados: Solo el 24% de los estudiantes aprobaron.

Gráficos

Los gráficos proporcionan una representación visual de estas estadísticas. Puedes descargar y visualizar los gráficos desde el siguiente enlace:

Descargar Gráficos del Análisis

Estos gráficos incluyen histogramas de distribuciones de edad, horas de estudio, calificaciones y gráficos de barras para género y aprobados. Esto te dará una buena visión general de los datos y te ayudará a identificar patrones y áreas de interés para investigaciones más profundas.

Si necesitas más detalles o análisis específicos, házmelo saber. ¡Estoy aquí para ayudarte!

import matplotlib.pyplot as plt

import seaborn as sns

# Cargando el dataset

df = pd.read_csv('/content/dataset_analitica_aprendizaje.csv')

# Estadísticas descriptivas

descriptive_stats = df.describe()

# Histogramas para variables continuas

plt.figure(figsize=(15, 10))

plt.subplot(2, 3, 1)

sns.histplot(df['Edad'], kde=True, bins=10, color='skyblue')

plt.title('Distribución de Edades')

plt.subplot(2, 3, 2)

sns.histplot(df['Horas_Estudio_Semana'], kde=True, bins=10, color='orange')

plt.title('Distribución de Horas de Estudio por Semana')

plt.subplot(2, 3, 3)

sns.histplot(df['Calificación_Promedio'], kde=True, bins=10, color='green')

plt.title('Distribución de Calificación Promedio')

plt.subplot(2, 3, 4)

sns.histplot(df['Examen_Final'], kde=True, bins=10, color='red')

plt.title('Distribución de Calificación del Examen Final')

plt.subplot(2, 3, 5)

sns.countplot(x='Género', data=df)

plt.title('Distribución de Género')

plt.subplot(2, 3, 6)

sns.countplot(x='Aprobado', data=df)

plt.title('Distribución de Aprobados y No Aprobados')

plt.tight_layout()

# Guardando los gráficos

graphics_path = '/mnt/data/graficos_analitica_aprendizaje.png'

plt.savefig(graphics_path)

descriptive_stats, graphics_path

RESULTADOS:

Conclusiones

Diversidad en la Edad y Género: El rango amplio de edades (18 a 49 años) sugiere que el curso atrae a una población estudiantil diversa. La distribución de género es también un dato importante para entender la demografía del curso.

Horas de Estudio y Rendimiento: El promedio de horas de estudio por semana (9 horas) podría correlacionarse con el rendimiento de los estudiantes. Sería interesante analizar si más horas de estudio se traducen en mejores calificaciones.

Participación en Foros: La variabilidad en la participación en los foros indica diferentes niveles de compromiso. Un análisis más profundo podría revelar si una mayor participación está asociada con mejores resultados académicos.

Desempeño Académico: La calificación promedio y los resultados del examen final están alrededor de 5, lo cual es justo en el umbral de aprobación. Esto sugiere que el curso puede ser desafiante para muchos estudiantes.

Tasa de Aprobación: Con solo el 24% de los estudiantes aprobando, se sugiere que el curso podría ser bastante difícil o que los estudiantes están enfrentando desafíos para cumplir con los requisitos.

Reflexiones

Estrategias de Enseñanza: Estos resultados podrían llevar a los educadores a revisar las estrategias de enseñanza y aprendizaje. ¿Se están abordando eficazmente las necesidades de una población estudiantil diversa?

Soporte y Recursos: La baja tasa de aprobación podría indicar la necesidad de más soporte y recursos para los estudiantes, como tutorías, sesiones de estudio adicionales o materiales de aprendizaje más accesibles.

Evaluación del Currículo: ¿Es el currículo adecuado para el nivel de los estudiantes? ¿Los métodos de evaluación son justos y reflejan con precisión el aprendizaje de los estudiantes?

Impacto de la Participación en Foros: Sería valioso investigar más a fondo el impacto de la participación en foros en el rendimiento académico, ya que la interacción y discusión podrían mejorar la comprensión de los temas.

Personalización del Aprendizaje: Considerar la personalización del aprendizaje para atender a las necesidades individuales de los estudiantes, especialmente teniendo en cuenta la amplia gama de edades y posiblemente de habilidades previas.

Para Futuras Investigaciones

Investigar la relación entre las horas de estudio y el rendimiento académico.

Examinar el impacto de la participación en foros en la tasa de aprobación.

Considerar variables adicionales, como el acceso a recursos de aprendizaje o el apoyo social, para comprender mejor los desafíos que enfrentan los estudiantes.

Estas conclusiones y reflexiones son puntos de partida para mejorar la experiencia educativa y el rendimiento estudiantil. Como docente de educación superior, puedes encontrar aquí áreas de interés para profundizar en tu investigación o práctica docente.

Volver

Entrada destacada

Información General

Analítica de Aprendizaje aplicando Aprendizaje Automático

Sin comentarios