Proyecto Aplicado: Análisis de Datos del Mundo Real
Proyecto Aplicado Análisis de Datos del Mundo Real.ipynb
Proyecto Aplicado: Análisis de Datos del
Mundo Real
Vamos a desarrollar un
ejemplo ficticio paso a paso sobre un proyecto aplicado en el ámbito de la
educación superior, enfocándonos en el análisis de datos del mundo real
1.
Planteamiento del Problema
Problema: Evaluar el
impacto de un nuevo método de enseñanza en línea en el rendimiento académico de
los estudiantes de un programa de educación superior.
2. Uso
de Datos
Dataset: Crear un
conjunto de datos que incluya:
Datos demográficos de los
estudiantes (edad, género, etc.).
Información académica
previa (notas en cursos anteriores, asistencia, participación en actividades
extracurriculares).
Datos sobre el uso del
nuevo método de enseñanza (tiempo dedicado en línea, interacciones en el
sistema, etc.).
Rendimiento académico
durante y después de la implementación del método (notas, participación, etc.).
3.
Desarrollo de Script Python
Para un proyecto de
análisis de datos en educación superior, aquí te presento una estructura básica
del script que podrías seguir:
Importación de Librerías Necesarias:
import pandas as pd
import numpy as np
import
matplotlib.pyplot as
plt
import seaborn as sns
from
sklearn.model_selection import
train_test_split
from
sklearn.linear_model import
LinearRegression
from
sklearn.metrics import
mean_squared_error
Carga y Limpieza
de Datos:
Cargar los datos desde un archivo CSV, por ejemplo.
Limpieza de datos
incluyendo manejo de valores faltantes, eliminación de outliers, y
normalización si es necesario.
df = pd.read_csv('/content/datos_educacion.csv')
df.dropna(inplace=True)
# Eliminar filas con valores
faltantes
# Aquí irían más pasos de limpieza y
preprocesamiento
Análisis
Estadístico Básico:
Obtener estadísticas
descriptivas para entender la distribución de los datos.
print(df.describe())
RESULTADO:
Dividir los datos en conjuntos de entrenamiento y
prueba.
Seleccionar las variables independientes y
dependientes.
X = df[['tiempo_en_linea',
'interacciones_en_linea',
'nota_previa']]
y = df['nota_final']
X_train, X_test, y_train, y_test =
train_test_split(X, y, test_size=0.3)
Construcción de
Modelos Predictivos:
Utilizar modelos
estadísticos o de machine learning para analizar los datos.
modelo = LinearRegression()
modelo.fit(X_train, y_train)
RESULTADO:
LinearRegression
LinearRegression()
Evaluación del
Modelo:
Evaluar el rendimiento del modelo utilizando métricas
adecuadas.
predicciones = modelo.predict(X_test)
print(mean_squared_error(y_test,
predicciones))
RESULTADO:
8.452469191316132
Visualización de
Resultados:
Generar gráficos para interpretar los resultados del
modelo.
RESULTADO:
4. Análisis Exploratorio de Datos (EDA)
Estadísticas Descriptivas:
Utilizar .describe() para
obtener un resumen estadístico de los datos.
Observar medias,
medianas, desviaciones estándar, etc.
Visualización de Datos:
Histogramas para
distribuciones de variables individuales.
Diagramas de caja
(boxplots) para ver la dispersión y detectar outliers.
Gráficos de dispersión
para observar relaciones entre variables.
sns.boxplot(x='asistencia_previa',
y='nota_final', data=df)
plt.show()
RESULTADO:
Análisis de Correlación:
Usar mapas de calor o
matrices de correlación para identificar relaciones entre variables.
sns.heatmap(df.corr(), annot=True)
plt.show()
Análisis de Tendencias y Patrones:
Identificar patrones o
tendencias en los datos, como el rendimiento académico en relación con el
tiempo de estudio en línea.
Inspección de Subgrupos:
Realizar análisis
específicos en subgrupos, como comparar el rendimiento entre diferentes
demografías de estudiantes.
5.
Interpretación de Resultados y Conclusiones
Hallazgos Clave: Por
ejemplo, si los estudiantes que pasaron más tiempo utilizando el método en
línea tuvieron un mejor rendimiento.
Limitaciones del Estudio:
Reconocer las limitaciones, como el tamaño de la muestra o la falta de datos
longitudinales.
Conclusiones:
Basar las conclusiones en el análisis, por ejemplo, si el nuevo método de
enseñanza es efectivo o no.
Recomendaciones: Sugerir
pasos futuros, como mejorar el método de enseñanza o realizar estudios
adicionales.



