Regresión Lineal Aplicado a La Educación Superior

Regresión Lineal Aplicado a La Educación Superior.ipynb

Regresión Lineal Aplicado a La Educación Superior

1. Explicación del Algoritmo de Regresión Lineal

La regresión lineal es un método estadístico que se usa para predecir el valor de una variable dependiente (Y) basándose en el valor de una o más variables independientes (X). La idea es encontrar una línea (en la regresión lineal simple) o un plano (en la regresión lineal múltiple) que mejor se ajuste a los datos. La fórmula general es:

Y=aX+b

donde a es la pendiente de la línea y b es la intersección.

2. Ejemplo Práctico con Datos Ficticios

Dataset: Vamos a crear un conjunto de datos ficticios que representen, por ejemplo, la relación entre las horas de estudio (variable independiente) y las calificaciones obtenidas (variable dependiente) de estudiantes en una universidad.

Script en Python:

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

from sklearn.metrics import mean_squared_error, r2_score

# Creando datos ficticios

np.random.seed(0)

X = 2 * np.random.rand(100, 1)

y = 4 + 3 * X + np.random.randn(100, 1)

# Creando el modelo de regresión lineal

modelo = LinearRegression()

modelo.fit(X, y)

# Predicciones

X_new = np.array([[0], [2]])

y_predict = modelo.predict(X_new)

# Gráfico

plt.scatter(X, y)

plt.plot(X_new, y_predict, color='red')

plt.xlabel('Horas de Estudio')

plt.ylabel('Calificaciones')

plt.show()

RESULTADOS:

3. Análisis de Resultados y Evaluación del Modelo

Después de entrenar el modelo, es crucial evaluar su rendimiento. Usamos métricas como el Error Cuadrático Medio (MSE) y el coeficiente de determinación (R²):

y_pred = modelo.predict(X)

mse = mean_squared_error(y, y_pred)

r2 = r2_score(y, y_pred)

print(f"MSE: {mse}")

print(f"Coeficiente de Determinación: {r2}")

RESULTADOS:

MSE: 0.9924386487246479

Coeficiente de Determinación: 0.7469629925504755

4. Imágenes y Gráficos

Los gráficos ya se incluyeron en el script. Representan la dispersión de los datos y la línea de mejor ajuste, lo cual es crucial para entender visualmente cómo el modelo se ajusta a los datos.

5. Fragmentos de Código

El código proporcionado muestra cómo implementar la regresión lineal usando Python y scikit-learn, desde la creación del dataset hasta la evaluación del modelo.

6. Conclusiones y Reflexiones

La regresión lineal es un método poderoso y simple para predecir valores continuos.

La calidad de la predicción depende de qué tan lineal sea la relación entre las variables independientes y dependientes.

Este ejemplo sirve como base para comprender cómo la regresión lineal puede aplicarse en el contexto de la educación superior, pero es crucial realizar análisis con datos reales para obtener insights significativos.

Reflexionar sobre las limitaciones del modelo y las posibles mejoras es una parte esencial del aprendizaje.

Volver

Entrada destacada

Información General

Regresión Lineal Aplicado a La Educación Superior

Sin comentarios