Regresión Lineal Aplicado a La Educación Superior
Regresión Lineal Aplicado a La Educación Superior.ipynb
Regresión Lineal
Aplicado a La Educación Superior
1. Explicación del
Algoritmo de Regresión Lineal
La regresión
lineal es un método estadístico que se usa para predecir el valor de una
variable dependiente (Y) basándose en el valor de una o más variables
independientes (X). La idea es encontrar una línea (en la regresión lineal
simple) o un plano (en la regresión lineal múltiple) que mejor se ajuste a los
datos. La fórmula general es:
Y=aX+b
donde a
es la pendiente de la línea y b es la intersección.
2. Ejemplo
Práctico con Datos Ficticios
Dataset: Vamos a
crear un conjunto de datos ficticios que representen, por ejemplo, la relación
entre las horas de estudio (variable independiente) y las calificaciones
obtenidas (variable dependiente) de estudiantes en una universidad.
Script en Python:
import numpy as np
import
matplotlib.pyplot as
plt
from
sklearn.linear_model import
LinearRegression
from
sklearn.metrics import
mean_squared_error, r2_score
# Creando datos ficticios
np.random.seed(0)
X = 2
* np.random.rand(100,
1)
y = 4
+ 3 * X + np.random.randn(100, 1)
# Creando el modelo de regresión lineal
modelo = LinearRegression()
modelo.fit(X, y)
# Predicciones
X_new = np.array([[0], [2]])
y_predict = modelo.predict(X_new)
# Gráfico
plt.scatter(X, y)
plt.plot(X_new, y_predict, color='red')
plt.xlabel('Horas de
Estudio')
plt.ylabel('Calificaciones')
plt.show()
RESULTADOS:
3. Análisis de
Resultados y Evaluación del Modelo
Después de
entrenar el modelo, es crucial evaluar su rendimiento. Usamos métricas como el
Error Cuadrático Medio (MSE) y el coeficiente de determinación (R²):
y_pred = modelo.predict(X)
mse = mean_squared_error(y, y_pred)
r2 = r2_score(y, y_pred)
print(f"MSE: {mse}")
print(f"Coeficiente de Determinación: {r2}")
RESULTADOS:
MSE: 0.9924386487246479
Coeficiente de Determinación: 0.7469629925504755
4. Imágenes y
Gráficos
Los gráficos ya se
incluyeron en el script. Representan la dispersión de los datos y la línea de
mejor ajuste, lo cual es crucial para entender visualmente cómo el modelo se
ajusta a los datos.
5. Fragmentos de
Código
El código
proporcionado muestra cómo implementar la regresión lineal usando Python y
scikit-learn, desde la creación del dataset hasta la evaluación del modelo.
6. Conclusiones y
Reflexiones
La regresión
lineal es un método poderoso y simple para predecir valores continuos.
La calidad de la
predicción depende de qué tan lineal sea la relación entre las variables
independientes y dependientes.
Este ejemplo sirve
como base para comprender cómo la regresión lineal puede aplicarse en el
contexto de la educación superior, pero es crucial realizar análisis con datos
reales para obtener insights significativos.
Reflexionar sobre
las limitaciones del modelo y las posibles mejoras es una parte esencial del
aprendizaje.
