Grado en Ingeniería Informática · Estadística
Tema 2 · Bidimensional, regresión y correlación
2. Variables estadísticas bidimensionales
Estudia dos variables X e Y conjuntamente. En examen cae muchísimo: tabla bidimensional, marginales, condicionadas, covarianza, correlación y regresión.
Tabla bidimensional
n_ij = frecuencia conjunta de X=x_i e Y=y_j
n_i. = suma de la fila i = marginal de X
n_.j = suma de la columna j = marginal de Y
n = total
f_ij = n_ij / n
Marginales y condicionadas
- Marginal de X: ignoras Y y sumas filas.
- Marginal de Y: ignoras X y sumas columnas.
- X condicionada a Y>algo: te quedas solo con columnas que cumplen la condición.
Independencia estadística
X e Y independientes si n_ij = (n_i. · n_.j) / n para todas las casillas.
Equivalente: f_ij = f_i. · f_.j
En examen: si una casilla no cumple, ya no son independientes.
Covarianza
σ_XY = ΣΣ x_i y_j n_ij / n - x̄ ȳ
| Valor | Interpretación |
|---|---|
| σ_XY > 0 | Relación directa: cuando X sube, Y tiende a subir. |
| σ_XY < 0 | Relación inversa: cuando X sube, Y tiende a bajar. |
| σ_XY ≈ 0 | No hay relación lineal clara. Puede haber relación no lineal. |
Correlación lineal de Pearson
r = σ_XY / (σ_X σ_Y)
R² = r²
r mide intensidad y sentido de la relación lineal. R² mide fiabilidad del modelo lineal: cuanto más cerca de 1, mejor.
Rectas de regresión
Predecir Y conociendo X
y = a x + b
a = σ_XY / σ_X²
b = ȳ - a x̄
Predecir X conociendo Y
x = α y + β
α = σ_XY / σ_Y²
β = x̄ - α ȳ
Error típico
No uses la recta equivocada. Si te dan X y piden Y, usa Y|X. Si te dan Y y piden X, usa X|Y.
Fiabilidad de una predicción
- Comprueba que R² esté cerca de 1.
- Comprueba que el valor usado para predecir esté dentro o cerca del rango observado.
Si predices muy fuera del rango, aunque R² sea alto, la predicción es extrapolación y es poco defendible.
Calculadora
Este tema se puede resolver casi entero con Estadística 2-variable/regresión. Necesitas saber leer: x̄, ȳ, σx, σy, Sx, Sy, Σx, Σy, Σx², Σy², Σxy, r, a, b.