Grado en Ingeniería Informática · Estadística

Tema 2 · Bidimensional, regresión y correlación

2. Variables estadísticas bidimensionales

Estudia dos variables X e Y conjuntamente. En examen cae muchísimo: tabla bidimensional, marginales, condicionadas, covarianza, correlación y regresión.

Tabla bidimensional

n_ij = frecuencia conjunta de X=x_i e Y=y_j n_i. = suma de la fila i = marginal de X n_.j = suma de la columna j = marginal de Y n = total f_ij = n_ij / n

Marginales y condicionadas

Independencia estadística

X e Y independientes si n_ij = (n_i. · n_.j) / n para todas las casillas. Equivalente: f_ij = f_i. · f_.j

En examen: si una casilla no cumple, ya no son independientes.

Covarianza

σ_XY = ΣΣ x_i y_j n_ij / n - x̄ ȳ
ValorInterpretación
σ_XY > 0Relación directa: cuando X sube, Y tiende a subir.
σ_XY < 0Relación inversa: cuando X sube, Y tiende a bajar.
σ_XY ≈ 0No hay relación lineal clara. Puede haber relación no lineal.

Correlación lineal de Pearson

r = σ_XY / (σ_X σ_Y) R² = r²

r mide intensidad y sentido de la relación lineal. mide fiabilidad del modelo lineal: cuanto más cerca de 1, mejor.

Rectas de regresión

Predecir Y conociendo X

y = a x + b a = σ_XY / σ_X² b = ȳ - a x̄

Predecir X conociendo Y

x = α y + β α = σ_XY / σ_Y² β = x̄ - α ȳ

Error típico

No uses la recta equivocada. Si te dan X y piden Y, usa Y|X. Si te dan Y y piden X, usa X|Y.

Fiabilidad de una predicción

Si predices muy fuera del rango, aunque R² sea alto, la predicción es extrapolación y es poco defendible.

Calculadora

Este tema se puede resolver casi entero con Estadística 2-variable/regresión. Necesitas saber leer: x̄, ȳ, σx, σy, Sx, Sy, Σx, Σy, Σx², Σy², Σxy, r, a, b.