Rseumen Cap. 2
Rseumen Cap. 2
Rseumen Cap. 2
Tenemos una población de 60 familias, divididas en 10 grupos según su ingreso semanal (de 80 a 260), así mismo,
aparecen los gastos de las familias de cada grupo.
Como vemos, en promedio, el consumo semanal se incrementa a medida que aumenta el ingreso. A estos valores
medios se les llama valores esperados condicionales, ya que dependen de los valores de la variable (condicional) X. Se
denota E(Y|X) (“valor esperado de Y, dado el valor de X”).
Otro es el valor esperado incondicional del consumo semanal, E(Y), que es el valor de la media incondicional (ya que
obviamos los niveles de ingreso) de las 60 familias, en este caso es 121.2 (7272/60)
Cuando se pregunta ¿Cuál es el valor esperado del consumo de una familia?, la respuesta es 121,2 (media
incondicional), pero si se pregunta ¿Cuál es el valor esperado de una familia cuyo ingreso semanal es 140?, la respuesta
es 101. Por consiguiente, conocer el nivel de ingreso permite predecir mejor el valor medio del consumo.
Al unir los puntos de la figura 2.1 obtenemos la línea de regresión poblacional (LRP), o la curva de regresión poblacional
(CRP), con palabras sencillas, la regresión de Y sobre X.
En el caso de la relación entre consumo de una familia y un nivel determinado de ingresos, se ve que el consumo de una
familia en particular se agrupa alrededor del consumo promedio de las familias en ese nivel, es decir, alrededor de la
esperanza condicional, Esta desviación, de su valor esperado se expresa como:
Donde “u” puede ser negativa o positiva, y se conoce como perturbación estocástica o termino de error estocástico.
¿Por qué no se introduce explícitamente las variables “u” en el modelo? ¿Por qué no se crea un modelo con tantas
variables como sea posible?
1. Vaguedad de la teoría: De existir una teoría, podría estar incompleta. “u” es el sustituto de las variables omitidas
2. Falta de disponibilidad de datos: Aunque se conozca la variable excluida, tal vez no haya información cuantitativa.
3. Variables centrales y periféricas: Variables pequeñas pero que en conjunto pueden afectar (religión, sexo, etc.)
4. Aleatoriedad intrínseca en comportamiento humano: “u” puede reflejar muy bien esta aleatoriedad.
5. Variables representantes (proxy) inadecuadas: en la práctica, X e Y pueden tener errores de medición
6. Principio de parsimonia: Conviene mantener el modelo lo más sencillo posible (incluir variables importantes)
7. Forma funcional incorrecta: En un modelo de regresión múltiple no es fácil determinar la forma funcional
Por estas razones, las perturbaciones estocásticas “u” asumen un papel muy valioso en el análisis de regresión
Líneas de regresión muestral, debido a fluctuaciones muestrales, son solo una aproximación de la verdadera RP.
En resumen, concluimos que el objetivo principal del análisis de regresión es determinar la FRP 2.4.2 con base en la FRM
2.6.2