Rseumen Cap. 2

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 3

Capítulo 2: Análisis de regresión con dos variables: algunas ideas básicas

2.1 Ejemplo histórico

Tenemos una población de 60 familias, divididas en 10 grupos según su ingreso semanal (de 80 a 260), así mismo,
aparecen los gastos de las familias de cada grupo.

Como vemos, en promedio, el consumo semanal se incrementa a medida que aumenta el ingreso. A estos valores
medios se les llama valores esperados condicionales, ya que dependen de los valores de la variable (condicional) X. Se
denota E(Y|X) (“valor esperado de Y, dado el valor de X”).

Otro es el valor esperado incondicional del consumo semanal, E(Y), que es el valor de la media incondicional (ya que
obviamos los niveles de ingreso) de las 60 familias, en este caso es 121.2 (7272/60)

Cuando se pregunta ¿Cuál es el valor esperado del consumo de una familia?, la respuesta es 121,2 (media
incondicional), pero si se pregunta ¿Cuál es el valor esperado de una familia cuyo ingreso semanal es 140?, la respuesta
es 101. Por consiguiente, conocer el nivel de ingreso permite predecir mejor el valor medio del consumo.

Al unir los puntos de la figura 2.1 obtenemos la línea de regresión poblacional (LRP), o la curva de regresión poblacional
(CRP), con palabras sencillas, la regresión de Y sobre X.

2.2 Concepto de función de regresión poblacional (FRP)

B1 coeficiente de intersección, B2 coeficiente de pendiente


2.3 Significado del termino lineal

Linealidad en las variables


El significado más “natural”, en que, Y es una función lineal de X, geométricamente la curva de regresión es una recta
(en este caso si X2, no es una función lineal)

Linealidad en los parámetros (esta usaremos en adelante)


En este caso, la esperanza condicional E(Y|X), es una función lineal de los parámetros, los B; puede ser o no lineal en la
variable X. En este modelo con un X2 si hay regresión lineal
(ahora si B2, sería un modelo de regresión no lineal)

2.4 Especificación estocástica de la FRP

En el caso de la relación entre consumo de una familia y un nivel determinado de ingresos, se ve que el consumo de una
familia en particular se agrupa alrededor del consumo promedio de las familias en ese nivel, es decir, alrededor de la
esperanza condicional, Esta desviación, de su valor esperado se expresa como:

Donde “u” puede ser negativa o positiva, y se conoce como perturbación estocástica o termino de error estocástico.

E(Y|X) es el componente sistemático o determinista, y “u” es el componente aleatorio, o no sistemático.


(perturbación estocástica, es un término que sustituye o representa a todas las variables omitidas que pueden afectar a
Y pero que no se incluyen el modelo de regresión) (2.4.2)

2.5 Importancia del termino de perturbación estocástica

¿Por qué no se introduce explícitamente las variables “u” en el modelo? ¿Por qué no se crea un modelo con tantas
variables como sea posible?

1. Vaguedad de la teoría: De existir una teoría, podría estar incompleta. “u” es el sustituto de las variables omitidas
2. Falta de disponibilidad de datos: Aunque se conozca la variable excluida, tal vez no haya información cuantitativa.
3. Variables centrales y periféricas: Variables pequeñas pero que en conjunto pueden afectar (religión, sexo, etc.)
4. Aleatoriedad intrínseca en comportamiento humano: “u” puede reflejar muy bien esta aleatoriedad.
5. Variables representantes (proxy) inadecuadas: en la práctica, X e Y pueden tener errores de medición
6. Principio de parsimonia: Conviene mantener el modelo lo más sencillo posible (incluir variables importantes)
7. Forma funcional incorrecta: En un modelo de regresión múltiple no es fácil determinar la forma funcional

Por estas razones, las perturbaciones estocásticas “u” asumen un papel muy valioso en el análisis de regresión

2.6 Función de regresión muestral (FRM)

Líneas de regresión muestral, debido a fluctuaciones muestrales, son solo una aproximación de la verdadera RP.

Función de regresión muestral (FRM):


Ahora, tal como la FRP, la FRM se expresa en su forma estocástica: (2.6.2)

En resumen, concluimos que el objetivo principal del análisis de regresión es determinar la FRP 2.4.2 con base en la FRM
2.6.2

En términos de la FRM, la Y observada se expresa como:

Y en termino de FRP, como:


(ahora, es evidente que la “Y sombrero” puede subestimar o sobrestimar la verdadera E(Y|X), debido a las fluctuaciones
muestrales)

2.7 Ejemplos ilustrativos

También podría gustarte