Rseumen Cap. 2

Capítulo 2: Análisis de regresión con dos variables: algunas ideas básicas
2.1 Ejemplo histórico
Tenemos una población de 60 familias, divididas en 10 grupos según su ingreso semanal (de 80 a 260), así mismo,
aparecen los gastos de las familias de cada grupo.
Como vemos, en promedio, el consumo semanal se incrementa a medida que aumenta el ingreso. A estos valores
medios se les llama valores esperados condicionales, ya que dependen de los valores de la variable (condicional) X. Se
denota E(Y|X) (“valor esperado de Y, dado el valor de X”).
Otro es el valor esperado incondicional del consumo semanal, E(Y), que es el valor de la media incondicional (ya que
obviamos los niveles de ingreso) de las 60 familias, en este caso es 121.2 (7272/60)
Cuando se pregunta ¿Cuál es el valor esperado del consumo de una familia?, la respuesta es 121,2 (media
incondicional), pero si se pregunta ¿Cuál es el valor esperado de una familia cuyo ingreso semanal es 140?, la respuesta
es 101. Por consiguiente, conocer el nivel de ingreso permite predecir mejor el valor medio del consumo.
Al unir los puntos de la figura 2.1 obtenemos la línea de regresión poblacional (LRP), o la curva de regresión poblacional
(CRP), con palabras sencillas, la regresión de Y sobre X.
2.2 Concepto de función de regresión poblacional (FRP)
B1 coeficiente de intersección, B2 coeficiente de pendiente

2.3 Significado del termino lineal
Linealidad en las variables

El significado más “natural”, en que, Y es una función lineal de X, geométricamente la curva de regresión es una recta
(en este caso si X2, no es una función lineal)
Linealidad en los parámetros (esta usaremos en adelante)

En este caso, la esperanza condicional E(Y|X), es una función lineal de los parámetros, los B; puede ser o no lineal en la
variable X. En este modelo con un X2 si hay regresión lineal
(ahora si B2, sería un modelo de regresión no lineal)
2.4 Especificación estocástica de la FRP
En el caso de la relación entre consumo de una familia y un nivel determinado de ingresos, se ve que el consumo de una
familia en particular se agrupa alrededor del consumo promedio de las familias en ese nivel, es decir, alrededor de la
esperanza condicional, Esta desviación, de su valor esperado se expresa como:
Donde “u” puede ser negativa o positiva, y se conoce como perturbación estocástica o termino de error estocástico.
E(Y|X) es el componente sistemático o determinista, y “u” es el componente aleatorio, o no sistemático.

(perturbación estocástica, es un término que sustituye o representa a todas las variables omitidas que pueden afectar a
Y pero que no se incluyen el modelo de regresión) (2.4.2)
2.5 Importancia del termino de perturbación estocástica
¿Por qué no se introduce explícitamente las variables “u” en el modelo? ¿Por qué no se crea un modelo con tantas
variables como sea posible?
1. Vaguedad de la teoría: De existir una teoría, podría estar incompleta. “u” es el sustituto de las variables omitidas
2. Falta de disponibilidad de datos: Aunque se conozca la variable excluida, tal vez no haya información cuantitativa.
3. Variables centrales y periféricas: Variables pequeñas pero que en conjunto pueden afectar (religión, sexo, etc.)
4. Aleatoriedad intrínseca en comportamiento humano: “u” puede reflejar muy bien esta aleatoriedad.
5. Variables representantes (proxy) inadecuadas: en la práctica, X e Y pueden tener errores de medición
6. Principio de parsimonia: Conviene mantener el modelo lo más sencillo posible (incluir variables importantes)
7. Forma funcional incorrecta: En un modelo de regresión múltiple no es fácil determinar la forma funcional
Por estas razones, las perturbaciones estocásticas “u” asumen un papel muy valioso en el análisis de regresión
2.6 Función de regresión muestral (FRM)
Líneas de regresión muestral, debido a fluctuaciones muestrales, son solo una aproximación de la verdadera RP.
Función de regresión muestral (FRM):

Ahora, tal como la FRP, la FRM se expresa en su forma estocástica: (2.6.2)
En resumen, concluimos que el objetivo principal del análisis de regresión es determinar la FRP 2.4.2 con base en la FRM
2.6.2
En términos de la FRM, la Y observada se expresa como:
Y en termino de FRP, como:

(ahora, es evidente que la “Y sombrero” puede subestimar o sobrestimar la verdadera E(Y|X), debido a las fluctuaciones
muestrales)
2.7 Ejemplos ilustrativos

Rseumen Cap. 2

Cargado por

Copyright:

Formatos disponibles

Rseumen Cap. 2

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Rseumen Cap. 2

Cargado por

Copyright:

Formatos disponibles

Capítulo 2: Análisis de regresión con dos variables: algunas ideas básicas

2.1 Ejemplo histórico

2.2 Concepto de función de regresión poblacional (FRP)

B1 coeficiente de intersección, B2 coeficiente de pendiente

Linealidad en las variables

Linealidad en los parámetros (esta usaremos en adelante)

2.4 Especificación estocástica de la FRP

E(Y|X) es el componente sistemático o determinista, y “u” es el componente aleatorio, o no sistemático.

2.5 Importancia del termino de perturbación estocástica

2.6 Función de regresión muestral (FRM)

Función de regresión muestral (FRM):

En términos de la FRM, la Y observada se expresa como:

Y en termino de FRP, como:

2.7 Ejemplos ilustrativos

También podría gustarte