Regresión Lineal - 3

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

Regresiones Lineales

Pruebas de Significancia
Facultad de ciencias básicas y aplicadas
Departamento de matemáticas
Estadística II
Docente: Veimar Daniel Rey Castillo
Prueba de Significancia para la Regresión
Definición:
Es el valor más pequeño de 𝛼 con el que se puede rechazar la hipótesis nula. En otras
palabras, mide la factibilidad de la hipótesis nula.

• Entre menor sea el p – valor, menos factible es la 𝐻0 , más certeza de 𝐻0 es falsa. Entre
más grande sea el p – valor, será más factible la 𝐻0 pero sin tener certeza de que 𝐻0 es
cierta.

• Como aceptar o rechazar la 𝐻0 .

𝑆𝑖 𝑃 > 𝛼 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠, 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻0



𝑆𝑖 𝑃 < 𝛼 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠, 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0
Prueba de Significancia para la Regresión
• Se tiene que la ecuación de una regresión lineal es de la forma yො = 𝛽1 𝑥 + 𝛽0
• Si el valor de 𝛽1 = 0 se tiene que la relación entre las variables deja de ser lineal, por el
contrario si 𝛽1 ≠ 0 se tendría que las variables 𝑥, 𝑦 estarían bien relacionadas
linealmente.
• Luego para determinar si hay una relación significante se debe realizar una prueba de
hipótesis para 𝛽1 .
• Para esta prueba existen dos pruebas, la prueba t y la prueba F.
• Para ambos es necesario calcular 𝜎 2 que representa la varianza de los valores de 𝑦 con
respecto a la recta regresión.
• Se utiliza el Error Cuadrado Medio (ECM) como estimador de 𝜎 2 , su forma de calculo
es:
𝑆𝐶𝐸
𝑠 2 = 𝐸𝐶𝑀 =
𝑛−2
• El Error estándar de Estimación se calcula por medio de
𝑠 = 𝑠 2 = 𝐸𝐶𝑀
Prueba t – Regresiones Lineales Simples

𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
(A dos Colas)
Estadístico de prueba:

𝑏1 𝑠
𝑡= 𝑐𝑜𝑛 𝑣 = 𝑛 − 2 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑦 𝑠𝑏 1 =
𝑠𝑏 1
σ𝑁
𝑘=1 𝑥𝑘 − 𝑥ҧ
2

También se tiene que:

Intervalo de confianza a dos colas 𝑷 𝒃𝟏 − 𝒕𝜶/𝟐 ⋅ 𝒔𝒃 𝟏 < 𝜷𝟏 < 𝒃𝟏 + 𝒕𝜶/𝟐 ⋅ 𝒔𝒃 𝟏 = 𝟏 − 𝜶


Prueba t – Regresiones Lineales Simples
Ejemplo 1 : Nielsen Media Research proporciona dos medidas de la audiencia que tienen los
programas de televisión: un rating de los programas, porcentaje de hogares que tienen
Televisión y están viendo un determinado programa y un share de los programas de televisión,
porcentaje de hogares que tienen la televisión encendida y están viendo un determinado pro-
grama. Los datos siguientes muestran los datos de raiting y share de Nielsen para el final de
la liga mayor de básquetbol en un periodo de nueve años (Associated Press)

Raiting 19 17 17 14 16 12 15 12 13
Share 32 28 29 24 26 20 24 20 22
Utilizando un nivel de 𝛼 = 0.05 se puede afirmar que las variables Raiting y share
están relacionadas. Verifique su resultado utilizando el p – valor, estadístico de prueba
e intervalo de confianza.
Prueba t – Regresiones Lineales Simples
Solución : Por ejercicios anteriores se conoce los valores de 𝛽0 y 𝛽1
x y
Raiting Vs Share y = 1,6667x
Raiting Share (Xi-Xprom) (Yi-Ypro) (Xi-Xpro)(Yi-Ypro) (Xi-Xprom)^2
R² = 0,9804
35 19 32 4 7 28 16
17 28 2 3 6 4
30 17 29 2 4 8 4
25 14 24 -1 -1 1 1
16 26 1 1 1 1
SHARE

20 12 20 -3 -5 15 9
15 24 0 -1 0 0
15 12 20 -3 -5 15 9
10 13 22 -2 -3 6 4
0 0 80 48
5 𝑥 − 𝑥 𝑦𝑖 − 𝑦 𝑥 − 𝑥ҧ 2

0
5
0 5 10 15 20 Luego la regresión buscada es: 𝑦ො = 3 𝑥
RAITNG 5
ya que 𝛽1 = 3 ≈ 1.6666 y 𝛽0 = 0
Prueba t – Regresiones Lineales Simples
Solución : También se sabe que
𝑁 𝑁
𝐻0 : 𝛽1 = 0 2
𝐻1 : 𝛽1 ≠ 0 𝑥𝑘 − 𝑥ҧ 2
= 48 𝑆𝑇𝐶 = 𝑦𝑘 − 𝑦ത = 136
𝑘=1 𝑘=1
𝑁 𝑁
2 𝑆𝐶𝑅 = 𝑦ො𝑘 − 𝑦ത 2 = 133.333
𝑆𝐶𝐸 = 𝑦𝑘 − 𝑦ො𝑘 = 2.6666
𝑘=1 𝑘=1

Luego para el cálculo se tiene:


2
𝑆𝐶𝐸 2
2.6666
𝑠 = 𝐸𝐶𝑀 = ⇒ 𝑠 = 𝐸𝐶𝑀 = ⇒ 𝑠 2 = 0.3808 ⇒ 𝑠 = 0.3808 ≈ 0.6171
𝑛−2 9−2
𝑁 𝑠 0.6171
𝑥𝑘 − 𝑥ҧ 2 = 48 = 6.9282
𝑠𝑏 1 = = ≈ 0.08907
𝑁 2
6.9282
𝑘=1 σ𝑘=1 𝑥𝑘 − 𝑥ҧ
Prueba t – Regresiones Lineales Simples
𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0

Estadístico de prueba:

𝑏1 5/3
𝑡= = ≈ 18.7111 𝑐𝑜𝑛 𝑣 = 𝑛 − 2 ⇒ 𝑣 = 7
𝑠𝑏1 0.08907

𝑃 = 2𝑃 𝑡 > 18.7111 ≈ 0 < 0.05 = 𝛼 luego se rechaza la 𝐻0


𝑣=7 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙 𝑏.

Esto significa que las Variables Raiting y Share están relacionadas de forma lineal
Prueba F – Regresiones Lineales Simples

𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
(A dos Colas)
Estadístico de prueba:
𝐶𝑀𝑅 𝑆𝐶𝑅
𝐹= 𝑐𝑜𝑛 𝐶𝑀𝑅 =
𝐸𝐶𝑀 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝐼𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠

Para este caso, 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝐼𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠 = 1 y con los grados de libertad 𝑣1 = 1 𝑦 𝑣2 = 𝑛 − 2
Prueba F – Regresiones Lineales
Ejemplo 1 : Nielsen Media Research proporciona dos medidas de la audiencia que tienen los
programas de televisión: un rating de los programas, porcentaje de hogares que tienen
Televisión y están viendo un determinado programa y un share de los programas de televisión,
porcentaje de hogares que tienen la televisión encendida y están viendo un determinado pro-
grama. Los datos siguientes muestran los datos de raiting y share de Nielsen para el final de
la liga mayor de básquetbol en un periodo de nueve años (Associated Press)

Raiting 19 17 17 14 16 12 15 12 13
Share 32 28 29 24 26 20 24 20 22

Utilizando un nivel de 𝛼 = 0.01 se puede afirmar que las variables Raiting y share están
relacionadas. Haga uso del estadístico de prueba y p – valor.
Prueba F – Regresiones Lineales Simples
Solución : Por ejercicios anteriores se conoce los valores de 𝛽0 y 𝛽1
x y
Raiting Vs Share y = 1,6667x
Raiting Share (Xi-Xprom) (Yi-Ypro) (Xi-Xpro)(Yi-Ypro) (Xi-Xprom)^2
R² = 0,9804
35 19 32 4 7 28 16
17 28 2 3 6 4
30 17 29 2 4 8 4
25 14 24 -1 -1 1 1
16 26 1 1 1 1
SHARE

20 12 20 -3 -5 15 9
15 24 0 -1 0 0
15 12 20 -3 -5 15 9
10 13 22 -2 -3 6 4
0 0 80 48
5 𝑥 − 𝑥 𝑦𝑖 − 𝑦 𝑥 − 𝑥ҧ 2

0
5
0 5 10 15 20 Luego la regresión buscada es: 𝑦ො = 3 𝑥
RAITNG 5
ya que 𝛽1 = 3 ≈ 1.6666 y 𝛽0 = 0
Prueba F – Regresiones Lineales Simples
Solución : También se sabe que
𝑁
𝐻0 : 𝛽1 = 0 𝑆𝐶𝐸 2
𝐻1 : 𝛽1 ≠ 0 𝐸𝐶𝑀 = = 0.3808 𝑆𝑇𝐶 = 𝑦𝑘 − 𝑦ത = 136
𝑛−2 𝑘=1
𝑁 𝑁 𝑁
2 2 𝑆𝐶𝑅 = 𝑦ො𝑘 − 𝑦ത 2 = 133.333
𝑥𝑘 − 𝑥ҧ = 48 𝑆𝐶𝐸 = 𝑦𝑘 − 𝑦ො𝑘 = 2.6666
𝑘=1 𝑘=1 𝑘=1

Luego para el cálculo se tiene:


𝑆𝐶𝑅 133.333
𝐶𝑀𝑅 = ⇒ 𝐶𝑀𝑅 = = 133.333
1 1

Estadístico de prueba: 𝐶𝑀𝑅 133.333


𝐹= = ≈ 350.1396 𝑐𝑜𝑛 𝑣1 = 1; 𝑣2 = 7
𝐸𝐶𝑀 0.3808
Tabla de ANOVA para la prueba F de 𝛽1
Por lo general los calculo realizados durante la regresión lineal simple, se resumen
en una tabla de análisis de varianza(ANOVA).

Fuente de Suma de Grados de Cuadrado F P - Valor


Variación Cuadrados Libertad Medio
Regresión 𝑆𝐶𝑅 1 𝑆𝐶𝑅 𝐶𝑀𝑅
𝐶𝑀𝑅 = 𝐹=
1 𝐶𝑀𝐸
Error 𝑆𝐶𝐸 𝑛−2 𝑆𝐶𝐸
𝐸𝐶𝑀 =
𝑛−2
Total 𝑆𝑇𝐶 𝑛−1
Prueba F – Regresiones Lineales
Ejemplo 1 : Nielsen Media Research proporciona dos medidas de la audiencia que tienen los
programas de televisión: un rating de los programas, porcentaje de hogares que tienen
Televisión y están viendo un determinado programa y un share de los programas de televisión,
porcentaje de hogares que tienen la televisión encendida y están viendo un determinado pro-
grama. Los datos siguientes muestran los datos de raiting y share de Nielsen para el final de
la liga mayor de básquetbol en un periodo de nueve años (Associated Press)

Raiting 19 17 17 14 16 12 15 12 13
Share 32 28 29 24 26 20 24 20 22

Construya una tabla ANOVA para la prueba F Realizada anteriormente.


Prueba F – Tabla ANOVA
Solución : Tomando todos los Cálculos realizados para la regresión lineal se tiene:

Fuente de Suma de Grados de Cuadrado F P - Valor


Variación Cuadrados Libertad Medio
Regresión 𝑆𝐶𝑅 1 𝐶𝑀𝑅 350.1396 0
133.3333 133.3333
Error 𝑆𝐶𝐸 𝑛−2 𝐸𝐶𝑀
2.6666 7 0.3808
Total 𝑆𝑇𝐶 𝑛−1
136 8
Prueba t y Prueba F – Regresiones Lineales Simples
Ejercicio 1 : Aunque actualmente en los aeropuertos grandes los retrasos son menos
frecuentes, es útil saber que en que aeropuertos es más probable que le echen a perder a uno
los planes de viaje. Además si su vuelo llega con retraso a un determinado aeropuerto ene que
tiene que hacer transbordo, ¿Cuál es la probabilidad de que se retrase la salida y que se pueda
hacer el transbordo?, Es una probabilidad muy baja tal vez por la ocurrencia de los dos
eventos. En la siguiente tabla se presenta una muestra de porcentaje de llegadas y salidas
retrasadas durante un mes en diferentes aeropuertos.
Aeropuerto A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11
Llegadas
Retrasadas 24 20 30 20 20 23 18 20 18 21 25
Salidas
Retrasadas 22 20 29 19 22 23 19 16 18 22 22

Utilizando un nivel de 𝛼 = 0.05 se puede afirmar que las variables Llegadas Retrasadas y
Salidas Retrasadas están relacionadas. Verifique su resultado utilizando el p – valor, estadístico
de prueba. Haga uso de la Prueba t y la Prueba F.

También podría gustarte