Pract 6 PDF-1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 5

UNIVERSIDAD NACIONAL DE MISIONES

FACULTAD DE CIENCIAS ECONÓMICAS


ESTADÍSTICA I
TRABAJO PRÁCTICO Nº6
REGRESIÓN SIMPLE

Ejercicio Nº1:
El presidente de la empresa Daniel-James Financial Services, considera que existe relación entre el número de
contactos con clientes y el importe en dólares de las ventas. Para documentar este aserto, obtuvo la siguiente
información muestral. La variable “ x ” indica el número de contactos de clientes el mes pasado, y la variable “ y ”
muestra el valor de las ventas (en miles de dólares) del mes pasado para cada cliente muestreado.
A partir de la información disponible en la siguiente tabla, se pide:

Nº de contactos Ventas
x
(en miles de $) x2 y2 x. y
y
14 24 196 576 336
12 14 144 196 168
20 28 400 784 560
16 30 256 900 480
46 80 2116 6400 3680
23 30 529 900 690
48 90 2304 8100 4320
50 85 2500 7225 4250
55 120 3025 14400 6600
50 110 2500 12100 5500
Total 334 611 13970 51581 26584
i) Determine la ecuación de regresión e interprete la pendiente en el contexto del problema.
ii) Evalúe las ventas estimadas si se contacta, o comunica, con 40 clientes.
iii) Utilice alguna observación del gráfico para indicar qué se entiende por: desviación explicada, no explicada y
desviación total .

Ventas vs. Nº de contactos realizados

140
Ventas (en miles de $)

120
100
80
60
40
20
0
0 10 20 30 40 50 60

Nº de contactos

iv) Calcule SCE, SCT y SCR y utilícelas para hallar:


a) el coeficiente de determinación,
b) el coeficiente de correlación,

v) Interprete cada uno de los resultados obtenidos en el ítem anterior.

Ejercicio Nº2:
Un análisis de la relación entre el consumo de yerba mate en toneladas y el número de hectáreas plantadas de
dicho producto (en miles ) se resume en la recta de regresión estimada yˆ  2  12x donde r= 0,80; siendo “x” las
toneladas de yerba mate consumida anualmente en el país e “y” las miles de hectáreas de plantación anual de yerba
mate en el país.
Se pide:
a) Explíquese el significado de los resultados –2 y 12 en la recta de regresión.
b) ¿Cuál es la expectativa respecto a las hectáreas de plantación si el consumo es de 30 toneladas años?
c) Si r hubiese sido igual a 1, ¿qué podríamos decir acerca del comportamiento de las variables?
ESTADÍSTICA I 2
Práctico N°6 – Regresión Simple
Ejercicio Nº3:
En las siguientes situaciones se tienen 5 observaciones para las variables, “ x ”e “ y ”
i)
xi 2 3 5 1 8
yi 25 25 20 30 16

ii)
xi 2 4 5 7 8
yi 2 3 2 6 4

Se pide, en cada caso:


a) Trace un diagrama de dispersión para estos datos. ¿Qué indica el diagrama de dispersión obtenido acerca de la
relación entre las dos variables?.
b) Plantee la ecuación estimada de regresión para estos datos.
c) Aplique la ecuación de regresión para predecir el valor de y cuando x  6 .
d) Calcule SCE, SCT y SCR.
2
e) Halle el coeficiente de determinación r . Comente sobre la bondad de ajuste
f) Obtenga el coeficiente de correlación para la muestra.

Ejercicio Nº4:
En un mercado de una ciudad se han observado durante seis días consecutivos las cantidades de conservas
vendidas en cientos de kilogramos “c” y el precio correspondiente en pesos “p”. A partir de dichos datos se han
calculado la siguiente información:
∑ ci = 21; ∑ pi = 840; ∑ ci pi = 2730;∑ p2i = 120200; ∑ c2i = 91; i= 1, 2, 3, 4, 5, 6
Se pide:
a) Calcúle ˆ 0 y ˆ1 en la recta de regresión estimada cˆ  ˆ0  ˆ1 p
b) Interprete la pendiente en el contexto del problema.
c) Calcule el coeficiente de determinación y el coeeficiente de correlación lineal entre “p” y “c”.
d) Se desea estimar la cantidad de conserva que se venderán para un precio de 100 $/kg, ¿qué cuidado
deberá tenerse al hallar esta estimación?.

Ejercicio Nº5:
En la siguiente tabla se presentan datos que relacionan el número de semanas de experiencia en un trabajo de
instalación de cables de componentes electrónicos en miniatura, y el número de componentes que se rechazaron la
semana anterior, para 12 trabajadores seleccionados al azar.
Trabajador muestreado 1 2 3 4 5 6 7 8 9 10 11 12
Semanas de Experiencia 7 9 6 14 8 12 10 4 2 11 1 8
Número de rechazos 26 20 28 16 23 18 24 26 38 22 32 25
2
 x  92 ,  y  298 ,  x  876 ,  y  7798 y  x. y  2048
2

i) Dada la siguiente información, utilice el coeficiente de correlación lineal de Pearson para obtener información
acerca de la existencia de relación entre las variables involucradas. Describa lo encontrado.
39

33
Rechazos

27

21

15
0 4 8 11 15
Experiencia

ii) Calcule el coeficiente de determinación e interprételo.


ESTADÍSTICA I 3
Práctico N°6 – Regresión Simple
iii) Determine la ecuación de regresión para justificar el número de componentes rechazados, dado un número
específico de semanas de experiencia. Interprete el valor hallado para la pendiente, en el contexto del
problema.
iv) ¿Es posible utilizar la ecuación de regresión estimada para describir la relación entre las semanas de
experiencias y el número de rechazos?. Justifique estadísticamente a un nivel de significancia del 5%.

Ejercicio Nº6: Al administrador de un hipódromo quiere pronosticar la cantidad de dinero apostado con base a la
asistencia de público. Se selecciona una muestra aleatoria de 10 días y los resultados se dan en la siguiente tabla
Asistencia (miles) 14,5 21,2 11,6 31,7 46,8 31,4 40 21 16,3 32,1
Cantidad apostada
0,70 0,83 0,62 1,10 1,27 1,02 1,15 0,80 0,71 1,04
(millones de $)
 xi  266 ,6 ;  xi2  8.312 ,44 ;  y i  9,24 ;  y i2  8,9748 ;  xi y i  269 ,029
a) La ecuación de regresión muestral. obtenida a partir de los datos es: ŷ  0,4227  0 ,0188 x . Interprete, en el
contexto del problema, el valor de la pendiente.
b) De acuerdo a la ecuación obtenida, ¿sirve esta recta para realizar predicciones de nuevos valores de la variable
dependiente?. Justifique estadísticamente a un nivel de significancia del 1%.
Ejercicio Nº7:
La siguiente es una ecuación de regresión: yˆ  17 ,08  0,16 x
La siguiente información está disponible también: s  4,05 ,  x  210 ,  x  9850 y n  5 .
2

a) Estime el valor de ŷ cuando x  50 .


b) Desarrolle un intervalo de confianza de 95% para un valor individual de y para x =50.

Ejercicio Nº8:
Los siguientes datos corresponden a las cantidades de ventas, en miles de pesos, y a los años de experiencia de 10
vendedores de una compañía:
Años de experiencia (X) 1 3 3 3 5 5 5 6 8 8
Ventas en miles de $ (Y) 2 2 3 4 5 4 6 7 8 6
Se pide:
a) Construya un diagrama de dispersión y describa lo observado.
b) Calcule el coeficiente de correlación ¿verifica su observación del ítem a? Justifique
c) Determine la ecuación de regresión lineal. En este caso ¿cómo interpreta la pendiente de la misma? ¿cuál es el
sentido de la ordenada al origen?
d) ¿La evidencia indica una relación significativa entre las variables? Use α = 0,10
e) De ser posible, utilice la ecuación estimada de regresión para estimar las ventas, en miles de pesos, de un vendedor
con (i) 7 años de experiencia y (ii) 19 años de experiencia.
f) Utilice la ecuación estimada de regresión para estimar un intervalo de confianza del valor promedio de ventas para los
vendedores con 7 años de experiencia. Use α = 0,10
g) Utilice la ecuación estimada de regresión para estimar un intervalo de predicción para un las de ventas de un
vendedor con 7 años de experiencia. Use α = 0,10
10 10 10 10 10
2 2
 xi  47  yi  47  xi  267  yi  259  xi yi  258
i 1 i1 i 1 i1 i1
Ejercicio Nº9:
En el caso que las variables del Ejercicio Nº5 estén relacionadas a nivel poblacional, se pide:
a) Determine el intervalo de confianza de 0.95, en miles de dólares, para la media de todo el personal de
ventas que realiza 40 contactos con clientes.
b) Halle el intervalo de confianza de 0.95, en miles de dólares, para un vendedor particular que realiza 40
contactos con clientes.

Ejercicio Nº10: Un comerciante al menudeo llevó a cabo un estudio para determinar la relación entre los gastos de
publicidad semanal y las ventas. Se obtuvieron los siguientes resultados
Gastos de publicidad $ 40 20 25 20 30 50 40 20 50 40 25 50
Ventas $ 385 400 395 365 475 440 490 420 560 525 480 510
2 2
 x  410  y  5 445  x . y  191325  x  15 650  y  2 512925
A partir de la información suministrada en la salida de InfoStat:
a) encuentre la ecuación de estimación que describe al conjunto de datos,
b) indique si la ecuación hallada, puede utilizarse para hacer nuevas estimaciones?. Justifique su
afirmación.
ESTADÍSTICA I 4
Práctico N°6 – Regresión Simple
Coeficientes de regresión y estadísticos asociados
Coef Est. EE LI(95%) LS(95%) T p-valor
const 343,71 44,77 243,96 443,45 7,68 <0,0001
Gastos Pub 3,22 1,24 0,46 5,98 2,60 0,0266

Ejercicio Nº11:
La empresa Nielsen Media Research reúne datos acerca de la cantidad de familias que sintonizan programas
donde pasa determinado anuncio. Esta información es útil para los publicistas, porque les dice a cuántos consumidores
llegan. Los datos siguientes muestran la cantidad de familias espectadoras, en millones, y la cantidad de veces que se
pasó el anuncio durante una semana de octubre de 1997.
Veces que pasó
Marca anunciada Familias espectadoras
el anuncio
Mc Donald's 49 359.6
Burger King 42 296.1
HBO 30 271.6
Red Corner movie 26 251.1
Pizza Hut 31 229.3
Sears 20 186.9
Isuzu Rodeo 21 186.3
MCI 24 172.7
Sprint 15 166
J.C. Penny 19 162.1
A continuación se da una parte de los resultados en computadora del análisis de regresión correspondiente,
donde se relacionan y = cantidad de familias espectadoras, en millones, con x = cantidad de veces que se pasó el
anuncio durante una cierta semana de octubre del 1997.

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,9455
Coeficiente de determinación R^2 0,8939
R^2 ajustado 0,8806
Error típico 22,7627
Observaciones 10

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 67,0476 20,9049 3,2073 0,0125 18,8407 115,2544
Variable X 1 5,8167 0,7085 8,2094 0,00004 4,1828 7,4506

a) Escriba la ecuación de regresión.


b) Aplique una prueba t para determinar si la cantidad de familias espectadoras se relacionan con el número de veces
que sale el anuncio.
c) Determine un estimado de intervalo de 95% de confianza para la cantidad de familias espectadoras de todos los
anuncios que salen al aire 35 veces.
d) Suponga que Wendy’s está pensando en pasar 35 veces un anuncio. Determine el estimado de intervalo de
predicción, con 95% de confianza, para la cantidad de familias espectadoras de ese determinado anuncio.

Ejercicio Nº12:
Para los datos del ejercicio Nº3, se pide:
i) Calcular los residuales .
ii) Trazar una gráfica de los residuales y analizar el cumplimiento de los supuestos acerca del término de error.
ESTADÍSTICA I 5
Práctico N°6 – Regresión Simple
CUESTIONES TEÓRICAS

Ejercicio Nº1: Indique si los siguientes enunciados sobre el modelo de REGRESIÓN LINEAL SIMPLE son verdaderos
o falsos. Si son falsos corríjalos.

a) La siguiente expresión describe la variación de los valores de “ y ” alrededor de la línea de regresión:   y i  y  .


2

b) Si s = 0 para una ecuación de estimación, ésta debe estimar perfectamente la variable dependiente en los puntos
observados ( s es el error estándar de estimación).
c) Si r  0,96 , entonces la ecuación de regresión explica el 96% de la variación total en la variable dependiente.
d) Dado que la ecuación para la recta de regresión es ŷ  24 x  26 , podemos decir que la relación de y con x es
directa y lineal.

Ejercicio Nº2: Las siguientes preguntas tienen que ver con el modelo de regresión lineal simple. Responda, justificando
brevemente.
i) ¿ Cuál de las siguientes expresiones describe la variación de los valores de “ y ” alrededor de la línea de
regresión?.

  yˆ i  y    yi  y   y i  yˆ    yi  yˆ i 
2 2 2 2
a) b) c) i
d)

ii) En el análisis de regresión, ¿qué objeto tiene probar si 1  0 ?. ¿A qué conclusión arriba en el caso de NO
rechazar H 0 : 1  0 ?.

Ejercicio Nº3: Siendo ŷ la recta de regresión estimada a partir de los datos de una muestra,
_
in1 ( ŷ i  y )
2
a. ¿Qué representa el cociente _
?
 n
i 1 ( yi  y ) 2

b. ¿Qué puede decirse estadísticamente, si éste cociente es igual a 1?. ¿Y si el resultado del cociente es igual a 0?.
c. Muestre en un gráfico lo que ocurre en las situaciones particulares planteadas anteriormente.

Ejercicio Nº4: Complete las siguientes afirmaciones relativas a CORRELACIÓN y REGRESIÓN


a) Supongamos que la fracción de variación en “y” que no está explicada por la variable independiente “x” es ¼.
2
Entonces r es igual a ...................................................................................................... ............................................-
b) Si la variable dependiente se incrementa al incrementarse la variable independiente en una ecuación de estimación,
el coeficiente de correlación estará en el intervalo .......................................................................................................-

c) La ecuación muestral de estimación ŷ   ˆ  ˆ x se utiliza para estimar..................................................................


0 1
....................................................y para estimar.............................................................................................................-
d) En el modelo de regresión lineal simple y   0  1 x   , “  ” representa.............................................................-

También podría gustarte