Regresión Lineal Simple Correlación

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 14

Universidad César Vallejo - Trujillo

Dirección de Investigación
Área: Estadística

Sesión 6
Regresión Lineal Simple
Correlación
Con frecuencia, las variables que constituyen una distribución bidimensional muestran un
cierto grado de dependencia entre ellas. Un ejemplo de esta relación aparece en la relación
de peso y altura: aunque no existe una ley causal que relacione ambas variables, en
términos estadísticos se aprecia una dependencia entre ellas (cuando aumenta la altura,
suele hacerlo también el peso). Esta dependencia se refleja en la nube de puntos que
representa a la distribución, de modo que los puntos de esta gráfica aparecen condensados
en algunas zonas.

En tales casos, se pretende definir una ecuación de regresión que sirva para relacionar las
dos variables de la distribución. La representación gráfica de esta ecuación recibe el nombre
de línea de regresión, y puede adoptar diversas formas: lineal, parabólica, cúbica,
hiperbólica, exponencial, etc.

ANÁLISIS DE REGRESIÓN
 Propósito: determinar la ecuación de regresión; se usa para predecir el valor de la
variable dependiente (Y) basado en la variable independiente (X).
 Procedimiento: seleccionar una muestra de la población y enumerar los datos por
pares para cada observación; dibujar un diagrama de dispersión para visualizar la
relación; determinar la ecuación de regresión.
 La ecuación de regresión: Y’= a + bX, donde:
o Y’ es el valor promedio pronosticado de Y para cualquier valor de X.
o a es la intercepción en Y, o el valor estimado de Y cuando X = 0
o b es la pendiente de la recta, o cambio promedio en Y’ por cada cambio de
una unidad en X:

REGRESIÓN LINEAL
Cuando la línea de regresión se asemeja a una recta (regresión lineal), puede ajustarse a
esta forma geométrica por medio de un método general conocido como método de los
mínimos cuadrados. La recta de ajuste tendrá por ecuación:

Y = β0 + β 1 X

Vamos a llamar a “X: VARIABLE INDEPENDIENTE o EXPLICATIVA”, y a la otra la


llamaremos “Y: VARIABLE DEPENDIENTE o EXPLICADA”.
Donde los coeficientes β0 y β1 se calculan teniendo en cuenta que:

1
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

 La recta debe pasar por el punto ( ).


 La separación de los puntos de la gráfica de dispersión con respecto a la recta de
regresión debe ser mínima.

CÁLCULO DE LOS COEFICIENTES β0 y β1:


Cov(x , y)
1° Cálculo de β1: β 1=
V (x)
2° Cálculo de β0: β 0=Ý −β 1 X́
Donde:
n

∑Yi: Media Aritmética de Y.


Ý = i=1
n
n

∑ Xi : Media Aritmética de X.
X́ = i =1
n

CORRELACIÓN (r)
El coeficiente de correlación (r) mide el grado de relación lineal (intensidad) de la relación
entre dos variables cuantitativas. El coeficiente r puede tomar valores entre -1.00 y 1.00.
Básicamente, esta información se refiere a dos características de la relación lineal: la
dirección o sentido y la cercanía o fuerza.

Correlación
Correlación nula Correlación
perfecta perfecta
negativa-1 0 1 Positiva
Fuerte Débil Débil Fuerte
Negativa Negativa Positiva Positiva

 Es importante notar que el uso del coeficiente de correlación sólo tiene sentido si la
relación a analizar es del tipo lineal. Si ésta no fuera no lineal, el coeficiente de
correlación sólo indicaría la ausencia de una relación lineal más no la ausencia
de relación alguna.

El coeficiente de correlación se expresa como:


Cov (x , y ) SC xy
R= =
σx σy √ ( SC x )( SC y )
Donde:
n n

n
SC xy=∑ X i Y i−
( )( )
∑ Xi ∑ Y i
i=1 i=1 : Suma Cruzada de X e Y.
i=1 n

2
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

n 2

n
2
SC x =∑ X i −
(∑ )
i=1
Xi
: Suma de Cuadrados de X.
i=1 n
n 2

n
2
SC y =∑ Y i −
(∑ )
i=1
Yi
: Suma de Cuadrados de Y.
i=1 n
Correlación negativa perfecta (r=-1) Correlación Positiva perfecta (r=1)

Correlación Nula

Correlación Positiva Fuerte

3
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

EL COEFICIENTE DE DETERMINACION “R2”


El coeficiente de determinación, r2 - la proporción de la variación total en la variable
dependiente Y que está explicada por o se debe a la variación en la variable independiente
X. El coeficiente de determinación es el cuadrado del coeficiente de correlación, y toma
valores de 0 a 1.

El objetivo principal del análisis de regresión es proyectar el valor de la variable dependiente


conociendo o suponiendo valores para la variable independiente. La confiabilidad de las
proyecciones está dada por la confiabilidad de la ecuación, la cual se mide a través del
coeficiente de determinación y de los errores de los coeficientes de regresión.

Una vez ajustada la recta de regresión a la nube de observaciones es importante disponer


de una medida que mida la bondad del ajuste realizado y que permita decidir si el ajuste
lineal es suficiente o se deben buscar modelos alternativos. Como medida de bondad
del ajuste se utiliza el coeficiente de determinación, definido como sigue:
R2 %=( R2 ) ×100
Donde:
R: Coeficiente de Correlación.

EJERCICIOS
Después de haber leído la bibliografía básica propuesta en el punto 2.1, resuelve los
siguientes ejercicios:
1. Para cada uno de los siguientes conjuntos de datos bivariantes graficar sus
correspondientes diagramas de dispersión de puntos. ¿Qué tipo de relación
funcional, cree usted, se podría ajustar mejor a los datos?, ¿Por qué?

4
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

X 5 10 8 19 14 19 15 15 25 20 20
a)
Y 2 7 13 14 15 16 10 5 7 10 5

X 3 6 5 1 4 2 3 7 4
b)
Y 16 14 12 8 18 11 11 5 20

X 6 2 1 4 1 3 4 1 3 2 4
c)
Y 10 16 14 10 16 13 11 15 14 14 12

X 6 14 15 18 10 16 14 12 18 17
d)
Y 8 11 16 17 11 14 13 10 14 18
2. Se realiza un estudio para determinar el efecto de la reducción de las horas de sueño
sobre la habilidad para resolver problemas sencillos. La reducción de las horas de
sueño es de 8, 12, 16, 20 y 24 horas sin dormir. En el estudio participaron un total
de 10 individuos, con dos en cada nivel de reducción. Después de su período
específico de reducción de horas de sueño, cada individuo fue sometido a un
conjunto de problemas simples de suma, observándose el número de errores. Los
resultados fueron:
Número de errores (Y) 8, 6 6, 10 8, 14 14, 12 16, 12
Reducción de horas de sueño (X) 8 12 16 20 24
a) Grafica el diagrama de dispersión de puntos.
b) Encuentra la recta de mínimos cuadrados apropiada para estos datos.
c) En el diagrama de dispersión de puntos, grafica la recta de mínimos
cuadrados.
d) Interpreta los coeficientes de regresión.
3. Los gastos semanales de publicidad y las ventas semanales de una empresa, en
dólares, para una muestra de diez semanas son:
Gastos semanales
de publicidad 41 54 63 54 48 46 62 61 64 71
Ventas semanales 1250 1380 1425 1425 1450 130 1400 1510 1575 1650
0
a) Establece la recta de regresión de mínimos cuadrados que permita predecir las
ventas semanales en función de los gastos en publicidad.
b) Representa gráficamente los puntos y la recta de mínimos cuadrados. Comenta.
c) Interpreta la pendiente de la recta de regresión.
d) Pronostica las ventas para gastos semanales de publicidad de 50 y 60 dólares.
e) ¿Cuáles son los errores de estimación cuando se predice las ventas semanales
para gastos semanales de publicidad de 61, 62 y 63 dólares respectivamente?
4. Las calificaciones en un examen de estadística y el número de horas de estudio para
el examen, de una muestra de doce estudiantes de una sección, se presentan en el
siguiente cuadro.
Tiempo de estudio 3 3 3 4 4 5 5 5 6 6 7 8
Calificación 9 12 11 12 15 14 16 15 18 16 15 17

5
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

a) Halla la recta de regresión de mínimos cuadrados considerando la calificación


en el examen como variable dependiente.
b) Interpreta la pendiente de la recta de regresión.
c) Calcula el error estándar de estimación. ¿Para qué se utiliza esta medida?
5. En una empresa se tiene interés en pronosticar el tiempo, en minutos, que toma
atender a un cliente en caja (Y) y se decide utilizar como variable independiente el
monto de las compras en dólares (X). Se tomó una muestra de 18 clientes y se
obtuvieron los siguientes resultados: x = 861, x2 = 60323, xy = 5177.3, y =
75.4, y2 = 455.86.
a) Halla la recta de regresión que mejor se ajusta a los datos e interpreta la
pendiente.
b) Grafica la recta de regresión.
c) Utiliza el gráfico de la recta de regresión para realizar dos predicciones de la
variable dependiente.
d) Calcula el error de estimación.
e) Calcula e interpreta el coeficiente de correlación
6. Para los puntajes de ansiedad (X) y de aptitud académica (Y) de diez postulantes a
un trabajo se han obtenido los siguientes resultados:  x = 847,  x2 = 71927, 
y = 446,  y2 = 20058,  xy = 37615.
a) Halla la recta de regresión de mínimos cuadrados que se ajusta a estos datos.
Interpreta la pendiente.
b) Interpreta la pendiente de la recta de regresión.
c) Grafica la recta de regresión.
d) Calcula e interpreta el coeficiente de correlación
7. Se ha tomado una muestra de 16 ventas de una casa comercial. Para cada venta se
han observado el precio de venta (X) y la cantidad vendida (Y) y se han obtenido
los siguientes resultados:  x = 77.9,  y = 749, SCx = 75.53, SCy = 7114.44 y
SCxy = - 489.89.
a) Halla la recta de regresión de mínimos cuadrados.
b) Interpreta la pendiente.
c) Pronostica la cantidad vendida para precios de venta de X=3 y x=5.
d) Calcula e interpreta el coeficiente de determinación.

8. Según investigaciones, el porcentaje de desembolso por empresas manufactureras


estadounidenses en plantas y equipo que fue destinado al control de polucióín
durante el periodo 1975–1987 fue como sigue:*
1975 1980 1981 1984 1987
9.3 4.8 4.3 3.3 4.3
*Fuente: Survey of Current Business.
a) Obtenga un modelo de regresión lineal, donde X: tiempo en años desde 1975.
b) Grafique la ecuación de la Recta.
c) Use el modelo calculado en (a) para estimar el porcentaje en 1985.
3.9. La siguiente tabla muestra el beneficio neto, en millones de dólares, de la
empresa Disney durante los años 1984-1992.

6
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

Beneficios estimados al $5 millón más cercano.


Fuente: Informes de compañía/The New York Times, Dic. 1992.
a) Estime la ecuación de la recta de mejor ajuste para estos datos.
b) Interprete el coeficiente β1.
c) Use el modelo calculado para hacer una estimación.
9. La siguiente tabla muestra la producción de soja, en millones de toneladas, en la
región Cerrados de Brasil, como función del área cultivada en millones de hectáreas.
Área
12, 16,
(Millones de 10,1 12,9 21,0
1 2
hectáreas)
Producción
15 25 30 40 60
(Millones de toneladas)
*Fuente: Ministerio de Agricultura de Brasil/New York Times.
a) Obtenga la ecuación de la recta de regresión lineal.
b) Interprete el coeficiente β1.
Use el modelo calculado para hacer una estimación.
10. Para una muestra de 20 operadores de máquinas se tienen registrados, la nota del
examen de ingreso (X) y la evaluación de eficiencia laboral (Y). A partir de estos
datos se han obtenido los siguientes coeficientes para la recta de regresión de
mínimos cuadrados: 0= 28.64y1 = 1.01.
a) Escribe la recta de regresión e interpretar 1.
b) Estima el puntaje promedio de evaluación de eficiencia laboralpara los
operadores que obtuvieron 75 puntos en el examen de ingreso.
c) Grafica la recta de regresión.
11. La siguiente información corresponde a calificaciones obtenidas por 10 estudiantes
en un examen de Estadística y su calificación final promedio.
Calificación
en examen 14 18 16 12 10 15 17 11 08 12
Calificación
promedio 12 14 15 10 11 12 12 11 10 11
a) Grafica el diagrama de dispersión. Comentar

7
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

b) Halla la recta de regresión de mínimos cuadrados. Interpretar la pendiente.


c) Calcula el coeficiente de correlación lineal. Interpreta.
d) Calcula el coeficiente de determinación. Interpreta.
12. En un estudio con 15 observaciones mensuales, un analista financiero quiere
determinar la relación de la tasa porcentual de rendimiento (Y) de las acciones de
una empresa sobre la tasa porcentual de rendimiento (X) de un índice bursátil.
Dispone de la siguiente información:
 x = 33.8,  y = 33.5,  xy = 79.22,  x2 = 80.34,  y2 = 79.45
a) Estima la regresión lineal de Y sobre X. Realiza una predicción.
b) Calcula el coeficiente de correlación lineal. Interpreta.
c) Calcula el coeficiente de determinación. Interpreta.
13. Un vendedor de bienes desea establecer la relación entre el número de semanas que
las casas están en el mercado antes de venderse y el precio que por ellas se pide.
La información es la siguiente:
Semana 6.2 6.7 7.5 8.5 11.5 9.5 12.2 9.8
Precio (miles) 25 82 100 95 120 110 130 135
a) Grafica la dispersión de puntos.
b) Halla la ecuación de regresión de Y sobre X. Interpreta la pendiente.
c) Realiza dos predicciones.
d) Calcula e interpreta el coeficiente de determinación.
e) Calcula el error estándar de estimación.
14. La siguiente tabla y gráfica muestran el consumo mensual de energía en función del
área del domicilio:
Área 119, 125, 136, 148, 158, 170, 183, 207, 223,
272,2
(m2) 8 4 6 8 9 9 9 2 0
Consumo
1180 1170 1260 1490 1570 1710 1800 1840 1960 1950
(kw-hrs)

a) Establezca la recta de regresión de mínimos cuadrados que permita predecir el


consumo de energía en función del área del domicilio.
b) Represente gráficamente los puntos y la recta de mínimos cuadrados. Comenta al
respecto.
c) Interprete la pendiente de la recta de regresión.
d) Calcule e interprete el Coeficiente de Correlación R.
e) Calcule e interprete el Coeficiente de Determinación R2.
15. En el servicio central de turismo del país se ha observado que el número de plazas
hoteleras ocupadas es diferente según sea el precio de la habitación. Sobre el total
de plazas ocupadas en un año se tiene:
Precio 260 650 100 1400 2100 250 2700 3300 4000
(US$./noche 0 0
)
Nº Habitac 4725 2610 187 943 750 700 700 580 500
Ocupadas 2

8
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

a) Representa gráficamente para comprobar que existe cierta dependencia lineal


entre las variables.
b) Halle la ecuación de la recta de regresión del precio sobre el número de
habitaciones.
c) ¿Cuántas habitaciones se llenarían a US$1500?
16. El volumen de ahorro y la renta del sector familias en billones de pesos, para el
período 77-86 fueron:

Año 77 78 79 80 81 82 83 84 85 86
Ahorro 1.9 1.8 2.0 2.1 1.9 2.0 2.2 2.3 2.7 3.0
Renta 20.5 20.8 21.2 21.7 22.1 22.3 22.2 22.6 23.1 23.5
a) Encuentre la recta de regresión considerando el ahorro como variable
independiente.
b) Encuentre la recta de regresión considerando la renta como variable
independiente
c) Para el año 87 se supone una renta de 24.1 billones de pesos. ¿Cuál será el
ahorro esperado para el año 87?
17. La tabla presenta datos ficticios para un estudio de adolescentes en riesgo de
desarrollar obesidad.
N° comidas rápidas
2 2 5 2 4 3 3 2
consumidas última semana
Peso (Kg.) 50,8 59,4 77,6 72,6 82,6 74,8 67,6 62,1
a) Trace un diagrama de dispersión del peso regresionado a partir del número de
comidas rápidas consumidas en la última semana.
b) Calcule el coeficiente de correlación R de Pearson para estas dos variables, así
como la ecuación de regresión Y = β0 + β 1 X .

18. La tabla siguiente contiene la edad (X) y la máxima de la presión sanguínea (Y) de un
grupo de 10 mujeres:
Edad 56 42 72 36 63 47 55 49 38 42
Presió 14,8 12,6 15,9 11,8 14,9 13,0 15,1 14,2 11,4 14,1
n
a) Determine la recta de regresión de Y sobre X, justificando la adecuación de un
modelo lineal.
b) Interprete la pendiente.
c) Mida la bondad del modelo.
d) Realice las siguientes predicciones, sólo si tienen sentido:
 Presión sanguínea de una mujer de 51 años.
 Presión sanguínea de una niña de 10 años.
 Presión sanguínea de un hombre de 54 años.

19. El crecimiento de los niños desde la infancia a la adolescencia generalmente sigue un


patrón lineal. Se calculó una recta de regresión mediante el método de mínimos
cuadrados con datos de alturas de niñas norteamericanas de 4 a 9 años y el
resultado fue: β0 = 80 y β1 = 6. La variable dependiente Y es la altura (en cm.) y X
es la edad (en años).
a) Interprete los valores estimados del intercepto y de la pendiente.

9
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

b) Cuál será la altura predicha de una niña de 8 años.


c) Cuál será la altura predicha de una mujer de 25 años. Comente el resultado.

20. En 1991 se publicó un trabajo “Diseñando plantas en climas difíciles” en la revista


Field Crops Research, los datos usados en la investigación son:
Duración 92 92 96 100 102 102 106 106 121 143
Rendimiento 1,7 2,3 1,9 2,0 1,5 1,7 1,6 1,8 1,0 0,3
Con X = la duración de la cosecha de porotos de soya en días, Y = rendimiento
de la cosecha en toneladas por hectárea.
a) Estime la recta de regresión mediante el método de mínimos cuadrados.
Interprete los estimadores en el contexto de la pregunta
b) ¿Existe una relación lineal significativa entre la duración y el rendimiento de la
cosecha?
c) Estime el rendimiento si la duración de la cosecha fue de 104 días.

21. Un investigador cree que la inteligencia de los niños, medida a través del coeficiente
intelectual (CI en puntos), depende del número de hermanos. Toma una muestra
aleatoria de 15 niños y ajusta una regresión lineal simple. Los resultados aparecen
en la tabla adjunta.

CI 110 115 120 118 110 108 105 104 9 9 99 100 9 9 90


8 9 0 3
N° Hnos 0 1 1 1 2 2 2 3 3 4 4 5 5 56
a) Encuentre e interprete el coeficiente de correlación R.
b) Dé la ecuación de la recta de regresión. Interprete los estimadores en el contexto
de la pregunta.
¿Existe una relación lineal significativa entre el número de hermanos y el
coeficiente intelectual?
22. Se desea saber si existe alguna relación entre la ingestión y la absorción de grasas
en lactantes desnutridos. Se realizan 20 determinaciones de ingestión y absorción
cuyos resultados se muestran en la tabla que sigue:
INGESTIÓN Y ABSORCIÓN DE GRASAS EN 20 LACTANTES
DESNUTRIDOS
Caso N° Ingestión Absorción Caso N° Ingestión Absorción
1 1,4 0,7 11 2,0 1,4
2 1,6 1,2 12 1,4 1,1
3 2,1 1,6 13 1,9 1,5
4 1,7 1,1 14 1,8 1,3
5 1,8 1,3 15 1,9 1,5
6 2,6 2,0 16 1,6 1,4
7 1,5 1,2 17 1,9 1,7
8 2,5 1,5 18 2,1 1,7
9 2,7 2,4 19 1,6 1,3
10 1,8 1,5 20 1,6 1,1
a) Estime β0 y β1 mediante el método de mínimos cuadrados. Interprete los
coeficientes de regresión.
b) Encuentre e interprete el coeficiente de correlación R.

10
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

c) ¿Existe una relación lineal significativa entre la ingestión y la absorción de


grasas?
23. La siguiente tabla presenta los datos sobre el número de cambios de aceite al año (X)
y el costo de la reparación (Y), en miles de pesos, de una muestra aleatoria de 8
autos de una cierta marca y modelo.
N° Cambios
3 5 2 3 1 4 6 4
de Aceite
Costo
(miles de 150 150 250 200 350 200 50 125
pesos)
a) Haga un gráfico de dispersión con los datos, verifique el supuesto de linealidad.
b) Encuentre la recta de regresión de mínimos cuadrados.
c) Interprete los valores estimados del intercepto y de la pendiente.
d) Estima cuál será el costo de reparación de un auto que ha tenido 4 cambios de
aceite.
e) Si cambia X por Y, ¿obtendrá la misma recta de regresión?
f) Calcule el residuo para la primera observación (X=3, Y=150).
24. Para la economía española, disponemos de los datos anuales redondeados sobre
consumo final de los hogares a precios corrientes (Y) y renta nacional disponible
neta (X), tomados de la Contabilidad Nacional de España base 1995 del INE , para
el período 1995-2002, ambos expresados en miles de millones de euros:
Año 1995 1996 1997 1998 1999 2000 2001 2002
Y 258,6 273,6 289,7 308,9 331,0 355,0 377,1 400,4
X 381,7 402,2 426,5 454,3 486,5 520,2 553,3 590,3
Considerando que el consumo se puede expresar como función lineal de la renta,
determine:
a) Los parámetros β0 y β1 de la recta de regresión.
b) El coeficiente de determinación de dicha regresión.
c) La predicción del valor que tomará el consumo para una renta de 650.000
millones de euros.
25. Se supone que se puede establecer cierta relación lineal entre las exportaciones de
un país y la producción interna de dicho país. En el caso de España, tenemos los
datos anuales (expresados en miles de millones de pesetas) para tales variables
correspondientes al quinquenio 2002-06 en la siguiente tabla:
Año Producción Exportaciones
2002 52,654 10,420
2003 53,972 11,841
2004 57,383 14,443
2005 61,829 16,732
2006 65,381 18,760
A partir de tal información, y considerando como válida dicha relación lineal, se pide:
a) Si la producción para el año 2007 fue de 2.210.610 millones de pesetas, ¿cual
sería la predicción de las exportaciones para este año? ¿Qué grado de precisión
tendría dicha predicción?
b) ¿Qué tanto por ciento de la varianza de las exportaciones no vienen explicadas
por la producción interna, y se debe a otro tipo de variables?

11
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

26. Un estudiante de la Escuela Universitaria de Estudios Empresariales de la


Universidad de Sevilla, para poder pagarse sus estudios, debe trabajar como
camarero en un bar de copas de su localidad. A este establecimiento, suelen acudir
todos los jóvenes de la zona. Este año, con los conocimientos aprendidos, decide
por fin estudiar la relación existente entre la cantidad de sal de las galletas saladas
y el consumo de bebidas, ya que es costumbre dar al cliente este aperitivo cuando
pide una consumición. Se sabe que las galletas no pueden tener una concentración
de sal superior a 3,5 gramos por cada 1000 galletas y, por ello, decide ir variando a
partir de 1 gramo la concentración de 0,5 en 0,5 gramos cada semana e ir anotando
el incremento en caja semanalmente, obteniendo la siguiente tabla:
Gramos de sal por Ingresos
1000 galletas (pesetas)
1 140,3
1,5 150
2 165
2,5 175
3 200
A partir de tales cifras, se quiere conocer:
a) ¿Considera justificado el planteamiento de un modelo lineal para expresar la
relación entre las variables?
b) Si el propietario desea unos ingresos de 160.000 pesetas, ¿qué cantidad de sal
debería aportar por cada 1000 galletas? Si aporta el máximo permitido de sal,
¿cuál sería el ingreso en caja? Explicar cuál de las dos predicciones le merece
mayor confianza.
¿Cuál sería la variación porcentual de los ingresos cuando la cantidad de sal
aumenta en un 1% sobre el último valor de la tabla? Si aumentamos en 1gr. la sal
por cada 1000 galletas, ¿cuánto variarán los ingresos?
27. La factura mensual del gasto telefónico de una pequeña empresa se ha incrementado
notablemente en los últimos meses. Los estudios realizados por el administrador de
la misma argumentan que el mayor uso de Internet dentro de la misma es la
principal causa del mayor gasto en teléfono, lo que ha hecho que se estudie la
posibilidad de acogerse a alguno de los múltiples bonos o tarifas especiales que
ofrecen las compañías, lo que hasta la fecha todavía no se llevó a cabo. Las últimas
cifras mensuales no hacen sino confirmar esta relación:
Mes Enero Febrero Marzo Abril Mayo
Cuantía de la factura 55 100 118 120 142
telefónica (€)
Tiempo de conexión 200 500 700 800 1000
(minutos)
De acuerdo con la información anterior, responda a las siguientes preguntas:
a) Suponiendo la existencia de una relación de tipo lineal entre tiempo de conexión y
gasto telefónico, ¿qué porcentaje de las variaciones en la cuantía de la factura
telefónica no podrían ser explicadas linealmente por el tiempo de conexión a
Internet dentro de la compañía?
b) ¿Cuál sería la cuantía de la factura telefónica de la compañía de acuerdo a esta
relación lineal si no se conectase a Internet en la empresa?

12
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

c) ¿Cuál sería el gasto telefónico estimado según esta relación lineal si el tiempo de
conexión a Internet fuera de 2000 minutos? ¿Le parece aceptable tal predicción?
Justifique su respuesta.
Se considera que un incremento del 20% en el tiempo de conexión a Internet
respecto al realizado en el mes de mayo conllevaría a que la factura telefónica se
elevase de forma extraordinaria. ¿Cuál sería el incremento relativo en la misma si
ello se produjese? Justifique su respuesta.
28. Una juguetería ha examinado la evolución reciente de las ventas de su muñeco “Qco”
(Y, en millones de euros) junto con los gastos de publicidad de ese muñeco (X, en
millones de euros), obteniéndose los siguientes resultados:
Año 2003 2004 2005 2006 2007 2008 2009
Y 126 135 156 156 150 150 180
X 20 25 30 32,5 35 32 34
A partir de esta información, responda a las siguientes cuestiones:
a) ¿Se puede afirmar que al aumentar los gastos en publicidad se incrementarán las
ventas? Obtenga los parámetros del ajuste lineal que explique las ventas en
función de los gastos. Interprete dichos coeficientes e indique la bondad del ajuste
realizado.
b) Si para este año 2010 aumentásemos los gastos de publicidad en un 1%, ¿en qué
porcentaje se espera que variasen las ventas, según el modelo lineal?

29. Para un conjunto de personas que están siguiendo una dieta de adelgazamiento, se
han recogido datos sobre el peso perdido desde el inicio de la misma (variable Y,
en Kg.) y el tiempo que llevan siguiendo la dieta (variable X, en semanas), los
cuales se muestran en la siguiente tabla:
Y 2,4 5,4 5,6 8,4 10,6 13,5 15 15
X 3 5 6 8 11 13 15 16
a) Estime el modelo lineal que explica el peso perdido en función del tiempo que se
lleva siguiendo la dieta e interprete los parámetros.
b) Para el modelo estimado en el apartado anterior, descomponga la varianza total
como suma de la explicada y la no explicada por el mismo y obtenga, a partir de
tal descomposición, el coeficiente de determinación.
c) Según el modelo considerado, ¿qué peso esperaría perder una persona que siga
la dieta durante 2 meses (8 semanas)? ¿Y una persona que esté dispuesta a
seguir la dieta durante dos años (108 semanas)? ¿Qué fiabilidad le otorga a cada
una de las estimaciones anteriores?

30. Con el objetivo de estudiar la relación lineal entre el precio de los automóviles y el
número de unidades vendidas, se procedió a recoger datos sobre tales magnitudes
durante el pasado mes en una determinada región. Los resultados obtenidos fueron
los siguientes:
Precio
7,5 9 10,5 12 14 16 18 20,5 23,5 27
(miles de euros)
Cantidad
450 425 400 350 325 300 290 280 260 200
vendida por mes
En función a los datos recabados para esa región y mes:
a) Una empresa radicada en la región tiene previsto para el mes próximo aumentar
el precio de su modelo más vendido en 500 􀂼. Si suponemos como válida la

13
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística

relación lineal entre las dos variables analizadas para los datos del pasado mes,
¿cómo afectaría este hecho a las ventas de dicho modelo?
b) Si el modelo más caro de la tabla anterior se abaratase para el mes próximo un
3%, ¿cómo variarían las ventas de dicho modelo?

31. En una muestra de familias se han analizado las variables ahorro anual (Y) y renta
anual (X), medidas ambas en miles de euros. Los datos obtenidos han sido los
siguientes:
Ahorro (Y) 1,9 1,8 2,0 2,1 1,9 2,0 2,2 2,3, 2,7 3,0
20, 20,
Renta (X) 21,2 21,7 22,1 22,3 22,2 22,6 23,1 23,5
5 8
A partir de tales datos, se pide:
a) Obtener el modelo lineal que explica el ahorro de las familias en función de su
renta.
b) ¿Qué familia aumentaría en un mayor porcentaje su ahorro si su renta se viese
incrementada en un 5%, la familia que tiene la menor renta de entre todas o la
que posee la mayor renta?
c) ¿Cuál será el incremento absoluto del ahorro cuando una familia aumente su
renta anual en 500 euros?
d) ¿Qué porcentaje de varianza de la variable ahorro queda explicado por la variable
renta a través del modelo lineal planteado?

REFERENCIAS BIBLIOGRÁFICAS
1. ÁVILA ACOSTA, R., (2001). Estadística Elemental. Estudios y Ediciones RA- Lima
– Perú.
2. BERENSON – LEVINE, (1996). Estadística Básica en Administración. 6ta edición.
Edit. PHH S. A. – México.
3. FREUND, John y MANNING SMITH, Richard, (1999). Estadística. 6ta edición –
Edit. Préntice Hall Hispanoamericana S.A.- México.
4. GUILFORD, J.P. y FRUCHTER, Benjamín, (1996). Estadística Aplicada a la
Psicología y la Educación. Edit. Mc Graw-Hill – México.
5. MILLER, Irwin y FREUND, John E.,1995. Probabilidad y Estadística para Ingenieros
– Edit. Préntice Hall Hispanoamericana S.A. – México.
6. MOYA, Rufino, (1991). Estadística Descriptiva. 1era edición –Editorial San Marcos-
Lima- Perú.
7. WEBSTER, A. y otros, (2000). Estadística Aplicada a los Negocios y a la
Economía.3era edición – Edit. McGraw-Hill Companies,

14

También podría gustarte