t2 Alumnos
t2 Alumnos
t2 Alumnos
Lesiones
Leves
Med
10
10
40
20
60
80
20
30
30
50
60
50
Se pide:
1. Representar los datos anteriores grficamente
2. Calcular las distribuciones marginales para cada una de las variables de estudio.
3. Construir una tabla de distribucin de frecuencias porcentuales donde aparezcan
las distribuciones de la variable de tipo de Lesin condicionada a cada una de las
variables del Fumador.
4. Estudiar si las variables estn asociadas o no por medio de una medida
descriptiva. Realizar un anlisis grfico y comentar los resultados.
SOLUCIN:
a)
b) Se obtiene a partir de la tabla de doble entrada sumando las frecuencias y las filas, o bien por
columnas segn el caso.
Marg. Tabaquismo
FREC.
Marg.Accid. Lab.
FREC.
Muy fumador
70
Muy grave
65
Fumador
140
Grave
130
Fumador Espordico
210
Lesin media
140
No fumador
105
Leve
190
525
525
c) La distribucin de una variable condicionada a que otra variable tome un determinado valor
de la distribucin de frecuencias de la variable cuando mantenemos fijo el valor condicionante
de otra variable.
Muy Grave
Grave
Lesin Med.
Leve
Muy Fum.
28.57
14.29
14.29
42.86
100%
Fumador
21.43
28.57
14.29
35.71
100%
Fum.Espor.
4.76
28.57
38.10
28.57
100%
No Fum.
4.76
19.05
28.57
47.62
100%
Marg.Lesin
12.38
24.76
26.67
36.19
100%
Como ejemplo del clculo de la distribucin porcentual del Tipo de lesin condicionado al
individuo sea Muy Fumador se realizar dividiendo cada una de las frecuencias de la fila
Fumador entre el nmero total de Muy Fumadores y despus multiplicariamos como
((20/70)*100=28.57; (10/70)*100=14.29,).
Lesin Med.
Leve
Marg.Tab
M.F Obs.
20
10
10
30
70
M.F Esp
8.667
17.333
18.667
25.333
70
M.F z
3.850
-1.761
-2.006
0.927
70
M.F Sim.
70
F. Obs.
30
40
20
50
140
F Esp.
17.333
34.667
37.333
50.667
140
F: z
3.043
0.906
-2.837
-0.094
140
F. Sim.
140
F.E Obs.
10
60
80
60
210
F.E Esp.
26
52
56
76
210
F.E z
-3.138
1.109
3.207
-1.835
210
F.E Sim.
210
No F. Obs.
20
30
50
105
No F. Esp.
13
26
28
38
105
No F. z
-2.219
-1.177
0.378
1.947
105
No F. Sim..
105
Marg. Lesin
65
130
140
190
525
X = 75.917 este valor depende del tamao de la muestra y de la forma de la tabla, por tanto
utilizaremos el valor V de Cramer como medida descriptiva de la asociacin entre variables,
esta medida esta comprendida entre 0 y 1, siendo las variables independientes cuande vale 0 y
existiendo asociacin perfecta cuando vale1. La expresin para V es:
Alto
Medio Bajo
Bajo
Hombre
50
135
78
Mujer
20
147
98
Se pide:
SOLUCIN:
a)
b)
Alto
Medio
Bajo
Marg.Sexo
Hombre Obs.
50
135
78
263
Hombre Esp
34.867
140.466
87.667
263
Hombre z.
2.563
-0.461
-1.032
263
Hombre Sim.
263
Mujer Obs.
20
147
98
265
Mujer Esp.
35.133
141.534
88.333
265
Mujer z.
-2.553
0.459
1.029
265
Mujer Sim.
265
Marg. Salario
70
176
176
528
V=0.172
10
16
15
32
20
48
22
56
30
64
32
80
a) Existe relacin lineal entre las ventas de la empresa y sus gastos en publicidad?
Razona la respuesta.
b) Obtener las rectas de regresin mnimo cuadrtico.
c) Qu volumen de ventas de la empresa se podra esperar en un ao que se gaste de
publicidad 60000 pesetas? Y para un gasto en publicidad de 200000 pesetas?
d) Si lo nico que interesase fuese la evolucin del volumen de ventas en trminos de
gastos en publicidad, sin tener en cuenta la cantidad concreta de cada uno de ellas,
existira correlacin ordinal entre ambas variables?
SOLUCIN:
a) Dibujamos primero el diagrama de dispersin:
Observndolo podemos decir que existe relacin lineal entre ambas variables.
Ahora calculamos el coeficiente de determinacin lineal para obtener una medida descriptiva
del grado de asociacin lineal que existe entre las variables. La expresin del coeficiente de
determinacin es:
XY
10
16
100
256
160
15
32
225
1024
480
20
48
400
2304
960
22
56
484
3136
1232
30
64
900
4096
1920
32
80
1024
6400
2560
129
296
3133
17216
7312
Substituyendo obtenemos que r vale 0.956 que es lo que caba esperar despus de observar el
diagrama de dispersin.
*
b) Si expresamos las rectas de regresin como y = a+bx y x =c+dy los coeficientes de los
calculados son como:
Y =3.604+0.363x ; X =-7.356+2.637y
c) Para realizar la prediccin del volumen de ventas utilizamos la recta de regresin que tienen
las ventas en funcin de los gastos en publicidad. Para un gasto en publicidad de 60000 pesetas
*
obtendremos un volumen de ventas de x =3.604+0.363*60=25.384 millones de pesetas.
Si el gasto es de 200 millones de pesetas no podemos utilizar la recta de regresin puesto que el
valor 200 esta fuera del recorrido del gasto en publicidad. Si sustituimos nos da un valor de
76204 millones de pesetas, pues las rectas slo son vlidas dentro del rango o para valores
prximos a los extremos del recorrido.
10
15
20
22
30
32
16
32
48
56
64
80
Rang Y
Rang X
di
Di
El coeficiente de Spearman cuando no existen empates en los rangos, como ocurre en estos
datos, tiene la siguiente expresin:
En este caso rs es 1 por tanto existe correlacin ordinal positiva y perfecta, es decir a mayor
gasto en publicidad mayor volumen de ventas.
(Podemos observar que la correlacin lineal no es perfecta y sin embargo la correlacin
ordinaria si lo es).
4. Un banco estatal de cierto pas est estudiando la posibilidad de bajar los tipos de
inters para incentivar la inversin privada, y as abrir la posibilidad de creacin de
puestos de trabajo. Para ello contrasta los tipos de inters real de diferentes pases con la
inversin privada en los mismos, todo ello durante el ltimo perodo. Obtenindose los
resultados que aparecen reflejados en la siguiente tabla:
Tipos de Inters(en tantos por uno)
INVERSION(miles
mills
0.05-0.10
0.10-0.15
0.15-0.20
0.20-0.25
10-50
50-100
100-150
150-200
SOLUCIN:
Para facilitar el seguimiento de los clculos necesarios para resolver el problema construimos la
siguiente tabla resumen: (variable X=tipo de inters real; variable Y=inversin).
YX
0.075
0.125
0.175
0.225
Marg.Y
fixi
fiyi
30
240
7200
75
450
33750
125
625
78120
175
1050
183750
Marg.
X
25
2365
302850
fixi
0.45
0.75
1.225
1.35
3.775
fixi2
0.03375
0.09375
0.30375
0.64563
0.21438
fijyixj
10.5
40.5
9.375
65.625
9.375
62.5
65.625
21.875
285.375
10-30
30-50
50-70
1-6
6-11
11-16
SOLUCIN:
a) 9000 LPs
c) y*=28.22+1.42x
d) y*=28.22+1.42*1.8=30776 Conciertos.
Se pide:
1. Ajstese la recta de regresin lineal que explica el consumo de electricidad en fi del
volumen de produccin. Raznese la validez de la recta ajustada
SOLUCIN:
a) y*=-10.746+2.202x
b) r=0.959
7. Una empresa de manufacturas basa las predicciones de sus ventas anuales en los
resultados oficiales de la demanda total en la industria. A continuacin se dan los datos de
demanda total y las ventas efectuadas por la empresa en los ltimos 11 aos.
demanda total
(miles de tm)
200
220
400
330
210
390
280
140
280
290
380
ventas
(miles de
tm)
9
6
12
7
5
10
8
4
7
10
14
SOLUCIN:
1. X=Demanda Total, Y=Ventas
8. Se est estudiando la relacin entre el nmero de aos que una persona est afiliada al
sindicato y el nivel de satisfaccin con la actuacin de dicho sindicato. Para ello se parte de
los datos de 7 individuos tomados aleatoriamente de personas adscritas a partidos
polticos, obtenindose:
Aos
10
13
Satisfaccin
SOLUCIN:
1. r=0.711
2. y*=3.118+0.474x ; y*=3.118+0.474*11=8.332 en la escala de satisfaccin.
3. x*=0.270+1.068*y; x*=0.270+1.068*6= 6.678 aos.
35-45
4
3
2
45-55
1
3
2
1
55-65
5
1
Entre que valores estar el precio cuando la produccin est entre 115 y 135 toneladas?
Razona la respuesta.
SOLUCIN:
1. y*=68.291-0.167x
2
2. r=0.556 ; r =0.309
3. y*=68.291-0.167*115= 49.086 e y*=68.291-0.167*135=45.746 ; el precio estar entre
45.746 y 68.291 pesetas
U
V
W
X
1
3
4.543
6.646
2
5
4.543
6.646
3
6
4.543
6
4
5
4.543
6
5
7
4.543
6
6
9
4.543
7
7
10
4.543
7
8
9
4.543
5.684
9
10
4.543
8.838
SOLUCIN:
a)
10
10
14.117
14.186
2. v*=3.067+0.788u ; x*=3.067+0.788w
3. ruv=0.877 ; rwx=0.877
4. Podemos observar que ambas rectas son exactamente iguales y que la relacin lineal en
ambas es la misma, pero se puede apreciar en las variables U/V la recta es ms
representativa que en el otro caso. Observamos que la presencia del outlier puede
cambiar el resultado esperado.
5. En el diagrama de dispersin U/V no se observan outliers. En el diagrama W/X se
advierte la presencia de un outlier, que es el punto( 14.117,14.186) si lo eliminamos
obtenemos la x*=6.646 y la asociacin lineal entre ellas es nula,
R
6. Este apartado se realizar para las variablea U/V v =3.571+0.714u.
7. La principal conclusin es que hay que dibujar siempre el diagrama de dispersin de
datos.
11. Un gerente de recursos humanos desea determinar el salario que debe pagar acierta
categora de obreros. Para determinar dicho salario que debe pagar a cierta categora de
obreros. Para determinar dicho salario se realiza un estudio en el que intervienen las
variables Salario Mensual( en miles de ptas), Nivel de Produccin Anual en la
Empresa( en millones de ptas) y Nivel de especializacin Media del Trabajador ( de 0
a 10). El gerente obtiene esta serie de resultados:
Sal.
123.4
135.7
115.9
100.6
98.7
150.4
124.6
110.0
138.6
123.4
Prod.
300.5
325.9
298.6
200.9
300.4
359.8
279.6
215.6
250.0
300.0
Esp.
4.3
5.5
7.8
4.9
4.3
8.5
6.4
5.6
5.3
5.0
Se pide:
1. Calcular el plano de regresin lineal mnimo cuadrtico que explica el
salario en funcin de la produccin y del nivel de especializacin.
2. Estudia la validez de la funcin obtenida en el apartado anterior por medio
de una medida descriptiva. Cunto vale la varianza residual?
3. Calcula el coeficiente de correlacin parcial para dos variables
explicativas.
4. Comenta los resultados.
Qu salario se debera pagar si el nivel de produccin fuese de 315 millones de ptas. y el
nivel medio de especializacin de 6.6?
SOLUCIN:
1) Variable Y=Salario Xi=Produccin X2=Nivel de especializacin.
La tabla de clculos es:
X1
X2
X12
X22
YX1
YX2
X1X2
123.4
300.5
4.3
15227.6
90300.1
18.5
37081.7
530.6
1292.2
135.7
325.9
5.5
18414.5
106210.8
30.3
44224.6
746.5
1792.5
115.9
298.6
7.8
13432.8
89162.0
60.8
34607.7
904.0
2329.1
100.6
200.9
4.9
10120.4
40360.8
24.0
20210.5
492.9
984.4
98.7
300.4
4.3
9741.7
90240.2
18.5
29649.5
424.5
1291.7
150.4
359.8
8.5
22620.2
129456.0
72.3
54114.0
1278.4
3058.3
124.6
279.6
6.4
15525.2
78176.2
41.0
34838.32
797.4
1789.4
110.0
215.6
5.6
12100.0
46483.4
31.4
23716.0
616.0
1207.4
138.6
250.0
5.3
19210.0
62500.0
28.1
34650.0
734.6
1325.0
123.4
300.0
5.0
15227.6
90000.0
25.0
37020.0
617.0
1500.0
1221.3
2831.3
57.6
151619.8
822889.6
349.7
350112.2
7141.8
16570.0
La recta a construir tendr la forma y*= a+b1x1+b2x2 y para calcular los coeficientes de
la recta aparece un Sistema de Ecuaciones Come ste:
Que tiene por solucin a=56198 b1=0.158 b2=3.664 . Por tanto el plano de regresin es :
y*=56.198+0.158x1+3.664x2
3
El coeficiente de correlacin parcial entre la variable dependiente y una variable
explicativa mide la fuerza de la relacin lineal entre ambas cuando eliminamos el efecto lineal
de las otras variables explicativas. Su resultado es:
Calcular:
a) Determinar a partir del coeficiente de correlacin lineal mltiple la validez
de la funcin anterior. Cunto vale la varianza residual?
b) Determinar el coeficiente de correlacin parcial para cada una de las
variables explicativas y calcula el coeficiente de determinacin para
e
.
c) Qu variacin se produce en la demanda si el precio se incrementa en 3
unidades permaneciendo fijo el IPC?y si se reduce el IPC en 0,03
permaneciendo fijo el precio? Razona la respuesta.
d) Qu variacin porcentual se producira en la demanda si el precio varia
de 156 a 159 pesetas y el IPC permanece constante e igual a 0,04?
e) Qu volumen de demanda predeciras para un ao en que el precio es de
159 pesetas y el IPC anual previsto es del 3,5%?
SOLUCIN:
a)
b) SCE(
=0,195185; SCE(
=0,458711; SCE(
)=0,17046;
=0,6283934;
=0,1266746;
13. Las calificaciones obtenidas por 9 alumnos en los exmenes del primer trimestre y
del segundo son:
1
5
7
6
9
3
1
2
4
6
2
6
5
8
6
4
2
1
3
7
Calcular:
1- Si existe correlacin entre los resultados.
2- Las rectas de regresin de y sobre x y de x sobre y
SOLUCIN:
Construimos la siguiente tabla:
xi
5
7
6
9
3
1
2
4
6
43
xi2
25
49
36
81
9
1
4
16
36
257
yi
6
5
8
6
4
2
1
3
7
42
yi
36
25
64
36
16
4
1
9
49
240
x iy i
30
35
48
54
12
2
2
12
42
237
yj
xi
70-75
75-80
1,65-1,70
1,70-1,75
1
2
1,75-1,80
80-85
xi = Tallas
yj = Pesos
SOLUCIN:
Efectuamos un cambio de variable mediante
x i = x0 + a x i
yj = y0 + b yj
x0 = 1,725 ;
a = 0,05
y0 = 77,5 ;
b=5
xi
yj
-1
1,675
1,725
1775
1,65-1,70
1,70-1,75
1,75-1,80
fj
fj yj
fj y j
-1
xi
yj
-1
72,5 70-75
77,5 75-80
82,5 80-85
10
-4
-1
fi
fi xi
fi xi
1- Coeficiente de correlacin
Luego
Luego
yj
15-18
18-21
21-24
24-27
x = Edad del marido.
Calcular:
15-20
20-25
25-30
30-35
35-40
2
4
7
3
2
10
2
2
6
5
1
3
y = Edad de la esposa.
SOLUCIN:
Construimos la siguiente tabla:
xi
yj
-2
-1
17,5
22,5
27,5
32,5
37,5
15-20
20-25
25-30
30-35
35-40
fj
fj yj
fj y j
-24
72
-8
xi
yj
-1
16,5 15-18
19,5 18-21
22,5 21-24
10
24
24
24
22,5 24-27
10
30
90
22
194
fi
fi xi
fi xi
13
17
13
50
-6
-13
13
12
13
13
16
54
Resulta:
Coeficiente de regresin de y sobre x
individuos
PESOS/TALLAS
159-161
161-163
163-165
165-167
167-169
169-171
48
51
54
57
60
1. Hallar el peso medio y la talla media as como el error cometido al resumir pesos y tallas
por sus valores medios Que media es mejor?
SOLUCIN:
Si llamamos X a la variable pesos e Y a la variable tallas, los datos pueden arreglarse en una
tabla de doble entrada como sigue para realizar los clculos:
2
X/Y
160
162
164
166
168
170
Ni.
Ni.xi
Ni.xi
48
384
18432
51
14
714
36414
54
24
1296
69984
57
14
798
45486
60
10
600
36000
n.,j
13
15
19
70
3792
206316
n.j yj
960
1296
2132
2490
3192
1530
11600
153600
209952
349648
413340
536256
260100
1922896
n.j yj
Para hallar el peso medio y la talla media se calcularn las medias de las distribuciones
marginales de X e Y respectivamente. Asimismo para cuantificar el error cometido al resumir
pesos y tallas por sus valores medios se cuantificarn los coeficientes de variacin de pearson
para ambas marginales. Las distribuciones marginales de X e Y son las siguientes:
ni.
n.j
48
160
51
14
162
54
24
164
13
57
14
166
15
60
10
168
19
170
Tenemos lo siguiente:
5
i 1
1
N
ni
n j x j
j 1
x2
1
N
i 1
3792
54,17
70
nx
j 1
206316
2X 2
54,17 12,98
70
n y
N
11600
165,71
70
2
j
1922896
2
165,71 10,13
70
Vx
12,98
x
0,0665 6,65%
54,17
X
Vy
y
10,13
0,0192 1,92%
165,71
Y
X/Y=162, 164,
166
n i/j=2, 3, 4
Y/X=54
n j/i=3
48
160
51
162
54
17
164
57
166
60
168
170
X/Y
162,164,166
Y / X 54
2
1
N
1
N
n
j 1
ni / j 2,3, 4
x
i 1
j / i 3
j
1908
53
36
3968
165,33
24
9
101448 53
N i 1
36
2
6 n
y
1
656176
2
y2 / x 54 i j / i 3 j 165,33 2
165,33 5,55
N j 1
24
2
53
15
24
27
30
12
15
10
19
12
15
SOLUCIN:
Para estudiar la independencia de las dos variables utilizando la distribucin conjunta y las
marginales tenemos que comprobar quefij=fi.f.j \/ i,j.
La primera tarea ser construir una tabla con la distribucin conjunta (fij=nij/N) y con
las marginales (fi.=ni./N y f .j=n.j/N).
X/Y
15
24
27
30
ni.
12
14
15
10
28
19
12
15
42
n.j
18
24
12
30
84
fij
f.j
fi.
0,03571429 0,0476191
0,02380952
0,05952381
0,1666667
0,07142857 0,0952381
0,04761905
0,11904762
0,3333333
0,10714286 0,1428571
0,07142857
0,17857143
0,5
0,21428571 0,2857143
0,14285714
0,35714286
0,37142*0,16666
0,37142*0,33333
0,21428*0,5
0,28571*0,5
0,14285714*0,5
0,37142*0,5
Observamos que, una vez realizados estos clculos, se obtiene la tabla de la distribucin
conjunta fij.
fij
0,035714286
0,04761905
0,02380952 0,05952381
0,071428571
0,0952381
0,04761905 0,11904762
0,107142857
0,14285714
0,07142857 0,17857143
0,214285714
0,28571429
0,14285714 0,35714286
Para estudiar la independencia de las dos variables utilizando las distribuciones marginales
y las condicionadas tenemos que comprobar que f
f i, j.
i/ j
fi/j=1
fi/j=2
fi/j=3
fi/j=4
nj.
fj/i=1
3/14
4/14
2/14
5/14
14
fj/i=2
6/28
8/28
4/28
10/28
28
fj/i=3
9/42
12/42
6/42
15/42
42
f.j
18/84
24/84
12/84
30/84
84
3 / 14 6 / 28 9 / 42 18 / 84
4 / 14 8 / 28 12 / 42 24 / 84
2 / 14 4 / 28 6 / 42 12 / 84
5 / 14 10 / 28 15 / 42 30 / 84
Para estudiar la independencia de las dos variables utilizando las distribuciones marginales
y la condicionadas tambin podramos comprobar que fi/j=fi. \/ i,j.
nj.
fi/j=1
fi/j=2
fi/j=3
fi/j=4
f.j
3/18
4/24
2/12
5/30
14/84
6/18
8/24
4/12
10/30
28/84
9/18
12/24
6/12
15/30
42/84
18
24
12
30
84
3 / 18 4 / 24 2 / 12 5 / 30 14 / 84
6 / 18 8 / 24 4 / 12 10 / 30 24 / 84
9 / 18 12 / 24 6 / 12 15 / 30 42 / 84
xy 1
N
( x
i 1 j 1
x)( y j y)nij
Luego para su clculo necesitamos las medias de las dos marginales X e Y, que se
calcularn con los datos de la tabla:
X/Y
15
24
27
30
nj.
12
14
15
10
28
19
12
15
42
n.j
18
24
12
30
84
nx
N
i 1
1
N
n
j 1
xj
1386
16,5
84
2070
24,64
84
La covarianza, que ser cero debido a la independencia, puede calcularse como sigue
1
[(12 16,5)(15 24,6) (12 16,5)(24 24,6) (12 16,5)(27 24,6) (12 16,5)(30 24,6)
N
(15 16,5)(15 24,6) (15 16,5)(24 24,6) (15 16,5)(27 24,6) (15 16,5)(30 24,6)
xy
(19 16,5)(15 24,6) (19 16,5)(24 24,6) (19 16,5)(27 24,6) (19 16,5(30 24,6) 0
m11
XY
x y
i
1
N
xi y j nij
XY
i,j
34155
16,5 24,64 0
84
nij 34155
i,j
X/Y
15
24
27
30
ni.
xiyin1j xiz2n2j
xiz3n3j
xiz4n4j
xizinij
12
14
540
1152
648
1800
4140
15
10
28
1350
2880
1620
4500
10350
19
12
15
42
2565
5472
3078
8550
19665
n.j
18
24
12
30
84
4455
9504
5346
14850
34155
18. En una empresa se toma una muestra de 100 trabajadores con la finalidad de estudiar
si hay relacin entre su edad X y los das que estn de baja en el ao Y. se obtienen los
siguientes resultados:
X/Y
0-20
20-40
40-60
ni.
18-30
28
30
30-40
26
15
45
40-50
14
25
1.
2.
3.
4.
5.
SOLUCIN:
Para realizar los clculos necesarios elaboramos la tabla siguiente:
X/Y
10
30
50
ni.
xini.
xi2ni
24
28
30
720
35
26
15
45
45
14
n.j
60
31
yjn.j
600
yj2n
yj3n
.j
.j
N.j
ci
hi=ni/ci
17280
12
2,5
1575
55125
10
4,5
25
1125
50625
10
2,5
100
3420
123030
930
450
1980
6000
27900
22500
56400
60000
837000
1E+06
2022000
60
91
100
a10 X
1
N
a 01 Y
1
N
n x
i 1
20
j 1
34,2
3420
100
1980 19,8
100
xj
n x
i 1
X a20
123030
10
12
3
100
a20
2
2
m02 y
1
N
n y
i 1
a 02 a01
3
ni x i
a03 Y 1
1980
N i 1
56400
100 19,8 5{64 392,04 171,96
a02
19,8
100
Para estudiar la asimetra del nmero de das de baja de los trabajadores calculamos el
coeficiente de asimetra de Fisher de la variable marginal Y como sigue:
g 01
m03
3
Y
2243,184
( 171,96)
0,99
Se observa que hay una ligera asimetra hacia la derecha, pero muy pequea. Los das
de baja se distribuyen casi simtricamente a lo largo del ao.
Para calcular la edad ms frecuente de los trabajadores que piden la baja hallaremos la moda de
la variable marginal X. Observamos que el intervalo modal es [30,40] ya que es el que tiene
mayor frecuencia ni. El clculo de la moda se realiza como sigue:
M L
0
i 1 c
d i 1
d i 1 d i 1
30
i
2,5
10 35aos
2,5 2,5
Ahora intentaremos ajustar los das de baja en funcin de la edad de los trabajadores mediante
x
un modelo de regresin exponencial de ecuacin y=ab
1,4771
24
28
30
672 70,9008
0 742,9008
35
26
15
45
910 775,478
237,86 1923,338
45
14
25
n.j
60
31
100
zjn.j
60
zj2n
60
.j
1,699 ni.
1
xi y j nij X
N
i,j
X2
a 10
0,6013
10,04
b 10
0,01782
3,99
( (3,99(1,04)
i 1
R 1
1
i
e
2
Y
j 1
xi
)) nij
126,14
1
0,26
171,96
2
y
El ajuste no es de calidad porque R esta ms cerca del cero que de la unidad. El ajuste por
regresin lineal de la forma y= a+bx siendo:
1
y
xy
b 2
x
xi
i,j
nij X Y
2
x
100
60,66
0,854
xy n
XY)
2
XY
ij
,
i j
100
0,2536
60,66 *171,96
x y
i
nij
i,j
X/Y
10
30
50
ni
x i y j nij
x i 2 y j 2 nij 2 x i 3 y j 3 nij 3
24
28
30
6720
1440
8160
35
26
14
45
9100
15750
7000
31850
45
14
25
2700
18900
11250
32850
nj
60
31
100
18520
36090
18250
72860
x i y j n ij
El ajuste lineal tampoco es de calidad por que R esta ms cerca de cero que de la
unidad. Adems el ajuste exponencial es mejor que el ajuste lineal por que su
coeficiente de
determinacin es mayor (0,26>0,25536).
19. Los ahorros S y los ingresos Y mensuales en cientos de euros de una muestra de
10 familias de una determinada regin se presentan en la siguiente tabla:
1,9
1,8
2,0
2,1
1,9
2,0
2,2
2,3
2,7
3,0
20,5
20,8
21,2
21,7
22,1
22,3
22,2
22,6
23,1
23,5
SOLUCIN:
Comenzaremos elaborando una tabla de datos adecuada para los clculos a realizar en el
problema.
4
SI
yi
S i yi
y 2i
S i y2i
y i3
yi
1,9
20,5
38,95
420,25
798,475
8615,125
176610,063
1,8
20,8
37,44
432,64
778,752
8998,912
187177,37
21,2
42,4
449,44
898,88
9528,128
201996,314
2,1
21,7
45,57
470,89
988,869
10218,313
221737,392
1,9
22,1
41,99
488,41
927,979
10793,861
238544,328
22,3
44,6
497,29
994,58
11089,567
247297,344
2,2
22,2
48,84
492,84
1084,248
10941,048
242891,266
2,3
22,6
51,98
510,76
1174,748
11543,176
260875,778
2,7
23,1
62,37
533,61
1440,747
12326,391
284739,632
23,5
70,5
552,25
1656,75
12977,875
304980,063
Suma>21,9
220
484,64
4848,38
10744,028
107032,296 2366849,55
10
S i Na b y i
i 1
i 1
10
10
10
i 1
i 1
i 1
S i y i ay i b y i2
21,9=10a+220b
484,64=220a+4848,38b
a=-5,4
b=0,34
Luego el modelo lineal ajustado ser:
S i 5,4 0,34 y i
Para medir la calidad de ajuste lineal utilizamos el coeficiente de correlacin o su cuadrado, el
coeficiente de determinacin, que se calcula como sigue:
r2
YS2
y s
2
0,284 2
0,72421527
0,838 * 0,1329
Se observa que la calidad del ajuste es buena por que el coeficiente de determinacin es alto (el
coeficiente de correlacin vale
2,6
2,9
3,4
4,1
5,1
6,0
7,2
9,2
11,2
Ki
0,6
0,6
0,8
1,0
1,3
1,4
1,6
1,9
2,2
2,5
2,9
3,5
3,9
SOLUCIN:
Se trata de un ajuste tipo potencial. Todo este tipo de ajustes se resuelve aplicando logaritmos
para linea rizar de la siguiente forma:
c
y aK
Log ( 123
y) Log (a)
c Log (K ) Z A cx
123
142
Z
A
43
X
11,2137= 13 A + 2,54022 c
3,18349 = 2,54022 A + 1,3963c
A=0,6471
C=1,1
Luego el modelo de Cobb-Douglas ajustado ser:
y 4,4k
1,1
Para medir la calidad del ajuste potencial medimos la del ajuste lineal al que es equivalente
utilizando el coeficiente de correlacin o su cuadrado el coeficiente de determinacin se calcula:
xZ2
x Z
2
0,763 2
0,98
0,0692 * 0,0851
Se observa que la calidad del ajuste lineal es buena por que el coeficiente de determinacin es
21. La siguiente tabla muestra el nmero de grmenes patgenos por centmetro cbico de
un determinado cultivo segn el tiempo transcurrido:
N de Horas
N de grmenes
20
26
33
41
47
53
3
SOLUCIN:
a)
b)
, donde:
nmero de horas,
nmero de grmenes
22. En un depsito cilndrico, la altura del agua que contiene varia conforme pasa el
tiempo segn esta tabla:
Tiempo (h)
22
27
33
50
Altura (m)
17
14
12
11
r=-0,997. Hay una relacin muy fuerte entre las dos variable, y negativa. A medida que
pasa el tiempo la altura va bajando (se va consumiendo el agua)
b) Cual ser la altura del agua cuando hayan transcurrido 40 horas?
c) Cuando la altura del agua es de 2m, suena una alarmaQu tiempo ha de pasar
para que avise la alarma?
SOLUCIN:
a)
. Hay una relacin muy fuerte entre dos variables, y negativa. A medida que
pasa el tiempo, la altura va bajando (se va consumiendo el agua).
b) La recta de regresin es
, donde
,
.
c)
2000
2400
2500
3000
2900
2800
3160
Y(euros/kg)
1,80
1,68
1,65
1,32
1,44
1,50
1,20
SOLUCIN:
a)
b)
10
10
10
15
10
SOLUCIN:
Tomando en filas los valores de x y en columnas los valores de y podremos hacer:
Y
X
0
0
1
1
1 III
II
1
2
II
III
10
II
2
3
I
III
10
25. Las alturas (x) y los pesos (y) de 20 hombres son los siguientes:
X
1.72
63
1.76
71
1.70
75
1.70
70
1.70
68
1.69
66
1.68
70
1.66
60
1.75
74
1.78
74
1.69
72
1.74
69
1.71
67
1.70
65
1.69
69
1.69
71
1.67
70
1.71
73
1.74
84
1.78
69
SOLUCIN:
La distribucin de frecuencias ser la siguiente:
Y
X
60-65
65-70
1.65-1.70
II
1.70-1.75
IIII
1.75-1.80
TOTAL
2
4
I
2
70-75
1
7
IIII
75-80
80-85
III
7
I
3
9
TOTAL
9
4
20
Con las tablas de clculo correspondiente a las distribuciones marginales podremos calcular las
medias y las desviaciones estndar pedidas:
Distribucin marginal de Y:
ni
1,65-1,70
1,675
11,725
19,639
1,70-1,75
1,725
15,525
26,781
1,75-1,80
1,775
7,100
12,603
TOTAL
yi
Li-1-Li
20
ni yi
yi ni
34,350
59,023
Y = 34,350/20 = 1,7175
2
Sy = 59,023/20-(34,350/20) = 0,0013
Sy = 0,037.
Distribucin marginal de X:
ni
60-65
62.5
125._
7812.50
65-70
67.5
472.5
31893.75
70-75
72.5
652.5
47306.25
75-80
77.5
77.5
6006.25
80-85
82.5
82.5
6806.25
TOTAL
yi
Li-1-Li
20
ni yi
yi ni
1410._
99825._
X = 1410/20 = 70.50
2
10
10
10
SOLUCIN:
Tomando las notas de Fsica en abscisas y las de Matemticas en ordenadas, tendremos la
siguiente nube de puntos o diagrama de dispersin:
12
10
8
6
4
2
0
0
6
F
10
12
27. Sea una distribucin bidimensional en donde Syx = 4.1, Sy^2 = 9 y el coeficiente de
regresin de la recta de Y/X es b = -1,1.
Determnese:
a) Las dos rectas de regresin de Y/X y X/Y, sabiendo que x = 2, y = 5.
b) El coeficiente de correlacin lineal.
SOLUCIN:
a) Los coeficientes de regresin de las seran
Y/X
b = -1,1
X/Y
lo cual es imposible, ya que los dos coeficientes de regresin deben ser del mismo signo, puesto
que, como
b = Sxy/Sx^2
b' = Sxy/Sy^2
y las varianzas son no negativas, entonces el signo de b y b' debe ser el mismo que la covarianza
Sxy.
Como en este caso Sxy = 4,1 > 0, no puede ser b = -1,1, resultado que necesariamente debe
estar equivocado.
Aceptando como verdadero valor Sxy = 4,1, lo nico que podemos determinar es la recta de
regresin de X sobre Y
X/Y x*-x = Sxy/Sy^2(y-y)
x*-2 = 4,1/9(y-5)
x* = -0,3+0,46y.
b) Por los mismos motivos que antes no se puede determinar r, ya que, como
r = Sxy/SxSy b = -1,1 = 4,1/Sx^2
Sx^2 = 4,1/-1,1<0
28. Estdiese en cules de los casos que a continuacin se relacionan los resultados que se
ofrecen son compatibles entre si:
a) rxy = -0,3 y* = 4x+5.
b) Sxy = 100 Sx = 5
c) y = 5x+8
Sy^2 = 400
y = 1/5x+9
rxy = 0,2.
Se^2= 0.
d) y* = 1/2x+4
x* = y+4
x = 16
y = 12.
SOLUCIN:
a) Como el coeficiente de regresin de la recta b = 4 es positivo, no puede ser el coeficiente de
correlacin lineal negativo.
r = Sxy/SxSy = 100/5*20 = 1
r = sqrt(1-Se^2/Sy^2) = sqrt(1-0/400) = 1
Y/X
y* = 5x+8
X/Y
x* = 5y-45
Y/X y* = 1/5x+9
X/Y
x* = 1/5y-8/5
y, por tanto
d) Sabemos que el punto de corte entre las dos rectas de regresin debe ser (x,y); para
comprobar que en este caso se verifica esta propiedad resolveremos el sistema de ecuaciones
formado por estas dos ecuaciones
y = 1/2x+4
2y-x = 8
x = y+4
-y+x = 4
de donde
y = 12 = y
x = 4+y = 4+12 = 16 = x
que son precisamente los dos valores medios que nos ofrecen.
20
30
40
50
SOLUCIN:
a) Formemos la siguiente tabla:
xi
10
20
30
40
50
= 150
yj
200
180
150
120
100 = 750
xi^2
100
400
900
2000 3600
4500
a = y-bx
a10 = x = 30
Por tanto,
b = Sxy/Sx^2 = -520/200 = -2,6 a = y-bx = 150-(-2,6)*30 = 228.
De donde la recta ajustada es
y = 228-2,6.
30. En un determinado sector, la produccin y las exportaciones durante los ltimos aos
han sido:
Aos
1982
1983
1984
1985
1986
400
420
440
480
500
Exportaciones 80
80
90
92
98
Produccin
(10^6 Ptas.)
(10^6 Ptas.)
a) Si se estima que la produccin en el ejercicio 1988 va a ser de 640 millones de
pesetas y que las condiciones del mercado internacional no van a variar, cul
ser el volumen de expotacin previsible?
b) En qu medida esta prevsin puede ser o no aceptable?
SOLUCIN:
a) No es difcil defender la hiptesis de que el volumen de expotaciones es una variable que
depende de la produccin. Si las exportaciones las representamos por X y la produccin por Y,
la especificacin lineal de esta hiptesis viene dada por
x = a+by
Para estimar por mnimos cuadrados los parametros a y b, formaremos la tabla
xj
80
80
90
92
98
yi
400
420
440
480
xj^2
6400
6400
8100
8464
yi^2
160000
176400
193600
230400
250000 = 1010400
xjyi
32000
33600
39600
44100
49000 = 198360
500
440
=
2240
9604 =
38968
Como
x = Exj/N = 440/5 = 88
Sx^2 = a02-a01^2 a01 = x = 88
Tendremos que
b = Sxy/Sy^2 = 248/1376 = 0,18
El modelo ajustado es
x = 7,36+0,18y
Se estima que la produccin en 1988 va ser de 640 millones de pesetas y que las condiciones
del mercado internacional no cambian. Esta ltima hiptesis nos faculta para poder seguir
utilizando el modelo lineal ajustado por tanto,
x = 7,36+0,18*640 = 122,56 millones de pesetas.
Las exportaciones se situarn, pues, sobre los 122,56 millones de pesetas.
Y 1
X 60 63 65 70 70 70 80 80 80 80 85 89 90 90 90 90
94
100
100
100
SOLUCIN:
1) A partir de los datos experimentales que nos proporcionan, obtenemos el siguiente
grfico de dispersin:
10
8
Presin 6
sanguinea 4
2
0
20
40
60
80
100
120
Presin sonora
x 82.3
y 4.3
Y las varianzas y covarianza muestral:
k
S x2 1 xi x 2 ni 158.432
n i 1
k
S y2 1 y i y 2 ni 6.537
n i 1
S xy
i
i
27.168
y
j
ij
S xy
yy
S x2
x x
y 0.171x 9.813
32. Sea (X,Y) una variable aleatoria bidimensional con funcin de densidad conjunta
f x, y
xy
si 0 x 1 , 0 y 1
SOLUCIN:
Las correspondientes funciones de densidad marginales son:
fX x
fY y
1
0
1
0
f x, y y
f x, y x
1
0
xyy
1
y
xyx
x
2
Se obtiene entonces:
10 E X
EX
1
0
1
E Y 01
6
xfX x x
x fX x x
2
1
2
E Y
8
y por lo tanto:
20 x E X
2
E X
72
Adems:
E XY
11
xyf x, y yx
1 1
0 0
Cov
11
11
10
01
9
1 11 1 1
9 6 6 9 36
y 01 20 x 10
1 1
1
1 9 36
x
y
7
6
6
72
y
es decir:
1 6
1
x
6
6 7
SOLUCIN:
Recta de regresin de Y sobre X:
11
y 01 20 x 10
10 E X
01 E Y
x P X x 1
y PY
E X 2 xi2
P X
i 1
i 1
j 1
3
4
4
4
10
2.5
xi
1 2
30
2
2
2
1 2 3 4
4
4
2.5
20 x E X
2
E X
30
2
2.5 1.25
4
11 E XY xi y j P X xi ,Y y j
11
i 1
1
1
1 29
23 32 44
7.25
j 1
y 2.5
1
x 2.5
1.25
y 0.8x 0.5
10
Mat.
3.5
10
Ms.
6.5
4.5
10
SOLUCIN:
Indiquemos por X la nota de matemticas y por Y la nota de msica.
Medias:
y
Covarianza:
xi
yi
S
xy
5.75
6.3
1
n
x y
i
xy 3.075
Varianzas:
2
Sx
1
2
2
xi x 3.763
n
S y
1
2
2
y i y 2.96
n
Coef. de correlacin:
S xy
S xS y
3.075
3.7632.96
0.9214
Coef. de regresin:
b21
b12
Recta de regresin de Y sobre X:
S xy
S2 x
S xy
S2 y
0.817
1.039
y y b 21 x x
y 6.3 0.817 x 5.75
y y b12 x x
9 9 4 6 8 9 7 6 9 9 9 8 8 9 8 9 9 9 10 9 15 10 12 12 10 10 12 10 10 12 12 10
3 8 3 8 3 8 8 8 3 8 12 12 8 8 8 12 12 20 8 20 8 8 20 8 8 12 8 20 20 3 3 20
SOLUCIN:
a) Escribir la distribucin de frecuencias conjunta. Cul es el porcentaje de veces
que transcurre ms de nueve minutos desde la anterior utilizacin y se imprimen
menos de 12 pginas? Cuntas veces se imprimen menos de 12 pginas y
transcurren 9 minutos desde la anterior utilizacin?
xi\yj
12
20
ni.
fi.
1/0,03
0,03
2/0,06
0,06
1/0,03
0,03
1/0,03
2/0,06
1/0,03
0,12
2/0,06
4/0,12
3/0,09
2/0,06
11
0,34
10
3/0,09
1/0,03
3/0,09
0,22
12
2/0,06
2/0,06
1/0,03
0,16
15
1/0,03
0,03
n.j
15
32
f.j
0,19
0,47
0,16
0,19
8
0.25 25%
32
6
19%
0.19
32
Yj
12
20
n.j
15
f.j
0,19
0,47
0,16
0,19
N.j
21
26
32
F.j
0.19
0.66
0.81
32
n*k
32 * 80
N
21
25.6 26
Ni 1
i
100
100
P80 12Pg.
25
N de Pg. impresas
20
15
10
5
0
0
10
15
20
Tiempo
36. Se midi el tiempo en segundos que tardaron en grabarse los mismos 24 ficheros en
1/3
1/4
cada uno de los dos tipos de discos (3 y 5 ). Los tiempos observados fueron:
1/3
1.2 1
1/4
1.3 1.1 1.2 0.4 1.2 1.4 1.1 1.6 1.6 1.5 0.4 1.5 0.4 0.3 0.3 1.6 1.3 1.1 1.3 1.1 0.4 0.4 1.4 1.6
3
5
1.1 0.5 1.1 1.5 1 1.4 1.4 1.3 0.4 1.2 0.4 0.3 0.3 1.5 1.4 1.1 1.2 1.2 0.4 0.5 1.3 1.5
SOLUCIN:
a) Construye la tabla de frecuencias conjuntas. Cul es el porcentaje de ficheros que
tardan menos de 1.5 segundos en el primer tipo de disco y ms de 1.4 en el
segundo? Cuntos ficheros tardan en grabarse entre 0.6 y 1.2 segundos en el
primer tipo de disco? Cunto tiempo tarda como mucho en grabarse al menos el
90,5 de los ficheros en el segundo tipo de disco?
xi\yj
0,3
0,4
1,1
1,2
1,3
1,4
1,5
1,6
0,3
2/0,08
2 0,083 2 0,083
0,4
3/0,125
3 0,125 5 0,208
0,5
2/0,08
2 0,083 7 0,292
2/0,08
2 0,083 9 0,375
1,1
1/0,04 2/0,08
3 0,125 12 0,500
1,2
1/0,04 2/0,08
1/0,04
4 0,167 16 0,667
1,3
1/0,04 1/0,04
2 0,083 18 0,750
1,4
1/0,04
1,5
1/0,04
n.j
f.j
0,083
0,208
N.j
15
16
18
20
24
ni.
fi.
24
Ni.
Fi.
F.j
0,083
0,292
4
17%
0.17
24
9
0.375 37.5%
24
n*k
24 * 90.5
N
20
21.72 24
Ni 1
i
100
100
P90.5 1.6seg.
1/4
0,3
0,4
1,1
1,2
1,3
1,4
1,5
1,6
n.j
f.j
0,25
0,5
0,25
N.j
F.j
0,25
0,75
0,75
0,75
1,80
1,60
1,40
5 1/4
1,20
1,00
0,80
0,60
0,40
0,20
0,00
0,00
0,20
0,40
0,60
0,80
1,00
1,20
1,40
1,60
3 1/3
Se puede observar como los puntos describen una lnea recta difusa.
yy
S xy
* x x
S x2
x * n
i
i 1
n
n
y
j 1
x 1.008
*nj
y 0.97
n
n
2
x
Sn
x
i 1
2
i
* ni
x Snx 0.1739
Sn y
y 2* n
j
j 1
y Sny 0.3895
Sn y Sn 2 0.624
y
n
ij
S xy
i 1 j 1
* xi *
yj
x * y 0.1756
n
y 0.97
0.1756
* x 1.008
y 1.00977 * x 0.0478
0.1739
Si x = 0.8 y = 0.75996
Medida de fiabilidad
rxy
S xy
0.6748
Sx * Sy
Es una medida de fiabilidad mala puesto que no llega al 70 %, aunque este cerca.
37. Las siguientes son las calificaciones obtenidas por los 25 alumnos de un grupo de
Bachillerato en las asignaturas de Biologa y Qumica:
B 4 5
5 5 6 6
7 7
7 7 7
7 7 8
8 8 8
8 8 9 9
Q 3 5
5 6 7 7
7 7
7 7 8
8 8 7
7 8 8
8 8
9 9
10
8 8 8 10 10 10
SOLUCIN:
a) Obtener la tabla de frecuencias conjunta.
3
5
6
7
xi\yj
4
1/0,04
2/0,08 1/0,04
-
10
ni.
fi.
Ni.
Fi.
0,040
0,040
0,120
0,160
2/0,08
0,080
0,240
4/0,16 3/0,12
0,280 13 0,520
2/0,08 4/0,16
0,240 19 0,760
0,200 24 0,960
10
1/0,04
0,040 25 1,000
n.j
10
25
f.j
0,040
0,080
N.j
F.j
0,040
0,120
3/0,12 2/0,12
12
22
25
25 4
*100 84%
25
Ms de un 5 en B
25 4
*100 84%
25
Ms de un 5 en Q
25 3
*100 88%
25
Y=7
ni.
fi.
Ni.
Fi.
0,000
0,000
0,000
0,000
2/0,08
0,250
0,250
4/0,16
0,500
0,750
2/0,08
0,250
1,000
0,000
1,000
10
0,000
1,000
Notable = 7-8
6
*100 75%
8
12,00
Qumica
10,00
8,00
6,00
4,00
2,00
0,00
0,00
2,00
4,00
6,00
8,00
10,00
12,00
Biologa
Se puede observar como a mas nota en biologa se tiende a sacar mas nota en qumica, es una
relacin lineal ascendente.
x * n
i 1
n
n
y
j 1
x 7.32
*nj
y 7.4
2
x
Sn
x
i 1
2
i
* ni
x Snx 2.2176
Snx Sn 2 1.489
x
n
2
y
Sn
y 2 * n
j
j 1
y Sny 2.32
Sn y Sn 2y 1.523
n
S xy
r xy
n
i 1 j 1
ij
* xi * y j
n
S xy
S x * Sy
x * y 1.992
0.878
Aqu observamos lo que ya se haba comentado al ver el grfico, y es que hay una tendencia
lineal ascendente, por lo que a mayores notas en Biologa, ese mismo alumno, tendr
mayores notas de Qumica.
38. Los siguientes datos corresponden a los tiempos en segundos que tardaron en
ejecutarse seis programas elegidos al azar en el entorno Windows y en DOS:
Programa
Windows
2.5
7.1
8.5
8.1
DOS
2.3
7.1
6.6
9
Tiempo (seg)
8
7
6
5
4
3
2
1
0
1
Programa
Re 8.5 2.5 6
n 6 50 m n
ai
6 2.5 Ci 3
Re 6
2 ai 2
Ci 3
Datos de Dos:
Re 8 2.3 5.7
n 6 50 m n
ai
6 2.5 Ci 3
Re 5.7
1.9 ia 2
Ci
3
xi\yj
[2,5-4,5)
[4,5-6,5)
[6,5-8,5)
ci
ni.
fi.
Ni.
Fi.
[2,5-4,5)
1/0,17
3,5
0,167
0,167
[4,5-6,5)
1/0,17
5,5
0,167
0,333
[6,5-8,5)
1/0,17
3/0,5
7,5
0,667
1,000
cj
3,5
5,5
7,5
n.j
f.j
0,333
0,167
0,500
N.j
F.j
0,333
0,500
1,000
S xy
* x x
S x2
yy
n
c * n
i
i 1
n
n
c
j 1
*nj
y 5.83
n
n
2
x
Sn
x 6.5
c
i 1
2
i
* ni
x Snx 2.33
2
y
Sn
c2 * n
j
j 1
j
2
y Sny 3.26
n
Sn y Sn 2y 1.8
n
S xy
n
i 1 j 1
y 5.83
ij
* xi * y j
n
x * y 2.355
2.355
y 1.011* x 0.7397
* x 6.5
2.33
Si x = 3 y = 2.29 seg
Si y = 6 x = 6.666 seg
rxy
S xy
0.8568
S x * Sy
Es una medida de fiabilidad buena puesto que llega al 70 % y lo sobrepasa hasta llegar a un
85.68 %.
39. Un determinado partido poltico, se plantea el problema de hasta que punto le pueden
compensar los gastos de la campaa de propaganda para las futuras elecciones. En las
ltimas elecciones, los gastos de publicidad y el nmero de diputados elegidos han sido:
Gastos publicidad en miles de pesetas
Diputados elegidos
1500
1750
3250
4000
5000
ni.
fi.
Ni.
Fi.
1500
1/0,2
0,200
0,200
1750
1/0,2
0,200
0,400
3250
1/0,2
0,200
0,600
4000
1/0,2
0,200
0,800
5000
1/0,2
0,200
1,000
n.j
f.j
0,200
0,400
0,200
0,200
N.j
F.j
0,200
0,600
0,800
1,000
S xy
* x x
S x2
yy
n
x * n
i
i 1
n
n
y
j 1
*nj
y 5
n
n
2
x
i 1
Sn
x 3100
2
i
* ni
x Snx 1765000
y 2 * n
j
j 1
2
y
Sn
y Sny 3.2
Sn y Sn 2y 1.789
n
S xy
n
i 1 j 1
y 5
ij
* xi * y j
n
x * y 2200
3
2200
* x 3100 y 1.246 *10 * x 1.136
1765000
rxy
S xy
0.9256
S x * Sy
92.56 % de confianza
40. La resistencia del papel utilizado en la fabricacin de cajas de cartulina (Y) est
relacionado con la concentracin de madera dura en la pulpa original (X). Bajo
condiciones controladas, una planta piloto fabrica 16 muestras con un lote diferente de
pulpa y mide la resistencia a la tensin. Los datos obtenidos son los siguientes:
X 1
1.5
1.5
1.5
2.2
2.4
2.8
3.2
3.3
Y 101.4 117.4 117.1 106.2 131.9 146.9 146.8 133.9 111 123 125.1 145.1 134.3 144.5 143.7 146.9
Re 3.3 1 2.3
n 16 50 m
ai
a
Re
Ci
2.3
4
n 16 4 Ci 4
0.575 i
0.6
Datos de Y:
Re
Ci
45.5
11.375 i
12
xi\yj
[101,4-113,4)
[113,4-125,4)
[125,4-137,4)
[137,4-149,4)
cj
ni.
fi.
Ni.
Fi.
[1-1,6)
2/0,125
2/0,125
1,3
0,250
0,250
[1,6-2,2)
1/0,06
1/0,06
1,9
0,125
0,375
[2,2-2,8)
2/0,125
1/0,06
1/0,06
2,5
0,250
10
0,625
[2,8-3,4)
1/0,06
1/0,06
4/0,25
3,1
1,000
107,4
119,4
131,4
143,4
0,375
-
16
cj
6
16
n.j
f.j
0,125
0,313
0,188
0,375
N.j
10
16
F.j
0,125
0,438
0,625
1,000
160,00
Resistencia
140,00
120,00
100,00
80,00
60,00
40,00
20,00
0,00
0,00
0,50
1,00
1,50
2,00
2,50
3,00
Lo que se observa es una variacin muy leve de la resistencia a medida que aumentamos la
concentracin.
3,50
c * n
i
i 1
n
n
c
j 1
x 2.35
*nj
y 129.15
n
n
2
x
i 1
Sn
2
i
* ni
x Snx 0.5175
Snx Sn 2 0.719
x
n
c2 * n
j
j 1
2
y
Sn
y Sny 165.9375
Sn y Sn 2y 12.88
n
S xy
rxy
n
i 1 j 1
ij
* xi * y j
n
S xy
S x * Sy
x * y 5.9625
0.644
yy
S xy
* x x
S x2
y 129.15
5.9625
* x 2.35 y 11.52 * x 102.07
0.5175
Si x = 2.3 y = 128.566
SOLUCIN:
yy
S xy
* x x
S x2
S
xy
xy
y 2 * x y 2 * x 4 0.667 * x
S
S
x
Sxy
2 0.667
S
x
S xy
*x4
S x2
S xy
* x 4 0.667 * 3 1.999 2
S x2
S xy
* y y
S y2
4
x 3
* y 2
xx
x 4 0.5 * y
42. Hallar la recta de regresin de Y sobre X sabiendo que x = 4.1, y = 2.3 y la recta pasa
por el punto (5.9, 3.5).
SOLUCIN:
S
xy
xy
y 2 * x y 2 * x a b * x
S
S
x
x
Sxy
2b
S
x
a y
Sxy
* x y b* x
S x2
y a b * x y b * x b * x
b 0.6667