Trabajo Colaborativo Numero 2 Estadística Descriptiva
Trabajo Colaborativo Numero 2 Estadística Descriptiva
Trabajo Colaborativo Numero 2 Estadística Descriptiva
Introduccin
En este segundo trabajo colaborativo se desarroll un taller con base en el manejo del
contenido visto en el mdulo de estadstica descriptiva unidad 2, con la finalidad de
profundizar sobre los temas y teoras planteados y observar la total comprensin de los
temas propuestos en la unidad 2 por los estudiantes del curso estadstica descriptiva.
2. Las estaturas en centmetros de los socios de un club juvenil de Bogot, son las
siguientes:
153
138
152
145
152
123
128
128
124
156
129
134
146
132
160
132
148
143
138
159
147
125
138
144
157
138
139
138
141
168
137
146
122
137
178
134
145
146
146
142
131
148
137
138
113
147
135
151
146
130
Realizar una tabla de distribucin de frecuencias para datos agrupados dado que la variable
es estatura (cuantitativa continua), Calcular varianza, desviacin estndar y coeficiente de
variacin. Interprete los resultados.
Rango = xmaxxmn
Rango: 178 113 = 65
K = 1 + 322.3 log n
Nmero de intervalos de clase: 1 + 3.322Log50 = 6,6 = 7
Amplitud de los intervalos= A = R
k
A = 65= 9,28 = 10
7
R* = (A) (K)
R* = 10 x 7 = 70
Exceso = R R*
Exceso =70 65 = 5
Limites de clase:
Intervalos de Clase
Se agrega (A-1) = 10 1 = 9
116 + 9 = 125
125 + 9 = 134
134 + 9 = 143
143 + 9 = 152
152 + 9 = 161
161 + 9 = 170
170 + 9 = 179
Estatura en
cms
116 125
125 134
134 - 143
143 152
152 161
161 170
170 - 179
Total
Frecuencia
5
9
14
15
5
1
1
50
FRECUENCIAS
Frecuencia
Frecuencia absoluta
relativa (%)
acumulada
10%
5
18%
14
28%
28
30%
43
10%
48
2%
49
2%
50
100%
MEDIA
n = cantidad de elementos
Xi = valor de cada elemento
X = media aritmtica, o simplemente media x
X= Xi
n
X = 7.064 = 141,3
50
Frecuencia relativa
acumulada
10%
28%
56%
86%
96%
98%
100%
VARIANZA
X
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
(Xi X)
-28,3
-19,3
-18,3
-17,3
-16,3
-13,3
-13,3
-12,3
-11,3
-10,3
-9,3
-9,3
-7,3
-7,3
-6,3
-4,3
-4,3
-4,3
-3,3
-3,3
-3,3
-3,3
-3,3
-3,3
-2,3
-0,3
0,7
1,7
2,7
3,7
3,7
4,7
4,7
(Xi X)2
800,89
372,49
334,89
299,29
265,69
176,89
176,89
151,29
127,69
106,09
86,49
86,49
53,29
53,29
39,69
18,49
18,49
18,49
10,89
10,89
10,89
10,89
10,89
10,89
5,29
0,09
0,49
2,89
7,29
13,69
13,69
22,09
22,09
146
146
146
147
147
148
148
151
152
152
153
156
157
159
160
168
178
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
7064
4,7
4,7
4,7
5,7
5,7
6,7
6,7
9,7
10,7
10,7
11,7
14,7
15,7
17,7
18,7
26,7
36,7
22,09
22,09
22,09
32,49
32,49
44,89
44,89
94,09
114,49
114,49
136,89
216,09
246,49
313,29
349,69
712,89
1346,89
7206,10
N
Reclamaciones
N De usuarios
26
10
Calcular:
a. El promedio de reclamos.
X=
94 = 1,6
60
356
60
-- (157)2= 3,5
CV = 8 *100 = 10,25 %
78
EXAMEN EN ALGEBRA
Media final: 73
Desviacin tpica 7,6
Varianza: 57.76
Coeficiente de variacin:
CV = 7,6 *100 = 10,41 %
73
Estadstica = Desviacin Estndar = s = 8
Algebra = Desviacin Estndar = s = 7.6
Se tiene entonces que en Estadstica hubo una mayor dispersin absoluta, pues la
desviacin estndar de estadstica es de 8 > 7,6, desviacin estndar de Algebra.
b. Dispersin relativa
Para saber en cul hubo mayor dispersin relativa, se recurre al coeficiente de variacin:
Estadstica = CV = 8 * 100 = 10.25
78
Algebra = CV = 7.6 * 100 = 10.41
73
La dispersin Relativa muestra que el Coeficiente de Variacin de los exmenes de
Algebra es mayor que el de Estadstica 10.41 > 10.25.
Entonces de manera absoluta hay mayor dispersin entre los resultados de los exmenes de
estadstica pero de manera relativa hay mayor dispersin en los resultados de
Exmenes de algebra.
c. Si el estudiante consigui 75 en estadstica y 71 en lgebra. En qu asignatura fue su
puntuacin relativa superior?
Estandarizamos con Z= (valor - media)
desviacin
Estadstica Z = (75-78) = -0.375
8
Algebra Z = (71-73) = -0.2632
7,6
La puntuacin relativa mayor fue en lgebra (-0.2632)
Estos valores de puntuacin Z negativos indican que ambas calificaciones se encuentran por
debajo de la media.
Dado que -0.2632 se encuentra ms cerca a 0 (la media de la variable estandarizada), se
dice que la puntuacin relativa del estudiante fue superior Algebra.
Y (PRESION)
100
98
105
110
112
120
Ventas (millones $)
1992
8.8
1993
9.7
1994
7.3
1995
6.7
1996
8.5
1997
9.2
1998
9.2
1999
8.4
2000
6.4
2001
6.2
2002
5.0
2003
6.7
2004
7.6
Si 8.8 es el 100%
9.7 ____ X
X= (9.7*100)/8.8= 110.2272
Si 9.7 es el 100%
7.3 ____X
Si 7.3 es el 100%
X=(7.3*100)/9.7= 72.2577
6.7 ____X
X=(6.7*100)/7.3= 91,7808
Si 6.7 es el 100%
8.5 ____X
X=(8.5*100)/6.7= 126,8656
Si 8.5 es el 100%
9.2 ____X
X=(9.2*100)/8.5= 108,2352
Si 9.2 es el 100%
8.4 ____X
X=(8.4*100)/9.2= 91,30437
Si 8.4 es el 100%
6.4 ____X
X=(6.4*100)/8.4= 76,1904
Si 6.4 es el 100%
6.2 ____X
X=(6.2*100)/6.4= 96,875
Si 6.2 es el 100%
5.0 ____X
X=(5.0*100)/6.2= 80,6451
Si 5.0 es el 100%
6.7 ____X
X=(6.7*100)/5.0= 134
Si 6.7 es el 100%
7.6 ____X
X=(7.6*100)/6.7= 113.4328
Medidas de dispersin
Total Hombres
Mujeres
71%
72%
70%
Media aritmtica
Es la medida ms conocida y la ms fcil de calcular. Se define como la suma de los
valores de una cantidad dada de nmeros dividido entre la cantidad de nmeros.
n
X
X
n
i
i =
=1
Donde: n = cantidad de elementos
3,2
3,1
2,4
4,0
3,5
3,0
3,5
3,8
4,2
4,0
Preguntas Buenas
Personas
15
13
19
21
SOLUCIN
PASO 1: Realizar la sumatoria del producto resultante de las clases por su frecuencia
absoluta. Para efectos del clculo de la media, deberamos sumar 15 veces el valor 1, 13
veces el valor 2, 8 veces el valor 3, hasta llegar a la ltima clase:
PASO 2: Dividir la sumatoria sobre el nmero total de datos.
En promedio los encuestados contestaron aproximadamente 3 (el valor exacto es 3,41)
preguntas buenas.
Ejemplo: media aritmtica para datos agrupados en tablas tipo B
Calcular la media para los datos distribuidos en la siguiente tabla de frecuencia:
Ni
Lm
Ls
Mc
40,0
48,1
44,1
48,1
56,1
52,1
56,1
64,1
11
60,1
64,1
72,1
32
68,1
72,1
80,1
21
76,1
80,1
88,1
18
84,1
88,1
96,1
14
92,1
96,1
104,0
100,1
SOLUCIN
Las marcas de clase representan a los intervalos de clase, por ejemplo, suponemos que la
marca de clase para el primer intervalo (44,1) se repite 3 veces, al desconocer los 3 valores
exactos que estn dentro de dicho intervalo.
PASO 1: Realizar la sumatoria del producto resultante entre las marcas de clase por su
frecuencia absoluta.
PASO 2: Dividir la sumatoria sobre el nmero total de datos.
47,8
23,1
12,4
35,4
44,0
26,2
18,6
11,0
32,0
12,4
49,4
41,4
18,6
21,0
26,3
11,1
21,4
30,6
12,8
43,1
18,1
38,1
16,8
12,4
33,6
40,9
15,2
33,2
48,2
37,0
SOLUCIN
Calculemos la media para los datos sin agrupar:
Ni Lm
Ls
Mc
11,00
17,41
14,21
17,41
23,81
20,61
23,81
30,21
27,01
30,21
36,61
33,41
36,61
43,01
39,81
43,01
49,40
46,21
Total
30
PASO 1: Realizar la sumatoria del producto resultante entre las marcas de clase por su
frecuencia absoluta.
PASO 2: Dividir la sumatoria sobre el nmero total de datos.
Podemos ver claramente una diferencia entre ambas medias: 27,74 para los datos no
agrupados y 28,29 para los datos agrupados. Esta diferencia radica que en la tabla tipo B
existe una perdida de informacin, al agrupar los datos en los intervalos de clase. El valor
de la media exacta es el calculado para los datos no agrupados, pero dada la proximidad de
la media para los datos agrupados, se tomar esta ltima como cierta.
Mediana
Se define como el valor que divide una distribucin de datos ordenados en dos mitades, es
decir, se encuentra en el centro de la distribucin. La mediana se simboliza como Me. Es
menos usada que la media aritmtica. Para su clculo es necesario que los datos estn
ordenados. Cuando la cantidad de datos es impar, fcilmente se identifica la mediana; pero
cuando el nmero de datos es par, la mediana se calcula hallando el valor medio entre los
dos valores centrales y no coincidir con ninguno de los valores del conjunto de datos.
La med iana se encuentra en el interva lo donde la frecu encia acu mu lada llega hasta
la mit ad de la s u ma de las frecuen cias abs olut as .
Ejem plo: Calcu lar la m edian a de una dis tr ibucin es tads ti ca que vi ene
dada por la s iguiente tabla:
fi
Fi
[60, 63)
[63, 66)
18
23
[66, 69)
42
65
[69, 72)
27
92
[72, 75)
100
100
100/2 = 50
6 7
8 9 10
4 3 3 2
3 16 20 10 1
XY
X2
Y2
24
36
16
16
21
49
20
24
64
10
18
81
10
10
100
40
13
50
97
330
39
X=40/50= 0.8
Y=13/50=0.26
Calculamos la covarianza
Covarianza= 97/50 (0.8*0.26) =
Covarianza= 1.94 0.208 = 1.732
Ahora calculamos las desviaciones estndar
Desviacin estndar X=330/50 0.82
Desviacin estndar= 6.6 0.64
Desviacin estndar= 5.96 = 2.44
Desviacin estndar X=2.44
Desviacin estndar Y= 39/50 0.262
Desviacin estndar Y=0.78- 0.0676
Desviacin estndar Y=0.7124= 0.8440
Desviacin estndar Y=0.8440
Coeficiente de correlacin= 1.732/2.44*0.8440=
Coeficiente de correlacin= 1.732/2.059=0.8411
Coeficiente de correlacin= 0.8411
Recta de regresin de Y sobre X
Calculamos las varianzas
X= 330/5-0.82=
X=66-0.64=65.36
Varianza de X= 65.36
Y=39/5-0262
Y=7.8-0.0676=7.7324
Varianza de Y= 7.7324
Y-0.26 = 1.732/0.8 (x-0.8)
Y-0.26 = 2.165 (x-0.8)
Y-0.26=2.168X-1.732
Y=2.168X-1.732+0.26
Y=2.168X-1.47200
Marca de
clase
2
Frecuencia
Fx
Fx2
4108861
8217722
16435444
4295913
30071391
210499737
12
4339046
52068552
624822624
17
3933754
66873818
1136854906
22
3641839
80120458
1762650076
27
3280767
88580709
2391679143
32
2917290
93353280
2987304960
37
2919161
108008957
3996331409
42
2732504
114765168
4820137056
47
2291308
107691476
5061499372
52
1835340
95437680
4962759360
57
1450658
82687506
4713187842
62
1104733
68493446
4246593652
67
921054
61710618
4134611406
72
702518
50581296
3641853312
77
504438
38841726
2990812902
82
278875
22867750
1875155500
87
210325
18298275
1591949925
Total
41468384
1188669828
51165138626
1. Medias de dispersin
Media
Varianza
Desviacin estndar
Coeficiente de variacin
Desviacin media
XY
X2
4108861
8217722
4295913
30071391
49
12
4339046
52068552
144
17
3933754
66873818
289
22
3641839
80120458
484
27
3280767
88580709
729
32
2917290
93353280
1024
37
2919161
108008957
1369
42
2732504
114765168
1764
47
2291308
107691476
2209
52
1835340
95437680
2704
57
1450658
82687506
3249
62
1104733
68493446
3844
67
921054
61710618
4489
72
702518
50581296
5184
77
504438
38841726
5929
82
278875
22867750
6724
87
210325
18298275
7569
Coeficiente de correlacin
De acuerdo a los resultados de la varianza podemos ver que hay menor dispersin
en el ao 2010 con respecto al 2011, es decir que hay menor diferencia de edad
entre los grupos de personas que recibieron asistencia escolar.
Segn la desviacin tpica en el ao 2010 hay menor estabilidad en los grupos de
edades con respecto a la media.
Tambin estos resultados nos permiten ver que hay una gran variacin en el grupo
de datos, o sea que hay datos muy distantes o mucha diferencia entre las edades de
los estudiantes.
Objetivos.
-
Que los estudiantes comprendan y interioricen todos los temas que la unidad 2
presenta.
Conclusin.
Se evidencia la satisfactoria comprensin y entendimiento de la unidad 2 del mdulo de
estadstica descriptiva al concluir este trabajo colaborativo satisfactoria mente, todos los
integrantes del grupo hemos puesto en prctica lo que se ha aprendido al leer y estudiar el
modulo y la unidad 2 de el mismo, tambin hemos realizado un trabajo en grupo el cual
ha dado buenos resultados siendo este documento la prueba de ello.
Bibliografa
http://estadisticadescriptivaunad100105.blogspot.com/
http://66.165.175.244/campus05_20131/file.php/23/2013-1-_2C/Nuevo_TC2-20131.pdf
http://www.dane.gov.co/#twoj_fragment1-4
MODULOS - CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica
Descriptiva