Ejercicios Resueltos de Estadística Descriptiva

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

EJERCICIOS RESUELTOS DE ESTADSTICA DESCRIPTIVA Nivel E.S.O.

2) Las estaturas de 27 jvenes, en cm, son las siguientes:


155 169 167 178 158 151 170 170 163 165 179 158 173 161 164 168 164 174 160 156 176 166 170 164 176 171 154

a) Tabular los datos en intervalos de clase de amplitud 5. b) Incluir en la tabla las frecuencias absolutas acumuladas, las frecuencias relativas, los tantos por ciento y las frecuencias relativas acumuladas. c) Hallar la Media, la Mediana, la Moda, los Cuartiles y la Desviacin Tpica. d) Dibujar los datos en un grfico adecuado. Solucin: a) Tabular los datos en intervalos de clase de amplitud 5. Se trata de una variable estadstica continua, por lo que tiene sentido tabular los datos en intervalos. Calculamos los valores mayor y menor de la muestra: 179 y 151. La diferencia es el rango: R = 179-151 = 28. Localizamos el mltiplo de 5 (la amplitud de los intervalos) ms prximo a 28 pero mayor o igual que 28: 30. sta ser la amplitud total de todos los intervalos de clase. Dividiendo 30/5 = 6 obtenemos el nmero total de intervalos de clase. Si empezamos el primero de los intervalos en 150 (por ejemplo) como la amplitud total de todos los intervalos ser 30, terminaremos en 150+30 = 180. Estas elecciones son vlidas, porque cubrimos desde el menor valor (151) hasta el mayor valor (179) de la muestra. Construimos la tabla con los intervalos resultantes: [150, 155); [155, 160); [160, 165); [165, 170); [170, 175); [175, 180] y haciendo un recuento de cuantos datos de la muestra caen dentro de cada uno de ellos (es decir, las frecuencias absolutas):

xi [150, 155) [155, 160) [160, 165) [165, 170) [170, 175) [175, 180]

fi 2 4 6 5 6 4 n = 27

La suma de la columna de las frecuencias es el nmero total de datos n = 27. Aadimos una columna con las marcas de clase. stas son los puntos medios de cada uno de los intervalos. Hay dos formas de calcularlos: 1) Sumamos los extremos del intervalo y dividimos el resultado entre 2. Por ejemplo, para el primer intervalo, la marca de clase es (150+155)/2 = 152,5. 2) Calculamos la mitad de la amplitud de los intervalos: 5/2 = 2,5. Sumamos esta mitad al extremo inferior de cada intervalo y nos sale la marca de clase. Para el primer intervalo es: 150+2,5 = 152,5. La tabla, con la columna de marcas de clase, es:
xi [150, 155) 152,5 [155, 160) 157,5 [160, 165) 162,5 [165, 170) 167,5 [170, 175) 172,5 [175, 180] 177,5 fi 2 4 6 5 6 4 n = 27

A partir de ahora, trabajamos la tabla como si fuera una tabla de datos sin agrupar en intervalos (es decir, ignoraremos la primera columna). Entonces, para los clculos, supondremos que los datos son las marcas de clase, con lo que sera como si 152,5 se repitiera 2 veces (su frecuencia), 157,5 4 veces, etc.

b) Incluir en la tabla las frecuencias absolutas acumuladas, las frecuencias relativas, los tantos por ciento y las frecuencias relativas acumuladas. Las frecuencias absolutas acumuladas son la suma de las frecuencias absolutas de todas las filas que estn por encima del dato actual, incluida la fila de dicho dato:
xi [150, 155) 152,5 [155, 160) 157,5 [160, 165) 162,5 [165, 170) 167,5 [170, 175) 172,5 [175, 180] 177,5 fi Fi 2 2 El mismo valor que en fi 4 6 El valor anterior de Fi (2) ms el de fi de al lado (4) 6 12 El valor anterior de Fi (6) ms el de fi de al lado (6) 5 17 12+5 6 23 17+6 4 27 23+4 n = 27

Las frecuencias relativas son los cocientes entre las frecuencias absolutas y n:
xi [150, 155) 152,5 [155, 160) 157,5 [160, 165) 162,5 [165, 170) 167,5 [170, 175) 172,5 [175, 180] 177,5 fi Fi hi 2 2 2 / 27 = 0,0740 4 6 4 / 27 = 0,1481 6 12 6 / 27 = 0,2222 5 17 5 / 27 = 0,1852 6 23 6 / 27 = 0,2222 4 27 4 / 27 = 0,1481 n = 27

La suma de las frecuencias relativas debe ser 1. Si las sumamos escritas en forma de fraccin, en efecto resulta 1. No es as en forma decimal a causa de los redondeos (se desprecian muchos decimales). Los tantos por ciento son las frecuencias relativas multiplicadas por 100:
xi [150, 155) 152,5 [155, 160) 157,5 fi 2 4 Fi hi % 2 2 / 27 = 0,0740 7,40% 6 4 / 27 = 0,1481 14,81%

[160, 165) 162,5 [165, 170) 167,5 [170, 175) 172,5 [175, 180] 177,5

6 12 6 / 27 = 0,2222 22,22% 5 17 5 / 27 = 0,1852 18,52% 6 23 6 / 27 = 0,2222 22,22% 4 27 4 / 27 = 0,1481 14,81% n = 27

Al igual que antes, la columna debera sumar 100. Si no es as es a causa de los errores que se comenten redondeando. Las frecuencias relativas acumuladas se calculan dividiendo las Fi entre n:
xi [150, 155) 152,5 [155, 160) 157,5 [160, 165) 162,5 [165, 170) 167,5 [170, 175) 172,5 [175, 180] 177,5 fi Fi hi % Hi 2 2 2 / 27 = 0,0740 7,40% 2 / 27 = 0,0740 4 6 4 / 27 = 0,1481 14,81% 6 / 27 = 0,2222 6 12 6 / 27 = 0,2222 22,22% 12 / 27 = 0,4444 5 17 5 / 27 = 0,1852 18,52% 17 / 27 = 0,6296 6 23 6 / 27 = 0,2222 22,22% 23 / 27 = 0,8519 4 27 4 / 27 = 0,1481 14,81% 27 / 27 = 1 n = 27

c) Hallar la Media, la Mediana, la Moda, los Cuartiles y la Desviacin Tpica. La frmula de la media aritmtica es:

es decir, sumamos cada dato xi multiplicado por su frecuencia fi y dividimos el resultado total entre n. Para facilitar los clculos, creamos una columna con los productos de cada xi por su correspondiente fi y sumaremos la columna, lo que nos dar el numerador de la frmula:
hi % Hi 2 / 27 = 2 / 27 = [150, 152,5 2 2 7,40% 0,0740 0,0740 155) 4 / 27 = 6 / 27 = [155, 157,5 4 6 14,81% 0,1481 0,2222 160) 6 / 27 = 12 / 27 = [160, 162,5 6 12 22,22% 0,2222 0,4444 165) xi fi Fi xifi 305 630 975

5 / 27 = 17 / 27 = [165, 167,5 5 17 18,52% 0,1852 0,6296 170) 6 / 27 = 23 / 27 = [170, 172,5 6 23 22,22% 0,2222 0,8519 175) 4 / 27 = [175, 177,5 4 27 14,81% 27 / 27 = 1 0,1481 180] n= 27

837,5 1035 710

Por lo que:

Si hemos estudiado el ejercicio 1, que es el mismo que ste pero con los datos sin agrupar en intervalos, veremos que este resultado no coincide con el que all se obtuvo, aunque se trata del mismo problema. La media correcta es la del ejercicio 1, porque all empleamos los datos originales. Aqu hemos utilizado las marcas de clase, lo cual supone una aproximacin. Por ejemplo, en el primer intervalo hay 2 datos, que realmente son 151 y 154. Pero nosotros hemos hecho los clculos como si ambos fuesen 152,2. Si hacemos los clculos con la calculadora cientfica, basta introducir los datos xi y sus respectivas frecuencias fi y la calculadora nos da, no slo la media, sino tambin la desviacin tpica y la suma de la columna xifi. En el ejercicio 1 se explic cmo manejar la calculadora para esto. En este ejercicio, el primer dato a introducir en la calculadora ser la primera marca de clase 152,5 y su frecuencia, 2; el segundo, 157,5 y su frecuencia 4; etc. La mediana es el dato que ocupa la posicin (n+1)/2, ya que n = 27 es impar. Dicha posicin es 28/2 = 14. Dicho dato es 167,5 (observando la columna de frecuencias vemos que 152,2 ocupa las dos primeras posiciones; 157,5 las 4 siguientes, es decir, la 3, 4, 5 y 6. 162,5 ocupa las 6 siguientes, hasta la 12. 167,5 ocupa las 5 siguientes, hasta la 17. Por tanto, ocupa la 14 posicin). Por consiguiente: Me = 167,5

Al igual que antes, al compararlo con el ejercicio 1 no da el mismo resultado. El correcto es aquel, porque aqu estamos aproximando, como explicamos antes. La moda es el resultado que ms se repite. Esta muestra es bimodal porque tiene 2 modas: 162,5 y 172,5, ya que ambos se repiten 6 veces. El primer cuartil Q1 es el primer dato de la muestra, una vez ordenada, que deja por debajo el 25% de los datos. Como los datos son 27, resulta que el 25% de 27 = 0,25 27 = 6,75. El primer dato que deja por debajo a los 6,75 anteriores es el 7 (en realidad, ningn dato puede ocupar la posicin 6,75). Con el mismo razonamiento que seguimos para calcular la mediana, deducimos que: Q1 = 162,5 El segundo cuartil coincide con la mediana, calculada anteriormente. Luego: Q2 = 167,5 El tercer cuartil es el primer dato que deja por debajo el 75% de los datos de la muestra; esto es, 75% de 27 = 0,75 27 = 20,25 datos. Por tanto, ser el que ocupe la posicin 21, por lo que: Q3 = 172,5 La desviacin tpica lo mejor es obtenerla mediante la calculadora, tal como se explic antes. Si no disponemos de calculadora con capacidad estadstica, deberemos realizar los clculos, tal como vamos a hacer nosotros. Empezamos calculando la varianza que no es ms que la desviacin tpica al cuadrado. A su resultado le calcularemos la raz cuadrada. La frmula de la desviacin tpica es:

Para obtener el numerador, aadimos dos columnas a la tabla: una con los xi2 (los xi son las marcas de clase) y otra con los productos xi2fi:

xi [150, 155) 152,5 [155, 160) 157,5 [160, 165) 162,5 [165, 170) 167,5 [170, 175) 172,5 [175, 180] 177,5

fi 2 4 6 5 6 4 n = 27

xi2 23.256,25 24.806,25 26.406,25 28.056,25 29.756,25 31.506,25

xi2fi 46.512,5 99.225 158.437,5 140.281,25 178.537,5 126.025

Como la media la obtuvimos anteriormente:

Hemos obtenido el mismo resultado que en el problema 1; si as no hubiera sido, el correcto sera aqul, ya que aqu aproximamos los datos por las marcas de clase. d) Dibujar los datos en un grfico adecuado. Como se trata de una variable continua, el grfico ms adecuado es el histograma. Aqu si empleamos los intervalos de clase, que constituirn las bases de los rectngulos, mientras que las alturas sern las frecuencias absolutas.

También podría gustarte