Estadística Anillado
Estadística Anillado
Estadística Anillado
1
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
¿Qué es la estadística?
Con respecto a los elementos del estudio los conceptos básicos de estadística son:
Población
Muestra
Individuo
Por otro lado, en referencia a los resultados que se obtienen en el estudio tenemos:
Valor
Dato
Muestreo
2
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Población:
A todos los elementos a los que le realizaremos en el estudio se les llama población.
En nuestro ejemplo, la población es el conjunto de todos los alumnos, es decir, los
200 alumnos.
No debes confundir este concepto con la población de una ciudad por ejemplo. La
población no tiene por qué ser siempre personas. Población son todos los
elementos a los que le vamos a hacer un estudio, independientemente de lo que
sea, ya sean piezas de una fábrica, animales, datos de cualquier tipo…
Muestra:
Se decide que de los 200 alumnos, van a escoger solamente a 50 para realizarles
una serie de preguntas. Estos 50 alumnos serían una muestra de la población, que
eran 200 alumnos. Por tanto, se le llama muestra a una parte que es representativa
de la población. La muestra siempre será más pequeña que la población.
3
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Individuo:
A cada uno de los alumnos del colegio, estadísticamente hablando se les llaman
individuos.
Valor:
El valor es el resultado de cada uno de los datos del estudio.
En nuestro ejemplo, estamos realizando un estudio sobre la cantidad de alumnos
que aprueban las matemáticas. Entonces, podemos tener dos valores diferentes por
cada dato:
Sí aprueba
No aprueba
Dato y variable:
Se le llama dato a cada uno de los valores obtenidos después de realizar el estudio
estadístico y variable al tipo de dato, que son una determinada característica de la
población (número de hijos, estatura, peso, color, profesión, etc).
Por ejemplo, empezamos estudiando a 3 alumnos y obtenemos estos datos:
Alumno 1: aprobado
Alumno 2: suspenso
Alumno 3: suspenso
En total, 1 «aprobado» y 2 «suspenso».
Tenemos 3 datos y cada uno de los datos puede tomar 2 valores («aprobado» o
«suspenso»). La variable estudiada en este caso es la calificación de la asignatura.
4
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Tipos de muestreo:
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo,
aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo
probabilísticos y métodos de muestreo no probabilísticos.
5
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio
de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la
misma probabilidad de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamaño n tienen la misma
probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos
nos aseguran la representatividad de la muestra extraída y son, por tanto, los más
recomendables. Dentro de los métodos de muestreo probabilísticos encontramos
los siguientes tipos:
1.- Muestreo aleatorio simple:
El procedimiento empleado es el siguiente:
a) Se asigna un número a cada individuo de la población
b) A través de algún medio mecánico (bolas dentro de una bolsa, tablas de
números aleatorios, números aleatorios generados con una calculadora u
ordenador, etc.) Se eligen tantos sujetos como sea necesario para completar
el tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica
cuando la población que estamos manejando es muy grande.
2.- Muestreo aleatorio sistemático:
Este procedimiento exige, como el anterior, numerar todos los elementos de la
población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se
parte de ese número aleatorio i, que es un número elegido al azar, y los elementos
que integran la muestra son los que ocupa los lugares es decir se toman los
individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre
el tamaño de la muestra:
k= N/n.
El número que empleamos como punto de partida será un número al azar entre
1 y k. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades
en la población ya que al elegir a los miembros de la muestra con una periodicidad
constante (k) podemos introducir una homogeneidad que no se da en la población.
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos
en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un
muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres
o sólo mujeres, no podría haber una representación de los dos sexos.
3.- Muestreo aleatorio estratificado:
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los
procesos y suelen reducir el error muestral para un tamaño dado de la muestra.
Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen
6
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
7
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
8
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
9
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Ejemplo 1:
Suponga que estamos investigando sobre el porcentaje de alumnos que trabajan
de una población de 20 alumnos de la Universidad de Tacna Base de datos de la
población:
María NO
Alicia NO
Fernanda NO
Pedro NO
Julio SI
Marcos NO
Rosa NO
Alberto SI
Fabián NO
Jorge SI
Ana NO
José NO
Laura NO
Carlos NO
Enrique NO
Miguel NO
Carmen SI
Victoria SI
Marcelo SI
Elija una muestra aleatoria simple de tamaño n=4 de esta población. Use la tabla
de números aleatorios adjunta, empiece en la fila 1 columna 1 y continúe
seleccionando hacia la derecha. Indique los pasos para elegir la muestra.
1-5 6-10 11-15 16-20 21-25 25-30 31-35 36-40 41-45 46-50
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672
10
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Respuesta:
Primero:
Asignamos número a cada alumno del 1 al 20:
Número Nombre ¿Trabaja?
Alumno
1 Juan SI
2 María NO
3 Alicia NO
4 Fernanda NO
5 Pedro NO
6 Julio SI
7 Marcos NO
8 Rosa NO
9 Alberto SI
10 Fabián NO
11 Jorge SI
12 Ana NO
13 José NO
14 Laura NO
15 Carlos NO
16 enrique NO
17 miguel NO
18 Carmen SI
19 Victoria SI
20 Marcelo SI
Segundo:
Buscamos en la tabla de números aleatorios 4 números, de dos dígitos, entre el 1 y
el 20, sin repetir.
11
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 7004
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672
Elija una muestra estratificada de tamaño n=4 de esta población. Use la tabla de
números aleatorios, en cada alternativa empiece en la fila 1 columna 1 y continúe
Seleccionando hacia la derecha. Indique los pasos para elegirla muestra.
12
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Nombre ¿Trabaja?
Alumno
Juan SI
María NO
Alicia NO
Fernanda NO
Pedro NO
Julio SI
Marcos NO
Rosa NO
Alberto SI
Fabián NO
Jorge SI
Ana NO
José NO
Laura NO
Carlos NO
enrique NO
miguel NO
Carmen SI
Victoria SI
Marcelo SI
Respuesta:
Para elegir una muestra estratificada, primero se dividen los hombres de las mujeres
y se asignan número de identificación a cada estrato:
13
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
ESTRATO MUJERES
ESTRATO DE HOMBRE
NUMERO NOMBRE DE LA
ALUMNA NUMERO NOMBRE DEL
ALUMNO
1 Alicia
1 Juan
2 Victoria
2 Pedro
3 María
3 Marcos
4 Fernanda
4 Alberto
5 Rosa
5 Jorge
6 Ana
6 José
7 Laura
7 Carlos
8 Carmen
8 Miguel
9 Julio
10 Fabián
11 Enrique
12 Marcelo
columna 1-5 6-10 11-15 16-20 21-25 25-30 31-35 36-40 41-45 46-50
fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672
Los números elegidos son: 10 y 1. Por lo tanto la muestra del estrato de hombres
queda constituida por Fabián y Juan. Fabián NO trabaja y Juan SI trabaja. Usando
la tabla de números aleatorios, se elige una muestra aleatoria simple de tamaño n=2
14
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
de las mujeres, buscando números del 1 al 8.Se parte de la fila 1 columna 1. Se usa
un dígito.
columna 1-5 6-10 11-15 16-20 21-25 25-30 31-35 36-40 41-45 46-50
fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672
Los números elegidos son: 1 y 4. Por lo tanto, la muestra del estrato de mujeres
queda constituida por Alicia y Fernanda. Alicia y Victoria NO trabajan .Por lo
tanto, la muestra final queda constituida por Fabián, Juan, Alicia y Fernanda.
Finalmente, la proporción de alumnos que trabaja en la muestra estratificada es
de 25%.
• Por ejemplo, el color de pelo de una persona, las notas de un examen, sexo,
estatura de una persona, etc.
15
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Variable cualitativa
• Las variables cualitativas son aquellas características o cualidades que no
pueden ser calculadas con números, sino que lo hacen con palabras.
• Este tipo de variable, a su vez se divide en las siguientes:
• Cualitativa nominal: Aquellas variables que no siguen ningún orden en
específico. Por ejemplo: Colores (Negro, Naranja, Amarillo).
• Cualitativa ordinal: Aquellas que siguen un orden o jerarquía. Por ejemplo:
Nivel socioeconómico (Alto, medio, bajo).
• Cualitativa binaria: En este caso, las variables son solamente dos. Por
ejemplo: Si o No, Hombre o Mujer.
Variable cuantitativa
16
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
• Variables cualitativas
• Nominal: Color de pelo de una persona: Castaño, Rubio o Morocho.
• Ordinal: La condición de un pasaporte: Aprobado, Negado, En Espera.
Frecuencias estadísticas
• Frecuencia Absoluta ( fi )
• Frecuencia Relativa Simple ( hi)
• Frecuencia Relativa Porcentual (hi%)
• Frecuencia Acumulada (Fi)
17
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Ejemplo:
• 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29,
29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
• En la primera columna de la tabla colocamos las variables ordenadas de
mayor a menor y en la segunda anotamos la frecuencia absoluta
Tabla
xi fi
27 1
28 2
29 6
30 7
31 8
32 3
33 3
34 1
31
Frecuencia relativa simple (hi)
18
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Hi = fi
n
Ejemplo:
Sea las notas de 10 alumnos en una prueba Pre test:
Xi= 12, 11, 10, 12, 13, 12, 10, 13, 12,13
Xi fi hi
10 2 0.2
11 1 0.1
12 4 0.4
13 3 0.3
total 10 1
Frecuencia relativa porcentual (hi%)
Es el producto de la frecuencia Absoluta “fi” por 100% entre el total de datos “n”asi;
Hi = fi x 100%
n
Ejemplo:
Sea las notas de 10 alumnos en una prueba Pre test:
Xi= 12, 11, 10, 12, 13, 12, 10, 13, 12,13
Xi fi hi hi%
10 2 0.2 20%
11 1 0.1 10%
12 4 0.4 40%
13 3 0.3 30%
Total 10 1 100%
“n”
19
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Fi= f1 + f2 + f3 +…….+ fi
Ejemplo:
Sea las notas de 10 alumnos en una prueba Pre test:
Xi= 12, 11, 10, 12, 13, 12, 10, 13, 12,13
Xi Fi hi hi% Fi
10 2 0.2 20% 2
11 1 0.1 10% 3
12 4 0.4 40% 7
13 3 0.3 30% 10
Total 10 1 100%
“n”
Hi = h1+h2+h3+…..+ hi
Ejemplo:
Sea las notas de 10 alumnos en una prueba Pre test:
Xi= 12, 11, 10, 12, 13, 12, 10, 13, 12,13
Xi fi hi hi% Fi Hi
10 2 0.2 20% 2 0.2
11 1 0.1 10% 3 0.3
12 4 0.4 40% 7 0.7
13 3 0.3 30% 10 1
Total 10 1 100%
“n”
Frecuencia relativa acumulada porcentual (Hi%)
HI%=h1%+hi2%+hi3%+…..+hi%
Ejemplo:
20
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Xi= 12, 11, 10, 12, 13, 12, 10, 13, 12,13
Xi fi hi hi% Fi Hi Hi%
10 2 0.2 20% 2 0.2 20%
11 1 0.1 10% 3 0.3 30%
12 4 0.4 40% 7 0.7 70%
13 3 0.3 30% 10 1 100%
Total 10 1 100%
“n”
Ejemplo;
Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los
siguientes resultados: Con los resultados obtenidos, elaborar una tabla de
frecuencias.
Solución:
Xi fi hi Hi%
Negro 4 4 0,20
Azul 5 9 0,25
Amarillo 5 14 0,25
Rojo 6 20 0,30
Total 20 1
21
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Ejemplo 2:
Xi fi hi hi% Fi Hi Hi%
0 8 8 0,267 0,267 26,7% 26,7%
1 7 15 0,233 0,500 23,3% 50,0%
2 7 22 0,233 0,733 23,3% 73,3%
3 5 27 0,167 0,900 16,7% 90,0%
4 3 30 0,100 1 10,0% 100%
Total 30 1 100%
Ejercicio 1:
22
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Ejercicio 2:
17 18 15 16 19
20 16 18 17 18
19 17 15 16 19
16 20 18 17 16
20 15 19 18 20
18 16 17 15 19
19
Elabore una tabla de frecuencias, agregando la frecuencia porcentual y la
frecuencia porcentual acumulada.
Ejercicio 3:
23
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Grafico estadístico
El siguiente paso, después de haber recogido y ordenado los datos en una tabla,
suele ser la representación gráfica de los mismos, usando alguno de los diversos
tipos de gráficos estadísticos. La representación gráfica debe ser lo
suficientemente clara y precisa para que de un vistazo obtengamos información
relevante acerca de la distribución de los datos.
24
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Polígono de frecuencias: son líneas poligonales que unen los vértices superiores
de las barras de un diagrama de barras o de los rectángulos en un histograma:
25
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
26
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Otros gráficos estadísticos: además de todos los anteriores, se suelen usar otros
gráficos, tales como:
Pirámides de población
Cartogramas
Pictogramas
27
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
a) Calcule la distribución de frecuencias de la variable obteniendo las frecuencias
absolutas, relativas y sus correspondientes acumuladas.
b) ¿Qué proporción de hogares está compuesto por tres o menos personas? ¿Qué
proporción de individuos vive en hogares con tres o menos miembros?
c) Dibuje el diagrama de frecuencias absolutas y el diagrama de frecuencias
acumuladas.
28
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13,14,15, 11, 11, 12, 16, 17, 17,16,16, 15,
14, 12, 11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13,
13, 15, 13, 11, 12.
a) Calcule la distribución de frecuencias de la variable obteniendo las frecuencias
absolutas, relativas y sus correspondientes acumuladas.
b) ¿Qué proporción de sucursales tiene más de 15 empleados?
c) Dibuje el diagrama de barras y el diagrama acumulativo de frecuencias
correspondientes.
d) Agrupe en intervalos de amplitud 3 los valores de la variable, calcule su
distribución de frecuencias y represente su histograma y su polígono de frecuencias
acumuladas.
e) Agrupe la variable en los intervalos que considere conveniente de amplitud
variable, calcule las densidades de frecuencia de cada intervalo y represente el
histograma correspondiente.
4. Los datos que se dan a continuación corresponden a los pesos en Kg. de ochenta
personas:
a) Obténgase una distribución de datos en intervalos de amplitud 5, siendo el primer
intervalo [50; 55].
b) Calcúlese el porcentaje de personas de peso menor que 65 Kg.
c) ¿Cuántas personas tienen peso mayor o igual que 70 Kg. pero menor que 85?
60;66;77;70;66;68;57;70;66;52;75;65;69;71;58; 66;6
7;74;61;63;69;80;59;66;70;67;78;75;64;71;81;62;64;
69;68;72;83;56;65;74;67;54;65;65;69;61;67;73;57;6
2;67;68;63;67;71;68;76;61;62;63;76;61;67;67;64;72;
64;73;79;58;67;71;68;59;69;70;66;62;63;66;
5. Una máquina ha fabricados 60 cilindros cuya longitud en centímetros se registra
29
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
239, 254, 255, 248, 246, 249, 242, 250, 249, 244, 253, 248
250, 258, 252, 251, 250, 253, 247, 243, 245, 251, 247, 250
248, 250, 259, 249, 249, 250, 251, 253, 241, 251, 249, 252
250, 247, 251, 259, 250, 246, 252, 238, 251, 238, 236, 259
249, 257, 249, 247, 251, 246, 245, 243, 250, 249, 242, 238
Se solicita:
a) Construya una distribución de frecuencia cuyas clases tengan como amplitud 5
centímetros y que la primera clase sea 235-239.
b) Construya el histograma y polígono de frecuencia
c) Qué Clase es la de mayor frecuencia?
d) Qué clase es la de menor frecuencia?
e) Qué porcentaje de cilindros son menores de 255 centímetros?
f) Qué porcentaje de cilindros son mayores de 244 centímetros?
4424536353
2137315172
5247362241
6433454324
3244366455
4551744365
Se pide:
A- Obtener la tabla de frecuencias para ese conjunto de datos. Interpretar la tabla.
B- Determinar e interpretar el tercera cuartil y el percentil 42%.
C- Calcular el tiempo medio de permanencia de los vehículos en el parqueo.
Interpretar el resultado y los elementos que intervienen.
7. Un fabricante de neumáticos ha recabado, de los diferentes concesionarios,
información sobre la cantidad de miles de kilómetros recorridos por un modelo
concreto de esos neumáticos hasta que se ha producido un pinchazo o un reventón
del neumático. Los concesionarios la han proporcionado los siguientes datos:
30
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Se pide:
a- Construir una taba de frecuencias para esos datos tomando como número de
intervalos ignorando los miles y redondeando. O sea 52.542 será 52 y así
sucesivamente, de manera que cada clase sea de amplitud 13, y la primera clase
sea 4-16. Interpretas la tabla.
b- Construir las tablas de frecuencias acumuladas ascendente.
c- Dibujar el histograma de frecuencias relativas sin acumular y acumulado.
d- Calcular las principales medidas de tendencia central e interpretarlas.
e- Obtener las medidas de dispersión más importantes e interpretarlas.
f- Analizar la asimetría y el apuntamiento de la distribución de frecuencias resultante.
31
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
(X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn)
---------------------------------------------------------------------------------------
Xm =
n
Según el tipo de datos que se analice será más apropiado utilizar la media aritmética
o la media geométrica.
32
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Todos los elementos del conjunto tienen que ser mayores que cero. Si algún
elemento fuese cero (Xi=0), entonces la MG sería 0 aunque todos los demás valores
estuviesen alejados del cero.
La media geométrica es útil para calcular medias de porcentajes, tantos por uno,
puntuaciones o índices. Tiene la ventaja de que no es tan sensible como la media a
los valores extremos.
No presentan el problema de estar influido por los valores extremos, pero en cambio
no utiliza en su cálculo toda la información de la serie de datos (no pondera cada
valor por el número de veces que se ha repetido).
33
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
X X X x x
1,20 1 1 3,3% 3,3%
Xm = --------------------------------------------------------------------------------------------------
30
Luego:
Xm = 1,253
34
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
35
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Los más usados son los cuartiles, cuando dividen la distribución en cuatro partes;
los deciles, cuando dividen la distribución en diez partes y los centiles o percentiles,
cuando dividen la distribución en cien partes. Los cuartiles, como los deciles y los
percentiles, son en cierta forma una extensión de la mediana.
U Q(u)
0.5 Mediana
CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
36
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer
cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes
(75%) de los datos.
Datos Agrupados
n
k Fk
4
Qk Lk *c
fk
Como los cuartiles adquieren su mayor importancia cuando contamos un número
grande de datos y tenemos en cuenta que en estos casos generalmente los datos
son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los cuartiles
cuando se trata de datos agrupados es la siguiente:
k= 1,2,3
Donde:
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los
datos; es decir, aquel valor de la variable que supera 25% de las observaciones
y es superado por el 75% de las observaciones.
37
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
P f a 1 P
n
Q1 l i * Ic 4
f1
Donde:
L1 = limite inferior de la clase que lo contiene
Ic = intervalo de clase
P f a 1 P
2n
Q1 l i * Ic 4
f1
Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
38
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de
los datos, es decir aquel valor de la variable que supera al 75% y es superado
por el 25% de las observaciones.
P f a 1 P
3n
Q1 l i * Ic 4
f1
Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Otra manera de verlo es partir de que todas las medidas no son sino casos
particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer
cuartil 75% percentil.
1* n
4
Cuando n es impar:
39
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
1(n 1)
4
3* n
4
Cuando n es impar:
3(n 1)
4
DECILES
Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto
de datos ordenados en diez partes iguales, son también un caso particular de los
percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo
decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.
Datos Agrupados
Para datos agrupados los deciles se calculan mediante la fórmula.
n
k Fk
Dk Lk 10
*c
fk
k= 1,2,3,... 9
Donde:
Lk = Límite real inferior de la clase del decil k
40
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
n = Número de datos
P f a 1 P
4n
D4 l i * Ic 10
f1
P f a 1
D9 li * Ic
f1
41
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
A* n
10
Cuando n es par:
An 1
10
Cuando n es impar:
CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación
o clasificación de las personas cuando atienden características tales como peso,
estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en
cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99),
leídos primer percentil,..., percentil 99.
Datos Agrupados
k= 1,2,3,... 99
42
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
P f a 1
P1 li * Ic
f1
P f a 1 P
99n
P99 li * Ic 100
f1
- El percentil 99 supera 99% de los datos y es superado a su vez por el 1%
restante.
43
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
Para los percentiles, cuando n es par:
A* n
10
An 1
100
Cuando n es impar:
Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con
el percentil 50 y el tercer cuartil con el percentil 75.
3. EJEMPLO
Salarios No. De fa
(I. De Empleados
Clases) (f1)
200-299 85 85
300-299 90 175
500-599 70 365
600-699 62 427
44
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
700-800 36 463
P f a 1
P li * Ic
f1
Siendo,
n
P
4
La posición del primer cuartil.
7n
P
10
30n
P
100
463
115.5
4
El primer cuartil:
115.5 – 85 = 30.75
Li = 300, Ic = 100 , fi = 90
45
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
30.75
Q1 300 *100 334
90
El 7 decil:
7463 3241
324.1
10 10
Posición:
324.1 – 295 = 29.1
Li = 500, fi = 70
29.1
D7 500 *100 541.57
70
El percentil 30
Posición:
30463 13890
138.9
100 100
138.9 – 85 = 53.9
fi = 90
53.9
P30 300 *100 359.88
90
Estos resultados nos indican que el 25% de los empleados ganan salarios por
debajo de $ 334; que bajo 541.57 gana el 57%de los empleados y sobre $359.88,
gana el 70% de los empleados.
46
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
EJERCICIOS PROPUESTOS
Nº de caries fi ni
0 25 0.25
1 20 0.2
2 x Z
3 15 0.15
4 y 0.05
10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16,
14, 8, 18
Meses Niños
9 1
10 4
11 9
12 16
13 11
14 8
15 1
Dibujar el polígono de frecuencias.
Calcular la moda, la mediana, la media y la varianza.
47
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
xi fi Fi ni
1 4 0.08
2 4
3 16 0.16
4 7 0.14
5 5 28
6 38
7 7 45
8
7. El resultado de lanzar dos dados 120 veces viene dado por la tabla:
Sumas Veces
2 3
3 8
4 9
5 11
6 20
7 19
8 16
9 13
10 11
11 6
12 4
Calcular la media y la desviación típica.
Hallar el porcentaje de valores comprendidos en el intervalo (x − σ, x + σ).
48
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Altura Nº de jugadores
[170, 175) 1
[175, 180) 3
[180, 185) 4
[185, 190) 8
[190, 195) 5
[195, 2.00) 2
La media.
La mediana.
La desviación típica.
¿Cuántos jugadores se encuentran por encima de la media más una
desviación típica?
1 2 3 4 5 6
fi a 32 35 33 b 35
49
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Hallar la mediana.
¿A partir de que valores se encuentran el 25% de los alumnos más
pesados?
11. De esta distribución de frecuencias absolutas acumuladas, calcular:
Edad Fi
[0, 2) 4
[2, 4) 11
[4, 6) 24
[6, 8) 34
[8, 10) 40
12. Una persona A mide 1.75 m y reside en una ciudad donde la estatura media
es de 1.60 m y la desviación típica es de 20 cm. Otra persona B mide 1.80
m y vive en una ciudad donde la estatura media es de 1.70 m y la
desviación típica es de 15 cm. ¿Cuál de las dos será más alta respecto a
sus conciudadanos?
13. Un profesor ha realizado dos tests a un grupo de 40 alumnos, obteniendo
los siguientes resultados: para el primer test la media es 6 y la desviación
típica 1.5.
50
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Di = x - x
Ejemplo
51
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
9, 3, 8, 8, 9, 8, 9, 18
Ejemplo
52
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
xi fi xi · fi |x - x| |x - x| · fi
21 457.5 98.57
Varianza
53
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Ejercicios de varianza
9, 3, 8, 8, 9, 8, 9, 18
54
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
xi fi xi · fi xi2 · fi
42 1 820 88 050
55
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Propiedades de la varianza
56
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Desviación típica
La d esvi a ci ó n tí pi ca es la ra í z cu ad rad a d e l a
vari an za .
57
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
9, 3, 8, 8, 9, 8, 9, 18
xi fi xi · fi xi2 · fi
58
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
42 1 820 88 050
59
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
2. En los casos q ue n o se p u ed a h al l ar l a
med i a t amp oco ser á posi ble h a llar la d es vi aci ó n
tí p i ca .
60
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Rango o recorrido
Definición: se llama recorrido de una distribución a la diferencia entre el
mayor y el menor valor de la variable estadística.
Cálculo del recorrido
Es muy sencillo aplicando la definición, consiste en ordenar los valores de menor a mayor
y restar al último el primero.
Observaciones al recorrido
1. Cuanto menor es el recorrido mayor es el grado de
representatividad de los valores centrales.
2. Cuanto mayor es, la distribución está menos concentrada o más
dispersa.
3. Tiene la gran ventaja de su sencillez de cálculo.
4. Tiene gran aplicación en procesos de control de calidad,
5. Tiene el inconveniente de que sólo depende de los valores
extremos. De esta forma basta que uno de ellos se separe mucho
para que el recorrido se vea sensiblemente afectado.
6. Para paliar este inconveniente a veces se utilizan otros dos rangos:
Rango intercuartílico: Q = Q3 – Q1
Rango entre percentiles: P = P90 – P10
Estos rangos son algo más estables, ya que tienden a eliminar aquellos
valores extremadamente alejados.
Medidas de dispersión
61
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
62
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Ejemplo ilustrativo:
Calcular la desviación media de la distribución: 3, 8, 8, 8, 9, 9, 9, 18
Solución:
Se calcula la media aritmética.
63
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Se emplea la ecuación:
6 4
7 2
8 3
9 2
10 1
Total 12
Solución:
64
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
2-4 6
4-6 8
6-8 16
8-10 10
Total 40
65
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Solución:
Intervalo F Xm F·xm
2-4 6 3 18
4-6 8 5 40
6-8 16 7 112
8-10 10 9 90
Total 40 260
66
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
67
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
68
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Notas:
1) Para el cálculo de la varianza de una muestra se divide por n-1 en lugar de
N, debido a que se tiene n-1 grados de libertad en la muestra. Otra razón por
la que se divide por n-1 es debido a que una muestra generalmente está un
poco menos dispersa que la población de la cual se tomó. Al dividir para n-1
en lugar de N se cumple con la tendencia y sentido lógico de que la varianza
y desviación estándar de la muestra deben tener un valor más pequeño que la
varianza y desviación estándar de la población.
69
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
70
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Por lo tanto se tiene un intervalo desde $ 590 - $474,97 = $ 115,03 hasta $ 590
+ $474,97 = $ 1064,97
Interpretación: Se puede afirmar de que por lo menos el 75% los sueldos están
entre $ 115,03 y $ 1064,97
A B
350,14 350,09
350,18 350,12
349,98 350,20
349,99 349,88
350,12 349,95
71
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
72
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
73
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Calificaciones F
4 3
5 6
6 4
7 13
8 7
10 6
Total 39
Solución:
A) Se llena la siguiente tabla:
74
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Calificaciones F Fx
4 3 12
5 6 30
6 4 24
7 13 91
8 7 56
10 6 60
Total 39 273
75
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Intervalo F
60-65 5
65-70 20
70-75 40
80-85 27
85-90 8
Total 100
Solución:
76
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
Intervalo F Xm F·xm
77
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO
BIBLIOGRAFIAS
78