Cap1 Esta Descript
Cap1 Esta Descript
Cap1 Esta Descript
Estadística Descriptiva
Jhon F. Bernedo Gonzales • Ronny I. Gonzales Medina • 2020
Índice
1. ¿Qué es la Estadística? 1
4. Distribución de frecuencias 9
4.1. Variables cualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.2. Variables Cuantitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.3. Distribución de frecuencias por intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
5. Forma de la distribución 27
5.1. Distribuciones Multimodales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.2. Distribución uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.3. Distribución simétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.4. Distribución asimétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
6. Ejercicios resueltos 31
7. Ejercicios propuestos 32
1 ¿Qué es la Estadística?
Cuando se habla de estadística, se suele pensar en una relación de datos numéricos presentada de
forma ordenada y sistemática. Esta idea es la consecuencia del concepto popular que existe sobre
el término y que cada vez está más extendido debido a la influencia de nuestro entorno, ya que
hoy día es casi imposible que cualquier medio de difusión, periódico, radio, televisión, etc., no nos
aborde diariamente con cualquier tipo de información estadística sobre accidentes de tránsito, índices
de crecimiento de población, turismo, tendencias políticas, etc. Sólo cuando nos adentramos en un
1
Probabilidad y Estadística 2. Elementos, población, muestra, caracteres
mundo más específico como es el campo de la investigación de las ciencias sociales, medicina, biología,
psicología, etc; empezamos a percibir que la Estadística no sólo es algo más, sino que se convierte en la
única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en
cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrínseca, no puedan
ser abordadas desde la perspectiva de las leyes deterministicas. Podríamos, desde un punto de vista
más amplio, definir la estadística como LA CIENCIA QUE ESTUDIA CÓMO DEBE EMPLEARSE LA
INFORMACIÓN Y CÓMO DAR UNA GUÍA DE ACCIÓN EN SITUACIONES PRÁCTICAS QUE
ENTRAÑAN INCERTIDUMBRE. La ESTADÍSTICA se ocupa de los métodos y procedimientos para
recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e
incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos,
con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. Podríamos por
tanto clasificar la Estadística en descriptiva, cuando los resultados del análisis no pretenden ir más allá
del conjunto de datos, e inferencial cuando el objetivo del estudio es derivar las conclusiones obtenidas
a un conjunto de datos más amplio.
1. Individuos o elementos. Personas u objetos que contienen cierta información que se desea
estudiar.
4. Parámetro. Función definida sobre los valores numéricos de características medibles de una
población.
5. Estadístico. Función definida sobre los valores numéricos de una muestra. En relación al tamaño
de la población, ésta puede ser:
Finita: Como es el caso del número de personas que llegan al servicio de urgencia de un
hospital en un día;
Infinita: Si por ejemplo estudiamos el mecanismo aleatorio que describe la secuencia de
caras y sellos obtenida en el lanzamiento repetido de una moneda al aire.
2
Probabilidad y Estadística 2. Elementos, población, muestra, caracteres
Ejemplo 2.1.
Consideremos la población formada por todos los estudiantes de una universidad del Perú(finita).
La altura media de todos los estudiantes es el parámetro µ. El conjunto formado por los alumnos
de la Facultad de Arquitectura e Ingeníerias es una muestra de dicha población y la altura media
de esta muestra, X, es un estadístico.
7. Modalidades Diferentes situaciones posibles de un carácter. Las modalidades deben ser a la vez
exhaustivas y mutuamente excluyentes. Cada elemento posee una y sólo una de las modalidades
posibles.
8. Clases Conjunto de una o más modalidades en el que se verifica que cada modalidad pertenece a
una y sólo una de las clases.
Definición 2.1. Datos es una colección de números, nombres, etiquetas, símbolos y el contexto
de estos valores.
Frecuentemente, los datos representan un subconjunto de una población. Por ejemplo, los datos pueden
ser
Los datos pueden ser registrados de forma periódica (secuencial), tal como la temperatura del ambiente,
la humedad relativa, el número de pacientes que llegan a un hospital por día entre otros.
Para obtener información que sea útil de los datos, se debe de saber el contexto de los valores numéricos
y no numéricos de estos. Por ejemplo, suponga que sea obtenga un valor registrado para Felipe, este
valor es igual a 2350, ahora este valor no es útil sin un marco de referencia, esto es, un contexto. Así,
este valor de 2350 puede significar el dinero que gana mensualmente o puede ser su código postal ó
su registro en su colegio profesional. Por tanto, si los datos están dispersos sin estructura los valores
registrados (numéricos o no numéricos) proporcionarán poca o nula información para el investigador,
empresa, gobierno, entre otros.
Para tener una visión mas clara de los datos es necesario organizarlos en una tabla tal como se observa
en la Tabla 1. Nótese que este arreglo ayuda a entender mejor los datos, donde en la parte superior se
indica los nombres de las características y cada fila es asociada a un individuo u objeto bajo estudio.
Además, cada fila (denominado caso) tiene p características.
En resumen, la tabla mostrada abajo es denominada tabla de datos, matriz de datos o conjunto de
datos (en inglés se indica como data set). En este sentido, la mayoría de los softwares estadísticos
organizan los datos en forma de tabla de datos.
3
Probabilidad y Estadística 2. Elementos, población, muestra, caracteres
Ejemplo 2.2.
En la Tabla 2 se presenta una tabla de datos relacionada con algunas características de la municipali-
dades del Perú. Los datos presentados en esta tabla es una muestra tomada de toda la población de
municipalidades. En esta tabla de datos se puede observar que:
la primera columna con el nombre idmuni muestra el código de cada municipalidad, así una fila
de esta tabla de datos representa unicamente una municipalidad (observación o caso).
la segunda columna tipomuni indica el tipo de municipalidad que puede ser distrital o provincial
la columna telcod registra el código de de ciudad del telefono fijo asociado a la municipalidad.
la columna total ingreso indica la cantidad de dinero (en soles) que recibió la municipalidad
hasta el día de la entrevista
la columna total gastos indica la cantidad que gastó la municipalidad hasta el día de la entrevista
4
Probabilidad y Estadística 2. Elementos, población, muestra, caracteres
En la tabla anterior se puede observar las diferentes características asociadas a las municipalidades
tanto numéricas como no numéricas. El número de características mostradas en la Tabla 2 es 8
si embargo se tienen mas características. Nótese que estos datos es una muestra de la población
de municipalidades del Perú, para mas detalles sobre este conjunto de datos se puede consultar
en http://iinei.inei.gob.pe/microdatos/ en la encuesta Registro Nacional de Municipalidades
(RENAMU) año 2019.
Las características registradas en cada columna para cada municipalidad son denominados de variables
o variable estadística.
5
Probabilidad y Estadística 3. Clasificación de las variables
Definición 2.2. Una variable estadística a una característica de interés observada que puede
tomar diferentes valores para diferentes casos bajo estudio.
Nótese que el término variable indica que los valores asociados a los individuos u objetos varían entre
ellos. Los diferentes valores registrados para una variable se denomina observaciones. Las observaciones
pueden ser de naturaleza numérica tal como el volumen de agua que llovió en una ciudad, el salario
de una persona entre otros. También, las observaciones pueden ser de naturaleza no numérica, en este
caso cada observación pertenece a una categoría o nivel, como por ejemplo el nivel de satisfacción de
un cliente que puede: ser muy malo, malo, regular, bueno y muy bueno. Asimismo, se debe de dejar
claro que el conjunto de calores registrados para un particular caso o una fila en la tabla de datos es
llamado también de observación.
Por otro lado, el número de variables registradas para cada elemento u observación indica la dimensión
y complejidad del conjunto de datos. Así, dependiendo de si hay una, dos o mas de dos variables se
tiene que el conjunto de datos es univariado, bivariado o multivariado respectivamente.
Ejemplo 2.3.
En la población constituida por los empleados de la universidad, algunas variables estadísticas definidas
en ésta población son:
6
Probabilidad y Estadística 3. Clasificación de las variables
Cualitativa ordinal
Una variable cualitativa es ordinal si existe un orden o rango en las categorías. Así, se puede indicar
cual es el primero (que dependería de la intensidad de la categoría y el contexto), el segundo, el tercero
y así sucesivamente. Y de esta forma se puede clasificar los datos de acuerdo al orden definido y esta
clasificación ayudará en el análisis de esta variable.
Ejemplo 3.1.
Algunos ejemplos de variables ordinales
El rango en una empresa. Por ejemplo puede ser clasificado como: presidente, vicepresidente, jefe
de departamento, empleados.
El grado de instrucción de una persona. Por ejemplo: analfabeto, primaria, secundaria, tecnico
superior, superior universitario.
El riesgo de una persona ante la exposición de un virus: Por ejemplo puede ser clasificado como:
alto, medio, bajo.
Cualitativa nominal
Una variable cualitativa es nominal si unicamente se tiene las categorías y no existe un orden o rango
en las categorías. Descriptivamente, para esta variable nominal se realiza un conteo y se indica el
porcentaje de observaciones que pertenecen a cada categoría. Una medida resumen usada para esta
variables es la moda (la categoría que tiene mayor frecuencia).
Ejemplo 3.2.
Algunos ejemplos de variables nominales
El distrito de residencia de los alumnos que llevan el curso de estadística básica. Por ejemplo:
Cercado, Selva Alefre, Cayma, Paucarpata, entre otros
7
Probabilidad y Estadística 3. Clasificación de las variables
Variable Discreta
Una variable cuantitativa es discreta si esta tiene un número contable de valores distintos. Esto
es, lo valores posibles de la variable discreta corresponden a puntos aislados en la recta numérica.
Frecuentemente, los valores son enteros y provienen de conteo ("número de").
Ejemplo 3.3.
Algunos ejemplos de variables cuantitativas discretas
Variable Continua
Una variable cuantitativa es continua si sus valores caen en un intervalo de la recta real. Las variables
continuas surgen de realizar mediciones físicas, por ejemplo, distancia, peso, tiempo, velocidad.
También, pueden provenir de variables financieras tal como ventas, activos, ratios precio/ganancias,
porcentajes, entre otros.
Ejemplo 3.4.
Algunos ejemplos de variables continuas
1. Nominal. Aquí, los números solo sirven para distinguir valores o categorías diferentes de la
variable. Ejemplo. El sexo de los electores se mide a este nivel de medición o escala. Una escala
apropiada puede ser, por ejemplo:
0 ≡ femenino; 1 ≡ masculino.
8
Probabilidad y Estadística 4. Distribución de frecuencias
a=femenino; b=masculino
para ciertos a y b números reales, fijados previamente y con la única condición de que sean
diferentes.
2. Ordinal. Aquí, los números, además de servir para distinguir, reflejan un orden existente entre
los valores de la variable, según el menor o mayor grado en el que se encuentre presente la
característica. Ejemplo. El grado de instrucción del elector, se suele medir con medir con este nivel.
Para simplificar, supongamos que solo distinguimos cuatro: analfabeto, primaria, secundaria y
superior. Entonces, una escala apropiada puede ser:
3. De intervalo. Además de las características anteriores, se tiene que las diferencias entre los
números asignados representan propiamente cantidades de la característica medida. Esto se logra
definiendo una unidad de medida y un cero u origen, este último es arbitrario por no existir
naturalmente, es decir, no existe un valor que indique ausencia de la característica que se mide.
Como ejemplo tendriamos la temperatura que se mide en una determinada ciudad
Ejemplo 3.5.
Los ingresos del elector se miden con este nivel o escala, pues existe una unidad de medida y
existe el cero absoluto u origen natural, es decir, un valor que, sin importar la escala de razón
empleada, indica ausencia de ingresos.
4 Distribución de frecuencias
Después de la recopilación o colecta de datos, es necesario resumirlos y presentarlos en forma tal, que
faciliten su comprensión y posterior análisis y utilización. Así, si se tiene datos univariados (una sola
variable) los valores observados son ordenados en tablas o cuadros. A esta tabla donde se ordenan los
datos se denominada tabla de distribución de frecuencias.
En la tabla de distribución de frecuencias se describe las frecuencias (conteo) de los valores asumidos
por las observaciones.
9
Probabilidad y Estadística 4. Distribución de frecuencias
1. Frecuencia absoluta (fi ): es el número de veces (cuantas veces se repite) que un valor aparece en
los datos. Nótese que
f1 + f2 + . . . + fk = n
X
i
Fi = fi = f1 + f2 + . . . + fi , i = 1, 2, . . . , k
j=1
3. Frecuencia relativa (hi ): es la proporción de las observaciones que pertenecen un mismo grupo
(categoria, classe) y es dado por
fi
hi =
n
La suma de las frecuencias relativas es igual a 1
h1 + h2 + . . . + hk = 1.00
X
i
Hi = hi = h 1 + h2 + . . . + hi , i = 1, 2, . . . , k
j=1
El último valor de las frecuencias relativas acumuladas debe ser igual a 1.00, Hk = 1
%hi = 100 × hi
Así, la tabla de distribución de frecuencias para una variable cualitativa es dada por
Observación:
10
Probabilidad y Estadística 4. Distribución de frecuencias
Ejemplo 4.1.
En la siguiente tabla se registran 143 empresas que cotizan en la bolsa de valores de algún país de
acuerdo al sector al que pertenecen. Sea X el tipo de empresa que cotiza en la bolsa de valores. Nótese
que el tamaño de muestra es dado por n = 143
Ejemplo 4.2.
Considere los siguientes datos sobre el tipo de problemas de salud (J=hinchazón de las articulaciones,
F=Fatiga, B=dolor de espalda, M=debilidad muscular, C=tos, N=nariz suelta/irritación, O=otro) que
aquejan a los plantadores de árboles.
Construir la distribución de frecuencias para el tipo de problema de salud.
O O N J C F B B F O J O O M
O F F O O N O N J F J B O C
J O J J F N O B M O J M O B
O F J O O B N C O O O M B F
J O F N
11
Probabilidad y Estadística 4. Distribución de frecuencias
Graficas
Los gráficos asociados a la distribución de frecuencias para datos cualitativos (nominal u ordinal) son
generalmente
Gráfico de barras
Diagrama de Pareto
Observación: Se debe de prestar atención a los pictogramas debido a que pueden llevar a malas
interpretaciones.
12
Probabilidad y Estadística 4. Distribución de frecuencias
Gráfico de barras
Un gráfico de barras muestra la distribución de frecuencias de la variable categórica (cualitativa). En
este gráfico se muestra el conteo para cada categoría o nivel de la variable para poderlos comparar.
Nótese que las barras deben de estar ligeramente separadas y además las barras tienen una misma
base. Se puede reemplazar el conteo en cada categoría por el porcentaje. Por alguna razón algunos
softwares estadísticos indican como gráfico de barras a cualquier gráfico de barras. Sólo se indica como
gráfico de barras cuando se analiza a una variable cualitativa (nominal u ordinal)
Ejemplo 4.3.
EL gráfico de barras asociada a la tabla de frecuencias para los diferentes tipos de empresa que cotizan
en la bolsa de valores dado en el Ejemplo 4.1.
60
50
40
%
30
20
10
0
Industriales Agrarias Mineras Financieras
Empresas
13
Probabilidad y Estadística 4. Distribución de frecuencias
Ejemplo 4.4.
Para construir el gráfico de sectores circulares para el Ejemplo 4.1 se calcula los ángulos centrales para
cada categoría. La tabla abajo muestra los ángulos centrales para cada empresa. Usualmente
X hi hi % angulo central
industriales 0.3706 37.06 0.3706×360o =133.42o
agrarias 0.4755 47.55 0.4755×360o =171.18o
mineras 0.1049 10.49 0.1049×360o =37.76o
financieras 0.049 4.9 0.049×360o =17.64o
total 1.0000 100 360o
Luego, usando los angulos centrales calculados para cada categoría se construye la gráfica circular que
es mostrada en la Figura 4.2.
Industriales 37%
Financieras 5%
Figura 4.2: Gráfico circular (pie chart) para las empresas que cotizan en la bolsa de valores.
14
Probabilidad y Estadística 4. Distribución de frecuencias
Ejemplo 4.5.
En una encuesta de opinión acerca de la preferencia de ciertas bebidas gaseosas por sus colores:
Negro(N), Blanco (B), Rojo (R), 20 consumidores proporcionaron las siguientes respuestas:
B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N
Con estos datos se construirá la distribución de frecuencias así como la gráfica de barras y circular. Así,
sea X : el color de la bebida gaseosa, nótese que que las categorías que puede asumir esta variable son
{N, B, R}. Luego, la distribución de frecuencias es
Tabla 6: Distribución de frecuencias para el color preferido de una marca de bebida gaseosa
X fi Fi hi Hi hi %
Negro (N)
Blanco (B)
Rojo (R)
total
a) En lo posible no utilize efectos de visuales tales como sombras o efectos 3D, esto debido a que
dificulta entender los datos.
a) Indique el nombre para cada categoria o segmento del gráfico circular. El color puede ser
distinguido en algunas personas pero en otras no (personas con daltonismo).
Sugerencia: Es recomendable utilizar el gráfico de barras en vez del gráfico circular!. En el siguiente
link se da ejemplos del mal uso del gráfico por sectores circulares
www.businessinsider.com/pie-charts-are-the-worst-2013-6
15
Probabilidad y Estadística 4. Distribución de frecuencias
Nótese que las frecuencias absolutas f1 , f2 , . . . , fk representan el número de repeticiones que se observa
para cada uno de los valores distintos, x1 , x2 , . . . , xk , i.e., , que en la muestra se tiene que x1 se observó
(se repitió) f1 veces, x2 se observó f2 veces y así hasta el último valor diferente xk .
Observación. Cuando es grande el número de datos observados de una variable discreta, su organiza-
ción es engorrosa. En este caso, para resumir los datos y poder calcular las medidas descriptivas, es
conveniente seguir el método de organización de datos de una variable continua por intervalos que se
describirá mas adelante.
Ejemplo 4.6.
Se tiene el reporte de 105 semanas acerca del número de accidentes, por semana, ocurridos en la fábrica
de alimentos Alconti el último mes.
0 0 1 0 0 1 3 5 1 1 2 2 2 1 5 3 4 1
1 1 4 3 3 3 3 4 3 3 3 2 2 1 3 4 1 1
2 2 2 2 2 0 0 2 2 2 2 1 1 2 3 3 5 0
1 2 2 2 2 3 3 3 2 2 3 1 1 2 2 4 2 2
2 5 2 2 1 3 1 1 3 3 0 0 1 2 3 1 1 2
0 2 2 2 4 2 2 2 2 1 1 1 2 2 2
Se desea obtener información relacionado con el número de accidentes (X). A priori se puede afirmar
que el número de accidentes está en un rango de 0 a 5, más no se sabe con que frecuencia ocurren. A
fin de obtener mas información se procederá a construir una distribución de frecuencias para estos
datos.
16
Probabilidad y Estadística 4. Distribución de frecuencias
Ejemplo 4.7.
Transductores de temperatura de cierto tipo se envían en lotes de 50. Se seleccionó una muestra de 60
lotes y se determinó el número de transductores en cada lote que no cumplen con las especificaciones
de diseño y se obtuvieron los datos siguientes:
2 1 2 4 0 1 3 2 0 5 3 3 1 3 2 4 7 0 2 3
0 4 2 1 3 1 1 3 4 1 2 3 2 2 8 4 5 1 3 1
5 0 2 3 2 1 0 6 4 2 1 6 0 3 3 3 6 1 2 3
17
Probabilidad y Estadística 4. Distribución de frecuencias
Tabla 9: Distribución de frecuencias para el color preferido de una marca de bebida gaseosa
X fi Fi hi Hi hi %
0
1
2
3
4
5
6
7
total
b) ¿Qué proporción de lotes muestreados tienen a lo sumo cinco transductores que no cumplen
con las especificaciones? ¿Qué proporción tiene menos de cinco? ¿Qué proporción tienen por lo
menos cinco unidades que no cumplen con las especificaciones?
18
Probabilidad y Estadística 4. Distribución de frecuencias
Gráficos
Entre los gráficos asociado con la distribución de frecuencias para datos discretos están el gráfico,
gráfico de puntos (dot plot) y el histograma.
Gráfico de Puntos
Esta gráfica presenta los datos a lo largo de una escala que ser horizontal o vertical. La frecuencia (fi )
de los datos son representados en la escala opuesta.
El gráfico de puntos indica que tan dispersos son los datos así como sobre que valores los datos se
concentran.
La Figura 4.3 muestra el gráfico de puntos para los datos del Ejemplo 4.6.
Figura 4.3: Gráfico de puntos para el número de accidentes del Ejemplo 4.6
19
Probabilidad y Estadística 4. Distribución de frecuencias
Histograma
Para el histograma se puede utilizar las frecuencias absolutas (fi ), frecuencias relativas (hi ) o las
frecuencias relativas porcentuales (hi %).
Figura 4.4: Histograma para para el número de accidentes del Ejemplo 4.6
Atención:
1. El término histograma es usado para un gráfico con barras (rectángulos) para representar la
distribución de frecuencias para datos cuantitativos.
2. El término gráfico de barras es utilizado para indicar un gráfico con barras representando la
distribución de frecuencias para datos cualitativos.
Sin embargo, algunos autores utilizan gráficos de barras para representar la distribución de frecuencia
de variables cuantitativas discretas.
20
Probabilidad y Estadística 4. Distribución de frecuencias
21
Probabilidad y Estadística 4. Distribución de frecuencias
Límites
Intervalo (Ii ) inferior superior
I1 Xmin ; Xmin + A [
I2 [ Xmin + A ; Xmin + 2A [
I3 [ Xmin + 2A ; Xmin + 3A [
.. .. ..
. . .
Ik [ Xmin + (k − 1)A ; Xmin + kA ]
R
Observe que se cierra el último intervalo. Esto se debe a que si la división k es exacta en el
número de decimales de los datos ningun dato quedara fuera.
Cuando los datos son organizados por medio de una distribución de frecuencias por intervalos existe
perdida de información sin embargo a cambio se tiene una mejor visualización del conjunto de datos.
Ejemplo 4.8.
Los salarios quincenales en cientos de soles, son presentados en una muestra de n = 45 trabajadores
63 89 36 49 56 64 59 35 78
43 51 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
50 64 76 44 73 56 62 63 60
El objetivo es construir una tabla de distribución de frecuencias. Para tal fin es recomendable ordenar
los datos de forma ascendente o descendente.
26 35 36 43 43 44 49 50 51
51 51 52 55 56 56 57 57 59
59 60 60 60 61 61 62 62 62
62 63 63 64 64 64 67 67 67
68 70 71 72 73 76 78 81 89
Luego, se sigue los pasos para la construcción de una distribución de frecuencias por intervalos.
De los datos, se tiene Xmax = 89 y Xmin = 26. El rango de los datos es: Rango: R= 89-26=63
el cual se aproxima a k = 7
Amplitud
63
A= =9
7
22
Probabilidad y Estadística 4. Distribución de frecuencias
Límites
Intervalo (Ii ) inferior superior
I1 [ 26 ; 35 [
I2 [ 35 ; 44 [
I3 [ 44 ; 53 [
I4 [ 53 ; 62 [
I5 [ 62 ; 71 [
I6 [ 71 ; 80 [
I7 [ 80 ; 89 ]
Con los limites definidos se puede construir la tabla de distribución de frecuencias para los datos. Para
obtener las frecuencias absolutas fi para cada intervalo se procede de la siguiente manera:
En el primer intervalo I1 = [ 26; 35 [, se tiene un dato en ese rango, el dato 26 y así la frecuencia
absoluta en I1 es f1 = 1.
En el segundo intervalo I2 = [ 35; 44 [, se tienen cuatro datos en ese rango que son 35,36,43 y 43 y
así la frecuencia absoluta en I2 es f2 = 4.
En el tercer intervalo I2 = [ 44; 53 [, se tienen 7 datos en ese rango que son 44,49,50,51,51,51 y 52 y
así la frecuencia absoluta en I3 es f3 = 7 y así se procede para encontrar las frecuencias absolutas
en todos los intervalos.
Finalmente se tiene la distribución de frecuencia para los datos agrupados por intervalos (clases)
Ii fi Fi hi Hi hi %
[ 26; 35 [ 1 1 0.022 0.022 2.2
[ 35; 44 [ 4 5 0.089 0.111 8.9
[ 44; 53 [ 7 12 0.156 0.267 15.6
[ 53; 62 [ 12 24 0.267 0.534 26.7
[ 62; 71 [ 14 38 0.311 0.845 31.1
[ 71; 80 [ 5 43 0.111 0.956 11.1
[ 80; 89 ] 2 45 0.044 1.000 4.4
total 45 - 1.000 - 100
Algunos comentarios
Una vez organizados los datos en la tabla de distribución de frecuencias se pueden realizar los
siguientes comentarios
Los intervalos con menores porcentajes de datos son los intervalos [ 26; 35 [ y [ 80; 89 [ con 2.2 % y
4.4 % respectivamente.
23
Probabilidad y Estadística 4. Distribución de frecuencias
En el intervalo [ 62; 71 [ contiene el mayor porcentaje de los datos, 31.1 %, en relación a los otros
intervalos
En el intervalo [ 53; 71 [ se observa que se tiene 26 personas que representan mas del 50 % de los
datos, esto es, el 57.8 % de esta forma los datos están mas concentrados en este intervalo. Nótese
que este porcentaje es obtenido por sumar h4 + h5 .
Marca de clase
La marca de clase de un intervalo es el número mi , que se define como el punto medio del intervalo,
Li + Ls
mi = , i = 1, 2, . . . , k
2
en que Li : es el límite inferior de la clase y Ls : es el límite superior de la clase. Por ejemplo, la marca de
clase en el intervalo I4 = [ 53; 62 ] es dada por:
53 + 62
m4 = = 57.5
2
A continuación se tiene la tabla de distribución de frecuencias ya adicionando la marca de clase
Ii mi fi Fi hi Hi hi %
[ 26; 35 [ 30.5 1 1 0.022 0.022 2.2
[ 35; 44 [ 39.5 4 5 0.089 0.111 8.9
[ 44; 53 [ 48.5 7 12 0.156 0.267 15.6
[ 53; 62 [ 57.5 12 24 0.267 0.534 26.7
[ 62; 71 [ 66.5 14 38 0.311 0.845 31.1
[ 71; 80 [ 75.5 5 43 0.111 0.956 11.1
[ 80; 89 ] 84.5 2 45 0.044 1.000 4.4
total - 45 - 1.000 - 100
24
Probabilidad y Estadística 4. Distribución de frecuencias
Ejemplo 4.9.
Las velocidades de 55 automóviles (en km/h) fueron medidas por un aparato de radar en una calle de
una ciudad
16 23 26 29 35
18 23 26 29 36
18 23 26 29 37
18 23 27 29 38
20 24 27 30 38
21 24 27 31 41
21 24 27 32 43
22 25 28 32 43
22 25 28 33 45
22 25 28 33 48
23 25 28 34 52
25
Probabilidad y Estadística 4. Distribución de frecuencias
Graficas
Histograma
Se construye a partir de la tabla de distribución de frecuencias, representando sobre cada intervalo, un
rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo
es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el
área de los mismos.
Ejemplo 4.10.
En la Figura 4.5 se muestra el histograma para los datos del Ejemplo 4.8.
Polígono de frecuencias
El polígono de frecuencias es también una representación gráfica de una distribución de frecuencias
por intervalos. La construcción es realizada uniendo los puntos de coordenadas:
en el eje de las abscisas: los puntos medios de cada intervalo (marcas de clase) y
en el eje de las ordenadas: las frecuencias absolutas o relativas para ese intervalo.
El polígono de frecuencias debe ser cerrado en el eje de las abscisas. Así, se debe adicionar una clase a
la izquierda del primer intervalo y una a la derecha del último intervalo. Los intervalos adicionados
deben tener frecuencias absolutas (relativas) iguales a cero.
Ejemplo 4.11.
La Figura 4.6 se muestra el polígono de frecuencias para los datos del Ejemplo 4.8
26
Probabilidad y Estadística 5. Forma de la distribución
Figura 4.6: Polígono de frecuencias para los datos del Ejemplo 4.8
5 Forma de la distribución
El histograma de la distribución de frecuencias puede tener diferentes formas.
27
Probabilidad y Estadística 5. Forma de la distribución
En el caso que los datos son organizados en una distribución de frecuencias por intervalos, la distribu-
ción es simétrica es caracterizada dependiendo del número de intervalos
28
Probabilidad y Estadística 5. Forma de la distribución
Ii fi Fi hi
[ L1 ; L2 [ f1 = f5 F1 h1 = h 5
[ L2 ; L3 [ f2 = f4 F2 h2 = h 4
[ L3 ; L4 [ f3 F3 h3
[ L4 ; L5 [ f4 = f2 F4 h4 = h 2
[ L5 ; L6 [ f5 = f1 F5 = n h5 = h 1
total n - 1.00
Ii fi Fi hi
[ L1 ; L2 [ f1 = f6 F1 h1 = h6
[ L2 ; L3 [ f2 = f5 F2 h2 = h5
[ L3 ; L4 [ f3 = f4 F3 h3 = h4
[ L4 ; L5 [ f4 = f3 F4 h4 = h3
[ L5 ; L6 [ f5 = f2 F5 h5 = h2
[ L6 ; L7 [ f6 = f1 F6 = n h6 = h1
total n - 1.00
29
Probabilidad y Estadística 5. Forma de la distribución
Ejemplo 5.1.
Considerando la distribución de frecuencias por intervalos del Ejemplo 4.9
30
Probabilidad y Estadística 6. Ejercicios resueltos
6 Ejercicios resueltos
Ejercicio 6.1.
Considerando la distribución de frecuencias por intervalos del Ejemplo 4.9 encuentre el porcentaje de
datos que se ubican entre 48 y 75 considerando la tabla de distribución de frecuencias por intervalos.
Solución:
Para calcular el porcentaje en los limites indicados se debe de observar las frecuencias relativas en la
tabla de distribución de frecuencias por intervalos tal como se muestra abajo. Sin embargo, no se tiene
intervalos con limites 48 y 75 ante ello se debe de interpolar a fin aproximar el % de datos entre 48 y
75.
Ii mi fi Fi hi Hi hi %
[ 26; 35 [ 30.5 1 1 0.022 0.022 2.2
[ 35; 44 [ 39.5 4 5 0.089 0.111 8.9
[ 44; 53 [ 48.5 7 12 0.156 0.267 15.6
[ 53; 62 [ 57.5 12 24 0.267 0.534 26.7
[ 62; 71 [ 66.5 14 38 0.311 0.845 31.1
[ 71; 80 [ 75.5 5 43 0.111 0.956 11.1
[ 80; 89 ] 84.5 2 45 0.044 1.000 4.4
total - 45 - 1.000 - 100
x 0.156 5 × 0.156
= →x= → x = 0.0867
53 − 48 53 − 44 9
31
Probabilidad y Estadística 7. Ejercicios propuestos
7 Ejercicios propuestos
1. bla bla bla
a) Una empresa que vende microcomputadoras ha llevado a cabo un estudio para analizar el
número de microcomputadoras que existen en pequeñas empresas del distrito A. Para el
efecto toma una muestra aleatoria de 40 empresas encontrando los siguientes resultados:
5 7 9 7 8 5 4 4 3 7
8 4 9 6 8 7 6 9 8 4
6 4 7 4 3 5 8 5 9 6
7 9 4 7 5 8 7 9 6 8
2, 81 4, 20 3, 85 9, 11 2, 08 5, 91 1, 62 6, 72 21, 66
3, 07 2, 95 8, 77 4, 73 9, 21 14, 21 1, 58 9, 85 78, 81
6, 65 1, 80 7, 01 1, 89 4, 23 6, 58 4, 74 8, 53 10, 56
43, 00 16, 72 2, 61 26, 46 34, 87 4, 19 4, 03 2, 78 28, 84
32
Probabilidad y Estadística 7. Ejercicios propuestos
12 18 5 2 8 24 17 5 9 15
27 35 18 14 3 9 15 20 24 27
30 22 21 17 20 36 28 23 12 11
22 32 37 40 28 36 35 39 12 19
28 20 15 6 4 12 16
d) El tiempo de respuesta de computadora se define como el tiempo que un usuario debe esperar
mientras la computadora accede a información en el disco. Se observaron aleatoriamente
un grupo de 48 computadoras del Laboratorio de Ingeniería de Sistemas y se obtuvo los
siguientes resultados (en milisegundos):
59 92 54 48 73 60 73 75 74 84
33 61 71 38 47 53 63 48 41 68
60 44 39 34 75 86 72 50 47 52
65 68 70 47 40 36 70 38 40 52
60 50 90 84 72 88 49 40
e) En fechas recientes se recabaron datos correspondientes a la velocidad MHz de 50 compu-
tadoras elegidas al azar en las oficinas de una empresa
33 25 20 33 25 16 16 16 16 20
12 20 33 33 20 33 20 12 25 20
33 25 16 25 33 25 20 20 20 20
12 25 16 16 20 16 25 20 25 16
3. Los sueldos mensuales (en dólares) de 60 empleados de la empresa Pirámide S.A. en el año 2002
son los siguientes:
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382
33
Probabilidad y Estadística 7. Ejercicios propuestos
[Li−1 , Li [ fi
[4,10[ 1
[10,16[ 3
[16,22[ 6
[22,28[ 12
[28,34[ 11
[34,40[ 5
[40,46] 2
[Li−1 , Li [ fi hi
[-19,-17[
[-17,-15[ 2
[-15,-13[ 8
[-13,-11[ 0.125
[-11,-9[ 4
[-9,-7] 0.2083
6. Completar la tabla de distribución para una muestra de 4308 elementos, si se sabe que a partir de
la segunda frecuencia absoluta se cumple que cada frecuencia es la quinta parte de la anterior
más dos. Además se conoce que:
k = 5 X1 = 60 X4 = 105
[Li−1 , Li [ fi Fi hi Hi
[30, 50[ m n 0.15 z
[50,70[ p q w a
[70,90[ r s 0.25 b
[90,110[ 10 u x 0.7
[110,130] 30 v y
Hallar:
a m+n
34
Probabilidad y Estadística 7. Ejercicios propuestos
b r−p+a
8. La compañía ABC, muestreó sus registros de embarque durante cierto día, obteniendo los
siguientes resultados con respecto al tiempo transcurrido desde la recepción de la orden hasta la
entrega (en días).
20 12 5 8 19 14 10 11 15 6
24 7 7 13 29 13 6 4 11 11
a ¿Qué afirmación puede hacer sobre la eficacia del procesamiento de pedidos a partir de la
distribución de frecuencias?
b Si la compañía quiere asegurarse de que la mitad de sus entregas se realicen en diez o menos
días, ¿puede usted determinar mediante la distribución de frecuencias si la compañía ha
alcanzado su meta?
9. En una fábrica se sabe que el jornal mínimo es S/115, si se conoce además que: 20 obreros ganan
por lo menos S/155, pero menos de S/165 68 obreros ganan por lo menos S/145; 106 obreros
ganan por lo menos S/135; 135 obreros ganan por lo menos S/125 y el restante 10 % de los obreros
ganan menos de S/125. Además se sabe que el rango es 50. Completar la tabla de distribución de
frecuencias.
10. Una compañía tiene 60 trabajadores. El sueldo mínimo de un trabajador es $100 y el máximo $590
mensuales. El 80 % de los trabajadores ganan por lo menos $210; 18 perciben haberes inferiores
a $390 mensuales; 20 % son profesionales y reciben un haber de por lo menos $490 mensuales.
Construir la tabla de distribución de frecuencias relativas.
[Li−1 , Li [ fi Fi hi
[160,170[
[170,180[ 48 60
[180,190[ 0.125
[190,200[ 0.075
[200,210]
12. Se revisaron 20 lotes de 48 artículos cada uno y se encontró el siguiente número de artículos
defectuosos por lote:
3 2 5 0 1 3 2 1 0 1 3 4 2 4 4 4 3 3 2 3
Construir el cuadro de distribución de frecuencias y ¿qué porcentaje de lotes tienen 2 o más pero
menos de 4 artículos defectuosos?
13. En una prueba de estadística se evaluaron a “n" estudiantes y se obtuvo el siguiente cuadro
estadístico.
35
Probabilidad y Estadística 7. Ejercicios propuestos
Marca de clase 45 55 65 75 85
Frcuencia relati- 2n
25
3n
100
n
50
3n
50
n
100
va
¿Qué porcentaje de estudiantes obtuvieron una nota menor que 60 puntos o mayor o igual a 80
puntos?
14. Dada la siguiente distribución de frecuencias en base al ingreso familiar de 200 familias.
[Li−1 , Li [ fi Fi
[ , [ 12
[ ,270[
[ ,300[ 30 90
[ , [ 126
[330, ]
[ , ] 50
[Li−1 , Li [ fi Fi hi
[ , [ 8
[ 12 , [
[ , [ 0.2
[ , 24 [ 17
[ , ]
16. Los tiempos de vida útil (en días) de un tipo de bacteria, se tabuló en una distribución de
frecuencias de 5 intervalos de igual amplitud con frecuencias relativas acumuladas: 0.10; 0.25; 0.55;
0.80; 1.00. Determine la distribución de frecuencias absolutas, si la tercera frecuencia absoluta
acumulada es 11, si la segunda marca de clase es 6, y si el límite inferior del cuarto intervalo es 12.
17. En una fábrica se sabe que el jornal mínimo es S/115, si se conoce además que: 20 obreros ganan
por lo menos S/155, pero menos de S/165 68 obreros ganan por lo menos S/145; 106 obreros
ganan por lo menos S/135; 135 obreros ganan por lo menos S/125 y el restante 10 % de los obreros
ganan menos de S/125. Además se sabe que el rango es 50. Completar la tabla de distribución de
frecuencias.
18. La compañía ABC, muestreó sus registros de embarque durante cierto día, obteniendo los
siguientes resultados con respecto al tiempo transcurrido desde la recepción de la orden hasta la
entrega (en días).
20 12 5 8 19 14 10 11 15 6
24 7 7 13 29 13 6 4 11 11
36
Probabilidad y Estadística 7. Ejercicios propuestos
a ¿Qué afirmación puede hacer sobre la eficacia del procesamiento de pedidos a partir de la
distribución de frecuencias?
b Si la compañía quiere asegurarse de que la mitad de sus entregas se realicen en diez o menos
días, ¿puede usted determinar mediante la distribución de frecuencias si la compañía ha
alcanzado su meta?
19. El consumo mensual de agua de 150 hogares, se tabularon en una distribución de frecuencias
simétrica de 6 intervalos, siendo las frecuencias f2 = 25, F3 = 75, F5 = 130. Si el límite inferior
del sexto intervalo es igual a 60, y si el 75 % de los consumos son mayores de 42.5m3 , Completar
la distribución de frecuencias.
20. Una compañía tiene 60 trabajadores. El sueldo mínimo de un trabajador es $100 y el máximo $590
mensuales. El 80 % de los trabajadores ganan por lo menos $210; 18 perciben haberes inferiores
a $390 mensuales; 20 % son profesionales y reciben un haber de por lo menos $490 mensuales.
Construir la tabla de distribución de frecuencias relativas.
37