Ma642 202201 Cuaderno IS3H

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 281

MA642

Estadística Aplicada I

Cuaderno de trabajo
Los profesores del curso
Área de Ciencias - Marzo 2022
2
Estadística Aplicada I 2022 01

La siguiente guía de trabajo contiene el material necesario


para seguir las clases del curso Estadística Aplicada I de la
Universidad Peruana de Ciencias Aplicadas. Contiene la
teoría, ejercicios resueltos y propuestos de todo el curso.

Este material de enseñanza está basado en


materiales y trabajo de los profesores del curso.

Esperamos que este material le sea de utilidad.

Los profesores del curso

Imagen de la carátula https://www.cognodata.com/blog/digitalizacion/


3
Estadística Aplicada I 2022 01

Tabla de contenido
Unidad 1. Estadística descriptiva.................................................................................................................... 4
Definiciones básicas..............................................................................................................................................5
Organización y presentación de datos...............................................................................................................19
Tablas de doble entrada.....................................................................................................................................37
Organización de datos cuantitativos discretos...................................................................................................47
Organización de datos cuantitativos continuos.................................................................................................51
Representación gráfica de variables cuantitativas continuas............................................................................53
Medidas de tendencia central, de posición y de variación................................................................................63
Medidas de tendencia central............................................................................................................................64
Medidas de posición o cuantiles........................................................................................................................81
Medidas de dispersión o variabilidad.................................................................................................................85
Medidas de asimetría.......................................................................................................................................104
Unidad 2. Aplicaciones de distribuciones de probabilidad..........................................................................109
Conceptos.........................................................................................................................................................110
Análisis combinatorio.......................................................................................................................................114
Reglas de conteo...............................................................................................................................................115
Concepto de probabilidad................................................................................................................................119
Operaciones con eventos.................................................................................................................................121
Probabilidad condicional..................................................................................................................................128
Eventos independientes...................................................................................................................................133
Variable aleatoria.............................................................................................................................................145
Variable aleatoria discreta................................................................................................................................146
Distribuciones de probabilidad de variables aleatorias discretas....................................................................156
Variable aleatoria continua..............................................................................................................................164
Distribuciones de probabilidad de variables aleatorias continuas...................................................................175
Propiedad reproductiva de la distribución normal..........................................................................................195
Unidad 3. Distribuciones muestrales en muestreo......................................................................................202
Distribución muestral.......................................................................................................................................203
Distribución muestral de la media....................................................................................................................203
Muestreo..........................................................................................................................................................213
Tamaño de muestra..........................................................................................................................................237
4
Estadística Aplicada I 2022 01

Unidad 1. Estadística descriptiva

Logro

Al término de la unidad, el estudiante entiende claramente la información presentada en tablas y


gráficas. Asimismo, calcula resúmenes obtenidos a partir de un conjunto de datos y los utiliza para
dar solución a un problema dentro de un contexto real o de su especialidad.

Temario

-Definiciones básicas.
-Organización de datos cualitativos: Tablas de distribución de frecuencias y representaciones gráficas.
-Organización de datos cualitativos (diagrama de Pareto).
-Tablas de doble entrada y gráficos comparativos.
-Organización de datos cuantitativos: Tablas de distribución de frecuencias y
representaciones gráficas para variables cuantitativas discretas y continuas.

-Tablas y gráficos comparativos para variables cuantitativas continuas.


-Medidas de tendencia central: media aritmética, mediana, moda, media ponderada. Propiedades de
la media.
-Medidas de posición: cuartiles, deciles y percentiles.
-Medidas de dispersión: rango, varianza, desviación estándar, coeficiente de variación y rango
intercuartil.
-Medidas de asimetría.
5
Estadística Aplicada I 2022 01

Definiciones básicas

Estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar,
organizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.

Recopilar datos Organizar datos Presentar datos Analizar datos Tomar decisiones

Estadística descriptiva
Son métodos asociados a la caracterización, resumen y presentación de datos, que permiten
describirlos apropiadamente.
Comprende el uso de gráficos, tablas e indicadores de resumen obtenidos al realizar algunos cálculos.

Estadística inferencial
Son métodos y técnicas que hacen posible estimar una o más características de una población o
tomar decisiones referentes a una población, basados en los resultados obtenidos del estudio de
muestras elegidas adecuadamente.
EJEMPLO:
Xi: Edades: 18, 17, 20, 22, 18 X = 19 AÑOS
Inferencia estadística: Generalizar a partir del resultado de una muestra a toda la población, es decir,
La edad promedio de los 40 alumnos de la sección es 19 años.

Estas conclusiones no tienen que ser totalmente válidas, pueden tener cierto margen de error, por
eso se dan con una medida de confiabilidad o probabilidad.

Estadística descriptiva
Métodos de recolección, caracterización, resumen y
presentación de características de datos

Población Muestra Datos


Muestreo

Porcentaje poblacional Mediana poblacional Estimación


Media poblacional Moda poblacional
Estadística inferencial
Se estima características poblacionales o se decide basándose en muestras al azar.
6
Estadística Aplicada I 2022 01

Definiciones
Unidad elemental
También llamada unidad de análisis, unidad estadística o elemento. Es el objeto sobre el cual se hace
la medición. Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que las
unidades de análisis son los individuos.

Población
Es la totalidad de elementos que queremos estudiar y que están agrupados bajo una o más
características comunes y que conforman el universo a ser investigado. Pueden ser personas,
objetos, conceptos, etc. de los cuales intentamos sacar conclusiones a partir de una o más
características observables de naturaleza cualitativa o cuantitativa que se pueden medir en ellos.

Muestra
Parte o subconjunto de la población que se selecciona para su análisis y así obtener información
acerca de la población de la que proviene. Una muestra será representativa, en el sentido de que
cada unidad muestreada representará las características de una cantidad conocida de unidades en la
población.

Dato
Son los valores numéricos o no numéricos que otorga la característica de interés de cada unidad
elemental.

Observación
Es el conjunto de datos de una unidad elemental. La observación se obtiene para cada unidad
elemental.

Población Muestra Datos


Muestreo

Dato
Observación

Unidad elemental

Ejemplo 1
En una empresa se tienen los datos de los trabajadores:
7
Estadística Aplicada I 2022 01

Población: Todos los trabajadores de la empresa.

Muestra: Algunos trabajadores de la empresa.

Unidad elemental: Un trabajador de la empresa. (Un / Una)

Dato: Por ejemplo: obrero.

Observación: Por ejemplo: 3, masculino, gerencia, 40, 10910, 3.

Trabajado Edad Sueldo Número de


Sexo Función
r (años) (soles) capacitaciones
1 Masculino Obrero 31 3200 5
2 Femenino Administrativo 26 2850 3
3 Masculino Gerencia 40 10910 3
4 Femenino Obrero 23 2890 6
⋮ ⋮ ⋮ ⋮ ⋮

Ejercicios
1. De los ingenieros colegiados en la ciudad de Lima durante el presente año, se entrevistó al azar
85 de ellos para estimar el porcentaje de los que trabajan en empresas privadas. Determine la
población, muestra y unidad elemental.

Población TODOS los ingenieros colegiados en la ciudad de Lima durante el presente año

Muestra 85 ingenieros colegiados en la ciudad de Lima durante el presente año

Unidad elemental Un ingeniero colegiado en la ciudad de Lima durante el presente año

2. De acuerdo con los Censos Nacionales de Población y Vivienda 2017, el 72% de los hogares en el
Perú no cuenta con conexión de Internet. Determine la población, muestra y unidad elemental
para el censo del 2017.
8
Estadística Aplicada I 2022 01

Población

Muestra

Unidad elemental

3. En el Perú, según la ley N°29664, la vulnerabilidad es la susceptibilidad de sufrir daños por


acción de un peligro. El análisis de la vulnerabilidad es el proceso mediante el cual se evalúan las
condiciones existentes de la población expuesta y sus medios de vida. Para evaluar la
vulnerabilidad de una vivienda se miden las siguientes variables, entre otras.
• Material predominante en las paredes: ladrillo, adobe, quincha, madera, etc.
• Material predominante en el techo: concreto armado, madera, calamina, caña, etc.
• Material predominante en el piso: parquet, loseta, madera, cemento, tierra, etc.
• Tipo de servicio higiénico: red pública dentro, red pública fuera, pozo séptico, río, etc.
El Gobierno Municipal de Lima está preocupado por las consecuencias de la ocurrencia de un
sismo de alta intensidad en Lima. Por esta razón, ha decidido realizar un diagnóstico de la
situación de las viviendas en este distrito eligiendo a 2500 viviendas seleccionadas al azar.

a. Determine la población, muestra y unidad elemental del estudio.

Población Todas las viviendas en vulnerabilidad de la ciudad de Lima

Muestra 2500 viviendas en vulnerabilidad de la ciudad de Lima

Unidad elemental Una vivienda en vulnerabilidad de la ciudad de Lima

b. Para las variables mencionadas, indique un posible dato y una posible observación.

Dato posible Ladrillo / madera / cemento / etc.


9
Estadística Aplicada I 2022 01

Observación
Ladrillo, concreto armado, loseta y red pública fuera
posible

4. En un estudio de ingeniería para investigar las fisuras por desgaste en aviones que llegaron al
aeropuerto Jorge Chávez el presente año, se tomó una muestra de 50 aviones a los que se les
hizo un estudio detallado de su estado. Determine la población, muestra y unidad elemental.

Población

Muestra

Unidad elemental

5. La empresa Star llevó a cabo un estudio entre los usuarios de Internet en Trujillo para analizar el
mercado de posibles compradores a través de este servicio. Como parte del estudio se recolectó
una muestra de 1500 usuarios.

Durante la recolección de datos se registró que uno de los usuarios tiene 28 años, dos
computadoras en casa con Internet, considera que la calidad del servicio prestado es buena,
diariamente usa el servicio de Internet 3,5 horas y la computadora con mayor uso del servicio
de Internet es Asus. De acuerdo con el texto, identifique un dato y una posible observación.

6. Saudi Aramco, la empresa estatal de petróleo y gas de Arabia Saudí, fue la empresa más
rentable en 2019, según la prestigiosa Fortune Global 500, una lista de las primeras 500
empresas de todo el mundo, medidas por los ingresos. La lista es compilada y publicada
anualmente por la revista Fortune. Determine la unidad elemental para la publicación de esta
lista.

Unidad elemental
10
Estadística Aplicada I 2022 01

Definiciones

Variable
Es una característica de interés de la población definida por la investigación estadística y que puede
tomar dos o más valores en distintas unidades de análisis.

Tipos de variables

Cualitativa

Variable Discreta ( Z )

Cuantitativa

Continua ( R )

Variable cualitativa
También son conocidas como categóricas.
Es una variable que al ser medida queda expresada por una etiqueta o nombre que se utiliza para
identificar una característica o atributo.

Variable cuantitativa
Es una variable que al ser medida queda expresada por un número que se utiliza para identificar una
característica o atributo. Estas a su vez pueden clasificarse en discretas o continuas.

Una variable es cuantitativa discreta si el conjunto de posibles valores que toma es finito o infinito
numerable, es decir, que sólo puede tomar ciertos valores en un intervalo determinado. [ 2 ; 8 ] Enteros

Una variable es cuantitativa continua si el conjunto de posibles valores es infinito no numerable, es


decir, que puede tomar cualquier valor en un intervalo determinado. [ 2 ; 8 ] Reales

Ejemplo 2

Las siguientes variables son de una encuesta aplicada a un postulante a un trabajo de ingeniería:

Variable cualitativa∶ lugar de nacimiento; grado de instrucción, carrera que ha estudiado.

Variable cuantitativa discreta∶ número de capacitaciones que llevó el año anterior; número de
trabajos que ha tenido en los últimos dos años.

Variable cuantitativa continua∶ tiempo que demora para trasladarse de su casa al trabajo, en
minutos; salario actual, en soles.
11
Estadística Aplicada I 2022 01

Escala de medición
Otra forma común de clasificar las variables es mediante el uso de cuatro niveles de medición;
nominal, ordinal, de intervalo y de razón. Cuando la estadística se aplica a problemas reales el nivel
de medición de las variables es un factor importante para determinar el procedimiento a usar.

Nominal
Se usa cuando los datos sólo pueden clasificarse en categorías o
modalidades. Si se le identificase mediante un número, este sólo se
utiliza como una etiqueta.

Ordinal
Se usa cuando los datos que reflejan diferentes grados de propiedad o
atributo de estudio. Se pueden ordenar en forma ascendente o
descendente (jerarquía), de tal manera que puedan expresar grados de
la característica medida.

Las variables con escalas ordinales pueden ser ordenadas o clasificadas


en relación con la cantidad del atributo poseído. Cada categoría puede
ser comparada con otra en relación de “mayor que” o “menor que”. Si
se le identificase mediante un número, este se utiliza para establecer el
orden del atributo estudiado.

Intervalo
Se utiliza cuando los datos miden cuantitativamente la intensidad del
atributo en estudio y, además, las diferencias iguales entre estos
valores indican diferencias iguales en las cuantías de los atributos
medidos.

En esta escala el cero es relativo, es decir, no indica la ausencia de la


característica medida.

Razón
Si los cocientes o razones de los números asignados a las unidades
estadísticas reflejan los cocientes de las cuantías de las propiedades
que se miden.

En esta escala el cero indica la ausencia de característica de la


medida. También se le conoce como escala de proporción o cociente.
12
Estadística Aplicada I 2022 01

Ejemplo 3

Indique el tipo y escala de medición de las siguientes variables:


 Número de celular / Número de DNI son V. Cualitativas
 Longitud de cable de fibra óptica usado en una instalación industrial (metros)
 Marca de un medidor láser de distancia (Bosch, Hilti, Suaoki, Leica)
 Tiempo de vida útil de una laptop (años)
 Peso de un celular, en kilogramos
 Grado en el ejército (general, coronel, comandante, etc.)
 Kilometraje de un auto (kilómetros por año)
 Tamaño de una bebida (pequeña, mediana, grande)
 Año de fabricación de un celular

Solución

Variable Tipo de variable Escala de medición

Número de celular Cualitativa Nominal

Longitud de cable de fibra óptica usado en


Cuantitativa continua Razón
una instalación industrial (metros)
Marca de un medidor láser de distancia
Cualitativa Nominal
(Bosch, Hilti, Suaoki, Leica)

Tiempo de vida útil de una laptop (años) Cuantitativa continua Razón

Peso de un celular, en kilogramos Cuantitativa continua Razón

Grado en el ejército (general, coronel,


Cualitativa Ordinal
comandante, etc.)
Kilometraje de un auto (kilómetros por
Cuantitativa continua Razón
año)
Tamaño de una bebida (pequeña,
Cualitativa Ordinal
mediana, grande)

Año de fabricación de un celular Cuantitativa discreta Intervalo


13
Estadística Aplicada I 2022 01

Ejercicios

7. La medición de la velocidad del pulso ultrasónico como una alternativa de prueba no destructiva
para evaluar la calidad del concreto se ha utilizado desde hace aproximadamente 50 años. La
técnica fue desarrollada por Leslie y Cheesman en Canadá (Malhotra y Carino, 1991) y se utilizó
con gran éxito desde la década de los sesenta para diagnosticar el estado del concreto. Además,
se han realizado estudios que permitan obtener modelos para predecir la resistencia a la
compresión del concreto en base a la velocidad ultrasónica. La clasificación del concreto en
categorías con base a intervalos de velocidad se presenta en el cuadro siguiente.

Clasificación del concreto según velocidad ultrasónica


Velocidad ultrasónica, V (metros/segundo) Clasificación del concreto
4575 ¿ V Excelente
3660 ¿ V ≤ 4 575 Bueno
3050 ¿ V ≤ 3660 Cuestionable
3050 ¿ V ≤ 2135 Pobre
V < 2135 Muy pobre
Fuente Malhotra, 1985. Predicción de la resistencia del concreto. Solís, Moreno y Catillo. 2004.

Identifique, para cada variable, si es discreta o continua, cualitativa o cuantitativa y su escala de


medición.

Variable Tipo Escala de medición

Velocidad ultrasónica en metros por


segundo

Clasificación del concreto

Resistencia a la compresión del


concreto, en kg/cm2
Grado de escolaridad del técnico que
realizó el experimento (ninguna,
primaria, secundaria, superior)
Número de experimentos realizados en
un día

8. Unión de Cervecerías Peruanas Jhon Bher S. A. dedicada a la producción de cerveza en el Perú,


cuenta con las certificaciones ISO 9001, ISO 14001, OHSAS 18001 y HACCP. Esta empresa tiene
una producción mensual de 2 400 000 botellas de cerveza en sus diferentes presentaciones. De
dicha producción, se eligen al azar dos mil botellas para inspeccionar si cumplen con las
especificaciones técnicas, anotando sus características en la siguiente tabla:

Número Número de Contenido de


Contenid Opinión de Presentació
de Marca defectos por alcohol (%
o (ml) calidad n de botella
botella botella volumen)
1 Imperial 0 1100 Buena 1100 ml. 4,85
2 Dorada 1 354 Regular 355 ml. 5,23
14
Estadística Aplicada I 2022 01

3 Tropical 0 355 Buena 355 ml. 4,94


⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
1000 Ducal 4 645 Mala 650 ml. 5,20
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
2000 Tropical 0 355 Buena 355 ml. 4,95

a. De acuerdo con el texto, identifique la población, la muestra y la unidad elemental.


Población 2 400 000 botellas de cerveza

Muestra 2 000 botellas de cerveza

Unidad elemental Una botella de cerveza

b. Indique el tipo y escala de medición de las variables.


Variable Tipo de variable Escala de medición

Marca Cualitativa Nominal

Número de defectos por botella Cuantitativa Discreta Razón

Contenido, en mililitros Cuantitativa Continua Razón

Opinión de calidad Cualitativa Ordinal

Presentación de botella Cuantitativa Continua Razón

Contenido de alcohol Cuantitativa Continua Razón

Diga el Tipo y Escala de la variable: EDAD


Tipo: Cuantitativa Continua
Escala: Razón

Ejemplo1: Estudiante del curso E. Aplicada I


18
17
22
21
18
19
20

Al trabajarlo necesito:
17 1
18 3
19 10
20 4
21 2
15
Estadística Aplicada I 2022 01

Ejemplo2: Personas que van de compras a PlazaVea


70
25
36
4
12
80
15
53
42
38
10

Al trabajarlo necesito hacer intervalos:


4 – 13 10
13 – 22 6
22 – 31 12
31 – 40 30
40 – 49 3
….
….

9. Prevenir la propagación de las fisuras por desgaste en las estructuras aeronáuticas es un


elemento importante de la seguridad en la aviación. En un estudio de ingeniería para investigar
las fisuras por desgaste en aviones del aeropuerto Jorge Chávez, se tomó una muestra de 50
aviones a los que se verifican sus alas, sometidas a cargas por unidad de superficie cíclicas y
reportó los siguientes resultados:
• El 35% de los aviones se fisuraron en el alerón izquierdo.
• El 91% no presentó defectos, el 8% defectos leves y el 1% defectos graves.
• El tiempo promedio de vuelo de estos aviones fue de 5,7 años.
• El número promedio de problemas por avión fueron 4,2.

a. Basado en la situación planteada identifique la población, la muestra y la unidad


elemental.

Población

Muestra

Unidad elemental

b. En base a cada resultado obtenido de la muestra identifique las variables en estudio, su


tipo y escala de medición.
16
Estadística Aplicada I 2022 01

Variable Tipo Escala de medición

10. Computer Soft es una compañía dedicada a brindar servicios integrales de informática y de
telecomunicaciones a empresas en todo el país. La gerencia de la compañía desea reforzar su
fuerza de ventas en Lima y, como parte de un estudio realizado, se analizó la información
correspondiente a una muestra de 30 empresas de la ciudad de Lima a las que se les brindó los
servicios informáticos de la compañía. Las variables consideradas en dicho estudio fueron:
• Lenguaje de programación (Cobol, Java, Informixs - 4gl, etc.)
• Cantidad de servidores por empresa.
• Costo de las licencias de software (en miles de dólares)
• Año de instalación del software.
• Sistema operativo (Windows NT, Unix, etc.)

a. Basado en la situación planteada identifique la población, la muestra y la unidad


elemental.
b. Identifique el tipo de variable y escala de medición de las variables mencionadas.
Rpta. a. Todas las empresas de Lima a las que se les
brindó los servicios informáticos de la compañía; 30
empresas de Lima a las que se les brindó los servicios
informáticos de la compañía; una empresa de Lima a la
que se le brindó los servicios informáticos de la
compañía. b. Cualitativa, nominal; cuantitativa discreta,
razón; cuantitativa continua, razón; Cuantitativa
discreta, intervalo; Cualitativa, nominal

11. Indique el tipo de variable y la escala de medición de las variables observadas en una muestra
de secciones de tuberías de agua.
a. Diámetro de la tubería (pulgadas)
b. Material de la tubería (hierro negro, hierro galvanizado, PVC, bronce cobrado)
c. Ubicación (subterránea, aérea)
d. Longitud de la tubería (pies)
e. Estabilidad del suelo circundante (inestable, moderadamente estable o estable)
f. Corrosividad del suelo circundante (corrosivo o no corrosivo)
Rpta. a.Cuantitativa continua, razón; b. Cualitativa,
nominal; c. Cualitativa, nominal; d. Cuantitativa
continua, razón; e. Cualitativa, ordinal; f. Cualitativa,
nominal.
17
Estadística Aplicada I 2022 01

Definiciones
Parámetro
Medida que describe una característica resumen de las unidades que componen una población.

Estadístico
Medida que describe una característica resumen de las unidades que componen una muestra.

Algunos parámetros y estadísticos que se pueden calcular son:

Ejemplo 4
La gerencia de la empresa Star llevó a cabo un estudio entre los usuarios de Internet en Trujillo para
poder analizar el mercado de posibles compradores a través de este servicio. Como parte del estudio
realizado se analizó la información correspondiente a una muestra de 1500 usuarios.

Por datos históricos de la empresa se sabe que, en promedio los usuarios utilizan el servicio de
Internet 3,75 horas al día. Además, de la muestra de usuarios se obtuvo que el número promedio de
computadoras que cuentan con el servicio de Internet en sus casas es de 2,5 y el 12% piensan que la
calidad del servicio de Internet es regular.

En base al enunciado y los resultados, complete la siguiente tabla.

Solución

Parámetro o Nombre del parámetro o


Resultado Notación Valor
estadístico estadístico
En promedio, los usuarios
utilizan el servicio de Internet Parámetro Media μ 3,75
3,75 horas al día.
El 12% de los usuarios piensan Proporción de usuarios que
que la calidad del servicio de Estadístico piensan que la calidad del ^p 0,12
Internet es regular. Internet es regular
El número promedio de
computadoras que cuentan con Estadístico Media x 2,5
el servicio de Internet es de 2,5.
18
Estadística Aplicada I 2022 01

Ejercicios

12. Green es una empresa que se dedica a la producción de productos agroindustriales, cuenta con
4325 trabajadores. Para la aplicación efectiva de una filosofía de administración para la calidad
total (TQM) en toda la empresa y así incrementar la productividad, el consejo directivo de la
empresa ha puesto en marcha un estudio del perfil de sus trabajadores para medir la
satisfacción laboral. Para dicho estudio se tomó una encuesta a 175 trabajadores seleccionados
de forma aleatoria. A continuación, se presenta el modelo de la encuesta que fue utilizada en el
estudio.

1. Sexo: Femenino Masculino

2. Edad: __________ años

3. Posición en la empresa

Gerencial Profesional Técnico/ventas Apoyo adm. Servicios Producción

4. Antigüedad en la empresa: __________

5. Ingresos anuales personales netos (en soles) el año pasado: __________

6. Ingresos familiares totales netos (en soles) el año pasado: __________

7. ¿Cuántas veces ha sido promovido? __________


8. En los siguientes 3 años. ¿Qué tan probable es que sea promovido?

Muy probable Probable No está seguro Improbable Muy improbable

9. Las oportunidades de obtener un ascenso, ¿Son mejores o peores para personas de su género?

Mejores Peores No influye el género

10. ¿Cuántas capacitaciones tiene por parte de la empresa? __________


11. ¿Rechazaría otro trabajo de mejor paga para quedarse en Green S.A.?

Muy probable Probable No está seguro Improbable Muy improbable

El registro utilizado en el estudio se muestra a continuación:

Antigüedad Ingresos Número de Número de Probabilidad


Posición en Ingresos Probabilidad Ascenso por
N° Sexo Edad en la anuales promo- capacita- de rechazar
la empresa familiares de promoción el género
empresa personales ciones ciones otro trabajo
1 F 27 Profesional 5,25 32244,00 65200,25 2 Probable No influye 8 Improbable
2 F 32 Producción 7,50 30057,55 72542,00 0 Improbable Peores 1 Improbable

⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
85 M 30 Producción 10,50 30850,50 67258,95 2 Muy probable No influye 6 Improbable
86 M 45 Profesional 6,75 35200,70 59056,62 0 Improbable Peores 2 No está seguro
87 F 35 Servicios 6,00 28050,05 40520,89 1 Probable No influye 2 Improbable

⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
19
Estadística Aplicada I 2022 01

175 M 30 Servicios 5,50 25000,85 42658,06 1 Probable No influye 4 Improbable

Luego de procesar la información recolectada en el estudio se obtuvo que el ingreso promedio


anual de los trabajadores durante el año pasado es de 35644,78 soles. Además, por datos
históricos de la empresa se sabe que el 62% de los empleados son obreros.
a. Basado en la situación planteada identifique la población, la muestra y la unidad elemental.
b. Indique un estadístico, su notación y valor.
c. Indique un parámetro, su notación y valor.
d. Indique un ejemplo de dato cualitativo, de dato cuantitativo y no de observación.
20
Estadística Aplicada I 2022 01

Organización y presentación de datos

Tabla de distribución de frecuencias


La forma más simple de resumir un conjunto de datos es la tabla de distribución de frecuencias que
consiste en presentar para cada valor de una variable (cualitativa o cuantitativa) el número de casos
o elementos que la componen.

Frecuencia absoluta, relativa y porcentual

Frecuencia absoluta simple de una clase


Es la cantidad de elementos que pertenecen a esa clase. Se denota por f i.

Frecuencia relativa simple de una clase


Es la proporción de elementos que pertenecen a esa clase. Se calcula dividiendo la frecuencia
absoluta entre el número total de datos. Se denota por hi y se calcula con:

fi
hi =
n

Frecuencia porcentual simple de una clase


Es la frecuencia relativa multiplicada por 100%. Se denota por pi y se calcula con:

pi=hi × 100 %

Frecuencia absoluta acumulada de una clase


Es la suma de la frecuencia absoluta de un valor determinado de la variable con las frecuencias
absolutas de los valores menores de la variable. Se denota por F i.
La frecuencia absoluta acumulada del último valor de la variable es igual al total de casos.

Frecuencia relativa acumulada de una clase


Es la suma de la frecuencia relativa de un valor determinado de la variable con las frecuencias
relativas de los valores menores de la variable. Se denota por H i.
La frecuencia relativa acumulada del valor más alto de la variable es igual a 1.

Frecuencia porcentual acumulada de una clase


Es la suma de la frecuencia porcentual de un valor determinado de la variable con las frecuencias
porcentuales de los valores menores de la variable. Se denota por Pi.
La frecuencia porcentual acumulada del valor más alto de la variable es igual a 100%.
21
Estadística Aplicada I 2022 01

Organización de datos cualitativos

Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en la
columna de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la variable.

 Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias simples
absolutas, relativas y porcentuales.
 Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las frecuencias
acumuladas absolutas, relativas y porcentuales.

La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta f i Frecuencia relativa hi Frecuencia porcentual pi
f1
Categoría 1 f1 h1 = p1=h 1 ×100 %
n
f2
Categoría 2 f2 h2 = p2=h 2 ×100 %
n
⋮ ⋮ ⋮ ⋮
fk
Categoría k fk hk= pk =hk ×100 %
n
Total n 1 100%
Fuente:

Título de una tabla de distribución de frecuencias

De acuerdo con el INEI, para los títulos seguiremos el siguiente esquema:

Distribución de <unidades elementales> según <variable>

Ejemplo 5

Distribución de personas según el continente donde vive, 2020 (en miles)

Tomado de “Estado de la población peruana 2020. INEI. Fondo de Población de Naciones Unidas”
22
Estadística Aplicada I 2022 01

Ejercicios

13. A un grupo de compradores de auto tomados al azar, se les preguntó sobre el color de su auto.
Los resultados obtenidos fueron:

Blanco Azul Verde Verde Verde Negro Rojo Negro Rojo Verde Blanco Azul
Negro Rojo Rojo Azul Azul Azul Rojo Verde Negro Azul Verde Negro
Azul Blanco Verde Blanco Blanco Rojo Blanco Rojo Azul Verde Blanco Negro
Negro Rojo Negro Rojo Rojo Verde Negro Negro Blanco Blanco Azul Blanco

a. Presente la tabla de distribución de frecuencias que resuma la información de la variable.

Distribución de ... según …


Variable Frecuencia absoluta f i Frecuencia relativa hi Frecuencia porcentual pi

Blanco

Azul

Verde

Negro

Rojo

Total 1 100%
Fuente:

14. Una tienda “A” que se dedica a la venta de productos electrónicos realiza un estudio sobre la
marca de laptop que prefieren sus clientes, para lo cual realizaron una encuesta a 30 de sus
clientes. Se obtuvieron los siguientes resultados:

Toshiba Hp Hp Hp Toshiba Toshiba Apple Hp Apple Hp


Hp Apple Hp Hp Hp Hp Hp Hp Hp Apple
Hp Hp Hp Hp Hp Hp Hp Hp Hp Hp

a. Obtenga la tabla de distribución de frecuencias respectiva. Indique todos los elementos de


la tabla (título y fuente).
Distribución de Laptop’s según su Marca
Frecuencia relativa
Frecuencia absoluta Frecuencia porcentual
simple
Variable simple simple
fi
fi hi = pi = hi * 100%
n
Toshiba 3 0,100 10,0%

Hp 23 0,767
76,7%
Apple 4 0,133 13,3%
23
Estadística Aplicada I 2022 01

Total n = 30 1,00 100%


Fuente: Tienda “A”

b. ¿Cuál es el porcentaje de clientes prefieren una laptop Toshiba?


El porcentaje de clientes que prefieren una laptop Toshiba es 10%.

c. ¿Cuál es el número de clientes prefieren una laptop Apple?


El número de clientes que prefieren una laptop Apple es 4.

15. La siguiente información muestra la distribución de una muestra de viviendas de un


determinado distrito de Lima según material con el cual fue construido.

Distribución de viviendas según material de construcción


Material de construcción fi hi pi
Adobe 48 0,160
Cemento 100 0,333
Material prefabricado 108 0,360
Quincha
Total 300 1,000
Fuente: Municipalidad distrital

Complete la tabla e interprete el valor de las siguientes frecuencias f 2 y p4 .


24
Estadística Aplicada I 2022 01

Representación gráfica de variables cualitativas

Gráfico de barras
En el eje horizontal se representa las categorías de la variable y en el eje de ordenadas las
frecuencias absolutas, relativas o porcentuales.

Ejemplo 6
Distribución de peruanos en pobreza según nivel de educación alcanzado, 2019
(Porcentaje)

Ejemplo 7
Distribución porcentual de peruanos según departamento de residencia
25
Estadística Aplicada I 2022 01

Gráfico circular
En este caso las categorías de la variable cualitativa ocupan un espacio en el círculo que es
proporcional a la frecuencia que representan. También se denomina diagrama de sector circular,
gráfico tipo torta o pastel.

Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de barras.

Ejemplo 8
Distribución de peruanos en pobreza extrema según región natural, 2019

Ejemplo 9

Distribución de adultos mayores peruanos según


condición de afiliación a algún tipo de seguro de salud, 2019
(Porcentaje respecto al total de población adulta mayor)
26
Estadística Aplicada I 2022 01

Ejemplo 10
La universidad A realizó una encuesta a 30 estudiantes que están terminando el colegio con la
finalidad de conocer sus preferencias profesionales. De los datos obtenidos se construyó la siguiente
tabla:

Distribución de estudiantes según su preferencia profesional


Preferencia profesional fi hi pi
Administración 5 0,1667 16,67%
Derecho 4 0,1333 13,33%
Gastronomía 6 0,2000 20,00%
Ingeniería 8 0,2667 26,67%
Negocios 3 0,1000 10,00%
Periodismo 4 0,1333 13,33%
Total 30 1 100%
Fuente: Universidad A

a. Presente el gráfico de barras de frecuencias porcentuales

Solución
Distribución porcentual de estudiantes según su preferencia profesional
30%
26.7%
Porcenaje de estudiantes

25%

20.0%
20%
16.7%
15% 13.3% 13.3%

10.0%
10%

5%

0%
Administración Derecho Gastronomía Ingeniería Negocios Periodismo
Preferencia profesional
Fuente: Universidad A

b. Presente el gráfico circular de frecuencias porcentuales.

Solución
Distribución porcentual de estudiantes según su preferencia profesional
Periodismo
13.3% Administración
16.7%

Negocios
10.0%

Derecho
13.3%

Ingeniería
26.7%
Gastronomía
20.0%
Fuente: Universidad A
27
Estadística Aplicada I 2022 01

Ejemplo 11

Se aplicó una encuesta a una muestra de 30 empleados de la empresa Motores A. Se preguntó por la
función que desempeña. Los datos se presentan a continuación:

Obrero Profesional Técnico Servicios Obrero Obrero


Profesional Producción Técnico Producción Obrero Producción
Obrero Técnico Profesional Obrero Técnico Producción
Producción Técnico Profesional Servicios Obrero Profesional
Obrero Obrero Profesional Obrero Obrero Obrero

a. Presente la tabla de distribución de frecuencias.

Solución

Distribución de empleados según función que desempeña


Función fi hi pi
Obrero 12 0,4000 40,00%

Producción 5 0,1667 16,67%

Profesional 6 0,2000 20,00%

Servicios 2 0,0667 6,67%

Técnico 5 0,1667 16,67%

Total 30 1 100%
Fuente: Motores A

b. Interprete la frecuencia absoluta simple de la categoría 1, la frecuencia relativa simple de la


categoría 3 y la frecuencia porcentual simple de la categoría 2.

Solución

f 1 = 12. De un total de 30 empleados, 12 son obreros.

h3 = 0,2. La proporción de empleados que son profesionales es 0,2.

p2 = 16,67%. El 16,67% de los empleados son de producción.


28
Estadística Aplicada I 2022 01

c. Presente el grafico de barras y circular de frecuencias porcentuales.

Distribución de empleados según función


45%
40.00%
40%
Porcentaje de empleados

35%

30%

25%
20.00%
20%
16.67% 16.67%
15%

10%
6.67%
5%

0%
Obrero Producción Profesional Servicios Técnico

Fuente: Motores A S.A. Función

Distribución de empleados según función

Técnico
16.67%

Servicios Obrero
6.67% 40.00%

Profesional
20.00%

Producción
Fuente: Motores A S.A. 16.67%
29
Estadística Aplicada I 2022 01

Diagrama de Pareto

El diagrama de Pareto es una representación gráfica que permite identificar y seleccionar los
aspectos prioritarios que hay que tratar en un determinado problema.

También se conoce como diagrama ABC o Ley de las prioridades 80 - 20, que dice: “el 80% de los
problemas que ocurren en cualquier actividad son ocasionados por el 20% de los elementos que
intervienen en producirlos” (pocos vitales, muchos triviales).

Según este concepto se tiene un problema con muchas causas, podemos decir que el 20% de las
causas resuelven el 80 % del problema. Por ejemplo, en control de calidad, se puede mostrar que la
mayoría de los defectos surgen de un número pequeño de causas.

Los pasos para la elaboración del diagrama de Pareto son los siguientes:

1. Construya una tabla de distribución de frecuencias ordenando las categorías en forma


descendente respecto a la frecuencia.

 La categoría Otros se coloca al final, no importa cuán grande sea, pues está compuesta por
categorías cuyas frecuencias son menores al valor de la variable con frecuencia más pequeña
listada individualmente.
 Agregue a la tabla de distribución de frecuencias una columna para la frecuencia acumulada.

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta fi Frecuencia porcentual pi Frecuencia acumulada porcentual Pi
Categoría 1 f1 p1 P1
Categoría 2 f2 p2 P2
⋮ ⋮ ⋮ ⋮
Otros fk pk Pk
Total n 100% 100%
Fuente:

2. Dibuje los ejes verticales y horizontal, título, rótulos de los ejes y fuente.

 Dibuje un eje vertical izquierdo, un eje vertical derecho y uno horizontal.


 En el eje vertical izquierdo, ponga alguna de las frecuencias simples ( f i, hi o pi).
• Si usa la frecuencia absoluta f i, marque una escala de 0 a n .
• Si usa la frecuencia relativa hi , marque una escala de 0 a 1.
• Si usa la frecuencia absoluta pi, marque una escala de 0% a 100%.
 En el eje vertical derecho, use alguna de las frecuencias acumuladas ( F i, H i o Pi=H i %). Se
recomienda usar la frecuencia porcentual acumulada; en ese caso, marque una escala de 0%
a 100%.

 En el eje horizontal, marque los espacios donde estarán dibujadas las barras para cada una
de las categorías incluida la categoría Otros.
30
Estadística Aplicada I 2022 01

Distribución de unidades elementales según variable

Frecuencia acumulada porcentual


100%

Frecuencia simple
75%

50%

25%

Categoría 1 Categoría 2 Categoría 3 Otros

Variable
Fuente:

3. Grafique el diagrama de barras.

Distribución de unidades elementales según variable

Frecuencia acumulada porcentual


100%
Frecuencia simple

75%

50%

25%

Categoría 1 Categoría 2 Categoría 3 Otros

Variable
Fuente:

4. Dibuje la línea de frecuencias acumuladas (curva de Pareto). Indique las etiquetas de datos de las
frecuencias simples y de las frecuencias acumuladas.

Distribución de unidades elementales según variable


Frecuencia acumulada porcentual

100 % 100%

P3
Frecuencia simple

75%
P2
P1
50%

25%

Categoría 1 Categoría 2 Categoría 3 Otros

Variable
Fuente:
31
Estadística Aplicada I 2022 01

Ejemplo 12

El gerente de producción de una empresa, que produce asientos de fibra de vidrio, quiere identificar
los problemas más frecuentes reportados en la fabricación de este producto, y planear soluciones de
acuerdo con la recurrencia del problema. Al extraer una muestra aleatoria de productos fallados,
obtuvo los siguientes resultados:

Distribución de productos según problemas reportados de asientos de fibra de vidrio


Tipo de problema reportado Número de ocurrencias ( f i)
Color inadecuado 28
Forma no simétrica 16
Medidas fuera de norma 50
Superficie rugosa 71
Bordes afilados 9
Desprendimiento de capa protectora 12
Otros 14
Fuente: Gerencia de Producción

¿Cuáles son los problemas más frecuentes reportados en la fabricación, para que el gerente de
producción planifique soluciones de acuerdo con la recurrencia de los problemas?

Solución

Lo primero es ordenar los datos en orden descendente a la frecuencia fi. La categoría Otros va al
final. Luego, se calcula las frecuencias relativas y las relativas acumuladas.

Distribución de productos según problemas reportados de asientos de fibra de vidrio


Tipo de problema reportado fi hi pi Pi
Superficie rugosa 71 71 35,5 % 35,5 %
Medidas fuera de norma 50 121 25,0 % 60,5 %
Color inadecuado 28 149 14,0 % 74,5 %
Forma no simétrica 16 165 8,0 % 82,5 %
Desprendimiento de capa protectora 12 177 6,0 % 88,5 %
Bordes afilados 9 186 4,5 % 93,0 %
Otros 14 200 7,0 % 100,0 %
Fuente: Gerencia de Producción

Se puede realizar el gráfico usando las frecuencias simples absolutas f i y las frecuencias porcentuales
porcentuales Pi.
32
Estadística Aplicada I 2022 01

Distribución de productos según problemas reportados de asientos de fibra


de vidrio 100.0%
200 93.0% 100%
88.5%
82.5%
160 74.5% 80%

Porcentaje acumulado de productos


60.5%
120 60%
Número de productos

80 71 40%
35.5%
50
40 28 20%
16 12 14
9
0 0%
Superficie rugosa Medidas fuera de Color inadecuado Forma no Desprendimiento Bordes afilados Otros
norma simétrica de capa protec-
tora

Tipo de problema reportado


Fuente: Gerencia de Producción

Los problemas más frecuentes en la producción de los asientos de fibra de vidrio son: superficie
rugosa, medidas fuera de norma y color inadecuado, los cuales representan un 74,5% de los
problemas.

Ejemplo 13

Termas S.A.C. es una empresa que fabrica y comercializa dentro y fuera del Perú, termas para el
calentamiento del agua para uso doméstico e industrial. Debido a la fuerte competencia de los
productos importados, la empresa se encuentra en un proceso de mejora continua, por este motivo
el jefe de control de calidad selecciona al azar 75 termas del área de reclamos.

A continuación, se presenta un resumen de los tipos de problemas reportados en termas


seleccionadas.

Tipo de problema reportado en las termas fi


Falla en el reloj termostato 5
Falla en resistencia 24
Tubos de abastos con filtración 13
Falla en el núcleo-eje 21
Otros 9
Falla en conexiones eléctricas 3

¿Cuáles de esos problemas deben de resolverse prioritariamente?


33
Estadística Aplicada I 2022 01

Solución

Ordenamos la tabla de distribución de frecuencias en forma descendente por las frecuencias simples,
con la categoría Otros al final.

Distribución de termas según problemas reportados por los clientes


Tipo de problema reportado en las termas fi hi pi Pi
Falla en resistencia 24 0,3200 32,00% 32,00%
Falla en el núcleo-eje 21 0,2800 28,00% 60,00%
Tubos de abastos con filtración 13 0,1733 17,33% 77,33%
Falla en el reloj termostato 5 0,0667 6,67% 84,00%
Falla en conexiones eléctricas 3 0,0400 4,00% 88,00%
Otros 9 0,1200 12,00% 100,00%
Total 75 1 100%
Fuente: Termas S.A.C.

Distribución de termas según problemas reportados por los clientes .


100% 100.00% 100%
84.00% 88.00%
77.33%
80% 80%
60.00%

Porcentaje acumulado de termas


60% 60%

40% 32.00% 40%


Porcentaje de termas

28.00%
32.00% 17.33%
20% 12.00% 20%
6.67% 4.00%
0% 0%
s
je
ia

ro
n

s a
t
ció
nc

ta

Ot
ric
o-
te

os
tra

ct
cl e
s is

é
fil

el
er
re

on

s
jt
el
en

ne
sc

lo
en

xio
l la

re
to
lla

ne
Fa

as

el
Fa

ab

co
en

en
e

ll a
sd

Fa

l la
bo

Fa
Tu

Tipo de problemas
Fuente: Termas SAC

El 77,33% de la problemática de la empresa lo generan la falla en resistencia, falla en el núcleo eje y


tubos de abastos con filtración.
34
Estadística Aplicada I 2022 01

Ejemplo 14

Emapa es una empresa de agua y alcantarillado que presenta muchos problemas en sus diferentes
procesos, los cuales generan pérdidas a la empresa y el malestar e insatisfacción de los usuarios.

Para conocer cuáles son las quejas más frecuentes reportadas por los clientes, que le permita a la
empresa establecer un plan de mejora, se elaboró un diagrama de Pareto con los 120 registros de las
quejas reportadas por los clientes en el último mes. Tal como se muestra a continuación:

Distribución de clientes según tipo de queja


Tipo de queja fi hi pi Pi
Rotura de red pública 56 0,4667 46,67% 46,67%

Problemas en el medidor 40 0,3333 33,33% 80,00%

Rotura de red domiciliara 14 0,1166 11,66% 91,67%

Filtaciones de conexión 8 0,0667 6,67% 98,33%

Otros 2 0,0167 1,67% 100,00%

Total 120 1 100%


Fuente: Emapa S.A.C.

Si las dos tipos de queja más frecuentes acumulan más del 70% de las quejas se va a realizar un plan
de mejora enfocándose en esos dos tipos de queja. Indique lo que hará la empresa.

Utilice las cinco dimensiones de la competencia de razonamiento cuantitativo.

Solución

Interpretación

Decidir si se va a implementar un plan de mejora.

Representación

La variable el tipo de queja reportada.


La herramienta estadística a utilizar es el diagrama de Pareto.

Cálculo

El cálculo es realizar el gráfico de Pareto.


35
Estadística Aplicada I 2022 01

Distribución de registros de quejas por los clientes de Emapa


en el último mes según tipo de queja

98.33% 100.00%
120 91.67% 100%
80.00% 90%
100

Porcentaje acumulado de registros


80%
80 70%
Número de registros

60%
46.67%
60 56 50%
40 40%
40 30%
20 20%
14
8 10%
0 2 0%
Rotura de red Problemas en el Rotura de red Filtraciones en la otros
pública medidor domiciliaria conexión

Tipo de queja
Fuente: Emapa S.A.C.

Análisis

El procentaje de quejas reportadas por los clientes se centran en rotura de red pública y problemas
en el medidor es del 80% que es mayor al 70%.

Argumentación

Por lo tanto, se va a realizar un plan de mejora enfocándose en esos dos tipos de queja, rotura de red
pública y problemas de medidor.
36
Estadística Aplicada I 2022 01

Ejercicios

16. La Italiana es una empresa dedicada a la fabricación de embutidos cárnicos, su proceso de


producción se enfoca en mejorar y optimizar sus productos para qué de esta forma, puedan
cumplir con los estándares del mercado e incluso superarlos. La empresa está interesada en
identificar los problemas principales que se pueden encontrar en la elaboración de embutidos
crudos curados.

Distribución de problemas según etapa en la fabricación de embutidos crudos curados


Problema más importante fi
Embarrado 11
Embutición 20
Nitrificación 12
Otros 10
Sabor 7
Textura 18
Fuente: La Italiana

En base a la información presentada, determine los principales problemas a ser atendidos con
prioridad por la empresa, con el procedimiento estadístico más adecuado.

Distribución de problemas según etapa en la fabricación de embutidos crudos


curados
100.00%
100% 100%
87.18%
78.21%

Porcentaje acumualdo de problemas


80% 80%
64.10%
Porcentaje de problemas

60% 60%
48.72%

40% 40%
25.64% 23.08%
20% 25.64% 20%
15.38% 14.10% 12.82%
8.97%

0% 0%
Embutición Textura Nitrificación Embarrado Sabor Otros
Problema más importante
Fuente: La Italiana

17. En la empresa Metal S.A.C. presentan fallas en una pieza AWR-3500 que sirve de repuesto en
aviones comerciales. Durante todo el mes de febrero del 2019 se observaron las piezas con
algún defecto y se registró el tipo de defecto identificado.

A continuación, se presenta un cuadro en el que se indica el número de piezas defectuosas


detectadas.
37
Estadística Aplicada I 2022 01

Distribución de piezas defectuosas según tipo de defecto


Tipo de defecto presentado Número de piezas defectuosas f i
Dureza no apropiada 30
Color no uniforme 15
Tamaño fuera de norma 52
Bordes afilados 10
Rugosidad excesiva 6
Otros 12
Fuente: Metal S.A.C.

Si Metal S.A.C. desea reducir al menos el 75% de los defectos ¿cuáles de esos defectos deben de
resolverse?
38
Estadística Aplicada I 2022 01

Tablas de doble entrada


También llamadas tablas cruzadas o de contingencia. Se utilizan cuando a las observaciones se les
asocian con dos variables cualitativas o categóricas simultáneamente.

 Se pone “y” si la tabla presenta frecuencias absolutas o porcentuales con respecto al total.
 Se pone “por” si la tabla presenta frecuencias porcentuales con respecto a fila o columna.

Ejemplo 15
La tabla que se presenta a continuación fue publicada el mes pasado por el diario Siglo XXI. La
encuesta se aplicó a una muestra de 805 hogares según nivel socioeconómico ( NSE ) y área de
residencia. Los resultados se presentan a continuación:

Tabla 1. Distribución de hogares según área de residencia y nivel socioeconómico


Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
Nivel socioeconómico A 15 2 17
Nivel socioeconómico B 48 3 51
Nivel socioeconómico C 105 145 250
Nivel socioeconómico D 94 175 269
Nivel socioeconómico E 38 180 218
Total 300 505 805
Fuente: Diario Siglo XXI

Solución
a. Indique el título de la tabla de doble entrada.
Distribución de hogares según área de residencia y nivel socioeconómico
Distribución de hogares según nivel socioeconómico y área de residencia

b. Interprete el valor 145.


Del total de 805 hogares, 145 se encuentran en área rural y pertenecen al nivel socioeconómico C.

c. Obtenga la tabla cruzada de porcentajes con respecto al total general y su gráfica.

Tabla 2. Distribución porcentual de hogares según área de residencia y nivel socioeconómico


Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
15 2
Nivel socioeconómico A ×100 %=1,86 % ×100 %=0,25 % 2,11%
805 805
48 3
Nivel socioeconómico B ×100 %=5,96 % ×100 %=0,37 % 6,33%
805 805
105 145
Nivel socioeconómico C ×100 %=13,04 % ×100 %=18,01 % 31,05%
805 805
94 175
Nivel socioeconómico D ×100 %=11,68 % ×100 %=21,74 % 33,42%
805 805
38 180
Nivel socioeconómico E ×100 %=4,72 % ×100 %=22,36 % 27,08%
805 805
300 505
Total ×100 %=37,27 % ×100 %=62,73% 100,00%
805 805
Fuente: Diario Siglo XXI
39
Estadística Aplicada I 2022 01

Tabla 2. Distribución porcentual de hogares según área de residencia y nivel socioeconómico


Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
Nivel socioeconómico A 1,86 % 0,25 % 2,11%
Nivel socioeconómico B 5,96 % 0,37 % 6,33%
Nivel socioeconómico C 13,04 % 18,01 % 31,05%
Nivel socioeconómico D 11,68 % 21,74 % 33,42%
Nivel socioeconómico E 4,72 % 22,36 % 27,08%
Total 37,27 % 62,73 % 100,00%
Fuente: Diario Siglo XXI

Gráfica 2. Distribución porcentual de hogares según área de residencia y nivel


socioeconómico
25%
21.74% 22.36%

20%
Porcentaje de hogares

18.01%

15% 13.04%
11.68%
10%
5.96%
4.72%
5%
1.86%
0.25% 0.37%
0%
NSE A NSE B NSE C NSE D NSE E
Nivel socieconómico

Fuente: Diario Siglo XXI Área urbana Área rural

Distribución porcentual de hogares según área de residencia y nivel so-


cioeconómico
40%
35%
30%
Porcentaje de hogares

25%
18.01% 21.74%
20%
15% 22.36%
10% 0.37%
13.04% 11.68%
5% 0.25%
5.96% 4.72%
0% 1.86%
NSE A NSE B NSE C NSE D NSE E
Nivel socieconómico

Fuente: Diario Siglo XXI Área urbana Área rural


40
Estadística Aplicada I 2022 01

d. Interprete el valor 18,01%.

Del total de hogares, 18,01% se encuentran en área rural y pertenecen al nivel socioeconómico C.

e. Obtenga la tabla cruzada de porcentajes con respecto al total de fila y su gráfica.

Tabla 3. Distribución porcentual de hogares según área de residencia por nivel socioeconómico
Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
15 2
Nivel socioeconómico A ×100 %=88,24 % ×100 %=11,76 % 100%
17 17
48 3
Nivel socioeconómico B × 100 %=94,12 % ×100 %=5,88 % 100%
51 51
105 145
Nivel socioeconómico C ×100 %=42,00 % ×100 %=58,00 % 100%
250 250
94 175
Nivel socioeconómico D ×100 %=34,94 % ×100 %=65,06 % 100%
269 269
38 180
Nivel socioeconómico E ×100 %=17,43 % ×100 %=82,57 % 100%
218 218
300 505
Total ×100 %=37,27 % ×100 %=62,73% 100%
805 805
Fuente: Diario Siglo XXI

Tabla 3. Distribución porcentual de hogares según área de residencia por nivel socioeconómico
Área de residencia
Nivel socioeconómico Total
Área urbana Área rural

Nivel socioeconómico A 88,24 % 11,76 % 100%

Nivel socioeconómico B 94,12 % 5,88 % 100%

Nivel socioeconómico C 42,00 % 58,00 % 100%

Nivel socioeconómico D 34,94 % 65,06 % 100%

Nivel socioeconómico E 17,43 % 82,57 % 100%

Total 37,27 % 62,73 % 100%


Fuente: Diario Siglo XXI
41
Estadística Aplicada I 2022 01

Distribución porcentual de hogares según área de residencia por nivel


socioeconómico
100% 94.12%
88.24%
90% 82.57%
80%
70% 65.06%
58.00%
Porcentaje de hogares

60%
50% 42.00%
40% 34.94%
30%
20% 17.43%
11.76%
10% 5.88%
0%
NSE A NSE B NSE C NSE D NSE E
Nivel socieconómico

Fuente: Diario Siglo XXI Área urbana Área rural

Distribución porcentual de hogares según área de residencia por nivel


socioeconómico
100% 5.88%
11.76%
90%
80%
70% 58.00% 65.06%
Porcentaje de hogares

60% 82.57%
50% 94.12%
88.24%
40%
30%
20% 42.00% 34.94%
10% 17.43%
0%
NSE A NSE B NSE C NSE D NSE E
Nivel socieconómico

Fuente: Diario Siglo XXI Área urbana Área rural

f. Interprete el valor 58%.

Del total de hogares que pertenecen al nivel socioeconómico C, el 58% se encuentran en área
rural.
42
Estadística Aplicada I 2022 01

g. Obtenga la tabla cruzada de porcentajes con respecto al total de columna y su gráfica.

Tabla 4. Distribución porcentual de hogares según nivel socioeconómico por área de residencia
Área de residencia
Nivel socio- Total
económico Área urbana Área rural
15 2 17
NSE A ×100 %=5,0 % ×100 %=0,40 % ×100 %=2,11 %
300 505 805
48 3 51
NSE B ×100 %=16,0 % ×100 %=0,59 % ×100 %=6,34 %
300 505 805
105 145 250
NSE C ×100 %=35,0 % ×100 %=28,71 % ×100 %=31,05 %
300 505 805
94 175 269
NSE D ×100 %=31,3 % ×100 %=34,65 % ×100 %=33,42 %
300 505 805
38 180 218
NSE E ×100 %=12,7 % ×100 %=35,64 % ×100 %=27,08 %
300 505 805
Total 100 % 100,00 % 100,00 %
Fuente: Diario Siglo XXI

Tabla 4. Distribución porcentual de hogares según nivel socioeconómico por área de residencia
Nivel socio- Área de residencia
económico Área urbana Área rural Total
NSE A 5,00 % 0,40 % 2,11 %
NSE B 16,00 % 0,59 % 6,34 %
NSE C 35,0 % 28,71 % 31,05 %
NSE D 31,33 % 34,65 % 33,42 %
NSE E 12,67 % 35,64 % 27,08 %
Total 100 % 100,00 % 100,00 %
Fuente: Diario Siglo XXI

Distribución porcentual de hogares según nivel socioeconómico por área de


residencia
40% 35.64%
35.00% 34.65%
35% 31.33%
30% 28.71%
Porcentaje de hogares

25%
20% 16.00%
15% 12.67%
10%
5.00%
5%
0.40% 0.59%
0%
Área urbana Área rural
Área de residencia

Fuente: Diario Siglo XXI NSE A NSE B NSE C NSE D NSE E


43
Estadística Aplicada I 2022 01

Distribución porcentual de hogares según nivel socioeconómico por área de


residencia
100%
12.67%
90%
80% 35.64%

70% 31.33%
NSE E
Porcentaje de hogares

60% NSE D
50% 34.65% NSE C
40% 35.00% NSE B
30% NSE A
20% 28.71%
16.00% 0.59%
10%
5.00% 0.40%
0%
Área urbana Área rural
Área de residencia
Fuente: Diario Siglo XXI

h. Interprete el valor 28,71%.

Del total de hogares que se encuentran en área rural, el 28,71% pertenecen el nivel socioeconómico C.
44
Estadística Aplicada I 2022 01

Ejercicios

18. Multicereales es una empresa de la industria alimentaria dedicada a la elaboración de cereales


para desayunos. La empresa realiza la producción en tres turnos de trabajo de ocho horas cada
turno, para monitorear el proceso el inspector de calidad selecciona una muestra aleatoria de
240 cajas de cereal del almacén y realizó análisis del turno de trabajo y tipo de presentación
obteniendo una tabla y una gráfica.

Distribución porcentual de cajas de cereal según ...


12%

10% 9.6% 9.2%

7.5% 7.8% 7.5% 7.5%


8%
7.1%
Porcentaje de cajas

5.8% 6.3% 6.3%


6% 5.8% 5.4%
5.0% 5.0%
5.0%
4%

2%

0%
Chocapic Fitnees Nesquik Snacker Trix
Presentacion

Fuente: Multicereales S.R.L. Noche Tarde Mañana

Distribución porcentual de cajas de cereal según tipo de presentación por turno


Tipo de presentación
Turno de trabajo Chocapic Fitnees Nesquik Snacker Trix
Mañana 20,00% 18,89% 20,00% 16,67% 24,44%
Tarde 20,00% 21,43% 17,14% 17,14% 24,29%
Noche 17,50% 15,00% 28,75% 16,25% 22,50%
Fuente: Multicereales S.R.L.

a. Indique el título del gráfico.


Rpta. Distribución porcentual de cajas de
cereal según tipo de presentación y turno
b. Indique la cantidad de cajas de cereal Nesquik y que son producidas en el turno noche.
Rpta. 23
c. Indique la cantidad de cajas de cereal Trix y que son producidas en el turno mañana.
Rpta. 22
d. Del total de cajas de cereal Chocapic, indique el porcentaje que son producidas en la
mañana.
Rpta. 39,13%
45
Estadística Aplicada I 2022 01

e. Del total de cajas de cereal que son producidas en el turno tarde, indique el porcentaje que
son Fitnees. Rpta. 21,43%

19. Osiptel es un organismo técnico especializado que regula y supervisa el mercado de servicios
públicos de telecomunicaciones y vela por los derechos del usuario. Osiptel decidió realizar una
investigación en 6000 hogares de Lima Metropolitana, sobre el uso principal del Internet y el
turno en el que utiliza el Internet. La investigación estuvo a cargo de un ingeniero de software,
quien muestra los datos obtenidos de una muestra de hogares en la siguiente tabla y gráfico:

Distribución porcentual de hogares según turno y uso principal del Internet


Turno de uso del Internet
Uso principal de Internet
Mañana Tarde Noche
Buscar información 2,09% 9,62% 2,93%
Juegos 6,28% 2,51% 6,69%
Educación 5,86% 5,02% 8,79%
Redes sociales 11,30% 6,69% 3,77%
Trabajo 7,53% 9,62% 11,30%
Fuente: Osiptel

Distribución porcentual de hogares según …………………………....……………...…


70% 65.7%

60%
51.9%
50%
Porcentaje de hogares

43.2% 44.7%
40.5% 39.7%
40%
33.8%
29.8% 30.8%
30% 26.5%
25.5%
20.0% 17.3%
20% 16.2%
14.3%
10%

0%
Buscar información Juegos Otros Redes sociales Trabajo
Uso principal de Internet

Fuente: Ostel
Turno Mañana Turno Tarde Turno Noche
a. Indique el título del gráfico.
Rpta. Distribución porcentual de hogares según turno
por uso principal de Internet
b. Indique la cantidad de hogares que utilizan principalmente Internet para ingresar a las
redes sociales durante la mañana. Rpta.
678
c. Indique la cantidad de hogares que utilizan Internet durante la noche y lo utilizan
principalmente para buscar trabajo. Rpta. 678
d. Del total de hogares que utilizan Internet para buscar información, indique el porcentaje de
hogares que lo usan durante la noche. Rpta. 20,01%
e. Del total de hogares que utilizan Internet durante la noche, indique el porcentaje que lo
usan para las redes sociales. Rpta. 11,26%
46
Estadística Aplicada I 2022 01

20. El área de mantenimiento de Dream Perú quiere identificar la existencia de algún tipo de
problema en los equipos de las diferentes áreas de producción y cuáles de estas son
perjudicadas debido a las constantes paradas no programadas. Se realizó un estudio en donde
el jefe de producción muestra la siguiente información en una tabla y un gráfico, obtenidos al
analizar el turno de trabajo y la planta de producción de los registros de paradas.

Distribución de los registros de paradas según turno de trabajo y planta de producción


Turno de trabajo
Planta de producción Mañana Tarde Noche
Chimbote 37 52 37
Ica 37 48 40
Lima 49 50 35
Tacna 34 43 38
Fuente: Dream Perú S.A.

Distribución porcentual de los registros de paradas según ………………............


35%
31.2%
24.9%
30%
26.7% 26.9%
Porcentaje de registros de parada

23.6% 25.3% 25.9%


24.7%
25% 23.6% 23.3%
21.7% 22.3%
20% Chimbote
Ica
15% Lima
Tacna
10%

5%

0%
Mañana Tarde Noche
Turno de trabajo
Fuente:Dream Perú S.A.

a. Indique el título del gráfico.


Rpta. Distribución porcentual de los registros de
paradas según planta de producción por turno
b. Indique la cantidad de registros de paradas que son de la planta de Lima y del turno de la
tarde. Rpta. 50
c. Indique la cantidad de registros de paradas que son de la planta de Ica y del turno de la
noche. Rpta. 40
d. Del total de registros de paradas de la mañana, indique el porcentaje que son de Chimbote.
Rpta. 23,60%
e. Del total de registros de paradas de la planta de Chimbote, el porcentaje que son de la tarde.
Rpta. 41,27%
47
Estadística Aplicada I 2022 01

21. El gerente de la Aseguradora Zambrano, preocupado por el incremento de siniestros en los


vehículos asegurados, propone incrementar el monto de la prima de riesgo a los autos, si
encuentra que el porcentaje de siniestros a causa de exceso de velocidad es mayor para los
autos que para las camionetas.

Gráfico 1: Distribución porcentual de los siniestros vehiculares según ...........


70%
63.0%
58.3% 60.0%
60% 54.2%
51.9%
50% 48.1%
45.8%
Porcentaje de sinistros

41.7% 40.0%
40% 37.0%

30%

20%

10%

0%
Exceso de velocidad Imprudencia del Ebriedad del Imprudencia del Desacato de
conductor conductor peaton señales de transito
Causa del siniestro

Fuente: Aseguradora Zambrano


Camioneta Auto

a. Indique el título del gráfico 1.


Rpta. Distribución porcentual de los siniestros vehiculares
según tipo de vehículo por causa de siniestro
b. Del total de siniestros causados en camionetas, indique el porcentaje de siniestros que fueron
por la imprudencia del conductor. Rpta. 15%
c. Del total de siniestros causados por la imprudencia del conductor, indique el porcentaje de
siniestros que fueron en camionetas. Rpta. 45,8%
d. ¿El gerente debe proponer el incremento del monto de la prima de los autos? Rpta. SÍ
48
Estadística Aplicada I 2022 01

Organización de datos Cualitativos


Frecuencia Frecuencia Frecuencia
Variable discreta
absoluta f i relativa hi porcentual pi
f1
x1 f1 h1 = p1 = h1 * 100%
n
f2
x2 f2 h2 = p2 = h2 * 100%
n
⋮ ⋮ ⋮
fk
xk fk h k= pk = hk * 100%
n
Total n 1

Gráficos para Datos Cualitativos: Barras (horizontales/verticales) y Circular

Organización de datos cuantitativos discretos


Si los datos son discretos y no hay mucha variabilidad se presentarán directamente cada valor de la
variable y sus respectivas frecuencias. El procedimiento más simple es listar los n datos en forma
ascendente y luego elaborar la tabla de distribución de frecuencias indicando para cada valor de la
variable su respectiva frecuencia con la que aparece en la serie.

Distribución de <unidades elementales> según <variable>


Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
Variable discreta
absoluta f i relativa hi acumulada F i acumulada H i
f1
x1 f1 h1 = F 1=f 1 H 1=h 1
n
f2
x2 f2 h2 = F 2=f 2+ F 1 H 2=h2+ H 1
n
⋮ ⋮ ⋮ ⋮ ⋮
fk
xk fk hk= F k =f k + Fk −1 H k =hk + H k−1
n
Total n 1
Fuente:
49
Estadística Aplicada I 2022 01

Representación gráfica de variables cuantitativas discretas

Gráfico de bastones o de varas

La representación gráfica de la variable cuantitativa discreta es similar al caso cualitativo, sólo que no
se emplean columnas sino líneas verticales para cada valor, denominados bastones o varas.

Ejemplo 16

La empresa APS ha registrado, durante 20 días, los reclamos de un producto defectuoso elaborado
por una de sus máquinas industriales. De los datos obtenidos se construyó la siguiente tabla:

Distribución de los días según número de reclamos


Número de reclamos fi hi Fi Hi
0 1 0,05 1 0,05
1 4 0,20 5 0,25
2 7 0,35 12 0,60
3 6 0,30 18 0,90
4 2 0,10 20 1,00
Total 20 1    
Fuente: Empresa APS

a. Presente el gráfico de varas de frecuencias porcentuales


Distribución de los días según el número de reclamos
40%
35%

30%
30%
Porcentaje de días

20%
20%

10%
10%
5%

0%
0 1 2 3 4 5
Número de reclamos
Fuente: Empresa APS
50
Estadística Aplicada I 2022 01

Ejemplo 17

Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores
(trabajadores) de la empresa Creativa S.A. en lo que va del año.

0 0 0 1 1 1 1 1 1 1 1 1 1 1 1
1 1 2 2 2 2 2 2 2 2 2 2 3 3 5

a. Presente la tabla de distribución de frecuencias.


Distribución de colaboradores según número de capacitaciones recibidas
Número de capacitaciones fi hi Fi Hi
0 3 0.1000 3 0.1000
1 14 0.4667 17 0.5667
2 10 0.3333 27 0.9000
3 2 0.0667 29 0.9667
5 1 0.0333 30 1.0000
Total 30 1.0000    
Fuente: Empresa Creativa S.A.

b. Presente el gráfico correspondiente para las frecuencias absolutas.

Distribución de colaboradores según número de capacitaciones recibidas


16
14
14
Número de colaboradores

12
10
10

43
2
2 1

0
0 1 2 3 4 5 6
Número de capacitaciones recibidas
Fuente: Empresa Creativa S.A.

c. Interprete:

f2 De 30 colaboradores, 14 han recibido solo una capacitación al año.


F2 De 30 colaboradores, 17 han recibido de una a menos capacitaciones al año.
La proporción de colaboradores que han recibido solo una capacitación al año es
h2
0,4667.
El 56,7% de los colaboradores han recibido de una a menos capacitaciones al
P2 = H 2%
año (como máximo / a lo más / menor o igual a una capacitación al año)
51
Estadística Aplicada I 2022 01

Ejercicios

22. El gerente de un banco está interesado en estudiar el comportamiento del número de cuentas
de ahorros cerradas por día. La información disponible para este fin se muestra a continuación:

0 3 1 2 1 0 2 3 0 1 4 1 4 4 0 4 3 1 2 2
1 5 0 5 4 1 0 2 1 3 0 3 2 1 1 2 5 4 0 1

a. Construya la tabla de distribución de frecuencias para la variable en estudio.


b. Interprete la frecuencia absoluta de la segunda categoría y la frecuencia porcentual
acumulada de la cuarta categoría.
c. Construya el gráfico de bastones para representar la variable en estudio.

23. El jefe de control de calidad de una empresa agroindustrial está interesado en estudiar el
comportamiento del número de productos defectuosos por lote. La información disponible para
este fin se muestra a continuación:

0 0 0 0 0 0 0 0 1 1
1 1 1 1 1 1 1 1 1 2
2 2 2 2 2 2 3 3 3 3
3 4 4 4 4 4 4 5 5 5

a. Construya la tabla de distribución de frecuencias para la variable en estudio.

Distribución de lotes según número de productos defectuosos por lote


Número de productos defectuosos por
fi hi Fi Hi
lote
0 8 0,200 8 0,200
1 11 0,275 19 0,475
2 7 0,175 26 0,650
3 5 0,125 31 0,775
4 6 0,150 37 0,925
5 3 0,075 40 1,000
Total 40    
Fuente: Empresa Agroindustrial

b. ¿Cuál es el porcentaje de lotes (Hi%) con un máximo de dos productos defectuosos?


El porcentaje de lotes (Hi%) con un máximo de dos productos defectuosos es 65%
52
Estadística Aplicada I 2022 01

Organización de datos cuantitativos continuos


Los datos se agruparán de intervalo (también llamados clases, categorías o grupos) cuando la
variable tiene gran variabilidad.

Pasos para construir la tabla de frecuencias

Para agrupar n datos de una muestra, los pasos son los siguientes:

a. Determine el rango (R)

R=Xmáx – Xmín

Donde Xmáx es el dato de mayor valor y Xmín el dato de menor valor.

b. Determine el número de intervalos (k ) usando la regla de Sturges:

k =1+3,322 log ( n )

El número de intervalos k es siempre un número entero. Si la estimación tiene decimales, se


toma el entero más próximo.

c. Calcule el ancho o amplitud de intervalo (w ).

R
w=
k

La amplitud w se redondea al número inmediato superior de acuerdo con la cantidad de


decimales que tienen los datos o según la precisión con que se desea trabajar.

Por ejemplo:

R w
Si los datos tienen w=
k (redondeo por exceso)

cero decimales w = 50,2381 w = 51

una cifra decimal w = 50,2381 w = 50,3

dos cifras decimales w = 50,2381 w = 50,24

tres cifras decimales w = 50,2381 w = 50,239

dos cifras decimales w = 0,3800 w = 0,38

dos cifras decimales w = 0,38001 w = 0,39

cero decimales w = 0,38001 w = 1,0

cero cifras decimales w = 0,3800 w = 1,0

d. Determine los límites de cada intervalo.


53
Estadística Aplicada I 2022 01

 Partiendo del dato de menor valor Xmin se determinan cada uno de los límites de intervalos
sumando la amplitud de clase a cada valor obtenido.

 Si los datos son cuantitativos continuos, el límite superior de un intervalo es el límite inferior
del siguiente intervalo. Se considera que el intervalo es abierto en el límite inferior y cerrado
en el límite superior, con excepción en el primer intervalo en el que los dos límites son
cerrados.

e. Calcule la marca de clase ( x k ).


´

La marca de clase es el punto medio de cada clase. Se calcula como la semisuma de los límites de
cada clase. Representa a todos los datos que están contenidos en dicha clase.

Límite inferior + Límite superior L +L
x ´k = = ik sk
2 2

f. Construya la tabla de distribución de frecuencias realizando la agrupación y conteo de los datos


según la clase a la que corresponda.

Distribución de <unidades elementales> según <variable>


Frecuencia Frecuencia
Intervalos ´ Frecuencia Frecuencia
Marca de clase x 1 absoluta relativa
(clases) absoluta f i relativa hi
acumulada F i acumulada H i
Li 1 + Ls 1 f1
[ Li 1−Ls 1 ] x ´1= f1 h1 = F 1=f 1 H 1=h 1
2 n
Li2 + Ls 2 f2
¿ Li 2−Ls 2 ¿ ¿ x ´2= f2 h2 = F 2=f 2+ F 1 H 2=h2+ H 1
2 n
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
Lik + L sk fk
¿ Lik −Lsk ¿ ¿ x ´k = fk h k= F k =f k + Fk −1 H k =hk + H k−1
2 n
Total n 1
Fuente:
54
Estadística Aplicada I 2022 01

Representación gráfica de variables cuantitativas continuas

Histograma
Es la representación por medio de barras rectangulares, siendo la base de cada barra proporcional a
la amplitud de la clase.
 Se indican los límites de los intervalos.
 En el eje horizontal va la escala de la variable. Su título debe indicar el nombre de la variable y su
unidad de medición.
 En el vertical va la escala de la frecuencia absoluta simple o frecuencia porcentual simple.
Histograma de frecuencias absolutas
Distribución de unidades elementales según variable
Frecuencia simple absoluta

f2
f1
f3
f4
f5

Li 1 Ls 1=Li 2Ls 2=Li 3Ls 3=Li 4Ls 4 =Li 5 Ls 5


Variable
Fuente: Unidad de medición

Histograma de frecuencias relativas


Distribución de unidades elementales según variable
Frecuencia simple porcentual

h2
h1
h3
h4
h5

Li 1 Ls 1=Li 2Ls 2=Li 3Ls 3=Li 4Ls 4 =Li 5 Ls 5


Variable
Fuente: Unidad de medición

Histograma de frecuencias porcentuales


Distribución de unidades elementales según variable
Frecuencia simple porcentual

p2
p1
p3
p4
p5

Li 1 Ls 1=Li 2Ls 2=Li 3Ls 3=Li 4Ls 4 =Li 5 Ls 5


Variable
Fuente: Unidad de medición
55
Estadística Aplicada I 2022 01

Polígono de frecuencias

Es la representación por medio de una figura poligonal cerrada, que se obtiene uniendo con
segmentos de recta los puntos de intersección de las marcas de clase con las frecuencias.

 Cada punto del polígono se obtiene levantando desde la marca de clase en el eje horizontal una
vertical que corresponde a su respectiva frecuencia (relativa o absoluta) simple.
 En este gráfico se usan las marcas de clase y no los límites de los intervalos.
 El polígono siempre va cerrado en los extremos. Para esto, considere marcas de clase adicionales
con frecuencia cero al inicio y al final del polígono.
 En el eje horizontal va la escala de la variable. Su título debe indicar el nombre de la variable y
sus unidades de medición.
 En el vertical va la escala de la frecuencia.

Distribución de unidades elementales según variable


Frecuencia simple

x ´1−w
´
x1 x ´2 x3
´
x ´4 ´
x4 + w
Variable
Unidad de medición
Fuente:

Ojiva (polígono de frecuencias acumuladas)

Se obtiene uniendo con segmentos de recta los puntos de intersección del límite superior de cada
intervalo y la frecuencia acumulada (Hi% o Fi) respectiva.

Con la ojiva se puede estimar fácilmente el número o porcentaje de observaciones que corresponden
a un intervalo determinado.

Distribución de unidades elementales según variable

100 %
100%
P4
Frecuencia acumulada
porcentual

75%
P3
P2
50%
P1
25%

Li 1 Ls 1=Li 2Ls 2=Li 3Ls 3=Li 4Ls 4 =Li 5 Ls 5


Variable
Fuente: Unidad de medición
56
Estadística Aplicada I 2022 01

Ejemplo 18

El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que
pagan los vecinos del distrito. Los datos de los pagos de impuestos, en soles, de 48 viviendas elegidas
al azar en el 2015 son:

145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1

Solución

a. Elabore la tabla de frecuencias para la variable “Pago por impuestos municipales” para el
presente año.

El rango R se calcula con:

R=Valor máximo – Valor mínimo=351,1 – 145,1=206

Siguiendo la regla de Sturges, el número de intervalos es:

k =1+3,322 log 10 ( n )=1+3,322 log 10 ( 48 )=6,585

Usamos redondeo simple sin decimales a que el número de intervalos es un número entero.
Luego:

k =7

La amplitud se calcula por:


R 206
w= = =29,429
k 7

Usamos redondeo por exceso a un decimal debido a que los datos tienen como máximo un
decimal. Luego:
w=29,5

A continuación, la tabla de distribución de frecuencias.

Distribución de viviendas según pago de impuesto municipal (en soles)


Pago de impuestos Marca de clase fi hi Fi Hi
[145,1; 174,6] 159,85 3 0,0625 3 0,0625
]174,6; 204,1] 189,35 3 0,0625 6 0,1250
]204,1; 233,6] 218,85 10 0,2084 16 0,3334
]233,6; 263,1] 248,35 12 0,2500 28 0,5834
]263,1; 292,6] 277,85 7 0,1458 35 0,7292
]292,6; 322,1] 307,35 7 0,1458 42 0,8750
]322,1; 351,6] 336,85 6 0,1250 48 1,0000
57
Estadística Aplicada I 2022 01

Total 48 1
Fuente: Oficina de Rentas de la Municipalidad

b. Interprete las siguientes frecuencias.

f2 = 3 Tres viviendas pagaron más de 174,6 soles y hasta de 204,1 soles

F2 = 6 Seis viviendas pagaron hasta 204,1 soles


La proporción de viviendas que pagaron más de 204,1 soles y hasta 233,6
h3 = 0,2084
soles es de 0,2084
P3 = 33,34% El 33,34% de las viviendas pagaron hasta 233,60 soles

c. Presente el respectivo gráfico.

Distribución de viviendas según pago de impuesto municipal (en soles)


14
12
12
10
Número de viviendas

10

8
7 7
6
6

4
3 3
2

0
- - - - - - -
145.1 174.6 204.1 233.6 263.1 292.6 322.1 351.6

Pago de impuesto municipal


Fuente: Oficina de Rentas de la Municipalidad
58
Estadística Aplicada I 2022 01

Distribución porcentual de viviendas según pago de impuesto mu -


nicipal (en soles)
30%
25.00%
25%
20.84%
Porcentaje de viviendas

20%
14.58% 14.58%
15% 12.50%

10%
6.25% 6.25%
5%

0%
130.35 159.85 189.35 218.85 248.35 277.85 307.35 336.85 366.35
Pago de impuesto municipal
Fuente: Oficina de Rentas de la Municipalidad
159,85 – w 336.85 + w

Distribución porcentual de viviendas según pago de impuesto mu-


nicipal (en soles)
100.00%
100%
87.50%
90%
80% 72.92%
70%
58.34%
Porcentaje de viviendas

60%
50%
40% 33.34%
30%
20% 12.50%
10% 6.25%
0%
145.1 174.6 204.1 233.6 263.1 292.6 322.1 351.6
Pago de impuesto municipal
Fuente: Oficina de Rentas de la Municipalidad
59
Estadística Aplicada I 2022 01

Ejercicios
24. Se ha llevado a cabo un estudio para evaluar el tiempo, en horas, que utiliza cada trabajador de
una planta hidroeléctrica para verificar el normal funcionamiento de la tubería de presión y las
válvulas de control. Para ello se eligieron al azar 45 de ellos.
0,15 0,18 0,19 0,71 0,75 0,82 0,84 0,92 0,96 1,16 1,17 1,19 1,23 1,40 1,47

1,59 1,61 2,01 2,16 2,38 2,42 3,07 3,22 3,53 3,76 3,94 4,50 4,59 4,75 5,41

5,42 5,45 5,61 5,62 5,71 6,19 6,23 6,43 6,71 7,12 7,45 7,54 7,93 9,12 10,0
a. Construya una tabla completa de distribución de frecuencias usando la regla de Sturges y el
gráfico adecuado.

Para construir la Tabla de Frecuencias, necesito realizar 3 pasos:


a) Rango de datos R = Vmax – Vmin
R = 10,0 – 0,15 = 9,85

b) Número de intervalos (Usar la Regla de Sturges) K = 1 + 3,322 Log ( n )


K = 1 + 3,322 * Log ( 45 ) = 6,4919  K  6

c) Amplitud/ancho del Intervalo W = R / K


W = R / K = 9,85 / 6 = 1,6417

IMPORTANTE: La amplitud w se redondea al número inmediato superior de acuerdo con la


cantidad de decimales que tienen los datos o según la precisión con que se desea trabajar.

 W  1,65

Distribución de trabajadores según el tiempo en horas que utiliza ……


Tiempo en horas Marca de clase
fi hi Fi Hi
Lim Inf - Lim Sup (L Inf. + L Sup.) / 2
[ 0,15 - 1,80 ] 0,975 17 0,3778 17 0,3778
] 1,80 - 3,45 ] 2,625 6 0,1333 23 0,5111
] 3,45 - 5,10 ] 4,275 6 0,1333 29 0,6444
] 5,10 - 6,75 ] 5,925 10 0,2222 39 0,8666
] 6,75 - 8,40 ] 7,575 4 0,0889 43 0,9555
] 8,40 - 10,05] 9,225 2 0,0444 45 0,9999  1
Total 45 1
Fuente: una planta hidroeléctrica

b. Interprete los valores de f 2, h1 y H 3 %.


De los 45 trabajadores, 6 utilizan más de 1,80 hasta 3,45 hrs para verificar
f2 = 6
el normal funcionamiento de la tubería de presión
La proporción de trabajadores que utilizan de 0,15 hasta 1,80 hrs es
h1 = 0,3778
0,3778 para verificar el normal funcionamiento de la tubería de presión
P3 = H3% = El 64,44% de los trabajadores utiliza como máximo 5,10 hrs (de 0,15 hasta
64,44% 5,10) para verificar el normal funcionamiento de la tubería de presión
60
Estadística Aplicada I 2022 01

25. Los datos corresponden a los ingresos, en cientos de soles, de una muestra de 60 clientes del
banco A.

5,25 7,22 8,53 9,27 9,54 10,21 10,32 10,45 10,52 10,76
10,85 11,25 11,56 12,42 13,27 14,65 15,72 16,85 17,22 18,56
19,32 20,56 21,72 22,85 23,12 24,32 25,65 26,72 28,72 29,65
31,42 32,71 33,55 34,28 35,21 37,45 38,32 39,65 41,22 43,28
45,72 47,32 49,45 51,27 52,38 54,75 55,81 56,27 57,45 58,22
59,32 61,45 63,75 65,72 66,85 69,32 69,54 72,30 75,81 77,42

a. Construya una tabla completa de distribución de frecuencias usando la regla de Sturges y el


grafico adecuado.
b. Interprete los valores de f 2, h3 y H 4 .

26. La empresa Computadoras S.A., es una compañía distribuidora de equipos de cómputo. Jean
Carlos jefe del área de logística preocupado por la disminución de las ventas diarias, propondrá
al directorio la implementación de la promoción del pago en 12 cuotas sin intereses, siempre
que más del 18% de días registren como máximo un monto de venta de 151 soles. A
continuación, se presenta algunos resultados de una muestra de 50 días:

52,0 94,7 95,1 97,5 102,5 104,1 106,0 125,2 125,6 146,0
146,8 158,6 158,7 162,6 166,2 166,2 166,2 166,2 168,2 169,7
196,0 204,9 204,9 204,9 204,9 208,3 215,2 217,5 218,1 218,1
218,1 218,1 220,9 226,2 235,0 239,7 242,2 259,6 261,6 277,2
286,5 287,0 297,8 313,9 315,0 316,2 338,6 359,9 363,1 398,3

¿La empresa debe implementar la promoción de las ventas en cuotas sin interés?

Hoy hemos visto:


Para datos cuantitativos discretos:

Tabla de Frecuencias

Gráfico Varas o Bastones

Para datos cuantitativos continuos:

Tabla de Frecuencias

Gráfico Histograma, Polígono de frecuencias y Ojiva


61
Estadística Aplicada I 2022 01

Comparación de distribuciones (de 2 o más muestras)

Si se va a agrupar datos de dos o más muestras para analizarlas comparativamente, tome en cuenta
adicionalmente lo siguiente:

 El rango ( R ) se determina tomando el dato mayor de todas las muestras menos el dato menor
de todas las muestras.
 Si las muestras tienen tamaño distinto, para determinar el número de intervalos ( K = 1 + 3,322
LOG ( n ) ) se toma el tamaño de muestra más grande.
 Al agrupar los datos en clases (intervalos), los datos de cada muestra se agrupan
independientemente, de tal manera que haya tantas tablas de distribución como muestras, pero
todas empleando las mismas clases (intervalos).

Distribución de <unidades elementales> según <variable>


Intervalos Marca de clase Muestra 1 Muestra 2

comunes x i fi hi Fi Hi fi hi Fi Hi
Li 1 + Ls 1
[ Li 1−Ls 1 ] ´
x 1= f1 h1 F1 H1 f1 h1 F1 H1
2
Li2 + Ls 2
¿ Li 2−Ls 2 ¿ ¿ ´
x 2= f2 h2 F2 H2 f2 h2 F2 H2
2

⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮

Lik + L sk
¿ Lik −Lsk ¿ ¿ x ´k = fk hk Fk Hk fk hk Fk Hk
2
Total n1 1 n2 1
Fuente:

Ejemplo 19
La empresa Fico presenta a continuación los datos correspondientes a la duración (en horas) de una
muestra de 40 focos de 100 watts producidos de la marca A y una muestra de 35 focos de 100 watts
de la marca B.

Marca A
684 697 720 773 821 831 835 848 852 852
859 860 868 870 876 893 899 905 909 911
922 924 926 926 938 939 943 946 954 971
972 977 984 1005 1014 1016 1041 1052 1080 1093

Marca B
819 836 888 897 903 907 912 918 942 943
952 959 962 986 994 1004 1005 1007 1015 1016
1018 1020 1034 1038 1072 1077 1077 1096 1100 1113
1113 1116 1153 1154 1172

a. Elabore las tablas de distribución de frecuencias de los datos de ambas muestras de tal manera
que permita su comparación apropiadamente.
62
Estadística Aplicada I 2022 01

 El rango ( R ) se determina tomando el dato mayor de todas las muestras menos el dato menor
de todas las muestras.

R = 1172 – 684 = 488

 Si las muestras tienen tamaño distinto, para determinar el número de intervalos ( K = 1 + 3,322
LOG ( n ) ) se toma el tamaño de muestra más grande.

K = 1 + 3,322 LOG ( 40 ) = 6,3220  K  6 intervalos

 Amplitud del intervalo es W = R / K

W = R / K = 488 / 6 = 81,3333  W = 82 (redondeado al inmediato superior con CERO


decimales)

Para la marca A, el valor máximo es 1093 horas y el valor mínimo es 684 horas.
Para la marca B, el valor máximo es 1172 horas y el valor mínimo es 819 horas.

El rango R para los intervalos comunes se calcula con:

R=X máx ( A , B )−X mín ( A , B )=1172−684=488

Para la marca A, el tamaño de muestra es n1 =40 .


Para la marca B, el tamaño de muestra es n2 =35.

Siguiendo la regla de Sturges, se elige el mayor de los dos tamaños de muestra, en este caso
n1 =40, por tanto, el número de intervalos k es:

k =1+3,322 log 10 (n)=1+3,322 log 10 (40)=6,3

El número de intervalos es un valor entero y se usa redondeo simple, por tanto, k =6 .

La amplitud se calcula por:

R 488
w= = =81,3
k 6

Usamos redondeo por exceso a cero decimales debido a que los datos tienen no tienen
decimales, por tanto, w=82 horas.

A continuación, se muestra la tabla de distribución de frecuencias.

Distribución de focos según la duración, en horas, por marca


Duración ’ Marca A Marca B
xi
L. Inf - L. Sup fi hi Fi Hi fi hi Fi Hi
[ 684 766 ] 725 3 0,075 3 0,075 0 0,0000 0 0,0000
] 766 848 ] 807 5 0,125 8 0,200 2 0,0571 2 0,0571
] 848 930 ] 889 16 0,400 24 0,600 6 0,1715 8 0,2286
63
Estadística Aplicada I 2022 01

] 930 1012 ] 971 10 0,250 34 0,850 10 0,2857 18 0,5143


] 1012 1094 ] 1053 6 0,150 40 1,000 9 0,2571 27 0,7714
] 1094 1176 ] 1135 0 0,000 40 1,000 8 0,2286 35 1,0000
Total 40 1 35 1    
Fuente: Fico S.A.

b. Elabore los polígonos de frecuencias para su comparación

Distribución porcentual de focos según la duración (en horas) por marca


45%
40% 40.0%
35%
28.6%
30% 25.7%
Porcentaje de focos

25% 25.0% 22.9%

20% 17.2%
15% 15.0%
12.5%
10% 5.7%
7.5%
5%
0%
643 725 807 889 971 1053 1135 1217

Duración (en horas)

Fuente: Fico S.A. Marca A Marca B

c. Por norma ISO 9001, la duración de un foco debe ser mayor de 930 horas. ¿Qué marca de foco es
la que cumple en mayor porcentaje con esta norma?

Usando la tabla de distribución de frecuencias, podemos saber el porcentaje de focos cuya


duración es mayor a 930 horas.

La marca B es la que cumple en mayor porcentaje con la norma ISO 9001, debido a que el
77,14% de los focos tienen una duración mayor a 930 horas, a diferencia de la marca A que tiene
un menor porcentaje de cumplimiento (40%).

d. ¿Qué marca de foco es la que cumple en mayor número de focos con esta norma?
La marca B es la que cumple en mayor porcentaje con la norma ISO 9001, debido a que 27 focos
tienen una duración mayor a 930 horas, a diferencia de la marca A que tiene una menor cantidad
de cumplimiento (16).

Distribución de focos según la duración, en horas, por marca


Marca A Marca B
Duración x ’i
fi hi Fi Hi fi hi Fi Hi
684 766 725 3 0,075 3 0,075 0 0,0000 0 0,0000
766 848 807 5 0,125 8 0,200 2 0,0571 2 0,0571
848 930 889 16 0,400 24 0,600 6 0,1715 8 0,2286
64
Estadística Aplicada I 2022 01

] 930 1012 ] 971 10 0,250 34 0,850 10 0,2857 18 0,5143


] 1012 1094 ] 1053 6 0,150 40 1,000 9 0,2571 27 0,7714
]1094 1176 ] 1135 0 0,000 40 1,000 8 0,2286 35 1,0000
Total 40 1 35 1    
65
Estadística Aplicada I 2022 01

Comparación de distribuciones
27. El ingeniero de control de calidad de la fábrica de aluminio G&E, por las constantes quejas que
recibe sobre la longitud de dichas láminas decide comparar las longitudes de las láminas en dos
turnos existentes, si se sabe que la longitud de la lámina debe estar entre 300 ∓ 8 mm. A
continuación, se muestra la longitud de las láminas en cada turno.

Tarde
290 290 290 290 291
293 294 295 295 298
298 300 304 305 306
313 314 315 321 327

Noche
282 286 296 296 297
298 298 300 301 304
306 310 310 310 311
312 313 313 315 315
316 317 319 319 319
320 320 320 321 322
324 324 325 328

Construya los intervalos comunes, marcas de clase y frecuencia absoluta simple para las
distribuciones de frecuencias, de manera que permita realizar comparaciones entre los dos
turnos. Utilice la regla de Sturges.

28. Una empresa emprendió un estudio para determinar el comportamiento de un sistema de


grabación de programas informáticos en el que para que el proceso funcione adecuadamente la
señal debe estar entre 9,2 y 10 voltios. Se instalaron sistemas de grabación tanto en una
ubicación antigua como en una nueva ubicación y se tomaron lecturas. Los datos registrados se
muestran en la siguiente tabla:
Ubicación antigua
8,05 8,72 8,72 8,80 9,55 9,70 9,73 9,80 9,80 9,84
9,84 9,87 9,87 9,95 9,97 9,98 9,98 10,0 10,01 10,02
10,03 10,05 10,05 10,12 10,15 10,15 10,26 10,26 10,29 10,55

Ubicación nueva
8,51 8,65 8,68 8,72 8,78 8,8 8,82 8,82 8,83 9,14
9,19 9,27 9,35 9,36 9,37 9,39 9,43 9,48 9,49 9,54
9,55 9,60 9,63 9,64 9,70 9,75 9,85 9,87 9,95 9,98
10,01 10,03 10,05 10,05 10,09 10,1 10,12 10,12 10,15 10,15

a. Elabore las tablas de distribución de frecuencias de los datos de ambas muestras de tal
manera que permita su comparación apropiadamente.
b. Elabore los polígonos de frecuencias para su comparación.
c. Elabore un informe sustentado de sus conclusiones.
66
Estadística Aplicada I 2022 01

Medidas de tendencia central, de posición y de variación


Las medidas de resumen sirven para describir en forma resumida un conjunto de datos que
constituyen una muestra tomada de alguna población.

Podemos distinguir cuatro grupos de medidas de resumen:

Medidas Medidas de tendencia Media


de central
resumen
Mediana

Moda

Medidas de posición o Percentil


cuantiles

Cuartil

Decil

Medidas de dispersión Rango

Varianza

Desviación estándar

Coeficiente de variación

Medidas de asimetría Coeficiente de asimetría de


(medida de forma) Pearson

1.
67
Estadística Aplicada I 2022 01

Medidas de tendencia central


Son aquellas medidas que localizan el centro de una distribución, indicando el valor alrededor del
cual tienden a concentrarse o distribuirse las demás observaciones. El objetivo es conseguir un valor
que sea representativo del conjunto total de datos que se está analizando.

Media aritmética o promedio


La media aritmética o promedio de un conjunto de valores de una variable es la suma de dichos
valores dividida entre el número de valores.

Cálculo de la media de datos no agrupados


Media poblacional (Parámetro)
N

∑ xi
i=1
μ=
N
Media muestral (Estadístico)
n

∑ xi
i=1
x=
n

donde:
x i : dato
N : tamaño de la población
n : tamaño de la muestra

Cálculo de la media de datos agrupados de variable discreta


Media poblacional
k

∑ xi f i
i=1
μ=
N
Media muestral
k

∑ xi f i
i=1
x=
n
donde:
x i: valor de la variable
f i : frecuencia de cada clase
N : tamaño de la población
n : tamaño de la muestra

Cálculo de la media de datos agrupados de variable continua


Media poblacional
k

∑ x ´i f i
i=1
μ=
N
68
Estadística Aplicada I 2022 01

Media muestral
k

∑ x ´i f i
i=1
x=
n
donde:
´
x i : marca de clase
f i : frecuencia de cada clase
N : tamaño de la población
n : tamaño de la muestra
Interpretación de la media

Según el contexto se puede interpretar de la siguiente manera:


La variable X se aproxima a…………
La variable X está alrededor de………
La variable X tiende a………….

Características de la media

• Se calcula para un conjunto de datos medido en escala de intervalo o razón.


• El valor de la media es sensible a los valores extremos (mínimo y máximo), por lo que la
presencia de valores inusuales la distorsionan.
• La media tiene propiedades matemáticas valiosas para poder usarlas en otros cálculos.

Ejemplo 20

Los siguientes datos corresponden al número de defectos por cada placa integrada, en una muestra
de 30 placas seleccionadas al azar de un proceso de producción.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1
5 5 5 3 1 3 1 4 1 1 2 4 1 4 1

Calcule e interprete la media de la variable en estudio.

Solución

La media del número de defectos de las 30 placas es de 2,6 defectos por placa.

Esto significa que:


 El número de defectos por placa en el proceso productivo se aproxima a 2,6 defectos por placa
 El número de defectos por placa en el proceso productivo está alrededor de 2,6 defectos por
placa
 El número de defectos por placa en el proceso productivo tiende a 2,6 defectos por placa.

Ejemplo 21
Los siguientes datos corresponden al espesor, en pulgadas, de una muestra aleatoria de varillas de
fierro corrugado.

1,73 1,73 1,84 1,71 1,61 1,50 1,78 1,50 1,90 1,81 1,72 1,84 1,75 1,69 1,63
69
Estadística Aplicada I 2022 01

1,51 1,77 1,81 1,77 1,80 1,68 1,56 1,71 1,78 1,49 1,57 1,71 1,82 1,66 1,69

Calcule e interprete el promedio de la variable en estudio.

Solución

El promedio del espesor de la muestra de varillas de fierro corrugado es 1,702 pulgadas. El espesor
de las varillas de fierro corrugado está alrededor de 1,702 pulgadas.

Ejemplo 22

A continuación, se muestra la distribución del número de máquinas que se sobrecalientan por día en
la planta REX S.A.

Distribución de días según número de máquinas que se sobrecalientan


Número de máquinas que se sobrecalientan
fi hi pi
xi
0 13 0,434 43,4%
1 10 0,333 33,3%
2 4 0,133 13,3%
3 3 0,100 10,0%
Total 30 1 100%
Fuente: REX. S.A.

Calcule e interprete el valor del promedio.

Solución

Calculemos la media:

∑ xi f i
x= i=1
n

0 ×13+1 ×10+2 × 4+3 × 3


x= =0,9
30

El número de máquinas que se sobrecalientan está alrededor de 0,9 máquinas por día.
70
Estadística Aplicada I 2022 01

Ejercicios

29. A continuación, se muestra la distribución del número de computadoras que fallan por día:

X i : Número de computadoras que


0 1 2 3 4
fallan
fi 30 10 5 3 2

Calcule e interprete el valor del promedio.

30. A continuación, se presenta el peso (en gramos) en forma agrupada para una muestra de
cargadores de celulares. Calcule e interprete la media.

Distribución de cargadores de celulares según peso, en gramos


i Peso x ’i fi x ’i f i
1 46,4 - 52,5 49,45 11 543,95
2 52,5 - 58,6 55,55 14 777,70
3 58,6 - 64,7 61,65 21 1294,65
4 64,7 - 70,8 67,75 20 1355,00
5 70,8 - 76,9 73,85 6 443,10
6 76,9 - 83,0 79,95 7 559,65
7 83,0 - 89,1 86,05 1 86,05
Fuente: Cargadores A S.A.

31. En la siguiente tabla se muestra la distribución del tiempo, en horas, de duración de los
componentes electrónicos de las marcas Alpha y Beta sometidos a un trabajo continuo:

Marca Alpha Marca Beta


i Intervalos
fi hi fi hi
1 [0 – 100] 2 0,025 12 0,171
2 ]100 – 200] 4 0,050 16 0,229
3 ]200 – 300] 22 0,275 25 0,357
4 ]300 – 400] 26 0,325 10 0,143
5 ]400 – 500] 20 0,250 4 0,057
6 ]500 – 600] 5 0,063 2 0,029
7 ]600 – 700] 1 0,013 1 0,014
Total 80 1 70 1

Calcule e interprete la media para el tiempo de duración de los componentes de las marcas
Alpha y Beta respectivamente.
71
Estadística Aplicada I 2022 01

Mediana

La mediana es el valor que ocupa la posición central de un conjunto de n datos ordenados de una
variable en estudio.

El 50% de las unidades elementales El 50% de las unidades elementales


presentan valores en la variable de estudio presentan valores en la variable de estudio
iguales o menores a la mediana. mayores a la mediana.

Mediana( Me)

Si n es impar:

me=X
[ ]
n +1
2

Si n es par:

X n +X
me=
[] [ ]
2
n
2
+1

Interpretación de la mediana

El 50% de las unidades elementales tienen un valor de la variable X menor o igual a la mediana.
El 50% de las unidades elementales tienen un valor de la variable X hasta la mediana.
El 50% de las unidades elementales tienen un valor de la variable X como máximo la mediana.

Características de la mediana

 Se calcula todo conjunto de datos medidos en escala de ordinal, intervalo o razón.


 El valor de la mediana depende del número de datos observados.
 La mediana es un estadístico robusto, es decir, no se ve afectada por valores extremos (mínimo y
máximo). Por eso se utiliza cuando hay datos inusuales o el polígono de frecuencias no es
simétrico.
 La mediana no tiene propiedades matemáticas valiosas para poder usarlas en otros cálculos.

Ejemplo 23

A continuación, se muestra el tiempo de vida (en días) de 12 baterías de litio seleccionadas al azar.
Halle e interprete la mediana del tiempo de vida de las baterías.

479 510 487 465 473 504 517 485 516 536 462 511

Solución

Primero se ordena los datos de menor a mayor.

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12


72
Estadística Aplicada I 2022 01

462 465 473 479 485 487 504 510 511 516 517 536

Como n=12 es par.

X n +X X +X
me=
[ ] [ ]= [ ] [
2
n
2
+1
12
2
12
2
+1 ] = X [ ]+ X [ ] = 487+504 =495,5
6 7
2 2 2 2

El 50% de las baterías de litio tienen un tiempo de vida de hasta 495,5 días.

Ejemplo 24

A continuación, se muestra el tiempo de vida (en días) de 11 baterías de litio seleccionadas al azar.
Halle e interprete la mediana del tiempo de vida de las baterías.

487 489 498 571 571 560 530 509 495 461 500

Solución

Primero, se ordena los datos de menor a mayor.

∑ X [ 2] X [ 3] X [4 ] X [ 5] X [ 6] X [ 7] X [ 8] X [ 9] X [ 10] X [ 11]
461 487 489 495 498 500 509 530 560 571 571

Como n=11 es impar.

me=X =X =X [ 6 ] =500
[ ]n +1
2 [ ]
11+ 1
2

El 50% de las baterías de litio tienen un tiempo de vida de 500 días o menos.

Ejemplo 25

Los datos corresponden a una muestra de baterías cuyas lecturas de voltaje (en voltios) son:

9,99 10,00 10,00 10,26 25,00 9,84 9,96 9,98 10,05 10,12

Calcule e interprete el valor de la mediana.

Solución

Primero, se ordena los datos de menor a mayor.

X [ 1] X [ 2] X [ 3] X [4 ] X [ 5] X [ 6] X [ 7] X [ 8] X [ 9] X [ 10 ]
9,84 9,96 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00

Como n=10 es par.


73
Estadística Aplicada I 2022 01

X n +X X +X
me=
[ ] [ ] = [ ] [ ] = X [ ]+ X [ ] = 10+10 =10
2
n
2
+1
10
2
10
2
+1
5 6
2 2 2 2

El 50% de las baterías tienen una lectura de como máximo de 10 voltios.


74
Estadística Aplicada I 2022 01

Ejercicios

32. Los siguientes datos corresponden al número de accidentes laborales que sucede
semanalmente en un taller mecánico.

1 2 0 2 1 3 3 1 3 0 5 1 3 1 3 1 2 1

Calcule e interprete la mediana de la variable en estudio.

Solución

Lo primero es ordenar los datos.

X [ 1] X [ 2] X [ 3] X [ 4 ] X [ 5] X [ 6] X [ 7] X [ 8] X [ 9] X [ 10] X [ 11] X [ 12] X [ 13] X [ 14] X [ 15] X [ 16] X [ 17] X [ 18]


0 0 1 1 1 1 1 1 1 2 2 2 3 3 3 3 3 5

33. El siguiente gráfico muestra de los salarios de los trabajadores españoles durante el año 2017 .
Interprete la mediana.
75
Estadística Aplicada I 2022 01

Moda
La moda es el valor que presenta la mayor frecuencia de un conjunto de datos observados de una
variable. Se denota por mo.

Interpretación de la moda
Es el valor más frecuente.

Características de la moda
 Es la única medida de tendencia central que se obtiene para cualquier escala de medición.
 El valor de la moda no se ve afectada por valores extremos.
 La moda no siempre es un valor único. En una serie de datos se puede tener dos modas
(bimodal) o más de dos modas (multimodal).
 En un conjunto de datos no necesariamente se va a encontrar moda.

Ejemplo 26
Los siguientes datos corresponden al número de piezas producidas (en cientos de piezas)
diariamente para una muestra aleatoria de 26 días.

4 2 4 2 2 3 3 1 3 3 4 1 1 5 5 5 3 1 3 2 4 2 1 5 2 3

Calcule e interprete la moda de la variable en estudio.

Solución

En este caso, el resultado de la moda es igual a 3 piezas diariamente. Esto significa que la cantidad de
piezas producidas con mayor frecuencia equivale a 3 piezas diariamente.

Cantidad de piezas producidas Frecuencia absoluta fi


1 5
2 6
3 7
4 4
5 4
Total general 26

La cantidad de piezas diarias producidas más frecuentes es tres cientos de piezas

Ejemplo 27
El tiempo, en minutos, que toma en producirse cada una de nueve piezas metálicas tomadas al azar
de la empresa Indus Metal se muestran a continuación:

Tiempo 47 42 27 39 57 37 33 37 42

Calcule e interprete el valor de la moda.


76
Estadística Aplicada I 2022 01

Solución
Tiempo 47 42 27 39 57 37 33 37 42

Existen dos modas.


mo 1=37 y mo 2=42

Es un caso bimodal (dos modas). Los tiempos más frecuentes en producir una pieza metálica son 37 y
42 minutos.

Ejemplo 28
A continuación, se muestra la distribución de trabajadores según número de piezas producidas.

Número de piezas vendidas fi pi


2 6 20,00%
3 8 26,67%
4 12 40,00%
5 3 10,00%
6 1 3,33%
Total 30 100%
Fuente: Elaboración propia

El valor de la moda es mo = 4, pues su frecuencia es la mayor (12 ó 40%).

El número de piezas vendidas más frecuente por los trabajadores es de cuatro piezas.
77
Estadística Aplicada I 2022 01

Ejercicios

34. A continuación, se presenta una muestra aleatoria de 13 telas de fibra de algodón registrando el
porcentaje de algodón y la resistencia a la tensión (N/m²).

2
Porcentaje de algodón 18 20 31 21 24 30 26 22 31 31 28 31
1
Resistencia a la tensión 5
54 54 84 73 70 76 88 68 61 71 75 87
(N/m²) 4

Calcule e interprete la moda para el porcentaje de algodón y la resistencia a la tensión de las


telas.

35. Renacer es una empresa que fabrica hornos microondas, la gerencia encargó al jefe de control
de calidad que informe cuál es el problema más frecuente encontrado en los hornos
microondas. Se tomó una muestra del área de reparaciones y se encontró la siguiente
información:

Problemas Número de hornos (fi)


De capacidad de descongelación 6
Velocidad de calentamiento 14
Cable de alimentación 3
Fuga de la microondas 8
Frecuencia de la microondas (MHz) 9
Potencia de microondas (W) 10

Con la información presentada, ¿qué problema se presenta con mayor frecuencia?

36. El jefe de control de calidad de una empresa agroindustrial está interesado en estudiar el
comportamiento del número de productos defectuosos por lote. La información disponible para
este fin se muestra a continuación:

0 0 0 0 0 0 0 0 1 1
1 1 1 1 1 1 1 1 1 2
2 2 2 2 2 2 3 3 3 3
3 4 4 4 4 4 4 5 5 5

Calcule e interprete las medidas de tendencia central.

37. El gerente de un banco está interesado en estudiar el comportamiento del número de cuentas
de ahorros cerradas por día. La información disponible para este fin se muestra a continuación:

1 2 3 4 0 0 2 3 0 1 4 1 4 4 0 4 3 1 2 2
1 5 0 5 4 1 0 2 1 3 0 3 2 1 1 5 4 3 2 1

Calcule e interprete las medidas de tendencia central.


78
Estadística Aplicada I 2022 01

38. Una empresa emprendió un estudio para determinar el comportamiento de un sistema de


grabación de programas informáticos. Se instalaron sistemas de grabación tanto en una
ubicación antigua como en una nueva ubicación y se tomaron lecturas, en voltios. Los datos
registrados se muestran en la siguiente tabla:

Ubicación antigua
8,05 8,72 8,72 8,80 9,55 9,7 9,73 9,80 9,80 9,84
9,84 9,87 9,87 9,95 9,97 9,98 9,98 10,00 10,01 10,02
10,03 10,05 10,05 10,12 10,15 10,15 10,26 10,26 10,29 10,55

Ubicación nueva
8,51 8,65 8,68 8,72 8,78 8,8 8,82 8,82 8,83 9,14
9,19 9,27 9,35 9,36 9,37 9,39 9,43 9,48 9,49 9,54
9,55 9,60 9,63 9,64 9,70 9,75 9,85 9,87 9,95 9,98
10,01 10,03 10,05 10,05 10,09 10,1 10,12 10,12 10,15 10,15

Calcule e interprete las medidas de tendencia central.

39. Una muestra de 30 trabajadores de una plataforma petrolera marina formó parte de un
ejercicio de escape del área. Para ello se registraron los siguientes tiempos, en minutos,
empleados en la evacuación.

31,5 32,5 32,5 33,4 33,9 34 35,6 35,6 35,9 35,9


36,3 36,4 36,9 37,0 37,3 37,3 37,4 37,5 38,0 38,9
39,2 39,3 39,4 39,7 40,2 40,3 41,5 42,4 42,8 44,5

Para la variable en estudio calcule e interprete las medidas de tendencia central.


79
Estadística Aplicada I 2022 01

Media o promedio ponderado

También llamada media pesada. Permite calcular el valor medio considerando la importancia o peso
de cada valor sobre el total.

∑ x i wi
x w = i=1n
∑ wi
i=1

donde:

x i : observación individual
w i : peso asignado a cada observación

Ejemplo 29

A continuación, se muestra el salario mensual (en soles) para diferentes ingenieros en una empresa
exportadora de tecnología emergente.

Tipo de ingeniero Salario mensual Porcentaje de ingenieros


Electrónico 5200 35%
Sistemas 4600 10%
Industrial 4200 15%
Mecánico 4000 40%

Halle el salario promedio de los ingenieros de la empresa exportadora.

Solución

5200∗35+ 4600∗10+4200∗15+ 4000∗40


x w= =4510
100

El salario de los ingenieros de la empresa exportadora de tecnología emergente está alrededor de


4510 soles.
80
Estadística Aplicada I 2022 01

Ejercicios

40. El ingreso promedio de los obreros de una empresa es de 2264 soles. Si el 60% de los obreros
tiene menos de 30 años y recibe el 20% del ingreso total, calcule el ingreso promedio por obrero
de menos de 30 años.

41. Una fábrica de ensamblado de autopartes cuenta con cuatro máquinas (A, B, C y D), siendo el
costo semanal para cada máquina de 650, 520, 450 y 380 nuevos soles. Si el 45% de las
autopartes son ensambladas por la máquina A, el 35% por la B, el 15% por la C y el resto por la
máquina D. Calcule el costo promedio semanal de las máquinas.

Máquinas Costo semanal Porcentaje de ensamblaje


A 650 45%
B 520 35%
C 450 15%
D 380 5%

42. Un profesor del curso de metalúrgica para ingeniería tuvo a su cargo dos secciones el ciclo
pasado. En la primera sección, donde tuvo 40 alumnos, la media de las notas del examen parcial
fue 13 y en la segunda sección, con 35 alumnos, la media de dicho examen fue 12,5. Calcular la
media de las notas de todos los estudiantes que tuvo a su cargo.

Secciones Alumnos Nota


1 40 13,0
2 35 12,5

43. Según una encuesta realizada por el INEI, se determinó que:


 de 80 pymes del sector madera, la media del número de trabajadores es de seis personas.
 de 50 pymes del sector metales, la media del número de trabajadores es de ocho personas.
 de 30 pymes del sector calzado, la media del número de trabajadores es de siete personas.
¿Cuál es el número promedio de trabajadores de los tres sectores?

Sector Número de pymes Númeo de trabajadores


Madera 80 6
Metales 50 8
Calzado 30 7

44. Se cuenta con tres alternativas para la localización de una nueva planta de fabricación. Para ello,
se ha identificado un conjunto de criterios y se ha distinguido el grado de importancia de cada
una de las alternativas en una escala de 0 a 10. Todo ello se recoge en la siguiente tabla:

Alternativas
Criterios Peso relativo (%)
A B C
Proximidad a proveedores 30 7 7 10
Costos laborales 30 5 9 7
Transportes 20 9 6 6
Impuestos 15 6 6 7
Costos instalación 5 7 8 2
81
Estadística Aplicada I 2022 01

Identifique, cuál de las alternativas es la ideal para la localización de la planta.

45. Una empresa de construcción utiliza tres tipos de trabajadores en obra (operario, maestro y
capataz). La empresa actualmente tiene a su cargo dos obras, en las que los trabajadores
participan de acuerdo con la siguiente tabla. ¿Cuál de las obras tiene un mayor promedio de
salario por hora?

Salario por hora, Número de horas trabajadas


Tipo de trabajador
en soles Obra 1 Obra 2
Operario 3 50 40
Maestro 6 20 35
Capataz 10 10 25
82
Estadística Aplicada I 2022 01

Propiedades de la media aritmética

El valor de la media es sensible a los valores extremos, por lo que varía mucho con valores muy
grandes o muy pequeños con respecto a los demás.

Si cada uno de los n valores x i es transformado en y i =a x i +b , siendo a y b constantes, entonces, la


media de los n valores y i es:

y=a x+ b

Ejemplo 30

Se sabe que el tiempo promedio para derretir un metal pesado con un método estándar es de 5,5
minutos, actualmente en el mercado existen dos alternativas modernas (A y B) para derretir el metal.

La empresa Iron Forte S.A. desea adquirir una de las dos alternativas, y para ello se conoce lo
siguiente:

 El tiempo para derretir el metal disminuye en 12,5% si se utiliza la alternativa A.


 El tiempo para derretir el metal disminuye en un 10% si se utiliza el método B y adicional
disminuye un minuto fijo por contar con radiación electromagnética.

¿Cuál de las dos alternativas permitirá a la empresa derretir el metal pesado en un tiempo promedio
más rápido?

Solución

Definamos las variables:

X ≔ tiempo para derretir el metal pesado con el método estándar


Y ≔ tiempo nuevo con las alternativas modernas.

Alternativa A

y=a x+ b

y= (1−0,125 ) 5,5+0=4,8125

El tiempo promedio para derretir un metal pesado con la alternativa A es 4,8125 minutos.

Alternativa B

y=a x+ b

y= (1−0,1 ) 5,5−1=3,95

El tiempo promedio para derretir un metal pesado con la alternativa B es 3,95 minutos.
83
Estadística Aplicada I 2022 01

La alternativa que permitirá a la empresa derretir el metal pesado con un tiempo promedio más
rápido se obtiene al utilizar la alternativa B.

Ejemplo 31

Se sabe que los ingresos mensuales que perciben los trabajadores de una planta de producción
tienen un promedio de 2800 soles, determine el nuevo ingreso promedio que se obtendría luego de
realizar los siguientes aumentos:

a. los ingresos de los trabajadores se incrementan en 250 soles.


b. los ingresos se incrementan en un 7,5%.
c. los ingresos se incrementan en un 12,5% más una bonificación de 125 soles.

Solución
Definamos las variables:

X ≔ antiguo ingreso de un trabajador


Y ≔ nuevo ingreso de un trabajador

a. los ingresos de los trabajadores se incrementan en 250 soles, entonces:

Solución

y=a x+ b

y= (1−0 ) 2800+250=3050

b. los ingresos se incrementan en un 7,5%, entonces:

Solución

y=a x+ b

y= (1+ 0,075 ) 2800+ 0=3010

c. los ingresos se incrementan en un 12,5% más una bonificación de 125 soles, entonces:

Solución

y=a x+ b

y= (1+ 0,125 ) 2800+125=3275


84
Estadística Aplicada I 2022 01

Ejercicios

46. Un fabricante desea adquirir una máquina para el llenado de bolsas de 150 gramos. Se realizan
20 ensayos con la máquina obteniéndose los siguientes pesos, en gramos:

143 145 146 148 149 150 150 150 150 150
150 150 150 150 150 151 152 154 155 155

Si el equipo de medición que se empleó para medir los pesos de las bolsas producidas por la
máquina estaba descalibrada y los verdaderos pesos serían 10% menores a los pesos medidos y,
además, con una constante de menos dos gramos, ¿cuál es el peso promedio verdadero de
bolsas de la máquina?

47. Una empresa de transporte gasta $ 400 en latas de conserva que cuestan $ 10 la docena; $500
en latas que cuestan $ 12,5 la docena; $ 600 más en latas que cuestan $ 20 la docena y $ 300 en
otras que cuestan $ 25 la docena. Calcular el costo promedio por docena de las latas de
conserva.

48. En una empresa textil, la distribución de salarios tiene una media aritmética de 300 dólares.
Como solución a un conflicto laboral, la gerencia propone un reajuste por medio de dos
alternativas.

Propuesta I
Un aumento general del 60% de los salarios.

Propuesta II
Un aumento general del 40% de los salarios y una bonificación adicional de 60 dólares a cada
trabajador.

¿Cuál de las alternativas propuestas conviene aceptar al sindicato?

49. En una cotización para adquirir drones, la empresa A ofrece las siguientes alternativas:

• La primera consiste en un aumento del precio en un 5% por contar con garantía de dos años.
• La segunda consiste en una disminución del precio en un 3% más 200 dólares por garantía
de dos años.

Indique la alternativa más conveniente del precio promedio de los drones, si el precio promedio
actual es de 1800 dólares.
85
Estadística Aplicada I 2022 01

. . .. . . . . . .. . . . .. . .. … la variabilidad de 125 km 2 ……………..  Varianza

. . .. . . . . . .. . . . .. . .. … la variabilidad de 125 km ……………..  Desviación Estándar

. . .. . . . . . .. . . . .. . .. … la variabilidad/homogeneidad del 13,5% ……………..  Coeficiente de Variación

¿Dónde es más homogéneo??

C.V. (A) = 12,4%

C.V. (B) = 22,9%

Los datos son más homogéneos en el grupo A, porque tiene menor porcentaje de variación.

Ejemplos:

Xi: Edades: 18, 20, 19, 19, 21, 17  Mo= 19 Me= 19 Media Aritmética= 19

50% 50%

Me = 19

30% 70%

P30

67% 33%

P67

¿Cuál es la altura mínima donde se encuentra el 20% de los celulares con mayor altura?  P80

80% 20%

P80
=PERCENTIL.EXC(rango_celdas;#_decimal)

¿Cuál es la altura máxima donde se encuentra el 20% de los celulares con menor altura?  P20
86
Estadística Aplicada I 2022 01

20% 80%

P20

¿Cuál es la altura mínima donde se encuentra el 20% de los celulares con mayor altura?  P80

60% 40%

P60
=PERCENTIL.EXC( rango_celdas;0,60)

P50 = Me

Aparte de PERCENTILES, existen otros términos, por ejemplo: CUARTILES (25% CADA SEGMENTO)

25% 25% 25% 25%

Q1 Q2 Q3

Q2 = P50 = Me

Q1 = P25 ; Q3 = P75

Aparte de PERCENTILES, existen otros términos, por ejemplo: DECILES (10% CADA SEGMENTO)

10% 10% 10%

D1 D2 .... D5 ... D9

D5 = Q2 = P50 = Me

D4 = P40 ; D7 = P70 ; ………………

Medidas de posición o cuantiles


Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir, en intervalos
que comprenden el mismo número de valores.

Los cuantiles más importantes son los denominados cuartiles, deciles y percentiles.

Percentiles
 Dividen el conjunto de datos en 100 partes porcentualmente iguales.

El k% de las unidades elementales presentan El (100 – k)% de las unidades elementales


valores en la variable de estudio iguales o presentan valores en la variable de estudio
menores al percentil k, Pk mayores al percentil k, Pk
87
Estadística Aplicada I 2022 01

Pk

Cuartiles
 Dividen el conjunto de datos en cuatro partes porcentualmente iguales.
 Se les denota como Q 1, Q2 y Q 3.
 Su equivalente en percentiles es Q 1=P25 , Q 2=P50=Me , Q3=P75 .

Deciles
 Dividen el conjunto de datos en 10 partes porcentualmente iguales.
 Se les denota como D1, D 2, D 3, …, D9 respectivamente.
 Su equivalente en percentiles es D 1=P10 , D 2=P20 , D 3=P30 ,…, D 9=P 90.

Ejemplo
Si queremos determinar el puntaje mínimo para estar en el quinto superior, debemos calcular el
percentil 80.

El 80% de los El 20% de los


estudiantes tienen un estudiantes tienen
puntaje menor o igual un puntaje mayor al
al percentil 80. percentil 80.
88
Estadística Aplicada I 2022 01

Cálculo de un percentil

1. Primero, ordenamos los datos de manera ascendente.

2. Calculamos la posición i del percentil k .

i= ( n+1
100 )
k=E ,d

3. Luego, calculamos el percentil k .

Si d=0 , entonces Pk = X [ E ]

Si d ≠ 0 , entonces Pk = X [ E ] +0 , d ( X [ E +1] − X [ E] )

Ejemplo 32
Se cuenta con los datos de los tiempos, en minutos, de ensamblaje de CPUs de 12 trabajadores.
Calcule e interprete el percentil 45.

15 12 18 22 24 10 9 13 25 18 12 14

Solución
Primero, ordenemos los datos ordenados.

X [ 1] X [ 2] X [ 3] X [4 ] X [ 5] X [ 6] X [ 7] X [ 8] X [ 9] X [ 10] X [ 11] X [ 12]


9 10 12 12 13 14 15 18 18 22 24 25

Calculemos la posición i del percentil 45.

i= ( n+1
100 ) k=(
100 )
12+ 1
45=5,85=E , d

De donde E=5 y d=0,85.

Como d=0,85≠ 0 , entonces el cálculo del percentil 45 es:

P45= X [ 5 ] +0,85 ( X [ 6 ] −X [ 5 ] ) =13+0,85 ( 14−13 ) =13,85

El 45% de los trabajadores ensamblan los CPUs en un tiempo máximo de 13,85 minutos.

Ejemplo 33
Exprese los siguientes valores como percentiles.

 Q1 = P25
 Q3 = P75
 Me = P50
 D3 = P30
89
Estadística Aplicada I 2022 01

 D6 = P60
90
Estadística Aplicada I 2022 01

Ejercicios

50. En una empresa, el jefe de Recursos Humanos está interesado en analizar el impacto en los
empleados al suprimir las horas extras de trabajo pagadas. Con este fin se extrae una muestra
aleatoria de 60 empleados tomando los datos de un día al azar. A continuación, se muestran las
horas de trabajo por día de cada empleado.

7,6 7,7 8,0 8,0 8,0 8,1 8,1 8,2 8,2 8,2 8,2 8,2 8,2 8,3 8,3
8,3 8,4 8,4 8,4 8,4 8,5 8,5 8,5 8,6 8,6 8,7 8,7 8,7 8,8 8,8
8,9 8,9 8,9 9,0 9,1 9,1 9,3 9,4 9,6 9,7 9,7 9,8 9,9 9,9 10,0
10,0 10,3 10,5 10,5 10,6 10,8 11,0 11,2 11,6 11,7 12,2 12,5 12,9 13,3 14,5

a. Calcule e interprete el percentil 35 y el 78.


b. Calcule el número mínimo de horas trabajadas para que un empleado se encuentre en el
20% de los empleados que más horas trabajan. P20 o P80
c. Calcule el número máximo de horas trabajadas para que un empleado se encuentre en el
25% de los empleados que menos horas trabajan. Q1 = P25 o P75

51. A continuación, se presentan el rendimiento medido por el número de pernos fabricados


semanalmente de 36 operarios de la empresa A.

540 546 553 555 560 571 587 593 597


598 607 640 650 652 668 672 691 696
717 719 741 753 794 801 805 836 843
864 878 889 905 923 928 931 934 941

a. Calcule el número de pernos máximo, fabricados semanalmente, para estar en el 15% de los
operarios con menor rendimiento. P85 o P15
b. Calcule el número de pernos mínimo, fabricados semanalmente, para estar en quinto
superior (1/5 = 0,20 = 20%) de los operarios con mayor rendimiento. P20 o P80
52. La empresa Computronix es una compañía distribuidora de equipos de cómputo. Jean Carlos
jefe del área de logística preocupado por la disminución de las ventas diarias, propondrá al
directorio la implementación de la promoción del pago en 12 cuotas sin intereses, siempre que
más del 18% de días registren como máximo un monto de venta de 151 soles.

A continuación, se presenta algunos resultados de una muestra elegida al azar de 50 días.

60,2 92,6 95,9 97,5 102,5 104,1 106,0 125,2 125,6 146,0
146,8 158,6 158,7 162,6 166,2 166,2 166,2 166,2 168,2 169,7
196,0 204,9 204,9 204,9 204,9 208,3 215,2 217,5 218,1 218,1
218,1 218,1 220,9 226,2 235,0 239,7 242,2 259,6 261,6 277,2
286,5 287,0 297,8 313,9 315,0 316,2 338,6 359,9 363,1 398,3
91
Estadística Aplicada I 2022 01

¿La empresa debe implementar la promoción de las ventas en cuotas sin interés?

53. Se ha registrado el número de problemas con el celular de 25 clientes de telefonía móvil en


Lima, usuarios de la operadora A, tal como se muestra a continuación:

4 7 4 7 6 8 7 5 7 5 7 4 7
8 6 5 6 6 5 6 6 7 4 6 4

La operadora A planifica hacer un descuento especial al 20% de los clientes que registra el
mayor número de problemas con el celular, ¿A partir de qué número de problemas, al cliente se
va a hacer el descuento especial?
92
Estadística Aplicada I 2022 01

Medidas de dispersión o variabilidad


Las medidas de dispersión o variabilidad indican cuán alejados están los valores de una variable del
valor que los representa y por lo tanto permiten evaluar la confiabilidad de ese valor central.

Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de
la medida de tendencia central, en cambio si la medida de dispersión tiene un valor grande, los datos
no están concentrados alrededor de la medida de tendencia central.

Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la diferencia entre
dato mayor y el dato menor:

R=Xmax− Xmin

donde:

Xmax : valor máximo observado de la variable


Xmin : valor mínimo observado de la variable

Ejemplo 34

El jefe de control de calidad de la empresa industrial de termas eléctricas Thermosol S.A. selecciona
una muestra al azar de 12 termas, y registra el número de defectos que presenta cada terma. Calcule
el rango.

2 1 2 4 1 3 2 3 2 0 5 1

Solución

El valor máximo es
Xmax =5
El valor mínimo es
Xmin=0

Luego el rango es R = 5 – 0 = 5. Esto indica que la amplitud del número de defectos en las ternas es
de 5.
93
Estadística Aplicada I 2022 01

Varianza
Es una medida del grado de dispersión o variación de los valores de una variable con respecto a su
media o promedio.

Varianza para datos no agrupados

Poblacional
N

∑ ( xi −μ )2
2 i=1
σ =
N

Muestral
n

∑ ( x i−x )2
s2= i=1
n−1

Varianza para datos agrupados

Poblacional
k

∑ f i ( x i−μ )2
2 i=1
σ =
N

Muestral
k

∑ f i ( x i−x )2
s2= i=1
n−1

Desviación estándar
La desviación estándar es la raíz cuadrada positiva de la varianza, mide la cantidad típica en la que los
valores del conjunto de observaciones difieren de la media.

Poblacional
σ =√ σ
2

Muestral
s= √ s
2
94
Estadística Aplicada I 2022 01

Característica de la varianza y la desviación estándar


 La varianza y la desviación estándar son números reales no negativos.
 Se pueden calcular para variables medidas en escala de intervalo o razón.
 Se ven afectadas por valores extremos.
 La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que la
desviación estándar es expresada en la misma unidad de los datos.

Ejemplo 35

A continuación, se presenta la cantidad de plomo en una muestra de agua potable, en miligramos


por litro. Halle la varianza y la desviación estándar.

45 62 30 25 36 60 47 19 16 38 10 35 31 21 22 25

Solución

Varianza
n

∑ ( x i−x )2
s2= i=1 =224,3833
n−1

Desviación estándar

s= √224,3833=14,9794

Coeficiente de variación
El coeficiente de variación de un conjunto de datos observados expresa la desviación estándar como
un porcentaje de la media. A diferencia de otras medidas de dispersión, el coeficiente de variación es
una medida relativa.

Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales
unidades.

Se calcula preferentemente en variables medidas en escala de razón (algunos autores sugieren que
se debe evitar su calcular para variables medidas en escala de intervalo).

Población
σ
CV = × 100 %
μ
Muestra
s
CV = ×100 %
x

Ejemplo 36
95
Estadística Aplicada I 2022 01

Los resultados presentados a continuación, representan resúmenes del número de mediciones de


resistencia de cierto artículo, realizados por dos grupos de técnicos:

Grupo 1: media = 3 y desviación estándar = 1,10


Grupo 2: media = 5 y desviación estándar = 1,66

¿En cuál de los grupos de técnicos el número de mediciones es más disperso?

Solución
Se usa como indicador el coeficiente de variación:

s1 1,10
CV 1= × 100 %= ×100 %=36,67 %
x1 3

s2 1,66
CV 2= × 100 %= ×100 %=33,207 %
x2 5

En el grupo 1, el número de mediciones es más disperso, puesto que su coeficiente de variación es


mayor.

Ejemplo 37

La fábrica de colchones Rímac S.A. cuenta con dos plantas (A y B), el área de seguridad industrial
desea analizar la variabilidad del número de accidentes industriales en las plantas. Para el estudio
tomó como referencia una muestra aleatoria de 100 días laborables para cada una de las plantas. La
información se muestra a continuación:

Distribución de días laborables según número Distribución de días laborables según número
de accidentes en la planta A de accidentes en la planta B
Número de accidentes Número de días Número de accidentes Número de días
0 10 0 15
1 15 1 10
2 30 2 35
3 35 3 25
4 10 4 15
Total 100 Total 100
Fuente: Rímac S.A. Fuente: Rímac S.A

¿En cuál de las dos plantas el número de accidentes presenta mayor homogeneidad? Justifique su
respuesta.

Solución

Se obtiene con las opciones de la calculadora:

La media y desviación estándar para la planta A es:


96
Estadística Aplicada I 2022 01

0 ×10+ 1× 15+2× 30+3 ×35+ 4 ×10


x A= =2,2
100

s A =1,1282

La media y desviación estándar para la planta B es:

0 × 15+1× 10+2× 35+3 ×25+ 4 ×15


xB = =2,15
100

s B=1,2422

El coeficiente de variación para la planta A es:

sA
CV A= × 100 %
xA

1,1282
¿ ×100 %=51,28 %
2,2

El coeficiente de variación para la planta B es:

sB
CV B = ×100 %
xB

1,2422
¿ ×100 %=57,78 %
2,15

Se observa que en la planta A, el coeficiente de variación es menor, por lo tanto, en esta planta existe
mayor homogeneidad en el número de accidentes.
97
Estadística Aplicada I 2022 01

Ejercicios

54. A continuación, se presentan los tiempos de transmisión de un archivo, en segundos, evaluados


en empresas que adoptaron la tecnología A y la tecnología B bajo condiciones similares.

Tecnología A 138 126 125 124 119 119 137 110 119 155
Tecnología B 130 126 129 130 127 129 132 128 124 132

Determine con cuál de las dos tecnologías, los tiempos de transmisión de un archivo son más
homogéneos.

55. La empresa Electro S.A. dedicada a la venta de artefactos electrónicos para el hogar, opera 200
tiendas en diferentes lugares del país. Los últimos informes indican que las ventas semanales
han descendido a tal punto que se han tenido que cerrar algunas tiendas. El gerente, con el fin
de enfrentar el problema, ha determinado que es necesario un estudio estadístico de las ventas
semanales (en miles de unidades) de un producto electrónico en dos de sus principales tiendas:
Cesca y Risco. Las muestras tomadas al azar de cada tienda arrojaron los siguientes datos:

Ventas en Cesca (miles de unidades) Ventas en Risco (miles de unidades)


50 55
55 48
42 44
40 40
38 38
39 42
44 58
Fuente: Electro S.A.

Determine en cuál de las tiendas las ventas realizadas son más homogéneas.

56. Se tiene tres marcas de bombillas A, B y C. Se presenta a continuación la duración (en días)
registrada de cierto número de bombillas de cada marca.

Marca A: duración registrada en días: 5; 10; 12; 13; 18

Marca B Marca C
Duración (días) Número de bombillas Duración (días) Número de bombillas
3 2 [0 – 5] 4
11 4 ]5 – 10] 8
15 3 ]10 – 15] 12
20 1 ]15 – 20] 2
Fuente: Electro S.A. Fuente: Electro S.A.

¿Qué marca compraría usted y por qué? Sustente su respuesta a base del análisis de las medidas
de dispersión de los datos presentados.

57. El ingeniero de control de calidad de la fábrica de cobre R&J, por las constantes quejas que
recibe sobre la longitud de dichas láminas decide comparar las longitudes de las láminas en dos
98
Estadística Aplicada I 2022 01

turnos existentes. A continuación, se presenta la longitud de las láminas tomadas al azar en


cada turno.

Tarde
290 290 290 290 291 293 294 295 295 298 298 300 304 305 306

Noche
282 286 296 296 297 298 298 300 301 304 306 310 310 310 311

¿En cuál de los dos turnos hay más variación?

58. El jefe de cuadrillas de operarios de la empresa de agua y alcantarillado Emapa S.A. supervisa la
reparación de la red pública y domiciliaria. El jefe afirma que hay mayor heterogeneidad en el
tiempo efectivo de reparación en la red domiciliaria, si esa afirmación se comprueba, se tendrá
que convocar más trabajadores para reparar esa red. Para analizar la situación se muestra la
siguiente información:

Distribución de registros de quejas según el tiempo efectivo de reparación


Red
Tiempo efectivo Red pública
domiciliaria
Marca de clase
Límite
Límite superior fi hi fi hi
inferior
9,02 9,57 9,295 9 0,15 3 0,06
9,57 10,12 9,845 3 0,05 12 0,24
10,12 10,67 10,395 12 0,20 5 0,10
10,67 11,22 10,945 15 0,25 6 0,12
11,22 11,77 11,495 15 0,25 14 0,28
11,77 12,32 12,045 6 0,10 10 0,20
Total 60 1 50 1
Fuente: Emapa S.A.

¿Deberá el jefe de cuadrillas convocar más trabajadores?

59. El jefe de producción de la empresa A debe decidir qué tipo de proveedor abastecerá a la
empresa de placas de un material necesario para la producción. En general, las placas de los
materiales ofrecidos por ambos proveedores son muy similares en precio y en casi todas las
características físicas estudiadas salvo en el de resistencia a la tracción, característica en la que
se concentraron las pruebas. A mayor resistencia a la tracción del material, mejor es su calidad.
Las pruebas de resistencia a la tracción (en kilogramos) de algunas placas de materiales de
ambos proveedores se muestra en la siguiente tabla resumida:

Distribución de placas de materiales según resistencia a la tracción y tipo de proveedor


Proveedor A Proveedor B
Intervalo
fi hi fi hi
[1,5 - 2,0] 2 0,050 2 0,029
]2,0 - 2,5] 1 0,025 10 0,143
]2,5 - 3,0] 4 0,100 16 0,229
]3,0 - 3,5] 15 0,375 24 0,343
]3,5 - 4,0] 10 0,250 12 0,171
Fuente: Empresa A S.A.
99
Estadística Aplicada I 2022 01

¿Qué proveedor es más homogéneo a la resistencia a la tracción?


100
Estadística Aplicada I 2022 01

Rango intercuartil

Es la diferencia entre el tercer y primer cuartil.

Cálculo del rango intercuartil

Rangointercuartil=RIC=Q3 −Q1=P75 −P25

25% 50% 25%


P25 P75

Características del rango intercuartil

 Se puede calcular en variables medidas en escala de intervalo o razón.


 No se ve afectado por valores extremos.

Nota
Si la pregunta es “comparar variabilidad” se calcula coeficiente de variación.
Si la pregunta es “comparar variabilidad en el 50% central” se calcula el rango intercuartil.
101
Estadística Aplicada I 2022 01

Ejercicios

60. Los siguientes datos corresponden a las mediciones de la emisión diaria (en toneladas) de óxido
de azufre de una planta industrial.

7,7 9,4 11,0 11,2 13,9 15,2 15,8 17,3 18,5 20 22,7 23,9 24,5 26,4

Calcule e interprete el rango intercuartil.

61. Covisa es una empresa de construcción civil, compra actualmente los ladrillos al proveedor FAX
S.A. Para continuar con el proveedor o cambiarlo, ha decidido realizar un análisis de la
resistencia transversal de los ladrillos, en Mn/m 2. A continuación, se presenta los resultados de
una muestra de 27 ladrillos fabricados por el proveedor.

3 4 4 4 5 5 6 8 8
8 8 8 9 9 11 11 11 11
11 12 13 13 14 15 15 17 17

La empresa decidirá cambiar de proveedor, si la dispersión en el 50% de los datos centrales


(valor del RIC) es superior a 5 Mn/m². Con los datos proporcionados ¿qué decisión deberá
tomar la empresa?
P75 = 13
P25 = 6
RIC = P75 – P25 = 13 – 6 = 7 Mn/m².
De acuerdo a los resultados obtenidos, la empresa sí decidirá cambiar de proveedor, por que
es mayor a 5 Mn/m².

62. Cuando se diseña un puente los ingenieros deben determinar la tensión que el concreto puede
soportar. En lugar de probar cada pulgada cúbica de concreto para determinar su capacidad de
resistencia, los ingenieros toman una muestra, la prueban y llegan a la conclusión sobre qué
tanta tensión, en promedio, puede resistir este tipo de concreto. A continuación, se presenta la
tensión (en kg/cm2) obtenidos de una muestra aleatoria de 20 bloques de concreto que se
utilizarán para construir un puente.

1,2 2,1 2,2 2,2 2,5 2,5 2,6 2,6 2,7 2,8
3,0 3,0 3,2 3,2 3,2 3,4 3,4 3,5 3,5 3,6

Calcule la dispersión del 50% central de los datos.


102
Estadística Aplicada I 2022 01

Diagrama de cajas

El diagrama de cajas o box plot es una gráfica que describe la distribución de un conjunto de datos
tomando como referencia los valores de los cuartiles como medida de posición y el valor del rango
intercuartil como medida de referencia de dispersión.

Valor atípico
Es un dato inusualmente grande o pequeño con respecto a los otros datos.
Se considera valor atípico a cualquier punto mayor al límite superior (a la derecha) o menor al límite
inferior (o a la izquierda); es decir, que se encuentre fuera de los límites.
Un valor atípico aparece cuando:

 Hay un elemento extraño en la muestra.

 Hay un error de ingreso en los datos.

Edad de un perro, en años 1 1 3 30 6 8 12

 El registro es correcto pero es un caso poco común.

Pasos para trazar un diagrama de cajas


1. Dibuje el eje vertical, eje horizontal, título, rótulos de los ejes y fuente. La variable 1
(cuantitativa) se representa en el eje vertical y la variable 2 en el eje horizontal.

Distribución de unidades elementales según variable 1 por variable 2


Variable 1 (Cuantitativa)
Unidad de medición

Categoría 1 Categoría 2 Categoría 3

Fuente: Variable 2
103
Estadística Aplicada I 2022 01

2. Trace un rectángulo con los extremos del percentil 25 y percentil 75, en cada categoría. En la caja
trace una recta horizontal en el lugar del percentil 50.

Distribución de unidades elementales según variable 1 por variable 2

Variable 1 (Cuantitativa)
Unidad de medición

Categoría 1 Categoría 2 Categoría 3


Fuente: Variable 2

3. Ubique los límites inferior y supeRior mediante el rango intercuartil, el límite superior está a 1,5
RIC arriba del P75, mientras que, el límite inferior está a 1,5 RIC debajo del P25.

o Trace los bigotes desde los extremos de las cajas hasta los valores mínimo y máximo dentro
de los límites inferior y superior.

o Marque con asteriscos (*) las localizaciones de los valores atípicos.

Distribución de unidades elementales según variable 1 por variable 2

*
Variable 1 (Cuantitativa)
Unidad de medición

*
Categoría 1 Categoría 2 Categoría 3
Fuente: Variable 2
104
Estadística Aplicada I 2022 01

En el diagrama de cajas, también se puede poner las categorías en el eje vertical, con lo que
las cajas y los bigotes estarán de forma horizontal.

Distribución de unidades elementales según variable 1


por variable 2

Categoría 1

*
Categoría 2
Variable 2
Categoría 3

Variable 1 (Cuantitativa)
Fuente: Unidad de medición
105
Estadística Aplicada I 2022 01

En la construcción del diagrama de cajas se pueden presentar dos casos, cuando el valor mínimo o
máximo son valores atípicos.

Caso 1: Cuando el valor mínimo es un valor atípico

Si el valor mínimo es un valor atípico, entonces el bigote debe llegar hasta el dato siguiente al valor
mínimo, considerando a este valor como nuevo valor mínimo.

Por ejemplo, si el límite inferior Li=1,7 ; el percentil 25 P25 =3,5 y los datos son:

1,5 1,8 2,2 3,4 4,2 … … … 5,8 6,7

Entonces:

3,5 Percentil 25
Bigote inferior

Valor mínimo dentro de los límites 1,8


Límite inferior = 1,7
Valor atípico 1,5
*

Caso 2: Cuando el valor máximo es un valor atípico

Si el valor máximo es un valor atípico, entonces el bigote debe llegar hasta el dato anterior al valor
máximo, considerando a este valor como nuevo valor máximo.

Por ejemplo, si el límite superior Ls =6,2 ,; el percentil 75 P75=3,8 y los datos son:

1,5 1,8 2,2 3,4 4,2 … … … 5,8 6,7

Entonces:

*
Valor atípico 6,7
Límite superior = 6,2
Valor máximo dentro de los límites 5,8

Bigote superior
3,8 Percentil 75
106
Estadística Aplicada I 2022 01

Interpretación de un diagrama de cajas

El diagrama de cajas permite:

 Comparar los cuartiles de dos o más conjuntos de datos.


 Comparar el rango de dos o más conjuntos de datos.
 Comparar el rango intercuartil de dos o más conjuntos de datos.
 Observar el tipo de distribución de los datos.
 Observar el tipo de distribución de los datos en el 50% central.
 Identificar la presencia de valores atípicos.
 Identificar los valores mínimos y máximos.

Distribución de elementos según variable cuantitativa por variable cualitativa

Valor atípico *
P75 *
P50
Variable cuantitativa

Máximo
P25
Rango Asimetría

RIC
Asimetría en el
50% central
Valor atípico
*
Mínimo

Categoría A Categoría B Categoría C

Variable cualitativa
Fuente: ...
107
Estadística Aplicada I 2022 01

Ejemplo 38
Tentel S.A. desea comparar el tiempo de conexión a Internet en los teléfonos celulares de sus
clientes de acuerdo con sus dos principales usos: Facebook y WhatsApp. Para llevar a cabo la
comparación se desea elaborar un diagrama de cajas. Complete la gráfica:

Distribución de clientes según tiempo en Internet por tipo de uso


140
129 *
120 118
Tiempo en Internet (minutos)

100
90
80
68.25
63
60
54 57.00
40
33.25
20 24
15
0
Facebook WhatsApp

Fuente: Telnet S.A. Tipo de uso de Internet

a. Complete la gráfica con el diagrama de cajas del tiempo de uso del WhatsApp. Utilice los
siguientes datos:

24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132

b. En el 50% central, la distribución del tiempo de uso del Facebook, indique el tipo de asimetría.
c. En el 50% central, ¿qué tiempos de uso son más homogéneos?
d. ¿Los tiempos de uso del WhatsApp tiene valor atípico? Si fuera así, ¿cuál es el valor?

Solución

a. Complete la gráfica con el diagrama de cajas del tiempo de uso del WhatsApp.

Solución
Calculamos los percentiles 25, 50 y 75 con los datos de los tiempos de los clientes que usan el
WhatsApp.

La posición del percentil 25 es:

k × ( n+ 1 ) 25 × ( 16+1 )
i= = =4,25
100 100

El cálculo del percentil 25 es:

Pk = X [ E ] +0 , d ( X [ E +1] − X [ E] )
108
Estadística Aplicada I 2022 01

P25 =X [ 4 ] + 0,25 ( X [ 4+1 ] −X [ 4] )=33+0,25 × ( 34−33 )=33,25

24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132

La posición del percentil 50 es:

k × ( n+ 1 ) 50 × ( 16+1 )
i= = =8,5
100 100

El cálculo del percentil 50 es:

P50=X [ 8 ] +0,5 ( X [ 8+1 ] −X [ 8] )=53+ 0,5×(61−53)=57

24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132

La posición del percentil 75 es:

k × ( n+ 1 ) 75 × ( 16+1 )
i= = =12,75
100 100

El cálculo del percentil 75 es:

P75=X [ 12] + 0,75 ( X [ 12+1 ] −X [ 12] ) =66+ 0,75× ( 69−66 )=68,25

24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132

El rango intercuartil es:

RIC=P75−P25=68,25−33,25=35
 
El límite inferior es:

L í miteinferior=P25 −1,5 RIC=33 , 25−1 , 5 ×35=−19 ,25

El límite superior es:

L í mite superior=P75 +1,5 RIC=68 ,25+ 1, 5 ×35=120 ,75


 
El extremo del bigote inferior = 24, pues el limite inferior es -19,25.

24 30 30 33 34 38 49 53
109
Estadística Aplicada I 2022 01

61 62 62 66 69 90 118 132

El extremo del bigote superior = 118, pues el límite superior es 120,75 y, por tanto, el máximo de
los valores dentro los límites es 118. El valor 132 será un valor atípico.

24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132

Luego, completamos el diagrama de cajas.

Distribución de clientes según tiempo en Internet por tipo de uso


140
129 *
120 118
Tiempo en Internet (minutos)

100
90
80
68.25
63
60
54 57.00
40
33.25
20 24
15
0
Facebook WhatsApp

Fuente: Telnet S.A. Tipo de uso de Internet

Solución
b. En el 50% central, la distribución del tiempo de uso del Facebook tiene asimetría positiva.
c. En el 50% central, son más homogéneos con el uso del WhatsApp, pues su rango intercuaril es 35
minuntos es menor que el rango intercuartil del uso de Facebook que es de 36 minutos.
d. El valor 132 de los tiempos de uso del WhatsApp es un valor atípico, pues está fuera de los
límites.
110
Estadística Aplicada I 2022 01

Ejercicios

63. Un ingeniero eléctrico está realizando una investigación acerca de la duración de los focos
eléctricos fabricado por dos empresas, para ello ha recolectado dos muestras aleatorias con
datos correspondientes a la duración (en horas) de una muestra de 40 focos de 100 watts
producidos por la empresa Alfa y una muestra de 40 focos de 100 watts producidos por la
empresa Gamma.

Empresa Alfa Empresa Gamma


684 697 720 773 821 819 836 888 897 903
831 835 848 852 852 907 912 918 942 943
859 860 868 870 876 952 959 962 986 992
893 899 905 909 911 994 1004 1005 1007 1015
922 924 926 926 938 1016 1018 1020 1022 1034
939 943 946 954 971 1038 1072 1077 1077 1082
972 977 984 1005 1014 1096 1100 1113 1113 1116
1016 1041 1052 1080 1093 1153 1154 1174 1188 1230

El ingeniero afirma que las duraciones de los focos fabricados por la empresa Alfa están
concentrados en valores altos y las duraciones de los focos fabricados por la empresa Gamma
están concentrados en valores bajos, y por lo tanto los focos fabricados por Alfa son más
confiables.
¿Serán confiables los focos fabricados por Alfa? Utilice dimensiones para su solución. Complete
el diagrama de cajas.

COMPROBAR:
empresa Alfa están concentrados en valores altos Q3 – Q2 < Q2 – Q1 Asimetría Negativa
111
Estadística Aplicada I 2022 01

Q3 – Q2 = 971,75 – 916,50 = 55,25


Q2 – Q1 = 916,50 – 853,75 = 62,75
Se cumple que Q3 – Q2 < Q2 – Q1 por lo tanto, los datos de la empresa Alfa están
concentrados en valores altos - Asimetría Negativa.

empresa Gamma están concentrados en valores bajos, Q3 – Q2 > Q2 – Q1 Asimetría Positiva


Q3 – Q2 = 1092,50 – 1015,50 = 77
Q2 – Q1 = 1015,50 – 945,25 = 70,25
Se cumple que Q3 – Q2 > Q2 – Q1 por lo tanto, los datos de la empresa Gamma están
concentrados en valores bajos - Asimetría Positiva.

Como los datos de Alfa están concentrados en valores altos, serán más confiables los focos
fabricados por Alfa.

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para elegir las Habilidad Habilidad de Habilidad de
identificar el herramientas para analizar, comunicar y
problema a estadísticas que usará calcular y entender e sustentar la decisión
resolver. para resolver el obtener los interpretar final en base a los
problema. Identificar las resultados. los resultados y el
variables involucradas en resultados análisis.
el estudio.

64. La empresa Tricon realiza un estudio sobre el tiempo de espera en las obras. Considera que esta
variable es necesaria pues el concreto premezclado tiene un tiempo de vida de
aproximadamente tres horas. A continuación, se presentan los datos de los tiempos de espera,
en minutos, de las 45 obras a las cuales se envió el concreto premezclado desde la planta de los
Olivos:

23 34 37 38 41 43 44 46 47 48 49 49 51 51 52
53 54 55 57 58 58 58 58 59 59 60 60 60 60 61
62 62 62 63 63 63 64 65 70 73 74 76 78 88 89

También se presenta el diagrama de cajas de los tiempos de espera (en minutos) para las
plantas de Lurín y Callao, desde donde se envía el concreto premezclado.
112
Estadística Aplicada I 2022 01

TiempoDistribución
de esperadedel
obras según tiempo
concreto de espera por
premezclado porplanta
planta
( en minutos) *89
Tiempos de espera, 80
en minutos *88
74 78

70 67

63
60 58 56.75 58
53
Datos

50 49.5 49

40 39 39,25

34
30

23 25 *23
20
LURIN CALLAO OLIVOS

Fuente: Tricon S.A. Planta

a. Complete con el diagrama de cajas de la planta de los Olivos.


P25 = 49
P75 = 63
RIC = 63 – 49 = 14
LÍMITE INFERIOR = Q1 – 1,5 * RIC = 49 – 1,5 * 14 = 28
LÍMITE SUPERIOR = Q3 + 1,5 * RIC = 63 + 1,5 * 14 = 84

b. En las obras abastecidas desde la planta de los Olivos, indique los datos atípicos, si existen.
En los Olivos, si existen datos atípicos: 23, 88 y 89

c. Respecto al 50% de los datos centrales del tiempo de espera, ¿cuál de las plantas presenta
mayor dispersión?
RIC (LURIN) = 58 – 39 = 19
RIC (CALLAO) = 56,75 – 39,25 = 17,5
RIC (OLIVOS) = 63 – 49 = 14
La planta que presenta mayor dispersión respecto al 50% de los datos centrales del tiempo
de espera es LURIN.

d. ¿Qué planta tiene un mayor valor mediano?


La planta que tiene un mayor valor mediano es Los Olivos.
113
Estadística Aplicada I 2022 01

Medidas de asimetría
Las medidas de asimetría permiten determinar la forma de una distribución para un conjunto de
datos.

 Si los datos se distribuyen con igual frecuencia y alejados por debajo y por encima de la media, se
dice que la distribución es simétrica.
 Si los datos que son menores a la media son más frecuentes que aquellos por encima de la media
o viceversa, se dice que la distribución es asimétrica.
 Si la distribución es asimétrica positiva; existe mayor concentración de valores a la izquierda de la
media.
 Si la distribución es asimétrica negativa; existe mayor concentración de valores a la derecha de la
media.

Coeficiente de asimetría de Pearson

El coeficiente de asimetría de Pearson se define como:

3 ( x−me )
As=
s

Se tiene que:

Asimetría negativa Asimetría positiva As


Simetría As = 0
As < 0 (cola izquierda) > 0 (cola derecha)

 Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una
concentración de datos en los valores altos.
 Si un grupo de datos tiene un coeficiente de asimetría nulo, esto significa que hay una
concentración de datos alrededor de la media.
 Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
concentración de datos en los valores bajos.
114
Estadística Aplicada I 2022 01

Ejemplo 39

Se tomó una muestra aleatoria de seis piezas de engranaje de un almacén para ser utilizados en
maquinarias industriales y se calculó los siguientes estadísticos para la variable antigüedad en años,
los resultados fueron los siguientes:

14 15 16 16 20 21

¿Qué tipo de asimetría presenta la variable antigüedad? ¿Qué significa?

Solución

Primero, calculemos la media y la desviación estándar muestral.

x=17

me=16

s=2,8284

Luego, calculemos el coeficiente de asimetría.

3 ( x−me )
As=
s

3 ( 17−16 )
As=
2,8284

As=1,0607

Como el As > 0, entonces existe asimetría positiva, por lo que la concentración de la antigüedad de
las piezas de engranaje se encuentra en los valores bajos.

Ejemplo 40
Los siguientes datos corresponden a la distribución del número de piezas defectuosas producidas en
una muestra aleatoria de 30 días.

Número de piezas defectuosas x i fi


3 6
4 8
5 12
6 3
7 1
Total 30
Fuente: Empresa A

Calcule e interprete el coeficiente de asimetría.


115
Estadística Aplicada I 2022 01

Solución

Primero, calculemos la media y la desviación estándar muestral.

x=4,5

me=5

s=1,0422

Luego, calculemos el coeficiente de asimetría.

3 ( x−me ) 3 ( 4,5−5 )
As= =
s 1,0422

As=−1,4393

Como el As<0 , entonces existe asimetría negativa, por lo que la concentración del número de piezas
defectuosas se encuentra en los valores altos.

Distribución de días según número de piezas defectuosas


0.45
0.40
0.40

0.35
Frecuencia relativa

0.30 0.27
0.25
0.20
0.20

0.15
0.10
0.10
0.03
0.05

0.00
2.5 3 3.5 4 4.5 5 5.5 6 6.5 7 7.5

Fuente: Empresa A Número de piezas defectuosas


116
Estadística Aplicada I 2022 01

Ejercicios

65. Con base en un célebre experimento, Henry Cavendish (1731 -1810) ofreció evidencias directas
de la ley de la gravitación universal de Newton. En el experimento se determinó el peso de
masas de objetos, la medida de la fuerza de atracción se usó para calcular la densidad de la
Tierra. Los valores de la densidad de la Tierra, en orden temporal por filas son:

5,1 5,27 5,29 5,29 5,3 5,34 5,34 5,36 5,39 5,42 5,44 5,46
5,47 5,53 5,57 5,58 5,62 5,63 5,65 5,68 5,75 5,79 5,85 5,82

Calcule e interprete la asimetría para la variable en estudio.

66. Cuando se diseña un puente los ingenieros deben determinar la tensión que el concreto puede
soportar. En lugar de probar cada pulgada cúbica de concreto para determinar su capacidad de
resistencia, los ingenieros toman una muestra al azar, la prueban y llegan a la conclusión sobre
qué tanta tensión, en promedio, puede resistir este tipo de concreto. A continuación, se
presenta la tensión (en kg/cm 2) obtenidos de una muestra al azar de 30 bloques de concreto
que se utilizarán para construir un puente:

1,2 2,1 2,2 2,2 2,5 2,5 2,6 2,6 2,7 2,8 3,0 3,0 3,2 3,2 3,2
3,4 3,4 3,5 3,5 3,6 3,6 3,6 3,6 3,7 3,8 3,9 3,9 4,0 4,0 4,0

Calcule e interprete el coeficiente de asimetría para la variable en estudio.

67. Se ha llevado a cabo un estudio para evaluar el tiempo, en horas, que utiliza cada trabajador de
una planta hidroeléctrica para verificar el normal funcionamiento de la tubería de presión y las
válvulas de control. Para ello se eligieron al azar 18 de ellos tal como se muestra a continuación:

0,11 0,16 0,25 0,71 0,75 0,82 0,84 0,92 0,96


1,16 1,17 1,19 1,23 1,4 1,47 1,59 1,61 2,01

Calcule e interprete el coeficiente de asimetría para la variable en estudio.

68. El jefe de Recursos Humanos desea información de la cantidad de faltas que han tenido los
trabajadores en el mes anterior. Por tal razón seleccionó al azar a 40 trabajadores y registró el
número de faltas.

Distribución de trabajadores según número de faltas


Número de faltas fi
0 4
1 8
2 10
3 11
4 7
Total 40
Fuente: Recursos Humanos

Calcule e interprete la asimetría para la variable en estudio.


117
Estadística Aplicada I 2022 01

69. El jefe de producción de una planta industrial está evaluando el tiempo de producción de las
piezas de telas, en minutos. Él afirma que la mayor concentración de los tiempos de producción
se podría encontrar en los valores altos. Si fuera correcta tal afirmación se tendría que realizar
mantenimiento a las maquinas tejedoras. Para tal propósito ha seleccionado una muestra
aleatoria de 16 piezas de telas, los datos se muestran a continuación:

3 4 4 4 5 5 6 6 8 8 8 8 8 9 9 9

¿Se tendrá que realizar mantenimiento a las máquinas tejedoras?

70. Investigadores del Massachussets Institute of Technology (MIT) realizaron, el 9 de abril de 1993,
un estudio sobre asteroides. Al observar 53 de estos asteroides con el telescopio Hiltner del
observatorio de MIT; se registró el número de exposiciones de imagen espectral.

Distribución de asteroides según número de exposiciones de imagen espectral


Número de exposiciones fi
1 4
2 8
3 12
4 16
6 13
Total 53
Fuente: Massachusetts Institute of Technology (MIT)

Calcule e interprete la asimetría para la variable en estudio.

71. La siguiente información muestra el número de ladrillos defectuosos fabricados diariamente en


una de las plantas de la empresa Rex S.A. Se tomó una muestra aleatoria de 50 días
mostrándose los resultados a continuación:

Distribución de días según número de ladrillos defectuosos


Número de ladrillos defectuosos fi
0 12
1 12
2 8
3 10
4 8
Total 50

Fuente: Ladrillera Rex

Calcule e interprete el coeficiente de asimetría para la variable en estudio.


118
Estadística Aplicada I 2022 01

Unidad 2. Aplicaciones de
distribuciones de probabilidad

Logro

Al término de la unidad, el estudiante utiliza las distribuciones de probabilidad para modelar


variables dentro de situaciones de incertidumbre en contextos reales.

Temario

-Probabilidad: concepto, experimento aleatorio, espacio muestral y evento. Operaciones con


eventos.
-Probabilidad de eventos.
-Probabilidad condicional.
-Probabilidad total.
-Teorema de Bayes.
-Definición de variable aleatoria discreta y continua.
-Función de probabilidad de una variable aleatoria discreta
119
Estadística Aplicada I 2022 01

Conceptos

Experimento aleatorio
Es un proceso que, al ser realizado u observado repetidas veces, bajo las mismas condiciones, genera
más de un posible resultado que no puede ser determinado de antemano. Se denota por ε.

Ejemplo 41

ε 1Lanzamiento de un dado
ε 2Traslado de productos de un almacén al centro de distribución
ε 3Selección de un producto para la inspección de calidad
ε 4Registrar el tiempo de vida de un celular en meses

Espacio muestral
Es el conjunto de todos los posibles resultados de un experimento aleatorio. Se le suele simbolizar
como S.

Ejemplo 42

• Si lanzamos un dado y anotamos el número que muestra la cara superior, entonces el espacio
muestral es:
S= { 1, 2 ,3 , 4 , 5 ,6 }

• Si trasladamos productos de un almacén al centro de distribución y anotamos el tiempo de


traslado en minutos, el espacio muestral es:
S= { t/t >0 }
donde t es el tiempo de traslado.

• Si seleccionamos un producto para la inspección, el espacio muestral es:


S= { defectuoso , no defectuoso }

• Si registramos el tiempo de vida de un celular y anotamos el tiempo en meses, el espacio


muestral es:
S= { t/ t >0 }
donde t es el tiempo de vida del celular en meses.

Evento
También denominado suceso. Un evento es cada tipo posible de ocurrencia o conjunto de
ocurrencias del experimento  estudiado, es decir, un evento es cualquier subconjunto del espacio
muestral S asociado al experimento. Se le suele simbolizar con cualquier letra mayúscula.
120
Estadística Aplicada I 2022 01

Ejemplo 43

En el caso de lanzar un dado, algunos eventos son:

A={1 }
B={2 , 4 , 6 }

En el caso del traslado de productos de un almacén al centro de distribución, el tiempo registrado en


minutos, algunos eventos son:

C={t / 0<t ≤7 }
D={t /t ≥ 4 }

En el caso de seleccionar un producto para la inspección de calidad, algunos eventos son:

E={ Defectuoso }
F={No defectuoso }

Evento simple
Es un evento definido por una sola característica.

Ejemplo 44

En el caso de lanzar un dado, algunos eventos simples son:

A={1 }

B={4 }

En el caso del traslado de productos de un almacén al centro de distribución se registra el tiempo en


minutos, algunos eventos:

C={t /0<t ≤7 }

D={t /t ≥ 4 }

Evento compuesto
Evento definido por dos o más características. También se le denomina evento compuesto.

Ejemplo 45

En el caso de lanzar un dado, un evento conjunto es:

A={ par y menor que 5 }

En el caso del traslado de productos de un almacén al centro de distribución donde se registra el


tiempo en minutos, un evento compuesto es:
121
Estadística Aplicada I 2022 01

C={t / t 4 ∧t 7 }
122
Estadística Aplicada I 2022 01

Ejemplo 46

Complete el siguiente cuadro.

Experimento Espacio muestral Evento

Se lanza un dado. S= { 1, 2 ,3 , 4 , 5 ,6 } A={ 2 ,3 , 4 }

{ }
( f , f , f ) ; ( f , m, f ) ;
Si se observan los sexos de tres niños S= ( f , f , m ) ; ( f , m, m ) ; A={ m, f , f }
recién nacidos ( m , f , f ) ; ( m, m , f ) ;
( m , f , m ) ; ( m , m, m )
De un lote de ocho dispositivos
electrónicos, se registra el número de S= { 0 ,1 , 2 ,3 , 4 ,5 ,6 , 7 , 8 } A={ 0 , 1, 2 ,3 }
artículos defectuosos.
De un lote de dos dispositivos
electrónicos, se registra la condición
S= { ( d ,nd ) ; ( d , d ) ; ( nd , d ) ; ( nd , nd ) } A={ ( d , nd ) }
del artículo {defectuoso, no
defectuoso}.

Complemento de un evento
Para un evento A cualquiera se define su complemento AC como el evento consistente en todos los
puntos de S que no están en A . Se tiene que:

c
P( A )=1−P ( A )
c
A se expresa como: “El evento A no ocurre”.

Ac

Ejemplo 47

En el caso de lanzar un dado; si


A={ 2 , 4 }

entonces
A = {1 , 3 , 5 ,6 }
c
123
Estadística Aplicada I 2022 01
124
Estadística Aplicada I 2022 01

Eventos mutuamente excluyentes


Si los eventos no pueden ocurrir al mismo tiempo, es decir, la ocurrencia de un evento excluye la
ocurrencia de otro evento.

A B

Ejemplo 48

En el caso de lanzar un dado, si:


A={2 , 4 }

B={1, 3 }

Los eventos A y B son mutuamente excluyentes pues son disjuntos, si ocurre A necesariamente no
ocurre B.

En el caso del traslado de productos de un almacén al centro de distribución, si:

C={t / t ≤ 4 }

D={t /t >7 }

Los eventos C y D son mutuamente excluyentes pues si ocurre C necesariamente no ocurre D.

Eventos independientes

Son aquellos eventos en los que la ocurrencia de un evento no influye en la ocurrencia de otro o de
otros eventos.

Ejemplo 49

Un sistema está conformado por tres componentes que funcionan independientemente. Sean los
siguientes eventos:

A = {El primer componente funciona correctamente}


B = {El segundo componente funciona correctamente}
C = {El tercer componente no funciona correctamente}
125
Estadística Aplicada I 2022 01

Análisis combinatorio

Principio de la multiplicación
El número de resultados posibles de k 1 eventos en el primer intento, k 2 eventos en el segundo
intento, . . . , k n eventos en el n-ésimo intento.

También es el número de resultados posibles si una operación puede realizarse de k 1 formas y por
cada una de éstas una segunda operación se puede realizar de k 2 formas, ... y la n-ésima operación
se puede realizar de k n formas.

k 1 × k 2 × k 3 ×⋯ × k n

Ejemplo 50

Un producto se arma en tres etapas, para la primera etapa se tienen disponibles cinco líneas de
armado, para la segunda cuatro y para la tercera seis ¿de cuántas maneras distintas se puede armar
el producto?

Etapa I Etapa II Etapa III


5 4 6

Solución
Por la regla de multiplicación un producto se puede armar de 5 x 4 x 6 = 120 formas

Principio de la adición
El número de formas posibles de realizar alguna de n operaciones si una operación puede realizarse
de k 1 formas, una segunda operación se puede realizar de k 2 formas, ... y la n-ésima operación se
puede realizar de k n formas y además todas las operaciones son mutuamente excluyentes.

k 1+ k 2+ k 3 +⋯ +k n

Ejemplo 51

Una persona puede viajar de una ciudad a otra por carretera de tres formas y por tren de dos formas.
¿De cuántas formas puede viajar la persona de una ciudad a otra?

Carretera Tren
3 2

Solución
Por la regla de la adición se puede viajar de 3 + 2 = 5 maneras.
126
Estadística Aplicada I 2022 01

Reglas de conteo

Permutaciones
El número de formas en que n objetos distinguibles se pueden ordenar es:

n!

Ejemplo 52

¿De cuántas maneras diferentes se pueden ordenar para su presentación en público a cinco
oradores?

Solución

Del enunciado,

n=5 !=5 × 4 × 3× 2× 1=120

La cantidad de maneras es 120.

Permutaciones
Cualquier secuencia ordenada de r objetos tomados de un conjunto de n objetos distintos se llama
permutación de tamaño r de los objetos. El número de permutaciones de tamaño r que puede
construirse con los n objetos (donde sí importa el orden).

n n!
Pr =
( n−r ) !

Ejemplo 53

Hay 20 personas para formar un comité. ¿De cuántas maneras diferentes se pueden formar un
comité en el que haya un presidente, un tesorero y un secretario?

Solución
En este caso el orden en el que se escogen las personas es importante. Donde n = 30 y r = 3
tenemos:

30 30!
P3 = =24360
( 30−3 ) !

Ejemplo 54

En un campeonato de fútbol participan 12 equipos ¿De cuántas maneras se pueden ocupar los tres
primeros puestos?
127
Estadística Aplicada I 2022 01

Solución
12 12 !
P3 = =1320
( 12−3 ) !

Combinaciones
Es el número de formas de seleccionar r objetos de un total de n objetos distinguibles sin tomar en
cuenta el orden.

n!
C nr =
r ! ( n−r ) !

Ejemplo 55

Hay 30 persona para formar un comité de tres personas. ¿De cuántas formas distintas se puede
formar el comité?

Solución
En este caso el orden con que se escojan las personas carece de importancia y ninguna va ha ser
escogida dos o más veces. Entonces aplicando la regla de combinaciones n = 20 y r = 3 tenemos:

30!
C 30
3 = =4060
3 ! ( 30−3 ) !

Ejemplo 56

Una persona realiza una jugada de la Tinka, que es un juego de lotería que consiste en elegir 6
números de 45 números posibles. ¿De cuántas maneras diferentes puede elegir esa jugada?

Solución

45 45 !
C6 = =8 145 060
6 ! ( 45−6 ) !
128
Estadística Aplicada I 2022 01

Ejercicios

72. El jefe de planta de una empresa embutidos desea efectuar algunas remodelaciones y requiere
los servicios de un distribuidor de maquinas industriales de cocina, de un contratista plomero y
de un contratista electricista. Si, en la zona, hay tres distribuidores de maquinas industriales de
cocina, diez contratistas plomeros y siete contratistas electricistas. ¿De cuántas formas se
pueden seleccionar estos tres servicios?

73. Un producto electrónico se vende en tres mercados. En el primer mercado se tienen disponibles
cinco tiendas, en el segundo cuatro y en el tercer mercado, seis tiendas. ¿De cuántas maneras
puede venderse el producto?

74. Una empresa industrial ha empezado un proyecto que tiene como objetivo incrementar la
capacidad de una de sus plantas en el cono Norte. El proyecto ha sido dividido en dos etapas:
etapa 1 (diseño) y etapa 2 (construcción). La etapa 1 se puede realizar en tres posibles periodos:
2, 3 ó 4 meses y la etapa 2 se puede realizar en 6, 7 u 8 meses. Calcule todas las posibles
maneras de que se realice el proyecto.

75. La empresa A desea contratar un profesional de ingeniería industrial a través de un concurso. Si


a la entrevista se presentan diez profesionales. ¿De cuántas formas distintas se pueden
adjudicar el orden de mérito de los diez profesionales?

76. Una empresa fabricante de electrodomésticos cuenta en su almacén de productos terminados


con un lote de diez refrigeradoras, de las cuales tres de ellas presentan algún tipo de falla. Un
comerciante compra tres de ellas, la empresa hace la elección de las refrigeradoras en forma
aleatoria, se pide determinar lo siguiente:

a. El experimento aleatorio realizado.


b. Indique los elementos del espacio muestral asociado a dicho experimento aleatorio.
c. Calcule la probabilidad que las tres refrigeradoras compradas por el comerciante no tengan
fallas.

77. Se va a programar un torneo de ajedrez para los diez integrantes de un club.

a. Calcule el número de partidos se deben programar si cada integrante jugará con cada uno
de los demás sin partido de revancha.
b. Calcule el número de partidos se deben programar si cada integrante jugará con cada uno
de los demás con partido de revancha.

78. Cinco matrimonios acuden juntos al teatro. El día anterior reservaron por teléfono diez butacas
contiguas en una misma fila. Retiran las entradas y las reparten aleatoriamente entre los diez.

a. Calcular el número de formas en que se pueden sentar las diez personas.


b. Calcular el número de formas en que se pueden sentar las diez personas alternando los
sexos.
c. Calcular el número de formas en que se pueden sentar las diez personas de manera que las
cinco mujeres se sienten juntas.
d. Calcular el número de formas en que se pueden sentar las diez personas de manera que las
cinco mujeres se sienten juntas y también los cinco maridos.

79. Una caja contiene cuatro bombillas de 40W, cinco de 60W y seis de 100W. En una única
extracción.
129
Estadística Aplicada I 2022 01

a. ¿De cuántas maneras se pueden seleccionar tres bombillas de la caja?


b. ¿De cuántas maneras se pueden seleccionar tres bombillas de manera que exactamente dos
de las bombillas sean de 100W?
c. ¿De cuántas maneras se pueden seleccionar tres bombillas de manera que al menos dos de
las bombillas sean de 100W?
d. ¿De cuántas maneras se pueden seleccionar tres bombillas de manera que las tres tengan la
misma potencia?
130
Estadística Aplicada I 2022 01

Concepto de probabilidad
Las decisiones que toma un ingeniero a menudo se basan en un análisis de situaciones como las
siguientes:

 ¿Cuál es la posibilidad de que el nuevo método de ensamble incremente la productividad?


 ¿Qué tan probable es que el proyecto se termine a tiempo?
 ¿Cuál es la posibilidad de que el producto entregado por el proveedor cumpla las
especificaciones técnicas solicitadas?

Probabilidad
La probabilidad es la evaluación numérica de la posibilidad de que un evento ocurra. Los valores de
probabilidad siempre se asignan en una escala de 0 a 1.

0≤ p≤1

Un valor de probabilidad cercano a 0 indica que es muy improbable que ocurra el evento, mientras
que una probabilidad cercana a 1 indica que es casi seguro que ocurra el evento.

El objetivo del cálculo de probabilidades es el obtener un valor numérico asociado con la ocurrencia
de determinado acontecimiento para facilitar la toma de decisiones relacionada con él.

Imposible Improbable Igualmente probable o improbable Probable Seguro


0 0,2 0,5 0,8 1

Definición clásica de probabilidad (a priori)

Sea un experimento aleatorio cuyo correspondiente espacio muestral W está formado por un
número finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces,
definimos la probabilidad de un evento A como sigue:

n(A)
P ( A )=
n (Ω)

donde:

n ( A ) es el número de elementos del evento A


n ( Ω ) es el número de elementos del espacio muestral
131
Estadística Aplicada I 2022 01

Axiomas de probabilidad

En Matemáticas, un axioma es cada uno de los principios indemostrables sobre los que, por medio de
un razonamiento deductivo, se construye una teoría. Los axiomas de probabilidad fueron
establecidos en 1933 cuando Andréi Kolmogórov publicó su libro Los fundamentos de la teoría de la
probabilidad.

Los tres axiomas son los siguinetes:

Sea el espacio muestral S, la probabilidad de un evento A se denota como evento P( A).

P( A) se define como el número que cumple los siguientes axiomas:

Primer axioma

P( A) ≥0 para todo A ∈Ω

Segundo axioma

P( S)=1

Tercer axioma

Sea { Ai } ; i=1 , 2 ,3 … , n una sucesión de eventos mutuamente excluyentes, Ai ∈ S entonces:

P ( A 1 ∪ A 2 ∪ ⋯ ∪ A n )=P( A 1)+ P( A2 )+… P( An )

Teoremas de probabilidad

 Si es el evento vacío, entonces:

P( )=0

 Si A y B son eventos cualesquiera, entonces:

P( A ∪ B)=P( A)+ P(B) – P( A ∩ B)


132
Estadística Aplicada I 2022 01

Operaciones con eventos

Diagramas de Venn

Una primera herramienta muy útil para mostrar la relación entre el espacio muestral y los eventos
que lo componen es el diagrama de Venn (teoría de conjuntos) donde el espacio muestral,
representado por un rectángulo, es el equivalente al conjunto universo y los eventos del espacio
muestral, representados por figuras geométricas cerradas, generalmente por círculos dentro del
rectángulo, equivalen a los conjuntos.

Los diagramas de Venn fueron desarrollados por John Venn 12 (Drypool, 4 de agosto de 1834 -
Cambridge, 4 de abril de 1923), matemático y lógico británico.

Unión de eventos

Para dos eventos A y B, la unión de los eventos A y B expresado como A ∪B es el evento que
contienen todos los puntos de S que pertenecen a A o a B o a ambos.

A B

A ∪B se expresa como: “Al menos uno de los eventos A o B ocurre”.

Intersección de eventos

Para dos eventos A y B, la intersección de los eventos A y B expresado como ( A ∩ B ) es el evento


que contienen todos los puntos de S que pertenecen tanto a A como a B.

A B

A ∩ B se expresa como: “Ambos eventos, A y B ocurren a la vez”.


133
Estadística Aplicada I 2022 01

Diferencia de eventos

Para dos eventos A y B, la diferencia de los eventos A y B es el evento que contienen todos los puntos
de S que pertenecen a A y no pertenecen a B.

A B

A – B se expresa como: “Ocurre el evento A pero no el evento B”.

Diferencia simétrica de eventos


Para dos eventos A y B, la diferencia simétrica de los eventos A y B es el evento que contienen todos
los puntos de S que pertenecen solo a A o aquellos que solo pertenecen a B.

A B

A  B se expresa como: “Ocurre solo uno de los eventos A o B”.


134
Estadística Aplicada I 2022 01

Ejercicios

80. El 30% de los estudiantes en una universidad son limeños, el 10 % estudian ingeniería, el 1%
estudian ingeniería y son limeños. Si se selecciona al azar un estudiante:

a. ¿Cuál es la probabilidad de que sea limeño o no pertenezca a la facultad de ingeniería?


b. ¿Cuál es la probabilidad de que solo sea un estudiante de ingeniería?
c. ¿Cuál es la probabilidad de que no sea limeño?
d. ¿Cuál es la probabilidad de que no sea limeño ni estudiante de ingeniería?
135
Estadística Aplicada I 2022 01

Probabilidad en tablas de contingencias


Además de los diagramas de Venn, una segunda herramienta muy útil en el cálculo de probabilidades
es la tabla de contingencias, sobre todo para mostrar las probabilidades simples y conjuntas, y que
además permite una rápida comprensión de cómo los eventos de un espacio muestral han sido
clasificados mediante dos o más criterios.

Ejemplo 57

Ingenieros de la planta mecánica de la empresa Indumental prueban una nueva técnica de soldadura
de arco. Se muestreo 300 soldaduras, las cuales fueron analizadas y clasificadas según el resultado de
la prueba de apariencia, así como por el resultado de la prueba de inspección de rayos X, tal como se
muestra en la siguiente tabla:

Distribución de soldaduras según apariencia y resultados de inspección de rayos X


Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Normal (Y) 39 63 39 141
Buena (Z) 21 36 27 84
Total 105 120 75 300
Fuente: Indumental S.A.

Se toma al azar una de las soldaduras analizadas.

a. Calcule la probabilidad de tenga resultado normal en ambas pruebas.

Solución

Definamos los eventos necesarios:


N ≔ La prueba de apariencia resulta normal para la soldadura seleccionada.
Y ≔ La prueba de inspección de rayos X resulta normal para la soldadura seleccionada.

La probabilidad pedida es:

63
P ( N ∩Y )= =0,21
300

Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Normal (Y) 39 63 39 141
Buena (Z) 21 36 27 84
Total 105 120 75 300
136
Estadística Aplicada I 2022 01

b. Calcule la probabilidad de que el resultado tenga una apariencia que sea buena.

Solución

Definamos los eventos necesarios:

B≔ La prueba de apariencia resulta buena para la soldadura seleccionada.

La probabilidad pedida es:

75
P ( B )= =0,25
300

Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Normal (Y) 39 63 39 141
Buena (Z) 21 36 27 84
Total 105 120 75 300

c. Calcule la probabilidad de que el resultado en la prueba de inspección de rayos X no sea mala.

Solución

Definamos los eventos necesarios:

c
X ≔ La prueba de inspección de rayos X no resulta mala para la soldadura seleccionada.

La probabilidad pedida es:

P ( X ) =P ( Y )+ P ( Z )
C

141 84
P ( X )=
C
+ =0,75
300 300

Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Normal (Y) 39 63 39 141
Buena (Z) 21 36 27 84
Total 105 120 75 300
137
Estadística Aplicada I 2022 01

d. Calcule la probabilidad de que el resultado en apariencia no resulta malo o el resultado en la


prueba de inspección de rayos X sea buena.

Solución

Definamos los eventos necesarios:

c
M ≔ La prueba de apariencia no resulta mala para la soldadura seleccionada.
Z ≔ La prueba de inspección de rayos X resulta buena para la soldadura seleccionada.

La probabilidad pedida es:

P ( M ∪ Z )=P ( M ) + P ( Z )−P ( M ∩ Z )
C C C

( 120+75 ) 84 ( 36+27 )
P ( M ∪ Z )=
C
+ −
300 300 300

P ( M C ∪ Z )=0,72

Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Normal (Y) 39 63 39 141
Buena (Z) 21 36 27 84
Total 105 120 75 300
138
Estadística Aplicada I 2022 01

Ejercicios

81. La empresa Plast&Cos fabrica placas circulares plásticas de policarbonato, pero últimamente sus
productos han sido devueltos por la baja resistencia encontrada. Por ello, el área de control de
calidad ha seleccionado al azar 300 placas circulares y analizado la resistencia a las rayaduras y a
los impactos. Los resultados se encuentran en la siguiente tabla.

Distribución de placas circulares plásticas de policarbonato


según resistencia a los impactos y resistencia a las rayaduras
Resistencia a los impactos
Resistencia a las rayaduras Total
Alta (A) Media (B) Baja(C)
Alta (D) 68 38 45 151
Media(E) 42 40 16 98
Baja (F) 20 19 12 51
Total 130 97 73 300
Fuente: Plast&Cos S.A.

Se toma al azar una de las placas circulares analizada.

a. Calcule la probabilidad de que su resistencia a las rayaduras y a los impactos sea alta.
Rpta. 0,22667
b. Calcule la probabilidad de que su resistencia a las rayaduras sea media o su resistencia a los
impactos sea baja. Rpta. 0,51667
c. Calcule la probabilidad de que su resistencia a las rayaduras no sea baja o su resistencia a
los impactos sea alta. Rpta. 0,89667

82. Se presenta una tabla donde se resume los pedidos realizados durante el último año clasificado
por tamaño de empresa, ciudad donde se ubica el proveedor y si el pedido sufrió algún retraso.

Distribución de pedidos de madera según tamaño de la empresa, ciudad y retraso del pedido
Tamaño de Pedido con retraso Pedido sin retraso Tota
empresa Pucallpa(P) Ucayali(U) Satipo(T) Pucallpa(P) Ucayali(U) Satipo(T) l
Mediana (A) 5 20 10 30 5 15 85
Pequeña (B) 15 30 15 20 10 15 105
Microempresa (C) 20 40 25 12 3 10 110
Total 40 90 50 62 18 40 300
Fuente: Elaboración propia

Se toma al azar uno de los pedidos analizados:


a. Calcule la probabilidad que el pedido sea de Pucallpa. Rpta. 0,3400
b. Calcule la probabilidad que el pedido tenga retraso o lo haya realizado la pequeña empresa.
c. Si se selecciona al azar un pedido, calcule la probabilidad que el pedido lo haya realizado
una mediana empresa y su ubicación sea en Satipo. Rpta. 0,0833
139
Estadística Aplicada I 2022 01

Probabilidad condicional
Sean los eventos A y B ∈ Ω, entonces la probabilidad de que ocurra el evento A teniendo como
condición que el evento B ya ocurrió, se denomina probabilidad condicional.

P ( A ∩ B)
P ( A /B )=
P (B )

A B

P( A ∩ B) P( B)

Axiomas de probabilidad condicional

Primer axioma

0 ≤ P¿

Segundo axioma

P¿

Tercer axioma

Para k eventos mutuamente excluyentes A1 , A 2 ,… , Ak se tiene que:

k
P(∪i =1 A i /B)=∑ P( Ai ¿ ¿ B ¿ )¿ ¿
k

i=1

Ejemplo 58

En una muestra aleatoria de 30 alumnos de la universidad A los resultados se clasifican por sexo y
por carrera. El resumen de los resultados se muestra en la siguiente tabla:

Distribución de alumnos según sexo y carrera


Sexo
Total
Carrera Femenino (F) Masculino (M)
Ingeniería en Gestión Minera (A) 1 5 6
Ingeniería de Sistema de Información (B) 3 2 5
Ingeniería de Software (C) 2 2 4
Ingeniería en Gestión Empresarial (D) 4 1 5
Ingeniería Industrial (E) 2 8 10
Total 12 18 30
Fuente: Universidad A
140
Estadística Aplicada I 2022 01

Se selecciona un alumno al azar.

a. Si se sabe que es hombre, ¿cuál es la probabilidad de que estudie la carrera de ingeniería de


sistema de información?

Solución

La probabilidad pedida es:

P¿¿

Sexo
Total
Carrera Femenino (F) Masculino (M)
Ingeniería en Gestión Minera (A) 1 5 6
Ingeniería de Sistema de Información (B) 3 2 5
Ingeniería de Software (C) 2 2 4
Ingeniería en Gestión Empresarial (D) 4 1 5
Ingeniería Industrial (E) 2 8 10
Total 12 18 30

b. Si es mujer, ¿cuál es la probabilidad de que estudie la carrera de ingeniería de sistema de


información?

Solución

La probabilidad pedida es:

P¿¿

Sexo
Total
Carrera Femenino (F) Masculino (M)
Ingeniería en Gestión Minera (A) 1 5 6
Ingeniería de Sistema de Información (B) 3 2 5
Ingeniería de Software (C) 2 2 4
Ingeniería en Gestión Empresarial (D) 4 1 5
Ingeniería Industrial (E) 2 8 10
Total 12 18 30
141
Estadística Aplicada I 2022 01

c. ¿Cuál es la probabilidad de que no estudie la carrera de ingeniería industrial, si es hombre?

Solución

La probabilidad pedida es:

P¿¿

Sexo
Total
Carrera Femenino (F) Masculino (M)
Ingeniería en Gestión Minera (A) 1 5 6
Ingeniería de Sistema de Información (B) 3 2 5
Ingeniería de Software (C) 2 2 4
Ingeniería en Gestión Empresarial (D) 4 1 5
Ingeniería Industrial (E) 2 8 10
Total 12 18 30
142
Estadística Aplicada I 2022 01

Ejercicios

83. Un estudio de mejoramiento de la producción del fabricante de semiconductores Indumetal


proporcionó información en una muestra de 530 placas de silicio. La información se presenta en
la siguiente tabla:

Distribución de placas de silicio según condición de troquel y calidad de la placa


Condición del troquel
Sin partículas Cantidad media de Gran cantidad de
Calidad de la placa (S) partículas (C) partículas (G) Total
Regular (R) 40 125 30 195
Buena (B) 35 80 70 185
Mala (M) 25 65 60 150
Total 100 270 160 530
Fuente: Indumental S.A.
Se selecciona una placa de silicio al azar.

a. Si la condición del troquel arroja cantidad media de partículas, ¿cuál es la probabilidad que
la calidad de la placa sea regular? Rpta. 0,46297
b. Si se sabe que la calidad de la placa es buena, ¿cuál es la probabilidad de que el troquel
arroje gran cantidad de partícula? Rpta.
0,37838
c. Dado que la condición del troquel es sin partículas, ¿cuál es la probabilidad de que la
calidad de la placa no sea mala? Rpta.
0,75

84. Flama Gas S. A. es una empresa que fabrica y comercializa termas a gas para uso doméstico e
industrial. La empresa cuenta con dos plantas de producción ubicadas en Ate y Callao. En la
siguiente tabla se muestra información acerca de la producción de termas:

Distribución de termas a gas según ubicación de la planta, tipo de combustible y capacidad


Ubicación Ate (P) Ubicación Callao (Q)
Capacidad Total
Dual (D) GLP (E) GN (F) Dual (D) GLP (E) GN (F)
10 litros (A) 18 2 38 16 4 20 98
14 litros (B) 6 8 6 10 6 18 54
18 litros (C) 10 4 6 14 6 8 48
Total 34 14 50 40 16 46 200
Fuente: Flama Gas S. A

Se selecciona una terma al azar.


a. Calcule la probabilidad que sea de capacidad de 14 litros o que haya sido producida en la
planta de producción del Callao. Rpta. 0,61
b. Calcule la probabilidad que sea de capacidad de 10 litros y que haya sido producida en la
planta de Ate. Rpta. 0,29
c. Calcule la probabilidad que sea de capacidad de 18 litros o que use gas natural.
Rpta. 0,59184
d. Calcule la probabilidad que sea de capacidad 10 litros o de 18 litros. Rpta. 0,73
e. Si se sabe que fue producida en la planta de Ate ¿cuál es la probabilidad que sea de
capacidad de 14 litros?
Rpta. 0,20408
143
Estadística Aplicada I 2022 01

f. Calcule la probabilidad de que la terma utilice gas dual y sea de una capacidad de 10 litros, si
se sabe que ha sido producida en la planta de producción de Ate. Rpta. 0,18367

85. La mayoría de las estaciones de servicio Súper Gas S.A. venden tres tipos de gasolina: 90
octanos, 95 octanos y 97 octanos. Con frecuencia, alguna de cada está enriquecida con un
aditivo. La tabla siguiente ilustra la cantidad de clientes que prefieren cada tipo.

Distribución de clientes según tipo de gasolina y composición del producto


Tipo de combustible
Composición Total
90 octanos (B) 95 octanos (C) 97 octanos (D)
Con aditivo(E) 5 10 25 40
Sin aditivo (F) 15 40 25 80
Total 20 50 50 120
Fuente: Súper Gas S.A.

Se selecciona al azar un cliente que ha comprado uno de estos tipos de gasolina.

a. Calcule la probabilidad que haya comprado gasolina con aditivo o no sea de 95 octanos.
Rpta.
0,66667
b. Si el cliente no compró gasolina de 95 octanos, calcule la probabilidad que haya comprado
gasolina de 97 octanos. Rpta. 0,71429
c. Si el cliente no compró gasolina de 90 octanos, calcule la probabilidad que haya comprado
gasolina sin aditivo.
d. Calcule la probabilidad que un cliente compre gasolina sin aditivo. Rpta. 0,66667
e. Calcule la probabilidad que un cliente no compre gasolina de 97 octanos. Rpta. 0,58333
f. Calcule la probabilidad que un cliente compre gasolina de 95 octanos sin aditivos.
Rpta. 0,33333

86. Los equipos usan tres tipos de lubricantes (mineral, sintético y semisintético) que incluyen o no
cierto aditivo. La tabla siguiente ilustra la cantidad de equipos averiados del área de producción
de colchones, distribuidos por marca y tipo de lubricante empleado (con y sin aditivo).

Con aditivo (A) Sin aditivo (Ac)


Marca Total
Mineral (F)Sintético (G)Semisintético (H)Mineral (F)Sintético (G)Semisintético (H)
Shell (S) 5 10 5 10 15 5 50
Mobil (M) 15 20 40 40 30 20 165
Chevron (C) 45 25 30 100 60 25 285
Total 65 55 75 150 105 50 500

Si se elige un equipo averiado:


a. Considerando solo a los equipos que usan lubricantes con aditivos, ¿qué marca de equipo es
más probable que se utilice? Justifique numéricamente su respuesta.
b. El jefe de operaciones desea usar solo lubricantes con aditivos y de la marca Shell, si basa su
decisión en el tipo de uso más probable, ¿qué tipo de lubricante deberá usar? Justifique
numéricamente su respuesta.
144
Estadística Aplicada I 2022 01

Eventos independientes
Son aquellos eventos en los que la ocurrencia de un evento no influye en la ocurrencia de otro u
otros eventos.

Dados los eventos A y B, si ellos son independientes, entonces se cumple que:

P ( A /B )=P ( A )

P( B/ A)=P( B)

Regla de la multiplicación de probabilidades


En general
P( A ∩ B)=P( A) P (B / A)

Para eventos independientes


P( A ∩ B)=P( A) P (B)

Para eventos mutuamente excluyentes


P( A ∩ B)=0

Propiedades
Si los eventos A y B son independientes, entonces también son independientes:

A y Bc , es decir, P( A ∩ Bc )=P( A)P( Bc )


c c c
A y B, es decir, P( A ∩ B)=P( A )P( B)
c c
A y B ,es decir, P( A c ∩ Bc )=P ( A c ) P(Bc )

Estas propiedades se puede generalizar a más de dos eventos.

Ejemplo 59

El dispositivo de un submarino tiene cuatro válvulas que funcionan de manera independiente, cuyas
probabilidades de fallar son, respectivamente, iguales a 0,08; 0,12; 0,22 y 0,34.

a. ¿Cuál es la probabilidad de que falle al menos una de las válvulas?

Solución
Definamos los eventos necesarios y sus probabilidades:
V 1 ∶=¿ que falla la válvula 1 P(V 1 )=0,08
V 2 ∶=¿ que falla la válvula 2 P(V 2 )=0,12
V 3 ∶=¿ que falla la válvula 3 P(V 3 )=0,22
145
Estadística Aplicada I 2022 01

V 4 ∶=¿ que falla la válvula 4 P(V 4)=0,34

Se definen los eventos necesarios:


V ∶=¿ que falle al menos una de las válvulas
c
V ∶=¿ que ninguna válvula falle

La probabilidad pedida es:


P (V )

Se cumple que:

P ( V )=1−P ( V ) =1−P ( V 1 ∩V 2 ∩V 3 ∩V 4 )
c c c c c

Como los eventos V 1, V 2, V 3 y V 4 son eventos independientes.

¿ 1−P ( V 1 ) P ( V 2 ) P ( V 3 ) P ( V 4 )
c c c c

¿ 1−( 0,92 ×0,88 × 0,78 ×0,66 )

¿ 1−0,4168

P ( V )=0,5832

b. ¿Cuál es la probabilidad de que falle sólo una de las válvulas?

Solución
Definamos los eventos necesarios:

A ≔ falle solo la válvula 1


B≔ falle solo la válvula 2
C ≔falle solo la válvula 3
D ≔falle solo la válvula 4
S ≔que falle solo una válvula

P ( A )=P ( V 1 ∩V 2 ∩ V 3 ∩V 4 ) =0,08× 0,88 ×0,78 × 0,66=0,0362


c c c

P( B)=P ( V 1 ∩ V 2 ∩V 3 ∩V 4 )=0,92 × 0,12× 0,78× 0,66=0,0568


c c c

P(C)=P ( V c1 ∩V 2c ∩V 3 ∩V c4 ) =0,92 ×0,88 × 0,22× 0,66=0,1176

P( D)=P ( V c1 ∩V c2 ∩V c3 ∩V 4 )=0,92× 0,88× 0,78 ×0,34=0,2147

La probabilidad pedida es:

P ( S )=P ( A ∪ B ∪ C ∪ D )

Como A , B , C y D son eventos mutuamente excluyentes:

P ( S )=P ( A ) + P ( B ) + P ( C )+ P ( D )
146
Estadística Aplicada I 2022 01

P ( S )=0,0362+0,0568+ 0,1176+0,2147

P(S)=0,4253
147
Estadística Aplicada I 2022 01

Ejercicios

87. Para señalar las emergencias que pudieran presentarse en una fábrica se ha instalado dos
alarmas que funcionan independientemente. La probabilidad que la alarma A funcione durante
una emergencia es igual a 0,95 y de que la alarma B funcione es 0,90. Calcule la probabilidad
que durante una emergencia se logre activar sola una alarma. Rpta.
0,14

88. El análisis de confiabilidad constituye la rama de la ingeniería que se dedica al cálculo de las
tasas de fallas de los sistemas. Un sistema contiene dos componentes, A y B, conectados en
serie como se muestra en el diagrama siguiente:

El sistema funcionará sólo si ambos componentes funcionan. El componente A funciona con una
probabilidad de 0,98 y el componente B funciona con una probabilidad de 0,95. Suponga que A
y B funcionan de manera independiente. Calcule la probabilidad que el sistema funcione.
Rpta. 0,931

89. Un sistema contiene dos componentes, A y B, conectados en paralelo como se muestra en el


diagrama siguiente:

El sistema funcionará si alguno, A o B funcionan. Los componentes A y B funcionan con una


probabilidad de 0,90 y 0,85; respectivamente. Suponga que A y B funcionan de manera
independiente. Calcule la probabilidad de que el sistema funcione. Rpta. 0,985

90. En la fabricación de cierto producto se presenta el defecto tipo 1 con una probabilidad de 0,01 y
el defecto tipo 2 con una probabilidad de 0,05. La ocurrencia de los defectos en los productos
son independientes.
a. Calcule la probabilidad de que un artículo tenga ambos defectos. Rpta. 0,0005
b. Calcule la probabilidad de que un artículo tenga solo el defecto 1. Rpta. 0,0095
c. Calcule la probabilidad de que un artículo contenga solo un defecto. Rpta. 0,0590
d. Calcule la probabilidad de que no tenga ningún defecto. Rpta. 0,9405

91. La probabilidad de obtener nota sobresaliente en un examen es 0,85, si se estudia mucho. Si un


alumno estudia mucho para cuatro exámenes.
¿Cuál es la probabilidad de no obtener ninguna nota sobresaliente? Rpta. 0,00051
¿Cuál es la probabilidad de tener exactamente dos notas sobresalientes? Rpta. 0,09754

92. Un sistema está conformado por cinco componentes que funcionan independientemente. La
probabilidad de que un componente funcione correctamente es 0,70.
a. Calcule la probabilidad de que al menos un componente funcione correctamente.
Rpta. 0,99757
b. Calcule la probabilidad de que al menos un componente no funcione correctamente.
Rpta. 0,83193
148
Estadística Aplicada I 2022 01

93. El número de trabajadores que se necesitan para reparar un cierto equipo es 3. En un día les
corresponde reparar a Andrés, Marcos y Fernando. La probabilidad de que Andrés falle en su
tarea es 0,05; Marcos falle es 0,06; Fernando falle es 0,08. Los tres trabajadores realizan su
tarea de manera independiente. Calcule la probabilidad que al menos uno de ellos falle en su
tarea.
149
Estadística Aplicada I 2022 01

Partición del espacio muestral

Se denomina partición del espacio muestral Ω a una colección de k eventos A1 , A 2 ,, … , Ak


mutuamente excluyentes y cuya unión es el espacio muestral Ω, con las siguientes condiciones:

 P( Ai )≥ 0 ; para todo i=1 , 2 ,3 , ⋯ , k


 Ai ∩ A j=∅ para todo i≠ j
 A1 ∪ A 2 ∪ ⋯ ∪ A k =Ω

Probabilidad total

Si k eventos A1 , A 2 ,, … , Ak constituyen una partición del espacio muestral Ω, entonces la


probabilidad para cualquier evento B de Ω se calcula:

k
P ( B )=∑ P(B ∩ A i ¿ )¿
i=1

k
P ( B )=∑ P ( A i ) P(B / A i ¿ )¿
i=1



150
Estadística Aplicada I 2022 01

Árbol de probabilidades

El árbol de probabilidades es la tercera herramienta (el diagrama de Venn y la tabla de contingencias


son las dos herramientas anteriores) muy útil para el planteamiento de problemas, sobre todo
cuando hay como datos iniciales las probabilidades condicionales.

La elaboración de un árbol de probabilidades sencillo tiene la siguiente estructura:

P (B / A ) P(A∩B)
P(A)
P (B c / A ) P ( A ∩B c )

P (B / Ac ) P ( Ac ∩ B )
P(A )
c

P ( B c / A c) P ( A c ∩ B c)

Teorema de Bayes

Si los k eventos A1 , A 2 , A3 , ⋯ , Ak constituyen una partición del espacio muestral Ω y P ( A i ) ≠ 0 para


todo i=1 , 2 ,3 , … , k ; entonces para un evento B cualquier contenido Ω tal que P ( B ) ≠ 0

P¿

P¿

Ejemplo 60
Una empresa de manufactura recibe embarques de una determinada pieza de dos proveedores.
Actualmente el 65% de las piezas adquiridas por la empresa provienen del proveedor 1 y 35%
restante del proveedor 2.

La calidad de las piezas adquiridas varía con la fuente de suministro. Con base a los datos históricos
se sabe que la probabilidad que una pieza del proveedor 1 sea defectuosa es 0,02 y la probabilidad
de que una pieza del proveedor 2 sea defectuosa es 0,05.

Si seleccionamos al azar una de las piezas adquiridas por la empresa, calcule la probabilidad de que
sea defectuosa.

Solución
Se definen los siguientes eventos.

E1 = que la pieza provenga del proveedor 1, luego P( E1 )=0,65


E2 = que la pieza provenga del proveedor 2, luego P( E2 )=0,35

A=¿ que la pieza sea defectuosa


151
Estadística Aplicada I 2022 01
c
A =¿ que la pieza no defectuosa

P( A /E 1)=0,02 y consecuentemente P( A c / E1 )=0,98


P( A /E 2)=0,05 y consecuentemente P( A c / E2 )=0,95

Luego, el diagrama de árbol correspondiente es:

P ( A / E1 ) =0,02 P ( E1 ∩ A )
P ( E1 )=0,65
P ( A / E1 ) =0,98 P ( E1 ∩ A )
c c

P ( A / E2 ) =0,05 P ( E2 ∩ A )
P ( E2 )=0,35
P ( Ac / E2 ) =0,95 P ( E2 ∩ Ac )

Por el teorema de la probabilidad total:

P ( A )=P ( E1 ∩ A ) + P ( E2 ∩ A )

P ( A )=P ( E1 ) P ( A / E1 ) + P ( E2 ) P ( A / E2 )

P ( A )=0,02 ×0,65+ 0,05× 0,35=0,0305

Ejemplo 61

La empresa de tejidos A se dedica a la fabricación de tejidos de lana de primera calidad. Para la


próxima temporada de invierno está elaborando un producto exclusivo que se espera sea todo un
éxito.

La empresa A cuenta con tres tipos de máquinas tejedoras A, B y C:

 el tipo A produce el 40% de la producción y un 3% de piezas defectuosas,


 el tipo B produce el 35% de la producción y un 1% de piezas defectuosas,
 el tipo C produce el 25% de la producción y un 2% de piezas defectuosas.

El departamento de control de calidad selecciona un artículo de toda la producción y lo analiza.

a. ¿Cuál es la probabilidad de que un artículo seleccionado al azar sea defectuoso?

Solución

Se definen los siguientes eventos.

A :=¿ el artículo es producido por la máquina tipo A, luego se tiene que P( A)=0,40
B:=¿ el artículo es producido por la máquina tipo B, luego se tiene que P( B)=0,35
152
Estadística Aplicada I 2022 01

C :=¿ el artículo es producido por la máquina tipo C, luego se tiene que P(C)=0,25

D :=¿ el artículo es defectuoso.


c
D :=¿ el artículo no es defectuoso.
153
Estadística Aplicada I 2022 01

P ( D/ A )=0,03 P ( A ∩ D)
P ( A )=0,40
P ( D / A )=0,97 P(A ∩D )
c c

P ( D/ B )=0,01 P (B ∩ D)
P ( B )=0,35
P ( Dc /B ) =0,99 P (B ∩ D c)

P ( D/C )=0,02 P (C ∩ D)
P ( C ) =0,25
P ( D /C ) =0,98 P (C ∩ D )
c c

Por el teorema de la probabilidad total:

P( D)=P( A) P( D/ A )+ P (B) P(D/ B)+ P(C )P(D /C )

P(D)=0,4 × 0,03+0,35 × 0,01+ 0,25× 0,02=0,0205

b. Si el producto seleccionado no fue defectuoso, ¿cuál es la probabilidad de que no haya sido


producido por las máquinas tipo B o C?

Solución
P( A∩D )
c
P ( B c ∪C c /Dc ) =P ( A / Dc )=
0,4 ×0,97
P ( D¿¿ c)= =0,3961 ¿
1−0,0205

Ejemplo 62

Para la empresa tecnológica A, se estima que la probabilidad de hacer un servicio en Lima es de 0,60
y en el interior del país es de 0,40.
Si el servicio es en Lima, la probabilidad de que sea:
 para instalación de equipos es 0,3
 para help desk es 0,6
 para reparación de equipos es 0,1.
Si el servicio es en el interior del país, la probabilidad de que sea:
 para instalación de equipos es 0,5
 para help desk es 0,15
 para reparación de equipos es 0,35.

a. Calcule la probabilidad de que el próximo servicio de la empresa A sea de help desk.


b. Si el servicio contratado no fue de help desk, calcule la probabilidad de que haya sido para Lima.

Solución
Se define los eventos necesarios:

L :=¿ Contratan a la empresa para un servicio en Lima


c
L :=¿ Contratan a la empresa para un servicio en el interior del país
154
Estadística Aplicada I 2022 01

I :=¿ Contratan a la empresa para un servicio de instalación de equipo


H :=¿ Contratan a la empresa para un servicio de help desk
R :=¿ Contratan a la empresa para un servicio de reparación de equipo

a. Calcule la probabilidad de que el próximo servicio de la empresa A sea de help desk.

Solución
P ( I / L )=0,30 P ( L∩ I )
P ( L )=0,60 P ( H / L )=0,60 P ( L∩ H )
P ( R / L )=0,10 P ( L∩ R )

P ( I /Lc ) =0,50 P ( Lc ∩ I )
P ( L )=0,40 P ( H / L )=0,15 P(L ∩H)
c c c

P ( R/ Lc )=0,35 P ( Lc ∩ R )

Usando el teorema de la probabilidad total, se tiene:

P ( H )=P ( L∩ H ) + P ( L ∩ H )=0,60 × 0,60+ 0,40 ×0,15


c

P(H )=0,36+ 0,06=0,42

b. Si el servicio contratado no fue de help desk, calcule la probabilidad de que haya sido para Lima.

Solución

Usando el teorema de Bayes, se tiene:

P(L∩H )
c
( c
P L/ H =)
P(H )
c

0,60× 0,30+0,60 × 0,10 0,24


¿ = =0,4138
1−0,42 0,58

Ejemplo 63

Los clientes acostumbran a evaluar en forma preliminar el diseño de sus productos. En el pasado,
95% de sus productos de gran éxito recibieron críticas favorables, 60% de los productos con éxito
moderado recibieron críticas favorables y 10% de los productos sin mucho éxito recibieron críticas
favorables. Además, 40% de los productos han sido de gran éxito, 35% han sido de éxito moderado y
25% han sido productos sin mucho éxito.

a. ¿Cuál es la probabilidad de que un producto obtenga una crítica favorable?

Solución
155
Estadística Aplicada I 2022 01

Se definen los eventos necesarios:

G : El producto ha tenido gran éxito


M : El producto ha tenido éxito moderado
P : El producto ha tenido poco éxito
F : El producto tuvo crítica favorable

P ( F /G )=0,95 P ( G∩ F )
P ( G )=0,40
P ( F /G ) =0,05 P ( G∩ F )
c c

P ( F / M )=0,60 P(M∩F)
P ( M )=0,35
P ( Fc / M )=0,40 P ( M ∩ Fc )

P ( F / P )=0,10 P (P ∩ F )
P ( P )=0,25
P ( F / P ) =0,90 P ( P∩ F )
c c

a. ¿Cuál es la probabilidad de que un producto obtenga una crítica favorable?

Solución

Usando el teorema de la probabilidad total, se tiene:

P( F)=0,40 ×0,95+0,35 × 0,60+0,25 ×0,10

P(F)=0,380+0,210+0,025=0,615

b. Si un diseño nuevo obtiene una crítica favorable, ¿cuál es la probabilidad de que sea un diseño de
gran éxito?

Solución

Usando el teorema de Bayes, se tiene:

P ( G∩ F )
P ( G/F )=
P(F)

0,40× 0,95
¿ =0,618
0,615

c. Si un producto no consigue una crítica favorable, ¿cuál es la probabilidad de que sea un producto
de gran éxito?

Solución

Usando el teorema de Bayes, se tiene:


156
Estadística Aplicada I 2022 01

P(G ∩ F c ) 0,40× 0,05


P ( G/ F ) =
c
= =0,052
c
P (F ) 1−0,615
157
Estadística Aplicada I 2022 01

Ejercicios

94. Una compañía de desarrollo urbano está considerando la posibilidad de construir un centro
comercial y una autopista en un sector de la ciudad.

Si el Consejo Municipal aprueba esta autopista, hay una posibilidad de 0,90 que la compañía
construya el centro comercial, en tanto que, si la autopista no es aprobada, la probabilidad que
construya el centro comercial es del 0,20. Basándose en la información disponible el presidente
de la compañía estima que hay una probabilidad de 0,60 de que apruebe la autopista.

a. Calcule la probabilidad que la compañía construya el centro comercial. Rpta. 0,62


b. Dado que el centro comercial se ha construido, calcule la posibilidad de que la autopista haya
sido aprobada. Rpta. 0,87097

95. Dos empresas A y B consideran la posibilidad de competir en una licitación para la construcción
de una carretera, la cual puede ser concedida o no dependiendo del monto de la propuesta. La
empresa A hace una propuesta y la probabilidad de que gane la licitación es 0,75 siempre y
cuando B no se haya presentado. La probabilidad de que B se presente a la licitación es 0,80 y,
en ese caso, la probabilidad de que la empresa A gane la licitación es sólo de 1/3. ¿Cuál es la
probabilidad de que A gane la licitación? Rpta. 0,4167

96. Una empresa de manufactura utiliza tres líneas de producción diferentes, A1, A2 y A3, para
fabricar un componente en particular. De lo fabricado por la línea A1, 5% necesita volver a
trabajarse para corregir un defecto, en tanto que 8% de los componentes de A2 necesitan
volver a trabajarse para corregir un defecto y 10% de los de A3 necesitan volver a trabajarse
para corregir un defecto. Se sabe que el 50% de todos los componentes son producidos por la
línea A1, en tanto que 30% son producidos por la línea A2 y el 20% vienen de la línea A3. Si se
extrae un componente al azar, calcule la probabilidad de que este componente necesite volver
a trabajarse para corregirle un defecto. Rpta. 0,069

97. Tres máquinas, A, B y C, producen el 45%, 30% y 25% respectivamente del total de las piezas
producidas en una fábrica. Los porcentajes de producción de defectuosos de estas máquinas
son del 3%, 4% y 5% respectivamente.

a. Si seleccionamos una pieza al azar, calcule la probabilidad de que sea defectuosa.


Rpta. 0,03800
b. Si seleccionamos una pieza al azar y resulta defectuosa ¿cuál es la probabilidad de que haya
sido producida por la máquina B? Rpta. 0,31579
c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?
Rpta. Máq. A

98. Suponga que tres ingenieros industriales (Luis, Juan y Pedro) de diferentes áreas de la empresa
A están cerca de jubilarse, dichos ingenieros solicitan sus pedidos al proveedor de servicios. Se
sabe que Luis solicita el 50% de los pedidos, Juan el 20% y Peter el 30%. Se conoce que Luis
comete cinco errores por cada 100 pedidos; Juan se equivoca el 9% de las veces, y Peter la
mitad de las veces que Juan.

a. Calcule la probabilidad de que un pedido sea solicitado con error. Rpta. 0,0565
b. Si un pedido ha sido solicitado con error, calcule la probabilidad de que el ingeniero Luis
haya solicitado el pedido. Rpta.
0,44248
158
Estadística Aplicada I 2022 01

99. Dercosa es una próspera empresa que lidera el mercado de reparación de autos en el Cono
Norte. Del total de servicios que brindaron el año pasado, aproximadamente el 40% fueron del
área mecánica, el 35% del área mantenimiento y el resto de otras áreas. Además, se sabe que el
costo de mantenimiento de un servicio es mayor a mil soles, en el 1%, 2% y 5% de las áreas
mecánicas, mantenimiento y resto de áreas, respectivamente. Dercosa implementará una
promoción para los servicios de mantenimiento si más del 25% de los servicios que tienen un
costo mayor de mil soles son del área de mantenimiento.
159
Estadística Aplicada I 2022 01

Variable aleatoria
Se denomina variable aleatoria a toda función que asocia cada elemento de un espacio muestral Ω a
un número real.

La variable aleatoria es una función que atribuye a cada evento un número que no es aleatorio o
imprevisible, sino fijo y predeterminado. Lo que es aleatorio es el resultado del experimento sobre
cuyo espacio muestral se define la variable aleatoria.

Ejemplo 64

A continuación, se describen algunas variables aleatorias.

 El experimento aleatorio es la inspección de un lote de 75 celulares; la variable aleatoria es el


número de celulares defectuosos y su rango R X ={ 0 , 1 ,2 , 3 , … ,75 }.

 El experimento aleatorio es la recepción de llamadas de 100 clientes; la variable aleatoria es el


número de ventas realizadas y su rango R X ={ 0 , 1 ,2 , 3 , … ,100 }.

 El experimento aleatorio es la construcción de nueva biblioteca; la variable aleatoria es el


porcentaje del proyecto terminado luego de 6 meses y su rango R X = [ 0 % ; 100 % ] .

 El experimento aleatorio es el funcionamiento de un almacén; la variable aleatoria es el número


de clientes que entran en un día y su rango R X ={ 0 , 1 ,2 , 3 , … }.

Aunque muchos experimentos tienen resultados experimentales que naturalmente se prestan a


valores numéricos, en otros no ocurre así.

Por ejemplo, para lanzar una moneda una vez, el resultado experimental puede ser cara o sello,
ninguno de los cuales tiene un valor numérico natural. Sin embargo, aun así, podemos expresar los
resultados en función de una variable aleatoria, una posibilidad es asignar ( X =1) si el resultado del
experimento es cara y ( X =0) si el resultado experimental es sello.

Variable aleatoria discreta

Una variable aleatoria es discreta si el conjunto de valores que puede tomar es finito o infinito
numerable.

Variable aleatoria continua

Una variable aleatoria es continua si el conjunto de valores que puede tomar es infinito no
numerable.
160
Estadística Aplicada I 2022 01

Variable aleatoria discreta


Una variable aleatoria es discreta si el conjunto de valores que puede tomar es finito o infinito
numerable. Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad
que se denota por P( X =x i).

Ejemplo 65
El jefe de mantenimiento de una empresa de transporte interprovincial de pasajeros está interesado
en el volumen diario de buses que entran al taller para algún servicio. Los registros históricos que
lleva actualizados cuidadosamente muestran que cinco es el número máximo de buses que alguna
vez ingresaron al taller y representa de una manera adecuada lo que puede ocurrir en el futuro.
Indique la variable aleatoria y su rango.

Solución
La variable aleatoria X es <número de buses que entran al taller para algún servicio> y su rango es
R X ={ 0,1,2,3,4,5 }

Distribución de probabilidad de una variable aleatoria discreta

La distribución de probabilidad de una variable aleatoria discreta X es una función f ( x ) que asigna a
todo número real x , la probabilidad de que X asuma ese valor, esto es:

Condición 1
f ( x ) ≥0

Condición 2
∑ f ( x )=1
RX

Definimos la función de probabillidad f ( x ) como:

f ( x )=P ( X =x )

Ejemplo 66

La cantidad de almuerzos demandados al día en el comedor universitario se modela con una variable
aleatoria X que tiene la siguiente distribución de probabilidad.

x 10 15 17 18 20 25
f (x) a 0,12 0,35 2a 0,14 0,09

a. ¿Cuál es la probabilidad de que se demanden 18 platos?


b. Calcule la probabilidad de que se demanden más de 18 platos.
c. Calcule la probabilidad de que se demanden a lo más 17 platos.
d. Calcule la probabilidad que se demanden al menos 15 platos, pero no más de 20 platos.
e. Calcule la probabilidad que se demanden menos de 25 platos.
f. Si se sabe que en este día la demanda será a lo más de 18 platos, ¿Cuál es la probabilidad que se
demanden más de 15 platos?
161
Estadística Aplicada I 2022 01

Solución

a. ¿Cuál es la probabilidad de que se demanden 18 platos?

Definamos la variable aleatoria.

X :¿ cantidad de almuerzos demandados al día en el comedor universitario

Debemos calcular el valor de a , para esto aplicamos la definición de la función de probabilidad.

∑ f ( x )=a+ 0,12+ 0,35+2 a+0,14+ 0,09=1


Por lo que el valor de a = 0,10

La probabilidad pedida es∶


P ( X=18 )=0,20

b. Calcule la probabilidad de que se demanden más de 18 platos.

Solución

La probabilidad pedida es:

P ( X >18 ) =P ( X =20 ) + P( X=25)

P ( X >18 ) =0,14+0,09=0,23

c. Calcule la probabilidad de que se demanden a lo más 17 platos.

Solución

La probabilidad pedida es:

P ( X ≤17 )=P ( X=10 )+ P ( X =15 ) + P ( X=17 )=0,57

d. Calcule la probabilidad que se demanden al menos 15 platos, pero no más de 20 platos.

Solución

La probabilidad pedida es:

P ( 15≤ X ≤ 20 )=0,12+ 0,35+ 0,20+0,14=0,81

e. Calcule la probabilidad que se demanden menos de 25 platos.

Solución

En este caso se usa la propiedad del complemento. La probabilidad pedida es:

P ( X <25 ) =1−P ( X ≥25 )=1−0,09=0,91


162
Estadística Aplicada I 2022 01

f. Si se sabe que en este día la demanda será a lo más de 18 platos, ¿Cuál es la probabilidad que se
demanden más de 15 platos?

Solución

La probabilidad pedida es:

P(15< X ≤ 18) 0,55


P ( X >15/ X ≤ 18 )= = =0,7143
P ( X ≤18) 0,77

Ejemplo 67

Calcule a para que la siguiente función sea una función de probabilidad y grafique f ( x).

f (x)=ax x=1 , 2 ,3 , 4 ,5

Solución

5
Como f ( x)es una función de probabilidad, se cumple que ∑ f ( x )=1.
x=1

∑ f (x )=1 a+2 a+3 a+ 4 a+5 a=1


x=1

De donde
a=1/15

La gráfica de f ( x) es:

0.30
0.2707 0.2707

0.25

0.20 0.1804
Probabilidad

0.1353
0.15

0.0902
0.10

0.05

0.00
0 1 2 3 4 5
X
163
Estadística Aplicada I 2022 01

Ejercicios

100. En una tienda de venta de artefactos electrónicos, la demanda mensual de impresoras es una
variable aleatoria con la siguiente función de probabilidad.

X : número de impresoras demandadas 80 90 100 120 130 140


f ( x) 3k 0,25 0,35 0,10 0,10 k

Responda a cada una de las siguientes preguntas.

a. Determine el valor de k .
b. Calcule la probabilidad de que se demanden 80 impresoras.
c. Calcule la probabilidad de que se demanden menos de 100 impresoras.
d. Calcule la probabilidad de que se demanden a lo más 90 impresoras.
e. Calcule la probabilidad que se demanden más de 100 impresoras, pero no más de 130
impresoras.
f. Calcule la probabilidad que se demanden más de 80 impresoras.
g. Si se sabe que hoy la demanda será mayor a 90 impresoras, ¿cuál es la probabilidad que se
demanden a lo más 130 impresoras?
164
Estadística Aplicada I 2022 01

Valor esperado de una variable aleatoria discreta

El valor esperado o esperanza matemática de una variable aleatoria X o media de una distribución
de probabilidad de X se denota E( X) .

n
μ X =E( X)=∑ x i f ( xi )
i=1

Se interpreta como el valor que se espera obtener en promedio al experimentar una y otra vez.

Valor esperado de una función de variable aleatoria discreta

Sea G(X ) una función de la variable aleatoria discreta X . El valor esperado de G(X ) es

n
μG (X ) =E(G( X))=∑ G( x i )f (x i)
i=1

Propiedades del valor esperado

Si a y b son constantes, entonces:

E ( aX +b )=aE ( X )+ b=a μ X +b

Como casos particulares se tiene:


E( b)=b

E( X +b)=E ( X )+ b=μ X +b

E( aX)=a E( X)=a μ X

Si X e Y son variables aleatorias, a y b son constantes, entonces:

E ( aX +bY )=a E ( X ) +b E ( Y ) =a μ X +b μ Y

Varianza de una variable aleatoria discreta


n
σ =V ( X )=∑ ( x i−μ X )2 f (x i)
2
X
i=1

Propiedades de la varianza

σ 2X =V ( X )=E ( X 2 ) −E(X )2

σ X =V ( X )=E ( X ) −μ
2 2 2
165
Estadística Aplicada I 2022 01

Si a y b son constantes, entonces:


V ( b ) =0
2
V ( aX )=a V ( X )

V ( X +b )=V ( X )

Desviación estándar de una variable aleatoria discreta

σ X = √ V ( X)

Coeficiente de variación
Una de las medidas de variabilidad que podríamos usar es el coeficiente de variación, tal como lo
usamos en la unidad de medidas de resumen. Esta vez definiremos el coeficiente de variación CV de
la siguiente manera:

σX σX
CV = × 100 %= × 100 %
E(X ) μX

Ejemplo 68

La cantidad de almuerzos demandados al día en el comedor universitario se modela con una variable
aleatoria X que tiene la siguiente distribución de probabilidad.

x 10 15 17 18 20 25
f (x) 0,10 0,12 0,35 0,20 0,14 0,09

El costo de cada almuerzo es de seis soles y las vende a diez soles. Todo almuerzo no vendido en el
día se desecha. Calcule el valor esperado y la variabilidad relativa de la utilidad diaria.

Solución
Calculemos el valor esperado de la utilidad diaria.

Primero obtendremos el valor esperado de la cantidad de almuerzos demandados al día

n
E( X)=∑ x i f ( xi )
i=1

E ( X ) =10× 0,10+15 ×0,12+17 × 0,35+18 ×0,20+20 × 0,14+25 ×0,09=17,4

La cantidad de almuerzos demandados que se espera obtener tiende a 17,4 platos.

La utilidad generada por la venta de un plato se expresa en la siguiente ecuación:

Utilidad de un plato = precio de venta – precio de costo = 10 – 6 = 4 soles.


166
Estadística Aplicada I 2022 01

Por tanto, para X platos demandados se tiene que la utilidad será:

U ( X )=4 X

El valor esperado de la utilidad diaria al vender X platos es:

μU ( X )=E ( U ( X ) )=E ( 4 X )=4 E ( X )=4 × 17,4=69,6

El valor esperado de la utilidad diaria por la venta de almuerzos es 69,6 soles.

Para obtener la variabilidad relativa de la utilidad diaria debemos calcular el coeficiente de variación,
y para ello, la media y desviación estándar de X .

Primero, calcularemos la varianza de X . Se sabe que:

V ( X )=E ( X 2 )−( E ( X ) )
2

Necesitamos calcular el esperado de X 2 .

n
E( X )=∑ x i f ( x i )
2 2

i=1

E ( X ) =10 × 0,10+15 ×0,12+17 ×0,35+ …+25 ×0,09=315,2


2 2 2 2 2

Reemplazando los valores en la varianza de X , tendremos:

V ( X )=E ( X 2 )−( E ( X ) )
2

2
¿ 315,2−17,4 =12,44

Ahora calculemos la varianza de la utilidad diaria es:

σ 2U ( X )=V ( U ( X ) )

¿ V (4 X )

¿ 42V ( X )
2
¿ 4 × 12,44=199,04

La desviación estándar de la utilidad es:

σ U =√ 199,04=14,1082

La variabilidad relativa de la utilidad diaria es el coeficiente de variación.

σU (X)
CV U ( X )= × 100 %
μU ( X )
167
Estadística Aplicada I 2022 01

14,1082
CV U ( X )= ×100 %=20,39 %
69,2
168
Estadística Aplicada I 2022 01

Ejemplo 69

Sea X variable aleatoria cuya función de probabilidad es:

x
f ( x )= x=0 ,1 , 2 ,3 , 4
10

a. Calcule E(3 X+ 8)

Solución

Primero, calculemos el valor esperado de X :

0 1 2 3 4
E ( X ) =0 × +1 × + 2× +3 × + 4 × =3
10 10 10 10 10

Por propiedad de valor esperado:

E ( 3 X +8 )=3 E ( X ) +8=3× 3+8=17

b. Calcule el valor de V (2 X −7)

Solución

Primero, calculemos el valor esperado de X 2

n
E( X )=∑ x i f ( x i )
2 2

i=1

0 2 1 2 3 4
E ( X ) =0 ×
2 2 2 2 2
+1 × +2 × + 3 × +4 × =10
10 10 10 10 10

Se sabe que:

V ( X )=E ( X 2 )−E ( X )2

Por tanto, se tiene que:

2
V ( X )=10−3 =1

Por propiedad de varianza, se tiene que:

V ( aX )=a2 V ( X )
2
V ( 2 X−7 )=2 V ( X )=4 × 1=4
169
Estadística Aplicada I 2022 01

Ejercicios

101. En una tienda de venta de artefactos electrónicos, la demanda mensual de impresoras es una
variable aleatoria con la siguiente función de probabilidad.

X : número de impresoras demandadas 80 90 100 120 130 140


f ( x) 0,15 0,25 0,35 0,10 0,10 0,05

Cada impresora cuesta 85 dólares y se vende a 100 dólares.

Responda a cada una de las siguientes preguntas.

a. Calcule la media de la demanda mensual.


b. Calcule la desviación estándar de la demanda mensual.
c. Calcule la media de la ganancia mensual.
d. Calcule la desviación estándar de la ganancia mensual.

102. Dada la siguiente función de probabilidad.

{
2
k x x=1 , 2 ,3 , 4 ,6
f ( x )=
0 en otro caso

a. Calcule k para que la función sea una función de probabilidad. Rpta. 0,25
b. P(2 ≤ X <4 ) Rpta. 0,3125
c. P( X ≤ 4 / X >1)

103. La demanda diaria de una herramienta en el almacén es una variable aleatoria X cuya
distribución de probabilidades está dada por la tabla que sigue:

x 1 2 3 4 5
f (x) a 4 / 16 b c 1/16

a. Calcule el valor de a , b y c , si se sabe que la distribución de probabilidad es simétrica.


Rpta. 1/16, 6/16,
4/16
b. Calcule e interprete el valor numérico del promedio de la demanda diaria de la herramienta.
Rpta. 3
c. Si la utilidad Y , en dólares, está dada por la relación Y =10+ 2 X . Determine la distribución
de probabilidades de la utilidad diaria. Rpta.
y 12 14 16 18 20
f ( y )1/ 4/ 6/ 4/ 1/
16 16 16 16 16
d. Calcule e interprete la utilidad diaria esperada. Rpta. 16

104. Una empresa produce artículos perecibles. A continuación, se presenta una tabla con los datos
históricos de las demandas semanales obtenidas en las últimas 50 semanas y el número de
semanas de ocurrencia.

Número de productos demandados 2000 3000 4000 5000


170
Estadística Aplicada I 2022 01

Número de semanas 15 25 5 5

a. Si la compañía decide programar la producción de dicho artículo tomando exactamente el


valor esperado de la demanda, ¿cuántas unidades de dicho artículo debe producir la
compañía semanalmente? Rpta.
3000
b. Cada unidad tiene un costo de cinco soles y se vende a 10 soles. Si el producto no se vende
durante la semana siguiente a la producida, se debe rematar a un precio 2,5 soles. Todos los
productos ofrecidos en remate se venden. ¿Cuántas unidades debe producirse
semanalmente la compañía para maximizar su utilidad esperada?
Rpta. 3000

105. Considere un grupo de cinco donantes de sangre, de los cuales solo dos tienen sangre ORh+. Se
obtiene cinco muestras de sangre, una de cada individuo y en forma aleatoria son analizadas
una por una, hasta identificar una muestra ORh+. Si se quiere calcular la probabilidad de
encontrar una muestra de dicho tipo de sangre luego de una cantidad de pruebas.

a. Defina la variable aleatoria.


b. Construya la tabla de distribución de probabilidades y su gráfica. Rpta.
x 1234
f (0x)0 0 0
, , , ,
4321
c. Determine el valor de la media y de la desviación estándar de la distribución. Rpta. 2; 1
171
Estadística Aplicada I 2022 01

Distribuciones de probabilidad de variables aleatorias discretas

Distribución binomial
El experimento consiste en una serie de n intentos, pruebas o ensayos, donde n se fija antes de
realizar el experimento.

Las pruebas son idénticas y cada uno de ellos puede resultar en uno de dos posibles resultados que
denotan éxito o fracaso.

Las pruebas son independientes entre sí por lo que el resultado de un intento en particular no influye
en el resultado de cualquier otro.

La probabilidad de éxito es constante de una prueba a otra y la denotamos como p.

El rango de la variable X es 0 , 1 ,2 , ⋯ , n.

Se dice que la variable aleatoria X sigue una distribución binomial con parámetros n y p y se denota:

X B(n , p)

Entonces para n intentos y la probabilidad p de éxito en cualquier intento, la probabilidad de tener x


éxitos en los n intentos está dada por:

n x n−x
f ( x )=P ( X =x )=C x p (1− p) x=0,1,2 , ⋯ , n

Ejemplo

Se tienen cinco urnas que contienen 7 bolas cada una, tres bolas negras y cuatro bolas rojas. Se saca
una bola de cada urna y se cuenta el número de bolas rojas ibtenidas en las cinco repeticiones. A
estre proceso se le denomina proceso binomial, pues solo hay dos posibilidades (bola roja o negra),
las extracciones son independientes y la probabilidad de obtener un éxito (bola roja) es constante.
172
Estadística Aplicada I 2022 01

Características

Independientemente de los valores de n , se tiene que:

• para p = 0,5 entonces la función de probabilidad f ( x ) es simétrica.


• para valores de p < 0,5 la función de probabilidad f ( x )tiene sesgo derecho.
• para valores de p > 0,5 la función de probabilidad f ( x )tiene sesgo izquierdo.

Para valores de n suficientemente grandes (n > 50), y sólo tomando en cuenta los valores relevantes
de probabilidad, la distribución es prácticamente simétrica.

Media
μ X =E ( X ) =np

Varianza
2
σ x =np (1− p)
173
Estadística Aplicada I 2022 01

Ejemplo 70

Se sabe que una máquina que está funcionando normalmente, el 10% de las piezas producidas
resultan defectuosas. Supongamos que seleccionamos al azar tres piezas producidas con la máquina
y que estamos interesados en el número de piezas defectuosas encontradas.

a. Calcule la probabilidad de encontrar menos de dos piezas defectuosas.


b. Calcule el valor esperado y desviación estándar del número de piezas defectuosas.

Solución

a. Calcule la probabilidad de encontrar menos de dos piezas defectuosas.

Solución
Dado el experimento descrito, definimos la variable aleatoria como:

X :=¿ número de piezas defectuosas

Verificamos las cuatro características del experimento para que la variable X siga una
distribución binomial:

 El experimento se puede describir como una secuencia de tres intentos idénticos, un intento
por cada una de las tres piezas seleccionadas.
 Para cada uno de los intentos son posibles dos resultados: pieza defectuosa y pieza no
defectuosa. En concordancia a cómo hemos definido la variable aleatoria, encontrar una
pieza defectuosa será éxito y una no defectuosa será fracaso.
 La probabilidad de pieza defectuosa es 0,10 y la de pieza no defectuosa es 0,90 y se supone
que se mantiene constante para todas las piezas.
 La condición de una pieza defectuosa es independiente de la condición de otras piezas.

La variable aleatoria X tiene una distribución binomial

X B(n=3 ; p=0,10)

El rango o recorrido de X es R X ={ 0 , 1 ,2 , 3 } .

La función de probabilidad es:

3 x 3− x
f ( x )=P ( X =x )=C x 0,10 (1−0,10)

La tabla de distribución de probabilidades es la siguiente:

x f ( x )=P( X=x )
0 0,729
1 0,243
2 0,027
3 0,001
174
Estadística Aplicada I 2022 01

Distribución de probabilidades según número de piezas defectuosas


0.80.729

0.7

0.6

0.5
Probabilidad

0.4

0.3 0.243

0.2

0.1
0.027
0.001
0
0 1 2 3 4

Número de piezas defectuosas

La probabilidad de encontrar menos de dos piezas defectuosas.

P ( X <2 )=P ( X =0 ) + P ( X =1 )
3 0 3 3 1 3−1
P ( X <2 )=C 0 ×0,10 ×(1−0,10) + C1 ×0,10 ×(1−0,10)

P ( X <2 )=0,729+0,243

P ( X <2 )=0,972

En Excel, se usa la función =DISTR.BINOM.N(1;3;0.1;1) = 0,972.

b. Calcule el valor esperado y desviación estándar del número de piezas defectuosas.

Solución

El valor esperado de la variable X es:

μ X =E ( X ) =np=3× 0,10=0,30

La varianza de la variable X es:

2
σ X =np (1− p )=3 × 0,10× ( 1−0,10 ) =0,27

La desviación estándar de la variable X es:

σ X = √ np (1− p)=√ 0,27=0,52


175
Estadística Aplicada I 2022 01

Ejercicios

106. Un aparato de cocina tiene 16 partes funcionales, cada una de las cuales tiene una probabilidad
de 0,99 de funcionar correctamente hasta el fin del período de garantía del producto. Las partes
funcionan de manera independiente, pero si dos o más no funcionan, el aparato tampoco. ¿Cuál
es la probabilidad de que uno de estos aparatos seleccionado al azar funcione bien durante
todo el periodo de garantía?

107. Una compañía encuestadora va a entrevistar a 50 personas en un área rural. Se sabe que la
probabilidad de que una persona en el área rural esté indocumentada es de 0,10; calcule la
probabilidad de que se entreviste al menos a cinco personas indocumentadas.

108. Una aerolínea tiene la política de vender hasta 22 boletos para viajar en un avión que cuenta
con 20 asientos para pasajeros. Estudios anteriores revelaron que solo el 90% de los pasajeros
que se registran en un determinado vuelo, se presentan al aeropuerto para viajar en ese vuelo.
Calcular la probabilidad de que no haya suficientes asientos disponibles para los pasajeros, en
un vuelo en el que se vendieron 22 boletos.

109. El ingeniero de control de calidad de la fábrica de láminas de aluminio G&E afirma que,
conforme a los registros históricos, de cada 10 láminas que se inspecciona, en promedio 1,2
láminas presentan fallas de longitud y de arqueo. Considere que las fallas se presentan de forma
independiente.
a. Justifique qué distribución tiene la variable <cantidad de láminas de aluminio que presentan
fallas de longitud y de arqueo en un total de 10 láminas inspeccionadas>. Indique en forma
explícita el valor de los parámetros de la distribución identificada. Rpta. B(10;0,12)

110. Una empresa fabrica diariamente una cantidad invariable de productos. La probabilidad de que
un producto resulte defectuoso es constante de tal manera que la cantidad de productos
defectuosos fabricados diariamente tiene un promedio de 3 y una varianza de 2,4. Si los
productos se fabrican independientemente uno de otro, calcule la probabilidad de que en un
día en particular se fabrique más de tres productos defectuosos. Rpta. 0,3518

111. El ingeniero internista de Transmin sabe que del total de operarios que ingresan a las galerías
mineras el 20% de estos presentan problemas de adaptación. Para rediseñar la selección de los
operarios desea obtener algunas probabilidades:

a. Calcule la probabilidad de que al seleccionar 15 operarios a lo más dos operarios presentan


problemas de adaptabilidad. Rpta. 0,3980
b. Si se seleccionan a 25 operarios ¿cuántos operarios con problemas de adaptabilidad
esperaríamos encontrar? Rpta. 5
c. El ingeniero decidirá modificar el diseño de selección, si al seleccionar a 15 operarios la
probabilidad de que al menos tres de ellos presentan problemas de adaptabilidad supere a
0,50. ¿Cuál será la decisión del ingeniero? Rpta. 0,602, modificará
176
Estadística Aplicada I 2022 01

Distribución Poisson

Se usa en situaciones en los que el experimento da lugar a valores numéricos discretos de una
variable aleatoria que ocurren durante un intervalo dado o una región específica.

El intervalo puede ser cualquier lapso como minutos, días, semanas, etc. y la región específica puede
ser una línea, un área o quizá una pieza de material, una carretera, etc.

El experimento que origina una variable aleatoria que sigue una distribución de Poisson se denomina
proceso de Poisson y posee las siguientes propiedades:

 El número de resultados que ocurren en un intervalo o región de espacio cualquiera es


independiente del número que ocurre en cualquier otro intervalo o región del espacio disjunto.
 La probabilidad de que ocurra un solo resultado durante el intervalo muy corto o región muy
pequeña es proporcional a la longitud del intervalo o al tamaño de la región y no depende del
número de resultados que ocurren fuera del intervalo o región.
 La probabilidad de que ocurra más de un resultado en tal intervalo corto o caiga en tal región
pequeña es insignificante.

Se dice que la variable aleatoria X sigue una distribución de Poisson con parámetro  y se denota:

X P( )

El rango de la variable X es R X =0 , 1 ,2 , ⋯

La probabilidad de tener x resultados en un intervalo dado o en una región específica es:

e−λ λ x
f ( x )=P ( X =x )= x=0 , 1 ,2 , …
x!

donde:

x = número de éxitos por unidad


 = número esperado de éxitos por unidad de tiempo o región
e = 2,71828…
177
Estadística Aplicada I 2022 01

Características

Siempre es una distribución sesgada a la derecha. A medida que  aumenta y se toma en cuenta solo
los valores relevantes de probabilidad, la distribución tiende a hacerse simétrica.

Media
❑ X =E( X )=¿

Varianza
σ 2X = λ

Ejemplo 71
El ingeniero encargado del área de producción de Desternit, se sabe que por cada cinco horas de
trabajo continuo se obtiene en promedio 1,5 láminas con defectos de arqueo.

a. Calcule la probabilidad que en una jornada de cinco horas de trabajo se hayan producido dos
láminas con defectos de arqueo.

Solución

X :=¿ número de láminas con defectos de arqueo por cada 5 horas de trabajo

X P( λ=1,5)

Rango: R X =¿ 0, 1, 2, 3,…

e−1,5 × 1,52
P ( X=2 )= =0,2510
2!

b. Calcule la probabilidad de que en una jornada de ocho horas de trabajo se hayan producido más
de una lámina con defectos de arqueo.

Solución

Por cada cinco horas de trabajo continuo λ = 1,5, aplicando regla de tres simple, diremos que por
cada ocho horas de trabajo continuo.

1,5× 8
λ= =2,4
5

La probabilidad pedida es:

P ( X >1 )=1−P ( X ≤ 1 )

¿ 1−[P ( X =0 ) + P ( X =1 ) ]

¿ 1− (
e−2,4 ×2,4 0 e−2,4 ×2,4 1
0!
+
1! )
178
Estadística Aplicada I 2022 01

¿ 0,6916
Ejercicios

112. El número de buques que llegan a un puerto sigue una distribución de Poisson con una media
de tres buques por día. Cada buque se demora en el puerto por los menos tres días y el puerto
tiene capacidad para ocho buques. Si en este momento, no hay ningún buque atracado en el
puerto, calcular la probabilidad de que el puerto se llene en los siguientes dos días.

113. El número de personas que llega a un restaurante puede modelarse por una variable Poisson
con un promedio de 0,8 personas por minuto.

a. ¿Cuál es la probabilidad de que en un minuto llegue una persona al restaurante?


b. ¿Cuál es la probabilidad de que en un minuto llegue más de una persona al restaurante?

114. La única cajera de una agencia bancaria sabe por experiencia que entre las cinco y las seis de la
tarde (hora en que cierra el banco) llegan a su agencia en forma aleatoria un promedio dos
personas por minuto. La cajera está obligada a atender a todas las personas que llegan hasta las
seis de la tarde. Tres minutos antes de las seis de la tarde no hay nadie en la cola y en ese
momento ella recibe una llamada telefónica que la obliga a ausentarse de su puesto durante
cinco minutos. Calcule la probabilidad de que al volver a su puesto hayan más de tres personas
en la cola. Rpta. 0,8488

115. El departamento de congestión y tránsito vehicular de la Municipalidad de Lima maneja


información que en la intersección de las avenidas Primavera y Miro Quesada, ocurren en
promedio 0,8 accidentes de tránsito por día (24 horas). El jefe a cargo del departamento desea
implementar algunos cambios en la señalización y para esto requiere de algunas probabilidades.

a. Calcule la probabilidad de que en un día ocurra exactamente dos accidentes. Rpta. 0,14379
b. Calcule la probabilidad de que en un día ocurra menos de un accidente. Rpta. 0,44933
c. Calcule la probabilidad de que en un día ocurra al menos dos accidentes. Rpta. 0,19121
d. La Municipalidad inspeccionará 18 horas de tránsito vehicular continuo y si la probabilidad de
que se haya presentado dos accidentes de tránsito supera el 8% se asignará un policía de
tránsito en horas punta. ¿La Municipalidad de Lima asignará un policía de tránsito?
Rpta. 0,09879

116. El número de torres de alta tensión que se caen por año en una ciudad puede modelarse por
una variable aleatoria de Poisson, con una desviación estándar de 1,5 torres por año. El costo de
reparar una torre caída es 200 000 dólares y la compañía destina como máximo 600 000 dólares
anuales para reparar torres. Calcule el gasto anual esperado en la reparación de torres.
179
Estadística Aplicada I 2022 01

Variable aleatoria continua


La variable aleatoria continua es una variable cuyo rango es un conjunto infinito no numerable de
valores.

Función de densidad de probabilidad

Se denomina función de densidad de probabilidad f ( x) de una variable aleatoria continua a la


función que satisface:

Condición 1
f ( x ) ≥0 para todo x ∈ R

Condición 2
+∞

∫ f ( x ) dx=1
−∞

Se cumple que:
b
P ( a ≤ X ≤ b )=∫ f ( x ) dx
a

Para variables continuas se cumple:

P(a ≤ X ≤ b)=P(a< X ≤ b)=P(a ≤ X <b)=P(a< X <b)

Ejemplo 72

Las ventas diarias, en miles de dólares, de una bodega es una variable aleatoria continua X que tiene
la función densidad:

{
a ( x+ 2 )
0 ≤ x ≤1
f ( x )= 5
0 otro caso
180
Estadística Aplicada I 2022 01

a. Calcular el valor de a .

Solución
Por la condición 2, se tiene que:

1
a ( x +2 )
∫ 5
dx=1
0

Resolviendo la ecuación a partir de la integral tenemos que a=2.

b. Calcule la probabilidad que en un día cualquiera las ventas superen los 900 dólares.

Solución

La probabilidad pedida es:

1
2 ( x +2 )
P ( X >0,9 ) =∫ dx =0,118
0,9 5

c. Calcule la probabilidad que las ventas oscilen entre los 750 y 950 dólares.

Solución

La probabilidad pedida es:

0,95
2 ( x+ 2 )
P ( 0,75 ≤ X ≤ 0,95 )= ∫ dx=0,228
0,75 5

d. Calcule la probabilidad que las ventas no superen los 700 dólares.

Solución

La probabilidad pedida es:

0,7
2 ( x+ 2 )
P ( X ≤0,7 )=∫ dx=0,658
0 5

e. Si se sabe que en un día las ventas superan los 500 dólares, calcule la probabilidad que se venda
a lo más 750 dólares.

Solución

La probabilidad pedida es:

P ( 0,5< X ≤ 0,75 ) 0,2625


P ( X ≤0,75 / X >0,5 ) = = =0,4773
P ( X > 0,5 ) 0,55
181
Estadística Aplicada I 2022 01

Función de distribución acumulada de una variable aleatoria continua

La función de distribución acumulada de una variable aleatoria continua X con función densidad
f ( x) se define por:

F ( x )=P ( X ≤ x ) −∞ < x<+ ∞

Se cumple:

P ( a< X ≤ b ) =F ( b ) – F (a)

Ejemplo 73

Las ventas diarias (en miles de dólares) de una bodega es una variable aleatoria continua X que tiene
la función densidad:

{
2( x+ 2)
0< x<1
f ( x)= 5
0 en otro caso

a. Construya su respectiva función de distribución acumulada de probabilidad.

Solución

Primera forma: Integrando

Para el tramo [0; 1] usaremos la definición de la función de distribución acumulada

)|
x

(
x
2 ( t+2 ) 2 t
2
F ( x )=P ( X ≤ x ) =∫ dt = +2 t
0 5 5 2 0

( ) ( ) ( )
2 2 2
2 x 2 0 2 x 1
¿ +2 x − + 2× 0 = +2 x = x ( x +4 )
5 2 5 2 5 2 5

La función de distribución se expresa de la siguiente manera:

{
1 x ≥1
1
F (x)= x ( x +4 ) 0< x< 1
5
0 x ≤0

Segund forma: Integrar usando algún programa informático

Para el tramo [0; 1] usaremos la definición de la función de distribución acumulada


182
Estadística Aplicada I 2022 01
x
2 ( t+2 ) 1
F ( x )=P ( X ≤ x ) =∫ dt= x ( x +4 )
0 5 5

Puede usar páginas como https://www.wolframalpha.com/ y pedir que calcule la integral


correspondiente.

https://www.wolframalpha.com/input/?i=integrate+%282%2F5%29%28t%2B2%29+dt+from+t%3D0+to+x

b. ¿Cuál sería la venta mínima del 25% de los mayores montos diarios de venta?

Solución

La venta mínima del 25% de los mayores montos diarios de venta corresponde al percentil 75.

Calcularemos el percentil 75; P75=m

P ( X ≤m )=F ( m )=0,75

1.0

0.9

0.8

0.7 0,75
0.6

0.5

0.4

0.3

0.2 0,78

0.1

0.0
-0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2

1
F ( m )= m ( m+ 4 )=0,75
5
183
Estadística Aplicada I 2022 01

Resolviendo la ecuación se tienen que m=0,78 ; por lo que el percentil 75 es 780 dólares.
184
Estadística Aplicada I 2022 01

Ejercicios

117. Sea X una variable aleatoria que representa a la vida útil, en años, de cierto tipo de
computadora. Su función de densidad se muestra a continuación:

{
f ( x)= kx 0< x<2
0 otro caso

a. Calcule el valor de k . Rpta. 0,5


b. Calcule la probabilidad que esta computadora dure a lo más un año y medio. Rpta. 0,5625
c. Calcule la probabilidad que dure entre 1,5 y 1,75 años. Rpta. 0,20313
d. Calcule la probabilidad que dure al menos un año. Rpta. 0,75
e. Si se sabe que la computadora va a durar más de un año, calcule la probabilidad que dure
hasta 1,95 años. Rpta.
0,93417
f. Determine la función de distribución acumulada de probabilidad de X . Rpta. x 2 /4
g. Calcule la probabilidad que dure entre 1,5 y 1,75 años, usando la función de distribución
acumulada.
h. Calcule el percentil 83. Rpta. 1,82209
i. Calcule la mediana. Rpta. 1,4142

118. Se ha observado que un termómetro sometido a condiciones meteorológicas adversas da una


medición de entre dos grados más y dos menos de la temperatura real. El error cometido se
modela por una variable aleatoria continua con la siguiente función de densidad.

f ( x )= {k ( 2−x
0
) −2≤ x ≤ 2
en otro caso

a. Calcule el valor de k .
b. Calcule la probabilidad de que el error esté entre -0,5 y 0,5 grados.
c. Determine la función de distribución acumulada de probabilidad de X y úsela para calcular
la probabilidad de que el error sea menor a un grado.

119. La demanda de gas propano, en miles de galones, de una distribución en particular es una
variable aleatoria con la siguiente función de densidad de probabilidad:

f ( x )=
{ ( x1 )
k 1−

0
2
1≤ x ≤ 2

en otro caso

a. Calcule el valor de k . Rpta. 2

b. Determine la función acumulativa de X . ( 1


Rpta. 2 x + −2
x )
c. Obtenga el valor del primer cuartil. Rpta. 1,42153

120. Para cierto negocio por correo electrónico la proporción de los pedidos procesados en 24 horas
tiene la función de densidad de probabilidad:
185
Estadística Aplicada I 2022 01

f ( x )= {k ( 1−x
0
) 0≤ x ≤ 1
en otro caso

a. Calcule k para que f (x) sea una función densidad. Rpta. 2


b. Calcule la probabilidad que al menos el 80% de los pedidos sean procesados dentro de 24
horas. Rpta. 0,04
c. Determine la función acumulada de X . Rpta. 2 x−x 2

121. Sea X una variable aleatoria que modela la cantidad de tiempo, en minutos, que una persona
tarda en responder una pregunta de un examen y que tiene la siguiente función de densidad:

f ( x )= {k ( 6−x
0
) 0< x <6
en otro caso

a. Determine la función de distribución acumulada de la variable aleatoria X .


b. Use la función de distribución acumulada de la variable X para calcular la probabilidad de
que una persona se tarde hasta cuatro minutos en responder una pregunta.
c. Use la función de distribución acumulada de la variable X para calcular la probabilidad de
que una persona se tarde entre dos y cinco minutos en responder una pregunta.
186
Estadística Aplicada I 2022 01

Valor esperado de una variable aleatoria

El valor esperado o esperanza matemática de una variable aleatoria X o media de una distribución
de probabilidad de X se denota E( X) .

Valor esperado de una variable aleatoria continua

+∞
μ X =E( X)=∫ x f ( x) dx
−∞

Valor esperado de una función de variable aleatoria continua

Sea G(X ) una función de la variable aleatoria continua X . El valor esperado de G(X ):

+∞
μG (X ) =E(G( X))= ∫ G ( x ) f ( x) dx
−∞

Propiedades del valor esperado

• Si a y b son constantes, entonces:

E ( aX +b )=aE ( X )+ b=a μ X +b

• Como casos particulares se tiene:

E( b)=b

E ( X +b )=E ( X ) + b=μ X +b

E ( aX ) =a E ( X )=a μ X

• Si X e Y son variables aleatorias, a y b son constantes, entonces:

E( aX +bY )=aE ( X )+bE(Y )

• Como casos particulares se tiene:

E( X +Y )=E( X)+ E (Y )

E( X – Y )=E( X) – E (Y )

• Si X e Y son variables aleatorias independientes, a y b son constantes, entonces:

E( a X .b Y )=a b E(X ) E(Y )

• Si X 1 , X 2 , X 3 ,… , X n son n variables aleatorias independientes, entonces:


187
Estadística Aplicada I 2022 01

E( X 1 . X 2 . X 3 .. . X n )=E( X 1) . E(X 2). E ( X 3 ). . . E (X n )

• Si X 1 , X 2 , X 3 ,… , X n son n variables aleatorias independientes y a 1 , a2 , a3 , … , an son n


constantes, entonces:

( )
n n
E ∑ ai X i =∑ a i E ( X i)
i=1 i=1

Varianza de una variable aleatoria continua

+∞
σ =V ( X )=∫ ¿ ¿
2
X
−∞

σ 2X =V ( X )=E ( X 2 ) −E ( X )
2

Desviación estándar de una variable aleatoria continua

√∫
+∞
σ X= ¿¿¿
−∞

Varianza de una función de variable aleatoria continua

+∞
σ G ( X )= ∫ ¿ ¿
2

−∞

Propiedades de la varianza

Si a y b son constantes, entonces:

V ( b ) =0

V ( aX )=a2 V ( X )

V ( X +b )=V ( X )

Si X e Y son dos variables aleatorias independientes, a y b son dos constantes, entonces:

V ( aX +bY ) =a2 V ( X ) +b2 V ( Y )

Si X 1 , X 2 , X 3 ,… , X n son n variables aleatorias independientes, y a 1 , a2 , a3 , … , an son n constantes,


entonces:
188
Estadística Aplicada I 2022 01

( )
n n
V ∑ ai X i =∑ ai V ( X i) 2

i =1 i=1

Desviación estándar de una variable aleatoria continua


σ X = √ V ( X)

Coeficiente de variación

Una de las medidas de variabilidad que podríamos usar es el coeficiente de variación, tal como lo
usamos en la unidad de medidas de resumen.

El coeficiente de variación se define de la siguiente manera:

σX
CV = × 100 %
E(X )

Ejemplo 74

Las ventas diarias (en miles de dólares) de IBM Shop es una variable aleatoria continua X que tiene
la función de densidad:

{
2(x+ 2)
f ( x)= ¿ 5
0< x<1
¿ 0 en otro caso

La utilidad neta queda aplicando el 45% de las ventas realizadas y a esto se le quita 70 dólares por
gastos fijos.

a. Calcule la utilidad esperada.

Solución

Definamos la variable aleatoria.

X ∶=¿ ventas diarias (en miles de dólares) de IBM Shop.

Primero calculamos el valor esperado de las ventas diarias.

( )
+∞ 1
2 ( x +2 )
E ( X ) =∫ xf ( x)=∫ x dx=0,5333
−∞ 0 5

La utilidad neta de la venta diaria se expresa por:

U ( X )=0,45 X−0,07
189
Estadística Aplicada I 2022 01

Calculemos el valor esperado de la utilidad.

E ( U ( X ) ) =E ( 0,45 X−0,07 )=0,45 E ( X ) −0,07

¿ 0,45( 0,5333)−0,07=0,170

La utilidad neta que se espera obtener por la venta diaria tiende a 170 dólares.
190
Estadística Aplicada I 2022 01

b. Calcule la desviación estándar de la utilidad neta.

Solución

Primero, calculemos el valor esperado de X 2 .

( 2( x5+2) ) dx=0,3667
+∞ 1
E ( X ) =∫ x f (x )=∫ x
2 2 2

−∞ 0

Por definición la varianza es:

V ( X )=E ( X 2 )−E 2( X )
2
V ( X )=0,3667−0,5333 =0,0823

La varianza de la utilidad neta es:

σ U =V ( U ( X ) )=V ( 0,45 X −0,07 )


2

Por las propiedades de la varianza, la constante sale al cuadrado y la varianza de una constante
es cero.

σ 2U =0,452 V ( X )

σ 2U =0,452 ×0,0823=0,0167

La desviación estándar de la utilidad neta es la raiz cuadrada de la varianza.

σ U =√ σ 2U = √ 0,0167=0,1291

El coeficiente de variación de la utilidad neta es:

σU
CV U = ×100 %=75,94 %
E(U )
191
Estadística Aplicada I 2022 01

Ejercicios

122. El peso, en kilos, de un producto usado en hogares y oficinas es una variable aleatoria X con
función de densidad:

f ( x)=
{k (x−8)
0
8< x<10
en otro caso

Si este producto es empacado en una caja el peso aumenta en un 10%, además que a este
producto ya empacado se le debe envolver en una bolsa de tela de medio kilo para su
presentación y posterior venta.

a. Calcule el valor de k . Rpta. ½


b. Determine el peso esperado del producto listo para su venta. Rpta. 10,77
c. Calcule la desviación estándar del peso del producto listo para su venta. Rpta. 0,51862
d. Calcule el coeficiente de variación del peso del producto listo para su venta. Rpta. 4,815%

123. El tiempo de fraguado, en minutos, de un cierto tipo de concreto se puede modelar por una
variable aleatoria X con la siguiente función de distribución acumulada:

{
x 2
− 20< x< 50
F (x)= 30 3
0 en otro caso

Calcule el coeficiente de variación de la variable X .

124. Cierta aleación se forma al combinar la mezcla fundida de dos metales. La aleación que resulta
contiene cierto porcentaje de plomo X , que puede modelarse con una variable aleatoria con la
siguiente función de densidad:

3
f ( x )= x ( 100−x ) 0≤ x ≤ 100
500000

La utilidad neta obtenida en soles al vender una libra de esta aleación con porcentaje X de
contenido de plomo, se obtiene mediante la siguiente función:

U ( X)=10+8 X

Calcule la utilidad esperada por libra. Rpta. 410


192
Estadística Aplicada I 2022 01

Distribuciones de probabilidad de variables aleatorias continuas

Distribución exponencial
En variables que representan los tiempos de vida útil, tiempos de sobrevivencia, en tiempos de
ocurrencia en procesos de Poisson se suele utilizar la distribución exponencial.

La variable aleatoria X tiene una distribución exponencial con parámetro β ( β > 0) si su función de
densidad de probabilidad es:

{
−x
1 β
e x≥0
f (x)= β
0 otro caso

Se dice que X sigue una distribución exponencial con parámetro β y se denota X exp( β)

P ( x  x 0 )  1  e  x0 / 

X
X0

Función de distribución acumulada

F (x)= { 0
1−e
−x/ β
x< 0
x≥0

β >0

Características

La variable puede tomar valores de 0 a +, no toma valores negativos.

La gráfica es descendente con sesgo a la derecha.

Existe una curva para cada valor de β .

Media
μ x =E ( X )=β

Varianza
2 2
σ X =β
193
Estadística Aplicada I 2022 01
194
Estadística Aplicada I 2022 01

Relación de la distribución exponencial se relaciona con la distribución de Poisson

La distribución exponencial se relaciona con la distribución de Poisson de la siguiente manera: si la


cantidad de eventos discretos que suceden en un tiempo sigue una distribución de Poisson con
media , entonces el tiempo entre la ocurrencia de dos eventos discretos consecutivos sigue una
distribución exponencial con media  = 1/.

Propiedad de la distribución exponencial

La distribución exponencial posee la propiedad de “no tener memoria”, en general, dado cualquier
valor a , b > 0, se tiene:

P ( X >a+ b/ X > a )

P ( ( X> a+b ) ∩ ( X >a ) )


¿
P ( X >a )

P ( X > a+b )
¿
P ( X > a)
−a+b
β
e
¿ −a
e β

−a +b a
+
β β
¿e
−b
¿ e β =P ( X > b )

Es decir que:

P ( X >a+ b/ X > a )=P ( X >b )

Ejemplo 75

El ingeniero de planta de una línea aérea sabe que la duración promedio de los neumáticos de las
avionetas es de 1,5 años. Si la duración de los neumáticos tiene una distribución exponencial.

a. ¿Cuál es la probabilidad de que los neumáticos duren a lo más 1,6 años?

Solución
Definamos la variable aleatoria X : duración de neumáticos de las avionetas.

X exp( β=1,5)

La probabilidad pedida es:


195
Estadística Aplicada I 2022 01
−1,6
1,5
P ( X ≤1,6 )=F ( 1,6 ) =1−e =0,6558

b. ¿Cuál es la probabilidad de que los neumáticos duren más de 2 años?

Solución

La probabilidad pedida es:

P ( X >2 )=1−P ( X ≤ 2 )

( )
−2

¿ 1−F (2 )=1− 1−e 1,5 =0,2636

c. La gerencia de la línea aérea está evaluando la posibilidad de cambiar de proveedor si el tiempo


mínimo del 25% de los neumáticos que tienen una mayor duración es menor a 1,8 años.

Solución

Interpretación
Determinar si se va a cambiar de proveedor.

Representación
Se debe calcular el percentil 75 de la variable <duración de neumáticos de las avionetas>.

Cálculo
El tiempo mínimo del 25% de los neumáticos que tienen una mayor duración lo representamos
por t min.

P ( X ≥ t min )=0,25

P ( X ≥ t min )=1−P ( X <t min )

( )
−t min

¿ 1−F ( t min )=1− 1−e 1,5

−t min
1,5
¿e =0,25
−t min
Tomamos logaritmo neperiano a ambos lados de la ecuación 1,5
e =0,25

ln ( e )=ln ⁡(0,25)
−t min
1,5

−t min
=−1,3863
1,5

t min =2,08 años

Análisis
196
Estadística Aplicada I 2022 01

El tiempo mínimo del 25% de los neumáticos que tienen una mayor duración es mayor a 1,8 años
(2,08 > 1,8).

Argumentación
Por tanto, no se va a cambiar de proveedor.
197
Estadística Aplicada I 2022 01

Ejercicios

125. El tiempo, en minutos, que demora una llamada telefónica se modela con una variable
exponencial con una media de 5 minutos. Calcular la probabilidad de que la duración de una
llamada sea mayor a seis minutos.

126. El tiempo que toma ajustar las máquinas que están produciendo láminas de aluminio con
defectos de arqueo, tiene una distribución exponencial con media de dos horas.
a. Calcule la probabilidad de que el tiempo de ajuste de una máquina que produce láminas de
aluminio con fallas de arqueo supere las 2,5 horas. Rpta. 0,28650

b. Determine el máximo tiempo de ajuste de una máquina que produce láminas de aluminio
con fallas de arqueo para que esté considerado dentro del 20% de los ajustes más rápidos.
Rpta.
0,4463

127. El tiempo de vida de un tipo de marcapasos puede modelarse por una variable con distribución
exponencial con media de 12 años.
a. Calcule la probabilidad de que un marcapasos de este tipo se malogre antes de los 15 años
de funcionamiento.
b. Si el marcapasos lleva funcionando correctamente cinco años en un paciente, ¿cuál es la
probabilidad de que se malogre antes de 15 años?

128. El tiempo de duración, en meses, de un tipo de resistencia eléctrica del modelo XFF se modela
con una variable aleatoria continua con la siguieinte función de densidad de probabilidad:

{
−0,5 x
0,5 e x ≥0
f (x)=
0 otro caso

a. Calcule la probabilidad de que una resistencia dure más de cuatro meses. Rpta. 0,13534
b. Si una resistencia eléctrica ya duró cuatro meses, calcule la probabilidad que dure como
máximo un mes más. Rpta. 0,39347
c. Las normas técnicas indican que el percentil 75 del tiempo de duración de la resistencia debe
ser mayor a los tres meses, ¿la resistencia eléctrica del modelo XFF cumple con las normas
técnicas? Rpta. No;
2,77
d. Si se prueban diez resistencias eléctricas, ¿cuál es la probabilidad de que ninguna dure más
de cuatro meses. Rpta.
0,23359

129. La empresa Sysmat ofrece equipos de aire acondicionado para galerías mineras al jefe de área
de logística de Trasmin. El representante de ventas de Sysmat indica que el tiempo de vida de
los equipos de aire acondicionado sigue una distribución exponencial con tiempo promedio de
dos años.

a. Sysmat indica que si un equipo se malogra antes de 1,8 años será repuesto por uno nuevo. Si
la probabilidad de que no se llegue a usar la garantía ofrecida por Sysmat es mayor al 50%;
Trasmin evaluará comprar los equipos de Sysmat. Rpta. No;
0,41
b. Con el fin de comprar definitivamente los equipos de Sysmat. El jefe de logística plantea la
siguiente situación: Si selecciona al azar un equipo de aire acondicionado que ya duró 2 años,
198
Estadística Aplicada I 2022 01

la probabilidad que dure como máximo medio año más es mayor a 0,2; se compran los
equipos a Sysmat. ¿Cuál será la decisión de Trasmin? Rpta.
0,22120
c. ¿Cuál sería el tiempo de vida máximo que tendría el 50% de los equipos de aire
acondicionado que compraría Trasmin? Rpta.
1,386
199
Estadística Aplicada I 2022 01

Distribución normal

Función de densidad

( )
2
−1 x−μ
1 2 σ
f ( x )= e x ∈R
σ √2 π

Se dice que la variable aleatoria X sigue una distribución normal con parámetros  y 2 y se denota
2
X N (,❑ ).

Características
 La función de densidad es simétrica y tiene forma de campana.
 Las medidas de tendencia central coinciden.
 Su rango es - a +.
 El eje X representa una asíntota de la grafica (la campana de Gauss)

Estandarización

Se toma como referencia una distribución normal estándar ( ¿ 0 y ¿ 1).

Se trabaja Z que es el número de desviaciones estándar que un dato X se aleja de la media .

X−μ
Z=
σ

Cálculo de una probabilidad de una variable normal

Para calcular una probabilidad de una variable normal existen varias posibilidades, entre ellas puede
usar:

 Estandarizar la variable para usar la tabla de la normal estándar.


 Usar un programa informático, como, por ejemplo Excel.
200
Estadística Aplicada I 2022 01
201
Estadística Aplicada I 2022 01

Cálculo de una probabilidad usando de la tabla normal estándar

Para calcular una probabilidad usando la tabla normal estándar debemos estandarizar la variable y
obetenemos un valor de Z.

P ( X ≤ a)

¿P ( X −μ
σ

σ )
a−μ

¿ P Z≤ ( a−μ
σ )
a−μ
El valor de se redondea a dos decimales, usando redondeo simple.
σ

 En la primera columna de este valor buscamos el valor de las unidades y las décimas.
 En la fila correspondiente al valor de la columna buscamos el valor de las centésimas.
 Su intersección nos dará la probabilidad.

La tabla normal estándar siempre nos dará el valor del área hacia la izquierda de Z.

-4 -3 -2 -1 0 1 2 3 4

Cálculo de una probabilidad de una variable normal usando Excel

Con Excel, se usa la función =DISTR.NORM.N(x;media;desv_estándar;acumulado)

 x: es el valor para el que desea la distribución.


 media: es la media aritmética de la distribución.
 desv_estándar: es la desviación estándar de la distribución, un número positivo.
 acumulado: Use acumulado = 1 para calcular la probabillidad.

La función siempre nos dará el valor del área hacia la izquierda de x.


202
Estadística Aplicada I 2022 01

Ejemplo 76

Sea X una variable normal tal que:

X N ( μ=30 ;σ =5 )
2 2

Calcule:
P( X ≤ 37,8)

Solución

Primera forma: Usando la tabla de la normal estándar

Estandarizando la variable para usar la tabla de la normal estándar.

P ( X ≤37,8 )

¿P ( X −μ
σ

37,8−μ
σ )
¿ P Z≤( 37,8−30
5 )
¿ P ( Z ≤1,56 )

Usando la tabla de la distribución normal estándar.

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449

Tenemos que:
P ( Z ≤1,56 )=0,94062

-4 -3 -2 -1 0 1 2 3 4

Segunda forma: Usando Excel

Usando algún programa estadístico como Excel.

En Excel, se usa =DISTR.NORM.N(1.56;0;1;1) = 0,94062


203
Estadística Aplicada I 2022 01
204
Estadística Aplicada I 2022 01

Cálculo de un percentil de una variable normal

Para calcular un percentil de una variable normal existen varias posibilidades:

 Estandarizar la variable para usar la tabla de la normal estándar


 Usar un programa informático, como, por ejemplo Excel.

Cálculo de un percentil usando de la tabla normal estándar

Para calcular un percentil usamos la tabla normal estándar de forma inversa.

Para calcular el percentil k, se plantea la ecuación:

P ( X ≤ P k )=0 , k

Luego, debemos estandarizar la variable.

P ( X −μ
σ

σ )
P −μ k
=0 , k

(
P Z≤
P k −μ
σ )
=0 , k

Luego, se busca dentro de la tabla el valor más cercano a 0 , k . A partir de ese número dentro de la
tabla, salimos a la primera columna y primera fila y sumamos los números encontrados y
obtenderemos el valor c.

-4 -3 -2 -1 0 1 2 3 4

El valor del percentil se obtiene de la ecuación:

Pk =μ+ c σ

Cálculo de un percentil de una variable normal usando Excel

Con Excel, se usa la función =INV.NORM(probabilidad;media;desv_estándar)


 probabilidad: es un número entre 0 y 1. Por ejemplo, para calcular el percentil 70; use 0,7.
 media: es la media aritmética de la distribución.
 desv_estándar: es la desviación estándar de la distribución, un número positivo.
205
Estadística Aplicada I 2022 01

Ejemplo 77

Sea X una variable normal tal que:

X N ( μ=30 ;σ =5 )
2 2

Calcule Pk para que se cumpla P( X ≤ Pk )=0,94950.

-4 -3 -2 -1 0 1 2 3 4

Solución
Primera forma: Estandarizando la variable X para usar la tabla de la normal estándar.

P( X ≤ Pk )=0,94950

P ( X −μ
σ

σ )
P −μ k
=0,94950

(
P Z≤
P k −30
5 )
=0,94950

Usando la tabla de la distribución normal estándar.

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327

Tenemos que P ( Z ≤1,64 )=0,94950 ; de donde:

P k −30
=1,64
5

El valor del percentil se obtiene de la ecuación:

Pk =30+ 1,64 ×5=38,2

Segunda forma: Usando Excel

Usando un programa informático, como, por ejemplo Excel.


206
Estadística Aplicada I 2022 01

En Excel, se usa =INV.NORM(0.9495;30;5) = 38,2.

Ejemplo 78
El ingeniero de operaciones de una aerolínea es el encargado de monitorear el tiempo de vuelo de
los aviones destinados a Sudamérica. Una de las rutas que generalmente presenta problemas es al
aeropuerto de Río de Janeiro. Sabe que el tiempo de vuelo tienen una distribución normal con una
media de 4 horas y desviación estándar de 0,25 horas. Dicho ingeniero desea calcular algunas
probabilidades para presentar el informe anual.

a. Calcule la probabilidad de que el vuelo sea menor a 230 minutos.

Solución
La variable X ∶=¿ tiempo de vuelo de un avión destinado a Río de Janeiro, en minutos

X N ( μ=240 ; σ =15 )
2 2

La probabilidad pedida es:


P ( X <230 )

Estandarizando que consiste en restar la media y dividir entre la desviación estándar:

¿P ( X −μ
σ
<
230−240
15 )
¿ P ( Z ←0,66667 )

Si vamos a usar la tabla de distribución normal estándar, siempre se redondea −0,66667 a dos
decimales, por redondeo simple, es decir:

¿ P ( Z ←0,67 ) =0,25143

z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854

En Excel, se usa =DISTR.NORM.N(230;240;15;1) = 0,25249. Se puede observar que el resultado es


ligeramente distinto.
207
Estadística Aplicada I 2022 01

Observe que la respuesta es ligeramente diferente, debido al redondeo a dos decimales al usar la
tabla normal estándar.

b. Calcule la probabilidad de que el vuelo supere los 286 minutos.

Solución
La probabilidad pedida es:

P ( X >286 )

Como la tabla normal siempre nos da el área hacia la izquierda, usaremos el complemento.

P ( X >286 ) =1−P ( X ≤286 )

Estandarizando.
¿ 1−P ( X −μ
σ

286−240
15 )
¿ 1−P ( Z ≤ 3,06667 )

Si vamos a usar la tabla de distribución normal estándar, siempre se redondea −3,06667 a dos
decimales, por redondeo simple, es decir:

¿ 1−P ( Z ≤ 3,07 )

¿ 1−0,99893=0,00107

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289

En Excel, se usa =1-DISTR.NORM.N(286;240;15;1) = 0,00108 . La diferencia se debe al redondeo.

c. Se considera tiempo de vuelos aceptables aquellos que están en el intervalo de [230 – 270]
minutos ¿Cuál es la probabilidad de que el vuelo sea considerado como aceptable?

Solución
208
Estadística Aplicada I 2022 01

La probabilidad pedida es:

P ( 230≤ X ≤ 270 )

Estandarizando en ambos extremos de la expresión, se tiene:

¿P ( 230−240
15

X −μ 270−240
σ

15 )
¿ P (−0,67 ≤ Z ≤ 2,00 )

¿ P ( Z ≤2,00 )−P ( Z ←0,67 )

Buscando en la tabla normal estándar o en un programa informático.

¿ 0,97725−0,25143=0,72582

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574

z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854

En Excel, se usa =DISTR.NORM.N(270;240;15;1) = 0,97725 .


En Excel, se usa =DISTR.NORM.N(230;240;15;1) = 0,25149 .

d. Se sabe que el 10% de los vuelos que tardan más recibirán asistencia técnica ni bien lleguen al
aeropuerto, cuál será el tiempo mínimo de vuelo para que dicho avión reciba asistencia técnica.

Solución

Denominemos t min al tiempo mínimo de vuelo para que dicho avión reciba asistencia técnica.

La condición para que reciba asistencia técnica es:

P ( X ≥ t min )=0,10

P ( X ≥ t min )=1−P ( X <t min ) =0,10

Despegando, se tiene que:

P ( X <t min )=0,90

Es decir tenemos que calcular el percentil 90.

Estandarizando.
209
Estadística Aplicada I 2022 01

P ( X <t min )=0,90

(
P Z<
t min −240
15 )
=0,90

Buscamos en la tabla normal estándar el valor más cercano a 0,90 (0,89973) y salimos a los
bordes de la tabla, luego el valor buscado es 1,28

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774

t min −240
=1,28
15

t min =259,2

El tiempo mínimo de vuelo para que dicho avión reciba asistencia técnica es 259,2 minutos.

En Excel, se usa la función =INV.NORM(0.9;240;15).

e. Si se seleccionan ocho vuelos que van a Rio de Janeiro, ¿cuál es la probabilidad de que a lo más
uno supera los 286 minutos de tiempo de vuelo.

Solución
Definimos la variable:

Y =¿: número de vuelos que superan los 286 minutos de tiempo de vuelo de una muestra de
ocho vuelos.

Y B ( n ; p)

Debemos determinar los parámetros de la distribución binomial.

n ∶=¿ número de repeticiones, es decir, n=8


p=P ( éxito )=P ( X >286 )

De la parte b, se sabe que la probabilidad de que el vuelo supere los 286 minutos es 0,00107.

Por lo tanto:
Y B (n=8; p=0,00107)

La probabilidad pedida es:

P ( Y ≤ 1 )=P ( Y =0 ) + P ( Y =1 )=f ( 0 ) +f (1)

P ( Y ≤ 1 )=C 80 × 0,001070 ×(1−0,00107)8 +C81 × 0,001071 ×(1−0,00107)7


210
Estadística Aplicada I 2022 01

P ( Y ≤ 1 )=0,99997

Usando Excel

En Excel, se usa la función P ( Y ≤ 1 )=¿ DISTR.BINOM.N(1;8;0.00107;1) = 0,99997.

Ejemplo 79
Una compañía telefónica ha determinado que el tiempo total de duración de las llamadas realizadas
mensualmente por sus clientes, medido en minutos, sigue una distribución normal de media 100 y
desviación estándar 25.

Solución

Definamos la variable:

X ≔ tiempo total de duración de las llamadas realizadas mensualmente por un cliente, en minutos

X N ( μ=100 ;σ =25 )
2 2

a. Calcular la probabilidad de que un cliente facture menos de dos horas en llamadas.

Usando la tabla normal estándar

La probabilidad pedida es:

P ( X <120 )

Estandarizando:

¿P ( X −μ
σ
<
120−μ
σ )=P ( Z <
120−100
25 )
¿ P ( Z <0,80 ) =0,78814

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646

Usando Excel

La probabilidad pedida es:

P ( X <120 )=0,78814

Se usa la función =DISTR.NORM.N(120;100;25;1)

b. ¿Cuál es la probabilidad de que un cliente facture entre 80 y 110 minutos?

La probabilidad pedida es:


211
Estadística Aplicada I 2022 01

P ( 80 ≤ X ≤ 110 )=0,44357

Se usa la función =DISTR.NORM.N(110;100;25;1)-DISTR.NORM.N(80;100;25;1)

c. La empresa decide iniciar una campaña para premiar a aquellos clientes que acumulen en
llamadas como mínimo tres horas. ¿Qué porcentaje de los usuarios se beneficiarán en dicha
campaña?

Usando la tabla normal estándar

La probabilidad pedida es:

P ( X >180 )=1−P ( X ≤180 )

(
¿ 1−P Z ≤
180−100
25 )
=1−P ( Z ≤ 3,20 )

¿ 1−0,999313=0,000687

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638

Usando Excel

La probabilidad pedida es:

P ( X >180 )=0,000687

Se usa la función =1-DISTR.NORM.N(180;100;25;1)

El porcentaje de los usuarios que se beneficiarán en dicha campaña es 0,0687%.

d. El gerente de ventas decidirá incentivar a los clientes que facturan poco con un sistema de
retribuciones. Desea incluir en ese programa al 4% de los clientes, siempre y cuando la duración
de llamadas realizadas al mes no supere los 60 minutos. Determine la duración total en minutos
que debe acumular como máximo un cliente para ser incluido en la promoción y con este
resultado ¿cuál será la decisión que debe tomar el gerente?

Resuelva considerando las dimensiones de la competencia razonamiento cuantitativo

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante El estudiante El estudiante El estudiante
identifica, el identifica la(s) muestra los compara los valores redacta la
problema que variable(s), formaliza cálculos calculados con el decisión que
debe solucionar, la probabilidad que realizados para criterio que le tomará a partir
con un lenguaje utilizará en la dar respuesta al permite tomar una del resultado de
sencillo, como solución del problema. decisión. su análisis.
pregunta u problema.
objetivo.

Solución
212
Estadística Aplicada I 2022 01

Interpretación
Determinar si se va a incentivar a los clientes que facturan poco con un sistema de retribuciones.

Representación
Vamos a usar la distribución normal y calcularemos la duración total en minutos que debe
acumular como máximo un cliente para ser incluido en la promoción.

Cálculo
Para calcular la duración total en minutos que debe acumular como máximo un cliente para ser
incluido en la promoción debemos calcular el percentil 4.

Usando tabla de distribución normal estándar

Nos piden calcular el percentil 4.

P ( X ≤ P 4 )=0,04

Estandarizando, se tiene que:

(
P Z≤
P 4−100
25 )
=0,04

Buscamos dentro de la tabla el valor más cercano a 0,04; en este caso, es 0,04006. Luego, salimos
a los bordes de la tabla, obteniendo el valor -1,75.

Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01


-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370

De la expresión estandarizada, se tiene que:

P 4−100
=−1,75
25

Despejando:

P4 =56,25 minutos

Usando Excel

En Excel, se usa la fución P4 =INV.NORM(0.04;100;25) = 56,23

Análisis
La duración total en minutos que debe acumular como máximo un cliente para ser incluido en la
promoción es 56,23 minutos que es menor a 60 minutos.

Argumentación
Por tanto, sí se va a incentivar a los clientes que facturan poco con un sistema de retribuciones,
pues 56,25 minutos es menor a 60 minutos.
213
Estadística Aplicada I 2022 01

Ejemplo 80

La corporación Metálica S.A. fabrica barras de construcción de acero. Se sabe que los pesos de las
barras de construcción de 5/8” de diámetro tienen distribución normal con media de 4,5 kg y
varianza de 0,64 kg2. Según disposición de la norma técnica si el peso de una barra de construcción se
encuentra entre 4,46 y 4,66 kilogramos se considera dentro de la especificación técnica.

¿Cuál es la probabilidad de que el peso de una barra seleccionada aleatoriamente se encuentre fuera
de la especificación técnica?

Solución
Definamos la variable:

X ≔ pesos de una barra de construcción de 5/8” de diámetro, en kilogramos


2
X N ( μ=4,5 ; σ =0,64)

La probabilidad pedida es:

P ( X < 4,46 ) + P ( X >4,66 )=1−P ( 4,46< X <4,66 )

¿ 1−0,09920=0,9008

En Excel, se usa la función =1-(DISTR.NORM.N(4.66;4.5;0.8;1)-DISTR.NORM.N(4.46;4.5;0.8;1))


214
Estadística Aplicada I 2022 01

Ejemplo 81
La empresa de bebidas gasificadas Coke’s tiene por política hacer un informe técnico del sistema de
embotellado de sus productos. Las normas indican que una máquina embotelladora está ajustada
para servir en promedio de 500 mililitros por botella. Si la cantidad de refresco se distribuye
normalmente con una desviación estándar de nueve mililitros.

a. ¿Cuál es la probabilidad que una botella contenga menos de 505 mililitros?

Solución

Definamos la variable:

X ≔ contenido de una botella en mililitros


2 2
X N ( μ=500 ; σ =9 )

La probabilidad pedida es:

P ( X <505 )=0,71074

En Excel, se usa la función =DISTR.NORM.N(505;500;9;1)

b. Las normas técnicas de llenado establecen que el contenido del líquido debe estar en el rango de
[490 – 510] mililitros. Si en la producción de un día, más del 25% de las botellas no cumplen las
normas técnicas se tendrá que parar la producción. ¿Cuál será la decisión?

Interpretación
Determinar si se tendrá que parar la producción.

Representación
Vamos a usar la distribución normal y calcularemos una probabilidad.

Cálculo
La probabilidad pedida es:

P ( 490 ≤ X ≤510 ) =0,73348

En Excel, se usa la función =DISTR.NORM.N(510;500;9;1)-DISTR.NORM.N(490;500;9;1)

Análisis
El porcentaje de botellas que no cumplen las normas técnicas es de 26,652% que es mayor al
25%.

Argumentación
Por tanto, sí se tendrá que parar la producción, pues 26,652% > 25%.

c. Si el llenado de botellas admite como máximo 520 mililitros ¿Cuántas botellas aproximadamente
se derramarán en las siguientes 1000 botellas?

Solución
La probabilidad de que derrame una botella es:
215
Estadística Aplicada I 2022 01

P ( X >520 )=0,013134

La cantidad de botellas que se derramarán aproximadamente es 1000 x 0,013134 = 13,1 botellas

d. ¿Debajo de qué valor se obtiene el 27% de botellas con menor contenido?

Solución

Calcularemos el percentil 27.

P ( X ≤ P 27 ) =0,27

En Excel, se usa la función =INV.NORM(0.27;500;9)

P27 =494,4847

e. Si se selecciona una muestra de seis botellas, ¿cuál es la probabilidad que ninguna de estas
botellas contenga más de 505 mililitros?

Solución

Definamos una nueva variable.

Y ≔número de botellas que contengan más de 505 mililitros

Y B (n=6 ; p=0,289257)

Calculemos la probabilidad de éxito.

p=P ( éxito )=P ( X >505 ) =0,289257

La probabilidad pedida es:


P ( Y =0 )=0,128906

En Excel, se usa la función =DISTR.BINOM.N(0;6;0.289257;0)

f. Calcule el contenido mínimo para estar en el 10% de las botellas con mayor contenido.

Solución

Calcularemos el percentil 90.

P ( X ≤ P 90) =0,9

En Excel, se usa la función =INV.NORM(0.9;500;9)

P90=511,534
216
Estadística Aplicada I 2022 01

El contenido mínimo para estar en el 10% de las botellas con mayor contenido es 511,534
mililitros.
217
Estadística Aplicada I 2022 01

Ejercicios

130. La vida útil de una lavadora automática se modela con una variable normal con una media de
3,1 años y una desviación estándar de 1,2 años. La lavadora tiene garantía de un año y, por
tanto, será reemplazada por una nueva si se malogra antes de un año. Calcule la probabilidad
de que una lavadora sea reemplazada por una nueva. Rpta.
0,0401

131. La corporación Metálica fabrica barras de construcción de acero. Se sabe que los pesos de las
barras de construcción de 5/8” de diámetro tienen distribución normal con media de 1,552 kg y
varianza de 0,16 kg2 por cada metro. Según disposición de la norma técnica si el peso de una
barra de construcción se encuentra entre 1,512 kg y 1,598 kg se considera dentro de la
especificación técnica.

a. Calcule la probabilidad de que el peso de una barra seleccionada aleatoriamente se


encuentre fuera de la especificación técnica. Rpta. 0,91439
b. Si el jefe de producción, al ver que es muy probable que las barras no cumplan las
especificaciones técnicas, desea saber cuál es el peso máximo del 45% de las barras que
presentan menos peso. Rpta. 1,50

132. Un blíster es un envase con una cavidad en forma de ampolla donde se aloja el producto, de tal
forma que permite presentarlo en el punto de venta y protegerlo de golpes. El proceso de
colado es la actividad final en la producción de las tabletas antes del blisteado. El tiempo de
colado se considera una variable aleatoria normalmente distribuida con media de 17 segundos y
una desviación estándar de 2,5 segundos. Según el departamento de producción el tiempo de
colado debe encontrarse entre 15 y 25 segundos.

a. Determine la probabilidad de que el tiempo de colado no se encuentre dentro del rango


establecido por el departamento de producción. Rpta. 0,21254
b. El departamento de producción clasificará las tabletas fabricadas de acuerdo con el tiempo de
colado en nivel bajo, medio y alto. El 35% de las tabletas fabricadas tienen un nivel bajo en el
tiempo de colado, el 45% un nivel medio y el 20% restante un nivel alto. Indique los tiempos
límites de colado en cada categoría. Rpta. 16,04; 19,10

133. Los bastidores que utilizan las máquinas torneadoras deben ser de muy buena calidad y
acabado para alargar el tiempo de vida útil de las máquinas. Según datos anteriores, el tiempo
de vida útil de una máquina torneadora tiene una distribución normal con media 600 días con
una variabilidad de 1089 días2. Si una máquina torneadora viene trabajando 570 días, calcule la
probabilidad de que su vida útil sea menor a 610 días. Rpta. 0,5345

134. El tiempo de incapacidad debido a un accidente laboral leve que tiene un trabajador de una
empresa durante un mes se modela con una variable normal con una media de 90 horas y una
desviación estándar de 18 horas. Si una persona ya tuvo 80 horas de incapacidad, calcule la
probabilidad de que tenga por lo menos 20 horas más. Rpta. 0,4071

135. Las notas finales del curso de Estadística Aplicada siguen aproximadamente una distribución
normal con una media de 12. Si el 95,44 % de los estudiantes que siguieron el curso obtuvieron
calificaciones entre 8 y 16.

a. Calcule el valor de la desviación estándar de las notas finales. Rpta. 2,00


b. Si la nota aprobatoria es 12,5, ¿qué porcentaje de alumnos aprobó el curso? Rpta. 40,13%
c. ¿Qué nota como mínimo debe tener un alumno para estar ubicado en el quinto superior?
218
Estadística Aplicada I 2022 01

Rpta. 13,68

136. La empresa de bebidas gasificadas Coke’s tiene por política hacer un informe técnico del
sistema de embotellado de sus productos. Las normas indican que una máquina embotelladora
está ajustada para servir en promedio de 500 mililitros por botella. Si la cantidad de refresco se
distribuye normalmente con una desviación estándar de cinco mililitros.

a. Calcule la probabilidad que una botella contenga menos de 503 mililitros. Rpta. 0,7257
b. Las normas técnicas de llenado establecen que el contenido del líquido debe estar en el
rango de [495 – 505] mililitros. Si en la producción de un día, más del 25% de las botellas no
cumplen las normas técnicas se tendrá que parar la producción. Indique si se detendrá la
producción. Rpta. 0,68269; se
detendrá
c. Si por error se toman botellas con capacidad de llenado máximo de 510 mililitros, ¿cuántas
botellas se espera que se derramen en las siguientes cien mil botellas? Rpta. 2275
d. ¿Debajo de qué valor se obtiene el 25% de botellas con menor contenido? Rpta. 496,63
e. Si se selecciona una muestra de seis botellas, calcule la probabilidad de que ninguna de
botella contenga más de 505 mililitros. Rpta.
0,35467
219
Estadística Aplicada I 2022 01

Propiedad reproductiva de la distribución normal


Igual que sucede con otras distribuciones, como la de Bernoulli, la binomial o la de Poisson, la
variable aleatoria de la distribución normal es reproductiva; esto quiere decir que, si sumamos
variables aleatorias de distribución normal, la variable suma también es otra variable de distribución
normal.

La reproductividad de la variable normal nos asegura que un histograma de estos valores tendrá el
aspecto de la curva de Gauss. La forma de saber los parámetros concretos (media y desviación
estándar) de la variable suma nos la da el siguiente resultado teórico.

Si X 1 , X 2 , X 3 ,… , X n son n variables aleatorias independientes, tales que:

X i N (μi ,❑2i )

para cada i=1 , 2 ,3 , ⋯ , n ; entonces, la variable aleatoria Y está distribuida normalmente.

n
S=c 1 X 1 +c 2 X 2 +…+ cn X n =∑ c i X i N ( μ S ; σ 2S )
i=1

donde c 1 , c2 , … , c nson constantes.

Media
n
E ( S )=μ S=c1 μ1 +c 2 μ2 +…+ c n μn =∑ c i μi
i=1

Varianza
n
V ( S )=σ 2S =c 21 σ 21+ c 22 σ 22+ …+c 2n σ 2n=∑ c2i σ 2i
i=1

Como caso particular, si tenemos que c i=1.

(∑ )
n n n
S= X 1 + X 2 +…+ X n=∑ X i N μ i ; ∑ σ 2i
i=1 i=1 i=1

Como casos particulares, si X 1 y X 2 tienen distribuciones normales X 1 N ( μ1 ; σ 1 ) y X 2 N ( μ2 ; σ 2 )


2 2

respectivamente, entonces:

S= X 1 + X 2 N ( μ 1+ μ 2 ; σ 21+ σ 22 )

S= X 1−X 2 N ( μ1−μ 2 ; σ 12+ σ 22 )


220
Estadística Aplicada I 2022 01

Ejemplo 82

En una industria metalmecánica, se tienen tres brazos mecánicos, sean X 1 , X 2 y X 3 el tiempo que se
demora un brazo en ensamblar una pieza de un producto.

X 1 ∶=¿ tiempo del brazo mecánico 1

X 1 N ( μ1=12 ; σ 21=0,02 )

X 2 ∶=¿ tiempo del brazo mecánico 2

X 2 N ( μ2=24 ; σ 22=0,03 )

X 3 ∶=¿ tiempo del brazo mecánico 3

X 3 N ( μ3=18 ; σ 23=0,04 )

a. ¿Qué distribución tendrá el tiempo total de ensamblaje?

Solución

Definamos la variable aleatoria:

S ∶=¿ tiempo total de ensamblaje

S= X 1 + X 2 + X 3

S= X 1 + X 2 + X 3 N ( μY =μ1 + μ2 + μ3 ; σ Y =σ 1+ σ 2 +σ 3 )
2 2 2 2

S= X 1 + X 2 + X 3 N ( μY =12+24+ 18; σ Y =0,02+0,03+0,04 )


2

S N ( μY =54 ; σ Y =0,09 )
2

b. ¿Cuál es la probabilidad de que el tiempo total de ensamblaje supere los 55 minutos?

Solución

La probabilidad pedida es:

P ( S >55 )=1−P ( S ≤ 55 )

Estandarizando:

(
¿ 1−P Z ≤
55−54
0,3 )
¿ 1−P ( Z ≤ 3,3333 )
221
Estadística Aplicada I 2022 01

Se redondea a dos cifras en la parte decimal para buscar en la tabla normal estándar.

¿ 1−P(Z ≤ 3,33)=1−0,9996=0,0004

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749

En Excel, se usa la función =1-DISTR.NORM.N(55;54;0.3;1).

c. Calcule la probabilidad de que el tiempo total de ensamblaje sea a lo más de 54,6 minutos.

Solución

La probabilidad pedida es:

P ( S ≤ 54,6 )

Estandarizando.

(
¿ P Z≤
54,6−54
0,3 )
¿ P ( Z ≤2 ) =0,9772

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537

En Excel, se usa la función =DISTR.NORM.N(54.6;54;0.3;1) = 0,97725.

Ejemplo 83

El transporte es un punto importante en el traslado de la carga vía terrestre. Por estudios anteriores
se sabe que el costo de un producto a transportar hacia su destino sigue una distribución normal con
media de 14 dólares y una desviación estándar de tres dólares. Urbaner desea llevar productos a
transportar al Cono Norte de Lima.

a. ¿Cuál es la probabilidad de que el costo de transportar 100 productos supere los 1450 dólares?

Solución

Sean las variables:

X i ∶=¿ costo de transporte de un producto; i=1 , 2 ,… , 100

X i N ( μi=14 ; σ 2i =3 2)
222
Estadística Aplicada I 2022 01

S ∶=¿ costo total de transportar cien productos

S= X 1 + X 2 +…+ X 100

Por propiedad reproductiva de la normal, la distribución de S es:

S= X 1 + X 2 +⋯ + X 100 N ( μ S=μ1 + μ2 +⋯ + μ100 ; σ 2S=σ 21 +σ 22 + ⋯+σ 2100 )

S= X 1 + X 2 +⋯ + X 100 N ( 14+ 14+⋯ +14 ; 32 +32 +⋯ +32 )

S N ( μS =1400 ; σ 2S =900 )

La probabilidad pedida es:

P ( Y >1450 )

Cálculo usando la estandarización de la variable

P ( S >1450 )=1−P ( S ≤ 1450 )

Estandarizando:

(
¿ 1−P Z ≤
1450−1400
√ 900 )
=1−P Z ≤
5
3 ( )
Para poder usar la tabla normal estándar, redondeamos el valor de Z a dos decimales.

¿ 1−P ( Z ≤ 1,67 )

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327

¿ 1 – 0,95254=0,04746

Cálculo usando Excel

En Excel, se usa la función

P ( S >1450 )=1-DISTR.NORM.N(1450;1400;30;1) = 0,04779

b. El jefe de logística establece la siguiente condición, si el valor de la probabilidad de que el costo


de transportar 100 productos supere los 1450 dólares es mayor al 10%, optará por subcontratar
a una empresa de transporte alternativa para abaratar sus costos; caso contrario, Urbaner se
establecerá como el único distribuidor de productos para el Cono Norte de Lima.

Solución

La probabilidad pedida es:


223
Estadística Aplicada I 2022 01

P ( S >1450 )=0,04746

Como la probabilidad es menor al 10% (4,746% < 10%), por lo tanto, Urbaner sería el único
distribuidor de productos para el Cono Norte de Lima.

Ejemplo 84

La temperatura de un contenedor es muy importante para mantener la calidad y peso de un


producto hasta llegar a su destino final.

• Un producto es empacado con un peso promedio de 20 gramos y una variabilidad de 4 gramos 2,


cuyo peso se distribuye normalmente.
• Los registros de pérdida de peso por evaporación de dicho producto empacado muestran una
perdida media de 6,45 gramos con una desviación estándar de 1,3 gramos, la pérdida de peso
tiene una distribución normal.

El ingeniero de producción desea determinar el peso restante del producto al llegar a su destino
final.

a. ¿Cuál es la probabilidad de que el peso restante del producto al llegar a su destino sea mayor a
15 gramos?

Solución

Sean las variables:

X 1 ∶=¿ peso del producto al empacar

Como dice que la variabilidad es de 4 gramos2, se refiere a la varianza pues está en unidades al
cuadrado.

X 1 N ( μ1=20 ;σ 1=4 )
2

X 2 ∶=¿ pérdida de peso por evaporación

X 2 N ( μ2=6,45 ;σ 22=1,32 )

S ∶=¿ peso final del producto

Por la propiedad reproductiva de la normal, la distribución de S es:

S= X 1−X 2 N ( μ1−μ 2 ; σ 1 + σ 2 )
2 2

S= X 1−X 2 N ( μ1−μ 2=20−6,45 ;σ 1+ σ 2=4+1,3 )


2 2 2

S N ( 13,55 ; 5,69 )

La probabilidad pedida es:


224
Estadística Aplicada I 2022 01

P ( S >15 )

Cálculo usando la estandarización de la variable

P ( S >15 )=1−P ( S ≤ 15 )

(
¿ 1−P Z ≤
15−13,55
2,385 )
¿ 1−P ( Z ≤ 0,607966 )

Para poder usar la tabla normal estándar, redondeamos el valor de Z a dos decimales.

¿ 1−P ( Z ≤ 0,61 )

Usando la tabla de distribución normal estándar.

¿ 1 – 0,7291=0,2709

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230

Cálculo usando Excel

En Excel, se usa la función:

P ( S >15 ) =1-DISTR.NORM.N(15;13.55;RAIZ(5.69);1) = 0,27164

La diferencia se debe al redondeo del valor de Z a dos decimales.

b. Si el valor de la probabilidad que el peso restante del producto al llegar a su destino sea mayor a
15 gramos es mayor al 25%; el ingeniero de producción optará por transportar sus productos a
su destino final usando contenedores aislantes para evitar la pérdida de peso por evaporación.
Indique la decisión tomará el ingeniero de producción.

Solución

Ya hemos calculado que:

P ( S >15 )=0,2709

Como la probabilidad es mayor al 25% (27,09% > 25,00%), por lo tanto, el ingeniero de control
usará contenedores aislantes.
225
Estadística Aplicada I 2022 01

Ejercicios

137. La empresa fabricante de detergentes Clean tiene asignada una máquina para el llenado y
sellado de las bolsas de detergente. El peso de detergente que la máquina deposita en las
bolsas se modela con una variable normal con media de 130 gramos y desviación estándar de 4
gramos y que el peso de las bolsas vacías utilizadas en el embolsado del detergente se modela
con una variable normal con media 20 gramos y una desviación estándar de 1,2 gramos.

a. Se toma al azar una bolsa llena de detergente a la salida del proceso de embolsado. Calcule
la probabilidad de que tenga un peso mayor a 155 gramos. Rpta. 0,11560
b. Calcule el peso mínimo de una bolsa llena de detergente para estar considerada en el 14,46%
de las bolsas con mayores pesos. Rpta. 154,43

138. En la estación de servicio se vende gasolina de 90, 95 y 97 octanos, los precios por galón son
12,8; 15,6 y 16,2 soles respectivamente.

Sean X 1 , X 2 , X 3 la cantidad de galones vendidos de cada tipo en un día en particular. Además,


se sabe que X 1 , X 2 , X 3 son variables independientes y se distribuyen normalmente con medias
960, 1600 y 300 galones y desviaciones estándares de 90, 150 y 25 galones, respectivamente.
Determine la media y la desviación estándar del ingreso por la venta de gasolina en un día en
particular. Rpta. 42108; 2639,46

139. Dos baterías de las marcas A y B tienen una durabilidad que se modela con dos variables
aleatorias independientes normales con medias 4000 y 4200 horas y desviaciones estándares de
36 y 38 horas respectivamente. Calcule la variabilidad relativa de la diferencia de la durabilidad
de las baterías de la marca B y la marca A. Rpta. CV = 26,17%

140. El peso de un adulto peruano puede modelarse con una variable aleatoria normal. El peso
medio para los varones es de 72 kilos y de 64 kilos para las mujeres, mientras que sus
desviaciones estándar fueron de ocho kilos y cuatro kilos, respectivamente.
a. Si se elige, al azar, a un hombre y una mujer, calcular la probabilidad de que la mujer pese
más que el hombre.
b. Si se elige a dos hombres y a dos mujeres, calcular la probabilidad de que la suma total de
pesos supere los 260 kilos.
c. Si en un grupo de peruanos, el 60% de las personas son varones y se elige a una persona al
azar, calcule la probabilidad de que dicha persona pese entre 65 y 72 kilos.
226
Estadística Aplicada I 2022 01

Unidad 3. Distribuciones
muestrales en muestreo

Logro

Al término de la unidad 5, el estudiante aplica los conceptos de distribuciones muestrales para la


toma de decisiones y estima un tamaño de muestra optimo para dar respuesta a un problema en el
ámbito de su especialidad.

Temario

 Distribución normal y aplicaciones


 Propiedad reproductiva de la distribución normal
 Distribución muestral de la media
 Teorema central del límite
 Introducción al muestreo
 Tamaño de muestra
227
Estadística Aplicada I 2022 01

Distribución muestral
A partir de la población se puede tomar muestras del mismo tamaño ( n ). Los estadísticos tomarán
diferentes valores de muestra en muestra. Una distribución muestral es la lista de posibles valores de
un estadístico y la probabilidad asociada a cada valor. Se puede construir varias distribuciones
muestrales a partir de una población y dependerá del tipo de estadístico que se tome como
referencia.

Distribución probabilística de la media muestral


La distribución probabilística de la variable media muestral X es la lista de todas las medias posibles
de tamaño n tomadas de una población específica.

La media de la media muestral es:

μ X =μ X

La varianza de la media muestral es:


2
2 σX
σ =
X
n

Distribución muestral de la media

Esperado y varianza de la media muestral

Sea X es una variable aleatoria con media 𝜇 y varianza 𝜎2, es decir,

X ? ( μ ; σ 2)

• Si el muestreo es con reemplazo o si la población es infinita, es decir, el tamaño de la población


N no se conoce, el esperado y la varianza para la variable aleatoria media muestral X son:

E ( X ) =μ X =μ X

2
2 σ
σ X=
n

( )
2
σ
X ? μ;
n

• Si el muestreo es sin reemplazo o si la población es finita, es decir, el tamaño de la población N


se conoce), el esperado y la varianza para la variable aleatoria media muestral X son:

E ( X ) =μ X =μ X

2
σ X= (
σ 2 N−n
n N−1 )
228
Estadística Aplicada I 2022 01

( ( ))
2
σ N−n
X ? μ;
n N −1

Distribución de la media muestral de una población normal

Sea X es una variable aleatoria con distribución normal con media 𝜇 y varianza 𝜎2;

X N (μ;σ )
2

entonces, se cumple que la variable media muestral X es una variable aleatoria normal, para n ≥ 2.

X N μ, ( )
σ2
n

Si, además, se conoce el tamaño poblacional, entonces la distribución de la media muestral es:

( ( ))
2
σ N −n
X N μ,
n N −1

Teorema del límite central

Sea X es una variable aleatoria (discreta o continua) con media 𝜇 y varianza 𝜎2.

Entonces se cumple que, para n ≥ 30, la media muestral X se aproxima a una distribución normal.

( )
X ≈ N μ,
σ2
n

Si, además, se conoce el tamaño poblacional, entonces la distribución de la media muestral es:

( ( ))
2
σ N −n
X ≈ N μ,
n N −1

Ejemplo 85

La duración de una pila tiene distribución normal con media 100 horas y desviación estándar de 20
horas. Si se selecciona una muestra aleatoria de 16 pilas, calcule la probabilidad de que la media
muestral sea mayor a 105 horas.

Solución

Definamos las variables necesarias.

X := tiempo de duración de una pila, en horas


229
Estadística Aplicada I 2022 01

X N ( μ=100 , σ 2=202 )

X := media muestral del tiempo de duración de las 16 pilas, en horas

(
X N μ=100 ,
σ 2 202
=
n 16 )
X N ( 100; 25 )

X N ( 100 ; 52 )

La probabilidad pedida es la probabilidad de que la media muestral sea mayor a 105 horas, es decir:

P( X > 105)

Cálculo usando la estandarización de la variable

Estandarizando
P( X > 105)=1−P ( X ≤105 )

¿ 1−P Z ≤ ( 105−100
5 )
¿ 1−P ( Z ≤ 1 )=1−F ( 1 )

De la tabla normal estándar.

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298

¿ 1−0,8413=0,1587

La probabilidad de que la media muestral supere las 105 horas es 0,1587.

Cálculo usando Excel

La probabilidad pedida es la probabilidad de que la media muestral sea mayor a 105 horas, es decir:

P ( X >105 )=0,1587

En Excel se usa =1-DISTR.NORM.N(105;100;5;1) = 0,1587

Ejemplo 86

La distribución del ingreso familiar en Lima Metropolitana es asimétrica, con sesgo hacia la derecha.
El último censo revela que el ingreso familiar medio es de 1667 soles con una desviación estándar de
230
Estadística Aplicada I 2022 01

200 soles. En una muestra aleatoria de 180 familias, calcule la probabilidad de que el ingreso familiar
medio de la muestra difiera del ingreso familiar medio de la población en menos de 35 soles.

Solución

Sea X := ingreso familiar en Lima Metropolitana, en soles

X ¿ ? ( μ=1667 , σ 2=2002 )

Sea X := media muestral del ingreso de las 180 familias en Lima Metropolitana

(
X ≈ ¿ ? μ=1667 ,
σ 2 200 2
=
n 180 )
Por el teorema del límite central para n = 180 > 30, se cumple que:

(σ 2 2002
X ≈ N μ=1667 , =
n 180 )
( )
2
σ
X ≈ N μ=1667 , =222,2222
n

Donde, la desviación estándar de X es:

σ X = √ 222,2222=14,9071

La probabilidad pedida es:

P (|X −μ|<35 )

Efectuando el valor absoluto, se tiene que:

P (−35< X −μ<35 )

Cálculo usando la estandarización de la variable

Estandarizando la variable media muestral X .

( )
−35 X−μ 35
P < <
σ σ σ
√n √n √n
Reemplazando los valores de la desviación estándar y del tamaño de muestra:

P ( 14,9071
−35
<Z<
14,9071 )
35

P (−2,35< Z<2,35 )
231
Estadística Aplicada I 2022 01

Usando la tabla normal estándar.

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361

z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390

¿ F ( 2,35 ) −F (−2,35 )=0,99061−0,00939=0,98122

La probabilidad de que la media muestral del ingreso familiar difiera del ingreso familiar medio
poblacional en menos de 35 soles es 0,98122.

Cálculo usando Excel

La probabilidad pedida es:

P (|X −μ|<35 )

P (−35< X −μ<35 )

¿ P (−35+1667< X < 35+1667 )

¿ P ( 1632< X <1702 )

=DISTR.NORM.N(1702;1667;14.9071;1)-DISTR.NORM.N(1632;1667;14.9071;1)

¿ 0,98122

Ejemplo 87
Una máquina embotelladora de gaseosas envasa su producto en botellas cuyo contenido sigue una
distribución normal con media igual a 12 onzas y varianza 0,0625 onzas 2. Las especificaciones de
calidad establecen que el contenido debe estar en el intervalo [11,75; 12,25].

Si se eligen seis botellas al azar, calcule la probabilidad de que la media del contenido de las seis
botellas esté fuera de los límites establecidos.

Solución

Definamos las variables necesarias.

X ≔contenido de gaseosa en una botella

X N ( μ=12 ; σ =0,0625 )
2

X ≔media muestral de los contenidos de gaseosa de las seis botellas


232
Estadística Aplicada I 2022 01

(
X N μ=12;
σ 2 0,0625
n
=
6 )
X N ( 12; 0,0104167 )

La probabilidad pedida es que el contenido promedio de las seis botellas esté fuera de los límites
establecidos, es decir:

P ( X <11,75 ) + P ( X >12,25 )

Cálculo usando Excel

P ( X <11,75 ) + P ( X >12,25 )=0,00715+0,00715=0,01430

Se usa

P ( X <11,75 ) =DISTR.NORM.N(11.75;12;0.1020621;1) ¿ 0,00715

P ( X >12,25 ) =1-DISTR.NORM.N(12.25;12;0.1020621;1) ¿ 0,00715

Ejemplo 88
El tiempo que demora un cliente en ser atendido con un nuevo sistema en cierta agencia bancaria es
una variable aleatoria con media igual a 1,5 minutos y desviación estándar de 0,35 minutos. Suponga
que esta agencia bancaria cuenta con un total de 200 clientes y X 1 , X 2 , …, X 40 es una muestra sin
reemplazo de esta población.

Calcule la probabilidad de que el tiempo promedio de atención de la muestra de clientes esté entre
1,40 y 1,75 minutos.

Solución

Definamos las variables necesarias.

X ≔tiempo que demora un cliente en ser atendido con un nuevo sistema en una agencia bancaria

X ¿ ? ( μ=1,5; σ 2=0,352 )

X ≔media muestral de los tiempos que demoran 40 clientes en ser atendidos

(
X ¿ ? μ=1,5 ; ( ) (
σ 2 N −n 0,35 2 200−40
n N −1
=
40 200−1 ))
X ¿ ? ( 1,5 ; 0,00246231 )

Como el tamaño de muestra n = 40 ≥ 30, usaremos el teorema del límite central, luego la variable
media muestral X se distribuye aproximadamente normal.

X ≈ N ( 1,5; 0,00246231)
233
Estadística Aplicada I 2022 01

La probabilidad pedida es que el tiempo promedio de atención de la muestra de clientes sea a lo más
de 1,75 pero mayor a 1,40 minutos, es decir:

P ( 1,40< X ≤1,75 )

Cálculo usando la estandarización de la variable

P ( 1,40< X ≤1,75 )

P ( √1,40−1,50
0,00246231
<X ≤
√0,00246231 )
1,75−1,50

P ( 2,01525<Z ≤5,03812 )

Redondeando el valor de Z a dos decimales.

P (−2,02<Z ≤5,04 )

Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872

P (−2,02<Z ≤5,04 )=1−0,02169=0,97831

Cálculo usando Excel

P ( 1,40< X ≤1,75 )=0,97806

Se usa la función:

¿DISTR.NORM.N(1.75;1.5;0.049622;1)-DISTR.NORM.N(1.4;1.5;0.049622;1)

Ejemplo 89

El tiempo (en minutos) hasta que ocurra el primer pedido de acceso a una base de datos cada día es
descrito como una variable aleatoria continua exponencial T con media igual a dos minutos. Si de 36
días escogidos al azar se sumaran los tiempos hasta que ocurra el primer pedido de cada día, ¿cuál es
la probabilidad de que dicha suma supere los 84 minutos?

Solución
Definamos las variables necesarias.

T ≔tiempo (en minutos) hasta que ocurra el primer pedido de acceso a una base de datos cada día

T exp ( β=2 )

La media de T es:

μ= β=2
234
Estadística Aplicada I 2022 01

La varianza de T es:

2 2
σ =β =4

S ≔ suma muestral de los tiempos (en minutos) hasta que ocurra el primer pedido de los 36 días

La probabilidad pedida es que dicha suma supere los 84 minutos, es decir:

P ( S >84 )

Vamos a dividir la suma entre n para obtener la media muestral.

P ( Sn > 84n )
(
¿P T>
84
36 )
=P ( T >2,3333 )

Definamos la variable T .

T ≔media muestral de los tiempos hasta que ocurra el primer pedido de los 36 días

(
T ¿ ? μ=2 ;
σ2 4
=
n 36 )
Como el tamaño de muestra n = 36 ≥ 30, usaremos el teorema del límite central.

(
T ≈ N μ=2 ;
σ2 4
=
n 36 )
T ≈ N ( 2 ; 0,111111 )

Luego, se tiene que la probabilidad pedida es:

P ( S >84 )=P (T >2,3333 ) =0,158679

En Excel, se usa =1-DISTR.NORM.N(2.3333;2;0.333333;1)

Ejemplo 90

Se sabe que el tiempo de producción de fierros de construcción tiene una distribución normal come
dia igual a 15 minutos y varianza igual a 2,1 minutos 2. Se toma al azar una muestra de 25 fierros y se
pide calcular lo siguiente:

a. Calcule la probabilidad que la media del tiempo de producción se encuentre entre 12 y 16


minutos.
b. El área de calidad determina que, si el porcentaje que el tiempo promedio de producción se
encuentra entre 12 y 16 minutos es mayor que 60%, entonces comprará otra máquina
laminadora. ¿Se comprará otra máquina laminadora?
235
Estadística Aplicada I 2022 01

c. ¿Cuál es el tiempo promedio que se requiere para estar en el 40,129% de los tiempos de
producción más bajos?

Solución

a. Calcule la probabilidad que la media del tiempo de producción se encuentre entre 12 y 16


minutos.

Solución

Definamos las variables necesarias.

X ≔tiempo de producción de fierros de construcción

X N ( μ=15 ;σ 2=2,1 )

X ≔media muestral de los tiempos de producción de 25 fierros de construcción

( )
2
σ 2,1
X N μ=15 ; =
n 25

X N ( 15; 0,084 )

La probabilidad pedida es que la media del tiempo de producción de los 25 fierros se encuentre
entre 12 y 16 minutos, es decir:

P ( 12< X <16 ) =0,99972

En Excel se usa =DISTR.NORM.N(16;15;0.289828;1)-DISTR.NORM.N(12;15;0.289828;1).

b. El área de calidad determina que, si el porcentaje que el tiempo promedio de producción se


encuentra entre 12 y 16 minutos es mayor que 60%, entonces comprará otra máquina
laminadora. ¿Se comprará otra máquina laminadora?

Solución

La probabilidad pedida es que la media del tiempo de producción de los 25 fierros se encuentre
entre 12 y 16 minutos, es decir:

P ( 12< X <16 ) =0,99972

Como el porcentaje pedido es mayor al 60% (99,972% > 60%), por tanto, sí comprará otra
máquina laminadora.

c. ¿Cuál es el tiempo promedio que se requiere para estar en el 40,129% de los tiempos de
producción más bajos?

Solución

Tenemos que:
236
Estadística Aplicada I 2022 01

X N ( 15; 0,084 )

Nos piden calcular el percentil 40,129, que es 14,9275 minutos.

En Excel, se usa =INV.NORM(0.40129;15;RAIZ(0.084)).


237
Estadística Aplicada I 2022 01

Ejercicios

141. La duración de un componente eléctrico sigue una distribución exponencial con una media de
1000 horas.

a. Calcular la probabilidad de que la media de las duraciones de 50 componentes esté entre 980
y 1020 horas.
b. Calcular la probabilidad de que la suma de las duraciones de 50 componentes sea de más de
54000 horas.

142. Sea X una variable aleatoria normal que denota la concentración de cierto contaminante con
una media de 10 partes por millón y una desviación estándar de 1,25 partes por millón. Se
considera tóxica una concentración cuando posee más de nueve partes por millón. Se toma una
muestra aleatoria de nueve concentraciones de este contaminante, calcule la probabilidad de
que la concentración promedio muestral sea mayor a nueve partes por millón. Rpta.
0,9918

143. El tiempo de descarga de una batería de cierto modelo de celular se modela con una variable
exponencial con media igual a 18 horas. ¿Cuál es la probabilidad de que la suma del tiempo de
las descargas de una muestra aleatoria de 36 de estas baterías supere las 666 horas?
Rpta. 0,4338

144. Se sabe que el tiempo de producción de fierros de construcción tiene una distribución normal
come dia igual a 15 minutos y varianza igual a 2,1 minutos 2. Se toma al azar una muestra de 25
fierros, calcule la probabilidad que la media del tiempo de producción se encuentre entre 12 y
16 minutos.

145. El tiempo, en minutos, que se tarda una persona en realizar una tarea puede modelarse por una
variable aleatoria con la siguiente función de densidad.

{
x
0< x <10
f ( x)= 50
0 en otro caso

Si se toma al azar una muestra de 32 personas, calcule la probabilidad de que el tiempo medio
que se tardan en realizar dicha tarea sea más de 7 minutos.

146. Se lanza un dado mil veces y se registra el número de la cara superior. Calcule la probabilidad de
que la media muestral de los mil lanzamientos esté entre 3,4 y 3,6.
238
Estadística Aplicada I 2022 01

Muestreo
Un gran objetivo de la Estadística es hacer inferencias acerca de una población con base en
información en una muestra. Esto motiva el estudio del problema del muestreo. Muchos estudios
estadísticos se inician con la selección de una muestra. Este proceso recibe el nombre de muestreo el
cual comprende:

 Definición de la población objetivo y búsqueda del marco muestral.


 Determinación del tamaño de la muestra.
 Elección del tipo de muestreo y selección de las unidades.
 Registro de las observaciones.

Unidad elemental
Es el objeto sobre el cual se hace la medición. También llamada unidad de observación, unidad de
análisis. unidad estadística o elemento. Por ejemplo, en estudios de poblaciones humanas, con
frecuencia ocurre que la unidad elemental es cada individuo. También podría ser por ejemplo una
empresa, un colegio o un día, dependiendo de los objetivos y de la información que se quiere
recolectar.

Población muestreada
Es el conjunto de todas las unidades elementales posibles que podrían extraerse en una muestra; es
decir, es la población de donde se extrae la muestra.

Unidad de muestreo
Es la unidad donde realizamos la muestra.

Por ejemplo, podríamos querer estudiar a las personas, pero no tenemos una lista de todos los
individuos que pertenecen a la población objetivo. En vez de eso, la unidad de muestreo es cada
familia y la unidad elemental es cada individuo que vive en una familia.

Marco muestral
Es una lista de las unidades de muestreo que están disponibles para elección. Generalmente la
unidad elemental es la unidad de muestreo, pero no siempre.

Muestreo no probabilístico
El muestreo no probabilístico es una técnica de muestreo donde las muestras se recogen en un
proceso que no brinda a todos los individuos de la población iguales oportunidades de ser
seleccionados. A diferencia del muestreo probabilístico, no es un producto de un proceso de
selección aleatoria. Los sujetos en una muestra no probabilística generalmente son seleccionados en
función de su accesibilidad o a criterio personal e intencional del investigador.

La desventaja es que esta muestra no es representativa. Por lo tanto, los resultados de la


investigación no pueden ser utilizados en generalizaciones respecto de toda la población.
239
Estadística Aplicada I 2022 01

Muestreo probabilístico

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de


equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser seleccionadas.

Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra


extraída y son, por tanto, los más recomendables ya que con este tipo de muestreos se pueden
realizar inferencias o generalizaciones sobre la población.

Tipos de muestreo probabilístico

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de


equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser seleccionadas.

Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra


extraída y son, por tanto, los más recomendables.

Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

aleatorio simple sistemático estratificado

Se selecciona una muestra Se selecciona un primer Se selecciona la muestra de


en forma aleatoria y sin elemento aleatoriamente y, los diversos estratos. Un
reemplazo a n unidades de luego, los demás elementos estrato es una parte de la
muestreo de una población que conformarán la muestra población, cuyos elementos
que contiene un total de N cada cierto intervalo. Este tienen características
unidades. Se garantiza que muestreo supone que se similares. El objetivo de
cada una de las muestras cuenta con una estratificar la población es
posibles tiene la misma enumeración completa de buscar homogeneidad entre
probabilidad de ser elegida. los elementos de la los estratos.
población.
240
Estadística Aplicada I 2022 01

Ficha técnica

La ficha técnica es el documento donde consta la metodología y el proceso que se ha seguido para
realizar un estudio social o de mercado.

En el caso de los estudios cuantitativos, la información a incluir es la siguiente:


 Descripción del universo
 Metodología de selección de la muestra
 Tamaño muestral
 Nivel de confianza y margen de error con el que se presentan los resultados
 Técnica aplicada para realizar el trabajo de campo
 Período de recogida de la información

Ejemplo de ficha técnica


241
Estadística Aplicada I 2022 01

Elección de la muestra

Se seleccionará los elementos del marco de muestreo que conformarán la muestra aplicando la
técnica de muestreo apropiada para el estudio que se desea llevar a cabo.
242
Estadística Aplicada I 2022 01

Uso de la tabla de números aleatorios


Está formada por 20 columnas. Se elige la columna deseada y las columnas necesarias hacia la
derecha. Para elegir un número dentro de un rango, se hace por caída libre. Por ejemplo, elegir un
número entre 1 y 200.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
243
Estadística Aplicada I 2022 01
244
Estadística Aplicada I 2022 01

Muestreo aleatorio simple

Es el procedimiento por el cual se selecciona una muestra en forma aleatoria y sin reemplazo a n
unidades de muestreo de una población que contiene un total de N unidades.
Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.

Pasos por seguir para seleccionar una muestra simple aleatoria

1. Enumere las unidades del marco muestral con números sucesivos.

2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios.

3. La selección de las unidades se realiza sin reemplazo.

El muestreo aleatorio simple presenta dos propiedades:

 Equiprobable: Cada unidad tiene las mismas posibilidades de ser elegida.


 Independencia: La selección de una unidad no influye en la selección de otras unidades.

Pero en el mundo real es difícil encontrar muestras completamente independientes y


representativas.

Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un método
no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono y cuenta
varias veces a los que tienen varios números.
245
Estadística Aplicada I 2022 01

Ejemplo 91

Se desea seleccionar una muestra de cinco clientes usando muestreo aleatorio simple y se tiene el
marco muestral, la lista enumerada de la población de clientes de la empresa de 350 clientes. Use las
columnas C6, C15 y C4.

Marco muestral
Número Cliente
001 Carlos Torres
002 Manuel Benavides
003 Ricardo Montoya
004 Rosario Castro
⋮ ⋮
349 Julia Martín
N = 350 Renato Alvarado

Solución

Se debe seleccionar cinco números del 1 al 350 sin reemplazo, es decir sin que se repitan. El número
máximo por seleccionar es 350 que tiene tres dígitos, entonces tomaremos de la tabla de números
aleatorios tres columnas consecutivas.

Comenzaremos con la columna C6 para iniciar la selección. Se tomarán tres columnas consecutivas
hacia la derecha a partir de C6, esto es: C6 C7 C8. Los números deben estar comprendidos entre 1 y
350.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8

Los números seleccionados serán: 84; 40; 124; 245 y 332. Las columnas C15 y C4 no se usarán.
246
Estadística Aplicada I 2022 01

Ejemplo 92

El gerente de una empresa automotriz que tiene un total de 150 empleados requiere seleccionar a
12 empleados al azar para que conformen un equipo de prueba, utilizando un nuevo método de
transporte y para estimar el ingreso mensual.

A continuación, se muestra el número o código del colaborador y su ingreso quincenal en soles.

Trabajadores registrados (Marco muestral)


Ingreso Ingreso Ingreso Ingreso
Nº Nº Nº Nº
quincenal quincenal quincenal quincenal
1 2300 39 2600 77 1800 115 1700
2 2800 40 2700 78 1700 116 2600
3 2400 41 2100 79 1700 117 1600
4 2500 42 2300 80 1700 118 1800
5 2300 43 1700 81 1700 119 2100
6 2100 44 2200 82 2100 120 1700
7 1700 45 2900 83 2600 121 2400
8 2000 46 1800 84 2400 122 2600
9 2200 47 2100 85 2600 123 2100
10 2100 48 2000 86 1900 124 2100
11 1700 49 2000 87 1600 125 2400
12 2500 50 2900 88 1900 126 1700
13 2800 51 2100 89 2100 127 2600
14 2400 52 2100 90 1700 128 2400
15 1700 53 1800 91 2100 129 2700
16 2400 54 2000 92 1700 130 2100
17 2200 55 2100 93 2300 131 1600
18 2200 56 1900 94 2500 132 2100
19 2300 57 2000 95 2600 133 1900
20 2800 58 2300 96 1900 134 2100
21 2100 59 2000 97 2500 135 2200
22 1700 60 1700 98 1800 136 2400
23 2500 61 1900 99 1700 137 1800
24 2400 62 2000 100 2000 138 2600
25 2700 63 2400 101 2400 139 2700
26 1700 64 1700 102 1700 140 2500
27 1600 65 1700 103 2500 141 2500
28 2600 66 2400 104 1700 142 1900
29 2500 67 2500 105 2400 143 2100
30 2500 68 2600 106 2400 144 1700
31 2700 69 2100 107 1900 145 1500
32 1700 70 1900 108 1700 146 1800
33 1600 71 2000 109 2100 147 2100
34 2400 72 1800 110 2000 148 2700
35 1900 73 2100 111 2000 149 1800
36 1800 74 2300 112 2500 150 2100
37 1800 75 2700 113 1700
38 2400 76 2800 114 2500

a. Seleccione una muestra de 12 trabajadores usando muestreo aleatorio simple. Elabore un listado
con el número o código seleccionado y el valor del ingreso quincenal. Considere las columnas C4,
247
Estadística Aplicada I 2022 01

C8, C11 y C15 de la tabla de números aleatorios para la selección. ¿A qué colaboradores
seleccionará para conformar el equipo de prueba?

Seleccionaremos 12 elementos del marco muestral. Como el marco muestral tiene 150 elementos
y este valor tiene 3 cifras o dígitos, entonces se utilizarán 3 columnas consecutivas para
seleccionar los elementos, se iniciará la selección con las columnas C4 C5 C6.

Número Ingreso quincenal Número Ingreso quincenal


114 2500 105 2400
081 1700 098 1800
134 2100 126 1700
148 2700 064 1700
039 2600 109 2100
097 2500 122 2600

b. Con la muestra obtenida estime el ingreso promedio mensual.

El ingreso promedio mensual es X = 2200 soles.


248
Estadística Aplicada I 2022 01

Muestreo estratificado
Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de
sus elementos. El objetivo del diseño estratificado es dar un tratamiento especial a cada estrato, ya
sea por razones administrativas, de costo, logísticas o minimizar variabilidad. La característica del
estrato es que dentro del él los datos son homogéneos pero heterogéneos entre sí.

Pasos para seleccionar una muestra estratificada


1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a
todos los elementos de la población y que cada elemento pertenezca solamente a un estrato.
2. Una vez conocido el tamaño de muestra a seleccionar, calcule la cantidad de elementos a
seleccionar en cada estrato de manera proporcional al tamaño de cada estrato. El tamaño de
muestra para cada estrato se obtiene mediante la siguiente fórmula:
Nh
n h= ×n
N
3. Seleccione muestras aleatorias simples para cada uno de los estratos.
Recomendaciones para el uso de muestras estratificadas

 Si se usa más de una variable para formar los estratos, no deben estén relacionadas entre sí.
 No se deben considerar la formación de muchos estratos, generalmente se usan entre tres y
ocho.
 Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto, pueden no
ser considerados.
 La variable de estratificación la suele sugerir el investigador o el estadístico.
249
Estadística Aplicada I 2022 01
250
Estadística Aplicada I 2022 01

Ejemplo 93

La empresa de telecomunicaciones RVTV tiene 120 empleados de los cuales tiene información de las
variables: ingreso mensual, en soles; nivel de educación y años en la empresa (Años).

Nivel de Nivel de Nivel de


Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años
educación educación educación
1 2300 Secundaria 5 41 2100 Técnica 13 81 2000 Superior 3
2 2800 Secundaria 11 42 2100 Técnica 9 82 2500 Superior 13
3 2400 Secundaria 4 43 1800 Técnica 1 83 1700 Superior 0
4 2500 Secundaria 2 44 2000 Técnica 9 84 2500 Superior 19
5 2300 Secundaria 3 45 2100 Técnica 10 85 1700 Superior 3
6 2100 Secundaria 2 46 1900 Técnica 4 86 2600 Superior 19
7 1700 Secundaria 2 47 2000 Técnica 10 87 1600 Superior 1
8 2000 Secundaria 0 48 2300 Técnica 11 88 1800 Superior 6
9 2200 Secundaria 7 49 2000 Técnica 7 89 2100 Superior 10
10 2100 Secundaria 4 50 1700 Técnica 1 90 1700 Superior 0
11 1700 Secundaria 0 51 1700 Técnica 1 91 2400 Superior 16
12 2500 Secundaria 2 52 2100 Técnica 6 92 2600 Superior 17
13 2800 Secundaria 13 53 2600 Técnica 17 93 2100 Superior 10
14 2400 Secundaria 9 54 2400 Técnica 9 94 2100 Superior 8
15 1700 Secundaria 1 55 2600 Técnica 19 95 2400 Superior 17
16 2400 Secundaria 9 56 1900 Técnica 7 96 1700 Superior 1
17 2200 Secundaria 10 57 1600 Técnica 0 97 2600 Superior 20
18 2200 Secundaria 4 58 1900 Técnica 3 98 2400 Superior 16
19 2300 Secundaria 10 59 2100 Técnica 14 99 2700 Superior 17
20 2800 Secundaria 11 60 1700 Técnica 0 100 2100 Superior 12
21 2100 Secundaria 7 61 2100 Técnica 15 101 1600 Superior 0
22 1700 Secundaria 1 62 1700 Técnica 1 102 2100 Superior 15
23 2500 Secundaria 6 63 2300 Técnica 14 103 1900 Superior 5
24 2400 Secundaria 9 64 2500 Técnica 16 104 2100 Superior 12
25 2700 Secundaria 17 65 2600 Técnica 18 105 2200 Superior 12
26 1700 Secundaria 0 66 1900 Técnica 3 106 2400 Superior 13
27 1600 Secundaria 2 67 2500 Técnica 19 107 1800 Superior 4
28 2600 Secundaria 17 68 1800 Técnica 6 108 2600 Superior 17
29 2500 Secundaria 13 69 1700 Técnica 2 109 2700 Superior 20
30 2500 Secundaria 16 70 2000 Técnica 10 110 2500 Superior 16
31 2100 Técnica 11 71 2400 Técnica 16 111 2500 Superior 16
32 2300 Técnica 14 72 1700 Técnica 0 112 1900 Superior 6
33 1700 Técnica 0 73 2500 Técnica 12 113 2100 Superior 15
34 2200 Técnica 13 74 1700 Técnica 3 114 1700 Superior 9
35 2900 Técnica 20 75 2400 Técnica 17 115 1500 Superior 0
36 1800 Técnica 5 76 2400 Técnica 16 116 1800 Superior 18
37 2100 Técnica 16 77 1900 Técnica 7 117 2100 Superior 10
38 2000 Técnica 12 78 1700 Técnica 1 118 2700 Superior 19
39 2000 Técnica 12 79 2100 Técnica 6 119 1800 Superior 9
40 2900 Técnica 20 80 2000 Técnica 5 120 2100 Superior 15

a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como
variable de estratificación el nivel de educación. Elabore un listado identificando el número
seleccionado y el valor respectivo de los años cumplidos en la empresa. Para el estrato 1 use las
columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11 y para el estrato 3 use
C4, C3, C5 y C7.
b. Con la muestra, calcule la proporción de empleados que tienen más de 12 años en la empresa.
251
Estadística Aplicada I 2022 01

Solución

a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como
variable de estratificación el nivel de educación. Elabore un listado identificando el número
seleccionado y el valor respectivo de los años cumplidos en la empresa.

Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y
C11 y para el estrato 3 use C4, C3, C5 y C7.

Solución

Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3
son: secundaria, técnica y superior, respectivamente.

Para cada uno de los estratos, seleccionamos muestras aleatorias simples.

Números de Cantidad seleccionada por estrato


Posiciones Nh
Estrato elementos en el
(desde – hasta) n h= ×n
estrato Nh N

N1 30
Secundaria N 1=30 1 – 30 n1 = × n= × 16=4
N 120

N2 50
Técnica N 2=50 31 – 80 n2 = × n= × 16=6,7 ≈7
N 120

N3 40
Superior N 3=40 81 – 120 n3 = × n= ×16=5,3≈ 5
N 120

Total N=120 n=16

Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y
C5. Observemos que las posiciones de los primeros elementos a elegir están entre 1 y 30.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
252
Estadística Aplicada I 2022 01

Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es:

Posición 2 16 29 13
Años en la empresa 11 9 13 13

Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9, C10
y C11. Observemos que las posiciones de los elementos a elegir están entre 31 y 80.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:

Posición 54 62 66 77 48 67 44
Años en la empresa 9 1 3 7 11 19 9

Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5
y C7. Observemos que las posiciones de los elementos a elegir están entre 81 y 120.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5

Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:

Posición 114 81 97 105 83


Años en la empresa 9 3 20 12 0

b. Con la muestra obtenida calcule la proporción de empleados que tienen más de 12 años en la
empresa.

Solución
Luego, con los elementos seleccionados se tiene que la proporción de empleados con más de 12
años en la empresa es igual a 4/16 = 0,25.
253
Estadística Aplicada I 2022 01

Muestreo sistemático

En el muestreo sistemático se debe elegir un elemento del marco muestral cada cierto intervalo. Este
muestreo supone que se cuenta con una enumeración completa de los elementos de la población.

Una característica importante del muestreo sistemático es que presenta menos variabilidad que el
muestreo aleatorio simple, esto debido a la presencia de una estratificación innata en el diseño del
muestreo sistemático.

Procedimiento para seleccionar una muestra sistemática

1. Calcule el valor de k con la siguiente fórmula:


N
k=
n
El valor de k se redondea al valor del entero menor.

2. Seleccione aleatoriamente un número entero entre 1 y k llamado arranque aleatorio ( A ).

Para encontrar el valor de A , la cantidad de columnas a usar de la tabla de números aleatorios


dependerá de la cantidad de dígitos que tenga k .

Por ejemplo, si el valor de k es un número de dos cifras, entonces deberá agregar a la columna
dada por enunciado una columna correlativa para completar un número de dos cifras.

3. A partir de este número elegido, seleccione el siguiente que ocupa la posición ( A+ k ) del listado
del marco muestral y así sucesivamente hasta completar la muestra.
254
Estadística Aplicada I 2022 01

Ejemplo 94

Se tiene a continuación una población de 15 personas a quienes se les consultó su edad. Se desea
elegir a cuatro de ellas mediante un muestreo sistemático.

Use la columna C6 y C12 de la tabla de números aleatorios.

Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Edad 12 15 23 10 32 65 34 23 43 54 22 34 56 34 25

Solución

Calculemos el valor de k , donde∶

N 15
k= = =3,75
n 4

El valor de k se redondea al valor del entero menor, luego k = 3.

Seleccionemos aleatoriamente un número entero entre 1 y k = 3, llamado arranque aleatorio ( A ).


Observando la columna C6 de la tabla de números aleatorios tenemos que A = 1.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
255
Estadística Aplicada I 2022 01

9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5

Los elementos seleccionados serán: el primero, cuarto, sétimo y décimo.

Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Edad 12 10 34 54
256
Estadística Aplicada I 2022 01

Ejemplo 95

Se tiene información de 40 personas de un distrito de Lima.

Obtenga una muestra de siete personas usando el muestreo sistemático y elabore una tabla con la
posición seleccionada. Utilice la columna C5.

Calcule la media muestral de la edad y el porcentaje muestral de mujeres.

Marco muestral: Personas registradas

Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura


1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 169
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 156
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 164
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 190
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 167
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 169
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162

Solución

Calculemos el valor de k , donde:

N 40
k= = =5,71
n 7

El valor de k se redondea al valor del entero menor, luego k =5.

El arranque aleatorio ( A ) es 1.

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4

Partiendo de la primera posición (A = 1), elegimos la posición 6, la posición 11, etc.


257
Estadística Aplicada I 2022 01

Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura


1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 169
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 156
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 164
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 190
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 167
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 169
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162

La muestra será:

Posición 1 6 11 16 21 26 31
Sexo Mujer Mujer Hombre Mujer Mujer Mujer Mujer
Edad 15 24 18 30 16 28 34
Estatura 154 170 177 163 168 161 169

La media muestral de la edad es 23,57 años.

El porcentaje muestral de mujeres ( 67 × 100 %)=85,71%.


258
Estadística Aplicada I 2022 01

Ejercicios

147. En una población estudiada, hay 2000 mujeres y 8000 hombres. Si queremos seleccionar una
muestra de 250 individuos en dicha población. ¿Cuántos mujeres deben ser elegidas en la
muestra si queremos usar muestreo estratificado por sexo? Rpta. 50

148. En una empresa textil se entrevistaron a 45 empleados sobre el clima organizacional de su


entorno de trabajo. En la siguiente tabla fueron registradas sus opiniones.

Nº Sexo Clima Nº Sexo Clima Nº Sexo Clima


1 Feme Bueno 16 Feme Bueno 31 Masc Malo
2 Feme Malo 17 Feme Malo 32 Masc Malo
3 Feme Malo 18 Feme Malo 33 Masc Bueno
4 Feme Regular 19 Feme Bueno 34 Masc Bueno
5 Feme Bueno 20 Feme Malo 35 Masc Bueno
6 Feme Bueno 21 Feme Bueno 36 Masc Regular
7 Feme Regular 22 Feme Regular 37 Masc Bueno
8 Feme Bueno 23 Feme Regular 38 Masc Malo
9 Feme Malo 24 Feme Bueno 39 Masc Bueno
10 Feme Regular 25 Feme Bueno 40 Masc Malo
11 Feme Malo 26 Feme Malo 41 Masc Bueno
12 Feme Bueno 27 Feme Malo 42 Masc Bueno
13 Feme Regular 28 Masc Bueno 43 Masc Regular
14 Feme Regular 29 Masc Bueno 44 Masc Bueno
15 Feme Bueno   30 Masc Regular 45 Masc Bueno

a. Usando muestreo simple aleatorio obtenga una muestra de tamaño 10 y con esa muestra
calcule el porcentaje de empleados que respondieron que el clima laboral era regular. Use
C3.
b. Usando muestreo sistemático obtenga una muestra de tamaño 10 y con esa muestra calcule
el porcentaje de empleados que respondieron que el clima laboral era regular. Use C3.
c. Calcule el porcentaje poblacional de empleados que respondieron que el clima laboral era
regular y compárelos con los estadísticos encontrados.

149. Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la tabla
que se muestra a continuación información acerca de las variables: nivel educativo y años
cumplidos en la empresa (años).

Nº Nivel Años Nº Nivel Años Nº Nivel Años Nº Nivel Años


educativo educativo educativo educativo
1 Secundaria 5 39 Secundaria 16 77 Técnica 3 115 Superior 3
2 Secundaria 11 40 Secundaria 18 78 Técnica 5 116 Superior 19
3 Secundaria 4 41 Técnica 11 79 Técnica 4 117 Superior 1
4 Secundaria 2 42 Técnica 14 80 Técnica 0 118 Superior 6
5 Secundaria 3 43 Técnica 0 81 Técnica 1 119 Superior 10
6 Secundaria 2 44 Técnica 13 82 Técnica 6 120 Superior 0
7 Secundaria 2 45 Técnica 20 83 Técnica 17 121 Superior 16
259
Estadística Aplicada I 2022 01

Nº Nivel Años Nº Nivel Años Nº Nivel Años Nº Nivel Años


educativo educativo educativo educativo
8 Secundaria 0 46 Técnica 5 84 Técnica 9 122 Superior 17
9 Secundaria 7 47 Técnica 16 85 Técnica 19 123 Superior 10
10 Secundaria 4 48 Técnica 12 86 Técnica 7 124 Superior 8
11 Secundaria 1 49 Técnica 12 87 Técnica 0 125 Superior 17
12 Secundaria 2 50 Técnica 20 88 Técnica 3 126 Superior 1
13 Secundaria 13 51 Técnica 13 89 Técnica 14 127 Superior 20
14 Secundaria 9 52 Técnica 9 90 Técnica 0 128 Superior 16
15 Secundaria 1 53 Técnica 1 91 Técnica 15 129 Superior 17
16 Secundaria 9 54 Técnica 9 92 Técnica 1 130 Superior 12
17 Secundaria 10 55 Técnica 10 93 Técnica 14 131 Superior 0
18 Secundaria 4 56 Técnica 4 94 Técnica 16 132 Superior 15
19 Secundaria 10 57 Técnica 10 95 Técnica 18 133 Superior 5
20 Secundaria 11 58 Técnica 11 96 Técnica 3 134 Superior 12
21 Secundaria 7 59 Técnica 7 97 Técnica 19 135 Superior 12
22 Secundaria 1 60 Técnica 1 98 Técnica 6 136 Superior 13
23 Secundaria 6 61 Técnica 6 99 Técnica 2 137 Superior 4
24 Secundaria 9 62 Técnica 9 100 Técnica 10 138 Superior 17
25 Secundaria 17 63 Técnica 17 101 Técnica 16 139 Superior 20
26 Secundaria 0 64 Técnica 0 102 Técnica 0 140 Superior 16
27 Secundaria 2 65 Técnica 2 103 Técnica 12 141 Superior 16
28 Secundaria 17 66 Técnica 17 104 Técnica 3 142 Superior 6
29 Secundaria 13 67 Técnica 13 105 Técnica 17 143 Superior 15
30 Secundaria 16 68 Técnica 16 106 Técnica 16 144 Superior 9
31 Secundaria 17 69 Técnica 14 107 Técnica 7 145 Superior 0
32 Secundaria 1 70 Técnica 7 108 Técnica 1 146 Superior 18
33 Secundaria 1 71 Técnica 9 109 Técnica 6 147 Superior 10
34 Secundaria 11 72 Técnica 7 110 Técnica 5 148 Superior 19
35 Secundaria 3 73 Técnica 10 111 Superior 3 149 Superior 9
36 Secundaria 5 74 Técnica 12 112 Superior 13 150 Superior 15
37 Secundaria 3 75 Técnica 20 113 Superior 0      
38 Secundaria 14 76 Técnica 20 114 Superior 19      

Aplique el muestreo sistemático para seleccionar una muestra de tamaño 13 empleados. Elabore
un listado con la posición seleccionada y el valor de los años cumplidos en la empresa y nivel
educativo. Utilice la columna C7, C10 y C15 de la tabla de números aleatorios. Con la muestra
obtenida, estime e interprete para la variable, años en la empresa el promedio y la mediana.
Obtenga, además, la proporción de empleados con nivel técnico.

150. Telecom es una empresa que brinda soluciones integrales en infraestructura de


telecomunicaciones. Cuenta con más de 12 años de experiencia en diferentes proyectos con los
principales operadores y fabricantes de equipos del sector, junto a un equipo de ingenieros,
técnicos y consultores de larga trayectoria profesional, nacional e internacional.

La empresa está interesada en saber si existe una alta rotación de personal, debido a ello, el
departamento de recursos humanos ha hecho un censo. Los resultados se muestran en la base
de datos siguiente.
260
Estadística Aplicada I 2022 01

Marco muestral
Número Permanencia Grado de Remuneración
Posición Sexo Edad Motivo de cese
de hijos (meses) instrucción bruta
1 M 0 33 26 Titulado 5000 Renuncia voluntaria
2 M 1 34 10 Titulado 12075 Renuncia voluntaria
3 M 0 30 11 Titulado 3000 Renuncia voluntaria
4 F 0 28 3 Titulado 1500 Renuncia voluntaria
5 M 0 27 2 Titulado 800 Renuncia voluntaria
6 M 0 28 28 Titulado 3000 Renuncia voluntaria
7 F 1 39 12 Post grado 5575 Renuncia voluntaria
8 F 1 38 32 Técnico completa 2000 Renuncia voluntaria
9 F 0 32 1 Técnico completa 2700 Renuncia voluntaria
10 F 0 26 0 Técnico completa 2575 Renuncia voluntaria
11 M 0 35 52 Titulado 12000 Renuncia voluntaria
12 F 0 28 0 Titulado 2000 Renuncia voluntaria
13 F 1 32 1 Titulado 3575 Renuncia voluntaria
14 M 0 25 15 Titulado 1500 Renuncia voluntaria
15 F 2 34 55 Post grado 5000 Renuncia voluntaria
16 F 0 31 2 Post grado 7500 Renuncia voluntaria
17 F 0 28 7 Titulado 2500 Renuncia voluntaria
18 F 1 29 1 Técnico completa 1500 Renuncia voluntaria
19 F 2 36 1 Post grado 4400 Renuncia voluntaria
20 F 2 37 10 Técnico completa 1985 Renuncia voluntaria
21 F 0 27 1 Titulado 3000 Renuncia voluntaria
22 F 0 27 5 Técnico completa 2200 Renuncia voluntaria
23 F 2 28 3 Técnico completa 2300 Renuncia voluntaria
24 F 0 37 20 Titulado 3085 Renuncia voluntaria
25 F 0 35 2 Técnico completa 1885 Renuncia voluntaria
26 F 2 51 23 Post grado 15085 Renuncia voluntaria
27 F 0 37 20 Titulado 3085 Renuncia voluntaria
28 F 0 35 2 Técnico completa 1885 Renuncia voluntaria
29 F 0 28 1 Técnico completa 1500 Renuncia voluntaria
30 F 0 27 1 Técnico completa 1500 Renuncia voluntaria
31 F 0 25 2 Técnico completa 1800 Renuncia voluntaria
32 F 0 30 2 Técnico completa 1800 Renuncia voluntaria
33 F 0 42 2 Titulado 2585 Renuncia voluntaria
34 F 0 29 3 Técnico completa 3000 Renuncia voluntaria
35 F 2 38 49 Post grado 6085 Renuncia voluntaria
36 M 0 24 33 Titulado 1800 Renuncia voluntaria
37 F 0 41 3 Técnico completa 950 Renuncia voluntaria
38 F 0 28 0 Técnico completa 1700 Renuncia voluntaria
39 F 0 22 0 Titulado 850 Renuncia voluntaria
40 F 0 29 6 Titulado 2800 Renuncia voluntaria
41 M 0 29 58 Titulado 2200 Renuncia voluntaria
42 F 1 41 26 Post grado 7000 Renuncia voluntaria
43 F 0 25 18 Titulado 1500 Renuncia voluntaria
44 M 0 27 7 Titulado 2000 Renuncia voluntaria
45 F 2 39 9 Titulado 3885 Renuncia voluntaria
46 F 1 28 9 Post grado 4585 Renuncia voluntaria
47 M 0 25 22 Titulado 1800 Renuncia voluntaria
48 F 0 34 41 Titulado 3300 Renuncia voluntaria
49 F 1 31 1 Titulado 2085 Renuncia voluntaria
50 F 1 39 3 Post grado 8085 Renuncia voluntaria
51 M 0 22 16 Post grado 1500 Renuncia voluntaria
261
Estadística Aplicada I 2022 01

Número Permanencia Grado de Remuneración


Posición Sexo Edad Motivo de cese
de hijos (meses) instrucción bruta
52 F 0 25 2 Técnico completa 1200 Renuncia voluntaria
53 F 0 26 6 Titulado 2085 Renuncia voluntaria
54 F 0 46 5 Post grado 20000 Renuncia voluntaria
55 F 0 27 46 Técnico completa 2300 Renuncia voluntaria
56 M 0 29 10 Técnico completa 2000 Renuncia voluntaria
57 F 0 28 8 Técnico completa 2000 Término de contrato
58 F 0 28 1 Técnico completa 1500 Término de contrato
59 F 0 33 4 Técnico completa 1585 Término de contrato
60 F 0 35 7 Técnico completa 2300 Término de contrato
61 F 0 26 16 Técnico completa 1700 Término de contrato
62 F 0 34 7 Titulado 3000 Término de contrato
63 F 0 25 18 Titulado 1500 Término de contrato
64 M 0 23 19 Titulado 1500 Término de contrato
65 F 0 33 1 Técnico completa 2200 Término de contrato
66 F 1 31 1 Técnico completa 2500 Término de contrato
67 M 0 23 1 Técnico completa 2000 Término de contrato
68 F 0 26 14 Técnico completa 1200 Término de contrato
69 F 2 47 1 Titulado 2875 Término de contrato
70 M 0 27 1 Titulado 2000 Término de contrato
71 F 2 30 15 Titulado 2800 Término de contrato
72 F 1 23 2 Técnico completa 1600 Término de contrato
73 F 0 27 16 Técnico completa 2200 Término de contrato
74 F 0 32 25 Técnico completa 2800 Término de contrato
75 F 0 40 8 Titulado 3500 Término de contrato
76 F 1 25 4 Titulado 2300 Término de contrato
77 F 0 30 3 Titulado 4085 Término de contrato
78 F 0 27 16 Titulado 1585 Término de contrato
79 F 0 26 1 Técnico completa 1500 Término de contrato
80 F 2 32 4 Técnico completa 2000 Término de contrato
81 F 2 29 4 Técnico completa 2500 Término de contrato
82 F 2 33 38 Titulado 2500 Término de contrato
83 F 2 30 19 Titulado 2000 Término de contrato
84 F 2 36 59 Post grado 4085 Término de contrato
85 F 2 33 9 Titulado 2500 Término de contrato
86 F 2 25 3 Técnico completa 1900 Término de contrato
87 F 0 27 3 Técnico completa 2000 Término de contrato
88 F 0 25 3 Titulado 2200 Término de contrato
89 F 0 28 3 Técnico completa 1500 Término de contrato
90 F 0 25 3 Técnico completa 1885 Término de contrato
91 F 0 42 4 Técnico completa 2800 Término de contrato
92 F 0 29 6 Titulado 4000 Término de contrato
93 F 2 40 20 Titulado 5585 Término de contrato
94 F 0 29 13 Técnico completa 1100 Término de contrato
95 F 0 34 31 Post grado 5000 Término de contrato
96 F 0 30 10 Post grado 11000 Término de contrato
97 F 0 25 10 Técnico completa 2585 Término de contrato
98 F 3 41 8 Técnico completa 4085 Término de contrato
99 M 0 32 28 Post grado 3300 Despido
100 F 0 34 10 Técnico completa 2085 Despido
101 M 0 29 10 Técnico completa 2000 Despido
102 M 0 25 8 Técnico completa 2000 Despido
103 M 0 26 7 Técnico completa 2000 Despido
104 F 0 28 12 Técnico completa 1600 Despido
262
Estadística Aplicada I 2022 01

Número Permanencia Grado de Remuneración


Posición Sexo Edad Motivo de cese
de hijos (meses) instrucción bruta
105 M 1 33 9 Post grado 3585 Despido
106 F 0 34 9 Post grado 3085 Despido
107 F 3 46 29 Técnico completa 1285 Despido
108 F 2 35 10 Técnico completa 2085 Despido
109 F 0 25 12 Técnico completa 1800 Despido
110 M 0 28 4 Técnico completa 1850 Despido
111 F 1 28 30 Titulado 2285 Despido
112 M 0 35 11 Post grado 4000 Despido

a. Se desea seleccionar una muestra de 13 trabajadores usando muestreo simple aleatorio. Use
las columnas C3, C1, C14 y C12 de la tabla de números aleatorios y encuentre el porcentaje
de trabajadores cuyo motivo de cese fue por renuncia voluntaria.
b. Se desea estimar la edad promedio de los trabajadores que cesan aplicando muestreo
estratificado con una muestra de 10 empleados. Use como variable de estratificación la
variable <motivo de cese>. Para el estrato 1 use las columnas C2, C4 y C5, para el estrato 2
use las columnas C8, C7, C5 y C11 y para el estrato 3 use las columnas C13, C14, C16 y C17.
c. ¿Está de acuerdo con usar la variable de estratificación <motivo de cese>? Si no está de
acuerdo, ¿qué otra variable usaría?
d. ¿Qué ventaja cree que tiene usar, en este caso, un muestreo estratificado a un muestreo
aleatorio simple?
e. Aplique el muestreo estratificado por motivo de cese para seleccionar una muestra de 10
empleados para estimar la edad promedio de los trabajadores.

151. Los siguientes datos han sido extraídos de una investigación realizada por La Defensoría del
Pueblo, Comisión de la Verdad y Reconciliación, Comité Internacional Cruz Roja y Coordinadora
Nacional de Derechos Humanos sobre un total de 150 personas extraviadas en el Perú entre los
años 1980 y 1996 en los tres principales departamentos donde hubo el brote terrorista:
Ayacucho, Huánuco y San Martín. Las variables que se consideraron fueron: Lugar de
procedencia (lugar), sexo y edad al momento de la desaparición. Los datos se presentan a
continuación:

N
Lugar Sexo Edad Nº Procedencia Sexo Edad Nº Lugar Sexo Edad Nº Lugar Sexo Edad
º
1 Ayacucho M 12 39 Ayacucho M 22 77 Ayacucho M 33 115 Huánuco M 28
2 Ayacucho M 40 40 Ayacucho F 23 78 Ayacucho M 22 116 Huánuco M 36
3 Ayacucho M 20 41 Ayacucho M 50 79 Ayacucho M 70 117 Huánuco M 27
4 Ayacucho M 43 42 Ayacucho M 26 80 Ayacucho M 34 118 Huánuco M 24
5 Ayacucho M 28 43 Ayacucho F 19 81 Ayacucho M 69 119 Huánuco M 45
6 Ayacucho M 12 44 Ayacucho M 54 82 Ayacucho F 31 120 Huánuco M 21
7 Ayacucho F 15 45 Ayacucho M 13 83 Huánuco M 21 121 Huánuco M 66
8 Ayacucho M 28 46 Ayacucho M 46 84 Huánuco M 27 122 Huánuco F 70
9 Ayacucho M 13 47 Ayacucho M 28 85 Huánuco F 19 123 Huánuco F 26
10 Ayacucho M 45 48 Ayacucho M 46 86 Huánuco M 27 124 Huánuco M 26
11 Ayacucho M 10 49 Ayacucho M 42 87 Huánuco M 20 125 Huánuco M 14
12 Ayacucho F 25 50 Ayacucho M 40 88 Huánuco M 25 126 Huánuco M 18
13 Ayacucho M 24 51 Ayacucho M 44 89 Huánuco M 18 127 Huánuco M 28
14 Ayacucho M 32 52 Ayacucho M 39 90 Huánuco M 47 128 San Martín M 25
15 Ayacucho M 48 53 Ayacucho M 17 91 Huánuco M 28 129 San Martín M 32
263
Estadística Aplicada I 2022 01

N
Lugar Sexo Edad Nº Procedencia Sexo Edad Nº Lugar Sexo Edad Nº Lugar Sexo Edad
º
16 Ayacucho M 23 54 Ayacucho F 19 92 Huánuco M 32 130 San Martín M 22
17 Ayacucho F 7 55 Ayacucho M 24 93 Huánuco M 18 131 San Martín M 21
18 Ayacucho F 5 56 Ayacucho F 15 94 Huánuco M 22 132 San Martín M 28
19 Ayacucho M 4 57 Ayacucho M 17 95 Huánuco M 28 133 San Martín M 18
20 Ayacucho F 9 58 Ayacucho M 22 96 Huánuco M 31 134 San Martín M 29
21 Ayacucho M 6 59 Ayacucho M 50 97 Huánuco M 34 135 San Martín M 20
22 Ayacucho M 66 60 Ayacucho M 42 98 Huánuco M 25 136 San Martín M 18
23 Ayacucho M 18 61 Ayacucho M 19 99 Huánuco M 27 137 San Martín M 21
24 Ayacucho F 36 62 Ayacucho M 21 100 Huánuco M 19 138 San Martín M 26
25 Ayacucho M 26 63 Ayacucho M 15 101 Huánuco M 24 139 San Martín M 23
26 Ayacucho M 17 64 Ayacucho M 43 102 Huánuco M 28 140 San Martín M 35
27 Ayacucho M 28 65 Ayacucho M 16 103 Huánuco F 4 141 San Martín M 17
28 Ayacucho M 30 66 Ayacucho M 30 104 Huánuco F 2 142 San Martín M 32
29 Ayacucho F 19 67 Ayacucho M 48 105 Huánuco M 33 143 San Martín F 32
30 Ayacucho M 17 68 Ayacucho M 45 106 Huánuco M 25 144 San Martín M 41
31 Ayacucho F 20 69 Ayacucho M 41 107 Huánuco M 21 145 San Martín M 26
32 Ayacucho M 21 70 Ayacucho M 23 108 Huánuco M 21 146 San Martín M 20
33 Ayacucho M 37 71 Ayacucho M 22 109 Huánuco M 30 147 San Martín M 21
34 Ayacucho M 58 72 Ayacucho M 20 110 Huánuco M 21 148 San Martín M 15
35 Ayacucho M 18 73 Ayacucho M 22 111 Huánuco M 21 149 San Martín M 22
36 Ayacucho F 18 74 Ayacucho M 16 112 Huánuco M 54 150 San Martín M 45
37 Ayacucho M 19 75 Ayacucho M 45 113 Huánuco M 38        
38 Ayacucho M 18 76 Ayacucho F 56 114 Huánuco M 16        

a. Aplique el muestreo estratificado para obtener una muestra de 10 personas desaparecidas.


Elabore un listado con el elemento seleccionado y el valor de la edad al momento de la
desaparición. Utilice como variable de estratificación: Lugar de procedencia.

Estrato 1: Ayacucho C3; C5; C7


Estrato 2: Huánuco C5; C9; C10; C12
Estrato 3: San Martín C4; C8; C11; C15

b. Con la muestra obtenida calcule el promedio de la edad al momento de la desaparición.

152. El director de una empresa tiene la lista de todo su personal y desea obtener una muestra
aleatoria de los colaboradores para conocer el grado de satisfacción que estos tienen en su
centro de trabajo y estimar el tiempo promedio de servicio. El siguiente cuadro presenta el
número o código del colaborador, el tiempo de servicio en meses y la edad en años.
264
Estadística Aplicada I 2022 01

Trabajadores registrados (Marco muestral)


N° Tiempo de servicio Edad N° Tiempo de servicio Edad N° Tiempo de servicio Edad
1 73 23 41 106 45 81 99 49
2 96 46 42 99 49 82 131 32
3 110 67 43 94 35 83 131 32
4 105 60 44 98 30 84 93 42
5 91 43 45 98 30 85 104 53
6 90 36 46 99 49 86 81 29
7 129 46 47 98 30 87 124 56
8 129 46 48 98 30 88 98 56
9 91 43 49 73 23 89 98 56
10 96 46 50 73 23 90 106 45
11 110 67 51 95 33 91 129 46
12 129 46 52 95 33 92 106 45
13 100 35 53 96 46 93 129 46
14 99 49 54 96 46 94 124 56
15 113 55 55 110 67 95 98 56
16 101 39 56 124 56 96 98 56
17 86 45 57 90 36 97 104 53
18 104 42 58 90 36 98 106 45
19 126 57 59 101 35 99 129 46
20 98 30 60 101 35 100 124 56
21 126 58 61 124 56 101 98 56
22 98 30 62 95 33 102 117 30
23 101 39 63 95 33 103 99 49
24 86 40 64 96 42 104 104 33
25 104 42 65 96 46 105 94 35
26 99 49 66 110 67 106 101 39
27 113 55 67 124 56 107 123 44
28 98 30 68 99 49 108 98 30
29 126 57 69 131 32 109 88 60
30 98 31 70 131 333 110 123 40
31 104 53 71 113 55 111 98 30
32 104 53 72 94 35 112 88 59
33 81 29 73 93 42 113 101 39
34 124 56 74 91 47 114 117 30
35 91 43 75 91 47 115 90 36
36 106 45 76 86 41 116 98 30
37 106 45 77 93 42 117 88 59
38 91 43 78 91 47 118 123 40
39 104 63 79 91 47 119 98 30
40 104 53 80 86 45 120 88 59

a. Seleccione una muestra de 10 trabajadores aplicando el muestreo aleatorio simple. Elabore un


listado con el número o código seleccionado y el valor de su tiempo de servicio. Considere para la
selección, las columnas: C9; C2; C10; C15 y C1 de la tabla de números aleatorios. ¿A qué
colaboradores se le aplicará la encuesta sobre el nivel de satisfacción con respecto a su centro
laboral?
b. Con la muestra seleccionada, estime el tiempo promedio de servicio de los colaboradores.
265
Estadística Aplicada I 2022 01

Tamaño de muestra
Al iniciar un trabajo de investigación o tesis, la pregunta que surge es:

 ¿Cuántas unidades debo seleccionar?


 ¿Bastará con aplicar un cuestionario a 100 personas o mejor a 500 personas?
 ¿Cómo podemos determinar el tamaño óptimo de una muestra?
 ¿Si la población es muy grande se tendrá que seleccionar también una muestra grande, o el
tamaño dependerá de la variabilidad de los resultados?
 ¿Qué margen de error tendrán los resultados hallados en la encuesta?

Para determinar el tamaño de la muestra se debe tener en cuenta lo siguiente:

 el parámetro por estimar, que puede ser la media o la proporción.


 el nivel de confianza.
 la variabilidad de la población.
 el margen de error o error de estimación o error máximo permisible.

Nivel de confianza
Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al verdadero
valor del parámetro. El nivel de confianza lo fija el investigador, el valor más usual es 95%.

Con este nivel de confianza se obtiene el valor Z1− α , que corresponde a un percentil de una
2
distribución normal estándar.

Variabilidad
Cuando una población es más homogénea la varianza es menor y el número de entrevistas
necesarias será más pequeño.

Generalmente la variabilidad es un valor desconocido y hay que estimarlo a partir de datos de


estudios previos, muestra piloto o estudios anteriores similares.

Margen de error o error de estimación


El margen de error o error de estimación es la diferencia entre un estadístico y el parámetro
correspondiente.

Nos da una idea clara de hasta dónde y con qué probabilidad una estimación basada en una muestra
se diferencia del valor del parámetro, que se hubiera obtenido por medio de un censo completo.

Un estadístico será más preciso cuando su error sea más pequeño.

En un estudio, el margen de error lo fija el investigador. Por ejemplo, si queremos estimar el valor de
la media del gasto mensual en transporte de una persona en Lima, el margen de error podría
establecerse en cuatro soles; mientras que si queremos estimar el porcentaje de personas que están
a favor de una cierta ley, el margen de error podría establecer en 2,8%.
266
Estadística Aplicada I 2022 01

Ejemplo del cálculo del valor Z1− α


2

Si el nivel de confianza es 90%, entonces:

( 1−α )=0,90

α =0,10

El 90% corresponde a la parte central de la distribución normal.

-4 -3 -2 -1 0 1 2 3 4

Buscando en la tabla el valor más cercano a la suma de 0,90 y 0,05; es decir; a 0,95 que es 0,94950.

Una vez hallado el valor hallado el valor más cercano a 0,95; salimos a los bordes de la tabla normal
estándar.

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327

Finalmente, el valor de Z1− α es:


2

Z α =Z 0,10 =Z 0,95 =1,64


1− 1−
2 2

En Excel, se usa la función =INV.NORM.ESTAND(0.95) ¿ 1,64 .


267
Estadística Aplicada I 2022 01

Tamaño de muestra para estimar la media poblacional

Tamaño de muestra si no se conoce N (población infinita)

Si el objetivo del estudio es estimar la media de una población, la fórmula para calcular el tamaño de
muestra (n ) es:

(( ))
2
z α
s
1−
2
n=
e

 n : es el tamaño de muestra que se obtendrá redondeando al entero superior.


Z α se encuentra con la distribución normal estándar, teniendo en cuenta el nivel de confianza
1−
2
que crea conveniente el investigador. Este nivel de confianza en porcentaje se coloca en la parte
central de la distribución normal estándar. Z1− α debe ser redondeado a dos decimales.
2

 S: es la desviación estándar de la variable que debe ser cuantitativa.

 e : el margen de error lo fija el investigador y está en las mismas unidades de los datos. Por
ejemplo, si la variable es ingresos las unidades serán soles o dólares, si la variable es el tiempo en
realizar una actividad las unidades estarán dadas en horas, minutos o segundos, según sea el caso.

Cuando no se conoce el tamaño de la población N (es un valor muy grande) se asume población
infinita y no se incluye N en la fórmula.

Tamaño de muestra si se conoce N (población finita)

Cuando se conoce el tamaño de la población N (es un valor no muy grande) se asume población
finita y se realiza un ajuste al valor del tamaño de muestra obtenido con la fórmula anterior y se
corrige n con la siguiente fórmula:

n
n c=
n
1+
N

n c ≔ tamaño de muestra corregido.

 El valor de n obtenido en la fórmula anterior debe ser ingresada redondeada al entero superior.

 El valor final n c se redondea al entero superior.


268
Estadística Aplicada I 2022 01

Ejemplo 96
Un estudiante realiza un estudio para conocer el ingreso familiar promedio y la asignación de estos
ingresos en cada rubro, como alimentación, educación, salud y otros, en la ciudad de Lima. ¿A
cuántas familias deberá considerar en el estudio si se desea tener un nivel de confianza del 95%, un
error máximo de 500 soles, y mediante una muestra piloto se obtuvo una desviación estándar del
ingreso familiar de 3600 soles?

Solución
Se quiere estimar la media del ingreso familiar, en soles, por tanto, la fórmula es:

(( ))
2
Z α
s
1−
2
n=
e

El margen de error es e = 500 soles

La desviación estándar muestral es s = 3600 soles

El nivel de confianza es del 95%

El valor del nivel de confianza ( 1−α )=0,95 lo colocamos en el centro de la distribución normal
estándar y buscamos dentro de la tabla el valor más cercano ala suma de 0,95 y 0,025, es decir,
0,975.

-4 -3 -2 -1 0 1 2 3 4

Z 0,975=1,96

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169

Z =Z =Z 0,975=1,96
(1− α2 ) (1− 0,052 )
En Excel, se usa la función =INV.NORM.ESTAND(0.975) ¿ 1,96 .

Reemplazando los valores.

n= ( 1,96 ×3600 2
500
=199,14 )
269
Estadística Aplicada I 2022 01

El valor del tamaño de muestra siempre se redondea por exceso, por tanto, se debe entrevistar a 200
familias. Como no se conoce el tamaño de la población N , no es necesario corregir el valor de n .
270
Estadística Aplicada I 2022 01

Ejemplo 97

Universal es una nueva emisora de carácter político y a una semana de estar al aire cuenta con 3000
radioescuchas. El gerente desea realizar un estudio para estimar el tiempo de conexión promedio de
los oyentes. Al seleccionar una muestra piloto se obtuvieron los siguientes resultados, en horas:

3,2 4,8 5,3 9,1 6,3 8,2 6,5 9,6 10,3 8,6
6,3 7,9 8,2 7,9 6,9 9,3 8,6 6,8 10,1 9,0

¿Cuál debe ser el tamaño de muestra de oyentes que se necesita si desea tener un error de
estimación de 0,15 horas con un nivel de confianza del 94%?

Solución

Se quiere estimar la media poblacional del tiempo de conexión μ.

El margen de error es:

e=0,15

La desviación estándar muestral es:

s=1,8597

El nivel de confianza del 94% entonces:

(1−α )=0,94

El valor del nivel de confianza ( 1−α )=0,94 lo colocamos en el centro de la distribución normal
estándar y buscamos dentro de la tabla el valor más cercano ala suma de 0,94 y 0,03; es decir; 0,97.

-4 -3 -2 -1 0 1 2 3 4

Z 0,97=1,88

En la tabla normal buscamos el valor más cercano a 0,97 que es 0,96995; luego salimos a los bordes y
obtenemos el valor 1,88.

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
271
Estadística Aplicada I 2022 01

1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670

Z α =Z 0,06 =Z 0,97=1,88
1− 1−
2 2

En Excel, se usa la función =INV.NORM.ESTAND(0.97) ¿ 1,88.

Reemplazando valores en la fórmula:

n= ( 1,88 ×1,8597 2
0,15
=543,27 )
Como el tamaño de la población es conocida, la población es finita, se debe corregir la muestra:

n 544
n c= = =459,97
n 544
1+ 1+
N 3000

El valor del tamaño de muestra siempre se redondea por exceso, por tanto, se necesita entrevistar a
460 radioescuchas.
272
Estadística Aplicada I 2022 01

Tamaño de muestra para estimar la proporción poblacional

Tamaño de muestra si no se conoce N (población infinita)

El tamaño de muestra se calcula con la siguiente fórmula:

2
Z ^p (1− ^p )
(1− α2 )
n= 2
e

 n es el tamaño de muestra que se obtendrá redondeando al entero superior.


Z α el valor de Z se encuentra con la distribución normal estándar, teniendo en cuenta el nivel
1−
2
de confianza que crea conveniente el investigador.

 ^p generalmente es un valor desconocido porque recién se hará el estudio, pero es necesario


conocer la proporción muestral para reemplazar en la fórmula, por tanto:

 si se tiene una estimación previa ^p se la usa. Esta estimación puede provenir de estudios
anteriores o de una muestra piloto.
 si no se tiene una estimación previa, se usa ^p=0,5.

 e es el margen de error lo fija el investigador en porcentaje o en unidades de proporción. Por


ejemplo, si el margen de error es 3,5% se considera e = 0,035 al reemplazar los valores en la
fórmula, el valor en porcentaje se divide entre 100.

Cuando no se conoce el tamaño de la población N o es un valor muy grande, se asume que la


población es infinita y, por tano, no se incluye N en la fórmula del tamaño de muestra.

Tamaño de muestra si se conoce N (población finita)

Cuando se conoce el tamaño de poblacional N , la población será finita y se realiza un ajuste al valor
del tamaño de muestra obtenido con la fórmula anterior y se corrige n con la siguiente fórmula:

n
n c=
n
1+
N

n c ≔ tamaño de muestra corregido

• El valor de n obtenido en la fórmula anterior debe ser ingresada redondeada al entero superior.

• El valor final n c se redondea al entero superior.


273
Estadística Aplicada I 2022 01

Ejemplo 98

Una compañía de investigación de mercado quiere estimar el porcentaje de hogares que tienen
Internet en casa, ¿cuántos hogares debe considerarse en el estudio si desea tener una confianza del
95% de que el porcentaje muestral difiera del poblacional a lo más en 4,5%.

Solución

La variable en estudio es tenencia de Internet y es una variable cualitativa.

Se quiere estimar p = proporción poblacional de hogares con Internet, por tanto, la fórmula es:

2
Z α ^p (1− ^p )
1−
2
n=
e2

El margen de error es la diferencia del porcentaje muestral del poblacional, por tanto, e = 0,045.

No se cuenta con una estimación previa de p, entonces se usa ^p = 0,5.

El valor del nivel de confianza ( 1−α )=0,95 lo colocamos en el centro de la distribución normal
estándar y buscamos dentro de la tabla el valor más cercano ala suma de 0,95 y 0,025, es decir,
0,975.

-4 -3 -2 -1 0 1 2 3 4

Z 0,975=1,96

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169

Z α =Z 0,05 =Z 0,975=1,96
1− 1−
2 2

En Excel, se usa la función =INV.NORM.ESTAND(0.975) ¿ 1,96 .

Reemplazando los valores en la fórmula, tenemos:

2
1,96 × 0,5×(1−0,5)
n= 2
=474,27
0,045
274
Estadística Aplicada I 2022 01

El valor del tamaño de muestra siempre se redondea por exceso, por tanto, se debe considerar a 475
hogares.
275
Estadística Aplicada I 2022 01

Tamaño de muestra para estimar el valor de la media o proporción poblacional


276
Estadística Aplicada I 2022 01

Ejercicios

153. Calcule el tamaño de muestra si se desea estimar el tiempo promedio, en horas, que demoran
los estudiantes en llegar a la universidad, de un total de 6400 estudiantes, si se considera un
nivel de confianza del 96% y un error de estimación de 0,1 horas. De una muestra piloto de ocho
alumnos, se obtuvo los siguientes resultados:

2,0 1,5 0,45 1,45 1,0 0,30 1,20 1,30


Rpta. 131

154. Infodata es una empresa privada que asesora en temas informáticos al Ministerio de Educación
y quiere realizar un estudio sobre el tiempo que llevan los usuarios de la Biblioteca Nacional en
las salas de búsqueda computarizada. Para realizar dicho estudio tomó una muestra piloto de 20
usuarios de la Biblioteca Nacional, obteniéndose los siguientes tiempos en minutos.

5,4 4,6 10,1 8,0 6,6 7,0 4,6 9,9 4,0 12,1
9,8 5,5 4,5 6,7 7,8 4,9 5,0 6,4 4,4 5,9

¿Cuál es el tamaño de muestra que se debe seleccionar para hacer una encuesta, si se desea
tener un margen de error de medio minuto con un nivel de confianza del 98%? Rpta.
114

155. La gerencia de una compañía de seguros ha observado el creciente uso de teléfonos celulares
de parte de los conductores, teniendo como resultado un mayor número de accidentes
automovilísticos, considerando implementar tarifas más altas en sus seguros. Se desea estimar
el porcentaje de conductores que hablan por teléfono mientras conducen, con un margen de
error de 3% y un nivel de confianza del 90% ¿cuál es el tamaño de muestra? Rpta.
748

156. Se quiere estimar el porcentaje poblacional de productos defectuosos de una línea de


producción ¿Qué tamaño de muestra debe obtener el ingeniero encargado, si se quiere tener
una confianza del 99% con un margen de error de 2,5%? En una muestra piloto de 360
productos se obtuvo 15 de productos defectuosos.
Rpta. 424

157. En una encuesta realizada entre estudiantes universitarios de Lima, el 32% de los encuestados
dijeron que la situación económica del país había mejorado en el último año. ¿Qué tan grande
se necesita que sea la muestra de estudiantes para una nueva encuesta, si se desea tener una
confianza de 95% y un margen de error de 2,2%? Rpta. 1728

158. El alcalde de un distrito desea estimar la proporción de residentes que conocen la propuesta
respecto al uso de fondos municipales para mejorar la limpieza del distrito. En una muestra
piloto de 120 residentes, 75 no conocen dicha propuesta. ¿Qué tamaño de muestra necesita
seleccionar si requiere una confianza del 98% y un margen de error del 4%?
Rpta. 796

159. Para estimar el porcentaje de electores a favor de un candidato, una encuestadora debe
determinar el tamaño de la muestra de una población de diez mil electores. ¿Qué tan grande
debe ser la muestra si se quiere tener una confianza del 97% y un margen de error del 2,8%?
Rpta. 1306
277
Estadística Aplicada I 2022 01
278
Estadística Aplicada I 2022 01

TABLA DE LA DISTRIBUCION NORMAL ESTANDAR

Área bajo la curva normal: P( Z ≤ z)=¿

Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,00003 0,00003 0,00007 0,00004 0,00004 0,00004 0,00004 0,00004 0,00005 0,00005
-3,8 0,00005 0,00005 0,00005 0,00006 0,00006 0,00006 0,00006 0,00007 0,00005 0,00007
-3,7 0,00008 0,00008 0,00008 0,00009 0,00009 0,00009 0,00010 0,00010 0,00010 0,00011
-3,6 0,00011 0,00012 0,00012 0,00013 0,00013 0,00014 0,00014 0,00015 0,00015 0,00017
-3,5 0,00017 0,00017 0,00018 0,00019 0,00019 0,00020 0,00021 0,00022 0,00022 0,00023
-3,4 0,00024 0,00025 0,00026 0,00027 0,00028 0,00029 0,00030 0,00031 0,00033 0,00037
-3,3 0,00035 0,00036 0,00038 0,00039 0,00040 0,00042 0,00043 0,00045 0,00047 0,00048
-3,2 0,00050 0,00052 0,00054 0,00056 0,00058 0,00060 0,00062 0,00064 0,00066 0,00067
-3,1 0,00071 0,00074 0,00076 0,00079 0,00082 0,00085 0,00087 0,00090 0,00094 0,00097
-3,0 0,00100 0,00104 0,00107 0,00111 0,00114 0,00118 0,00122 0,00126 0,00131 0,00135
                     
-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
                     
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
                     
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
279
Estadística Aplicada I 2022 01

TABLA DE LA DISTRIBUCION NORMAL ESTANDAR

Área bajo la curva normal: P( Z ≤ z)=¿

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
                     
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
                     
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
                     
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99897 0,99900
3,1 0,99903 0,99907 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929
3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99945
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965
3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976
3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99982 0,99982 0,99983 0,99984
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989
3,7 0,99989 0,99990 0,99990 0,99991 0,99991 0,99991 0,99992 0,99992 0,99992 0,99993
3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995
3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997
280
Estadística Aplicada I 2022 01

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
281
Estadística Aplicada I 2022 01

Índice

Análisis combinatorio, 117 Coeficiente de asimetría, 107


Dato, 7 Medidas de dispersión, 88
Distribución Coeficiente de variación, 90
binomial, 160 Desviación estándar, 89
exponencial, 180 Rango, 88
normal, 184 Varianza, 89
normal, propiedad reproductiva, 201 Medidas de posición, 84
Poisson, 165 Percentiles, 85
Distribución muestral, 208 Muestra, 7
media, 208 Muestreo, 218
Escala de medición, 13 aleatorio simple, 223
Estadístico, 18 estratificado, 227
Eventos sistemático, 231
Complemento, 115 Observación, 7
Diferencia de, 125 Parámetro, 18
Diferencia simétrica de, 125 Población, 7
independientes, 116, 136 Probabilidad
Intersección de, 124 Axiomas, 123
mutuamente excluyentes, 116 condicional, 131
Unión de, 124 en tablas de contingencias, 127
Ficha técnica, 220 Espacio muestral, 113
Frecuencia, 21 Experimento aleatorio, 113
Gráfico Teorema de Bayes, 141
circular, 26 Reglas de conteo, 118
de barras, 25 Tamaño de muestra
de Pareto, 30 media, 244
histograma, 55 proporción, 248
Intervalos comunes, 61 Unidad elemental, 7
ojiva, 56 Variable, 12
polígono de frecuencias, 56 cualitativa, 12
Medida de tendencia central cuantitativa, 12
Media aritmética o promedio, 67 Variable aleatoria
Media ponderada, 78 continua, 169
Mediana, 71 definición, 149
Moda, 74 discreta, 150
Medidas de asimetría

También podría gustarte