MA444 2021 01 Cuaderno de Trabajo - CS3G 28 de Junio
MA444 2021 01 Cuaderno de Trabajo - CS3G 28 de Junio
MA444 2021 01 Cuaderno de Trabajo - CS3G 28 de Junio
Civil
Electrónica
Mecatrónica
Cuaderno de trabajo
Área de Ciencias
marzo 2021
UPC MA444 Estadística 2
UPC MA444 Estadística 3
Tabla de contenido
Unidad 4. Otros tópicos de Estadística: Análisis de varianza y análisis de regresión ........ 264
Diseño de experimentos .................................................................................................................................266
Conceptos generales .................................................................................................................................. 267
Diseño completamente al azar ................................................................................................................... 269
Análisis de la varianza .....................................................................................................................................272
Método de comparaciones múltiples: Prueba de Tukey - Kramer ............................................................... 278
Regresión lineal simple ...................................................................................................................................290
Diagrama de dispersión o gráfico del plot ................................................................................................... 293
Método de los mínimos cuadrados ............................................................................................................. 293
Recta o ecuación de regresión .................................................................................................................... 294
Análisis de varianza .................................................................................................................................... 298
Coeficiente de determinación..................................................................................................................... 301
Coeficiente de correlación .......................................................................................................................... 301
UPC MA444 Estadística 5
Tablas estadísticas ..........................................................................................................................................318
Tabla de la distribución normal estándar .................................................................................................... 318
Tabla de la distribución t - Student ............................................................................................................. 320
Tabla de la distribución F ............................................................................................................................ 322
UPC MA444 Estadística 6
Logro
Al finalizar la unidad, el estudiante aplica adecuadamente métodos de organización y presentación de
datos, asimismo, calcula resúmenes de variables para la resolución de problemas obtenidos de los
datos de una situación real.
Temario
• La Estadística. Definiciones de población, muestra, variables, clasificación de variables, parámetros
y estimadores
• Métodos de organización y presentación de datos: datos cualitativos, datos cuantitativos, tablas
de distribución de frecuencias y representaciones gráficas (circular, barras, Pareto, histograma,
polígono, bastones)
• Tablas de doble entrada
• Medidas de tendencia central: media, mediana, moda, media ponderada
• Medidas de dispersión: varianza, desviación estándar y coeficiente de variación
• Medidas de posición: cuartiles, deciles y percentiles
• Organización de datos cuantitativos discretos y continuos, gráficos para una variable cuantitativa
discreta y continua. Tablas de doble entrada y gráficos comparativos
Bibliografía
• Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.1 (pág. 7-11)
• Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.3 (pág. 11-17)
• Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.5 (pág. 24-57)
UPC MA444 Estadística 7
Estadística
Es la ciencia de los datos. Implica la recolección de datos, clasificación, organización, análisis e
interpretación de resultados.
Estadística descriptiva
Es la rama de la Estadística que se dedica al análisis, descripción y representación de un conjunto de
datos obtenidos a partir de una muestra o población. Las conclusiones son válidas sobre las
características de dicho conjunto de datos.
Estadística inferencial
Es la rama de la Estadística que desarrolla los procesos de estimación, análisis y pruebas de hipótesis
de un conjunto de datos extraídos de una muestra, con el propósito de llegar a conclusiones acerca de
una población.
Estadística descriptiva
Se obtienen conclusiones sobre el conjunto de datos sin
incertidumbre. No realiza proyecciones
•Recolección de datos
•Clasificación de datos
•Organización de datos
•Analisis e interpretación
Estadística inferencial
Se obtienen conclusiones respecto a la población bajo
incertidumbre. Realiza proyecciones
•Toma de decisiones a partir de una muestra
UPC MA444 Estadística 8
Conceptos básicos
Población
Es un conjunto de elementos (personas, objetos, etc.) que tienen una o más características observables
que se pueden medir en ellos. Se denota por la letra N mayúscula.
Ejemplo 1
Para conocer la opinión que tienen los estudiantes de ingeniería sobre el servicio que ofrece el Centro
de Información, se puede considerar como
Muestra
Se denomina muestra a una parte de la población. El tamaño de la muestra se denota con la letra n
minúscula.
Ejemplo 2
Para conocer la opinión que tienen los estudiantes de ingeniería, sobre el servicio que ofrece el Centro
de Información, se puede considerar como muestra a un subconjunto de estudiantes de ingeniería de
la UPC matriculados en el semestre anterior.
Encuesta de vivienda
1. Tiempo de antigüedad de la vivienda
• Menos de 10 años
• Entre 10 y 20 años
• Más de 20 años
2. Material de construcción de la vivienda:
• Cemento
• Adobe
• Quincha
• Prefabricado
3. Número de habitaciones: ____________
4. Área de terreno: __________ m2
5. La vivienda se encuentra en:
• Buen estado de conservación
• Regular estado de conservación
• Mal estado de conservación
Ejemplo 4
Se realizó un estudio para determinar la cantidad promedio diario de residuos de construcción y
demolición en la ciudad de Lima durante los meses de enero, febrero y marzo del presente año.
Determine la población, muestra y elemento.
Todos los residuos diarios de construcción y demolición en la ciudad de Lima
Población
durante los meses de enero, febrero y marzo del presente año
Algunos residuos diarios de construcción y demolición en la ciudad de Lima durante
Muestra
los meses de enero, febrero y marzo del presente año
Un residuo diario de construcción y demolición en la ciudad de Lima durante los
Elemento
meses de enero, febrero y marzo del presente año
UPC MA444 Estadística 11
Variables
Una variable es la característica de interés de los elementos. Se representan con las letras mayúsculas
de nuestro alfabeto; por lo general, X, Y, Z.
X: nombre
Y: peso
Z: promedio ponderado
Tipo de variables
Variable cualitativa
Es la característica cuyos valores no son numéricos. Por ejemplo, carrera universitaria, material de
construcción y tipo de resistencia.
Variable cuantitativa
Es la característica cuyos valores son numéricos. Se dividen en discretas y continuas.
Ejemplo 3
En cada caso, identifique la variable en estudio y su tipo.
¿Cuál es su grado de
X:Grado de Instrucción Cualitativo
instrucción?
¿Cuál es su ingreso
Y: Ingreso mensual (soles) Cuantitativa Continua
mensual, en soles?
¿Cuántos hermanos
Z:Numero de hermanos Cuantitativa Discreta
tiene?
¿Cuál es tu año de
W: Año de Nacimiento Cualitativo
nacimiento?
UPC MA444 Estadística 13
Escalas de medición
Las escalas de medición de las variables permiten determinar la cantidad de información que
contienen los datos e indica el resumen de estos y el análisis estadístico más apropiado.
Nominal
Una variable está medida en escala nominal cuando los datos son etiquetas o nombres que se emplean
para definir un atributo del elemento. Por ejemplo: el género de las personas, el estado civil, el número
telefónico, etc.
Ordinal
Una variable está medida en escala ordinal cuando pueden ordenarse de acuerdo con algún criterio.
Se pueden ordenar en forma ascendente o descendente. También, pueden registrarse por medio de
un código numérico. Por ejemplo: el orden de mérito de los alumnos en el curso de estadística, el grado
de instrucción de los clientes de un banco, nivel socioeconómico de los alumnos de la universidad.
Opinión del Servicio: (Bueno, Regular, Malo), Orden de Mérito: (quinto superior, tercio superior)
Intervalo
Una variable está medida en escala de intervalo si el cero es relativo, es decir, no indica la ausencia de
la característica medida. Por ejemplo: las temperaturas en grados Celsius o en grados Fahrenheit.
Razón
Una variable está medida en escala de razón si el cero indica la ausencia de característica de la medida.
Por ejemplo: el sueldo de los empleados de una empresa, el peso de los trabajadores.
Sueldo = 0, Estatura = 0
UPC MA444 Estadística 14
Ejemplo 1
Complete:
Ejemplo 2
La Corporación Aceros Perú es una empresa que se dedica a la industria del acero. Actualmente, la
empresa está fabricando hierro esponja, palanquillas de acero, barras helicoidales, alambrón y barras
de construcción y tiene una capacidad de 680,000 toneladas al año. Uno de los mercados a los que
más se orientan los productos es el mercado de la construcción de Lima.
El departamento de Control de Calidad está encargado de realizar un estudio sobre las varillas
devueltas a la fábrica. Al seleccionar una muestra aleatoria de 80 barras de aceros de la sección de
devoluciones del almacén, se midieron algunas características de acuerdo con la siguiente ficha
técnica:
UPC MA444 Estadística 15
Número de barra: ___________
1. Tipo de barra de acero:
• Corrugado ASTM
• Corrugado Grado60
• Corrugado NBR7480
• Corrugado 4,7 mm
2. El destino de uso de la barra de acero
• Columnas
• Vigas
• Cimentación
• Concreto armado
3. Resistencia a la tracción: ________________ kg/cm2
Indique la población
Indique la muestra
1. Corporación Domar S.A.C. es una empresa peruana ubicada en la ciudad de Lima con más de ocho
años de experiencia en el sector Industrial. La empresa ejecuta proyectos de instalación de sistemas
mecánicos y electrónicos, además brinda un servicio industrial de mantenimiento especializado de
maquinarias y laboratorios en todas las especialidades de ingeniería. El gerente del área de servicios
quiere convertir a la corporación en una de las empresas con mayor representatividad, a nivel
nacional, en el rubro industrial, por lo que desea evaluar los servicios brindados durante el último
trimestre. Se seleccionaron al azar 22 registros de los servicios realizados durante el último
trimestre. Algunas de las variables registradas se presentan a continuación:
Población
Tipo de servicio
Población
Muestra
3. Computer es una compañía dedicada a brindar servicios informáticos a empresas que desean tener
una presencia firme y contundente en la red. Esta compañía se dedica al tendido de redes LAN,
instalación de equipos, servidores y toda una gama de productos tecnológicos que puedan resultar
imprescindibles para una empresa.
Como parte de un estudio realizado por Computer se analizó la información correspondiente a una
muestra de 30 empresas en la ciudad de Lima a las que se les brindó los servicios informáticos.
4. La empresa de investigación de mercados Alpha S.A. realizó un estudio para evaluar el efecto de la
caída de la bolsa de valores de Lima (BVL) en las administradoras de fondos de pensiones (AFP). En
este estudio se tomó una muestra de 300 afiliados entre 25 y 35 años en Lima seleccionados al azar.
Población
Muestra
Material de la tubería
Año de instalación
Observación
Es el conjunto de datos medidos de una unidad elemental.
Ejemplo 1
Identifique y complete:
Estadístico
Un estadístico resume una característica de la muestra, para obtener su valor se utiliza la información
muestral. El valor obtenido de un estimador se conoce como estimación. Al estimador se le llama
estadígrafo o estadístico.
Moda Mo mo
𝐴 𝑥
Proporción 𝑝= 𝑝̂ =
𝑁 𝑛
Ejemplo 1
Se tiene una población de 30 alumnos del curso de estadística de la sección CI3A. A cada alumno se
le preguntó su edad. Con esos 30 datos se calculó la media, que es 19,7 años.
Título
El título debe seguir la siguiente estructura:
Fuente
Se refiere de dónde se recolectaron los datos para posteriormente ser organizados. Se ubica siempre
en la parte inferior de la tabla.
UPC MA444 Estadística 23
Ejemplo 1
La siguiente información muestra la distribución de una muestra de viviendas de un determinado
distrito de Lima según material con el cual fue construido. Observe que el título sigue la siguiente
estructura:
Distribución de <elementos> según <variable>
Unidad elemental
f3 = …
p3 = …
Complete los elementos que faltan en cada uno de los gráficos y comente:
80
Título del eje
60 50
45
40
20
0
Access MS Excel MS Power Point MS Word Outlook Otros
Título del eje
Fuente: PC-Review-Perú
Outlook
MS Excel
20%
20%
El jefe del Área de Servicios impulsará paquetes si más del 25% de los clientes que solicitaron un
servicio pertenecen a este rubro.
Ejemplo 1
El jefe de control de calidad de la empresa Mundo está interesado en conocer cuáles son las principales
causas que están afectando la producción.
Al seleccionar una muestra de 450 artículos fallados obtuvo los siguientes resultados:
300
60%
250
42.4%
200 191
40%
150 122
100 20%
56
50
0 0%
Cambios Rotura de Inestabilidad Rotura máquina Cansancio Otros
ambientales operador máquina operador
6. La siguiente tabla muestra información sobre el defecto observado con mayor frecuencia en los
puentes vecinales construidos en estructura de madera en cierta localidad del interior del país:
Pandeos y rajaduras 40
Pudrimiento de las piezas de madera 30
Efectos del desgaste mecánico 20
Otros 5
Deformaciones 15
Ataques de insectos y crustáceos 10
Acción de fuego 5
Fuente: Municipalidad distrital
Elabore el diagrama de Pareto para identificar qué defectos deben priorizarse en este tipo de
puentes.
7. Rex es una empresa con más de 30 años en el mercado y está dedicada a la fabricación de hornos
para la elaboración de ladrillos que requieren altas temperaturas de secado. Estos aparatos pueden
causar daños bastantes considerables a los operarios cuando el horno no está funcionando
correctamente.
Durante el último mes, el departamento de control de calidad seleccionó una muestra de 57 hornos
para su revisión. Los problemas que se observaron en la revisión se muestran a continuación:
Distribución de …………………………………………………………………………..
Principal problema Número de hornos
Condensación precoz 5
Retracciones del mortero 12
Cocción de ladrillos 15
Otros 8
Caliches 9
Exfoliaciones 8
Fuente: Rex S.A.
El departamento de control de calidad tiene por norma priorizar los problemas que resuelvan
alrededor del 80% del total de casos. Sin embargo, si estos problemas son más de tres, dicho
departamento ordenará una revisión total del proceso de producción. Indique lo que hará el
departamento de control de calidad.
UPC MA444 Estadística 30
8. Metronics es una fábrica especializada en la producción de piezas electrónicas para ensamblaje de
computadoras. En los últimos meses, el jefe de producción ha registrado pérdidas, por ello, ha
solicitado información estadística. Una muestra aleatoria de 30 piezas defectuosas fabricadas
diariamente por el área de producción arrojó la siguiente información respecto al problema
observado en la pieza defectuosa.
Basado en su experiencia, el inspector determina que corrigendo a lo más el 77% de los problemas
se reducen pérdidas en la producción. Si se llega a identificar que los problemas a corregir son tres,
entonces pasará por un nuevo proceso de evaluación de calidad de los productos. ¿La empresa será
sometida nuevamente a un proceso de evaluación de calidad?
Distribución de ……………………………………………
Problema observado Número de piezas fabricadas
Recalentamiento 3
Corrosión 6
Rajadura 8
Deformación 9
No cumple estándar 4
Fuente: Metronics S. A.
UPC MA444 Estadística 31
Tabulaciones cruzadas
También llamadas tablas de contingencia o tablas de doble entrada. Se usan para resumir de manera
simultánea los datos de dos variables.
Ejemplo 1
Uno de los requisitos que toda represa debe tener es poder conservar las condiciones de funcionalidad
y de seguridad que permita su utilización a lo largo de su vida útil, sufriendo las menores incidencias
posibles y dando cumplimiento a la legislación de seguridad y mantenimiento vigentes.
La Confiep sospecha que existe un alto porcentaje de represas de tipo terraplén en mal y muy mal
estado de conservación. De comprobarse que este porcentaje supera el 10%, la represa será declarada
en emergencia. La información de la tabla fue obtenida al término de la inspección de las represas.
Estado de conservación
Tipo de represa
Bueno Regular Malo Muy Malo Total
Cimiento 16 17 12 12 57
Excavación 5 8 5 11 29
Terraplén 7 9 13 5 34
Total 28 34 30 28 120
Fuente: Confiep
Ejemplo 2
Un estudio realizado por A&C Consultores sobre los tipos de riesgos asociados a las excavaciones de
zanjas y tipo de terreno, arrojó los siguientes resultados en base a una muestra de 500 obras de
construcción.
Distribución de las obras de construcción según tipo de terreno y riesgo más importante
Tipo de riesgo más importante
Tipo de terreno
Atrapamiento Caída de personal Derrumbe Inundaciones Otros Total
Roca blanda 27 66 51 9 25 178
Roca dura 15 53 38 3 9 118
Tierra arcillosa 9 31 17 1 10 68
Tierra fuerte 17 55 36 10 18 136
Total 68 205 142 23 62 500
Fuente: Consultores A&C
Indique el número de obras de construcción cuyo tipo de terreno son de roca dura y presentan riesgo
de derrumbe.
Del total de obras que presentan riesgo de atrapamiento, indique el porcentaje de obras de
construcción son de tierra fuerte.
10.En la siguiente tabla se muestran los resultados obtenidos de un estudio realizado en la ciudad de
Nazca por un grupo de profesionales de la UPC de la facultad de Ingeniería sobre las fallas
estructurales en las edificaciones debido al último sismo que tuvo como epicentro la ciudad de
Nazca.
Construya un diagrama de Pareto para identificar las fallas estructurales que tienen mayor
incidencia en las edificaciones en la ciudad de Ica debido al último sismo mencionado.
UPC MA444 Estadística 34
Organización de datos cuantitativos discretos
La variable cuantitativa discreta, además de presentar las frecuencias absolutas y relativas, presenta
dos frecuencias acumuladas.
𝑘 𝑓𝑘 ℎ𝑘 𝑛 1 𝑝𝑘
Total 𝑛 1
F : ………
60 54 52
49
50
Número de empleados
40
30
16
20
8 6
10
0
0 1 2 3 4 5 6
Fuente: Empresa de Cemento A Número de capacitaciones
Un empleado
185
Numero de capacitaciones
Interprete el gráfico
UPC MA444 Estadística 36
Ejercicios propuestos
0 0 0 0 1 1 1 1 1 1 1 1 2 2 2
2 2 2 2 2 2 2 3 3 3 3 3 3 4 4
Número de faltas fi hi Fi Hi
0 f1=4 h1=0.1333 F1=4 0.1333
1 f2=8 0.2667 F2=12 0.4000
2 10 h3=0.3333 22 H3=0.7333
3 6 h4=0.2000 F4=28 H4=0.9333
4 f5=2 0.0667 30 1.0000
Total
Fuente: Empresa A
12
10
Numero de Trabajadorees
10
8
8
6
6
4
4
2
2
0
0 1 2 3 4
Numero de Faltas
Se observa que el mayor número de faltas que presentaron los trabajadores es dos con diez casos y
el menor es cuatro con dos casos y el número regular de faltas tiende a ser dos
12.La siguiente información muestra el número de ladrillos defectuosos fabricados diariamente en una
de las plantas de la empresa Rex. En una muestra aleatoria de 50 días se obtuvo la siguiente
información:
Si el gerente de Rex encuentra al menos un ladrillo defectuoso, en más de 40 días, deberá revisar
su sistema de fabricación.
13.El gerente de la empresa Líder S.A. solicita al jefe del Departamento de Ingeniería realizar una
investigación de las obras que fueron atendidas por la empresa el periodo anterior. Para la
realización del estudio, seleccionó aleatoriamente una muestra de 160 obras de construcción
atendidas el año pasado. La gerencia decidirá adquirir más camiones mezcladores, para las obras
de construcción, si el porcentaje de obras en el que se utiliza mínimo tres camiones para el traslado
del concreto armado premezclado supera el 55%. Indique lo que hará la empresa.
UPC MA444 Estadística 38
50 45
Cantidad de obras
40
30 25
20 15
10 10
10
0
0 1 2 3 4 5 6 7
3 4 3 3 1 4 1 3 2 3
1 1 4 2 3 3 2 6 1 1
3 3 2 2 2 2 1 3 2 1
6 3 1 2 2 3 2 2 4 2
𝑘 = 1 + 3,322 𝑙𝑜𝑔10 𝑛
𝑅
𝑤=
𝑘
El valor de 𝑤 se redondea por redondeo por exceso y con el mismo número de cifras decimales
que tienen los datos.
• Calcular las frecuencias absolutas y relativas con sus respectivas frecuencias acumuladas.
Ejemplo 2
Se ha llevado a cabo un estudio para evaluar el tiempo, en horas, que utiliza cada trabajador de una
planta hidroeléctrica para verificar el normal funcionamiento de la tubería de presión y las válvulas
de control. Para ello se eligieron al azar 30 de ellos.
0,08 0,15 0,19 0,71 0,75 0,82 0,84 0,92 0,96 1,16 1,17 1,19 1,23 1,4 1,47
1,59 1,61 2,01 2,16 2,38 2,42 3,07 3,22 3,53 3,76 3,94 4,5 4,59 4,75 5,41
El dato máximo es 5,41 y el dato mínimo es 0,08, entonces el rango es R = 5,41 – 0,08=5,33
5,33
𝑤= = 0,88𝟖3
6
Como los datos tienen dos decimales, 𝑤 lo redondeamos por exceso con dos decimales, luego, el
valor de 𝑤 es 0,89.
UPC MA444 Estadística 41
Título: Distribución de Trabajadores según Tiempo de Verificación
i Intervalo X´i fi hi Fi Hi
1 [0,08 – 0,97] 0,525 f1=9 0.3 9 H1=0.3
2 ]0,97 – 1,86] 1,415 f2=8 h2=0.2667 F2=17 0.5667
3 ]1,86 – 2,75] 2,305 4 0.1333 21 0.7000
4 ]2,75- 3,64] 3,195 f4=3 0.1 F4=24 H4=0.8
5 ]3,64 – 4,53] 4,085 3 0.1 27 0.9
6 ]4,53 – 5,42] 4,975 3 0.1 30 1
F : ……………………
Ejemplo 3
Use la regla de Sturges para construir la tabla de distribución de frecuencias del monto de venta diario,
en cientos de soles, de la empresa Beta Systems S.A.
52,0 94,7 95,1 97,5 102,5 104,1 106,0 125,2 125,6 146,0
146,8 158,6 158,7 162,6 166,2 166,2 166,2 166,2 168,2 169,7
196,0 204,9 204,9 204,9 204,9 208,3 215,2 217,5 218,1 218,1
218,1 218,1 220,9 226,2 235,0 239,7 242,2 259,6 261,6 277,2
286,5 287,0 297,8 313,9 315,0 316,2 338,6 359,9 363,1 398,3
Identifique.
Elemento
Variable en estudio
Tipo de variable
Escala de medida
UPC MA444 Estadística 42
UPC MA444 Estadística 43
Complete la siguiente tabla.
Título: …
Límite inferior Límite superior X´i fi hi Fi Hi
Fuente:
f2
h3(%)
F4
H2(%)
UPC MA444 Estadística 44
Gráficos de una variable cuantitativa continua
Son gráficas que representan las observaciones obtenidas de la variable cuantitativa continua. Se
pueden realizar con las fi o pi. Como todo gráfico los elementos son: el título principal, título de los ejes
X e Y, etiquetas y fuente.
Histograma
Es una gráfica de barras cuyos valores del eje X son los intervalos de clase. Además, la altura de las
barras está determinada por las frecuencias relativas de los intervalos de clase. Según el interés del
estudio se pueden considerar también, las frecuencias absolutas.
Polígono
Es una gráfica donde los valores del eje X son las marcas de clase.
Para cerrar el polígono se debe aplicar el siguiente artificio: restar a la primera marca de clase el valor
de la amplitud y sumar a la última marca de clase el valor de la amplitud.
Según el interés del estudio se pueden considerar también, las frecuencias absolutas.
UPC MA444 Estadística 45
Ojiva
Es una gráfica donde los valores del eje X son los límites superiores.
Es una gráfica creciente a la que debe aplicarse el siguiente artificio: El primer valor del eje X es el dato
más pequeño del conjunto de datos o valor mínimo o valor del primer límite inferior.
Según el interés del estudio se pueden considerar también, las frecuencias absolutas.
UPC MA444 Estadística 46
Ejercicios propuestos
15.El jefe del Área de Operaciones de Tricon S.A. aplicará una mejora continua en la distribución del
concreto premezclado a las obras, debido a las constantes quejas de los clientes respecto al tiempo
de llegada de los camiones a la obra desde la planta de Los Olivos. Tomará tal decisión si más del
30% de los camiones llegan después de los 39,5 minutos a la obra.
19,1 20,0 23,9 26,1 26,5 27,9 30,1 30,8 32,9 34,7
36,1 36,5 36,6 37,5 38,4 39,3 43,7 44,2 44,6 45,1
46,1 46,3 48,8 51,3 52,7 52,9 53,0 55,0 57,3 59,6
16.Corporación Domar es una empresa peruana ubicada en la ciudad de Lima con más de ocho años
de experiencia en el sector Industrial. La empresa ejecuta proyectos de instalación de sistemas
mecánicos y electrónicos, además brinda un servicio industrial de mantenimiento especializado de
maquinarias y laboratorios en todas las especialidades de ingeniería. Debido a las expectativas de
las utilidades del último trimestre, la meta del gerente del área de servicios es que por lo menos el
40% de servicios tengan precios netos por el servicio mayores a 33 900 soles. De llegar a cumplir la
meta, el gerente será reconocido con una bonificación por parte del directorio. ¿Cuál será la
decisión del directorio? Los registros del último trimestre se presentan a continuación:
Fuente: Empresa A
UPC MA444 Estadística 48
Caso: Riesgo de construcción de viviendas
Para tomar decisiones, la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima
realizó un estudio de riesgo de construcción de viviendas en el mes pasado, para ello se seleccionaron
200 viviendas ubicadas en las laderas de los cerros de Lima Metropolitana.
En el estudio se presentaron las siguientes situaciones para tomar las decisiones adecuadas:
Situación 1
Determinar si se brindará asistencia técnica a las viviendas.
La Gerencia de Gestión del Riesgo de Desastres de la Municipalidad de Lima brindará asistencia técnica
a las viviendas ubicadas en la zona alta de Lima con riesgo de cimientos siempre y cuando más del 30%
de ellas tengan al menos cuatro pisos.
Para ello se evaluaron 24 viviendas seleccionadas al azar con dichas características. La información
obtenida se muestra a continuación:
5 4
4
3 2
2
1
0
0 1 2 3 4 5 6
Fuente: Municipalidad de Lima Número de pisos
¿Qué decisión tomará la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima?
El analista del departamento de gestión del riesgo de desastres de la Municipalidad de Lima desea
realizar un estudio completo de materia orgánica en las laderas de los cerros que tienen suelo arenoso.
Para ello es importante evaluar la capacidad de intercambio catiónico (CIC). Para el estudio se tomó
información del CIC de una muestra de 80 viviendas con suelo arenoso. El analista decidirá realizar el
estudio completo, si más del 18% de estas viviendas registran un CIC mayor a 41,48 meq/100 gr. A
continuación, se presenta la siguiente información:
¿El analista del departamento de gestión de riesgos de desastres realizará el estudio completo?
Definiciones
Parámetro
Es una medida de resumen que caracteriza a la población. Para obtener su valor se hace necesario
contar con toda la información que brinda los elementos de una población. Por ejemplo, la media
poblacional 𝜇, varianza poblacional 𝜎 2 .
Estadístico
Es una medida de resumen que caracteriza a la muestra. Para obtener su valor se utiliza la información
muestral. A los valores obtenidos de un estimador se conoce como estimación.
∑𝑁
𝑖=1 𝑥𝑖 ∑𝑁
𝑖=1 𝑥𝑖
Media 𝜇= 𝑥̅ =
𝑁 𝑛
∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2 ∑𝑁
𝑖=1(𝑥𝑖 − 𝑥̅ )
2
Varianza 𝜎2 = 𝑠2 =
𝑁 𝑛−1
Desviación estándar 𝜎 𝑠
Características de la media
• Se puede calcular para variables de escala intervalo o razón.
• La mayor desventaja es que se ve afectado por valores extremos; es decir si hay valores muy
pequeños o grandes, la media no los representaría adecuadamente.
Cálculo de la media
Ejemplo 1
Los siguientes datos son medidas de la resistencia al rompimiento (en onzas) de una muestra de hilos
de lino.
15,2 15,8 16,2 18,5 19,4 20,6 21,2 21,9 25,4 27,3 28,3 29,5 32,5 33,7 36,9
Solución
La fórmula es:
∑𝑁
𝑖=1 𝑥𝑖
𝑥̅ =
𝑛
Reemplazando valores:
15,2 + 15,8 + 16,2 + ⋯ + 36,9
𝑥̅ = = 24,16
15
Interpretación
La resistencia al rompimiento de los hilos está alrededor de 24,16 onzas.
La resistencia al rompimiento de los hilos está próximo a 24,16 onzas.
UPC MA444 Estadística 52
Ejemplo 2
Calcule e interprete la media para el número de hijos obtenida a partir de una muestra de 35 familias.
𝑥̅ = 1.37
Ejemplo 3
Calcule el tiempo promedio de verificación, en horas, para una muestra de trabajadores e interprete.
𝑥̅ = 1.68
Para tomar decisiones, la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima
realizó un estudio de riesgo de construcción de viviendas en el mes pasado, para ello se seleccionaron
200 viviendas ubicadas en las laderas de los cerros de Lima Metropolitana.
Situación 1
Determinar si se brindará asistencia técnica a las viviendas.
5 4
4
3 2
2
1
0
0 1 2 3 4 5 6
Número de pisos
Fuente: Municipalidad de Lima
La gerencia de gestión del riesgo de desastres de la Municipalidad de Lima brindará asistencia técnica
a las viviendas ubicadas en la zona alta de Lima con riesgo de cimientos siempre y cuando el número
promedio de pisos por vivienda es mayor a dos. Para ello se evaluaron 24 viviendas seleccionadas al
azar con dichas características. La información obtenida se muestra a continuación:
¿Qué decisión tomara la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima?
𝑥̅ = 3
ANALISIS
𝑥̅ = 3 ; El número de pisos está alrededor de 3 pisos, se puede observar que el promedio es mayor a
2 pisos
ARGUMENTACIÓN
Situación 2
Realizar un estudio de materia orgánica en las laderas.
El analista del departamento de gestión del riesgo de desastres de la Municipalidad de Lima desea
realizar un estudio completo de materia orgánica en las laderas de los cerros que tienen suelo arenoso.
Para ello es importante evaluar la capacidad de intercambio catiónico (CIC).
Para el estudio se tomó información del CIC de una muestra de 80 viviendas con suelo arenoso. El
analista decidirá hacer el estudio completo, si el CIC promedio supera el valor de 25 meq/100 gr. A
continuación, se presenta la siguiente información:
¿El analista del departamento de gestión del riesgo de desastres realizará el estudio completo?
INTERPRETACION
REPRESENTACION
CALCULO
𝑥̅ = 33.82
ANALISIS
𝑥̅ = 33.82 ; la capacidad de intercambio catiónico (CIC) está alrededor de 33.82 meq/100 gr, se puede
observar que el promedio es mayor a 25 meq/100 gr
ARGUMENTACIÓN
Mediana
Es el valor que ocupa el lugar central de un conjunto de datos ordenados. Por tanto, es el valor que
divide en dos partes a dicho conjunto de datos.
Características de la mediana
Si denotamos las observaciones ordenadas por 𝑥[1] , 𝑥[2] , 𝑥[3] , … , 𝑥[𝑛] , la mediana calcularse por:
Ejemplo 1
Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje (en voltios) se
muestran a continuación:
10,00 10,05 10,12 10,26 25,00 9,84 9,96 9,98 9,99 10,00
Solución
Primero ordenamos los datos.
X1 X5 X6 X10
9,84 9,96 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00
𝑥[𝑛] + 𝑥[𝑛+1]
2 2
𝑚𝑒 =
2
Reemplazando los valores.
𝑥10 + 𝑥10
2 2 +1 𝑥5 + 𝑥6 10 + 10
𝑚𝑒 = = = = 10
2 2 2
UPC MA444 Estadística 57
Ejemplo 2
Los siguientes datos corresponden a la distribución del número de piezas defectuosas producidas en
una muestra de 150 días. Calcule e interprete el valor de la mediana.
𝑥150 + 𝑥150
2 2
+1 𝑥75 + 𝑥76 1 + 1
𝑚𝑒 = = = =1
2 2 2
Interpretación: El 50% de los días tienen una lectura máxima de 1 pieza defectuosa.
UPC MA444 Estadística 58
Moda
La moda de un conjunto de datos es aquel valor que se repite con mayor frecuencia.
Características de la moda
Ejemplo 1
Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje se presentan a
continuación:
9,84 9,89 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00
Interpretación
La lectura de voltaje más frecuente es de 10 voltios.
Ejemplo 2
Renacer S.A. fabrica hornos de microondas. La gerencia encargó al jefe de control de calidad que
informe cuál es el problema más frecuente encontrado en los hornos microondas. Se tomó una
muestra del área de reparaciones y los resultados fueron los siguientes:
Interpretación
El problema más frecuente es de Velocidad de calentamiento.
UPC MA444 Estadística 59
Medidas de posición o cuantiles
Se define así a un número real que divide a un conjunto de datos en dos partes con porcentajes
especificados debajo y sobre este valor. Para su cálculo, los datos deben estar previamente ordenados.
Cuartil
Divide al conjunto de datos en cuatro partes porcentualmente iguales. Se denotan Q1, Q2 y Q3 que son
los correspondientes percentiles 𝑃25 , 𝑃50 y 𝑃75 .
Decil
Divide al conjunto de datos en diez partes porcentualmente iguales. Hay nueve deciles D1, D2, …, D9
que son los correspondientes percentiles 𝑃10 , 𝑃20 , …, y 𝑃90 .
D1=P10, D7=P70
Percentil
Divide un conjunto de datos en 100 partes porcentualmente iguales. Dado un percentil Pk, este divide
el conjunto de datos en dos partes, la inferior que contiene el k% de datos y la superior que contiene
el (100 – k)% de datos.
𝑃𝑘
Calcular el valor de la posición que ocupa el percentil 𝑃𝑘 en la lista de datos ordenados que está
determinada por la siguiente expresión:
𝑘(𝑛 + 1)
𝑖= = 𝐸, 𝑑
100
Luego,
𝑃𝑘 = 𝑋[𝐸] + 0, 𝑑(𝑋[𝐸+1] − 𝑋[𝐸] )
UPC MA444 Estadística 60
Ejemplo 1
Suponga que los promedios ponderados de una muestra de 12 ingenieros civiles egresados se
muestran a continuación:
D4 = P40
P40=????
𝑘(𝑛 + 1) 40(12 + 1)
𝑖= = = 5. 𝟐
100 100
X5 = 16.2 = X[E]
X6= 16.5 = X[E +1]
b. Si se desea contratar a un egresado que pertenezca al quinto superior, ¿qué percentil debe
calcular y cuál es la nota mínima que debería de tener?
P80=????
𝑘(𝑛 + 1) 80(12 + 1)
𝑖= = = 10. 𝟒
100 100
Ejemplo 2
Una muestra de 30 trabajadores de una plataforma petrolera marina formó parte de un ejercicio de
escape del área. Para ello se registraron los tiempos, en minutos, empleados en la evacuación.
31,5 32,5 32,5 33,4 33,9 34,0 35,6 35,6 35,9 35,9
36,3 36,4 36,9 37,0 37,3 37,3 37,4 37,5 38,0 38,9
39,2 39,3 39,4 39,7 40,2 40,3 41,5 42,4 42,8 44,5
a. ¿Cuál es el tiempo mínimo registrado por el 18% de trabajadores que emplearon más tiempo en
la evacuación de la plataforma?
UPC MA444 Estadística 62
b. ¿Cuál es tiempo máximo empleado por el 28% de trabajadores que emplearon menos tiempo en
la evacuación de la plataforma?
Ejemplo 3
Investigadores del Massachussets Institute of Technology (MIT) realizaron el 9 de abril de 1993 un
estudio sobre asteroides. Al observar 39 de estos asteroides con el telescopio Hiltner del observatorio
de MIT; se registró el número de exposiciones de imagen espectral.
Título: ……………………………………………………………………………………………………………………………..
Número de exposiciones fi hi Fi Hi
1
2
3
4
6
Total
b. Indique el mínimo número de exposiciones obtenidos en el 15% de los asteroides con mayores
exposiciones. Además, indique a qué percentil corresponde.
UPC MA444 Estadística 63
c. Se desea categorizar a los asteroides según su número de exposiciones en categorías baja, media
y alta. ¿Cuáles serán los límites de las categorías si la categoría media contiene al 50% central de
la cantidad de asteroides?
UPC MA444 Estadística 64
Medidas de variación o dispersión
Son aquellas que cuantifican que tan dispersos o concentrados se encuentran los datos respecto de
una medida de tendencia central. Los datos que están relativamente cercanos entre sí tienen bajas
medidas de variabilidad, mientras que los que están más alejados entre sí tienen medidas de variación
más grandes.
Nos indican cuan parecidos o cuan diferentes son los valores en un conjunto de datos
Promedio A = 16 Promedio B = 16
(20, 20, 19, 02, 03 …..) ( 17, 16, 16, 16, 15,15,16……..)
CV = 0%
Varianza
• Es una medida del grado de dispersión o variación de los valores de una variable con respecto a su
media aritmética.
• Las unidades en las que queda expresada la varianza son unidades al cuadrado.
• Esta medida no tiene interpretación.
• La notación de la varianza de una muestra es 𝑠2 , mientras que la de una población es 𝜎 2 .
Cálculo de la varianza
Varianza poblacional
∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2
𝜎2 =
𝑁
∑𝑁
𝑖=1(𝑥𝑖 − 𝑥̅ )
2
𝑠2 =
𝑛−1
∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2
𝑠2 =
𝑛−1
2
∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖´ − 𝑥̅ )
𝑠2 =
𝑛−1
UPC MA444 Estadística 65
Desviación estándar
• La desviación estándar es la raíz cuadrada positiva de la varianza
• Se denota por s cuando es calculada de una muestra y por 𝜎 cuando es poblacional.
35 73 30 15 36 60 47 19 15 38 10 35 31 21 22 20
MUESTRA
S2 : VARIANZA MUESTRAL
S =17.0478
S2 = 290.6275
Ejemplo 2
Calcule la varianza y desviación estándar del número de accidentes automovilísticos en una muestra
de 100 días.
Número de
accidentes fi
automovilísticos
0 f1=10
1 f2=15
2 30
3 35
4 f5=10
Total n=100
S =1.1282
S2 = 1.2728
UPC MA444 Estadística 67
Ejemplo 3
Calcule la varianza y desviación estándar de los tiempos de exposición, en minutos, de un metal a una
sustancia química. Los resultados de una muestra de 66 reacciones son las siguientes:
S =2.42
S2 = 5.8564
UPC MA444 Estadística 68
Coeficiente de variación
Es una medida de dispersión relativa libre de unidades por lo que es útil para comparar la variabilidad
de dos o más grupos de datos expresados en distintas unidades de medida o cuando los promedios de
los conjuntos de datos a comparar son diferentes.
El coeficiente de variación proporciona una estimación de la magnitud de las desviaciones con respecto
a la magnitud de la media.
𝑠
𝐶𝑉 = × 100%
𝑥̄
Ejemplo 1
A continuación, se presentan los tiempos de transmisión de un archivo, en segundos, evaluados en
empresas que adoptaron la tecnología WAN y la tecnología LAN bajo condiciones similares.
Determine para qué tipo de tecnología utilizada los tiempos de transmisión de datos son más
homogéneos. Justifique numéricamente su respuesta.
Promedio
Desviación estándar
Coeficiente de variación
Interpretación
La tecnología que presenta los tiempos de transmisión de datos más homogéneos es ……………
UPC MA444 Estadística 69
Ejercicios propuestos
18.La empresa Electro, dedicada a la venta de artefactos electrónicos para el hogar, opera 200 tiendas
en diferentes lugares del país. Los últimos informes indican que las ventas mensuales han
descendido a tal punto que se han tenido que cerrar algunas tiendas. El gerente, con el fin de
enfrentar el problema, ha determinado que es necesario un estudio estadístico de las ventas
semanales (en miles de soles) de un producto electrónico en tres de sus principales tiendas: Aptao,
Azufral y Brento. Las muestras tomadas al azar de cada tienda arrojaron los siguientes resultados:
Media
Desviación estándar
UPC MA444 Estadística 70
b. Determine en cuál de las tiendas las ventas realizadas son más homogéneas.
19.En el medio local hay dos plantas (planta 1 y planta 2) que se dedican a la fabricación de barras de
acero para la construcción. Las empresas proveedoras de barras de acero para la construcción, que
abastecen al mercado constructor, desean averiguar acerca de la media y la desviación estándar de
la resistencia a la tracción.
Para ello, se tomaron muestras aleatorias en ambas plantas y la información registrada acerca de
la resistencia a la tracción (en kg/cm2) se muestra en las siguientes tablas:
Realice el análisis adecuado para la dispersión y responda ¿qué planta es más heterogénea en las
resistencias a la tracción? Sustente su respuesta estadísticamente.
Promedio
Desviación estándar
Coeficiente de variación
UPC MA444 Estadística 71
20.Las represas constituyen una de las principales causas directas e indirectas de contaminación
ambiental. Una de estas causas es la filtración de sustancias contaminantes originando el
debilitamiento de la densidad de la superficie en la cual está construida la represa. Los resultados
que Andino S.A. obtuvo sobre las densidades de los terrenos en represas calificadas con impacto
ambiental regular y en represas con impacto ambiental fuerte se presentan a continuación:
10
10
Cantidad de represas
8 7 7
6 5
4 3
2
2 1
0 35.6
5.5 9.8 14.1 18.4 22.7 27 31.3
Para que una represa siga funcionando, la Confiep establece el cumplimiento de dos condiciones:
• Condición 1: La densidad promedio del terreno con impacto ambiental (regular o fuerte) donde
se ubica la represa debe ser por lo menos 17,5 gr/cm3 para que ésta no se derrumbe.
• Condición 2: La densidad del terreno donde se ubica la represa con impacto ambiental (regular
o fuerte) debe tener una variabilidad relativa de a lo más 34%.
Verifique las condiciones de tal manera que pueda presentar un informe que ayude a identificar
qué tipo de represa (con impacto ambiental fuerte o regular) está habilitada para su normal
funcionamiento.
𝑥̄ − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
𝐴𝑠 = 3 ( )
𝑠
Ejemplo 1
• Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una
v ………
• Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
v ………
• En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de
í …………, q …………
• En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente tienen
f í ……………, q …………………
UPC MA444 Estadística 74
Ejemplo 2
Comasa es una empresa que produce artículos pesados de acero y dispone de un equipo especializado
de operarios que se capacitan constantemente. El último año se ha observado un aumento en el
número de accidentes, incrementándose así el costo de atención inmediata. Con el propósito de
implementar estrategias de prevención de accidentes, se analizarán los costos de la planta de
producción de Lima Sur. A continuación, se presenta la información, en miles de soles:
8 9 10 11 11 12 12 13 13 13 13 14
14 15 15 16 17 17 18 18 19 19 20 21
22 23 24 25 25 26 27 28 28 29 30
22.Covisa es una empresa de construcción civil que compra ladrillos al proveedor Fax S.A. Para
continuar con el proveedor o cambiarlo, ha decidido realizar un análisis de la resistencia transversal
de los ladrillos, en Mn/m2.
3 4 4 4 5 5 6 6 6 7
8 8 8 8 8 9 9 9 10 11
11 11 11 11 11 12 12 12 12 13
13 13 14 15 15 17 17 18 19 20
0,045 0,036 0,045 0,049 0,064 0,07 0,079 0,088 0,091 0,118 0,13 0,136
0,136 0,136 0,145 0,179 0,182 0,182 0,194 0,209 0,209 0,227 0,242 0,258
0,258 0,258 0,291 0,327 0,333 0,336 0,361 0,379 0,394 0,412 0,445 0,506
0,554 0,567 0,579 0,600 0,67 0,912 1,055 1,07 1,267 1,639 1,894 3,046
3,888 3,985 4,170 8,788
a. ¿Cuál es el tiempo máximo de resolución de un problema para ser considerado dentro del 10%
de los más rápidos?
b. ¿Cuál es el tiempo mínimo de resolución de un problema para ser considerado dentro del 20%
de los menos rápidos?
c. Se desea categorizar a los problemas según sus tiempos de resolución en categorías normal,
media y alta ¿Cuáles serán los límites de cada una de ellas si la categoría media contiene al
50% central de la cantidad de problemas?
24.Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una distribución
de frecuencias simétrica de cinco intervalos de igual amplitud resultando que el ingreso mínimo es
de 125 dólares y la marca de clase del cuarto intervalo es de 300 dólares. Si el 8% de los ingresos
son menores que 175 dólares y el 70% de los ingresos son menores a 275 dólares.
9
10
7
8 6
6 4
3
4
2
0
0 1 2 3 4 5 6 7 8
Número de camiones
Fuente: Planta de Lurín
26.Cuando se diseña un puente los ingenieros deben determinar la tensión que el concreto puede
soportar. En lugar de probar cada pulgada cúbica de concreto para determinar su capacidad de
resistencia, los ingenieros toman una muestra, la prueban y llegan a la conclusión sobre qué tanta
tensión, en promedio, puede resistir este tipo de concreto. A continuación, se presenta la tensión
(en kg/cm2) obtenidos de una muestra de 30 bloques de concreto que se utilizarán para construir
un puente.
1,2 2,1 2,2 2,2 2,5 2,5 2,6 2,6 2,7 2,8
3,0 3,0 3,2 3,2 3,2 3,4 3,4 3,5 3,5 3,6
3,6 3,6 3,6 3,7 3,8 3,9 3,9 4,0 4,0 4,0
471,13 472,19 476,25 477,32 478,52 481,02 490,65 496,66 497,66 498,40
502,77 504,44 503,78 506,14 512,88 515,06 516,23 516,89 523,45 523,78
Situación 1
Determinar si la nueva máquina llena las cajas de avena en hojuelas de acuerdo con la especificación
técnica.
La especificación técnica indica que el 90% central de las cajas de avena en hojuelas deben tener un
peso entre 480 y 520 gramos. El gerente de control de calidad sospecha que el peso de la caja no está
cumpliendo con la especificación técnica, y de ser así, significaría que la nueva máquina, al momento
de ser instalada, no fue calibrada correctamente.
CALCULO:
P5 Y P95
P5=????
𝑘(𝑛 + 1) 5(20 + 1)
𝑖= = = 1.05
100 100
X1 = 471.13 = X[E]
X2 = 472.19 = X[E +1]
𝑃5 = 𝑋1 + 0.05(𝑋2 − 𝑋1)
P95
P95=????
𝑘(𝑛 + 1) 95(20 + 1)
𝑖= = = 19.95
100 100
480 y 520
n=20 PAR
𝑥[𝑛] + 𝑥[𝑛+1]
2 2 𝑋10 + 𝑋11 498.40 + 502.77
𝑚𝑒 = = = = 500.585
2 2 2
𝑥̄ − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
𝐴𝑠 = 3 ( )
𝑠
ANALISIS
[480 : 520]
El coeficiente de asimetría es -0.5043 la distribución del peso es asimétrica negativa es decir los
pesos se encuentran concentrados en valores altos.
ARGUMENTACION
Los pesos de las cajas de avena en hojuelas, se encuentran concentrados en valores altos porque se
presenta una asimetría negativa.
Situación 2
Determinar qué proceso de producción tiene mayor variabilidad.
𝑠
𝐶𝑉 = × 100%
𝑥̄
El gerente ordenará una revisión completa de aquel proceso que presente mayor variabilidad. ¿Cuál
de los dos procesos deberá ser revisado completamente?
Nota: Para el caso del proceso de llenado de la caja utilice los cálculos hechos para la situación 1.
fi Marca de clase
2 4.85
3 6.33
5 7.81
7 9.29
2 10.77
1 12.25
66
INTERPRETACION:
REPRESENTACION:
CALCULO:
𝑠
𝐶𝑉 = × 100%
𝑥̄
ANALISIS
El coeficiente de variación del peso es menor al coeficiente de variación del porcentaje de grasa
ARGUMENTACION
El proceso relacionado con el porcentaje de grasa será revisado completamente porque presenta la
mayor variabilidad
UPC MA444 Estadística 82
INTER´RETACION:
Logro
Al finalizar la unidad, el estudiante aplica la teoría de la probabilidad en situaciones de incertidumbre
para la toma de decisiones en casos reales dentro del ámbito de su especialidad.
Temario
• Probabilidad: concepto. Experimento aleatorio, espacio muestral y evento
• Operaciones con eventos
UPC MA444 Estadística 83
• Probabilidad condicional
• Probabilidad total. Teorema de Bayes. Diagrama del árbol
• Eventos independientes
• Variable aleatoria, tipos, valor esperado y desviación estándar
• Distribución de probabilidad de una variable discreta: binomial y Poisson
• Distribución de densidad de una variable continua: normal y exponencial
• Otros modelos de probabilidad aplicados en la Ingeniería Civil y Electrónica
Bibliografía
• Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 4.1 (pág. 124-
126) Capítulo 4.5 (pág. 139-143)
• Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 4.7 (pág. 152-
166)
• Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 6.1 (pág. 211)
• Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 6.1 (pág. 213)
UPC MA444 Estadística 84
Definiciones
Experimento aleatorio
Es una operación cuyo resultado no se puede predecir con certeza y que se realiza bajo las siguientes
condiciones:
• Se puede repetir indefinidamente donde los resultados dependen del azar, por lo que no se pueden
predecir con certeza.
• Se puede describir el conjunto de todos los resultados posibles.
• Cuando se repite un gran número de veces, aparece un modelo definido de regularidad.
Ejemplo 1
Espacio muestral
Es el conjunto de todos los posibles resultados de un experimento aleatorio. Cada elemento de este
conjunto se le denomina punto muestral y se le denota con 𝑤.
Ejemplo 2
1 = {1, 2, 3, 4, 5, 6}
2 = {𝑐𝑐, 𝑐𝑠, 𝑠𝑐, 𝑠𝑠}
3 = {𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜, 𝑛𝑜 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜}
4 = {𝑡/𝑡 ≥ 0}
Evento
Es todo subconjunto del espacio muestral y representa cierta característica de ella. Se denotan
mediante las letras mayúscula de nuestro alfabeto, como por ejemplo A, B o C.
Evento simple
En un evento formado por un sólo un punto muestral. No se puede descomponer.
Ejemplo 3
Ejemplo 4
Si 1= {1, 2, 3, 4, 5, 6}, entonces A = {1, 3, 5} o A:= obtener un número impar es un evento compuesto.
Si 2= {cc, cs, sc, ss}, entonces B= {cs, sc} o B:= obtener dos valores diferentes en las caras superiores
de las dos monedas es un evento compuesto.
Unión
La unión de dos eventos 𝐴 y 𝐵 es el evento que ocurre si A o B, o ambos ocurren en una sola realización
del experimento.
Ejemplo 1
Solución
UPC MA444 Estadística 86
a. Obtenga la intersección y la unión de los eventos 𝐴 y 𝐵.
Solución
El espacio muestral es:
= {1, 2, 3, 4, 5, 6}
Los eventos 𝐴 y 𝐵 son:
𝐴 = {1, 2, 3, 4}
𝐵 = {2, 4, 6}
Solución
Ejemplo 2
Estos eventos A y B son mutuamente excluyentes, dado que ambos a la vez no pueden ocurrir, esto es
𝐴 ∩ 𝐵 = ∅, es decir la intersección de los eventos no tienen elementos en común.
UPC MA444 Estadística 87
Ejemplo 3
b. Sean los eventos: A: suma de los dados es ocho; B: suma de los dados mayor a seis y C: suma de
los dados menor a nueve. Determine los elementos de los eventos.
c. Obtenga la intersección de los eventos A y B, la unión de los eventos B y C ¿Son los eventos A y C
mutuamente excluyentes?
UPC MA444 Estadística 88
Probabilidad
Sea un experimento aleatorio, el espacio muestral asociado y sea 𝐴 un evento definido en el
espacio muestral .
La probabilidad del evento 𝐴 es la medida del grado de posibilidad de ocurrencia del evento 𝐴 cuando
se realiza una vez el experimento.
Axiomas de probabilidad
• 0 ≤ 𝑃(𝐴) ≤ 1
• 𝑃() = 1
• Sean los eventos {𝐴𝑖 }, 𝐴𝑖 ∈ , 𝑖 = 1, 2, 3, … , 𝑛 una sucesión de eventos mutuamente excluyentes,
entonces:
𝑃(𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ … ∪ 𝐴𝑛 ) = ∑ 𝑃(𝐴𝑖 )
𝑖=1
Además,
• Si 𝑃(𝐴) tiende a 0 es poco probable que el evento 𝐴 ocurra.
• Si 𝑃(𝐴) tiende a 1 es un muy probable que el evento 𝐴 ocurra.
• En un espacio muestral finito, la suma de las probabilidades de todos los eventos simples 𝐸𝑖 es igual
a 1.
𝑛
∑ 𝑃(𝐸𝑖 ) = 1, 𝑖 = 1, 2, 3, … , 𝑘
𝑖=1
Sea un experimento aleatorio cuyo correspondiente espacio muestral está formado por un número
n finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces definimos la
probabilidad de un evento 𝐴 como sigue:
𝑛(𝐴)
= {1, 2, 3, 4, 5, 6} A = 3, 5 𝑃(𝐴) = =
𝑛()
𝐴 ∪ 𝐴𝑐 =
Ac
A
𝑃(𝐴) + 𝑃(𝐴𝑐 ) = 1
A B
(AUB)c
𝑃 (𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
UPC MA444 Estadística 91
Ejemplo 1
Solución
Reemplazando valores:
𝑃(𝐸 ∩ 𝑀) = 0,03
E M
0,61
La probabilidad que se haya producido por ambos tipos de falla es 𝑃(𝐸 ∩ 𝑀) = 0,03.
b. ¿Cuál es la probabilidad de que el accidente se haya producido por solo un tipo de falla?
Solución
E M
0,61
Ejemplo 2
Solución
Solución
Definamos el evento 𝐼: = que una refrigeradora tenga imperfecciones en la pintura.
b. Calcule la probabilidad de que las tres refrigeradoras compradas por el comerciante no presenten
imperfecciones de pintura.
Solución
𝐶37 × 𝐶03
𝑃(𝐵) = = 0,2917
𝐶310
UPC MA444 Estadística 93
c. Calcule la probabilidad de que en la compra realizada por el comerciante se encuentre al menos
una refrigeradora con imperfecciones de pintura.
Solución
Ejemplo 3
Solución
5A
6B
4C
N = 15 n=3
Solución
Solución
Definamos el evento necesario.
𝐶06 × 𝐶39
𝑃(𝐸) = 1 − 𝑃(𝐸𝑐 ) = = 0,8154
𝐶315
Ejemplo 4
Dos vendedores de seguros trabajan en la empresa Pacifico. La probabilidad de que el vendedor más
viejo llegue tarde cierto día es 0,20, de que el vendedor más joven llegue tarde cierto día es 0,15 y que
ambos lleguen tarde es 0,09.
a. Determine la probabilidad de que al menos un vendedor llegue tarde al trabajo cierto día.
Solución
𝑃(𝐴 ∩ 𝐵) = 0,09
UPC MA444 Estadística 95
Usando los diagramas de Venn tendremos:
A B
0,74
6
La probabilidad de que al menos un vendedor llegue tarde al trabajo cierto día es la probabilidad
de la unión de A con B, por lo tanto:
𝑃(𝐴 ∪ 𝐵) = 0,20 + 0,15 − 0,09 = 0,26
A B
c. Determine la probabilidad de alguno de los vendedores no llegue tarde al trabajo cierto día.
Solución
La probabilidad pedida es:
𝑃(𝐴𝑐 ∩ 𝐵𝑐 ) = 1 − 𝑃(𝐴 ∩ 𝐵) = 1 − 0,09 = 0,91
Usando los diagramas de Venn tendremos:
A B
b. ¿Cuál es la probabilidad de que se haya producido solo uno de los tipos de defectos?
1 = {1, 2, 3, 4, 5, 6}
2: números pares de tres cifras que se pueden formar con los dígitos 1, 2, 3, 4, 5, 6, 7, 8, 9
Observamos que ya no es fácil listar y contar los posibles resultados, ante esta situación es necesario
utilizar técnicas que nos faciliten el conteo de estos posibles resultados.
Principio de la multiplicación
Si un procedimiento A puede realizarse de 𝑚 maneras y otro procedimiento B puede realizarse de 𝑛
maneras, entonces los dos procedimientos A y B (uno seguido del otro) ocurren de 𝑚 × 𝑛 maneras o
formas.
Ejemplo 1
Ejemplo 1
Solución
Definamos los eventos:
Ejemplo 2
Un ingeniero de telecomunicaciones está proyectando un viaje a una provincia para instalar una
antena parabólica, debe decidir el viaje por bus o por tren. Si hay tres rutas para el bus y dos para el
tren ¿de cuántas maneras posibles puede realizar el viaje?
UPC MA444 Estadística 99
Técnica de conteo: Combinación
Es una técnica que permite contar el número de maneras de seleccionar o elegir aleatoriamente 𝑟
elementos de un total de 𝑛, sin considerar el orden de selección. Está dado por:
𝑛!
𝐶𝑟𝑛 =
𝑟! (𝑛 − 𝑟)!
Ejemplo 1
Una empresa ha decidido que, para el trabajo remoto de su personal, tres de los 15 trabajadores del
área de Recursos Humanos deben asistir de manera presencial a la empresa, ¿de cuántas maneras
puede seleccionar al grupo?
Solución
Definamos el evento necesario:
𝐶: = elegir tres de los de los 15 trabajadores del área de Recursos Humanos para que asistan de manera
presencial a la empresa.
15!
𝑛(𝐶) = 𝐶315 = = 455
3! (15 − 3)!
Ejemplo 2
Solución
Ejemplo 4
De un grupo de ocho pequeñas empresas se sabe que dos no cumplen con sus obligaciones tributarias.
La Sunat revisará el cumplimiento de los tributos de todas las pequeñas empresas si al seleccionar tres
empresas, la probabilidad de que por lo menos una no cumple con sus obligaciones tributarias sea
superior a 0,62 ¿Qué le recomendaría usted a la Sunat?
UPC MA444 Estadística 101
Probabilidad condicional
Si 𝐴 y 𝐵 v Ω, , q
el evento 𝐴 dado 𝐵 se determina por:
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵 ) =
𝑃(𝐵)
Ejemplo 1
Egresado de ingeniería
No egresado de
Mecánica Industrial Total
universidad (N)
Años de experiencia (M) (I)
Al menos tres años de experiencia (A) 14 4 9 27
Menos de tres años de experiencia (B) 25 11 27 63
Total 39 15 36 90
El orden en que el gerente de la estación entrevista a los aspirantes es aleatorio. Calcule la probabilidad
de que el primer entrevistado por el gerente:
a. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
b. Sea egresado de ingeniería mecánica o tenga al menos tres años de experiencia.
c. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
d. Tenga al menos tres años de experiencia dado que es egresado de ingeniería industrial.
Solución
a)
𝑃(𝑁 ∩ 𝐵) 0.3
𝑃(𝑁 ⁄𝐵 ) = = = 0.4286
𝑃(𝐵) 0.7
27
𝑃(𝑁 ∩ 𝐵) = = 0.3
90
63
𝑃(𝐵) = = 0.7
90
Solución
27
𝑃(N ∩ B) = = 0.30
90
Solución
39 27 14
𝑃(𝑀 ∪ 𝐴) = 𝑃(𝑀) + 𝑃(𝐴) − 𝑃(𝑀 ∩ 𝐴) = + − = 0,5778
90 90 90
c. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
Solución
27
𝑃(𝑁 ∩ 𝐵) 90 27
𝑃(𝑁 ⁄𝐵 ) = = = = 0,4286
𝑃(𝐵) 63 63
90
UPC MA444 Estadística 103
d. Tenga al menos tres años de experiencia dado que es egresado de ingeniería industrial.
Solución
4
𝑃(𝐴 ∩ 𝐼) 90 4
𝑃(𝐴⁄𝐼 ) = = = = 0,2667
𝑃(𝐼) 15 15
90
UPC MA444 Estadística 104
Ejemplo 2
a. ¿Cuál es la probabilidad que sea de calidad regular y tenga gran cantidad de partículas?
b. ¿Cuál es la probabilidad que tenga una cantidad media de partículas o sea de mala calidad?
c. ¿Cuál es la probabilidad de que la placa haya sido producida por un troquel con una cantidad
media de partículas o por un troquel con gran cantidad de partículas si la placa no es buena?
d. Dado que la placa de silicio es producida con un troquel que no tiene gran cantidad de partículas,
¿cuál es la probabilidad que sea de buena calidad?
Solución
a. ¿Cuál es la probabilidad que sea de calidad regular y tenga gran cantidad de partículas?
Solución
30
𝑃(𝑅 ∩ 𝐺) = = 0,0566
530
b. ¿Cuál es la probabilidad que tenga una cantidad media de partículas o sea de mala calidad?
Solución
UPC MA444 Estadística 105
Definamos los eventos necesarios:
270 150 65
= + − = 0,6698
530 530 530
c. ¿Cuál es la probabilidad de que la placa haya sido producida por un troquel con una cantidad media
de partículas o por un troquel con gran cantidad de partículas si la placa no es buena?
Solución
190 90 0
= + − = 0,8116
345 345 345
d. Dado que la placa de silicio es producida con un troquel que no tiene gran cantidad de partículas,
¿cuál es la probabilidad que sea de buena calidad?
Solución
Definamos los eventos necesarios:
𝑃(𝐵 ∩ 𝐺 𝑐 ) 80 + 35
𝑃(𝐵/𝐺 𝑐 ) = = = 0,3108
𝑃(𝐺 𝑐 ) 370
UPC MA444 Estadística 106
Ley multiplicativa de probabilidad
Ejemplo 1
Sean 𝐴 y 𝐵 son eventos tales que 𝑃(𝐴) = 0,4; 𝑃(𝐵) = 0,2 y 𝑃(𝐴/𝐵) = 0,5.
𝑃(𝐴⁄𝐵 ) = 𝑃(𝐴)
𝑃 (𝐴 ∩ 𝐵) = 𝑃 (𝐴)𝑃(𝐵)
𝑃( 𝐸1 ∩ 𝐸2 ∩. . . 𝐸𝑘 ) = 𝑃( 𝐸1 ) 𝑃( 𝐸2 ) ⋯ 𝑃( 𝐸𝑘 )
Propiedades
• 𝐴𝑐 y 𝐵𝑐 ; entonces:
𝑃(𝐴𝑐 ∩ 𝐵𝑐 ) = 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )
• 𝐴𝑐 y 𝐵; entonces:
𝑃(𝐴𝑐 ∩ 𝐵) = 𝑃(𝐴𝑐 )𝑃(𝐵)
• 𝐴y 𝐵𝑐 ; entonces:
𝑃(𝐴 ∩ 𝐵𝑐 ) = 𝑃(𝐴)𝑃(𝐵𝑐 )
Leyes de De Morgan
Un sistema electrónico está compuesto por tres subsistemas A, B y C, de tal manera que las
probabilidades de fallar de cada uno son 0,15; 0,20 y 0,35. Si los subsistemas funcionan de manera
independiente, calcular:
a. Calcular la probabilidad de que al menos uno de los subsistemas falle.
b. Calcular la probabilidad de solo dos de los subsistemas funcione.
Solución
Solución
𝑃(𝑆) = 1 − 𝑃(𝑆 𝑐 )
Para que ninguno de los sistemas falle, no debe fallar ninguno de los sistemas 𝐴, 𝐵 y 𝐶.
𝑃(𝑆) = 1 − 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶 𝑐 )
Solución
Para que solo dos de los sistemas funcionen, deben funcionar A y C pero no B; B y C pero no A; A y
B pero no C. Por lo tanto:
UPC MA444 Estadística 109
𝑃(𝑆2 ) = 0,85 × 0,20 × 0,65 + 0,15 × 0,80 × 0,65 + 0,85 × 0,80 × 0,35 = 0,4265
Ejemplo 2
Una empresa produce piezas en tres máquinas, M1, M2 y M3, que pueden presentar desajustes de
manera independiente, con probabilidades 0,02; 0,01 y 0,06 respectivamente. Al inicio de un día de
operación se realiza una prueba en cada máquina. Si se observan desajustes en una máquina, ésta
debe pasar el día en revisión técnica. Para cumplir el nivel mínimo de producción diaria se necesita que
al menos dos de las tres máquinas funcionen.
a. ¿Cuál es la probabilidad de que una de las tres máquinas deba pasar el día en revisión técnica?
b. ¿Cuál es la probabilidad de cumplir con el nivel mínimo de producción diaria?
Solución
a. ¿Cuál es la probabilidad de que una de las tres máquinas deba pasar el día en revisión técnica?
Solución
Para que solo una de las máquinas presente desajustes, deben presentarlos M1 pero no M2 y M3;
M2 pero no M1 y M3; M3 pero no M1 y M2.
Por lo tanto:
𝑃(𝑅) = 0,02 × 0,99 × 0,94 + 0,98 × 0,01 × 0,94 + 0,98 × 0,99 × 0,06 = 0,086
Solución
Para cumplir el nivel mínimo de producción diaria se necesita que al menos dos de las tres máquinas
funcionen, es decir, funcionen dos de las máquinas o las tres.
𝑃(𝑁) = 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶) + 𝑃(𝐴𝑐 )𝑃(𝐵)𝑃(𝐶 𝑐 ) + 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶) + 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶 𝑐 )
𝑃(𝑁) = 0,98 × 0,99 × 0,06 + 0,98 × 0,01 × 0,94 + 0,02 × 0,99 × 0,94 + 0,98 × 0,99 × 0,94
𝑃(𝑁) = 0,9980
UPC MA444 Estadística 111
Aplicación al sistema de componentes: Confiabilidad de sistemas
Podemos aplicar el concepto de la independencia de eventos al caso en que se tenga un sistema de
componentes electrónicos acoplados en serie o en paralelo.
Sistema en serie
Un sistema de componentes acopladas en serie funciona si todos sus componentes funcionan.
Para que el sistema funcione 𝑆, ambos componentes, A y B, deben funcionar. Se asume que cada
componente funciona de forma independiente.
A B
𝑃(S) = 𝑃(𝐴 ∩ 𝐵)
𝑃(𝑆) = 𝑃(𝐴)𝑃(𝐵)
Ejemplo 1
El sistema funcionará sólo si ambos componentes funcionan. El componente A funciona con una
probabilidad de 0,98 y el componente B funciona con una probabilidad de 0,95. Suponga que A y B
funcionan de manera independiente. Determine la probabilidad que el sistema funcione.
Solución
Sean los eventos:
𝐴 ≔ el componente A funcione
𝐵 ≔ el componente B funcione
𝑆 ≔ el sistema funcione
A B
𝑃(𝑆) = 𝑃(𝐴 ∩ 𝐵)
Ejemplo 2
Los componentes A y B funcionan con una probabilidad de 0,90 y 0,85 respectivamente. Suponga que
los componentes A y B funcionan de manera independiente. Determine la probabilidad de que el
sistema funcione.
B
Solución
0,8
C
0,9 0,8
A B
0,8
D
a. Calcule la probabilidad que el sistema completo funcione.
b. Calcule la probabilidad que el componente C no funcione, dado que el sistema completo funciona.
UPC MA444 Estadística 114
Probabilidad total y el teorema de Bayes
Probabilidad total
Sean los eventos 𝐴1 , 𝐴2 , . . . , 𝐴𝑘 , los cuales forman una partición del espacio muestral mutuamente
excluyentes y exhaustivos y sea 𝐸 otro evento cualquiera de , se cumple:
𝐴1 𝐴2 𝐴𝑘
A B C
REGLA DE MULTIPLICACION
P(A∩D)
P (A / D) = P (D )
P(A∩D)
P (D / A) = P (A )
P (A / D)*P(D) = P ( A ∩ D )
P (D / A)*P(A) = P ( A ∩ D )
Teorema de Bayes
Si los eventos 𝐴1 , 𝐴2 , . . . , 𝐴𝑘 constituyen una partición del espacio muestral , entonces para cualquier
evento 𝐸 de , se cumple que:
𝑃(𝐴𝑖 ∩ 𝐸)
𝑃(𝐴𝑖 ⁄𝐸) = 𝑖 = 1, 2, … , 𝑘
𝑃(𝐸)
𝑃(𝐴𝑖 )𝑃(𝐸⁄𝐴𝑖 )
𝑃(𝐴𝑖 ⁄𝐸) =
𝑃(𝐴1 )𝑃(𝐸⁄𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐸⁄𝐴2 ) + ⋯ + 𝑃(𝐴𝑘 )𝑃(𝐸⁄𝐴𝑘 )
UPC MA444 Estadística 116
Ejemplo 1
Una cadena de tiendas de suministros de construcción vende tres marcas diferentes de teodolitos. De
sus ventas de teodolitos, 50% son de la marca 1 (la menos cara), 30% son de la marca 2 y 20% son de
la marca 3 (la más cara).
Cada fabricante ofrece un año de garantía en las partes y mano de obra. Se sabe que 25% de los
teodolitos de la marca 1 requieren trabajo de reparación dentro del periodo de garantía, mientras que
los porcentajes correspondientes de las marcas 2 y 3 son 20% y 10%, respectivamente.
Determine:
a. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya adquirido un teodolito de
la marca 1 y que necesitará reparación mientras se encuentra dentro de garantía?
b. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya comprado un teodolito
que necesite reparación mientras se encuentra dentro de la garantía?
c. Si un cliente regresa a la tienda con un teodolito que necesita reparación dentro de garantía, ¿cuál
es la probabilidad de que sea un teodolito de la marca 1?
Solución
Solución
La probabilidad pedida es:
Solución
𝑁: = necesita reparación mientras se encuentra dentro de la garantía
c. Si un cliente regresa a la tienda con un teodolito que necesita reparación dentro de la garantía,
¿cuál es la probabilidad de que sea un teodolito de la marca 1?
Solución
Ejemplo 2
Tres máquinas A, B y C, producen el 45%, 30% y 25% respectivamente del total de las piezas producidas
en una fábrica. El porcentaje de producción de piezas defectuosas de estas máquinas son del 3%, 4%
y 5% respectivamente.
Solución
Solución
La probabilidad pedida es:
Solución
La probabilidad pedida es:
c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?
Solución
Las probabilidades pedidas son:
Una empresa se encuentra estudiando la posibilidad de importar para el próximo año un nuevo
modelo de celular de última generación. Al estudiar la situación económica del próximo año se
contemplan tres posibilidades: inflación, estabilidad o crecimiento, estimando dichas alternativas con
las siguientes probabilidades: 0,55; 0,35 y 0,10 respectivamente. La probabilidad de importar el nuevo
modelo de celular es 0,25 si existiera inflación; 0,40 si existiera estabilidad y 0,65 si existiera
crecimiento.
c. Asumiendo que la empresa decidió importar el nuevo modelo de celular, ¿cuál es la probabilidad
que existiera inflación en la economía?
UPC MA444 Estadística 121
Ejemplo 4
17
La probabilidad que la construcción de un edificio termine a tiempo es , la probabilidad que no haya
20
3 14
huelga es y la probabilidad que la construcción se termine a tiempo dado que no hubo huelga es ;
4 15
1
la probabilidad que haya huelga y no se termine la construcción a tiempo es .
10
27.Una empresa constructora emplea a tres ingenieros de ventas. El ingeniero 1 hace el trabajo de
estimar costos en 60% de las cotizaciones solicitadas a la empresa, el ingeniero 2 hace lo mismo en
30% de las cotizaciones y el ingeniero 3 en el resto. Se sabe que la tasa de error para el ingeniero 1
es tal que la probabilidad de encontrar un error en su trabajo es 0,02; la probabilidad de encontrar
un error en el trabajo del ingeniero 2 es 0,04 y la probabilidad de encontrar un error en el ingeniero
3 es de 0,03.
Suponga que al revisar una solicitud de cotización se encuentra un error grave en la estimación de
los costos. ¿Qué ingeniero supondría usted que hizo los cálculos?
28.El informe de la comisión mundial de represas (ONU, 2015) indica numerosos impactos ambientales
que logran dañar represas, provocando en ellas averías muy serias. La Confiep debe recomendar
un tipo de estructura antes de diseñar una nueva represa. Por registros anteriores se sabe que en
el Perú el 55% de las represas están hechas a base de cimientos, el 28% con terraplenes y el resto
con excavaciones. Además, se conoce que, cuando el diseño de la estructura de la represa es a base
de cimientos ésta no presenta averías en un 80%, si es a base de terraplenes presenta averías en
un 35% y si la estructura es a base de excavaciones presenta averías en un 25%.
Si se elige una represa al azar y ésta presenta averías ¿cuál es el tipo de diseño de estructura que
debería recomendar la Confiep?
29.Consideremos que tres máquinas Alpha, Beta y Gamma producen respectivamente el 50%, el 30%
y el 20% del número total de artículos de una fábrica. Si la proporción de artículos defectuosos que
produce cada una de estas máquinas es 0,03; 0,04 y 0,05 respectivamente y se selecciona un
artículo aleatoriamente.
30.Una empresa vende tres tipos de maquinaria pesada para la industria textil A, B y C. El 70% de las
máquinas son del tipo A, el 20% del tipo B y el 10% son del tipo C. Las máquinas A tienen una
probabilidad de 0,10 de producir una pieza defectuosa a lo largo de un año, las máquinas B tienen
una probabilidad de 0,30 y las máquinas C tienen una probabilidad 0,60 de producir una de tales
piezas defectuosas a lo largo de un año.
Una de estas máquinas ha estado funcionando durante un año de prueba y ha producido una pieza
defectuosa. ¿De cuál tipo de máquina es más probable que provenga la pieza defectuosa?
31.Una de las etapas de producción de drones es el ensamblado de la cubierta del casco para
exteriores. Se programan diariamente 1400 cascos utilizando a tres especialistas A, B y C. El
especialista A atiende 170 cascos, el especialista B atiende 500 cascos y el especialista C atiende los
restantes.
UPC MA444 Estadística 123
Cabe la posibilidad de que el ensamblado del casco no sea el correcto; por lo tanto, el casco
ensamblado sería defectuoso. La siguiente tabla muestra como varía la proporción del ensamblado
defectuoso del casco para cada especialista.
Si se selecciona al azar un dron con casco ensamblado defectuoso, ¿cuál es la probabilidad de que
lo haya ensamblado el especialista B?
32.Una de las medidas que se consideran para regular el volumen de agua en m 3 en las represas, es
abrir las compuertas para que las represas no rebalsen. Las compuertas operan en forma
independiente de acuerdo con dos tipos de sistemas. Estos sistemas operan solo si hay una
trayectoria de dispositivos funcionales de izquierda a derecha. Su funcionamiento es muy
importante por lo que el ingeniero de mantenimiento recomendará utilizar aquel sistema que
presente mayor probabilidad de flujo de funcionamiento continuo.
Sistema 1 Sistema 2
¿Cuál de los dos sistemas deberá elegir para ser instalado en una compuerta? Suponga que cada
dispositivo funciona de manera independiente con una probabilidad de 0,85.
1 3 4
2 5 6
34.Electronic Systems Company que brinda soporte especializado en la instalación de redes con
tecnología LAN o WAN en diferentes empresas, sabe que el 15% de las empresas prefieren como
medio físico de transporte los cables de cobre de par trenzado, el 35% prefiere los cables coaxiales,
el 40% fibras ópticas y 10% el aire. Además, si la empresa elige los cables de cobre de par trenzado
como medio físico, la probabilidad que elija la tecnología WAN es 0,62. Las empresas que eligen
cables coaxiales tienen una probabilidad de 0,45 de elegir la tecnología LAN; las empresas que
eligen la fibra óptica tienen una probabilidad de 0,55 de elegir la tecnología WAN y las empresas
que eligen el aire como medio físico de transporte tienen una probabilidad de 0,5 de elegir la
tecnología LAN.
UPC MA444 Estadística 124
a. Calcule la probabilidad que una empresa elija para su red la tecnología LAN.
b. Si se selecciona al azar una empresa que utiliza tecnología WAN, ¿cuál es la probabilidad que
utilice como medio físico de transporte cables de cobre de par trenzado?
35.Si la probabilidad de que cada llave esté cerrada dejando pasar corriente es 𝑝 = 0,6 y las llaves se
cierran y se abren en forma independiente, calcular la probabilidad de que pase corriente de I hacia
O en el siguiente circuito.
UPC MA444 Estadística 125
Caso: Construcción de represas
Si se elige una represa al azar y esta presenta averías, ¿cuál es el tipo de material que debería
recomendar la Confiep para que no ocurran fallas estructurales?
UPC MA444 Estadística 126
Variable aleatoria
Sea Ω un espacio muestral. Una variable aleatoria es una función 𝑋 que transforma cada resultado w
del espacio muestral en un número real 𝑋(𝑤).
Ejemplo 1
Al lanzar dos monedas para registrar los posibles resultados se obtiene el espacio muestral siguiente:
Si definimos la variable aleatoria X como número de caras que se obtiene, entonces a cada resultado
de , es posible asignarle un número real de la siguiente manera:
Número de caras 0 1 2
f(x) = P(X = x) 0.25 0.50 0.25
UPC MA444 Estadística 127
Por ejemplo: número de circuitos electrónicos producidos por una empresa que cumplen con las
especificaciones técnicas, número de llamadas que recibe una central telefónica.
Por ejemplo: resistencia a la ruptura de un material plástico (onzas por pulgada cuadrada), resistencia
transversal de los ladrillos fabricados por una empresa (MN/m 2).
Sea 𝑋 una variable aleatoria discreta. La función de probabilidad de una variable aleatoria discreta
representa la probabilidad de que la variable aleatoria tome un valor genérico igual a x y se denotará
de la siguiente manera:
𝒇(𝒙) = 𝑷(𝑿 = 𝒙)
𝑷(𝑿 = 𝟑)
𝑓(𝑥) ≥ 0
∑ 𝒇(𝒙) = 𝟏
𝑹𝒂𝒏𝒈𝒐 𝑿
Ejemplo 1
El ingeniero de producción de la empresa Tecnotronics S.A. ha determinado que la distribución de
probabilidades del número de artículos defectuosos por lote es la siguiente:
Solución
∑ 𝑓(𝑥) = 1
𝑅𝑎𝑛𝑔𝑜 𝑋
c. Si el lote tiene dos o más artículos defectuosos, es considerado malo; calcule la probabilidad que
el lote sea malo.
Solución
El lote será malo si tiene dos o más artículos defectuosos, por lo tanto, la probabilidad pedida es:
POR COMPLEMENTO:
d. Si se sabe que el número de artículos defectuosos por lote es al menos uno, calcule la probabilidad
de que el número de artículos defectuosos sea menor a tres.
Solución
PROBABILIDAD CONDICIONAL:
𝑃(𝐴 ∩ B)
𝑃(𝐴/𝐵) =
𝑃(B)
POR COMPLEMENTO:
DESARROLLO:
𝑃(𝑋 < 3 ∩ 𝑋 ≥ 1)
𝑃 (𝑋 < 3 /𝑋 ≥ 1) =
𝑃(𝑋 ≥ 1)
𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)
𝑃 (𝑋 < 3 /𝑋 ≥ 1) =
1 − 𝑃(𝑋 = 0)
0,15 + 0,10
𝑃 (𝑋 < 3 /𝑋 ≥ 1) = = 0,3333
0.75
UPC MA444 Estadística 130
Ejemplo 2
El departamento de control de calidad de una empresa selecciona al azar diariamente tres bombillas
de un lote que contiene 20 bombillas, para decidir si acepta el lote y los pasa al departamento de
producción o rechaza el lote y los devuelve al proveedor.
𝑃(𝑋 = 0) =
𝑃(𝑋 = 1) =
𝑃(𝑋 = 2) =
c. En relación con la regla planteada en (b), si el lote es aceptado, ¿cuál es la probabilidad que la
muestra contenga un defectuoso?
UPC MA444 Estadística 131
Esperado de una variable aleatoria discreta
Sea X una variable aleatoria discreta con función de probabilidad f(x). Entonces el valor esperado o
media de X es:
𝜇 = 𝑬(𝑿) = ∑ 𝑥 𝑓(𝑥)
𝑅𝑎𝑛𝑔𝑜 𝑋
Sea 𝑋 una variable discreta con función de probabilidad f(x). Entonces, la varianza de X es:
donde:
𝐸(𝑋 2 ) = ∑ 𝑥 2 𝑓(𝑥)
𝑅𝑎𝑛𝑔𝑜 𝑋
𝜎 = √𝜎 2
Ejemplo 1
El número de fallas de energía eléctrica que afectan a cierta región en cualquier año dado se considera
una variable aleatoria que tiene la siguiente función de probabilidad:
X: El número de
fallas de energía 0 1 2 3
eléctrica
P(X = x) 0,38 0,24 k 0,08
Solución
En primer lugar, hallaremos el valor de k para que la distribución sea función de probabilidad:
𝟎, 𝟑𝟖 + 𝟎, 𝟐𝟒 + 𝒌 + 𝟎, 𝟎𝟖 = 𝟏
Despejando, el valor de 𝒌 = 𝟎, 𝟑.
𝜇 = 𝐸(𝑋) = ∑ 𝑥 𝑓(𝑥)
𝑅𝑎𝑛𝑔𝑜 𝑋
X: El número de
fallas de energía 0 1 2 3
eléctrica
P(X = x) 0,38 0,24 0.30 0,08
Reemplazando:
Interpretación
Si el experimento se repitiera muchas veces, en promedio el número de fallas de energía eléctrica
que afectan a cierta región en cualquier año dado sería de 1,08.
Solución
Primero, calculamos la varianza y usaremos la fórmula:
Donde:
𝑬(𝑿𝟐 ) = 𝟎𝟐 × 𝟎, 𝟑𝟖 + 𝟏𝟐 × 𝟎, 𝟐𝟒 + 𝟐𝟐 × 𝟎, 𝟑 + 𝟑𝟐 × 𝟎, 𝟎𝟖 = 𝟐, 𝟏𝟔
Reemplazando:
𝐷𝑆(𝑋) 0.9968
𝐶𝑉(𝑋) = ∗ 100 = ∗ 100 = 92.30%
𝐸(𝑋) 1.08
Ejemplo 2
Un ingeniero civil del departamento de obras muestra la distribución de probabilidad de la variable
aleatoria 𝑋: = número de habitaciones a construir en edificios residenciales.
x 4 5 7 8 9
f(x) 0,20 0,25 0,10 0,15 0,30
a. Si la gerencia del departamento de obras le impone que construya menos de ocho habitaciones y
suponiendo que se cumple con este requerimiento, ¿cuál es la probabilidad que construya por lo
menos cinco habitaciones?
b. Si el costo de una vivienda, en dólares, está en función del número de habitaciones de acuerdo con
la siguiente ecuación 𝐶(𝑋) = 14000𝑋 + 5000. Indique la media del costo de una vivienda.
Solución
a. Si la gerencia del departamento de obras le impone que construya menos de ocho habitaciones y
suponiendo que se cumple con este requerimiento, ¿cuál es la probabilidad que construya por lo
menos cinco habitaciones?
Solución
Solución
Si el valor esperado de X es 1,71 fallas por cable, ¿cuál es la probabilidad de que un cable presente
a lo más dos fallas?
x 0 1 2 3 4
f(x) a 0,37 0,16 b 0,01
38.Una librería necesita hacer el pedido semanal de una revista especializada de ingeniería. Por
registros históricos, se sabe que las frecuencias relativas de vender una cantidad de ejemplares es
la siguiente:
Demanda de ejemplares 1 2 3 4 5 6
Frecuencia relativa 1/15 2/15 3/15 4/15 3/15 2/15
a. Calcule la probabilidad de que en las cinco tostadoras seleccionadas existan exactamente dos
de la marca A.
b. Calcule la probabilidad de que en las cinco tostadoras seleccionadas, a lo sumo, haya una
tostadora de las marcas menos conocidas.
UPC MA444 Estadística 136
Distribuciones discretas especiales
Distribución Binomial
El experimento consiste en 𝑛 pruebas idénticas de Bernoulli. Cada prueba tiene únicamente dos
resultados: éxito o fracaso. 𝑃(é𝑥𝑖𝑡𝑜) = 𝑝 y 𝑃(𝑓𝑟𝑎𝑐𝑎𝑠𝑜) = 1 − 𝑝 se mantiene constante a lo largo de
todas las pruebas.
La probabilidad del evento considerado como éxito es constante en cada prueba y se denota por 𝑝.
donde:
EJEMPLO:
OTRO EJEMPLO:
Notación
Si la variable aleatoria 𝑋 sigue una distribución binomial con parámetros 𝒏 y 𝒑 se denota 𝑋~𝐵(𝑛, 𝑝).
Media
= 𝐸(𝑋) = 𝑛𝑝
Varianza
2 = 𝑉(𝑋) = 𝑛𝑝(1 − 𝑝)
La probabilidad de que el comprador de un osciloscopio haga uso del servicio dentro del plazo de
garantía es 0,20. Para los cinco osciloscopios que cierta empresa ha vendido independientemente a
cinco compradores este mes.
Solución
𝑋~𝐵(𝑛 = 5, 𝑝 = 0,20)
El rango de 𝑋 es 0, 1, 2, …, 5
RANGO: X = 0, 1, 2,3, 4, 5
Solución
CON EXCEL:
=DISTR.BINOM.N(3,5,0.2,FALSO)
𝑃(𝑋 = 3) = 0.0512
=DISTR.BINOM.N
UPC MA444 Estadística 138
Solución
CON EXCEL:
=DISTR.BINOM.N(1,5,0.2,VERDADERO)
𝑃(𝑋 ≤ 1) = 0.73728
Solución
𝑷(𝑿 ≥ 𝟑) = 1 − [𝐶05 0,200 (1 − 0,20)5 + 𝐶15 0,21 (1 − 0,2)4 + 𝐶25 0,22 (1 − 0,2)3 ]
CON EXCEL:
=DISTR.BINOM.N(1,5,0.2,VERDADERO)
P(X<3) =P(X<=2)
=DISTR.BINOM.N(2,5,0.2,VERDADERO)
UPC MA444 Estadística 139
Ejemplo 2
El supervisor de una obra ha determinado que un proveedor entrega los pedidos a tiempo alrededor
del 94% de las veces. Para su última obra, el supervisor seleccionó una muestra de 12 pedidos.
El rango de 𝑋 es 0, 1, 2, …, 12
Solución
12
𝑃(𝑋 = 11) = 𝐶11 0,9411 (1 − 0,94)1 = 0,3645
Solución
𝐸(𝑋) = 𝑛𝑝 = 11,28
UPC MA444 Estadística 140
Ejemplo 3
𝑋~
El rango de 𝑋 es 0, 1, 2, …,
40.Un cierto sistema mecánico contiene componentes y se han seleccionado al azar 10. Suponga que
la probabilidad de que cualquier componente individual falle es de 0,07 y que los componentes
fallan independientes unos de otros.
Problema 1
En el área de ventas de la empresa se han detectado reclamos por parte de los clientes que adquirieron
equipos de protección fallados y que serán devueltos. Si la probabilidad que se devuelvan dos o más
equipos en una semana es mayor a 0,35; se recomendará a la gerencia de comercialización cambiar
de proveedor. A continuación, se muestra la siguiente información:
INTERPRETACION
Determinar si la gerencia de comercialización cambiara de proveedor.
REPRESENTACION
CALCULO
Tabla de distribución de Probabilidad
2K+0.42+K+0.20+0.08 = 1
K = 0.1
ANALISIS
P(X>=2) = 0.80
La probabilidad que se devuelvan dos o más equipos en una semana es 0.80, se observa que es
superior a 0.35
ARGUMENTACION
Problema 2
Debido a la globalización y al desarrollo constante de las comunicaciones, los pedidos por internet se
han incrementado últimamente. Un grupo de profesionales de la empresa ha observado que el 25%
de sus clientes realiza sus compras por Internet. Si se eligen al azar 10 clientes y SI se obtiene que la
probabilidad de que más de tres de ellos realizaron sus compras por Internet supera el 0,2, entonces
se recomendará a la gerencia implementar la promoción de envió de pedidos a domicilio sin ningún
costo.
INTERPRETACION
Determinar si la gerencia debe implementar la promoción de envió de pedidos a domicilio sin ningún
costo.
.
REPRESENTACION
CALCULO
Sea 𝑋: = cantidad de clientes que realizan sus compras por internet en una muestra de 10 clientes
El rango de 𝑋 es 0, 1, 2, …, 10
P(X > 3) = 1 - P(X <= 3) = 1 – [ P(X=0)+ P(X=1)+ P(X=2)+ P(X=3)] = 1 – 0.77588 = 0.22412
ANALISIS
P(X> 3) = 0.22412
La probabilidad de que más de tres de clientes realizaron sus compras por Internet es 0.22412, se
observa que es superior a 0.20
ARGUMENTACION
Se recomienda que la gerencia debe implementar la promoción de envió de pedidos a domicilio sin
ningún costo.
UPC MA444 Estadística 145
Distribución Poisson
El experimento consiste en realizar el conteo del número X de veces que ocurre un evento en particular
durante una unidad de tiempo, área, volumen, peso, distancia o cualquier otra unidad de medida dada.
La probabilidad de que un evento ocurra en una unidad dada de tiempo, área, etc.; es la misma para
todas las unidades.
El número de eventos que ocurren en una unidad de tiempo, área, volumen es independiente del
número de los que ocurren en otras unidades.
𝑒 −𝜇 𝜇 𝑥
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 = 0, 1, 2, 3, …
𝑥!
donde:
𝒕: = periodo de evaluación
Notación
La variable aleatoria X sigue una distribución Poisson con parámetro 𝜇 y se denota por 𝑿~𝑷(𝝁), donde
𝝁 = 𝒕
Media
𝜇 = 𝐸(𝑋) = 𝜆𝑡
Varianza
𝜎 2 = 𝑉(𝑋) = 𝜆𝑡 = 𝜇
Solución
𝑡 = 1 𝑘𝑚
Por lo tanto,
PARAMETRO:
1,25 𝑏𝑎𝑐ℎ𝑒𝑠
𝜇 = 𝑡 = × 1 𝑘𝑚 = 0,3125 𝑏𝑎𝑐ℎ𝑒𝑠
4 𝑘𝑚
𝑿~𝑷(𝝁 = 𝟎, 𝟑𝟏𝟐𝟓)
𝑒 −0,3125 0,3125𝑥
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 = 0, 1, 2, 3, …𝐼𝑁𝐹𝐼𝑁𝐼𝑇𝑂
𝑥!
=POISSON.DIST(2,0.3125,FALSO)
UPC MA444 Estadística 147
b. La probabilidad de que en los siguientes dos kilómetros se encuentre a lo más tres baches o
fisuras.
Solución
𝒕 = 𝟐 𝒌𝒎
Por lo tanto,
1,25 𝑏𝑎𝑐ℎ𝑒𝑠
𝜇 = 𝑡 = × 2 𝑘𝑚 = 0,625
4 𝑘𝑚
𝑌~𝑃(𝜇 = 0,625)
𝑒 −0,625 0,625𝑦
𝑃(𝑌 = 𝑦) = 𝑦 = 0, 1, 2, 3, … 𝐼𝑁𝐹𝐼𝑁𝐼𝑇𝑂
𝑦!
=POISSON.DIST(2,0.3125,FALSO)
c. El costo de reparación de estos defectos es de 35 dólares por cada bache o fisura detectada.
Calcule el costo esperado al inspeccionar 80 km de esta carretera.
Solución
𝑡 = 80 𝑘𝑚
Por lo tanto,
1,25 𝑏𝑎𝑐ℎ𝑒𝑠
𝜇 = 𝑡 = × 80 𝑘𝑚 = 25
4 𝑘𝑚
𝑊~𝑃(𝜇 = 25)
𝐶(𝑋) = 35𝑋
Ejemplo 3
En un estudio del tránsito en cierta intersección, se determinó que el número de automóviles que
llegan a un óvalo tiene distribución de Poisson con media igual a tres automóviles por segundo.
a. Calcule la probabilidad de que en dos segundos lleguen al óvalo exactamente dos automóviles.
b. Calcule la probabilidad de que en dos segundos lleguen al óvalo menos de tres automóviles.
c. Calcule la probabilidad de que en los siguientes tres segundos lleguen al óvalo por lo menos dos
automóviles.
Solución
a. Calcule la probabilidad de que en dos segundos lleguen al óvalo exactamente dos automóviles.
Solución
𝑡 = 2 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
Por lo tanto:
UPC MA444 Estadística 149
3 𝑎𝑢𝑡𝑜𝑠
𝜇 = 𝑡 = × 2 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 = 6
1 𝑠𝑒𝑔𝑢𝑛𝑑𝑜
𝑋~𝑃(𝜇 = 6)
62 × 𝑒 −6
𝑃(𝑋 = 2) = = 0,0446
2!
b. Calcule la probabilidad de que en dos segundos lleguen al ovalo menos de tres automóviles.
Solución
60 𝑒 −6 61 𝑒 −6 62 𝑒 −6
𝑃(𝑋 < 3) = + +
0! 1! 2!
c. Calcule la probabilidad de que en los siguientes tres segundos lleguen al óvalo por lo menos dos
automóviles.
Solución
𝑡 = 3 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
Por lo tanto,
3 𝑎𝑢𝑡𝑜𝑠
𝜇 = 𝑡 = × 3 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 = 9
1 𝑠𝑒𝑔𝑢𝑛𝑑𝑜
𝑋~𝑃(𝜇 = 9)
90 × 𝑒 −9 91 × 𝑒 −9
𝑃(𝑌 ≥ 2) = 1 − ( + )
0! 1!
UPC MA444 Estadística 150
𝑃(𝑌 ≥ 2) = 1 − 0,00123 = 0,9988
Ejemplo 4
Con la finalidad de diseñar un nuevo sistema de control de tráfico, un ingeniero recoge información
sobre el número de automóviles que llegan a una intersección. Por histórico, se sabe que en promedio
llegan cuatro autos a la intersección cada minuto según un proceso de Poisson.
Solución
𝑋~
El rango de 𝑋 es
b. ¿Qué probabilidad hay de que entre las 5:25 pm y 5:28 pm lleguen más de dos autos?
c. Si en un minuto llegaron más de tres autos, ¿cuál es la probabilidad que como máximo sean cinco
los autos que llegaron en ese minuto?
UPC MA444 Estadística 151
Ejemplo 5
Cierto tipo de azulejo puede tener un número X de puntos defectuosos con media de tres puntos
defectuosos por azulejo. Calcule la probabilidad de que se presenten cinco defectos en un azulejo
elegido al azar.
𝑋~
El rango de 𝑋 es
41.Debido al calentamiento global, es muy común la presencia de caracoles en las represas debido a
sus aguas estancadas, lo cual hace que se produzcan enfermedades nocivas para el hombre y su
entorno. El número de caracoles presentes en las aguas estancadas sigue una distribución Poisson
con un promedio de 16 caracoles por cinco m3 de agua.
La OMS establece que si la probabilidad de que haya más de un caracol presente en un m3 de agua
estancada es mayor a 0,75 se deberá comprar un filtro especial como norma sanitaria. ¿Se llegará
a realizar la compra de dicho filtro?
42.En un estudio del tránsito en cierta intersección, se determinó que el número de automóviles que
llegan a un óvalo tiene distribución de Poisson con media igual a cinco automóviles por segundo.
Condición 1
𝑓(𝑥) ≥ 0
Condición 2
+∞
∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎
Para variables continuas se cumple:
� (� )
� (� ≤ � ≤ � )
� �
Ejemplo 1
Sea 𝑘 una constante y consideremos la función de densidad de la vida útil, en años, de cierto tipo de
computadora.
𝒌𝑥 0≤𝑥≤2
𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Solución
Para que 𝑓(𝑥) sea función de densidad debe satisfacer las siguientes condiciones:
Condición 1
𝑓(𝑥) ≥ 0
Para el tramo 0 ≤ 𝑥 ≤ 2
𝑘𝑥 ≥0
Por tanto, 𝑘 debe ser positivo.
Condición 2
+∞
∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞
∫ 𝑘𝑥 𝑑𝑥 = 1
0
Integrando:
2
𝑥2
𝑘 ( )|
2 0
Evaluando en 0 y 2. se tiene:
22 02
𝑘( − )=1
2 2
1
𝑘=
2
Reemplazando tenemos:
1
𝑓(𝑥) = {2 𝑥 0≤𝑥≤2
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Solución
La probabilidad pedida es:
1,8
1
𝑃(𝟎, 𝟓 < 𝑿 < 𝟏. 𝟖) = ∫ 𝑥 𝑑𝑥 = 0,7475
2
0,5
UPC MA444 Estadística 156
c. Calcule 𝑃(𝑋 > 1).
Solución
La probabilidad pedida es:
2
1
𝑃(𝑋 > 1) = ∫ 𝑥 𝑑𝑥 = 0,75
2
1
Ejemplo 2
El peso, en onzas, de un artículo de gasfitería usado en hogares y oficinas es una variable aleatoria 𝑋
con función densidad:
𝑘(𝑥 − 8) 8 ≤ 𝑥 ≤ 10
𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
10
∫ 𝑘(𝑥 − 8) 𝑑𝑥 = 1
8
Integrando:
10
𝑥2
𝑘[ ( )| - 8(𝑥)|10
8 ]
2 8
1
𝑘=
2
1
𝑓(𝑥) = {2 (𝑥 − 8) 8 ≤ 𝑥 ≤ 10
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
UPC MA444 Estadística 157
10 1
𝑃(𝑋 > 9) = ∫9 (𝑥 − 8) 𝑑𝑥 =0.75
2
c. Los artículos con un peso menor a 8,5 onzas son separados. Calcule la probabilidad que un artículo,
seleccionado al azar, sea separado.
8.5 1
𝑃(𝑋 < 8.5) = ∫8 (𝑥 − 8) 𝑑𝑥 =0.0625
2
UPC MA444 Estadística 158
Ejercicios propuestos
43.El gerente de la empresa le informa al departamento de control de calidad que uno de los
principales clientes de la empresa ha exigido que las bombillas LED tengan como mínimo un tiempo
de encendido continuo de 2100 horas. La distribución de densidad del tiempo de encendido
continúo (en miles de horas) que obtuvo la empresa es la siguiente:
𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡
−∞
Si 𝐹(𝑥) es la función de distribución acumulativa para una variable aleatoria continua 𝑋, entonces la
función de densidad 𝑓(𝑥) para 𝑋 es:
𝑑𝐹(𝑥)
𝑓(𝑥) =
𝑑𝑥
Se cumple que:
𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝐹(𝑏) − 𝐹(𝑎)
� (� )
� (� ≤ � ≤ � )
� �
Ejemplo 1
El tiempo, en minutos, que un tren se retrasa es una variable aleatoria continua X con la siguiente
función de densidad:
3 2
𝑓(𝑥) = {250 (25 − 𝑥 ) 0≤𝑥≤5
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Solución
UPC MA444 Estadística 160
a. Determine la función acumulada 𝐹(𝑋).
Solución
Para hallar la función acumulada emplearemos la definición de la función de distribución
acumulada 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥).
𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡
−∞
𝑥
3 𝑡3
= (25𝑡 − )|
250 3 0
75𝑥 − 𝑥 3
𝐹(𝑥) =
250
0 𝑥<0
75𝑥 − 𝑥 3
𝐹(𝑥) = { 0≤𝑥<5
250
1 𝑥≥5
Solución
La probabilidad pedida es:
5
3
𝑃(𝑋 > 2) = ∫ (25 − 𝑥 2 )𝑑𝑥
2 250
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥)
75𝑥− 𝑥 3
Reemplazando el valor 𝑋 = 2 en 𝐹(𝑥) = .
250
75×2−23
𝐹(2) = =0.568
250
Solución
La probabilidad pedida es:
𝑃(1,5 < 𝑋 < 3,5) = 𝑃(𝑋 < 3,5) − 𝑃(𝑋 < 1,5) = 𝐹(3,5) − 𝐹(1,5)
Ejemplo 2
Los sondeos de mercado realizados por un fabricante sobre la demanda de un producto indican que la
demanda proyectada debe considerarse una variable aleatoria X con valores entre 0 y 25 toneladas.
La función de densidad de X está dada por:
3 2
𝑓(𝑥) = {253 𝑥 0 ≤ 𝑥 ≤ 25
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. Construir la función de distribución acumulada de 𝑋.
𝑥
3 2
𝐹(𝑥) = ∫ 𝑡 𝑑𝑡
0 253
𝑥
3 𝑡3
= 3 ( )|
25 3 0
𝑥3
𝐹(𝑥) =
15625
0 𝑥<0
𝑥3
𝐹(𝑥) = { 0 ≤ 𝑥 ≤ 25
15625
1 𝑥 > 25
UPC MA444 Estadística 162
203 103
𝑃(10 ≤ 𝑋 ≤ 20) = − =0.448
15625 15625
M = Mediana
𝑃(𝑋 ≤ 𝑀) = 0.50
𝐹(𝑀) = 0.50
𝑀3
= 0.50
15625
M = 19.84
Ejercicios propuestos
44.El costo de una reparación de conexión domiciliaria, en soles, es una variable aleatoria cuya función
de distribución acumulada es:
0 𝑥 ≤ 20
𝑥 − 20
𝐹(𝑥) = { 20 < 𝑥 < 30
10
1 𝑥 ≥ 30
45.SAP Ingeniería, es una empresa que desarrolla soluciones específicas y busca ofrecer servicios de
telecomunicaciones, independientemente del tamaño y desempeño del sector o actividad
empresarial. De estudios anteriores se conoce que el tiempo de atención de un servicio, en minutos,
para cada tamaño de empresa, se tiene la función de densidad y la función de distribución
acumulada; respectivamente.
Pequeña empresa
(80 − 𝑥)
𝑓(𝑥) = { 3000 0 < 𝑥 < 100
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Mediana empresa
UPC MA444 Estadística 163
0 𝑥<0
90 𝑥2
𝐹(𝑥) = { 𝑥− 0 ≤ 𝑥 ≤ 120
3600 7200
1 𝑥 > 120
El jefe de producto de telecomunicaciones desea implementar una reingeniería, por lo cual necesita
determinar, para cada tamaño de empresa, la probabilidad de que la atención de un servicio sea
menor a 55 minutos.
UPC MA444 Estadística 164
Esperado de una variable aleatoria continua
Sea 𝑋 una variable aleatoria continua con función de densidad 𝑓(𝑥), entonces el valor esperado de 𝑋
es la siguiente:
+∞
𝜇 = 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥
−∞
Sea X una variable aleatoria continua con función de densidad 𝑓(𝑥). Entonces, la varianza de 𝑋 es:
Donde:
+
𝐸(𝑋 2 ) = ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥
−
𝜎 = √𝜎 2
Coeficiente de variabilidad
Se define como:
𝜎
𝐶𝑉 = × 100%
𝜇
UPC MA444 Estadística 165
Ejemplo 1
El tiempo de anticipación (valores negativos de 𝑋) o retraso (valores positivos de 𝑋) en minutos, de la
llegada de un tren sobre su tiempo establecido, es una variable aleatoria continua 𝑋 con la siguiente
función de densidad:
3 2
𝑓(𝑥) = {500 (25 − 𝑥 ) −5 < 𝑥 < 5
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Solución
Solución
+∞
𝐸(𝑋) = ∫ 𝑥 𝑓(𝑥)𝑥 𝑑𝑥
−∞
+5
3
𝐸(𝑋) = ∫ 𝑥 (25 − 𝑥 2 ) 𝑑𝑥
−5 500
3 252 54 3 252 54
𝐸(𝑋) = ( − )− ( + )=0
500 2 4 500 2 4
El tiempo promedio de anticipación o retraso que tiene el tren sobre su hora establecida es 0
minutos, es decir llega en promedio puntual.
UPC MA444 Estadística 166
b. Los supervisores de la estación ferroviaria han notado que últimamente los trenes no están
llegando en su hora establecida, para lo cual han fijado como norma que un tren puede llegar en
a lo más ± 0,5 𝜎, donde 𝜎 es la desviación estándar. ¿Qué porcentaje de trenes cumplen la norma
fijada?
Solución
+5
𝐸(𝑋 2 ) = ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥
−5
+5
3
𝐸(𝑋2 ) = ∫ 𝑥2 (25 − 𝑥 2 )𝑑𝑥
−5 500
+5
3
𝐸(𝑋2 ) = ∫ (25𝑥 2 − 𝑥 4 )𝑑𝑥
500 −5
5
3 𝑥3 𝑥5
𝐸(𝑋2 ) = (25 − )|
500 3 5 −5
3 53 55 3 −53 −55
𝐸(𝑋2 ) = (25 − ) − (25 + )
500 3 5 500 3 5
𝐸(𝑋2 ) = 5
𝜎 2 = 𝑉(𝑋) = 5 − 02 = 5
𝜎 = √𝜎 2 = √5 = 2,2361
𝑃(−0,5 𝜎 ≤ 𝑋 ≤ 0,5 𝜎)
Reemplazando:
UPC MA444 Estadística 167
𝑃(−0,5 × 2,236 ≤ 𝑋 ≤ 0,5 × 2,236)
= 𝑃(−1,118 ≤ 𝑋 ≤ 1,118)
1,118
3
= ∫ (25 − 𝑥 2 )𝑑𝑥 = 0,32981
500
−1,118
El peso, en onzas, de un artículo de gasfitería usado en hogares y oficinas es una variable aleatoria X
con función densidad:
𝑘(𝑥 − 8) 8 < 𝑥 ≤ 10
𝑓(𝑥) = {
0 𝑜𝑡𝑟𝑜𝑐𝑎𝑠𝑜
a. Calcule el peso máximo que debe tener un artículo de manera que el 25% de los artículos tengan
pesos menores o iguales a dicho peso.
10
∫ 𝑘(𝑥 − 8) 𝑑𝑥 = 1
8
Integrando:
10
𝑥2
𝑘[ ( )| - 8(𝑥)|10
8 ]
2 8
1
𝑘=
2
1
𝑓(𝑥) = {2 (𝑥 − 8) 8 < 𝑥 ≤ 10
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
b. Calcule el peso máximo que debe tener un artículo de manera que el 25% de los artículos tengan
pesos menores o iguales a dicho peso.
25%
𝐶1
∫8 (𝑥 − 8)𝑑𝑥 =0.25
2
UPC MA444 Estadística 169
𝐶
1 𝑥2
[ ( )| - 8(𝑥)|𝐶8 ] = 0.25
2 2 8
se tiene:
1 𝐶 2 82
[( − ) − 8(𝐶 − 8)] = 0.25
2 2 2
𝐶 2 − 64 − 16𝐶 + 128 = 1
𝐶 2 − 16𝐶 + 64 = 1
(𝐶 − 8)2 = 1
𝐶 − 8 = ±1
𝐶=7
𝐶=9
RPTA C=9
+∞
𝐸(𝑋) = ∫ 𝑥 𝑓(𝑥)𝑥 𝑑𝑥
−∞
10 1
𝜇 = 𝐸(𝑋) = ∫8 𝑥 (𝑥 − 8) 𝑑𝑥 = 9.33
2
𝜎
𝐶𝑉 = × 100%
𝜇
UPC MA444 Estadística 170
10 1
𝐸(𝑋2 ) = ∫8 𝑥 2 (𝑥 − 8)𝑑𝑥 =87.33
2
𝜎 = √𝜎 2 = √0.2811 = 0.5302
0.5302
𝐶𝑉 = × 100% = 5.68%
9.33
UPC MA444 Estadística 171
Ejercicios propuestos
46.Las utilidades netas, en miles de soles, de los propietarios de stands en una galería comercial es una
variable aleatoria con la siguiente función de densidad:
𝑥
0≤𝑥≤4
𝑓(𝑥) = {8
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. ¿Estaría usted en condiciones de afirmar que más de la mitad de los propietarios tiene
utilidades superiores al promedio? Justifique.
b. Calcule la variación relativa de las utilidades.
47.Un estudio realizado por un grupo de ingenieros civiles determinó, que la resistencia a la
compresión en probetas de concreto con materiales propios de una región (en miles de psi), está
determinada por la siguiente función de densidad de probabilidad:
3𝑥 2
0<𝑥<2
20
𝑓(𝑥) = 𝑥
2≤𝑥≤4
10
{ 0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. Para un proyecto en particular se requiere que la resistencia a la compresión del concreto sea
de por lo menos 3500 psi, ¿qué tan probable cumpla con el requerimiento?
b. Se desea conocer la resistencia mínima del 15% de los bloques de concreto que tienen mayores
resistencias a la compresión.
UPC MA444 Estadística 172
Caso: Proyectos de generación eléctrica
Un inversionista en proyectos de generación eléctrica desea invertir en nuevos proyectos con el grupo
brasileño Alupar, pues se siente atraído por los resultados de las utilidades generadas por éste en los
proyectos culminados.
Para decidir en qué región invertir, el grupo brasileño le muestra al inversionista la función de
densidad y la función de distribución acumulada de la utilidad, en millones de soles, generada por los
proyectos culminados en las regiones costa y sierra.
Función de densidad de la utilidad generada por los proyectos culminados en la región costa
𝑘(𝑥 − 5) 2 ≤ 𝑥 ≤ 18
𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
0 𝑥<7
2 𝑥2 7
𝐹(𝑥) = { ( − 4𝑥 + ) 7 ≤ 𝑥 ≤ 20
247 2 2
1 𝑥 > 20
La decisión de inversión se basará en aquella región (costa o sierra) que tenga mayor probabilidad
de obtener utilidades superiores a 15 millones de soles en proyectos culminados, ¿en qué región
deberá invertirse?
UPC MA444 Estadística 173
COSTA:
18
1
𝑃(𝑋 > 15) = ∫ (𝑥 − 5)𝑑𝑥 = 0.4313
15 80
𝑘(𝑥 − 5) 2 ≤ 𝑥 ≤ 18
𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
18
∫ 𝑘(𝑥 − 5) 𝑑𝑥 = 1
2
Integrando:
18
𝑥2
𝑘[ ( )| - 5(𝑥)|18
2 ]
2 2
1
𝑘=
80
1
𝑓(𝑥) = {80 (𝑥 − 5) 2 ≤ 𝑥 ≤ 18
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
SIERRA:
2 152 7
𝐹(15) = ( − 4(15) + ) = 0.4534
247 2 2
Función de densidad
Una variable aleatoria 𝑋 es exponencial con parámetro 𝛽 > 0, si su función de densidad es:
1 −𝑥
𝑒 𝛽 𝑥≥0
𝑓(𝑥) = {𝛽
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Notación
Si 𝑋 sigue una distribución exponencial con parámetro 𝛽 se denota por 𝑋 ~ 𝐸𝑥𝑝 ().
Media
𝜇 = 𝐸(𝑋) = 𝛽
Varianza
𝜎 2 = 𝑉(𝑋) = 𝛽 2
𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑥) 𝑑𝑥
−∞
𝑥
1 −𝑥 −
𝑥
𝐹(𝑥) = ∫ 𝑒 𝛽 𝑑𝑥 = 1 − 𝑒 𝛽
0 𝛽
𝑥
−
𝐹(𝑥) = 1 − 𝑒 𝛽
UPC MA444 Estadística 175
Características
Ejemplo 1
1 −𝑥
𝑓(𝑥) = 𝑒 500 𝑥≥0
500
Solución
𝑋 ~ 𝐸𝑥𝑝 ( = 500)
𝑪
−
𝑷(𝑿 < 𝑪) = 𝟏 − 𝒆 𝜷
Solución
= 1 − 𝑷(𝑿 ≤ 𝟖𝟎𝟎)
−800
= 1 − (1 − 𝑒 500 ) = 0,2019
Solución
𝐹(𝑀𝑒) = 0,50
𝑥
−𝛽
Usando la función de distribución acumulada 𝐹(𝑥) = 1 − 𝑒 de la variable exponencial tenemos
que:
−𝑀𝑒
(1 − 𝑒 500 ) = 0,50
−𝑀𝑒
𝑒 500 = 0,50
−𝑀𝑒
𝑙𝑛 (𝑒 500 ) = 𝑙𝑛(0,50)
𝑀𝑒
− = 𝑙𝑛(0,50)
500
Despejando:
𝑀𝑒 = 346,5 días
Ejemplo 2
La duración, en miles de millas, que obtienen los dueños de automóviles con cierto tipo de neumático
es una variable aleatoria con la siguiente función de densidad:
1 −𝑥
𝑓(𝑥) = {20 𝑒 𝑥≥0
20
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝑋 ~ 𝐸𝑥𝑝 ( = 20)
𝑪
−
𝑷(𝑿 ≤ 𝑪) = 𝟏 − 𝒆 𝜷
𝑪
−
𝑷(𝑿 ≥ 𝑪) = 𝒆 𝜷
UPC MA444 Estadística 177
a. Calcule la probabilidad de que un neumático dure como máximo diez mil millas.
𝟏𝟎
P( X <= 10) = 𝟏 − 𝒆−𝟐𝟎 = 0.3935
𝟐𝟒 𝟏𝟔
P(16 < X <24) = P( X < 24) – P(X<16) = ( 𝟏 − 𝒆−𝟐𝟎 ) – ( 𝟏 − 𝒆−𝟐𝟎 ) = 0.6988 – 0.5507 = 0.1481
48.La duración, en minutos, de una conversación telefónica de larga distancia nacional tiene
distribución exponencial con promedio de ocho minutos.
a. ¿Cuál es la probabilidad que una llamada dure entre tres y diez minutos?
b. ¿Cuál es la probabilidad que una llamada dure más de 9 minutos?
c. ¿Cuánto debe durar como mínimo una llamada para estar considerada dentro del 10% de las
de mayor duración?
d. Si la llamada dura más de cinco minutos ¿cuál es la probabilidad de que dure a lo más 8
minutos?
49.Suponga que la vida útil, en horas, de cierta marca de foco electrónico, es una variable aleatoria X
cuya función de densidad de probabilidad es:
𝑥
−8000
𝑓(𝑥) = {𝑐𝑒 𝑥≥0
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. Calcule el valor de la constante 𝑐 para que 𝑓(𝑥) sea función de densidad. Si se selecciona un
foco electrónico al azar, calcule la probabilidad de dure más de diez mil horas.
b. Calcule la probabilidad de que por lo menos dos de ellos duren más de diez mil horas.
50.La vida, en horas, de un dispositivo electrónico es una variable aleatoria que tiene la siguiente
función de densidad:
1 −𝑥
𝑓(𝑥) = {50 𝑒 𝑥≥0
50
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Función de densidad
1 1 𝑥−𝜇 2
−2( 𝜎 )
𝑓(𝑥) = 𝑒 −∞< 𝑥 < ∞
√2𝜋 𝜎
Notación
Si la variable aleatoria tiene distribución normal con parámetros 𝝁 y 𝝈𝟐 se denota:
𝑋 ~ 𝑁(, 2 ).
Media
𝐸(𝑋) =
Varianza
𝑉(𝑋) = 2
UPC MA444 Estadística 180
Distribución normal estándar
• La distribución normal estándar es una distribución de una variable aleatoria continua denotada
con la letra 𝑍, que tiene media 0 y desviación estándar 1.
• Una variable aleatoria con distribución normal se puede convertir en una distribución normal
estándar si se realiza la siguiente transformación, llamada de estandarización o de tipificación.
𝑋−𝜇
𝑍=
𝜎
𝑍 ~ 𝑁 (0,1)
Ejemplo 1
𝐹 (𝑍) = 𝑃(𝑍 ≤ 𝑧)
Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233
-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350
-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621
-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681
-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866
-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
UPC MA444 Estadística 182
Tabla de la distribución normal estándar
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
UPC MA444 Estadística 183
La lectura en tabla presenta tres situaciones:
Situación 1 𝑃(𝑍 ≤ 𝑎)
P(-0.13 < Z < 1.05 ) = P(Z < 1.05) - P(Z < -0.13)
d. ¿Cuál será el valor máximo de Z = D tal que el 15,87% de los valores son menores a Z = D?
TABLA INVERSA
P(Z < C) = 0.9750000 ; C= 1.96
e. ¿Cuál será el valor mínimo de Z tal que el 15,87% de los valores son mayores a Z?
P( Z>= B) = 0.1587
1 - P( Z < B) = 0.1587
0.8413 = P( Z < B)
Ejemplo 2
Raúl sabe que la gestión del proyecto se mide habitualmente en términos de utilidad, por lo que
analizó la utilidad, en millones de soles, de los proyectos grandes culminados el último año. Sabe,
además, que esta variable tiene distribución normal con media 111,5 millones de soles y desviación
estándar de 25 millones de soles.
Si la probabilidad de que un proyecto grande culminado en el último año genere una utilidad mayor
a 112 millones de soles supera a 0,52, no tomará la decisión de modificar los términos de referencia
para invertir en más proyectos grandes caso contrario modificará los términos de referencia. ¿Qué
decisión tomará?
Solución
Definamos la variable:
𝑋−𝜇
𝑍=
𝜎
𝑃(𝑋 ≤ 112)
𝑋 − µ 112 − 111,5
𝑃( < )
𝜎 25
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
Como la 𝑃(𝑋 > 112) = 0,49202 < 0,52, entonces no cumple con lo establecido.
Por lo tanto, sí se tomará la decisión de modificar los términos de referencia para invertir en más
proyectos grandes.
Ejemplo 3
Una máquina llena recipientes con determinado producto. Se sabe que el peso de llenado de dicho
producto tiene distribución normal. Se sabe, de acuerdo con los datos históricos, que la media es
20,23 y la desviación estándar de pesos de llenado es de 0,6 onzas.
𝑋−µ 21 −20.23
P(X > 21) = 1 – P( ≤ )
𝜎 0.6
c. Se dice que la máquina funciona correctamente si el peso de llenado del producto está entre 19,03
y 21,43 ¿Qué tan probable es que la máquina no funcione correctamente?
P(FUNCIONE) = P ( 19.03 < X < 21.43) = P(X <21.43) – P(X < 19.03)
P(FUNCIONE) = P ( 19.03 < X < 21.43) = P(𝑍 ≤ 2.00) – P(𝑍 ≤ −2.00) = 0.97725 – 0.02275 = 0.9545
d. ¿Cuál debe ser el tiempo de llenado mínimo para pertenecer al 25% de recipientes con mayor
peso de llenado?
P( X >= C ) = 0.25
1 - P( X < C ) = 0.25
𝑿−µ 𝑪−𝟐𝟎.𝟐𝟑
P( < ) = 0.75
𝝈 𝟎.𝟔
𝑪−𝟐𝟎.𝟐𝟑
P(𝒁 < ) = 0.75
𝟎.𝟔
𝑪 − 𝟐𝟎. 𝟐𝟑
= 𝟎. 𝟔𝟕
𝟎. 𝟔
𝑪 = 20.632
UPC MA444 Estadística 189
UPC MA444 Estadística 190
Ejercicios propuestos
51. La medición mensual de la contaminación por polvo atmosférico generado por residuos sólidos
de las construcciones y demoliciones de obras es una variable aleatoria distribuida normalmente
con media de 35 toneladas/km2 y desviación estándar de 15 toneladas/km2. Si la cantidad máxima
de contaminación aceptable según la norma ambiental es de 25 toneladas/km2 por mes, calcule
la probabilidad de que la medición del próximo mes reporte un valor no aceptable.
52. Una máquina automática para el llenado de paquetes de arroz puede regularse de modo que la
cantidad media de arroz llenado sea la que se desee. Si la cantidad de arroz depositada se
distribuye normalmente con desviación estándar igual a 10 gramos, ¿cuál debe ser la regulación
media de modo que solo el 1% de los paquetes tengan un peso neto inferior a 990 gramos?
53. En un taller de la Industria Sideromecánica se fabrican árboles de leva para darles uso en motores
de gasolina. Después de investigaciones realizadas se ha llegado a la conclusión de que la
excentricidad de estos árboles de leva es una variable aleatoria normalmente distribuida con
media de 1,02 pulgadas y desviación estándar de 0,44 pulgadas.
a. Calcule la probabilidad que un árbol de leva tenga una excentricidad menor a una pulgada.
b. Calcule la probabilidad que un árbol de leva tenga una excentricidad mayor a 1,05 pulgadas.
c. Calcule el valor máximo para estar en el 30% de los árboles de leva con menor excentricidad.
d. Calcule el valor mínimo para estar en el 20% de los árboles de leva con mayor excentricidad.
54. La duración de las llamadas telefónicas en una empresa se modela con una variable normal con
media de 130 segundos y desviación estándar de 30 segundos. Calcule la probabilidad que una
llamada dure entre 90 y 170 segundos.
55. Un foco tiene una duración distribuida normalmente con una media de 7000 horas y una
desviación estándar de 1000 horas. Un competidor ha inventado un nuevo foco LED con una
duración distribuida normalmente con una media de 7500 horas y una desviación estándar de
1200 horas. ¿Cuál foco tiene mayor probabilidad de tener una duración mayor que 9000 horas?
56. Un contratista de construcción afirma que elaborar un proyecto demora en promedio 35 horas
de trabajo y el 97,5% de los proyectos demandan como máximo 38,92 horas. Considerando que
los tiempos para completar proyectos similares se distribuyen normalmente.
a. ¿Cuál es la probabilidad de que un proyecto demande menos de 32 horas?
b. Si el contratista demora más de 48 horas deberá devolver 2% del costo de dicho proyecto; si
en cambio demora menos de 29,5 horas, recibirá un incentivo de 5% del costo del proyecto,
¿cuánto esperaría recibir de incentivo?
57. Un fabricante de televisores asegura que el tiempo medio de funcionamiento sin fallas de los
aparatos es de dos años con una desviación estándar de 0,25 años. El tiempo de vida de los
aparatos sigue una distribución normal.
a. ¿Cuál es la probabilidad de que el tiempo de buen funcionamiento sea menor que 2,5 años?
b. Determine la probabilidad de que el tiempo de funcionamiento este entre 1 año y 1,75 años.
c. El fabricante garantiza que remplazará gratis cualquier aparato de televisión cuya duración sin
fallas sea menor que k años. Calcular k de tal modo que sólo el 1% de los aparatos vendidos
tenga que ser reemplazado.
UPC MA444 Estadística 191
Caso: Cemento Tumbo
Enterado de esto, el jefe de control de calidad desea saber si el nuevo producto cumple con las normas
técnicas que indican que, por cada metro cuadrado de techo, la cantidad de cemento en concreto
premezclado debe tener un volumen entre 0,21 m3 y 0,41 m3 y tomará la decisión de enviar un reporte
a la gerencia general pidiendo que se detenga la producción si la probabilidad de que no se cumpla
con la norma técnica es mayor a 0,10. ¿Qué decisión tomará?
INTERPRETACION
Determinar si se tomará la decisión de enviar un reporte a la gerencia general pidiendo que se detenga
la producción
REPRESENTACION
CALCULO
ANALISIS
ARGUMENTACION
Se recomienda que si se debe enviar un reporte a la gerencia general pidiendo que se detenga la
producción
Logro
Al finalizar la unidad, el estudiante aplica algunas técnicas de muestreo e inferencia estadística en
situaciones reales dentro del ámbito de su especialidad para la toma de decisiones.
Temario
• Muestreo, tipos de muestreo, tamaño de muestra
• Introducción a la inferencia estadística
• Prueba de hipótesis: conceptos. Tipos de error
• Pruebas de hipótesis para la media y proporción poblacional
• Prueba de hipótesis para dos varianzas y dos medias poblacionales
Bibliografía
• Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 7.1 pág. 248-
250.
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 261.
• Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 9 pág. 364-369.
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 295 – 307.
• Estadística. Mario Triola. 11a. Edición. Pearson Educación, México 2013 519.5 TRIO/E 2013
capitulo 7. pág. 297.
• Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 10 (pág. 386-
395) Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 375 – 388.
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 375 - 388.
UPC MA444 Estadística 194
Conceptos básicos
Unidad elemental
Es el objeto sobre el cual se hace la medición. También llamada unidad de observación, unidad de
análisis, unidad estadística o elemento. Por ejemplo, en estudios de poblaciones humanas, con
frecuencia ocurre que la unidad elemental es cada individuo.
Población muestreada
Es el conjunto de todas las unidades elementales posibles que podrían extraerse en una muestra; es
decir, es la población de donde se extrae la muestra.
Unidad de muestreo
Es la unidad donde realizamos la muestra. Por ejemplo, si queremos estudiar a las personas, pero no
tenemos la lista de todos los individuos que pertenecen a la población objetivo, la unidad de muestreo
sería cada familia y la unidad elemental sería cada individuo que vive en la familia .
Marco muestral
Es una lista de las unidades de muestreo que están disponibles para elección.
Para las encuestas telefónicas el marco de muestreo podría ser una lista de todos los números
telefónicos residenciales de la ciudad; para las entrevistas personales una lista de las direcciones de
todas las calles; para una encuesta de agricultura una lista de todas las granjas o un mapa con todas
las áreas que contienen granjas.
Censo
Es una investigación estadística que consiste en el recuento de la totalidad de los elementos que
componen la población por investigar. Es necesario que se especifique el espacio y el tiempo al que se
refiere el recuento.
Por ejemplo, el 22 de octubre del 2017 se realizaron los Censos Nacionales 2017: XII de Población, VII
de Vivienda y III de Comunidades Indígenas. Su finalidad es proveer información sobre la composición,
distribución geográfica y crecimiento de la población, los patrones de la concentración urbana y rural,
las características y servicios básicos de la vivienda para la ejecución de las políticas públicas.
Muestreo
Cuando se opta por una investigación usando una muestra en vez de la población, el estudio estadístico
comprende por lo menos cuatro etapas:
Marco muestral
Para el desarrollo de la investigación se consideró como marco muestral:
• La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI).
• Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de mayor
crecimiento de la ciudad (conos)
Tamaño de la muestra
• Se entrevistó a un total de 3 598 hogares distribuidos en 41 distritos.
• El margen de error máximo probable con un nivel de confianza del 95,1% y considerando el máximo
de dispersión (p = q = 0,5) fue de ± 1,63%.
• Dentro de esta muestra se realizaron 200 entrevistas en Distritos con predominio de los N.S.E. Muy
Alto/Alto con el propósito de obtener una submuestra estadísticamente significativa para este
segmento.
• El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de cada
uno de los distritos de Lima Metropolitana.
Selección de la muestra
• Determinada la cantidad de entrevistas a aplicar por distrito, se
procedió a sortear tantas manzanas como entrevistas se requerían.
• Dentro de cada manzana se seleccionó por un sistema aleatorio
simple cinco viviendas: una vivienda titular y cuatro viviendas suplentes. Los hogares titulares
fueron visitados hasta en tres oportunidades antes de proceder al reemplazo. Se controló que la
tasa de reemplazo no excediera el 10% del total de entrevistas originalmente sorteadas.
UPC MA444 Estadística 196
Muestreo probabilístico
El procedimiento consiste en seleccionar una muestra de tamaño n en forma aleatoria y sin reemplazo
de una población que contiene un total de N unidades elementales. Se garantiza que cada una de las
muestras posibles tiene la misma probabilidad de ser elegida.
Ejemplo 1
Por ejemplo, en un problema nos dicen que elijamos las columnas C10, C7, C5 y C16.
• Si el tamaño de la población N = 87, esto implica que el número mayor 87 tiene dos cifras
significativas.
La primera columna elegida será C10 y usaremos una columna adicional a la derecha para completar
la cantidad de dígitos que tiene la población. Es decir, usaremos C10C11 para elegir números del 1
al 87 inclusive sin reemplazo.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
• Si el tamaño de la población N = 550, esto implica que el número mayor 550 tiene tres cifras
significativas.
La primera columna elegida será C10 y usaremos dos columnas adicionales a la derecha para
completar la cantidad de dígitos que tiene la población. Es decir, usaremos C10C11C12 y elegir
números del 1 al 550 inclusive sin reemplazo.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
UPC MA444 Estadística 198
Una empresa de tiene un total de 150 empleados y ha registrado información acerca de las variables:
ingreso mensual, en soles (Ingreso) y años cumplidos en la empresa (Años).
a. Seleccione una muestra de 16 trabajadores usando muestreo simple aleatorio. Elabore un listado
con el número seleccionado y el valor del ingreso mensual y años en la empresa. Use las columnas
C2, C7, C11 y C9 de la tabla de números aleatorios.
b. Con la muestra, estime e interprete las medidas de tendencia central para el ingreso mensual.
c. Con la muestra, estime e interprete el cuartil 1 para la variable años en la empresa.
UPC MA444 Estadística 200
Solución
a. Elabore un listado con el número seleccionado y el valor del ingreso mensual y años en la empresa:
Posición
Ingreso mensual
Años en la empresa
Posición
Ingreso mensual
Años en la empresa
b. Con la muestra obtenida estime e interprete las medidas de tendencia central para la variable
ingreso mensual.
Media
Mediana
Moda
c. Con la muestra obtenida estime e interprete los cuartiles para la variable años en la empresa.
Años en la empresa
Años en la empresa
Cuartil 1
Ejemplo 3
El siguiente marco muestral muestra la información del total de usuarios de internet de una
determinada zona de un distrito de la ciudad capital. Las variables analizadas fueron las siguientes:
• Marca de computadora portátil
• Principales problemas con Internet
• Número de computadoras con Internet en casa
• Tiempo de navegación diaria en Internet (en minutos)
UPC MA444 Estadística 201
Marca de Número de Tiempo de navegación
Usuario Principales problemas
computadora computadoras diaria (min)
1 HP Saturación de la red 1 94,00
2 Dell Saturación de la red 1 74,45
3 IBM Saturación de la red 3 104,89
4 HP Saturación de la red 3 125,53
5 Dell Saturación de la red 3 123,97
6 HP Saturación de la red 4 134,66
7 Otra marca Saturación de la red 2 56,33
8 HP Saturación de la red 2 95,32
9 HP Saturación de la red 2 121,90
10 Lenovo Saturación de la red 2 78,27
11 Lenovo Saturación de la red 2 86,20
12 Apple Saturación de la red 2 66,19
13 Lenovo Saturación de la red 2 63,06
14 Dell Saturación de la red 1 80,45
15 Dell Saturación de la red 1 84,53
16 Apple Saturación de la red 1 57,64
17 HP Saturación de la red 1 88,64
18 HP Saturación de la red 3 91,92
19 Apple Saturación de la red 3 102,7
20 Apple Baja velocidad en la señal 3 92,69
21 Lenovo Baja velocidad en la señal 3 93,46
22 HP Baja velocidad en la señal 3 92,60
23 Dell Baja velocidad en la señal 4 126,85
24 HP Baja velocidad en la señal 2 98,29
25 Lenovo Baja velocidad en la señal 2 96,28
26 Apple Baja velocidad en la señal 1 89,74
27 Apple Baja velocidad en la señal 1 139,44
28 HP Baja velocidad en la señal 1 117,31
29 HP Baja velocidad en la señal 1 147,51
30 Otra marca Baja velocidad en la señal 3 86,90
31 Otra marca Baja velocidad en la señal 3 133,23
32 IBM Baja velocidad en la señal 4 67,75
33 Apple Baja velocidad en la señal 2 110,78
34 Apple Baja velocidad en la señal 2 118,04
35 Dell Baja velocidad en la señal 4 138,38
36 Dell Baja velocidad en la señal 2 98,31
37 Apple Baja velocidad en la señal 1 89,52
38 IBM Baja velocidad en la señal 1 113,50
39 HP Baja velocidad en la señal 1 92,37
40 Otra marca Baja velocidad en la señal 1 115,15
41 HP Baja velocidad en la señal 1 131,22
42 HP Calidad y durabilidad del modem 2 125,81
43 HP Calidad y durabilidad del modem 2 130,02
44 HP Calidad y durabilidad del modem 3 83,74
45 IBM Calidad y durabilidad del modem 2 133,69
46 IBM Calidad y durabilidad del modem 1 129,39
47 Lenovo Calidad y durabilidad del modem 1 111,01
48 Lenovo Lentitud para subir información 1 103,69
49 Lenovo Lentitud para subir información 1 121,70
50 Apple Lentitud para subir información 2 151,81
51 Apple Lentitud para subir información 2 125,43
UPC MA444 Estadística 202
52 Apple Lentitud para subir información 2 116,00
53 Dell Lentitud para subir información 3 139,41
54 Dell Lentitud para subir información 2 129,52
55 Dell Lentitud para subir información 1 127,74
56 Dell Lentitud para subir información 2 120,89
57 Dell Lentitud para subir información 3 126,33
58 Otra marca Lentitud para subir información 3 118,44
59 Otra marca Otros 1 113,04
60 Otra marca Otros 2 114,44
61 Lenovo Otros 1 119,66
62 Dell Otros 1 145,52
a. Se desea seleccionar una muestra de 10 usuarios de internet usando muestreo simple aleatorio.
Use las columnas C15, C1 y C8 de la tabla de números aleatorios para indicar la posición del elemento
seleccionado. Indique, además, el principal problema del usuario con Internet y el tiempo diario
de navegación, en minutos.
Posición
Problema
Tiempo (min.)
b. Con la muestra obtenida, estime el porcentaje de usuarios cuyo principal problema de Internet es
la baja velocidad en la señal.
c. Con la muestra obtenida, estime e interprete las medidas de tendencia central para el tiempo
diario de navegación.
UPC MA444 Estadística 203
Ejemplo 4
La empresa está interesada en saber si existe una alta rotación de su personal, debido a ello, el
departamento de Recursos Humanos ha hecho un censo. Los resultados se muestran a continuación:
Marco muestral
Número Permanencia Grado de Remuneración
Posición Sexo Motivo de cese
de hijos (meses) instrucción bruta (soles)
1 M 0 26 Titulado 5000 Renuncia voluntaria
2 M 1 10 Titulado 12075 Renuncia voluntaria
3 M 0 11 Titulado 3000 Renuncia voluntaria
4 F 0 3 Titulado 1500 Renuncia voluntaria
5 M 0 2 Titulado 800 Renuncia voluntaria
6 M 0 28 Titulado 3000 Renuncia voluntaria
7 F 1 12 Post grado 5575 Renuncia voluntaria
8 F 1 32 Técnico completa 2000 Renuncia voluntaria
9 F 0 1 Técnico completa 2700 Renuncia voluntaria
10 F 0 0 Técnico completa 2575 Renuncia voluntaria
11 M 0 52 Titulado 12000 Renuncia voluntaria
12 F 0 0 Titulado 2000 Renuncia voluntaria
13 F 1 1 Titulado 3575 Renuncia voluntaria
14 M 0 15 Titulado 1500 Renuncia voluntaria
15 F 2 55 Post grado 5000 Renuncia voluntaria
16 F 0 2 Post grado 7500 Renuncia voluntaria
17 F 0 7 Titulado 2500 Renuncia voluntaria
18 F 1 1 Técnico completa 1500 Renuncia voluntaria
19 F 2 1 Post grado 4400 Renuncia voluntaria
20 F 2 10 Técnico completa 1985 Renuncia voluntaria
21 F 0 1 Titulado 3000 Renuncia voluntaria
22 F 0 5 Técnico completa 2200 Renuncia voluntaria
23 F 2 3 Técnico completa 2300 Renuncia voluntaria
24 F 0 20 Titulado 3085 Renuncia voluntaria
25 F 0 2 Técnico completa 1885 Renuncia voluntaria
26 F 2 23 Post grado 15085 Renuncia voluntaria
27 F 0 20 Titulado 3085 Renuncia voluntaria
28 F 0 2 Técnico completa 1885 Renuncia voluntaria
29 F 0 1 Técnico completa 1500 Renuncia voluntaria
30 F 0 1 Técnico completa 1500 Renuncia voluntaria
31 F 0 2 Técnico completa 1800 Renuncia voluntaria
32 F 0 2 Técnico completa 1800 Renuncia voluntaria
33 F 0 2 Titulado 2585 Renuncia voluntaria
34 F 0 3 Técnico completa 3000 Renuncia voluntaria
35 F 2 49 Post grado 6085 Renuncia voluntaria
36 M 0 33 Titulado 1800 Renuncia voluntaria
UPC MA444 Estadística 204
37 F 0 3 Técnico completa 950 Renuncia voluntaria
38 F 0 0 Técnico completa 1700 Renuncia voluntaria
39 F 0 0 Titulado 850 Renuncia voluntaria
40 F 0 6 Titulado 2800 Renuncia voluntaria
41 M 0 58 Titulado 2200 Renuncia voluntaria
42 F 1 26 Post grado 7000 Renuncia voluntaria
43 F 0 18 Titulado 1500 Renuncia voluntaria
44 M 0 7 Titulado 2000 Renuncia voluntaria
45 F 2 9 Titulado 3885 Renuncia voluntaria
46 F 1 9 Post grado 4585 Renuncia voluntaria
47 M 0 22 Titulado 1800 Renuncia voluntaria
48 F 0 41 Titulado 3300 Renuncia voluntaria
49 F 1 1 Titulado 2085 Renuncia voluntaria
50 F 1 3 Post grado 8085 Renuncia voluntaria
51 M 0 16 Post grado 1500 Renuncia voluntaria
52 F 0 2 Técnico completa 1200 Renuncia voluntaria
53 F 0 6 Titulado 2085 Renuncia voluntaria
54 F 0 5 Post grado 20000 Renuncia voluntaria
55 F 0 46 Técnico completa 2300 Renuncia voluntaria
56 M 0 10 Técnico completa 2000 Renuncia voluntaria
57 F 0 8 Técnico completa 2000 Término de contrato
58 F 0 1 Técnico completa 1500 Término de contrato
59 F 0 4 Técnico completa 1585 Término de contrato
60 F 0 7 Técnico completa 2300 Término de contrato
61 F 0 16 Técnico completa 1700 Término de contrato
62 F 0 7 Titulado 3000 Término de contrato
63 F 0 18 Titulado 1500 Término de contrato
64 M 0 19 Titulado 1500 Término de contrato
65 F 0 1 Técnico completa 2200 Término de contrato
66 F 1 1 Técnico completa 2500 Término de contrato
67 M 0 1 Técnico completa 2000 Término de contrato
68 F 0 14 Técnico completa 1200 Término de contrato
69 F 2 1 Titulado 2875 Término de contrato
70 M 0 1 Titulado 2000 Término de contrato
71 F 2 15 Titulado 2800 Término de contrato
72 F 1 2 Técnico completa 1600 Término de contrato
73 F 0 16 Técnico completa 2200 Término de contrato
74 F 0 25 Técnico completa 2800 Término de contrato
75 F 0 8 Titulado 3500 Término de contrato
76 F 1 4 Titulado 2300 Término de contrato
77 F 0 3 Titulado 4085 Término de contrato
78 F 0 16 Titulado 1585 Término de contrato
79 F 0 1 Técnico completa 1500 Término de contrato
80 F 2 4 Técnico completa 2000 Término de contrato
81 F 2 4 Técnico completa 2500 Término de contrato
82 F 2 38 Titulado 2500 Término de contrato
83 F 2 19 Titulado 2000 Término de contrato
84 F 2 59 Post grado 4085 Término de contrato
85 F 2 9 Titulado 2500 Término de contrato
a. Se desea seleccionar una muestra de 11 trabajadores usando muestreo simple aleatorio. Use las
columnas C13, C14 y C5 de la tabla de números aleatorios para indicar la posición del elemento
seleccionado. Indique, además, el motivo del cese y el número de hijos de cada trabajador.
UPC MA444 Estadística 205
Posición
Motivo
Número de hijos
Remuneración bruta
b. Con la muestra obtenida, estime el porcentaje de trabajadores cuyo motivo de cese fue por
renuncia voluntaria y el porcentaje de trabajadores que tienen hijos.
c. Con la muestra obtenida, estime e interprete el valor del cuartil 3 para la variable remuneración
bruta, en soles.
d. Con la muestra obtenida, estime e interprete el valor de las medidas de tendencia central para la
variable remuneración bruta, en soles.
UPC MA444 Estadística 206
Tamaño de muestra para estimar la media de una población
La respuesta a cada una de estas preguntas nos la da la Estadística. A la hora de determinar el tamaño
que debe alcanzar una muestra hay que tener en cuenta: el parámetro a estimar, el margen de error
o error de estimación, la varianza poblacional y el nivel de confianza.
Margen de error
Es la diferencia entre un estadístico y su parámetro correspondiente. Nos da una idea clara de hasta
dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera
obtenido por medio de un censo completo. Un estadístico será más preciso cuando su error sea más
pequeño.
Nivel de confianza
Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al verdadero valor
del parámetro.
Varianza poblacional
Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias
será más pequeño. Cuando no se dispone de dicho valor, éste puede ser estimado a partir de una
muestra preliminar o piloto.
2
𝑍1−𝛼 𝑠
2
𝑛=( )
𝑒
Para realizar la estimación del promedio, es necesario determinar, en primer lugar, ¿a cuántas
unidades elementales debemos entrevistar?
Para seleccionar a las n unidades elementales usaremos muestreo aleatorio simple. La tabla de números
aleatorios nos permitirá seleccionar a estos elementos.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
Se tiene una población de 108 trabajadores de una empresa y se desea estimar el tiempo promedio
de servicio a partir de una muestra elegida al azar.
N = 108 trabajadores
𝑧 𝛼 ×𝑠 2
(1− 2 )
𝑛=( ) = 9,8 = … j
𝑒
n=…
Posición
Trabajador (en la tabla de números X= …
aleatorios)
1
2
3
4
5
6
7
8
9
10
Promedio
UPC MA444 Estadística 210
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
UPC MA444 Estadística 213
Ejemplo 2
El jefe de la Oficina de Seguridad del distrito de San Martín de Porres desea realizar una estimación de
cuánto tiempo, en promedio, estarían dispuestos a permanecer en las charlas sobre rondas vecinales
los vecinos del distrito. En estudios anteriores se estimó que el tiempo medio era de 45,25 minutos
con una varianza de 18,75 minutos2, ¿A cuántas personas se debería entrevistar si se estima un error
máximo de 1,25 minutos y un nivel de confianza del 95%?
N = 10000
Solución
𝛼 0,05
1− = 1− = 0,975.
2 2
Buscamos dentro de la tabla el valor más cercano a 0,975 y desde este valor salimos a los bordes de la
tabla.
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2
𝑍(1−𝛼) × 𝑠
2
𝑛=( )
𝑒
UPC MA444 Estadística 214
2
1,96 × 4,33
𝑛=( )
1,25
𝑛 = 46,09
El valor del tamaño de muestra se redondea siempre al entero mayor, por lo tanto, se necesita
seleccionar a una muestra de 47 vecinos del distrito de San Martin de Porres.
UPC MA444 Estadística 215
Ejemplo 3
¿Cuál debe ser el tamaño de muestra si se desea estimar el tiempo promedio, en horas, que demoran
los estudiantes en llegar a la universidad con un nivel de confianza del 94% y con un error de
estimación de 0,1 horas? Una muestra piloto de 8 alumnos arrojó los siguientes resultados:
2
𝑍(1−𝛼) × 𝑠
2
𝑛=( )
𝑒
e=0.1
S= 0.55997
1 – α = 0.94 ; α = 0.06 ; 𝑍(1−𝛼) = 𝑍(1−0.06)= 𝑍(0.97)=1.88
2 2
1.88 × 0.55997 2
𝑛=( )
0.1
𝑛 = 110.82
El valor del tamaño de muestra se redondea siempre al entero mayor, por lo tanto, se necesita
seleccionar a una muestra de 111 estudiantes de una universidad.
Ejemplo 4
La gerencia de un diario local desea estimar el gasto promedio mensual que las familias destinan a la
compra de diarios. La gerencia desea que sus resultados tengan un nivel de confianza del 95% y un
error de estimación no mayor a tres soles. Si la desviación estándar de los gastos en compra de diarios
en una muestra piloto fue de 20 soles ¿Qué tamaño de muestra deberá seleccionar?
UPC MA444 Estadística 216
UPC MA444 Estadística 217
Ejercicios propuestos
58. Se desea realizar una encuesta para estimar el número promedio de amigos que los jóvenes tienen
en su cuenta de Facebook. Con un error de estimación de cinco amigos y con un nivel de confianza
del 95%, determine el tamaño de muestra adecuado si en una muestra piloto se obtuvo que el
valor de la desviación estándar del número de amigos es igual a 42. Rpta: 272
59. El jefe de la oficina de seguridad del distrito de San Borja desea realizar una estimación de cuánto
tiempo, en promedio, estarían dispuestos a permanecer los vecinos escuchando charlas sobre
seguridad vecinal. En estudios anteriores se estimó que el tiempo promedio era de 45,25 minutos
con una varianza de 18,75 minutos2. ¿A cuántas personas se debería entrevistar si se estima un
error máximo de un minuto y una confianza del 95%? Suponga que esta variable se distribuye
normalmente. Rpta: 73
60. La máquina de refrescos de una universidad está ajustada de tal manera que la cantidad de líquido
despachada se distribuye aproximadamente en forma normal. ¿Qué tan grande se requiere que
sea la muestra si se desea tener una confianza de 98% de que su media muestral esté dentro de
0,05 centilitros del promedio real? Se cuenta con la siguiente información de una muestra
preliminar o piloto de tamaño 24. Rpta: 60
1,99 1,98 2,04 1,97 2,18 2,04 2,13 2,03 2,08 2,72 2,04 2,09
2,11 2,13 2,14 1,98 2,29 2,02 1,94 1,82 2,02 2,10 2,19 2,13
61. Una editorial desea evaluar la media muestral del tiempo de distribución de su último best seller
en cada uno de sus 400 puntos de venta. Para este estudio se desea tener un error de estimación
de tres minutos con un nivel de confianza del 90%. Además, se sabe que la desviación estándar
de los tiempos de distribución es de 17 minutos. ¿Qué tamaño de muestra debe emplearse para
el estudio? Rpta: 72
UPC MA444 Estadística 218
Caso: Cemento Tumbo
Para obtener la desviación estándar tomará una muestra piloto de ocho bolsas del almacén mediante
muestreo simple aleatorio. S= 4.89898
Muestra:_
N° Posición Tiempo
1 16 44
2 27 49
3 01 40
4 24 42
5 18 47
6 09 36
7 19 43
8 22 35
UPC MA444 Estadística 219
Dos dígitos:
2
𝑍(1−𝛼) × 𝑠
2
𝑛=( )
𝑒
e=1.5
S= 4.89898
1.96 × 4.89898 2
𝑛=( )
1.5
𝑛 = 40.97
El valor del tamaño de muestra se redondea siempre al entero mayor, por lo tanto, se necesita
seleccionar a una muestra de 41 bolsas de cemento.
UPC MA444 Estadística 220
Prueba de hipótesis
Es un procedimiento estadística que busca desmentir o corroborar la afirmación que se hace con
respecto a un parámetro
Luego, a partir de los resultados obtenidos de la muestra, o bien rechazamos la hipótesis nula a favor
de la alternativa, o bien no rechazamos la hipótesis nula y suponemos que nuestra estimación inicial
del parámetro poblacional podría ser correcta.
El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta. Significa simplemente que los
datos de la muestra son insuficientes para inducir un rechazo de la hipótesis nula.
Contraste de hipótesis
La hipótesis que se contrasta es rechazada o no en función de la información muestral. La hipótesis
alternativa se especifica como opción posible si se rechaza la nula.
Tipos de errores
Información muestral
No rechazar H0 Rechazar H0
LIBERAR ENCARCELAR
H0 es cierta Error tipo I = α= Nivel de
No hay error
INOCENTE Significación
La realidad
H0 es falsa
Error tipo II No hay error
CULPABLE
Error tipo I
Ocurre cuando se rechaza una hipótesis H0 que es verdadera. La probabilidad de cometer error tipo I
viene a ser la probabilidad de rechazar H0 cuando ésta es cierta.
El valor es fijado por la persona que realiza la investigación. Por lo general, 1%, 5% o 10%
Error tipo II
Ocurre cuando se acepta una hipótesis H0 que es falsa, la probabilidad de cometer error tipo II es la
probabilidad de no rechazar H0 cuando ésta es falsa.
Debido a que el valor real del parámetro es desconocido este error no puede ser fijado.
UPC MA444 Estadística 222
Pasos para realizar una prueba de hipótesis
Paso 1
Paso 2
Paso 3
Paso 4
Paso 5
Paso 6
• Realizar la conclusión
UPC MA444 Estadística 223
Prueba de hipótesis para una media con varianza poblacional desconocida
1. Plantear las hipótesis
H0{ ≥ , = , ≤ ]
H1 { < , ≠ , > }
̅ − 𝝁𝟎
𝑿
𝑻= ~𝒕𝒏−𝟏 𝒈𝒍
𝑺
√𝒏
La tabla t Student necesita los datos: probabilidad (cola) y grados de libertad (𝑔𝑙 = 𝑛 − 1).
𝐻1 : 𝜇 < 𝜇0
Unilateral izquierda
Bilateral 𝐻1 : 𝜇 ≠ 𝜇0
̅ − 𝝁𝟎
𝑿
𝑻= ~𝒕𝒏−𝟏 𝒈𝒍
𝑺
√𝒏
Tamaño de muestra: 𝑛 = 10
La tabla t Student necesita los siguientes datos: probabilidad y grados de libertad (𝑔𝑙)
Probabilidad (cola):
0.025 0.025
Bilateral 𝐻1 : 𝜇 ≠ 𝜇0
- 2.2622 = t(0.025, 9)
= 2.2622
UPC MA444 Estadística 226
Ejemplo 2
La lucha contra el COVID-19 también se lleva a cabo con el uso de la tecnología. Esta vez, se ve
desarrollada en robots que ayudan a desinfectar habitaciones de hospitales y centros médicos. Este
robot usa lámparas germicidas de irradiación ultravioleta (UVGI). La clave de este robot para que
funcione de manera autónoma está en el software que registra la máquina vía wifi en el servidor del
centro médico. Con el uso de este robot, todas las estancias hospitalarias quedan libres de cualquier
virus, pues con este método destruye tanto el ADN como el ARN que es donde justamente se
encuentra la programación genética de los virus y bacterias.
La clínica El Porvenir desea adquirir estos equipos para la desinfección de sus áreas. Pero el jefe de
adquisiciones sospecha que el promedio de los datos consumidos por el robot del modelo ASEPT-2X
es de 20 GB. Para confirmar esta suposición eligió una muestra de 10 robots de este modelo. Los datos
se presentan a continuación:
16 16 20 19 18 16 22 19 23 22
De confirmarse la sospecha, pedirá un lote previo de cinco robots con el fin de no congestionar la red
inalámbrica de la clínica. Use un nivel de significación es 𝛼 = 0,05.
Solución
Interpretación
Determinar si se debe adquirir un lote previo de cinco robots con el fin de no congestionar la red
inalámbrica de la clínica
Representación
Cálculo
El valor del estadístico de prueba es:
𝑥 − 𝜇𝑜 19,1 − 20
𝑡𝑐 = 𝑠 = = −1,076
2,644
√𝑛 √10
Datos:
𝑋̅ =19.1
S = 2.6437
n = 10
t(0.025, 9) = 2.2622
-2,26216 2,26216
EFECTO ESPEJO:
0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
6 0.26483 0.55338 0.90570 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743 6
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948 7
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539 8
9 0.26096 0.54348 0.88340 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.57380 2.82144 3.24984 9
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927 10
Análisis
Como 𝑡𝑐 = −1,076 > −2,26216; entonces no se rechaza H0. Con un nivel de significación del 5%, es
posible afirmar que el consumo promedio de los datos que usan los robots es igual a 20 GB.
Argumentación
El jefe de adquisiciones sí deberá adquirir el lote previo de cinco robots del modelo ASEPT-2X.
UPC MA444 Estadística 228
UPC MA444 Estadística 229
Tabla de la distribución t-Student
0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1 0.32492 0.72654 1.37638 1.96261 3.07768 6.31375 7.91582 10.57889 12.7062 15.89454 21.20495 31.82052 63.65674 1
2 0.28868 0.61721 1.06066 1.38621 1.88562 2.91999 3.31976 3.89643 4.30265 4.84873 5.64278 6.96456 9.92484 2
3 0.27667 0.58439 0.97847 1.24978 1.63774 2.35336 2.60543 2.95051 3.18245 3.48191 3.89605 4.54070 5.84091 3
4 0.27072 0.56865 0.94096 1.18957 1.53321 2.13185 2.33287 2.60076 2.77645 2.99853 3.29763 3.74695 4.60409 4
5 0.26718 0.55943 0.91954 1.15577 1.47588 2.01505 2.19096 2.42158 2.57058 2.75651 3.00287 3.36493 4.03214 5
6 0.26483 0.55338 0.90570 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743 6
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948 7
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539 8
9 0.26096 0.54348 0.88340 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.57380 2.82144 3.24984 9
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927 10
11 0.25956 0.53994 0.87553 1.08767 1.36343 1.79588 1.92843 2.09614 2.20099 2.32814 2.49066 2.71808 3.10581 11
12 0.25903 0.53862 0.87261 1.08321 1.35622 1.78229 1.91231 2.07644 2.17881 2.30272 2.46070 2.68100 3.05454 12
13 0.25859 0.5375 0.87015 1.07947 1.35017 1.77093 1.89887 2.06004 2.16037 2.2816 2.43585 2.65031 3.01228 13
14 0.25821 0.53655 0.86805 1.07628 1.34503 1.76131 1.8875 2.04617 2.14479 2.26378 2.4149 2.62449 2.97684 14
15 0.25789 0.53573 0.86624 1.07353 1.34061 1.75305 1.87774 2.03429 2.13145 2.24854 2.39701 2.60248 2.94671 15
16 0.25760 0.53501 0.86467 1.07114 1.33676 1.74588 1.86928 2.02400 2.11991 2.23536 2.38155 2.58349 2.92078 16
17 0.25735 0.53438 0.86328 1.06903 1.33338 1.73961 1.86187 2.01500 2.10982 2.22385 2.36805 2.56693 2.89823 17
18 0.25712 0.53382 0.86205 1.06717 1.33039 1.73406 1.85534 2.00707 2.10092 2.21370 2.35618 2.55238 2.87844 18
19 0.25692 0.53331 0.86095 1.06551 1.32773 1.72913 1.84953 2.00002 2.09302 2.20470 2.34565 2.53948 2.86093 19
20 0.25674 0.53286 0.85996 1.06402 1.32534 1.72472 1.84433 1.99371 2.08596 2.19666 2.33624 2.52798 2.84534 20
21 0.25658 0.53246 0.85907 1.06267 1.32319 1.72074 1.83965 1.98804 2.07961 2.18943 2.32779 2.51765 2.83136 21
22 0.25643 0.53208 0.85827 1.06145 1.32124 1.71714 1.83542 1.98291 2.07387 2.18289 2.32016 2.50832 2.81876 22
23 0.25630 0.53175 0.85753 1.06034 1.31946 1.71387 1.83157 1.97825 2.06866 2.17696 2.31323 2.49987 2.80734 23
24 0.25617 0.53144 0.85686 1.05932 1.31784 1.71088 1.82805 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694 24
25 0.25606 0.53115 0.85624 1.05838 1.31635 1.70814 1.82483 1.97010 2.05954 2.16659 2.30113 2.48511 2.78744 25
26 0.25595 0.53089 0.85567 1.05752 1.31497 1.70562 1.82186 1.96651 2.05553 2.16203 2.29581 2.47863 2.77871 26
27 0.25586 0.53065 0.85514 1.05673 1.3137 1.70329 1.81913 1.96320 2.05183 2.15782 2.29091 2.47266 2.77068 27
28 0.25577 0.53042 0.85465 1.05599 1.31253 1.70113 1.81659 1.96014 2.04841 2.15393 2.28638 2.46714 2.76326 28
29 0.25568 0.53021 0.85419 1.0553 1.31143 1.69913 1.81424 1.95729 2.04523 2.15033 2.28217 2.46202 2.75639 29
30 0.25561 0.53002 0.85377 1.05466 1.31042 1.69726 1.81205 1.95465 2.04227 2.14697 2.27826 2.45726 2.75000 30
31 0.25553 0.52984 0.85337 1.05406 1.30946 1.69552 1.81000 1.95218 2.03951 2.14383 2.27461 2.45282 2.74404 31
32 0.25546 0.52967 0.85300 1.05350 1.30857 1.69389 1.80809 1.94987 2.03693 2.14090 2.27120 2.44868 2.73848 32
33 0.25540 0.5295 0.85265 1.05298 1.30774 1.69236 1.80629 1.9477 2.03452 2.13816 2.26801 2.44479 2.73328 33
34 0.25534 0.52935 0.85232 1.05248 1.30695 1.69092 1.80461 1.94567 2.03224 2.13558 2.26501 2.44115 2.72839 34
35 0.25528 0.52921 0.85201 1.05202 1.30621 1.68957 1.80302 1.94375 2.03011 2.13316 2.26219 2.43772 2.72381 35
36 0.25523 0.52908 0.85172 1.05158 1.30551 1.6883 1.80153 1.94195 2.02809 2.13087 2.25953 2.43449 2.71948 36
37 0.25518 0.52895 0.85144 1.05117 1.30485 1.68709 1.80012 1.94024 2.02619 2.12871 2.25702 2.43145 2.71541 37
38 0.25513 0.52883 0.85118 1.05077 1.30423 1.68595 1.79878 1.93863 2.02439 2.12667 2.25465 2.42857 2.71156 38
39 0.25508 0.52871 0.85094 1.05040 1.30364 1.68488 1.79751 1.93711 2.02269 2.12474 2.25240 2.42584 2.70791 39
40 0.25504 0.52861 0.85070 1.05005 1.30308 1.68385 1.79631 1.93566 2.02108 2.12291 2.25027 2.42326 2.70446 40
UPC MA444 Estadística 230
Ejemplo 3
Se sabe que el rendimiento promedio (en porcentaje) de un proceso químico es 12. Sin embargo,
últimamente se observa muchos valores menores. Para comprobar que efectivamente el rendimiento
promedio ha disminuido, se toma una muestra aleatoria de un lote de materia prima y se registra las
siguientes observaciones:
9,7 12,8 8,7 13,4 8,3 11,7 10,7 8,1 9,1 10,5
PASO 1:
H0: µ ≥ 12
H1: µ < 12 (si efectivamente el rendimiento promedio ha disminuido)
PASO 2:
α = 0.04
PASO 3:
𝑥 − 𝜇𝑜 10.3 − 12
𝑡𝑐 = 𝑠 = = −2.886
1.8625
√𝑛 √10
Datos:
𝑋̅ = 10.3
S = 1.8625
n = 10
PASO 4:
VALOR CRITICO:
Gráfica de distribución
T, df=9
TC = -2.886
0.4
0.3
Densidad
0.2
0.1
0.04
0.0
T(0.96,9) = -1.973 0
PASO 5:
RHO
PASO 6:
A un nivel de significación del 4% SI se RH0, es decir SI existe suficiente evidencia estadística para
afirmar que efectivamente el rendimiento promedio ha disminuido
62. Las bombillas LED poseen un rendimiento promedio luminoso superior a todas las tecnologías
existentes. La empresa Solari afirma que el rendimiento luminoso de las bombillas LED que
produce es de 70 lumens/watio. Sin embargo, debido a la competencia en el mercado, introduce
nuevos cambios en su tecnología con la finalidad de lograr un mejor rendimiento.
Para poder comprobar los nuevos resultados, toma una muestra aleatoria de 61 bombillas
actuales, sometiéndolas a pruebas rigurosas, obteniendo un promedio de 75 lumens/watio y una
desviación estándar de 6,8 lumens/watio. Con un nivel de significación del 4%, ¿Se puede afirmar
que los nuevos cambios mejoraron el rendimiento promedio luminoso de las bombillas LED?
63. Cierto fabricante de motocicletas anuncia en un comercial de televisión que su vehículo rendirá
en promedio 87 millas por galón. Los millajes (recorrido en millas) en ocho viajes prolongados
fueron:
88 82 81 87 80 78 79 89
64. La densidad de ciertos fluidos es muy volátil por lo que se requiere que la densidad promedio
sobrepase al valor de 0,031 para poder utilizarlo. La empresa 3C Ingenieros, encargada de realizar
los análisis fisicoquímicos, debe evaluar la densidad de la sustancia XP90.
0,033 0,040 0,031 0,034 0,036 0,031 0,036 0,034 0,034 0,032
65. Una de las últimas innovaciones en el campo de la iluminación es el proyector de cabeza móvil.
Este proyector está compuesto por un foco halógeno que permite variar la intensidad luminosa.
El gerente de ventas de la empresa Visual Systems ha decidido este año exportar este novedoso
proyector si la intensidad luminosa promedio de estos proyectores es superior a 2600 lúmenes.
2600 2800 3000 2000 2400 2800 2700 2600 3000 3200 3100 2500
Suponiendo que la intensidad luminosa tiene distribución normal ¿Visual Systems deberá decidir
realizar la exportación del lote? Use un nivel de significación de 3%.
66. Según las últimas investigaciones en hidrografía, los ingenieros civiles usan actualmente
telémetros de láser manuales de bajo peso debido a su gran precisión al momento de realizar una
medición.
UPC MA444 Estadística 233
Un ingeniero civil de una importante constructora está encargado de analizar la eficiencia de una
marca de estos aparatos, por lo que decide realizar pruebas con este equipo, obteniendo los
siguientes resultados del error de lectura, en milímetros, en la localización de un objeto situado a
500 metros.
La calibración de un telemetro juega un papel muy importante en la exactitud de una medida. Si,
en promedio, los errores de lectura sobrepasan los 5 mm, estaríamos en una sobreestimación de
la lectura, por lo que debería ser devuelto al laboratorio de calibración para su ajuste. Usando la
información de la muestra ¿el telémetro debería ir al laboratorio de recalibración? Use un nivel de
significación del 4%.
67. Los drones tienen un accesorio en su fabricación llamado acelerómetro. Este accesorio registra
las variaciones de aceleración o velocidad en el aire. La norma de la Agencia Estatal de Seguridad
Aérea indica que la velocidad promedio que debe alcanzar un dron en áreas urbanas no debe
sobrepasar los 20,5 metros/segundo. Por lo tanto, ante la sospecha que no se está cumpliendo
con la norma, se seleccionaron al azar 42 drones y se realizó una prueba para medir sus
velocidades. A continuación, se presentan los resultados:
¿Se puede afirmar que no se está cumpliendo con la norma? Use un nivel de significancia del 1%.
UPC MA444 Estadística 234
Caso: Aceros Perú
El jefe de Control de calidad ordena realizar el estudio de la longitud de las barras de acero ASTM A615-
grado 60, las cuales deben tener una longitud estándar de nueve metros. Según reclamos, los clientes
manifiestan que la longitud es menor a dicho valor. De ser cierto, procederá a regular las máquinas
cortadoras de las barras de acero. Para ello, seleccionó una muestra aleatoria de 20 barras de acero
ASTM A615- grado 60.
Con 5% de significación, ¿se procederá con la regulación de las máquinas cortadoras de barras de
acero? Utilice las cinco dimensiones para la solución del caso.
8,90 8,91 8,92 8,93 8,93 8,94 8,95 8,95 8,97 8,98
8,99 8,99 8,99 9,01 9,02 9,02 9,03 9,04 9,05 9,06
UPC MA444 Estadística 235
PASO 1:
H0: µ ≥ 9
H1: µ < 9 (procederá a regular las máquinas cortadoras de las barras de acero)
PASO 2:
α = 0.05
PASO 3:
𝑥 − 𝜇𝑜 8.979 − 9
𝑡𝑐 = 𝑠 = = −1.9245
0.0488
√𝑛 √20
Datos:
𝑋̅ = 8.979
S = 0.0488
n = 20
PASO 4:
VALOR CRITICO:
T(PROBABILIDAD,GRADOS DE LIBERTAD)
Gráfica de distribución
T, df=1 9
TC = -1 .925
0.4
0.3
Densidad
0.2
0.1
0.05
0.0
T(0.95,19) = -1.729 0
UPC MA444 Estadística 236
PASO 5:
RHO
PASO 6:
A un nivel de significación del 5% SI se RH0, es decir SI existe suficiente evidencia estadística para
afirmar que procederá a regular las máquinas cortadoras de las barras de acero
UPC MA444 Estadística 237
Bilateral 𝐻1 : 𝑝 ≠ 𝑝0
6. Realizar la conclusión.
UPC MA444 Estadística 238
Ejemplo 1
Kubick S.A. es una empresa que fabrica y comercializa termas de uso doméstico e industrial. Debido a
los constantes reclamos presentados por los clientes sobre el mal funcionamiento de las termas a gas,
el ingeniero de planta sostiene que el porcentaje de unidades defectuosas producidas debe ser a lo
más 4%. Si esto no se cumple, se implementará un programa de capacitación a los trabajadores. A
partir de una muestra aleatoria de 150 termas a gas donde se encontró que 12 de ellas están
defectuosas. Usando un nivel de significación del 4%, ¿se llevará a cabo el programa de capacitación?
Solución
Interpretación
Determinar si se implementará un programa de capacitación para los trabajadores.
Representación
Variable: Funcionamiento de las termas a gas (buen funcionamiento, mal funcionamiento)
Parámetro: Proporción poblacional de terma a gas con mal funcionamiento
Herramienta: Prueba de hipótesis de la proporción
𝐻0 𝑝 ≤ 0,04
𝐻1 𝑝 > 0,04
Cálculo
La proporción muestral de terma a gas con mal funcionamiento es:
12
𝑝̂ = = 0,08
150
𝑝̂ − 𝑝0 (0,08 − 0,04)
𝑍= = = 2,5
√𝑝0 (1 − 𝑝0 ) √0,04(1 − 0,04)
𝑛 150
1,75
UPC MA444 Estadística 239
Análisis
Como 𝑍𝑐𝑎𝑙𝑐 = 2,5 > 𝑍𝑐𝑟í𝑡𝑖𝑐𝑜 = 1,75; se rechaza H0.
Conclusión
Con un nivel de significación del 4% es posible afirmar que el porcentaje de termas a gas defectuosas
es mayor al 4%.
Argumentación
Se sugiere implementar un programa de capacitación para los trabajadores de las plantas de la
empresa Kubick.
Ejemplo 2
El jefe de control de calidad de Whitney Motor está preocupado porque las máquinas de controlador
electrónico de motor (CEM), que fabrican, no se les ha dado el mantenimiento programado, y supone
que el porcentaje de CEMs con algún defecto de fabricación es superior a 20%. De ser cierta su
suposición, deberá detener el proceso de producción y realizar mantenimiento a dichas máquinas.
Para comprobarlo se seleccionó una muestra de 55 CEMs. Los resultados obtenidos del estado de
fabricación se presentan a continuación:
Defectuoso
13
Normal
42
¿Qué decisión tomará el jefe de control de calidad? Use un nivel de significación del 5%.
Solución
Interpretación
Representación
E v g f 4% , α = 0,04.
Cálculo
13
𝑝̂ = = 0,2364
55
𝑝̂ − 𝑝 0,2364 − 0,20
𝑍= = = 0,6749
√𝑝(1 − 𝑝) √0,20(1 − 0,20)
𝑛 55
Análisis
1,65
Como 𝑍𝑐𝑎𝑙𝑐 = 0,6749 < 𝑍𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 1,65; no se rechaza H0. Con un nivel de significancia de 5%, no es
posible afirmar que el porcentaje de CEMs con algún defecto de fabricación es superior al 20%.
Argumentación
Ejemplo 3
La Municipalidad de Lima ampliará el presupuesto para fiscalizar las obras si más del 30% de las obras
de Lima no cumplen o cumplen parcialmente con las normas de seguridad y acabados en las obras
de construcción civil. Se selecciona al azar 94 obras y se obteniendo la siguiente gráfica:
70 64
Número de obras
60
50
40
30 22
20
8
10
0
No cumplen Cumplen parcialmente Cumplen totalemnte
Con un nivel de significación del 2% y asumiendo normalidad, ¿la Municipalidad de Lima ampliará
el presupuesto para fiscalizar las obras de construcción de Lima?
UPC MA444 Estadística 242
PASO 1:
H0: P ≤ 0.30
H1: P > 0.30 (La Municipalidad de Lima ampliará el presupuesto para fiscalizar las obras)
PASO 2:
α=0.02
PASO 3:
n=94
30
𝑝̂ = = 0.3191
94
𝑝̂ − 𝑝0 (0.3191 − 0.30)
𝑍= = = 0.4041
√𝑝0 (1 − 𝑝0 ) √0.30(1 − 0.30)
𝑛 94
PASO 4:
H1: P > 0.30
PASO 5: NO SE RH0
PASO 6: A un nivel de significación del 2%, no se RH0, es decir no existe suficiente evidencia
estadística para afirmar que La Municipalidad de Lima ampliará el presupuesto para fiscalizar
las obras
UPC MA444 Estadística 243
UPC MA444 Estadística 244
Ejercicios propuestos
68. Un fabricante sostiene que al menos el 95% de los equipos que envió a una fábrica está acorde
con las especificaciones técnicas. Una revisión de una muestra de 200 piezas reveló que 18 eran
defectuosas. Asumiendo normalidad, pruebe la afirmación del fabricante al nivel de significancia
de 1%.
De una muestra de 300 elementos se observó que en 10 de ellos sí se perdieron datos cuando el
controlador del fabricante estaba operando. ¿La información recolectada refuta la aseveración
del fabricante? Use un nivel de significancia del 3%.
70. El jefe del área de Gestión Ambiental de la Municipalidad de Lima recomendará a la Municipalidad
de Los Olivos reformular el plan de segregación de residuos sólidos domiciliarios si más del 51%
de las viviendas de este distrito generan residuos de composición de materia orgánica. Para ello
se seleccionaron al azar 80 viviendas del distrito. Con un nivel de significancia del 4%, ¿los
resultados sustentan la recomendación del jefe del área de Gestión Ambiental de la Municipalidad
de Lima?
71. Una encuestadora realizó una consulta a los pobladores de la urbanización Lomas para saber si
están de acuerdo o no con la construcción de un nuevo centro comercial en el lugar. Al seleccionar
una muestra al azar de 250 pobladores de dicha urbanización, se obtuvo que 85 de ellos apoyaban
la construcción del nuevo centro comercial. La construcción empezará solo si más del 30% de los
ciudadanos apoyan el proyecto, de lo contrario se debe optar por otras urbanizaciones vecinas.
Realice la prueba estadística respectiva a un nivel de significación del 3%.
72. Los usuarios de la sustancia XP90 indican que cuando esta sustancia no es óptima ocurre un
fenómeno conocido como licuefacción y se requiere un reproceso. La certificadora, encargada de
la realización de los análisis fisicoquímicos, asegura que la proporción de reprocesos disminuye
cuando la sustancia está certificada por lo tanto una de las metas de la empresa es tener más del
20% de sustancias certificadas. De una muestra de 120 reprocesos se identificó que 26 usaron
sustancias certificadas. En base a esta información podemos afirmar que ¿la empresa ha logrado
la meta? Use un nivel de significación del 3%.
UPC MA444 Estadística 245
Prueba de hipótesis para la razón de varianzas poblacionales
1. Plantear las hipótesis
𝐻0 : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 ≠ 𝜎22
2. F j v g f :α
𝑆12
𝐹𝑐 = 𝐹(𝑛1 −1,𝑛2−1)
𝑆22
Donde:
1
𝐹1 =
𝐹α⁄
2; 𝑛2 −1,𝑛1 −1
𝐹2 = 𝐹α⁄
2;𝑛1 −1,𝑛2 −1
6. Realizar la conclusión.
UPC MA444 Estadística 246
Ejemplo 1
La producción de compuestos inflamables es delicada y requiere técnicas muy precisas para lograr
resultados óptimos. Actualmente, en el laboratorio se aplica la técnica A y se desea probar una nueva
técnica, B. La siguiente información muestra el resultado de los tiempos, en minutos, que utilizó cada
técnica por proceso.
Un ingeniero desea probar si la variabilidad entre los tiempos usados por ambas técnicas no es similar.
Use = 0,05
𝐻0 : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 ≠ 𝜎22
𝑆12 6,562
𝐹𝑐 = = = 10,24
𝑆22 2,052
donde:
1
𝐹1 = α
𝐹( ⁄2 ; 𝑛2 − 1, 𝑛1 − 1)
1 1
= = = 0,3268
𝐹(0,025; 10; 15) 3,06
0.050 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54
0.025 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06
0.010 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80
0.005 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42
v1
𝜶 v2 12 15 20 24 30 40 50 60 70 120
0.050 10 2.91 2.85 2.77 2.74 2.70 2.66 2.64 2.62 2.61 2.58
0.025 3.62 3.52 3.42 3.37 3.31 3.26 3.22 3.20 3.18 3.14
0.010 4.71 4.56 4.41 4.33 4.25 4.17 4.12 4.08 4.06 4.00
0.005 5.66 5.47 5.27 5.17 5.07 4.97 4.90 4.86 4.83 4.75
6. Realizar la conclusión.
Con un nivel de significancia del 5%, sí es posible afirmar que la variabilidad entre los tiempos
usados por ambas técnicas no es similar.
UPC MA444 Estadística 248
Prueba de hipótesis para la diferencia de medias poblacionales
𝐻0 : 𝜇1 − 𝜇2 ≥ 𝑘 𝐻0 : 𝜇1 − 𝜇2 = 𝑘 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝑘
𝐻1 : 𝜇1 − 𝜇2 < 𝑘 𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑘 𝐻1 : 𝜇1 − 𝜇2 > 𝑘
Unilateral izquierda
H0: µ1 ≥ µ2
H1: µ1 < µ2
H0: µ1 - µ2 ≥ 0
H1: µ1 - µ2 < 0
Unilateral derecha
H0: µ1 ≤ µ2
H1: µ1 > µ2
H0: µ1 - µ2 ≤ 100
H1: µ1 - µ2 > 100
2. F j v g f :α
(𝑥1 − 𝑥2 ) − 𝑘
𝑡𝑐 = ~𝑡(𝑛1+𝑛2−2)
1 1
√𝑆𝑝2 ( + )
𝑛1 𝑛2
−𝑡𝛼;𝑛1 +𝑛2−2
Bilateral 𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑘
−𝑡𝛼;𝑛 𝑡𝛼;𝑛
2 1 +𝑛2 −2 2 1 +𝑛2 −2
𝑡𝛼;𝑛1+𝑛2−2
6. Realizar la conclusión.
𝐻0 : 𝜇1 − 𝜇2 ≥ 𝑘 𝐻0 : 𝜇1 − 𝜇2 = 𝑘 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝑘
𝐻1 : 𝜇1 − 𝜇2 < 𝑘 𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑘 𝐻1 : 𝜇1 − 𝜇2 > 𝑘
(𝒙𝟏 − 𝒙𝟐 ) − 𝒌
𝒕𝒄 =
𝑺𝟐 𝑺𝟐
√ 𝟏+ 𝟐
𝒏𝟏 𝒏𝟐
2
𝑆2 𝑆2
( 1 + 2)
𝑛1 𝑛2
𝜐= 2 2
𝑆2 𝑆2
( 1) ( 2)
𝑛1 𝑛2
+
(𝑛1 − 1) (𝑛2 − 1)
El valor de 𝑣 debe ser un valor entero y deberá redondearse al entero menor. Por ejemplo, si 𝑣 =
18,12608, entonces 𝑣 = 18.
−𝑡𝛼; 𝑣
Bilateral 𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑘
−𝑡𝛼; 𝑣 𝑡𝛼;𝑣
2 2
𝑡𝛼; 𝑣
UPC MA444 Estadística 251
6. Realizar la conclusión.
Ejemplo 1
Para determinar la concentración de partículas de nitrato en el aire en dos centros poblados, Larrea
(Pasco) y San Marcos (Ancash), cuya principal actividad económica es la minería, se tomaron 8
muestras de aire en Larrea y 6 muestras de aire en San Marcos. Los resultados se muestran a
continuación:
El Ministerio del Medio Ambiente, desea realizar una inspección exhaustiva de la calidad de aire que
respiran los habitantes de estos centros poblados, pero por cuestiones de presupuesto solo podrá
realizarlo en el centro poblado de Larrea, siempre y cuando se llegue a demostrar que la concentración
promedio de nitrato es mayor que en el centro poblado de San Marcos; caso contrario, se esperará el
próximo año para inspeccionar los dos centros poblados. Usando un nivel de significancia 5%. ¿Cuál
será la decisión que tomará el Ministerio de Medio Ambiente?
Solución
Resolviendo con las cinco dimensiones:
Interpretación
Determinar si el Ministerio de Medio Ambiente realizará una inspección exhaustiva de la calidad de
aire que respiran los habitantes de los centros poblados de Larrea y San Marcos; caso contrario, se
esperará el próximo año para inspeccionar los dos centros poblados.
Determinar si la inspección exhaustiva de la calidad de aire que respiran los habitantes se realizara
solo en el centro poblado de Larrea
Representación
Variable: Concentración de nitrato (fibra/litro)
Variable de agrupación: Centro poblado: Larrea (1) San Marcos (2)
Herramienta estadística: Prueba de hipótesis para la diferencia de medias y prueba de hipótesis
para la razón de varianzas
Cálculo
Para establecer cuál es el estadístico de prueba adecuado para la prueba de diferencia de medias
poblacionales, debemos realizar primero una prueba de razón de varianzas para determinar si
consideramos que las varianzas poblacionales son iguales o diferentes.
UPC MA444 Estadística 252
𝐻0 : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 ≠ 𝜎22
PASO 2:
El nivel de significancia es de = 0,05.
PASO 3:
𝑠12 0,006102
𝐹𝑐𝑎𝑙 = = = 20,42
𝑠22 0,001352
PASO 4:
F DE FISHER
Donde:
𝐹1 = 𝐹(0,975; 7; 5)
RECIPROCIDAD:
1 1 1
𝐹1 = = = = 0,1890
𝐹𝛼 ; 𝑛 𝐹0,025; 5; 7 5,29
2 2 −1,𝑛1 −1
F1 = 0.1892063
=INV.F(0.025,7,5)
𝐹2 = 𝐹(0,025; 7; 5) = 6,85
UPC MA444 Estadística 253
=INV.F.CD(0.025,7,5)
PASO 5:
PASO 6:
Conclusión:
Con un nivel de significancia de 5%, es posible afirmar que las varianzas poblacionales son
heterogéneas. DIFERENTES
𝐻0 𝜇1 ≤ 𝜇2
𝐻1 𝜇1 > 𝜇2
𝐻0 𝜇1 − 𝜇2 ≤ 0
𝐻1 𝜇1 − 𝜇2 > 0
PASO 1:
H0: µ1 - µ2 ≤ 0
H1: µ1 - µ2 > 0 (La inspección se realizara solo en el centro poblado de Larrea)
PASO 2:
PASO 3:
De acuerdo con la prueba de razón de varianzas, se acepta de las varianzas poblacionales son
heterogéneas, por lo tanto, el estadístico de la prueba adecuado para la diferencia de medias es:
(𝑥1 − 𝑥2 ) − 𝑘
𝑡𝑐𝑎𝑙 =
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2
(0,04806 − 0,03286) − 0
𝑡𝑐𝑎𝑙 = = 𝟔, 𝟖𝟑
2 2
√0,00610 + 0,00135
8 6
UPC MA444 Estadística 254
2
𝑆2 𝑆2
( 1 + 2)
𝑛1 𝑛2
𝜐= 2 2
𝑆2 𝑆2
( 1) ( 2)
𝑛1 𝑛2
+
(𝑛1 − 1) (𝑛2 − 1)
PASO 4:
La prueba es unilateral derecha.
1,89458
𝜐 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015
6 0.26483 0.55338 0.9057 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381
UPC MA444 Estadística 255
Análisis
PASO 5:
PASO 6:
Conclusión
A un nivel de confianza de 95%, existe evidencia estadística suficiente para afirmar que la
concentración promedio de nitrato en Larrea es mayor que en San Marcos.
Argumentación
Debido a que la concentración promedio de nitrato en Larrea es mayor que en San Marcos, el
Ministerio de Medio Ambiente realizará una inspección exhaustiva de la calidad de aire en el centro
poblado de Larrea.
Ejemplo 2
El tiempo de exposición, en minutos, de un metal con una sustancia química hasta lograr un adherido
perfecto es parte de un proceso de producción. Se considera que el menor tiempo de exposición es
mejor. Como parte de la mejora del proceso se somete a prueba dos procedimientos y se mide el
tiempo de exposición para dos muestras independientes.
a. Asumiendo que los tiempos de exposición tienen distribución normal, ¿se puede afirmar que hay
diferencia en la variación de los tiempos? Use un nivel de significación del 10%.
UPC MA444 Estadística 256
b. Asumiendo que los tiempos de exposición tienen distribución normal y usando un nivel de
significación del 5%, ¿recomendaría el procedimiento B?
UPC MA444 Estadística 257
UPC MA444 Estadística 258
Ejercicios propuestos
73. Los siguientes datos corresponden a la resistencia a la compresión a los 28 días, en kg/cm 2,
reportados por dos laboratorios:
74. La exactitud obtenida en mediciones con GPS depende del equipo receptor. Uno de los fabricantes
de receptores está realizando un estudio para comparar la exactitud de dos modelos, GPSMAP (1)
y Oregón (2). Según información del departamento de control de calidad, la exactitud del modelo
GPSMAP es menor que la de Oregón, por lo cual se sugiere dejar de fabricarla.
El jefe de producción seleccionó al azar dos muestras de receptores de ambos modelos con la
finalidad de realizar la prueba correspondiente y registra la exactitud, en mm, obtenida por ambos
receptores. Considerando que la exactitud se distribuye normalmente y con un nivel de
significación del 4%, ¿la empresa debe dejar de fabricar el modelo GPSMAP.
75. La empresa de ingeniería Y&F pertenece al rubro de la construcción. Para un proyecto realizado a
una empresa minera de Ancash, se tuvo como principal tarea el movimiento de tierras. Ante ello,
es evidente que el soporte de mantenimiento que necesita esta división es elemental para la
eficiencia del trabajo.
El jefe del área de mantenimiento enviará personal de la zona norte a la zona centro cuando los
costos de mano de obra en la zona centro superen a los costos en la zona norte. Para decidir, use
un nivel de significación del 4%.
Asuma que los costos se distribuyen normalmente y que las varianzas poblacionales son
desconocidas y homogéneas.
76. Un componente de los satélites son los paneles solares. La compañía Intelsat está probando dos
tipos de paneles solares: el EQM y el EM3, los cuales deben pasar un estricto control de calidad.
Según información del departamento de calidad si la potencia de los paneles solares EQM supera
en más de dos kw a los de EM3, se sugiere dejar de fabricar el modelo EM3.
El jefe de producción seleccionó al azar dos muestras de paneles de ambos modelos y registra las
potencias de estos. A continuación, se presenta la siguiente información:
UPC MA444 Estadística 259
Considerando que la potencia se distribuye normalmente, con un nivel de significación del 5%, ¿se
debe dejar de fabricar el modelo EM3?
UPC MA444 Estadística 260
Caso: Constructora R&P
El jefe del área de compra de materiales sospecha que el promedio de la resistencia a la flexión de las
columnas es mayor cuando se usan los fierros de procedencia nacional que cuando se usan los fierros
importados. De ser cierta su sospecha, elegirá fierros nacionales para la construcción.
Para ello, seleccionó al azar registros del último año de la resistencia a la flexión, en kg/cm2, de las
columnas construidas con cada tipo de fierro obteniendo los siguientes resultados:
Sabiendo que la resistencia a flexión de las columnas se distribuye normalmente y que sus varianzas
poblacionales son homogéneas. A un nivel de significación del 5% ¿cuál será la decisión del jefe del
área de compra de materiales?
Interpretación
Determinar si El jefe del área de compra de materiales elegirá fierros nacionales para la construcción
Representación
Cálculo
𝐻0 𝜇1 ≤ 𝜇2
𝐻1 𝜇1 > 𝜇2
PASO 1:
H0: µ1 - µ2 ≤ 0
H1: µ1 - µ2 > 0 (elegirá fierros nacionales para la construcción)
PASO 2:
PASO 3:
De acuerdo con la prueba de razón de varianzas, se acepta de las varianzas poblacionales son IGUALES
homogéneas
(𝑥1 − 𝑥2 ) − 𝑘 (𝑥1 − 𝑥2 ) − 0
𝑡𝑐 = = = 𝟑, 𝟒𝟔𝟐𝟏𝟓 ~𝑡(𝑛1 +𝑛2−2)
1 1 1 1
√𝑆𝑝2 ( + ) √𝑆𝑝2 ( + )
𝑛1 𝑛2 𝑛1 𝑛2
PASO 4:
La prueba es unilateral derecha.
1,6896
=INV.T(0.95, 35)
UPC MA444 Estadística 263
Análisis
PASO 5:
PASO 6:
Conclusión
A un nivel de significación 5%, SI existe evidencia estadística suficiente para afirmar que se debe elegir
fierros nacionales para la construcción
Argumentación
Debido a que el promedio de la resistencia a la flexión de las columnas es mayor cuando se usan los
fierros de procedencia nacional que cuando se usan los fierros importados. El jefe del área de compra
de materiales debe elegir fierros nacionales para la construcción
UPC MA444 Estadística 264
Logro
Al finalizar la unidad, el estudiante aplica el análisis de varianza y análisis de regresión en casos
relacionados a su especialidad.
Temario
• Análisis de varianza de un factor
• Comparaciones múltiples con Minitab
• Regresión simple: diagrama de dispersión
• Estimación de los parámetros.
• Descomposición de la varianza total
• Validación del modelo
• Coeficiente de determinación, error estándar de la estimación y coeficiente de correlación
Bibliografía
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a la
Ingeniería. México, D.F: McGraw-Hill, pág. 561 - 576.
• Mendenhall, W., Beaver, R. & Beaver, B. (2010) Introducción a la Probabilidad y Estadística pág.
425 - 428.
• Estadística. Mario Triola. 11a. Edición. Pearson Educación, México 2013 519.5 TRIO/E 2013 pág.
568.
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, pág. 483 – 506.
• Mendenhall, W., Beaver, R. & Beaver, B. (2010) Introducción a la Probabilidad y Estadística pág.
482 -488.
• Estadística. Mario Triola. 11a. Edición. Pearson Educación, México 2013 519.5 TRIO/E 2013.
UPC MA444 Estadística 265
UPC MA444 Estadística 266
Diseño de experimentos
Un experimento diseñado es una prueba o serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada (factores controlables) de un proceso o sistema, de manera
que sea posible observar e identificar las causas de los cambios en la variable de salida (variable
respuesta).
Variable de entrada
(Factores Variable de salida
Proceso
controlables y no (Variable respuesta)
controlables)
Ejemplo 1
Se tiene dos poblaciones, una de hombres y otra de mujeres. Se quiere saber si el ingreso promedio
mensual de los trabajadores hombres similar al de las mujeres.
¿µ1 = µ2?
n1 n2
𝑥̅1 𝑥̅2
Elemento Un Trabajador
Tratamiento
Un tratamiento corresponde a los niveles de un factor o a la combinación de los niveles de dos o más
factores. Es un conjunto de procedimientos cuyo efecto sobre la variable respuesta nos interesa
estudiar. Su efecto se mide y se compara con otros tratamientos.
Variable respuesta
Es la variable en la cual se evaluarán los efectos de los tratamientos.
Unidad experimental
Es la unidad, sujeto u objeto, al el cual se le aplica un tratamiento.
Ejemplo 2
Se tiene tres poblaciones, una de alumnos en modalidad presencial, otra en blended y otra en línea. Se
quiere saber si la nota promedio de los alumnos es similar en las tres modalidades.
¿µ1 = µ2 = µ3?
n1 = 5 n2 = 10 n3 = 5
Presencial, Blended, En
Categorías de la variable de agrupación Tratamientos
Linea
Elemento Unidad de análisis Un Alumno
A continuación, se presentan los datos recolectados, los mismos que se han tabulado en una matriz de
datos. El 𝑌𝑖𝑗 representa la variable en estudio, siendo 𝑖 el tratamiento y 𝑗 las repeticiones.
Tratamientos
Repeticiones
Tratamiento 1 Tratamiento 2 Tratamiento 3
1 𝑌11 𝑌21 𝑌31
2 𝑌12 𝑌22 𝑌32
3 𝑌13 𝑌23 𝑌33
… … … …
𝑗 𝑌1𝑗 𝑌2𝑗 𝑌3𝑗
… … … …
𝑛𝑖 𝑌1𝑛1 𝑌2𝑛2 𝑌3𝑛3
Total 𝒀𝟏. 𝒀𝟐. 𝒀𝟑.
Ejemplo 3
El gerente de una compañía dedicada a ensamblar piezas de equipos electrónicos realizó un estudio
con el fin de comparar la eficacia de tres programas de capacitación, A, B y C. Para ello se asignaron
al azar quince empleados, cinco a cada uno de los tres programas. Después de terminado los cursos de
capacitación se registró el tiempo, en minutos, que les tomó ensamblar las piezas en los equipos
electrónicos.
Complete lo solicitado:
Las poblaciones que se desea comparar suelen ser producto de la aplicación de distintos tratamientos
a ciertas unidades de análisis.
En este caso:
• Los cinco programas de incentivos serían los cinco tratamientos aplicados (los cuales definen las
cinco poblaciones que se van a comparar).
• La unidad de análisis sería un trabajador (quien recibe el tratamiento).
Los datos para analizar pueden arreglarse en una tabla como la que se muestra a continuación:
Tratamientos
Repeticiones
Tratamiento 1 Tratamiento 2 … Tratamiento i … Tratamiento k
1 𝑌11 𝑌21 … 𝑌𝑖1 … 𝑌𝑘1
2 𝑌12 𝑌22 … 𝑌𝑖2 … 𝑌𝑘2
3 𝑌13 𝑌23 … 𝑌𝑖3 … 𝑌𝑘3
… … … … … … …
𝑗 𝑌1𝑗 𝑌2𝑗 … 𝑌𝑖𝑗 … 𝑌𝑘𝑗
… … … … … … …
𝑛𝑖 𝑌1𝑛1 𝑌2𝑛2 … 𝑌𝑖𝑛𝑖 … 𝑌𝑘𝑛𝑘
Total 𝒀𝟏. 𝒀𝟐. … 𝒀𝒊. … 𝒀𝒌.
La hipótesis 𝐻0 significa la varianza es la misma en las cuatro sucursales y la hipótesis 𝐻1 significa que
al menos una varianza es diferente.
UPC MA444 Estadística 270
Los resultados de Minitab son:
Bartlett's Test
Como el p valor (P-value) es mayor al nivel de significancia 𝛼 = 0.05 (0,988 > 0,05), no se rechaza H0,
el resultado de esta prueba indica que no hay suficiente evidencia estadística afirmar que alguna de
las varianzas poblacionales es diferente, es decir, se acepta que el supuesto de homogeneidad de
varianzas al 5% de nivel de significancia.
60
50
40
30
20
10
5
1
-2 -1 0 1 2
RESI1
Como el p valor (P-value) es mayor al nivel de significancia 𝛼 (0,150 > 0,05), no se rechaza H0, el
resultado de esta prueba indica que no hay suficiente evidencia estadística para afirmar que los errores
del modelo no tienen distribución normal, es decir se acepta el supuesto de normalidad al 5% de nivel
de significancia.
UPC MA444 Estadística 271
Observación
Ambos supuestos se han obtenido con el software Minitab. Para efectos del curso se asumirán ambos
supuestos.
𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 𝑖 = 1, 2, ⋯ , 𝑘 ; 𝑗 = 1, 2, ⋯ , 𝑛𝑖
donde:
𝑦𝑖𝑗 : = valor observado del 𝑖-ésimo tratamiento en la 𝑗-ésima repetición
𝜇 : = efecto de la media poblacional
𝜏𝑖 : = efecto del 𝑖-ésimo tratamiento
𝜀𝑖𝑗 : = error experimental asociado a la observación 𝑦𝑖𝑗
Por ejemplo, podríamos usar en análisis de varianza para responder a las siguientes situaciones:
• Una importante compañía de construcciones desea comparar tres marcas de taladros para
determinar cuánto tiempo pasa antes de necesitar una reparación; si los tiempos de vida de los
taladros de cada marca se distribuyen normalmente. ¿Las marcas de taladro tienen un tiempo de
vida útil promedio similar a las otras marcas antes de requerir una reparación?
• Un ingeniero civil residente de una obra desea evaluar el efecto que tiene las técnicas de mezclado
de concreto sobre la resistencia (kg/cm2) a la compresión. Para ello evalúa cuatro técnicas
diferentes y para realizar la prueba produce especímenes de concreto. ¿La resistencia promedio a
la compresión es la misma para cada técnica de mezclado?
• Una empresa constructora brinda capacitación con diferentes métodos a sus operarios. ¿El
rendimiento promedio de los operarios en la empresa es el mismo según los métodos de
adiestramiento recibido por el operario?
• Una importante compañía de construcciones desea comparar tres marcas de camiones antes de
ordenar toda una nueva flota de una clase de camión. ¿Los costos medios de operación por
kilómetro de cada camión es el mismo para cada marca de camión?
UPC MA444 Estadística 272
Análisis de la varianza
El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar tres o más medias.
Se desea medir el efecto del factor en estudio (variable independiente de naturaleza cualitativa o
cuantitativa) sobre la variable respuesta (variable dependiente de naturaleza cuantitativa).
En un diseño completamente al azar (DCA) los tratamientos se asignan aleatoriamente a las unidades
experimentales.
Esta técnica estadística permite descomponer la variabilidad total de los resultados de un experimento
en sus distintas fuentes (tratamientos, error experimental), con la finalidad de compararlas e
identificar su importancia relativa en la explicación de la variación total.
𝑘 𝑛𝑖 𝑘 𝑛𝑖
2
2 𝑦..2
𝑆𝐶𝑇 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅) = ∑ ∑ 𝑦𝑖𝑗 −
𝑛.
𝑖=1 𝑗=1 𝑖=1 𝑗=1
Variación dentro de las muestras o variación intragrupos que denotaremos como 𝑆𝐶𝑇𝑅.
𝑘 𝑘
𝑦𝑖.2 𝑦..2
𝑆𝐶𝑇𝑅 = ∑ 𝑛𝑖 (𝑦̅𝑖 − 𝑦̅)2 =∑ −
𝑛𝑖 𝑛.
𝑖=1 𝑖=1
UPC MA444 Estadística 273
Variación entre muestras o variación intergrupos que denotaremos como 𝑆𝐶𝐸.
𝑘 𝑛𝑖
2
𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖 )
𝑖=1 𝑗=1
donde:
Asumiendo el cumplimiento de los supuestos antes mencionados, y que en realidad no hay diferencia
entre los tratamientos, la cantidad Fc del cuadro de análisis de varianza seguiría una distribución F con
los grados de libertad del tratamiento y con los grados de libertad del error.
Entonces, se puede utilizar esta distribución para evaluar la hipótesis nula de que no hay diferencias
entre las medias de los tratamientos.
Hipótesis estadística
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑎 𝑙𝑜𝑠 𝑑𝑒𝑚á𝑠
𝐻0 es la afirmación de que no hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio no afecta a la variable respuesta.
𝐻1 es la afirmación de que sí hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio sí afecta a la variable respuesta.
𝐶𝑀𝑇𝑅
𝐹𝑐 =
𝐶𝑀𝐸
Si 𝐹𝑐 ≤ 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 , no se rechaza 𝐻0
Si 𝐹𝑐 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 , sí se rechaza 𝐻0
6. Realizar la conclusión.
Ejemplo 1
La gerente de mercadeo de un banco planea poner en marcha cierto tipo de promociones para atraer
nuevos clientes en cuatro sucursales del banco. Ella está convencida que diferentes tipos de
promociones atraerán a personas de diferentes grupos de ingreso, por lo que, de haber diferencias
entre los ingresos medios de los clientes de cada sucursal, se optará por un programa de
promociones distinto para cada una.
Considere a los montos de los depósitos, en miles de soles, como una medida representativa de los
ingresos de los clientes. Se presentan datos para una muestra de siete depósitos de cada sucursal
¿Debe la gerente optar por un programa de promociones distinto para cada sucursal? Evalúe esta
posibilidad con un nivel de significación del 5%.
Solución
Factor Sucursal
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑎 𝑙𝑜𝑠 𝑑𝑒𝑚á𝑠; 𝑖 = 1, 2, 3, 4
𝐻0 es la afirmación de que no hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio no afecta a la variable respuesta.
𝐻1 es la afirmación de que sí hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio sí afecta a la variable respuesta.
= 0,05
FC = ¿???
2
𝑦..2 (∑𝑘=4 7
𝑖=1 ∑𝑗=1 𝑦𝑖𝑗 ) (27,3 + 23,8 + 25,8 + 23,1)2 1002
𝑇𝐶 = = = = = 357,1429
𝑛 ∑𝑘=4
𝑖=1 𝑛𝑖 7+7+7+7 28
𝑘=4 7
2 𝑦..2
𝑆𝐶𝑇 = ∑ ∑ 𝑦𝑖𝑗 − = (5,32 + 2,62 + ⋯ + 4,12 ) − 357,1429 = 27,0171
𝑛.
𝑖=1 𝑗=1
𝑘=4
𝑦𝑖.2 𝑦..2 27,32 23,82 25,82 23,12
𝑆𝐶𝑇𝑅 = ∑ − =( + + + ) − 357,1429 = 1,568
𝑛𝑖 𝑛. 7 7 7 7
𝑖=1
v1
𝜶
v2 1 2 3 4 5 6 7 8 9 10
0.050 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25
0.025 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64
0.010 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17
0.005 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59
UPC MA444 Estadística 277
6. Realizar la conclusión.
Al 5% de significación, no es posible afirmar que al menos un depósito promedio sea diferente a los
demás.
UPC MA444 Estadística 278
Método de comparaciones múltiples: Prueba de Tukey - Kramer
Se supone que el experimentador tiene a su disposición mediciones relativas a varios tratamientos. El
análisis de varianza indica si hay evidencias de que al menos una de las medias sea diferente o no.
Cuando se rechaza la hipótesis nula, el análisis de varianza no revela cuál o cuáles de las medias son
significativamente diferentes; en estos casos se deben utilizar otras pruebas estadísticas.
Cuando el experimentador desea determinar todos los pares de medias que se puede concluir que
difieren de otro (µi versus µj) se utilizan las pruebas de comparaciones múltiples como la de Tukey -
Kramer con el fin de probar todas las hipótesis nulas simultáneas.
𝐻0 : 𝜇1 − 𝜇𝑗 = 0
𝐻1 : 𝜇1 − 𝜇𝑗 ≠ 0
𝑥̄ 𝑖 . − 𝑥̄𝑗 .
𝑡=
𝐶𝑀𝐸 1 1
√ 2 (𝑟 + 𝑟 )
𝑖 𝑗
donde:
Ejemplo 1
Croma Color S.A. es una empresa especializada en la comercialización de pinturas envasadas a nivel
industrial, comercial y residencial. Usan tecnología de ósmosis inversa, nano filtración, microfiltración,
entre otras.
El gerente de marketing propone lanzar una campaña publicitaria para incrementar las ventas de las
pinturas. La campaña publicitaria se lanzará solo en el distrito o distritos donde las ventas promedio,
en miles de soles, sean menores.
Para identificar el distrito dónde se lanzará la campaña publicitaria, se registró el monto de venta, en
miles de soles, de algunos meses del último año tomados al azar. Los resultados se presentan a
continuación:
¿En qué distrito o distritos se debe lanzar la campaña publicitaria? Utilice un nivel de significación del
1%.
Solución
Interpretación
Representación
Factor: Distrito
Tratamientos: Santa Anita, Breña, Ate
Variable respuesta: Monto de ventas de pintura envasada, en miles de soles
Unidad experimental: Un mes de venta de pintura envasada
Herramienta estadística: Usaremos la herramienta del diseño completamente al azar (DCA)
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑎 𝑙𝑎𝑠 𝑑𝑒𝑚á𝑠; 𝑖 = 1, 2, 3
= 0,05
UPC MA444 Estadística 280
Cálculo
Fuente de Suma de
Grados de libertad Cuadrados medio Fcalculado
variación cuadrados
2520 𝟏𝟐𝟔𝟎
Tratamientos 𝑘– 1 = 3 − 1 = 2 𝑆𝐶𝑇𝑅 = 2520 = 1260 𝐹𝐶 = = 𝟏𝟎, 𝟓
2 𝟏𝟐𝟎
1440
Error 𝑛 − 𝑘 = 15 − 3 = 12 𝑆𝐶𝐸 = 1440 = 120
12
Fuente de Suma de
Grados de libertad Cuadrado medio Fcalculado
variación cuadrados
Distritos 2 2520 1260 10,5
Error 12 1440 120
Total 14 3960
𝑭𝒄𝒂𝒍𝒄𝒖𝒍𝒂𝒅𝒐 = 𝟏𝟎, 𝟓
PASO 4:
v1
𝛼
v2 1 2 3 4 5 6 7 8 9 10
UPC MA444 Estadística 281
0.050 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75
0.025 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37
0.010 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30
0.005 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09
UPC MA444 Estadística 282
Análisis
PASO 5:
Para decidir comparamos el valor del estadístico de prueba y el valor crítico.
PASO 6:
La conclusión es: Al 1% de nivel de significancia, se puede afirmar que existe diferencia en al menos un
monto promedio de venta de pintura envasada, en miles de soles.
Se puede observar que no hay diferencia significativa entre las ventas de los distritos de Ate y Santa
Anita. Los distritos con mayor monto promedio de ventas de pintura envasada son Ate y Santa Anita.
, se observa que las ventas son menores en el distrito de breña
Argumentación
La campaña publicitaria se lanzará solo en el distrito de Breña, porque las ventas promedio de agua
envasada son menores.
UPC MA444 Estadística 283
Ejemplo 2
Un ingeniero civil residente de una obra desea evaluar el efecto que tienen las técnicas de mezclado
de concreto sobre la resistencia (kg/cm2) a la compresión. Para ello evalúa cuatro técnicas diferentes
y para realizar la prueba produce especímenes de concreto. La resistencia a la compresión del concreto
de cada técnica se distribuye normalmente y tienen la misma varianza. Los datos recolectados son los
siguientes:
a. Identifique:
Variable respuesta
Factor
Tratamientos
Unidad experimental
Error
Total
H0:
H1:
UPC MA444 Estadística 284
2. Establecer el nivel de significación
=
Fc =
Como Fc = …………… …… Fcrit …………; ………., ………. = ……….….. entonces …….. rechaza H0.
6. Realizar la conclusión.
77. Una compañía que produce ladrillos efectuó un experimento para determinar si cuatro
temperaturas de cocción específicas, en °F, afectan la densidad de cierto tipo de ladrillo, en
gr/cm3. La densidad de los ladrillos para cada temperatura se distribuye normalmente y tienen la
misma varianza.
Temperaturas
100°F (1) 125°F (2) 150°F (3) 175°F (4)
19,9 21,7 20,9 21,8
19,7 21,4 20,8 21,9
19,8 21,5 20,8 21,7
19,7 21,5 20,6 21,6
20,0 21,7
Factor N Mean Grouping
175°F (4) 5 21.7400 A
125°F (2) 4 21.5250 A
150°F (3) 4 20.7750 B
100°F (1) 5 19.8200 C
Variable respuesta
Factor
Tratamientos
Unidad experimental
c. Utilice nivel de significación de 5% para probar si al menos una temperatura de cocción influye
en la densidad de los ladrillos. Presente el ANOVA del Excel.
d. Si la prueba resulta significativa, ¿qué temperatura recomendaría utilizar?
78. Una importante compañía de construcciones desea comparar tres marcas de taladros para
determinar cuánto tiempo pasa antes de necesitar una reparación. Los tiempos de vida de los
taladros de cada marca se distribuyen normalmente y tienen la misma varianza. Los datos de los
tiempos de vida útil, en decenas de horas, para cada marca se encuentran en la siguiente tabla:
a. Identifique:
Variable respuesta
Factor
Tratamientos
Unidad experimental
79. Un empresario debe elegir la alternativa más eficiente para fabricar un mismo producto. Se
analiza el costo por unidad, en soles, de tres alternativas. El costo por unidad para cada alternativa
se distribuye normalmente y tienen la misma varianza, ¿qué alternativa deberá elegirse?
40%
20% 16%
12%
7% 5% 6%
0%
Materia Plástico Sanitario Papel Cartón Otros
organica
Composición de residuos sólidos
a. Pruebe si existe alguna diferencia significativa en los costos unitarios de las tres alternativas
de fabricación. Utilice nivel de significación de 5%.
b. Si existen diferencias, ¿entre qué grupos están las diferencias? Utilice nivel de significación de
5%.
80. Importación Bombardera desea determinar si el tipo de chip (A, B, C) que tienen las laptops que
ellos importan influye en el tiempo de respuesta (microsegundos). El tiempo de respuesta para
cada tipo de chip se distribuye normalmente y tienen la misma varianza. Al probar cinco laptops
con cada tipo de chip, se obtuvieron los siguientes resultados, en microsegundos:
a. Al nivel de significancia del 5%, ¿la importadora puede concluir que hay diferencia en los
tiempos promedio de respuesta según el tipo de chip utilizado?
b. Si la prueba resulta significativa, ¿qué tipo de chip recomendaría utilizar?
UPC MA444 Estadística 288
2
81. Para determinar si la resistencia a la ruptura (libras/ pulg ) difiere según el tipo de estructura, se
tomó al azar una muestra de zonas con estructura tipo cimientos, zonas con estructura tipo
terraplenes y zonas con estructura tipo excavación. Asuma que se cumplen los supuestos de
normalidad y de homogeneidad. Los resultados de la resistencia a la ruptura (libras/ pulg 2) se
presenta en el siguiente cuadro:
Variable respuesta
Factor
Tratamientos
Unidad experimental
b. A continuación, se muestra la tabla del ANVA con algunos datos faltantes. Asimismo, se
muestran los resultados del análisis de comparaciones múltiples de Tukey. Complete la tabla.
c. Explique y fundamente, con un nivel de significación del 5%, ¿con qué tipo de estructura se
debería construir la represa?
UPC MA444 Estadística 289
Caso: Compañía Clean
La siguiente tabla contiene los resultados, medidos por área, en m2, que se limpian en una hora:
¿Qué sistema o sistemas para limpiar manchas de grasa en departamentos es más efectiva de tal
manera que se pueda trabajar exclusivamente con dicho sistema? Asuma que se cumplen los
supuestos de normalidad y homogeneidad. Utilice un nivel de significación del 5%.
• ¿La velocidad de transferencia de datos de un disco duro depende de la velocidad en que giran los
discos del plato del disco duro o de su capacidad de almacenamiento?
• ¿El tiempo de ejecución de una obra civil depende del número de trabajadores o del índice de
automatización?
• ¿El tiempo de falla de los equipos electrónicos dependerá de la resistencia de los resistores?
• ¿El sueldo dependerá del grado de instrucción?
• ¿El tiempo de procesamiento de trabajos estará relacionado con el número de trabajos por día?
• ¿La temperatura está relacionada con la presión sobre el rendimiento de un producto químico?
Estas preguntas surgen cuando queremos estudiar dos variables de una población con el fin de
examinar la relación existente entre ellas. Las dos variables en estudio son variables cuantitativas que
nos permitirá construir una ecuación lineal que modela la relación existente entre estas dos
variables.
En el análisis de regresión la ecuación lineal puede usarse para estimar o predecir los valores de una
variable dependiente, llamada Y, cuando se conocen o se suponen conocidos los valores de otra
variable, variable independiente, llamada X.
El análisis de correlación permite determinar el grado de relación lineal existente entre dos variables.
Es útil en un trabajo exploratorio cuando el investigador desea encontrar el grado o la fuerza de esa
relación.
Ejemplo:
Consumo:
Ingreso:
Y: Consumo
X: Ingreso
Y = b0 + b1 X
Y: variable dependiente
X: variable independiente
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑒𝑖 𝑖 = 1, 2, 3, … , 𝑛
Donde:
𝑋: = variable independiente
UPC MA444 Estadística 291
𝑌: = variable dependiente
Se trabaja con variables de tipo cuantitativas, entre las cuales se puede establecer una relación
funcional.
𝑌 = 𝑓(𝑋)
Para cada par de variables, identifique la variable dependiente (𝑌) e independiente (𝑋), la pendiente
(positiva o negativa) y el tipo de relación (inversa o directa) y qué significa el tipo de relación:
Y = b0 + b1 X
Pendiente
Positiva
10
8
9
7
8
5 4
4 3
3 2 Modelo lineal
2 Buen ajuste
1
1
0
0 0 2 4 6 8 10
0 2 4 6 8 10
8 10
9
7 Modelo lineal
8
6
Buen ajuste
7
5 6
4 5
4
3
3
2
Cuando X crece, Y crece 2
1
1
0 0
0 2 4 6 8 10 0 2 4 6 8 10
Y = b0 + b1 X
• La suma de las desviaciones verticales de los puntos con relación a la recta es cero.
• La suma de los cuadrados de las desviaciones es mínima (es decir, ninguna otra recta daría una
menor suma de cuadrados de tales desviaciones). Es decir, ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂𝑖 )2 es mínima.
Los valores de 𝑏0 y b1 que minimizan la suma de los cuadrados de las desviaciones, son las soluciones
de las llamadas ecuaciones normales de la recta de regresión:
𝑛 𝑛
∑ 𝑦𝑖 = 𝑛𝑏0 + 𝑏1 (∑ 𝑥𝑖 )
𝑖=1 𝑖=1
UPC MA444 Estadística 294
𝑛 𝑛 𝑛
∑ 𝑥𝑖 𝑦𝑖 = 𝑏0 (∑ 𝑥𝑖 ) + 𝑏1 (∑ 𝑥𝑖2 )
𝑖=1 𝑖=1 𝑖=1
Este método nos permite estimar los parámetros del modelo de regresión. Resolviendo las ecuaciones
simultáneas para 𝑏𝑜 y 𝑏1 tenemos:
𝑏𝑜 = 𝑦̅ − 𝑏1 𝑥̅
𝒀 = 𝜷𝟎 + 𝜷𝟏 𝑿 + 𝒆
donde:
𝑏1 es la pendiente de la recta o coeficiente de regresión.
𝑏0 es la ordenada en el origen o intercepto de la recta con eje Y.
Ejemplo 1
Para las siguientes variables:
𝑌: = ingreso mensual (soles)
𝑋: = experiencia profesional (años)
UPC MA444 Estadística 295
a. Indique la relación entre las variables.
Y = 2500 + 450 X
𝑏0 = 2500 Si la experiencia profesional es cero (años) el ingreso mensual será de 2500 soles
Ejemplo 2
Se desea modelar la vida útil (en años) de un satélite en función de la cantidad de combustible (en kg)
requerido para moverlo de su posición orbital, usando un modelo lineal. Los datos se muestran a
continuación:
Y: Vida útil (años) 10,8 11,5 12 12,4 13,2 13,7 13,9 14,1 14,8 15
X: Cantidad de combustible ( kg) 150,4 156,3 162,5 165,8 172,5 168,9 184,5 185,9 187,2 199,4
UPC MA444 Estadística 296
15
14
Vida útil
13
12
11
150 160 170 180 190 200
Cantidad de combustible
Fuente: Empresa A
b. Calcule e interprete los coeficientes de regresión estimados del ejemplo anterior, considerando la
siguiente información:
X:= cantidad de
N° Y:= vida útil xy x2 y2
combustible
1 150,4 10,8 1624,32 22620,16 116,64
2 156,3 11,5 1797,45 24429,69 132,25
3 162,5 12,0 1950,00 26406,25 144,00
4 165,8 12,4 2055,92 27489,64 153,76
5 172,5 13,2 2277,00 29756,25 174,24
6 168,9 13,7 2313,93 28527,21 187,69
7 184,5 13,9 2564,55 34040,25 193,21
8 185,9 14,1 2621,19 34558,81 198,81
9 187,2 14,8 2770,56 35043,84 219,04
10 199,4 15,0 2991,00 39760,36 225,00
Total 1733,4 131,4 22965,92 302632,46 1744,64
UPC MA444 Estadística 297
Y = -1.996 + 0.087 X
𝑏0 La vida útil (años) es de -1.996 años cuando Cantidad de combustible ( kg) es cero
Donde:
𝑛
(∑𝑛𝑖=1 𝑥𝑖 )2
𝑆𝐶𝑅𝑒𝑔 = 𝛽̂1 (∑ 𝑥𝑖2
2
− )
𝑛
𝑖=1
𝑛
(∑𝑛𝑖=1 𝑦𝑖 )2
𝑆𝐶𝑇 = ∑ 𝑦𝑖2 −
𝑛
𝑖=1
Este análisis permite realizar la prueba de hipótesis para validar el modelo de regresión obtenido a un
v g f α.
̂ = 𝒃𝟎 + 𝒃𝟏 𝒙
𝒚
𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
𝐶𝑀𝑅𝑒𝑔
𝐹𝑐𝑎𝑙 =
𝐶𝑀𝐸𝑟𝑟𝑜𝑟
Si 𝐹𝑐𝑎𝑙 > 𝐹𝑐𝑟𝑖𝑡 (𝛼, 1, 𝑛 − 2), entonces se rechaza Ho; por lo tanto, el modelo de regresión es válido.
Si 𝐹𝑐𝑎𝑙 ≤ 𝐹𝑐𝑟𝑖𝑡 (𝛼, 1, 𝑛 − 2),entonces no se rechaza Ho; el modelo de regresión no es válido.
6. Realizar la conclusión
Ejemplo 1
A un nivel de significación del 5%, valide el modelo de regresión lineal del ejercicio anterior. Obtenga
el ANOVA del Excel.
𝐻0 : 𝛽1 = 0
( El modelo es Valido)
𝐻1 : 𝛽1 ≠ 0
𝐶𝑀𝑅𝑒𝑔
𝐹𝑐𝑎𝑙 = = 85.962
𝐶𝑀𝐸𝑟𝑟𝑜𝑟
Si 𝐹𝑐𝑎𝑙 = 85.962 > 𝐹𝑐𝑟𝑖𝑡 (0.05, 1,8) = 5.32 , entonces se rechaza Ho; por lo tanto, el modelo de
regresión es válido.
UPC MA444 Estadística 300
6. Realizar la conclusión.
A un nivel de significación del 5% se RH=, es decir si existe suficiente evidencia estadística para afirmar
que el modelo es valido
UPC MA444 Estadística 301
Coeficiente de determinación
Es una medida de bondad de ajuste del modelo. Nos indica que tan bueno es el modelo para explicar
el porcentaje de variabilidad de la variable dependiente Y.
También nos ayuda a saber la precisión con la que se puede predecir o pronosticar el valor de la
variable dependiente, si se conocen los valores de la variable dependiente.
𝑆𝐶𝑅𝑒𝑔
𝑅2 = × 100%
𝑆𝐶𝑇𝑜𝑡
R2 = 0.915 = 91.6 %
La variabilidad de la vida útil(años) es explicado en un 95.6% por el peso del combustible (kg)
Coeficiente de correlación
El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X e Y.
Se calcula como la raíz cuadrada del coeficiente de determinación:
√𝑅 2 𝑠𝑖 𝛽̂1 > 0
𝑟={
− √𝑅 2 𝑠𝑖 𝛽̂1 < 0
Si el coeficiente de correlación está cerca de cero entonces indicará que no existe relación lineal
significativa entre las dos variables.
Si el coeficiente de correlación se acerca a 1 o a -1 indicará que existe una relación lineal fuerte
pudiendo ser directa o inversa.
Los valores que se pueden tomar como referencia para determinar si no existe relación lineal o si existe
una relación lineal fuerte, directa o inversa, se muestra a continuación, estos valores pueden variar de
acuerdo con el campo de estudio.
r= 0.956
Ejemplo 1
R2 = 91,5%
La variabilidad de la vida útil(años) es explicado en un 95.5% por el peso del combustible (kg)
r= 0.956 la relación lineal entre la vida útil y el peso del combustible tiene una relación fuerte y
directamente proporcional
Indique qué valor de r2 y r que le corresponde a cada gráfico. Considere los siguientes valores: r = 0,95;
r = -0,78 y r = 0,52. Además, indique el tipo de relación entre las variables.
Situación 1
r= 0.52
El coeficiente de correlación es 0.52, por tanto, la relación entre las variables es modera y directamente
proporcional
r2 = 0.2704
Situación 2
r= 0.95
El coeficiente de correlación es 0.95, por tanto, la relación entre las variables es fuerte y directamente
proporcional
El coeficiente de determinación es r2 = 0.2704
UPC MA444 Estadística 303
Situación 3
El coeficiente de correlación es -0.78, por tanto, la relación entre las variables es alta y inversamente
proporcional
El coeficiente de determinación es
UPC MA444 Estadística 304
Regresión usando una calculadora Casio
Los pasos para obtener los valores de los coeficientes de regresión 𝑏0 y 𝑏1 , el coeficiente de regresión
𝑟 usando una calculadora Casio son los siguientes:
Y = A + B X = 𝑏0 + 𝑏1 𝑥
Para realizar la tabla de análisis de varianza se necesita calcular la suma de cuadrados total 𝑆𝐶𝑇, la
suma de cuadrados de la regresión 𝑆𝐶𝑅𝑒𝑔 y la suma de cuadrados de errores 𝑆𝐶𝐸.
UPC MA444 Estadística 306
Para calcular la suma de cuadrados total 𝑆𝐶𝑇 usaremos la siguiente fórmula:
𝑆𝐶𝑇 = (𝑛 − 1)𝑆𝑌2
𝑆𝐶𝑅𝑒𝑔 = 𝑅 2 × 𝑆𝐶𝑇
1. Para calcular el valor del coeficiente de correlación r presione Shift + 1 y seleccione Reg, opción 3.
2. Para calcular el valor del coeficiente de determinación R2 eleve al cuadrado el valor de r.
3. Para calcular el valor 𝑆𝑌 ; seleccione Shift + 1, luego la opción 4 y luego elija 7: sy.
Ejemplo 1
Usando una calculadora Casio
Una empresa dedicada a la fabricación de equipos de telecomunicación considera que la vida útil de
los equipos puede estar explicada por la temperatura del ambiente en el que trabaja mediante una
relación lineal. Para encontrar la ecuación de regresión lineal de la vida útil de los quipos en función
de la temperatura del ambiente se tomó una muestra de 11 datos, los cuales se muestran en la tabla
siguiente:
Temperatura (ºC) 24 20 18 16 10 12 13 28 16 15 23
Vida útil (en años) 8,0 6,4 5,5 4,6 3,8 3,9 5,6 8,5 6,6 4,5 8,8
Solución
Solución
Siguiendo los pasos descritos en una calculadora Casio obtendrá las siguientes pantallas.
𝑦̂ = 𝑏0 + 𝑏1 𝑥 = 𝐴 + 𝐵𝑥
𝑦̂ = 0,7984 + 0,2944𝑥
𝑏1 = 0,2944. Ante el incremento de 1°C en la temperatura del ambiente, la vida útil del equipo se
incrementa, en promedio, 0,2944 años.
Solución
Solución
El 81,74% de la variabilidad total de la vida útil de un equipo está siendo explicada por la
temperatura del ambiente en el que trabaja, en el modelo de regresión estimado.
e. Estime la vida útil de un equipo, en años, si la temperatura del medio ambiente donde trabaja es
de 10,5 °C.
Solución
𝑦̂ = 0,7984 + 0,2944 𝑥
La vida útil de un equipo, en años, estimada es 3,89 años; si la temperatura del medio ambiente
donde trabaja es de 10,5 °C.
Solución
𝑆𝐶𝑇 = (𝑛 − 1)𝑆𝑌2
UPC MA444 Estadística 309
𝑆𝐶𝑅𝑒𝑔 = 𝑅 2 × 𝑆𝐶𝑇
Reemplazando:
𝑆𝐶𝑇 = (𝑛 − 1)𝑆𝑦2 = 10 × 1,80212 = 32,4756
Solución
Validar el modelo de regresión implica probar que la pendiente poblacional es diferente de cero,
por tanto, las hipótesis son:
𝐻0 𝛽1 = 0
𝐻1 𝛽1 ≠ 0
𝐶𝑀𝑅𝑒𝑔 26,5458
𝐹𝑐 = = = 40,2878
𝐶𝑀𝐸 0,6590
El valor crítico es
v1
𝛼
v2 1 2 3 4 5 6 7 8 9 10
0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42
UPC MA444 Estadística 311
Decisión
Conclusión
Con un nivel de significación del 5%, el modelo es válido. Por lo tanto, existe una relación lineal
entre la vida útil del equipo y la temperatura del ambiente.
UPC MA444 Estadística 312
Caso: SYMA
La empresa desea incursionar en América Latina, donde las temperaturas son más cálidas, para lo cual
debe cumplir con un tiempo mínimo de vuelo de seis minutos a una temperatura ambiente de 30°C.
De cumplir con la exigencia, ingresará al mercado latino, de lo contrario deberá realizar reajustes a su
dron.
Se ha encargado al área de producción realizar la estimación solicitada, para ello se seleccionó una
muestra de 10 drones. Los resultados se presentan a continuación:
Temperatura (°C) 25 26 20 25 23 18 18 20 21 22
Duración (minutos) 8,0 9,0 10,3 8,4 8,6 12,5 14,0 11,5 8,9 10,0
Solución
Interpretación
Determinar si Syma ingresará al mercado latino donde las temperaturas son más cálidas.
Representación
15
14
13
Duración (min)
12
11
10
9
8
7
6
17 18 19 20 21 22 23 24 25 26 27
Temperatura (°C)
Fuente Syma S.A.
Se observa una relación inversa, es decir a mayor valor de la temperatura en el ambiente menor será
el tiempo de vuelo (minutos).
Cálculo
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.86215497
Coeficiente de determinación R^2 0.74331119
𝑌̂ = 𝑏0 + 𝑏1 𝑋
𝑌̂ = 22,94 − 0,588 𝑋
Si la temperatura del medio ambiente se incrementa en 1°C el tiempo de vuelo de los drones disminuye
en 0,588 minutos.
UPC MA444 Estadística 314
Validación del modelo
Validar el modelo de regresión implica probar que la pendiente poblacional es diferente de cero, por
tanto, las hipótesis son:
𝐻0 𝛽1 = 0
𝐻1 𝛽1 ≠ 0
𝐶𝑀𝑅𝑒𝑔 26,1467
𝐹𝑐𝑎𝑙 = = = 23,17
𝐶𝑀𝐸𝑟𝑟𝑜𝑟 1,1287
v1
𝛼
v2 1 2 3 4 5 6 7 8 9 10
0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42
Conclusión
Con un nivel de significación del 5 %, el modelo es válido. Por lo tanto, existe una relación lineal entre
la vida útil del equipo y la temperatura del ambiente.
Análisis
R2 = (26,147/35,176) x100% = 74,33% o directamente de la tabla 0,7433x100% = 74,33%
Interpretación
El 74,33% de la variabilidad en la duración del tiempo de vuelo de los drones es explicada por la
temperatura en el modelo de regresión estimado.
r = 0,8622
Entre las variables tiempo de vuelo y la temperatura del medio ambiente existe una fuerte relación y
es directa por ser el valor del coeficiente cercano a 1.
Argumentación
No se cumple con la exigencia de un tiempo mínimo de vuelo de 6 minutos a una temperatura de 30°C.
Por lo tanto, la empresa deberá realizar ajustes a su dron.
UPC MA444 Estadística 316
Ejercicios propuestos
Temperatura (oC) 18 18 18 22 22 26 30 30 34
Tiempo de operación 1200 1215 1150 1000 974 810 583 612 240
1200
Tiempo de operación
1000
800
600
400
200
0
17 19 21 23 25 27 29 31 33 35
Temperatura (°C)
Fuente: Empresa A
83. Para la construcción de carreteras que experimentan heladas intensas, es importante que la
densidad del concreto (kg/m2) seleccionado tenga un valor bajo de conductividad térmica
(watts/metros.Kelvin) para reducir al mínimo los daños provocados por cambios de temperatura.
Por lo tanto, se desea modelar la conductividad térmica en función de la densidad que posee el
concreto. Por lo tanto, se toman 12 trozos al azar de diferentes densidades de concreto y se
registra la conductividad. Los datos se muestran en la siguiente tabla:
Densidad del concreto 300 400 500 600 700 800 900 1000 1100 1200 1400 1600
Conductividad térmica 0,065 0,08 0,095 0,115 0,13 0,15 0,175 0,205 0,23 0,27 0,346 0,436
0.50
0.45
Conductividad térmica 0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0 200 400 600 800 1000 1200 1400 1600 1800
Densidad del concreto
Fuente: Constructora A
84. NVZ Import Export es una empresa proveedora de GPS para automóviles de diferentes modelos,
últimamente ha importado nuevos modelos de GPS que ya están a la venta. El jefe del
departamento de ventas ha implementado charlas motivadoras para sus agentes vendedores y
desea modelar la eficiencia de sus ventas (%) en función de las horas que asisten mediante una
función lineal.
Los siguientes datos corresponden a una muestra aleatoria de 10 agentes vendedores. Se registró
el tiempo acumulado de horas en las que estuvo presente el agente vendedor en una o más
charlas durante el último trimestre y la eficiencia de sus ventas.
85. El área de producción del fabricante NanoTec registró el tiempo de vuelo de los drones del modelo
CX-STAR en función de la temperatura del medio ambiente. Para una muestra de 10 drones se
tienen los siguientes resultados:
Temperatura (°C) 25 26 20 25 23 18 18 20 21 22
Tiempo de vuelo (min.) 8 9 10,3 8,4 8,6 12,5 14 11,5 8,9 10
Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233
-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350
-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621
-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681
-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866
-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
UPC MA444 Estadística 319
Tabla de la distribución normal estándar
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
UPC MA444 Estadística 320
Tabla de la distribución t - Student
Área bajo la curva 𝑃(𝑇 ≥ 𝑐) = 𝛼
𝛼
𝜐 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1 0.32492 0.72654 1.37638 1.96261 3.07768 6.31375 7.91582 10.57889 12.7062 15.89454 21.20495 31.82052 63.65674
2 0.28868 0.61721 1.06066 1.38621 1.88562 2.91999 3.31976 3.89643 4.30265 4.84873 5.64278 6.96456 9.92484
3 0.27667 0.58439 0.97847 1.24978 1.63774 2.35336 2.60543 2.95051 3.18245 3.48191 3.89605 4.54070 5.84091
4 0.27072 0.56865 0.94096 1.18957 1.53321 2.13185 2.33287 2.60076 2.77645 2.99853 3.29763 3.74695 4.60409
5 0.26718 0.55943 0.91954 1.15577 1.47588 2.01505 2.19096 2.42158 2.57058 2.75651 3.00287 3.36493 4.03214
6 0.26483 0.55338 0.9057 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539
9 0.26096 0.54348 0.8834 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.5738 2.82144 3.24984
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927
11 0.25956 0.53994 0.87553 1.08767 1.36343 1.79588 1.92843 2.09614 2.20099 2.32814 2.49066 2.71808 3.10581
12 0.25903 0.53862 0.87261 1.08321 1.35622 1.78229 1.91231 2.07644 2.17881 2.30272 2.46070 2.68100 3.05454
13 0.25859 0.5375 0.87015 1.07947 1.35017 1.77093 1.89887 2.06004 2.16037 2.2816 2.43585 2.65031 3.01228
14 0.25821 0.53655 0.86805 1.07628 1.34503 1.76131 1.8875 2.04617 2.14479 2.26378 2.41490 2.62449 2.97684
15 0.25789 0.53573 0.86624 1.07353 1.34061 1.75305 1.87774 2.03429 2.13145 2.24854 2.39701 2.60248 2.94671
16 0.25760 0.53501 0.86467 1.07114 1.33676 1.74588 1.86928 2.02400 2.11991 2.23536 2.38155 2.58349 2.92078
17 0.25735 0.53438 0.86328 1.06903 1.33338 1.73961 1.86187 2.01500 2.10982 2.22385 2.36805 2.56693 2.89823
18 0.25712 0.53382 0.86205 1.06717 1.33039 1.73406 1.85534 2.00707 2.10092 2.21370 2.35618 2.55238 2.87844
19 0.25692 0.53331 0.86095 1.06551 1.32773 1.72913 1.84953 2.00002 2.09302 2.20470 2.34565 2.53948 2.86093
20 0.25674 0.53286 0.85996 1.06402 1.32534 1.72472 1.84433 1.99371 2.08596 2.19666 2.33624 2.52798 2.84534
21 0.25658 0.53246 0.85907 1.06267 1.32319 1.72074 1.83965 1.98804 2.07961 2.18943 2.32779 2.51765 2.83136
22 0.25643 0.53208 0.85827 1.06145 1.32124 1.71714 1.83542 1.98291 2.07387 2.18289 2.32016 2.50832 2.81876
23 0.25630 0.53175 0.85753 1.06034 1.31946 1.71387 1.83157 1.97825 2.06866 2.17696 2.31323 2.49987 2.80734
24 0.25617 0.53144 0.85686 1.05932 1.31784 1.71088 1.82805 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694
25 0.25606 0.53115 0.85624 1.05838 1.31635 1.70814 1.82483 1.9701 2.05954 2.16659 2.30113 2.48511 2.78744
26 0.25595 0.53089 0.85567 1.05752 1.31497 1.70562 1.82186 1.96651 2.05553 2.16203 2.29581 2.47863 2.77871
27 0.25586 0.53065 0.85514 1.05673 1.3137 1.70329 1.81913 1.96320 2.05183 2.15782 2.29091 2.47266 2.77068
28 0.25577 0.53042 0.85465 1.05599 1.31253 1.70113 1.81659 1.96014 2.04841 2.15393 2.28638 2.46714 2.76326
29 0.25568 0.53021 0.85419 1.05530 1.31143 1.69913 1.81424 1.95729 2.04523 2.15033 2.28217 2.46202 2.75639
30 0.25561 0.53002 0.85377 1.05466 1.31042 1.69726 1.81205 1.95465 2.04227 2.14697 2.27826 2.45726 2.75000
31 0.25553 0.52984 0.85337 1.05406 1.30946 1.69552 1.81000 1.95218 2.03951 2.14383 2.27461 2.45282 2.74404
32 0.25546 0.52967 0.853 1.0535 1.30857 1.69389 1.80809 1.94987 2.03693 2.14090 2.27120 2.44868 2.73848
33 0.25540 0.5295 0.85265 1.05298 1.30774 1.69236 1.80629 1.94770 2.03452 2.13816 2.26801 2.44479 2.73328
34 0.25534 0.52935 0.85232 1.05248 1.30695 1.69092 1.80461 1.94567 2.03224 2.13558 2.26501 2.44115 2.72839
35 0.25528 0.52921 0.85201 1.05202 1.30621 1.68957 1.80302 1.94375 2.03011 2.13316 2.26219 2.43772 2.72381
36 0.25523 0.52908 0.85172 1.05158 1.30551 1.6883 1.80153 1.94195 2.02809 2.13087 2.25953 2.43449 2.71948
37 0.25518 0.52895 0.85144 1.05117 1.30485 1.68709 1.80012 1.94024 2.02619 2.12871 2.25702 2.43145 2.71541
38 0.25513 0.52883 0.85118 1.05077 1.30423 1.68595 1.79878 1.93863 2.02439 2.12667 2.25465 2.42857 2.71156
39 0.25508 0.52871 0.85094 1.0504 1.30364 1.68488 1.79751 1.93711 2.02269 2.12474 2.25240 2.42584 2.70791
40 0.25504 0.52861 0.85070 1.05005 1.30308 1.68385 1.79631 1.93566 2.02108 2.12291 2.25027 2.42326 2.70446
UPC MA444 Estadística 321
Tabla de la distribución t – Student
𝛼
𝜐 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
41 0.25500 0.52850 0.85048 1.04971 1.30254 1.68288 1.79517 1.93428 2.01954 2.12117 2.24825 2.42080 2.70118
42 0.25496 0.52840 0.85026 1.04939 1.30204 1.68195 1.79409 1.93298 2.01808 2.11952 2.24633 2.41847 2.69807
43 0.25492 0.52831 0.85006 1.04908 1.30155 1.68107 1.79305 1.93173 2.01669 2.11794 2.24449 2.41625 2.69510
44 0.25488 0.52822 0.84987 1.04879 1.30109 1.68023 1.79207 1.93054 2.01537 2.11644 2.24275 2.41413 2.69228
45 0.25485 0.52814 0.84968 1.04852 1.30065 1.67943 1.79113 1.92941 2.0141 2.11500 2.24108 2.41212 2.68959
46 0.25482 0.52805 0.84951 1.04825 1.30023 1.67866 1.79023 1.92833 2.0129 2.11364 2.23949 2.41019 2.68701
47 0.25479 0.52798 0.84934 1.04800 1.29982 1.67793 1.78937 1.92729 2.01174 2.11233 2.23797 2.40835 2.68456
48 0.25476 0.52790 0.84917 1.04775 1.29944 1.67722 1.78855 1.92630 2.01063 2.11107 2.23652 2.40658 2.68220
49 0.25473 0.52783 0.84902 1.04752 1.29907 1.67655 1.78776 1.92535 2.00958 2.10987 2.23512 2.40489 2.67995
50 0.25470 0.52776 0.84887 1.04729 1.29871 1.67591 1.78700 1.92444 2.00856 2.10872 2.23379 2.40327 2.67779
51 0.25467 0.52769 0.84873 1.04708 1.29837 1.67528 1.78627 1.92356 2.00758 2.10762 2.2325 2.40172 2.67572
52 0.25465 0.52763 0.84859 1.04687 1.29805 1.67469 1.78558 1.92272 2.00665 2.10655 2.23127 2.40022 2.67373
53 0.25462 0.52757 0.84846 1.04667 1.29773 1.67412 1.78491 1.92191 2.00575 2.10553 2.23009 2.39879 2.67182
54 0.25460 0.52751 0.84833 1.04648 1.29743 1.67356 1.78426 1.92114 2.00488 2.10455 2.22895 2.39741 2.66998
55 0.25458 0.52745 0.84821 1.04630 1.29713 1.67303 1.78364 1.92039 2.00404 2.10361 2.22785 2.39608 2.66822
56 0.25455 0.52740 0.84809 1.04612 1.29685 1.67252 1.78304 1.91967 2.00324 2.10270 2.22679 2.39480 2.66651
57 0.25453 0.52735 0.84797 1.04595 1.29658 1.67203 1.78246 1.91897 2.00247 2.10182 2.22577 2.39357 2.66487
58 0.25451 0.52730 0.84786 1.04578 1.29632 1.67155 1.78190 1.9183 2.00172 2.10097 2.22479 2.39238 2.66329
59 0.25449 0.52725 0.84776 1.04562 1.29607 1.67109 1.78137 1.91765 2.00100 2.10015 2.22384 2.39123 2.66176
60 0.25447 0.52720 0.84765 1.04547 1.29582 1.67065 1.78085 1.91703 2.00030 2.09936 2.22292 2.39012 2.66028
61 0.25445 0.52715 0.84755 1.04532 1.29558 1.67022 1.78034 1.91642 1.99962 2.0986 2.22204 2.38905 2.65886
62 0.25444 0.52711 0.84746 1.04518 1.29536 1.6698 1.77986 1.91584 1.99897 2.09786 2.22118 2.38801 2.65748
63 0.25442 0.52706 0.84736 1.04504 1.29513 1.6694 1.77939 1.91527 1.99834 2.09715 2.22035 2.38701 2.65615
64 0.25440 0.52702 0.84727 1.04490 1.29492 1.66901 1.77893 1.91472 1.99773 2.09645 2.21955 2.38604 2.65485
65 0.25439 0.52698 0.84719 1.04477 1.29471 1.66864 1.77849 1.91419 1.99714 2.09578 2.21877 2.38510 2.65360
66 0.25437 0.52694 0.84710 1.04464 1.29451 1.66827 1.77806 1.91368 1.99656 2.09514 2.21802 2.38419 2.65239
67 0.25436 0.52690 0.84702 1.04452 1.29432 1.66792 1.77765 1.91318 1.99601 2.09451 2.21729 2.38330 2.65122
68 0.25434 0.52687 0.84694 1.04440 1.29413 1.66757 1.77724 1.91269 1.99547 2.09390 2.21658 2.38245 2.65008
69 0.25433 0.52683 0.84686 1.04428 1.29394 1.66724 1.77685 1.91222 1.99495 2.09330 2.21589 2.38161 2.64898
70 0.25431 0.52680 0.84679 1.04417 1.29376 1.66691 1.77647 1.91177 1.99444 2.09273 2.21523 2.38081 2.64790
75 0.25425 0.52664 0.84644 1.04365 1.29294 1.66543 1.77473 1.90967 1.9921 2.09008 2.21216 2.37710 2.64298
80 0.25419 0.5265 0.84614 1.04320 1.29222 1.66412 1.77321 1.90784 1.99006 2.08778 2.20949 2.37387 2.63869
85 0.25414 0.52637 0.84587 1.0428 1.29159 1.66298 1.77187 1.90623 1.98827 2.08574 2.20713 2.37102 2.63491
90 0.25410 0.52626 0.84563 1.04244 1.29103 1.66196 1.77068 1.90480 1.98667 2.08394 2.20504 2.36850 2.63157
95 0.25406 0.52616 0.84542 1.04212 1.29053 1.66105 1.76961 1.90352 1.98525 2.08233 2.20317 2.36624 2.62858
100 0.25402 0.52608 0.84523 1.04184 1.29007 1.66023 1.76866 1.90237 1.98397 2.08088 2.20150 2.36422 2.62589
105 0.25399 0.52600 0.84506 1.04158 1.28967 1.65950 1.76779 1.90133 1.98282 2.07958 2.19998 2.36239 2.62347
110 0.25396 0.52592 0.84490 1.04134 1.28930 1.65882 1.76701 1.90039 1.98177 2.07839 2.19861 2.36073 2.62126
120 0.25391 0.52580 0.84463 1.04093 1.28865 1.65765 1.76564 1.89874 1.97993 2.07631 2.19620 2.35782 2.61742
∞ 0.25335 0.52440 0.84162 1.03643 1.28156 1.64484 1.75069 1.88079 1.95997 2.05375 2.17009 2.32635 2.57583
UPC MA444 Estadística 322
Tabla de la distribución F
Área bajo la curva: 𝑃(𝐹 ≥ 𝑐) = 𝛼
v1
𝛼 v2 1 2 3 4 5 6 7 8 9 10
0.050 1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 241.88
0.025 647.79 799.48 864.15 899.60 921.83 937.11 948.20 956.64 963.28 968.63
0.010 4052.18 4999.34 5403.53 5624.26 5763.96 5858.95 5928.33 5980.95 6022.40 6055.93
0.005 16212.46 19997.36 21614.13 22500.75 23055.82 23439.53 23715.20 23923.81 24091.45 24221.84
0.050 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40
0.025 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40
0.010 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40
0.005 198.50 199.01 199.16 199.24 199.30 199.33 199.36 199.38 199.39 199.39
0.050 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79
0.025 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42
0.010 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23
0.005 55.55 49.80 47.47 46.20 45.39 44.84 44.43 44.13 43.88 43.68
0.050 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96
0.025 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84
0.010 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55
0.005 31.33 26.28 24.26 23.15 22.46 21.98 21.62 21.35 21.14 20.97
0.050 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74
0.025 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62
0.010 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05
0.005 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62
0.050 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06
0.025 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46
0.010 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87
0.005 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25
0.050 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64
0.025 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76
0.010 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62
0.005 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38
0.050 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35
0.025 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30
0.010 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81
0.005 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21
0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42
0.050 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98
0.025 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72
0.010 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85
0.005 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85
0.050 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85
0.025 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53
0.010 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54
0.005 12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.42
0.050 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75
0.025 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37
0.010 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30
0.005 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09
UPC MA444 Estadística 323
Tabla de la distribución F
bastones, 28
Circular, 19
B de barras, 19
Bayes histograma, 36
Teorema de, 89 ojiva, 36
Pareto, 22
C
M
Censo, 147
Coeficiente de correlación, 221 Marca de clase, 32
Coeficiente de determinación, 221 Media
aritmética, 43
Medidas de tendencia central, 43
D Medidas de variación
Distribución Desviación estándar, 54
binomial, 105 Varianza, 54
continua, 130 Moda, 49
exponencial, 130 Muestra, 7
normal, 134 Muestreo, 147
normal estándar, 134, 135 aleatorio simple, 149
Poisson, 109 probabilístico, 149
E P
Escalas de medición Parámetro, 16, 42
intervalo, 10 Probabilidad
nominal, 10 condicional, 80
ordinal, 10 Prueba de hipótesis
razón, 10 media poblacional, 167
Esperado medias poblacionales, 186
de una variable discreta, 102 proporción poblacional, 176
de variable continua, 125 varianzas poblacionales, 183
Estadística
definición, 6 R
descriptiva, 6, 98
inferencial, 6 Regla multiplicativa
Estadístico, 16, 42 para eventos independientes, 83
Evento Regresión
complementario, 70 lineal, 215
compuesto, 67
independientes, 83 T
mutuamente excluyentes, 67
simple, 66 Tamaño de muestra
Experimento aleatorio, 66 media de una población, 158
Tipos de errores, 165
F
V
Frecuencia
acumulada absoluta, 28 Variable
porcentual, 28 aleatoria continua, 117
Función aleatoria discreta, 99
de densidad, 117 continua, 9
de distribución acumulada, 120 cualitativa, 9
cuantitativa, 9
discreta, 9
G Varianza
Gráfico de una variable aleatoria, 102, 125
UPC MA444 Estadística 327