MA444 202201 - Cuaderno de Trabajo
MA444 202201 - Cuaderno de Trabajo
MA444 202201 - Cuaderno de Trabajo
Civil
Electrónica
Mecatrónica
Cuaderno de trabajo
Área de Ciencias
marzo 2022
2
UPC MA444 Estadística
3
UPC MA444 Estadística
Tabla de contenido
Logro
Temario
La Estadística. Conceptos básicos.
Organización de datos cualitativos y cuantitativos
Medidas de tendencia central: media, mediana, moda, media ponderada
Medidas de posición: cuartiles, deciles y percentiles
Medidas de dispersión: varianza, desviación estándar y coeficiente de variación
Coeficiente de asimetría
Bibliografía
Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.1 (pág. 7-11)
Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.3 (pág. 11-
17)
Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.5 (pág. 24-
57)
6
UPC MA444 Estadística
7
UPC MA444 Estadística
Estadística
Es la ciencia de los datos. Implica la recolección de datos, clasificación, organización, análisis e
interpretación de resultados.
Estadística descriptiva
Es la rama de la Estadística que se dedica al análisis, descripción y representación de un conjunto de
datos obtenidos a partir de una muestra. Las conclusiones son válidas sobre las características de
dicho conjunto de datos.
Estadística inferencial
Es la rama de la Estadística que desarrolla los procesos de estimación, análisis y pruebas de hipótesis
de un conjunto de datos extraídos de una muestra, con el propósito de llegar a conclusiones acerca
de una población.
Estadística descriptiva
Se obtienen conclusiones sobre el conjunto de datos sin
incertidumbre. No realiza proyecciones
Recolección de datos
Clasiicación de datos
Organización de datos
Analisis e interpretación
Estadística inferencial
Se obtienen conclusiones respecto a la población bajo
incertidumbre. Realiza proyecciones
Toma de decisiones a partir de una muestra
8
UPC MA444 Estadística
Conceptos básicos
Población
Es un conjunto de elementos (personas, objetos, etc.) que tienen una o más características
observables que se pueden medir en ellos. Se denota por la letra N mayúscula.
Ejemplo 1
Para conocer la opinión que tienen los estudiantes de ingeniería sobre el servicio que ofrece el
Centro de Información, se puede considerar como población a todos los estudiantes de ingeniería de
la UPC matriculados en el semestre anterior.
Muestra
Se denomina muestra a una parte de la población. El tamaño de la muestra se denota con la letra n
minúscula.
Ejemplo 2
Para conocer la opinión que tienen los estudiantes de ingeniería, sobre el servicio que ofrece el
Centro de Información, se puede considerar como muestra a un subconjunto de estudiantes de
ingeniería de la UPC matriculados en el semestre anterior.
Población Todos
Muestra Un subconjunto
Elemento Un
9
UPC MA444 Estadística
Ejemplo 3
El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad
en el departamento de Lima y las consecuencias que éste podría generar en el
Cercado de Lima. Por esta razón, Defensa Civil ha decidido realizar un
diagnóstico de la situación de las viviendas en este distrito encuestando a
1200 viviendas seleccionadas al azar. Parte de la encuesta se presenta a
continuación.
Encuesta de vivienda
Ejemplo 4
Se realizó un estudio para determinar la cantidad promedio diario de residuos de construcción y
demolición en la ciudad de Lima durante los meses de enero, febrero y marzo del presente año.
Determine la población, muestra y elemento.
Población
Muestra
10
UPC MA444 Estadística
Elemento
Variables
Una variable es la característica de interés de los elementos. Se representan con las letras
mayúsculas de nuestro alfabeto; por lo general, X, Y, Z.
Tipo de variables
Variable cualitativa
Es la característica cuyos valores no son numéricos. Por ejemplo, carrera universitaria, material de
construcción y tipo de resistencia.
Variable cuantitativa
Es la característica cuyos valores son numéricos. Se dividen en discretas y continuas.
Ejemplo 1
Son variables cuantitativas discretas:
Número de artículos defectuosos producidos diariamente
Número de defectos por barra de acero
Ejemplo 2
Si formulamos la siguiente pregunta al elemento: ¿Cuál es tu programa de televisión preferido?, la
variable en estudio la representamos con una letra mayúscula, por ejemplo, X= Programa de
televisión preferido.
Ejemplo 3
En cada caso, identifique la variable en estudio y su tipo.
¿Cuál es su grado de
instrucción?
¿Cuál es su ingreso
mensual, en soles?
¿Cuántos hermanos
tiene?
¿Cuál es tu año de
nacimiento?
12
UPC MA444 Estadística
Escalas de medición
Las escalas de medición de las variables permiten determinar la cantidad de información que
contienen los datos e indica el resumen de estos y el análisis estadístico más apropiado.
Nominal
Una variable está medida en escala nominal cuando los datos son etiquetas o nombres que se
emplean para definir un atributo del elemento. Por ejemplo: el género de las personas, el estado
civil, el número telefónico, etc.
Ordinal
Una variable está medida en escala ordinal cuando pueden ordenarse de acuerdo con algún criterio.
Se pueden ordenar en forma ascendente o descendente. También, pueden registrarse por medio de
un código numérico. Por ejemplo: el orden de mérito de los alumnos en el curso de estadística, el
grado de instrucción de los clientes de un banco, nivel socioeconómico de los alumnos de la
universidad.
Intervalo
Una variable está medida en escala de intervalo si el cero es relativo, es decir, no indica la ausencia
de la característica medida. Por ejemplo: las temperaturas en grados Celsius o en grados Fahrenheit.
Razón
Una variable está medida en escala de razón si el cero indica la ausencia de característica de la
medida. Por ejemplo: el sueldo de los empleados de una empresa, el peso de los trabajadores.
Ejemplo 1
Complete:
Ejemplo 2
La Corporación Aceros Perú es una empresa que se dedica a la industria del acero. Actualmente, la
empresa está fabricando hierro esponja, palanquillas de acero, barras helicoidales, alambrón y barras
de construcción y tiene una capacidad de 680,000 toneladas al año. Uno de los mercados a los que
más se orientan los productos es el mercado de la construcción de Lima.
El departamento de Control de Calidad está encargado de realizar un estudio sobre las varillas
devueltas a la fábrica. Al seleccionar una muestra aleatoria de 80 barras de aceros de la sección de
devoluciones del almacén, se midieron algunas características de acuerdo con la siguiente ficha
técnica:
Indique la población
Indique la muestra
1. Corporación Domar S.A.C. es una empresa peruana ubicada en la ciudad de Lima con más de ocho
años de experiencia en el sector Industrial. La empresa ejecuta proyectos de instalación de
sistemas mecánicos y electrónicos, además brinda un servicio industrial de mantenimiento
especializado de maquinarias y laboratorios en todas las especialidades de ingeniería. El gerente
del área de servicios quiere convertir a la corporación en una de las empresas con mayor
representatividad, a nivel nacional, en el rubro industrial, por lo que desea evaluar los servicios
brindados durante el último trimestre. Se seleccionaron al azar 22 registros de los servicios
realizados durante el último trimestre. Algunas de las variables registradas se presentan a
continuación:
Población
Población
Muestra
3. Computer es una compañía dedicada a brindar servicios informáticos a empresas que desean
tener una presencia firme y contundente en la red. Esta compañía se dedica al tendido de redes
LAN, instalación de equipos, servidores y toda una gama de productos tecnológicos que puedan
resultar imprescindibles para una empresa.
4. La empresa de investigación de mercados Alpha S.A. realizó un estudio para evaluar el efecto de
la caída de la bolsa de valores de Lima (BVL) en las administradoras de fondos de pensiones (AFP).
En este estudio se tomó una muestra de 300 afiliados entre 25 y 35 años en Lima seleccionados al
azar.
Población
Muestra
Material de la tubería
Año de instalación
Observación
Es el conjunto de datos que se tiene por unidad elemental. Existirán tantas observaciones como
elementos se tengan.
Ejemplo 1
Identifique y complete:
Estadístico
Un estadístico resume una característica de la muestra, para obtener su valor se utiliza la
información muestral. El valor obtenido de un estimador se conoce como estimación. Al estimador se
le llama estadígrafo o estadístico.
Promedio
∑ xi ∑ xi
i=1 i=1
μ= x=
N n
Moda Mo mo
A a
Proporción p= ^p=
N n
Ejemplo 1
Se tiene una población de 30 alumnos del curso de estadística de la sección CI3A. A cada alumno se le
preguntó su edad. Con estos 30 datos se calculó la media y se obtuvo un valor de 19,7 años.
Título
El título de la tabla debe tener la siguiente estructura:
Fuente
Se refiere de dónde se recolectaron los datos para posteriormente ser organizados. Se ubica siempre
en la parte inferior de la tabla.
21
UPC MA444 Estadística
Ejemplo 1
La siguiente información muestra la distribución de una muestra de viviendas de un determinado
distrito de Lima según material con el cual fue construido.
Unidad elemental
f3 = …
p3 = …
Complete los elementos que faltan en cada uno de los gráficos y comente:
80
Axis Title
60
50
45
40
20
0
Access MS Excel MS Power Point MS Word Outlook Otros
Axis Title
Fuente: PC-Review-Perú
Comente el gráfico
23
UPC MA444 Estadística
Chart Title
Otros Access
9% 10%
Outlook
20% MS Excel
20%
Comente el gráfico
24
UPC MA444 Estadística
El jefe del Área de Servicios impulsará paquetes si más del 25% de los clientes que solicitaron un
servicio pertenecen a este rubro.
Gráfico de Pareto
Ejemplo 1
El jefe de control de calidad de la empresa Mundo está interesado en conocer cuáles son las
principales causas que están afectando la producción. Al seleccionar una muestra de 450 artículos
fallados obtuvo los siguientes resultados:
Distribución de …
Causas que afectan la producción Cantidad
Inestabilidad máquina 56
Cambios ambientales 191
Rotura máquina 35
Cansancio operador 11
Desgaste del equipo 3
Desviación del material 5
Fluctuación energía 9
Error de medición 10
Partida fría 8
Rotura de operador 122
Total 450
26
UPC MA444 Estadística
Fuente: Empresa Mundo
Complete el diagrama de Pareto agrupando en la categoría “Otros” a las categorías cuyas frecuencias
absolutas sean de 10 a menos e identifique las principales causas que resuelvan el 80% de los
problemas de producción.
Distribución de …
Causas que afectan la producción fi hi Fi Hi
Cambios ambientales 191 0,424 191 42,4%
Rotura de operador 122 0,271 313 69,6%
Inestabilidad máquina 56 0,124 369 82,0%
Rotura máquina
Cansancio operador
Otros
Total 450 1
Fuente: Empresa Mundo
Chart Title
100.0%
450 92.2% 100%
89.8%
400 82.0%
350 80%
300
60%
250
42.4%
200 191
40%
150 122
100 20%
56
50 35
0 0%
a
.
...
...
r
s
t..
do
in
ro
er
áq
en
Ot
ra
op
m
áq
bi
pe
ad
am
io
eo
c
lid
ra
an
Principal causa
os
tu
bi
ta
Ro
Ca
m
tu
es
Ca
Ro
In
27
UPC MA444 Estadística
Ejercicios propuestos
6. La siguiente tabla muestra información sobre el defecto observado con mayor frecuencia en los
puentes vecinales construidos en estructura de madera en cierta localidad del interior del país:
Pandeos y rajaduras 40
Pudrimiento de las piezas de madera 30
Efectos del desgaste mecánico 20
Otros 5
Deformaciones 15
Ataques de insectos y crustáceos 10
Acción de fuego 5
Fuente: Municipalidad distrital
Elabore el diagrama de Pareto para identificar qué defectos deben priorizarse en este tipo de
puentes.
7. Rex es una empresa con más de 30 años en el mercado y está dedicada a la fabricación de hornos
para la elaboración de ladrillos que requieren altas temperaturas de secado. Estos aparatos
pueden causar daños bastantes considerables a los operarios cuando el horno no está
funcionando correctamente.
Distribución de ...
Principal problema Número de hornos
Condensación precoz 5
Retracciones del mortero 12
Cocción de ladrillos 15
Otros 8
Caliches 9
Exfoliaciones 8
Fuente: Rex S.A.
El departamento de control de calidad tiene por norma priorizar los problemas que resuelvan
alrededor del 80% del total de casos. Sin embargo, si estos problemas son más de tres, dicho
departamento ordenará una revisión total del proceso de producción. Indique lo que hará el
departamento de control de calidad.
28
UPC MA444 Estadística
Distribución de …
Problema observado Número de piezas fabricadas
Recalentamiento 3
Corrosión 6
Rajadura 8
Deformación 9
No cumple estándar 4
Fuente: Metronics S. A.
29
UPC MA444 Estadística
Tabulaciones cruzadas
También llamadas tablas de contingencia o tablas de doble entrada. Se usan para resumir de manera
simultánea los datos de dos variables.
Ejemplo 1
Uno de los requisitos que toda represa debe tener es poder conservar las condiciones de
funcionalidad y de seguridad que permita su utilización a lo largo de su vida útil, sufriendo las
menores incidencias posibles y dando cumplimiento a la legislación de seguridad y mantenimiento
vigentes.
La Confiep sospecha que existe un alto porcentaje de represas de tipo terraplén en mal y muy mal
estado de conservación. De comprobarse que este porcentaje supera el 10%, la represa será
declarada en emergencia. La información de la tabla fue obtenida al término de la inspección de las
represas.
Estado de conservación
Tipo de represa
Bueno Regular Malo Muy Malo Total
Cimiento 16 17 12 12 57
Excavación 5 8 5 11 29
Terraplén 7 9 13 5 34
Total 28 34 30 28 120
Fuente: Confiep
Ejemplo 2
Un estudio realizado por A&C Consultores sobre los tipos de riesgos asociados a las excavaciones de
zanjas y tipo de terreno, arrojó los siguientes resultados en base a una muestra de 500 obras de
construcción.
Distribución de las obras de construcción según tipo de terreno y riesgo más importante
Tipo de riesgo más importante
Tipo de terreno
Atrapamiento Caída de personal Derrumbe Inundaciones Otros Total
Roca blanda 27 66 51 9 25 178
Roca dura 15 53 38 3 9 118
Tierra arcillosa 9 31 17 1 10 68
Tierra fuerte 17 55 36 10 18 136
Total 68 205 142 23 62 500
Fuente: Consultores A&C
Indique el número de obras de construcción cuyo tipo de terreno son de roca dura y presentan riesgo
de derrumbe.
Del total de obras que presentan riesgo de atrapamiento, indique el porcentaje de obras de
construcción son de tierra fuerte.
10.En la siguiente tabla se muestran los resultados obtenidos de un estudio realizado en la ciudad de
Nazca por un grupo de profesionales de la UPC de la facultad de Ingeniería sobre las fallas
estructurales en las edificaciones debido al último sismo que tuvo como epicentro la ciudad de
Nazca.
Construya un diagrama de Pareto para identificar las fallas estructurales que tienen mayor
incidencia en las edificaciones en la ciudad de Ica debido al último sismo mencionado.
33
UPC MA444 Estadística
La variable cuantitativa discreta, además de presentar las frecuencias absolutas y relativas, presenta
dos frecuencias acumuladas. La frecuencia acumulada absoluta representada por Fi y la frecuencia
acumulada relativa representada por Hi.
k fk hk n 1 pk
Total n 1
Fuente: ………
Título
El título de la tabla debe tener la siguiente estructura:
Fuente
Se refiere de dónde se recolectaron los datos para posteriormente ser organizados. Se ubica siempre
en la parte inferior de la tabla.
34
UPC MA444 Estadística
35
UPC MA444 Estadística
Ejemplo 1
Corporación Domar S.A.C. es una empresa peruana ubicada en la ciudad de Lima. El gerente de
servicios desea evaluar el servicio brindado durante el primer trimestre del año, para ello seleccionó
al azar 22 registros de servicios realizados en dicho periodo. Para lograr una mayor
representatividad, se requiere que el número de ingenieros necesarios para realizar un servicio debe
ser como máximo 6, esto es por criterio de optimización del personal especializado. Si más del 15%
de los servicios se realizaron con más de 6 ingenieros, entonces el gerente sancionará al jefe de
personal. ¿Qué decisión tomará? La data se presenta a continuación:
Solución
25%
20% 18.2%
10%
5%
0%
2.5 3 3.5 4 4.5 5 5.5 6 6.5 7 7.5
Se observa que en el 13,6% de los servicios realizados participaron más de 6 ingenieros y de acuerdo
a la condición, el gerente del área de servicios no sancionará al jefe de personal.
37
UPC MA444 Estadística
Ejemplo 2
A continuación, se presenta el gráfico de bastones para la variable <número de capacitaciones
realizadas durante el último semestre del año>, obtenida a partir de una muestra de trabajadores de
una determinada empresa de cemento ubicada en la ciudad de Lima. En base al siguiente gráfico
identifique:
60 54 52
49
50
40
30
20 16
8 6
10
0
0 1 2 3 4 5 6
Número de capacitaciones
Fuente: Empresa de Cemento A
Interprete el gráfico
38
UPC MA444 Estadística
Ejercicios propuestos
0 0 0 0 1 1 1 1 1 1 1 1 2 2 2
2 2 2 2 2 2 2 3 3 3 3 3 3 4 4
Variable en estudio
Unidad elemental
Interprete un dato
Distribución de ……
Número de faltas fi hi Fi Hi
0 4 4
1 8 12
2 10 22
3 28
4 30
Total
Fuente: Empresa A
Si el gerente de Rex encuentra al menos un ladrillo defectuoso, en más de 40 días, deberá revisar
su sistema de fabricación.
13.El gerente de la empresa Líder S.A. solicita al jefe del Departamento de Ingeniería realizar una
investigación de las obras que fueron atendidas por la empresa el periodo anterior. Para la
realización del estudio, seleccionó aleatoriamente una muestra de 160 obras de construcción
atendidas el año pasado. La gerencia decidirá adquirir más camiones mezcladores, para las obras
de construcción, si el porcentaje de obras en el que se utiliza mínimo tres camiones para el
traslado del concreto armado premezclado supera el 55%. Indique lo que hará la empresa.
50 45
40
30 25
20 15
10 10
10
0
0 1 2 3 4 5 6 7
Número de camiones
Fuente: Empresa Líder S.A.
3 4 3 3 1 4 1 3 2 3
1 1 4 2 3 3 2 6 1 1
3 3 2 2 2 2 1 3 2 1
6 3 1 2 2 3 2 2 4 2
k =1+3,322 log 10 n
R
w=
k
El valor de w debe tener el mismo número de cifras decimales que tienen los datos y se
redondea por exceso.
Calcular las frecuencias absolutas y relativas con sus respectivas frecuencias acumuladas.
Ejemplo 1
Corporación Domar S.A.C. es una empresa peruana ubicada en la ciudad de Lima. El gerente de
servicios desea evaluar el servicio brindado durante el primer trimestre del año, para ello seleccionó
al azar 22 registros de servicios realizados en dicho periodo. La data se presenta a continuación:
La meta del gerente del área de servicios es que menos del 38% de los servicios tengan
precios netos hasta 29200 soles. De llegar a cumplirse la meta, el gerente será reconocido
con una bonificación especial por parte del directorio.
Solución
Se pide determinar el porcentaje de servicios realizados cuyos precios netos sean como
máximo 29200 soles; por lo tanto, se debe realizar la tabla de distribución de frecuencias y
adicionalmente el histograma.
15,4
w= =3,08
5
Los datos tienen dos decimales; por lo tanto, w se redondea por exceso a un decimal, luego, el
valor de w es 3,1
porcentaje de servicios
30% 27.30%
25%
20% 18.20%
15% 13.60%
10% 9.10%
5%
0%
[23.0-26.1] ]26.1-29.2] ]29.2-32.3] ]32.3-35.4] ]35.4-38.5]
precio neto
Fuente: Corporación Domar S.A.C.
Se observa que el 36,4% de los servicios tienen precios netos menores o iguales a 29200
soles. Por lo tanto, el gerente será reconocido con una bonificación especial por parte del
directorio de la Corporación Domar S.A.C.
Ejemplo 2
Se ha llevado a cabo un estudio para evaluar el tiempo, en horas, que utiliza cada trabajador de una
planta hidroeléctrica para verificar el normal funcionamiento de la tubería de presión y las válvulas
de control. Para ello se eligieron al azar 30 de ellos.
0,08 0,15 0,19 0,71 0,75 0,82 0,84 0,92 0,96 1,16 1,17 1,19 1,23 1,4 1,47
1,59 1,61 2,01 2,16 2,38 2,42 3,07 3,22 3,53 3,76 3,94 4,5 4,59 4,75 5,41
Título: …
i Intervalo X´i fi hi Fi Hi
1 [0,08 – 0,97]
2 ]0,97 – 1,86]
3 ]1,86 – 2,75]
4 ]2,75- 3,64]
5 ]3,64 – 4,53]
6 ]4,53 – 5,42]
Fuente: ……………………
f2
h2(%)
F4
H4(%)
Ejemplo 3
Use la regla de Sturges para construir la tabla de distribución de frecuencias del monto de venta
diario, en cientos de soles, de la empresa Beta Systems S.A.
52,0 94,7 95,1 97,5 102,5 104,1 106,0 125,2 125,6 146,0
146,8 158,6 158,7 162,6 166,2 166,2 166,2 166,2 168,2 169,7
196,0 204,9 204,9 204,9 204,9 208,3 215,2 217,5 218,1 218,1
218,1 218,1 220,9 226,2 235,0 239,7 242,2 259,6 261,6 277,2
286,5 287,0 297,8 313,9 315,0 316,2 338,6 359,9 363,1 398,3
Identifique.
Elemento
Variable en estudio
46
UPC MA444 Estadística
Título: …
Intervalo X´i fi hi Fi Hi
Fuente: …
f2
h3(%)
F4
H2(%)
47
UPC MA444 Estadística
Gráficos de una variable cuantitativa continua
Son gráficas que representan las observaciones obtenidas de la variable cuantitativa continua. Se
pueden realizar con las fi o pi. Como todo gráfico los elementos son: el título principal, título de los
ejes X e Y, etiquetas y fuente.
Los siguientes gráficos se han obtenido con los datos del ejemplo 2 y usando el software MINITAB.
Histograma
Es una gráfica de barras cuyos valores del eje X son los intervalos de clase. Además, la altura de las
barras está determinada por las frecuencias relativas de los intervalos de clase. Según el interés del
estudio se pueden considerar también, las frecuencias absolutas.
Polígono
Es una gráfica donde los valores del eje X son las marcas de clase.
Para cerrar el polígono se debe aplicar el siguiente artificio: restar a la primera marca de clase el valor
de la amplitud y sumar a la última marca de clase el valor de la amplitud.
Según sea el interés del estudio se pueden considerar las frecuencias absolutas o porcentuales.
48
UPC MA444 Estadística
Ojiva
Es una gráfica donde los valores del eje X son los límites superiores.
Es una gráfica creciente a la que debe aplicarse el siguiente artificio: El primer valor del eje X es el
dato más pequeño del conjunto de datos o valor mínimo o valor del primer límite inferior.
Según el interés del estudio se pueden considerar las frecuencias absolutas o relativas.
49
UPC MA444 Estadística
Ejercicios propuestos
15.El jefe del Área de Operaciones de Tricon S.A. aplicará una mejora continua en la distribución del
concreto premezclado a las obras, debido a las constantes quejas de los clientes respecto al
tiempo de llegada de los camiones a la obra desde la planta de Los Olivos. Tomará tal decisión si
más del 30% de los camiones llegan después de los 39,5 minutos a la obra.
19,1 20,0 23,9 26,1 26,5 27,9 30,1 30,8 32,9 34,7
36,1 36,5 36,6 37,5 38,4 39,3 43,7 44,2 44,6 45,1
46,1 46,3 48,8 51,3 52,7 52,9 53,0 55,0 57,3 59,6
16.Corporación Domar es una empresa peruana ubicada en la ciudad de Lima con más de ocho años
de experiencia en el sector Industrial. La empresa ejecuta proyectos de instalación de sistemas
mecánicos y electrónicos, además brinda un servicio industrial de mantenimiento especializado
de maquinarias y laboratorios en todas las especialidades de ingeniería. Debido a las expectativas
de las utilidades del último trimestre, la meta del gerente del área de servicios es que por lo
menos el 40% de servicios tengan precios netos por el servicio mayores a 33 900 soles. De llegar a
cumplir la meta, el gerente será reconocido con una bonificación por parte del directorio. ¿Cuál
será la decisión del directorio? Los registros del último trimestre se presentan a continuación:
Fuente: Empresa A
51
UPC MA444 Estadística
Para tomar decisiones, la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima
realizó un estudio de riesgo de construcción de viviendas en el mes pasado, para ello se
seleccionaron 200 viviendas ubicadas en las laderas de los cerros de Lima Metropolitana.
En el estudio se presentaron las siguientes situaciones para tomar las decisiones adecuadas:
Situación 1
Determinar si se brindará asistencia técnica a las viviendas.
Para ello se evaluaron 24 viviendas seleccionadas al azar con dichas características. La información
obtenida se muestra a continuación:
6 6 6
6
5
4
4
3
2
2
1
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
¿Qué decisión tomará la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima?
El analista del departamento de gestión del riesgo de desastres de la Municipalidad de Lima desea
realizar un estudio completo de materia orgánica en las laderas de los cerros que tienen suelo
arenoso. Para ello es importante evaluar la capacidad de intercambio catiónico (CIC). Para el estudio
se tomó información del CIC de una muestra de 80 viviendas con suelo arenoso. El analista decidirá
realizar el estudio completo, si más del 18% de estas viviendas registran un CIC mayor a 41,48
meq/100 gr. A continuación, se presenta la siguiente información:
¿El analista del departamento de gestión de riesgos de desastres realizará el estudio completo?
Definiciones
Parámetro
Es una medida de resumen que caracteriza a la población. Para obtener su valor se hace necesario
contar con toda la información que brinda los elementos de una población. Por ejemplo, la media
poblacional μ, varianza poblacional σ 2.
Estadístico
Es una medida de resumen que caracteriza a la muestra. Para obtener su valor se utiliza la
información muestral. A los valores obtenidos de un estimador se conoce como estimación.
Media
∑ xi ∑ xi
i=1 i=1
μ= x=
N n
N N
Varianza
∑ ( xi −μ )2 ∑ ( x i−x )2
σ 2= i=1 s2= i=1
N n−1
Desviación estándar σ s
Media aritmética
La media llamada también promedio, se define como el cociente de la suma de los valores
observados de la variable en estudio y el número de observaciones.
Características de la media
Se puede calcular para variables de escala intervalo o razón.
La mayor desventaja es que se ve afectado por valores extremos; es decir si hay valores muy
pequeños o grandes, la media no los representaría adecuadamente.
Cálculo de la media
∑ xi
i=1
μ=
N
∑ xi
x= i=1
n
∑ f i xi
i=1
x=
n
∑ f i x ´i
i=1
x=
n
15,2 15,8 16,2 18,5 19,4 20,6 21,2 21,9 25,4 27,3 28,3 29,5 32,5 33,7 36,9
Solución
N
La fórmula es:
∑ xi
x= i=1
n
Interpretación
Ejemplo 2
Calcule e interprete la media para el número de hijos obtenida a partir de una muestra de 35
familias.
Ejemplo 3
Calcule el tiempo promedio de verificación, en horas, para una muestra de trabajadores e interprete.
Para tomar decisiones, la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima
realizó el mes pasado un estudio de riesgo de construcción de viviendas, para ello se seleccionaron
200 viviendas ubicadas en las laderas de los cerros de Lima Metropolitana.
Situación 1
Determinar si se brindará asistencia técnica a las viviendas.
La gerencia de gestión del riesgo de desastres de la Municipalidad de Lima brindará asistencia técnica
a las viviendas ubicadas en la zona alta de Lima con riesgo de cimientos siempre y cuando el número
promedio de pisos por vivienda sea mayor a dos. Para ello se evaluaron 24 viviendas seleccionadas al
azar con dichas características. La información obtenida se muestra a continuación:
7
6 6 6
6
5
4
4
3
2
2
1
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Número de pisos
Fuente: Municipalidad de Lima
¿Qué decisión tomara la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima?
El analista del departamento de gestión del riesgo de desastres de la Municipalidad de Lima desea
realizar un estudio completo de materia orgánica en las laderas de los cerros que tienen suelo
arenoso. Para ello es importante evaluar la capacidad de intercambio catiónico (CIC).
Para el estudio se tomó información del CIC de una muestra de 80 viviendas con suelo arenoso. El
analista decidirá hacer el estudio completo, si el CIC promedio supera el valor de 25 meq/100 gr. A
continuación, se presenta la siguiente información:
Distribución de ………
Intervalos Marca de clase fi hi Fi Hi
18,36 24,14 21,25 12 0,1500 12 0,1500
24,14 29,92 27,03 0,1875 27 0,3375
29,92 35,70 32,81 20 0,2500 47 0,5875
35,70 38,59 18 0,2250 65 0,8125
47,26 44,37 10 75 0,9375
47,26 53,04 50,15 5 0,0625 80 1,0000
Fuente: Municipalidad de Lima
¿El analista del departamento de gestión del riesgo de desastres realizará el estudio completo?
Mediana
Es el valor que ocupa el lugar central de un conjunto de datos ordenados. Por tanto, es el valor que
divide en dos partes a dicho conjunto de datos.
Características de la mediana
[ ]
n
2
+1 .
Ejemplo 1
Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje (en voltios) se
muestran a continuación:
10,00 10,05 10,12 10,26 25,00 9,84 9,96 9,98 9,99 10,00
Solución
Primero ordenamos los datos.
9,84 9,96 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00
x n +x
me=
[] [ ]
2
n
2
+1
2
61
UPC MA444 Estadística
Reemplazando los valores.
x 10 + x 10
2 2
+1 x 5+ x 6 10+10
me= = = =10
2 2 2
Ejemplo 2
Los siguientes datos corresponden a la distribución del número de piezas defectuosas producidas en
una muestra de 150 días. Calcule e interprete el valor de la mediana.
Moda
La moda de un conjunto de datos es aquel valor que se repite con mayor frecuencia.
Características de la moda
Ejemplo 1
Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje se presentan a
continuación:
9,84 9,89 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00
Interpretación
La lectura de voltaje más frecuente es de 10 voltios.
La lectura de voltaje que se repite con mayor frecuencia es 10 voltios.
Ejemplo 2
Renacer S.A. es una empresa que fabrica hornos microondas. La gerencia encargó al jefe de control
de calidad informar cuál es el problema más frecuente encontrado en la fabricación de estos
aparatos. Para dar respuesta a la consulta, se tomó una muestra de equipos del área de
reparaciones. Los resultados se presentan en la siguiente tabla:
Cuartil
Divide al conjunto de datos en cuatro partes porcentualmente iguales. Se denotan Q1, Q2 y Q3 que son
los correspondientes percentiles P25, P50 y P75.
Decil
Divide al conjunto de datos en diez partes porcentualmente iguales. Hay nueve deciles D1, D2, …, D9
que son los correspondientes percentiles P10 , P20, …, y P90 .
Percentil
Divide un conjunto de datos en 100 partes porcentualmente iguales. Dado un percentil Pk, este divide
el conjunto de datos en dos partes, la inferior que contiene el k% de datos y la superior que contiene
el (100 – k)% de datos.
Pk
Calcular el valor de la posición que ocupa el percentil Pk en la lista de datos ordenados que está
determinada por la siguiente expresión:
k ( n+1 )
i= =E , d
100
Luego,
Pk = X [ E ] +0 , d ( X [ E +1] − X [ E] )
64
UPC MA444 Estadística
Ejemplo 1
Suponga que los promedios ponderados de una muestra de 12 ingenieros civiles egresados se
muestran a continuación:
14,5 15,5 15,5 16,1 16,2 16,4 16,5 17,0 17,1 17,3 17,5 17,6
b. Si se desea contratar a un egresado que pertenezca al quinto superior, ¿qué percentil debe
calcular y cuál es la nota mínima que debería de tener?
65
UPC MA444 Estadística
Ejemplo 2
Una muestra de 30 trabajadores de una plataforma petrolera marina formó parte de un ejercicio de
escape del área. Para ello se registraron los tiempos, en minutos, empleados en la evacuación.
31,5 32,5 32,5 33,4 33,9 34,0 35,6 35,6 35,9 35,9
36,3 36,4 36,9 37,0 37,3 37,3 37,4 37,5 38,0 38,9
39,2 39,3 39,4 39,7 40,2 40,3 41,5 42,4 42,8 44,5
a. ¿Cuál es el tiempo mínimo registrado por el 18% de trabajadores que emplearon más tiempo en
la evacuación de la plataforma?
b. ¿Cuál es tiempo máximo empleado por el 28% de trabajadores que emplearon menos tiempo en
la evacuación de la plataforma?
66
UPC MA444 Estadística
Ejemplo 3
Investigadores del Massachussets Institute of Technology (MIT) realizaron el 9 de abril de 1993 un
estudio sobre asteroides. Al observar 39 de estos asteroides con el telescopio Hiltner del
observatorio de MIT; se registró el número de exposiciones de imagen espectral.
Título: ……………………………………………………………………………………………………………………………..
Número de exposiciones fi hi Fi Hi
1
2
3
4
6
Total
b. Indique el mínimo número de exposiciones obtenidos en el 15% de los asteroides con mayores
exposiciones. Además, indique a qué percentil corresponde.
c. Se desea categorizar a los asteroides según su número de exposiciones en categorías baja, media
y alta. ¿Cuáles serán los límites de las categorías si la categoría media contiene al 50% central de
la cantidad de asteroides?
67
UPC MA444 Estadística
Medidas de variación o dispersión
Son aquellas que cuantifican que tan dispersos o concentrados se encuentran los datos respecto de
una medida de tendencia central. Los datos que están relativamente cercanos entre sí tienen bajas
medidas de variabilidad, mientras que los que están más alejados entre sí tienen medidas de
variación más grandes.
Varianza
Es una medida del grado de dispersión o variación de los valores de una variable con respecto a su
media aritmética.
Las unidades en las que queda expresada la varianza son unidades al cuadrado.
Esta medida no tiene interpretación.
La notación de la varianza de una muestra es s2, mientras que la de una población es σ 2.
Cálculo de la varianza
∑ ( xi −μ )2
2 i=1
σ =
N
∑ ( x i−x )2
2 i=1
s=
n−1
∑ f i ( x i−x )2
s2= i=1
n−1
∑ f i ( x'i −x )
2
s2= i=1
n−1
Desviación estándar
La desviación estándar es la raíz cuadrada positiva de la varianza
Se denota por si la desviación estándar es poblacional (parámetro) y por s si la desviación
estándar es muestral (estadístico).
68
UPC MA444 Estadística
Las unidades de la desviación estándar son las mismas unidades de la variable. Por ejemplo, si la
variable tiene unidades centímetros, entonces, la desviación estándar tendrá como unidades
centímetros.
√
N
∑ ( xi −μ )2
i=1
σ=
N
√
n
∑ ( x i−x )2
i=1
s=
n−1
√
n
∑ f i ( x i−x )2
i=1
s=
n−1
√
n
∑ f i ( x 'i−x )2
i=1
s=
n−1
Ejemplo 1
Calcule la varianza y la desviación estándar para la cantidad de plomo en una muestra de agua
potable en miligramos por litro.
35 73 30 15 36 60 47 19 15 38 10 35 31 21 22 20
69
UPC MA444 Estadística
Ejemplo 2
Calcule la varianza y desviación estándar del número de accidentes automovilísticos en una muestra
de 100 días.
Ejemplo 3
Calcule la varianza y desviación estándar de los tiempos de exposición, en minutos, de un metal a
una sustancia química. Los resultados de una muestra de 66 reacciones son las siguientes:
Coeficiente de variación
Las medidas de variación estudiadas son medidas de variación absolutas pues estas se expresan en
las mismas unidades que la variable original (excepto la varianza que se expresa en unidades al
cuadrado).
σ
CV = × 100 %
μ
s
CV = ×100 %
x
Ejemplo 1
A continuación, se presentan los tiempos de transmisión de un archivo, en segundos, evaluados en
una muestra de empresas que adoptaron la tecnología WAN y la tecnología LAN bajo condiciones
similares.
71
UPC MA444 Estadística
Tiempo de transmisión de un archivo con tecnología WAN
138 126 125 124 119 119 137 110 119 155 123 124 126 126 129
Determine para qué tipo de tecnología utilizada los tiempos de transmisión de datos son más
homogéneos. Justifique numéricamente su respuesta.
Promedio
Desviación estándar
Coeficiente de variación
Interpretación
La tecnología que presenta los tiempos de transmisión de datos más homogéneos es ……………
72
UPC MA444 Estadística
Ejercicios propuestos
18.Electro, empresa dedicada a la venta de artefactos electrónicos para el hogar cuenta con tres
tiendas A, B y C. Los últimos informes indican que las ventas de cierto producto electrónico han
descendido. El gerente, con el fin de enfrentar el problema, ha determinado que es necesario un
estudio estadístico de las ventas semanales de este producto, en miles de soles. A continuación,
se presentan los resultados obtenidos para cada tienda:
Media
Desviación estándar
b. Determine en cuál de las tiendas las ventas realizadas son más homogéneas.
Para ello, se tomaron muestras aleatorias en ambas plantas y la información registrada acerca de
la resistencia a la tracción (en kg/cm2) se muestra en las siguientes tablas:
Realice el análisis adecuado para la dispersión y responda ¿qué planta es más heterogénea en las
resistencias a la tracción? Sustente su respuesta estadísticamente.
Promedio
Desviación estándar
Coeficiente de variación
21.Las represas constituyen una de las principales causas directas e indirectas de contaminación
ambiental. Una de estas causas es la filtración de sustancias contaminantes originando el
debilitamiento de la densidad de la superficie en la cual está construida la represa. Los resultados
que Andino S.A. obtuvo sobre las densidades de los terrenos, en gr/cm 3 en represas calificadas
con impacto ambiental regular y en represas con impacto ambiental fuerte se presentan a
continuación:
75
UPC MA444 Estadística
Densidad del terreno, en gr/cm3, en represas con impacto ambiental regular
15,2 20,7 16,6 22,7 35,6 17,1 25,2 26,6 10,4 23,6
10
10
Cantidad de represas
8
7 7
6
5
4
3
2
2
1
0
5.5 9.8 14.1 18.4 22.7 27 31.3 35.635.6
Para que una represa siga funcionando, la Confiep establece el cumplimiento de dos condiciones:
Condición 1: La densidad promedio del terreno con impacto ambiental (regular o fuerte)
donde se ubica la represa debe ser por lo menos 17,5 gr/cm 3 para que ésta no se derrumbe.
Condición 2: La densidad del terreno donde se ubica la represa con impacto ambiental (regular
o fuerte) debe tener una variabilidad relativa de a lo más 34%.
Verifique las condiciones de tal manera que pueda presentar un informe que ayude a identificar
qué tipo de represa (con impacto ambiental fuerte o regular) está habilitada para su normal
funcionamiento.
76
UPC MA444 Estadística
Medida de asimetría
Ejemplo 1
Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una
concentración de datos en los valores ………
Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
concentración de datos en los valores ………
En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de
asimetría …………, porque …………
En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente
tienen un coeficiente de asimetría ……………, porque …………………
77
UPC MA444 Estadística
Ejemplo 2
Comasa es una empresa que produce artículos pesados de acero y dispone de un equipo
especializado de operarios que se capacitan constantemente. El último año se ha observado un
aumento en el número de accidentes, incrementándose así el costo de atención inmediata. Con el
propósito de implementar estrategias de prevención de accidentes, se analizarán los costos de la
planta de producción de Lima Sur. A continuación, se presenta la información, en miles de soles:
8 9 10 11 11 12 12 13 13 13 13 14
14 15 15 16 17 17 18 18 19 19 20 21
22 23 24 25 25 26 27 28 28 29 30
22.Covisa es una empresa de construcción civil que compra ladrillos al proveedor Fax S.A. Para
continuar con el proveedor o cambiarlo, ha decidido realizar un análisis de la resistencia
transversal de los ladrillos, en Mn/m2.
3 4 4 4 5 5 6 6 6 7
8 8 8 8 8 9 9 9 10 11
11 11 11 11 11 12 12 12 12 13
13 13 14 15 15 17 17 18 19 20
0,045 0,036 0,045 0,049 0,064 0,07 0,079 0,088 0,091 0,118 0,13 0,136
0,136 0,136 0,145 0,179 0,182 0,182 0,194 0,209 0,209 0,227 0,242 0,258
0,258 0,258 0,291 0,327 0,333 0,336 0,361 0,379 0,394 0,412 0,445 0,506
0,554 0,567 0,579 0,600 0,67 0,912 1,055 1,07 1,267 1,639 1,894 3,046
3,888 3,985 4,170 8,788
Se desea categorizar a los problemas según sus tiempos de resolución en categorías normal,
media y alta ¿Cuáles serán los límites de cada una de ellas si la categoría media contiene al 50%
central de la cantidad de problemas?
25.A continuación, se presenta al número de camiones que atendió la planta de Lurín en cada obra
con el objetivo de evaluar indicadores en las atenciones que realiza la planta de Lurín.
80
UPC MA444 Estadística
14
12 11
Número de obras
10 9
8 7
6
6
4
4 3
2
0
0 1 2 3 4 5 6 7 8
Número de camiones
Fuente: Planta de Lurín
26.Cuando se diseña un puente los ingenieros deben determinar la tensión que el concreto puede
soportar. En lugar de probar cada pulgada cúbica de concreto para determinar su capacidad de
resistencia, los ingenieros toman una muestra, la prueban y llegan a la conclusión sobre qué tanta
tensión, en promedio, puede resistir este tipo de concreto. A continuación, se presenta la tensión
(en kg/cm2) obtenidos de una muestra de 30 bloques de concreto que se utilizarán para construir
un puente.
1,2 2,1 2,2 2,2 2,5 2,5 2,6 2,6 2,7 2,8
3,0 3,0 3,2 3,2 3,2 3,4 3,4 3,5 3,5 3,6
3,6 3,6 3,6 3,7 3,8 3,9 3,9 4,0 4,0 4,0
471,13 472,19 476,25 477,32 478,52 481,02 490,65 496,66 497,66 498,40
502,77 504,44 503,78 506,14 512,88 515,06 516,23 516,89 523,45 523,78
Situación 1
Determinar si la nueva máquina llena las cajas de avena en hojuelas de acuerdo con la especificación
técnica.
La especificación técnica indica que el 90% central de las cajas de avena en hojuelas deben tener un
peso entre 480 y 520 gramos. El gerente de control de calidad sospecha que el peso de la caja no
está cumpliendo con la especificación técnica, y de ser así, significaría que la nueva máquina, al
momento de ser instalada, no fue calibrada correctamente.
Situación 2
Determinar qué proceso de producción tiene mayor variabilidad.
Nota: Para el caso del proceso de llenado de la caja utilice los cálculos hechos para la situación 1.
Logro
Al terminar la unidad, el estudiante utiliza las distribuciones de probabilidad para modelar variables
dentro de situaciones de incertidumbre en contextos reales
Temario
Probabilidad: concepto. Experimento aleatorio, espacio muestral y evento
Operaciones con eventos
Probabilidad condicional
Probabilidad total. Teorema de Bayes.
Eventos independientes
Variable aleatoria. Valor esperado y desviación estándar
Distribución de probabilidad de una variable discreta: binomial y Poisson
Distribución de densidad de una variable continua: normal y exponencial
Bibliografía
Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 4.1 (pág. 124-
126) Capítulo 4.5 (pág. 139-143)
Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 4.7 (pág. 152-
166)
Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 6.1 (pág. 211)
Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 6.1 (pág. 213)
84
UPC MA444 Estadística
Definiciones
Experimento aleatorio
Es una operación cuyo resultado no se puede predecir con certeza y que se realiza bajo las siguientes
condiciones:
Se puede repetir indefinidamente donde los resultados dependen del azar, por lo que no se
pueden predecir con certeza.
Se puede describir el conjunto de todos los resultados posibles.
Cuando se repite un gran número de veces, aparece un modelo definido de regularidad.
Ejemplo 1
Espacio muestral
Es el conjunto de todos los posibles resultados de un experimento aleatorio. Cada elemento de este
conjunto se le denomina punto muestral y se le denota con w .
Ejemplo 2
❑1={1 , 2 ,3 , 4 ,5 , 6 }
❑2={cc , cs , sc , ss }
❑3={defectuoso , no defectuoso }
❑4={t /t ≥ 0}
Evento
Es todo subconjunto del espacio muestral y representa cierta característica de ella. Se denotan
mediante las letras mayúscula de nuestro alfabeto, como por ejemplo A, B o C.
Evento simple
En un evento formado por un sólo un punto muestral. No se puede descomponer.
Ejemplo 3
Evento compuesto
En un evento formado por más de un punto muestral.
Ejemplo 4
Si 1= {1, 2, 3, 4, 5, 6}, entonces A = {1, 3, 5} o A:= obtener un número impar es un evento
compuesto.
Si 2= {cc, cs, sc, ss}, entonces B= {cs, sc} o B:= obtener dos valores diferentes en las caras superiores
de las dos monedas es un evento compuesto.
Unión
La unión de dos eventos A y B es el evento que ocurre si A o B, o ambos ocurren en una sola
realización del experimento.
Ejemplo 1
Solución
El espacio muestral es:
¿ {1 , 2 ,3 , 4 ,5 , 6 }
Los eventos A y B son:
A={1 , 2, 3 , 4 }
B= {2 , 4 ,6 }
Solución
Ejemplo 2
Ejemplo 3
b. Sean los eventos: A: suma de los dados es ocho; B: suma de los dados mayor a seis y C: suma de
los dados menor a nueve. Determine los elementos de los eventos.
c. Obtenga la intersección de los eventos A y B, la unión de los eventos B y C ¿Son los eventos A y C
mutuamente excluyentes?
88
UPC MA444 Estadística
89
UPC MA444 Estadística
Probabilidad
Sea un experimento aleatorio, el espacio muestral asociado y sea A un evento definido en el
espacio muestral .
La probabilidad del evento A es la medida del grado de posibilidad de ocurrencia del evento A
cuando se realiza una vez el experimento.
Axiomas de probabilidad
0 ≤ P(A )≤ 1
P( )=1
Sean los eventos { Ai }, Ai ∈, i=1 , 2, 3 , … , n una sucesión de eventos mutuamente excluyentes,
entonces:
n
P( A1 ∪ A 2 ∪ A 3 ∪ … ∪ An )=∑ P ( Ai )
i=1
Además,
Si P( A) tiende a 0 es poco probable que el evento A ocurra.
Si P( A) tiende a 1 es un muy probable que el evento A ocurra.
En un espacio muestral finito, la suma de las probabilidades de todos los eventos simples Ei es
igual a 1.
n
∑ P( Ei)=1, i=1 , 2 ,3 , … , k
i=1
Sea un experimento aleatorio cuyo correspondiente espacio muestral está formado por un
número n finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces
definimos la probabilidad de un evento A como sigue:
n(A) ❑
= {1, 2, 3, 4, 5, 6} A = 3, 5 P ( A )= =
n( ) ❑
Eventos complementarios
c
A ∪ A =¿
Ac
A
c
P( A)+ P( A )=1
A B
(AUB)c
Ejemplo 1
Solución
P ( E∪ M ) =P ( E )+ P ( M )−P ( E ∩ M )
Reemplazando valores:
0,39=0,24+ 0,18−P( E M )
P(E ∩ M )=0,03
E M
0,61
b. ¿Cuál es la probabilidad de que el accidente se haya producido por solo un tipo de falla?
Solución
93
UPC MA444 Estadística
La probabilidad pedida es:
P ( E ∩ M c ) =P ( E )−P ( E ∩ M )=0,24−0,03=0,21
P ( E ∩ M ) =P ( M ) −P ( E ∩ M )=0,18−0,03=0,15
c
P( E ∩ M c )+ P(E c ∩ M )=0,21+0,15=0,36
E M
0,61
Ejemplo 2
Solución
Solución
Definamos el evento I :=¿ que una refrigeradora tenga imperfecciones en la pintura.
Ω={( I , I , I ) ; ( I c , I , I ) ; ( I , I c , I ) ; ( I , I , I c ) ; ( I , I c , I c ) ; ; ( I c , I , I c ) ; ( I c , I c , I ) ; ( I c , I c , I c ) }
b. Calcule la probabilidad de que las tres refrigeradoras compradas por el comerciante no presenten
imperfecciones de pintura.
Solución
7 3
C 3 ×C 0
P( B)= 10
=0,2917
C3
Solución
P ( C ) =1−P ( C ) =1−0,2917=0,7083
c
Ejemplo 3
Solución
5A
6B
4C
N = 15 n=3
95
UPC MA444 Estadística
F :=¿ seleccionar una computadora de la marca A, una de la marca B y una de la marca C.
5 6 4
C 1 × C 1 ×C 1
P( F)= 15
=0,2637
C3
Solución
5 6 4
C2 ×C 1 × C0
P ( D )= 15
=0,1319
C3
Solución
Definamos el evento necesario.
6 9
C 0 ×C 3
P ( E )=1−P ( E )= c
15
=0,8154
C3
Ejemplo 4
Dos vendedores de seguros trabajan en la empresa Pacifico. La probabilidad de que el vendedor más
viejo llegue tarde cierto día es 0,20, de que el vendedor más joven llegue tarde cierto día es 0,15 y
que ambos lleguen tarde es 0,09.
a. Determine la probabilidad de que al menos un vendedor llegue tarde al trabajo cierto día.
Solución
P ( A ∩ B )=0,09
A B
0,74
6
La probabilidad de que al menos un vendedor llegue tarde al trabajo cierto día es la probabilidad
de la unión de A con B, por lo tanto:
P ( A ∪ B ) =0,20+0,15−0,09=0,26
A B
P ( ( A ∩ B ) ∪ ( A ∩ B ) ) =P ( A ∩ B ) + P ( A ∩ B ) =0,11+0,06=0,17
c c c c
c. Determine la probabilidad de alguno de los vendedores no llegue tarde al trabajo cierto día.
Solución
La probabilidad pedida es:
97
UPC MA444 Estadística
c c
P( A ∩ B )=1−P( A ∩ B)=1−0,09=0,91
Usando los diagramas de Venn tendremos:
A B
Ejemplo 5
b. ¿Cuál es la probabilidad de que se haya producido solo uno de los tipos de defectos?
❑1={1 , 2 ,3 , 4 ,5 , 6 }
2: números pares de tres cifras que se pueden formar con los dígitos 1, 2, 3, 4, 5, 6, 7, 8, 9
Observamos que ya no es fácil listar y contar los posibles resultados, ante esta situación es necesario
utilizar técnicas que nos faciliten el conteo de estos posibles resultados.
Principio de la multiplicación
Si un procedimiento A puede realizarse de m maneras y otro procedimiento B puede realizarse de n
maneras, entonces los dos procedimientos A y B (uno seguido del otro) ocurren de m× n maneras o
formas.
Ejemplo 1
Principio de la adición
Si un procedimiento A puede realizarse de m maneras y otro procedimiento B puede realizarse de n
maneras, y si no es posible que ambos se realicen en forma simultánea entonces los dos
procedimientos A o B ocurren de m+n maneras o formas.
Ejemplo 1
Solución
Definamos los eventos:
n ( L )=n ( C ) +n ( E )=40+50=90
Ejemplo 2
Un ingeniero de telecomunicaciones está proyectando un viaje a una provincia para instalar una
antena parabólica, debe decidir el viaje por bus o por tren. Si hay tres rutas para el bus y dos para el
tren ¿de cuántas maneras posibles puede realizar el viaje?
101
UPC MA444 Estadística
Es una técnica que permite contar el número de maneras de seleccionar o elegir aleatoriamente r
elementos de un total de n , sin considerar el orden de selección. Está dado por:
n!
C nr =
r ! ( n−r ) !
Ejemplo 1
Una empresa ha decidido que, para el trabajo remoto de su personal, tres de los 15 trabajadores del
área de Recursos Humanos deben asistir de manera presencial a la empresa, ¿de cuántas maneras
puede seleccionar al grupo?
Solución
Definamos el evento necesario:
C :=¿ elegir tres de los de los 15 trabajadores del área de Recursos Humanos para que asistan de
manera presencial a la empresa.
15 15 !
n ( C )=C 3 = =455
3 ! ( 15−3 ) !
Ejemplo 2
Solución
n ( A ) =C20 15 10
6 +C 6 +C 6 =43 975
102
UPC MA444 Estadística
Ejemplo 3
Ejemplo 4
De un grupo de ocho pequeñas empresas se sabe que dos no cumplen con sus obligaciones
tributarias. La Sunat revisará el cumplimiento de los tributos de todas las pequeñas empresas si al
seleccionar tres empresas, la probabilidad de que por lo menos una no cumple con sus obligaciones
tributarias sea superior a 0,62 ¿Qué le recomendaría usted a la Sunat?
103
UPC MA444 Estadística
Probabilidad condicional
Si A y B son dos eventos de un espacio muestral Ω, entonces, la probabilidad condicional de que
ocurra el evento A dado B se determina por:
P (A ∩B)
P ( A /B )=
P( B)
Siendo P ( B )> 0.
Ejemplo 1
Egresado de ingeniería
No egresado de
Mecánica Industrial Total
universidad (N)
Años de experiencia (M) (I)
Al menos tres años de experiencia (A) 14 4 9 27
Menos de tres años de experiencia
25 11 27 63
(B)
Total 39 15 36 90
a. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
b. Sea egresado de ingeniería mecánica o tenga al menos tres años de experiencia.
c. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
d. Tenga al menos tres años de experiencia dado que es egresado de ingeniería industrial.
Solución
a. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
Solución
Solución
39 27 14
P( M ∪ A)=P(M )+ P( A)−P (M ∩ A)= + − =0,578
90 90 90
c. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
Solución
27
P ( N ∩B ) 90 27
P ( N /B )= = = =0,429
P ( B) 63 63
90
d. Tenga al menos tres años de experiencia dado que es egresado de ingeniería industrial.
Solución
a. ¿Cuál es la probabilidad que sea de calidad regular y tenga gran cantidad de partículas?
b. ¿Cuál es la probabilidad que tenga una cantidad media de partículas o sea de mala calidad?
c. ¿Cuál es la probabilidad de que la placa haya sido producida por un troquel con una cantidad
media de partículas o por un troquel con gran cantidad de partículas si la placa no es buena?
d. Dado que la placa de silicio es producida con un troquel que no tiene gran cantidad de
partículas, ¿cuál es la probabilidad que sea de buena calidad?
Solución
a. ¿Cuál es la probabilidad que sea de calidad regular y tenga gran cantidad de partículas?
Solución
30
P(R ∩G)= =0,0566
530
b. ¿Cuál es la probabilidad que tenga una cantidad media de partículas o sea de mala calidad?
Solución
107
UPC MA444 Estadística
Definamos los eventos necesarios:
P ( P ∪ M )=P ( P ) + P ( M ) −P ( P ∩ M )
270 150 65
¿ + − =0,6698
530 530 530
c. ¿Cuál es la probabilidad de que la placa haya sido producida por un troquel con una cantidad
media de partículas o por un troquel con gran cantidad de partículas si la placa no es buena?
Solución
190 90 0
¿ + − =0,8116
345 345 345
d. Dado que la placa de silicio es producida con un troquel que no tiene gran cantidad de partículas,
¿cuál es la probabilidad que sea de buena calidad?
Solución
Definamos los eventos necesarios:
Ejemplo 1
Calcule P( A ∪ B) .
Calcule P ¿).
109
UPC MA444 Estadística
Eventos independientes
P ( A /B )=P ( A )
P ( A ∩ B)=P ( A) P(B)
Propiedades
Ac y Bc ; entonces:
c c c c
P( A ∩ B )=P ( A ) P(B )
Ac y B; entonces:
P( A c ∩ B)=P( Ac )P( B)
A y Bc ; entonces:
c c
P( A ∩ B )=P( A)P(B )
Leyes de De Morgan
c c c
P( ( A ∩ B ) )=P(A ∪ B )
c c c
P( ( A ∪ B ) )=P (A ∩ B )
Un sistema electrónico está compuesto por tres subsistemas A, B y C, de tal manera que las
probabilidades de fallar de cada uno son 0,15; 0,20 y 0,35. Si los subsistemas funcionan de manera
independiente, calcular:
a. Calcular la probabilidad de que al menos uno de los subsistemas falle.
b. Calcular la probabilidad de solo dos de los subsistemas funcione.
Solución
c
A :=¿ el subsistema A falle P( A)=0,15 P( A )=0,85
B:=¿ el subsistema B falle P( B)=0,20 P( Bc )=0,80
c
C :=¿ el subsistema C falle P(C)=0,35 P(C )=0,65
Solución
P ( S )=1−P ( S c )
Para que ninguno de los sistemas falle, no debe fallar ninguno de los sistemas A , B y C .
P( S)=1−P ( A c ∩ Bc ∩ Cc )
P( S)=1−P ( A c ) P( Bc ) P(C c )
Solución
c c c c c c
P( S2 )=P( A )P(B) P (C )+ P( A )P( B )P(C )+ P( A ) P (B ) P (C)
Ejemplo 2
Una empresa produce piezas en tres máquinas, M 1, M2 y M3, que pueden presentar desajustes de
manera independiente, con probabilidades 0,02; 0,01 y 0,06 respectivamente. Al inicio de un día de
operación se realiza una prueba en cada máquina. Si se observan desajustes en una máquina, ésta
debe pasar el día en revisión técnica. Para cumplir el nivel mínimo de producción diaria se necesita
que al menos dos de las tres máquinas funcionen.
a. ¿Cuál es la probabilidad de que una de las tres máquinas deba pasar el día en revisión técnica?
b. ¿Cuál es la probabilidad de cumplir con el nivel mínimo de producción diaria?
Solución
c
A :=¿ la máquina M1 presenta desajustes P( A)=0,02 P( A )=0,98
c
B:=¿ la máquina M2 presenta desajustes P(B)=0,01 P( B )=0,99
C :=¿ la máquina M3 presenta desajustes P(C)=0,06 P(C c )=0,94
a. ¿Cuál es la probabilidad de que una de las tres máquinas deba pasar el día en revisión técnica?
Solución
Para que solo una de las máquinas presente desajustes, deben presentarlos M1 pero no M2 y M3;
M2 pero no M1 y M3; M3 pero no M1 y M2.
Por lo tanto:
112
UPC MA444 Estadística
c c c c c c
P( R)=P( A ∩ B ∩C )+ P( A ∩B ∩C )+ P( A ∩ B ∩C )
Solución
Para cumplir el nivel mínimo de producción diaria se necesita que al menos dos de las tres
máquinas funcionen, es decir, funcionen dos de las máquinas o las tres.
P ( N )=P ( A ∩B ∩C ) + P ( A ∩ B ∩C ) + P ( A ∩ B ∩C ) + P ( A ∩B ∩C )
c c c c c c c c c
P ( N )=P ¿
P(N )=0,9980
113
UPC MA444 Estadística
Aplicación al sistema de componentes: Confiabilidad de sistemas
Podemos aplicar el concepto de la independencia de eventos al caso en que se tenga un sistema de
componentes electrónicos acoplados en serie o en paralelo.
Sistema en serie
Un sistema de componentes acopladas en serie funciona si todos sus componentes funcionan.
Para que el sistema funcione S, ambos componentes, A y B, deben funcionar. Se asume que cada
componente funciona de forma independiente.
P(S)=P( A ∩ B)
P( S)=P( A) P(B)
Ejemplo 1
El sistema funcionará sólo si ambos componentes funcionan. El componente A funciona con una
probabilidad de 0,98 y el componente B funciona con una probabilidad de 0,95. Suponga que A y B
funcionan de manera independiente. Determine la probabilidad que el sistema funcione.
Solución
Sean los eventos:
A ≔ el componente A funcione
B≔ el componente B funcione
S ≔el sistema funcione
P( S)=P( A ∩ B)
Sistema en paralelo
Un sistema de componentes acoplada en paralelo funciona, si al menos una de sus componentes
funciona. El sistema funcionará si alguno de los componentes, A o B, funciona.
P ( S )=P ( A ∪ B ) =P ( A )+ P ( B )−P ( A ∩ B )
P ( S )=P ( A ∪ B ) =1−P ¿
P ( S )=P ( A ∪B ) =1−P ( A ∩B )
c C
P( S)=1−P ( A c ) P(Bc )
Ejemplo 2
Los componentes A y B funcionan con una probabilidad de 0,90 y 0,85 respectivamente. Suponga
que los componentes A y B funcionan de manera independiente. Determine la probabilidad de que el
sistema funcione.
Solución
Probabilidad total
Sean los eventos A1 , A 2 ,... , A k , los cuales forman una partición del espacio muestral mutuamente
excluyentes y exhaustivos y sea E otro evento cualquiera de , se cumple:
A1 A2 Ak
P ( E )=P ( A1 ) P ( E/ A1 ) + P ( A2 ) P ( E/ A 2 ) +…+ P ( A k ) P ( E / A l )
Teorema de Bayes
Si los eventos A1 , A 2 ,... , A k constituyen una partición del espacio muestral , entonces para
cualquier evento E de , se cumple que:
P ( Ai ∩ E )
P ( Ai / E)= i=1, 2 , … , k
P( E)
P ( A i ) P ( E/ A i )
P ( Ai / E)=
P ( A1 ) P ( E/ A1 ) + P ( A2 ) P ( E/ A 2 ) +…+ P ( A k ) P ( E / A k )
118
UPC MA444 Estadística
Ejemplo 1
Una cadena de tiendas de suministros de construcción vende tres marcas diferentes de teodolitos.
De sus ventas de teodolitos, 50% son de la marca 1 (la menos cara), 30% son de la marca 2 y 20% son
de la marca 3 (la más cara).
Cada fabricante ofrece un año de garantía en las partes y mano de obra. Se sabe que 25% de los
teodolitos de la marca 1 requieren trabajo de reparación dentro del periodo de garantía, mientras
que los porcentajes correspondientes de las marcas 2 y 3 son 20% y 10%, respectivamente.
Determine:
a. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya adquirido un teodolito de
la marca 1 y que necesitará reparación mientras se encuentra dentro de garantía?
b. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya comprado un teodolito
que necesite reparación mientras se encuentra dentro de la garantía?
c. Si un cliente regresa a la tienda con un teodolito que necesita reparación dentro de garantía,
¿cuál es la probabilidad de que sea un teodolito de la marca 1?
Solución
P ( N / A )=0,25 P(A∩N )
P ( A )=0,50
P ( N / A )=0,75 P(A ∩ N )
c c
P ( N /B )=0,20 P (B ∩ N )
P ( B )=0,30
P ( N /B )=0,80 P (B ∩ N )
c c
P ( N /C )=0,10 P (C ∩ N )
P ( C ) =0,20
P ( N /C ) =0,90 P (C ∩ N )
c c
Solución
La probabilidad pedida es:
119
UPC MA444 Estadística
Solución
P ( N )=P ( A ∩ N ) + P ( B ∩ N ) + P (C ∩ N )
P ( N )=P ( N / A ) P ( A ) + P ( N / B ) P ( B ) + P ( N /C ) P ( C )
¿ 0,125+0,06+ 0,02=0,205
c. Si un cliente regresa a la tienda con un teodolito que necesita reparación dentro de la garantía,
¿cuál es la probabilidad de que sea un teodolito de la marca 1?
Solución
P( A ∩ N ) 0,5 × 0,25
P ( A / N )= = =0,6098
P(N ) 0,205
Ejemplo 2
Tres máquinas A, B y C, producen el 45%, 30% y 25% respectivamente del total de las piezas
producidas en una fábrica. El porcentaje de producción de piezas defectuosas de estas máquinas son
del 3%, 4% y 5% respectivamente.
Solución
P ( D/ A )=0,03 P ( A ∩ D)
P ( A )=0,45
P ( D / A )=0,97 P(A ∩D )
c c
P ( D/B )=0,04 P (B ∩ D)
P ( B )=0,30
P ( D /B ) =0,96 P (B ∩ D )
c c
P ( D/C )=0,05 P (C ∩ D)
P ( C ) =0,25
P ( D /C ) =0,95 P (C ∩ D )
c c
Solución
La probabilidad pedida es:
b. Si tomamos al azar una pieza y resulta defectuosa ¿cuál es la probabilidad de que haya sido
producida por la máquina B?
Solución
La probabilidad pedida es:
P ( D/ B ) P( B) 0,04 ×0,30
P ( B /D )= = =0,3158
P(D) 0,038
c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?
Solución
Las probabilidades pedidas son:
P ( D / A ) P( A) 0,03 ×0,45
P ( A / D )= = =0,3553
P (D) 0,038
P ( D/ B ) P( B) 0,04 ×0,30
P ( B /D )= = =0,3158
P(D) 0,038
121
UPC MA444 Estadística
Una empresa se encuentra estudiando la posibilidad de importar para el próximo año un nuevo
modelo de celular de última generación. Al estudiar la situación económica del próximo año se
contemplan tres posibilidades: inflación, estabilidad o crecimiento, estimando dichas alternativas con
las siguientes probabilidades: 0,55; 0,35 y 0,10 respectivamente. La probabilidad de importar el
nuevo modelo de celular es 0,25 si existiera inflación; 0,40 si existiera estabilidad y 0,65 si existiera
crecimiento.
c. Asumiendo que la empresa decidió importar el nuevo modelo de celular, ¿cuál es la probabilidad
que existiera inflación en la economía?
123
UPC MA444 Estadística
Ejemplo 4
17
La probabilidad que la construcción de un edificio termine a tiempo es , la probabilidad que no
20
3
haya huelga es y la probabilidad que la construcción se termine a tiempo dado que no hubo huelga
4
14 1
es ; la probabilidad que haya huelga y no se termine la construcción a tiempo es .
15 10
Ejercicios propuestos
27.Una empresa constructora emplea a tres ingenieros de ventas. El ingeniero 1 hace el trabajo de
estimar costos en 60% de las cotizaciones solicitadas a la empresa, el ingeniero 2 hace lo mismo
en 30% de las cotizaciones y el ingeniero 3 en el resto. Se sabe que la tasa de error para el
ingeniero 1 es tal que la probabilidad de encontrar un error en su trabajo es 0,02; la probabilidad
de encontrar un error en el trabajo del ingeniero 2 es 0,04 y la probabilidad de encontrar un error
en el ingeniero 3 es de 0,03.
Suponga que al revisar una solicitud de cotización se encuentra un error grave en la estimación de
los costos. ¿Qué ingeniero supondría usted que hizo los cálculos?
28.El informe de la comisión mundial de represas (ONU, 2015) indica numerosos impactos
ambientales que logran dañar represas, provocando en ellas averías muy serias. La Confiep debe
recomendar un tipo de estructura antes de diseñar una nueva represa. Por registros anteriores se
sabe que en el Perú el 55% de las represas están hechas a base de cimientos, el 28% con
terraplenes y el resto con excavaciones. Además, se conoce que, cuando el diseño de la estructura
de la represa es a base de cimientos ésta no presenta averías en un 80%, si es a base de
terraplenes presenta averías en un 35% y si la estructura es a base de excavaciones presenta
averías en un 25%.
Si se elige una represa al azar y ésta presenta averías ¿cuál es el tipo de diseño de estructura que
debería recomendar la Confiep?
29.Consideremos que tres máquinas Alpha, Beta y Gamma producen respectivamente el 50%, el 30%
y el 20% del número total de artículos de una fábrica. Si la proporción de artículos defectuosos
que produce cada una de estas máquinas es 0,03; 0,04 y 0,05 respectivamente y se selecciona un
artículo aleatoriamente.
30.Una empresa vende tres tipos de maquinaria pesada para la industria textil A, B y C. El 70% de las
máquinas son del tipo A, el 20% del tipo B y el 10% son del tipo C. Las máquinas A tienen una
probabilidad de 0,10 de producir una pieza defectuosa a lo largo de un año, las máquinas B tienen
una probabilidad de 0,30 y las máquinas C tienen una probabilidad 0,60 de producir una de tales
piezas defectuosas a lo largo de un año.
125
UPC MA444 Estadística
Una de estas máquinas ha estado funcionando durante un año de prueba y ha producido una
pieza defectuosa. ¿De cuál tipo de máquina es más probable que provenga la pieza defectuosa?
31.Una de las etapas de producción de drones es el ensamblado de la cubierta del casco para
exteriores. Se programan diariamente 1400 cascos utilizando a tres especialistas A, B y C. El
especialista A atiende 170 cascos, el especialista B atiende 500 cascos y el especialista C atiende
los restantes.
Cabe la posibilidad de que el ensamblado del casco no sea el correcto; por lo tanto, el casco
ensamblado sería defectuoso. La siguiente tabla muestra como varía la proporción del
ensamblado defectuoso del casco para cada especialista.
Si se selecciona al azar un dron con casco ensamblado defectuoso, ¿cuál es la probabilidad de que
lo haya ensamblado el especialista B?
32.Una de las medidas que se consideran para regular el volumen de agua en m 3 en las represas, es
abrir las compuertas para que las represas no rebalsen. Las compuertas operan en forma
independiente de acuerdo con dos tipos de sistemas. Estos sistemas operan solo si hay una
trayectoria de dispositivos funcionales de izquierda a derecha. Su funcionamiento es muy
importante por lo que el ingeniero de mantenimiento recomendará utilizar aquel sistema que
presente mayor probabilidad de flujo de funcionamiento continuo.
¿Cuál de los dos sistemas deberá elegir para ser instalado en una compuerta? Suponga que cada
dispositivo funciona de manera independiente con una probabilidad de 0,85.
a. Calcule la probabilidad que una empresa elija para su red la tecnología LAN.
b. Si se selecciona al azar una empresa que utiliza tecnología WAN, ¿cuál es la probabilidad que
utilice como medio físico de transporte cables de cobre de par trenzado?
35.Si la probabilidad de que cada llave esté cerrada dejando pasar corriente es p=¿ 0,6 y las llaves
se cierran y se abren en forma independiente, calcular la probabilidad de que pase corriente de I
hacia O en el siguiente circuito.
127
UPC MA444 Estadística
Si se elige una represa al azar y esta presenta averías, ¿cuál es el tipo de material que debería
recomendar la Confiep para que no ocurran fallas estructurales?
128
UPC MA444 Estadística
Variable aleatoria
Sea Ω un espacio muestral. Una variable aleatoria es una función X que transforma cada resultado w
del espacio muestral en un número real X (w) .
Ejemplo 1
Al lanzar dos monedas para registrar los posibles resultados se obtiene el espacio muestral siguiente:
Si definimos la variable aleatoria X como número de caras que se obtiene, entonces a cada resultado
de , es posible asignarle un número real de la siguiente manera:
Por ejemplo: número de circuitos electrónicos producidos por una empresa que cumplen con las
especificaciones técnicas, número de llamadas que recibe una central telefónica.
Por ejemplo: resistencia a la ruptura de un material plástico (onzas por pulgada cuadrada),
resistencia transversal de los ladrillos fabricados por una empresa (MN/m 2).
129
UPC MA444 Estadística
Sea X una variable aleatoria discreta. La función de probabilidad de una variable aleatoria discreta
representa la probabilidad de que la variable aleatoria tome un valor genérico igual a x y se denotará
de la siguiente manera:
f ( x)=P ( X=x )
f (x) ≥ 0
∑ f (x)=1
Rango X
Ejemplo 1
El ingeniero de producción de la empresa Tecnotronics S.A. ha determinado que la distribución de
probabilidades del número de artículos defectuosos por lote es la siguiente:
Solución
Solución
∑ f (x)=1
Rango X
f ( 0 )+ f ( 1 ) +f ( 2 ) + f ( 3 )+ f ( 4 )=1
Solución
c. Si el lote tiene dos o más artículos defectuosos, es considerado malo; calcule la probabilidad que
el lote sea malo.
Solución
El lote será malo si tiene dos o más artículos defectuosos, por lo tanto, la probabilidad pedida es:
d. Si se sabe que el número de artículos defectuosos por lote es al menos uno, calcule la
probabilidad de que el número de artículos defectuosos sea menor a tres.
Solución
P ( X <3/ X ≥ 1 )
P ( X < 3∩ X ≥1 )
¿
P( X ≥ 1)
P ( X =1 ) + P ( X=2 )
¿
1−P ( X=0 )
f ( 1 ) +f ( 2 )
¿
1−f ( 0 )
0,15+0,10
¿ =0,3333
1−0,25
131
UPC MA444 Estadística
Ejemplo 2
El departamento de control de calidad de una empresa selecciona al azar diariamente tres bombillas
de un lote que contiene 20 bombillas, para decidir si acepta el lote y los pasa al departamento de
producción o rechaza el lote y los devuelve al proveedor.
P ( X=0 )=¿
P ( X=1 ) =¿
P ( X=2 )=¿
c. En relación con la regla planteada en (b), si el lote es aceptado, ¿cuál es la probabilidad que la
muestra contenga un defectuoso?
132
UPC MA444 Estadística
133
UPC MA444 Estadística
Sea X una variable aleatoria discreta con función de probabilidad f(x). Entonces el valor esperado o
media de X es:
μ= E ( X )= ∑ x f (x)
Rango X
Sea X una variable discreta con función de probabilidad f(x). Entonces, la varianza de X es:
σ =V ( X )=E ( ( X−μ ) )
2 2
V ( X)=E(X 2 ) – [ E( X )] 2
donde:
E ( X 2) = ∑ x 2 f (x )
Rango X
σ =√ σ
2
Ejemplo 1
El número de fallas de energía eléctrica que afectan a cierta región en cualquier año dado se
considera una variable aleatoria que tiene la siguiente función de probabilidad:
x 0 1 2 3
P(X = x) 0,38 0,24 k 0,08
Solución
En primer lugar, hallaremos el valor de k para que la distribución sea función de probabilidad:
0,38+0,24 +k + 0,08=1
μ= E ( X )= ∑ x f (x)
Rango X
Reemplazando:
Interpretación
Si el experimento se repitiera muchas veces, en promedio el número de fallas de energía
eléctrica que afectan a cierta región en cualquier año dado sería de 1,08.
Solución
Primero, calculamos la varianza y usaremos la fórmula:
2 2
V ( X)=E(X ) – [ E( X )]
Donde:
Reemplazando:
V ( X )=2,16−1,082 =0,9936
Finalmente,
Ejemplo 2
Un ingeniero civil del departamento de obras muestra la distribución de probabilidad de la variable
aleatoria X :=¿ número de habitaciones a construir en edificios residenciales.
x 4 5 7 8 9
f(x) 0,20 0,25 0,10 0,15 0,30
a. Si la gerencia del departamento de obras le impone que construya menos de ocho habitaciones y
suponiendo que se cumple con este requerimiento, ¿cuál es la probabilidad que construya por lo
menos cinco habitaciones?
b. Si el costo de una vivienda, en dólares, está en función del número de habitaciones de acuerdo
con la siguiente ecuación C ( X )=14000 X +5000 . Indique la media del costo de una vivienda.
Solución
a. Si la gerencia del departamento de obras le impone que construya menos de ocho habitaciones y
suponiendo que se cumple con este requerimiento, ¿cuál es la probabilidad que construya por lo
menos cinco habitaciones?
Solución
Solución
9
μ= E ( X )=∑ xf ( x )=4 × 0,20+5 × 0,25+ 7 ×0,10+8 × 0,15+9 ×0,30
x=4
E( X)=6,65 habitaciones
Si el valor esperado de X es 1,71 fallas por cable, ¿cuál es la probabilidad de que un cable presente
a lo más dos fallas?
x 0 1 2 3 4
f(x) a 0,37 0,16 b 0,01
38.Una librería necesita hacer el pedido semanal de una revista especializada de ingeniería. Por
registros históricos, se sabe que las frecuencias relativas de vender una cantidad de ejemplares es
la siguiente:
Demanda de ejemplares 1 2 3 4 5 6
Frecuencia relativa 1/15 2/15 3/15 4/15 3/15 2/15
a. Calcule la probabilidad de que en las cinco tostadoras seleccionadas existan exactamente dos
de la marca A.
b. Calcule la probabilidad de que en las cinco tostadoras seleccionadas, a lo sumo, haya una
tostadora de las marcas menos conocidas.
138
UPC MA444 Estadística
Distribución binomial
El experimento consiste en n pruebas idénticas de Bernoulli. Cada prueba tiene únicamente dos
resultados: éxito o fracaso. P(éxito)=p y P(fracaso)=1− p se mantiene constante a lo largo de
todas las pruebas.
La probabilidad del evento considerado como éxito es constante en cada prueba y se denota por p.
n x n−x
f ( x )=P ( X =x )=C x p ( 1−p ) , x=0,1, 2 , ..., n
donde:
Notación
Si la variable aleatoria X sigue una distribución binomial con parámetros n y p se denota
X B(n , p) .
Media
¿ E ( X ) =np
Varianza
❑2=V ( X )=np(1− p)
La probabilidad de que el comprador de un osciloscopio haga uso del servicio dentro del plazo de
garantía es 0,20. Para los cinco osciloscopios que cierta empresa ha vendido independientemente a
cinco compradores este mes.
Solución
X B(n=5 , p=0,20)
El rango de X es 0, 1, 2, …, 5
5 x 5−x
f ( x)=P ( X=x )=C x 0,20 (1−0,20) , x=0 ,1 , 2 ,... , 5
Solución
Solución
Solución
P ( X ≥3 )=1−P ( X <3 )
¿ 1−[P ( X =0 ) + P ( X =1 )+ P ( X =2 ) ]
P ( X ≥3 )=1−0,94208=0,05792
Ejemplo 2
El supervisor de una obra ha determinado que un proveedor entrega los pedidos a tiempo alrededor
del 94% de las veces. Para su última obra, el supervisor seleccionó una muestra de 12 pedidos.
X B(n=12 , p=0,94)
El rango de X es 0, 1, 2, …, 12
f ( x )=P ( X =x )=C 12 x
x 0,94 ( 1−0,94 )
12−x
x=0 , 1, 2 ,... , 12
Solución
12 11 1
P ( X=11 ) =C11 0,94 (1−0,94) =0,3645
Solución
E( X)=np=11,28
141
UPC MA444 Estadística
Ejemplo 3
El rango de X es 0, 1, 2, …,
n x n−x
f ( x )=P ( X =x )=C x p ( 1−p ) x =0 ,1 , 2 ,... , n
Ejercicios propuestos
40.Un cierto sistema mecánico contiene componentes y se han seleccionado al azar 10. Suponga que
la probabilidad de que cualquier componente individual falle es de 0,07 y que los componentes
fallan independientes unos de otros.
Caso: Ferrosa
Problema 1
En el área de ventas de la empresa se han detectado reclamos por parte de los clientes que
adquirieron equipos de protección fallados y que serán devueltos. Si la probabilidad que se
devuelvan dos o más equipos en una semana es mayor a 0,35; se recomendará a la gerencia de
comercialización cambiar de proveedor. A continuación, se muestra la siguiente información:
Problema 2
Debido a la globalización y al desarrollo constante de las comunicaciones, los pedidos por internet se
han incrementado últimamente. Un grupo de profesionales de la empresa ha observado que el 25%
de sus clientes realiza sus compras por Internet. Si se eligen al azar 10 clientes y se obtiene que la
probabilidad de que más de tres de ellos realizaron sus compras por Internet supera el 0,2, entonces
se recomendará a la gerencia implementar la promoción de envió de pedidos a domicilio sin ningún
costo.
La probabilidad de que un evento ocurra en una unidad dada de tiempo, área, etc.; es la misma para
todas las unidades.
El número de eventos que ocurren en una unidad de tiempo, área, volumen es independiente del
número de los que ocurren en otras unidades.
e−μ μx
f ( x )=P ( X =x )= x=0 , 1 ,2 , 3 , …
x!
donde:
Notación
La variable aleatoria X sigue una distribución Poisson con parámetro μ y se denota por X P(μ),
donde μ=t
Media
μ= E ( X )=λt
Varianza
σ 2=V ( X )=λt
Solución
t=1 km
Por lo tanto,
1,25 baches
μ=t= ×1 km=0,3125
4 km
X P(μ=0,3125)
−0,3125 x
e 0,3125
f ( x )=P ( X =x )= x=0 ,1 , 2 ,3 , …
x!
b. La probabilidad de que en los siguientes dos kilómetros se encuentre a lo más tres baches o
fisuras.
Solución
t=2 km
Por lo tanto,
146
UPC MA444 Estadística
1,25 baches
μ=t= ×2 km=0,625
4 km
Y P(μ=0,625)
−0,625 y
e 0,625
f ( y ) =P ( Y = y )= y=0 , 1 ,2 , 3 , …
y!
¿ f ( 0 )+ f ( 1 ) +f ( 2 ) + f ( 3 )
c. El costo de reparación de estos defectos es de 35 dólares por cada bache o fisura detectada.
Calcule el costo esperado al inspeccionar 80 km de esta carretera.
Solución
t=80 km
Por lo tanto,
1,25 baches
μ=t= ×80 km=25
4 km
W P( μ=25)
C ( X )=35 X
Ejemplo 3
En un estudio del tránsito en cierta intersección, se determinó que el número de automóviles que
llegan a un óvalo tiene distribución de Poisson con media igual a tres automóviles por segundo.
a. Calcule la probabilidad de que en dos segundos lleguen al óvalo exactamente dos automóviles.
b. Calcule la probabilidad de que en dos segundos lleguen al óvalo menos de tres automóviles.
c. Calcule la probabilidad de que en los siguientes tres segundos lleguen al óvalo por lo menos dos
automóviles.
Solución
a. Calcule la probabilidad de que en dos segundos lleguen al óvalo exactamente dos automóviles.
Solución
t=2 segundos
Por lo tanto:
3 autos
μ=t= ×2 segundos=6
1 segundo
X P(μ=6)
2 −6
6 ×e
P ( X=2 )= =0,0446
2!
b. Calcule la probabilidad de que en dos segundos lleguen al ovalo menos de tres automóviles.
Solución
P ( X <3 ) =0,0620
c. Calcule la probabilidad de que en los siguientes tres segundos lleguen al óvalo por lo menos dos
automóviles.
Solución
t=3 segundos
Por lo tanto,
3 autos
μ=t= ×3 segundos=9
1 segundo
X P( μ=9)
Ejemplo 4
Con la finalidad de diseñar un nuevo sistema de control de tráfico, un ingeniero recoge información
sobre el número de automóviles que llegan a una intersección. Por histórico, se sabe que en
promedio llegan cuatro autos a la intersección cada minuto según un proceso de Poisson.
X
El rango de X es
b. ¿Qué probabilidad hay de que entre las 5:25 pm y 5:28 pm lleguen más de dos autos?
c. Si en un minuto llegaron más de tres autos, ¿cuál es la probabilidad que como máximo sean
cinco los autos que llegaron en ese minuto?
Ejemplo 5
Cierto tipo de azulejo puede tener un número X de puntos defectuosos con media de tres puntos
defectuosos por azulejo. Calcule la probabilidad de que se presenten cinco defectos en un azulejo
elegido al azar.
X
El rango de X es
41.Debido al calentamiento global, es muy común la presencia de caracoles en las represas debido a
sus aguas estancadas, lo cual hace que se produzcan enfermedades nocivas para el hombre y su
entorno. El número de caracoles presentes en las aguas estancadas sigue una distribución Poisson
con un promedio de 16 caracoles por cinco m 3 de agua.
42.En un estudio del tránsito en cierta intersección, se determinó que el número de automóviles que
llegan a un óvalo tiene distribución de Poisson con media igual a cinco automóviles por segundo.
Caso: Ferrosa
Condición 1
f (x)≥ 0
Condición 2
+∞
∫ f ( x ) dx=1
−∞
b
P ( a ≤ X ≤ b )=∫ f ( x ) dx
a
Para variables continuas se cumple:
Ejemplo 1
Sea k una constante y consideremos la función de densidad de la vida útil, en años, de cierto tipo de
computadora.
{
f ( x )= kx 0≤ x ≤ 2
0 en otro caso
Solución
Para que f ( x) sea función de densidad debe satisfacer las siguientes condiciones:
Condición 1
f (x)≥ 0
Para el tramo 0 ≤ x ≤ 2
k x≥0
Por tanto, k debe ser positivo.
Condición 2
+∞
∫ f ( x ) dx=1
−∞
∫ kx dx =1
0
Integrando:
( )|
2
2
x
k
2 0
Evaluando en 0 y 2. se tiene:
22 02
k −k =1
2 2
1
k=
2
Reemplazando tenemos:
{
1
x 0 ≤ x ≤2
f ( x )= 2
0 en otro caso
Solución
La probabilidad pedida es:
155
UPC MA444 Estadística
1,8
1
P ( X >1 )=∫ x dx=0,7475
0,5 2
Solución
La probabilidad pedida es:
2
1
P ( X >1 )=∫ x dx=0,75
1 2
Ejemplo 2
El peso, en onzas, de un artículo de gasfitería usado en hogares y oficinas es una variable aleatoria X
con función densidad:
f ( x )= {k ( x−8
0
) 8 ≤ x ≤10
en otro caso
c. Los artículos con un peso menor a 8,5 onzas son separados. Calcule la probabilidad que un
artículo, seleccionado al azar, sea separado.
156
UPC MA444 Estadística
157
UPC MA444 Estadística
Ejercicios propuestos
43.El gerente de la empresa le informa al departamento de control de calidad que uno de los
principales clientes de la empresa ha exigido que las bombillas LED tengan como mínimo un
tiempo de encendido continuo de 2100 horas. La distribución de densidad del tiempo de
encendido continúo (en miles de horas) que obtuvo la empresa es la siguiente:
f ( x )= {k ( 17−x
0
) 1,8 ≤ x ≤2,2
en otro caso
x
F (x)=P( X ≤ x )=∫ f ( t ) dt
−∞
Si F (x) es la función de distribución acumulativa para una variable aleatoria continua X , entonces la
función de densidad f ( x) para X es:
dF ( x)
f ( x )=
dx
Ejemplo 1
El tiempo, en minutos, que un tren se retrasa es una variable aleatoria continua X con la siguiente
función de densidad:
{
3 2
(25−x ) 0 ≤ x ≤5
f (x)= 250
0 en otro caso
Solución
159
UPC MA444 Estadística
Solución
Para hallar la función acumulada emplearemos la definición de la función de distribución
acumulada F ( x )=P ( X ≤ x ) .
x
F ( x )=P ( X ≤ x ) =∫ f ( t ) dt
−∞
)|
x
(
3
3 t
¿ 25 t−
250 3 0
3
75 x−x
F ( x )=
250
{
0 x <0
75 x−x 3
F ( x )= 0 ≤ x<5
250
1 x≥5
Solución
La probabilidad pedida es:
P ( X >2 )=1−P( X ≤ 2)
F ( x )=P ( X ≤ x )
Solución
La probabilidad pedida es:
Ejemplo 2
Los sondeos de mercado realizados por un fabricante sobre la demanda de un producto indican que
la demanda proyectada debe considerarse una variable aleatoria X con valores entre 0 y 25
toneladas. La función de densidad de X está dada por:
{
3 2
x 0 ≤ x ≤25
f ( x)= 253
0 en otro caso
a. Construir la función de distribución acumulada de X .
44.El costo de una reparación de conexión domiciliaria, en soles, es una variable aleatoria cuya
función de distribución acumulada es:
{
0 x ≤ 20
x −20
F ( x )= 20< x <30
10
1 x ≥ 30
45.SAP Ingeniería, es una empresa que desarrolla soluciones específicas y busca ofrecer servicios de
telecomunicaciones, independientemente del tamaño y desempeño del sector o actividad
empresarial. De estudios anteriores se conoce que el tiempo de atención de un servicio, en
minutos, para cada tamaño de empresa, se tiene la función de densidad y la función de
distribución acumulada; respectivamente.
Pequeña empresa
{
( 80−x )
0< x <100
( )
f x = 3000
0 en otro caso
Mediana empresa
{
0 x <0
2
90 x
F ( x )= x− 0 ≤ x ≤120
3600 7200
1 x >120
Sea X una variable aleatoria continua con función de densidad f ( x), entonces el valor esperado de
X es la siguiente:
+∞
μ= E ( X )= ∫ xf ( x ) dx
−∞
Sea X una variable aleatoria continua con función de densidad f (x). Entonces, la varianza de X es:
V ( X)=E(X 2 ) – [ E( X )] 2
Donde:
E ( X 2) = ∫ +¿ x 2 f ( x ) dx ¿
−¿¿
σ =√ σ 2
Coeficiente de variabilidad
Se define como:
σ
CV = × 100 %
μ
Ejemplo 1
El tiempo de anticipación (valores negativos de X ) o retraso (valores positivos de X ) en minutos, de
la llegada de un tren sobre su tiempo establecido, es una variable aleatoria continua X con la
siguiente función de densidad:
{
3
f ( x )= 500
( 25−x 2) −5< x <5
0 otro caso
164
UPC MA444 Estadística
Solución
Solución
+∞
E ( X ) =∫ x f (x ) x dx
−∞
+5
3
E ( X ) =∫ x ( 25−x 2 ) dx
−5 500
( ) ( )
2 4 2 4
3 25 5 3 25 5
E ( X )= − − + =0
500 2 4 500 2 4
El tiempo promedio de anticipación o retraso que tiene el tren sobre su hora establecida es 0
minutos, es decir llega en promedio puntual.
b. Los supervisores de la estación ferroviaria han notado que últimamente los trenes no están
llegando en su hora establecida, para lo cual han fijado como norma que un tren puede llegar en
a lo más± 0,5 σ , donde σ es la desviación estándar. ¿Qué porcentaje de trenes cumplen la norma
fijada?
Solución
+5
E ( X ) =∫ x f ( x ) dx
2 2
−5
165
UPC MA444 Estadística
+5
2 3
E ( X ) =∫ x ( 25−x 2 ) dx
2
−5 500
+5
3
E ( X )=
2
∫ ( 25 x 2−x 4 ) dx
500 −5
)|
5
(
3 5
3 x x
E ( X )=
2
25 −
500 3 5 −5
( ) ( )
3 5 3 5
3 5 5 3 −5 −5
E ( X 2) = 25 − − 25 +
500 3 5 500 3 5
E ( X 2) =5
2 2 2
σ =V (X )=E (X )– [ E( X)]
2 2
σ =V ( X )=5−0 =5
σ =√ σ = √5=2,2361
2
P (−0,5 σ ≤ X ≤0,5 σ )
Reemplazando:
¿ P(−1,118 ≤ X ≤1,118)
1,118
3
¿ ∫ 500
( 25−x 2) dx =0,32981
−1,118
El peso, en onzas, de un artículo de gasfitería usado en hogares y oficinas es una variable aleatoria X
con función densidad:
f ( x)=
{k (x−8)
0
8< x ≤ 10
otrocaso
a. Calcule el peso máximo que debe tener un artículo de manera que el 25% de los artículos tengan
pesos menores o iguales a dicho peso.
46.Las utilidades netas, en miles de soles, de los propietarios de stands en una galería comercial es
una variable aleatoria con la siguiente función de densidad:
{
x
0≤ x≤4
f ( x)= 8
0 otro caso
a. ¿Estaría usted en condiciones de afirmar que más de la mitad de los propietarios tiene
utilidades superiores al promedio? Justifique.
b. Calcule la variación relativa de las utilidades.
47.Un estudio realizado por un grupo de ingenieros civiles determinó, que la resistencia a la
compresión en probetas de concreto con materiales propios de una región (en miles de psi), está
determinada por la siguiente función de densidad de probabilidad:
{
2
3x
0< x< 2
20
f ( x )= x
2≤x ≤4
10
0 otro caso
Para decidir en qué región invertir, el grupo brasileño le muestra al inversionista la función de
densidad y la función de distribución acumulada de la utilidad, en millones de soles, generada por
los proyectos culminados en las regiones costa y sierra.
Función de densidad de la utilidad generada por los proyectos culminados en la región costa
f ( x )= {k ( x−5
0
) 5≤ x ≤ 18
en otro caso
{
0 x <7
( )
2
F ( x )= 2 x 7
−4 x + 7 ≤ x ≤20
247 2 2
1 x>20
La decisión de inversión se basará en aquella región (costa o sierra) que tenga mayor probabilidad
de obtener utilidades superiores a 15 millones de soles en proyectos culminados, ¿en qué región
deberá invertirse?
170
UPC MA444 Estadística
Función de densidad
Una variable aleatoria X es exponencial con parámetro β >0, si su función de densidad es:
{
−x
1
e β
x≥0
f ( x )= β
0 otro caso
Notación
Media
μ= E ( X )=β
Varianza
σ 2=V ( X )=β 2
x
F ( x )=P ( X ≤ x ) =∫ f ( x ) dx
−∞
Como el rango de X es de 0 a + ∞.
x −x −x
1
F ( x )=∫ e β
dx=1−e β
0 β
171
UPC MA444 Estadística
−x
β
F ( x )=1−e
Características
Ejemplo 1
−x
1 500
f ( x )= e x≥0
500
Solución
Solución
P ( X >800 )
¿ 1−P ( X ≤ 800 )
¿ 1−(1−e )=0,2019
−800
500
Solución
F ( Me )=0,50
−x
Usando la función de distribución acumulada F ( x )=1−e β de la variable exponencial tenemos
que:
−Me
(1−e 500 )=0,50
− Me
500
e =0,50
ln (e )=ln (0,50)
− Me
500
−Me
=ln ( 0,50 )
500
Despejando:
−Me=−0,693× 500
Me=346,5 días
Ejemplo 2
La duración, en miles de millas, que obtienen los dueños de automóviles con cierto tipo de
neumático es una variable aleatoria con la siguiente función de densidad:
{
−x
1 20
e x ≥0
f ( x)= 20
0 otro caso
a. Calcule la probabilidad de que un neumático dure como máximo diez mil millas.
173
UPC MA444 Estadística
48.La duración, en minutos, de una conversación telefónica de larga distancia nacional tiene
distribución exponencial con promedio de ocho minutos.
a. ¿Cuál es la probabilidad que una llamada dure entre tres y diez minutos?
b. ¿Cuál es la probabilidad que una llamada dure más de 9 minutos?
c. ¿Cuánto debe durar como mínimo una llamada para estar considerada dentro del 10% de las
de mayor duración?
d. Si la llamada dura más de cinco minutos ¿cuál es la probabilidad de que dure a lo más 8
minutos?
49.Suponga que la vida útil, en horas, de cierta marca de foco electrónico, es una variable aleatoria X
cuya función de densidad de probabilidad es:
{
−x
8000
ce x≥0
f ( x)=
0 otro caso
Calcule el valor de la constante c para que f ( x) sea función de densidad. Si se selecciona un foco
electrónico al azar, calcule la probabilidad de dure más de diez mil horas.
50.La vida, en horas, de un dispositivo electrónico es una variable aleatoria que tiene la siguiente
función de densidad:
{
−x
1 50
e x ≥0
f ( x)= 50
0 otro caso
Función de densidad
( )
2
−1 x− μ
1 2 σ
f (x)= e −∞ < x <∞
√2π σ
Notación
Si la variable aleatoria tiene distribución normal con parámetros μ y σ 2 se denota:
2
X N (,❑ ).
Media
E( X)=¿
Varianza
2
V ( X)=❑
176
UPC MA444 Estadística
La distribución normal estándar es una distribución de una variable aleatoria continua denotada
con la letra Z , que tiene media 0 y desviación estándar 1.
Una variable aleatoria con distribución normal se puede convertir en una distribución normal
estándar si se realiza la siguiente transformación, llamada de estandarización o de tipificación.
X−μ
Z=
σ
Z N (0,1)
Ejemplo 1
F (Z )=P(Z ≤ z)
Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233
-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350
-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621
-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681
-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866
-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
179
UPC MA444 Estadística
Tabla de la distribución normal estándar
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
180
UPC MA444 Estadística
Situación 1 P ( Z ≤ a)
d. ¿Cuál será el valor máximo de Z tal que el 15,87% de los valores son menores a Z?
182
UPC MA444 Estadística
e. ¿Cuál será el valor mínimo de Z tal que el 15,87% de los valores son mayores a Z?
Ejemplo 2
Raúl sabe que la gestión del proyecto se mide habitualmente en términos de utilidad, por lo que
analizó la utilidad, en millones de soles, de los proyectos grandes culminados el último año. Sabe,
además, que esta variable tiene distribución normal con media 111,5 millones de soles y desviación
estándar de 25 millones de soles. Si la probabilidad de que un proyecto grande culminado en el
último año genere una utilidad mayor a 112 millones de soles supera a 0,52, no tomará la decisión
de modificar los términos de referencia para invertir en más proyectos grandes caso contrario
modificará los términos de referencia. ¿Qué decisión tomará?
Solución
Definamos la variable:
X :=¿ utilidad, en millones de soles, de los grandes proyectos culminados en el último año
2 2
X N ( μ=111,5; σ =25 )
Estandarizando:
(
¿ 1−P Z <
112−111,5
25 )
¿ 1−P(Z <0,02)=1−0,50798=0,49202
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
Por lo tanto, sí se tomará la decisión de modificar los términos de referencia para invertir en más
proyectos grandes.
183
UPC MA444 Estadística
Ejemplo 3
Una máquina llena recipientes con determinado producto. Se sabe que el peso de llenado de dicho
producto tiene distribución normal. Se sabe, de acuerdo con los datos históricos, que la media es
20,23 y la desviación estándar de pesos de llenado es de 0,6 onzas.
c. Se dice que la máquina funciona correctamente si el peso de llenado del producto está entre
19,03 y 21,43 ¿Qué tan probable es que la máquina no funcione correctamente?
d. ¿Cuál debe ser el tiempo de llenado mínimo para pertenecer al 25% de recipientes con mayor
peso de llenado?
185
UPC MA444 Estadística
Ejercicios propuestos
51. La medición mensual de la contaminación por polvo atmosférico generado por residuos sólidos
de las construcciones y demoliciones de obras es una variable aleatoria distribuida normalmente
con media de 35 toneladas/km 2 y desviación estándar de 15 toneladas/km 2. Si la cantidad
máxima de contaminación aceptable según la norma ambiental es de 25 toneladas/km 2 por mes,
calcule la probabilidad de que la medición del próximo mes reporte un valor no aceptable.
52. Una máquina automática para el llenado de paquetes de arroz puede regularse de modo que la
cantidad media de arroz llenado sea la que se desee. Si la cantidad de arroz depositada se
distribuye normalmente con desviación estándar igual a 10 gramos, ¿cuál debe ser la regulación
media de modo que solo el 1% de los paquetes tengan un peso neto inferior a 990 gramos?
53. En un taller de la Industria Sideromecánica se fabrican árboles de leva para darles uso en
motores de gasolina. Después de investigaciones realizadas se ha llegado a la conclusión de que
la excentricidad de estos árboles de leva es una variable aleatoria normalmente distribuida con
media de 1,02 pulgadas y desviación estándar de 0,44 pulgadas.
a. Calcule la probabilidad que un árbol de leva tenga una excentricidad menor a una pulgada.
b. Calcule la probabilidad que un árbol de leva tenga una excentricidad mayor a 1,05 pulgadas.
c. Calcule el valor máximo para estar en el 30% de los árboles de leva con menor excentricidad.
d. Calcule el valor mínimo para estar en el 20% de los árboles de leva con mayor excentricidad.
54. La duración de las llamadas telefónicas en una empresa se modela con una variable normal con
media de 130 segundos y desviación estándar de 30 segundos. Calcule la probabilidad que una
llamada dure entre 90 y 170 segundos.
55. Un foco tiene una duración distribuida normalmente con una media de 7000 horas y una
desviación estándar de 1000 horas. Un competidor ha inventado un nuevo foco LED con una
duración distribuida normalmente con una media de 7500 horas y una desviación estándar de
1200 horas. ¿Cuál foco tiene mayor probabilidad de tener una duración mayor que 9000 horas?
56. Un contratista de construcción afirma que elaborar un proyecto demora en promedio 35 horas
de trabajo y el 97,5% de los proyectos demandan como máximo 38,92 horas. Considerando que
los tiempos para completar proyectos similares se distribuyen normalmente.
a. ¿Cuál es la probabilidad de que un proyecto demande menos de 32 horas?
b. Si el contratista demora más de 48 horas deberá devolver 2% del costo de dicho proyecto; si
en cambio demora menos de 29,5 horas, recibirá un incentivo de 5% del costo del proyecto,
¿cuánto esperaría recibir de incentivo?
57. Un fabricante de televisores asegura que el tiempo medio de funcionamiento sin fallas de los
aparatos es de dos años con una desviación estándar de 0,25 años. El tiempo de vida de los
aparatos sigue una distribución normal.
a. ¿Cuál es la probabilidad de que el tiempo de buen funcionamiento sea menor que 2,5 años?
b. Determine la probabilidad de que el tiempo de funcionamiento este entre 1 año y 1,75 años.
c. El fabricante garantiza que remplazará gratis cualquier aparato de televisión cuya duración
sin fallas sea menor que k años. Calcular k de tal modo que sólo el 1% de los aparatos
vendidos tenga que ser reemplazado.
186
UPC MA444 Estadística
187
UPC MA444 Estadística
Enterado de esto, el jefe de control de calidad desea saber si el nuevo producto cumple con las
normas técnicas que indican que, por cada metro cuadrado de techo, la cantidad de cemento en
concreto premezclado debe tener un volumen entre 0,21 m 3 y 0,41 m3 y tomará la decisión de enviar
un reporte a la gerencia general pidiendo que se detenga la producción si la probabilidad de que no
se cumpla con la norma técnica es mayor a 0,10. ¿Qué decisión tomará?
Logro
Al terminar la unidad, el estudiante modela la relación entre dos variables para dar respuesta a un
problema en un contexto real donde implique la predicción o la generalización.
Temario
Muestreo aleatorio simple
Tamaño de muestra
Prueba de hipótesis: para la media y para la proporción poblacional
Prueba de hipótesis para dos varianzas y dos medias poblacionales
Análisis de varianza de un factor
Regresión lineal simple
Bibliografía
Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 7.1 pág. 248-
250.
Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 261.
Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 9 pág. 364-
369.
Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 295 – 307.
Estadística. Mario Triola. 11a. Edición. Pearson Educación, México 2013 519.5 TRIO/E 2013
capitulo 7. pág. 297.
Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 10 (pág. 386-
395) Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 375 – 388.
Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 375 - 388.
189
UPC MA444 Estadística
Conceptos básicos
Unidad elemental
Es el objeto sobre el cual se hace la medición. También llamada unidad de observación, unidad de
análisis, unidad estadística o elemento. Por ejemplo, en estudios de poblaciones humanas, con
frecuencia ocurre que la unidad elemental es cada individuo.
Población muestreada
Es el conjunto de todas las unidades elementales posibles que podrían extraerse en una muestra; es
decir, es la población de donde se extrae la muestra.
Unidad de muestreo
Es la unidad donde realizamos la muestra. Por ejemplo, si queremos estudiar a las personas, pero no
tenemos la lista de todos los individuos que pertenecen a la población objetivo, la unidad de
muestreo sería cada familia y la unidad elemental sería cada individuo que vive en la familia .
Marco muestral
Es una lista de las unidades de muestreo que están disponibles para elección.
Para las encuestas telefónicas el marco de muestreo podría ser una lista de todos los números
telefónicos residenciales de la ciudad; para las entrevistas personales una lista de las direcciones de
todas las calles; para una encuesta de agricultura una lista de todas las granjas o un mapa con todas
las áreas que contienen granjas.
Censo
Es una investigación estadística que consiste en el recuento de la totalidad de los elementos que
componen la población por investigar. Es necesario que se especifique el espacio y el tiempo al que
se refiere el recuento.
Por ejemplo, el 22 de octubre del 2017 se realizaron los Censos Nacionales 2017: XII de Población, VII
de Vivienda y III de Comunidades Indígenas. Su finalidad es proveer información sobre la
composición, distribución geográfica y crecimiento de la población, los patrones de la concentración
urbana y rural, las características y servicios básicos de la vivienda para la ejecución de las políticas
públicas.
Muestreo
Cuando se opta por una investigación usando una muestra en vez de la población, el estudio
estadístico comprende por lo menos cuatro etapas:
Por ejemplo, la Asociación Peruana de Empresas de Investigación realizaba una encuesta para
determinar el nivel socioeconómico de una persona. Hoy en día, ya no encuesta, sino más bien usa la
Encuesta Nacional de Hogares (ENAHO) realizada por el Instituto Nacional de Estadística e
Informática (INEI).
Marco muestral
Para el desarrollo de la investigación se consideró como marco muestral:
La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI).
Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de
mayor crecimiento de la ciudad (conos)
Tamaño de la muestra
Se entrevistó a un total de 3 598 hogares distribuidos en 41 distritos.
El margen de error máximo probable con un nivel de confianza del 95,1% y considerando el
máximo de dispersión (p = q = 0,5) fue de ± 1,63%.
Dentro de esta muestra se realizaron 200 entrevistas en Distritos con predominio de los N.S.E.
Muy Alto/Alto con el propósito de obtener una submuestra estadísticamente significativa para
este segmento.
El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de cada
uno de los distritos de Lima Metropolitana.
Selección de la muestra
Determinada la cantidad de entrevistas a aplicar por distrito, se
procedió a sortear tantas manzanas como entrevistas se
requerían.
Dentro de cada manzana se seleccionó por un sistema aleatorio simple cinco viviendas: una
vivienda titular y cuatro viviendas suplentes. Los hogares titulares fueron visitados hasta en tres
oportunidades antes de proceder al reemplazo. Se controló que la tasa de reemplazo no
excediera el 10% del total de entrevistas originalmente sorteadas.
191
UPC MA444 Estadística
Muestreo probabilístico
Ejemplo 1
Por ejemplo, en un problema nos dicen que elijamos las columnas C 10, C7, C5 y C16.
Si el tamaño de la población N = 87, esto implica que el número mayor 87 tiene dos cifras
significativas.
La primera columna elegida será C10 y usaremos una columna adicional a la derecha para
completar la cantidad de dígitos que tiene la población. Es decir, usaremos C 10C11 para elegir
números del 1 al 87 inclusive sin reemplazo.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
Si el tamaño de la población N = 550, esto implica que el número mayor 550 tiene tres cifras
significativas.
La primera columna elegida será C10 y usaremos dos columnas adicionales a la derecha para
completar la cantidad de dígitos que tiene la población. Es decir, usaremos C 10C11C12 y elegir
números del 1 al 550 inclusive sin reemplazo.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
193
UPC MA444 Estadística
194
UPC MA444 Estadística
Una empresa de tiene un total de 150 empleados y ha registrado información acerca de las variables:
ingreso mensual, en soles (Ingreso) y años cumplidos en la empresa (Años).
a. Seleccione una muestra de 16 trabajadores usando muestreo simple aleatorio. Elabore un listado
con el número seleccionado y el valor del ingreso mensual y años en la empresa. Use las
columnas C2, C7, C11 y C9 de la tabla de números aleatorios.
b. Con la muestra, estime e interprete las medidas de tendencia central para el ingreso mensual.
c. Con la muestra, estime e interprete el cuartil 1 para la variable años en la empresa.
196
UPC MA444 Estadística
Solución
a. Elabore un listado con el número seleccionado y el valor del ingreso mensual y años en la
empresa:
Posición
Ingreso mensual
Años en la empresa
Posición
Ingreso mensual
Años en la empresa
b. Con la muestra obtenida estime e interprete las medidas de tendencia central para la variable
ingreso mensual.
Media
Mediana
Moda
c. Con la muestra obtenida estime e interprete los cuartiles para la variable años en la empresa.
Años en la empresa
Años en la empresa
Cuartil 1
Ejemplo 3
El siguiente marco muestral muestra la información del total de usuarios de internet de una
determinada zona de un distrito de la ciudad capital. Las variables analizadas fueron las siguientes:
Marca de computadora portátil
Principales problemas con Internet
197
UPC MA444 Estadística
Número de computadoras con Internet en casa
Tiempo de navegación diaria en Internet (en minutos)
a. Se desea seleccionar una muestra de 10 usuarios de internet usando muestreo simple aleatorio.
Use las columnas C15, C1 y C8 de la tabla de números aleatorios para indicar la posición del
elemento seleccionado. Indique, además, el principal problema del usuario con Internet y el
tiempo diario de navegación, en minutos.
Posición
Problema
Tiempo (min.)
b. Con la muestra obtenida, estime el porcentaje de usuarios cuyo principal problema de Internet
es la baja velocidad en la señal.
c. Con la muestra obtenida, estime e interprete las medidas de tendencia central para el tiempo
diario de navegación.
199
UPC MA444 Estadística
Ejemplo 4
La empresa está interesada en saber si existe una alta rotación de su personal, debido a ello, el
departamento de Recursos Humanos ha hecho un censo. Los resultados se muestran a continuación:
Marco muestral
Número Permanencia Grado de Remuneración
Posición Sexo Motivo de cese
de hijos (meses) instrucción bruta (soles)
1 M 0 26 Titulado 5000 Renuncia voluntaria
2 M 1 10 Titulado 12075 Renuncia voluntaria
3 M 0 11 Titulado 3000 Renuncia voluntaria
4 F 0 3 Titulado 1500 Renuncia voluntaria
5 M 0 2 Titulado 800 Renuncia voluntaria
6 M 0 28 Titulado 3000 Renuncia voluntaria
7 F 1 12 Post grado 5575 Renuncia voluntaria
8 F 1 32 Técnico completa 2000 Renuncia voluntaria
9 F 0 1 Técnico completa 2700 Renuncia voluntaria
10 F 0 0 Técnico completa 2575 Renuncia voluntaria
11 M 0 52 Titulado 12000 Renuncia voluntaria
12 F 0 0 Titulado 2000 Renuncia voluntaria
13 F 1 1 Titulado 3575 Renuncia voluntaria
14 M 0 15 Titulado 1500 Renuncia voluntaria
15 F 2 55 Post grado 5000 Renuncia voluntaria
16 F 0 2 Post grado 7500 Renuncia voluntaria
17 F 0 7 Titulado 2500 Renuncia voluntaria
18 F 1 1 Técnico completa 1500 Renuncia voluntaria
19 F 2 1 Post grado 4400 Renuncia voluntaria
20 F 2 10 Técnico completa 1985 Renuncia voluntaria
21 F 0 1 Titulado 3000 Renuncia voluntaria
22 F 0 5 Técnico completa 2200 Renuncia voluntaria
200
UPC MA444 Estadística
23 F 2 3 Técnico completa 2300 Renuncia voluntaria
24 F 0 20 Titulado 3085 Renuncia voluntaria
25 F 0 2 Técnico completa 1885 Renuncia voluntaria
26 F 2 23 Post grado 15085 Renuncia voluntaria
27 F 0 20 Titulado 3085 Renuncia voluntaria
28 F 0 2 Técnico completa 1885 Renuncia voluntaria
29 F 0 1 Técnico completa 1500 Renuncia voluntaria
30 F 0 1 Técnico completa 1500 Renuncia voluntaria
31 F 0 2 Técnico completa 1800 Renuncia voluntaria
32 F 0 2 Técnico completa 1800 Renuncia voluntaria
33 F 0 2 Titulado 2585 Renuncia voluntaria
34 F 0 3 Técnico completa 3000 Renuncia voluntaria
35 F 2 49 Post grado 6085 Renuncia voluntaria
36 M 0 33 Titulado 1800 Renuncia voluntaria
37 F 0 3 Técnico completa 950 Renuncia voluntaria
38 F 0 0 Técnico completa 1700 Renuncia voluntaria
39 F 0 0 Titulado 850 Renuncia voluntaria
40 F 0 6 Titulado 2800 Renuncia voluntaria
41 M 0 58 Titulado 2200 Renuncia voluntaria
42 F 1 26 Post grado 7000 Renuncia voluntaria
43 F 0 18 Titulado 1500 Renuncia voluntaria
44 M 0 7 Titulado 2000 Renuncia voluntaria
45 F 2 9 Titulado 3885 Renuncia voluntaria
46 F 1 9 Post grado 4585 Renuncia voluntaria
47 M 0 22 Titulado 1800 Renuncia voluntaria
48 F 0 41 Titulado 3300 Renuncia voluntaria
49 F 1 1 Titulado 2085 Renuncia voluntaria
50 F 1 3 Post grado 8085 Renuncia voluntaria
51 M 0 16 Post grado 1500 Renuncia voluntaria
52 F 0 2 Técnico completa 1200 Renuncia voluntaria
53 F 0 6 Titulado 2085 Renuncia voluntaria
54 F 0 5 Post grado 20000 Renuncia voluntaria
55 F 0 46 Técnico completa 2300 Renuncia voluntaria
56 M 0 10 Técnico completa 2000 Renuncia voluntaria
57 F 0 8 Técnico completa 2000 Término de contrato
58 F 0 1 Técnico completa 1500 Término de contrato
59 F 0 4 Técnico completa 1585 Término de contrato
60 F 0 7 Técnico completa 2300 Término de contrato
61 F 0 16 Técnico completa 1700 Término de contrato
62 F 0 7 Titulado 3000 Término de contrato
63 F 0 18 Titulado 1500 Término de contrato
64 M 0 19 Titulado 1500 Término de contrato
65 F 0 1 Técnico completa 2200 Término de contrato
66 F 1 1 Técnico completa 2500 Término de contrato
67 M 0 1 Técnico completa 2000 Término de contrato
68 F 0 14 Técnico completa 1200 Término de contrato
69 F 2 1 Titulado 2875 Término de contrato
70 M 0 1 Titulado 2000 Término de contrato
71 F 2 15 Titulado 2800 Término de contrato
72 F 1 2 Técnico completa 1600 Término de contrato
73 F 0 16 Técnico completa 2200 Término de contrato
74 F 0 25 Técnico completa 2800 Término de contrato
201
UPC MA444 Estadística
75 F 0 8 Titulado 3500 Término de contrato
76 F 1 4 Titulado 2300 Término de contrato
77 F 0 3 Titulado 4085 Término de contrato
78 F 0 16 Titulado 1585 Término de contrato
79 F 0 1 Técnico completa 1500 Término de contrato
80 F 2 4 Técnico completa 2000 Término de contrato
81 F 2 4 Técnico completa 2500 Término de contrato
82 F 2 38 Titulado 2500 Término de contrato
83 F 2 19 Titulado 2000 Término de contrato
84 F 2 59 Post grado 4085 Término de contrato
85 F 2 9 Titulado 2500 Término de contrato
a. Se desea seleccionar una muestra de 11 trabajadores usando muestreo simple aleatorio. Use las
columnas C13, C14 y C5 de la tabla de números aleatorios para indicar la posición del elemento
seleccionado. Indique, además, el motivo del cese y el número de hijos de cada trabajador.
Posición
Motivo
Número de hijos
Remuneración bruta
b. Con la muestra obtenida, estime el porcentaje de trabajadores cuyo motivo de cese fue por
renuncia voluntaria y el porcentaje de trabajadores que tienen hijos.
c. Con la muestra obtenida, estime e interprete el valor del cuartil 3 para la variable remuneración
bruta, en soles.
d. Con la muestra obtenida, estime e interprete el valor de las medidas de tendencia central para la
variable remuneración bruta, en soles.
202
UPC MA444 Estadística
203
UPC MA444 Estadística
Margen de error
Es la diferencia entre un estadístico y su parámetro correspondiente. Nos da una idea clara de hasta
dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se
hubiera obtenido por medio de un censo completo. Un estadístico será más preciso cuando su error
sea más pequeño.
Nivel de confianza
Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al verdadero
valor del parámetro.
Varianza poblacional
Cuando una población es más homogénea la varianza es menor y el número de entrevistas
necesarias será más pequeño. Cuando no se dispone del valor de la varianza de la población, ésta
puede ser estimada a partir de una muestra preliminar o piloto.
(( ))
2
Z α
.s
1−
2
n=
e
Para realizar la estimación del promedio, es necesario determinar, en primer lugar, ¿a cuántas
unidades elementales debemos entrevistar?
Para seleccionar a las n unidades elementales usaremos muestreo aleatorio simple. La tabla de números
aleatorios nos permitirá seleccionar a estos elementos.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
Se tiene una población de 108 trabajadores de una empresa y se desea estimar el tiempo promedio
de servicio a partir de una muestra elegida al azar por muestreo aleatorio simple.
N = 108 trabajadores
( )
2
z ×s
n= (1−¿2 ) = 9,8 = … trabajadores
e
n=…
Posición
Trabajador (en la tabla de números X= …
aleatorios)
1
2
3
4
5
6
7
8
9
10
Promedio
207
UPC MA444 Estadística
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
210
UPC MA444 Estadística
Ejemplo 2
El jefe de la Oficina de Seguridad del distrito de San Martín de Porres desea realizar una estimación
de cuánto tiempo, en promedio, estarían dispuestos a permanecer en las charlas sobre rondas
vecinales los vecinos del distrito. En estudios anteriores se estimó que el tiempo medio era de 45,25
minutos con una varianza de 18,75 minutos 2, ¿A cuántas personas se debería entrevistar si se estima
un error máximo de 1,25 minutos y un nivel de confianza del 95%? Suponga que esta variable se
distribuye normalmente.
Solución
Como el nivel de confianza es el 95% entonces ( 1−α )=0,95. Por lo tanto, α = 0,05.
α 0,05
1− =1− =0,975.
2 2
Buscamos dentro de la tabla el valor más cercano a 0,975 y desde este valor salimos a los bordes de
la tabla.
Z
El valor de (1− α2 )en la tabla normal estándar es Z 0,975=1,96.
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
(( ) )
2
Z α
×s
1−
2
n=
e
( )
2
1,96 × 4,33
n=
1,25
n=46,09
El valor del tamaño de muestra se redondea siempre al entero mayor, por lo tanto, se necesita
seleccionar a una muestra de 47 vecinos del distrito de San Martin de Porres.
211
UPC MA444 Estadística
Ejemplo 3
¿Cuál debe ser el tamaño de muestra si se desea estimar el tiempo promedio, en horas, que
demoran los estudiantes en llegar a la universidad con un nivel de confianza del 94% y con un error
de estimación de 0,1 horas? Una muestra piloto de 8 alumnos arrojó los siguientes resultados:
Ejemplo 4
La gerencia de un diario local desea estimar el gasto promedio mensual que las familias destinan a la
compra de diarios. La gerencia desea que sus resultados tengan un nivel de confianza del 95% y un
error de estimación no mayor a tres soles. Si la desviación estándar de los gastos en compra de
diarios en una muestra piloto fue de 20 soles ¿Qué tamaño de muestra deberá seleccionar?
212
UPC MA444 Estadística
Ejercicios propuestos
58. Se desea realizar una encuesta para estimar el número promedio de amigos que los jóvenes
tienen en su cuenta de Facebook. Con un error de estimación de cinco amigos y con un nivel de
confianza del 95%, determine el tamaño de muestra adecuado si en una muestra piloto se
obtuvo que el valor de la desviación estándar del número de amigos es igual a 42. Rpta:
272
59. El jefe de la oficina de seguridad del distrito de San Borja desea realizar una estimación de
cuánto tiempo, en promedio, estarían dispuestos a permanecer los vecinos escuchando charlas
sobre seguridad vecinal. En estudios anteriores se estimó que el tiempo promedio era de 45,25
minutos con una varianza de 18,75 minutos 2. ¿A cuántas personas se debería entrevistar si se
estima un error máximo de un minuto y una confianza del 95%? Suponga que esta variable se
distribuye normalmente. Rpta:
73
60. La máquina de refrescos de una universidad está ajustada de tal manera que la cantidad de
líquido despachada se distribuye aproximadamente en forma normal. ¿Qué tan grande se
requiere que sea la muestra si se desea tener una confianza de 98% de que su media muestral
esté dentro de 0,05 centilitros del promedio real? Se cuenta con la siguiente información de una
muestra preliminar o piloto de tamaño 24. Rpta:
60
1,99 1,98 2,04 1,97 2,18 2,04 2,13 2,03 2,08 2,72 2,04 2,09
2,11 2,13 2,14 1,98 2,29 2,02 1,94 1,82 2,02 2,10 2,19 2,13
61. Una editorial desea evaluar la media muestral del tiempo de distribución de su último best seller
en cada uno de sus 400 puntos de venta. Para este estudio se desea tener un error de
estimación de tres minutos con un nivel de confianza del 90%. Además, se sabe que la
desviación estándar de los tiempos de distribución es de 17 minutos. ¿Qué tamaño de muestra
debe emplearse para el estudio?
Rpta: 72
213
UPC MA444 Estadística
Para obtener la desviación estándar tomará una muestra piloto de ocho bolsas del almacén mediante
muestreo simple aleatorio.
Prueba de hipótesis
La prueba de hipótesis involucra una suposición acerca de un parámetro de la población. Después se
toma una muestra para ver si la hipótesis podría ser correcta. La hipótesis que contrastamos se llama
hipótesis nula ( H 0). La hipótesis nula se contrasta con la hipótesis alternativa ( H 1).
Luego, a partir de los resultados obtenidos de la muestra, o bien rechazamos la hipótesis nula a favor
de la alternativa, o bien no rechazamos la hipótesis nula y suponemos que nuestra estimación inicial
del parámetro poblacional podría ser correcta.
El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta. Significa simplemente que
los datos de la muestra son insuficientes para inducir un rechazo de la hipótesis nula.
Contraste de hipótesis
La hipótesis que se contrasta es rechazada o no en función de la información muestral. La hipótesis
alternativa se especifica como opción posible si se rechaza la nula.
Tipos de errores
Información muestral
No rechazar H0 Rechazar H0
H0 es cierta No hay error Error tipo I
La realidad
H0 es falsa Error tipo II No hay error
Error tipo I
Ocurre cuando se rechaza una hipótesis H 0 que es verdadera. La probabilidad de cometer error tipo I
viene a ser la probabilidad de rechazar H 0 cuando ésta es cierta.
El valor es fijado por la persona que realiza la investigación. Por lo general, 1%, 5% o 10%
Error tipo II
Ocurre cuando se acepta una hipótesis H 0 que es falsa, la probabilidad de cometer error tipo II es la
probabilidad de no rechazar H0 cuando ésta es falsa.
Debido a que el valor real del parámetro es desconocido este error no puede ser fijado.
215
UPC MA444 Estadística
Pasos para realizar una prueba de hipótesis
Paso 1
Paso 2
Paso 3
Paso 4
Paso 5
Paso 6
Concluir
216
UPC MA444 Estadística
Prueba de hipótesis para una media con varianza poblacional desconocida
1. Plantear las hipótesis
X−μ 0
T= t n−1 gl
S
√n
La tabla t Student necesita los datos: probabilidad (cola) y grados de libertad ( gl=n−1).
H 1 : μ< μ 0
Unilateral izquierda
Bilateral H 1 : μ ≠ μ0
Probabilidad (cola):
Bilateral H 1 : μ ≠ μ0
219
UPC MA444 Estadística
Ejemplo 2
La lucha contra el COVID-19 también se lleva a cabo con el uso de la tecnología. Esta vez, se ve
desarrollada en robots que ayudan a desinfectar habitaciones de hospitales y centros médicos. Este
robot usa lámparas germicidas de irradiación ultravioleta (UVGI). La clave de este robot para que
funcione de manera autónoma está en el software que registra la máquina vía wifi en el servidor del
centro médico. Con el uso de este robot, todas las estancias hospitalarias quedan libres de cualquier
virus, pues con este método destruye tanto el ADN como el ARN que es donde justamente se
encuentra la programación genética de los virus y bacterias.
La clínica El Porvenir desea adquirir estos equipos para la desinfección de sus áreas. Pero el jefe de
adquisiciones sospecha que el promedio de los datos consumidos por el robot del modelo ASEPT-2X
es de 20 GB. Para confirmar esta suposición eligió una muestra de 10 robots de este modelo. Los
datos se presentan a continuación:
16 16 20 19 18 16 22 19 23 22
De confirmarse la sospecha, pedirá un lote previo de cinco robots con el fin de no congestionar la red
inalámbrica de la clínica. Use un nivel de significación es α =¿ 0,05.
Solución
Interpretación
Determinar si se debe adquirir un lote previo de cinco robots con el fin de no congestionar la red
inalámbrica de la clínica
Representación
Cálculo
El valor del estadístico de prueba es:
x −μ o 19,1−20
t c= = =−1,076
s 2,644
√n √10
La prueba es bilateral pues H 1 : μ ≠ μ0.
-2,26216 2,26216
0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
6 0.26483 0.55338 0.90570 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743 6
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948 7
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539 8
9 0.26096 0.54348 0.88340 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.57380 2.82144 3.24984 9
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927 10
Análisis
Como t c =−1,076>−2,26216 ; entonces no se rechaza H0. Con un nivel de significación del 5%, es
posible afirmar que el consumo promedio de los datos que usan los robots es igual a 20 GB.
Argumentación
El jefe de adquisiciones sí deberá adquirir el lote previo de cinco robots del modelo ASEPT-2X.
221
UPC MA444 Estadística
Tabla de la distribución t-Student
0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1 0.32492 0.72654 1.37638 1.96261 3.07768 6.31375 7.91582 10.57889 12.7062 15.89454 21.20495 31.82052 63.65674 1
2 0.28868 0.61721 1.06066 1.38621 1.88562 2.91999 3.31976 3.89643 4.30265 4.84873 5.64278 6.96456 9.92484 2
3 0.27667 0.58439 0.97847 1.24978 1.63774 2.35336 2.60543 2.95051 3.18245 3.48191 3.89605 4.54070 5.84091 3
4 0.27072 0.56865 0.94096 1.18957 1.53321 2.13185 2.33287 2.60076 2.77645 2.99853 3.29763 3.74695 4.60409 4
5 0.26718 0.55943 0.91954 1.15577 1.47588 2.01505 2.19096 2.42158 2.57058 2.75651 3.00287 3.36493 4.03214 5
6 0.26483 0.55338 0.90570 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743 6
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948 7
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539 8
9 0.26096 0.54348 0.88340 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.57380 2.82144 3.24984 9
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927 10
11 0.25956 0.53994 0.87553 1.08767 1.36343 1.79588 1.92843 2.09614 2.20099 2.32814 2.49066 2.71808 3.10581 11
12 0.25903 0.53862 0.87261 1.08321 1.35622 1.78229 1.91231 2.07644 2.17881 2.30272 2.46070 2.68100 3.05454 12
13 0.25859 0.5375 0.87015 1.07947 1.35017 1.77093 1.89887 2.06004 2.16037 2.2816 2.43585 2.65031 3.01228 13
14 0.25821 0.53655 0.86805 1.07628 1.34503 1.76131 1.8875 2.04617 2.14479 2.26378 2.4149 2.62449 2.97684 14
15 0.25789 0.53573 0.86624 1.07353 1.34061 1.75305 1.87774 2.03429 2.13145 2.24854 2.39701 2.60248 2.94671 15
16 0.25760 0.53501 0.86467 1.07114 1.33676 1.74588 1.86928 2.02400 2.11991 2.23536 2.38155 2.58349 2.92078 16
17 0.25735 0.53438 0.86328 1.06903 1.33338 1.73961 1.86187 2.01500 2.10982 2.22385 2.36805 2.56693 2.89823 17
18 0.25712 0.53382 0.86205 1.06717 1.33039 1.73406 1.85534 2.00707 2.10092 2.21370 2.35618 2.55238 2.87844 18
19 0.25692 0.53331 0.86095 1.06551 1.32773 1.72913 1.84953 2.00002 2.09302 2.20470 2.34565 2.53948 2.86093 19
20 0.25674 0.53286 0.85996 1.06402 1.32534 1.72472 1.84433 1.99371 2.08596 2.19666 2.33624 2.52798 2.84534 20
21 0.25658 0.53246 0.85907 1.06267 1.32319 1.72074 1.83965 1.98804 2.07961 2.18943 2.32779 2.51765 2.83136 21
22 0.25643 0.53208 0.85827 1.06145 1.32124 1.71714 1.83542 1.98291 2.07387 2.18289 2.32016 2.50832 2.81876 22
23 0.25630 0.53175 0.85753 1.06034 1.31946 1.71387 1.83157 1.97825 2.06866 2.17696 2.31323 2.49987 2.80734 23
24 0.25617 0.53144 0.85686 1.05932 1.31784 1.71088 1.82805 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694 24
25 0.25606 0.53115 0.85624 1.05838 1.31635 1.70814 1.82483 1.97010 2.05954 2.16659 2.30113 2.48511 2.78744 25
26 0.25595 0.53089 0.85567 1.05752 1.31497 1.70562 1.82186 1.96651 2.05553 2.16203 2.29581 2.47863 2.77871 26
27 0.25586 0.53065 0.85514 1.05673 1.3137 1.70329 1.81913 1.96320 2.05183 2.15782 2.29091 2.47266 2.77068 27
28 0.25577 0.53042 0.85465 1.05599 1.31253 1.70113 1.81659 1.96014 2.04841 2.15393 2.28638 2.46714 2.76326 28
29 0.25568 0.53021 0.85419 1.0553 1.31143 1.69913 1.81424 1.95729 2.04523 2.15033 2.28217 2.46202 2.75639 29
30 0.25561 0.53002 0.85377 1.05466 1.31042 1.69726 1.81205 1.95465 2.04227 2.14697 2.27826 2.45726 2.75000 30
31 0.25553 0.52984 0.85337 1.05406 1.30946 1.69552 1.81000 1.95218 2.03951 2.14383 2.27461 2.45282 2.74404 31
32 0.25546 0.52967 0.85300 1.05350 1.30857 1.69389 1.80809 1.94987 2.03693 2.14090 2.27120 2.44868 2.73848 32
33 0.25540 0.5295 0.85265 1.05298 1.30774 1.69236 1.80629 1.9477 2.03452 2.13816 2.26801 2.44479 2.73328 33
34 0.25534 0.52935 0.85232 1.05248 1.30695 1.69092 1.80461 1.94567 2.03224 2.13558 2.26501 2.44115 2.72839 34
35 0.25528 0.52921 0.85201 1.05202 1.30621 1.68957 1.80302 1.94375 2.03011 2.13316 2.26219 2.43772 2.72381 35
36 0.25523 0.52908 0.85172 1.05158 1.30551 1.6883 1.80153 1.94195 2.02809 2.13087 2.25953 2.43449 2.71948 36
37 0.25518 0.52895 0.85144 1.05117 1.30485 1.68709 1.80012 1.94024 2.02619 2.12871 2.25702 2.43145 2.71541 37
38 0.25513 0.52883 0.85118 1.05077 1.30423 1.68595 1.79878 1.93863 2.02439 2.12667 2.25465 2.42857 2.71156 38
39 0.25508 0.52871 0.85094 1.05040 1.30364 1.68488 1.79751 1.93711 2.02269 2.12474 2.25240 2.42584 2.70791 39
40 0.25504 0.52861 0.85070 1.05005 1.30308 1.68385 1.79631 1.93566 2.02108 2.12291 2.25027 2.42326 2.70446 40
222
UPC MA444 Estadística
Ejemplo 3
Se sabe que el rendimiento promedio (en porcentaje) de un proceso químico es 12. Sin embargo,
últimamente se observa muchos valores menores. Para comprobar que efectivamente el
rendimiento promedio ha disminuido, se toma una muestra aleatoria de un lote de materia prima y
se registra las siguientes observaciones:
9,7 12,8 8,7 13,4 8,3 11,7 10,7 8,1 9,1 10,5
62. Las bombillas LED poseen un rendimiento promedio luminoso superior a todas las tecnologías
existentes. La empresa Solari afirma que el rendimiento luminoso de las bombillas LED que
produce es de 70 lumens/watio. Sin embargo, debido a la competencia en el mercado, introduce
nuevos cambios en su tecnología con la finalidad de lograr un mejor rendimiento.
Para poder comprobar los nuevos resultados, toma una muestra aleatoria de 61 bombillas
actuales, sometiéndolas a pruebas rigurosas, obteniendo un promedio de 75 lumens/watio y
una desviación estándar de 6,8 lumens/watio. Con un nivel de significación del 4%, ¿Se puede
afirmar que los nuevos cambios mejoraron el rendimiento promedio luminoso de las bombillas
LED?
63. Cierto fabricante de motocicletas anuncia en un comercial de televisión que su vehículo rendirá
en promedio 87 millas por galón. Los millajes (recorrido en millas) en ocho viajes prolongados
fueron:
88 82 81 87 80 78 79 89
64. La densidad de ciertos fluidos es muy volátil por lo que se requiere que la densidad promedio
sobrepase al valor de 0,031 para poder utilizarlo. La empresa 3C Ingenieros, encargada de
realizar los análisis fisicoquímicos, debe evaluar la densidad de la sustancia XP90.
0,033 0,040 0,031 0,034 0,036 0,031 0,036 0,034 0,034 0,032
65. Una de las últimas innovaciones en el campo de la iluminación es el proyector de cabeza móvil.
Este proyector está compuesto por un foco halógeno que permite variar la intensidad luminosa.
El gerente de ventas de la empresa Visual Systems ha decidido este año exportar este novedoso
proyector si la intensidad luminosa promedio de estos proyectores es superior a 2600 lúmenes.
2600 2800 3000 2000 2400 2800 2700 2600 3000 3200 3100 2500
Suponiendo que la intensidad luminosa tiene distribución normal ¿Visual Systems deberá decidir
realizar la exportación del lote? Use un nivel de significación de 3%.
66. Según las últimas investigaciones en hidrografía, los ingenieros civiles usan actualmente
telémetros de láser manuales de bajo peso debido a su gran precisión al momento de realizar
una medición.
224
UPC MA444 Estadística
Un ingeniero civil de una importante constructora está encargado de analizar la eficiencia de
una marca de estos aparatos, por lo que decide realizar pruebas con este equipo, obteniendo los
siguientes resultados del error de lectura, en milímetros, en la localización de un objeto situado
a 500 metros.
La calibración de un telemetro juega un papel muy importante en la exactitud de una medida. Si,
en promedio, los errores de lectura sobrepasan los 5 mm, estaríamos en una sobreestimación de
la lectura, por lo que debería ser devuelto al laboratorio de calibración para su ajuste. Usando la
información de la muestra ¿el telémetro debería ir al laboratorio de recalibración? Use un nivel
de significación del 4%.
67. Los drones tienen un accesorio en su fabricación llamado acelerómetro. Este accesorio registra
las variaciones de aceleración o velocidad en el aire. La norma de la Agencia Estatal de Seguridad
Aérea indica que la velocidad promedio que debe alcanzar un dron en áreas urbanas no debe
sobrepasar los 20,5 metros/segundo. Por lo tanto, ante la sospecha que no se está cumpliendo
con la norma, se seleccionaron al azar 42 drones y se realizó una prueba para medir sus
velocidades. A continuación, se presentan los resultados:
¿Se puede afirmar que no se está cumpliendo con la norma? Use un nivel de significancia del 1%.
225
UPC MA444 Estadística
El jefe de Control de calidad ordena realizar el estudio de la longitud de las barras de acero ASTM
A615-grado 60, las cuales deben tener una longitud estándar de nueve metros. Según reclamos, los
clientes manifiestan que la longitud es menor a dicho valor. De ser cierto, procederá a regular las
máquinas cortadoras de las barras de acero. Para ello, seleccionó una muestra aleatoria de 20 barras
de acero ASTM A615- grado 60. Con 5% de significación, ¿se procederá con la regulación de las
máquinas cortadoras de barras de acero? Utilice las cinco dimensiones para la solución del caso.
8,90 8,91 8,92 8,93 8,93 8,94 8,95 8,95 8,97 8,98
8,99 8,99 8,99 9,01 9,02 9,02 9,03 9,04 9,05 9,06
226
UPC MA444 Estadística
Prueba de hipótesis para una proporción poblacional
1. Plantear las hipótesis.
√ p o (1− p o)
n
Bilateral H 1 : p ≠ p0
6. Realizar la conclusión.
227
UPC MA444 Estadística
228
UPC MA444 Estadística
Ejemplo 1
Kubick S.A. es una empresa que fabrica y comercializa termas de uso doméstico e industrial. Debido a
los constantes reclamos presentados por los clientes sobre el mal funcionamiento de las termas a
gas, el ingeniero de planta sostiene que el porcentaje de unidades defectuosas producidas debe ser a
lo más 4%. Si esto no se cumple, se implementará un programa de capacitación a los trabajadores. A
partir de una muestra aleatoria de 150 termas a gas donde se encontró que 12 de ellas están
defectuosas. Usando un nivel de significación del 4%, ¿se llevará a cabo el programa de capacitación?
Solución
Interpretación
Determinar si se implementará un programa de capacitación para los trabajadores.
Representación
Variable: Funcionamiento de las termas a gas (buen funcionamiento, mal funcionamiento)
Parámetro: Proporción poblacional de terma a gas con mal funcionamiento
Herramienta: Prueba de hipótesis de la proporción
H0 p ≤ 0,04
H1 p>0,04
Cálculo
La proporción muestral de terma a gas con mal funcionamiento es:
12
^p= =0,08
150
^p −p 0 (0,08−0,04)
Z= = =2,5
√ p 0 ( 1− p0 )
n √ 0,04(1−0,04)
150
1,75
229
UPC MA444 Estadística
Análisis
Como Z calc = 2,5 > Z crítico = 1,75; se rechaza H0.
Conclusión
Con un nivel de significación del 4% es posible afirmar que el porcentaje de termas a gas defectuosas
es mayor al 4%.
Argumentación
Se sugiere implementar un programa de capacitación para los trabajadores de las plantas de la
empresa Kubick.
Ejemplo 2
El jefe de control de calidad de Whitney Motor está preocupado porque las máquinas de controlador
electrónico de motor (CEM), que fabrican, no se les ha dado el mantenimiento programado, y supone
que el porcentaje de CEMs con algún defecto de fabricación es superior a 20%. De ser cierta su
suposición, deberá detener el proceso de producción y realizar mantenimiento a dichas máquinas.
Para comprobarlo se seleccionó una muestra de 55 CEMs. Los resultados obtenidos del estado de
fabricación se presentan a continuación:
Defectuoso
13
Normal
42
¿Qué decisión tomará el jefe de control de calidad? Use un nivel de significación del 5%.
Solución
Interpretación
Representación
H0 p ≤ 0,20
H1 p>0,20
Cálculo
13
^p= =0,2364
55
^p −p 0,2364−0,20
Z= = =0,6749
√ p (1− p)
n √ 0,20(1−0,20)
55
Análisis
1,65
Como Z calc=¿ 0,6749 < Z critico = 1,65; no se rechaza H0. Con un nivel de significancia de 5%, no es
posible afirmar que el porcentaje de CEMs con algún defecto de fabricación es superior al 20%.
Argumentación
Ejemplo 3
La Municipalidad de Lima ampliará el presupuesto para fiscalizar las obras de la ciudad de Lima si
más del 30% de estas obras no cumplen o cumplen parcialmente con las normas de seguridad y
acabados en las obras de construcción civil. Al selecciona al azar una muestra de 94 obras de la
ciudad se obtuvo el siguiente gráfico:
60
50
40
30 22
20
8
10
0
No cumplen Cumplen parcialmente Cumplen totalemnte
Con un nivel de significación del 2% y asumiendo normalidad, ¿la Municipalidad de Lima ampliará el
presupuesto para fiscalizar las obras de construcción civil de la ciudad?
232
UPC MA444 Estadística
Ejemplo 4
Un fabricante sostiene que al menos el 95% de los equipos que envía a una fábrica está acorde con
las especificaciones técnicas. Una revisión de una muestra de 200 piezas reveló que 18 estaban
defectuosas. Asumiendo normalidad, pruebe la afirmación del fabricante al nivel de significancia de
1%.
233
UPC MA444 Estadística
Ejercicios propuestos
70. Una encuestadora realizó una consulta a los pobladores de la urbanización Lomas para saber si
están de acuerdo o no con la construcción de un nuevo centro comercial en el lugar. Al
seleccionar una muestra al azar de 250 pobladores de dicha urbanización, se obtuvo que 85 de
ellos apoyaban la construcción del nuevo centro comercial. La construcción empezará solo si
más del 30% de los ciudadanos apoyan el proyecto, de lo contrario se debe optar por otras
234
UPC MA444 Estadística
urbanizaciones vecinas. Realice la prueba estadística respectiva a un nivel de significación del
3%.
71. Los usuarios de la sustancia XP90 indican que cuando esta sustancia no es óptima ocurre un
fenómeno conocido como licuefacción y se requiere un reproceso. La certificadora, encargada
de la realización de los análisis fisicoquímicos, asegura que la proporción de reprocesos
disminuye cuando la sustancia está certificada por lo tanto una de las metas de la empresa es
tener más del 20% de sustancias certificadas. De una muestra de 120 reprocesos se identificó
que 26 usaron sustancias certificadas. En base a esta información podemos afirmar que ¿la
empresa ha logrado la meta? Use un nivel de significación del 3%.
235
UPC MA444 Estadística
Prueba de hipótesis para la razón de varianzas poblacionales
1. Plantear las hipótesis
2 2
¿ H 0 : σ 1=σ 2
¿ H 1 : σ 21 ≠ σ 22
2
S1 1
F c= 2
. 2
F (n −1 , n −1 )
S 2 σ2 1 2
2
σ1
Donde:
1
F 1=
F (α ¿¿ 2; n −1 , n −1¿ )¿ ¿
2 1
F 2=F(¿ α )¿
; n 1−1 , n 2−1
2
6. Realizar la conclusión.
236
UPC MA444 Estadística
Ejemplo 1
La producción de compuestos inflamables es delicada y requiere técnicas muy precisas para lograr
resultados óptimos. Actualmente, en el laboratorio se aplica la técnica A y se desea probar una nueva
técnica, B. La siguiente información muestra el resultado de los tiempos, en minutos, que utilizó cada
técnica por proceso.
Un ingeniero desea probar si la variabilidad entre los tiempos usados por ambas técnicas no es
similar. Use = 0,05
¿ H 0 : σ 21=σ 22
2 2
¿ H1: σ 1≠ σ2
2
S1 6,562
F c= 2
= 2
=10,24
S2 2,05
donde:
1
F 1=
F ( α2 ; n −1 , n −1)
2 1
1 1
¿ = =0,3268
F ( 0,025 ;10 ; 15 ) 3,06
237
UPC MA444 Estadística
0.050 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54
0.025 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06
0.010 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80
0.005 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42
v1
α v2 12 15 20 24 30 40 50 60 70 120
0.050 10 2.91 2.85 2.77 2.74 2.70 2.66 2.64 2.62 2.61 2.58
0.025 3.62 3.52 3.42 3.37 3.31 3.26 3.22 3.20 3.18 3.14
0.010 4.71 4.56 4.41 4.33 4.25 4.17 4.12 4.08 4.06 4.00
0.005 5.66 5.47 5.27 5.17 5.07 4.97 4.90 4.86 4.83 4.75
6. Realizar la conclusión.
Con un nivel de significancia del 5%, sí es posible afirmar que la variabilidad entre los tiempos
usados por ambas técnicas no es similar.
238
UPC MA444 Estadística
Prueba de hipótesis para la diferencia de medias poblacionales
( x1 −x2 ) −(μ1 −μ 2)
t c= t (n +n −2)
√ ( )
1 2
2 1 1
S p +
n1 n 2
2
Calcular el valor de la varianza combinada S p .
2 2
(n1−1)S1 +(n2−1)S 2
S2p=
n1+ n2−2
−t α ;n +n −2
1 2
239
UPC MA444 Estadística
Bilateral H 1 : μ 1−μ2 ≠ k
−t α tα
; n 1+n2−2 ; n1 +n2−2
2 2
t α ; n +n −2
1 2
6. Realizar la conclusión.
( x1 −x2 ) −( μ1 −μ 2)
t c=
√ S 21 S 22
+
n1 n 2
( )
2 2 2
S 1 S2
+
n 1 n2
υ=
( ) ( )
2 2
S 21 S 22
n1 n2
+
( n1−1 ) ( n2−1 )
El valor de v debe ser un valor entero y deberá redondearse al entero menor. Por ejemplo, si v =
18,12608, entonces v = 18.
−t α ;v
Bilateral H 1 : μ 1−μ2 ≠ k
−t α tα
;v ;v
2 2
t α; v
6. Realizar la conclusión.
241
UPC MA444 Estadística
Ejemplo 1
Para determinar la concentración de partículas de nitrato en el aire en dos centros poblados, Larrea
(Pasco) y San Marcos (Ancash), cuya principal actividad económica es la minería, se tomaron 8
muestras de aire en Larrea y 6 muestras de aire en San Marcos. Los resultados se muestran a
continuación:
El Ministerio del Medio Ambiente, desea realizar una inspección exhaustiva de la calidad de aire que
respiran los habitantes de estos centros poblados, pero por cuestiones de presupuesto solo podrá
realizarlo en el centro poblado de Larrea, siempre y cuando se llegue a demostrar que la
concentración promedio de nitrato es mayor que en el centro poblado de San Marcos; caso
contrario, se esperará el próximo año para inspeccionar los dos centros poblados. Usando un nivel de
significancia 5%. ¿Cuál será la decisión que tomará el Ministerio de Medio Ambiente?
Solución
Resolviendo con las cinco dimensiones:
Interpretación
Determinar si el Ministerio de Medio Ambiente realizará una inspección exhaustiva de la calidad de
aire que respiran los habitantes de los centros poblados de Larrea y San Marcos; caso contrario, se
esperará el próximo año para inspeccionar los dos centros poblados.
Representación
Variable: Concentración de nitrato (fibra/litro)
Variable de agrupación: Centro poblado: Larrea (1) San Marcos (2)
Herramienta estadística: Prueba de hipótesis para la diferencia de medias y prueba de
hipótesis para la razón de varianzas
Cálculo
Para establecer cuál es el estadístico de prueba adecuado para la prueba de diferencia de medias
poblacionales, debemos realizar primero una prueba de razón de varianzas para determinar si
consideramos que las varianzas poblacionales son iguales o diferentes.
2 2
H 0 :σ 1=σ 2
2 2
H 1: σ1≠ σ 2
Donde:
1 1 1
F 1= = = =0,1890
Fα F 0,025;5 ;7 5,29
;n2−1 ,n1−1
2
F 2=F0,025 ;7 ;5 =6,85
Conclusión
Con un nivel de significancia de 5%, es posible afirmar que las varianzas poblacionales son
heterogéneas.
H 0 μ1≤ μ2
H 1 μ1 > μ2
H 0 μ 1−μ2 ≤ 0
H 1 μ1−μ 2> 0
De acuerdo con la prueba de razón de varianzas, se acepta de las varianzas poblacionales son
heterogéneas, por lo tanto, el estadístico de la prueba adecuado para la diferencia de medias es:
243
UPC MA444 Estadística
( x 1−x 2 )−k
t cal=
√ S21 S22
+
n1 n2
( 0,04806−0,03286 )−0
t cal= =6,83
√ 0,006102 0,001352
8
+
6
( )
2
S 21 S22
+
n 1 n2
υ=
( ) ( )
2 2
S 21 S 22
n1 n2
+
( n1−1 ) ( n2−1 )
( )
2 2 2
0,00610 0,00135
+
8 6
υ= =7,90
( ) ( )
2 2
0,006102 0,001352
8 6
+
( 8−1 ) ( 6−1 )
1,89458
υ 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015
6 0.26483 0.55338 0.9057 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381
Análisis
Conclusión
A un nivel de confianza de 5%, existe evidencia estadística suficiente para afirmar que la
concentración promedio de nitrato en Larrea es mayor que en San Marcos.
Argumentación
Debido a que la concentración promedio de nitrato en Larrea es mayor que en San Marcos, el
Ministerio de Medio Ambiente realizará una inspección exhaustiva de la calidad de aire en el centro
poblado de Larrea.
Ejemplo 2
El jefe del área de mantenimiento enviará personal de la zona norte a la zona centro cuando los
costos de mano de obra en la zona centro superen a los costos en la zona norte. Para decidir, use un
nivel de significación del 4%. Asuma que los costos se distribuyen normalmente y que las varianzas
poblacionales son desconocidas y homogéneas.
Ejemplo 3
Un componente de los satélites son los paneles solares. La compañía Intel está probando dos tipos
de paneles solares: el EQM y el EM3, los cuales deben pasar un estricto control de calidad. Según
información del departamento de calidad si la potencia de los paneles solares EQM supera en más de
dos kW a los de EM3, se sugiere dejar de fabricar el modelo EM3.
El jefe de producción seleccionó al azar dos muestras de paneles de ambos modelos y registra las
potencias de estos. A continuación, se presenta la siguiente información:
Considerando que la potencia se distribuye normalmente, con un nivel de significación del 5%, ¿se
debe dejar de fabricar el modelo EM3?
247
UPC MA444 Estadística
248
UPC MA444 Estadística
249
UPC MA444 Estadística
Ejercicios propuestos
72. Los siguientes datos corresponden a la resistencia a la compresión a los 28 días, en kg/cm 2,
reportados por dos laboratorios:
73. La exactitud obtenida en mediciones con GPS depende del equipo receptor. Uno de los
fabricantes de receptores está realizando un estudio para comparar la exactitud de dos
modelos, GPSMAP (1) y Oregón (2). Según información del departamento de control de calidad,
la exactitud del modelo GPSMAP es menor que la de Oregón, por lo cual se sugiere dejar de
fabricarla.
El jefe de producción seleccionó al azar dos muestras de receptores de ambos modelos con la
finalidad de realizar la prueba correspondiente y registra la exactitud, en mm, obtenida por
ambos receptores. Considerando que la exactitud se distribuye normalmente y con un nivel de
significación del 4%, ¿la empresa debe dejar de fabricar el modelo GPSMAP.
74. El tiempo de exposición, en minutos, de un metal con una sustancia química hasta lograr un
adherido perfecto es parte de un proceso de producción. Se considera que el menor tiempo de
exposición es mejor. Como parte de la mejora del proceso se somete a prueba dos
procedimientos y se mide el tiempo de exposición para dos muestras independientes.
a. Asumiendo que los tiempos de exposición tienen distribución normal, ¿se puede afirmar que hay
diferencia en la variación de los tiempos? Use un nivel de significación del 10%.
b. Asumiendo que los tiempos de exposición tienen distribución normal y usando un nivel de
significación del 5%, ¿recomendaría el procedimiento B?
250
UPC MA444 Estadística
El jefe del área de compra de materiales sospecha que el promedio de la resistencia a la flexión de las
columnas es mayor cuando se usan los fierros de procedencia nacional que cuando se usan los fierros
importados. De ser cierta su sospecha, elegirá fierros nacionales para la construcción. Para ello,
seleccionó al azar registros del último año de la resistencia a la flexión, en kg/cm 2, de las columnas
construidas con cada tipo de fierro obteniendo los siguientes resultados:
Sabiendo que la resistencia a flexión de las columnas se distribuye normalmente y que sus varianzas
poblacionales son homogéneas. A un nivel de significación del 5% ¿cuál será la decisión del jefe del
área de compra de materiales?
Diseño de experimentos
Un experimento diseñado es una prueba o serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada (factores controlables) de un proceso o sistema, de manera
que sea posible observar e identificar las causas de los cambios en la variable de salida (variable
respuesta).
Variable de entrada
(Factores Variable de salida
Proceso
controlables y no (Variable respuesta)
controlables)
Ejemplo 1
Se tienen dos poblaciones, una de alumnos que lleva el curso de Estadística en modalidad presencial
y otra de alumnos que lleva el curso en modalidad blended. Se quiere saber si la nota promedio de
los alumnos es similar en ambas modalidades.
¿µ1 = µ2?
n1 = 5
n2 = 10
Variable en estudio
Elemento
Parámetro
252
UPC MA444 Estadística
Herramienta estadística
253
UPC MA444 Estadística
Conceptos generales
Factor
Variable independiente que afecta los resultados del experimento: controlables o no controlables. En
un experimento se puede evaluar uno o más factores.
Tratamiento
Un tratamiento corresponde a los niveles de un factor o a la combinación de los niveles de dos o más
factores. Es un conjunto de procedimientos cuyo efecto sobre la variable respuesta nos interesa
estudiar. Su efecto se mide y se compara con otros tratamientos.
Variable respuesta
Es la variable en la cual se evaluarán los efectos de los tratamientos.
Unidad experimental
Es la unidad, sujeto u objeto, al el cual se le aplica un tratamiento.
Ejemplo 2
Se tienen ahora tres poblaciones, una de alumnos que lleva el curso de Estadística en modalidad
presencial, otra en modalidad blended y otra en modalidad online. Se quiere saber si la nota
promedio de los alumnos es similar en las tres modalidades.
¿µ1 = µ2 = µ3?
n1 = 5 n2 = 10 n3 = 5
254
UPC MA444 Estadística
Identifique los conceptos generales:
Herramienta estadística
A continuación, se presentan los datos recolectados, los mismos que se han tabulado en una matriz
de datos. El Y ij representa la variable en estudio, siendo i el tratamiento y j las repeticiones.
Tratamientos
Repeticiones
Tratamiento 1 Tratamiento 2 Tratamiento 3
1 Y 11 Y 21 Y 31
2 Y 12 Y 22 Y 32
3 Y 13 Y 23 Y 33
… … … …
j Y1j Y2j Y3j
… … … …
ni Y 1n 1
Y 2n 2
Y 3n 3
Total Y 1. Y 2. Y 3.
Ejemplo 3
El gerente de una compañía dedicada a ensamblar piezas de equipos electrónicos realizó un estudio
con el fin de comparar la eficacia de tres programas de capacitación, A, B y C. Para ello se asignaron
al azar quince empleados, cinco a cada uno de los tres programas. Después de terminado los cursos
de capacitación se registró el tiempo, en minutos, que les tomó ensamblar las piezas en los equipos
electrónicos.
Complete lo solicitado:
Variable respuesta
Factor
Tratamientos
Unidad experimental
255
UPC MA444 Estadística
256
UPC MA444 Estadística
Diseño completamente al azar
En el diseño completamente al azar (DCA) suponga que se cuenta con los resultados de k muestras
aleatorias independientes, cada una de tamaño ni , obtenidas desde k diferentes poblaciones y se
desea probar la hipótesis de que las medias de estas k poblaciones son todas iguales.
Las poblaciones que se desea comparar suelen ser producto de la aplicación de distintos
tratamientos a ciertas unidades de análisis.
En este caso:
Los cinco programas de incentivos serían los cinco tratamientos aplicados (los cuales definen las
cinco poblaciones que se van a comparar).
La unidad de análisis sería un trabajador (quien recibe el tratamiento).
Los datos para analizar pueden arreglarse en una tabla como la que se muestra a continuación:
Tratamientos
Repeticiones
Tratamiento 1 Tratamiento 2 … Tratamiento i … Tratamiento k
1 Y 11 Y 21 … Y i1 … Yk1
2 Y 12 Y 22 … Y i2 … Yk2
3 Y 13 Y 23 … Y i3 … Yk3
… … … … … … …
j Y1j Y2j … Y ij … Y kj
… … … … … … …
ni Y 1n 1
Y 2n 2
… Y in i
… Ykn k
Total Y 1. Y 2. … Y i. … Yk.
Para probar la hipótesis de la igualdad de las medias, se deben probar los siguientes supuestos:
H0 : σ 21=σ 22 ¿ σ 23=σ 24
2
H 1 : Al menosuna σ i es diferente ; i=1 , 2, 3 , 4
Como el p valor (P-value) es mayor al nivel de significancia α (0,988 > 0,05), no se rechaza H0, el
resultado de esta prueba indica que no hay suficiente evidencia estadística afirmar que alguna de las
varianzas poblacionales es diferente, es decir, se acepta que el supuesto de homogeneidad de
varianzas al 5% de nivel de significancia.
Como el p valor (P-value) es mayor al nivel de significancia α (0,150 > 0,05), no se rechaza H0, el
resultado de esta prueba indica que no hay suficiente evidencia estadística para afirmar que los
258
UPC MA444 Estadística
errores del modelo no tienen distribución normal, es decir se acepta el supuesto de normalidad al 5%
de nivel de significancia.
Observación
Ambos supuestos se han obtenido con el software Minitab. Para efectos del curso se asumirán
ambos supuestos.
donde:
y ij :=¿valor observado del i -ésimo tratamiento en la j -ésima repetición
μ :=¿efecto de la media poblacional
τi :=¿efecto del i -ésimo tratamiento
ε ij :=¿error experimental asociado a la observación y ij
Por ejemplo, podríamos usar en análisis de varianza para responder a las siguientes situaciones:
Una importante compañía de construcciones desea comparar tres marcas de taladros para
determinar cuánto tiempo pasa antes de necesitar una reparación; si los tiempos de vida de los
taladros de cada marca se distribuyen normalmente. ¿Las marcas de taladro tienen un tiempo de
vida útil promedio similar a las otras marcas antes de requerir una reparación?
Un ingeniero civil residente de una obra desea evaluar el efecto que tiene las técnicas de
mezclado de concreto sobre la resistencia (kg/cm 2) a la compresión. Para ello evalúa cuatro
técnicas diferentes y para realizar la prueba produce especímenes de concreto. ¿La resistencia
promedio a la compresión es la misma para cada técnica de mezclado?
Una empresa constructora brinda capacitación con diferentes métodos a sus operarios. ¿El
rendimiento promedio de los operarios en la empresa es el mismo según los métodos de
adiestramiento recibido por el operario?
Una importante compañía de construcciones desea comparar tres marcas de camiones antes de
ordenar toda una nueva flota de una clase de camión. ¿Los costos medios de operación por
kilómetro de cada camión es el mismo para cada marca de camión?
259
UPC MA444 Estadística
Análisis de la varianza
El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar tres o más
medias. Se desea medir el efecto del factor en estudio (variable independiente de naturaleza
cualitativa o cuantitativa) sobre la variable respuesta (variable dependiente de naturaleza
cuantitativa).
En un diseño completamente al azar (DCA) los tratamientos se asignan aleatoriamente a las unidades
experimentales.
ni ni
k k
y 2..
SCT =∑ ∑ ( y ij − y ) =∑ ∑
2 2
y−
ij
i=1 j=1 i=1 j=1 n.
Variación dentro de las muestras o variación intragrupos que denotaremos como SCTR.
260
UPC MA444 Estadística
k k 2 2
y i. y ..
SCTR=∑ ni ( y i− y ) =∑
2
−
i=1 i=1 ni n.
k ni
SCE=SCT−SCTR=∑ ∑ ( y ij − yi )
2
i=1 j=1
donde:
Entonces, se puede utilizar esta distribución para evaluar la hipótesis nula de que no hay diferencias
entre las medias de los tratamientos.
Hipótesis estadística
H0 : μ1 =μ 2=…=μk
H 1 : Al menosuna μi es diferente a los demás
H 0 es la afirmación de que no hay diferencia entre las medias poblacionales, es decir, que el
factor en estudio no afecta a la variable respuesta.
H 1 es la afirmación de que sí hay diferencia entre las medias poblacionales, es decir, que el
factor en estudio sí afecta a la variable respuesta.
CMTR
F c=
CME
Si F c ≤ F critico , no se rechaza H 0
Si F c > F critico , sí se rechaza H 0
6. Realizar la conclusión.
Ejemplo 1
La gerente de mercadeo de un banco planea poner en marcha cierto tipo de promociones para atraer
nuevos clientes en cuatro sucursales del banco. Ella está convencida que diferentes tipos de
promociones atraerán a personas de diferentes grupos de ingreso, por lo que, de haber diferencias
entre los ingresos medios de los clientes de cada sucursal, se optará por un programa de
promociones distinto para cada una.
Considere a los montos de los depósitos, en miles de soles, como una medida representativa de los
ingresos de los clientes. Se presentan datos para una muestra de siete depósitos de cada sucursal
¿Debe la gerente optar por un programa de promociones distinto para cada sucursal? Evalúe esta
posibilidad con un nivel de significación del 5%.
Solución
Variable respuesta
262
UPC MA444 Estadística
Factor
Tratamientos
Unidad experimental
H0 : μ1=μ 2=μ3
H 1 : Al menosuna μi es diferente a los demás; i=1 , 2 ,3
H 0 es la afirmación de que no hay diferencia entre las medias poblacionales, es decir, que el
factor en estudio no afecta a la variable respuesta.
H 1 es la afirmación de que sí hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio sí afecta a la variable respuesta.
(∑ ∑ )
k=4 7 2
2
y ij
y .. i=1 j=1 ( 27,3+23,8+25,8+ 23,1 )2 1002
TC = = = = =357,1429
n k=4
7+7+ 7+7 28
∑ ni
i=1
k= 4 7 2
y ..
SCT =∑ ∑ y ij − = ( 5,3 + 2,6 +…+ 4,1 )−357,1429=27,0171
2 2 2 2
i=1 j=1 n.
( )
k=4 2 2
y i . y .. 27,3 2 23,8 2 25,8 2 23,1 2
SCTR=∑ − = + + + −357,1429=1,568
i=1 ni n. 7 7 7 7
SCE=SCT−SCTR=27,0171−1,568=25,4486
F critico=F ;gl tratamientos ;gl error =F; k−1; n−k =F 0,05; 3; 24=3,01
v1
α
v2 1 2 3 4 5 6 7 8 9 10
0.050 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25
0.025 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64
0.010 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17
0.005 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59
6. Realizar la conclusión.
264
UPC MA444 Estadística
Al 5% de significación, no es posible afirmar que al menos un depósito promedio sea diferente a
los demás.
265
UPC MA444 Estadística
Método de comparaciones múltiples: Prueba de Tukey - Kramer
Se supone que el experimentador tiene a su disposición mediciones relativas a varios tratamientos. El
análisis de varianza indica si hay evidencias de que al menos una de las medias sea diferente o no.
Cuando se rechaza la hipótesis nula, el análisis de varianza no revela cuál o cuáles de las medias son
significativamente diferentes. En este caso, se debe utilizar otra prueba estadística.
Cuando el experimentador desea determinar todos los pares de medias que se puede concluir que
difieren de otro (µi versus µj) se utiliza la prueba de comparación múltiple de Tukey – Kramer, con el
fin de probar todas las hipótesis nulas simultáneas. Para fines de este curso se presentará la salida
obtenida con MINITAB.
Ejemplo 1
Croma Color S.A. es una empresa especializada en la comercialización de pinturas envasadas a nivel
industrial, comercial y residencial. El gerente de marketing propone lanzar una campaña publicitaria
para incrementar las ventas de las pinturas. La campaña publicitaria se lanzará en el distrito o
distritos donde las ventas promedio, sean menores. Para identificar el distrito dónde se lanzará la
campaña publicitaria, se registró el monto de venta, en miles de soles, de algunos meses del último
año tomados al azar. Los resultados se presentan a continuación:
¿En qué distrito o distritos se debe lanzar la campaña publicitaria? Utilice un nivel de significación del
1%.
Solución
Interpretación
Representación
Factor: Distrito
Tratamientos: Santa Anita, Breña, Ate
Variable respuesta: Monto de ventas de pintura envasada, en miles de soles
Unidad experimental: Un mes de venta de pintura envasada
Herramienta estadística: Usaremos la herramienta del diseño completamente al azar (DCA)
H0 : μ1=μ 2=μ3
H 1 : Al menosuna μi es diferente a las demás; i=1 , 2 ,3
Cálculo
Fuente de Suma de
Grados de libertad Cuadrados medio Fcalculado
variación cuadrados
2520 1260
Tratamientos k – 1=3−1=2 SCTR=2520 =1260 =10,5
2 120
1440
Error n−k =15−3=12 SCE=1440 =120
12
Total n−1=15−1=14 SCT =3960
Fuente de Suma de
Grados de libertad Cuadrado medio Fcalculado
variación cuadrados
Distritos 2 2520 1260 10,5
Error 12 1440 120
Total 14 3960
v1
α
v2 1 2 3 4 5 6 7 8 9 10
0.05
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75
0
0.02
6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37
5
0.01
9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30
0
0.00
11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09
5
Análisis
F calculado=10,5> F critico=3,89
Se puede observar que no hay diferencia significativa entre las ventas de los distritos de Ate y Santa
Anita. Los distritos con mayor monto promedio de ventas de pintura envasada son Ate y Santa Anita.
Por lo tanto, la empresa debe decidir por dichos distritos para lanzar la campaña publicitaria.
268
UPC MA444 Estadística
Argumentación
La campaña publicitaria se lanzará solo en el distrito de Breña, porque las ventas promedio de
pintura envasada son menores.
269
UPC MA444 Estadística
Ejemplo 2
Un ingeniero civil residente de una obra desea evaluar el efecto que tienen las técnicas de mezclado
de concreto sobre la resistencia (kg/cm 2) a la compresión. Para ello evalúa cuatro técnicas diferentes
y para realizar la prueba produce especímenes de concreto. La resistencia a la compresión del
concreto de cada técnica se distribuye normalmente y tienen la misma varianza. Los datos
recolectados son los siguientes:
a. Identifique:
Variable respuesta
Factor
Tratamientos
Unidad experimental
Error
Total
H0:
H1:
270
UPC MA444 Estadística
2. Establecer el nivel de significación: =
Como Fc = …………… …… Fcrit (…………; ………., ……….) = ……….….. entonces …….. rechaza H0.
5. Realizar la conclusión.
75. Una compañía que produce ladrillos efectuó un experimento para determinar si cuatro
temperaturas de cocción específicas, en °F, afectan la densidad de cierto tipo de ladrillo, en
gr/cm3. La densidad de los ladrillos para cada temperatura se distribuye normalmente y tienen la
misma varianza.
Temperaturas
100°F (1) 125°F (2) 150°F (3) 175°F (4)
19,9 21,7 20,9 21,8
19,7 21,4 20,8 21,9
19,8 21,5 20,8 21,7
19,7 21,5 20,6 21,6
20,0 21,7
Factor N Mean Grouping
175°F (4) 5 21.7400 A
125°F (2) 4 21.5250 A
150°F (3) 4 20.7750 B
100°F (1) 5 19.8200 C
Variable respuesta
Factor
Tratamientos
Unidad experimental
76. Una importante compañía de construcciones desea comparar tres marcas de taladros para
determinar cuánto tiempo pasa antes de necesitar una reparación. Los tiempos de vida de los
taladros de cada marca se distribuyen normalmente y tienen la misma varianza. Los datos de los
tiempos de vida útil, en decenas de horas, para cada marca se encuentran en la siguiente tabla:
a. Identifique:
Variable respuesta
Factor
Tratamientos
Unidad experimental
77. Un empresario debe elegir la alternativa más eficiente para fabricar un mismo producto. Se
analiza el costo por unidad, en soles, de tres alternativas. El costo por unidad para cada
alternativa se distribuye normalmente y tienen la misma varianza, ¿qué alternativa deberá
elegirse?
a. Pruebe si existe alguna diferencia significativa en los costos unitarios de las tres alternativas
de fabricación. Utilice nivel de significación de 5%.
b. Si existen diferencias, ¿entre qué grupos están las diferencias? Utilice nivel de significación
de 5%.
273
UPC MA444 Estadística
78. Importación Bombardera desea determinar si el tipo de chip (A, B, C) que tienen las laptops que
ellos importan influye en el tiempo de respuesta (microsegundos). El tiempo de respuesta para
cada tipo de chip se distribuye normalmente y tienen la misma varianza. Al probar cinco laptops
con cada tipo de chip, se obtuvieron los siguientes resultados, en microsegundos:
a. Al nivel de significancia del 5%, ¿la importadora puede concluir que hay diferencia en los
tiempos promedio de respuesta según el tipo de chip utilizado?
b. Si la prueba resulta significativa, ¿qué tipo de chip recomendaría utilizar?
79. Para determinar si la resistencia a la ruptura (libras/ pulg 2) difiere según el tipo de estructura, se
tomó al azar una muestra de zonas con estructura tipo cimientos, zonas con estructura tipo
terraplenes y zonas con estructura tipo excavación. Asuma que se cumplen los supuestos de
normalidad y de homogeneidad. Los resultados de la resistencia a la ruptura (libras/ pulg 2) se
presenta en el siguiente cuadro:
Variable respuesta
Factor
Tratamientos
Unidad experimental
274
UPC MA444 Estadística
b. Explique y fundamente, con un nivel de significación del 5%, ¿con qué tipo de estructura se
debería construir la represa?
La siguiente tabla contiene los resultados, medidos por área, en m 2, que se limpian en una hora:
¿Qué sistema o sistemas para limpiar manchas de grasa en departamentos es más efectiva de tal
manera que se pueda trabajar exclusivamente con dicho sistema? Asuma que se cumplen los
supuestos de normalidad y homogeneidad. Utilice un nivel de significación del 5%.
¿La velocidad de transferencia de datos de un disco duro depende de la velocidad en que giran
los discos del plato del disco duro o de su capacidad de almacenamiento?
¿El tiempo de ejecución de una obra civil depende del número de trabajadores o del índice de
automatización?
¿El tiempo de falla de los equipos electrónicos dependerá de la resistencia de los resistores?
¿El sueldo dependerá del grado de instrucción?
¿El tiempo de procesamiento de trabajos estará relacionado con el número de trabajos por día?
¿La temperatura está relacionada con la presión sobre el rendimiento de un producto químico?
Estas preguntas surgen cuando queremos estudiar dos variables de una población con el fin de
examinar la relación existente entre ellas. Las dos variables en estudio son variables cuantitativas que
nos permitirá construir una ecuación lineal que modela la relación existente entre estas dos
variables.
En el análisis de regresión la ecuación lineal puede usarse para estimar o predecir los valores de una
variable dependiente, llamada Y, cuando se conocen o se suponen conocidos los valores de otra
variable, variable independiente, llamada X.
El análisis de correlación permite determinar el grado de relación lineal existente entre dos variables.
Es útil en un trabajo exploratorio cuando el investigador desea encontrar el grado o la fuerza de esa
relación.
Y i=β 0 ± β1 X i +e i i=1 , 2 ,3 , … , n
Donde:
X :=¿ variable independiente
Y :=¿ variable dependiente
Se trabaja con variables de tipo cuantitativas, entre las cuales se puede establecer una relación
funcional.
Y =f ( X )
Variable dependiente
Variable independiente
Pendiente
Tipo de relación
Significado de la relación
Variable dependiente
Variable independiente
Pendiente
Tipo de relación
Significado de la relación
277
UPC MA444 Estadística
Diagrama de dispersión o gráfico del plot
El primer paso en el análisis de regresión es registrar simultáneamente los valores de las dos
variables asociadas ( X , Y ) en una gráfica bidimensional para ver si existe una tendencia lineal que
podría explicar la relación entre estas dos variables
La suma de las desviaciones verticales de los puntos con relación a la recta es cero.
La suma de los cuadrados de las desviaciones es mínima (es decir, ninguna otra recta daría una
n
menor suma de cuadrados de tales desviaciones). Es decir, ∑ ( y i −^y i ) es mínima.
2
i=1
Los valores de b 0 y b1 que minimizan la suma de los cuadrados de las desviaciones, son las soluciones
de las llamadas ecuaciones normales de la recta de regresión:
( )
n n
∑ yi =¿ n b0 +b 1 ∑ x i ¿
i=1 i=1
( ) (∑ )
n n n
Este método nos permite estimar los parámetros del modelo de regresión. Resolviendo las
ecuaciones simultáneas para b o y b 1 tenemos:
( ) ( )( )
n n n
n ∑ xi yi − ∑ xi ∑ yi
i=1 i=1 i =1
b 1=
(∑ ) (∑ )
n n 2
n x 2i − xi
i=1 i=1
b o= y−b1 x
Y = β0 + β 1 X +e
^y =b0 +b1 x
donde:
b 1 es la pendiente de la recta o coeficiente de regresión.
b 0 es la ordenada en el origen o intercepto de la recta con eje Y.
Ejemplo 1
Para las siguientes variables:
Y :=¿ ingreso mensual (soles)
X :=¿ experiencia profesional (años)
b0 = …
b 1= …
Ejemplo 2
Se desea modelar la vida útil (en años) de un satélite en función de la cantidad de combustible (en
kg) requerido para moverlo de su posición orbital, usando un modelo lineal. Los datos se muestran a
continuación:
Vida útil 10,8 11,5 12 12,4 13,2 13,7 13,9 14,1 14,8 15
Cantidad de combustible 150,4 156,3 162,5 165,8 172,5 168,9 184,5 185,9 187,2 199,4
15
14
Vida útil
13
12
11
150 155 160 165 170 175 180 185 190 195 200
Cantidad de combustible
Fuente: Empresa A
b. Calcule e interprete los coeficientes de regresión estimados del ejemplo anterior, considerando
la siguiente información:
X:= cantidad de
N° Y:= vida útil xy x2 y2
combustible
1 150,4 10,8 1624,32 22620,16 116,64
2 156,3 11,5 1797,45 24429,69 132,25
3 162,5 12,0 1950,00 26406,25 144,00
4 165,8 12,4 2055,92 27489,64 153,76
5 172,5 13,2 2277,00 29756,25 174,24
6 168,9 13,7 2313,93 28527,21 187,69
7 184,5 13,9 2564,55 34040,25 193,21
8 185,9 14,1 2621,19 34558,81 198,81
9 187,2 14,8 2770,56 35043,84 219,04
10 199,4 15,0 2991,00 39760,36 225,00
Total 1733,4 131,4 22965,92 302632,46 1744,64
b0
b1
281
UPC MA444 Estadística
Validación del modelo de regresión lineal
No siempre la ecuación estimada es válida. Puede ocurrir que no exista pendiente, es decir que la
pendiente poblacional sea igual a 0. Esto significaría que no existe relación lineal entre las variables X
e Y. Es necesario entonces verificar si el modelo es válido.
H 0 : β 1=0
H 1 : β1 ≠ 0
CMReg
F cal=
CMError
Donde:
( (∑ ) )
n 2
n
xi
SCReg= ^β ∑x −
2 2 i=1
1 i
i=1 n
SCE=SCT−SCReg
282
UPC MA444 Estadística
La suma de cuadrados total se calcula con:
( )
n 2
n ∑ yi
SCT =∑ y 2i −
i=1
i=1 n
6. Realizar la conclusión
Ejemplo 1
A un nivel de significación del 5%, valide el modelo de regresión lineal del ejercicio anterior. Obtenga
el ANOVA del Excel.
H0 :
H1:
CMReg
F cal=
CMError
6. Realizar la conclusión.
283
UPC MA444 Estadística
284
UPC MA444 Estadística
Coeficiente de determinación
Es una medida de bondad de ajuste del modelo. Nos indica que tan bueno es el modelo para explicar
el porcentaje de variabilidad de la variable dependiente Y. Por lo tanto, el coeficiente de
determinación R2 indica el porcentaje de la variabilidad de la variable Y que es explicada por X en el
modelo de regresión lineal estimado.
También nos ayuda a saber la precisión con la que se puede predecir o pronosticar el valor de la
variable dependiente, si se conocen los valores de la variable dependiente.
2 SCReg
R= ×100 %
SCTot
Coeficiente de correlación
El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X e
Y. El coeficiente de correlación muestral se denota por r y varía dentro del intervalo de -1 a 1. El
coeficiente de correlación r siempre tiene el signo de la pendiente b1
r=
{√ R2
−√R
2
si b1 >0
si b1 <0
Además,
En los resultados del Excel, el valor de r siempre se muestra en positivo. En el caso de que la
pendiente b1 sea negativa, deberá colocar al coeficiente de correlación r el signo negativo.
Los valores que se pueden tomar como referencia para determinar si existe o no una relación lineal
directa o inversa se muestra a continuación y pueden variar de acuerdo con el campo de estudio:
285
UPC MA444 Estadística
-1,0 -0,65 -0,2 0,2 0,65 1,0
Relación lineal fuerte e inversa No existe relación lineal Relación lineal fuerte y directa
Ejemplo 1
Indique qué valor de r2 y r que le corresponde a cada gráfico. Considere los siguientes valores: r =
0,95; r = -0,78 y r = 0,52. Además, indique el tipo de relación entre las variables.
Situación 1
Situación 2
Situación 3
Los pasos para obtener los valores de los coeficientes de regresión b 0 y b 1, el coeficiente de regresión
r usando una calculadora Casio son los siguientes:
Y = A + B X ¿ b 0 + b1 x
Para realizar la tabla de análisis de varianza se necesita calcular la suma de cuadrados total SCT , la
suma de cuadrados de la regresión SCReg y la suma de cuadrados de errores SCE.
288
UPC MA444 Estadística
SCT =( n−1 ) S 2Y
2
SCReg=R × SCT
SCE=SCT−SCReg
1. Para calcular el valor del coeficiente de correlación r presione Shift + 1 y seleccione Reg, opción 3.
2. Para calcular el valor del coeficiente de determinación R2 eleve al cuadrado el valor de r.
3. Para calcular el valor SY ; seleccione Shift + 1, luego la opción 4 y luego elija 7: sy.
Ejemplo 1
Usando una calculadora Casio
Una empresa dedicada a la fabricación de equipos de telecomunicación considera que la vida útil de
los equipos puede estar explicada por la temperatura del ambiente en el que trabaja mediante una
relación lineal. Para encontrar la ecuación de regresión lineal de la vida útil de los quipos en función
de la temperatura del ambiente se tomó una muestra de 11 datos, los cuales se muestran en la tabla
siguiente:
Temperatura (ºC) 24 20 18 16 10 12 13 28 16 15 23
Vida útil (en años) 8,0 6,4 5,5 4,6 3,8 3,9 5,6 8,5 6,6 4,5 8,8
Solución
a. Indique la variable dependiente y la independiente.
Solución
Solución
Siguiendo los pasos descritos en una calculadora Casio obtendrá las siguientes pantallas.
^y =b0 +b1 x= A+ Bx
^y =0,7984+0,2944 x
b 1 = 0,2944. Ante el incremento de 1°C en la temperatura del ambiente, la vida útil del equipo se
incrementa, en promedio, 0,2944 años.
Solución
290
UPC MA444 Estadística
Solución
El 81,74% de la variabilidad total de la vida útil de un equipo está siendo explicada por la
temperatura del ambiente en el que trabaja en el modelo de regresión estimado.
e. Estime la vida útil de un equipo, en años, si la temperatura del medio ambiente donde trabaja es
de 10,5 °C.
Solución
^y =0,7984+0,2944 x
^y =0,7984+0,2944 × 10,5=3,89
La vida útil de un equipo, en años, estimada es 3,89 años; si la temperatura del medio ambiente
donde trabaja es de 10,5 °C.
Solución
2
SCT =( n−1 ) S Y
2
SCReg=R × SCT
SCE=SCT−SCReg
Reemplazando:
SCT =( n−1 ) S 2y =10 ×1,80212=32,4756
SCE=SCT−SCReg=32,4756 – 26,545=5,9300
Solución
Validar el modelo de regresión implica probar que la pendiente poblacional es diferente de cero,
por tanto, las hipótesis son:
H 0 β 1=0
H 1 β1≠ 0
CMReg 26,5458
F c= = =40,2878
CME 0,6590
0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42
Decisión
Conclusión
Con un nivel de significación del 5%, el modelo es válido. Por lo tanto, existe una relación lineal
entre la vida útil del equipo y la temperatura del ambiente.
Caso: SYMA
La empresa desea incursionar en América Latina, donde las temperaturas son más cálidas, para lo
cual debe cumplir con un tiempo mínimo de vuelo de seis minutos a una temperatura ambiente de
30°C. De cumplir con la exigencia, ingresará al mercado latino, de lo contrario deberá realizar
reajustes a su dron.
Se ha encargado al área de producción realizar la estimación solicitada, para ello se seleccionó una
muestra de 10 drones. Los resultados se presentan a continuación:
Temperatura (°C) 25 26 20 25 23 18 18 20 21 22
Duración (minutos) 8,0 9,0 10,3 8,4 8,6 12,5 14,0 11,5 8,9 10,0
Solución
294
UPC MA444 Estadística
Interpretación
Determinar si Syma ingresará al mercado latino donde las temperaturas son más cálidas.
Representación
15
14
13
12
Duración (min)
11
10
9
8
7
6
17 18 19 20 21 22 23 24 25 26 27
Temperatura (°C)
Fuente Syma S.A.
Se observa una relación inversa, es decir a mayor valor de la temperatura en el ambiente menor será
el tiempo de vuelo (minutos).
Cálculo
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.86215497
Coeficiente de determinación R^2 0.74331119
295
UPC MA444 Estadística
El modelo de regresión estimado es:
Y^ =b0−b1 X
Y^ =22,94−0,588 X
Si la temperatura del medio ambiente se incrementa en 1°C el tiempo de vuelo de los drones
disminuye en 0,588 minutos.
Validar el modelo de regresión implica probar que la pendiente poblacional es diferente de cero, por
tanto, las hipótesis son:
H 0 β 1=0
H 1 β1≠ 0
CMReg 26,1467
F cal= = =23,17
CMError 1,1287
v1
α
v2 1 2 3 4 5 6 7 8 9 10
0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42
296
UPC MA444 Estadística
Conclusión
Con un nivel de significación del 5 %, el modelo es válido. Por lo tanto, existe una relación lineal entre
la vida útil del equipo y la temperatura del ambiente.
Y^ =22,94−0,588× 30=5,3
Análisis
R2 = (26,147/35,176) x100% = 74,33% o directamente de la tabla 0,7433x100% = 74,33%
Interpretación
El 74,33% de la variabilidad total de la duración del tiempo de vuelo de los drones es explicada por la
temperatura en el modelo de regresión estimado.
r = 0,8622
Entre las variables tiempo de vuelo y la temperatura del medio ambiente existe una relación fuerte y
es directa por ser el valor del coeficiente de correlación cercano a 1.
Argumentación
No se cumple con la exigencia de un tiempo mínimo de vuelo de 6 minutos a una temperatura de
30°C. Por lo tanto, la empresa deberá realizar ajustes a su dron.
297
UPC MA444 Estadística
Ejercicios propuestos
80. Para la construcción de carreteras que experimentan heladas intensas, es importante que la
densidad del concreto (kg/m2) seleccionado tenga un valor bajo de conductividad térmica
(watts/metros.Kelvin) para reducir al mínimo los daños provocados por cambios de
temperatura. Por lo tanto, se desea estimar la conductividad térmica en función de la densidad
que posee el concreto. Por lo tanto, se toman 12 trozos al azar de diferentes densidades de
concreto y se registra la conductividad. Los datos se muestran en la siguiente tabla:
Densidad del concreto 300 400 500 600 700 800 900 1000 1100 1200 1400 1600
Conductividad térmica 0,065 0,08 0,095 0,115 0,13 0,15 0,175 0,205 0,23 0,27 0,346 0,436
81. Export es una empresa proveedora de GPS para automóviles de diferentes modelos. El jefe del
departamento de ventas ha implementado charlas motivadoras para sus agentes vendedores y
desea modelar mediante una relación lineal la eficiencia en ventas (%) en función al tiempo
acumulado de horas en las que estuvo presente el agente vendedor en las charlas de
capacitación durante el último trimestre.
82. El área de producción del fabricante NanoTec registró el tiempo de vuelo de los drones del
modelo CX-STAR en función de la temperatura del medio ambiente. Para una muestra de 10
drones se tienen los siguientes resultados:
Temperatura (°C) 25 26 20 25 23 18 18 20 21 22
Tiempo de vuelo (min.) 8 9 10,3 8,4 8,6 12,5 14 11,5 8,9 10
298
UPC MA444 Estadística
Tablas estadísticas
Tabla de la distribución normal estándar
Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233
-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350
-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621
-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681
-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866
-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
300
UPC MA444 Estadística
301
UPC MA444 Estadística
Tabla de la distribución normal estándar
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
302
UPC MA444 Estadística
Tabla de la distribución t - Student
α
υ 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1 0.32492 0.72654 1.37638 1.96261 3.07768 6.31375 7.91582 10.57889 12.7062 15.89454 21.20495 31.82052 63.65674
2 0.28868 0.61721 1.06066 1.38621 1.88562 2.91999 3.31976 3.89643 4.30265 4.84873 5.64278 6.96456 9.92484
3 0.27667 0.58439 0.97847 1.24978 1.63774 2.35336 2.60543 2.95051 3.18245 3.48191 3.89605 4.54070 5.84091
4 0.27072 0.56865 0.94096 1.18957 1.53321 2.13185 2.33287 2.60076 2.77645 2.99853 3.29763 3.74695 4.60409
5 0.26718 0.55943 0.91954 1.15577 1.47588 2.01505 2.19096 2.42158 2.57058 2.75651 3.00287 3.36493 4.03214
6 0.26483 0.55338 0.9057 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539
9 0.26096 0.54348 0.8834 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.5738 2.82144 3.24984
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927
11 0.25956 0.53994 0.87553 1.08767 1.36343 1.79588 1.92843 2.09614 2.20099 2.32814 2.49066 2.71808 3.10581
12 0.25903 0.53862 0.87261 1.08321 1.35622 1.78229 1.91231 2.07644 2.17881 2.30272 2.46070 2.68100 3.05454
13 0.25859 0.5375 0.87015 1.07947 1.35017 1.77093 1.89887 2.06004 2.16037 2.2816 2.43585 2.65031 3.01228
14 0.25821 0.53655 0.86805 1.07628 1.34503 1.76131 1.8875 2.04617 2.14479 2.26378 2.41490 2.62449 2.97684
15 0.25789 0.53573 0.86624 1.07353 1.34061 1.75305 1.87774 2.03429 2.13145 2.24854 2.39701 2.60248 2.94671
16 0.25760 0.53501 0.86467 1.07114 1.33676 1.74588 1.86928 2.02400 2.11991 2.23536 2.38155 2.58349 2.92078
17 0.25735 0.53438 0.86328 1.06903 1.33338 1.73961 1.86187 2.01500 2.10982 2.22385 2.36805 2.56693 2.89823
18 0.25712 0.53382 0.86205 1.06717 1.33039 1.73406 1.85534 2.00707 2.10092 2.21370 2.35618 2.55238 2.87844
19 0.25692 0.53331 0.86095 1.06551 1.32773 1.72913 1.84953 2.00002 2.09302 2.20470 2.34565 2.53948 2.86093
20 0.25674 0.53286 0.85996 1.06402 1.32534 1.72472 1.84433 1.99371 2.08596 2.19666 2.33624 2.52798 2.84534
21 0.25658 0.53246 0.85907 1.06267 1.32319 1.72074 1.83965 1.98804 2.07961 2.18943 2.32779 2.51765 2.83136
22 0.25643 0.53208 0.85827 1.06145 1.32124 1.71714 1.83542 1.98291 2.07387 2.18289 2.32016 2.50832 2.81876
23 0.25630 0.53175 0.85753 1.06034 1.31946 1.71387 1.83157 1.97825 2.06866 2.17696 2.31323 2.49987 2.80734
24 0.25617 0.53144 0.85686 1.05932 1.31784 1.71088 1.82805 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694
25 0.25606 0.53115 0.85624 1.05838 1.31635 1.70814 1.82483 1.9701 2.05954 2.16659 2.30113 2.48511 2.78744
26 0.25595 0.53089 0.85567 1.05752 1.31497 1.70562 1.82186 1.96651 2.05553 2.16203 2.29581 2.47863 2.77871
27 0.25586 0.53065 0.85514 1.05673 1.3137 1.70329 1.81913 1.96320 2.05183 2.15782 2.29091 2.47266 2.77068
28 0.25577 0.53042 0.85465 1.05599 1.31253 1.70113 1.81659 1.96014 2.04841 2.15393 2.28638 2.46714 2.76326
29 0.25568 0.53021 0.85419 1.05530 1.31143 1.69913 1.81424 1.95729 2.04523 2.15033 2.28217 2.46202 2.75639
30 0.25561 0.53002 0.85377 1.05466 1.31042 1.69726 1.81205 1.95465 2.04227 2.14697 2.27826 2.45726 2.75000
31 0.25553 0.52984 0.85337 1.05406 1.30946 1.69552 1.81000 1.95218 2.03951 2.14383 2.27461 2.45282 2.74404
32 0.25546 0.52967 0.853 1.0535 1.30857 1.69389 1.80809 1.94987 2.03693 2.14090 2.27120 2.44868 2.73848
33 0.25540 0.5295 0.85265 1.05298 1.30774 1.69236 1.80629 1.94770 2.03452 2.13816 2.26801 2.44479 2.73328
34 0.25534 0.52935 0.85232 1.05248 1.30695 1.69092 1.80461 1.94567 2.03224 2.13558 2.26501 2.44115 2.72839
35 0.25528 0.52921 0.85201 1.05202 1.30621 1.68957 1.80302 1.94375 2.03011 2.13316 2.26219 2.43772 2.72381
36 0.25523 0.52908 0.85172 1.05158 1.30551 1.6883 1.80153 1.94195 2.02809 2.13087 2.25953 2.43449 2.71948
37 0.25518 0.52895 0.85144 1.05117 1.30485 1.68709 1.80012 1.94024 2.02619 2.12871 2.25702 2.43145 2.71541
38 0.25513 0.52883 0.85118 1.05077 1.30423 1.68595 1.79878 1.93863 2.02439 2.12667 2.25465 2.42857 2.71156
39 0.25508 0.52871 0.85094 1.0504 1.30364 1.68488 1.79751 1.93711 2.02269 2.12474 2.25240 2.42584 2.70791
40 0.25504 0.52861 0.85070 1.05005 1.30308 1.68385 1.79631 1.93566 2.02108 2.12291 2.25027 2.42326 2.70446
303
UPC MA444 Estadística
Tabla de la distribución t – Student
α
υ 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
41 0.25500 0.52850 0.85048 1.04971 1.30254 1.68288 1.79517 1.93428 2.01954 2.12117 2.24825 2.42080 2.70118
42 0.25496 0.52840 0.85026 1.04939 1.30204 1.68195 1.79409 1.93298 2.01808 2.11952 2.24633 2.41847 2.69807
43 0.25492 0.52831 0.85006 1.04908 1.30155 1.68107 1.79305 1.93173 2.01669 2.11794 2.24449 2.41625 2.69510
44 0.25488 0.52822 0.84987 1.04879 1.30109 1.68023 1.79207 1.93054 2.01537 2.11644 2.24275 2.41413 2.69228
45 0.25485 0.52814 0.84968 1.04852 1.30065 1.67943 1.79113 1.92941 2.0141 2.11500 2.24108 2.41212 2.68959
46 0.25482 0.52805 0.84951 1.04825 1.30023 1.67866 1.79023 1.92833 2.0129 2.11364 2.23949 2.41019 2.68701
47 0.25479 0.52798 0.84934 1.04800 1.29982 1.67793 1.78937 1.92729 2.01174 2.11233 2.23797 2.40835 2.68456
48 0.25476 0.52790 0.84917 1.04775 1.29944 1.67722 1.78855 1.92630 2.01063 2.11107 2.23652 2.40658 2.68220
49 0.25473 0.52783 0.84902 1.04752 1.29907 1.67655 1.78776 1.92535 2.00958 2.10987 2.23512 2.40489 2.67995
50 0.25470 0.52776 0.84887 1.04729 1.29871 1.67591 1.78700 1.92444 2.00856 2.10872 2.23379 2.40327 2.67779
51 0.25467 0.52769 0.84873 1.04708 1.29837 1.67528 1.78627 1.92356 2.00758 2.10762 2.2325 2.40172 2.67572
52 0.25465 0.52763 0.84859 1.04687 1.29805 1.67469 1.78558 1.92272 2.00665 2.10655 2.23127 2.40022 2.67373
53 0.25462 0.52757 0.84846 1.04667 1.29773 1.67412 1.78491 1.92191 2.00575 2.10553 2.23009 2.39879 2.67182
54 0.25460 0.52751 0.84833 1.04648 1.29743 1.67356 1.78426 1.92114 2.00488 2.10455 2.22895 2.39741 2.66998
55 0.25458 0.52745 0.84821 1.04630 1.29713 1.67303 1.78364 1.92039 2.00404 2.10361 2.22785 2.39608 2.66822
56 0.25455 0.52740 0.84809 1.04612 1.29685 1.67252 1.78304 1.91967 2.00324 2.10270 2.22679 2.39480 2.66651
57 0.25453 0.52735 0.84797 1.04595 1.29658 1.67203 1.78246 1.91897 2.00247 2.10182 2.22577 2.39357 2.66487
58 0.25451 0.52730 0.84786 1.04578 1.29632 1.67155 1.78190 1.9183 2.00172 2.10097 2.22479 2.39238 2.66329
59 0.25449 0.52725 0.84776 1.04562 1.29607 1.67109 1.78137 1.91765 2.00100 2.10015 2.22384 2.39123 2.66176
60 0.25447 0.52720 0.84765 1.04547 1.29582 1.67065 1.78085 1.91703 2.00030 2.09936 2.22292 2.39012 2.66028
61 0.25445 0.52715 0.84755 1.04532 1.29558 1.67022 1.78034 1.91642 1.99962 2.0986 2.22204 2.38905 2.65886
62 0.25444 0.52711 0.84746 1.04518 1.29536 1.6698 1.77986 1.91584 1.99897 2.09786 2.22118 2.38801 2.65748
63 0.25442 0.52706 0.84736 1.04504 1.29513 1.6694 1.77939 1.91527 1.99834 2.09715 2.22035 2.38701 2.65615
64 0.25440 0.52702 0.84727 1.04490 1.29492 1.66901 1.77893 1.91472 1.99773 2.09645 2.21955 2.38604 2.65485
65 0.25439 0.52698 0.84719 1.04477 1.29471 1.66864 1.77849 1.91419 1.99714 2.09578 2.21877 2.38510 2.65360
66 0.25437 0.52694 0.84710 1.04464 1.29451 1.66827 1.77806 1.91368 1.99656 2.09514 2.21802 2.38419 2.65239
67 0.25436 0.52690 0.84702 1.04452 1.29432 1.66792 1.77765 1.91318 1.99601 2.09451 2.21729 2.38330 2.65122
68 0.25434 0.52687 0.84694 1.04440 1.29413 1.66757 1.77724 1.91269 1.99547 2.09390 2.21658 2.38245 2.65008
69 0.25433 0.52683 0.84686 1.04428 1.29394 1.66724 1.77685 1.91222 1.99495 2.09330 2.21589 2.38161 2.64898
70 0.25431 0.52680 0.84679 1.04417 1.29376 1.66691 1.77647 1.91177 1.99444 2.09273 2.21523 2.38081 2.64790
75 0.25425 0.52664 0.84644 1.04365 1.29294 1.66543 1.77473 1.90967 1.9921 2.09008 2.21216 2.37710 2.64298
80 0.25419 0.5265 0.84614 1.04320 1.29222 1.66412 1.77321 1.90784 1.99006 2.08778 2.20949 2.37387 2.63869
85 0.25414 0.52637 0.84587 1.0428 1.29159 1.66298 1.77187 1.90623 1.98827 2.08574 2.20713 2.37102 2.63491
90 0.25410 0.52626 0.84563 1.04244 1.29103 1.66196 1.77068 1.90480 1.98667 2.08394 2.20504 2.36850 2.63157
95 0.25406 0.52616 0.84542 1.04212 1.29053 1.66105 1.76961 1.90352 1.98525 2.08233 2.20317 2.36624 2.62858
100 0.25402 0.52608 0.84523 1.04184 1.29007 1.66023 1.76866 1.90237 1.98397 2.08088 2.20150 2.36422 2.62589
105 0.25399 0.52600 0.84506 1.04158 1.28967 1.65950 1.76779 1.90133 1.98282 2.07958 2.19998 2.36239 2.62347
110 0.25396 0.52592 0.84490 1.04134 1.28930 1.65882 1.76701 1.90039 1.98177 2.07839 2.19861 2.36073 2.62126
120 0.25391 0.52580 0.84463 1.04093 1.28865 1.65765 1.76564 1.89874 1.97993 2.07631 2.19620 2.35782 2.61742
∞ 0.25335 0.52440 0.84162 1.03643 1.28156 1.64484 1.75069 1.88079 1.95997 2.05375 2.17009 2.32635 2.57583
304
UPC MA444 Estadística
Tabla de la distribución F
0.050 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40
0.025 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40
0.010 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40
0.005 198.50 199.01 199.16 199.24 199.30 199.33 199.36 199.38 199.39 199.39
0.050 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79
0.025 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42
0.010 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23
0.005 55.55 49.80 47.47 46.20 45.39 44.84 44.43 44.13 43.88 43.68
0.050 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96
0.025 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84
0.010 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55
0.005 31.33 26.28 24.26 23.15 22.46 21.98 21.62 21.35 21.14 20.97
0.050 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74
0.025 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62
0.010 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05
0.005 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62
0.050 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06
0.025 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46
0.010 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87
0.005 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25
0.050 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64
0.025 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76
0.010 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62
0.005 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38
0.050 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35
0.025 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30
0.010 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81
0.005 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21
0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42
0.050 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98
0.025 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72
0.010 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85
0.005 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85
0.050 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85
0.025 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53
0.010 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54
0.005 12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.42
0.050 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75
0.025 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37
0.010 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30
0.005 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09
305
UPC MA444 Estadística
306
UPC MA444 Estadística
Tabla de la distribución F
0.050 2 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.48 19.48 19.49
0.025 39.41 39.43 39.45 39.46 39.46 39.47 39.48 39.48 39.48 39.49
0.010 99.42 99.43 99.45 99.46 99.47 99.48 99.48 99.48 99.48 99.49
0.005 199.42 199.43 199.45 199.45 199.48 199.48 199.48 199.48 199.48 199.49
0.050 3 8.74 8.70 8.66 8.64 8.62 8.59 8.58 8.57 8.57 8.55
0.025 14.34 14.25 14.17 14.12 14.08 14.04 14.01 13.99 13.98 13.95
0.010 27.05 26.87 26.69 26.60 26.50 26.41 26.35 26.32 26.29 26.22
0.005 43.39 43.08 42.78 42.62 42.47 42.31 42.21 42.15 42.10 41.99
0.050 4 5.91 5.86 5.80 5.77 5.75 5.72 5.70 5.69 5.68 5.66
0.025 8.75 8.66 8.56 8.51 8.46 8.41 8.38 8.36 8.35 8.31
0.010 14.37 14.20 14.02 13.93 13.84 13.75 13.69 13.65 13.63 13.56
0.005 20.70 20.44 20.17 20.03 19.89 19.75 19.67 19.61 19.57 19.47
0.050 5 4.68 4.62 4.56 4.53 4.50 4.46 4.44 4.43 4.42 4.40
0.025 6.52 6.43 6.33 6.28 6.23 6.18 6.14 6.12 6.11 6.07
0.010 9.89 9.72 9.55 9.47 9.38 9.29 9.24 9.20 9.18 9.11
0.005 13.38 13.15 12.90 12.78 12.66 12.53 12.45 12.40 12.37 12.27
0.050 6 4.00 3.94 3.87 3.84 3.81 3.77 3.75 3.74 3.73 3.70
0.025 5.37 5.27 5.17 5.12 5.07 5.01 4.98 4.96 4.94 4.90
0.010 7.72 7.56 7.40 7.31 7.23 7.14 7.09 7.06 7.03 6.97
0.005 10.03 9.81 9.59 9.47 9.36 9.24 9.17 9.12 9.09 9.00
0.050 7 3.57 3.51 3.44 3.41 3.38 3.34 3.32 3.30 3.29 3.27
0.025 4.67 4.57 4.47 4.41 4.36 4.31 4.28 4.25 4.24 4.20
0.010 6.47 6.31 6.16 6.07 5.99 5.91 5.86 5.82 5.80 5.74
0.005 8.18 7.97 7.75 7.64 7.53 7.42 7.35 7.31 7.28 7.19
0.050 8 3.28 3.22 3.15 3.12 3.08 3.04 3.02 3.01 2.99 2.97
0.025 4.20 4.10 4.00 3.95 3.89 3.84 3.81 3.78 3.77 3.73
0.010 5.67 5.52 5.36 5.28 5.20 5.12 5.07 5.03 5.01 4.95
0.005 7.01 6.81 6.61 6.50 6.40 6.29 6.22 6.18 6.15 6.06
0.050 9 3.07 3.01 2.94 2.90 2.86 2.83 2.80 2.79 2.78 2.75
0.025 3.87 3.77 3.67 3.61 3.56 3.51 3.47 3.45 3.43 3.39
0.010 5.11 4.96 4.81 4.73 4.65 4.57 4.52 4.48 4.46 4.40
0.005 6.23 6.03 5.83 5.73 5.62 5.52 5.45 5.41 5.38 5.30
0.050 10 2.91 2.85 2.77 2.74 2.70 2.66 2.64 2.62 2.61 2.58
0.025 3.62 3.52 3.42 3.37 3.31 3.26 3.22 3.20 3.18 3.14
0.010 4.71 4.56 4.41 4.33 4.25 4.17 4.12 4.08 4.06 4.00
0.005 5.66 5.47 5.27 5.17 5.07 4.97 4.90 4.86 4.83 4.75
0.050 11 2.79 2.72 2.65 2.61 2.57 2.53 2.51 2.49 2.48 2.45
0.025 3.43 3.33 3.23 3.17 3.12 3.06 3.03 3.00 2.99 2.94
0.010 4.40 4.25 4.10 4.02 3.94 3.86 3.81 3.78 3.75 3.69
0.005 5.24 5.05 4.86 4.76 4.65 4.55 4.49 4.45 4.41 4.34
0.050 12 2.69 2.62 2.54 2.51 2.47 2.43 2.40 2.38 2.37 2.34
0.025 3.28 3.18 3.07 3.02 2.96 2.91 2.87 2.85 2.83 2.79
0.010 4.16 4.01 3.86 3.78 3.70 3.62 3.57 3.54 3.51 3.45
0.005 4.91 4.72 4.53 4.43 4.33 4.23 4.17 4.12 4.09 4.01
307
UPC MA444 Estadística
308
UPC MA444 Estadística
Tabla de la distribución F
0.050 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60
0.025 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15
0.010 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94
0.005 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.60
0.050 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54
0.025 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06
0.010 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80
0.005 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42
0.050 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35
0.025 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77
0.010 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37
0.005 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85
0.050 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25
0.025 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64
0.010 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17
0.005 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59
0.050 30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16
0.025 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51
0.010 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98
0.005 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.34
0.050 40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08
0.025 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39
0.010 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80
0.005 8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.12
0.050 45 4.06 3.20 2.81 2.58 2.42 2.31 2.22 2.15 2.10 2.05
0.025 5.38 4.01 3.42 3.09 2.86 2.70 2.58 2.49 2.41 2.35
0.010 7.23 5.11 4.25 3.77 3.45 3.23 3.07 2.94 2.83 2.74
0.005 8.71 5.97 4.89 4.29 3.91 3.64 3.43 3.28 3.15 3.04
0.050 50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03
0.025 5.34 3.97 3.39 3.05 2.83 2.67 2.55 2.46 2.38 2.32
0.010 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70
0.005 8.63 5.90 4.83 4.23 3.85 3.58 3.38 3.22 3.09 2.99
0.050 60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99
0.025 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27
0.010 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63
0.005 8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.90
0.050 70 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.02 1.97
0.025 5.25 3.89 3.31 2.97 2.75 2.59 2.47 2.38 2.30 2.24
0.010 7.01 4.92 4.07 3.60 3.29 3.07 2.91 2.78 2.67 2.59
0.005 8.40 5.72 4.66 4.08 3.70 3.43 3.23 3.08 2.95 2.85
0.050 120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91
0.025 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16
0.010 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47
0.005 8.18 5.54 4.50 3.92 3.55 3.28 3.09 2.93 2.81 2.71
309
UPC MA444 Estadística
310
UPC MA444 Estadística
Tabla de la distribución F
0.050 14 2.53 2.46 2.39 2.35 2.31 2.27 2.24 2.22 2.21 2.18
0.025 3.05 2.95 2.84 2.79 2.73 2.67 2.64 2.61 2.60 2.55
0.010 3.80 3.66 3.51 3.43 3.35 3.27 3.22 3.18 3.16 3.09
0.005 4.43 4.25 4.06 3.96 3.86 3.76 3.70 3.66 3.62 3.55
0.050 15 2.48 2.40 2.33 2.29 2.25 2.20 2.18 2.16 2.15 2.11
0.025 2.96 2.86 2.76 2.70 2.64 2.59 2.55 2.52 2.51 2.46
0.010 3.67 3.52 3.37 3.29 3.21 3.13 3.08 3.05 3.02 2.96
0.005 4.25 4.07 3.88 3.79 3.69 3.59 3.52 3.48 3.45 3.37
0.050 20 2.28 2.20 2.12 2.08 2.04 1.99 1.97 1.95 1.93 1.90
0.025 2.68 2.57 2.46 2.41 2.35 2.29 2.25 2.22 2.20 2.16
0.010 3.23 3.09 2.94 2.86 2.78 2.69 2.64 2.61 2.58 2.52
0.005 3.68 3.50 3.32 3.22 3.12 3.02 2.96 2.92 2.88 2.81
0.050 24 2.18 2.11 2.03 1.98 1.94 1.89 1.86 1.84 1.83 1.79
0.025 2.54 2.44 2.33 2.27 2.21 2.15 2.11 2.08 2.06 2.01
0.010 3.03 2.89 2.74 2.66 2.58 2.49 2.44 2.40 2.38 2.31
0.005 3.42 3.25 3.06 2.97 2.87 2.77 2.70 2.66 2.63 2.55
0.050 30 2.09 2.01 1.93 1.89 1.84 1.79 1.76 1.74 1.72 1.68
0.025 2.41 2.31 2.20 2.14 2.07 2.01 1.97 1.94 1.92 1.87
0.010 2.84 2.70 2.55 2.47 2.39 2.30 2.25 2.21 2.18 2.11
0.005 3.18 3.01 2.82 2.73 2.63 2.52 2.46 2.42 2.38 2.30
0.050 40 2.00 1.92 1.84 1.79 1.74 1.69 1.66 1.64 1.62 1.58
0.025 2.29 2.18 2.07 2.01 1.94 1.88 1.83 1.80 1.78 1.72
0.010 2.66 2.52 2.37 2.29 2.20 2.11 2.06 2.02 1.99 1.92
0.005 2.95 2.78 2.60 2.50 2.40 2.30 2.23 2.18 2.15 2.06
0.050 45 1.97 1.89 1.81 1.76 1.71 1.66 1.63 1.60 1.59 1.54
0.025 2.25 2.14 2.03 1.96 1.90 1.83 1.79 1.76 1.74 1.68
0.010 2.61 2.46 2.31 2.23 2.14 2.05 2.00 1.96 1.93 1.85
0.005 2.88 2.71 2.53 2.43 2.33 2.22 2.16 2.11 2.08 1.99
0.050 50 1.95 1.87 1.78 1.74 1.69 1.63 1.60 1.58 1.56 1.51
0.025 2.22 2.11 1.99 1.93 1.87 1.80 1.75 1.72 1.70 1.64
0.010 2.56 2.42 2.27 2.18 2.10 2.01 1.95 1.91 1.88 1.80
0.005 2.82 2.65 2.47 2.37 2.27 2.16 2.10 2.05 2.02 1.93
0.050 60 1.92 1.84 1.75 1.70 1.65 1.59 1.56 1.53 1.52 1.47
0.025 2.17 2.06 1.94 1.88 1.82 1.74 1.70 1.67 1.64 1.58
0.010 2.50 2.35 2.20 2.12 2.03 1.94 1.88 1.84 1.81 1.73
0.005 2.74 2.57 2.39 2.29 2.19 2.08 2.01 1.96 1.93 1.83
0.050 70 1.89 1.81 1.72 1.67 1.62 1.57 1.53 1.50 1.49 1.44
0.025 2.14 2.03 1.91 1.85 1.78 1.71 1.66 1.63 1.60 1.54
0.010 2.45 2.31 2.15 2.07 1.98 1.89 1.83 1.78 1.75 1.67
0.005 2.68 2.51 2.33 2.23 2.13 2.02 1.95 1.90 1.86 1.77
0.050 120 1.83 1.75 1.66 1.61 1.55 1.50 1.46 1.43 1.41 1.35
0.025 2.05 1.94 1.82 1.76 1.69 1.61 1.56 1.53 1.50 1.43
0.010 2.34 2.19 2.03 1.95 1.86 1.76 1.70 1.66 1.62 1.53
0.005 2.54 2.37 2.19 2.09 1.98 1.87 1.80 1.75 1.71 1.61
311
UPC MA444 Estadística
312
UPC MA444 Estadística
Índice
B Circular, 19
de barras, 19
Bayes histograma, 36
Teorema de, 89 ojiva, 36
Pareto, 22
C
M
Censo, 147
Coeficiente de correlación, 221 Marca de clase, 32
Coeficiente de determinación, 221 Media
aritmética, 43
Medidas de tendencia central, 43
D Medidas de variación
Distribución Desviación estándar, 54
binomial, 105 Varianza, 54
continua, 130 Moda, 49
exponencial, 130 Muestra, 7
normal, 134 Muestreo, 147
normal estándar, 134, 135 aleatorio simple, 149
Poisson, 109 probabilístico, 149
E P
Escalas de medición Parámetro, 16, 42
intervalo, 10 Probabilidad
nominal, 10 condicional, 80
ordinal, 10 Prueba de hipótesis
razón, 10 media poblacional, 167
Esperado medias poblacionales, 186
de una variable discreta, 102 proporción poblacional, 176
de variable continua, 125 varianzas poblacionales, 183
Estadística
definición, 6 R
descriptiva, 6, 98
inferencial, 6 Regla multiplicativa
Estadístico, 16, 42 para eventos independientes, 83
Evento Regresión
complementario, 70 lineal, 215
compuesto, 67
independientes, 83
mutuamente excluyentes, 67
T
simple, 66 Tamaño de muestra
Experimento aleatorio, 66 media de una población, 158
Tipos de errores, 165
F
Frecuencia
V
acumulada absoluta, 28 Variable
porcentual, 28 aleatoria continua, 117
Función aleatoria discreta, 99
de densidad, 117 continua, 9
de distribución acumulada, 120 cualitativa, 9
cuantitativa, 9
G discreta, 9
Varianza
Gráfico de una variable aleatoria, 102, 125
bastones, 28
313
UPC MA444 Estadística