MA444 2021 01 Cuaderno de Trabajo - CS3G 28 de Junio

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 327

MA444 Estadística

Civil

Electrónica

Mecatrónica

Cuaderno de trabajo
Área de Ciencias
marzo 2021
UPC MA444 Estadística 2
UPC MA444 Estadística 3

Tabla de contenido

Unidad 1. Estadística Descriptiva ........................................................................................ 6


Estadística ...........................................................................................................................................................7
Estadística descriptiva .................................................................................................................................... 7
Estadística inferencial ..................................................................................................................................... 7
Conceptos básicos ...............................................................................................................................................8
Variables ...................................................................................................................................................... 11
Escalas de medición...................................................................................................................................... 13
Dato ............................................................................................................................................................. 20
Observación ................................................................................................................................................. 20
Parámetro .................................................................................................................................................... 21
Estadístico .................................................................................................................................................... 21
Organización de datos cualitativos ...................................................................................................................22
Tabla de distribución de frecuencias ............................................................................................................. 22
Gráficos de una variable cualitativa .............................................................................................................. 23
Tabulaciones cruzadas .................................................................................................................................. 31
Organización de datos cuantitativos discretos ..................................................................................................34
Tabla de distribución de frecuencias ............................................................................................................. 34
Gráfico de bastones o líneas ......................................................................................................................... 34
Organización de datos cuantitativos continuos ................................................................................................39
Tabla de distribución de frecuencias ............................................................................................................. 39
Gráficos de una variable cuantitativa continua ............................................................................................. 44
Métodos numéricos para describir datos cuantitativos ....................................................................................50
Definiciones.................................................................................................................................................. 50
Medidas de tendencia central ...................................................................................................................... 51
Medidas de posición o cuantiles ................................................................................................................... 59
Medidas de variación o dispersión ................................................................................................................ 64
Medidas de asimetría ................................................................................................................................... 73

Unidad 2. Probabilidad y variable aleatoria ...................................................................... 82


Definiciones ......................................................................................................................................................84
Experimento aleatorio .................................................................................................................................. 84
Espacio muestral .......................................................................................................................................... 84
Evento .......................................................................................................................................................... 84
Operaciones con eventos ..................................................................................................................................85
Probabilidad ......................................................................................................................................................88
Regla aditiva de la probabilidad .................................................................................................................... 90
Principios fundamentales de conteo ............................................................................................................. 97
Probabilidad condicional.................................................................................................................................101
Ley multiplicativa de probabilidad ..................................................................................................................106
Eventos independientes ..................................................................................................................................107
Aplicación al sistema de componentes: Confiabilidad de sistemas.............................................................. 111
Probabilidad total y el teorema de Bayes .......................................................................................................114
Probabilidad total ....................................................................................................................................... 114
UPC MA444 Estadística 4
Teorema de Bayes ...................................................................................................................................... 115
Variable aleatoria............................................................................................................................................126
Distribuciones discretas especiales .................................................................................................................136
Distribución binomial ................................................................................................................................. 136
Distribución Poisson ................................................................................................................................... 145
Variables aleatorias continuas ........................................................................................................................154
Función de densidad de una variable continua ........................................................................................... 154
Función de distribución acumulada ............................................................................................................ 159
Esperado de una variable aleatoria continua .............................................................................................. 164
Varianza de una variable aleatoria continua ............................................................................................... 164
Desviación estándar de una variable aleatoria continua ............................................................................. 164
Coeficiente de variabilidad ......................................................................................................................... 164
Principales distribuciones de variables aleatorias continuas ..........................................................................174
Distribución exponencial ............................................................................................................................ 174
Distribución normal .................................................................................................................................... 179

Unidad 3. Introducción al muestreo e inferencia estadística ........................................... 193


Conceptos básicos ...........................................................................................................................................194
Unidad elemental ....................................................................................................................................... 194
Muestreo probabilístico ..................................................................................................................................196
Muestreo simple aleatorio ......................................................................................................................... 196
Uso de la tabla de números aleatorios ........................................................................................................ 197
Tamaño de muestra para estimar la media de una población ........................................................................206
Margen de error ......................................................................................................................................... 206
Nivel de confianza ...................................................................................................................................... 206
Varianza poblacional .................................................................................................................................. 206
Prueba de hipótesis.........................................................................................................................................220
Contraste de hipótesis ................................................................................................................................ 220
Tipos de errores ......................................................................................................................................... 220
Pasos para realizar una prueba de hipótesis ............................................................................................... 222
Prueba de hipótesis para una media con varianza poblacional desconocida ............................................... 223
Prueba de hipótesis para una proporción poblacional ................................................................................ 237
Prueba de hipótesis para la razón de varianzas poblacionales .................................................................... 245
Prueba de hipótesis para la diferencia de medias poblacionales ................................................................. 248

Unidad 4. Otros tópicos de Estadística: Análisis de varianza y análisis de regresión ........ 264
Diseño de experimentos .................................................................................................................................266
Conceptos generales .................................................................................................................................. 267
Diseño completamente al azar ................................................................................................................... 269
Análisis de la varianza .....................................................................................................................................272
Método de comparaciones múltiples: Prueba de Tukey - Kramer ............................................................... 278
Regresión lineal simple ...................................................................................................................................290
Diagrama de dispersión o gráfico del plot ................................................................................................... 293
Método de los mínimos cuadrados ............................................................................................................. 293
Recta o ecuación de regresión .................................................................................................................... 294
Análisis de varianza .................................................................................................................................... 298
Coeficiente de determinación..................................................................................................................... 301
Coeficiente de correlación .......................................................................................................................... 301
UPC MA444 Estadística 5
Tablas estadísticas ..........................................................................................................................................318
Tabla de la distribución normal estándar .................................................................................................... 318
Tabla de la distribución t - Student ............................................................................................................. 320
Tabla de la distribución F ............................................................................................................................ 322
UPC MA444 Estadística 6

Unidad 1. Estadística Descriptiva

Logro
Al finalizar la unidad, el estudiante aplica adecuadamente métodos de organización y presentación de
datos, asimismo, calcula resúmenes de variables para la resolución de problemas obtenidos de los
datos de una situación real.

Temario
• La Estadística. Definiciones de población, muestra, variables, clasificación de variables, parámetros
y estimadores
• Métodos de organización y presentación de datos: datos cualitativos, datos cuantitativos, tablas
de distribución de frecuencias y representaciones gráficas (circular, barras, Pareto, histograma,
polígono, bastones)
• Tablas de doble entrada
• Medidas de tendencia central: media, mediana, moda, media ponderada
• Medidas de dispersión: varianza, desviación estándar y coeficiente de variación
• Medidas de posición: cuartiles, deciles y percentiles
• Organización de datos cuantitativos discretos y continuos, gráficos para una variable cuantitativa
discreta y continua. Tablas de doble entrada y gráficos comparativos

Bibliografía

• Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.1 (pág. 7-11)
• Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.3 (pág. 11-17)
• Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.5 (pág. 24-57)
UPC MA444 Estadística 7
Estadística
Es la ciencia de los datos. Implica la recolección de datos, clasificación, organización, análisis e
interpretación de resultados.

Estadística descriptiva
Es la rama de la Estadística que se dedica al análisis, descripción y representación de un conjunto de
datos obtenidos a partir de una muestra o población. Las conclusiones son válidas sobre las
características de dicho conjunto de datos.

Estadística inferencial
Es la rama de la Estadística que desarrolla los procesos de estimación, análisis y pruebas de hipótesis
de un conjunto de datos extraídos de una muestra, con el propósito de llegar a conclusiones acerca de
una población.

Estadística descriptiva
Se obtienen conclusiones sobre el conjunto de datos sin
incertidumbre. No realiza proyecciones
•Recolección de datos
•Clasificación de datos
•Organización de datos
•Analisis e interpretación

Estadística inferencial
Se obtienen conclusiones respecto a la población bajo
incertidumbre. Realiza proyecciones
•Toma de decisiones a partir de una muestra
UPC MA444 Estadística 8
Conceptos básicos
Población
Es un conjunto de elementos (personas, objetos, etc.) que tienen una o más características observables
que se pueden medir en ellos. Se denota por la letra N mayúscula.

Población: Todos los grifos de la ciudad de lima

Ejemplo 1
Para conocer la opinión que tienen los estudiantes de ingeniería sobre el servicio que ofrece el Centro
de Información, se puede considerar como

Población: Todos los estudiantes de ingeniería de la UPC matriculados en el semestre anterior.

Muestra
Se denomina muestra a una parte de la población. El tamaño de la muestra se denota con la letra n
minúscula.

Muestra: 50 estudiantes de ingeniería de la UPC matriculados en el semestre anterior.

Ejemplo 2
Para conocer la opinión que tienen los estudiantes de ingeniería, sobre el servicio que ofrece el Centro
de Información, se puede considerar como muestra a un subconjunto de estudiantes de ingeniería de
la UPC matriculados en el semestre anterior.

Elemento o unidad elemental


Es cada una de las entidades acerca de las cuales se reúnen los datos.

Unidad Elemental: Un estudiante de ingeniería de la UPC matriculados en el semestre anterior.


UPC MA444 Estadística 9

Población Todos los trabajadores del área de marketing de la inmobiliaria Nexo


Muestra Algunos de los trabajadores del área de marketing de la inmobiliaria Nexo
Elemento Un trabajador del área de marketing de la inmobiliaria Nexo

Población Todas las farmacias del distrito de San Miguel

Muestra Un subconjunto de farmacias del distrito de San Miguel


Elemento Una farmacia del distrito de San Miguel
UPC MA444 Estadística 10
Ejemplo 3
El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad
en el departamento de Lima y las consecuencias que éste podría generar en el
Cercado de Lima. Por esta razón, Defensa Civil ha decidido realizar un
diagnóstico de la situación de las viviendas en este distrito encuestando a 1200
viviendas seleccionadas al azar. Parte de la encuesta se presenta a
continuación.

Encuesta de vivienda
1. Tiempo de antigüedad de la vivienda
• Menos de 10 años
• Entre 10 y 20 años
• Más de 20 años
2. Material de construcción de la vivienda:
• Cemento
• Adobe
• Quincha
• Prefabricado
3. Número de habitaciones: ____________
4. Área de terreno: __________ m2
5. La vivienda se encuentra en:
• Buen estado de conservación
• Regular estado de conservación
• Mal estado de conservación

Complete la siguiente ficha técnica:


Fecha: Del 02 al 15 de marzo del 2020
Población: Todas las viviendas en el distrito de Cercado de Lima
Muestra: 1200 viviendas en el distrito de Cercado de Lima
Unidad elemental: Una vivienda en el distrito de Cercado de Lima

Con 95% de confianza y 3% de margen de error.

Ejemplo 4
Se realizó un estudio para determinar la cantidad promedio diario de residuos de construcción y
demolición en la ciudad de Lima durante los meses de enero, febrero y marzo del presente año.
Determine la población, muestra y elemento.
Todos los residuos diarios de construcción y demolición en la ciudad de Lima
Población
durante los meses de enero, febrero y marzo del presente año
Algunos residuos diarios de construcción y demolición en la ciudad de Lima durante
Muestra
los meses de enero, febrero y marzo del presente año
Un residuo diario de construcción y demolición en la ciudad de Lima durante los
Elemento
meses de enero, febrero y marzo del presente año
UPC MA444 Estadística 11

Variables
Una variable es la característica de interés de los elementos. Se representan con las letras mayúsculas
de nuestro alfabeto; por lo general, X, Y, Z.

Unidad Elemental: Un alumno de la UPC

X: nombre
Y: peso
Z: promedio ponderado

Tipo de variables

Variable cualitativa
Es la característica cuyos valores no son numéricos. Por ejemplo, carrera universitaria, material de
construcción y tipo de resistencia.

Variable cuantitativa
Es la característica cuyos valores son numéricos. Se dividen en discretas y continuas.

Variable cuantitativa discreta


Es aquella variable cuyo resultado sólo puede tomar un número finito o infinito numerable de valores.
Estos valores surgen de un proceso de conteo.
X: número de hermanos
Y: número de curso que llevo en el ciclo

Variable cuantitativa continua


Es aquella variable cuyo resultado puede tomar infinitos valores entre dos valores cualesquiera. Estos
valores surgen de un proceso de medición.
Estatura 180cm 180.1 cm
Temperatura -10°C, 13.4 °C
Ejemplo 1
Son variables cuantitativas discretas:
• Número de artículos defectuosos producidos diariamente
• Número de defectos por barra de acero

Son variables cuantitativas continuas:


• Temperatura (°C)
• Longitud de las barras de acero (cm)

Son variables cualitativas:


• Grado de instrucción
• Opinión sobre la calidad del servicio
UPC MA444 Estadística 12
Ejemplo 2
Si tenemos la siguiente pregunta: ¿Cuál es tu programa de televisión preferido? y deseamos la variable
se usa una letra mayúscula, por ejemplo, X:= Programa de televisión preferido.

Pregunta Variable en estudio Tipo de variable


¿Cuál es tu programa de televisión X : programa de televisión
Cualitativa
preferido preferido

Ejemplo 3
En cada caso, identifique la variable en estudio y su tipo.

Pregunta Variable en estudio Tipo de variable

¿Cuál es su grado de
X:Grado de Instrucción Cualitativo
instrucción?

¿Cuál es su ingreso
Y: Ingreso mensual (soles) Cuantitativa Continua
mensual, en soles?

¿Cuántos hermanos
Z:Numero de hermanos Cuantitativa Discreta
tiene?

¿Cuál es tu año de
W: Año de Nacimiento Cualitativo
nacimiento?
UPC MA444 Estadística 13
Escalas de medición
Las escalas de medición de las variables permiten determinar la cantidad de información que
contienen los datos e indica el resumen de estos y el análisis estadístico más apropiado.

Las escalas de medida de una variable cualitativa son las siguientes:

Nominal
Una variable está medida en escala nominal cuando los datos son etiquetas o nombres que se emplean
para definir un atributo del elemento. Por ejemplo: el género de las personas, el estado civil, el número
telefónico, etc.

Sexo: (femenino, masculino), Carrera: (Ing. Civil, Ing. Electrónica, Mecatrónica)

Ordinal
Una variable está medida en escala ordinal cuando pueden ordenarse de acuerdo con algún criterio.
Se pueden ordenar en forma ascendente o descendente. También, pueden registrarse por medio de
un código numérico. Por ejemplo: el orden de mérito de los alumnos en el curso de estadística, el grado
de instrucción de los clientes de un banco, nivel socioeconómico de los alumnos de la universidad.

Opinión del Servicio: (Bueno, Regular, Malo), Orden de Mérito: (quinto superior, tercio superior)

Las escalas de medida de una variable cuantitativa son las siguientes:

Intervalo
Una variable está medida en escala de intervalo si el cero es relativo, es decir, no indica la ausencia de
la característica medida. Por ejemplo: las temperaturas en grados Celsius o en grados Fahrenheit.

Temperatura = 0 °C, -10°C, 13.4 °C

Razón
Una variable está medida en escala de razón si el cero indica la ausencia de característica de la medida.
Por ejemplo: el sueldo de los empleados de una empresa, el peso de los trabajadores.

Sueldo = 0, Estatura = 0
UPC MA444 Estadística 14

Ejemplo 1

Complete:

a. ¿Cuál es tu programa de TV preferido?


Y = Programa de Tv preferido
Tipo de variable: Cualitativa
Escala de medida: Nominal

b. ¿Cuál es tu carrera profesional


Y=
Tipo de variable:
Escala de medida:

c. ¿Cuánto es la temperatura hoy, en grados centígrados?


Y = Temperatura actual
Tipo de variable: Cuantitativa Continua
Escala de medida: Intervalo

d. ¿Cuál es su año de nacimiento?


Y=
Tipo de variable:
Escala de medida:

e. ¿Cuántos hermanos tiene?


Y = Numero de Hermanos
Tipo de variable: Cuantitativa Discreta
Escala de medida: Razón

Ejemplo 2

La Corporación Aceros Perú es una empresa que se dedica a la industria del acero. Actualmente, la
empresa está fabricando hierro esponja, palanquillas de acero, barras helicoidales, alambrón y barras
de construcción y tiene una capacidad de 680,000 toneladas al año. Uno de los mercados a los que
más se orientan los productos es el mercado de la construcción de Lima.

El departamento de Control de Calidad está encargado de realizar un estudio sobre las varillas
devueltas a la fábrica. Al seleccionar una muestra aleatoria de 80 barras de aceros de la sección de
devoluciones del almacén, se midieron algunas características de acuerdo con la siguiente ficha
técnica:
UPC MA444 Estadística 15
Número de barra: ___________
1. Tipo de barra de acero:
• Corrugado ASTM
• Corrugado Grado60
• Corrugado NBR7480
• Corrugado 4,7 mm
2. El destino de uso de la barra de acero
• Columnas
• Vigas
• Cimentación
• Concreto armado
3. Resistencia a la tracción: ________________ kg/cm2

4. Número de protuberancias: ________________


5. Categoría del límite a afluencia
• Alta
• Regular
• Baja
6. Tipo de defecto
• Escamas • Marcas mecánicas • Corrosión
• Pliegues • Fisuras
• Grietas • Porosidad

A partir de la información, complete el siguiente cuadro.

Indique la población

Indique la muestra

Identifique las características e


indique el tipo de variable y la
escala de medida.
UPC MA444 Estadística 16
UPC MA444 Estadística 17
Ejercicios propuestos

1. Corporación Domar S.A.C. es una empresa peruana ubicada en la ciudad de Lima con más de ocho
años de experiencia en el sector Industrial. La empresa ejecuta proyectos de instalación de sistemas
mecánicos y electrónicos, además brinda un servicio industrial de mantenimiento especializado de
maquinarias y laboratorios en todas las especialidades de ingeniería. El gerente del área de servicios
quiere convertir a la corporación en una de las empresas con mayor representatividad, a nivel
nacional, en el rubro industrial, por lo que desea evaluar los servicios brindados durante el último
trimestre. Se seleccionaron al azar 22 registros de los servicios realizados durante el último
trimestre. Algunas de las variables registradas se presentan a continuación:

• Precio neto por el servicio (en miles de soles)


• Rubro de la empresa cliente (Construcción, Industria Manufacturera, Salud, Educación)
• Número de ingenieros necesarios para realizar el servicio
• Tipo de servicio (Mantenimiento preventivo, mantenimiento correctivo, instalación de
laboratorios, instalación de máquinas industriales)
• Cantidad de días de ejecución del servicio

a. Identifique la población y clasifique las variables según su tipo y escala de medida.

Población

Variable Tipo de variable Escala de medida

Precio neto por el servicio

Rubro de la empresa cliente

Número de ingenieros necesarios


para realizar el servicio

Tipo de servicio

Cantidad de días de ejecución del


servicio

2. El gobierno peruano está preocupado por la ocurrencia de un sismo de alta intensidad en el


departamento de Lima y por las consecuencias que esto podría generar, especialmente en algunos
distritos como el Cercado de Lima. Por esta razón, Defensa Civil realizó un diagnóstico de la
situación de las viviendas en el mencionado distrito a través de una muestra de 1200 viviendas
seleccionadas al azar.

Se registraron las siguientes variables:


• Tiempo de construida la vivienda, en años
• Material de construcción de la vivienda (cemento, adobe, quincha, material prefabricado)
• Número de habitaciones por vivienda
• Área del terreno en donde se construyó la vivienda.
UPC MA444 Estadística 18
De acuerdo con el enunciado, identifique:

Población

Muestra

Variable Tipo de variable Escala de medida


Tiempo de construida la
vivienda, en años
Material de construcción de
la vivienda
Número de habitaciones por
vivienda
Área del terreno en donde se
construyó la vivienda

3. Computer es una compañía dedicada a brindar servicios informáticos a empresas que desean tener
una presencia firme y contundente en la red. Esta compañía se dedica al tendido de redes LAN,
instalación de equipos, servidores y toda una gama de productos tecnológicos que puedan resultar
imprescindibles para una empresa.

Como parte de un estudio realizado por Computer se analizó la información correspondiente a una
muestra de 30 empresas en la ciudad de Lima a las que se les brindó los servicios informáticos.

Identifique el tipo y escala de medición de las variables consideradas en dicho estudio.

Variable Tipo de variable Escala de medida


Lenguajes de programación (Cobol,
Cualitativa Nominal
Java, etc.)
Cantidad de servidores por
Cuantitativa Discreta Razón
empresa
Costo de las licencias de software
Cuantitativa Continuo Razón
(en dólares)

Año de instalación del software Cualitativa Ordinal

4. La empresa de investigación de mercados Alpha S.A. realizó un estudio para evaluar el efecto de la
caída de la bolsa de valores de Lima (BVL) en las administradoras de fondos de pensiones (AFP). En
este estudio se tomó una muestra de 300 afiliados entre 25 y 35 años en Lima seleccionados al azar.

Se registraron las siguientes variables:


• AFP a la que pertenece el afiliado
• Monto del fondo del afiliado (en soles)
• Edad del afiliado (en años)
• Tipo de fondo según riesgo (bajo, moderado, alto).
UPC MA444 Estadística 19

De acuerdo con el enunciado, identifique:

Población

Muestra

Variable Tipo de variable Escala de medida


AFP a la que pertenece el
afiliado
Monto del fondo del
afiliado (en soles)

Edad del afiliado (en años)

Tipo de fondo según riesgo

5. Indique el tipo y la escala de medición de las características observadas en una muestra de


secciones de tuberías de agua.

Variable Tipo de variable Escala de medición

Diámetro de la tubería (pulgadas)

Material de la tubería

Año de instalación

Ubicación (subterránea, aérea)

Longitud de la tubería (pies)


Estabilidad del suelo circundante (inestable,
moderadamente estable o estable)
Corrosividad del suelo circundante (corrosivo o
no corrosivo)
UPC MA444 Estadística 20
Dato
Es la respuesta que se tiene, por variable, de cada unidad elemental. Los datos pueden ser numéricos
o no numéricos.

Observación
Es el conjunto de datos medidos de una unidad elemental.

Ejemplo 1

La siguiente base de datos contiene información de una muestra de 10 usuarios de Internet.

Principales problemas con Número de PC Tiempo de navegación


Usuario Marca de PC
Internet con Internet diaria (min)
1 HP Saturación de la red 1 194,00
2 Dell Lentitud para subir información 1 274,45
3 IBM Saturación de la red 3 104,89
4 HP Lentitud para ver videos 3 125,53
5 Dell Lentitud para ver videos 3 123,97
6 HP Calidad y durabilidad del modem 4 134,66
7 Otra marca Baja velocidad en la señal 2 256,33
8 HP Otros 2 195,32
9 HP Baja velocidad en la señal 2 121,90
10 Lenovo Lentitud para ver videos 2 378,27

Identifique y complete:

Indique la unidad elemental Un usuario de internet

¿Cuántos datos hay por unidad elemental? 4

¿Cuántas observaciones hay? 10

¿Cuántas características se están evaluando? 4

¿Cuántos datos hay en total? 40


Proporcione un ejemplo de dato cuantitativo
4 Número de PC con Internet
discreto
Proporcione un ejemplo de dato cuantitativo
134,66 Tiempo de navegación diaria (min)
continuo
Proporcione un ejemplo de observación
UPC MA444 Estadística 21
Parámetro
Un parámetro resume una característica de la población. Para obtener su valor se hace necesario
contar con toda la información que brindan los elementos de una población.

Estadístico
Un estadístico resume una característica de la muestra, para obtener su valor se utiliza la información
muestral. El valor obtenido de un estimador se conoce como estimación. Al estimador se le llama
estadígrafo o estadístico.

Algunos parámetros y estadísticos:

Nombre de la medida de resumen Notación del parámetro Notación del estadístico


∑𝑁
𝑖=1 𝑥𝑖 ∑𝑁
𝑖=1 𝑥𝑖
Promedio 𝜇= 𝑥̅ =
𝑁 𝑛

Moda Mo mo

𝐴 𝑥
Proporción 𝑝= 𝑝̂ =
𝑁 𝑛

Ejemplo 1

Se tiene una población de 30 alumnos del curso de estadística de la sección CI3A. A cada alumno se
le preguntó su edad. Con esos 30 datos se calculó la media, que es 19,7 años.

Complete el siguiente cuadro:

Indique si este valor corresponde a un


Parámetro
parámetro o a un estadístico

Indique el valor de la medida de resumen. 19,7 años

Indique la notación de la medida de resumen. 𝜇


UPC MA444 Estadística 22
Organización de datos cualitativos

La organización se presenta a través de una tabla y de gráficos.

Tabla de distribución de frecuencias


Distribución de < elementos> según <variable>
Variable Frecuencia absoluta fi Frecuencia relativa hi Frecuencia porcentual pi
𝑓1
Categoría 1 𝑓1 ℎ1 = 𝑝1 = ℎ1 × 100%
𝑛
𝑓2
Categoría 2 𝑓2 ℎ2 = 𝑝2 = ℎ2 × 100%
𝑛
⋮ ⋮ ⋮ ⋮
𝑓𝑘
Categoría k 𝑓𝑘 ℎ𝑘 = 𝑝𝑘 = ℎ𝑘 × 100%
𝑛
F : ……………………………………..

Los elementos de la tabla de frecuencias se describen a continuación:

Frecuencia absoluta (fi)


La frecuencia absoluta (fi) de una categoría, está dada por el número de repeticiones en las
observaciones que presenta esta categoría.

Frecuencia relativa (hi)


La frecuencia relativa (hi) de una categoría está dada por la proporción del número total de
observaciones que caen en esa categoría.

Frecuencia relativa acumulada (Hi)


La frecuencia relativa acumulada de una categoría está dada por la proporción del número total de
observaciones que caen hasta esa categoría.

Elementos de la tabla de frecuencias

Título
El título debe seguir la siguiente estructura:

Distribución de <elementos> según <variable en estudio>

Fuente
Se refiere de dónde se recolectaron los datos para posteriormente ser organizados. Se ubica siempre
en la parte inferior de la tabla.
UPC MA444 Estadística 23
Ejemplo 1
La siguiente información muestra la distribución de una muestra de viviendas de un determinado
distrito de Lima según material con el cual fue construido. Observe que el título sigue la siguiente
estructura:
Distribución de <elementos> según <variable>

Distribución de viviendas según material de construcción


Material de construcción fi hi = fi/n pi = hi x 100%
Cemento 48 0,160
Adobe 100 0,333
Quincha 108 0,360
Material prefabricado 44 0,147
Total 300 1,000
Fuente: Municipalidad distrital

Indique la unidad elemental, variable en estudio, su tipo y escala de medición.

Unidad elemental

Variable en estudio Tipo de variable Escala de medición

Interprete el valor de las siguientes frecuencias:

f3 = …

p3 = …

Gráficos de una variable cualitativa


Barras y sector circular
• Para organizar gráficamente la variable cualitativa se utiliza el gráfico de barras o el gráfico de sector
circular.
• En caso la variable cualitativa sea de escala ordinal, se recomienda usar el gráfico de barras, donde
en el eje X se muestre la jerarquía de las categorías. Si trabajamos con variables cualitativas de
escala nominal, las categorías pueden ser colocadas en cualquier orden.
• En el gráfico de barras es posible usar las frecuencias absolutas o porcentuales, pero se prefieren
las frecuencias porcentuales.
• Para el caso del gráfico circular sólo es posible usar las frecuencias porcentuales.
• El título del gráfico es el mismo que se ha colocado a la tabla de frecuencias.
• En ambos tipos de gráfico, colocar la fuente y las etiquetas.
UPC MA444 Estadística 24
Ejemplo 1
La empresa PC Review – Perú está interesada en conocer cuál es el programa de Microsoft Office que
más utilizan los empleados de las empresas de la ciudad de Lima. Por tal motivo seleccionó al azar una
muestra de 500 empleados y se les pidió que indicaran el programa que más usaban diariamente. La
información se presenta a continuación:

Distribución de empleados según tipo de programa de Microsoft que usan diariamente


Programa de Microsoft Número de empleados fi hi pi% = hi x 100%
Access 50
MS Excel 101
MS Power Point 90
MS Word 113
Outlook 101
Otros 45
Total 500
Fuente: PC-Review-Perú

Complete los elementos que faltan en cada uno de los gráficos y comente:

Título del gráfico


120 113
101 101
100 90

80
Título del eje

60 50
45
40

20

0
Access MS Excel MS Power Point MS Word Outlook Otros
Título del eje

Fuente: PC-Review-Perú

Comentario del gráfico


UPC MA444 Estadística 25

Título del gráfico


Otros Access
9% 10%

Outlook
MS Excel
20%
20%

MS Word MS Power Point


23% 18%
Fuente: PC-Review-Perú

Comentario del gráfico


UPC MA444 Estadística 26
Caso: Corporación Domar S.A.C.

Domar, es una empresa peruana ubicada en la ciudad de Lima y ejecuta


proyectos de instalación de sistemas mecánicos y electrónicos.
Además, brinda servicio de mantenimiento especializado de
maquinarias y laboratorios. Últimamente, se han presentado ciertos
inconvenientes con las empresas que solicitan sus servicios. Por esta
razón, el jefe del área desea realizar una evaluación seleccionando al
azar 32 registros de los servicios que se realizaron el primer trimestre
del presente año.

Complete la siguiente tabla:

Variable Tipo de variable Escala de medición


Costo por servicio (en miles de soles)
Número de técnicos especializados
necesarios para realizar el servicio
Principal queja presentada por la empresa
que recibió un servicio
Tiempo en horas para realizar el servicio

Calificación por el servicio (1 al 10)

El jefe del Área de Servicios impulsará paquetes si más del 25% de los clientes que solicitaron un
servicio pertenecen a este rubro.

Rubro de la empresa cliente de una muestra de 32 registros


Salud Servicios Manufacturera Manufacturera
Construcción Salud Salud Salud
Servicios Servicios Manufacturera Educación
Construcción Servicios Manufacturera Manufacturera
Manufacturera Construcción Educación Manufacturera
Salud Manufacturera Manufacturera Educación
Servicios Manufacturera Manufacturera Servicios
Servicios Manufacturera Salud Educación

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante indica El estudiante El estudiante El estudiante redacta
redacta el la variable y que muestra los indica conque la decisión que
problema, con un herramienta cálculos realizados valor calculado tomará a partir del
lenguaje sencillo, estadística utilizará para dar respuesta responde el resultado de su
como pregunta u en la solución del al problema. problema. análisis.
objetivo. problema.
UPC MA444 Estadística 27
Gráfico de Pareto

• El gráfico de Pareto es un gráfico especial de variable cualitativa. Es un gráfico de barras ordenado


por frecuencia, en orden descendente.
• P g áf P : “ 80% de los problemas se pueden
, 20% q g ” v , h v .
• Este diagrama es un caso particular de gráfico de barras y es utilizado básicamente para conocer
cuáles son los factores más importantes que deben priorizarse para aplicar mejoras o medidas
correctivas.

Pasos para realizar el gráfico de Pareto

• Recolectar los datos y clasificarlos por categorías.


• Ordenar las categorías de mayor a menor, según su frecuencia absoluta.
• L g í “O ” ú , á g el valor
de esta categoría.
• Dibuje dos ejes verticales y uno horizontal. En el eje vertical secundario marque con una escala de
0% a 100% y en el eje vertical primario, marque una escala de 0 hasta el número total de
observaciones. En el eje Horizontal, marque los espacios donde estarán dibujadas las barras para
cada una de las categorías, g í “O ”.
• Calcule los porcentajes individuales y acumulados de cada categoría.
• Elabore el diagrama de barras y dibuje la línea de frecuencias acumuladas (curva de Pareto).
• Coloque el título principal, el título de los ejes, primario y secundario, etiquetas y fuente.

Ejemplo 1
El jefe de control de calidad de la empresa Mundo está interesado en conocer cuáles son las principales
causas que están afectando la producción.

Al seleccionar una muestra de 450 artículos fallados obtuvo los siguientes resultados:

Distribución de ……………………. según ………………………………


Causas que afectan la producción Cantidad
Inestabilidad máquina 56
Cambios ambientales 191
Rotura máquina 35
Cansancio operador 11
Desgaste del equipo 3
Desviación del material 5
Fluctuación energía 9
Error de medición 10
Partida fría 8
Rotura de operador 122
Total 450
Fuente: Empresa Mundo
UPC MA444 Estadística 28

Complete g P g g í “O ” a las categorías cuyas frecuencias


absolutas sean de 10 a menos e identifique las principales causas que resuelvan el 80% de los
problemas de producción.

Distribución de ………………………. según ……………………………


Causas que afectan la producción fi hi Fi Hi
Cambios ambientales 191 0,424 191 42,4%
Rotura de operador 122 0,271 313 69,6%
Inestabilidad máquina 56 0,124 369 82,0%
Rotura máquina
Cansancio operador
Otros
Total 450 1
Fuente: Empresa Mundo

Título del gráfico

450 89.8% 100%

Porcentaje acumulado de artículos


400 82.0%

350 69.6% 80%


Número de artículos

300
60%
250
42.4%
200 191
40%
150 122
100 20%
56
50
0 0%
Cambios Rotura de Inestabilidad Rotura máquina Cansancio Otros
ambientales operador máquina operador

Fuente: Empresa Mundo Principal causa


UPC MA444 Estadística 29
Ejercicios propuestos

6. La siguiente tabla muestra información sobre el defecto observado con mayor frecuencia en los
puentes vecinales construidos en estructura de madera en cierta localidad del interior del país:

Distribución de puentes vecinales según tipo de defecto observado


Defectos observados fi hi Fi Hi

Pandeos y rajaduras 40
Pudrimiento de las piezas de madera 30
Efectos del desgaste mecánico 20
Otros 5
Deformaciones 15
Ataques de insectos y crustáceos 10
Acción de fuego 5
Fuente: Municipalidad distrital

Elabore el diagrama de Pareto para identificar qué defectos deben priorizarse en este tipo de
puentes.

7. Rex es una empresa con más de 30 años en el mercado y está dedicada a la fabricación de hornos
para la elaboración de ladrillos que requieren altas temperaturas de secado. Estos aparatos pueden
causar daños bastantes considerables a los operarios cuando el horno no está funcionando
correctamente.

Durante el último mes, el departamento de control de calidad seleccionó una muestra de 57 hornos
para su revisión. Los problemas que se observaron en la revisión se muestran a continuación:

Distribución de …………………………………………………………………………..
Principal problema Número de hornos
Condensación precoz 5
Retracciones del mortero 12
Cocción de ladrillos 15
Otros 8
Caliches 9
Exfoliaciones 8
Fuente: Rex S.A.

El departamento de control de calidad tiene por norma priorizar los problemas que resuelvan
alrededor del 80% del total de casos. Sin embargo, si estos problemas son más de tres, dicho
departamento ordenará una revisión total del proceso de producción. Indique lo que hará el
departamento de control de calidad.
UPC MA444 Estadística 30
8. Metronics es una fábrica especializada en la producción de piezas electrónicas para ensamblaje de
computadoras. En los últimos meses, el jefe de producción ha registrado pérdidas, por ello, ha
solicitado información estadística. Una muestra aleatoria de 30 piezas defectuosas fabricadas
diariamente por el área de producción arrojó la siguiente información respecto al problema
observado en la pieza defectuosa.

Basado en su experiencia, el inspector determina que corrigendo a lo más el 77% de los problemas
se reducen pérdidas en la producción. Si se llega a identificar que los problemas a corregir son tres,
entonces pasará por un nuevo proceso de evaluación de calidad de los productos. ¿La empresa será
sometida nuevamente a un proceso de evaluación de calidad?

Distribución de ……………………………………………
Problema observado Número de piezas fabricadas
Recalentamiento 3
Corrosión 6
Rajadura 8
Deformación 9
No cumple estándar 4
Fuente: Metronics S. A.
UPC MA444 Estadística 31
Tabulaciones cruzadas
También llamadas tablas de contingencia o tablas de doble entrada. Se usan para resumir de manera
simultánea los datos de dos variables.

Ejemplo 1
Uno de los requisitos que toda represa debe tener es poder conservar las condiciones de funcionalidad
y de seguridad que permita su utilización a lo largo de su vida útil, sufriendo las menores incidencias
posibles y dando cumplimiento a la legislación de seguridad y mantenimiento vigentes.

La Confiep sospecha que existe un alto porcentaje de represas de tipo terraplén en mal y muy mal
estado de conservación. De comprobarse que este porcentaje supera el 10%, la represa será declarada
en emergencia. La información de la tabla fue obtenida al término de la inspección de las represas.

Estado de conservación
Tipo de represa
Bueno Regular Malo Muy Malo Total
Cimiento 16 17 12 12 57
Excavación 5 8 5 11 29
Terraplén 7 9 13 5 34
Total 28 34 30 28 120
Fuente: Confiep

Identifique las variables en estudio, tipos y escalas de medida.

Identifique la unidad elemental.

Coloque título a la tabla.

Interprete el valor de la celda sombreada con respecto al total de fila.


UPC MA444 Estadística 32
Interprete el valor de la celda sombreada con respecto al total de columna.

Interprete el valor de la celda sombreada con respecto al gran total.

Ejemplo 2
Un estudio realizado por A&C Consultores sobre los tipos de riesgos asociados a las excavaciones de
zanjas y tipo de terreno, arrojó los siguientes resultados en base a una muestra de 500 obras de
construcción.

Distribución de las obras de construcción según tipo de terreno y riesgo más importante
Tipo de riesgo más importante
Tipo de terreno
Atrapamiento Caída de personal Derrumbe Inundaciones Otros Total
Roca blanda 27 66 51 9 25 178
Roca dura 15 53 38 3 9 118
Tierra arcillosa 9 31 17 1 10 68
Tierra fuerte 17 55 36 10 18 136
Total 68 205 142 23 62 500
Fuente: Consultores A&C

Indique el número de obras de construcción cuyo tipo de terreno son de roca dura y presentan riesgo
de derrumbe.

Del total de obras que presentan riesgo de atrapamiento, indique el porcentaje de obras de
construcción son de tierra fuerte.

Indique el porcentaje de obras de construcción con riesgo de inundación y roca dura.


UPC MA444 Estadística 33
Ejercicios propuestos

9. La siguiente tabla muestra la distribución de clientes de la empresa de telefonía según sus


principales quejas.

Distribución de clientes según principales quejas


Principales quejas fi hi Fi Hi
Cambios sin consentimiento 246
Tarifas y servicios 106
Forzamiento al cambio 29
Marketing 74
Llamadas internacionales 15
Maltratos 12
Servicio de operadora 18
Fuente: Empresa de telefonía A

Construya el diagrama de Pareto para la variable en estudio. Considere un acumulado de menos


de 8% para la categoría Otros. ¿Cuáles son las quejas que deberán priorizarse?

10.En la siguiente tabla se muestran los resultados obtenidos de un estudio realizado en la ciudad de
Nazca por un grupo de profesionales de la UPC de la facultad de Ingeniería sobre las fallas
estructurales en las edificaciones debido al último sismo que tuvo como epicentro la ciudad de
Nazca.

Distribución de edificaciones en Nazca según falla estructural debido al último sismo


Falla estructural Porcentaje
Columnas cortas 10%
Configuración del edificio 45%
Problemas geotécnicos 30%
Otros 10%
Piso blando 5%
Fuente: UPC. Facultad de Ingeniería

Construya un diagrama de Pareto para identificar las fallas estructurales que tienen mayor
incidencia en las edificaciones en la ciudad de Ica debido al último sismo mencionado.
UPC MA444 Estadística 34
Organización de datos cuantitativos discretos

La variable cuantitativa discreta, además de presentar las frecuencias absolutas y relativas, presenta
dos frecuencias acumuladas.

La frecuencia acumulada absoluta representada por Fi y la frecuencia acumulada relativa representada


por Hi.

Tabla de distribución de frecuencias

Frecuencia acumulada absoluta (Fi)


Representa el número de observaciones que caen hasta esa categoría.

Frecuencia porcentual (pi)


Representa el valor porcentual de la frecuencia relativa.

Distribución de < elementos> según <variable>


Variable fi hi Fi Hi pi
0 𝑓1 ℎ1 𝐹1 𝐻1 𝑝1
1 𝑓2 ℎ2 𝐹2 𝐻2 𝑝2
2 𝑓3 ℎ3 𝐹3 𝐻3 𝑝3
… … … … … …

𝑘 𝑓𝑘 ℎ𝑘 𝑛 1 𝑝𝑘
Total 𝑛 1
F : ………

Gráfico de bastones o líneas


Es un gráfico para variable cuantitativa discreta donde se representan los valores de la variable y sus
respectivas frecuencias absolutas, relativas o porcentuales. Como todo gráfico debe tener su título
principal, títulos en los ejes, X e Y, las etiquetas, y la fuente.
UPC MA444 Estadística 35
Ejemplo 1
A continuación, se presenta el gráfico de bastones para la variable <número de capacitaciones
realizadas durante el último semestre del año>, obtenida a partir de una muestra de trabajadores de
una determinada empresa de cemento ubicada en la ciudad de Lima. En base al siguiente gráfico
identifique:
Distribución de empleados según número de capacitaciones

60 54 52
49
50
Número de empleados

40
30
16
20
8 6
10
0
0 1 2 3 4 5 6
Fuente: Empresa de Cemento A Número de capacitaciones

Identifique la unidad elemental.

Un empleado

Indique el tamaño de muestra.

185

Indique la variable en estudio.

Numero de capacitaciones

Interprete el gráfico
UPC MA444 Estadística 36
Ejercicios propuestos

11.El jefe de recursos humanos de la empresa A desea determinar la distribución de la cantidad de


faltas que han tenido los trabajadores el mes anterior. Por tal motivo, seleccionó al azar 30
trabajadores y registró el número de faltas. Los datos se presentan a continuación:

0 0 0 0 1 1 1 1 1 1 1 1 2 2 2
2 2 2 2 2 2 2 3 3 3 3 3 3 4 4

a. Con la información anterior, indique:

la cantidad de faltas que han tenido los trabajadores el


Variable en estudio
mes anterior en la empresa A
Escala de medida de la variable Razón

Unidad elemental Un trabajador

Interprete un dato 4: un trabajador presento 4 faltas

b. Complete la tabla y llene los espacios en blanco.

Distribución de trabajadores según la Cantidad de Faltas

Número de faltas fi hi Fi Hi
0 f1=4 h1=0.1333 F1=4 0.1333
1 f2=8 0.2667 F2=12 0.4000
2 10 h3=0.3333 22 H3=0.7333
3 6 h4=0.2000 F4=28 H4=0.9333
4 f5=2 0.0667 30 1.0000
Total
Fuente: Empresa A

c. Indique el porcentaje de trabajadores que no presentaron faltas el mes anterior.


Rpta: 13.33%
d. Indique el número de trabajadores que tuvieron a lo más dos faltas.
Rpta. 22
e. Los trabajadores con problemas son aquellos con tres o más faltas. Indique el porcentaje de
trabajadores que tienen problemas.
Rpta: 26.67%
f. Interprete la primera frecuencia absoluta.
f1=4 : Cuatro trabajadores presentaron como numero de faltas el valor cero
g. Interprete la tercera frecuencia relativa.
h3=0.3333: el 33.33% de los trabajadores presentaron como numero de faltas el valor dos
h. Interprete la cuarta frecuencia acumulada absoluta.
UPC MA444 Estadística 37
F4=28: Veintiocho trabajadores presentaron como numero de faltas hasta el valor tres

i. Presente el gráfico adecuado para la variable en estudio. Interprete.

Distribución de trabajadores según la Cantidad de Faltas

12
10
Numero de Trabajadorees

10
8
8
6
6
4
4
2
2

0
0 1 2 3 4
Numero de Faltas

Se observa que el mayor número de faltas que presentaron los trabajadores es dos con diez casos y
el menor es cuatro con dos casos y el número regular de faltas tiende a ser dos

12.La siguiente información muestra el número de ladrillos defectuosos fabricados diariamente en una
de las plantas de la empresa Rex. En una muestra aleatoria de 50 días se obtuvo la siguiente
información:

Distribución de días según número de ladrillos defectuosos


Número de ladrillos defectuosos fi hi Fi Hi
0 12
1 0,32
2 0,10
3 9
4 8 0,16
Total 50 1,00
Fuente: Rex S.A.

Si el gerente de Rex encuentra al menos un ladrillo defectuoso, en más de 40 días, deberá revisar
su sistema de fabricación.

13.El gerente de la empresa Líder S.A. solicita al jefe del Departamento de Ingeniería realizar una
investigación de las obras que fueron atendidas por la empresa el periodo anterior. Para la
realización del estudio, seleccionó aleatoriamente una muestra de 160 obras de construcción
atendidas el año pasado. La gerencia decidirá adquirir más camiones mezcladores, para las obras
de construcción, si el porcentaje de obras en el que se utiliza mínimo tres camiones para el traslado
del concreto armado premezclado supera el 55%. Indique lo que hará la empresa.
UPC MA444 Estadística 38

Distribución de obras según número de camiones


60 55

50 45

Cantidad de obras
40
30 25

20 15
10 10
10
0
0 1 2 3 4 5 6 7

Fuente: Empresa Líder S.A. Número de camiones

14.Investigadores del Massachussets Institute of Technology (MIT) estudiaron las propiedades


espectroscópicas de asteroides de la franja principal, con un diámetro menor a los 100 kilómetros.
Los asteroides se observaron con el telescopio Hiltner del observatorio de MIT; se registró el
número de exposiciones de imagen espectral independiente para cada observación. Aquí se
presentan los datos de 40 observaciones de asteroides obtenidas de Science.

3 4 3 3 1 4 1 3 2 3
1 1 4 2 3 3 2 6 1 1
3 3 2 2 2 2 1 3 2 1
6 3 1 2 2 3 2 2 4 2

Construir un gráfico de bastones para el número de exposiciones de imagen espectral.


UPC MA444 Estadística 39
Organización de datos cuantitativos continuos
Los datos se agruparán de intervalo (también llamados clases, categorías o grupos) cuando la variable
tiene gran variabilidad.

Tabla de distribución de frecuencias


Distribución de <unidades elementales> según <variable>
Frecuencia Frecuencia Frecuencia Frecuencia
Intervalos
Marca de clase 𝑥1´ absoluta relativa absoluta relativa
(clases)
𝑓𝑖 ℎ𝑖 acumulada 𝐹𝑖 acumulada 𝐻𝑖
𝐿𝑖1 + 𝐿𝑠1 𝑓1
[𝐿𝑖1 − 𝐿𝑠1 ] 𝑥1´ = 𝑓1 ℎ1 = 𝐹1 = 𝑓1 𝐻1 = ℎ1
2 𝑛
𝐿𝑖2 + 𝐿𝑠2 𝑓2
]𝐿𝑖2 − 𝐿𝑠2 ] 𝑥2´ = 𝑓2 ℎ2 = 𝐹2 = 𝑓2 + 𝐹1 𝐻2 = ℎ2 + 𝐻1
2 𝑛
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝐿𝑖𝑘 + 𝐿𝑠𝑘 𝑓𝑘
]𝐿𝑖𝑘 − 𝐿𝑠𝑘 ] 𝑥𝑘´ = 𝑓𝑘 ℎ𝑘 = 𝐹𝑘 = 𝑓𝑘 + 𝐹𝑘−1 𝐻𝑘 = ℎ𝑘 + 𝐻𝑘−1
2 𝑛
Total 𝒏 1,00
Fuente:

Pasos para elaborar la tabla de distribución de frecuencias


• Obtener el rango (𝑅) o recorrido, usando la siguiente fórmula:

𝑅 = 𝑑𝑎𝑡𝑜 𝑚á𝑥𝑖𝑚𝑜 − 𝑑𝑎𝑡𝑜 𝑚í𝑛𝑖𝑚𝑜

• Calcular el número de intervalos, usando la regla de Sturges:

𝑘 = 1 + 3,322 𝑙𝑜𝑔10 𝑛

El valor de 𝑘 se redondea por redondeo simple.

• Calcular la amplitud del intervalo, usando la siguiente fórmula:

𝑅
𝑤=
𝑘

El valor de 𝑤 se redondea por redondeo por exceso y con el mismo número de cifras decimales
que tienen los datos.

• Calcular las frecuencias absolutas y relativas con sus respectivas frecuencias acumuladas.

• Calcular la marca de clase a través de la siguiente fórmula:

límite 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟𝑖 + límite 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟𝑖


𝑥𝑖´ =
2
UPC MA444 Estadística 40
Ejemplo 1

Complete el siguiente cuadro.

Si los datos son enteros Es w = 12,7207; entonces 𝑤 =

Si los datos tienen una cifra decimal Es w = 2,0205; entonces 𝑤 =

Si los datos tienen dos cifras decimales Es w = 165,33033; entonces 𝑤 =

Ejemplo 2
Se ha llevado a cabo un estudio para evaluar el tiempo, en horas, que utiliza cada trabajador de una
planta hidroeléctrica para verificar el normal funcionamiento de la tubería de presión y las válvulas
de control. Para ello se eligieron al azar 30 de ellos.

0,08 0,15 0,19 0,71 0,75 0,82 0,84 0,92 0,96 1,16 1,17 1,19 1,23 1,4 1,47
1,59 1,61 2,01 2,16 2,38 2,42 3,07 3,22 3,53 3,76 3,94 4,5 4,59 4,75 5,41

Identifique y complete lo solicitado.

Elemento Un trabajador de una planta hidroeléctrica


El tiempo (horas) de verificar el normal funcionamiento de la tubería
Variable en estudio
de presión y las válvulas de control
Tipo de variable Cuantitativo Continuo

Escala de medida Razón

• Calcule el rango (R) o recorrido.

El dato máximo es 5,41 y el dato mínimo es 0,08, entonces el rango es R = 5,41 – 0,08=5,33

• Determine el número de intervalos (𝑘).

𝑘 = 1 + 3,322 𝑙𝑜𝑔10 (𝟑𝟎) = 5,90

Como 𝑘 debe ser un número entero, con redondeo simple 𝑘 = 6.

• Determine el tamaño del intervalo de clase (𝑤).

5,33
𝑤= = 0,88𝟖3
6

Como los datos tienen dos decimales, 𝑤 lo redondeamos por exceso con dos decimales, luego, el
valor de 𝑤 es 0,89.
UPC MA444 Estadística 41
Título: Distribución de Trabajadores según Tiempo de Verificación

i Intervalo X´i fi hi Fi Hi
1 [0,08 – 0,97] 0,525 f1=9 0.3 9 H1=0.3
2 ]0,97 – 1,86] 1,415 f2=8 h2=0.2667 F2=17 0.5667
3 ]1,86 – 2,75] 2,305 4 0.1333 21 0.7000
4 ]2,75- 3,64] 3,195 f4=3 0.1 F4=24 H4=0.8
5 ]3,64 – 4,53] 4,085 3 0.1 27 0.9
6 ]4,53 – 5,42] 4,975 3 0.1 30 1
F : ……………………

Interprete los valores de las siguientes frecuencias.

f2=8 ; Ocho trabajadores de la planta hidroeléctrica presentan un tiempo de


f2
verificación que se encuentra en el siguiente intervalo ]0,97 – 1,86] horas
h2=0.2667 ; el 26 67% de los trabajadores de la planta hidroeléctrica presentan un
h2(%)
tiempo de verificación que se encuentra en el siguiente intervalo ]0,97 – 1,86] horas
F4=24: veinticuatro trabajadores de la planta hidroeléctrica presentan un tiempo de
F4
verificación que se encuentra en el siguiente intervalo [0,08 – 3,64] horas
H4=0.80 ; el 80 % de los trabajadores de la planta hidroeléctrica presentan un tiempo
H4(%)
de verificación que se encuentra en el siguiente intervalo [0,08 – 3,64] horas

Ejemplo 3
Use la regla de Sturges para construir la tabla de distribución de frecuencias del monto de venta diario,
en cientos de soles, de la empresa Beta Systems S.A.

52,0 94,7 95,1 97,5 102,5 104,1 106,0 125,2 125,6 146,0
146,8 158,6 158,7 162,6 166,2 166,2 166,2 166,2 168,2 169,7
196,0 204,9 204,9 204,9 204,9 208,3 215,2 217,5 218,1 218,1
218,1 218,1 220,9 226,2 235,0 239,7 242,2 259,6 261,6 277,2
286,5 287,0 297,8 313,9 315,0 316,2 338,6 359,9 363,1 398,3

Identifique.

Elemento

Variable en estudio

Tipo de variable

Escala de medida
UPC MA444 Estadística 42
UPC MA444 Estadística 43
Complete la siguiente tabla.

Título: …
Límite inferior Límite superior X´i fi hi Fi Hi

Fuente:

Interprete los valores de las siguientes frecuencias.

f2

h3(%)

F4

H2(%)
UPC MA444 Estadística 44
Gráficos de una variable cuantitativa continua
Son gráficas que representan las observaciones obtenidas de la variable cuantitativa continua. Se
pueden realizar con las fi o pi. Como todo gráfico los elementos son: el título principal, título de los ejes
X e Y, etiquetas y fuente.

Histograma

Es una gráfica de barras cuyos valores del eje X son los intervalos de clase. Además, la altura de las
barras está determinada por las frecuencias relativas de los intervalos de clase. Según el interés del
estudio se pueden considerar también, las frecuencias absolutas.

Polígono
Es una gráfica donde los valores del eje X son las marcas de clase.

Para cerrar el polígono se debe aplicar el siguiente artificio: restar a la primera marca de clase el valor
de la amplitud y sumar a la última marca de clase el valor de la amplitud.

Según el interés del estudio se pueden considerar también, las frecuencias absolutas.
UPC MA444 Estadística 45
Ojiva
Es una gráfica donde los valores del eje X son los límites superiores.

Es una gráfica creciente a la que debe aplicarse el siguiente artificio: El primer valor del eje X es el dato
más pequeño del conjunto de datos o valor mínimo o valor del primer límite inferior.

Según el interés del estudio se pueden considerar también, las frecuencias absolutas.
UPC MA444 Estadística 46
Ejercicios propuestos

15.El jefe del Área de Operaciones de Tricon S.A. aplicará una mejora continua en la distribución del
concreto premezclado a las obras, debido a las constantes quejas de los clientes respecto al tiempo
de llegada de los camiones a la obra desde la planta de Los Olivos. Tomará tal decisión si más del
30% de los camiones llegan después de los 39,5 minutos a la obra.

19,1 20,0 23,9 26,1 26,5 27,9 30,1 30,8 32,9 34,7
36,1 36,5 36,6 37,5 38,4 39,3 43,7 44,2 44,6 45,1
46,1 46,3 48,8 51,3 52,7 52,9 53,0 55,0 57,3 59,6

¿Recomendaría usted aplicar la mejora continua en la distribución del concreto premezclado?

16.Corporación Domar es una empresa peruana ubicada en la ciudad de Lima con más de ocho años
de experiencia en el sector Industrial. La empresa ejecuta proyectos de instalación de sistemas
mecánicos y electrónicos, además brinda un servicio industrial de mantenimiento especializado de
maquinarias y laboratorios en todas las especialidades de ingeniería. Debido a las expectativas de
las utilidades del último trimestre, la meta del gerente del área de servicios es que por lo menos el
40% de servicios tengan precios netos por el servicio mayores a 33 900 soles. De llegar a cumplir la
meta, el gerente será reconocido con una bonificación por parte del directorio. ¿Cuál será la
decisión del directorio? Los registros del último trimestre se presentan a continuación:

N° de Número de Precio neto del servicio


Tipo de servicio
servicio ingenieros (en miles de soles)
1 5 23,3 Mantenimiento preventivo
2 4 27,5 Instalación de laboratorios
3 7 23,0 Mantenimiento preventivo
4 3 28,1 Mantenimiento correctivo
5 4 34,5 Instalación de laboratorios
6 7 38,4 Instalación de máquinas industriales
7 5 28,1 Mantenimiento correctivo
8 5 30,7 Instalación de laboratorios
9 3 31,9 Mantenimiento correctivo
10 3 30,7 Mantenimiento preventivo
11 3 26,5 Mantenimiento preventivo
12 4 36,9 Instalación de máquinas industriales
13 6 30,7 Instalación de laboratorios
14 3 29,0 Instalación de máquinas industriales
15 3 38,1 Mantenimiento correctivo
16 5 31,2 Instalación de laboratorios
17 4 35,8 Instalación de laboratorios
18 7 34,0 Instalación de máquinas industriales
19 5 35,0 Mantenimiento correctivo
20 3 28,0 Mantenimiento correctivo
21 6 31,2 Instalación de máquinas industriales
22 5 28,2 Mantenimiento preventivo
UPC MA444 Estadística 47
17.En la producción de las piezas electrónicas, el tiempo de fabricación es muy importante, de tal
manera que el jefe de producción debería calibrar su maquinaria si verifica que hay por lo menos
30% de piezas electrónicas cuyo tiempo de fabricación es más de 10,55 minutos. ¿Deberá el jefe de
producción calibrar su maquinaria? Se cuenta con la siguiente información del tiempo de
fabricación en una muestra de 30 piezas electrónicas.

Distribución de piezas electrónicas según tiempo de fabricación


Tiempo de fabricación X´i fi hi Fi Hi
4,71 0,100
7,63 2
8
5 0,167
11,28 7

Fuente: Empresa A
UPC MA444 Estadística 48
Caso: Riesgo de construcción de viviendas

El crecimiento demográfico en Lima se ha incrementado de


manera exponencial. Este problema ha conllevado a ocupar
espacios con riesgos y vulnerabilidad a desastres por
construcción, debido a una mala técnica, mal manejo de
materiales, tipo de suelo, tipo de cimentación o altitud de la
construcción.

Para tomar decisiones, la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima
realizó un estudio de riesgo de construcción de viviendas en el mes pasado, para ello se seleccionaron
200 viviendas ubicadas en las laderas de los cerros de Lima Metropolitana.

En el estudio se presentaron las siguientes situaciones para tomar las decisiones adecuadas:

Situación 1
Determinar si se brindará asistencia técnica a las viviendas.

La Gerencia de Gestión del Riesgo de Desastres de la Municipalidad de Lima brindará asistencia técnica
a las viviendas ubicadas en la zona alta de Lima con riesgo de cimientos siempre y cuando más del 30%
de ellas tengan al menos cuatro pisos.

Para ello se evaluaron 24 viviendas seleccionadas al azar con dichas características. La información
obtenida se muestra a continuación:

Distribución de viviendas según número de pisos


7 6 6 6
6
Número de viviendas

5 4
4
3 2
2
1
0
0 1 2 3 4 5 6
Fuente: Municipalidad de Lima Número de pisos

¿Qué decisión tomará la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima?

Cálculo Análisis Argumentación


El estudiante muestra los cálculos El estudiante indica con que valor El estudiante redacta la
realizados para dar respuesta al calculado responde el problema. decisión que tomará a partir
problema. del resultado del análisis.
UPC MA444 Estadística 49
Situación 2
Realizar un estudio de materia orgánica en las laderas.

El analista del departamento de gestión del riesgo de desastres de la Municipalidad de Lima desea
realizar un estudio completo de materia orgánica en las laderas de los cerros que tienen suelo arenoso.
Para ello es importante evaluar la capacidad de intercambio catiónico (CIC). Para el estudio se tomó
información del CIC de una muestra de 80 viviendas con suelo arenoso. El analista decidirá realizar el
estudio completo, si más del 18% de estas viviendas registran un CIC mayor a 41,48 meq/100 gr. A
continuación, se presenta la siguiente información:

Distribución de …………… según ……………


Intervalos Marca de clase fi hi Fi Hi
[18,36 24,14] 21,25 12 0,1500 12 0,15
]24,14 29,92] 27,03 0,1875 27 0,3375
]29,92 35,70] 32,81 20 0,2500 47 0,5875
]35,70 38,59 18 0,2250 65 0,8125
47,26] 44,37 10 75 0,9375
]47,26 53,04] 50,15 5 0,0625 80 1,00
Fuente: Municipalidad de Lima

¿El analista del departamento de gestión de riesgos de desastres realizará el estudio completo?

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante indica El estudiante El estudiante El estudiante
redacta el la variable y que muestra los indica con que redacta la decisión
problema con un herramienta cálculos realizados valor calculado que tomará a
lenguaje sencillo, estadística utilizará para dar respuesta responde el partir del resultado
como pregunta u en la solución del al problema. problema. del análisis.
objetivo. problema.
UPC MA444 Estadística 50
Métodos numéricos para describir datos cuantitativos

Definiciones

Parámetro
Es una medida de resumen que caracteriza a la población. Para obtener su valor se hace necesario
contar con toda la información que brinda los elementos de una población. Por ejemplo, la media
poblacional 𝜇, varianza poblacional 𝜎 2 .

Estadístico
Es una medida de resumen que caracteriza a la muestra. Para obtener su valor se utiliza la información
muestral. A los valores obtenidos de un estimador se conoce como estimación.

Por ejemplo: la media muestral (𝑥̅ ), varianza muestral (𝑠2 ).

Los parámetros y estadísticos de mayor uso son:

Nombre Parámetro Estadístico

∑𝑁
𝑖=1 𝑥𝑖 ∑𝑁
𝑖=1 𝑥𝑖
Media 𝜇= 𝑥̅ =
𝑁 𝑛

∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2 ∑𝑁
𝑖=1(𝑥𝑖 − 𝑥̅ )
2
Varianza 𝜎2 = 𝑠2 =
𝑁 𝑛−1

Desviación estándar 𝜎 𝑠

𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠


Proporción 𝑝= 𝑝̂ =
𝑁 𝑛
UPC MA444 Estadística 51
Medidas de tendencia central
q q z “ ” , v
a concentrarse o distribuirse las demás observaciones. Lo que se persigue es conseguir un valor que
sea representativo del conjunto de datos que se está analizando.

Media aritmética (Promedio)


La media llamada también promedio, se define como el cociente de la suma de los valores observados
de la variable en estudio y el número de observaciones.

Características de la media
• Se puede calcular para variables de escala intervalo o razón.
• La mayor desventaja es que se ve afectado por valores extremos; es decir si hay valores muy
pequeños o grandes, la media no los representaría adecuadamente.

Cálculo de la media

Para datos simples (no agrupados) se calcula por:


∑𝑁
𝑖=1 𝑥𝑖
𝑥̅ =
𝑛

Para datos discretos (agrupados) se calcula por:


∑𝑘𝑖=1 𝑓𝑖 𝑥𝑖
𝑥̅ =
𝑛

Para datos continuos (agrupados) se calcula por:


∑𝑘𝑖=1 𝑓𝑖 𝑥𝑖´
𝑥̅ =
𝑛

Ejemplo 1
Los siguientes datos son medidas de la resistencia al rompimiento (en onzas) de una muestra de hilos
de lino.

15,2 15,8 16,2 18,5 19,4 20,6 21,2 21,9 25,4 27,3 28,3 29,5 32,5 33,7 36,9

Solución
La fórmula es:
∑𝑁
𝑖=1 𝑥𝑖
𝑥̅ =
𝑛
Reemplazando valores:
15,2 + 15,8 + 16,2 + ⋯ + 36,9
𝑥̅ = = 24,16
15
Interpretación
La resistencia al rompimiento de los hilos está alrededor de 24,16 onzas.
La resistencia al rompimiento de los hilos está próximo a 24,16 onzas.
UPC MA444 Estadística 52
Ejemplo 2
Calcule e interprete la media para el número de hijos obtenida a partir de una muestra de 35 familias.

Número de hijos Número de familias (fi )


0 13
1 6
2 8
3 6
4 2

𝑥̅ = 1.37

El Número de hijos está alrededor de 1.37 hijos.

Ejemplo 3
Calcule el tiempo promedio de verificación, en horas, para una muestra de trabajadores e interprete.

Tiempo de verificación fi X’i


[0,02 - 0,81] 6 0.415
]0,81 - 1,60] 13 1.205
]1,60 - 2,39] 4 1.995
]2,39 - 3,18] 3 2.785
]3,18 - 3,97] 2 3.575
]3,97 - 4,76] 2 4.365
n= 30

𝑥̅ = 1.68

El tiempo de verificación está alrededor de 1.68 horas.


UPC MA444 Estadística 53
Caso: Riesgo de construcción de viviendas

El crecimiento demográfico en Lima se ha incrementado de


manera exponencial. Este problema ha conllevado a ocupar
espacios con riesgos y vulnerabilidad a desastres por
construcción, debido a una mala técnica, mal manejo de
materiales, tipo de suelo, tipo de cimentación o altitud de la
construcción.

Para tomar decisiones, la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima
realizó un estudio de riesgo de construcción de viviendas en el mes pasado, para ello se seleccionaron
200 viviendas ubicadas en las laderas de los cerros de Lima Metropolitana.

En el estudio se presentaron dos situaciones para tomar las decisiones adecuadas.

Situación 1
Determinar si se brindará asistencia técnica a las viviendas.

Distribución de viviendas según número de pisos


7 6 6 6
6
Número de viviendas

5 4
4
3 2
2
1
0
0 1 2 3 4 5 6
Número de pisos
Fuente: Municipalidad de Lima

La gerencia de gestión del riesgo de desastres de la Municipalidad de Lima brindará asistencia técnica
a las viviendas ubicadas en la zona alta de Lima con riesgo de cimientos siempre y cuando el número
promedio de pisos por vivienda es mayor a dos. Para ello se evaluaron 24 viviendas seleccionadas al
azar con dichas características. La información obtenida se muestra a continuación:

¿Qué decisión tomara la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima?

Cálculo Análisis Argumentación


El estudiante muestra los cálculos El estudiante indica con que El estudiante redacta la
realizados para dar respuesta al valor calculado responde el decisión que tomará a partir
problema. problema. del resultado del análisis.
UPC MA444 Estadística 54
CALCULO:

Número de pisos Número de viviendas (fi )


1 4
2 6
3 6
4 2
5 6

𝑥̅ = 3

ANALISIS

𝑥̅ = 3 ; El número de pisos está alrededor de 3 pisos, se puede observar que el promedio es mayor a
2 pisos

ARGUMENTACIÓN

Se recomienda que La gerencia de gestión del riesgo de desastres de la Municipalidad de Lima SI


brindará asistencia técnica a las viviendas ubicadas en la zona alta de Lima con riesgo de cimientos

Situación 2
Realizar un estudio de materia orgánica en las laderas.

El analista del departamento de gestión del riesgo de desastres de la Municipalidad de Lima desea
realizar un estudio completo de materia orgánica en las laderas de los cerros que tienen suelo arenoso.
Para ello es importante evaluar la capacidad de intercambio catiónico (CIC).

Para el estudio se tomó información del CIC de una muestra de 80 viviendas con suelo arenoso. El
analista decidirá hacer el estudio completo, si el CIC promedio supera el valor de 25 meq/100 gr. A
continuación, se presenta la siguiente información:

Distribución de la capacidad de intercambio catiónico (CIC) según viviendas


Intervalos Marca de clase fi hi Fi Hi
18,36 24,14 21,25 12 0,1500 12 0,1500
24,14 29,92 27,03 15 0,1875 27 0,3375
29,92 35,70 32,81 20 0,2500 47 0,5875
35,70 41.48 38,59 18 0,2250 65 0,8125
41.48 47,26 44,37 10 0.125 75 0,9375
47,26 53,04 50,15 5 0,0625 80 1,0000
n=80
UPC MA444 Estadística 55
Fuente: Municipalidad de Lima

¿El analista del departamento de gestión del riesgo de desastres realizará el estudio completo?

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante indica El estudiante El estudiante El estudiante redacta
redacta el problema la variable y que muestra los indica con que la decisión que
con un lenguaje herramienta cálculos valor calculado tomará a partir del
sencillo, como estadística utilizará realizados para responde el resultado del
pregunta u en la solución del dar respuesta problema. análisis.
objetivo. problema. al problema.

INTERPRETACION

Determinar si El analista decidirá hacer el estudio completo

REPRESENTACION

Variable: la capacidad de intercambio catiónico (CIC).

Técnica estadística: Medidas de Tendencia Central

CALCULO

Distribución de la capacidad de intercambio catiónico (CIC) según viviendas


Intervalos Marca de clase fi hi Fi Hi
18,36 24,14 21,25 12 0,1500 12 0,1500
24,14 29,92 27,03 15 0,1875 27 0,3375
29,92 35,70 32,81 20 0,2500 47 0,5875
35,70 41.48 38,59 18 0,2250 65 0,8125
41.48 47,26 44,37 10 0.125 75 0,9375
47,26 53,04 50,15 5 0,0625 80 1,0000
n=80

𝑥̅ = 33.82

ANALISIS

𝑥̅ = 33.82 ; la capacidad de intercambio catiónico (CIC) está alrededor de 33.82 meq/100 gr, se puede
observar que el promedio es mayor a 25 meq/100 gr

ARGUMENTACIÓN

Se recomienda que El analista DEBE decidir hacer el estudio completo


UPC MA444 Estadística 56

Mediana
Es el valor que ocupa el lugar central de un conjunto de datos ordenados. Por tanto, es el valor que
divide en dos partes a dicho conjunto de datos.

Características de la mediana

Se puede calcular para variables medidas en escala intervalo o razón.


La mediana no se ve afectada por valores extremos (mínimo y máximo).

Cálculo de la mediana para datos no agrupados

Si denotamos las observaciones ordenadas por 𝑥[1] , 𝑥[2] , 𝑥[3] , … , 𝑥[𝑛] , la mediana calcularse por:

• Si 𝑛 es impar, la mediana es:


𝑚𝑒 = 𝑥 𝑛+1
[ 2 ]
• Si 𝑛 es par, la mediana es:
𝑥[𝑛] + 𝑥[𝑛+1]
2 2
𝑚𝑒 =
2
𝑛 𝑛
Es decir, 𝑛 es par, la media es el promedio de los datos que se encuentran en la posición [ ] y [ + 1].
2 2

Ejemplo 1
Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje (en voltios) se
muestran a continuación:

10,00 10,05 10,12 10,26 25,00 9,84 9,96 9,98 9,99 10,00

Calcule e interprete el valor de la mediana.

Solución
Primero ordenamos los datos.

X1 X5 X6 X10
9,84 9,96 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00

Como 𝑛 = 10, el cual es un número par, la mediana se calcula con:

𝑥[𝑛] + 𝑥[𝑛+1]
2 2
𝑚𝑒 =
2
Reemplazando los valores.

𝑥10 + 𝑥10
2 2 +1 𝑥5 + 𝑥6 10 + 10
𝑚𝑒 = = = = 10
2 2 2
UPC MA444 Estadística 57

Interpretación: El 50% de las baterías tienen una lectura máxima de 10 voltios.

Ejemplo 2
Los siguientes datos corresponden a la distribución del número de piezas defectuosas producidas en
una muestra de 150 días. Calcule e interprete el valor de la mediana.

Número de piezas de defectuosas Número de días fi Fi


0 50 50 (X1 – X50
1 60 110 (X51 – X110)
2 25 135 (X111 – X136
3 10 145
4 5 150
n=150 PAR

𝑥150 + 𝑥150
2 2
+1 𝑥75 + 𝑥76 1 + 1
𝑚𝑒 = = = =1
2 2 2

Interpretación: El 50% de los días tienen una lectura máxima de 1 pieza defectuosa.
UPC MA444 Estadística 58
Moda
La moda de un conjunto de datos es aquel valor que se repite con mayor frecuencia.

Características de la moda

• La moda se puede calcular para cualquier escala de medición.


• El valor de la moda no se ve afectada por valores extremos.
• La moda no siempre es un valor único.
• Un conjunto de datos puede tener dos modas (bimodal) o más de dos modas (multimodal o
polimodal).
• Se puede dar el caso en que un conjunto de datos no tenga moda.

Ejemplo 1
Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje se presentan a
continuación:

9,84 9,89 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00

Moda = 10, pues es el valor que más se repite.

Interpretación
La lectura de voltaje más frecuente es de 10 voltios.

Ejemplo 2
Renacer S.A. fabrica hornos de microondas. La gerencia encargó al jefe de control de calidad que
informe cuál es el problema más frecuente encontrado en los hornos microondas. Se tomó una
muestra del área de reparaciones y los resultados fueron los siguientes:

Problemas Número de hornos fi


De capacidad de descongelación 6
Velocidad de calentamiento 14
Cable de alimentación 3
Fuga de la microondas 8
Frecuencia de la microondas (MHz) 9
Potencia de microondas (kilowatts) 10

Con la información presentada, ¿qué problema se presenta con mayor frecuencia?

Interpretación
El problema más frecuente es de Velocidad de calentamiento.
UPC MA444 Estadística 59
Medidas de posición o cuantiles
Se define así a un número real que divide a un conjunto de datos en dos partes con porcentajes
especificados debajo y sobre este valor. Para su cálculo, los datos deben estar previamente ordenados.

Cuartil
Divide al conjunto de datos en cuatro partes porcentualmente iguales. Se denotan Q1, Q2 y Q3 que son
los correspondientes percentiles 𝑃25 , 𝑃50 y 𝑃75 .

Decil
Divide al conjunto de datos en diez partes porcentualmente iguales. Hay nueve deciles D1, D2, …, D9
que son los correspondientes percentiles 𝑃10 , 𝑃20 , …, y 𝑃90 .
D1=P10, D7=P70

Percentil
Divide un conjunto de datos en 100 partes porcentualmente iguales. Dado un percentil Pk, este divide
el conjunto de datos en dos partes, la inferior que contiene el k% de datos y la superior que contiene
el (100 – k)% de datos.

El k% de las unidades elementales presentan El (100 – k)% de las unidades elementales


valores en la variable de estudio iguales o presentan valores en la variable de estudio
menores al percentil k, 𝑃𝑘 mayores al percentil k, 𝑃𝑘

𝑃𝑘

Cálculo del percentil para datos no agrupados

Primero debe ordenarse los datos en orden creciente o decreciente.

Luego, para hallar el percentil 𝑃𝑘 se sigue los siguientes pasos:

Calcular el valor de la posición que ocupa el percentil 𝑃𝑘 en la lista de datos ordenados que está
determinada por la siguiente expresión:

𝑘(𝑛 + 1)
𝑖= = 𝐸, 𝑑
100

Donde 𝐸 es la parte entera y 𝑑 es la parte decimal.

Luego,
𝑃𝑘 = 𝑋[𝐸] + 0, 𝑑(𝑋[𝐸+1] − 𝑋[𝐸] )
UPC MA444 Estadística 60
Ejemplo 1
Suponga que los promedios ponderados de una muestra de 12 ingenieros civiles egresados se
muestran a continuación:

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12


14,5 15,5 15,5 16,2 16,2 16,5 16,5 17,0 17,1 17,3 17,5 17,6

a. Calcule e interprete el valor del D4.

D4 = P40

P40=????

𝑘(𝑛 + 1) 40(12 + 1)
𝑖= = = 5. 𝟐
100 100

X5 = 16.2 = X[E]
X6= 16.5 = X[E +1]

𝑃𝑘 = 𝑋[𝐸] + 0, 𝑑(𝑋[𝐸+1] − 𝑋[𝐸] )

𝑃40 = 𝑋5 + 0.2(𝑋6 − 𝑋5)

𝑃40 = 16.2 + 0.2(16.5 − 16.2) = 16.26

El 40% de ingenieros civiles presenta un promedio ponderado máximo de 16.26

b. Si se desea contratar a un egresado que pertenezca al quinto superior, ¿qué percentil debe
calcular y cuál es la nota mínima que debería de tener?

P80=????

𝑘(𝑛 + 1) 80(12 + 1)
𝑖= = = 10. 𝟒
100 100

X10 = 17.3 = X[E]


X11= 17.5 = X[E +1]

𝑃𝑘 = 𝑋[𝐸] + 0, 𝑑(𝑋[𝐸+1] − 𝑋[𝐸] )

𝑃80 = 𝑋10 + 0.4(𝑋11 − 𝑋10)

𝑃80 = 17.3 + 0.4(17.5 − 17.3) = 17.38

El 80% de ingenieros civiles presenta un promedio ponderado máximo de 17.38


UPC MA444 Estadística 61
La nota mínima que debería de tener un egresado que pertenezca al quinto superior para que sea
contratado es 17.38

Ejemplo 2
Una muestra de 30 trabajadores de una plataforma petrolera marina formó parte de un ejercicio de
escape del área. Para ello se registraron los tiempos, en minutos, empleados en la evacuación.

31,5 32,5 32,5 33,4 33,9 34,0 35,6 35,6 35,9 35,9
36,3 36,4 36,9 37,0 37,3 37,3 37,4 37,5 38,0 38,9
39,2 39,3 39,4 39,7 40,2 40,3 41,5 42,4 42,8 44,5

a. ¿Cuál es el tiempo mínimo registrado por el 18% de trabajadores que emplearon más tiempo en
la evacuación de la plataforma?
UPC MA444 Estadística 62
b. ¿Cuál es tiempo máximo empleado por el 28% de trabajadores que emplearon menos tiempo en
la evacuación de la plataforma?

Ejemplo 3
Investigadores del Massachussets Institute of Technology (MIT) realizaron el 9 de abril de 1993 un
estudio sobre asteroides. Al observar 39 de estos asteroides con el telescopio Hiltner del observatorio
de MIT; se registró el número de exposiciones de imagen espectral.

Número de exposiciones de imagen espectral


1 1 1 1 1 1 1 1 1 2 2 2 2
2 2 2 2 2 2 2 2 2 3 3 3 3
3 3 3 3 3 3 3 3 4 4 4 4 6

a. A partir de los datos, elabore la tabla de frecuencias.

Título: ……………………………………………………………………………………………………………………………..
Número de exposiciones fi hi Fi Hi
1
2
3
4
6
Total

b. Indique el mínimo número de exposiciones obtenidos en el 15% de los asteroides con mayores
exposiciones. Además, indique a qué percentil corresponde.
UPC MA444 Estadística 63

c. Se desea categorizar a los asteroides según su número de exposiciones en categorías baja, media
y alta. ¿Cuáles serán los límites de las categorías si la categoría media contiene al 50% central de
la cantidad de asteroides?
UPC MA444 Estadística 64
Medidas de variación o dispersión
Son aquellas que cuantifican que tan dispersos o concentrados se encuentran los datos respecto de
una medida de tendencia central. Los datos que están relativamente cercanos entre sí tienen bajas
medidas de variabilidad, mientras que los que están más alejados entre sí tienen medidas de variación
más grandes.

Nos indican cuan parecidos o cuan diferentes son los valores en un conjunto de datos

Promedio A = 16 Promedio B = 16

(20, 20, 19, 02, 03 …..) ( 17, 16, 16, 16, 15,15,16……..)

CVA = 57.23% CVB= 4.79%

CV = 0%

Varianza
• Es una medida del grado de dispersión o variación de los valores de una variable con respecto a su
media aritmética.
• Las unidades en las que queda expresada la varianza son unidades al cuadrado.
• Esta medida no tiene interpretación.
• La notación de la varianza de una muestra es 𝑠2 , mientras que la de una población es 𝜎 2 .

Cálculo de la varianza

Varianza poblacional

∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2
𝜎2 =
𝑁

Varianza muestral para datos simples

∑𝑁
𝑖=1(𝑥𝑖 − 𝑥̅ )
2
𝑠2 =
𝑛−1

Varianza muestral para datos agrupados discretos

∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2
𝑠2 =
𝑛−1

Varianza muestral para datos agrupados continuos

2
∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖´ − 𝑥̅ )
𝑠2 =
𝑛−1
UPC MA444 Estadística 65
Desviación estándar
• La desviación estándar es la raíz cuadrada positiva de la varianza
• Se denota por s cuando es calculada de una muestra y por 𝜎 cuando es poblacional.

Cálculo de la varianza usando una calculadora Casio


Para conocer cómo calcular la media y desviación estándar en una calculadora
científica Casio mire v : “C media, varianza y desviación estándar
con calculadora CASIO fx-570E ”.
https://www.youtube.com/watch?v=Ds4vXpZ5jOw
UPC MA444 Estadística 66
Ejemplo 1
Calcule la varianza y la desviación estándar para la cantidad de plomo en una muestra de agua potable
en miligramos por litro. n=16

35 73 30 15 36 60 47 19 15 38 10 35 31 21 22 20

MUESTRA

S2 : VARIANZA MUESTRAL

S : DESVACION ESTANDAR MUESTRAL

S =17.0478

S2 = 290.6275

Ejemplo 2
Calcule la varianza y desviación estándar del número de accidentes automovilísticos en una muestra
de 100 días.

Número de accidentes automovilísticos 0 1 2 3 4


fi 10 15 30 35 10

Número de
accidentes fi
automovilísticos
0 f1=10
1 f2=15
2 30
3 35
4 f5=10
Total n=100

S =1.1282

S2 = 1.2728
UPC MA444 Estadística 67
Ejemplo 3
Calcule la varianza y desviación estándar de los tiempos de exposición, en minutos, de un metal a una
sustancia química. Los resultados de una muestra de 66 reacciones son las siguientes:

Intervalos fi Marca de clase


[15,2 – 17,2] 12 16.2
]17,2 – 19,2] 13 18.2
]19,2 – 21,2] 20 20.2
]21,2 – 23,2] 16 22.2
]23,2 – 25,2] 5 24.2
Total 66

Calcule la varianza y desviación estándar.

S =2.42

S2 = 5.8564
UPC MA444 Estadística 68
Coeficiente de variación
Es una medida de dispersión relativa libre de unidades por lo que es útil para comparar la variabilidad
de dos o más grupos de datos expresados en distintas unidades de medida o cuando los promedios de
los conjuntos de datos a comparar son diferentes.

El coeficiente de variación proporciona una estimación de la magnitud de las desviaciones con respecto
a la magnitud de la media.

𝑠
𝐶𝑉 = × 100%
𝑥̄

Ejemplo 1
A continuación, se presentan los tiempos de transmisión de un archivo, en segundos, evaluados en
empresas que adoptaron la tecnología WAN y la tecnología LAN bajo condiciones similares.

Tiempos de transmisión con tecnología WAN


138 126 125 124 119 119 137 110 119 155 123 124 126 126 129

Distribución de archivos según tiempos de transmisión con tecnología LAN


Tiempos de transmisión Frecuencia
[108 111] 3
]111 114] 35
]114 117] 66
]117 120] 57
]120 123] 29
]123 126] 16
Fuente: Estudio de tecnología WAN y LAN

Determine para qué tipo de tecnología utilizada los tiempos de transmisión de datos son más
homogéneos. Justifique numéricamente su respuesta.

Medida de resumen LAN WAN

Promedio

Desviación estándar

Coeficiente de variación

Interpretación
La tecnología que presenta los tiempos de transmisión de datos más homogéneos es ……………
UPC MA444 Estadística 69
Ejercicios propuestos

18.La empresa Electro, dedicada a la venta de artefactos electrónicos para el hogar, opera 200 tiendas
en diferentes lugares del país. Los últimos informes indican que las ventas mensuales han
descendido a tal punto que se han tenido que cerrar algunas tiendas. El gerente, con el fin de
enfrentar el problema, ha determinado que es necesario un estudio estadístico de las ventas
semanales (en miles de soles) de un producto electrónico en tres de sus principales tiendas: Aptao,
Azufral y Brento. Las muestras tomadas al azar de cada tienda arrojaron los siguientes resultados:

Distribución de semanas según ventas de un producto electrónico en la tienda Aptao


Ventas semanales Número de semanas
[100 – 200] 5
]200 – 300] 14
]300 – 400] 21
]400 – 500] 7
]500 – 600] 3
Total 50
Fuente: Empresa Electro

Distribución de semanas según ventas de un producto electrónico en la tienda Brento


Ventas semanales Número de semanas
20 2
40 8
60 25
80 20
100 8
Total 63
Fuente: Empresa Electro

Ventas semanales de un producto electrónico en la tienda Azufral


120 200 100 50 45 120 100 100 90 75 100 210 100 50 120

a. Calcule la media y la varianza de las ventas en Aptao, Azufral y en Brento.

Medida de resumen Aptao Azufral Brento

Media

Desviación estándar
UPC MA444 Estadística 70
b. Determine en cuál de las tiendas las ventas realizadas son más homogéneas.

Medida de resumen Aptao Azufral Brento

19.En el medio local hay dos plantas (planta 1 y planta 2) que se dedican a la fabricación de barras de
acero para la construcción. Las empresas proveedoras de barras de acero para la construcción, que
abastecen al mercado constructor, desean averiguar acerca de la media y la desviación estándar de
la resistencia a la tracción.

Para ello, se tomaron muestras aleatorias en ambas plantas y la información registrada acerca de
la resistencia a la tracción (en kg/cm2) se muestra en las siguientes tablas:

Distribución de barras de acero según resistencia a la tracción – Planta 1


Resistencia a la tracción – Planta 1 fi
[69,220 – 70,436] 14
]70,436 – 71,652] 5
]71,652 – 72,868] 6
]72,868 – 74,084] 8
]74,084 – 75,300] 7
]75,300 – 76,516] 17
]76,516 – 77,732] 5
Total 62
Fuente: Estudio de barras de acero de planta 1 y 2

Estadísticas descriptivas: Resistencia a la tracción – Planta 2


Tamaño de muestra 62
Media muestral 64,52
Desviación estándar muestral 2,983
Fuente: Estudio de barras de acero de planta 1 y 2

Realice el análisis adecuado para la dispersión y responda ¿qué planta es más heterogénea en las
resistencias a la tracción? Sustente su respuesta estadísticamente.

Medida de resumen Planta 1 Planta 2

Promedio

Desviación estándar

Coeficiente de variación
UPC MA444 Estadística 71
20.Las represas constituyen una de las principales causas directas e indirectas de contaminación
ambiental. Una de estas causas es la filtración de sustancias contaminantes originando el
debilitamiento de la densidad de la superficie en la cual está construida la represa. Los resultados
que Andino S.A. obtuvo sobre las densidades de los terrenos en represas calificadas con impacto
ambiental regular y en represas con impacto ambiental fuerte se presentan a continuación:

Densidad del terreno en represas con impacto ambiental regular


15,2 20,7 16,6 22,7 35,6 17,1 25,2 26,6 10,4 23,6

Distribución de represas según la densidad del terreno con impacto


ambiental fuerte
12

10
10
Cantidad de represas

8 7 7

6 5

4 3
2
2 1

0 35.6
5.5 9.8 14.1 18.4 22.7 27 31.3

Fuente: Andino S.A. Densidad del terreno

Para que una represa siga funcionando, la Confiep establece el cumplimiento de dos condiciones:

• Condición 1: La densidad promedio del terreno con impacto ambiental (regular o fuerte) donde
se ubica la represa debe ser por lo menos 17,5 gr/cm3 para que ésta no se derrumbe.

• Condición 2: La densidad del terreno donde se ubica la represa con impacto ambiental (regular
o fuerte) debe tener una variabilidad relativa de a lo más 34%.

Verifique las condiciones de tal manera que pueda presentar un informe que ayude a identificar
qué tipo de represa (con impacto ambiental fuerte o regular) está habilitada para su normal
funcionamiento.

21.En una reciente entrevista, el presidente de la Confederación Nacional de Instituciones


Empresariales Privadas (Confiep), sostuvo que, en el país y a largo plazo, la mejor forma de prevenir
los desastres naturales es la construcción de represas y reservorios.

Debido a la previsión de falta de agua, la Confiep ha encargado realizar un nuevo estudio de


prefactibilidad a cargo de profesionales de ingeniería civil, en zonas cercanas a los ríos de la costa
norte del país, Tumbes, Piura, y Lambayeque, para decidir la construcción de una represa.
UPC MA444 Estadística 72
La información recogida se presenta a continuación:

Zonas Tipo de estructura Ríos Caudal del río (m3/segundo)


1 Cimientos Tumbes 13,3
2 Cimientos Tumbes 20,9
3 Cimientos Tumbes 35,7
4 Cimientos Tumbes 41,9
5 Cimientos Tumbes 42,2
6 Cimientos Tumbes 48,0
7 Cimientos Tumbes 49,7
8 Cimientos Tumbes 52,4
9 Cimientos Tumbes 52,4
10 Cimientos Tumbes 56,3
11 Cimientos Tumbes 62,5
12 Cimientos Piura 38,1
13 Cimientos Piura 40,3
14 Cimientos Piura 49,8
15 Excavaciones Piura 56,2
16 Excavaciones Piura 57,2
17 Excavaciones Piura 61,3
18 Excavaciones Piura 61,3
19 Excavaciones Piura 71,1
20 Excavaciones Piura 77,5
21 Excavaciones Lambayeque 34,4
22 Excavaciones Lambayeque 42,8
23 Excavaciones Lambayeque 42,8
24 Terraplenes Lambayeque 44,5
25 Terraplenes Lambayeque 48,1
26 Terraplenes Lambayeque 49,4
27 Terraplenes Lambayeque 54,3

a. Según los especialistas un punto muy importante a considerar al momento de diseñar la


ubicación de las represas es evaluar el caudal (m3/segundo) en cada uno de los ríos (Tumbes,
Piura y Lambayeque), porque si el caudal es muy bajo la represa no almacenaría la cantidad de
agua esperada para su posterior distribución. Por ello, el gerente de la empresa decidirá
construir la represa en aquella zona, que concentre los caudales del río en los valores más
altos. Según los resultados, ¿Cuál sería la recomendación de ustedes al gerente de la empresa?

b. Ingenieros especialistas indicaron, que se debe realizar la construcción de la represa en aquella


zona que presente menor variabilidad posible en el caudal del río. Según la información
analizada, ¿en cuál de los ríos es más propicia la construcción de la represa?
UPC MA444 Estadística 73
Medidas de asimetría

Coeficiente de asimetría de Pearson

Mide si los datos aparecen ubicados simétricamente o no respecto de la media. El coeficiente de


asimetría para datos simples o agrupados se calcula con la siguiente fórmula:

𝑥̄ − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
𝐴𝑠 = 3 ( )
𝑠

Si el coeficiente de simetría As es:

Ejemplo 1

Complete los siguientes textos:

• Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una
v ………

• Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
v ………

• En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de
í …………, q …………

• En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente tienen
f í ……………, q …………………
UPC MA444 Estadística 74
Ejemplo 2

Comasa es una empresa que produce artículos pesados de acero y dispone de un equipo especializado
de operarios que se capacitan constantemente. El último año se ha observado un aumento en el
número de accidentes, incrementándose así el costo de atención inmediata. Con el propósito de
implementar estrategias de prevención de accidentes, se analizarán los costos de la planta de
producción de Lima Sur. A continuación, se presenta la información, en miles de soles:

8 9 10 11 11 12 12 13 13 13 13 14
14 15 15 16 17 17 18 18 19 19 20 21
22 23 24 25 25 26 27 28 28 29 30

a. ¿Qué forma presenta la distribución de esta variable? Presente la gráfica.

b. Analizando la forma de la distribución, ¿es preocupante para la empresa?


UPC MA444 Estadística 75
Ejercicios propuestos

22.Covisa es una empresa de construcción civil que compra ladrillos al proveedor Fax S.A. Para
continuar con el proveedor o cambiarlo, ha decidido realizar un análisis de la resistencia transversal
de los ladrillos, en Mn/m2.

A continuación, se presentan los resultados de una muestra de 40 ladrillos fabricados por el


proveedor:

3 4 4 4 5 5 6 6 6 7
8 8 8 8 8 9 9 9 10 11
11 11 11 11 11 12 12 12 12 13
13 13 14 15 15 17 17 18 19 20

¿Qué forma presenta la distribución de esta variable? Presente la gráfica.

23.Zinder y Crisis (1990), presentaron un algoritmo híbrido para resolver un problema de


programación matemática polinomial cero-uno. El algoritmo incorpora una combinación de
conceptos pseudo booleanos y procedimientos de enumeración implícitos probados y
comprobados.

Se resolvieron 52 problemas al azar utilizando el algoritmo híbrido; los tiempos de resolución


(tiempos de CPU en segundos) se listan en la siguiente tabla.

0,045 0,036 0,045 0,049 0,064 0,07 0,079 0,088 0,091 0,118 0,13 0,136
0,136 0,136 0,145 0,179 0,182 0,182 0,194 0,209 0,209 0,227 0,242 0,258
0,258 0,258 0,291 0,327 0,333 0,336 0,361 0,379 0,394 0,412 0,445 0,506
0,554 0,567 0,579 0,600 0,67 0,912 1,055 1,07 1,267 1,639 1,894 3,046
3,888 3,985 4,170 8,788

a. ¿Cuál es el tiempo máximo de resolución de un problema para ser considerado dentro del 10%
de los más rápidos?
b. ¿Cuál es el tiempo mínimo de resolución de un problema para ser considerado dentro del 20%
de los menos rápidos?
c. Se desea categorizar a los problemas según sus tiempos de resolución en categorías normal,
media y alta ¿Cuáles serán los límites de cada una de ellas si la categoría media contiene al
50% central de la cantidad de problemas?

24.Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una distribución
de frecuencias simétrica de cinco intervalos de igual amplitud resultando que el ingreso mínimo es
de 125 dólares y la marca de clase del cuarto intervalo es de 300 dólares. Si el 8% de los ingresos
son menores que 175 dólares y el 70% de los ingresos son menores a 275 dólares.

a. Determine las frecuencias relativas de cada intervalo.


b. ¿Qué porcentaje de ingresos son superiores a 285 dólares?
UPC MA444 Estadística 76
25.A continuación, se presenta al número de camiones que atendió la planta de Lurín en cada obra
con el objetivo de evaluar indicadores en las atenciones que realiza la planta de Lurín.

Distribución del número de obras según número de camiones enviados


15
16
14
11
12
Número de obras

9
10
7
8 6
6 4
3
4
2
0
0 1 2 3 4 5 6 7 8
Número de camiones
Fuente: Planta de Lurín

Calcule las medidas de tendencia central e interprete los resultados.

26.Cuando se diseña un puente los ingenieros deben determinar la tensión que el concreto puede
soportar. En lugar de probar cada pulgada cúbica de concreto para determinar su capacidad de
resistencia, los ingenieros toman una muestra, la prueban y llegan a la conclusión sobre qué tanta
tensión, en promedio, puede resistir este tipo de concreto. A continuación, se presenta la tensión
(en kg/cm2) obtenidos de una muestra de 30 bloques de concreto que se utilizarán para construir
un puente.

1,2 2,1 2,2 2,2 2,5 2,5 2,6 2,6 2,7 2,8
3,0 3,0 3,2 3,2 3,2 3,4 3,4 3,5 3,5 3,6
3,6 3,6 3,6 3,7 3,8 3,9 3,9 4,0 4,0 4,0

Calcule las medidas de tendencia central e interprete los resultados.


UPC MA444 Estadística 77
Caso: Industria alimentaria

Multi Cereales S.R.L. es una empresa dedicada a la elaboración de cereales para


desayunos. La empresa ha adquirido una nueva máquina, la que permitirá
elevar la producción de 1200 a 1500 cajas por hora. Según las especificaciones
técnicas del producto, esta caja debe tener un peso promedio de 500 gramos.
Para monitorear el proceso de llenado, el inspector seleccionó una muestra
aleatoria de 20 cajas de avena en hojuelas del almacén cuyos pesos (en gramos)
se muestran a continuación:

471,13 472,19 476,25 477,32 478,52 481,02 490,65 496,66 497,66 498,40
502,77 504,44 503,78 506,14 512,88 515,06 516,23 516,89 523,45 523,78

Situación 1
Determinar si la nueva máquina llena las cajas de avena en hojuelas de acuerdo con la especificación
técnica.

La especificación técnica indica que el 90% central de las cajas de avena en hojuelas deben tener un
peso entre 480 y 520 gramos. El gerente de control de calidad sospecha que el peso de la caja no está
cumpliendo con la especificación técnica, y de ser así, significaría que la nueva máquina, al momento
de ser instalada, no fue calibrada correctamente.

¿Deberá ser recalibrada la nueva máquina?


¿Dónde se concentran los pesos de las cajas de avena en hojuelas, en valores altos o en valores
bajos?

CALCULO:

P5 Y P95

P5=????

𝑘(𝑛 + 1) 5(20 + 1)
𝑖= = = 1.05
100 100

X1 = 471.13 = X[E]
X2 = 472.19 = X[E +1]

𝑃𝑘 = 𝑋[𝐸] + 0, 𝑑(𝑋[𝐸+1] − 𝑋[𝐸] )

𝑃5 = 𝑋1 + 0.05(𝑋2 − 𝑋1)

𝑃5 = 471.13 + 0.05(472.19 − 471.13) = 471.18


UPC MA444 Estadística 78

P95

P95=????

𝑘(𝑛 + 1) 95(20 + 1)
𝑖= = = 19.95
100 100

X19 = 523.45 = X[E]


X20 = 523.78 = X[E +1]

𝑃𝑘 = 𝑋[𝐸] + 0, 𝑑(𝑋[𝐸+1] − 𝑋[𝐸] )

𝑃95 = 𝑋19 + 0.95(𝑋20 − 𝑋19)

𝑃95 = 523.45 + 0.95(523.78 − 523.45) = 523.76

[471.18 : 523.76] 90% central

480 y 520

PROMEDIO DESVIACION MEDIANA COEFICIENTE


ESTANDAR DE ASIMETRIA
PESO 497.3425 19.2893 500.585

n=20 PAR

𝑥[𝑛] + 𝑥[𝑛+1]
2 2 𝑋10 + 𝑋11 498.40 + 502.77
𝑚𝑒 = = = = 500.585
2 2 2

𝑥̄ − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
𝐴𝑠 = 3 ( )
𝑠

PROMEDIO DESVIACION COEFICIENTE DE


ESTANDAR ASIMETRIA
PESO 497.3425 19.2893 -0.5043

ANALISIS

[480 : 520]

[471.18 : 523.76] 90% central, No se encuentra dentro del intervalo


UPC MA444 Estadística 79

El coeficiente de asimetría es -0.5043 la distribución del peso es asimétrica negativa es decir los
pesos se encuentran concentrados en valores altos.

ARGUMENTACION

Se recomienda recalibrar la nueva máquina ya que no cumple con la condición de encontrarse


contenido en el intervalo [480: 520]

Los pesos de las cajas de avena en hojuelas, se encuentran concentrados en valores altos porque se
presenta una asimetría negativa.

Cálculo Análisis Argumentación


El estudiante muestra los El estudiante indica con que El estudiante redacta la decisión
cálculos realizados para dar valor calculado responde el que tomará a partir del resultado
respuesta al problema. problema. del análisis.

Situación 2
Determinar qué proceso de producción tiene mayor variabilidad.

Una de las razones de la falta de calidad en un proceso productivo es la alta variabilidad en el


cumplimiento de las especificaciones técnicas, por lo que el gerente de control de calidad desea
comparar la variabilidad del proceso de llenado de las cajas de avena en hojuelas con la variabilidad
del porcentaje de grasa que deben tener las hojuelas de avena.

𝑠
𝐶𝑉 = × 100%
𝑥̄

El gerente ordenará una revisión completa de aquel proceso que presente mayor variabilidad. ¿Cuál
de los dos procesos deberá ser revisado completamente?

Nota: Para el caso del proceso de llenado de la caja utilice los cálculos hechos para la situación 1.

Con los datos de la situación 1, el gerente obtuvo el siguiente gráfico:


UPC MA444 Estadística 80

Distribución de cajas de avena en hojuelas según porcentaje de grasa


8
7
7
6
5
Número de cajas
5
4
3
3
2 2
2
1
1
0
1.89 3.37 4.85 6.33 7.81 9.29 10.77 12.25 13.73 15.21
Porcentaje de grasa
Fuente: Multi Cereales S.R.L.

fi Marca de clase
2 4.85
3 6.33
5 7.81
7 9.29
2 10.77
1 12.25
66

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante indica El estudiante El estudiante El estudiante redacta
redacta el la variable y que muestra los indica con que la decisión que
problema con un herramienta cálculos valor calculado tomará a partir del
lenguaje sencillo, estadística utilizará realizados para responde el resultado del análisis.
como pregunta u en la solución del dar respuesta problema.
objetivo. problema. al problema.
UPC MA444 Estadística 81

INTERPRETACION:

Determinar cuál de los dos procesos deberá ser revisado completamente

REPRESENTACION:

X1: El peso de la caja de avena en hojuelas


X2: El porcentaje de grasas de la caja de avena en hojuelas

Técnica Estadística: Medidas de Dispersión (variabilidad), CV

CALCULO:

𝑠
𝐶𝑉 = × 100%
𝑥̄

PROMEDIO DESVIACION COEFICIENTE DE


ESTANDAR VARIACION
PESO 497.3425 19.2893 3.88%
PORCENTAJE DE 7.1455 1.5716 21.99%
GRASA

ANALISIS

EL peso presenta un coeficiente de variación del 3.88% es decir es homogéneo


El porcentaje de grasa presenta un coeficiente de variación del 21.99% es decir heterogéneo

El coeficiente de variación del peso es menor al coeficiente de variación del porcentaje de grasa

ARGUMENTACION

El proceso relacionado con el porcentaje de grasa será revisado completamente porque presenta la
mayor variabilidad
UPC MA444 Estadística 82

INTER´RETACION:

Unidad 2. Probabilidad y variable aleatoria

Logro
Al finalizar la unidad, el estudiante aplica la teoría de la probabilidad en situaciones de incertidumbre
para la toma de decisiones en casos reales dentro del ámbito de su especialidad.

Temario
• Probabilidad: concepto. Experimento aleatorio, espacio muestral y evento
• Operaciones con eventos
UPC MA444 Estadística 83
• Probabilidad condicional
• Probabilidad total. Teorema de Bayes. Diagrama del árbol
• Eventos independientes
• Variable aleatoria, tipos, valor esperado y desviación estándar
• Distribución de probabilidad de una variable discreta: binomial y Poisson
• Distribución de densidad de una variable continua: normal y exponencial
• Otros modelos de probabilidad aplicados en la Ingeniería Civil y Electrónica

Bibliografía
• Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 4.1 (pág. 124-
126) Capítulo 4.5 (pág. 139-143)
• Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 4.7 (pág. 152-
166)
• Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 6.1 (pág. 211)
• Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 6.1 (pág. 213)
UPC MA444 Estadística 84
Definiciones

Experimento aleatorio
Es una operación cuyo resultado no se puede predecir con certeza y que se realiza bajo las siguientes
condiciones:

• Se puede repetir indefinidamente donde los resultados dependen del azar, por lo que no se pueden
predecir con certeza.
• Se puede describir el conjunto de todos los resultados posibles.
• Cuando se repite un gran número de veces, aparece un modelo definido de regularidad.

Un experimento aleatorio se denota por .

Ejemplo 1

1: Lanzar un dado.


2 : Se lanzan dos monedas y se registra el resultado obtenido.
3 : Seleccionar un dispositivo electrónico y registrar si es defectuoso o no.
4 : Observar el tiempo de vida de un artefacto eléctrico.

Espacio muestral
Es el conjunto de todos los posibles resultados de un experimento aleatorio. Cada elemento de este
conjunto se le denomina punto muestral y se le denota con 𝑤.

Un espacio muestral se denota por .

Ejemplo 2

1 = {1, 2, 3, 4, 5, 6}
2 = {𝑐𝑐, 𝑐𝑠, 𝑠𝑐, 𝑠𝑠}
3 = {𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜, 𝑛𝑜 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜}
4 = {𝑡/𝑡 ≥ 0}

Evento
Es todo subconjunto del espacio muestral y representa cierta característica de ella. Se denotan
mediante las letras mayúscula de nuestro alfabeto, como por ejemplo A, B o C.

Evento simple
En un evento formado por un sólo un punto muestral. No se puede descomponer.

Ejemplo 3

Si 1 = {1, 2, 3, 4, 5, 6}, entonces {1},{2},{3},{4},{5},{6} son eventos simples.


Si 2 = {cc, cs, sc, ss}, entonces {cc},{cs},{sc},{ss} son eventos simples.
Si 3 = {defectuoso, no defectuoso}, entonces {defectuoso} y {no defectuoso} son eventos simples.
UPC MA444 Estadística 85
Evento compuesto
En un evento formado por más de un punto muestral.

Ejemplo 4

Si 1= {1, 2, 3, 4, 5, 6}, entonces A = {1, 3, 5} o A:= obtener un número impar es un evento compuesto.

Si 2= {cc, cs, sc, ss}, entonces B= {cs, sc} o B:= obtener dos valores diferentes en las caras superiores
de las dos monedas es un evento compuesto.

Operaciones con eventos


Intersección
La intersección de dos eventos A y B es el evento que ocurre si tanto A como B ocurren en una sola
realización del experimento.

La intersección de los eventos A y B se denota mediante el símbolo 𝐴 ∩ 𝐵.

Unión
La unión de dos eventos 𝐴 y 𝐵 es el evento que ocurre si A o B, o ambos ocurren en una sola realización
del experimento.

La unión de dichos eventos se denota mediante el símbolo 𝐴 ∪ 𝐵

Eventos mutuamente excluyentes


Son aquellos eventos donde la ocurrencia de uno de ellos excluye la ocurrencia del otro, esto es no
pueden ocurrir los dos a la vez.

Ejemplo 1

En el experimento : lanzamiento de un dado.

Sean los eventos:

𝐴: = Resulta un número menor que 5


𝐵: = Resulta un número par

a. Obtenga la intersección y la unión de los eventos 𝐴 y 𝐵.


b. ¿Son los eventos 𝐴 y 𝐵 mutuamente excluyentes?

Solución
UPC MA444 Estadística 86
a. Obtenga la intersección y la unión de los eventos 𝐴 y 𝐵.

Solución
El espacio muestral  es:
 = {1, 2, 3, 4, 5, 6}
Los eventos 𝐴 y 𝐵 son:

𝐴 = {1, 2, 3, 4}

𝐵 = {2, 4, 6}

La intersección de los eventos 𝐴 y 𝐵 es:


𝐴 ∩ 𝐵 = {2,4}

La unión de los eventos 𝐴 y 𝐵 es:


𝐴 ∪ 𝐵 = {1, 2, 3, 4, 6}

b. ¿Son los eventos A y B mutuamente excluyentes?

Solución

Como 𝐴 ∩ 𝐵 ≠ ∅, los eventos no son mutuamente excluyentes.

Ejemplo 2

Sea el experimento : lanzamiento de dos dados

El espacio muestral es:

 = {(1,1), (1,2)(1,3), … , (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}

Se definen los eventos necesarios:

𝐴: = obtener una suma de seis.

𝐴: = {(1,5), (5,1), (2,4), (4,2), (3,3)}

𝐵: = obtener una suma de cinco.

𝐵 = {(1,4), (4,1), (2,3), (3,2)}

Estos eventos A y B son mutuamente excluyentes, dado que ambos a la vez no pueden ocurrir, esto es
𝐴 ∩ 𝐵 = ∅, es decir la intersección de los eventos no tienen elementos en común.
UPC MA444 Estadística 87
Ejemplo 3

Se realiza el siguiente experimento aleatorio : lanzamiento de dos dados de seis caras.

a. Determine el espacio muestral.

b. Sean los eventos: A: suma de los dados es ocho; B: suma de los dados mayor a seis y C: suma de
los dados menor a nueve. Determine los elementos de los eventos.

c. Obtenga la intersección de los eventos A y B, la unión de los eventos B y C ¿Son los eventos A y C
mutuamente excluyentes?
UPC MA444 Estadística 88
Probabilidad
Sea  un experimento aleatorio,  el espacio muestral asociado y sea 𝐴 un evento definido en el
espacio muestral .

La probabilidad del evento 𝐴 es la medida del grado de posibilidad de ocurrencia del evento 𝐴 cuando
se realiza una vez el experimento.

La probabilidad de un evento 𝐴 es un valor numérico y se denota por 𝑃(𝐴).

Axiomas de probabilidad

• 0 ≤ 𝑃(𝐴) ≤ 1
• 𝑃() = 1
• Sean los eventos {𝐴𝑖 }, 𝐴𝑖 ∈ , 𝑖 = 1, 2, 3, … , 𝑛 una sucesión de eventos mutuamente excluyentes,
entonces:

𝑃(𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ … ∪ 𝐴𝑛 ) = ∑ 𝑃(𝐴𝑖 )
𝑖=1

Además,
• Si 𝑃(𝐴) tiende a 0 es poco probable que el evento 𝐴 ocurra.
• Si 𝑃(𝐴) tiende a 1 es un muy probable que el evento 𝐴 ocurra.
• En un espacio muestral finito, la suma de las probabilidades de todos los eventos simples 𝐸𝑖 es igual
a 1.
𝑛

∑ 𝑃(𝐸𝑖 ) = 1,  𝑖 = 1, 2, 3, … , 𝑘
𝑖=1

Definición clásica de la probabilidad de un evento

Sea un experimento aleatorio cuyo correspondiente espacio muestral  está formado por un número
n finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces definimos la
probabilidad de un evento 𝐴 como sigue:

𝑛(𝐴) 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝐴


𝑃(𝐴) = =
𝑛() 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠
UPC MA444 Estadística 89
Ejemplo 1

Complete el siguiente cuadro.

Experimento aleatorio Espacio muestral Evento Probabilidad


Se lanza un dado, calcule la
probabilidad de que salga 3 ó 5.

𝑛(𝐴)
 = {1, 2, 3, 4, 5, 6} A = 3, 5 𝑃(𝐴) = =
𝑛()

Se lanzan dos dados, calcule la


probabilidad de que la suma sea
mayor a 7.

 = {(1,1); (1,2); 𝑛(𝐴)


A={ } 𝑃(𝐴) = =
(1,3); ….; (6,6)} 𝑛()

Se saca una bola de una urna con


tres bojas rojas y cuatro negras,
calcule la probabilidad de que sea
roja.
𝑛(𝐴)
={ } A={ } 𝑃(𝐴) = =
𝑛()
UPC MA444 Estadística 90
Eventos complementarios

El complemento de un evento A es el evento en el que A no ocurre, es decir, el evento formado por


todos los eventos simples que no están en el evento A. El complemento del evento A se denota
mediante el símbolo Ac.

𝐴 ∪ 𝐴𝑐 = 

Ac
A

La suma de las probabilidades complementarias es igual a 1.

𝑃(𝐴) + 𝑃(𝐴𝑐 ) = 1

Regla aditiva de la probabilidad


La probabilidad de la unión de los eventos A y B es la suma de las probabilidades de los eventos A y B
menos la probabilidad de la intersección de los eventos A y B:

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)

A B

A∩Bc A∩B Ac∩B

(AUB)c

Regla aditiva para eventos mutuamente excluyentes

Si dos eventos A y B son mutuamente excluyentes, la probabilidad de la unión de A y B es igual a la


suma de las probabilidades de A y B.

𝑃 (𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
UPC MA444 Estadística 91
Ejemplo 1

Metac S.A.C., es una organización orientada a suministrar productos, servicios y desarrollo de


soluciones de ingeniería aplicada. El gerente de esta organización considera que la probabilidad de que
los accidentes en transmisiones y ejes hayan sido ocasionados por las conexiones eléctricas es 0,24,
por falla mecánica es 0,18 y por conexiones eléctricas o falla mecánica es 0,39. Si se selecciona al azar
un accidente producido en transmisiones y ejes.

a. Determine la probabilidad que se haya producido por ambos tipos de falla.

Solución

Definamos los eventos necesarios.

𝐸: = {Accidentes por conexiones eléctricas} 𝑃(𝐸) = 0,24


𝑀: = {Accidentes por falla mecánica} 𝑃(𝑀) = 0,18

Además, se sabe que:


𝑃(𝐸 ∪ 𝑀) = 0,39

Usando la regla aditiva de la probabilidad, se tiene que:

𝑃(𝐸 ∪ 𝑀) = 𝑃(𝐸) + 𝑃(𝑀) − 𝑃(𝐸 ∩ 𝑀)

Reemplazando valores:

0,39 = 0,24 + 0,18 − 𝑃(𝐸𝑀)

𝑃(𝐸 ∩ 𝑀) = 0,03

E M

0,21 0,03 0,15

0,61

La probabilidad que se haya producido por ambos tipos de falla es 𝑃(𝐸 ∩ 𝑀) = 0,03.

b. ¿Cuál es la probabilidad de que el accidente se haya producido por solo un tipo de falla?

Solución

La probabilidad pedida es:

𝑃(𝐸 ∩ 𝑀𝑐 ) = 𝑃(𝐸) − 𝑃(𝐸 ∩ 𝑀) = 0,24 − 0,03 = 0,21


UPC MA444 Estadística 92
𝑃(𝐸𝑐 ∩ 𝑀) = 𝑃(𝑀) − 𝑃(𝐸 ∩ 𝑀) = 0,18 − 0,03 = 0,15

𝑃(𝐸 ∩ 𝑀𝑐 ) + 𝑃(𝐸𝑐 ∩ 𝑀) = 0,21 + 0,15 = 0,36

E M

0,21 0,03 0,15

0,61

Ejemplo 2

Una empresa fabricante de electrodomésticos cuenta en su almacén de productos terminados con un


lote de diez refrigeradoras, de las cuales tres de ellas presentan imperfecciones en la pintura. Un
comerciante compra tres de ellas, la empresa hace la elección de las refrigeradoras en forma aleatoria,
se pide determinar lo siguiente:

a. Indique el espacio muestral.


b. Calcule la probabilidad de que las tres refrigeradoras compradas por el comerciante no presenten
imperfecciones de pintura.
c. Calcule la probabilidad de que en la compra realizada por el comerciante se encuentre al menos
una refrigeradora con imperfecciones de pintura.

Solución

a. Indique el espacio muestral.

Solución
Definamos el evento 𝐼: = que una refrigeradora tenga imperfecciones en la pintura.

Ω = {(𝐼, 𝐼, 𝐼); (𝐼 𝑐 , 𝐼, 𝐼); (𝐼, 𝐼 𝑐 , 𝐼); (𝐼, 𝐼, 𝐼 𝑐 ); ( 𝐼, 𝐼 𝑐 , 𝐼 𝑐 ); ; ( 𝐼 𝑐 , 𝐼, 𝐼 𝑐 ); (𝐼 𝑐 , 𝐼 𝑐 , 𝐼); (𝐼 𝑐 , 𝐼 𝑐 , 𝐼 𝑐 )}

b. Calcule la probabilidad de que las tres refrigeradoras compradas por el comerciante no presenten
imperfecciones de pintura.

Solución

Definamos el evento necesario.

𝐵: = las tres refrigeradoras compradas por el comerciante no presenten imperfecciones de pintura


La probabilidad pedida es:

𝐶37 × 𝐶03
𝑃(𝐵) = = 0,2917
𝐶310
UPC MA444 Estadística 93
c. Calcule la probabilidad de que en la compra realizada por el comerciante se encuentre al menos
una refrigeradora con imperfecciones de pintura.

Solución

Definamos el evento necesario.

𝐶: = se seleccione al menos una refrigeradora con imperfecciones de pintura.

La probabilidad pedida es:

𝑃(𝐶) = 1 − 𝑃(𝐶 𝑐 ) = 1 − 0,2917 = 0,7083

Ejemplo 3

La empresa Compusystem S.A. se dedicada a la venta de computadoras de diferentes marcas. En estos


momentos está ofertando cinco modelos diferentes de la marca A, seis modelos diferentes de la marca
B y cuatro de la marca C.

Una empresa de servicios ha decidido comprar tres computadoras a dicha empresa.

a. Determine la probabilidad de seleccionar las tres computadoras de diferente marca.

Solución

Definamos los eventos necesarios.

𝐴: = seleccionar una computadora de la marca de A 𝑛(𝐴) = 5


𝐵: = seleccionar una computadora de la marca de B 𝑛(𝐵) = 6
𝐶: = seleccionar una computadora de la marca de C 𝑛(𝐶) = 4

5A
6B
4C

N = 15 n=3

𝐹: = seleccionar una computadora de la marca A, una de la marca B y una de la marca C.

La probabilidad pedida es:

𝐶15 × 𝐶16 × 𝐶14


𝑃(𝐹) = = 0,2637
𝐶315
UPC MA444 Estadística 94
b. Determine la probabilidad de seleccionar dos de la marca A y una de la marca B.

Solución

Definamos el evento necesario.


𝐷: = seleccionar dos de la marca A y una de la marca B

La probabilidad pedida es:

𝐶25 × 𝐶16 × 𝐶04


𝑃(𝐷) = = 0,1319
𝐶315

c. Determine la probabilidad de seleccionar al menos una computadora de la marca B.

Solución
Definamos el evento necesario.

𝐸: = al menos una computadora es de la marca B

La probabilidad pedida es:

𝐶06 × 𝐶39
𝑃(𝐸) = 1 − 𝑃(𝐸𝑐 ) = = 0,8154
𝐶315

Ejemplo 4

Dos vendedores de seguros trabajan en la empresa Pacifico. La probabilidad de que el vendedor más
viejo llegue tarde cierto día es 0,20, de que el vendedor más joven llegue tarde cierto día es 0,15 y que
ambos lleguen tarde es 0,09.

a. Determine la probabilidad de que al menos un vendedor llegue tarde al trabajo cierto día.

Solución

Definamos los eventos necesarios:

𝐴: = que el vendedor más viejo llega tarde a la empresa 𝑃(𝐴) = 0,20


𝐵: = que el vendedor más joven llega tarde a la empresa 𝑃(𝐵) = 0,15

Se sabe que la probabilidad de que ambos lleguen tarde es 0,15, luego:

𝑃(𝐴 ∩ 𝐵) = 0,09
UPC MA444 Estadística 95
Usando los diagramas de Venn tendremos:

A B

0,11 0,09 0,06

0,74
6
La probabilidad de que al menos un vendedor llegue tarde al trabajo cierto día es la probabilidad
de la unión de A con B, por lo tanto:
𝑃(𝐴 ∪ 𝐵) = 0,20 + 0,15 − 0,09 = 0,26

b. Determine la probabilidad de solo un vendedor llegue tarde al trabajo cierto día.


Solución
La probabilidad pedida es:
𝑃((𝐴 ∩ 𝐵𝑐 ) ∪ (𝐴𝑐 ∩ 𝐵))

Usando los diagramas de Venn tendremos:

A B

0,11 0,09 0,06

Como los eventos 𝐴 ∩ 𝐵𝑐 y 𝐴𝑐 ∩ 𝐵 son mutuamente excluyentes, entonces:


𝑃((𝐴 ∩ 𝐵𝑐 ) ∪ (𝐴𝑐 ∩ 𝐵)) = 𝑃(𝐴 ∩ 𝐵𝑐 ) + 𝑃(𝐴𝑐 ∩ 𝐵) = 0,11 + 0,06 = 0,17

c. Determine la probabilidad de alguno de los vendedores no llegue tarde al trabajo cierto día.
Solución
La probabilidad pedida es:
𝑃(𝐴𝑐 ∩ 𝐵𝑐 ) = 1 − 𝑃(𝐴 ∩ 𝐵) = 1 − 0,09 = 0,91
Usando los diagramas de Venn tendremos:

A B

0,11 0,09 0,06


UPC MA444 Estadística 96
Ejemplo 5

Después de una política de mejora de la calidad de la producción de Chemilatex, tanto en el área de


llenado como el de sellado, los trabajadores fueron sensibilizados para realizar sus labores de
producción de la mejor manera y así disminuir los productos defectuosos en la producción. Para
corroborarlo se toma una muestra de 80 productos, encontrándose que 25 presentan defectos en el
llenado, 32 presentan defectos en el sellado y 30 no presentaban defectos. Si se selecciona un
producto al azar.

a. Determine la probabilidad de que se hayan producido ambos tipos de defectos.

b. ¿Cuál es la probabilidad de que se haya producido solo uno de los tipos de defectos?

c. ¿Los eventos defecto en el sellado y defecto en llenado son mutuamente excluyentes?


UPC MA444 Estadística 97
Principios fundamentales de conteo
Comprende un conjunto de procedimientos que permiten determinar el número de resultados de un
suceso o experimento sin necesidad de utilizar una enumeración e identificación directa de todos los
posibles resultados de dicho suceso o experimento.

Analicemos los siguientes experimentos aleatorios:

1: lanzar un dado y registrar el número de la cara superior.

1 = {1, 2, 3, 4, 5, 6}

Observamos que es fácil listar y contar los posibles resultados.

2: números pares de tres cifras que se pueden formar con los dígitos 1, 2, 3, 4, 5, 6, 7, 8, 9

2 = {174, 148, 184, 198, 194, 144, … }

Observamos que ya no es fácil listar y contar los posibles resultados, ante esta situación es necesario
utilizar técnicas que nos faciliten el conteo de estos posibles resultados.

Principio de la multiplicación
Si un procedimiento A puede realizarse de 𝑚 maneras y otro procedimiento B puede realizarse de 𝑛
maneras, entonces los dos procedimientos A y B (uno seguido del otro) ocurren de 𝑚 × 𝑛 maneras o
formas.

Ejemplo 1

Un ensamblador de computadoras tiene cuatro microprocesadores de diferentes marcas y tres


memorias de diferentes marcas ¿de cuántas maneras posibles puede ensamblar una computadora?
UPC MA444 Estadística 98
Principio de la adición
Si un procedimiento A puede realizarse de 𝑚 maneras y otro procedimiento B puede realizarse de 𝑛
maneras, y si no es posible que ambos se realicen en forma simultánea entonces los dos
procedimientos A o B ocurren de 𝑚 + 𝑛 maneras o formas.

Ejemplo 1

La biblioteca de la UPC tiene en uno de sus estantes 40 libros de Cálculo y 50 de Estadística. Si un


estudiante desea estudiar uno de estos dos temas. ¿De cuántas formas puede realizar la elección de
los libros?

Solución
Definamos los eventos:

𝐶: = elegir un libro de Cálculo 𝑛(𝐶) = 40


𝐸: = elegir un libro de Estadística 𝑛(𝐸) = 50
𝐿: = elegir un libro

Por la regla de la adición:

𝑛(𝐿) = 𝑛(𝐶) + 𝑛(𝐸) = 40 + 50 = 90

Se puede realizar la elección de los libros de 90 maneras diferentes.

Ejemplo 2

Un ingeniero de telecomunicaciones está proyectando un viaje a una provincia para instalar una
antena parabólica, debe decidir el viaje por bus o por tren. Si hay tres rutas para el bus y dos para el
tren ¿de cuántas maneras posibles puede realizar el viaje?
UPC MA444 Estadística 99
Técnica de conteo: Combinación

Es una técnica que permite contar el número de maneras de seleccionar o elegir aleatoriamente 𝑟
elementos de un total de 𝑛, sin considerar el orden de selección. Está dado por:

𝑛!
𝐶𝑟𝑛 =
𝑟! (𝑛 − 𝑟)!

Ejemplo 1

Una empresa ha decidido que, para el trabajo remoto de su personal, tres de los 15 trabajadores del
área de Recursos Humanos deben asistir de manera presencial a la empresa, ¿de cuántas maneras
puede seleccionar al grupo?

Solución
Definamos el evento necesario:

𝐶: = elegir tres de los de los 15 trabajadores del área de Recursos Humanos para que asistan de manera
presencial a la empresa.

Como no implica orden, entonces:

15!
𝑛(𝐶) = 𝐶315 = = 455
3! (15 − 3)!

Se puede realizar la elección de los libros de 90 maneras diferentes.

Ejemplo 2

Una planta de producción emplea 20 trabajadores en el turno mañana, 15 trabajadores en el turno


tarde y 10 en el turno de noche. Un consultor de control de calidad selecciona a seis trabajadores de
un turno para ser entrevistados. ¿De cuántas formas se puede realizar la selección?

Solución

Definamos el evento necesario:

𝐴: = elegir seis trabajadores de un turno para ser entrevistados.

Como no implica orden, entonces:

𝑛(𝐴) = 𝐶620 + 𝐶615 + 𝐶610 = 43 975


UPC MA444 Estadística 100
Ejemplo 3

Un grupo de 20 ingenieros civiles igualmente capacitados forman la plantilla de una empresa


constructora. Si se eligen al azar a tres de ellos para participar en un proyecto, ¿de cuántas maneras
posibles se pueden seleccionar a estos tres ingenieros?

Ejemplo 4

De un grupo de ocho pequeñas empresas se sabe que dos no cumplen con sus obligaciones tributarias.
La Sunat revisará el cumplimiento de los tributos de todas las pequeñas empresas si al seleccionar tres
empresas, la probabilidad de que por lo menos una no cumple con sus obligaciones tributarias sea
superior a 0,62 ¿Qué le recomendaría usted a la Sunat?
UPC MA444 Estadística 101
Probabilidad condicional
Si 𝐴 y 𝐵 v Ω, , q
el evento 𝐴 dado 𝐵 se determina por:

𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵 ) =
𝑃(𝐵)

Siendo 𝑃(𝐵) > 0.

Ejemplo 1

Para ocupar un puesto de trabajo en el departamento de diseño de ingeniería de una compañía


constructora de barcos, se han presentado postulantes, cuyas principales características se resumen
en el siguiente cuadro:

Egresado de ingeniería
No egresado de
Mecánica Industrial Total
universidad (N)
Años de experiencia (M) (I)
Al menos tres años de experiencia (A) 14 4 9 27
Menos de tres años de experiencia (B) 25 11 27 63
Total 39 15 36 90

El orden en que el gerente de la estación entrevista a los aspirantes es aleatorio. Calcule la probabilidad
de que el primer entrevistado por el gerente:

a. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
b. Sea egresado de ingeniería mecánica o tenga al menos tres años de experiencia.
c. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
d. Tenga al menos tres años de experiencia dado que es egresado de ingeniería industrial.

Solución

a)

𝑃(𝑁 ∩ 𝐵) 0.3
𝑃(𝑁 ⁄𝐵 ) = = = 0.4286
𝑃(𝐵) 0.7

27
𝑃(𝑁 ∩ 𝐵) = = 0.3
90

63
𝑃(𝐵) = = 0.7
90

a. No sea egresado de universidad Y que tiene menos de tres años de experiencia.


UPC MA444 Estadística 102

Solución

Definamos los eventos necesarios:

𝑁: = Que el postulante NO sea egresado de la universidad


𝐵: = que el postulante tenga menos de tres años de experiencia

La probabilidad pedida es:

27
𝑃(N ∩ B) = = 0.30
90

b. Sea egresado de ingeniería mecánica o tenga al menos tres años de experiencia.

Solución

Definamos los eventos necesarios:

𝐴: = que el postulante tenga al menos de tres años de experiencia


𝑀: = que el postulante sea egresado de mecánica

La probabilidad pedida es:

39 27 14
𝑃(𝑀 ∪ 𝐴) = 𝑃(𝑀) + 𝑃(𝐴) − 𝑃(𝑀 ∩ 𝐴) = + − = 0,5778
90 90 90

c. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.

Solución

Definamos los eventos necesarios:

𝐵: = que el postulante tenga menos de tres años de experiencia


𝑁: = que el postulante no sea egresado de universidad

La probabilidad pedida es:

27
𝑃(𝑁 ∩ 𝐵) 90 27
𝑃(𝑁 ⁄𝐵 ) = = = = 0,4286
𝑃(𝐵) 63 63
90
UPC MA444 Estadística 103

d. Tenga al menos tres años de experiencia dado que es egresado de ingeniería industrial.

Solución

Definamos los eventos necesarios:

𝐴: = que el postulante tenga al menos de tres años de experiencia


𝐼: = que el postulante sea egresado de ingeniería industrial

La probabilidad pedida es:

4
𝑃(𝐴 ∩ 𝐼) 90 4
𝑃(𝐴⁄𝐼 ) = = = = 0,2667
𝑃(𝐼) 15 15
90
UPC MA444 Estadística 104
Ejemplo 2

Un estudio de mejoramiento de la producción de un fabricante de semiconductores proporcionó datos


para una muestra de 530 placas de silicio. La siguiente tabla presenta el resumen de las respuestas a
dos interrogantes: ¿se encontraron partículas en el troquel que produjo la placa de silicio? y ¿la placa
es regular, buena o mala?

Condición del troquel

Sin partículas Cantidad media de Gran cantidad de Total


(S) partículas (P) partículas (G)
Calidad de la placa
Buena (B) 35 80 70 185
Regular (R) 40 125 30 195
Mala (M) 25 65 60 150
Total 100 270 160 530

Se selecciona al azar una placa de silicio.

a. ¿Cuál es la probabilidad que sea de calidad regular y tenga gran cantidad de partículas?
b. ¿Cuál es la probabilidad que tenga una cantidad media de partículas o sea de mala calidad?
c. ¿Cuál es la probabilidad de que la placa haya sido producida por un troquel con una cantidad
media de partículas o por un troquel con gran cantidad de partículas si la placa no es buena?
d. Dado que la placa de silicio es producida con un troquel que no tiene gran cantidad de partículas,
¿cuál es la probabilidad que sea de buena calidad?

Solución

a. ¿Cuál es la probabilidad que sea de calidad regular y tenga gran cantidad de partículas?

Solución

Definamos los eventos necesarios:

𝑅: = que la placa sea de calidad regular


𝐺: = que el troquel tenga gran cantidad de partículas

La probabilidad pedida es:

30
𝑃(𝑅 ∩ 𝐺) = = 0,0566
530

b. ¿Cuál es la probabilidad que tenga una cantidad media de partículas o sea de mala calidad?

Solución
UPC MA444 Estadística 105
Definamos los eventos necesarios:

𝑀: = que la placa sea de mala calidad


𝑃: = que el troquel tenga una cantidad media de partículas

La probabilidad pedida es:

𝑃(𝑃 ∪ 𝑀) = 𝑃(𝑃) + 𝑃(𝑀) − 𝑃(𝑃 ∩ 𝑀)

270 150 65
= + − = 0,6698
530 530 530

c. ¿Cuál es la probabilidad de que la placa haya sido producida por un troquel con una cantidad media
de partículas o por un troquel con gran cantidad de partículas si la placa no es buena?

Solución

Definamos los eventos necesarios:

𝐺: = que el troquel tenga gran cantidad de partículas


𝑃: = que el troquel tenga una cantidad media de partículas
𝐵: = que la placa sea de buena calidad

La probabilidad pedida es:

𝑃(𝑃 ∪ 𝐺 ⁄𝐵𝑐 ) = 𝑃(𝑃⁄𝐵𝑐 ) + 𝑃(𝐺 ⁄𝐵𝑐 )– 𝑃(𝑃 ∩ 𝐺 ⁄𝐵𝑐 )

190 90 0
= + − = 0,8116
345 345 345

d. Dado que la placa de silicio es producida con un troquel que no tiene gran cantidad de partículas,
¿cuál es la probabilidad que sea de buena calidad?

Solución
Definamos los eventos necesarios:

𝐺: = que el troquel tenga gran cantidad de partículas


𝐵: = que la placa sea de buena calidad

La probabilidad pedida es:

𝑃(𝐵 ∩ 𝐺 𝑐 ) 80 + 35
𝑃(𝐵/𝐺 𝑐 ) = = = 0,3108
𝑃(𝐺 𝑐 ) 370
UPC MA444 Estadística 106
Ley multiplicativa de probabilidad

De la definición de probabilidad condicional, obtenemos la fórmula para hallar la probabilidad de la


intersección (o producto) de los eventos 𝐴 y 𝐵, esto es, de:

𝑃 (𝐴 ∩ 𝐵) = 𝑃 (𝐴/𝐵)𝑃 (𝐵) = 𝑃 (𝐵/𝐴)𝑃 (𝐴)

Ejemplo 1

Sean 𝐴 y 𝐵 son eventos tales que 𝑃(𝐴) = 0,4; 𝑃(𝐵) = 0,2 y 𝑃(𝐴/𝐵) = 0,5.

Calcule 𝑃(𝐴 ∪ 𝐵).

Calcule 𝑃(𝐴𝑐 ∩ 𝐵).


UPC MA444 Estadística 107
Eventos independientes

Los eventos A y B son independientes si la ocurrencia de B no altera la probabilidad de que haya


ocurrido A, es decir, los eventos A y B son independientes si:

𝑃(𝐴⁄𝐵 ) = 𝑃(𝐴)

Si dos eventos no son independientes, se dice que son dependientes.

Regla multiplicativa para eventos independientes

Si los eventos A y B son independientes, la probabilidad de la intersección de A y B es igual al producto


de las probabilidades de A y B, es decir,

𝑃 (𝐴 ∩ 𝐵) = 𝑃 (𝐴)𝑃(𝐵)

Generalizando para los eventos independientes 𝐸1 , 𝐸2 , … , 𝐸𝑘 .

𝑃( 𝐸1 ∩ 𝐸2 ∩. . . 𝐸𝑘 ) = 𝑃( 𝐸1 ) 𝑃( 𝐸2 ) ⋯ 𝑃( 𝐸𝑘 )

Propiedades

Si los eventos 𝐴 y 𝐵 son independientes, entonces también son independientes:

• 𝐴𝑐 y 𝐵𝑐 ; entonces:
𝑃(𝐴𝑐 ∩ 𝐵𝑐 ) = 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )
• 𝐴𝑐 y 𝐵; entonces:
𝑃(𝐴𝑐 ∩ 𝐵) = 𝑃(𝐴𝑐 )𝑃(𝐵)
• 𝐴y 𝐵𝑐 ; entonces:
𝑃(𝐴 ∩ 𝐵𝑐 ) = 𝑃(𝐴)𝑃(𝐵𝑐 )

Esta propiedad se puede generalizar para más de dos eventos.

Leyes de De Morgan

• 𝑃((𝐴 ∩ 𝐵)𝑐 ) = 𝑃(𝐴𝑐 ∪ 𝐵𝑐 )


• 𝑃((𝐴 ∪ 𝐵)𝑐 ) = 𝑃(𝐴𝑐 ∩ 𝐵𝑐 )

Estas leyes se pueden generalizar para más de dos eventos.


UPC MA444 Estadística 108
Ejemplo 1

Un sistema electrónico está compuesto por tres subsistemas A, B y C, de tal manera que las
probabilidades de fallar de cada uno son 0,15; 0,20 y 0,35. Si los subsistemas funcionan de manera
independiente, calcular:
a. Calcular la probabilidad de que al menos uno de los subsistemas falle.
b. Calcular la probabilidad de solo dos de los subsistemas funcione.

Solución

Definamos los eventos necesarios.

𝐴: = el subsistema A falle 𝑃(𝐴) = 0,15 𝑃(𝐴𝑐 ) = 0,85


𝐵: = el subsistema B falle 𝑃(𝐵) = 0,20 𝑃(𝐵𝑐 ) = 0,80
𝐶: = el subsistema C falle 𝑃(𝐶) = 0,35 𝑃(𝐶 𝑐 ) = 0,65

a. Calcular la probabilidad de que al menos uno de los subsistemas falle.

Solución

Definamos los eventos necesarios.

𝑆: = al menos uno de los sistemas falle


𝑆 𝑐 : = ninguno de los sistemas falle

𝑃(𝑆) = 1 − 𝑃(𝑆 𝑐 )

Para que ninguno de los sistemas falle, no debe fallar ninguno de los sistemas 𝐴, 𝐵 y 𝐶.

𝑃(𝑆) = 1 − 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶 𝑐 )

Como los eventos 𝐴, 𝐵 y 𝐶 son independientes:

𝑃(𝑆) = 1 − 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶 𝑐 )

𝑃(𝑆) = 1 − 0,85 × 0,80 × 0,65 = 0,558

b. La probabilidad de solo dos de los subsistemas funcione.

Solución

Definamos los eventos necesarios.

𝑆2 : = solo dos de los sistemas funcionen.

Para que solo dos de los sistemas funcionen, deben funcionar A y C pero no B; B y C pero no A; A y
B pero no C. Por lo tanto:
UPC MA444 Estadística 109

𝑃(𝑆2 ) = 𝑃(𝐴𝑐 ∩ 𝐵 ∩ 𝐶 𝑐 ) + 𝑃(𝐴 ∩ 𝐵𝑐 ∩ 𝐶 𝑐 ) + 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶)

Como los eventos 𝐴, 𝐵 y 𝐶 son independientes:

𝑃(𝑆2 ) = 𝑃(𝐴𝑐 )𝑃(𝐵)𝑃(𝐶 𝑐 ) + 𝑃(𝐴)𝑃(𝐵𝑐 )𝑃(𝐶 𝑐 ) + 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶)

Reemplazando los valores, tendremos:

𝑃(𝑆2 ) = 0,85 × 0,20 × 0,65 + 0,15 × 0,80 × 0,65 + 0,85 × 0,80 × 0,35 = 0,4265

Ejemplo 2

Una empresa produce piezas en tres máquinas, M1, M2 y M3, que pueden presentar desajustes de
manera independiente, con probabilidades 0,02; 0,01 y 0,06 respectivamente. Al inicio de un día de
operación se realiza una prueba en cada máquina. Si se observan desajustes en una máquina, ésta
debe pasar el día en revisión técnica. Para cumplir el nivel mínimo de producción diaria se necesita que
al menos dos de las tres máquinas funcionen.

a. ¿Cuál es la probabilidad de que una de las tres máquinas deba pasar el día en revisión técnica?
b. ¿Cuál es la probabilidad de cumplir con el nivel mínimo de producción diaria?

Solución

Definamos los eventos necesarios.

𝐴: = la máquina M1 presenta desajustes 𝑃(𝐴) = 0,02 𝑃(𝐴𝑐 ) = 0,98


𝐵: = la máquina M2 presenta desajustes 𝑃(𝐵) = 0,01 𝑃(𝐵𝑐 ) = 0,99
𝐶: = la máquina M3 presenta desajustes 𝑃(𝐶) = 0,06 𝑃(𝐶 𝑐 ) = 0,94

a. ¿Cuál es la probabilidad de que una de las tres máquinas deba pasar el día en revisión técnica?

Solución

Se define el evento necesario:

𝑅: = una de las tres máquinas presenta desajustes

Para que solo una de las máquinas presente desajustes, deben presentarlos M1 pero no M2 y M3;
M2 pero no M1 y M3; M3 pero no M1 y M2.

Por lo tanto:

𝑃(𝑅) = 𝑃(𝐴 ∩ 𝐵𝑐 ∩ 𝐶 𝑐 ) + 𝑃(𝐴𝑐 ∩ 𝐵 ∩ 𝐶 𝑐 ) + 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶)

Como los eventos 𝐴, 𝐵 y 𝐶 son independientes:

𝑃(𝑅) = 𝑃(𝐴)𝑃(𝐵𝑐 )𝑃(𝐶 𝑐 ) + 𝑃(𝐴𝑐 )𝑃(𝐵)𝑃(𝐶 𝑐 ) + 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶)


UPC MA444 Estadística 110
Reemplazando los valores, tendremos:

𝑃(𝑅) = 0,02 × 0,99 × 0,94 + 0,98 × 0,01 × 0,94 + 0,98 × 0,99 × 0,06 = 0,086

b. ¿Cuál es la probabilidad de cumplir con el nivel mínimo de producción diaria?

Solución

Se define el evento necesario:

𝑁: = cumplir con el nivel mínimo de producción

Para cumplir el nivel mínimo de producción diaria se necesita que al menos dos de las tres máquinas
funcionen, es decir, funcionen dos de las máquinas o las tres.

𝑃(𝑁) = 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶) + 𝑃(𝐴𝑐 ∩ 𝐵 ∩ 𝐶 𝑐 ) + 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶) + 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶 𝑐 )

Como los eventos 𝐴, 𝐵 y 𝐶 son independientes:

𝑃(𝑁) = 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶) + 𝑃(𝐴𝑐 )𝑃(𝐵)𝑃(𝐶 𝑐 ) + 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶) + 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶 𝑐 )

Reemplazando los valores, tendremos:

𝑃(𝑁) = 0,98 × 0,99 × 0,06 + 0,98 × 0,01 × 0,94 + 0,02 × 0,99 × 0,94 + 0,98 × 0,99 × 0,94

𝑃(𝑁) = 0,9980
UPC MA444 Estadística 111
Aplicación al sistema de componentes: Confiabilidad de sistemas
Podemos aplicar el concepto de la independencia de eventos al caso en que se tenga un sistema de
componentes electrónicos acoplados en serie o en paralelo.

Sistema en serie
Un sistema de componentes acopladas en serie funciona si todos sus componentes funcionan.

Sean los eventos:


𝐴 ≔ el componente A funcione
𝐵 ≔ el componente B funcione
𝑆 ≔ el sistema funcione

Para que el sistema funcione 𝑆, ambos componentes, A y B, deben funcionar. Se asume que cada
componente funciona de forma independiente.

A B

𝑃(S) = 𝑃(𝐴 ∩ 𝐵)

Cada componente funciona de forma independiente, entonces:

𝑃(𝑆) = 𝑃(𝐴)𝑃(𝐵)

Ejemplo 1

El sistema funcionará sólo si ambos componentes funcionan. El componente A funciona con una
probabilidad de 0,98 y el componente B funciona con una probabilidad de 0,95. Suponga que A y B
funcionan de manera independiente. Determine la probabilidad que el sistema funcione.

Solución
Sean los eventos:
𝐴 ≔ el componente A funcione
𝐵 ≔ el componente B funcione
𝑆 ≔ el sistema funcione

A B

La probabilidad de que funcione el sistema es:

𝑃(𝑆) = 𝑃(𝐴 ∩ 𝐵)

Cada componente funciona de forma independiente, entonces:

𝑃(𝑆) = 𝑃(𝐴)𝑃(𝐵) = 0,98 × 0,95 = 0,931


UPC MA444 Estadística 112
Sistema en paralelo
Un sistema de componentes acoplada en paralelo funciona, si al menos una de sus componentes
funciona. El sistema funcionará si alguno de los componentes, A o B, funciona.

𝑃(𝑆) = 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)

Se asume que cada componente funciona de forma independiente.

𝑃(𝑆) = 𝑃(𝐴 ∪ 𝐵) = 1 − 𝑃((𝐴 ∪ 𝐵)𝑐 )

Usando las leyes de De Morgan

𝑃(𝑆) = 𝑃(𝐴 ∪ 𝐵) = 1 − 𝑃(𝐴𝑐 ∩ 𝐵𝐶 )

Cada componente funciona de forma independiente, entonces la probabilidad de que el sistema


funcione es:

𝑃(𝑆) = 1 − 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )

Ejemplo 2
Los componentes A y B funcionan con una probabilidad de 0,90 y 0,85 respectivamente. Suponga que
los componentes A y B funcionan de manera independiente. Determine la probabilidad de que el
sistema funcione.

B
Solución

La probabilidad de que el sistema funcione es:

𝑃(𝑆) = 1 − 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 ) = 1 − (0,10 × 0,15) = 0,985


UPC MA444 Estadística 113
Ejemplo 3

Un sistema eléctrico consta de cuatro componentes. El sistema funciona si los componentes A y B


funcionan, y si funciona cualquiera de los componentes C o D. La confiabilidad (probabilidad de que
funcionen) de cada uno de los componentes también se muestra en la figura. Suponga que los cuatro
componentes funcionan de manera independiente.

0,8
C
0,9 0,8
A B
0,8
D
a. Calcule la probabilidad que el sistema completo funcione.

b. Calcule la probabilidad que el componente C no funcione, dado que el sistema completo funciona.
UPC MA444 Estadística 114
Probabilidad total y el teorema de Bayes

Probabilidad total

Sean los eventos 𝐴1 , 𝐴2 , . . . , 𝐴𝑘 , los cuales forman una partición del espacio muestral  mutuamente
excluyentes y exhaustivos y sea 𝐸 otro evento cualquiera de , se cumple:

𝐴1 𝐴2 𝐴𝑘

𝑃(𝐸) = 𝑃(𝐴1 )𝑃(𝐸⁄𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐸⁄𝐴2 ) + ⋯ + 𝑃(𝐴𝑘 )𝑃(𝐸 ⁄𝐴𝑙 )

Donde a 𝑃(𝐸) se le conoce como la probabilidad total.

A B C

𝑷(𝑫) = 𝑷(𝑨 ∩ 𝑫) + 𝑷(𝑩 ∩ 𝑫) + 𝑷(𝑪 ∩ 𝑫)

𝑷(𝑫) = 𝑷(𝐃/𝐀) ∗ 𝑷(𝑨) + 𝑷(𝐃/𝐁) ∗ 𝑷(𝑩) + 𝑷(𝐃/𝐂) ∗ 𝑷(𝑪)


UPC MA444 Estadística 115

REGLA DE MULTIPLICACION

P(A∩D)
P (A / D) = P (D )

P(A∩D)
P (D / A) = P (A )

P (A / D)*P(D) = P ( A ∩ D )

P (D / A)*P(A) = P ( A ∩ D )

Teorema de Bayes

Si los eventos 𝐴1 , 𝐴2 , . . . , 𝐴𝑘 constituyen una partición del espacio muestral , entonces para cualquier
evento 𝐸 de , se cumple que:

𝑃(𝐴𝑖 ∩ 𝐸)
𝑃(𝐴𝑖 ⁄𝐸) = 𝑖 = 1, 2, … , 𝑘
𝑃(𝐸)

𝑃(𝐴𝑖 )𝑃(𝐸⁄𝐴𝑖 )
𝑃(𝐴𝑖 ⁄𝐸) =
𝑃(𝐴1 )𝑃(𝐸⁄𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐸⁄𝐴2 ) + ⋯ + 𝑃(𝐴𝑘 )𝑃(𝐸⁄𝐴𝑘 )
UPC MA444 Estadística 116
Ejemplo 1
Una cadena de tiendas de suministros de construcción vende tres marcas diferentes de teodolitos. De
sus ventas de teodolitos, 50% son de la marca 1 (la menos cara), 30% son de la marca 2 y 20% son de
la marca 3 (la más cara).

Cada fabricante ofrece un año de garantía en las partes y mano de obra. Se sabe que 25% de los
teodolitos de la marca 1 requieren trabajo de reparación dentro del periodo de garantía, mientras que
los porcentajes correspondientes de las marcas 2 y 3 son 20% y 10%, respectivamente.

Determine:
a. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya adquirido un teodolito de
la marca 1 y que necesitará reparación mientras se encuentra dentro de garantía?
b. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya comprado un teodolito
que necesite reparación mientras se encuentra dentro de la garantía?
c. Si un cliente regresa a la tienda con un teodolito que necesita reparación dentro de garantía, ¿cuál
es la probabilidad de que sea un teodolito de la marca 1?

Solución

Primero, definimos los eventos y a continuación elaboramos el diagrama del árbol.

𝐴: = que un comprador haya adquirido un teodolito de la marca A1


𝐵: = que un comprador haya adquirido un teodolito de la marca A2
𝐶: = que un comprador haya adquirido un teodolito de la marca A3
𝑁: = necesita reparación mientras se encuentra dentro de la garantía

𝑃(𝑁 ⁄𝐴) = 0,25 𝑃(𝐴 ∩ 𝑁) = 0.125


𝑃(𝐴) = 0,50
𝑃(𝑁 𝑐 ⁄𝐴) = 0,75 𝑃(𝐴 ∩ 𝑁 𝑐 )

𝑃(𝑁 ⁄𝐵 ) = 0,20 𝑃(𝐵 ∩ 𝑁) = 0.06


𝑃(𝐵) = 0,30
𝑃(𝑁 𝑐 ⁄𝐵 ) = 0,80 𝑃(𝐵 ∩ 𝑁 𝑐 )

𝑃(𝑁 ⁄𝐶 ) = 0,10 𝑃(𝐶 ∩ 𝑁) = 0.02


𝑃(𝐶) = 0,20
𝑃(𝑁 𝑐 ⁄𝐶 ) = 0,90 𝑃(𝐶 ∩ 𝑁 𝑐 )

𝑷(𝑵) = 𝑷(𝑨 ∩ 𝑵) + 𝑷(𝑩 ∩ 𝑵) + 𝑷(𝑪 ∩ 𝑵)

𝑷(𝑵) = 𝟎. 𝟏𝟐𝟓 + 𝟎. 𝟎𝟔 + 𝟎. 𝟎𝟐 = 𝟎. 𝟐𝟎𝟓

𝑷(𝑵𝑪 ) = 𝑷(𝑨 ∩ 𝑵𝑪 ) + 𝑷(𝑩 ∩ 𝑵𝑪 ) + 𝑷(𝑪 ∩ 𝑵𝑪 )


UPC MA444 Estadística 117

a. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya adquirido un teodolito de


la marca 1 y que necesitará reparación mientras se encuentra dentro de garantía?

Solución
La probabilidad pedida es:

𝑃(𝐴 ∩ 𝑁) = 𝑃(𝑁 ⁄𝐴)𝑃(𝐴) = 0,125

b. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya comprado un teodolito


que necesite reparación mientras se encuentra dentro de la garantía?

Solución
𝑁: = necesita reparación mientras se encuentra dentro de la garantía

La probabilidad pedida es:

𝑃(𝑁) = 𝑃(𝐴 ∩ 𝑁) + 𝑃(𝐵 ∩ 𝑁) + 𝑃(𝐶 ∩ 𝑁)

Usando el teorema de la probabilidad total.

𝑃(𝑁) = 𝑃(𝑁 ⁄𝐴)𝑃(𝐴) + 𝑃(𝑁 ⁄𝐵 )𝑃(𝐵) + 𝑃(𝑁 ⁄𝐶 )𝑃(𝐶)

𝑃(𝑁) = 0,5 × 0,25 + 0,30 × 0,20 + 0,20 × 0,10 = 0,205

𝑃(𝑁) = 0,125 + 0,06 + 0,02 = 𝟎, 𝟐𝟎𝟓

c. Si un cliente regresa a la tienda con un teodolito que necesita reparación dentro de la garantía,
¿cuál es la probabilidad de que sea un teodolito de la marca 1?

Solución

La probabilidad pedida es:

𝑃(𝐴 ∩ 𝑁) 𝑃(𝑁/𝐴)𝑃(𝐴) 0,5 × 0,25


𝑃(𝐴⁄𝑁 ) = = = = 0,6098
𝑃(𝑁) 𝑃(𝐷) 0,205

𝑷(𝑵) = 𝑷(𝑨 ∩ 𝑵) + 𝑷(𝑩 ∩ 𝑵) + 𝑷(𝑪 ∩ 𝑵)

𝑷(𝑵) = 𝟎. 𝟏𝟐𝟓 + 𝟎. 𝟎𝟔 + 𝟎. 𝟎𝟐 = 𝟎. 𝟐𝟎𝟓


UPC MA444 Estadística 118

Ejemplo 2
Tres máquinas A, B y C, producen el 45%, 30% y 25% respectivamente del total de las piezas producidas
en una fábrica. El porcentaje de producción de piezas defectuosas de estas máquinas son del 3%, 4%
y 5% respectivamente.

a. Si seleccionamos una pieza al azar ¿cuál es la probabilidad de que sea defectuosa?


b. Si tomamos al azar una pieza y resulta defectuosa ¿cuál es la probabilidad de que haya sido
producida por la máquina B?
c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?

Solución

Primero, definimos los eventos y a continuación elaboramos el diagrama del árbol:

𝐴: = que la pieza sea producida por la máquina A 𝑃(𝐴) = 0,45


𝐵: = que la pieza sea producida por la máquina B 𝑃(𝐵) = 0,30
𝐶: = que la pieza sea producida por la máquina C 𝑃(𝐶) = 0,25
𝐷: = que se elija una pieza defectuosa

𝑃(𝐷 ⁄𝐴) = 0,03 𝑃(𝐴 ∩ 𝐷) = 0.0135


𝑃(𝐴) = 0,45
𝑃(𝐷 𝑐 ⁄𝐴) = 0,97 𝑃(𝐴 ∩ 𝐷 𝑐 )

𝑃(𝐷 ⁄𝐵 ) = 0,04 𝑃(𝐵 ∩ 𝐷) = 0.012


𝑃(𝐵) = 0,30
𝑃(𝐷 𝑐 ⁄𝐵 ) = 0,96 𝑃(𝐵 ∩ 𝐷 𝑐 )

𝑃(𝐷 ⁄𝐶 ) = 0,05 𝑃(𝐶 ∩ 𝐷) = 0.0125


𝑃(𝐶) = 0,25
𝑃(𝐷 𝑐 ⁄𝐶 ) = 0,95 𝑃(𝐶 ∩ 𝐷 𝑐 )

a. Si seleccionamos una pieza al azar ¿cuál es la probabilidad de que sea defectuosa?

Solución
La probabilidad pedida es:

𝑷(𝑫) = 𝑷(𝑨 ∩ 𝐃) + 𝑷(𝑩 ∩ 𝑫) + 𝑷(𝑪 ∩ 𝐃)

𝑃(𝐷) = 0,45 × 0,03 + 0,30 × 0,04 + 0,25 × 0,05 = 0,038


UPC MA444 Estadística 119
b. SI SE SABE QUE Si tomamos al azar una pieza y resulta defectuosa ¿cuál es la probabilidad de que
haya sido producida por la máquina B?

Solución
La probabilidad pedida es:

𝑃(𝐵 ∩ 𝐷) 𝑃(𝐷/𝐵)𝑃(𝐵) 0,04 × 0,30


𝑃(𝐵/𝐷) = = = = 0,3158
𝑃(D) 𝑃(𝐷) 0,038

c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?

Solución
Las probabilidades pedidas son:

𝑃(𝐴 ∩ 𝐷) 𝑃(𝐷/𝐴)𝑃(𝐴) 0,03 × 0,45


𝑃(𝐴/𝐷) = = = = 𝟎, 𝟑𝟓𝟓𝟑
𝑃(D) 𝑃(𝐷) 0,038

𝑃(𝐵 ∩ 𝐷) 𝑃(𝐷/𝐵)𝑃(𝐵) 0,04 × 0,30


𝑃(𝐵/𝐷) = = = = 0,3158
𝑃(D) 𝑃(𝐷) 0,038

𝑃(𝐶 ∩ 𝐷) 𝑃(𝐷/𝐶)𝑃(𝐶) 0,05 × 0,25


𝑃(𝐶/𝐷) = = = = 0,3289
𝑃(D) 𝑃(𝐷) 0,038

La máquina con mayor probabilidad de haber producido la pieza defectuosa es la máquina A.


UPC MA444 Estadística 120
Ejemplo 3

Una empresa se encuentra estudiando la posibilidad de importar para el próximo año un nuevo
modelo de celular de última generación. Al estudiar la situación económica del próximo año se
contemplan tres posibilidades: inflación, estabilidad o crecimiento, estimando dichas alternativas con
las siguientes probabilidades: 0,55; 0,35 y 0,10 respectivamente. La probabilidad de importar el nuevo
modelo de celular es 0,25 si existiera inflación; 0,40 si existiera estabilidad y 0,65 si existiera
crecimiento.

a. Defina los eventos y presente el diagrama del árbol.

b. Calcule la probabilidad de importar el nuevo modelo de celular para el próximo año.

c. Asumiendo que la empresa decidió importar el nuevo modelo de celular, ¿cuál es la probabilidad
que existiera inflación en la economía?
UPC MA444 Estadística 121
Ejemplo 4
17
La probabilidad que la construcción de un edificio termine a tiempo es , la probabilidad que no haya
20
3 14
huelga es y la probabilidad que la construcción se termine a tiempo dado que no hubo huelga es ;
4 15
1
la probabilidad que haya huelga y no se termine la construcción a tiempo es .
10

a. Calcule la probabilidad de que la construcción se termine a tiempo y no haya huelga.

b. No haya huelga dado que la construcción se terminó a tiempo.

c. La construcción no se termine a tiempo si hubo huelga.

d. La construcción no se termine a tiempo si no hubo huelga.


UPC MA444 Estadística 122
Ejercicios propuestos

27.Una empresa constructora emplea a tres ingenieros de ventas. El ingeniero 1 hace el trabajo de
estimar costos en 60% de las cotizaciones solicitadas a la empresa, el ingeniero 2 hace lo mismo en
30% de las cotizaciones y el ingeniero 3 en el resto. Se sabe que la tasa de error para el ingeniero 1
es tal que la probabilidad de encontrar un error en su trabajo es 0,02; la probabilidad de encontrar
un error en el trabajo del ingeniero 2 es 0,04 y la probabilidad de encontrar un error en el ingeniero
3 es de 0,03.

Suponga que al revisar una solicitud de cotización se encuentra un error grave en la estimación de
los costos. ¿Qué ingeniero supondría usted que hizo los cálculos?

28.El informe de la comisión mundial de represas (ONU, 2015) indica numerosos impactos ambientales
que logran dañar represas, provocando en ellas averías muy serias. La Confiep debe recomendar
un tipo de estructura antes de diseñar una nueva represa. Por registros anteriores se sabe que en
el Perú el 55% de las represas están hechas a base de cimientos, el 28% con terraplenes y el resto
con excavaciones. Además, se conoce que, cuando el diseño de la estructura de la represa es a base
de cimientos ésta no presenta averías en un 80%, si es a base de terraplenes presenta averías en
un 35% y si la estructura es a base de excavaciones presenta averías en un 25%.

Si se elige una represa al azar y ésta presenta averías ¿cuál es el tipo de diseño de estructura que
debería recomendar la Confiep?

29.Consideremos que tres máquinas Alpha, Beta y Gamma producen respectivamente el 50%, el 30%
y el 20% del número total de artículos de una fábrica. Si la proporción de artículos defectuosos que
produce cada una de estas máquinas es 0,03; 0,04 y 0,05 respectivamente y se selecciona un
artículo aleatoriamente.

a. Calcule la probabilidad de que el artículo sea defectuoso.


b. Calcule la probabilidad de que el artículo seleccionado al azar haya sido producido por la
máquina Alpha si se sabe que es defectuoso.
c. Calcule la probabilidad de que el artículo seleccionado al azar haya sido producido por la
máquina Alpha o la máquina Beta, si se sabe que es defectuoso.

30.Una empresa vende tres tipos de maquinaria pesada para la industria textil A, B y C. El 70% de las
máquinas son del tipo A, el 20% del tipo B y el 10% son del tipo C. Las máquinas A tienen una
probabilidad de 0,10 de producir una pieza defectuosa a lo largo de un año, las máquinas B tienen
una probabilidad de 0,30 y las máquinas C tienen una probabilidad 0,60 de producir una de tales
piezas defectuosas a lo largo de un año.

Una de estas máquinas ha estado funcionando durante un año de prueba y ha producido una pieza
defectuosa. ¿De cuál tipo de máquina es más probable que provenga la pieza defectuosa?

31.Una de las etapas de producción de drones es el ensamblado de la cubierta del casco para
exteriores. Se programan diariamente 1400 cascos utilizando a tres especialistas A, B y C. El
especialista A atiende 170 cascos, el especialista B atiende 500 cascos y el especialista C atiende los
restantes.
UPC MA444 Estadística 123
Cabe la posibilidad de que el ensamblado del casco no sea el correcto; por lo tanto, el casco
ensamblado sería defectuoso. La siguiente tabla muestra como varía la proporción del ensamblado
defectuoso del casco para cada especialista.

Especialista Proporción de cascos ensamblados defectuosos


A 0,02
B 0,04
C 0,03

Si se selecciona al azar un dron con casco ensamblado defectuoso, ¿cuál es la probabilidad de que
lo haya ensamblado el especialista B?

32.Una de las medidas que se consideran para regular el volumen de agua en m 3 en las represas, es
abrir las compuertas para que las represas no rebalsen. Las compuertas operan en forma
independiente de acuerdo con dos tipos de sistemas. Estos sistemas operan solo si hay una
trayectoria de dispositivos funcionales de izquierda a derecha. Su funcionamiento es muy
importante por lo que el ingeniero de mantenimiento recomendará utilizar aquel sistema que
presente mayor probabilidad de flujo de funcionamiento continuo.

Sistema 1 Sistema 2

¿Cuál de los dos sistemas deberá elegir para ser instalado en una compuerta? Suponga que cada
dispositivo funciona de manera independiente con una probabilidad de 0,85.

33.Considere el sistema de componentes electrónicos conectados como se muestra en la figura. Los


componentes funcionan de manera independiente uno del otro, y la probabilidad de que cada
componente funcione es 0,90; ¿cuál es la probabilidad de que el sistema electrónico funcione?

1 3 4

2 5 6

34.Electronic Systems Company que brinda soporte especializado en la instalación de redes con
tecnología LAN o WAN en diferentes empresas, sabe que el 15% de las empresas prefieren como
medio físico de transporte los cables de cobre de par trenzado, el 35% prefiere los cables coaxiales,
el 40% fibras ópticas y 10% el aire. Además, si la empresa elige los cables de cobre de par trenzado
como medio físico, la probabilidad que elija la tecnología WAN es 0,62. Las empresas que eligen
cables coaxiales tienen una probabilidad de 0,45 de elegir la tecnología LAN; las empresas que
eligen la fibra óptica tienen una probabilidad de 0,55 de elegir la tecnología WAN y las empresas
que eligen el aire como medio físico de transporte tienen una probabilidad de 0,5 de elegir la
tecnología LAN.
UPC MA444 Estadística 124

a. Calcule la probabilidad que una empresa elija para su red la tecnología LAN.
b. Si se selecciona al azar una empresa que utiliza tecnología WAN, ¿cuál es la probabilidad que
utilice como medio físico de transporte cables de cobre de par trenzado?

35.Si la probabilidad de que cada llave esté cerrada dejando pasar corriente es 𝑝 = 0,6 y las llaves se
cierran y se abren en forma independiente, calcular la probabilidad de que pase corriente de I hacia
O en el siguiente circuito.
UPC MA444 Estadística 125
Caso: Construcción de represas

El informe de la Comisión Mundial de Represas


(ONU,2015) indica que numerosos impactos
ambientales logran dañar represas, provocando en ellas
averías muy serias; por lo tanto, la Confiep debe
recomendar un tipo de material antes de diseñar una
nueva represa.

Por registros anteriores se sabe que en el Perú el 55% de


las represas están construidas a base de cimientos, el
2B% con terraplenes y el resto con excavaciones. Además, se conoce que si el diseño de la estructura
de la represa es a base de cimientos esta no presenta averías en un B0%, si es a base de terraplenes
presenta averías en un 35% y si la estructura es a base de excavaciones presenta averías en un 25%.

Si se elige una represa al azar y esta presenta averías, ¿cuál es el tipo de material que debería
recomendar la Confiep para que no ocurran fallas estructurales?
UPC MA444 Estadística 126
Variable aleatoria

Sea Ω un espacio muestral. Una variable aleatoria es una función 𝑋 que transforma cada resultado w
del espacio muestral en un número real 𝑋(𝑤).

El rango de la variable aleatoria X es el conjunto RX de todos sus posibles valores.

Ejemplo 1
Al lanzar dos monedas para registrar los posibles resultados se obtiene el espacio muestral siguiente:

 = {cc, cs, sc, ss}

Si definimos la variable aleatoria X como número de caras que se obtiene, entonces a cada resultado
de , es posible asignarle un número real de la siguiente manera:

• cc, se le asigna el número real 2


• cs, se le asigna el número real 1
• sc, se le asigna el número real 1
• ss, se le asigna el número real 0

Número de caras 0 1 2
f(x) = P(X = x) 0.25 0.50 0.25
UPC MA444 Estadística 127

Clasificación de variables aleatorias

Una variable es discreta si su rango es un conjunto finito o infinito numerable.

Por ejemplo: número de circuitos electrónicos producidos por una empresa que cumplen con las
especificaciones técnicas, número de llamadas que recibe una central telefónica.

Una variable es continua si su rango es un conjunto infinito no numerable.

Por ejemplo: resistencia a la ruptura de un material plástico (onzas por pulgada cuadrada), resistencia
transversal de los ladrillos fabricados por una empresa (MN/m 2).

Variable aleatoria discreta

Sea 𝑋 una variable aleatoria discreta. La función de probabilidad de una variable aleatoria discreta
representa la probabilidad de que la variable aleatoria tome un valor genérico igual a x y se denotará
de la siguiente manera:

𝒇(𝒙) = 𝑷(𝑿 = 𝒙)

𝑷(𝑿 = 𝟑)

La función de probabilidad de 𝑋 debe cumplir las siguientes condiciones:

𝑓(𝑥) ≥ 0

∑ 𝒇(𝒙) = 𝟏
𝑹𝒂𝒏𝒈𝒐 𝑿

Ejemplo 1
El ingeniero de producción de la empresa Tecnotronics S.A. ha determinado que la distribución de
probabilidades del número de artículos defectuosos por lote es la siguiente:

Tabla de distribución de probabilidades

X: Número de artículos defectuosos 0 1 2 3 4


f(x) = P(X = x) 0,25 a 0,10 0,25 0,25

a. Calcule el valor de la constante a para que la distribución sea de probabilidad.


b. Calcule la probabilidad de encontrar menos de dos artículos defectuosos por lote.
c. Si el lote tiene dos o más artículos defectuosos, es considerado malo; calcule la probabilidad que el
lote sea malo.
d. Si el número de artículos defectuosos por lote es al menos uno, calcule la probabilidad de que el
número de artículos defectuosos sea menor a tres.
UPC MA444 Estadística 128
Solución

a. Calcule el valor de la constante 𝑎 para que la distribución sea de probabilidad.

Solución

Para hallar el valor de la constante usaremos la siguiente condición:

∑ 𝑓(𝑥) = 1
𝑅𝑎𝑛𝑔𝑜 𝑋

𝑓(0) + 𝑓(1) + 𝑓(2) + 𝑓(3) + 𝑓(4) = 1

0,25 + 𝑎 + 0,10 + 0,25 + 0,25 = 1

Despejando se tiene que 𝒂 = 0,15

Tabla de distribución de probabilidades

X: Número de artículos defectuosos 0 1 2 3 4


f(x) = P(X = x) 0,25 0.15 0,10 0,25 0,25

b. Calcule la probabilidad de encontrar menos de dos artículos defectuosos por lote.

X : Número de artículos defectuosos


Solución

La probabilidad pedida es:

𝑃(𝑋 < 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) = 0,25 + 0,15 = 0,40

c. Si el lote tiene dos o más artículos defectuosos, es considerado malo; calcule la probabilidad que
el lote sea malo.

Solución

Sea el evento 𝐴: = el lote sea malo

El lote será malo si tiene dos o más artículos defectuosos, por lo tanto, la probabilidad pedida es:

𝑃(𝑋 ≥ 2) = 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4) = 0.10 + 0.25 + 0.25 = 0.60

POR COMPLEMENTO:

𝑃(𝑋 ≥ 2) = 1– 𝑃(𝑋 < 2) = 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1)] = 1– 0,40 = 0,60


UPC MA444 Estadística 129

d. Si se sabe que el número de artículos defectuosos por lote es al menos uno, calcule la probabilidad
de que el número de artículos defectuosos sea menor a tres.

Solución

La probabilidad pedida es:

PROBABILIDAD CONDICIONAL:
𝑃(𝐴 ∩ B)
𝑃(𝐴/𝐵) =
𝑃(B)

𝑷(𝑿 < 𝟑⁄𝑿 ≥ 𝟏)

POR COMPLEMENTO:

𝑃(𝑋 ≥ 1) = 1– 𝑃(𝑋 < 1) = 1 − [𝑃(𝑋 = 0)] = 1– 0.25 = 0.75

DESARROLLO:

𝑃(𝑋 < 3 ∩ 𝑋 ≥ 1)
𝑃 (𝑋 < 3 /𝑋 ≥ 1) =
𝑃(𝑋 ≥ 1)

𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)
𝑃 (𝑋 < 3 /𝑋 ≥ 1) =
1 − 𝑃(𝑋 = 0)

0,15 + 0,10
𝑃 (𝑋 < 3 /𝑋 ≥ 1) = = 0,3333
0.75
UPC MA444 Estadística 130
Ejemplo 2

El departamento de control de calidad de una empresa selecciona al azar diariamente tres bombillas
de un lote que contiene 20 bombillas, para decidir si acepta el lote y los pasa al departamento de
producción o rechaza el lote y los devuelve al proveedor.

a. Construya la distribución de probabilidad del número de bombillas defectuosas que se encuentra


en la muestra, si el muestreo es sin reposición y bajo la suposición que el lote contiene dos
bombillas defectuosas.

Identificamos la variable 𝑋: = número de bombillas defectuosas encontradas en la muestra.

Los valores del rango de la variable son 𝑅𝑋 = { }

Definamos los eventos necesarios:

𝐷: = bombilla defectuosa 𝑃(𝐷) =


𝐷 𝑐 : = bombilla no defectuosa 𝑃(𝐷 𝑐 ) =

𝑃(𝑋 = 0) =
𝑃(𝑋 = 1) =
𝑃(𝑋 = 2) =

Finalmente, colocamos los resultados en la tabla de función de probabilidades.

Numero de bombillas defectuosas 0 1 2


f(x) = P(X = x)

b. Si la regla de decisión es rechazar el lote si en la muestra se encuentra más de un artículo


defectuoso. ¿Cuál es la probabilidad de rechazar un lote?

c. En relación con la regla planteada en (b), si el lote es aceptado, ¿cuál es la probabilidad que la
muestra contenga un defectuoso?
UPC MA444 Estadística 131
Esperado de una variable aleatoria discreta

Sea X una variable aleatoria discreta con función de probabilidad f(x). Entonces el valor esperado o
media de X es:

𝜇 = 𝑬(𝑿) = ∑ 𝑥 𝑓(𝑥)
𝑅𝑎𝑛𝑔𝑜 𝑋

Varianza de una variable aleatoria

Sea 𝑋 una variable discreta con función de probabilidad f(x). Entonces, la varianza de X es:

𝜎 2 = 𝑉(𝑋) = 𝐸((𝑋 − 𝜇)2 )

La fórmula abreviada para el cálculo de la varianza es:

𝝈𝟐 = 𝑽(𝑿) = 𝑬(𝑿𝟐 )– [𝑬(𝑿)]𝟐

donde:
𝐸(𝑋 2 ) = ∑ 𝑥 2 𝑓(𝑥)
𝑅𝑎𝑛𝑔𝑜 𝑋

Desviación estándar de una variable aleatoria

La desviación estándar de 𝑿 es la raíz cuadrada positiva de la varianza de 𝑋.

𝜎 = √𝜎 2

Ejemplo 1

El número de fallas de energía eléctrica que afectan a cierta región en cualquier año dado se considera
una variable aleatoria que tiene la siguiente función de probabilidad:

Tabla de distribución de probabilidades

X: El número de
fallas de energía 0 1 2 3
eléctrica
P(X = x) 0,38 0,24 k 0,08

a. Calcule e interprete el valor esperado de 𝑋.


b. Calcule la desviación estándar y el coeficiente de variación de X.
UPC MA444 Estadística 132
Solución

a. Calcule e interprete el valor esperado de 𝑋.

Solución
En primer lugar, hallaremos el valor de k para que la distribución sea función de probabilidad:

𝟎, 𝟑𝟖 + 𝟎, 𝟐𝟒 + 𝒌 + 𝟎, 𝟎𝟖 = 𝟏

Despejando, el valor de 𝒌 = 𝟎, 𝟑.

El valor esperado de 𝑋 se calcula con la siguiente fórmula:

𝜇 = 𝐸(𝑋) = ∑ 𝑥 𝑓(𝑥)
𝑅𝑎𝑛𝑔𝑜 𝑋

Tabla de distribución de probabilidades

X: El número de
fallas de energía 0 1 2 3
eléctrica
P(X = x) 0,38 0,24 0.30 0,08

Reemplazando:

𝜇 = 𝐸(𝑋) = 0 × 0,38 + 1 × 0,24 + 2 × 0,3 + 3 × 0,08 = 𝟏, 𝟎𝟖

Interpretación
Si el experimento se repitiera muchas veces, en promedio el número de fallas de energía eléctrica
que afectan a cierta región en cualquier año dado sería de 1,08.

b. Calcule la desviación estándar y el coeficiente de variación de X.

Solución
Primero, calculamos la varianza y usaremos la fórmula:

𝑉(𝑋) = 𝐸(𝑋2 )– [𝐸(𝑋)]2

Donde:

𝑬(𝑿𝟐 ) = 𝟎𝟐 × 𝟎, 𝟑𝟖 + 𝟏𝟐 × 𝟎, 𝟐𝟒 + 𝟐𝟐 × 𝟎, 𝟑 + 𝟑𝟐 × 𝟎, 𝟎𝟖 = 𝟐, 𝟏𝟔

Reemplazando:

𝑉(𝑋) = 2,16 − 1,082 = 0,9936


Finalmente,
UPC MA444 Estadística 133

la desviación estándar de 𝑿 es:


𝜎 = 𝐷𝑆(𝑋) = √𝑉(𝑋) = √0.9936 = 0.9968

el coeficiente de variación de X es:

𝐷𝑆(𝑋) 0.9968
𝐶𝑉(𝑋) = ∗ 100 = ∗ 100 = 92.30%
𝐸(𝑋) 1.08

Ejemplo 2
Un ingeniero civil del departamento de obras muestra la distribución de probabilidad de la variable
aleatoria 𝑋: = número de habitaciones a construir en edificios residenciales.

x 4 5 7 8 9
f(x) 0,20 0,25 0,10 0,15 0,30

a. Si la gerencia del departamento de obras le impone que construya menos de ocho habitaciones y
suponiendo que se cumple con este requerimiento, ¿cuál es la probabilidad que construya por lo
menos cinco habitaciones?
b. Si el costo de una vivienda, en dólares, está en función del número de habitaciones de acuerdo con
la siguiente ecuación 𝐶(𝑋) = 14000𝑋 + 5000. Indique la media del costo de una vivienda.

Solución

a. Si la gerencia del departamento de obras le impone que construya menos de ocho habitaciones y
suponiendo que se cumple con este requerimiento, ¿cuál es la probabilidad que construya por lo
menos cinco habitaciones?

Solución

Se trata de una probabilidad condicional. Aplicando la fórmula se tiene que:

𝑃((5 ≥ 𝑋) ∩ (𝑋 < 8)) 𝑃(5 ≤ 𝑋 < 8) 𝑓(5) + 𝑓(7)


𝑃(𝑋 ≥ 5⁄𝑋 < 8) = = =
𝑃(𝑋 < 8) 𝑃(𝑋 < 8) 𝑓(4) + 𝑓(5) + 𝑓(7)

0,25 + 0,10 0,35


= = = 0,6364
0,20 + 0,25 + 0,10 0,55

b. ¿Cuánto esperaría pagar un cliente por una vivienda?

Solución

Usando la fórmula se tiene que:

𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑓(𝑥) = 4 × 0,20 + 5 × 0,25 + 7 × 0,10 + 8 × 0,15 + 9 × 0,30


𝑥=4
UPC MA444 Estadística 134

𝐸(𝑋) = 6,65 habitaciones

El valor esperado o media del costo será:

𝐸(𝐶(𝑋)) = 𝐸(14000𝑋 + 5000) = 14000 𝐸(𝑋) + 5000

Por lo tanto, la media del costo de una vivienda es de 89100 dólares.


UPC MA444 Estadística 135
Ejercicios propuestos

36.Según el departamento de control de calidad de la empresa Construye S.A., el número de fallas


superficiales en la elaboración de cables de luz en su presentación de rollos de 20 metros
corresponde a una variable aleatoria X, la misma que presenta la siguiente función de probabilidad:

Número de fallas superficiales 0 1 2 3 4


Probabilidad a 0,27 0,16 b 0,01

Si el valor esperado de X es 1,71 fallas por cable, ¿cuál es la probabilidad de que un cable presente
a lo más dos fallas?

37.Según el departamento de control de calidad de una empresa fabricante de tornillos, el número de


fallas superficiales en los tornillos corresponde a una variable aleatoria 𝑋 con 𝐸(𝑋) = 0,88 por
tornillo. Además, se sabe que la función de probabilidad está dada por:

x 0 1 2 3 4
f(x) a 0,37 0,16 b 0,01

a. Calcule la probabilidad de que un tornillo presente al menos dos fallas.


b. Calcule la varianza y el coeficiente de variación de X.

38.Una librería necesita hacer el pedido semanal de una revista especializada de ingeniería. Por
registros históricos, se sabe que las frecuencias relativas de vender una cantidad de ejemplares es
la siguiente:

Demanda de ejemplares 1 2 3 4 5 6
Frecuencia relativa 1/15 2/15 3/15 4/15 3/15 2/15

Calcule la media y varianza de la demanda de ejemplares.

39.En un almacén de aparatos electrónicos se almacenan 10 tostadoras para su distribución, cuatro de


la marca A y el resto de las marcas menos conocidas. Si un empleado selecciona al azar cinco
tostadoras para llevarlas por encargo a una tienda para su comercialización, calcular la probabilidad
de que en las cinco tostadoras seleccionadas:

a. Calcule la probabilidad de que en las cinco tostadoras seleccionadas existan exactamente dos
de la marca A.
b. Calcule la probabilidad de que en las cinco tostadoras seleccionadas, a lo sumo, haya una
tostadora de las marcas menos conocidas.
UPC MA444 Estadística 136
Distribuciones discretas especiales

Distribución Binomial
El experimento consiste en 𝑛 pruebas idénticas de Bernoulli. Cada prueba tiene únicamente dos
resultados: éxito o fracaso. 𝑃(é𝑥𝑖𝑡𝑜) = 𝑝 y 𝑃(𝑓𝑟𝑎𝑐𝑎𝑠𝑜) = 1 − 𝑝 se mantiene constante a lo largo de
todas las pruebas.

Las pruebas son independientes.

La probabilidad del evento considerado como éxito es constante en cada prueba y se denota por 𝑝.

La variable aleatoria binomial se define como:

𝑋: = número de éxitos que ocurren en los 𝑛 ensayos o pruebas

La función de probabilidad de 𝑋 es:

𝑓(𝑥) = 𝑷(𝑿 = 𝒙) = 𝑪𝒏𝒙 𝒑𝒙 (𝟏 − 𝒑)𝒏−𝒙 , 𝑥 = 0,1, 2, . . . , 𝑛

donde:

𝑛: = número de ensayos o pruebas


𝒑: = probabilidad de éxito en cada ensayo
1 – 𝑝: = probabilidad de fracaso

EJEMPLO:

𝑿: = Número de artículos defectuosos


p = 0.03

OTRO EJEMPLO:

𝑿: = Número de artículos NO defectuosos


p = 0.97

Notación
Si la variable aleatoria 𝑋 sigue una distribución binomial con parámetros 𝒏 y 𝒑 se denota 𝑋~𝐵(𝑛, 𝑝).

Media
 = 𝐸(𝑋) = 𝑛𝑝

Varianza
2 = 𝑉(𝑋) = 𝑛𝑝(1 − 𝑝)

Para el cálculo de probabilidades de una distribución binomial en Excel se usa la función:


=DISTR.BINOM.N(𝑥; 𝑛 = número de repeticiones; 𝑝 = probabilidad de éxito; acumulado = 1).
UPC MA444 Estadística 137
Ejemplo 1

La probabilidad de que el comprador de un osciloscopio haga uso del servicio dentro del plazo de
garantía es 0,20. Para los cinco osciloscopios que cierta empresa ha vendido independientemente a
cinco compradores este mes.

a. ¿Cuál es la probabilidad de que exactamente tres compradores hagan uso de la garantía?


b. ¿Cuál es la probabilidad que máximo un comprador haga uso de la garantía?
c. ¿Cuál es la probabilidad de que tres o más compradores hagan uso de la garantía?

Solución

𝑋: = número de compradores de osciloscopios que hagan uso de la garantía

𝑋~𝐵(𝑛 = 5, 𝑝 = 0,20)

El rango de 𝑋 es 0, 1, 2, …, 5

La función de probabilidad 𝑓(𝑥) es:

𝑓(𝑥) = 𝑷(𝑿 = 𝒙) = 𝑪𝒏𝒙 𝒑𝒙 (𝟏 − 𝒑)𝒏−𝒙 , 𝑥 = 0,1, 2, . . . , 𝑛

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝐶𝑥5 0,20𝑥 (1 − 0,20)5−𝑥 ,

RANGO: X = 0, 1, 2,3, 4, 5

a. ¿Cuál es la probabilidad de que exactamente tres compradores hagan uso de la garantía?

Solución

La probabilidad pedida es:

𝑃(𝑋 = 𝑥) = 𝐶𝑥5 0,20𝑥 (1 − 0,20)5−𝑥 , FUNCION

𝑃(𝑋 = 3) = 𝐶35 0,203 (1 − 0,20)2 = 𝟎, 𝟎𝟓𝟏𝟐

CON EXCEL:

=DISTR.BINOM.N(3,5,0.2,FALSO)

𝑃(𝑋 = 3) = 0.0512

=DISTR.BINOM.N
UPC MA444 Estadística 138

b. ¿Cuál es la probabilidad que máximo un comprador haga uso de la garantía?

Solución

La probabilidad pedida es:

𝑃(𝑋 ≤ 1) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1)

𝑃(𝑋 ≤ 1) = 𝐶05 0,200 (1 − 0,20)5 + 𝐶15 0,201 (1 − 0,20)4 = 0,73728

CON EXCEL:

=DISTR.BINOM.N(1,5,0.2,VERDADERO)

𝑃(𝑋 ≤ 1) = 0.73728

c. ¿Cuál es la probabilidad de que tres o más compradores hagan uso de la garantía?

Solución

La probabilidad pedida es:

𝑷(𝑿 ≥ 𝟑) = 1 − 𝑃(𝑋 < 3)

𝑷(𝑿 ≥ 𝟑) = 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)]

𝑷(𝑿 ≥ 𝟑) = 1 − [𝐶05 0,200 (1 − 0,20)5 + 𝐶15 0,21 (1 − 0,2)4 + 𝐶25 0,22 (1 − 0,2)3 ]

𝑃(𝑋 ≥ 3) = 1 − 0,94208 = 0,05792

CON EXCEL:

=DISTR.BINOM.N(1,5,0.2,VERDADERO)

𝑷(𝑿 ≥ 𝟑) = 1 − 𝑃(𝑋 < 3) = 1 – 0.94208 = 0.05792

P(X<3) =P(X<=2)

=DISTR.BINOM.N(2,5,0.2,VERDADERO)
UPC MA444 Estadística 139

Ejemplo 2

El supervisor de una obra ha determinado que un proveedor entrega los pedidos a tiempo alrededor
del 94% de las veces. Para su última obra, el supervisor seleccionó una muestra de 12 pedidos.

a. Calcule la probabilidad de que el proveedor entregue 11 pedidos a tiempo.


b. Calcule el valor esperado del número de pedidos entregados a tiempo.

Sea 𝑋: = número de pedidos entregados a tiempo en una muestra de 12 pedidos

𝑋~𝐵(𝑛 = 12, 𝑝 = 0,94)

El rango de 𝑋 es 0, 1, 2, …, 12

La función de probabilidad 𝑓(𝑥) es:

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝐶𝑥12 0,94𝑥 (1 − 0,94)12−𝑥 𝑥 = 0, 1, 2, . . . ,12

a. Calcule la probabilidad de que el proveedor entregue 11 pedidos a tiempo.

Solución

La probabilidad pedida es:

12
𝑃(𝑋 = 11) = 𝐶11 0,9411 (1 − 0,94)1 = 0,3645

c. Calcule el valor esperado del número de pedidos entregados a tiempo.

Solución

El valor esperado es:

𝐸(𝑋) = 𝑛𝑝 = 11,28
UPC MA444 Estadística 140
Ejemplo 3

En un proceso de fabricación se produce unidades precoladas con un 1% de unidades defectuosas.


Todos los días se someten a prueba 10 unidades seleccionadas al azar de la producción diaria. Si existen
fallas en una o más de estas unidades se detiene el proceso de producción.

La variable aleatoria 𝑋 se define 𝑋: =

𝑋~

El rango de 𝑋 es 0, 1, 2, …,

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝐶𝑥𝑛 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 𝑥 = 0, 1, 2, . . . , 𝑛

a. ¿Cuál es la probabilidad de encontrar dos unidades defectuosas?

b. ¿Cuál es la probabilidad de encontrar al menos dos unidades defectuosas?

c. ¿Cuál es la probabilidad de detener el proceso?

d. Calcule el valor esperado y el coeficiente de variabilidad del número de unidades no defectuosas.


UPC MA444 Estadística 141
Ejercicios propuestos

40.Un cierto sistema mecánico contiene componentes y se han seleccionado al azar 10. Suponga que
la probabilidad de que cualquier componente individual falle es de 0,07 y que los componentes
fallan independientes unos de otros.

a. Calcule la probabilidad de que falle al menos uno de los componentes.


b. Calcule la probabilidad de que fallen exactamente dos componentes.
c. Calcule la probabilidad de que fallen entre dos y cinco componentes.
d. Obtenga los valores de 𝐸(𝑋) y 𝑉(𝑋).
UPC MA444 Estadística 142
Caso: Ferrosa

Ferrosa es una empresa dedica a la venta al por mayor y menor


de artículos de ferretería. Actualmente, la gerencia de
comercialización ha detectado determinados problemas que
están afectando las ventas de la empresa, por lo que, encargó a
un grupo de profesionales realizar un estudio para identificar
dichos los problemas. Analizando la información, se
identificaron los siguientes problemas:

Problema 1
En el área de ventas de la empresa se han detectado reclamos por parte de los clientes que adquirieron
equipos de protección fallados y que serán devueltos. Si la probabilidad que se devuelvan dos o más
equipos en una semana es mayor a 0,35; se recomendará a la gerencia de comercialización cambiar
de proveedor. A continuación, se muestra la siguiente información:

X: Cantidad de equipos de protección fallados devueltos por


1 2 3 4 5
semana
f(x) = P(X = x) 2k 0,42 k 0,20 0,08

¿Qué decisión deberá tomar el gerente de comercialización?

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para identificar Habilidad para Habilidad para Habilidad de
identificar el la variable(s) y elegir las determinar los analizar, comunicar y
problema a herramientas valores de las entender e sustentar la decisión
resolver estadísticas que usará probabilidades interpretar los final en base a los
para resolver el resultados resultados y el
problema análisis

INTERPRETACION
Determinar si la gerencia de comercialización cambiara de proveedor.

REPRESENTACION

X: Cantidad de equipos de protección fallados devueltos por semana


TECNICA ESTADISTICA: Variable Aleatoria Discreta
UPC MA444 Estadística 143

CALCULO
Tabla de distribución de Probabilidad

X: Cantidad de equipos de protección fallados devueltos por


1 2 3 4 5
semana
f(x) = P(X = x) 0.2 0,42 0.1 0,20 0,08

2K+0.42+K+0.20+0.08 = 1

K = 0.1

P(X>=2) = 1- P(X < 2) = 1 – [ P(X=1)] = 1 – 0.20 = 0.80

ANALISIS

P(X>=2) = 0.80

La probabilidad que se devuelvan dos o más equipos en una semana es 0.80, se observa que es
superior a 0.35

ARGUMENTACION

Se recomienda la gerencia de comercialización cambiar de proveedor

Problema 2
Debido a la globalización y al desarrollo constante de las comunicaciones, los pedidos por internet se
han incrementado últimamente. Un grupo de profesionales de la empresa ha observado que el 25%
de sus clientes realiza sus compras por Internet. Si se eligen al azar 10 clientes y SI se obtiene que la
probabilidad de que más de tres de ellos realizaron sus compras por Internet supera el 0,2, entonces
se recomendará a la gerencia implementar la promoción de envió de pedidos a domicilio sin ningún
costo.

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para Habilidad para Habilidad para Habilidad de comunicar
identificar el identificar la variable(s) determinar los analizar, y sustentar la decisión
problema a y elegir las herramientas valores de las entender e final en base a los
resolver estadísticas que usará probabilidades interpretar los resultados y el análisis
para resolver el resultados
problema
UPC MA444 Estadística 144

INTERPRETACION
Determinar si la gerencia debe implementar la promoción de envió de pedidos a domicilio sin ningún
costo.
.
REPRESENTACION

X: Cantidad de clientes que realizan sus compras por Internet


TECNICA ESTADISTICA: Distribución Binomial

CALCULO

Sea 𝑋: = cantidad de clientes que realizan sus compras por internet en una muestra de 10 clientes

𝑋~𝐵(𝑛 = 10, 𝑝 = 0,25)

El rango de 𝑋 es 0, 1, 2, …, 10

La función de probabilidad 𝑓(𝑥) es:

𝑃(𝑋 = 𝑥) = 𝐶𝑥10 0,25𝑥 (1 − 0,25)10−𝑥 𝑥 = 0, 1, 2, . . . ,10

P(X > 3) = 1 - P(X <= 3) = 1 – [ P(X=0)+ P(X=1)+ P(X=2)+ P(X=3)] = 1 – 0.77588 = 0.22412

P(X <= 3) = 0.77588

ANALISIS

P(X> 3) = 0.22412

La probabilidad de que más de tres de clientes realizaron sus compras por Internet es 0.22412, se
observa que es superior a 0.20

ARGUMENTACION

Se recomienda que la gerencia debe implementar la promoción de envió de pedidos a domicilio sin
ningún costo.
UPC MA444 Estadística 145

Distribución Poisson
El experimento consiste en realizar el conteo del número X de veces que ocurre un evento en particular
durante una unidad de tiempo, área, volumen, peso, distancia o cualquier otra unidad de medida dada.

La probabilidad de que un evento ocurra en una unidad dada de tiempo, área, etc.; es la misma para
todas las unidades.

El número de eventos que ocurren en una unidad de tiempo, área, volumen es independiente del
número de los que ocurren en otras unidades.

La variable aleatoria Poisson se define como:

𝑋: = número de veces que ocurre un evento durante un intervalo definido

La función de probabilidad 𝑓(𝑥) de 𝑋 es:

𝑒 −𝜇 𝜇 𝑥
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 = 0, 1, 2, 3, …
𝑥!

donde:

𝑒: = base del sistema de logaritmos neperianos

: = razón promedio de ocurrencia

𝒕: = periodo de evaluación

Notación
La variable aleatoria X sigue una distribución Poisson con parámetro 𝜇 y se denota por 𝑿~𝑷(𝝁), donde
𝝁 = 𝒕

Media
𝜇 = 𝐸(𝑋) = 𝜆𝑡

Varianza
𝜎 2 = 𝑉(𝑋) = 𝜆𝑡 = 𝜇

Para el cálculo de probabilidades de una distribución Poisson en Excel se usa la función:

=POISSON.DIST(x; media = lambda; acumulado = 0).


UPC MA444 Estadística 146
Ejemplo 3
En la inspección del pavimento y asfalto de una carretera recién construida se ha detectado que hay,
en promedio 1,25 baches o fisuras cada cuatro kilómetros. Asumiendo una distribución de Poisson,
determine:

a. La probabilidad de que en el siguiente kilómetro se encuentre dos baches o fisuras.

Solución

Sea 𝑿𝟏: = número de baches o fisuras en cada kilómetro

Calculemos la media 𝜇 = 𝑡.

 = 1,25 𝑏𝑎𝑐ℎ𝑒𝑠 𝑐𝑎𝑑𝑎 4 𝑘𝑚

1.25 𝑏𝑎𝑐ℎ𝑒𝑠 𝑏𝑎𝑐ℎ𝑒𝑠


 = = 0.3125
4 𝑘𝑚 𝑘𝑚

𝑡 = 1 𝑘𝑚

Por lo tanto,

PARAMETRO:

1,25 𝑏𝑎𝑐ℎ𝑒𝑠
𝜇 = 𝑡 = × 1 𝑘𝑚 = 0,3125 𝑏𝑎𝑐ℎ𝑒𝑠
4 𝑘𝑚

𝑿~𝑷(𝝁 = 𝟎, 𝟑𝟏𝟐𝟓)

La función de distribución de la variable Poisson es:

𝑒 −0,3125 0,3125𝑥
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 = 0, 1, 2, 3, …𝐼𝑁𝐹𝐼𝑁𝐼𝑇𝑂
𝑥!

La probabilidad pedida es:


𝑒 −0,3125 0,31252
𝑃(𝑋 = 2) = = 0,03572
2!

=POISSON.DIST(2,0.3125,FALSO)
UPC MA444 Estadística 147

b. La probabilidad de que en los siguientes dos kilómetros se encuentre a lo más tres baches o
fisuras.

Solución

Sea 𝑌: = número de baches o fisuras en cada dos kilómetros

Calculemos la media 𝜇 = 𝑡.

1.25 𝑏𝑎𝑐ℎ𝑒𝑠 𝑏𝑎𝑐ℎ𝑒𝑠


 = = 0.3125
4 𝑘𝑚 𝑘𝑚

𝒕 = 𝟐 𝒌𝒎

Por lo tanto,
1,25 𝑏𝑎𝑐ℎ𝑒𝑠
𝜇 = 𝑡 = × 2 𝑘𝑚 = 0,625
4 𝑘𝑚

𝑌~𝑃(𝜇 = 0,625)

La función de distribución de la variable Poisson es:

𝑒 −0,625 0,625𝑦
𝑃(𝑌 = 𝑦) = 𝑦 = 0, 1, 2, 3, … 𝐼𝑁𝐹𝐼𝑁𝐼𝑇𝑂
𝑦!

La probabilidad pedida es:

𝑃(𝑋 ≤ 3) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3)

= 𝑓(0) + 𝑓(1) + 𝑓(2) + 𝑓(3)

𝑒 −0,3125 0,31250 𝑒 −0,3125 0,31251 𝑒 −0,3125 0,31252 𝑒 −0,3125 0,31253


= + +
0! 1! 2! 3!

= 0,5353 + 0,3345 + 0,1045 + 0,0218 = 0,9961

=POISSON.DIST(2,0.3125,FALSO)

c. El costo de reparación de estos defectos es de 35 dólares por cada bache o fisura detectada.
Calcule el costo esperado al inspeccionar 80 km de esta carretera.

Solución

Sea 𝑊: = número de baches o fisuras en 80 kilómetros


UPC MA444 Estadística 148
Calculemos la media 𝜇 = 𝑡.

 = 1,25 𝑏𝑎𝑐ℎ𝑒𝑠 𝑐𝑎𝑑𝑎 4 𝑘𝑚

𝑡 = 80 𝑘𝑚

Por lo tanto,
1,25 𝑏𝑎𝑐ℎ𝑒𝑠
𝜇 = 𝑡 = × 80 𝑘𝑚 = 25
4 𝑘𝑚

𝑊~𝑃(𝜇 = 25)

Definamos la variable costo 𝐶(𝑋).

𝐶(𝑋) = 35𝑋

Calculemos el esperado de la variable costo 𝐶(𝑋).

𝐸(𝐶(𝑋)) = 𝐸(35𝑋) = 35𝐸(𝑋) = 35 × 25 = 875

Luego, el costo esperado al inspeccionar 80 km de esta carretera es 875 dólares.

Ejemplo 3
En un estudio del tránsito en cierta intersección, se determinó que el número de automóviles que
llegan a un óvalo tiene distribución de Poisson con media igual a tres automóviles por segundo.

a. Calcule la probabilidad de que en dos segundos lleguen al óvalo exactamente dos automóviles.
b. Calcule la probabilidad de que en dos segundos lleguen al óvalo menos de tres automóviles.
c. Calcule la probabilidad de que en los siguientes tres segundos lleguen al óvalo por lo menos dos
automóviles.

Solución

a. Calcule la probabilidad de que en dos segundos lleguen al óvalo exactamente dos automóviles.

Solución

Sea 𝑋: = número de automóviles que llegan a un óvalo en dos segundos

Calculemos la media 𝜇 = 𝑡.

 = 3 𝑎𝑢𝑡𝑜𝑠 𝑐𝑎𝑑𝑎 𝑠𝑒𝑔𝑢𝑛𝑑𝑜

𝑡 = 2 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠

Por lo tanto:
UPC MA444 Estadística 149
3 𝑎𝑢𝑡𝑜𝑠
𝜇 = 𝑡 = × 2 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 = 6
1 𝑠𝑒𝑔𝑢𝑛𝑑𝑜

𝑋~𝑃(𝜇 = 6)

La probabilidad pedida es:

62 × 𝑒 −6
𝑃(𝑋 = 2) = = 0,0446
2!

b. Calcule la probabilidad de que en dos segundos lleguen al ovalo menos de tres automóviles.

Solución

La probabilidad pedida es:

𝑃(𝑋 < 3) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) = 𝑓(0) + 𝑓(1) + 𝑓(2)

60 𝑒 −6 61 𝑒 −6 62 𝑒 −6
𝑃(𝑋 < 3) = + +
0! 1! 2!

𝑃(𝑋 < 3) = 0,0620

c. Calcule la probabilidad de que en los siguientes tres segundos lleguen al óvalo por lo menos dos
automóviles.

Solución

Sea 𝑌: = número de automóviles que llegan a un óvalo en tres segundos

Calculemos la media 𝜇 = 𝑡.

 = 3 𝑎𝑢𝑡𝑜𝑠 𝑐𝑎𝑑𝑎 𝑠𝑒𝑔𝑢𝑛𝑑𝑜

𝑡 = 3 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠

Por lo tanto,
3 𝑎𝑢𝑡𝑜𝑠
𝜇 = 𝑡 = × 3 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 = 9
1 𝑠𝑒𝑔𝑢𝑛𝑑𝑜

𝑋~𝑃(𝜇 = 9)

La probabilidad pedida es:

𝑃(𝑌 ≥ 2) = 1 − 𝑃(𝑌 < 2) = 1 − [𝑃(𝑌 = 0) + 𝑃(𝑌 = 1)]

90 × 𝑒 −9 91 × 𝑒 −9
𝑃(𝑌 ≥ 2) = 1 − ( + )
0! 1!
UPC MA444 Estadística 150
𝑃(𝑌 ≥ 2) = 1 − 0,00123 = 0,9988

Ejemplo 4

Con la finalidad de diseñar un nuevo sistema de control de tráfico, un ingeniero recoge información
sobre el número de automóviles que llegan a una intersección. Por histórico, se sabe que en promedio
llegan cuatro autos a la intersección cada minuto según un proceso de Poisson.

a. ¿Qué probabilidad hay de que en 30 segundos lleguen tres autos?


b. ¿Qué probabilidad hay de que entre las 5:25 pm y 5:28 pm lleguen más de dos autos?
c. Si en un minuto llegaron más de tres autos, ¿cuál es la probabilidad que como máximo sean
cinco los autos que llegaron en ese minuto?

Solución

La variable aleatoria 𝑋 se define 𝑋: =

𝑋~
El rango de 𝑋 es

La función de probabilidad 𝑓(𝑥) es:

a. ¿Qué probabilidad hay de que en 30 segundos lleguen tres autos?

b. ¿Qué probabilidad hay de que entre las 5:25 pm y 5:28 pm lleguen más de dos autos?

c. Si en un minuto llegaron más de tres autos, ¿cuál es la probabilidad que como máximo sean cinco
los autos que llegaron en ese minuto?
UPC MA444 Estadística 151

Ejemplo 5
Cierto tipo de azulejo puede tener un número X de puntos defectuosos con media de tres puntos
defectuosos por azulejo. Calcule la probabilidad de que se presenten cinco defectos en un azulejo
elegido al azar.

La variable aleatoria 𝑋 se define como 𝑋: =

𝑋~
El rango de 𝑋 es

La función de probabilidad 𝑓(𝑥) es:


UPC MA444 Estadística 152
Ejercicios propuestos

41.Debido al calentamiento global, es muy común la presencia de caracoles en las represas debido a
sus aguas estancadas, lo cual hace que se produzcan enfermedades nocivas para el hombre y su
entorno. El número de caracoles presentes en las aguas estancadas sigue una distribución Poisson
con un promedio de 16 caracoles por cinco m3 de agua.

La OMS establece que si la probabilidad de que haya más de un caracol presente en un m3 de agua
estancada es mayor a 0,75 se deberá comprar un filtro especial como norma sanitaria. ¿Se llegará
a realizar la compra de dicho filtro?

42.En un estudio del tránsito en cierta intersección, se determinó que el número de automóviles que
llegan a un óvalo tiene distribución de Poisson con media igual a cinco automóviles por segundo.

a. Calcule la probabilidad de que en un segundo lleguen al óvalo más de dos automóviles.


b. Calcule la probabilidad de que en los siguientes diez segundos lleguen al óvalo 40 automóviles.
c. Suponga que el 90% de vehículos que llegan diariamente al óvalo mencionado son de
transporte privado. Para los siguientes cinco días, calcule la probabilidad de que lleguen al
óvalo por lo menos tres vehículos de transporte privado.
UPC MA444 Estadística 153
Caso: Ferrosa

Ferrosa es una empresa dedica a la venta al por mayor y


menor de artículos de ferretería. Actualmente, la
gerencia de comercialización ha detectado algunos
problemas que están afectando las ventas de la empresa.
Los clientes manifiestan que el tiempo que esperan para
pagar los productos es demasiado y algunos optan por
retirase y dirigirse a la competencia, ocasionando
pérdidas significativas para la empresa.

El grupo encargado de la investigación ha revisado la información histórica y determinó que en


promedio llegan a la ferretería 30 clientes cada hora según un proceso de Poisson. La gerencia de
comercialización establece que; si la probabilidad de que lleguen a la ferretería por lo menos tres
clientes en un lapso de cinco minutos es mayor a 0,30; tomará la decisión de ampliar el número de
ventanillas para el pago de productos.

¿La gerencia deberá ampliar el número de ventanillas para el pago de productos?

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para Habilidad para Habilidad para Habilidad de
identificar el identificar la variable(s) determinar los analizar, comunicar y
problema a y elegir las valores de las entender e sustentar la decisión
resolver herramientas probabilidades interpretar los final en base a los
estadísticas que usará resultados resultados y el
para resolver el análisis
problema
UPC MA444 Estadística 154
Variables aleatorias continuas
Función de densidad de una variable continua
Se denomina función de densidad 𝑓(𝑥) de una variable aleatoria continua X a la función f(x) integrable
que satisface:

Condición 1
𝑓(𝑥) ≥ 0

Condición 2
+∞

∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞

Cálculo de una probabilidad usando la función de densidad

𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎
Para variables continuas se cumple:

𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 < 𝑏)

� (� )

� (� ≤ � ≤ � )

� �

Ejemplo 1
Sea 𝑘 una constante y consideremos la función de densidad de la vida útil, en años, de cierto tipo de
computadora.

X: tiempo de vida útil de cierto tipo de computadora (años)

𝒌𝑥 0≤𝑥≤2
𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Obtenga el valor de 𝑘, para que 𝑓(𝑥) sea función de densidad.


b. Calcule 𝑷(𝟎, 𝟓 < 𝑿 < 𝟏, 𝟖).
c. Calcule 𝑃(𝑋 > 1).
UPC MA444 Estadística 155
Solución

a. Obtenga el valor de 𝑘, para que 𝑓(𝑥) sea función de densidad.

Solución

Para que 𝑓(𝑥) sea función de densidad debe satisfacer las siguientes condiciones:

Condición 1
𝑓(𝑥) ≥ 0

Para el tramo 0 ≤ 𝑥 ≤ 2
𝑘𝑥 ≥0
Por tanto, 𝑘 debe ser positivo.

Condición 2
+∞

∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞

La función tiene el valor 0, fuera del tramo 0 ≤ 𝑥 ≤ 2; por lo tanto:

∫ 𝑘𝑥 𝑑𝑥 = 1
0
Integrando:
2
𝑥2
𝑘 ( )|
2 0
Evaluando en 0 y 2. se tiene:
22 02
𝑘( − )=1
2 2

1
𝑘=
2
Reemplazando tenemos:

1
𝑓(𝑥) = {2 𝑥 0≤𝑥≤2
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

b. Calcule 𝑃(0,5 < 𝑋 < 1,8).

Solución
La probabilidad pedida es:
1,8
1
𝑃(𝟎, 𝟓 < 𝑿 < 𝟏. 𝟖) = ∫ 𝑥 𝑑𝑥 = 0,7475
2
0,5
UPC MA444 Estadística 156
c. Calcule 𝑃(𝑋 > 1).

Solución
La probabilidad pedida es:
2
1
𝑃(𝑋 > 1) = ∫ 𝑥 𝑑𝑥 = 0,75
2
1
Ejemplo 2

El peso, en onzas, de un artículo de gasfitería usado en hogares y oficinas es una variable aleatoria 𝑋
con función densidad:

𝑘(𝑥 − 8) 8 ≤ 𝑥 ≤ 10
𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Obtenga el valor de 𝑘, para que 𝑓(𝑥) sea una función de densidad.

10

∫ 𝑘(𝑥 − 8) 𝑑𝑥 = 1
8
Integrando:

10
𝑥2
𝑘[ ( )| - 8(𝑥)|10
8 ]
2 8

Evaluando en 8 y 10. se tiene:


102 82
𝑘 [( − ) − 8(10 − 8)] = 1
2 2
𝑘 [18 − 16] = 1
𝑘∗2=1

1
𝑘=
2

1
𝑓(𝑥) = {2 (𝑥 − 8) 8 ≤ 𝑥 ≤ 10
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
UPC MA444 Estadística 157

b. Calcule la probabilidad que un artículo pese más de nueve onzas.

Calcule 𝑃(𝑋 > 9)

10 1
𝑃(𝑋 > 9) = ∫9 (𝑥 − 8) 𝑑𝑥 =0.75
2

c. Los artículos con un peso menor a 8,5 onzas son separados. Calcule la probabilidad que un artículo,
seleccionado al azar, sea separado.

Calcule 𝑃(𝑆𝐸𝑃𝐴𝑅𝐴𝐷𝑂) = 𝑃(𝑋 < 8.5)

8.5 1
𝑃(𝑋 < 8.5) = ∫8 (𝑥 − 8) 𝑑𝑥 =0.0625
2
UPC MA444 Estadística 158
Ejercicios propuestos

43.El gerente de la empresa le informa al departamento de control de calidad que uno de los
principales clientes de la empresa ha exigido que las bombillas LED tengan como mínimo un tiempo
de encendido continuo de 2100 horas. La distribución de densidad del tiempo de encendido
continúo (en miles de horas) que obtuvo la empresa es la siguiente:

𝑘(17 − 𝑥) 1,8 ≤ 𝑥 ≤ 2,2


𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. ¿Cuál es la probabilidad de que el departamento de control de calidad pueda cumplir con la


exigencia del cliente?
b. ¿Cuál es la probabilidad de que el tiempo de encendido sea superior a 2000 horas?
UPC MA444 Estadística 159
Función de distribución acumulada
La función de distribución acumulativa 𝐹(𝑥) para una variable aleatoria continua 𝑋 se define:

𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡
−∞

Si 𝐹(𝑥) es la función de distribución acumulativa para una variable aleatoria continua 𝑋, entonces la
función de densidad 𝑓(𝑥) para 𝑋 es:

𝑑𝐹(𝑥)
𝑓(𝑥) =
𝑑𝑥

Propiedades de la función de distribución acumulada

Se cumple que:
𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝐹(𝑏) − 𝐹(𝑎)

� (� )

� (� ≤ � ≤ � )

� �

Para variables continuas se cumple:

𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 < 𝑏)

Ejemplo 1
El tiempo, en minutos, que un tren se retrasa es una variable aleatoria continua X con la siguiente
función de densidad:

3 2
𝑓(𝑥) = {250 (25 − 𝑥 ) 0≤𝑥≤5
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Determine la función acumulada 𝐹(𝑋).


b. Calcule 𝑃(𝑋 > 2) haciendo uso de la función acumulada.
c. Calcule 𝑃(1,5 < 𝑋 < 3,5) haciendo uso de la función acumulada.

Solución
UPC MA444 Estadística 160
a. Determine la función acumulada 𝐹(𝑋).

Solución
Para hallar la función acumulada emplearemos la definición de la función de distribución
acumulada 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥).

Para el tramo 0 ≤ 𝑥 < 5, se tiene:

𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡
−∞

Para el tramo descrito se tiene que:


𝑥
3
𝐹(𝑥) = ∫ (25 − 𝑡 2 )𝑑𝑡
0 250

𝑥
3 𝑡3
= (25𝑡 − )|
250 3 0

75𝑥 − 𝑥 3
𝐹(𝑥) =
250

Finalmente, la función de distribución acumulada se representa de la siguiente manera:

0 𝑥<0
75𝑥 − 𝑥 3
𝐹(𝑥) = { 0≤𝑥<5
250
1 𝑥≥5

b. Calcule 𝑃(𝑋 > 2) haciendo uso de la función acumulada.

Solución
La probabilidad pedida es:

5
3
𝑃(𝑋 > 2) = ∫ (25 − 𝑥 2 )𝑑𝑥
2 250

𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2)

Usando la definición de función de distribución acumulada.

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥)

𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − 𝐹(2)


UPC MA444 Estadística 161

75𝑥− 𝑥 3
Reemplazando el valor 𝑋 = 2 en 𝐹(𝑥) = .
250

75×2−23
𝐹(2) = =0.568
250

𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − 𝐹(2) = 1 − 0.568 = 0.432

c. Usando la función acumulada, calcule 𝑃(1,5 < 𝑋 < 3,5).

Solución
La probabilidad pedida es:

𝑃(1,5 < 𝑋 < 3,5) = 𝑃(𝑋 < 3,5) − 𝑃(𝑋 < 1,5) = 𝐹(3,5) − 𝐹(1,5)

75 × 3,5 − 3,53 75 × 1,5 − 1,53


𝑃(1,5 < 𝑋 < 3,5) = − = 0,442
250 250

Ejemplo 2
Los sondeos de mercado realizados por un fabricante sobre la demanda de un producto indican que la
demanda proyectada debe considerarse una variable aleatoria X con valores entre 0 y 25 toneladas.
La función de densidad de X está dada por:
3 2
𝑓(𝑥) = {253 𝑥 0 ≤ 𝑥 ≤ 25
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. Construir la función de distribución acumulada de 𝑋.

𝑥
3 2
𝐹(𝑥) = ∫ 𝑡 𝑑𝑡
0 253

𝑥
3 𝑡3
= 3 ( )|
25 3 0

𝑥3
𝐹(𝑥) =
15625

0 𝑥<0
𝑥3
𝐹(𝑥) = { 0 ≤ 𝑥 ≤ 25
15625
1 𝑥 > 25
UPC MA444 Estadística 162

b. ¿Cuál es la probabilidad de tener una demanda entre 10 y 20 toneladas?


𝑃(10 ≤ 𝑋 ≤ 20) = 𝑃(𝑋 ≤ 20) − 𝑃(𝑋 ≤ 10) = 𝐹(20) − 𝐹(10)

203 103
𝑃(10 ≤ 𝑋 ≤ 20) = − =0.448
15625 15625

c. Calcule la mediana de la variable en estudio e interprete. Use el siguiente esquema para su


representación.

M = Mediana
𝑃(𝑋 ≤ 𝑀) = 0.50
𝐹(𝑀) = 0.50

𝑀3
= 0.50
15625
M = 19.84

Ejercicios propuestos

44.El costo de una reparación de conexión domiciliaria, en soles, es una variable aleatoria cuya función
de distribución acumulada es:

0 𝑥 ≤ 20
𝑥 − 20
𝐹(𝑥) = { 20 < 𝑥 < 30
10
1 𝑥 ≥ 30

Calcule e interprete el valor de la mediana.

45.SAP Ingeniería, es una empresa que desarrolla soluciones específicas y busca ofrecer servicios de
telecomunicaciones, independientemente del tamaño y desempeño del sector o actividad
empresarial. De estudios anteriores se conoce que el tiempo de atención de un servicio, en minutos,
para cada tamaño de empresa, se tiene la función de densidad y la función de distribución
acumulada; respectivamente.

Pequeña empresa
(80 − 𝑥)
𝑓(𝑥) = { 3000 0 < 𝑥 < 100
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Mediana empresa
UPC MA444 Estadística 163
0 𝑥<0
90 𝑥2
𝐹(𝑥) = { 𝑥− 0 ≤ 𝑥 ≤ 120
3600 7200
1 𝑥 > 120

El jefe de producto de telecomunicaciones desea implementar una reingeniería, por lo cual necesita
determinar, para cada tamaño de empresa, la probabilidad de que la atención de un servicio sea
menor a 55 minutos.
UPC MA444 Estadística 164
Esperado de una variable aleatoria continua
Sea 𝑋 una variable aleatoria continua con función de densidad 𝑓(𝑥), entonces el valor esperado de 𝑋
es la siguiente:

+∞

𝜇 = 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥
−∞

Varianza de una variable aleatoria continua

Sea X una variable aleatoria continua con función de densidad 𝑓(𝑥). Entonces, la varianza de 𝑋 es:

𝜎 2 = 𝑉(𝑋) = 𝐸((𝑋 − 𝜇)2 )

La fórmula abreviada para el cálculo de la varianza es:

𝑉(𝑋) = 𝐸(𝑋2 )– [𝐸(𝑋)]2

Donde:

+

𝐸(𝑋 2 ) = ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥
−

Desviación estándar de una variable aleatoria continua


Es la raíz cuadrada positiva de la varianza. La fórmula es la siguiente:

𝜎 = √𝜎 2

Coeficiente de variabilidad
Se define como:

𝜎
𝐶𝑉 = × 100%
𝜇
UPC MA444 Estadística 165

Ejemplo 1
El tiempo de anticipación (valores negativos de 𝑋) o retraso (valores positivos de 𝑋) en minutos, de la
llegada de un tren sobre su tiempo establecido, es una variable aleatoria continua 𝑋 con la siguiente
función de densidad:

3 2
𝑓(𝑥) = {500 (25 − 𝑥 ) −5 < 𝑥 < 5
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Calcule e interprete el valor esperado.


b. Los supervisores de la estación ferroviaria han notado que últimamente los trenes no están
llegando en su hora establecida, para lo cual han fijado como norma que un tren puede llegar en a
lo más ± 0,5𝜎, donde 𝜎 es la desviación estándar. ¿Qué porcentaje de trenes cumplen la norma
fijada?

Solución

a. Calcule e interprete el valor esperado.

Solución

El cálculo del esperado se hace con la siguiente fórmula:

+∞
𝐸(𝑋) = ∫ 𝑥 𝑓(𝑥)𝑥 𝑑𝑥
−∞

Como la función es diferente de cero solo en el tramo [-5 ; 5]

+5
3
𝐸(𝑋) = ∫ 𝑥 (25 − 𝑥 2 ) 𝑑𝑥
−5 500

Reemplazando los valores:

3 252 54 3 252 54
𝐸(𝑋) = ( − )− ( + )=0
500 2 4 500 2 4

El tiempo promedio de anticipación o retraso que tiene el tren sobre su hora establecida es 0
minutos, es decir llega en promedio puntual.
UPC MA444 Estadística 166

b. Los supervisores de la estación ferroviaria han notado que últimamente los trenes no están
llegando en su hora establecida, para lo cual han fijado como norma que un tren puede llegar en
a lo más ± 0,5 𝜎, donde 𝜎 es la desviación estándar. ¿Qué porcentaje de trenes cumplen la norma
fijada?

Solución

Necesitamos el valor de la desviación estándar 𝜎, por lo tanto, calcularemos la varianza de 𝑋; por


lo tanto, necesitamos calcular 𝐸(𝑋2 ) y 𝐸(𝑋).

+5
𝐸(𝑋 2 ) = ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥
−5

+5
3
𝐸(𝑋2 ) = ∫ 𝑥2 (25 − 𝑥 2 )𝑑𝑥
−5 500

+5
3
𝐸(𝑋2 ) = ∫ (25𝑥 2 − 𝑥 4 )𝑑𝑥
500 −5

5
3 𝑥3 𝑥5
𝐸(𝑋2 ) = (25 − )|
500 3 5 −5

3 53 55 3 −53 −55
𝐸(𝑋2 ) = (25 − ) − (25 + )
500 3 5 500 3 5

𝐸(𝑋2 ) = 5

La fórmula abreviada para el cálculo de la varianza es:

𝜎 2 = 𝑉(𝑋) = 𝐸(𝑋2 )– [𝐸(𝑋)]2

Luego, el cálculo de la varianza es:

𝜎 2 = 𝑉(𝑋) = 5 − 02 = 5

Como la desviación estándar 𝜎 es la raíz cuadrada de la varianza, se tiene:

𝜎 = √𝜎 2 = √5 = 2,2361

La probabilidad de que un tren cumpla la norma fijada es:

𝑃(−0,5 𝜎 ≤ 𝑋 ≤ 0,5 𝜎)

Reemplazando:
UPC MA444 Estadística 167
𝑃(−0,5 × 2,236 ≤ 𝑋 ≤ 0,5 × 2,236)

= 𝑃(−1,118 ≤ 𝑋 ≤ 1,118)

1,118
3
= ∫ (25 − 𝑥 2 )𝑑𝑥 = 0,32981
500
−1,118

Por lo tanto, el 32,981% de los trenes cumplen la norma fijada.


UPC MA444 Estadística 168
Ejemplo 2

El peso, en onzas, de un artículo de gasfitería usado en hogares y oficinas es una variable aleatoria X
con función densidad:

𝑘(𝑥 − 8) 8 < 𝑥 ≤ 10
𝑓(𝑥) = {
0 𝑜𝑡𝑟𝑜𝑐𝑎𝑠𝑜

a. Calcule el peso máximo que debe tener un artículo de manera que el 25% de los artículos tengan
pesos menores o iguales a dicho peso.

10

∫ 𝑘(𝑥 − 8) 𝑑𝑥 = 1
8
Integrando:

10
𝑥2
𝑘[ ( )| - 8(𝑥)|10
8 ]
2 8

Evaluando en 8 y 10. se tiene:


102 82
𝑘 [( − ) − 8(10 − 8)] = 1
2 2
𝑘 [18 − 16] = 1
𝑘∗2=1

1
𝑘=
2

1
𝑓(𝑥) = {2 (𝑥 − 8) 8 < 𝑥 ≤ 10
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

b. Calcule el peso máximo que debe tener un artículo de manera que el 25% de los artículos tengan
pesos menores o iguales a dicho peso.

25%

𝐶1
∫8 (𝑥 − 8)𝑑𝑥 =0.25
2
UPC MA444 Estadística 169

𝐶
1 𝑥2
[ ( )| - 8(𝑥)|𝐶8 ] = 0.25
2 2 8

se tiene:
1 𝐶 2 82
[( − ) − 8(𝐶 − 8)] = 0.25
2 2 2

𝐶 2 − 64 − 16𝐶 + 128 = 1

𝐶 2 − 16𝐶 + 64 = 1

(𝐶 − 8)2 = 1

𝐶 − 8 = ±1

𝐶=7

𝐶=9

RPTA C=9

c. Calcule el valor esperado de la variable en estudio. µ

El cálculo del esperado se hace con la siguiente fórmula:

+∞
𝐸(𝑋) = ∫ 𝑥 𝑓(𝑥)𝑥 𝑑𝑥
−∞

Como la función es diferente de cero solo en el tramo [8 ; 10]

10 1
𝜇 = 𝐸(𝑋) = ∫8 𝑥 (𝑥 − 8) 𝑑𝑥 = 9.33
2

Calcule la variación relativa. CV

𝜎
𝐶𝑉 = × 100%
𝜇
UPC MA444 Estadística 170

10 1
𝐸(𝑋2 ) = ∫8 𝑥 2 (𝑥 − 8)𝑑𝑥 =87.33
2

La fórmula abreviada para el cálculo de la varianza es:

𝜎 2 = 𝑉(𝑋) = 𝐸(𝑋2 )– [𝐸(𝑋)]2

Luego, el cálculo de la varianza es:

𝜎 2 = 𝑉(𝑋) = 87.33 − 9.332 = 0.2811

Como la desviación estándar 𝜎 es la raíz cuadrada de la varianza, se tiene:

𝜎 = √𝜎 2 = √0.2811 = 0.5302

0.5302
𝐶𝑉 = × 100% = 5.68%
9.33
UPC MA444 Estadística 171
Ejercicios propuestos

46.Las utilidades netas, en miles de soles, de los propietarios de stands en una galería comercial es una
variable aleatoria con la siguiente función de densidad:

𝑥
0≤𝑥≤4
𝑓(𝑥) = {8
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. ¿Estaría usted en condiciones de afirmar que más de la mitad de los propietarios tiene
utilidades superiores al promedio? Justifique.
b. Calcule la variación relativa de las utilidades.

47.Un estudio realizado por un grupo de ingenieros civiles determinó, que la resistencia a la
compresión en probetas de concreto con materiales propios de una región (en miles de psi), está
determinada por la siguiente función de densidad de probabilidad:

3𝑥 2
0<𝑥<2
20
𝑓(𝑥) = 𝑥
2≤𝑥≤4
10
{ 0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Para un proyecto en particular se requiere que la resistencia a la compresión del concreto sea
de por lo menos 3500 psi, ¿qué tan probable cumpla con el requerimiento?
b. Se desea conocer la resistencia mínima del 15% de los bloques de concreto que tienen mayores
resistencias a la compresión.
UPC MA444 Estadística 172
Caso: Proyectos de generación eléctrica

El grupo brasileño Alupar, a través de su subsidiaria La Virgen


S.A.C. está construyendo en Junín la central hidroeléctrica La
Virgen, con una inversión de 107 millones de soles, la cual
tendrá una potencia de 84 MW. Con esta inversión, la
producción de energía eléctrica podría crecer 5% este año.

El grupo tiene registrado a la fecha un total de 280 proyectos


de generación eléctrica, de los cuales algunos están en
proceso y otros ya culminaron.

Situación: Invertir con el grupo brasileño Alupar en función a las utilidades.

Un inversionista en proyectos de generación eléctrica desea invertir en nuevos proyectos con el grupo
brasileño Alupar, pues se siente atraído por los resultados de las utilidades generadas por éste en los
proyectos culminados.

Para decidir en qué región invertir, el grupo brasileño le muestra al inversionista la función de
densidad y la función de distribución acumulada de la utilidad, en millones de soles, generada por los
proyectos culminados en las regiones costa y sierra.

Las funciones se muestran a continuación:

Función de densidad de la utilidad generada por los proyectos culminados en la región costa

𝑘(𝑥 − 5) 2 ≤ 𝑥 ≤ 18
𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Función de distribución acumulada de la utilidad generada por los proyectos culminados en la


región sierra

0 𝑥<7
2 𝑥2 7
𝐹(𝑥) = { ( − 4𝑥 + ) 7 ≤ 𝑥 ≤ 20
247 2 2
1 𝑥 > 20

La decisión de inversión se basará en aquella región (costa o sierra) que tenga mayor probabilidad
de obtener utilidades superiores a 15 millones de soles en proyectos culminados, ¿en qué región
deberá invertirse?
UPC MA444 Estadística 173
COSTA:
18
1
𝑃(𝑋 > 15) = ∫ (𝑥 − 5)𝑑𝑥 = 0.4313
15 80

𝑘(𝑥 − 5) 2 ≤ 𝑥 ≤ 18
𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

18

∫ 𝑘(𝑥 − 5) 𝑑𝑥 = 1
2
Integrando:

18
𝑥2
𝑘[ ( )| - 5(𝑥)|18
2 ]
2 2

Evaluando en 8 y 10. se tiene:


182 22
𝑘 [( − ) − 5(18 − 2)] = 1
2 2
𝑘 [160 − 80] = 1
𝑘 ∗ 80 = 1

1
𝑘=
80

1
𝑓(𝑥) = {80 (𝑥 − 5) 2 ≤ 𝑥 ≤ 18
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

SIERRA:

𝑃(𝑋 > 15) = 1 − 𝑃(𝑋 ≤ 15)

𝑃(𝑋 > 15) = 1 − 𝐹(15) = 1 − 0.4534 = 0.5466

2 152 7
𝐹(15) = ( − 4(15) + ) = 0.4534
247 2 2

SE RECOMIENDA INVERTIR EN LA REGION SIERRA POR PRESENTAR LA PROBABILIDAD MAS ALTA


UPC MA444 Estadística 174
Principales distribuciones de variables aleatorias continuas
Distribución exponencial

Función de densidad

Una variable aleatoria 𝑋 es exponencial con parámetro 𝛽 > 0, si su función de densidad es:

1 −𝑥
𝑒 𝛽 𝑥≥0
𝑓(𝑥) = {𝛽
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Notación

Si 𝑋 sigue una distribución exponencial con parámetro 𝛽 se denota por 𝑋 ~ 𝐸𝑥𝑝 ().

Media
𝜇 = 𝐸(𝑋) = 𝛽

Varianza
𝜎 2 = 𝑉(𝑋) = 𝛽 2

Función de distribución acumulada

La definición de la función de distribución acumulada es:

𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑥) 𝑑𝑥
−∞

Como el rango de 𝑋 es de 0 a +∞.

𝑥
1 −𝑥 −
𝑥
𝐹(𝑥) = ∫ 𝑒 𝛽 𝑑𝑥 = 1 − 𝑒 𝛽
0 𝛽

𝑥

𝐹(𝑥) = 1 − 𝑒 𝛽
UPC MA444 Estadística 175
Características

La variable puede tomar valores de 0 a +, no toma valores negativos.

La gráfica es descendente con sesgo a la derecha.

Existe una curva para cada valor de .

La distribución exponencial se usa para describir la vida útil de un dispositivo o tiempo de


funcionamiento hasta que falle y  es el promedio de la vida útil (vida media) del dispositivo.

Ejemplo 1

El tiempo de vida de un componente tiene la siguiente función de densidad:

1 −𝑥
𝑓(𝑥) = 𝑒 500 𝑥≥0
500

a. ¿Cuál es la probabilidad de que un componente dure más de 800 días?


b. Calcule el valor de la mediana.

Solución

X : El tiempo de vida de un componente

𝑋 ~ 𝐸𝑥𝑝 ( = 500)

𝑪

𝑷(𝑿 < 𝑪) = 𝟏 − 𝒆 𝜷

a. ¿Cuál es la probabilidad de que un componente dure más de 800 días?

Solución

La probabilidad pedida es:

𝑃(𝑋 > 800)

= 1 − 𝑷(𝑿 ≤ 𝟖𝟎𝟎)

−800
= 1 − (1 − 𝑒 500 ) = 0,2019

b. Calcule el valor de la mediana.

Solución

Por definición de mediana.


UPC MA444 Estadística 176
𝑃(𝑋 ≤ 𝑀𝑒) = 0,50

𝐹(𝑀𝑒) = 0,50

𝑥
−𝛽
Usando la función de distribución acumulada 𝐹(𝑥) = 1 − 𝑒 de la variable exponencial tenemos
que:

−𝑀𝑒
(1 − 𝑒 500 ) = 0,50

−𝑀𝑒
𝑒 500 = 0,50

Tomamos logaritmo neperiano en ambos términos de la ecuación:

−𝑀𝑒
𝑙𝑛 (𝑒 500 ) = 𝑙𝑛(0,50)

𝑀𝑒
− = 𝑙𝑛(0,50)
500

Despejando:

−𝑀𝑒 = −0,693 × 500

𝑀𝑒 = 346,5 días

El 50% de los componentes duran 346,5 días o menos.

Ejemplo 2

La duración, en miles de millas, que obtienen los dueños de automóviles con cierto tipo de neumático
es una variable aleatoria con la siguiente función de densidad:

1 −𝑥
𝑓(𝑥) = {20 𝑒 𝑥≥0
20

0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

X : La duración de cierto tipo de neumático, en miles de millas

𝑋 ~ 𝐸𝑥𝑝 ( = 20)

𝑪

𝑷(𝑿 ≤ 𝑪) = 𝟏 − 𝒆 𝜷

𝑪

𝑷(𝑿 ≥ 𝑪) = 𝒆 𝜷
UPC MA444 Estadística 177

a. Calcule la probabilidad de que un neumático dure como máximo diez mil millas.

𝟏𝟎
P( X <= 10) = 𝟏 − 𝒆−𝟐𝟎 = 0.3935

b. Calcule la probabilidad de que un neumático dure entre 16 mil y 24 mil millas.

𝟐𝟒 𝟏𝟔
P(16 < X <24) = P( X < 24) – P(X<16) = ( 𝟏 − 𝒆−𝟐𝟎 ) – ( 𝟏 − 𝒆−𝟐𝟎 ) = 0.6988 – 0.5507 = 0.1481

c. Calcule la probabilidad de que un neumático dure al menos 30 mil millas.


UPC MA444 Estadística 178
Ejercicios propuestos

48.La duración, en minutos, de una conversación telefónica de larga distancia nacional tiene
distribución exponencial con promedio de ocho minutos.

a. ¿Cuál es la probabilidad que una llamada dure entre tres y diez minutos?
b. ¿Cuál es la probabilidad que una llamada dure más de 9 minutos?
c. ¿Cuánto debe durar como mínimo una llamada para estar considerada dentro del 10% de las
de mayor duración?
d. Si la llamada dura más de cinco minutos ¿cuál es la probabilidad de que dure a lo más 8
minutos?

49.Suponga que la vida útil, en horas, de cierta marca de foco electrónico, es una variable aleatoria X
cuya función de densidad de probabilidad es:

𝑥
−8000
𝑓(𝑥) = {𝑐𝑒 𝑥≥0
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Calcule el valor de la constante 𝑐 para que 𝑓(𝑥) sea función de densidad. Si se selecciona un
foco electrónico al azar, calcule la probabilidad de dure más de diez mil horas.
b. Calcule la probabilidad de que por lo menos dos de ellos duren más de diez mil horas.

50.La vida, en horas, de un dispositivo electrónico es una variable aleatoria que tiene la siguiente
función de densidad:

1 −𝑥
𝑓(𝑥) = {50 𝑒 𝑥≥0
50

0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Calcule e interprete la mediana. Si un lote tiene 20 de estos dispositivos, ¿cuántos se esperaría


que duren más que la mediana?
b. Si el dispositivo duró 80 horas, ¿cuál es la probabilidad de que dure 25 horas más?
UPC MA444 Estadística 179
Distribución Normal
Esta distribución se aproxima a las distribuciones de frecuencias observadas de muchas medidas
naturales y físicas, como es el caso de pesos, alturas, ventas, vida útil de producción, coeficiente
intelectual, etc.

La curva normal tiene forma de campana y es simétrica con respecto a su media


La media, la mediana y la moda son iguales y se encuentran en x =  y la desviación estándar es .

Función de densidad

La variable aleatoria X es normal si su función de densidad se define de la siguiente manera:

1 1 𝑥−𝜇 2
−2( 𝜎 )
𝑓(𝑥) = 𝑒 −∞< 𝑥 < ∞
√2𝜋 𝜎

Notación
Si la variable aleatoria tiene distribución normal con parámetros 𝝁 y 𝝈𝟐 se denota:

𝑋 ~ 𝑁(, 2 ).

𝑋: = variable aleatoria de interés


𝜇 ≔ media de la distribución
𝜎 ≔ desviación estándar de la distribución

Media
𝐸(𝑋) = 

Varianza
𝑉(𝑋) = 2
UPC MA444 Estadística 180
Distribución normal estándar

• La distribución normal estándar es una distribución de una variable aleatoria continua denotada
con la letra 𝑍, que tiene media 0 y desviación estándar 1.
• Una variable aleatoria con distribución normal se puede convertir en una distribución normal
estándar si se realiza la siguiente transformación, llamada de estandarización o de tipificación.

𝑋−𝜇
𝑍=
𝜎

Notación de una variable normal estándar

Si una variable es normal estándar se denota por:

𝑍 ~ 𝑁 (0,1)
Ejemplo 1

Si las gráficas son simétricas, ¿qué las diferencia?

Función acumulada de la normal estándar

𝐹 (𝑍) = 𝑃(𝑍 ≤ 𝑧)

La distribución de la variable 𝑍 se encuentra tabulada en la tabla estadística de la normal estándar.


UPC MA444 Estadística 181
Tabla de la distribución normal estándar

Área bajo la curva normal 𝑃(𝑍 ≤ 𝑧) = 𝛼

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233

-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350

-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621

-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275

-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681

-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866

-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854

-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
UPC MA444 Estadística 182
Tabla de la distribución normal estándar

Área bajo la curva normal 𝑃(𝑍 ≤ 𝑧) = 𝛼

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793

0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891

1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189

1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670

2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361

2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861

3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758

3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
UPC MA444 Estadística 183
La lectura en tabla presenta tres situaciones:

Situación 1 𝑃(𝑍 ≤ 𝑎)

Situación 2 𝑃(𝑍 > 𝑎) = 1 − 𝑃(𝑍 ≤ 𝑎)

Situación 3 𝑃 ≤ 𝑏 = 𝑃(𝑍 ≤ 𝑏) − 𝑃(𝑍 ≤ 𝑎)


UPC MA444 Estadística 184
Ejemplo 1: USO DE LA TABLA DE DISTRIBUCION NORMAL Z

Calcule las siguientes probabilidades:

a. ¿Cuál es la probabilidad de que Z sea menor a 1,15?

P(Z < 1.15) = 0.87493

b. ¿Cuál es la probabilidad de que Z sea mayor que 2,01?

P(Z > 2.01) = 1 – P(Z <= 2.01) = 1 – 0.97778 = 0.02222

c. ¿Cuál es la probabilidad de que Z esté entre –0,13 y 1,05?

P(-0.13 < Z < 1.05 ) = P(Z < 1.05) - P(Z < -0.13)

P(-0.13 < Z < 1.05 ) = 0.85314 – 0.44828 = 0.40486

d. ¿Cuál será el valor máximo de Z = D tal que el 15,87% de los valores son menores a Z = D?

TABLA INVERSA
P(Z < C) = 0.9750000 ; C= 1.96

P(Z < K) = 0.950000 ; C= 1.64

P(Z <= D) = 0.1587 ; D = 1.00


UPC MA444 Estadística 185

e. ¿Cuál será el valor mínimo de Z tal que el 15,87% de los valores son mayores a Z?

P( Z>= B) = 0.1587

1 - P( Z < B) = 0.1587

0.8413 = P( Z < B)

P( Z < B) = 0.8413 ; B= 1.00

Ejemplo 2
Raúl sabe que la gestión del proyecto se mide habitualmente en términos de utilidad, por lo que
analizó la utilidad, en millones de soles, de los proyectos grandes culminados el último año. Sabe,
además, que esta variable tiene distribución normal con media 111,5 millones de soles y desviación
estándar de 25 millones de soles.

Si la probabilidad de que un proyecto grande culminado en el último año genere una utilidad mayor
a 112 millones de soles supera a 0,52, no tomará la decisión de modificar los términos de referencia
para invertir en más proyectos grandes caso contrario modificará los términos de referencia. ¿Qué
decisión tomará?

Solución
Definamos la variable:

𝑋 = Utilidad, en millones de soles, de los grandes proyectos culminados en el último año

𝑋~𝑁(𝜇 = 111,5; 𝜎 2 = 252 )

La probabilidad pedida es:


𝑷(𝑿 > 𝟏𝟏𝟐) = 1 − 𝑃(𝑋 ≤ 112)

𝑋−𝜇
𝑍=
𝜎

𝑃(𝑋 ≤ 112)

𝑋 − µ 112 − 111,5
𝑃( < )
𝜎 25

𝑃(𝑍 < 0.02)


UPC MA444 Estadística 186
Estandarizando:
112 − 111,5
𝑷(𝑿 > 𝟏𝟏𝟐) = 1 − 𝑃 (𝑍 < )
25

𝑷(𝑿 > 𝟏𝟏𝟐) = 1 − 𝑷(𝒁 < 𝟎, 𝟎𝟐) = 1 − 0,50798 = 0,49202

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409

Como la 𝑃(𝑋 > 112) = 0,49202 < 0,52, entonces no cumple con lo establecido.

Por lo tanto, sí se tomará la decisión de modificar los términos de referencia para invertir en más
proyectos grandes.

Ejemplo 3
Una máquina llena recipientes con determinado producto. Se sabe que el peso de llenado de dicho
producto tiene distribución normal. Se sabe, de acuerdo con los datos históricos, que la media es
20,23 y la desviación estándar de pesos de llenado es de 0,6 onzas.

a. ¿Cuál es la probabilidad de que el peso de llenado sea menor que el promedio?

𝑋 = El peso de llenado de dicho producto

𝑋~𝑁(𝜇 = 20.23 ; 𝜎 2 = 0.62 )

𝑋−µ 20.23 −20.23


P( X < 20.23) = P( < ) = P(𝑍 < 0.00)= 0.50
𝜎 0.6
UPC MA444 Estadística 187

b. ¿Cuál es la probabilidad de que el peso de llenado sea mayor a 21 onzas?

P(X > 21) = 1 – P(X <= 21)

𝑋−µ 21 −20.23
P(X > 21) = 1 – P( ≤ )
𝜎 0.6

P(X > 21) = 1 – P(𝒁 ≤ 𝟏. 𝟐𝟖) = 1 – 0.89973 = 0.10027


UPC MA444 Estadística 188

c. Se dice que la máquina funciona correctamente si el peso de llenado del producto está entre 19,03
y 21,43 ¿Qué tan probable es que la máquina no funcione correctamente?

P(NO FUNCIONE) = 1 – P(FUNCIONE)

P(FUNCIONE) = P ( 19.03 < X < 21.43) = P(X <21.43) – P(X < 19.03)

𝑋−µ 21.43 −20.23 𝑋−µ 19.03 −20.23


P ( 19.03 < X < 21.43) = P( ≤ ) – P( ≤ )
𝜎 0.6 𝜎 0.6

P(FUNCIONE) = P ( 19.03 < X < 21.43) = P(𝑍 ≤ 2.00) – P(𝑍 ≤ −2.00) = 0.97725 – 0.02275 = 0.9545

P(NO FUNCIONE) = 1 – 0.9545 = 0.0455

d. ¿Cuál debe ser el tiempo de llenado mínimo para pertenecer al 25% de recipientes con mayor
peso de llenado?

P( X >= C ) = 0.25

1 - P( X < C ) = 0.25

0.75 = P(X < C )

P(X < C ) = 0.75

𝑿−µ 𝑪−𝟐𝟎.𝟐𝟑
P( < ) = 0.75
𝝈 𝟎.𝟔

𝑪−𝟐𝟎.𝟐𝟑
P(𝒁 < ) = 0.75
𝟎.𝟔

𝑪 − 𝟐𝟎. 𝟐𝟑
= 𝟎. 𝟔𝟕
𝟎. 𝟔

𝑪 = 20.632
UPC MA444 Estadística 189
UPC MA444 Estadística 190
Ejercicios propuestos

51. La medición mensual de la contaminación por polvo atmosférico generado por residuos sólidos
de las construcciones y demoliciones de obras es una variable aleatoria distribuida normalmente
con media de 35 toneladas/km2 y desviación estándar de 15 toneladas/km2. Si la cantidad máxima
de contaminación aceptable según la norma ambiental es de 25 toneladas/km2 por mes, calcule
la probabilidad de que la medición del próximo mes reporte un valor no aceptable.

52. Una máquina automática para el llenado de paquetes de arroz puede regularse de modo que la
cantidad media de arroz llenado sea la que se desee. Si la cantidad de arroz depositada se
distribuye normalmente con desviación estándar igual a 10 gramos, ¿cuál debe ser la regulación
media de modo que solo el 1% de los paquetes tengan un peso neto inferior a 990 gramos?

53. En un taller de la Industria Sideromecánica se fabrican árboles de leva para darles uso en motores
de gasolina. Después de investigaciones realizadas se ha llegado a la conclusión de que la
excentricidad de estos árboles de leva es una variable aleatoria normalmente distribuida con
media de 1,02 pulgadas y desviación estándar de 0,44 pulgadas.
a. Calcule la probabilidad que un árbol de leva tenga una excentricidad menor a una pulgada.
b. Calcule la probabilidad que un árbol de leva tenga una excentricidad mayor a 1,05 pulgadas.
c. Calcule el valor máximo para estar en el 30% de los árboles de leva con menor excentricidad.
d. Calcule el valor mínimo para estar en el 20% de los árboles de leva con mayor excentricidad.

54. La duración de las llamadas telefónicas en una empresa se modela con una variable normal con
media de 130 segundos y desviación estándar de 30 segundos. Calcule la probabilidad que una
llamada dure entre 90 y 170 segundos.

55. Un foco tiene una duración distribuida normalmente con una media de 7000 horas y una
desviación estándar de 1000 horas. Un competidor ha inventado un nuevo foco LED con una
duración distribuida normalmente con una media de 7500 horas y una desviación estándar de
1200 horas. ¿Cuál foco tiene mayor probabilidad de tener una duración mayor que 9000 horas?

56. Un contratista de construcción afirma que elaborar un proyecto demora en promedio 35 horas
de trabajo y el 97,5% de los proyectos demandan como máximo 38,92 horas. Considerando que
los tiempos para completar proyectos similares se distribuyen normalmente.
a. ¿Cuál es la probabilidad de que un proyecto demande menos de 32 horas?
b. Si el contratista demora más de 48 horas deberá devolver 2% del costo de dicho proyecto; si
en cambio demora menos de 29,5 horas, recibirá un incentivo de 5% del costo del proyecto,
¿cuánto esperaría recibir de incentivo?

57. Un fabricante de televisores asegura que el tiempo medio de funcionamiento sin fallas de los
aparatos es de dos años con una desviación estándar de 0,25 años. El tiempo de vida de los
aparatos sigue una distribución normal.
a. ¿Cuál es la probabilidad de que el tiempo de buen funcionamiento sea menor que 2,5 años?
b. Determine la probabilidad de que el tiempo de funcionamiento este entre 1 año y 1,75 años.
c. El fabricante garantiza que remplazará gratis cualquier aparato de televisión cuya duración sin
fallas sea menor que k años. Calcular k de tal modo que sólo el 1% de los aparatos vendidos
tenga que ser reemplazado.
UPC MA444 Estadística 191
Caso: Cemento Tumbo

Cemento Tumbo es una empresa con más de 50 años de


experiencia y vende productos de alta calidad para el
sector de la construcción. Entre sus principales productos
tenemos el cemento tipo I, II, V, que se venden en bolsas
de papel de 42,5 kilos y a granel.

La empresa cree que es bueno brindar productos de alta


calidad para mantenerse en el sitial en que se encuentra,
por lo que desea tener la certeza de que sus productos
cumplan con las especificaciones técnicas que promocionan.

El área de producción ha decidido incorporar un insumo en la elaboración de cemento que abarataría


los costos de producción, por lo que ahora la cantidad de cemento en un m 2 de concreto premezclado
de techo aligerado es una variable aleatoria que se distribuye normalmente, con media 0,31 m 3 y
desviación estándar 0,08 m3.

Enterado de esto, el jefe de control de calidad desea saber si el nuevo producto cumple con las normas
técnicas que indican que, por cada metro cuadrado de techo, la cantidad de cemento en concreto
premezclado debe tener un volumen entre 0,21 m3 y 0,41 m3 y tomará la decisión de enviar un reporte
a la gerencia general pidiendo que se detenga la producción si la probabilidad de que no se cumpla
con la norma técnica es mayor a 0,10. ¿Qué decisión tomará?

INTERPRETACION
Determinar si se tomará la decisión de enviar un reporte a la gerencia general pidiendo que se detenga
la producción

REPRESENTACION

𝑋 = La cantidad de cemento en un m2 de concreto premezclado de techo aligerado

𝑋~𝑁(𝜇 = 0.31 ; 𝜎 2 = 0.082 )

Técnica Estadística : Distribución Normal

CALCULO

𝑃(𝑁𝑜 𝑐𝑢𝑚𝑝𝑙𝑒 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛) = 1 − 𝑃(𝐶𝑢𝑚𝑝𝑙𝑒 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛)

𝑃(𝐶𝑢𝑚𝑝𝑙𝑒 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛) = 𝑃(0.21 < 𝑋 < 0.41)

0.21 − 0.31 𝑋 − µ 0.41 − 0.31


𝑃(𝐶𝑢𝑚𝑝𝑙𝑒 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛) = 𝑃( < < )
0.08 𝜎 0.08

𝑃(𝐶𝑢𝑚𝑝𝑙𝑒 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛) = 𝑃(−1.25 < 𝑍 < 1.25)

𝑃(𝐶𝑢𝑚𝑝𝑙𝑒 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛) = 𝑃(𝑍 < 1.25) − 𝑃(𝑍 < −1.25)


UPC MA444 Estadística 192

𝑃(𝐶𝑢𝑚𝑝𝑙𝑒 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛) = 0.89435 − 0.10565 = 0.7887

𝑃(𝑁𝑜 𝑐𝑢𝑚𝑝𝑙𝑒 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛) = 1 − 𝑃(𝐶𝑢𝑚𝑝𝑙𝑒 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛)

𝑷(𝑵𝒐 𝒄𝒖𝒎𝒑𝒍𝒆 𝑬𝒔𝒑𝒆𝒄𝒊𝒇𝒊𝒄𝒂𝒄𝒊𝒐𝒏) = 𝟏 − 𝟎. 𝟕𝟖𝟖𝟕 = 𝟎. 𝟐𝟏𝟏𝟑

ANALISIS

La probabilidad de no cumplir con la especificación es de 0.2113 que es mayor a 0.10

ARGUMENTACION

Se recomienda que si se debe enviar un reporte a la gerencia general pidiendo que se detenga la
producción

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para identificar Habilidad para Habilidad para Habilidad de
identificar el la variable(s) y elegir las determinar los analizar, comunicar y sustentar
problema a herramientas estadísticas valores de las entender e la decisión final en
resolver que usará para resolver probabilidades interpretar los base a los resultados y
el problema resultados el análisis
UPC MA444 Estadística 193
INTER

Unidad 3. Introducción al muestreo e


inferencia estadística

Logro
Al finalizar la unidad, el estudiante aplica algunas técnicas de muestreo e inferencia estadística en
situaciones reales dentro del ámbito de su especialidad para la toma de decisiones.

Temario
• Muestreo, tipos de muestreo, tamaño de muestra
• Introducción a la inferencia estadística
• Prueba de hipótesis: conceptos. Tipos de error
• Pruebas de hipótesis para la media y proporción poblacional
• Prueba de hipótesis para dos varianzas y dos medias poblacionales

Bibliografía
• Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 7.1 pág. 248-
250.
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 261.
• Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 9 pág. 364-369.
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 295 – 307.
• Estadística. Mario Triola. 11a. Edición. Pearson Educación, México 2013 519.5 TRIO/E 2013
capitulo 7. pág. 297.
• Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 10 (pág. 386-
395) Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 375 – 388.
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 375 - 388.
UPC MA444 Estadística 194
Conceptos básicos
Unidad elemental
Es el objeto sobre el cual se hace la medición. También llamada unidad de observación, unidad de
análisis, unidad estadística o elemento. Por ejemplo, en estudios de poblaciones humanas, con
frecuencia ocurre que la unidad elemental es cada individuo.

Población muestreada
Es el conjunto de todas las unidades elementales posibles que podrían extraerse en una muestra; es
decir, es la población de donde se extrae la muestra.

Unidad de muestreo
Es la unidad donde realizamos la muestra. Por ejemplo, si queremos estudiar a las personas, pero no
tenemos la lista de todos los individuos que pertenecen a la población objetivo, la unidad de muestreo
sería cada familia y la unidad elemental sería cada individuo que vive en la familia .

Marco muestral
Es una lista de las unidades de muestreo que están disponibles para elección.

Para las encuestas telefónicas el marco de muestreo podría ser una lista de todos los números
telefónicos residenciales de la ciudad; para las entrevistas personales una lista de las direcciones de
todas las calles; para una encuesta de agricultura una lista de todas las granjas o un mapa con todas
las áreas que contienen granjas.

Censo
Es una investigación estadística que consiste en el recuento de la totalidad de los elementos que
componen la población por investigar. Es necesario que se especifique el espacio y el tiempo al que se
refiere el recuento.
Por ejemplo, el 22 de octubre del 2017 se realizaron los Censos Nacionales 2017: XII de Población, VII
de Vivienda y III de Comunidades Indígenas. Su finalidad es proveer información sobre la composición,
distribución geográfica y crecimiento de la población, los patrones de la concentración urbana y rural,
las características y servicios básicos de la vivienda para la ejecución de las políticas públicas.

Muestreo
Cuando se opta por una investigación usando una muestra en vez de la población, el estudio estadístico
comprende por lo menos cuatro etapas:

1. Definición de la población objetivo y búsqueda del marco muestral.


2. Determinación del tamaño de la muestra.
3. Selección de las unidades.
4. Registro de las observaciones.

En el curso trabajaremos las dos últimas.


• La selección de las unidades y
• El registro de las observaciones
UPC MA444 Estadística 195
Por ejemplo, la Asociación Peruana de Empresas de Investigación realizaba una encuesta para
determinar el nivel socioeconómico de una persona. Hoy en día, ya no encuesta, sino más bien usa la
Encuesta Nacional de Hogares (ENAHO) realizada por el Instituto Nacional de Estadística e Informática
(INEI).

Niveles socioeconómicos en Lima Metropolitana y Callao


Ficha técnica
Universo de estudio
• Se consideró como universo de estudio a todos los hogares pertenecientes a
Lima Metropolitana entendida como los distritos de Lima ubicados en el
núcleo urbano (sin considerar balnearios) y la Provincia Constitucional del
Callao. Se definió como hogar, al conjunto de personas que, habitando en la
misma vivienda, preparan y consumen sus alimentos en común.
• La persona informante fue el jefe de familia, definido como aquella persona que más
aporta económicamente en el hogar.

Marco muestral
Para el desarrollo de la investigación se consideró como marco muestral:
• La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI).
• Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de mayor
crecimiento de la ciudad (conos)
Tamaño de la muestra
• Se entrevistó a un total de 3 598 hogares distribuidos en 41 distritos.
• El margen de error máximo probable con un nivel de confianza del 95,1% y considerando el máximo
de dispersión (p = q = 0,5) fue de ± 1,63%.
• Dentro de esta muestra se realizaron 200 entrevistas en Distritos con predominio de los N.S.E. Muy
Alto/Alto con el propósito de obtener una submuestra estadísticamente significativa para este
segmento.
• El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de cada
uno de los distritos de Lima Metropolitana.
Selección de la muestra
• Determinada la cantidad de entrevistas a aplicar por distrito, se
procedió a sortear tantas manzanas como entrevistas se requerían.
• Dentro de cada manzana se seleccionó por un sistema aleatorio
simple cinco viviendas: una vivienda titular y cuatro viviendas suplentes. Los hogares titulares
fueron visitados hasta en tres oportunidades antes de proceder al reemplazo. Se controló que la
tasa de reemplazo no excediera el 10% del total de entrevistas originalmente sorteadas.
UPC MA444 Estadística 196
Muestreo probabilístico

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de


equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser seleccionadas.

Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra


extraída y son, por tanto, los más recomendables.

Dentro de los métodos de muestreo probabilísticos encontramos al muestreo simple aleatorio:

Muestreo aleatorio simple


Se selecciona una muestra en forma aleatoria y sin
reemplazo a n unidades de muestreo de una
población que contiene un total de N unidades. Se
garantiza que cada una de las muestras posibles
tiene la misma probabilidad de ser elegida.

Muestreo simple aleatorio


Se seleccionarán los elementos del marco muestral que conformarán la muestra aplicando la técnica
de muestreo simple aleatorio.

El procedimiento consiste en seleccionar una muestra de tamaño n en forma aleatoria y sin reemplazo
de una población que contiene un total de N unidades elementales. Se garantiza que cada una de las
muestras posibles tiene la misma probabilidad de ser elegida.

Los pasos son los siguientes:


• Enumere las unidades del marco muestral con números sucesivos.
• Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra.
• La selección de las unidades se realiza sin reemplazo.
• Para elegir a los elementos de la población, que formarán parte de la muestra, se hará uso de una
tabla llamada tabla de números aleatorios.

El muestreo aleatorio simple presenta dos propiedades:


• Equiprobable: Cada unidad tiene las mismas posibilidades de ser elegida.
• Independencia: La selección de una unidad no influye en la selección de otras unidades.

Pero en el mundo real es difícil encontrar muestras completamente independientes y representativas.


Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un método
no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono o cuenta varias
veces a los que tienen varios números telefónicos.
UPC MA444 Estadística 197
Uso de la tabla de números aleatorios
Para usar la tabla de números aleatorios:

• Los números se eligen de arriba hacia abajo en las columnas seleccionadas.


• Las columnas se usan en el orden dado, no se reordenan.
• No es necesario usar todas las columnas.
• Las columnas que se usarán serán las necesarias hasta completar el tamaño de muestra requerido.

Ejemplo 1

Por ejemplo, en un problema nos dicen que elijamos las columnas C10, C7, C5 y C16.

• Si el tamaño de la población N = 87, esto implica que el número mayor 87 tiene dos cifras
significativas.

La primera columna elegida será C10 y usaremos una columna adicional a la derecha para completar
la cantidad de dígitos que tiene la población. Es decir, usaremos C10C11 para elegir números del 1
al 87 inclusive sin reemplazo.

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6

• Si el tamaño de la población N = 550, esto implica que el número mayor 550 tiene tres cifras
significativas.

La primera columna elegida será C10 y usaremos dos columnas adicionales a la derecha para
completar la cantidad de dígitos que tiene la población. Es decir, usaremos C10C11C12 y elegir
números del 1 al 550 inclusive sin reemplazo.

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
UPC MA444 Estadística 198

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
UPC MA444 Estadística 199
Ejemplo 2

Una empresa de tiene un total de 150 empleados y ha registrado información acerca de las variables:
ingreso mensual, en soles (Ingreso) y años cumplidos en la empresa (Años).

Marco muestral: Trabajadores registrados


Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años
1 2300 5 39 2600 16 77 1800 3 115 1700 3
2 2800 11 40 2700 18 78 1700 5 116 2600 19
3 2400 4 41 2100 11 79 1700 4 117 1600 1
4 2500 2 42 2300 14 80 1700 0 118 1800 6
5 2300 3 43 1700 0 81 1700 1 119 2100 10
6 2100 2 44 2200 13 82 2100 6 120 1700 0
7 1700 2 45 2900 20 83 2600 17 121 2400 16
8 2000 0 46 1800 5 84 2400 9 122 2600 17
9 2200 7 47 2100 16 85 2600 19 123 2100 10
10 2100 4 48 2000 12 86 1900 7 124 2100 8
11 1700 0 49 2000 12 87 1600 0 125 2400 17
12 2500 2 50 2900 20 88 1900 3 126 1700 1
13 2800 13 51 2100 13 89 2100 14 127 2600 20
14 2400 9 52 2100 9 90 1700 0 128 2400 16
15 1700 1 53 1800 1 91 2100 15 129 2700 17
16 2400 9 54 2000 9 92 1700 1 130 2100 12
17 2200 10 55 2100 10 93 2300 14 131 1600 0
18 2200 4 56 1900 4 94 2500 16 132 2100 15
19 2300 10 57 2000 10 95 2600 18 133 1900 5
20 2800 11 58 2300 11 96 1900 3 134 2100 12
21 2100 7 59 2000 7 97 2500 19 135 2200 12
22 1700 1 60 1700 1 98 1800 6 136 2400 13
23 2500 6 61 1900 6 99 1700 2 137 1800 4
24 2400 9 62 2000 9 100 2000 10 138 2600 17
25 2700 17 63 2400 17 101 2400 16 139 2700 20
26 1700 0 64 1700 0 102 1700 0 140 2500 16
27 1600 2 65 1700 2 103 2500 12 141 2500 16
28 2600 17 66 2400 17 104 1700 3 142 1900 6
29 2500 13 67 2500 13 105 2400 17 143 2100 15
30 2500 16 68 2600 16 106 2400 16 144 1700 9
31 2700 17 69 2100 14 107 1900 7 145 1500 0
32 1700 1 70 1900 7 108 1700 1 146 1800 18
33 1600 1 71 2000 9 109 2100 6 147 2100 10
34 2400 11 72 1800 7 110 2000 5 148 2700 19
35 1900 3 73 2100 10 111 2000 3 149 1800 9
36 1800 5 74 2300 12 112 2500 13 150 2100 15
37 1800 3 75 2700 20 113 1700 0
38 2400 14 76 2800 20 114 2500 19

a. Seleccione una muestra de 16 trabajadores usando muestreo simple aleatorio. Elabore un listado
con el número seleccionado y el valor del ingreso mensual y años en la empresa. Use las columnas
C2, C7, C11 y C9 de la tabla de números aleatorios.
b. Con la muestra, estime e interprete las medidas de tendencia central para el ingreso mensual.
c. Con la muestra, estime e interprete el cuartil 1 para la variable años en la empresa.
UPC MA444 Estadística 200
Solución

a. Elabore un listado con el número seleccionado y el valor del ingreso mensual y años en la empresa:

Posición
Ingreso mensual
Años en la empresa

Posición
Ingreso mensual
Años en la empresa

b. Con la muestra obtenida estime e interprete las medidas de tendencia central para la variable
ingreso mensual.

Medidas Valor Interpretación

Media

Mediana

Moda

c. Con la muestra obtenida estime e interprete los cuartiles para la variable años en la empresa.

Años en la empresa

Años en la empresa

Medidas Valor Interpretación

Cuartil 1

Ejemplo 3
El siguiente marco muestral muestra la información del total de usuarios de internet de una
determinada zona de un distrito de la ciudad capital. Las variables analizadas fueron las siguientes:
• Marca de computadora portátil
• Principales problemas con Internet
• Número de computadoras con Internet en casa
• Tiempo de navegación diaria en Internet (en minutos)
UPC MA444 Estadística 201
Marca de Número de Tiempo de navegación
Usuario Principales problemas
computadora computadoras diaria (min)
1 HP Saturación de la red 1 94,00
2 Dell Saturación de la red 1 74,45
3 IBM Saturación de la red 3 104,89
4 HP Saturación de la red 3 125,53
5 Dell Saturación de la red 3 123,97
6 HP Saturación de la red 4 134,66
7 Otra marca Saturación de la red 2 56,33
8 HP Saturación de la red 2 95,32
9 HP Saturación de la red 2 121,90
10 Lenovo Saturación de la red 2 78,27
11 Lenovo Saturación de la red 2 86,20
12 Apple Saturación de la red 2 66,19
13 Lenovo Saturación de la red 2 63,06
14 Dell Saturación de la red 1 80,45
15 Dell Saturación de la red 1 84,53
16 Apple Saturación de la red 1 57,64
17 HP Saturación de la red 1 88,64
18 HP Saturación de la red 3 91,92
19 Apple Saturación de la red 3 102,7
20 Apple Baja velocidad en la señal 3 92,69
21 Lenovo Baja velocidad en la señal 3 93,46
22 HP Baja velocidad en la señal 3 92,60
23 Dell Baja velocidad en la señal 4 126,85
24 HP Baja velocidad en la señal 2 98,29
25 Lenovo Baja velocidad en la señal 2 96,28
26 Apple Baja velocidad en la señal 1 89,74
27 Apple Baja velocidad en la señal 1 139,44
28 HP Baja velocidad en la señal 1 117,31
29 HP Baja velocidad en la señal 1 147,51
30 Otra marca Baja velocidad en la señal 3 86,90
31 Otra marca Baja velocidad en la señal 3 133,23
32 IBM Baja velocidad en la señal 4 67,75
33 Apple Baja velocidad en la señal 2 110,78
34 Apple Baja velocidad en la señal 2 118,04
35 Dell Baja velocidad en la señal 4 138,38
36 Dell Baja velocidad en la señal 2 98,31
37 Apple Baja velocidad en la señal 1 89,52
38 IBM Baja velocidad en la señal 1 113,50
39 HP Baja velocidad en la señal 1 92,37
40 Otra marca Baja velocidad en la señal 1 115,15
41 HP Baja velocidad en la señal 1 131,22
42 HP Calidad y durabilidad del modem 2 125,81
43 HP Calidad y durabilidad del modem 2 130,02
44 HP Calidad y durabilidad del modem 3 83,74
45 IBM Calidad y durabilidad del modem 2 133,69
46 IBM Calidad y durabilidad del modem 1 129,39
47 Lenovo Calidad y durabilidad del modem 1 111,01
48 Lenovo Lentitud para subir información 1 103,69
49 Lenovo Lentitud para subir información 1 121,70
50 Apple Lentitud para subir información 2 151,81
51 Apple Lentitud para subir información 2 125,43
UPC MA444 Estadística 202
52 Apple Lentitud para subir información 2 116,00
53 Dell Lentitud para subir información 3 139,41
54 Dell Lentitud para subir información 2 129,52
55 Dell Lentitud para subir información 1 127,74
56 Dell Lentitud para subir información 2 120,89
57 Dell Lentitud para subir información 3 126,33
58 Otra marca Lentitud para subir información 3 118,44
59 Otra marca Otros 1 113,04
60 Otra marca Otros 2 114,44
61 Lenovo Otros 1 119,66
62 Dell Otros 1 145,52

a. Se desea seleccionar una muestra de 10 usuarios de internet usando muestreo simple aleatorio.
Use las columnas C15, C1 y C8 de la tabla de números aleatorios para indicar la posición del elemento
seleccionado. Indique, además, el principal problema del usuario con Internet y el tiempo diario
de navegación, en minutos.

Posición

Problema

Tiempo (min.)

b. Con la muestra obtenida, estime el porcentaje de usuarios cuyo principal problema de Internet es
la baja velocidad en la señal.

c. Con la muestra obtenida, estime e interprete las medidas de tendencia central para el tiempo
diario de navegación.
UPC MA444 Estadística 203
Ejemplo 4

Telecom es una empresa que brinda soluciones integrales en


infraestructura de telecomunicaciones. Cuenta con más de
12 años de experiencia y ha participado en diferentes
proyectos con los principales operadores y fabricantes de
equipos del sector, junto a un equipo de ingenieros, técnicos
y consultores de larga trayectoria profesional, nacional e
internacional.

La empresa está interesada en saber si existe una alta rotación de su personal, debido a ello, el
departamento de Recursos Humanos ha hecho un censo. Los resultados se muestran a continuación:

Marco muestral
Número Permanencia Grado de Remuneración
Posición Sexo Motivo de cese
de hijos (meses) instrucción bruta (soles)
1 M 0 26 Titulado 5000 Renuncia voluntaria
2 M 1 10 Titulado 12075 Renuncia voluntaria
3 M 0 11 Titulado 3000 Renuncia voluntaria
4 F 0 3 Titulado 1500 Renuncia voluntaria
5 M 0 2 Titulado 800 Renuncia voluntaria
6 M 0 28 Titulado 3000 Renuncia voluntaria
7 F 1 12 Post grado 5575 Renuncia voluntaria
8 F 1 32 Técnico completa 2000 Renuncia voluntaria
9 F 0 1 Técnico completa 2700 Renuncia voluntaria
10 F 0 0 Técnico completa 2575 Renuncia voluntaria
11 M 0 52 Titulado 12000 Renuncia voluntaria
12 F 0 0 Titulado 2000 Renuncia voluntaria
13 F 1 1 Titulado 3575 Renuncia voluntaria
14 M 0 15 Titulado 1500 Renuncia voluntaria
15 F 2 55 Post grado 5000 Renuncia voluntaria
16 F 0 2 Post grado 7500 Renuncia voluntaria
17 F 0 7 Titulado 2500 Renuncia voluntaria
18 F 1 1 Técnico completa 1500 Renuncia voluntaria
19 F 2 1 Post grado 4400 Renuncia voluntaria
20 F 2 10 Técnico completa 1985 Renuncia voluntaria
21 F 0 1 Titulado 3000 Renuncia voluntaria
22 F 0 5 Técnico completa 2200 Renuncia voluntaria
23 F 2 3 Técnico completa 2300 Renuncia voluntaria
24 F 0 20 Titulado 3085 Renuncia voluntaria
25 F 0 2 Técnico completa 1885 Renuncia voluntaria
26 F 2 23 Post grado 15085 Renuncia voluntaria
27 F 0 20 Titulado 3085 Renuncia voluntaria
28 F 0 2 Técnico completa 1885 Renuncia voluntaria
29 F 0 1 Técnico completa 1500 Renuncia voluntaria
30 F 0 1 Técnico completa 1500 Renuncia voluntaria
31 F 0 2 Técnico completa 1800 Renuncia voluntaria
32 F 0 2 Técnico completa 1800 Renuncia voluntaria
33 F 0 2 Titulado 2585 Renuncia voluntaria
34 F 0 3 Técnico completa 3000 Renuncia voluntaria
35 F 2 49 Post grado 6085 Renuncia voluntaria
36 M 0 33 Titulado 1800 Renuncia voluntaria
UPC MA444 Estadística 204
37 F 0 3 Técnico completa 950 Renuncia voluntaria
38 F 0 0 Técnico completa 1700 Renuncia voluntaria
39 F 0 0 Titulado 850 Renuncia voluntaria
40 F 0 6 Titulado 2800 Renuncia voluntaria
41 M 0 58 Titulado 2200 Renuncia voluntaria
42 F 1 26 Post grado 7000 Renuncia voluntaria
43 F 0 18 Titulado 1500 Renuncia voluntaria
44 M 0 7 Titulado 2000 Renuncia voluntaria
45 F 2 9 Titulado 3885 Renuncia voluntaria
46 F 1 9 Post grado 4585 Renuncia voluntaria
47 M 0 22 Titulado 1800 Renuncia voluntaria
48 F 0 41 Titulado 3300 Renuncia voluntaria
49 F 1 1 Titulado 2085 Renuncia voluntaria
50 F 1 3 Post grado 8085 Renuncia voluntaria
51 M 0 16 Post grado 1500 Renuncia voluntaria
52 F 0 2 Técnico completa 1200 Renuncia voluntaria
53 F 0 6 Titulado 2085 Renuncia voluntaria
54 F 0 5 Post grado 20000 Renuncia voluntaria
55 F 0 46 Técnico completa 2300 Renuncia voluntaria
56 M 0 10 Técnico completa 2000 Renuncia voluntaria
57 F 0 8 Técnico completa 2000 Término de contrato
58 F 0 1 Técnico completa 1500 Término de contrato
59 F 0 4 Técnico completa 1585 Término de contrato
60 F 0 7 Técnico completa 2300 Término de contrato
61 F 0 16 Técnico completa 1700 Término de contrato
62 F 0 7 Titulado 3000 Término de contrato
63 F 0 18 Titulado 1500 Término de contrato
64 M 0 19 Titulado 1500 Término de contrato
65 F 0 1 Técnico completa 2200 Término de contrato
66 F 1 1 Técnico completa 2500 Término de contrato
67 M 0 1 Técnico completa 2000 Término de contrato
68 F 0 14 Técnico completa 1200 Término de contrato
69 F 2 1 Titulado 2875 Término de contrato
70 M 0 1 Titulado 2000 Término de contrato
71 F 2 15 Titulado 2800 Término de contrato
72 F 1 2 Técnico completa 1600 Término de contrato
73 F 0 16 Técnico completa 2200 Término de contrato
74 F 0 25 Técnico completa 2800 Término de contrato
75 F 0 8 Titulado 3500 Término de contrato
76 F 1 4 Titulado 2300 Término de contrato
77 F 0 3 Titulado 4085 Término de contrato
78 F 0 16 Titulado 1585 Término de contrato
79 F 0 1 Técnico completa 1500 Término de contrato
80 F 2 4 Técnico completa 2000 Término de contrato
81 F 2 4 Técnico completa 2500 Término de contrato
82 F 2 38 Titulado 2500 Término de contrato
83 F 2 19 Titulado 2000 Término de contrato
84 F 2 59 Post grado 4085 Término de contrato
85 F 2 9 Titulado 2500 Término de contrato

a. Se desea seleccionar una muestra de 11 trabajadores usando muestreo simple aleatorio. Use las
columnas C13, C14 y C5 de la tabla de números aleatorios para indicar la posición del elemento
seleccionado. Indique, además, el motivo del cese y el número de hijos de cada trabajador.
UPC MA444 Estadística 205

Posición
Motivo
Número de hijos
Remuneración bruta

b. Con la muestra obtenida, estime el porcentaje de trabajadores cuyo motivo de cese fue por
renuncia voluntaria y el porcentaje de trabajadores que tienen hijos.

c. Con la muestra obtenida, estime e interprete el valor del cuartil 3 para la variable remuneración
bruta, en soles.

d. Con la muestra obtenida, estime e interprete el valor de las medidas de tendencia central para la
variable remuneración bruta, en soles.
UPC MA444 Estadística 206
Tamaño de muestra para estimar la media de una población

Al iniciar cualquier investigación, la pregunta que surge es:

• ¿Cómo podemos determinar el tamaño óptimo de una muestra?


• ¿Bastará con aplicar un cuestionario a 100 personas?
• ¿Será necesario encuestar a 500 individuos?
• ¿Cómo influye la variabilidad de las respuestas de cada encuestado?
• ¿Qué margen de error tendrán los resultados hallados en la encuesta?

La respuesta a cada una de estas preguntas nos la da la Estadística. A la hora de determinar el tamaño
que debe alcanzar una muestra hay que tener en cuenta: el parámetro a estimar, el margen de error
o error de estimación, la varianza poblacional y el nivel de confianza.

Margen de error
Es la diferencia entre un estadístico y su parámetro correspondiente. Nos da una idea clara de hasta
dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera
obtenido por medio de un censo completo. Un estadístico será más preciso cuando su error sea más
pequeño.

Nivel de confianza
Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al verdadero valor
del parámetro.

Varianza poblacional
Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias
será más pequeño. Cuando no se dispone de dicho valor, éste puede ser estimado a partir de una
muestra preliminar o piloto.

La fórmula para determinar el tamaño de muestra n es:

2
𝑍1−𝛼 𝑠
2
𝑛=( )
𝑒

Si la población es finita; es decir, se conoce el tamaño de la población N, el tamaño de la muestra se


corrige con la siguiente fórmula:
𝑛
𝑛𝑐 = 𝑛
1+
𝑁
UPC MA444 Estadística 207
El muestreo se ilustrará con el siguiente esquema:
UPC MA444 Estadística 208

Se tiene una población de tamaño N

Marco muestral: N trabajadores registrados

Se registran las N unidades elementales en el


marco muestral.

Para realizar la estimación del promedio, es necesario determinar, en primer lugar, ¿a cuántas
unidades elementales debemos entrevistar?

Si se conoce el tamaño de la población N, el tamaño


Establecemos un nivel de confianza, un de la muestra se corrige con la siguiente fórmula:
margen de error y estimamos la desviación 𝑛
estándar de la variable en estudio. La 𝑛𝑐 = 𝑛
fórmula es la siguiente: 1+
𝑁
𝑧(1−𝛼) × 𝑠 2
2
𝑛=( )
𝑒

Para seleccionar a las n unidades elementales usaremos muestreo aleatorio simple. La tabla de números
aleatorios nos permitirá seleccionar a estos elementos.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4

Una vez obtenida la muestra, realizar la


estimación
UPC MA444 Estadística 209
Ejemplo 1

Se tiene una población de 108 trabajadores de una empresa y se desea estimar el tiempo promedio
de servicio a partir de una muestra elegida al azar.

N = 108 trabajadores

Si queremos estimar el tiempo


promedio, en años, que tienen los
trabajadores en la empresa, ¿a
cuántos trabajadores debemos
entrevistar?

𝑧 𝛼 ×𝑠 2
(1− 2 )
𝑛=( ) = 9,8 = … j
𝑒

n=…

Para seleccionar la muestra de trabajadores


mediante muestreo aleatorio simple, usar
las columnas: C12, C5, C10 de la tabla de
números aleatorios (completar la tabla)

Una vez obtenida la muestra,


¿qué le preguntaremos a cada
elemento?

Posición
Trabajador (en la tabla de números X= …
aleatorios)
1
2
3
4
5
6
7
8
9
10
Promedio
UPC MA444 Estadística 210

Marco muestral: Trabajadores registrados


Nº Ingreso Tiempo Nº Ingreso Tiempo Nº Ingreso Tiempo
1 2300 5 37 2600 16 73 1800 3
2 2800 11 38 2700 18 74 1700 5
3 2400 4 39 2100 11 75 1700 4
4 2500 2 40 2300 14 76 1700 0
5 2300 3 41 1700 0 77 1700 1
6 2100 2 42 2200 13 78 2100 6
7 1700 2 43 2900 20 79 2600 17
8 2000 0 44 1800 5 80 2400 9
9 2200 7 45 2100 16 81 2600 19
10 2100 4 46 2000 12 82 1900 7
11 1700 0 47 2000 12 83 1600 0
12 2500 2 48 2900 20 84 1900 3
13 2800 13 49 2100 13 85 2100 14
14 2400 9 50 2100 9 86 1700 0
15 1700 1 51 1800 1 87 2100 15
16 2400 9 52 2000 9 88 1700 1
17 2200 10 53 2100 10 89 2300 14
18 2200 4 54 1900 4 90 2500 16
19 2300 10 55 2000 10 91 2600 18
20 2800 11 56 2300 11 92 1900 3
21 2100 7 57 2000 7 93 2500 19
22 1700 1 58 1700 1 94 1800 6
23 2500 6 59 1900 6 95 1700 2
24 2400 9 60 2000 9 96 2000 10
25 2700 17 61 2400 17 97 2400 16
26 1700 0 62 1700 0 98 1700 0
27 1600 2 63 1700 2 99 2500 12
28 2600 17 64 2400 17 100 1700 3
29 2500 13 65 2500 13 101 2400 17
30 2500 16 66 2600 16 102 2400 16
31 2700 17 67 2100 14 103 1900 7
32 1700 1 68 1900 7 104 1700 1
33 1600 1 69 2000 9 105 2100 6
34 2400 11 70 1800 7 106 2000 5
35 1900 3 71 2100 10 107 2000 3
36 1800 5 72 2300 12 108 2500 13
UPC MA444 Estadística 211

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
UPC MA444 Estadística 212
Tabla de la distribución normal estándar

Área bajo la curva normal: 𝑃(𝑍 ≤ 𝑧) = 𝛼


Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240

0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214

1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408

1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169

2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361

2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861

3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758

3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
UPC MA444 Estadística 213
Ejemplo 2

El jefe de la Oficina de Seguridad del distrito de San Martín de Porres desea realizar una estimación de
cuánto tiempo, en promedio, estarían dispuestos a permanecer en las charlas sobre rondas vecinales
los vecinos del distrito. En estudios anteriores se estimó que el tiempo medio era de 45,25 minutos
con una varianza de 18,75 minutos2, ¿A cuántas personas se debería entrevistar si se estima un error
máximo de 1,25 minutos y un nivel de confianza del 95%?

N = 10000

Suponga que esta variable se distribuye normalmente. SE CUMPLE EL SUPUESTO EL SUPUESTO

Solución

El margen de error e es: e = 1,25 minutos

𝑒 = |𝜇 − 𝑋̅| = 1.25 min

La desviación estándar muestral es: s = √18,75 = 4,33 minutos


Como el nivel de confianza es el 95% entonces (1 − 𝛼) = 0,95. Por lo tanto, 𝛼 = 0,05.

1 – α = 0.95 ; α = 0.05 ; 𝑍(1−𝛼) = 𝑍(1−0.05)= 𝑍(0.975)=1.96


2 2

Luego, se tiene que:

𝛼 0,05
1− = 1− = 0,975.
2 2

Buscamos dentro de la tabla el valor más cercano a 0,975 y desde este valor salimos a los bordes de la
tabla.

El valor de 𝑍(1−𝛼)en la tabla normal estándar es 𝑍0,975 = 1,96.


2

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169

Entonces, reemplazando en la fórmula:

2
𝑍(1−𝛼) × 𝑠
2
𝑛=( )
𝑒
UPC MA444 Estadística 214
2
1,96 × 4,33
𝑛=( )
1,25

𝑛 = 46,09

El valor del tamaño de muestra se redondea siempre al entero mayor, por lo tanto, se necesita
seleccionar a una muestra de 47 vecinos del distrito de San Martin de Porres.
UPC MA444 Estadística 215
Ejemplo 3

¿Cuál debe ser el tamaño de muestra si se desea estimar el tiempo promedio, en horas, que demoran
los estudiantes en llegar a la universidad con un nivel de confianza del 94% y con un error de
estimación de 0,1 horas? Una muestra piloto de 8 alumnos arrojó los siguientes resultados:

2,0 1,5 0,45 1,45 1,0 0,30 1,20 1,30

¿Qué tamaño de muestra deberá seleccionar?

2
𝑍(1−𝛼) × 𝑠
2
𝑛=( )
𝑒

e=0.1
S= 0.55997
1 – α = 0.94 ; α = 0.06 ; 𝑍(1−𝛼) = 𝑍(1−0.06)= 𝑍(0.97)=1.88
2 2

1.88 × 0.55997 2
𝑛=( )
0.1

𝑛 = 110.82

El valor del tamaño de muestra se redondea siempre al entero mayor, por lo tanto, se necesita
seleccionar a una muestra de 111 estudiantes de una universidad.

Ejemplo 4

La gerencia de un diario local desea estimar el gasto promedio mensual que las familias destinan a la
compra de diarios. La gerencia desea que sus resultados tengan un nivel de confianza del 95% y un
error de estimación no mayor a tres soles. Si la desviación estándar de los gastos en compra de diarios
en una muestra piloto fue de 20 soles ¿Qué tamaño de muestra deberá seleccionar?
UPC MA444 Estadística 216
UPC MA444 Estadística 217
Ejercicios propuestos

58. Se desea realizar una encuesta para estimar el número promedio de amigos que los jóvenes tienen
en su cuenta de Facebook. Con un error de estimación de cinco amigos y con un nivel de confianza
del 95%, determine el tamaño de muestra adecuado si en una muestra piloto se obtuvo que el
valor de la desviación estándar del número de amigos es igual a 42. Rpta: 272

59. El jefe de la oficina de seguridad del distrito de San Borja desea realizar una estimación de cuánto
tiempo, en promedio, estarían dispuestos a permanecer los vecinos escuchando charlas sobre
seguridad vecinal. En estudios anteriores se estimó que el tiempo promedio era de 45,25 minutos
con una varianza de 18,75 minutos2. ¿A cuántas personas se debería entrevistar si se estima un
error máximo de un minuto y una confianza del 95%? Suponga que esta variable se distribuye
normalmente. Rpta: 73

60. La máquina de refrescos de una universidad está ajustada de tal manera que la cantidad de líquido
despachada se distribuye aproximadamente en forma normal. ¿Qué tan grande se requiere que
sea la muestra si se desea tener una confianza de 98% de que su media muestral esté dentro de
0,05 centilitros del promedio real? Se cuenta con la siguiente información de una muestra
preliminar o piloto de tamaño 24. Rpta: 60

1,99 1,98 2,04 1,97 2,18 2,04 2,13 2,03 2,08 2,72 2,04 2,09
2,11 2,13 2,14 1,98 2,29 2,02 1,94 1,82 2,02 2,10 2,19 2,13

61. Una editorial desea evaluar la media muestral del tiempo de distribución de su último best seller
en cada uno de sus 400 puntos de venta. Para este estudio se desea tener un error de estimación
de tres minutos con un nivel de confianza del 90%. Además, se sabe que la desviación estándar
de los tiempos de distribución es de 17 minutos. ¿Qué tamaño de muestra debe emplearse para
el estudio? Rpta: 72
UPC MA444 Estadística 218
Caso: Cemento Tumbo

La empresa Cemento Tumbo considera que el tiempo de


secado del cemento tipo II es un factor muy importante en las
grandes edificaciones como puentes, túneles, represas, etc. El
encargado de control de calidad desea estimar el tiempo
promedio de secado del cemento tipo II.

Asumiendo un margen de error de 1,5 minutos y un nivel de


confianza de 95%, ¿cuántas bolsas de cemento deberá seleccionar para llevar a cabo dicha estimación?

Para obtener la desviación estándar tomará una muestra piloto de ocho bolsas del almacén mediante
muestreo simple aleatorio. S= 4.89898

Use las columnas C7, C11, C15 de la tabla de números aleatorios.

Considere que el marco muestral es el siguiente:

N° Tiempo N° Tiempo N° Tiempo N° Tiempo


1 40 8 43 15 41 22 35
2 47 9 36 16 44 23 42
3 47 10 38 17 42 24 42
4 40 11 47 18 47 25 45
5 38 12 39 19 43 26 37
6 37 13 50 20 41 27 49
7 37 14 50 21 38 28 43

Muestra:_
N° Posición Tiempo
1 16 44
2 27 49
3 01 40
4 24 42
5 18 47
6 09 36
7 19 43
8 22 35
UPC MA444 Estadística 219
Dos dígitos:

2
𝑍(1−𝛼) × 𝑠
2
𝑛=( )
𝑒

e=1.5
S= 4.89898

1 – α = 0.95 ; α = 0.05 ; 𝑍(1−𝛼) = 𝑍(1−0.05)= 𝑍(0.975)=1.96


2 2

1.96 × 4.89898 2
𝑛=( )
1.5

𝑛 = 40.97

El valor del tamaño de muestra se redondea siempre al entero mayor, por lo tanto, se necesita
seleccionar a una muestra de 41 bolsas de cemento.
UPC MA444 Estadística 220

Prueba de hipótesis
Es un procedimiento estadística que busca desmentir o corroborar la afirmación que se hace con
respecto a un parámetro

La prueba de hipótesis involucra una suposición acerca de un parámetro de la población. Después se


toma una muestra para ver si la hipótesis podría ser correcta.

La hipótesis que contrastamos se llama hipótesis nula (𝑯𝟎 ).


La hipótesis nula se contrasta con la hipótesis alternativa (𝑯𝟏 ).

Luego, a partir de los resultados obtenidos de la muestra, o bien rechazamos la hipótesis nula a favor
de la alternativa, o bien no rechazamos la hipótesis nula y suponemos que nuestra estimación inicial
del parámetro poblacional podría ser correcta.

El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta. Significa simplemente que los
datos de la muestra son insuficientes para inducir un rechazo de la hipótesis nula.

Contraste de hipótesis
La hipótesis que se contrasta es rechazada o no en función de la información muestral. La hipótesis
alternativa se especifica como opción posible si se rechaza la nula.

Tipos de errores

Información muestral
No rechazar H0 Rechazar H0
LIBERAR ENCARCELAR
H0 es cierta Error tipo I = α= Nivel de
No hay error
INOCENTE Significación
La realidad
H0 es falsa
Error tipo II No hay error
CULPABLE

Error tipo I
Ocurre cuando se rechaza una hipótesis H0 que es verdadera. La probabilidad de cometer error tipo I
viene a ser la probabilidad de rechazar H0 cuando ésta es cierta.

𝑃(Cometer error tipo 𝐼) = 𝑃(Rechazar Ho⁄Ho es cierta) = 𝛼

El valor  es fijado por la persona que realiza la investigación. Por lo general, 1%, 5% o 10%

Error tipo II
Ocurre cuando se acepta una hipótesis H0 que es falsa, la probabilidad de cometer error tipo II es la
probabilidad de no rechazar H0 cuando ésta es falsa.

𝑃(Cometer error tipo II) = 𝑃(No rechazar Ho⁄Ho es falsa) = 𝛽


UPC MA444 Estadística 221

Debido a que el valor real del parámetro es desconocido este error no puede ser fijado.
UPC MA444 Estadística 222
Pasos para realizar una prueba de hipótesis

Paso 1

• Plantear las hipótesis

Paso 2

• Fijar el nivel de significancia

Paso 3

• Calcular el estadístico de la prueba

Paso 4

• Establecer las regiones críticas

Paso 5

• Aplicar los criterios de decisión

Paso 6

• Realizar la conclusión
UPC MA444 Estadística 223
Prueba de hipótesis para una media con varianza poblacional desconocida
1. Plantear las hipótesis

Prueba unilateral izquierda Prueba bilateral Prueba unilateral derecha


𝐻0 : 𝜇 ≥ 20 𝐻0 : 𝜇 = 500 𝐻0 : 𝜇 ≤ 100
𝐻1 : 𝜇 < 20 𝐻1 : 𝜇 ≠ 500 𝐻1 : 𝜇 > 100

H0{ ≥ , = , ≤ ]

H1 { < , ≠ , > }

2. Fijar el nivel de significación . ; α =0.05 ; α =0.06


3. Calcular el valor del estadístico de la prueba. El estadístico sigue una distribución t Student.

̅ − 𝝁𝟎
𝑿
𝑻= ~𝒕𝒏−𝟏 𝒈𝒍
𝑺
√𝒏
La tabla t Student necesita los datos: probabilidad (cola) y grados de libertad (𝑔𝑙 = 𝑛 − 1).

4. Establecer las regiones críticas.

𝐻1 : 𝜇 < 𝜇0
Unilateral izquierda

Bilateral 𝐻1 : 𝜇 ≠ 𝜇0

Unilateral derecha 𝐻1 : 𝜇 > 𝜇0


UPC MA444 Estadística 224
5. Aplicar los criterios de decisión: Rechazar H0 o no rechazar H0.
6. Realizar la conclusión.
UPC MA444 Estadística 225
Ejemplo 1

Para la siguiente prueba de hipótesis bilateral, establezca la región crítica.

1. Plantear las hipótesis.


𝐻0 : 𝜇 = 5
𝐻1 : 𝜇 ≠ 5

2. Fijar el nivel de significación .


 = 𝟎, 𝟎𝟓

3. Estadístico de la prueba: Distribución t Student

̅ − 𝝁𝟎
𝑿
𝑻= ~𝒕𝒏−𝟏 𝒈𝒍
𝑺
√𝒏

Tamaño de muestra: 𝑛 = 10

La tabla t Student necesita los siguientes datos: probabilidad y grados de libertad (𝑔𝑙)

t(probabilidad, 𝑔𝑙) = t(0.025, 9) = 2.2622 (con todos los decimales)

Probabilidad (cola):

Grados de libertad: (𝑔𝑙 = 𝑛 − 1)

0.025 0.025

Bilateral 𝐻1 : 𝜇 ≠ 𝜇0

- 2.2622 = t(0.025, 9)
= 2.2622
UPC MA444 Estadística 226
Ejemplo 2

La lucha contra el COVID-19 también se lleva a cabo con el uso de la tecnología. Esta vez, se ve
desarrollada en robots que ayudan a desinfectar habitaciones de hospitales y centros médicos. Este
robot usa lámparas germicidas de irradiación ultravioleta (UVGI). La clave de este robot para que
funcione de manera autónoma está en el software que registra la máquina vía wifi en el servidor del
centro médico. Con el uso de este robot, todas las estancias hospitalarias quedan libres de cualquier
virus, pues con este método destruye tanto el ADN como el ARN que es donde justamente se
encuentra la programación genética de los virus y bacterias.

La clínica El Porvenir desea adquirir estos equipos para la desinfección de sus áreas. Pero el jefe de
adquisiciones sospecha que el promedio de los datos consumidos por el robot del modelo ASEPT-2X
es de 20 GB. Para confirmar esta suposición eligió una muestra de 10 robots de este modelo. Los datos
se presentan a continuación:

16 16 20 19 18 16 22 19 23 22

De confirmarse la sospecha, pedirá un lote previo de cinco robots con el fin de no congestionar la red
inalámbrica de la clínica. Use un nivel de significación es 𝛼 = 0,05.

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Define la Determina Establece las regiones Presenta un informe
problemática, variable, el correctamente críticas con el (los) sobre la problemática
señalando parámetro, la el valor del valor(es) crítico(s) que se deseaba
claramente el técnica estadístico de correcto(s). Fundamenta resolver, dando
objetivo del caso. estadística y prueba. correctamente la respuesta al objetivo.
presenta las decisión estadística y la
hipótesis. conclusión.

Solución

Usemos las cinco dimensiones del razonamiento cuantitativo.

Interpretación

Determinar si se debe adquirir un lote previo de cinco robots con el fin de no congestionar la red
inalámbrica de la clínica

Representación

Definamos la variable en estudio.

𝑋 ≔cantidad de datos consumidos diariamente por el robot (en gigabytes)

Definamos el parámetro en estudio.


𝜇 ≔media poblacional

Herramienta estadística: Prueba de hipótesis para la media poblacional


UPC MA444 Estadística 227
Plantear las hipótesis.
𝐻0 : 𝜇 = 20
𝐻1 : 𝜇 ≠ 20
Fijar el nivel de significación
𝛼 = 0,05

Cálculo
El valor del estadístico de prueba es:

𝑥 − 𝜇𝑜 19,1 − 20
𝑡𝑐 = 𝑠 = = −1,076
2,644
√𝑛 √10
Datos:

𝑋̅ =19.1
S = 2.6437
n = 10

t(0.025, 9) = 2.2622

t(0.975, 9) = - t(0.025, 9) = - 2.2622

La prueba es bilateral pues 𝐻1 : 𝜇 ≠ 𝜇0 .

-2,26216 2,26216
EFECTO ESPEJO:

 

0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
6 0.26483 0.55338 0.90570 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743 6
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948 7
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539 8
9 0.26096 0.54348 0.88340 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.57380 2.82144 3.24984 9
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927 10

Análisis
Como 𝑡𝑐 = −1,076 > −2,26216; entonces no se rechaza H0. Con un nivel de significación del 5%, es
posible afirmar que el consumo promedio de los datos que usan los robots es igual a 20 GB.

Argumentación
El jefe de adquisiciones sí deberá adquirir el lote previo de cinco robots del modelo ASEPT-2X.
UPC MA444 Estadística 228
UPC MA444 Estadística 229
Tabla de la distribución t-Student

Área bajo la curva 𝑃(𝑇 ≥ 𝑐) = 𝛼

  
0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1 0.32492 0.72654 1.37638 1.96261 3.07768 6.31375 7.91582 10.57889 12.7062 15.89454 21.20495 31.82052 63.65674 1
2 0.28868 0.61721 1.06066 1.38621 1.88562 2.91999 3.31976 3.89643 4.30265 4.84873 5.64278 6.96456 9.92484 2
3 0.27667 0.58439 0.97847 1.24978 1.63774 2.35336 2.60543 2.95051 3.18245 3.48191 3.89605 4.54070 5.84091 3
4 0.27072 0.56865 0.94096 1.18957 1.53321 2.13185 2.33287 2.60076 2.77645 2.99853 3.29763 3.74695 4.60409 4
5 0.26718 0.55943 0.91954 1.15577 1.47588 2.01505 2.19096 2.42158 2.57058 2.75651 3.00287 3.36493 4.03214 5
6 0.26483 0.55338 0.90570 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743 6
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948 7
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539 8
9 0.26096 0.54348 0.88340 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.57380 2.82144 3.24984 9
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927 10

11 0.25956 0.53994 0.87553 1.08767 1.36343 1.79588 1.92843 2.09614 2.20099 2.32814 2.49066 2.71808 3.10581 11
12 0.25903 0.53862 0.87261 1.08321 1.35622 1.78229 1.91231 2.07644 2.17881 2.30272 2.46070 2.68100 3.05454 12
13 0.25859 0.5375 0.87015 1.07947 1.35017 1.77093 1.89887 2.06004 2.16037 2.2816 2.43585 2.65031 3.01228 13
14 0.25821 0.53655 0.86805 1.07628 1.34503 1.76131 1.8875 2.04617 2.14479 2.26378 2.4149 2.62449 2.97684 14
15 0.25789 0.53573 0.86624 1.07353 1.34061 1.75305 1.87774 2.03429 2.13145 2.24854 2.39701 2.60248 2.94671 15
16 0.25760 0.53501 0.86467 1.07114 1.33676 1.74588 1.86928 2.02400 2.11991 2.23536 2.38155 2.58349 2.92078 16
17 0.25735 0.53438 0.86328 1.06903 1.33338 1.73961 1.86187 2.01500 2.10982 2.22385 2.36805 2.56693 2.89823 17
18 0.25712 0.53382 0.86205 1.06717 1.33039 1.73406 1.85534 2.00707 2.10092 2.21370 2.35618 2.55238 2.87844 18
19 0.25692 0.53331 0.86095 1.06551 1.32773 1.72913 1.84953 2.00002 2.09302 2.20470 2.34565 2.53948 2.86093 19
20 0.25674 0.53286 0.85996 1.06402 1.32534 1.72472 1.84433 1.99371 2.08596 2.19666 2.33624 2.52798 2.84534 20

21 0.25658 0.53246 0.85907 1.06267 1.32319 1.72074 1.83965 1.98804 2.07961 2.18943 2.32779 2.51765 2.83136 21
22 0.25643 0.53208 0.85827 1.06145 1.32124 1.71714 1.83542 1.98291 2.07387 2.18289 2.32016 2.50832 2.81876 22
23 0.25630 0.53175 0.85753 1.06034 1.31946 1.71387 1.83157 1.97825 2.06866 2.17696 2.31323 2.49987 2.80734 23
24 0.25617 0.53144 0.85686 1.05932 1.31784 1.71088 1.82805 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694 24
25 0.25606 0.53115 0.85624 1.05838 1.31635 1.70814 1.82483 1.97010 2.05954 2.16659 2.30113 2.48511 2.78744 25
26 0.25595 0.53089 0.85567 1.05752 1.31497 1.70562 1.82186 1.96651 2.05553 2.16203 2.29581 2.47863 2.77871 26
27 0.25586 0.53065 0.85514 1.05673 1.3137 1.70329 1.81913 1.96320 2.05183 2.15782 2.29091 2.47266 2.77068 27
28 0.25577 0.53042 0.85465 1.05599 1.31253 1.70113 1.81659 1.96014 2.04841 2.15393 2.28638 2.46714 2.76326 28
29 0.25568 0.53021 0.85419 1.0553 1.31143 1.69913 1.81424 1.95729 2.04523 2.15033 2.28217 2.46202 2.75639 29
30 0.25561 0.53002 0.85377 1.05466 1.31042 1.69726 1.81205 1.95465 2.04227 2.14697 2.27826 2.45726 2.75000 30

31 0.25553 0.52984 0.85337 1.05406 1.30946 1.69552 1.81000 1.95218 2.03951 2.14383 2.27461 2.45282 2.74404 31
32 0.25546 0.52967 0.85300 1.05350 1.30857 1.69389 1.80809 1.94987 2.03693 2.14090 2.27120 2.44868 2.73848 32
33 0.25540 0.5295 0.85265 1.05298 1.30774 1.69236 1.80629 1.9477 2.03452 2.13816 2.26801 2.44479 2.73328 33
34 0.25534 0.52935 0.85232 1.05248 1.30695 1.69092 1.80461 1.94567 2.03224 2.13558 2.26501 2.44115 2.72839 34
35 0.25528 0.52921 0.85201 1.05202 1.30621 1.68957 1.80302 1.94375 2.03011 2.13316 2.26219 2.43772 2.72381 35
36 0.25523 0.52908 0.85172 1.05158 1.30551 1.6883 1.80153 1.94195 2.02809 2.13087 2.25953 2.43449 2.71948 36
37 0.25518 0.52895 0.85144 1.05117 1.30485 1.68709 1.80012 1.94024 2.02619 2.12871 2.25702 2.43145 2.71541 37
38 0.25513 0.52883 0.85118 1.05077 1.30423 1.68595 1.79878 1.93863 2.02439 2.12667 2.25465 2.42857 2.71156 38
39 0.25508 0.52871 0.85094 1.05040 1.30364 1.68488 1.79751 1.93711 2.02269 2.12474 2.25240 2.42584 2.70791 39
40 0.25504 0.52861 0.85070 1.05005 1.30308 1.68385 1.79631 1.93566 2.02108 2.12291 2.25027 2.42326 2.70446 40
UPC MA444 Estadística 230
Ejemplo 3

Se sabe que el rendimiento promedio (en porcentaje) de un proceso químico es 12. Sin embargo,
últimamente se observa muchos valores menores. Para comprobar que efectivamente el rendimiento
promedio ha disminuido, se toma una muestra aleatoria de un lote de materia prima y se registra las
siguientes observaciones:

9,7 12,8 8,7 13,4 8,3 11,7 10,7 8,1 9,1 10,5

Suponiendo normalidad y a partir de la información muestral, verifique si efectivamente el


rendimiento promedio ha disminuido. Use α = 0,04.

PASO 1:

H0: µ ≥ 12
H1: µ < 12 (si efectivamente el rendimiento promedio ha disminuido)

PASO 2:
α = 0.04

PASO 3:
𝑥 − 𝜇𝑜 10.3 − 12
𝑡𝑐 = 𝑠 = = −2.886
1.8625
√𝑛 √10
Datos:

𝑋̅ = 10.3
S = 1.8625
n = 10

PASO 4:

VALOR CRITICO:

T(0.96,9) = - T(0.04,9) = - 1.9727


UPC MA444 Estadística 231

Gráfica de distribución
T, df=9
TC = -2.886
0.4

0.3
Densidad

0.2

0.1

0.04
0.0
T(0.96,9) = -1.973 0

PASO 5:

RHO

PASO 6:
A un nivel de significación del 4% SI se RH0, es decir SI existe suficiente evidencia estadística para
afirmar que efectivamente el rendimiento promedio ha disminuido

EJEMPLO DE CONCLUSION SI NO RH0

A un nivel de significación del 4% NO se RH0, es decir NO existe suficiente evidencia estadística


para afirmar que efectivamente el rendimiento promedio ha disminuido
UPC MA444 Estadística 232
Ejercicios propuestos

62. Las bombillas LED poseen un rendimiento promedio luminoso superior a todas las tecnologías
existentes. La empresa Solari afirma que el rendimiento luminoso de las bombillas LED que
produce es de 70 lumens/watio. Sin embargo, debido a la competencia en el mercado, introduce
nuevos cambios en su tecnología con la finalidad de lograr un mejor rendimiento.

Para poder comprobar los nuevos resultados, toma una muestra aleatoria de 61 bombillas
actuales, sometiéndolas a pruebas rigurosas, obteniendo un promedio de 75 lumens/watio y una
desviación estándar de 6,8 lumens/watio. Con un nivel de significación del 4%, ¿Se puede afirmar
que los nuevos cambios mejoraron el rendimiento promedio luminoso de las bombillas LED?

63. Cierto fabricante de motocicletas anuncia en un comercial de televisión que su vehículo rendirá
en promedio 87 millas por galón. Los millajes (recorrido en millas) en ocho viajes prolongados
fueron:

88 82 81 87 80 78 79 89

Al nivel de significación del 5% ¿el millaje medio es menor que el anunciado?

64. La densidad de ciertos fluidos es muy volátil por lo que se requiere que la densidad promedio
sobrepase al valor de 0,031 para poder utilizarlo. La empresa 3C Ingenieros, encargada de realizar
los análisis fisicoquímicos, debe evaluar la densidad de la sustancia XP90.

Para estos fines se seleccionó aleatoriamente 10 muestras de distintos lotes de producción y se


registró la densidad. Los datos se muestran a continuación:

0,033 0,040 0,031 0,034 0,036 0,031 0,036 0,034 0,034 0,032

¿La empresa 3C I g á XP90? α = 0,02.

65. Una de las últimas innovaciones en el campo de la iluminación es el proyector de cabeza móvil.
Este proyector está compuesto por un foco halógeno que permite variar la intensidad luminosa.
El gerente de ventas de la empresa Visual Systems ha decidido este año exportar este novedoso
proyector si la intensidad luminosa promedio de estos proyectores es superior a 2600 lúmenes.

Al seleccionar 12 proyectores y medir la intensidad luminosa de cada proyector se obtuvieron los


siguientes datos:

2600 2800 3000 2000 2400 2800 2700 2600 3000 3200 3100 2500

Suponiendo que la intensidad luminosa tiene distribución normal ¿Visual Systems deberá decidir
realizar la exportación del lote? Use un nivel de significación de 3%.

66. Según las últimas investigaciones en hidrografía, los ingenieros civiles usan actualmente
telémetros de láser manuales de bajo peso debido a su gran precisión al momento de realizar una
medición.
UPC MA444 Estadística 233
Un ingeniero civil de una importante constructora está encargado de analizar la eficiencia de una
marca de estos aparatos, por lo que decide realizar pruebas con este equipo, obteniendo los
siguientes resultados del error de lectura, en milímetros, en la localización de un objeto situado a
500 metros.

5,1 5,4 4,9 5,2 5,4 5,1 5,3 5,0 4,8

La calibración de un telemetro juega un papel muy importante en la exactitud de una medida. Si,
en promedio, los errores de lectura sobrepasan los 5 mm, estaríamos en una sobreestimación de
la lectura, por lo que debería ser devuelto al laboratorio de calibración para su ajuste. Usando la
información de la muestra ¿el telémetro debería ir al laboratorio de recalibración? Use un nivel de
significación del 4%.

67. Los drones tienen un accesorio en su fabricación llamado acelerómetro. Este accesorio registra
las variaciones de aceleración o velocidad en el aire. La norma de la Agencia Estatal de Seguridad
Aérea indica que la velocidad promedio que debe alcanzar un dron en áreas urbanas no debe
sobrepasar los 20,5 metros/segundo. Por lo tanto, ante la sospecha que no se está cumpliendo
con la norma, se seleccionaron al azar 42 drones y se realizó una prueba para medir sus
velocidades. A continuación, se presentan los resultados:

Distribución de drones probados según velocidad registrada


Velocidad (metros/segundo) Número de drones probados
[14,5 – 16,5] 7
]16,5 – 18,5] 9
]18,5 – 20,5] 14
]20,5 – 22,5] 8
]22,5 – 24,5] 4

¿Se puede afirmar que no se está cumpliendo con la norma? Use un nivel de significancia del 1%.
UPC MA444 Estadística 234
Caso: Aceros Perú

Aceros Perú es una empresa siderúrgica con más de 40 años de


experiencia, vende productos de alta calidad para los sectores de
la construcción, industria y minería. Entre sus principales
productos de producción tenemos las barras de acero corrugado
ASTM A615-grado 60 con diferentes medidas de producción.

Últimamente, se están importando productos siderúrgicos de


diferentes partes del mundo, razón por la cual el jefe del área de
Control de Calidad desea conocer el estado real de los diferentes
productos que comercializa para establecer hitos de control. Para ello, hará una investigación
minuciosa teniendo en cuenta las siguientes variables: longitud (metros), resistencia a la tracción
(kg/cm2), diámetro (cm), peso (kg).

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Define la variable, Determina Grafica las regiones Presenta un informe
problemática, el parámetro, la correctamente críticas con el (los) valor sobre la
señalando técnica el valor del (es) crítico (s) correcto (s). problemática que se
claramente el estadística y estadístico de Fundamenta deseaba resolver,
objetivo del caso. presenta las prueba. correctamente la decisión dando respuesta al
hipótesis. estadística y la conclusión. objetivo.

Objetivo: Determinar si se regularán las máquinas cortadoras de acero.

El jefe de Control de calidad ordena realizar el estudio de la longitud de las barras de acero ASTM A615-
grado 60, las cuales deben tener una longitud estándar de nueve metros. Según reclamos, los clientes
manifiestan que la longitud es menor a dicho valor. De ser cierto, procederá a regular las máquinas
cortadoras de las barras de acero. Para ello, seleccionó una muestra aleatoria de 20 barras de acero
ASTM A615- grado 60.

Con 5% de significación, ¿se procederá con la regulación de las máquinas cortadoras de barras de
acero? Utilice las cinco dimensiones para la solución del caso.

8,90 8,91 8,92 8,93 8,93 8,94 8,95 8,95 8,97 8,98
8,99 8,99 8,99 9,01 9,02 9,02 9,03 9,04 9,05 9,06
UPC MA444 Estadística 235

PASO 1:

H0: µ ≥ 9
H1: µ < 9 (procederá a regular las máquinas cortadoras de las barras de acero)

PASO 2:
α = 0.05

PASO 3:
𝑥 − 𝜇𝑜 8.979 − 9
𝑡𝑐 = 𝑠 = = −1.9245
0.0488
√𝑛 √20
Datos:

𝑋̅ = 8.979
S = 0.0488
n = 20

PASO 4:

VALOR CRITICO:

T(PROBABILIDAD,GRADOS DE LIBERTAD)

T(0.95,19) = - T(0.05,19) = - 1.7291

Gráfica de distribución
T, df=1 9
TC = -1 .925
0.4

0.3
Densidad

0.2

0.1

0.05
0.0
T(0.95,19) = -1.729 0
UPC MA444 Estadística 236
PASO 5:

RHO

PASO 6:
A un nivel de significación del 5% SI se RH0, es decir SI existe suficiente evidencia estadística para
afirmar que procederá a regular las máquinas cortadoras de las barras de acero
UPC MA444 Estadística 237

Prueba de hipótesis para una proporción poblacional


1. Plantear las hipótesis.

Prueba unilateral izquierda Prueba bilateral Prueba unilateral derecha


𝐻0 : 𝑝 ≥ 𝑝0 𝐻0 : 𝑝 = 𝑝0 𝐻0 : 𝑝 ≤ 𝑝0
𝐻1 : 𝑝 < 𝑝0 𝐻1 : 𝑝 ≠ 𝑝0 𝐻1 : 𝑝 > 𝑝0

2. Fijar el nivel de significación. 𝛼

3. Calcular el estadístico de la prueba.


𝑝̂ − 𝑝𝑜
𝑍= ~𝑍(0,1)
√𝑝𝑜 (1 − 𝑝𝑜 )
𝑛

4. Establecer las regiones críticas.

Unilateral izquierda 𝐻1 : 𝑝 < 𝑝0

Bilateral 𝐻1 : 𝑝 ≠ 𝑝0

Unilateral derecha 𝐻1 : 𝑝 > 𝑝0

5. Aplicar las reglas de decisión: Rechazar H0 o no rechazar H0.

6. Realizar la conclusión.
UPC MA444 Estadística 238

Ejemplo 1
Kubick S.A. es una empresa que fabrica y comercializa termas de uso doméstico e industrial. Debido a
los constantes reclamos presentados por los clientes sobre el mal funcionamiento de las termas a gas,
el ingeniero de planta sostiene que el porcentaje de unidades defectuosas producidas debe ser a lo
más 4%. Si esto no se cumple, se implementará un programa de capacitación a los trabajadores. A
partir de una muestra aleatoria de 150 termas a gas donde se encontró que 12 de ellas están
defectuosas. Usando un nivel de significación del 4%, ¿se llevará a cabo el programa de capacitación?

Solución
Interpretación
Determinar si se implementará un programa de capacitación para los trabajadores.

Representación
Variable: Funcionamiento de las termas a gas (buen funcionamiento, mal funcionamiento)
Parámetro: Proporción poblacional de terma a gas con mal funcionamiento
Herramienta: Prueba de hipótesis de la proporción

𝐻0 𝑝 ≤ 0,04
𝐻1 𝑝 > 0,04

El valor hipotético 𝑝0 es 0,04.

El nivel de significación es 4% es decir, α = 0,04.

Cálculo
La proporción muestral de terma a gas con mal funcionamiento es:

12
𝑝̂ = = 0,08
150

El valor del estadístico de prueba es:

𝑝̂ − 𝑝0 (0,08 − 0,04)
𝑍= = = 2,5
√𝑝0 (1 − 𝑝0 ) √0,04(1 − 0,04)
𝑛 150

La prueba es unilateral derecha pues 𝐻1 : 𝑝 > 0,04.

1,75
UPC MA444 Estadística 239
Análisis
Como 𝑍𝑐𝑎𝑙𝑐 = 2,5 > 𝑍𝑐𝑟í𝑡𝑖𝑐𝑜 = 1,75; se rechaza H0.

Conclusión
Con un nivel de significación del 4% es posible afirmar que el porcentaje de termas a gas defectuosas
es mayor al 4%.

Argumentación
Se sugiere implementar un programa de capacitación para los trabajadores de las plantas de la
empresa Kubick.

Ejemplo 2
El jefe de control de calidad de Whitney Motor está preocupado porque las máquinas de controlador
electrónico de motor (CEM), que fabrican, no se les ha dado el mantenimiento programado, y supone
que el porcentaje de CEMs con algún defecto de fabricación es superior a 20%. De ser cierta su
suposición, deberá detener el proceso de producción y realizar mantenimiento a dichas máquinas.
Para comprobarlo se seleccionó una muestra de 55 CEMs. Los resultados obtenidos del estado de
fabricación se presentan a continuación:

Distribución de CEMs según su estados de fabricación

Defectuoso
13

Normal
42

Fuente: Whitney Motor

¿Qué decisión tomará el jefe de control de calidad? Use un nivel de significación del 5%.

Solución
Interpretación

Determinar si el jefe de control de calidad no deberá detener el proceso de producción y realizar un


mantenimiento a dichas máquinas.

Representación

Variable: estado de fabricación (defectuoso, normal)


Parámetro: proporción poblacional de CEMs con algún defecto de fabricación
Herramienta: prueba de hipótesis para la proporción
UPC MA444 Estadística 240
𝐻0 𝑝 ≤ 0,20
𝐻1 𝑝 > 0,20

E v g f 4% , α = 0,04.

Cálculo

La proporción muestral de CEMs con algún defecto de fabricación es:

13
𝑝̂ = = 0,2364
55

El valor del estadístico de prueba es:

𝑝̂ − 𝑝 0,2364 − 0,20
𝑍= = = 0,6749
√𝑝(1 − 𝑝) √0,20(1 − 0,20)
𝑛 55

Análisis

La prueba es unilateral derecha, pues 𝐻1 : 𝑝 > 0,20.

1,65

Como 𝑍𝑐𝑎𝑙𝑐 = 0,6749 < 𝑍𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 1,65; no se rechaza H0. Con un nivel de significancia de 5%, no es
posible afirmar que el porcentaje de CEMs con algún defecto de fabricación es superior al 20%.

Argumentación

El jefe de control de calidad no deberá detener el proceso de producción y realizar mantenimiento a


dichas máquinas.
UPC MA444 Estadística 241

Ejemplo 3

La Municipalidad de Lima ampliará el presupuesto para fiscalizar las obras si más del 30% de las obras
de Lima no cumplen o cumplen parcialmente con las normas de seguridad y acabados en las obras
de construcción civil. Se selecciona al azar 94 obras y se obteniendo la siguiente gráfica:

Distribución de obras según el cumplimiento de las normas de seguridad

70 64
Número de obras

60
50
40
30 22
20
8
10
0
No cumplen Cumplen parcialmente Cumplen totalemnte

Fuente: Municipalidad de Lima Cumplimiento

Con un nivel de significación del 2% y asumiendo normalidad, ¿la Municipalidad de Lima ampliará
el presupuesto para fiscalizar las obras de construcción de Lima?
UPC MA444 Estadística 242

PASO 1:
H0: P ≤ 0.30
H1: P > 0.30 (La Municipalidad de Lima ampliará el presupuesto para fiscalizar las obras)

PASO 2:
α=0.02

PASO 3:

n=94
30
𝑝̂ = = 0.3191
94

El valor del estadístico de prueba es:

𝑝̂ − 𝑝0 (0.3191 − 0.30)
𝑍= = = 0.4041
√𝑝0 (1 − 𝑝0 ) √0.30(1 − 0.30)
𝑛 94

PASO 4:
H1: P > 0.30

VALOR CRITICO = Z(0.98) = 2.05

PASO 5: NO SE RH0
PASO 6: A un nivel de significación del 2%, no se RH0, es decir no existe suficiente evidencia
estadística para afirmar que La Municipalidad de Lima ampliará el presupuesto para fiscalizar
las obras
UPC MA444 Estadística 243
UPC MA444 Estadística 244
Ejercicios propuestos

68. Un fabricante sostiene que al menos el 95% de los equipos que envió a una fábrica está acorde
con las especificaciones técnicas. Una revisión de una muestra de 200 piezas reveló que 18 eran
defectuosas. Asumiendo normalidad, pruebe la afirmación del fabricante al nivel de significancia
de 1%.

69. El fabricante de un nuevo controlador de errores de comunicación asegura que la proporción de


procesos en los que se pierden datos cuando su controlador está operando es menor de 0,10. A
fin de probar esta aseveración, se vigila el enlace de comunicación entre una terminal de gráficos
y una computadora con el controlador de errores funcionando.

De una muestra de 300 elementos se observó que en 10 de ellos sí se perdieron datos cuando el
controlador del fabricante estaba operando. ¿La información recolectada refuta la aseveración
del fabricante? Use un nivel de significancia del 3%.

70. El jefe del área de Gestión Ambiental de la Municipalidad de Lima recomendará a la Municipalidad
de Los Olivos reformular el plan de segregación de residuos sólidos domiciliarios si más del 51%
de las viviendas de este distrito generan residuos de composición de materia orgánica. Para ello
se seleccionaron al azar 80 viviendas del distrito. Con un nivel de significancia del 4%, ¿los
resultados sustentan la recomendación del jefe del área de Gestión Ambiental de la Municipalidad
de Lima?

71. Una encuestadora realizó una consulta a los pobladores de la urbanización Lomas para saber si
están de acuerdo o no con la construcción de un nuevo centro comercial en el lugar. Al seleccionar
una muestra al azar de 250 pobladores de dicha urbanización, se obtuvo que 85 de ellos apoyaban
la construcción del nuevo centro comercial. La construcción empezará solo si más del 30% de los
ciudadanos apoyan el proyecto, de lo contrario se debe optar por otras urbanizaciones vecinas.
Realice la prueba estadística respectiva a un nivel de significación del 3%.

72. Los usuarios de la sustancia XP90 indican que cuando esta sustancia no es óptima ocurre un
fenómeno conocido como licuefacción y se requiere un reproceso. La certificadora, encargada de
la realización de los análisis fisicoquímicos, asegura que la proporción de reprocesos disminuye
cuando la sustancia está certificada por lo tanto una de las metas de la empresa es tener más del
20% de sustancias certificadas. De una muestra de 120 reprocesos se identificó que 26 usaron
sustancias certificadas. En base a esta información podemos afirmar que ¿la empresa ha logrado
la meta? Use un nivel de significación del 3%.
UPC MA444 Estadística 245
Prueba de hipótesis para la razón de varianzas poblacionales
1. Plantear las hipótesis

𝐻0 : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 ≠ 𝜎22

2. F j v g f :α

3. Calcular el estadístico de la prueba.

𝑆12
𝐹𝑐 = 𝐹(𝑛1 −1,𝑛2−1)
𝑆22

4. Establecer las regiones críticas.

Donde:
1
𝐹1 =
𝐹α⁄
2; 𝑛2 −1,𝑛1 −1

𝐹2 = 𝐹α⁄
2;𝑛1 −1,𝑛2 −1

5. Aplicar las reglas de decisión: Rechazar H0 o no rechazar H0.

6. Realizar la conclusión.
UPC MA444 Estadística 246
Ejemplo 1

La producción de compuestos inflamables es delicada y requiere técnicas muy precisas para lograr
resultados óptimos. Actualmente, en el laboratorio se aplica la técnica A y se desea probar una nueva
técnica, B. La siguiente información muestra el resultado de los tiempos, en minutos, que utilizó cada
técnica por proceso.

Técnicas Tamaño de muestra Promedio Desviación estándar


Técnica A 16 9,97 6,56
Técnica B 11 9,27 2,05

Un ingeniero desea probar si la variabilidad entre los tiempos usados por ambas técnicas no es similar.
Use  = 0,05

1. Plantear las hipótesis

𝐻0 : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 ≠ 𝜎22

2. Fijar el nivel de significación: α = 0,05

3. Calcular el valor del estadístico de la prueba.

𝑆12 6,562
𝐹𝑐 = = = 10,24
𝑆22 2,052

4. Establecer las regiones críticas.

donde:
1
𝐹1 = α
𝐹( ⁄2 ; 𝑛2 − 1, 𝑛1 − 1)

1 1
= = = 0,3268
𝐹(0,025; 10; 15) 3,06

𝐹2 = 𝐹(0,025, 15,10) = 3,52


UPC MA444 Estadística 247
Área bajo la curva: 𝑃(𝐹 ≥ 𝑐) = 𝛼
v1
𝜶 v2 1 2 3 4 5 6 7 8 9 10

0.050 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54
0.025 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06
0.010 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80
0.005 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42

v1
𝜶 v2 12 15 20 24 30 40 50 60 70 120
0.050 10 2.91 2.85 2.77 2.74 2.70 2.66 2.64 2.62 2.61 2.58
0.025 3.62 3.52 3.42 3.37 3.31 3.26 3.22 3.20 3.18 3.14
0.010 4.71 4.56 4.41 4.33 4.25 4.17 4.12 4.08 4.06 4.00
0.005 5.66 5.47 5.27 5.17 5.07 4.97 4.90 4.86 4.83 4.75

5. Aplicar las reglas de decisión.

Como Fc = 10,24 > F2 = 3,52, entonces Rechazar H0.

6. Realizar la conclusión.

Con un nivel de significancia del 5%, sí es posible afirmar que la variabilidad entre los tiempos
usados por ambas técnicas no es similar.
UPC MA444 Estadística 248
Prueba de hipótesis para la diferencia de medias poblacionales

Caso 1: Varianzas poblacionales desconocidas y homogéneas IGUALES

1. Plantear las hipótesis

Unilateral izquierda Bilateral Unilateral derecha

𝐻0 : 𝜇1 − 𝜇2 ≥ 𝑘 𝐻0 : 𝜇1 − 𝜇2 = 𝑘 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝑘

𝐻1 : 𝜇1 − 𝜇2 < 𝑘 𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑘 𝐻1 : 𝜇1 − 𝜇2 > 𝑘

Unilateral izquierda

H0: µ1 ≥ µ2
H1: µ1 < µ2

H0: µ1 - µ2 ≥ 0
H1: µ1 - µ2 < 0

Unilateral derecha

H0: µ1 ≤ µ2
H1: µ1 > µ2

H0: µ1 - µ2 ≤ 100
H1: µ1 - µ2 > 100

2. F j v g f :α

3. Calcular el valor del estadístico de prueba.

(𝑥1 − 𝑥2 ) − 𝑘
𝑡𝑐 = ~𝑡(𝑛1+𝑛2−2)
1 1
√𝑆𝑝2 ( + )
𝑛1 𝑛2

Calcular el valor de la varianza combinada 𝑆𝑝2 .


(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

4. Establecer las regiones críticas.


UPC MA444 Estadística 249

Unilateral izquierda 𝐻1 : 𝜇1 − 𝜇2 < 𝑘

−𝑡𝛼;𝑛1 +𝑛2−2

Bilateral 𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑘

−𝑡𝛼;𝑛 𝑡𝛼;𝑛
2 1 +𝑛2 −2 2 1 +𝑛2 −2

Unilateral derecha 𝐻1 : 𝜇1 − 𝜇2 > 𝑘

𝑡𝛼;𝑛1+𝑛2−2

5. Aplicar las reglas de decisión: Rechazar H0 o no rechazar H0.

6. Realizar la conclusión.

Caso 2: Varianzas poblacionales desconocidas y heterogéneas DIFERENTES

1. Plantear las hipótesis.

Unilateral izquierda Bilateral Unilateral derecha

𝐻0 : 𝜇1 − 𝜇2 ≥ 𝑘 𝐻0 : 𝜇1 − 𝜇2 = 𝑘 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝑘

𝐻1 : 𝜇1 − 𝜇2 < 𝑘 𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑘 𝐻1 : 𝜇1 − 𝜇2 > 𝑘

2. Fijar el nivel de significación. 𝛼


UPC MA444 Estadística 250
3. Calcular el estadístico de prueba.

(𝒙𝟏 − 𝒙𝟐 ) − 𝒌
𝒕𝒄 =
𝑺𝟐 𝑺𝟐
√ 𝟏+ 𝟐
𝒏𝟏 𝒏𝟐

Los grados de libertad se obtienen de la siguiente manera:

2
𝑆2 𝑆2
( 1 + 2)
𝑛1 𝑛2
𝜐= 2 2
𝑆2 𝑆2
( 1) ( 2)
𝑛1 𝑛2
+
(𝑛1 − 1) (𝑛2 − 1)

El valor de 𝑣 debe ser un valor entero y deberá redondearse al entero menor. Por ejemplo, si 𝑣 =
18,12608, entonces 𝑣 = 18.

4. Establecer las regiones críticas.

Unilateral izquierda 𝐻1 : 𝜇1 − 𝜇2 < 𝑘

−𝑡𝛼; 𝑣

Bilateral 𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑘

−𝑡𝛼; 𝑣 𝑡𝛼;𝑣
2 2

Unilateral derecha 𝐻1 : 𝜇1 − 𝜇2 > 𝑘

𝑡𝛼; 𝑣
UPC MA444 Estadística 251

5. Aplicar las reglas de la decisión: Rechazar H0 o no rechazar H0.

6. Realizar la conclusión.

Ejemplo 1
Para determinar la concentración de partículas de nitrato en el aire en dos centros poblados, Larrea
(Pasco) y San Marcos (Ancash), cuya principal actividad económica es la minería, se tomaron 8
muestras de aire en Larrea y 6 muestras de aire en San Marcos. Los resultados se muestran a
continuación:

Centros poblados Tamaño de muestra Media (fibra/litro) Desviación estándar (fibra/litro)


Larrea (1) n1 = 8 𝑋̅1 = 0,04806 S1 =0,00610
San Marcos (2) n2 =6 𝑋̅2 = 0,03286 S2= 0,00135

El Ministerio del Medio Ambiente, desea realizar una inspección exhaustiva de la calidad de aire que
respiran los habitantes de estos centros poblados, pero por cuestiones de presupuesto solo podrá
realizarlo en el centro poblado de Larrea, siempre y cuando se llegue a demostrar que la concentración
promedio de nitrato es mayor que en el centro poblado de San Marcos; caso contrario, se esperará el
próximo año para inspeccionar los dos centros poblados. Usando un nivel de significancia 5%. ¿Cuál
será la decisión que tomará el Ministerio de Medio Ambiente?

Solución
Resolviendo con las cinco dimensiones:

Interpretación
Determinar si el Ministerio de Medio Ambiente realizará una inspección exhaustiva de la calidad de
aire que respiran los habitantes de los centros poblados de Larrea y San Marcos; caso contrario, se
esperará el próximo año para inspeccionar los dos centros poblados.

Determinar si la inspección exhaustiva de la calidad de aire que respiran los habitantes se realizara
solo en el centro poblado de Larrea

Representación
Variable: Concentración de nitrato (fibra/litro)
Variable de agrupación: Centro poblado: Larrea (1) San Marcos (2)
Herramienta estadística: Prueba de hipótesis para la diferencia de medias y prueba de hipótesis
para la razón de varianzas

Cálculo
Para establecer cuál es el estadístico de prueba adecuado para la prueba de diferencia de medias
poblacionales, debemos realizar primero una prueba de razón de varianzas para determinar si
consideramos que las varianzas poblacionales son iguales o diferentes.
UPC MA444 Estadística 252

Prueba de hipótesis para la razón de varianzas (IGUALDAD DE VARIANZAS)

Las hipótesis para la razón de varianzas son:


PASO 1:

𝐻0 : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 ≠ 𝜎22

PASO 2:
El nivel de significancia es de  = 0,05.

PASO 3:

El valor del estadístico de prueba es:

𝑠12 0,006102
𝐹𝑐𝑎𝑙 = = = 20,42
𝑠22 0,001352
PASO 4:

F DE FISHER

Donde:

𝐹1 = 𝐹(0,975; 7; 5)

RECIPROCIDAD:

1 1 1
𝐹1 = = = = 0,1890
𝐹𝛼 ; 𝑛 𝐹0,025; 5; 7 5,29
2 2 −1,𝑛1 −1

F1 = 0.1892063
=INV.F(0.025,7,5)
𝐹2 = 𝐹(0,025; 7; 5) = 6,85
UPC MA444 Estadística 253

=INV.F.CD(0.025,7,5)

PASO 5:

Aplicando las reglas de decisión, se rechaza H0.

PASO 6:

Conclusión:
Con un nivel de significancia de 5%, es posible afirmar que las varianzas poblacionales son
heterogéneas. DIFERENTES

Prueba de hipótesis para la diferencia de medias

Las hipótesis para la diferencia de medias son:

𝐻0 𝜇1 ≤ 𝜇2
𝐻1 𝜇1 > 𝜇2

𝐻0 𝜇1 − 𝜇2 ≤ 0
𝐻1 𝜇1 − 𝜇2 > 0

PASO 1:

H0: µ1 - µ2 ≤ 0
H1: µ1 - µ2 > 0 (La inspección se realizara solo en el centro poblado de Larrea)

PASO 2:

El nivel de significancia es de  = 0,05.

PASO 3:

De acuerdo con la prueba de razón de varianzas, se acepta de las varianzas poblacionales son
heterogéneas, por lo tanto, el estadístico de la prueba adecuado para la diferencia de medias es:

(𝑥1 − 𝑥2 ) − 𝑘
𝑡𝑐𝑎𝑙 =
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2

Reemplazando los valores:

(0,04806 − 0,03286) − 0
𝑡𝑐𝑎𝑙 = = 𝟔, 𝟖𝟑
2 2
√0,00610 + 0,00135
8 6
UPC MA444 Estadística 254

Los grados de libertad del estadístico de prueba se obtienen de la siguiente manera:

2
𝑆2 𝑆2
( 1 + 2)
𝑛1 𝑛2
𝜐= 2 2
𝑆2 𝑆2
( 1) ( 2)
𝑛1 𝑛2
+
(𝑛1 − 1) (𝑛2 − 1)

Reemplazando los valores:


2
0,006102 0,001352
( + )
8 6
𝜐= 2 2 = 7,90
0,006102 0,001352
( ) ( )
8 6
+
(8 − 1) (6 − 1)

Los grados de libertad son 𝑣 = 7,90. SE REDONDEA AL ENTERO MENOR, 𝑣 = 7.

PASO 4:
La prueba es unilateral derecha.

1,89458

El valor crítico es 𝒕𝟎,𝟎𝟓; 𝟕 = 1,89458.

𝒕𝟎,𝟎𝟓; 𝟕 = TABLA DE CLASES

𝒕𝟎,𝟗𝟓; 𝟕 = 1.89457861 EN EXCEL

𝜐 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015
6 0.26483 0.55338 0.9057 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381
UPC MA444 Estadística 255

Análisis

PASO 5:

Como 𝑡𝑐𝑎𝑙 = 6,83 > 𝑡𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 1,89458, entonces se rechaza H0.

PASO 6:

Conclusión
A un nivel de confianza de 95%, existe evidencia estadística suficiente para afirmar que la
concentración promedio de nitrato en Larrea es mayor que en San Marcos.

Argumentación

Debido a que la concentración promedio de nitrato en Larrea es mayor que en San Marcos, el
Ministerio de Medio Ambiente realizará una inspección exhaustiva de la calidad de aire en el centro
poblado de Larrea.

Ejemplo 2

El tiempo de exposición, en minutos, de un metal con una sustancia química hasta lograr un adherido
perfecto es parte de un proceso de producción. Se considera que el menor tiempo de exposición es
mejor. Como parte de la mejora del proceso se somete a prueba dos procedimientos y se mide el
tiempo de exposición para dos muestras independientes.

Procedimiento Tamaño de muestra Media Desviación estándar

Procedimiento A 31 12,97 4,25

Procedimiento B 25 11,99 2,47

a. Asumiendo que los tiempos de exposición tienen distribución normal, ¿se puede afirmar que hay
diferencia en la variación de los tiempos? Use un nivel de significación del 10%.
UPC MA444 Estadística 256

b. Asumiendo que los tiempos de exposición tienen distribución normal y usando un nivel de
significación del 5%, ¿recomendaría el procedimiento B?
UPC MA444 Estadística 257
UPC MA444 Estadística 258
Ejercicios propuestos

73. Los siguientes datos corresponden a la resistencia a la compresión a los 28 días, en kg/cm 2,
reportados por dos laboratorios:

Laboratorio 1 287,0 238,2 314,3 365,9 362,0 388,7 292,9 290,3


Laboratorio 2 306,0 338,0 349,4 307,4 316,2 326,9

Con 5% de nivel de significación, ¿los laboratorios reportan resultados en promedio similares?


Asuma poblaciones normales.

74. La exactitud obtenida en mediciones con GPS depende del equipo receptor. Uno de los fabricantes
de receptores está realizando un estudio para comparar la exactitud de dos modelos, GPSMAP (1)
y Oregón (2). Según información del departamento de control de calidad, la exactitud del modelo
GPSMAP es menor que la de Oregón, por lo cual se sugiere dejar de fabricarla.

El jefe de producción seleccionó al azar dos muestras de receptores de ambos modelos con la
finalidad de realizar la prueba correspondiente y registra la exactitud, en mm, obtenida por ambos
receptores. Considerando que la exactitud se distribuye normalmente y con un nivel de
significación del 4%, ¿la empresa debe dejar de fabricar el modelo GPSMAP.

75. La empresa de ingeniería Y&F pertenece al rubro de la construcción. Para un proyecto realizado a
una empresa minera de Ancash, se tuvo como principal tarea el movimiento de tierras. Ante ello,
es evidente que el soporte de mantenimiento que necesita esta división es elemental para la
eficiencia del trabajo.

El jefe del área de mantenimiento enviará personal de la zona norte a la zona centro cuando los
costos de mano de obra en la zona centro superen a los costos en la zona norte. Para decidir, use
un nivel de significación del 4%.

Asuma que los costos se distribuyen normalmente y que las varianzas poblacionales son
desconocidas y homogéneas.

Costo de mano de obra en la zona Centro


2506,46 2563,99 2501,06 2581,49 2730,66 2544,64 2534,54 2666,93

Costo de mano de obra en la zona Norte


Tamaño de muestra Media Desviación estándar
10 2484,5 55,5

76. Un componente de los satélites son los paneles solares. La compañía Intelsat está probando dos
tipos de paneles solares: el EQM y el EM3, los cuales deben pasar un estricto control de calidad.
Según información del departamento de calidad si la potencia de los paneles solares EQM supera
en más de dos kw a los de EM3, se sugiere dejar de fabricar el modelo EM3.

El jefe de producción seleccionó al azar dos muestras de paneles de ambos modelos y registra las
potencias de estos. A continuación, se presenta la siguiente información:
UPC MA444 Estadística 259

Variable Tamaño de muestra Promedio Desviación estándar


Panel EQM (1) 16 27,21 1,620
Panel EM3 (2) 21 23,63 3,490

Considerando que la potencia se distribuye normalmente, con un nivel de significación del 5%, ¿se
debe dejar de fabricar el modelo EM3?
UPC MA444 Estadística 260
Caso: Constructora R&P

Constructora R&P es una empresa dedicada a la construcción de


puentes y carreteras. Recientemente adquirió la buena pro por parte
de la autoridad competente para la construcción de un puente en la
provincia de Virú al norte del país. Los fierros de construcción son
materiales básicos para la construcción del puente porque brinda la
resistencia a la flexión. En el mercado existen fierros de construcción
tanto de procedencia nacional como importados.

El jefe del área de compra de materiales sospecha que el promedio de la resistencia a la flexión de las
columnas es mayor cuando se usan los fierros de procedencia nacional que cuando se usan los fierros
importados. De ser cierta su sospecha, elegirá fierros nacionales para la construcción.

Para ello, seleccionó al azar registros del último año de la resistencia a la flexión, en kg/cm2, de las
columnas construidas con cada tipo de fierro obteniendo los siguientes resultados:

Fierro nacional (1) Fierro importado (2)


Tamaño de muestra n1=21 n2=16
Media 𝑋̅1 = 41,8 𝑋̅2= 39,1
Desviación estándar S1= 2,57 S2=2,02

Sabiendo que la resistencia a flexión de las columnas se distribuye normalmente y que sus varianzas
poblacionales son homogéneas. A un nivel de significación del 5% ¿cuál será la decisión del jefe del
área de compra de materiales?

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante El estudiante El estudiante grafica El estudiante
identifica la identifica la determina las regiones críticas presenta un informe
problemática y lo variable, la técnica correctamente, con el (los) valor(es) sobre la
redacta como estadística y con precisión, el crítico(s). problemática que se
problema o como presenta las valor del Fundamenta deseaba resolver,
objetivo. hipótesis. estadístico de correctamente la dando respuesta al
prueba. decisión estadística y objetivo.
la conclusión.
UPC MA444 Estadística 261
Solución
Resolviendo con las cinco dimensiones:

Interpretación

Determinar si El jefe del área de compra de materiales elegirá fierros nacionales para la construcción

Representación

Variable: la resistencia a la flexión, en kg/cm2


Variable de agrupación: procedencia de los fierros: Nacional (1), Importado (2)
Herramienta estadística: Prueba de hipótesis para la diferencia de medias

Cálculo

Prueba de hipótesis para la diferencia de medias

Las hipótesis para la diferencia de medias son:

𝐻0 𝜇1 ≤ 𝜇2
𝐻1 𝜇1 > 𝜇2

PASO 1:

H0: µ1 - µ2 ≤ 0
H1: µ1 - µ2 > 0 (elegirá fierros nacionales para la construcción)

PASO 2:

El nivel de significancia es de  = 0,05.

PASO 3:

De acuerdo con la prueba de razón de varianzas, se acepta de las varianzas poblacionales son IGUALES
homogéneas

Calcular el valor del estadístico de prueba.


UPC MA444 Estadística 262

Fierro nacional (1) Fierro importado (2)


Tamaño de muestra n1=21 n2=16
Media 𝑋̅1 = 41,8 𝑋̅2= 39,1
Desviación estándar S1= 2,57 S2=2,02

(𝑥1 − 𝑥2 ) − 𝑘 (𝑥1 − 𝑥2 ) − 0
𝑡𝑐 = = = 𝟑, 𝟒𝟔𝟐𝟏𝟓 ~𝑡(𝑛1 +𝑛2−2)
1 1 1 1
√𝑆𝑝2 ( + ) √𝑆𝑝2 ( + )
𝑛1 𝑛2 𝑛1 𝑛2

Calcular el valor de la varianza combinada 𝑆𝑝2 .


(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑝2 = = 5.52297
𝑛1 + 𝑛2 − 2

PASO 4:
La prueba es unilateral derecha.

Cuando las variancias IGUALES


El grado de libertad se busca como 𝑡(𝑛1 +𝑛2−2)= 𝑡(35)

1,6896

El valor crítico es 𝒕𝟎,𝟎𝟓; 𝟑𝟓 = 1.6896.

𝒕𝟎,𝟎𝟓; 𝟑𝟓 = TABLA DE CLASES

𝒕𝟎,𝟗𝟓; 𝟑𝟓 = 1.68957246 EXCEL

=INV.T(0.95, 35)
UPC MA444 Estadística 263

Análisis

PASO 5:

Como 𝒕𝒄𝒂𝒍 = 𝟑. 𝟒𝟔𝟐𝟏𝟓 > 𝒕𝒄𝒓𝒊𝒕𝒊𝒄𝒐 = 𝟏, 𝟔𝟖𝟗𝟔, entonces se rechaza H0.

PASO 6:

Conclusión
A un nivel de significación 5%, SI existe evidencia estadística suficiente para afirmar que se debe elegir
fierros nacionales para la construcción

Argumentación

Debido a que el promedio de la resistencia a la flexión de las columnas es mayor cuando se usan los
fierros de procedencia nacional que cuando se usan los fierros importados. El jefe del área de compra
de materiales debe elegir fierros nacionales para la construcción
UPC MA444 Estadística 264

Unidad 4. Otros tópicos de Estadística:


Análisis de varianza y análisis de regresión

Logro
Al finalizar la unidad, el estudiante aplica el análisis de varianza y análisis de regresión en casos
relacionados a su especialidad.

Temario
• Análisis de varianza de un factor
• Comparaciones múltiples con Minitab
• Regresión simple: diagrama de dispersión
• Estimación de los parámetros.
• Descomposición de la varianza total
• Validación del modelo
• Coeficiente de determinación, error estándar de la estimación y coeficiente de correlación

Bibliografía
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a la
Ingeniería. México, D.F: McGraw-Hill, pág. 561 - 576.
• Mendenhall, W., Beaver, R. & Beaver, B. (2010) Introducción a la Probabilidad y Estadística pág.
425 - 428.
• Estadística. Mario Triola. 11a. Edición. Pearson Educación, México 2013 519.5 TRIO/E 2013 pág.
568.
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, pág. 483 – 506.
• Mendenhall, W., Beaver, R. & Beaver, B. (2010) Introducción a la Probabilidad y Estadística pág.
482 -488.
• Estadística. Mario Triola. 11a. Edición. Pearson Educación, México 2013 519.5 TRIO/E 2013.
UPC MA444 Estadística 265
UPC MA444 Estadística 266
Diseño de experimentos
Un experimento diseñado es una prueba o serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada (factores controlables) de un proceso o sistema, de manera
que sea posible observar e identificar las causas de los cambios en la variable de salida (variable
respuesta).

Variable de entrada
(Factores Variable de salida
Proceso
controlables y no (Variable respuesta)
controlables)

Ejemplo 1

Se tiene dos poblaciones, una de hombres y otra de mujeres. Se quiere saber si el ingreso promedio
mensual de los trabajadores hombres similar al de las mujeres.

N1: hombres N2: mujeres

¿µ1 = µ2?

n1 n2
𝑥̅1 𝑥̅2

Variable en estudio El ingreso mensual

Poblaciones (variable de agrupación) Sexo

Elemento Un Trabajador

Parámetro El ingreso promedio poblacional mensual

Herramienta estadística PH de Diferencia Medias


UPC MA444 Estadística 267
Conceptos generales
Factor
Variable independiente que afecta los resultados del experimento: controlables o no controlables. En
un experimento se puede evaluar uno o más factores.

Tratamiento
Un tratamiento corresponde a los niveles de un factor o a la combinación de los niveles de dos o más
factores. Es un conjunto de procedimientos cuyo efecto sobre la variable respuesta nos interesa
estudiar. Su efecto se mide y se compara con otros tratamientos.

Variable respuesta
Es la variable en la cual se evaluarán los efectos de los tratamientos.

Unidad experimental
Es la unidad, sujeto u objeto, al el cual se le aplica un tratamiento.

Ejemplo 2

Se tiene tres poblaciones, una de alumnos en modalidad presencial, otra en blended y otra en línea. Se
quiere saber si la nota promedio de los alumnos es similar en las tres modalidades.

N1: modalidad presencial N2: modalidad blended N3: modalidad en línea

¿µ1 = µ2 = µ3?

n1 = 5 n2 = 10 n3 = 5

𝑥̅1 𝑥̅2 𝑥̅3


UPC MA444 Estadística 268
Antes Ahora Identifique

Variable en estudio Variable respuesta La nota

Poblaciones (variable de agrupación) Factor Modalidad de estudio

Presencial, Blended, En
Categorías de la variable de agrupación Tratamientos
Linea
Elemento Unidad de análisis Un Alumno

Herramienta estadística Análisis de Variancia de un Factor

A continuación, se presentan los datos recolectados, los mismos que se han tabulado en una matriz de
datos. El 𝑌𝑖𝑗 representa la variable en estudio, siendo 𝑖 el tratamiento y 𝑗 las repeticiones.

Tratamientos
Repeticiones
Tratamiento 1 Tratamiento 2 Tratamiento 3
1 𝑌11 𝑌21 𝑌31
2 𝑌12 𝑌22 𝑌32
3 𝑌13 𝑌23 𝑌33
… … … …
𝑗 𝑌1𝑗 𝑌2𝑗 𝑌3𝑗
… … … …
𝑛𝑖 𝑌1𝑛1 𝑌2𝑛2 𝑌3𝑛3
Total 𝒀𝟏. 𝒀𝟐. 𝒀𝟑.

Ejemplo 3

El gerente de una compañía dedicada a ensamblar piezas de equipos electrónicos realizó un estudio
con el fin de comparar la eficacia de tres programas de capacitación, A, B y C. Para ello se asignaron
al azar quince empleados, cinco a cada uno de los tres programas. Después de terminado los cursos de
capacitación se registró el tiempo, en minutos, que les tomó ensamblar las piezas en los equipos
electrónicos.

Complete lo solicitado:

El tiempo de ensamblaje min


Variable respuesta
Programa de capacitación
Factor
A, B, C
Tratamientos
Un empleado
Unidad experimental
UPC MA444 Estadística 269
Diseño completamente al azar
En el diseño completamente al azar (DCA) suponga que se cuenta con los resultados de 𝑘 muestras
aleatorias independientes, cada una de tamaño 𝑛𝑖 , obtenidas desde 𝑘 diferentes poblaciones y se
desea probar la hipótesis de que las medias de estas 𝑘 poblaciones son todas iguales.

Las poblaciones que se desea comparar suelen ser producto de la aplicación de distintos tratamientos
a ciertas unidades de análisis.

Considere el caso en el que se desea comparar el efecto de cinco programas de incentivos en la


productividad de los trabajadores.

En este caso:
• Los cinco programas de incentivos serían los cinco tratamientos aplicados (los cuales definen las
cinco poblaciones que se van a comparar).
• La unidad de análisis sería un trabajador (quien recibe el tratamiento).

Los datos para analizar pueden arreglarse en una tabla como la que se muestra a continuación:

Tratamientos
Repeticiones
Tratamiento 1 Tratamiento 2 … Tratamiento i … Tratamiento k
1 𝑌11 𝑌21 … 𝑌𝑖1 … 𝑌𝑘1
2 𝑌12 𝑌22 … 𝑌𝑖2 … 𝑌𝑘2
3 𝑌13 𝑌23 … 𝑌𝑖3 … 𝑌𝑘3
… … … … … … …
𝑗 𝑌1𝑗 𝑌2𝑗 … 𝑌𝑖𝑗 … 𝑌𝑘𝑗
… … … … … … …
𝑛𝑖 𝑌1𝑛1 𝑌2𝑛2 … 𝑌𝑖𝑛𝑖 … 𝑌𝑘𝑛𝑘
Total 𝒀𝟏. 𝒀𝟐. … 𝒀𝒊. … 𝒀𝒌.

Para probar la hipótesis se deben probar los siguientes supuestos:

• Homogeneidad de las varianzas


• Normalidad de los errores.

Supuesto 1: Homogeneidad de varianzas

Las hipótesis son:

𝐻0 : 𝜎12 = 𝜎22 = 𝜎32 = 𝜎42


𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜎𝑖2 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒; 𝑖 = 1, 2, 3, 4

La hipótesis 𝐻0 significa la varianza es la misma en las cuatro sucursales y la hipótesis 𝐻1 significa que
al menos una varianza es diferente.
UPC MA444 Estadística 270
Los resultados de Minitab son:

Test for Equal Variances for Depósitos

Bartlett's Test

1 Test Statistic 0.19


P-Value 0.980
Levene's Test
Test Statistic 0.04
P-Value 0.988
2
Sucursal

0.5 1.0 1.5 2.0 2.5 3.0


95% Bonferroni Confidence Intervals for StDevs

Como el p valor (P-value) es mayor al nivel de significancia 𝛼 = 0.05 (0,988 > 0,05), no se rechaza H0,
el resultado de esta prueba indica que no hay suficiente evidencia estadística afirmar que alguna de
las varianzas poblacionales es diferente, es decir, se acepta que el supuesto de homogeneidad de
varianzas al 5% de nivel de significancia.

Supuesto 2: Normalidad de los errores


Las hipótesis son:

𝐻0 : Los errores del modelo sí tienen distribución normal


𝐻1 : Los errores del modelo no tienen distribución normal

Los resultados de Minitab son:

Probability Plot of RESI1


Normal
99
Mean 5.551115E-17
StDev 0.9708
95 N 28
KS 0.081
90
P-Value >0.150
80
70
Percent

60
50
40
30
20

10
5

1
-2 -1 0 1 2
RESI1

Como el p valor (P-value) es mayor al nivel de significancia 𝛼 (0,150 > 0,05), no se rechaza H0, el
resultado de esta prueba indica que no hay suficiente evidencia estadística para afirmar que los errores
del modelo no tienen distribución normal, es decir se acepta el supuesto de normalidad al 5% de nivel
de significancia.
UPC MA444 Estadística 271
Observación

Ambos supuestos se han obtenido con el software Minitab. Para efectos del curso se asumirán ambos
supuestos.

El modelo para este diseño es el siguiente:

𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 𝑖 = 1, 2, ⋯ , 𝑘 ; 𝑗 = 1, 2, ⋯ , 𝑛𝑖

donde:
𝑦𝑖𝑗 : = valor observado del 𝑖-ésimo tratamiento en la 𝑗-ésima repetición
𝜇 : = efecto de la media poblacional
𝜏𝑖 : = efecto del 𝑖-ésimo tratamiento
𝜀𝑖𝑗 : = error experimental asociado a la observación 𝑦𝑖𝑗

Por ejemplo, podríamos usar en análisis de varianza para responder a las siguientes situaciones:

• Una importante compañía de construcciones desea comparar tres marcas de taladros para
determinar cuánto tiempo pasa antes de necesitar una reparación; si los tiempos de vida de los
taladros de cada marca se distribuyen normalmente. ¿Las marcas de taladro tienen un tiempo de
vida útil promedio similar a las otras marcas antes de requerir una reparación?

• Un ingeniero civil residente de una obra desea evaluar el efecto que tiene las técnicas de mezclado
de concreto sobre la resistencia (kg/cm2) a la compresión. Para ello evalúa cuatro técnicas
diferentes y para realizar la prueba produce especímenes de concreto. ¿La resistencia promedio a
la compresión es la misma para cada técnica de mezclado?

• Una empresa constructora brinda capacitación con diferentes métodos a sus operarios. ¿El
rendimiento promedio de los operarios en la empresa es el mismo según los métodos de
adiestramiento recibido por el operario?

• Una importante compañía de construcciones desea comparar tres marcas de camiones antes de
ordenar toda una nueva flota de una clase de camión. ¿Los costos medios de operación por
kilómetro de cada camión es el mismo para cada marca de camión?
UPC MA444 Estadística 272
Análisis de la varianza

El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar tres o más medias.
Se desea medir el efecto del factor en estudio (variable independiente de naturaleza cualitativa o
cuantitativa) sobre la variable respuesta (variable dependiente de naturaleza cuantitativa).

En un diseño completamente al azar (DCA) los tratamientos se asignan aleatoriamente a las unidades
experimentales.

Hay k poblaciones (k tratamientos) y se seleccionan k muestras aleatorias independientes, una de cada


población.

Esta técnica estadística permite descomponer la variabilidad total de los resultados de un experimento
en sus distintas fuentes (tratamientos, error experimental), con la finalidad de compararlas e
identificar su importancia relativa en la explicación de la variación total.

Variabilidad entre grupos Variabilidad dentro de los grupos

•Mide el efecto de los tratamientos •Mide la variabilidad del error experimental

Tabla del ANOVA o ANVA


Fuente de
Grados de libertad Suma de cuadrados Cuadrado medio Fc
variación
𝑆𝑀𝑇𝑅
Tratamientos 𝑘−1 𝑆𝐶𝑇𝑅 𝐶𝑀𝑇𝑅 =
𝑘−1 𝐶𝑀𝑇𝑅
𝑆𝐶𝐸 𝐶𝑀𝐸
Error 𝑛−𝑘 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅 𝐶𝑀𝐸 =
𝑛• − 𝑘

Total 𝑛−1 𝑆𝐶𝑇

La prueba para 𝑘 medias o el análisis de varianza se basa en la descomposición de la variación total de


los datos con respecto a la media global (𝑆𝐶𝑇) en dos partes:

𝑘 𝑛𝑖 𝑘 𝑛𝑖
2
2 𝑦..2
𝑆𝐶𝑇 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅) = ∑ ∑ 𝑦𝑖𝑗 −
𝑛.
𝑖=1 𝑗=1 𝑖=1 𝑗=1

Variación dentro de las muestras o variación intragrupos que denotaremos como 𝑆𝐶𝑇𝑅.

𝑘 𝑘
𝑦𝑖.2 𝑦..2
𝑆𝐶𝑇𝑅 = ∑ 𝑛𝑖 (𝑦̅𝑖 − 𝑦̅)2 =∑ −
𝑛𝑖 𝑛.
𝑖=1 𝑖=1
UPC MA444 Estadística 273
Variación entre muestras o variación intergrupos que denotaremos como 𝑆𝐶𝐸.

𝑘 𝑛𝑖
2
𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖 )
𝑖=1 𝑗=1

donde:

𝑆𝐶𝑇: Suma de cuadrados del total


𝑆𝐶𝑇𝑅: Suma de cuadrados de los tratamientos
𝑆𝐶𝐸: Suma de cuadrados del error
𝑛𝑖 : Tamaño de muestra del 𝑖-ésimo tratamiento
𝑛: Tamaño de muestra total 𝑛 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘
𝑘: Número de tratamientos
𝑌𝑖 : Total de la 𝑖-ésima muestra 𝑌 = 𝑌1 + 𝑌2 + ⋯ + 𝑌𝑘

Asumiendo el cumplimiento de los supuestos antes mencionados, y que en realidad no hay diferencia
entre los tratamientos, la cantidad Fc del cuadro de análisis de varianza seguiría una distribución F con
los grados de libertad del tratamiento y con los grados de libertad del error.

Entonces, se puede utilizar esta distribución para evaluar la hipótesis nula de que no hay diferencias
entre las medias de los tratamientos.

Hipótesis estadística

1. Formular las hipótesis.

𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑎 𝑙𝑜𝑠 𝑑𝑒𝑚á𝑠

𝐻0 es la afirmación de que no hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio no afecta a la variable respuesta.

𝐻1 es la afirmación de que sí hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio sí afecta a la variable respuesta.

2. Fijar el nivel de significación. 𝛼

3. Calcular el estadístico de prueba.

𝐶𝑀𝑇𝑅
𝐹𝑐 =
𝐶𝑀𝐸

4. Establecer la región crítica.

El valor crítico es:


𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 𝐹; 𝑔𝑙 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜; 𝑔𝑙 𝑒𝑟𝑟𝑜𝑟 = 𝐹; 𝑘−1; 𝑛−𝑘
UPC MA444 Estadística 274
5. Aplicar los criterios de decisión.

El valor crítico es:

𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 𝐹; 𝑔𝑙 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜; 𝑔𝑙 𝑒𝑟𝑟𝑜𝑟 = 𝐹; 𝑘−1; 𝑛−𝑘

Para tomar una decisión seguimos la siguiente regla:

Si 𝐹𝑐 ≤ 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 , no se rechaza 𝐻0
Si 𝐹𝑐 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 , sí se rechaza 𝐻0

6. Realizar la conclusión.

Ejemplo 1
La gerente de mercadeo de un banco planea poner en marcha cierto tipo de promociones para atraer
nuevos clientes en cuatro sucursales del banco. Ella está convencida que diferentes tipos de
promociones atraerán a personas de diferentes grupos de ingreso, por lo que, de haber diferencias
entre los ingresos medios de los clientes de cada sucursal, se optará por un programa de
promociones distinto para cada una.

Considere a los montos de los depósitos, en miles de soles, como una medida representativa de los
ingresos de los clientes. Se presentan datos para una muestra de siete depósitos de cada sucursal
¿Debe la gerente optar por un programa de promociones distinto para cada sucursal? Evalúe esta
posibilidad con un nivel de significación del 5%.

Depósito Sucursal 1 Sucursal 2 Sucursal 3 Sucursal 4


1 Y11 = 5,3 Y21 = 3,3 Y31 = 3,6 Y41 = 4,3
2 Y12 = 2,6 Y22 = 4,6 Y32 = 2,8 Y42 = 2,5
3 Y13 = 3,6 Y23= 2,1 Y33 = 4,5 Y43 = 1,8
4 Y14 = 3,8 Y24 = 3,5 Y34 = 3,8 Y44 = 3,0
5 Y15 = 2,7 Y25 = 5,0 Y35 = 1,9 Y45 = 3,9
6 Y16 = 5,1 Y26 = 2,8 Y36 = 4,1 Y46 = 3,5
7 Y17 = 4,2 Y27 = 2,5 Y37 = 5,1 Y47 = 4,1
Total, Yi. Y1. = 27,3 Y2. = 23,8 Y 3. = 25,8 Y 4. = 23,1

Solución

Variable respuesta los montos de los depósitos, en miles de soles

Factor Sucursal

Tratamientos Sucursal 1, Sucursal 2, Sucursal 3, Sucursal 4

Unidad experimental Un cliente


UPC MA444 Estadística 275

1. Formular las hipótesis.

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑎 𝑙𝑜𝑠 𝑑𝑒𝑚á𝑠; 𝑖 = 1, 2, 3, 4

𝐻0 es la afirmación de que no hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio no afecta a la variable respuesta.

𝐻1 es la afirmación de que sí hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio sí afecta a la variable respuesta.

2. Establecer el nivel de significación.

 = 0,05

3. Calcular el valor del estadístico de prueba.

FC = ¿???

Los cálculos para obtener las sumas de cuadrados son:

2
𝑦..2 (∑𝑘=4 7
𝑖=1 ∑𝑗=1 𝑦𝑖𝑗 ) (27,3 + 23,8 + 25,8 + 23,1)2 1002
𝑇𝐶 = = = = = 357,1429
𝑛 ∑𝑘=4
𝑖=1 𝑛𝑖 7+7+7+7 28

La suma de cuadrados total es:

𝑘=4 7
2 𝑦..2
𝑆𝐶𝑇 = ∑ ∑ 𝑦𝑖𝑗 − = (5,32 + 2,62 + ⋯ + 4,12 ) − 357,1429 = 27,0171
𝑛.
𝑖=1 𝑗=1

La suma de cuadrados de los tratamientos es:

𝑘=4
𝑦𝑖.2 𝑦..2 27,32 23,82 25,82 23,12
𝑆𝐶𝑇𝑅 = ∑ − =( + + + ) − 357,1429 = 1,568
𝑛𝑖 𝑛. 7 7 7 7
𝑖=1

La suma de cuadrados de los errores es:

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅 = 27,0171 − 1,568 = 25,4486


UPC MA444 Estadística 276

La tabla del análisis de varianza:

Fuente de Grados de Suma de


Cuadrados medio Fcalculado
variación libertad cuadrados
𝑘−1 =4−1 1,569 0,523
Tratamientos 𝑆𝐶𝑇𝑅 = 1,569 𝐶𝑀𝑇𝑅𝐴𝑇 = = 0,523 𝐹𝐶 = = 𝟎, 𝟒𝟗
=3 3 1,060
𝑛 − 𝑘 = 28 − 4 25,449
Error 𝑆𝐶𝐸 = 25,449 𝐶𝑀𝐸 = = 1,060
= 24 24
𝑛 − 1 = 28 − 1
Total 𝑆𝐶𝑇 = 27,017
= 27

El valor del estadístico de prueba es:


𝑭𝒄𝒂𝒍𝒄𝒖𝒍𝒂𝒅𝒐 = 𝟎, 𝟒𝟗

4. Establecer la región crítica.

Esta es una prueba unilateral izquierda.

El valor crítico es:

𝑭𝒄𝒓𝒊𝒕𝒊𝒄𝒐 = 𝑭; 𝒈𝒍 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔; 𝒈𝒍 𝒆𝒓𝒓𝒐𝒓 = 𝑭( ; 𝒌−𝟏; 𝒏−𝒌= 𝑭𝟎,𝟎𝟓; 𝟑; 𝟐𝟒 = 𝟑, 𝟎𝟏

𝑭𝒄𝒓𝒊𝒕𝒊𝒄𝒐 = 𝑭(; 𝒈𝒍 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔; 𝒈𝒍 𝒆𝒓𝒓𝒐𝒓) = 𝑭(𝟎. 𝟎𝟓, 3,24) =

v1
𝜶
v2 1 2 3 4 5 6 7 8 9 10

0.050 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25
0.025 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64
0.010 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17
0.005 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59
UPC MA444 Estadística 277

5. Aplicar los criterios de decisión.

𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 0,49 < 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 3,01; entonces no se rechaza 𝑯𝟎 .

6. Realizar la conclusión.

Al 5% de significación, no es posible afirmar que al menos un depósito promedio sea diferente a los
demás.
UPC MA444 Estadística 278
Método de comparaciones múltiples: Prueba de Tukey - Kramer
Se supone que el experimentador tiene a su disposición mediciones relativas a varios tratamientos. El
análisis de varianza indica si hay evidencias de que al menos una de las medias sea diferente o no.
Cuando se rechaza la hipótesis nula, el análisis de varianza no revela cuál o cuáles de las medias son
significativamente diferentes; en estos casos se deben utilizar otras pruebas estadísticas.

Cuando el experimentador desea determinar todos los pares de medias que se puede concluir que
difieren de otro (µi versus µj) se utilizan las pruebas de comparaciones múltiples como la de Tukey -
Kramer con el fin de probar todas las hipótesis nulas simultáneas.

Las hipótesis son:

𝐻0 : 𝜇1 − 𝜇𝑗 = 0
𝐻1 : 𝜇1 − 𝜇𝑗 ≠ 0

El estadístico de prueba es:

𝑥̄ 𝑖 . − 𝑥̄𝑗 .
𝑡=
𝐶𝑀𝐸 1 1
√ 2 (𝑟 + 𝑟 )
𝑖 𝑗

donde:

𝑟𝑖 y 𝑟𝑗 son los tamaños de muestra de los tratamientos 𝑖 y 𝑗, respectivamente.

Ejemplo 1
Croma Color S.A. es una empresa especializada en la comercialización de pinturas envasadas a nivel
industrial, comercial y residencial. Usan tecnología de ósmosis inversa, nano filtración, microfiltración,
entre otras.

El gerente de marketing propone lanzar una campaña publicitaria para incrementar las ventas de las
pinturas. La campaña publicitaria se lanzará solo en el distrito o distritos donde las ventas promedio,
en miles de soles, sean menores.

Para identificar el distrito dónde se lanzará la campaña publicitaria, se registró el monto de venta, en
miles de soles, de algunos meses del último año tomados al azar. Los resultados se presentan a
continuación:

Santa Anita Breña Ate


70 30 40
60 40 50
60 30 70
80 40 80
60 40 60
UPC MA444 Estadística 279

Los resultados de la prueba de Tukey – Kramer son:

Factor N Mean Grouping


Santa Anita 5 66.00 A
Ate 5 60.00 A
Breña 5 36.00 B

¿En qué distrito o distritos se debe lanzar la campaña publicitaria? Utilice un nivel de significación del
1%.

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Identifica el factor, Realiza la prueba de Realiza y analiza Sustenta los
problemática, tratamientos, la técnica las comparaciones resultados
señalando variable de estadística aplicada múltiples encontrados en la
claramente el respuesta, unidad e interpreta. muestra y brinda
objetivo del experimental una
caso. Identifica la técnica recomendación al
estadística a usar. problema.

Solución

Interpretación

Determinar en qué distrito o distritos se debe lanzar la campaña publicitaria.

Representación

Factor: Distrito
Tratamientos: Santa Anita, Breña, Ate
Variable respuesta: Monto de ventas de pintura envasada, en miles de soles
Unidad experimental: Un mes de venta de pintura envasada
Herramienta estadística: Usaremos la herramienta del diseño completamente al azar (DCA)

1. Formular las hipótesis.

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑎 𝑙𝑎𝑠 𝑑𝑒𝑚á𝑠; 𝑖 = 1, 2, 3

2. Establecer el nivel de significación.

 = 0,05
UPC MA444 Estadística 280
Cálculo

PASO 3: FC= ¿???

3. Calcular el valor del estadístico de prueba.

Fuente de Suma de
Grados de libertad Cuadrados medio Fcalculado
variación cuadrados
2520 𝟏𝟐𝟔𝟎
Tratamientos 𝑘– 1 = 3 − 1 = 2 𝑆𝐶𝑇𝑅 = 2520 = 1260 𝐹𝐶 = = 𝟏𝟎, 𝟓
2 𝟏𝟐𝟎
1440
Error 𝑛 − 𝑘 = 15 − 3 = 12 𝑆𝐶𝐸 = 1440 = 120
12

Total 𝑛 − 1 = 15 − 1 = 14 𝑆𝐶𝑇 = 3960

Finalmente, la tabla del análisis de varianza es:

Fuente de Suma de
Grados de libertad Cuadrado medio Fcalculado
variación cuadrados
Distritos 2 2520 1260 10,5
Error 12 1440 120
Total 14 3960

El valor del estadístico de prueba es:

𝑭𝒄𝒂𝒍𝒄𝒖𝒍𝒂𝒅𝒐 = 𝟏𝟎, 𝟓

PASO 4:

El valor crítico es:

𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 𝐹; 𝑔𝑙 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜; 𝑔𝑙 𝑒𝑟𝑟𝑜𝑟 = 𝐹; 𝑘−1; 𝑛−𝑘 = 𝐹0,01; 2; 12 = 6.93

v1
𝛼
v2 1 2 3 4 5 6 7 8 9 10
UPC MA444 Estadística 281

0.050 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75
0.025 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37
0.010 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30
0.005 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09
UPC MA444 Estadística 282
Análisis

PASO 5:
Para decidir comparamos el valor del estadístico de prueba y el valor crítico.

𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 10,5 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 3,89

Por lo tanto, se rechaza H0.

PASO 6:

La conclusión es: Al 1% de nivel de significancia, se puede afirmar que existe diferencia en al menos un
monto promedio de venta de pintura envasada, en miles de soles.

Los resultados de la prueba de Tukey – Kramer son:

Factor N Mean Grouping


Santa Anita 5 66.00 A
Ate 5 60.00 A
Breña 5 36.00 B

De la prueba Tukey - Kramer

µBreña µAte µSanta Anita


36 60 66

Se puede observar que no hay diferencia significativa entre las ventas de los distritos de Ate y Santa
Anita. Los distritos con mayor monto promedio de ventas de pintura envasada son Ate y Santa Anita.
, se observa que las ventas son menores en el distrito de breña

Argumentación

La campaña publicitaria se lanzará solo en el distrito de Breña, porque las ventas promedio de agua
envasada son menores.
UPC MA444 Estadística 283
Ejemplo 2

Un ingeniero civil residente de una obra desea evaluar el efecto que tienen las técnicas de mezclado
de concreto sobre la resistencia (kg/cm2) a la compresión. Para ello evalúa cuatro técnicas diferentes
y para realizar la prueba produce especímenes de concreto. La resistencia a la compresión del concreto
de cada técnica se distribuye normalmente y tienen la misma varianza. Los datos recolectados son los
siguientes:

Técnica 1 Técnica 2 Técnica 3 Técnica 4


2765 3200 2800 2600
2665 3300 3150 2700
2865 2975 2885 2600
2890 3150 2850 2765

Factor N Mean Grouping


Técnica 2 4 3156.3 A
Técnica 3 4 2921.3 A B
Técnica 1 4 2796.3 B
Técnica 4 4 2666.3 B

a. Identifique:

Variable respuesta

Factor

Tratamientos

Unidad experimental

b. Al 5% de significación, ¿al menos una técnica de mezclado influye en la resistencia a la compresión


del concreto?

Anova con Excel

Fuente de Grados de Suma de


Cuadrados medio Fcalculado
variación libertad cuadrados
Tratamientos

Error

Total

1. Formular las hipótesis de trabajo

H0:
H1:
UPC MA444 Estadística 284
2. Establecer el nivel de significación

=

3. Calcular el valor del estadístico de prueba

Fc =

4. Establecer la región crítica.

5. Aplicar el criterio de decisión.

Como Fc = …………… …… Fcrit …………; ………., ………. = ……….….. entonces …….. rechaza H0.

6. Realizar la conclusión.

c. Si la prueba resulta significativa, ¿qué técnica recomendaría utilizar?


UPC MA444 Estadística 285
Ejercicios propuestos

77. Una compañía que produce ladrillos efectuó un experimento para determinar si cuatro
temperaturas de cocción específicas, en °F, afectan la densidad de cierto tipo de ladrillo, en
gr/cm3. La densidad de los ladrillos para cada temperatura se distribuye normalmente y tienen la
misma varianza.
Temperaturas
100°F (1) 125°F (2) 150°F (3) 175°F (4)
19,9 21,7 20,9 21,8
19,7 21,4 20,8 21,9
19,8 21,5 20,8 21,7
19,7 21,5 20,6 21,6
20,0 21,7
Factor N Mean Grouping
175°F (4) 5 21.7400 A
125°F (2) 4 21.5250 A
150°F (3) 4 20.7750 B
100°F (1) 5 19.8200 C

a. Interprete el valor de Y23.


b. Complete el siguiente cuadro:

Variable respuesta

Factor

Tratamientos

Unidad experimental

c. Utilice nivel de significación de 5% para probar si al menos una temperatura de cocción influye
en la densidad de los ladrillos. Presente el ANOVA del Excel.
d. Si la prueba resulta significativa, ¿qué temperatura recomendaría utilizar?

78. Una importante compañía de construcciones desea comparar tres marcas de taladros para
determinar cuánto tiempo pasa antes de necesitar una reparación. Los tiempos de vida de los
taladros de cada marca se distribuyen normalmente y tienen la misma varianza. Los datos de los
tiempos de vida útil, en decenas de horas, para cada marca se encuentran en la siguiente tabla:

Marca A Marca B Marca C


6 10 3
2 9 2
4 8 5
1 6 4
7
UPC MA444 Estadística 286

Factor N Mean Grouping


Marca B 4 8.250 A
Marca A 5 4.000 B
Marca C 4 3.500 B

a. Identifique:

Variable respuesta

Factor

Tratamientos

Unidad experimental

b. Interprete el valor de Y13.


c. ¿Sugieren los datos que el tiempo promedio de vida es el mismo para cada marca de taladro
antes de una reparación? Utilice nivel de significación de 5%.
d. Si la prueba resulta significativa, ¿qué marca de taladro recomendaría utilizar?

79. Un empresario debe elegir la alternativa más eficiente para fabricar un mismo producto. Se
analiza el costo por unidad, en soles, de tres alternativas. El costo por unidad para cada alternativa
se distribuye normalmente y tienen la misma varianza, ¿qué alternativa deberá elegirse?

Alternativa A Alternativa B Alternativa C


9,35 8,35 9,35
8,35 8,35 10,35
7,35 7,35 9,35
8,35 7,35 8,35
9,35 8,35 9,35
7,35 7,35 9,35
UPC MA444 Estadística 287

Distribución de viviendas del distrito de Los Olivos


según composición de residuos sólidos
60% 54%
Porcentaje de viviendas

40%

20% 16%
12%
7% 5% 6%
0%
Materia Plástico Sanitario Papel Cartón Otros
organica
Composición de residuos sólidos

Factor N Mean Grouping


Alternativa C 6 9.350 A
Alternativa A 6 8.350 A B
Alternativa B 6 7.850 B

a. Pruebe si existe alguna diferencia significativa en los costos unitarios de las tres alternativas
de fabricación. Utilice nivel de significación de 5%.
b. Si existen diferencias, ¿entre qué grupos están las diferencias? Utilice nivel de significación de
5%.

80. Importación Bombardera desea determinar si el tipo de chip (A, B, C) que tienen las laptops que
ellos importan influye en el tiempo de respuesta (microsegundos). El tiempo de respuesta para
cada tipo de chip se distribuye normalmente y tienen la misma varianza. Al probar cinco laptops
con cada tipo de chip, se obtuvieron los siguientes resultados, en microsegundos:

Tipo A Tipo B Tipo C


18 24 17
23 25 14
21 30 19
18 27 20
24 38 17

Factor N Mean Grouping


Tipo B 5 28.80 A
Tipo A 5 20.80 B
Tipo C 5 17.40 B

a. Al nivel de significancia del 5%, ¿la importadora puede concluir que hay diferencia en los
tiempos promedio de respuesta según el tipo de chip utilizado?
b. Si la prueba resulta significativa, ¿qué tipo de chip recomendaría utilizar?
UPC MA444 Estadística 288
2
81. Para determinar si la resistencia a la ruptura (libras/ pulg ) difiere según el tipo de estructura, se
tomó al azar una muestra de zonas con estructura tipo cimientos, zonas con estructura tipo
terraplenes y zonas con estructura tipo excavación. Asuma que se cumplen los supuestos de
normalidad y de homogeneidad. Los resultados de la resistencia a la ruptura (libras/ pulg 2) se
presenta en el siguiente cuadro:

Cimiento Terraplenes Excavación


2050 2200 2300
2100 2230 2180
2100 2150 2200
2100 2150 2200
2150 2200

Tipo_estructura N Media Agrupación


Excavación 5 2216.0 A
Terraplenes 5 2176.0 A
Cimiento 4 2087.5 B

a. Complete la siguiente información:

Variable respuesta
Factor
Tratamientos
Unidad experimental

b. A continuación, se muestra la tabla del ANVA con algunos datos faltantes. Asimismo, se
muestran los resultados del análisis de comparaciones múltiples de Tukey. Complete la tabla.

Grados de Suma de Cuadrado


Fuentes de variación Fcalculado
libertad cuadrados medios
Tipo de estructura 2
Error
Total 13 54150

c. Explique y fundamente, con un nivel de significación del 5%, ¿con qué tipo de estructura se
debería construir la represa?
UPC MA444 Estadística 289
Caso: Compañía Clean

La compañía Clean S.A ha diseñado cuatro sistemas diferentes (A, B, C y


D) para limpiar manchas de grasa en departamentos. Los especialistas
desean determinar cuál de estos sistemas es más efectivo. Para ello,
diseñan un experimento de la siguiente manera: de una muestra de 19
trabajadores de la empresa (todos con la misma destreza en el trabajo) se
seleccionaron aleatoriamente cinco trabajadores para el sistema A, cinco
para el sistema B, cuatro para el sistema C y cinco para el sistema D, de tal
manera que cada grupo de trabajadores limpia las manchas de grasa con un determinado sistema.

La siguiente tabla contiene los resultados, medidos por área, en m2, que se limpian en una hora:

Sistema A Sistema B Sistema C Sistema D


15 22 16 13
14 20 18 15
20 26 18 12
17 23 20 10
22 23 12

Factor N Mean Grouping


Sistema 2 5 22.800 A
Sistema 3 4 18.000 B
Sistema 1 5 17.600 B
Sistema 4 5 12.400 C

¿Qué sistema o sistemas para limpiar manchas de grasa en departamentos es más efectiva de tal
manera que se pueda trabajar exclusivamente con dicho sistema? Asuma que se cumplen los
supuestos de normalidad y homogeneidad. Utilice un nivel de significación del 5%.

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Identifica el factor, Realiza las pruebas Presenta el valor de la Sustenta los
problemática, niveles, necesarias de la tabla. resultados
señalando tratamientos, técnica estadística Realiza la decisión y encontrados en la
claramente el variable de aplicada e conclusión estadística. muestra y brinda
objetivo del respuesta, unidad interpreta. Realiza y analiza las una
caso. experimental comparaciones recomendación al
Identifica la técnica múltiples problema.
estadística a usar.
Plantea la hipótesis.
UPC MA444 Estadística 290
Regresión lineal simple
Podemos hacernos muchas preguntas sobre la relación entre dos variables:

• ¿La velocidad de transferencia de datos de un disco duro depende de la velocidad en que giran los
discos del plato del disco duro o de su capacidad de almacenamiento?
• ¿El tiempo de ejecución de una obra civil depende del número de trabajadores o del índice de
automatización?
• ¿El tiempo de falla de los equipos electrónicos dependerá de la resistencia de los resistores?
• ¿El sueldo dependerá del grado de instrucción?
• ¿El tiempo de procesamiento de trabajos estará relacionado con el número de trabajos por día?
• ¿La temperatura está relacionada con la presión sobre el rendimiento de un producto químico?

Estas preguntas surgen cuando queremos estudiar dos variables de una población con el fin de
examinar la relación existente entre ellas. Las dos variables en estudio son variables cuantitativas que
nos permitirá construir una ecuación lineal que modela la relación existente entre estas dos
variables.

En el análisis de regresión la ecuación lineal puede usarse para estimar o predecir los valores de una
variable dependiente, llamada Y, cuando se conocen o se suponen conocidos los valores de otra
variable, variable independiente, llamada X.

El análisis de correlación permite determinar el grado de relación lineal existente entre dos variables.
Es útil en un trabajo exploratorio cuando el investigador desea encontrar el grado o la fuerza de esa
relación.

Ejemplo:

Consumo:

Ingreso:

Y: Consumo

X: Ingreso

Y = b0 + b1 X

Y: variable dependiente
X: variable independiente

La regresión lineal simple es modelar la dependencia de la variable Y en función de la variable X a través


de la ecuación de una recta

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑒𝑖 𝑖 = 1, 2, 3, … , 𝑛
Donde:
𝑋: = variable independiente
UPC MA444 Estadística 291
𝑌: = variable dependiente

Se trabaja con variables de tipo cuantitativas, entre las cuales se puede establecer una relación
funcional.

𝑌 = 𝑓(𝑋)

Entonces diremos que la variable Y depende de la variable X.


UPC MA444 Estadística 292
Ejemplo 1

Para cada par de variables, identifique la variable dependiente (𝑌) e independiente (𝑋), la pendiente
(positiva o negativa) y el tipo de relación (inversa o directa) y qué significa el tipo de relación:

Ingreso mensual (soles)


Variables
Consumo mensual (soles)

Variable dependiente Y: Consumo mensual (soles)

X: Ingreso mensual (soles)


Variable independiente

Y = f(X) el consumo esta en función del ingreso

Y = b0 + b1 X
Pendiente
Positiva

Tipo de relación Directamente proporcional

Cuando una variable aumenta la otra aumenta y cuando


Significado de la relación
disminuye la otra disminuye

Precio de venta del auto (dólares)


Variables
Antigüedad (años)
Y: Precio de venta del auto (dólares)
Variable dependiente

Variable independiente X: Antigüedad (años)

el precio de venta del auto (dólares) esta en función de la


Y = f(X)
antigüedad (años)
Y = b0 + b1 X
Pendiente
Negativo

Tipo de relación Inversamente proporcional

Cuando una variable aumenta la otra disminuye y cuando


Significado de la relación
disminuye la otra aumenta
UPC MA444 Estadística 293
Diagrama de dispersión o gráfico del plot
El primer paso en el análisis de regresión es registrar simultáneamente los valores de las dos variables
asociadas (𝑋, 𝑌) en una gráfica bidimensional para ver si existe una tendencia lineal que podría explicar
la relación entre estas dos variables

10
8
9
7
8

7 6 Cuando X crece, Y decrece


6 5

5 4

4 3

3 2 Modelo lineal
2 Buen ajuste
1
1
0
0 0 2 4 6 8 10
0 2 4 6 8 10

8 10

9
7 Modelo lineal
8
6
Buen ajuste
7
5 6

4 5

4
3
3
2
Cuando X crece, Y crece 2
1
1

0 0
0 2 4 6 8 10 0 2 4 6 8 10

Y = b0 + b1 X

Método de los mínimos cuadrados


Mediante este método es posible seleccionar la recta que se ajuste mejor a los datos. La recta
resultante tiene dos características importantes:

• La suma de las desviaciones verticales de los puntos con relación a la recta es cero.
• La suma de los cuadrados de las desviaciones es mínima (es decir, ninguna otra recta daría una
menor suma de cuadrados de tales desviaciones). Es decir, ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂𝑖 )2 es mínima.

Los valores de 𝑏0 y b1 que minimizan la suma de los cuadrados de las desviaciones, son las soluciones
de las llamadas ecuaciones normales de la recta de regresión:
𝑛 𝑛

∑ 𝑦𝑖 = 𝑛𝑏0 + 𝑏1 (∑ 𝑥𝑖 )
𝑖=1 𝑖=1
UPC MA444 Estadística 294
𝑛 𝑛 𝑛

∑ 𝑥𝑖 𝑦𝑖 = 𝑏0 (∑ 𝑥𝑖 ) + 𝑏1 (∑ 𝑥𝑖2 )
𝑖=1 𝑖=1 𝑖=1

Este método nos permite estimar los parámetros del modelo de regresión. Resolviendo las ecuaciones
simultáneas para 𝑏𝑜 y 𝑏1 tenemos:

𝑛(∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 ) − (∑𝑛𝑖=1 𝑥𝑖 )(∑𝑛𝑖=1 𝑦𝑖 )


𝑏1 = 2
𝑛(∑𝑛𝑖=1 𝑥𝑖2 ) − (∑𝑛𝑖=1 𝑥𝑖 )

𝑏𝑜 = 𝑦̅ − 𝑏1 𝑥̅

Recta o ecuación de regresión

El modelo poblacional es:

𝒀 = 𝜷𝟎 + 𝜷𝟏 𝑿 + 𝒆

El modelo muestral es:

̂ = 𝒃𝟎 + 𝒃𝟏 𝒙 Ecuación de Regresión Estimada


𝒚

donde:
𝑏1 es la pendiente de la recta o coeficiente de regresión.
𝑏0 es la ordenada en el origen o intercepto de la recta con eje Y.

Ejemplo 1
Para las siguientes variables:
𝑌: = ingreso mensual (soles)
𝑋: = experiencia profesional (años)
UPC MA444 Estadística 295
a. Indique la relación entre las variables.

La relación es directamente proporcional (positiva)

Y = 2500 + 450 X

𝑌: = ingreso mensual (soles)


𝑋: = experiencia profesional (años)

b. Interprete el valor de los coeficientes de regresión.

𝑏0 = 2500 Si la experiencia profesional es cero (años) el ingreso mensual será de 2500 soles

Si la experiencia profesional se incrementa en un año, el ingreso mensual se


𝑏1 = 450
incrementa 450 dólares

Ejemplo 2
Se desea modelar la vida útil (en años) de un satélite en función de la cantidad de combustible (en kg)
requerido para moverlo de su posición orbital, usando un modelo lineal. Los datos se muestran a
continuación:

Y: Vida útil (años) 10,8 11,5 12 12,4 13,2 13,7 13,9 14,1 14,8 15
X: Cantidad de combustible ( kg) 150,4 156,3 162,5 165,8 172,5 168,9 184,5 185,9 187,2 199,4
UPC MA444 Estadística 296

Dispersión de la vida útil vs la cantidad de combustible

15

14
Vida útil

13

12

11
150 160 170 180 190 200
Cantidad de combustible
Fuente: Empresa A

a. Comente el diagrama de dispersión de estas variables.

DEL DIAGRAMA DE DISPERSION SE OBSERVA UNA RELACION DITECTAMENTE PROPORCIONAL DE


PENDIENTE POSITVA CUANDO UNO CRECE EL OTRO CRECE

b. Calcule e interprete los coeficientes de regresión estimados del ejemplo anterior, considerando la
siguiente información:

X:= cantidad de
N° Y:= vida útil xy x2 y2
combustible
1 150,4 10,8 1624,32 22620,16 116,64
2 156,3 11,5 1797,45 24429,69 132,25
3 162,5 12,0 1950,00 26406,25 144,00
4 165,8 12,4 2055,92 27489,64 153,76
5 172,5 13,2 2277,00 29756,25 174,24
6 168,9 13,7 2313,93 28527,21 187,69
7 184,5 13,9 2564,55 34040,25 193,21
8 185,9 14,1 2621,19 34558,81 198,81
9 187,2 14,8 2770,56 35043,84 219,04
10 199,4 15,0 2991,00 39760,36 225,00
Total 1733,4 131,4 22965,92 302632,46 1744,64
UPC MA444 Estadística 297

Y = -1.996 + 0.087 X

Y: Vida útil (años)


X: Cantidad de combustible ( kg)

c. Interprete los valores de los coeficientes de regresión.

𝑏0 La vida útil (años) es de -1.996 años cuando Cantidad de combustible ( kg) es cero

Si la cantidad de combustible se incrementa en un kilo, la vida útil se incrementa


𝑏1
0.087 años
UPC MA444 Estadística 298
Análisis de varianza
El análisis de varianza es la descomposición de la variación total en sus fuentes de variación: regresión
y error (residual).

Fuente de Grados de Suma de Cuadrado medio Estadístico de


variación libertad cuadrados prueba
𝑆𝐶𝑅𝑒𝑔 𝐶𝑀𝑅𝑒𝑔
Regresión 1 𝑆𝐶𝑅𝑒𝑔 𝐶𝑀𝑅𝑒𝑔 = 𝐹𝑐 =
1 𝐶𝑀𝐸
𝑆𝐶𝐸
Error (residual) 𝑛– 2 𝑆𝐶𝐸 𝐶𝑀𝐸 =
𝑛−2
Total 𝑛– 1 𝑆𝐶𝑇

Donde:

La suma de cuadrados de la regresión se calcula con:

𝑛
(∑𝑛𝑖=1 𝑥𝑖 )2
𝑆𝐶𝑅𝑒𝑔 = 𝛽̂1 (∑ 𝑥𝑖2
2
− )
𝑛
𝑖=1

La suma de cuadrados de los errores se calcula con:

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑅𝑒𝑔

La suma de cuadrados total se calcula con:

𝑛
(∑𝑛𝑖=1 𝑦𝑖 )2
𝑆𝐶𝑇 = ∑ 𝑦𝑖2 −
𝑛
𝑖=1

Este análisis permite realizar la prueba de hipótesis para validar el modelo de regresión obtenido a un
v g f α.

̂ = 𝒃𝟎 + 𝒃𝟏 𝒙
𝒚

El objetivo de esta prueba es probar que la pendiente poblacional 𝛽1 es diferente a cero.

1. Establecer las hipótesis:

𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0

2. Fijar el nivel de significancia: 𝛼

3. Calcular el valor del estadístico de prueba.


UPC MA444 Estadística 299

𝐶𝑀𝑅𝑒𝑔
𝐹𝑐𝑎𝑙 =
𝐶𝑀𝐸𝑟𝑟𝑜𝑟

4. Establecer la región creativa.

El valor crítico es 𝐹𝑐𝑟𝑖𝑡 (𝛼, 1, 𝑛 − 2).

5. Aplicar los criterios de decisión.

Si 𝐹𝑐𝑎𝑙 > 𝐹𝑐𝑟𝑖𝑡 (𝛼, 1, 𝑛 − 2), entonces se rechaza Ho; por lo tanto, el modelo de regresión es válido.
Si 𝐹𝑐𝑎𝑙 ≤ 𝐹𝑐𝑟𝑖𝑡 (𝛼, 1, 𝑛 − 2),entonces no se rechaza Ho; el modelo de regresión no es válido.

6. Realizar la conclusión

Ejemplo 1

A un nivel de significación del 5%, valide el modelo de regresión lineal del ejercicio anterior. Obtenga
el ANOVA del Excel.

1. Establecer las hipótesis:

𝐻0 : 𝛽1 = 0
( El modelo es Valido)
𝐻1 : 𝛽1 ≠ 0

2. Fijar el nivel de significancia: α = 0.05

3. Calcular el valor del estadístico de prueba.

𝐶𝑀𝑅𝑒𝑔
𝐹𝑐𝑎𝑙 = = 85.962
𝐶𝑀𝐸𝑟𝑟𝑜𝑟

4. Establecer la región crítica.

FCRITICO = F(0.05, 1,8) = 5.32

5. Aplicar los criterios de decisión.

Si 𝐹𝑐𝑎𝑙 = 85.962 > 𝐹𝑐𝑟𝑖𝑡 (0.05, 1,8) = 5.32 , entonces se rechaza Ho; por lo tanto, el modelo de
regresión es válido.
UPC MA444 Estadística 300

6. Realizar la conclusión.

A un nivel de significación del 5% se RH=, es decir si existe suficiente evidencia estadística para afirmar
que el modelo es valido
UPC MA444 Estadística 301
Coeficiente de determinación
Es una medida de bondad de ajuste del modelo. Nos indica que tan bueno es el modelo para explicar
el porcentaje de variabilidad de la variable dependiente Y.

El coeficiente de determinación R2 indica el porcentaje de la variabilidad de la variable dependiente Y


que es explicada por X en el modelo de regresión lineal.

También nos ayuda a saber la precisión con la que se puede predecir o pronosticar el valor de la
variable dependiente, si se conocen los valores de la variable dependiente.

El coeficiente de determinación 𝑅 2 se calcula de la siguiente manera:

𝑆𝐶𝑅𝑒𝑔
𝑅2 = × 100%
𝑆𝐶𝑇𝑜𝑡

R2 = 0.915 = 91.6 %

La variabilidad de la vida útil(años) es explicado en un 95.6% por el peso del combustible (kg)

Coeficiente de correlación
El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X e Y.
Se calcula como la raíz cuadrada del coeficiente de determinación:

√𝑅 2 𝑠𝑖 𝛽̂1 > 0
𝑟={
− √𝑅 2 𝑠𝑖 𝛽̂1 < 0

Si el coeficiente de correlación está cerca de cero entonces indicará que no existe relación lineal
significativa entre las dos variables.

Si el coeficiente de correlación se acerca a 1 o a -1 indicará que existe una relación lineal fuerte
pudiendo ser directa o inversa.

Los valores que se pueden tomar como referencia para determinar si no existe relación lineal o si existe
una relación lineal fuerte, directa o inversa, se muestra a continuación, estos valores pueden variar de
acuerdo con el campo de estudio.

-1,0 -0,65 -0,2 0,2 0,65 1,0


Relación lineal fuerte e inversa No existe relación lineal Relación lineal fuerte y directa
UPC MA444 Estadística 302

r= 0.956

Ejemplo 1

Interprete el coeficiente de correlación y del coeficiente de determinación del ejemplo anterior.

R2 = 91,5%

La variabilidad de la vida útil(años) es explicado en un 95.5% por el peso del combustible (kg)

r= 0.956 la relación lineal entre la vida útil y el peso del combustible tiene una relación fuerte y
directamente proporcional

Indique qué valor de r2 y r que le corresponde a cada gráfico. Considere los siguientes valores: r = 0,95;
r = -0,78 y r = 0,52. Además, indique el tipo de relación entre las variables.

Rellene los espacios en blanco.

Situación 1

r= 0.52
El coeficiente de correlación es 0.52, por tanto, la relación entre las variables es modera y directamente
proporcional

El coeficiente de determinación es 0 2704

r2 = 0.2704
Situación 2

r= 0.95
El coeficiente de correlación es 0.95, por tanto, la relación entre las variables es fuerte y directamente
proporcional
El coeficiente de determinación es r2 = 0.2704
UPC MA444 Estadística 303

Situación 3

El coeficiente de correlación es -0.78, por tanto, la relación entre las variables es alta y inversamente
proporcional

El coeficiente de determinación es
UPC MA444 Estadística 304
Regresión usando una calculadora Casio

Coeficientes de regresión usando calculadora

Los pasos para obtener los valores de los coeficientes de regresión 𝑏0 y 𝑏1 , el coeficiente de regresión
𝑟 usando una calculadora Casio son los siguientes:

1. Desactive la opción de frecuencias.


2. Ingrese al MODE 3: STAT.

3. Elija la opción 2: A+BX.

4. Ingrese los datos en ambas columnas, X e Y.

5. Presione Shift + 1. A continuación, presione 5: Reg.


UPC MA444 Estadística 305

Las opciones que se muestran son las siguientes:

1: A es el valor del intercepto 𝑏0


2: B es el valor de la pendiente 𝑏1
3: r es el valor del coeficiente de correlación
4: 𝑥̂ es el valor estimado de la variable X para un valor dado de la variable Y
5: 𝑦̂ es el valor estimado de la variable Y para un valor dado de la variable X

En la calculadora, 𝑏0 = A y 𝑏1 = B. Luego, el modelo de regresión es:

Y = A + B X = 𝑏0 + 𝑏1 𝑥

En la calculadora, el coeficiente de correlación 𝑟 = r.

Análisis de varianza usando calculadora

La tabla de análisis de varianza ANVA es la siguiente:

Fuente de Grados de Suma de Cuadrados Estadístico de


variación libertad cuadrados medio prueba
𝐶𝑀𝑅𝑒𝑔
Regresión 1 𝑆𝐶𝑅𝑒𝑔 𝐶𝑀𝑅𝑒𝑔 𝐹𝑐 =
𝐶𝑀𝐸
Error (residual) 𝑛−2 𝑆𝐶𝐸 𝐶𝑀𝐸

Total 𝑛−1 𝑆𝐶𝑇

Para realizar la tabla de análisis de varianza se necesita calcular la suma de cuadrados total 𝑆𝐶𝑇, la
suma de cuadrados de la regresión 𝑆𝐶𝑅𝑒𝑔 y la suma de cuadrados de errores 𝑆𝐶𝐸.
UPC MA444 Estadística 306
Para calcular la suma de cuadrados total 𝑆𝐶𝑇 usaremos la siguiente fórmula:

𝑆𝐶𝑇 = (𝑛 − 1)𝑆𝑌2

Para calcular la suma de cuadrados de la regresión 𝑆𝐶𝑅𝑒𝑔 usaremos la siguiente fórmula:

𝑆𝐶𝑅𝑒𝑔 = 𝑅 2 × 𝑆𝐶𝑇

Para calcular la suma de cuadrados de errores 𝑆𝐶𝐸 usaremos la siguiente fórmula:

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑅𝑒𝑔

Los pasos en la calculadora son los siguientes:

1. Para calcular el valor del coeficiente de correlación r presione Shift + 1 y seleccione Reg, opción 3.
2. Para calcular el valor del coeficiente de determinación R2 eleve al cuadrado el valor de r.
3. Para calcular el valor 𝑆𝑌 ; seleccione Shift + 1, luego la opción 4 y luego elija 7: sy.

Ejemplo 1
Usando una calculadora Casio
Una empresa dedicada a la fabricación de equipos de telecomunicación considera que la vida útil de
los equipos puede estar explicada por la temperatura del ambiente en el que trabaja mediante una
relación lineal. Para encontrar la ecuación de regresión lineal de la vida útil de los quipos en función
de la temperatura del ambiente se tomó una muestra de 11 datos, los cuales se muestran en la tabla
siguiente:

Temperatura (ºC) 24 20 18 16 10 12 13 28 16 15 23
Vida útil (en años) 8,0 6,4 5,5 4,6 3,8 3,9 5,6 8,5 6,6 4,5 8,8

a. Indique la variable dependiente y la independiente.


b. Estime el modelo de regresión e interprete el coeficiente de regresión 𝑏1 .
c. Calcule e interprete el coeficiente de correlación.
d. Calcule e interprete el coeficiente de determinación.
a. Estime la vida útil de un equipo, en años, si la temperatura del medio ambiente donde trabaja es
de 10,5 °C.
e. Presente el cuadro de análisis de varianza.
f. Valide el modelo de regresión. Use un nivel de significancia del 5%.
UPC MA444 Estadística 307
Solución
a. Indique la variable dependiente y la independiente.

Solución

Variable dependiente: vida útil de los equipos (en años)


Variable independiente: temperatura del medio ambiente (en °C)

b. Estime el modelo de regresión e interprete el coeficiente de regresión 𝑏1 .

Solución

Siguiendo los pasos descritos en una calculadora Casio obtendrá las siguientes pantallas.

La ecuación del modelo de regresión es:

𝑦̂ = 𝑏0 + 𝑏1 𝑥 = 𝐴 + 𝐵𝑥

Usando los valores de la calculadora:

𝑦̂ = 0,7984 + 0,2944𝑥

𝑏1 = 0,2944. Ante el incremento de 1°C en la temperatura del ambiente, la vida útil del equipo se
incrementa, en promedio, 0,2944 años.

c. Interprete el coeficiente de correlación.

Solución

El valor del coeficiente de correlación r = 0,9041


UPC MA444 Estadística 308
Entre las variables vida útil del equipo y la temperatura del medio ambiente en el que trabaja existe
una fuerte relación y es directa por ser el valor del coeficiente cercano a 1.

d. Interprete el coeficiente de determinación.

Solución

El valor del coeficiente de determinación R2 se obtiene elevando al cuadrado el valor del


coeficiente de correlación r. Luego, R2 = r2 = 0,90412 = 0,8174.

El 81,74% de la variabilidad total de la vida útil de un equipo está siendo explicada por la
temperatura del ambiente en el que trabaja, en el modelo de regresión estimado.

e. Estime la vida útil de un equipo, en años, si la temperatura del medio ambiente donde trabaja es
de 10,5 °C.

Solución

Para estimar la vida útil, reemplazamos 𝑋 = 10,5 en la ecuación de regresión:

𝑦̂ = 0,7984 + 0,2944 𝑥

𝑦̂ = 0,7984 + 0,2944 × 10,5 = 3,89

La vida útil de un equipo, en años, estimada es 3,89 años; si la temperatura del medio ambiente
donde trabaja es de 10,5 °C.

f. Presente el cuadro de análisis de varianza.

Solución

La tabla de análisis de varianza ANVA es la siguiente:

Fuente de Grados de Suma de Cuadrados Estadístico de


variación libertad cuadrados medio prueba
𝐶𝑀𝑅𝑒𝑔
Regresión 1 𝑆𝐶𝑅𝑒𝑔 𝐶𝑀𝑅𝑒𝑔 𝐹𝑐 =
𝐶𝑀𝐸
Error (residual) 𝑛−2 𝑆𝐶𝐸 𝐶𝑀𝐸

Total 𝑛−1 𝑆𝐶𝑇

Para realizar la tabla de análisis de varianza se necesitan calcular la suma de cuadrados de la


regresión 𝑆𝐶𝑅𝑒𝑔, la suma de cuadrados de errores 𝑆𝐶𝐸 y la suma de cuadrados total 𝑆𝐶𝑇.

Para calcular la suma de cuadrados total 𝑆𝐶𝑇 usaremos la siguiente fórmula:

𝑆𝐶𝑇 = (𝑛 − 1)𝑆𝑌2
UPC MA444 Estadística 309

Para calcular la suma de cuadrados de la regresión 𝑆𝐶𝑅𝑒𝑔 usaremos la siguiente fórmula:

𝑆𝐶𝑅𝑒𝑔 = 𝑅 2 × 𝑆𝐶𝑇

Para calcular la suma de cuadrados de errores 𝑆𝐶𝐸 usaremos la siguiente fórmula:

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑅𝑒𝑔

Usando los valores de la calculadora:

El valor del coeficiente de correlación 𝑟 es r = 0,9040953415.

El valor del coeficiente de determinación 𝑅 2 es r2 = 0,90409534152 = 0,8174.

Reemplazando:
𝑆𝐶𝑇 = (𝑛 − 1)𝑆𝑦2 = 10 × 1,80212 = 32,4756

𝑆𝐶𝑅𝑒𝑔 = 𝑅 2 × 𝑆𝐶𝑇 = 0,90412 × 32,4756 = 26,5456

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑅𝑒𝑔 = 32,4756– 26,545 = 5,9300

La tabla de análisis de varianza ANVA se calcula de la siguiente manera:

Fuente de Grados de libertad Suma de Cuadrados medio Estadístico de


variación cuadrados prueba
26,5456 26,5456
Regresión 1 𝑆𝐶𝑅𝑒𝑔 = 26,5456 𝐶𝑀𝑅𝑒𝑔 = 𝐹𝑐 =
1 0,6589
Error 5,9300
𝑛 − 2 = 11 − 2 = 9 𝑆𝐶𝐸 = 5,9300 𝐶𝑀𝐸 =
(residual) 9

Total 𝑛 − 1 = 11 − 1 = 10 𝑆𝐶𝑇 = 32,4756

La tabla de análisis de varianza ANVA quedaría de la siguiente manera:


Fuente de Grados de libertad Suma de Cuadrado medio Estadístico de
variación cuadrados prueba
Regresión 1 26,5456 26,5456 40,2878
Error
9 5,9300 0,6589
(residual)
Total 10 32,4756
UPC MA444 Estadística 310

g. Valide el modelo de regresión. Considere un nivel de significancia del 5%.

Solución

Validar el modelo de regresión implica probar que la pendiente poblacional es diferente de cero,
por tanto, las hipótesis son:

𝐻0 𝛽1 = 0
𝐻1 𝛽1 ≠ 0

El nivel de significancia del 5%; luego,  = 0,05.

El valor del estadístico de la prueba es:

𝐶𝑀𝑅𝑒𝑔 26,5458
𝐹𝑐 = = = 40,2878
𝐶𝑀𝐸 0,6590

Establecer la región crítica

El valor crítico es

𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 (𝛼; 1; 𝑛 − 2) = 5,12

𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 (0,05; 1; 11 − 2) = 5,12

𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 (0.05; 1; 9) = 5,12

Luego, el valor crítico es 5,12.

v1
𝛼
v2 1 2 3 4 5 6 7 8 9 10

0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42
UPC MA444 Estadística 311
Decisión

𝐹𝑐 = 40,2878 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 (0.05; 1; 9) = 5,12

Entonces, se rechaza H0.

Conclusión
Con un nivel de significación del 5%, el modelo es válido. Por lo tanto, existe una relación lineal
entre la vida útil del equipo y la temperatura del ambiente.
UPC MA444 Estadística 312
Caso: SYMA

Syma es una de las marcas más populares de drones sobre todo


porque lleva muchos años innovando y lanzando infinidad de
cuadricópteros que conquistan el mercado una y otra vez. Estos
drones destacan sobre todo por su bajo precio, su facilidad de
manejo y su robustez. Debido a las últimas investigaciones se sabe
que el tiempo de vuelo de los drones está en función de la
temperatura del medio ambiente.

La empresa desea incursionar en América Latina, donde las temperaturas son más cálidas, para lo cual
debe cumplir con un tiempo mínimo de vuelo de seis minutos a una temperatura ambiente de 30°C.
De cumplir con la exigencia, ingresará al mercado latino, de lo contrario deberá realizar reajustes a su
dron.

Se ha encargado al área de producción realizar la estimación solicitada, para ello se seleccionó una
muestra de 10 drones. Los resultados se presentan a continuación:

Temperatura (°C) 25 26 20 25 23 18 18 20 21 22
Duración (minutos) 8,0 9,0 10,3 8,4 8,6 12,5 14,0 11,5 8,9 10,0

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Identifica las Realiza las pruebas En base a los Brinda una
problemática, variables, comenta necesarias de la resultados de la recomendación al
señalando el diagrama de técnica estadística evidencia muestral problema, sustentada
claramente el dispersión. aplicada e interpreta. interpreta los en los resultados
objetivo del Presenta el modelo Presenta el modelo valores de los encontrados en la
caso. a estimar e indica estimado y realiza la coeficientes de muestra de acuerdo
la herramienta a estimación puntual. correlación y con el contexto
usar. determinación. presentado.

Solución

Interpretación

Determinar si Syma ingresará al mercado latino donde las temperaturas son más cálidas.

Representación

Variable dependiente: Tiempo de vuelo (minutos)


Variable independiente: Temperatura del medio ambiente (°C)
UPC MA444 Estadística 313

Dispersión de del tiempo de vuelo vs la temperatura del medio ambiente

15
14
13
Duración (min)

12
11
10
9
8
7
6
17 18 19 20 21 22 23 24 25 26 27
Temperatura (°C)
Fuente Syma S.A.

Se observa una relación inversa, es decir a mayor valor de la temperatura en el ambiente menor será
el tiempo de vuelo (minutos).

El modelo por estimar es:


𝑌̂ = 𝑏0 + 𝑏1 𝑋

La herramienta que usaremos será la regresión lineal simple.

Cálculo

Fuente de variación Grados de libertad Suma de cuadrados Promedio de los cuadrados F


Regresión 1 26.147 26.1467 23.17
Residuos 8 9.029 1.1287
Total 9 35.176

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.86215497
Coeficiente de determinación R^2 0.74331119

El modelo de regresión estimado es:

𝑌̂ = 𝑏0 + 𝑏1 𝑋

𝑌̂ = 22,94 − 0,588 𝑋

La interpretación de la pendiente es 𝑏1 = −0,588.

Si la temperatura del medio ambiente se incrementa en 1°C el tiempo de vuelo de los drones disminuye
en 0,588 minutos.
UPC MA444 Estadística 314
Validación del modelo

Validar el modelo de regresión implica probar que la pendiente poblacional es diferente de cero, por
tanto, las hipótesis son:

𝐻0 𝛽1 = 0
𝐻1 𝛽1 ≠ 0

El nivel de significancia del 5%; luego,  = 0,05.

El valor del estadístico de la prueba es:

𝐶𝑀𝑅𝑒𝑔 26,1467
𝐹𝑐𝑎𝑙 = = = 23,17
𝐶𝑀𝐸𝑟𝑟𝑜𝑟 1,1287

Establezcamos la región crítica:

El valor crítico es:

𝐹𝑐𝑟í𝑡𝑖𝑐𝑜 (0,05, 1, 9) = 5,12

v1
𝛼
v2 1 2 3 4 5 6 7 8 9 10

0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42

Como 𝐹𝑐𝑎𝑙 = 23,17 > 𝐹𝑐𝑟í𝑡𝑖𝑐𝑜 = 5,12, entonces se rechaza H0.

Conclusión
Con un nivel de significación del 5 %, el modelo es válido. Por lo tanto, existe una relación lineal entre
la vida útil del equipo y la temperatura del ambiente.

𝑌̂ = 22,94 − 0,588 × 30 = 5,3

Para una temperatura de 30°C, el tiempo de vuelo estimado es de 5,3 minutos.


UPC MA444 Estadística 315

Análisis
R2 = (26,147/35,176) x100% = 74,33% o directamente de la tabla 0,7433x100% = 74,33%

Interpretación
El 74,33% de la variabilidad en la duración del tiempo de vuelo de los drones es explicada por la
temperatura en el modelo de regresión estimado.

r = 0,8622
Entre las variables tiempo de vuelo y la temperatura del medio ambiente existe una fuerte relación y
es directa por ser el valor del coeficiente cercano a 1.

Argumentación
No se cumple con la exigencia de un tiempo mínimo de vuelo de 6 minutos a una temperatura de 30°C.
Por lo tanto, la empresa deberá realizar ajustes a su dron.
UPC MA444 Estadística 316
Ejercicios propuestos

82. Se desea modelar el tiempo de operación (en horas) en función de la temperatura de un


dispositivo producido por la empresa A. Para ello se realiza un experimento estadístico, cuyos
resultados son los siguientes:

Temperatura (oC) 18 18 18 22 22 26 30 30 34
Tiempo de operación 1200 1215 1150 1000 974 810 583 612 240

Dispersión del tiempo de operación vs la temperatura


1400

1200
Tiempo de operación

1000

800

600

400

200

0
17 19 21 23 25 27 29 31 33 35
Temperatura (°C)
Fuente: Empresa A

a. Comente el diagrama de dispersión o plot.


b. Presente la ecuación de la recta o modelo de regresión estimado.
c. Interprete los valores de los coeficientes de regresión.
d. Valide el modelo Use 5% de significancia.
e. Interprete el coeficiente de determinación y correlación.

83. Para la construcción de carreteras que experimentan heladas intensas, es importante que la
densidad del concreto (kg/m2) seleccionado tenga un valor bajo de conductividad térmica
(watts/metros.Kelvin) para reducir al mínimo los daños provocados por cambios de temperatura.
Por lo tanto, se desea modelar la conductividad térmica en función de la densidad que posee el
concreto. Por lo tanto, se toman 12 trozos al azar de diferentes densidades de concreto y se
registra la conductividad. Los datos se muestran en la siguiente tabla:

Densidad del concreto 300 400 500 600 700 800 900 1000 1100 1200 1400 1600
Conductividad térmica 0,065 0,08 0,095 0,115 0,13 0,15 0,175 0,205 0,23 0,27 0,346 0,436

a. Comente el diagrama de dispersión o plot.


b. Presente la ecuación de la recta o modelo de regresión estimado.
c. Interprete el valor de la pendiente de la recta.
d. Valide el modelo Use 1% de significancia.
e. Interprete el coeficiente de determinación y correlación.
UPC MA444 Estadística 317

Dispersión de la conductividad térmica vs la densidad del concreto

0.50
0.45
Conductividad térmica 0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0 200 400 600 800 1000 1200 1400 1600 1800
Densidad del concreto
Fuente: Constructora A

84. NVZ Import Export es una empresa proveedora de GPS para automóviles de diferentes modelos,
últimamente ha importado nuevos modelos de GPS que ya están a la venta. El jefe del
departamento de ventas ha implementado charlas motivadoras para sus agentes vendedores y
desea modelar la eficiencia de sus ventas (%) en función de las horas que asisten mediante una
función lineal.

Los siguientes datos corresponden a una muestra aleatoria de 10 agentes vendedores. Se registró
el tiempo acumulado de horas en las que estuvo presente el agente vendedor en una o más
charlas durante el último trimestre y la eficiencia de sus ventas.

Eficiencia en las ventas (%) 47 84 80 46 62 72 52 87 37 68


Tiempo acumulado, en horas 27 45 41 19 35 39 19 49 15 31

a. Presente el gráfico del plot y comente.


b. Presente la ecuación de la recta.
c. Interprete los coeficientes del modelo de regresión estimado.
d. Realice el proceso de validación del modelo, con un nivel de significación de 5%.
e. Interprete el coeficiente de determinación y el de correlación.

85. El área de producción del fabricante NanoTec registró el tiempo de vuelo de los drones del modelo
CX-STAR en función de la temperatura del medio ambiente. Para una muestra de 10 drones se
tienen los siguientes resultados:

Temperatura (°C) 25 26 20 25 23 18 18 20 21 22
Tiempo de vuelo (min.) 8 9 10,3 8,4 8,6 12,5 14 11,5 8,9 10

a. Presente el gráfico del plot y comente.


b. Obtenga el modelo estimado de regresión lineal simple.
c. Interprete el coeficiente de regresión.
d. Valide el modelo estimado. Use  = 0,05.
e. Determine e interprete el coeficiente de determinación.
f. Estime el tiempo de vuelo cuando la temperatura del medio ambiente es 24°C.
UPC MA444 Estadística 318
Tablas estadísticas
Tabla de la distribución normal estándar
Área bajo la curva normal 𝑃(𝑍 ≤ 𝑧) = 𝛼

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233
-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350

-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621
-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275

-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681
-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866

-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
UPC MA444 Estadística 319
Tabla de la distribución normal estándar

Área bajo la curva normal 𝑃(𝑍 ≤ 𝑧) = 𝛼

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891

1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670

2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861

3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
UPC MA444 Estadística 320
Tabla de la distribución t - Student
Área bajo la curva 𝑃(𝑇 ≥ 𝑐) = 𝛼

𝛼
𝜐 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1 0.32492 0.72654 1.37638 1.96261 3.07768 6.31375 7.91582 10.57889 12.7062 15.89454 21.20495 31.82052 63.65674
2 0.28868 0.61721 1.06066 1.38621 1.88562 2.91999 3.31976 3.89643 4.30265 4.84873 5.64278 6.96456 9.92484
3 0.27667 0.58439 0.97847 1.24978 1.63774 2.35336 2.60543 2.95051 3.18245 3.48191 3.89605 4.54070 5.84091
4 0.27072 0.56865 0.94096 1.18957 1.53321 2.13185 2.33287 2.60076 2.77645 2.99853 3.29763 3.74695 4.60409
5 0.26718 0.55943 0.91954 1.15577 1.47588 2.01505 2.19096 2.42158 2.57058 2.75651 3.00287 3.36493 4.03214
6 0.26483 0.55338 0.9057 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539
9 0.26096 0.54348 0.8834 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.5738 2.82144 3.24984
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927

11 0.25956 0.53994 0.87553 1.08767 1.36343 1.79588 1.92843 2.09614 2.20099 2.32814 2.49066 2.71808 3.10581
12 0.25903 0.53862 0.87261 1.08321 1.35622 1.78229 1.91231 2.07644 2.17881 2.30272 2.46070 2.68100 3.05454
13 0.25859 0.5375 0.87015 1.07947 1.35017 1.77093 1.89887 2.06004 2.16037 2.2816 2.43585 2.65031 3.01228
14 0.25821 0.53655 0.86805 1.07628 1.34503 1.76131 1.8875 2.04617 2.14479 2.26378 2.41490 2.62449 2.97684
15 0.25789 0.53573 0.86624 1.07353 1.34061 1.75305 1.87774 2.03429 2.13145 2.24854 2.39701 2.60248 2.94671
16 0.25760 0.53501 0.86467 1.07114 1.33676 1.74588 1.86928 2.02400 2.11991 2.23536 2.38155 2.58349 2.92078
17 0.25735 0.53438 0.86328 1.06903 1.33338 1.73961 1.86187 2.01500 2.10982 2.22385 2.36805 2.56693 2.89823
18 0.25712 0.53382 0.86205 1.06717 1.33039 1.73406 1.85534 2.00707 2.10092 2.21370 2.35618 2.55238 2.87844
19 0.25692 0.53331 0.86095 1.06551 1.32773 1.72913 1.84953 2.00002 2.09302 2.20470 2.34565 2.53948 2.86093
20 0.25674 0.53286 0.85996 1.06402 1.32534 1.72472 1.84433 1.99371 2.08596 2.19666 2.33624 2.52798 2.84534

21 0.25658 0.53246 0.85907 1.06267 1.32319 1.72074 1.83965 1.98804 2.07961 2.18943 2.32779 2.51765 2.83136
22 0.25643 0.53208 0.85827 1.06145 1.32124 1.71714 1.83542 1.98291 2.07387 2.18289 2.32016 2.50832 2.81876
23 0.25630 0.53175 0.85753 1.06034 1.31946 1.71387 1.83157 1.97825 2.06866 2.17696 2.31323 2.49987 2.80734
24 0.25617 0.53144 0.85686 1.05932 1.31784 1.71088 1.82805 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694
25 0.25606 0.53115 0.85624 1.05838 1.31635 1.70814 1.82483 1.9701 2.05954 2.16659 2.30113 2.48511 2.78744
26 0.25595 0.53089 0.85567 1.05752 1.31497 1.70562 1.82186 1.96651 2.05553 2.16203 2.29581 2.47863 2.77871
27 0.25586 0.53065 0.85514 1.05673 1.3137 1.70329 1.81913 1.96320 2.05183 2.15782 2.29091 2.47266 2.77068
28 0.25577 0.53042 0.85465 1.05599 1.31253 1.70113 1.81659 1.96014 2.04841 2.15393 2.28638 2.46714 2.76326
29 0.25568 0.53021 0.85419 1.05530 1.31143 1.69913 1.81424 1.95729 2.04523 2.15033 2.28217 2.46202 2.75639
30 0.25561 0.53002 0.85377 1.05466 1.31042 1.69726 1.81205 1.95465 2.04227 2.14697 2.27826 2.45726 2.75000

31 0.25553 0.52984 0.85337 1.05406 1.30946 1.69552 1.81000 1.95218 2.03951 2.14383 2.27461 2.45282 2.74404
32 0.25546 0.52967 0.853 1.0535 1.30857 1.69389 1.80809 1.94987 2.03693 2.14090 2.27120 2.44868 2.73848
33 0.25540 0.5295 0.85265 1.05298 1.30774 1.69236 1.80629 1.94770 2.03452 2.13816 2.26801 2.44479 2.73328
34 0.25534 0.52935 0.85232 1.05248 1.30695 1.69092 1.80461 1.94567 2.03224 2.13558 2.26501 2.44115 2.72839
35 0.25528 0.52921 0.85201 1.05202 1.30621 1.68957 1.80302 1.94375 2.03011 2.13316 2.26219 2.43772 2.72381
36 0.25523 0.52908 0.85172 1.05158 1.30551 1.6883 1.80153 1.94195 2.02809 2.13087 2.25953 2.43449 2.71948
37 0.25518 0.52895 0.85144 1.05117 1.30485 1.68709 1.80012 1.94024 2.02619 2.12871 2.25702 2.43145 2.71541
38 0.25513 0.52883 0.85118 1.05077 1.30423 1.68595 1.79878 1.93863 2.02439 2.12667 2.25465 2.42857 2.71156
39 0.25508 0.52871 0.85094 1.0504 1.30364 1.68488 1.79751 1.93711 2.02269 2.12474 2.25240 2.42584 2.70791
40 0.25504 0.52861 0.85070 1.05005 1.30308 1.68385 1.79631 1.93566 2.02108 2.12291 2.25027 2.42326 2.70446
UPC MA444 Estadística 321
Tabla de la distribución t – Student

Área bajo la curva 𝑃(𝑇 ≥ 𝑐) = 𝛼

𝛼
𝜐 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
41 0.25500 0.52850 0.85048 1.04971 1.30254 1.68288 1.79517 1.93428 2.01954 2.12117 2.24825 2.42080 2.70118
42 0.25496 0.52840 0.85026 1.04939 1.30204 1.68195 1.79409 1.93298 2.01808 2.11952 2.24633 2.41847 2.69807
43 0.25492 0.52831 0.85006 1.04908 1.30155 1.68107 1.79305 1.93173 2.01669 2.11794 2.24449 2.41625 2.69510
44 0.25488 0.52822 0.84987 1.04879 1.30109 1.68023 1.79207 1.93054 2.01537 2.11644 2.24275 2.41413 2.69228
45 0.25485 0.52814 0.84968 1.04852 1.30065 1.67943 1.79113 1.92941 2.0141 2.11500 2.24108 2.41212 2.68959
46 0.25482 0.52805 0.84951 1.04825 1.30023 1.67866 1.79023 1.92833 2.0129 2.11364 2.23949 2.41019 2.68701
47 0.25479 0.52798 0.84934 1.04800 1.29982 1.67793 1.78937 1.92729 2.01174 2.11233 2.23797 2.40835 2.68456
48 0.25476 0.52790 0.84917 1.04775 1.29944 1.67722 1.78855 1.92630 2.01063 2.11107 2.23652 2.40658 2.68220
49 0.25473 0.52783 0.84902 1.04752 1.29907 1.67655 1.78776 1.92535 2.00958 2.10987 2.23512 2.40489 2.67995
50 0.25470 0.52776 0.84887 1.04729 1.29871 1.67591 1.78700 1.92444 2.00856 2.10872 2.23379 2.40327 2.67779

51 0.25467 0.52769 0.84873 1.04708 1.29837 1.67528 1.78627 1.92356 2.00758 2.10762 2.2325 2.40172 2.67572
52 0.25465 0.52763 0.84859 1.04687 1.29805 1.67469 1.78558 1.92272 2.00665 2.10655 2.23127 2.40022 2.67373
53 0.25462 0.52757 0.84846 1.04667 1.29773 1.67412 1.78491 1.92191 2.00575 2.10553 2.23009 2.39879 2.67182
54 0.25460 0.52751 0.84833 1.04648 1.29743 1.67356 1.78426 1.92114 2.00488 2.10455 2.22895 2.39741 2.66998
55 0.25458 0.52745 0.84821 1.04630 1.29713 1.67303 1.78364 1.92039 2.00404 2.10361 2.22785 2.39608 2.66822
56 0.25455 0.52740 0.84809 1.04612 1.29685 1.67252 1.78304 1.91967 2.00324 2.10270 2.22679 2.39480 2.66651
57 0.25453 0.52735 0.84797 1.04595 1.29658 1.67203 1.78246 1.91897 2.00247 2.10182 2.22577 2.39357 2.66487
58 0.25451 0.52730 0.84786 1.04578 1.29632 1.67155 1.78190 1.9183 2.00172 2.10097 2.22479 2.39238 2.66329
59 0.25449 0.52725 0.84776 1.04562 1.29607 1.67109 1.78137 1.91765 2.00100 2.10015 2.22384 2.39123 2.66176
60 0.25447 0.52720 0.84765 1.04547 1.29582 1.67065 1.78085 1.91703 2.00030 2.09936 2.22292 2.39012 2.66028

61 0.25445 0.52715 0.84755 1.04532 1.29558 1.67022 1.78034 1.91642 1.99962 2.0986 2.22204 2.38905 2.65886
62 0.25444 0.52711 0.84746 1.04518 1.29536 1.6698 1.77986 1.91584 1.99897 2.09786 2.22118 2.38801 2.65748
63 0.25442 0.52706 0.84736 1.04504 1.29513 1.6694 1.77939 1.91527 1.99834 2.09715 2.22035 2.38701 2.65615
64 0.25440 0.52702 0.84727 1.04490 1.29492 1.66901 1.77893 1.91472 1.99773 2.09645 2.21955 2.38604 2.65485
65 0.25439 0.52698 0.84719 1.04477 1.29471 1.66864 1.77849 1.91419 1.99714 2.09578 2.21877 2.38510 2.65360
66 0.25437 0.52694 0.84710 1.04464 1.29451 1.66827 1.77806 1.91368 1.99656 2.09514 2.21802 2.38419 2.65239
67 0.25436 0.52690 0.84702 1.04452 1.29432 1.66792 1.77765 1.91318 1.99601 2.09451 2.21729 2.38330 2.65122
68 0.25434 0.52687 0.84694 1.04440 1.29413 1.66757 1.77724 1.91269 1.99547 2.09390 2.21658 2.38245 2.65008
69 0.25433 0.52683 0.84686 1.04428 1.29394 1.66724 1.77685 1.91222 1.99495 2.09330 2.21589 2.38161 2.64898
70 0.25431 0.52680 0.84679 1.04417 1.29376 1.66691 1.77647 1.91177 1.99444 2.09273 2.21523 2.38081 2.64790

75 0.25425 0.52664 0.84644 1.04365 1.29294 1.66543 1.77473 1.90967 1.9921 2.09008 2.21216 2.37710 2.64298
80 0.25419 0.5265 0.84614 1.04320 1.29222 1.66412 1.77321 1.90784 1.99006 2.08778 2.20949 2.37387 2.63869
85 0.25414 0.52637 0.84587 1.0428 1.29159 1.66298 1.77187 1.90623 1.98827 2.08574 2.20713 2.37102 2.63491
90 0.25410 0.52626 0.84563 1.04244 1.29103 1.66196 1.77068 1.90480 1.98667 2.08394 2.20504 2.36850 2.63157
95 0.25406 0.52616 0.84542 1.04212 1.29053 1.66105 1.76961 1.90352 1.98525 2.08233 2.20317 2.36624 2.62858
100 0.25402 0.52608 0.84523 1.04184 1.29007 1.66023 1.76866 1.90237 1.98397 2.08088 2.20150 2.36422 2.62589
105 0.25399 0.52600 0.84506 1.04158 1.28967 1.65950 1.76779 1.90133 1.98282 2.07958 2.19998 2.36239 2.62347
110 0.25396 0.52592 0.84490 1.04134 1.28930 1.65882 1.76701 1.90039 1.98177 2.07839 2.19861 2.36073 2.62126
120 0.25391 0.52580 0.84463 1.04093 1.28865 1.65765 1.76564 1.89874 1.97993 2.07631 2.19620 2.35782 2.61742
∞ 0.25335 0.52440 0.84162 1.03643 1.28156 1.64484 1.75069 1.88079 1.95997 2.05375 2.17009 2.32635 2.57583
UPC MA444 Estadística 322
Tabla de la distribución F
Área bajo la curva: 𝑃(𝐹 ≥ 𝑐) = 𝛼
v1
𝛼 v2 1 2 3 4 5 6 7 8 9 10
0.050 1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 241.88
0.025 647.79 799.48 864.15 899.60 921.83 937.11 948.20 956.64 963.28 968.63
0.010 4052.18 4999.34 5403.53 5624.26 5763.96 5858.95 5928.33 5980.95 6022.40 6055.93
0.005 16212.46 19997.36 21614.13 22500.75 23055.82 23439.53 23715.20 23923.81 24091.45 24221.84
0.050 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40
0.025 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40
0.010 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40
0.005 198.50 199.01 199.16 199.24 199.30 199.33 199.36 199.38 199.39 199.39
0.050 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79
0.025 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42
0.010 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23
0.005 55.55 49.80 47.47 46.20 45.39 44.84 44.43 44.13 43.88 43.68
0.050 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96
0.025 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84
0.010 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55
0.005 31.33 26.28 24.26 23.15 22.46 21.98 21.62 21.35 21.14 20.97
0.050 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74
0.025 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62
0.010 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05
0.005 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62
0.050 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06
0.025 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46
0.010 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87
0.005 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25
0.050 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64
0.025 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76
0.010 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62
0.005 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38
0.050 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35
0.025 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30
0.010 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81
0.005 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21
0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42
0.050 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98
0.025 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72
0.010 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85
0.005 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85
0.050 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85
0.025 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53
0.010 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54
0.005 12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.42
0.050 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75
0.025 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37
0.010 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30
0.005 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09
UPC MA444 Estadística 323
Tabla de la distribución F

Área bajo la curva: 𝑃(𝐹 ≥ 𝑐) = 𝛼


v1
𝜶 v2 12 15 20 24 30 40 50 60 70 120
0.050 1 243.90 245.95 248.02 249.05 250.10 251.14 251.77 252.20 252.50 253.25
0.025 976.72 984.87 993.08 997.27 1001.40 1005.60 1008.10 1009.79 1011.01 1014.04
0.010 6106.68 6156.97 6208.66 6234.27 6260.35 6286.43 6302.26 6312.97 6320.89 6339.51
0.005 24426.73 24631.62 24836.51 24937.09 25041.40 25145.71 25212.76 25253.74 25283.55 25358.05
0.050 2 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.48 19.48 19.49
0.025 39.41 39.43 39.45 39.46 39.46 39.47 39.48 39.48 39.48 39.49
0.010 99.42 99.43 99.45 99.46 99.47 99.48 99.48 99.48 99.48 99.49
0.005 199.42 199.43 199.45 199.45 199.48 199.48 199.48 199.48 199.48 199.49
0.050 3 8.74 8.70 8.66 8.64 8.62 8.59 8.58 8.57 8.57 8.55
0.025 14.34 14.25 14.17 14.12 14.08 14.04 14.01 13.99 13.98 13.95
0.010 27.05 26.87 26.69 26.60 26.50 26.41 26.35 26.32 26.29 26.22
0.005 43.39 43.08 42.78 42.62 42.47 42.31 42.21 42.15 42.10 41.99
0.050 4 5.91 5.86 5.80 5.77 5.75 5.72 5.70 5.69 5.68 5.66
0.025 8.75 8.66 8.56 8.51 8.46 8.41 8.38 8.36 8.35 8.31
0.010 14.37 14.20 14.02 13.93 13.84 13.75 13.69 13.65 13.63 13.56
0.005 20.70 20.44 20.17 20.03 19.89 19.75 19.67 19.61 19.57 19.47
0.050 5 4.68 4.62 4.56 4.53 4.50 4.46 4.44 4.43 4.42 4.40
0.025 6.52 6.43 6.33 6.28 6.23 6.18 6.14 6.12 6.11 6.07
0.010 9.89 9.72 9.55 9.47 9.38 9.29 9.24 9.20 9.18 9.11
0.005 13.38 13.15 12.90 12.78 12.66 12.53 12.45 12.40 12.37 12.27
0.050 6 4.00 3.94 3.87 3.84 3.81 3.77 3.75 3.74 3.73 3.70
0.025 5.37 5.27 5.17 5.12 5.07 5.01 4.98 4.96 4.94 4.90
0.010 7.72 7.56 7.40 7.31 7.23 7.14 7.09 7.06 7.03 6.97
0.005 10.03 9.81 9.59 9.47 9.36 9.24 9.17 9.12 9.09 9.00
0.050 7 3.57 3.51 3.44 3.41 3.38 3.34 3.32 3.30 3.29 3.27
0.025 4.67 4.57 4.47 4.41 4.36 4.31 4.28 4.25 4.24 4.20
0.010 6.47 6.31 6.16 6.07 5.99 5.91 5.86 5.82 5.80 5.74
0.005 8.18 7.97 7.75 7.64 7.53 7.42 7.35 7.31 7.28 7.19
0.050 8 3.28 3.22 3.15 3.12 3.08 3.04 3.02 3.01 2.99 2.97
0.025 4.20 4.10 4.00 3.95 3.89 3.84 3.81 3.78 3.77 3.73
0.010 5.67 5.52 5.36 5.28 5.20 5.12 5.07 5.03 5.01 4.95
0.005 7.01 6.81 6.61 6.50 6.40 6.29 6.22 6.18 6.15 6.06
0.050 9 3.07 3.01 2.94 2.90 2.86 2.83 2.80 2.79 2.78 2.75
0.025 3.87 3.77 3.67 3.61 3.56 3.51 3.47 3.45 3.43 3.39
0.010 5.11 4.96 4.81 4.73 4.65 4.57 4.52 4.48 4.46 4.40
0.005 6.23 6.03 5.83 5.73 5.62 5.52 5.45 5.41 5.38 5.30
0.050 10 2.91 2.85 2.77 2.74 2.70 2.66 2.64 2.62 2.61 2.58
0.025 3.62 3.52 3.42 3.37 3.31 3.26 3.22 3.20 3.18 3.14
0.010 4.71 4.56 4.41 4.33 4.25 4.17 4.12 4.08 4.06 4.00
0.005 5.66 5.47 5.27 5.17 5.07 4.97 4.90 4.86 4.83 4.75
0.050 11 2.79 2.72 2.65 2.61 2.57 2.53 2.51 2.49 2.48 2.45
0.025 3.43 3.33 3.23 3.17 3.12 3.06 3.03 3.00 2.99 2.94
0.010 4.40 4.25 4.10 4.02 3.94 3.86 3.81 3.78 3.75 3.69
0.005 5.24 5.05 4.86 4.76 4.65 4.55 4.49 4.45 4.41 4.34
0.050 12 2.69 2.62 2.54 2.51 2.47 2.43 2.40 2.38 2.37 2.34
0.025 3.28 3.18 3.07 3.02 2.96 2.91 2.87 2.85 2.83 2.79
0.010 4.16 4.01 3.86 3.78 3.70 3.62 3.57 3.54 3.51 3.45
0.005 4.91 4.72 4.53 4.43 4.33 4.23 4.17 4.12 4.09 4.01
UPC MA444 Estadística 324
Tabla de la distribución F

Área bajo la curva: 𝑃(𝐹 ≥ 𝑐) = 𝛼


v1
𝜶 v2 1 2 3 4 5 6 7 8 9 10
0.050 13 4.7 3.8 3.4 3.2 3.0 2.9 2.8 2.8 2.7 2.7
0.025 6.4 5.0 4.3 4.0 3.8 3.6 3.5 3.4 3.3 3.2
0.010 9.1 6.7 5.7 5.2 4.9 4.6 4.4 4.3 4.2 4.1
0.005 11.4 8.2 6.9 6.2 5.8 5.5 5.3 5.1 4.9 4.8
0.050 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60
0.025 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15
0.010 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94
0.005 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.60
0.050 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54
0.025 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06
0.010 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80
0.005 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42
0.050 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35
0.025 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77
0.010 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37
0.005 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85
0.050 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25
0.025 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64
0.010 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17
0.005 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59
0.050 30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16
0.025 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51
0.010 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98
0.005 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.34
0.050 40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08
0.025 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39
0.010 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80
0.005 8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.12
0.050 45 4.06 3.20 2.81 2.58 2.42 2.31 2.22 2.15 2.10 2.05
0.025 5.38 4.01 3.42 3.09 2.86 2.70 2.58 2.49 2.41 2.35
0.010 7.23 5.11 4.25 3.77 3.45 3.23 3.07 2.94 2.83 2.74
0.005 8.71 5.97 4.89 4.29 3.91 3.64 3.43 3.28 3.15 3.04
0.050 50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03
0.025 5.34 3.97 3.39 3.05 2.83 2.67 2.55 2.46 2.38 2.32
0.010 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70
0.005 8.63 5.90 4.83 4.23 3.85 3.58 3.38 3.22 3.09 2.99
0.050 60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99
0.025 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27
0.010 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63
0.005 8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.90
0.050 70 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.02 1.97
0.025 5.25 3.89 3.31 2.97 2.75 2.59 2.47 2.38 2.30 2.24
0.010 7.01 4.92 4.07 3.60 3.29 3.07 2.91 2.78 2.67 2.59
0.005 8.40 5.72 4.66 4.08 3.70 3.43 3.23 3.08 2.95 2.85
0.050 120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91
0.025 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16
0.010 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47
0.005 8.18 5.54 4.50 3.92 3.55 3.28 3.09 2.93 2.81 2.71
UPC MA444 Estadística 325
Tabla de la distribución F

Área bajo la curva: 𝑃(𝐹 ≥ 𝑐) = 𝛼


v1
𝜶 v2 12 15 20 24 30 40 50 60 70 120
0.050 13 2.6 2.5 2.5 2.4 2.4 2.3 2.3 2.3 2.3 2.3
0.025 3.2 3.1 2.9 2.9 2.8 2.8 2.7 2.7 2.7 2.7
0.010 4.0 3.8 3.7 3.6 3.5 3.4 3.4 3.3 3.3 3.3
0.005 4.6 4.5 4.3 4.2 4.1 4.0 3.9 3.9 3.8 3.8
0.050 14 2.53 2.46 2.39 2.35 2.31 2.27 2.24 2.22 2.21 2.18
0.025 3.05 2.95 2.84 2.79 2.73 2.67 2.64 2.61 2.60 2.55
0.010 3.80 3.66 3.51 3.43 3.35 3.27 3.22 3.18 3.16 3.09
0.005 4.43 4.25 4.06 3.96 3.86 3.76 3.70 3.66 3.62 3.55
0.050 15 2.48 2.40 2.33 2.29 2.25 2.20 2.18 2.16 2.15 2.11
0.025 2.96 2.86 2.76 2.70 2.64 2.59 2.55 2.52 2.51 2.46
0.010 3.67 3.52 3.37 3.29 3.21 3.13 3.08 3.05 3.02 2.96
0.005 4.25 4.07 3.88 3.79 3.69 3.59 3.52 3.48 3.45 3.37
0.050 20 2.28 2.20 2.12 2.08 2.04 1.99 1.97 1.95 1.93 1.90
0.025 2.68 2.57 2.46 2.41 2.35 2.29 2.25 2.22 2.20 2.16
0.010 3.23 3.09 2.94 2.86 2.78 2.69 2.64 2.61 2.58 2.52
0.005 3.68 3.50 3.32 3.22 3.12 3.02 2.96 2.92 2.88 2.81
0.050 24 2.18 2.11 2.03 1.98 1.94 1.89 1.86 1.84 1.83 1.79
0.025 2.54 2.44 2.33 2.27 2.21 2.15 2.11 2.08 2.06 2.01
0.010 3.03 2.89 2.74 2.66 2.58 2.49 2.44 2.40 2.38 2.31
0.005 3.42 3.25 3.06 2.97 2.87 2.77 2.70 2.66 2.63 2.55
0.050 30 2.09 2.01 1.93 1.89 1.84 1.79 1.76 1.74 1.72 1.68
0.025 2.41 2.31 2.20 2.14 2.07 2.01 1.97 1.94 1.92 1.87
0.010 2.84 2.70 2.55 2.47 2.39 2.30 2.25 2.21 2.18 2.11
0.005 3.18 3.01 2.82 2.73 2.63 2.52 2.46 2.42 2.38 2.30
0.050 40 2.00 1.92 1.84 1.79 1.74 1.69 1.66 1.64 1.62 1.58
0.025 2.29 2.18 2.07 2.01 1.94 1.88 1.83 1.80 1.78 1.72
0.010 2.66 2.52 2.37 2.29 2.20 2.11 2.06 2.02 1.99 1.92
0.005 2.95 2.78 2.60 2.50 2.40 2.30 2.23 2.18 2.15 2.06
0.050 45 1.97 1.89 1.81 1.76 1.71 1.66 1.63 1.60 1.59 1.54
0.025 2.25 2.14 2.03 1.96 1.90 1.83 1.79 1.76 1.74 1.68
0.010 2.61 2.46 2.31 2.23 2.14 2.05 2.00 1.96 1.93 1.85
0.005 2.88 2.71 2.53 2.43 2.33 2.22 2.16 2.11 2.08 1.99
0.050 50 1.95 1.87 1.78 1.74 1.69 1.63 1.60 1.58 1.56 1.51
0.025 2.22 2.11 1.99 1.93 1.87 1.80 1.75 1.72 1.70 1.64
0.010 2.56 2.42 2.27 2.18 2.10 2.01 1.95 1.91 1.88 1.80
0.005 2.82 2.65 2.47 2.37 2.27 2.16 2.10 2.05 2.02 1.93
0.050 60 1.92 1.84 1.75 1.70 1.65 1.59 1.56 1.53 1.52 1.47
0.025 2.17 2.06 1.94 1.88 1.82 1.74 1.70 1.67 1.64 1.58
0.010 2.50 2.35 2.20 2.12 2.03 1.94 1.88 1.84 1.81 1.73
0.005 2.74 2.57 2.39 2.29 2.19 2.08 2.01 1.96 1.93 1.83
0.050 70 1.89 1.81 1.72 1.67 1.62 1.57 1.53 1.50 1.49 1.44
0.025 2.14 2.03 1.91 1.85 1.78 1.71 1.66 1.63 1.60 1.54
0.010 2.45 2.31 2.15 2.07 1.98 1.89 1.83 1.78 1.75 1.67
0.005 2.68 2.51 2.33 2.23 2.13 2.02 1.95 1.90 1.86 1.77
0.050 120 1.83 1.75 1.66 1.61 1.55 1.50 1.46 1.43 1.41 1.35
0.025 2.05 1.94 1.82 1.76 1.69 1.61 1.56 1.53 1.50 1.43
0.010 2.34 2.19 2.03 1.95 1.86 1.76 1.70 1.66 1.62 1.53
0.005 2.54 2.37 2.19 2.09 1.98 1.87 1.80 1.75 1.71 1.61
UPC MA444 Estadística 326
Índice

bastones, 28
Circular, 19
B de barras, 19
Bayes histograma, 36
Teorema de, 89 ojiva, 36
Pareto, 22
C
M
Censo, 147
Coeficiente de correlación, 221 Marca de clase, 32
Coeficiente de determinación, 221 Media
aritmética, 43
Medidas de tendencia central, 43
D Medidas de variación
Distribución Desviación estándar, 54
binomial, 105 Varianza, 54
continua, 130 Moda, 49
exponencial, 130 Muestra, 7
normal, 134 Muestreo, 147
normal estándar, 134, 135 aleatorio simple, 149
Poisson, 109 probabilístico, 149

E P
Escalas de medición Parámetro, 16, 42
intervalo, 10 Probabilidad
nominal, 10 condicional, 80
ordinal, 10 Prueba de hipótesis
razón, 10 media poblacional, 167
Esperado medias poblacionales, 186
de una variable discreta, 102 proporción poblacional, 176
de variable continua, 125 varianzas poblacionales, 183
Estadística
definición, 6 R
descriptiva, 6, 98
inferencial, 6 Regla multiplicativa
Estadístico, 16, 42 para eventos independientes, 83
Evento Regresión
complementario, 70 lineal, 215
compuesto, 67
independientes, 83 T
mutuamente excluyentes, 67
simple, 66 Tamaño de muestra
Experimento aleatorio, 66 media de una población, 158
Tipos de errores, 165
F
V
Frecuencia
acumulada absoluta, 28 Variable
porcentual, 28 aleatoria continua, 117
Función aleatoria discreta, 99
de densidad, 117 continua, 9
de distribución acumulada, 120 cualitativa, 9
cuantitativa, 9
discreta, 9
G Varianza
Gráfico de una variable aleatoria, 102, 125
UPC MA444 Estadística 327

También podría gustarte