MA444 202201 - Cuaderno de Trabajo

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 313

MA444 Estadística

Civil

Electrónica

Mecatrónica

Cuaderno de trabajo
Área de Ciencias
marzo 2022
2
UPC MA444 Estadística
3
UPC MA444 Estadística

Tabla de contenido

Unidad 1. Estadística Descriptiva...........................................................................................


Estadística........................................................................................................................................................
Estadística descriptiva...........................................................................................................................................7
Estadística inferencial...........................................................................................................................................7
Conceptos básicos............................................................................................................................................
Variables.............................................................................................................................................................10
Escalas de medición............................................................................................................................................12
Dato....................................................................................................................................................................18
Observación........................................................................................................................................................18
Parámetro...........................................................................................................................................................19
Estadístico...........................................................................................................................................................19
Organización de datos cualitativos.................................................................................................................. 20
Tabla de distribución de frecuencias..................................................................................................................20
Gráficos de una variable cualitativa...................................................................................................................21
Tabulaciones cruzadas........................................................................................................................................29
Organización de datos cuantitativos discretos................................................................................................. 32
Tabla de distribución de frecuencias..................................................................................................................32
Gráfico de bastones o líneas...............................................................................................................................32
Organización de datos cuantitativos continuos................................................................................................ 38
Tabla de distribución de frecuencias..................................................................................................................38
Gráficos de una variable cuantitativa continua..................................................................................................44
Métodos numéricos para describir datos cuantitativos....................................................................................50
Definiciones........................................................................................................................................................50
Medidas de tendencia central............................................................................................................................51
Medidas de posición o cuantiles........................................................................................................................58
Medidas de variación o dispersión.....................................................................................................................62
Medida de asimetría...........................................................................................................................................71

Unidad 2. Probabilidad y variable aleatoria.........................................................................77


Definiciones.................................................................................................................................................... 78
Experimento aleatorio........................................................................................................................................78
Espacio muestral.................................................................................................................................................78
Evento.................................................................................................................................................................78
Operaciones con eventos................................................................................................................................ 79
Probabilidad................................................................................................................................................... 82
Regla aditiva de la probabilidad.........................................................................................................................84
Principios fundamentales de conteo..................................................................................................................91
Probabilidad condicional................................................................................................................................. 95
Ley multiplicativa de probabilidad.................................................................................................................. 99
Eventos independientes................................................................................................................................ 100
Aplicación al sistema de componentes: Confiabilidad de sistemas.................................................................104
Probabilidad total y el teorema de Bayes...................................................................................................... 107
Probabilidad total.............................................................................................................................................107
4
UPC MA444 Estadística
Teorema de Bayes............................................................................................................................................107
Variable aleatoria......................................................................................................................................... 117
Distribuciones discretas especiales................................................................................................................ 125
Distribución binomial........................................................................................................................................125
Distribución Poisson.........................................................................................................................................131
Variables aleatorias continuas....................................................................................................................... 139
Función de densidad de una variable continua................................................................................................139
Función de distribución acumulada..................................................................................................................143
Esperado de una variable aleatoria continua...................................................................................................147
Varianza de una variable aleatoria continua....................................................................................................147
Desviación estándar de una variable aleatoria continua.................................................................................147
Coeficiente de variabilidad...............................................................................................................................147
Principales distribuciones de variables aleatorias continuas..........................................................................153
Distribución exponencial..................................................................................................................................153
Distribución normal..........................................................................................................................................158

Unidad 3. Inferencia estadística.........................................................................................169


Conceptos básicos......................................................................................................................................... 170
Unidad elemental.............................................................................................................................................170
Muestreo probabilístico................................................................................................................................ 172
Muestreo simple aleatorio...............................................................................................................................172
Uso de la tabla de números aleatorios.............................................................................................................173
Tamaño de muestra para estimar la media de una población........................................................................182
Margen de error...............................................................................................................................................182
Nivel de confianza.............................................................................................................................................182
Varianza poblacional.........................................................................................................................................182
Prueba de hipótesis...................................................................................................................................... 192
Contraste de hipótesis......................................................................................................................................192
Tipos de errores................................................................................................................................................192
Pasos para realizar una prueba de hipótesis....................................................................................................193
Prueba de hipótesis para una media con varianza poblacional desconocida..................................................194
Prueba de hipótesis para una proporción poblacional....................................................................................203
Prueba de hipótesis para la razón de varianzas poblacionales........................................................................210
Prueba de hipótesis para la diferencia de medias poblacionales....................................................................213
Diseño de experimentos............................................................................................................................... 225
Conceptos generales........................................................................................................................................226
Diseño completamente al azar.........................................................................................................................228
Análisis de la varianza................................................................................................................................... 231
Método de comparaciones múltiples: Prueba de Tukey - Kramer...................................................................236
Regresión lineal simple................................................................................................................................. 245
Diagrama de dispersión o gráfico del plot........................................................................................................247
Método de los mínimos cuadrados..................................................................................................................247
Recta o ecuación de regresión.........................................................................................................................248
Validación del modelo de regresión lineal.......................................................................................................251
Coeficiente de determinación..........................................................................................................................253
Coeficiente de correlación................................................................................................................................253
Tablas estadísticas........................................................................................................................................ 268
Tabla de la distribución normal estándar.........................................................................................................268
5
UPC MA444 Estadística
Tabla de la distribución t - Student...................................................................................................................270
Tabla de la distribución F..................................................................................................................................272

Unidad 1. Estadística Descriptiva

Logro

Al término de la unidad, el estudiante entiende claramente la información presentada en tablas y


gráficas. Asimismo, calcula resúmenes obtenidos a partir de un conjunto de datos y los utiliza para
dar solución a un problema dentro de un contexto real o de su especialidad.

Temario
 La Estadística. Conceptos básicos.
 Organización de datos cualitativos y cuantitativos
 Medidas de tendencia central: media, mediana, moda, media ponderada
 Medidas de posición: cuartiles, deciles y percentiles
 Medidas de dispersión: varianza, desviación estándar y coeficiente de variación
 Coeficiente de asimetría

Bibliografía

 Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.1 (pág. 7-11)
 Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.3 (pág. 11-
17)
 Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.5 (pág. 24-
57)
6
UPC MA444 Estadística
7
UPC MA444 Estadística

Estadística
Es la ciencia de los datos. Implica la recolección de datos, clasificación, organización, análisis e
interpretación de resultados.

Estadística descriptiva
Es la rama de la Estadística que se dedica al análisis, descripción y representación de un conjunto de
datos obtenidos a partir de una muestra. Las conclusiones son válidas sobre las características de
dicho conjunto de datos.

Estadística inferencial
Es la rama de la Estadística que desarrolla los procesos de estimación, análisis y pruebas de hipótesis
de un conjunto de datos extraídos de una muestra, con el propósito de llegar a conclusiones acerca
de una población.

Estadística descriptiva
Se obtienen conclusiones sobre el conjunto de datos sin
incertidumbre. No realiza proyecciones
Recolección de datos
Clasiicación de datos
Organización de datos
Analisis e interpretación

Estadística inferencial
Se obtienen conclusiones respecto a la población bajo
incertidumbre. Realiza proyecciones
Toma de decisiones a partir de una muestra
8
UPC MA444 Estadística

Conceptos básicos
Población
Es un conjunto de elementos (personas, objetos, etc.) que tienen una o más características
observables que se pueden medir en ellos. Se denota por la letra N mayúscula.

Ejemplo 1
Para conocer la opinión que tienen los estudiantes de ingeniería sobre el servicio que ofrece el
Centro de Información, se puede considerar como población a todos los estudiantes de ingeniería de
la UPC matriculados en el semestre anterior.

Muestra
Se denomina muestra a una parte de la población. El tamaño de la muestra se denota con la letra n
minúscula.

Ejemplo 2
Para conocer la opinión que tienen los estudiantes de ingeniería, sobre el servicio que ofrece el
Centro de Información, se puede considerar como muestra a un subconjunto de estudiantes de
ingeniería de la UPC matriculados en el semestre anterior.

Elemento o unidad elemental


Es cada una de las entidades acerca de las cuales se reúnen los datos.

Población Todos los trabajadores del área de marketing de la inmobiliaria Nexo


Muestra Algunos
Elemento Un

Población Todos
Muestra Un subconjunto
Elemento Un
9
UPC MA444 Estadística
Ejemplo 3
El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad
en el departamento de Lima y las consecuencias que éste podría generar en el
Cercado de Lima. Por esta razón, Defensa Civil ha decidido realizar un
diagnóstico de la situación de las viviendas en este distrito encuestando a
1200 viviendas seleccionadas al azar. Parte de la encuesta se presenta a
continuación.

Encuesta de vivienda

1. Tiempo de antigüedad de la vivienda


 Menos de 10 años
 Entre 10 y 20 años
 Más de 20 años
2. Material de construcción de la vivienda:
 Cemento
 Adobe
 Quincha
 Prefabricado
3. Número de habitaciones: ____________
4. Área de terreno: __________ m2
5. La vivienda se encuentra en:
 Buen estado de conservación
 Regular estado de conservación
 Mal estado de conservación

Complete la siguiente ficha técnica:


Fecha: Del 02 al 15 de marzo del 2020
Población: …
Muestra: …
Unidad elemental: …

Con 95% de confianza y 3% de margen de error.

Ejemplo 4
Se realizó un estudio para determinar la cantidad promedio diario de residuos de construcción y
demolición en la ciudad de Lima durante los meses de enero, febrero y marzo del presente año.
Determine la población, muestra y elemento.

Población

Muestra
10
UPC MA444 Estadística
Elemento
Variables
Una variable es la característica de interés de los elementos. Se representan con las letras
mayúsculas de nuestro alfabeto; por lo general, X, Y, Z.

Tipo de variables

Variable cualitativa
Es la característica cuyos valores no son numéricos. Por ejemplo, carrera universitaria, material de
construcción y tipo de resistencia.

Variable cuantitativa
Es la característica cuyos valores son numéricos. Se dividen en discretas y continuas.

Variable cuantitativa discreta


Es aquella variable cuyo resultado sólo puede tomar un número finito o infinito numerable de
valores. Estos valores surgen de un proceso de conteo.

Variable cuantitativa continua


Es aquella variable cuyo resultado puede tomar infinitos valores entre dos valores cualesquiera. Estos
valores surgen de un proceso de medición.

Ejemplo 1
Son variables cuantitativas discretas:
 Número de artículos defectuosos producidos diariamente
 Número de defectos por barra de acero

Son variables cuantitativas continuas:


 Temperatura (°C)
 Longitud de las barras de acero (cm)

Son variables cualitativas:


 Grado de instrucción
 Opinión sobre la calidad del servicio

Ejemplo 2
Si formulamos la siguiente pregunta al elemento: ¿Cuál es tu programa de televisión preferido?, la
variable en estudio la representamos con una letra mayúscula, por ejemplo, X= Programa de
televisión preferido.

Pregunta Variable en estudio Tipo de variable


11
UPC MA444 Estadística
¿Cuál es tu programa de televisión X = programa de televisión
Cualitativa
preferido preferido

Ejemplo 3
En cada caso, identifique la variable en estudio y su tipo.

Pregunta Variable en estudio Tipo de variable

¿Cuál es su grado de
instrucción?

¿Cuál es su ingreso
mensual, en soles?

¿Cuántos hermanos
tiene?

¿Cuál es tu año de
nacimiento?
12
UPC MA444 Estadística
Escalas de medición
Las escalas de medición de las variables permiten determinar la cantidad de información que
contienen los datos e indica el resumen de estos y el análisis estadístico más apropiado.

Las escalas de medida de una variable cualitativa son las siguientes:

Nominal
Una variable está medida en escala nominal cuando los datos son etiquetas o nombres que se
emplean para definir un atributo del elemento. Por ejemplo: el género de las personas, el estado
civil, el número telefónico, etc.

Ordinal
Una variable está medida en escala ordinal cuando pueden ordenarse de acuerdo con algún criterio.
Se pueden ordenar en forma ascendente o descendente. También, pueden registrarse por medio de
un código numérico. Por ejemplo: el orden de mérito de los alumnos en el curso de estadística, el
grado de instrucción de los clientes de un banco, nivel socioeconómico de los alumnos de la
universidad.

Las escalas de medida de una variable cuantitativa son las siguientes:

Intervalo
Una variable está medida en escala de intervalo si el cero es relativo, es decir, no indica la ausencia
de la característica medida. Por ejemplo: las temperaturas en grados Celsius o en grados Fahrenheit.

Razón
Una variable está medida en escala de razón si el cero indica la ausencia de característica de la
medida. Por ejemplo: el sueldo de los empleados de una empresa, el peso de los trabajadores.

Ejemplo 1

Complete:

a. ¿Cuál es tu programa de TV preferido?


Y=
Tipo de variable:
Escala de medida:

b. ¿Cuál es tu carrera profesional


Y=
Tipo de variable:
13
UPC MA444 Estadística
Escala de medida:

c. ¿Cuánto es la temperatura hoy, en grados centígrados?


Y=
Tipo de variable:
Escala de medida:

d. ¿Cuál es su año de nacimiento?


Y=
Tipo de variable:
Escala de medida:

e. ¿Cuántos hermanos tiene?


Y=
Tipo de variable:
Escala de medida:

Ejemplo 2

La Corporación Aceros Perú es una empresa que se dedica a la industria del acero. Actualmente, la
empresa está fabricando hierro esponja, palanquillas de acero, barras helicoidales, alambrón y barras
de construcción y tiene una capacidad de 680,000 toneladas al año. Uno de los mercados a los que
más se orientan los productos es el mercado de la construcción de Lima.

El departamento de Control de Calidad está encargado de realizar un estudio sobre las varillas
devueltas a la fábrica. Al seleccionar una muestra aleatoria de 80 barras de aceros de la sección de
devoluciones del almacén, se midieron algunas características de acuerdo con la siguiente ficha
técnica:

Número de barra: ___________


1. Tipo de barra de acero:
 Corrugado ASTM
 Corrugado Grado60
 Corrugado NBR7480
 Corrugado 4,7 mm
2. El destino de uso de la barra de acero
 Columnas
 Vigas
 Cimentación
 Concreto armado
3. Resistencia a la tracción: ________________ kg/cm 2
14
UPC MA444 Estadística

4. Número de protuberancias: ________________


5. Categoría del límite a afluencia
 Alta
 Regular
 Baja
6. Tipo de defecto
 Escamas  Marcas mecánicas  Corrosión
 Pliegues  Fisuras
 Grietas  Porosidad

A partir de la información, complete el siguiente cuadro.

Indique la población

Indique la muestra

Identifique las características e


indique el tipo de variable y la
escala de medida.
15
UPC MA444 Estadística
Ejercicios propuestos

1. Corporación Domar S.A.C. es una empresa peruana ubicada en la ciudad de Lima con más de ocho
años de experiencia en el sector Industrial. La empresa ejecuta proyectos de instalación de
sistemas mecánicos y electrónicos, además brinda un servicio industrial de mantenimiento
especializado de maquinarias y laboratorios en todas las especialidades de ingeniería. El gerente
del área de servicios quiere convertir a la corporación en una de las empresas con mayor
representatividad, a nivel nacional, en el rubro industrial, por lo que desea evaluar los servicios
brindados durante el último trimestre. Se seleccionaron al azar 22 registros de los servicios
realizados durante el último trimestre. Algunas de las variables registradas se presentan a
continuación:

 Precio neto por el servicio (en miles de soles)


 Rubro de la empresa cliente (Construcción, Industria Manufacturera, Salud, Educación)
 Número de ingenieros necesarios para realizar el servicio
 Tipo de servicio (Mantenimiento preventivo, mantenimiento correctivo, instalación de
laboratorios, instalación de máquinas industriales)
 Cantidad de días de ejecución del servicio

a. Identifique la población y clasifique las variables según su tipo y escala de medida.

Población

Variable Tipo de variable Escala de medida

Precio neto por el servicio

Rubro de la empresa cliente


Número de ingenieros necesarios
para realizar el servicio
Tipo de servicio
Cantidad de días de ejecución del
servicio

2. El gobierno peruano está preocupado por la ocurrencia de un sismo de alta intensidad en el


departamento de Lima y por las consecuencias que esto podría generar, especialmente en
algunos distritos como el Cercado de Lima. Por esta razón, Defensa Civil realizó un diagnóstico de
la situación de las viviendas en el mencionado distrito a través de una muestra de 1200 viviendas
seleccionadas al azar.

Se registraron las siguientes variables:


 Tiempo de construida la vivienda, en años
 Material de construcción de la vivienda (cemento, adobe, quincha, material prefabricado)
 Número de habitaciones por vivienda
 Área del terreno en donde se construyó la vivienda.
16
UPC MA444 Estadística

De acuerdo con el enunciado, identifique:

Población

Muestra

Variable Tipo de variable Escala de medida


Tiempo de construida la
vivienda, en años
Material de construcción de
la vivienda
Número de habitaciones por
vivienda
Área del terreno en donde
se construyó la vivienda

3. Computer es una compañía dedicada a brindar servicios informáticos a empresas que desean
tener una presencia firme y contundente en la red. Esta compañía se dedica al tendido de redes
LAN, instalación de equipos, servidores y toda una gama de productos tecnológicos que puedan
resultar imprescindibles para una empresa.

Como parte de un estudio realizado por Computer se analizó la información correspondiente a


una muestra de 30 empresas en la ciudad de Lima a las que se les brindó los servicios
informáticos.

Identifique el tipo y escala de medición de las variables consideradas en dicho estudio.

Variable Tipo de variable Escala de medida


Lenguajes de programación (Cobol,
Java, etc.)
Cantidad de servidores por
empresa
Costo de las licencias de software
(en dólares)
Año de instalación del software

4. La empresa de investigación de mercados Alpha S.A. realizó un estudio para evaluar el efecto de
la caída de la bolsa de valores de Lima (BVL) en las administradoras de fondos de pensiones (AFP).
En este estudio se tomó una muestra de 300 afiliados entre 25 y 35 años en Lima seleccionados al
azar.

Se registraron las siguientes variables:


 AFP a la que pertenece el afiliado
17
UPC MA444 Estadística
 Monto del fondo del afiliado (en soles)
 Edad del afiliado (en años)
 Tipo de fondo según riesgo (bajo, moderado, alto).

De acuerdo con el enunciado, identifique:

Población

Muestra

Variable Tipo de variable Escala de medida


AFP a la que pertenece el
afiliado
Monto del fondo del
afiliado (en soles)

Edad del afiliado (en años)

Tipo de fondo según riesgo

5. Indique el tipo y la escala de medición de las características observadas en una muestra de


secciones de tuberías de agua.

Variable Tipo de variable Escala de medición

Diámetro de la tubería (pulgadas)

Material de la tubería

Año de instalación

Ubicación (subterránea, aérea)

Longitud de la tubería (pies)


Estabilidad del suelo circundante (inestable,
moderadamente estable o estable)
Corrosividad del suelo circundante (corrosivo
o no corrosivo)
18
UPC MA444 Estadística
Dato
Es la respuesta que se tiene, por variable, de cada unidad elemental. Los datos pueden ser numéricos
o no numéricos.

Observación
Es el conjunto de datos que se tiene por unidad elemental. Existirán tantas observaciones como
elementos se tengan.

Ejemplo 1

La siguiente base de datos contiene información de una muestra de 10 usuarios de Internet de un


determinado distrito de la ciudad capital.

Usuari Principales problemas con Número de PC Tiempo de navegación


Marca de PC
o Internet con Internet diaria (min)
1 HP Saturación de la red 1 194,00
2 Dell Lentitud para subir información 1 274,45
3 IBM Saturación de la red 3 104,89
4 HP Lentitud para ver videos 3 125,53
5 Dell Lentitud para ver videos 3 123,97
6 HP Calidad y durabilidad del modem 4 134,66
7 Otra marca Baja velocidad en la señal 2 256,33
8 HP Otros 2 195,32
9 HP Baja velocidad en la señal 2 121,90
10 Lenovo Lentitud para ver videos 2 378,27

Identifique y complete:

Indique la unidad elemental

¿Cuántos datos hay por unidad elemental?

¿Cuántas observaciones hay?

¿Cuántas características se están evaluando?

¿Cuántos datos hay en total?


Proporcione un ejemplo de dato cuantitativo
discreto
Proporcione un ejemplo de dato cuantitativo
continuo
Proporcione un ejemplo de observación
19
UPC MA444 Estadística
Parámetro
Un parámetro resume una característica de la población. Para obtener su valor se hace necesario
contar con toda la información que brindan los elementos de una población.

Estadístico
Un estadístico resume una característica de la muestra, para obtener su valor se utiliza la
información muestral. El valor obtenido de un estimador se conoce como estimación. Al estimador se
le llama estadígrafo o estadístico.

Algunos parámetros y estadísticos:

Nombre de la medida de resumen Notación del parámetro Notación del estadístico


N N

Promedio
∑ xi ∑ xi
i=1 i=1
μ= x=
N n
Moda Mo mo

A a
Proporción p= ^p=
N n

Ejemplo 1

Se tiene una población de 30 alumnos del curso de estadística de la sección CI3A. A cada alumno se le
preguntó su edad. Con estos 30 datos se calculó la media y se obtuvo un valor de 19,7 años.

Complete el siguiente cuadro:

Indique si la medida de resumen corresponde


a un parámetro o a un estadístico

Indique el valor de la medida de resumen

Indique la notación de la medida de resumen


20
UPC MA444 Estadística

Organización de datos cualitativos

La organización se presenta a través de una tabla y de gráficos.

Tabla de distribución de frecuencias


Distribución de < elementos> según <variable>
Variable Frecuencia absoluta fi Frecuencia relativa hi Frecuencia porcentual pi
f1
Categoría 1 f1 h1 = p1=h 1 ×100 %
n
f2
Categoría 2 f2 h2 = p2=h 2 ×100 %
n
⋮ ⋮ ⋮ ⋮
fk
Categoría k fk h k= pk =hk ×100 %
n
Fuente: ……………………………………..

Los elementos de la tabla de frecuencias se describen a continuación:

Frecuencia absoluta (fi)


La frecuencia absoluta (fi) de una categoría, está dada por el número de repeticiones en las
observaciones que presenta esta categoría.

Frecuencia relativa (hi)


La frecuencia relativa (hi) de una categoría está dada por la proporción del número total de
observaciones que caen en esa categoría.

Frecuencia relativa acumulada (Hi)


La frecuencia relativa acumulada de una categoría está dada por la proporción del número total de
observaciones que caen hasta esa categoría.

Elementos de la tabla de frecuencias

Título
El título de la tabla debe tener la siguiente estructura:

Distribución de <elementos> según <variable en estudio>

Fuente
Se refiere de dónde se recolectaron los datos para posteriormente ser organizados. Se ubica siempre
en la parte inferior de la tabla.
21
UPC MA444 Estadística
Ejemplo 1
La siguiente información muestra la distribución de una muestra de viviendas de un determinado
distrito de Lima según material con el cual fue construido.

Distribución de viviendas según material de construcción


Material de construcción fi hi = fi/n pi = hi x 100%
Cemento 48 0,160
Adobe 100 0,333
Quincha 108 0,360
Material prefabricado 44 0,147
Total 300 1,000
Fuente: Municipalidad distrital

Indique la unidad elemental, variable en estudio, su tipo y escala de medición.

Unidad elemental

Variable en estudio Tipo de variable Escala de medición

Interprete el valor de las siguientes frecuencias:

f3 = …

p3 = …

Gráficos de una variable cualitativa


Barras y sector circular
 Para organizar gráficamente la variable cualitativa se utiliza el gráfico de barras o el gráfico de
sector circular.
 En caso la variable cualitativa sea de escala ordinal, se recomienda usar el gráfico de barras,
donde en el eje X se muestre la jerarquía de las categorías. Si trabajamos con variables cualitativas
de escala nominal, las categorías pueden ser colocadas en cualquier orden.
 En el gráfico de barras es posible usar las frecuencias absolutas o porcentuales, pero se prefieren
las frecuencias porcentuales.
 Para el caso del gráfico circular sólo es posible usar las frecuencias porcentuales.
 El título del gráfico es el mismo que se ha colocado a la tabla de frecuencias.
 En ambos tipos de gráfico, barras o sector circular, colocar la fuente y las etiquetas.
22
UPC MA444 Estadística
Ejemplo 1
La empresa PC Review – Perú está interesada en conocer cuál es el programa de Microsoft Office que
más utilizan los empleados de las empresas de la ciudad de Lima. Por tal motivo seleccionó al azar
una muestra de 500 empleados y se les pidió que indicaran el programa que más usaban
diariamente. La información se presenta a continuación:

Distribución de empleados según tipo de programa de Microsoft que usan diariamente


Programa de Microsoft Número de empleados fi hi pi% = hi x 100%
Access 50
MS Excel 101
MS Power Point 90
MS Word 113
Outlook 101
Otros 45
Total 500
Fuente: PC-Review-Perú

Complete los elementos que faltan en cada uno de los gráficos y comente:

Título del gráfico


120 113
101 101
100
90

80
Axis Title

60
50
45
40

20

0
Access MS Excel MS Power Point MS Word Outlook Otros
Axis Title

Fuente: PC-Review-Perú

Comente el gráfico
23
UPC MA444 Estadística

Chart Title
Otros Access
9% 10%

Outlook
20% MS Excel
20%

MS Word MS Power Point


23% 18%
Fuente: PC-Review-Perú

Comente el gráfico
24
UPC MA444 Estadística

Caso: Corporación Domar S.A.C.

Domar, es una empresa peruana ubicada en la ciudad de Lima y


ejecuta proyectos de instalación de sistemas mecánicos y electrónicos.
Además, brinda servicio de mantenimiento especializado de
maquinarias y laboratorios. Últimamente, se han presentado ciertos
inconvenientes con las empresas que solicitan sus servicios. Por esta
razón, el jefe del área desea realizar una evaluación seleccionando al
azar 32 registros de los servicios que se realizaron el primer trimestre
del presente año.

Complete la siguiente tabla:

Variable Tipo de variable Escala de medición


Costo por servicio (en miles de soles)

Número de técnicos especializados


necesarios para realizar el servicio

Principal queja presentada por la empresa


que recibió un servicio

Tiempo en horas para realizar el servicio

Calificación por el servicio (1 al 10)

El jefe del Área de Servicios impulsará paquetes si más del 25% de los clientes que solicitaron un
servicio pertenecen a este rubro.

Rubro de la empresa cliente de una muestra de 32 registros


Salud Servicios Manufacturera Manufacturera
Construcción Salud Salud Salud
Servicios Servicios Manufacturera Educación
Construcción Servicios Manufacturera Manufacturera
Manufacturera Construcción Educación Manufacturera
Salud Manufacturera Manufacturera Educación
Servicios Manufacturera Manufacturera Servicios
Servicios Manufacturera Salud Educación

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante indica El estudiante El estudiante El estudiante redacta
redacta el la variable y que muestra los indica conque la decisión que
problema, con un herramienta cálculos realizados valor calculado tomará a partir del
lenguaje sencillo, estadística utilizará para dar respuesta responde el resultado de su
como pregunta u en la solución del al problema. problema. análisis.
objetivo. problema.
25
UPC MA444 Estadística

Gráfico de Pareto

 El gráfico de Pareto es un gráfico especial de variable cualitativa. Es un gráfico de barras ordenado


por frecuencia, en orden descendente.
 Permite mostrar gráficamente el principio de Pareto: “el 80% de los problemas se pueden
solucionar, si se eliminan el 20% de las causas que los originan” (pocos vitales, muchos triviales).
 Este diagrama es un caso particular de gráfico de barras y es utilizado básicamente para conocer
cuáles son los factores más importantes en un problema y que deben priorizarse para aplicar
mejoras o medidas correctivas.

Pasos para realizar el gráfico de Pareto

 Recolectar los datos y clasificarlos por categorías.


 Ordenar las categorías de la variable de mayor a menor, según sus frecuencias absolutas.
 La categoría “Otros” debe ser colocada en la última posición, independientemente de cuál sea su
valor.
 Dibuje dos ejes verticales y uno horizontal. En el eje vertical secundario use la escala de 0% a
100% y en el eje vertical primario, use la escala de 0 hasta el número total de observaciones. En el
eje horizontal, marque los espacios donde estarán dibujadas las barras para cada una de las
categorías, incluida la categoría “Otros”.
 Calcule los porcentajes individuales y acumulados de cada categoría.
 Elabore el diagrama de barras y dibuje la línea de frecuencias acumuladas (curva de Pareto).
 Coloque el título principal, título del eje X, título del eje Y, primario y secundario, etiquetas y
fuente.

Ejemplo 1
El jefe de control de calidad de la empresa Mundo está interesado en conocer cuáles son las
principales causas que están afectando la producción. Al seleccionar una muestra de 450 artículos
fallados obtuvo los siguientes resultados:

Distribución de …
Causas que afectan la producción Cantidad
Inestabilidad máquina 56
Cambios ambientales 191
Rotura máquina 35
Cansancio operador 11
Desgaste del equipo 3
Desviación del material 5
Fluctuación energía 9
Error de medición 10
Partida fría 8
Rotura de operador 122
Total 450
26
UPC MA444 Estadística
Fuente: Empresa Mundo

Complete el diagrama de Pareto agrupando en la categoría “Otros” a las categorías cuyas frecuencias
absolutas sean de 10 a menos e identifique las principales causas que resuelvan el 80% de los
problemas de producción.

Distribución de …
Causas que afectan la producción fi hi Fi Hi
Cambios ambientales 191 0,424 191 42,4%
Rotura de operador 122 0,271 313 69,6%
Inestabilidad máquina 56 0,124 369 82,0%
Rotura máquina
Cansancio operador
Otros
Total 450 1    
Fuente: Empresa Mundo

Chart Title
100.0%
450 92.2% 100%
89.8%
400 82.0%
350 80%

Porcentaje acumulado de artículos


69.6%
Número de artículos

300
60%
250
42.4%
200 191
40%
150 122
100 20%
56
50 35

0 0%
a
.

...

...
r

s
t..

do

in

ro
er
áq
en

Ot
ra

op
m

áq
bi

pe

ad
am

io
eo

c
lid

ra

an

Principal causa
os

tu
bi

Fuente: Empresa Mundo


ns
ra
bi

ta

Ro

Ca
m

tu

es
Ca

Ro

In
27
UPC MA444 Estadística
Ejercicios propuestos

6. La siguiente tabla muestra información sobre el defecto observado con mayor frecuencia en los
puentes vecinales construidos en estructura de madera en cierta localidad del interior del país:

Distribución de puentes vecinales según tipo de defecto observado


Defectos observados fi hi Fi Hi

Pandeos y rajaduras 40
Pudrimiento de las piezas de madera 30
Efectos del desgaste mecánico 20
Otros 5
Deformaciones 15
Ataques de insectos y crustáceos 10
Acción de fuego 5
Fuente: Municipalidad distrital

Elabore el diagrama de Pareto para identificar qué defectos deben priorizarse en este tipo de
puentes.

7. Rex es una empresa con más de 30 años en el mercado y está dedicada a la fabricación de hornos
para la elaboración de ladrillos que requieren altas temperaturas de secado. Estos aparatos
pueden causar daños bastantes considerables a los operarios cuando el horno no está
funcionando correctamente.

Durante el último mes, el departamento de control de calidad seleccionó una muestra de 57


hornos para su revisión. Los problemas que se observaron en la revisión se muestran a
continuación:

Distribución de ...
Principal problema Número de hornos
Condensación precoz 5
Retracciones del mortero 12
Cocción de ladrillos 15
Otros 8
Caliches 9
Exfoliaciones 8
Fuente: Rex S.A.

El departamento de control de calidad tiene por norma priorizar los problemas que resuelvan
alrededor del 80% del total de casos. Sin embargo, si estos problemas son más de tres, dicho
departamento ordenará una revisión total del proceso de producción. Indique lo que hará el
departamento de control de calidad.
28
UPC MA444 Estadística

8. Metronics es una fábrica especializada en la producción de piezas electrónicas para ensamblaje de


computadoras. En los últimos meses, el jefe de producción ha registrado pérdidas, por ello, ha
solicitado información estadística. Una muestra aleatoria de 30 piezas defectuosas fabricadas
diariamente por el área de producción arrojó la siguiente información respecto al problema
observado en la pieza defectuosa.

Basado en su experiencia, el inspector determina que corrigendo a lo más el 77% de los


problemas se reducen pérdidas en la producción. Si se llega a identificar que los problemas a
corregir son tres, entonces pasará por un nuevo proceso de evaluación de calidad de los
productos. ¿La empresa será sometida nuevamente a un proceso de evaluación de calidad?

Distribución de …
Problema observado Número de piezas fabricadas
Recalentamiento 3
Corrosión 6
Rajadura 8
Deformación 9
No cumple estándar 4
Fuente: Metronics S. A.
29
UPC MA444 Estadística
Tabulaciones cruzadas
También llamadas tablas de contingencia o tablas de doble entrada. Se usan para resumir de manera
simultánea los datos de dos variables.

Ejemplo 1
Uno de los requisitos que toda represa debe tener es poder conservar las condiciones de
funcionalidad y de seguridad que permita su utilización a lo largo de su vida útil, sufriendo las
menores incidencias posibles y dando cumplimiento a la legislación de seguridad y mantenimiento
vigentes.

La Confiep sospecha que existe un alto porcentaje de represas de tipo terraplén en mal y muy mal
estado de conservación. De comprobarse que este porcentaje supera el 10%, la represa será
declarada en emergencia. La información de la tabla fue obtenida al término de la inspección de las
represas.

Estado de conservación
Tipo de represa
Bueno Regular Malo Muy Malo Total
Cimiento 16 17 12 12 57
Excavación 5 8 5 11 29
Terraplén 7 9 13 5 34
Total 28 34 30 28 120
Fuente: Confiep

Identifique las variables en estudio, tipos y escalas de medida.

Identifique la unidad elemental.

Coloque título a la tabla.

Interprete el valor de la celda sombreada con respecto al total de fila.


30
UPC MA444 Estadística

Interprete el valor de la celda sombreada con respecto al total de columna.

Interprete el valor de la celda sombreada con respecto al gran total.

Ejemplo 2
Un estudio realizado por A&C Consultores sobre los tipos de riesgos asociados a las excavaciones de
zanjas y tipo de terreno, arrojó los siguientes resultados en base a una muestra de 500 obras de
construcción.

Distribución de las obras de construcción según tipo de terreno y riesgo más importante
Tipo de riesgo más importante
Tipo de terreno
Atrapamiento Caída de personal Derrumbe Inundaciones Otros Total
Roca blanda 27 66 51 9 25 178
Roca dura 15 53 38 3 9 118
Tierra arcillosa 9 31 17 1 10 68
Tierra fuerte 17 55 36 10 18 136
Total 68 205 142 23 62 500
Fuente: Consultores A&C

Indique el número de obras de construcción cuyo tipo de terreno son de roca dura y presentan riesgo
de derrumbe.

Del total de obras que presentan riesgo de atrapamiento, indique el porcentaje de obras de
construcción son de tierra fuerte.

Indique el porcentaje de obras de construcción con riesgo de inundación y roca dura.


31
UPC MA444 Estadística
32
UPC MA444 Estadística
Ejercicios propuestos

9. La siguiente tabla muestra la distribución de clientes de la empresa de telefonía según sus


principales quejas.

Distribución de clientes según principales quejas


Principales quejas fi hi Fi Hi
Cambios sin consentimiento 246
Tarifas y servicios 106
Forzamiento al cambio 29
Marketing 74
Llamadas internacionales 15
Maltratos 12
Servicio de operadora 18
Fuente: Empresa de telefonía A

Construya el diagrama de Pareto para la variable en estudio. Considere un acumulado de menos


de 8% para la categoría Otros. ¿Cuáles son las quejas que deberán priorizarse?

10.En la siguiente tabla se muestran los resultados obtenidos de un estudio realizado en la ciudad de
Nazca por un grupo de profesionales de la UPC de la facultad de Ingeniería sobre las fallas
estructurales en las edificaciones debido al último sismo que tuvo como epicentro la ciudad de
Nazca.

Distribución de edificaciones en Nazca según falla estructural debido al último sismo


Falla estructural Porcentaje
Columnas cortas 10%
Configuración del edificio 45%
Problemas geotécnicos 30%
Otros 10%
Piso blando 5%
Fuente: UPC. Facultad de Ingeniería

Construya un diagrama de Pareto para identificar las fallas estructurales que tienen mayor
incidencia en las edificaciones en la ciudad de Ica debido al último sismo mencionado.
33
UPC MA444 Estadística

Organización de datos cuantitativos discretos

La variable cuantitativa discreta, además de presentar las frecuencias absolutas y relativas, presenta
dos frecuencias acumuladas. La frecuencia acumulada absoluta representada por Fi y la frecuencia
acumulada relativa representada por Hi.

Tabla de distribución de frecuencias

Frecuencia acumulada absoluta (Fi)


Representa el número de observaciones que caen hasta esa categoría.

Frecuencia porcentual (pi)


Representa el valor porcentual de la frecuencia relativa.

Distribución de < elementos> según <variable>


Variable fi hi Fi Hi pi
0 f1 h1 F1 H1 p1
1 f2 h2 F2 H2 p2
2 f3 h3 F3 H3 p3
… … … … … …

k fk hk n 1 pk
Total n 1
Fuente: ………

Gráfico de bastones o líneas


Es un gráfico para variable cuantitativa discreta donde se representan los valores de la variable y sus
respectivas frecuencias absolutas, relativas o porcentuales. Como todo gráfico debe tener su título
principal, títulos en los ejes, X e Y, las etiquetas, y la fuente.

Elementos de la tabla de frecuencias

Título
El título de la tabla debe tener la siguiente estructura:

Distribución de <elementos> según <variable en estudio>

Fuente
Se refiere de dónde se recolectaron los datos para posteriormente ser organizados. Se ubica siempre
en la parte inferior de la tabla.
34
UPC MA444 Estadística
35
UPC MA444 Estadística
Ejemplo 1
Corporación Domar S.A.C. es una empresa peruana ubicada en la ciudad de Lima. El gerente de
servicios desea evaluar el servicio brindado durante el primer trimestre del año, para ello seleccionó
al azar 22 registros de servicios realizados en dicho periodo. Para lograr una mayor
representatividad, se requiere que el número de ingenieros necesarios para realizar un servicio debe
ser como máximo 6, esto es por criterio de optimización del personal especializado. Si más del 15%
de los servicios se realizaron con más de 6 ingenieros, entonces el gerente sancionará al jefe de
personal. ¿Qué decisión tomará? La data se presenta a continuación:

Número de Precio neto del servicio


Servicio Tipo de servicio
ingenieros (en miles de soles)
1 5 23.3 Mantenimiento preventivo
2 4 27.5 Instalación de laboratorios
3 7 23 Mantenimiento preventivo
4 3 28.1 Mantenimiento correctivo
5 4 34.5 Instalación de laboratorios
6 7 38.4 Instalación de máquinas industriales
7 5 28.1 Mantenimiento correctivo
8 5 30.7 Instalación de laboratorios
9 3 31.9 Mantenimiento correctivo
10 3 30.7 Mantenimiento preventivo
11 3 26.5 Mantenimiento preventivo
12 4 36.9 Instalación de máquinas industriales
13 6 30.7 Instalación de laboratorios
14 3 29 Instalación de máquinas industriales
15 3 38.1 Mantenimiento correctivo
16 5 31.2 Instalación de laboratorios
17 4 35.8 Instalación de laboratorios
18 7 34 Instalación de máquinas industriales
19 5 35 Mantenimiento correctivo
20 6 30 Mantenimiento correctivo
21 6 31.2 Instalación de máquinas industriales
22 5 28.2 Mantenimiento preventivo

a. Identifique la variable, su tipo y escala de medida.


b. Identifique la herramienta a usar para dar respuesta a la consulta del gerente.
c. ¿Qué decisión tomará el gerente de servicio?

Solución

a. Identifique la variable, su tipo y escala de medida.

 Variable: Número de ingenieros necesarios para realizar el servicio


 Tipo: cuantitativa discreta
 Escala: razón
36
UPC MA444 Estadística
b. Identifique la herramienta a usar para dar respuesta a la consulta del gerente.

Se pide determinar el porcentaje de servicios con más de 6 ingenieros. Por lo tanto, se


debe realizar la tabla de distribución de frecuencias y adicionalmente el gráfico de
bastones.

Distribución de servicios según número de ingenieros


Número de ingenieros fi hi Fi Hi
3 6 0.273 6 0.273
4 4 0.182 10 0.455
5 6 0.273 16 0.727
6 3 0.136 19 0.864
7 3 0.136 22 1.000
Total 22 1.000
Fuente: Corporación Domar S.A.C.

Distribución de servicios según número de ingenieros

30% 27.3% 27.3%


porcentaje de ingenoeros

25%

20% 18.2%

15% 13.6% 13.6%

10%

5%

0%
2.5 3 3.5 4 4.5 5 5.5 6 6.5 7 7.5

Fuente: Corporación Domar Número de ingenieros


S.A.C.

c. ¿Qué decisión tomará el gerente de servicio?

Se observa que en el 13,6% de los servicios realizados participaron más de 6 ingenieros y de acuerdo
a la condición, el gerente del área de servicios no sancionará al jefe de personal.
37
UPC MA444 Estadística

Ejemplo 2
A continuación, se presenta el gráfico de bastones para la variable <número de capacitaciones
realizadas durante el último semestre del año>, obtenida a partir de una muestra de trabajadores de
una determinada empresa de cemento ubicada en la ciudad de Lima. En base al siguiente gráfico
identifique:

Distribución de empleados según número de capacitaciones


Número de empleados

60 54 52
49
50
40
30
20 16
8 6
10
0
0 1 2 3 4 5 6
Número de capacitaciones
Fuente: Empresa de Cemento A

Identifique la unidad elemental.

Indique el tamaño de muestra.

Indique la variable en estudio.

Interprete el gráfico
38
UPC MA444 Estadística
Ejercicios propuestos

11.El jefe de recursos humanos de la empresa A desea determinar la distribución de la cantidad de


faltas que han tenido los trabajadores el mes anterior. Por tal motivo, seleccionó al azar 30
trabajadores y registró el número de faltas. Los datos se presentan a continuación:

0 0 0 0 1 1 1 1 1 1 1 1 2 2 2
2 2 2 2 2 2 2 3 3 3 3 3 3 4 4

a. Con la información anterior, indique:

Variable en estudio

Escala de medida de la variable

Unidad elemental

Interprete un dato

b. Complete la tabla y llene los espacios en blanco.

Distribución de ……
Número de faltas fi hi Fi Hi
0 4 4
1 8 12
2 10 22
3 28
4 30
Total
Fuente: Empresa A

c. Indique el porcentaje de trabajadores que no presentaron faltas el mes anterior.


d. Indique el número de trabajadores que tuvieron a lo más dos faltas.
e. Los trabajadores con problemas son aquellos con tres o más faltas. Indique el porcentaje de
trabajadores que tienen problemas.
f. Interprete la primera frecuencia absoluta.
g. Interprete la tercera frecuencia relativa.
h. Interprete la cuarta frecuencia acumulada absoluta.
i. Presente el gráfico adecuado para la variable en estudio. Interprete.

12.La siguiente información muestra el número de ladrillos defectuosos fabricados diariamente en


una de las plantas de la empresa Rex. En una muestra aleatoria de 50 días se obtuvo la siguiente
información:
39
UPC MA444 Estadística
Distribución de días según número de ladrillos defectuosos
Número de ladrillos defectuosos fi hi Fi Hi
0 12
1 0,32
2 0,10
3 9
4 8 0,16
Total 50 1,00

Fuente: Rex S.A.

Si el gerente de Rex encuentra al menos un ladrillo defectuoso, en más de 40 días, deberá revisar
su sistema de fabricación.

13.El gerente de la empresa Líder S.A. solicita al jefe del Departamento de Ingeniería realizar una
investigación de las obras que fueron atendidas por la empresa el periodo anterior. Para la
realización del estudio, seleccionó aleatoriamente una muestra de 160 obras de construcción
atendidas el año pasado. La gerencia decidirá adquirir más camiones mezcladores, para las obras
de construcción, si el porcentaje de obras en el que se utiliza mínimo tres camiones para el
traslado del concreto armado premezclado supera el 55%. Indique lo que hará la empresa.

Distribución de obras según número de camiones


60 55
Cantidad de obras

50 45

40
30 25

20 15
10 10
10
0
0 1 2 3 4 5 6 7
Número de camiones
Fuente: Empresa Líder S.A.

14.Investigadores del Massachussets Institute of Technology (MIT) estudiaron las propiedades


espectroscópicas de asteroides de la franja principal, con un diámetro menor a los 100 kilómetros.
Los asteroides se observaron con el telescopio Hiltner del observatorio de MIT; se registró el
número de exposiciones de imagen espectral independiente para cada observación. Aquí se
presentan los datos de 40 observaciones de asteroides obtenidas de Science.

3 4 3 3 1 4 1 3 2 3
1 1 4 2 3 3 2 6 1 1
3 3 2 2 2 2 1 3 2 1
6 3 1 2 2 3 2 2 4 2

Construir un gráfico de bastones para el número de exposiciones de imagen espectral.


40
UPC MA444 Estadística
41
UPC MA444 Estadística

Organización de datos cuantitativos continuos


Los datos se agruparán de intervalo (también llamados clases, categorías o grupos) cuando la
variable tiene gran variabilidad.

Tabla de distribución de frecuencias


Distribución de <unidades elementales> según <variable>
Frecuenci Frecuencia Frecuencia
Intervalos ´ Frecuencia
Marca de clase x 1 a absoluta absoluta relativa
(clases) relativa hi
fi acumulada F i acumulada H i
Li 1 + Ls 1 f1
[ Li 1−Ls 1 ] ´
x 1= f1 h1 = F 1=f 1 H 1=h 1
2 n
L + L f2
¿ Li 2−Ls 2 ¿ ¿ x ´2= i2 s 2 f2 h2 = F 2=f 2+ F 1 H 2=h2+ H 1
2 n
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
Lik + L sk fk
¿ Lik −Lsk ¿ ¿ ´
xk= fk hk= F k =f k + Fk −1 H k =hk + H k−1
2 n
Total n 1,00
Fuente:

Pasos para elaborar la tabla de distribución de frecuencias


 Obtener el rango ( R ) o recorrido, usando la siguiente fórmula:

R=datomáximo −dato mínimo

 Calcular el número de intervalos, usando la regla de Sturges:

k =1+3,322 log 10 n

El valor de k debe ser un valor entero y se redondea por redondeo simple.

 Calcular la amplitud del intervalo, usando la siguiente fórmula:

R
w=
k

El valor de w debe tener el mismo número de cifras decimales que tienen los datos y se
redondea por exceso.

Si los datos son enteros Si w = 12,7207; entonces w =

Si los datos tienen una cifra decimal Si w = 2,0205; entonces w =


42
UPC MA444 Estadística

Si los datos tienen dos cifras decimales Si w = 165,33033; entonces w =

 Calcular las frecuencias absolutas y relativas con sus respectivas frecuencias acumuladas.

 Calcular la marca de clase a través de la siguiente fórmula:

límite inferior i+límite superior i


x ´i =
2

Ejemplo 1
Corporación Domar S.A.C. es una empresa peruana ubicada en la ciudad de Lima. El gerente de
servicios desea evaluar el servicio brindado durante el primer trimestre del año, para ello seleccionó
al azar 22 registros de servicios realizados en dicho periodo. La data se presenta a continuación:

Número de Precio neto del servicio


Servicio Tipo de servicio
ingenieros (en miles de soles)
1 5 23.3 Mantenimiento preventivo
2 4 27.5 Instalación de laboratorios
3 7 23 Mantenimiento preventivo
4 3 28.1 Mantenimiento correctivo
5 4 34.5 Instalación de laboratorios
6 7 38.4 Instalación de máquinas industriales
7 5 28.1 Mantenimiento correctivo
8 5 30.7 Instalación de laboratorios
9 3 31.9 Mantenimiento correctivo
10 3 30.7 Mantenimiento preventivo
11 3 26.5 Mantenimiento preventivo
12 4 36.9 Instalación de máquinas industriales
13 6 30.7 Instalación de laboratorios
14 3 29 Instalación de máquinas industriales
15 3 38.1 Mantenimiento correctivo
16 5 31.2 Instalación de laboratorios
17 4 35.8 Instalación de laboratorios
18 7 34 Instalación de máquinas industriales
19 5 35 Mantenimiento correctivo
20 6 30 Mantenimiento correctivo
21 6 31.2 Instalación de máquinas industriales
22 5 28.2 Mantenimiento preventivo

La meta del gerente del área de servicios es que menos del 38% de los servicios tengan
precios netos hasta 29200 soles. De llegar a cumplirse la meta, el gerente será reconocido
con una bonificación especial por parte del directorio.

a. Identifique la variable, su tipo y escala de medida.


b. Identifique la herramienta a usar para dar respuesta a la consulta del gerente.
43
UPC MA444 Estadística
c. ¿El gerente recibirá la bonificación especial?

Solución

a. Identifique la variable, su tipo y escala de medida.

 Variable: Precio neto por el servicio, en soles


 Tipo: cuantitativa continua
 Escala: razón

b. Identifique la herramienta a usar para dar respuesta a la consulta del gerente.

Se pide determinar el porcentaje de servicios realizados cuyos precios netos sean como
máximo 29200 soles; por lo tanto, se debe realizar la tabla de distribución de frecuencias y
adicionalmente el histograma.

Para construir la tabla de frecuencias seguir los siguientes pasos:

 Calcule el rango (R) o recorrido.

R=dato máximo−dato mínimo = 38,4 – 23 =15,4

 Determine el número de intervalos (k ).

k =1+3,322 log 10 ( 22 )=5,46

Como k debe ser un número entero, por redondeo simple k = 5

 Determine el tamaño del intervalo de clase (w ).

15,4
w= =3,08
5

Los datos tienen dos decimales; por lo tanto, w se redondea por exceso a un decimal, luego, el
valor de w es 3,1

Distribución de servicios según precio neto


i Intervalo X´i fi hi Fi Hi
1 [23,0 26,1] 24,6 2 0,091 2 0,091
2 ]26,1 29,2] 27,7 6 0,273 8 0,364
3 ]29,2 32,3] 30,8 7 0,318 15 0,682
4 ]32,3 35,4] 33,9 3 0,136 18 0,818
5 ]35,4 38,5] 37,0 4 0,182 22 1,000
    22 1    
44
UPC MA444 Estadística

Distribución de servicios según precio neto


35%
31.80%

porcentaje de servicios
30% 27.30%
25%

20% 18.20%

15% 13.60%

10% 9.10%

5%

0%
[23.0-26.1] ]26.1-29.2] ]29.2-32.3] ]32.3-35.4] ]35.4-38.5]
precio neto
Fuente: Corporación Domar S.A.C.

c. ¿El gerente recibirá la bonificación especial?

Se observa que el 36,4% de los servicios tienen precios netos menores o iguales a 29200
soles. Por lo tanto, el gerente será reconocido con una bonificación especial por parte del
directorio de la Corporación Domar S.A.C.

Ejemplo 2
Se ha llevado a cabo un estudio para evaluar el tiempo, en horas, que utiliza cada trabajador de una
planta hidroeléctrica para verificar el normal funcionamiento de la tubería de presión y las válvulas
de control. Para ello se eligieron al azar 30 de ellos.

0,08 0,15 0,19 0,71 0,75 0,82 0,84 0,92 0,96 1,16 1,17 1,19 1,23 1,4 1,47
1,59 1,61 2,01 2,16 2,38 2,42 3,07 3,22 3,53 3,76 3,94 4,5 4,59 4,75 5,41

Para construir la tabla de frecuencias deberá seguir los siguientes pasos:

 Calcule el rango (R) o recorrido.

 Determine el número de intervalos (k ).

 Determine el tamaño del intervalo de clase (w ).


45
UPC MA444 Estadística

Complete la siguiente tabla:

Título: …
i Intervalo X´i fi hi Fi Hi
1 [0,08 – 0,97]
2 ]0,97 – 1,86]
3 ]1,86 – 2,75]
4 ]2,75- 3,64]
5 ]3,64 – 4,53]
6 ]4,53 – 5,42]

Fuente: ……………………

Interprete los valores de las siguientes frecuencias.

f2

h2(%)

F4

H4(%)

Ejemplo 3
Use la regla de Sturges para construir la tabla de distribución de frecuencias del monto de venta
diario, en cientos de soles, de la empresa Beta Systems S.A.

52,0 94,7 95,1 97,5 102,5 104,1 106,0 125,2 125,6 146,0
146,8 158,6 158,7 162,6 166,2 166,2 166,2 166,2 168,2 169,7
196,0 204,9 204,9 204,9 204,9 208,3 215,2 217,5 218,1 218,1
218,1 218,1 220,9 226,2 235,0 239,7 242,2 259,6 261,6 277,2
286,5 287,0 297,8 313,9 315,0 316,2 338,6 359,9 363,1 398,3

Identifique.

Elemento

Variable en estudio
46
UPC MA444 Estadística

Tipo de variable y escala

Complete la siguiente tabla:

Título: …
Intervalo X´i fi hi Fi Hi

Fuente: …

Interprete los valores de las siguientes frecuencias.

f2

h3(%)

F4

H2(%)
47
UPC MA444 Estadística
Gráficos de una variable cuantitativa continua
Son gráficas que representan las observaciones obtenidas de la variable cuantitativa continua. Se
pueden realizar con las fi o pi. Como todo gráfico los elementos son: el título principal, título de los
ejes X e Y, etiquetas y fuente.

Los siguientes gráficos se han obtenido con los datos del ejemplo 2 y usando el software MINITAB.

Histograma

Es una gráfica de barras cuyos valores del eje X son los intervalos de clase. Además, la altura de las
barras está determinada por las frecuencias relativas de los intervalos de clase. Según el interés del
estudio se pueden considerar también, las frecuencias absolutas.

Polígono
Es una gráfica donde los valores del eje X son las marcas de clase.

Para cerrar el polígono se debe aplicar el siguiente artificio: restar a la primera marca de clase el valor
de la amplitud y sumar a la última marca de clase el valor de la amplitud.

Según sea el interés del estudio se pueden considerar las frecuencias absolutas o porcentuales.
48
UPC MA444 Estadística

Ojiva
Es una gráfica donde los valores del eje X son los límites superiores.

Es una gráfica creciente a la que debe aplicarse el siguiente artificio: El primer valor del eje X es el
dato más pequeño del conjunto de datos o valor mínimo o valor del primer límite inferior.

Según el interés del estudio se pueden considerar las frecuencias absolutas o relativas.
49
UPC MA444 Estadística
Ejercicios propuestos

15.El jefe del Área de Operaciones de Tricon S.A. aplicará una mejora continua en la distribución del
concreto premezclado a las obras, debido a las constantes quejas de los clientes respecto al
tiempo de llegada de los camiones a la obra desde la planta de Los Olivos. Tomará tal decisión si
más del 30% de los camiones llegan después de los 39,5 minutos a la obra.

19,1 20,0 23,9 26,1 26,5 27,9 30,1 30,8 32,9 34,7
36,1 36,5 36,6 37,5 38,4 39,3 43,7 44,2 44,6 45,1
46,1 46,3 48,8 51,3 52,7 52,9 53,0 55,0 57,3 59,6

¿Recomendaría usted aplicar la mejora continua en la distribución del concreto premezclado?

16.Corporación Domar es una empresa peruana ubicada en la ciudad de Lima con más de ocho años
de experiencia en el sector Industrial. La empresa ejecuta proyectos de instalación de sistemas
mecánicos y electrónicos, además brinda un servicio industrial de mantenimiento especializado
de maquinarias y laboratorios en todas las especialidades de ingeniería. Debido a las expectativas
de las utilidades del último trimestre, la meta del gerente del área de servicios es que por lo
menos el 40% de servicios tengan precios netos por el servicio mayores a 33 900 soles. De llegar a
cumplir la meta, el gerente será reconocido con una bonificación por parte del directorio. ¿Cuál
será la decisión del directorio? Los registros del último trimestre se presentan a continuación:

N° de Número de Precio neto del servicio


Tipo de servicio
servicio ingenieros (en miles de soles)
1 5 23,3 Mantenimiento preventivo
2 4 27,5 Instalación de laboratorios
3 7 23,0 Mantenimiento preventivo
4 3 28,1 Mantenimiento correctivo
5 4 34,5 Instalación de laboratorios
6 7 38,4 Instalación de máquinas industriales
7 5 28,1 Mantenimiento correctivo
8 5 30,7 Instalación de laboratorios
9 3 31,9 Mantenimiento correctivo
10 3 30,7 Mantenimiento preventivo
11 3 26,5 Mantenimiento preventivo
12 4 36,9 Instalación de máquinas industriales
13 6 30,7 Instalación de laboratorios
14 3 29,0 Instalación de máquinas industriales
15 3 38,1 Mantenimiento correctivo
16 5 31,2 Instalación de laboratorios
17 4 35,8 Instalación de laboratorios
18 7 34,0 Instalación de máquinas industriales
19 5 35,0 Mantenimiento correctivo
20 3 28,0 Mantenimiento correctivo
21 6 31,2 Instalación de máquinas industriales
22 5 28,2 Mantenimiento preventivo
50
UPC MA444 Estadística
17.En la producción de las piezas electrónicas, el tiempo de fabricación es muy importante, de tal
manera que el jefe de producción debería calibrar su maquinaria si verifica que hay por lo menos
30% de piezas electrónicas cuyo tiempo de fabricación es más de 10,55 minutos. ¿Deberá el jefe
de producción calibrar su maquinaria? Se cuenta con la siguiente información del tiempo de
fabricación en una muestra de 30 piezas electrónicas.

Distribución de piezas electrónicas según tiempo de fabricación


Tiempo de fabricación X´i fi hi Fi Hi
4,71 0,100
7,63 2
8
5 0,167
11,28 7

Fuente: Empresa A
51
UPC MA444 Estadística

Caso: Riesgo de construcción de viviendas

El crecimiento demográfico en Lima se ha incrementado de


manera exponencial. Este problema ha conllevado a ocupar
espacios con riesgos y vulnerabilidad a desastres por
construcción, debido a una mala técnica, mal manejo de
materiales, tipo de suelo, tipo de cimentación o altitud de la
construcción.

Para tomar decisiones, la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima
realizó un estudio de riesgo de construcción de viviendas en el mes pasado, para ello se
seleccionaron 200 viviendas ubicadas en las laderas de los cerros de Lima Metropolitana.

En el estudio se presentaron las siguientes situaciones para tomar las decisiones adecuadas:

Situación 1
Determinar si se brindará asistencia técnica a las viviendas.

La Gerencia de Gestión del Riesgo de Desastres de la Municipalidad de Lima brindará asistencia


técnica a las viviendas ubicadas en la zona alta de Lima con riesgo de cimientos siempre y cuando
más del 30% de ellas tengan al menos cuatro pisos.

Para ello se evaluaron 24 viviendas seleccionadas al azar con dichas características. La información
obtenida se muestra a continuación:

Distribución de viviendas según número de pisos


7
Número de viviendas

6 6 6
6
5
4
4
3
2
2
1
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5

Fuente: Municipalidad de Lima


Número de pisos

¿Qué decisión tomará la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima?

Cálculo Análisis Argumentación


El estudiante muestra los cálculos El estudiante indica con que valor El estudiante redacta la
realizados para dar respuesta al calculado responde el problema. decisión que tomará a partir
problema. del resultado del análisis.
52
UPC MA444 Estadística
53
UPC MA444 Estadística
Situación 2
Realizar un estudio de materia orgánica en las laderas.

El analista del departamento de gestión del riesgo de desastres de la Municipalidad de Lima desea
realizar un estudio completo de materia orgánica en las laderas de los cerros que tienen suelo
arenoso. Para ello es importante evaluar la capacidad de intercambio catiónico (CIC). Para el estudio
se tomó información del CIC de una muestra de 80 viviendas con suelo arenoso. El analista decidirá
realizar el estudio completo, si más del 18% de estas viviendas registran un CIC mayor a 41,48
meq/100 gr. A continuación, se presenta la siguiente información:

Distribución de …………… según ……………


Intervalos Marca de clase fi hi Fi Hi
[18,36 24,14] 21,25 12 0,1500 12 0,15
]24,14 29,92] 27,03 0,1875 27 0,3375
]29,92 35,70] 32,81 20 0,2500 47 0,5875
]35,70 38,59 18 0,2250 65 0,8125
47,26] 44,37 10 75 0,9375
]47,26 53,04] 50,15 5 0,0625 80 1,00
Fuente: Municipalidad de Lima

¿El analista del departamento de gestión de riesgos de desastres realizará el estudio completo?

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante indica El estudiante El estudiante El estudiante
redacta el la variable y que muestra los indica con que redacta la decisión
problema con un herramienta cálculos realizados valor calculado que tomará a
lenguaje sencillo, estadística utilizará para dar respuesta responde el partir del resultado
como pregunta u en la solución del al problema. problema. del análisis.
objetivo. problema.
54
UPC MA444 Estadística

Métodos numéricos para describir datos cuantitativos

Definiciones

Parámetro
Es una medida de resumen que caracteriza a la población. Para obtener su valor se hace necesario
contar con toda la información que brinda los elementos de una población. Por ejemplo, la media
poblacional μ, varianza poblacional σ 2.

Estadístico
Es una medida de resumen que caracteriza a la muestra. Para obtener su valor se utiliza la
información muestral. A los valores obtenidos de un estimador se conoce como estimación.

Por ejemplo: la media muestral ( x ), varianza muestral ( s2).

Los parámetros y estadísticos de mayor uso son:

Nombre de la medida de resumen Parámetro Estadístico


N N

Media
∑ xi ∑ xi
i=1 i=1
μ= x=
N n
N N

Varianza
∑ ( xi −μ )2 ∑ ( x i−x )2
σ 2= i=1 s2= i=1
N n−1

Desviación estándar σ s

número de éxitos número de éxitos


Proporción p= ^p=
N n
55
UPC MA444 Estadística
Medidas de tendencia central
Son aquellas que localizan el “centro” de una distribución, indicando el valor alrededor del cual
tienden a concentrarse o distribuirse las demás observaciones. Lo que se persigue es conseguir un
valor que sea representativo del conjunto de datos que se está analizando.

Media aritmética
La media llamada también promedio, se define como el cociente de la suma de los valores
observados de la variable en estudio y el número de observaciones.

Características de la media
 Se puede calcular para variables de escala intervalo o razón.
 La mayor desventaja es que se ve afectado por valores extremos; es decir si hay valores muy
pequeños o grandes, la media no los representaría adecuadamente.

Cálculo de la media

La media poblacional es un parámetro y se calcula con:


N

∑ xi
i=1
μ=
N

Para datos simples (no agrupados) se calcula por:


N

∑ xi
x= i=1
n

Para datos discretos (agrupados) se calcula por:


k

∑ f i xi
i=1
x=
n

Para datos continuos (agrupados) se calcula por:


k

∑ f i x ´i
i=1
x=
n

Cálculo del promedio usando una calculadora Casio


Para conocer cómo calcular la media en una calculadora científica Casio mire
el video: “Calcular media, varianza y desviación estándar con calculadora
CASIO fx-570ES”.
https://www.youtube.com/watch?v=Ds4vXpZ5jOw
56
UPC MA444 Estadística
Ejemplo 1
Los siguientes datos son medidas de la resistencia al rompimiento (en onzas) de una muestra de hilos
de lino.

15,2 15,8 16,2 18,5 19,4 20,6 21,2 21,9 25,4 27,3 28,3 29,5 32,5 33,7 36,9
Solución
N

La fórmula es:
∑ xi
x= i=1
n

Ingresando estos valores a la calculadora resulta: x=24,16

Interpretación

La resistencia al rompimiento de los hilos está alrededor de 24,16 onzas.


La resistencia al rompimiento de los hilos está próximo a 24,16 onzas.

Ejemplo 2
Calcule e interprete la media para el número de hijos obtenida a partir de una muestra de 35
familias.

Número de hijos Número de familias


0 13
1 6
2 8
3 6
4 2

Ejemplo 3
Calcule el tiempo promedio de verificación, en horas, para una muestra de trabajadores e interprete.

Tiempo de verificación fi X’i


[0,02 - 0,81] 6  
]0,81 - 1,60] 13  
]1,60 - 2,39] 4  
]2,39 - 3,18] 3  
]3,18 - 3,97] 2  
57
UPC MA444 Estadística
]3,97 - 4,76] 2  
58
UPC MA444 Estadística

Caso: Riesgo de construcción de viviendas

El crecimiento demográfico en Lima se ha incrementado de


manera exponencial. Este problema ha conllevado a ocupar
espacios con riesgos y vulnerabilidad a desastres por
construcción, debido a una mala técnica, mal manejo de
materiales, tipo de suelo, tipo de cimentación o altitud de la
construcción.

Para tomar decisiones, la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima
realizó el mes pasado un estudio de riesgo de construcción de viviendas, para ello se seleccionaron
200 viviendas ubicadas en las laderas de los cerros de Lima Metropolitana.

En el estudio se presentaron dos situaciones para tomar las decisiones adecuadas.

Situación 1
Determinar si se brindará asistencia técnica a las viviendas.

La gerencia de gestión del riesgo de desastres de la Municipalidad de Lima brindará asistencia técnica
a las viviendas ubicadas en la zona alta de Lima con riesgo de cimientos siempre y cuando el número
promedio de pisos por vivienda sea mayor a dos. Para ello se evaluaron 24 viviendas seleccionadas al
azar con dichas características. La información obtenida se muestra a continuación:

Distribución de viviendas con riesgo de cimientos según número de pisos


Número de viviendas

7
6 6 6
6
5
4
4
3
2
2
1
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Número de pisos
Fuente: Municipalidad de Lima

¿Qué decisión tomara la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima?

Cálculo Análisis Argumentación


El estudiante muestra los cálculos El estudiante indica con que El estudiante redacta la
realizados para dar respuesta al valor calculado responde el decisión que tomará a partir
problema. problema. del resultado del análisis.
59
UPC MA444 Estadística
Situación 2
Realizar un estudio de materia orgánica en las laderas.

El analista del departamento de gestión del riesgo de desastres de la Municipalidad de Lima desea
realizar un estudio completo de materia orgánica en las laderas de los cerros que tienen suelo
arenoso. Para ello es importante evaluar la capacidad de intercambio catiónico (CIC).

Para el estudio se tomó información del CIC de una muestra de 80 viviendas con suelo arenoso. El
analista decidirá hacer el estudio completo, si el CIC promedio supera el valor de 25 meq/100 gr. A
continuación, se presenta la siguiente información:

Distribución de ………
Intervalos Marca de clase fi hi Fi Hi
18,36 24,14 21,25 12 0,1500 12 0,1500
24,14 29,92 27,03 0,1875 27 0,3375
29,92 35,70 32,81 20 0,2500 47 0,5875
35,70 38,59 18 0,2250 65 0,8125
47,26 44,37 10 75 0,9375
47,26 53,04 50,15 5 0,0625 80 1,0000
Fuente: Municipalidad de Lima

¿El analista del departamento de gestión del riesgo de desastres realizará el estudio completo?

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante indica El estudiante El estudiante El estudiante redacta
redacta el problema la variable y que muestra los indica con que la decisión que
con un lenguaje herramienta cálculos valor calculado tomará a partir del
sencillo, como estadística utilizará realizados para responde el resultado del análisis.
pregunta u en la solución del dar respuesta problema.
objetivo. problema. al problema.
60
UPC MA444 Estadística

Mediana
Es el valor que ocupa el lugar central de un conjunto de datos ordenados. Por tanto, es el valor que
divide en dos partes a dicho conjunto de datos.

Características de la mediana

Se puede calcular para variables medidas en escala intervalo o razón.


La mediana no se ve afectada por valores extremos (mínimo y máximo).

Cálculo de la mediana para datos no agrupados

Si denotamos las observaciones ordenadas por x [ 1 ], x [ 2 ], x [ 3 ], … , x [ n ] , la mediana calcularse por:

 Si n es impar, la mediana es:


me=x
[ ]
n+1
2
 Si n es par, la mediana es:
x n +x
me=
[] [ ]
2
n
2
+1

Es decir, n es par, la media es el promedio de los datos que se encuentran en la posición []


n
2
y

[ ]
n
2
+1 .

Ejemplo 1
Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje (en voltios) se
muestran a continuación:

10,00 10,05 10,12 10,26 25,00 9,84 9,96 9,98 9,99 10,00

Calcule e interprete el valor de la mediana.

Solución
Primero ordenamos los datos.

9,84 9,96 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00

Como n = 10, el cual es un número par, la mediana se calcula con:

x n +x
me=
[] [ ]
2
n
2
+1

2
61
UPC MA444 Estadística
Reemplazando los valores.

x 10 + x 10
2 2
+1 x 5+ x 6 10+10
me= = = =10
2 2 2

Interpretación: El 50% de las baterías tienen una lectura máxima de 10 voltios.

Ejemplo 2
Los siguientes datos corresponden a la distribución del número de piezas defectuosas producidas en
una muestra de 150 días. Calcule e interprete el valor de la mediana.

Número de piezas de defectuosas Número de días fi Fi


0 50
1 60
2 25
3 10
4 5
62
UPC MA444 Estadística

Moda
La moda de un conjunto de datos es aquel valor que se repite con mayor frecuencia.

Características de la moda

 La moda se puede calcular para cualquier escala de medición.


 El valor de la moda no se ve afectada por valores extremos.
 Si un conjunto de datos tiene una moda, se dice que es unimodal, si tiene dos modas se dice que
es bimodal y si tiene más de dos modas se dice que es polimodal.
 Se puede dar el caso en que un conjunto de datos no tenga moda.

Ejemplo 1
Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje se presentan a
continuación:

9,84 9,89 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00

Moda = 10, pues es el valor que más se repite.

Interpretación
La lectura de voltaje más frecuente es de 10 voltios.
La lectura de voltaje que se repite con mayor frecuencia es 10 voltios.

Ejemplo 2
Renacer S.A. es una empresa que fabrica hornos microondas. La gerencia encargó al jefe de control
de calidad informar cuál es el problema más frecuente encontrado en la fabricación de estos
aparatos. Para dar respuesta a la consulta, se tomó una muestra de equipos del área de
reparaciones. Los resultados se presentan en la siguiente tabla:

Problemas Número de hornos fi


Capacidad de descongelación 6
Velocidad de calentamiento 14
Cable de alimentación 3
Fuga de la microondas 8
Frecuencia de la microondas (MHz) 9
Potencia de microondas (kilowatts) 10

Con la información presentada, ¿qué problema se presenta con mayor frecuencia?


63
UPC MA444 Estadística
Medidas de posición o cuantiles
Se define así a un número real que divide a un conjunto de datos en dos partes con porcentajes
especificados debajo y sobre este valor. Para su cálculo, los datos deben estar previamente
ordenados.

Cuartil
Divide al conjunto de datos en cuatro partes porcentualmente iguales. Se denotan Q1, Q2 y Q3 que son
los correspondientes percentiles P25, P50 y P75.

Decil
Divide al conjunto de datos en diez partes porcentualmente iguales. Hay nueve deciles D1, D2, …, D9
que son los correspondientes percentiles P10 , P20, …, y P90 .

Percentil
Divide un conjunto de datos en 100 partes porcentualmente iguales. Dado un percentil Pk, este divide
el conjunto de datos en dos partes, la inferior que contiene el k% de datos y la superior que contiene
el (100 – k)% de datos.

El k% de las unidades elementales presentan El (100 – k)% de las unidades elementales


valores menores o iguales o al percentil k presentan valores mayores al percentil k

Pk

Cálculo del percentil para datos no agrupados

Primero debe ordenarse los datos en orden creciente.

Luego, para hallar el percentil Pk se sigue los siguientes pasos:

Calcular el valor de la posición que ocupa el percentil Pk en la lista de datos ordenados que está
determinada por la siguiente expresión:

k ( n+1 )
i= =E , d
100

Donde E es la parte entera y d es la parte decimal.

Luego,
Pk = X [ E ] +0 , d ( X [ E +1] − X [ E] )
64
UPC MA444 Estadística
Ejemplo 1
Suponga que los promedios ponderados de una muestra de 12 ingenieros civiles egresados se
muestran a continuación:

14,5 15,5 15,5 16,1 16,2 16,4 16,5 17,0 17,1 17,3 17,5 17,6

a. Calcule e interprete el valor del D4.

b. Si se desea contratar a un egresado que pertenezca al quinto superior, ¿qué percentil debe
calcular y cuál es la nota mínima que debería de tener?
65
UPC MA444 Estadística
Ejemplo 2
Una muestra de 30 trabajadores de una plataforma petrolera marina formó parte de un ejercicio de
escape del área. Para ello se registraron los tiempos, en minutos, empleados en la evacuación.

31,5 32,5 32,5 33,4 33,9 34,0 35,6 35,6 35,9 35,9
36,3 36,4 36,9 37,0 37,3 37,3 37,4 37,5 38,0 38,9
39,2 39,3 39,4 39,7 40,2 40,3 41,5 42,4 42,8 44,5

a. ¿Cuál es el tiempo mínimo registrado por el 18% de trabajadores que emplearon más tiempo en
la evacuación de la plataforma?

b. ¿Cuál es tiempo máximo empleado por el 28% de trabajadores que emplearon menos tiempo en
la evacuación de la plataforma?
66
UPC MA444 Estadística
Ejemplo 3
Investigadores del Massachussets Institute of Technology (MIT) realizaron el 9 de abril de 1993 un
estudio sobre asteroides. Al observar 39 de estos asteroides con el telescopio Hiltner del
observatorio de MIT; se registró el número de exposiciones de imagen espectral.

Número de exposiciones de imagen espectral


1 1 1 1 1 1 1 1 1 2 2 2 2
2 2 2 2 2 2 2 2 2 3 3 3 3
3 3 3 3 3 3 3 3 4 4 4 4 6

a. A partir de los datos, elabore la tabla de frecuencias.

Título: ……………………………………………………………………………………………………………………………..
Número de exposiciones fi hi Fi Hi
1
2
3
4
6
Total

b. Indique el mínimo número de exposiciones obtenidos en el 15% de los asteroides con mayores
exposiciones. Además, indique a qué percentil corresponde.

c. Se desea categorizar a los asteroides según su número de exposiciones en categorías baja, media
y alta. ¿Cuáles serán los límites de las categorías si la categoría media contiene al 50% central de
la cantidad de asteroides?
67
UPC MA444 Estadística
Medidas de variación o dispersión
Son aquellas que cuantifican que tan dispersos o concentrados se encuentran los datos respecto de
una medida de tendencia central. Los datos que están relativamente cercanos entre sí tienen bajas
medidas de variabilidad, mientras que los que están más alejados entre sí tienen medidas de
variación más grandes.

Varianza
 Es una medida del grado de dispersión o variación de los valores de una variable con respecto a su
media aritmética.
 Las unidades en las que queda expresada la varianza son unidades al cuadrado.
 Esta medida no tiene interpretación.
 La notación de la varianza de una muestra es s2, mientras que la de una población es σ 2.

Cálculo de la varianza

Varianza poblacional para datos simples

∑ ( xi −μ )2
2 i=1
σ =
N

Varianza muestral para datos simples

∑ ( x i−x )2
2 i=1
s=
n−1

Varianza muestral para datos agrupados discretos

∑ f i ( x i−x )2
s2= i=1
n−1

Varianza muestral para datos agrupados continuos

∑ f i ( x'i −x )
2

s2= i=1
n−1

Desviación estándar
 La desviación estándar es la raíz cuadrada positiva de la varianza
 Se denota por  si la desviación estándar es poblacional (parámetro) y por s si la desviación
estándar es muestral (estadístico).
68
UPC MA444 Estadística
 Las unidades de la desviación estándar son las mismas unidades de la variable. Por ejemplo, si la
variable tiene unidades centímetros, entonces, la desviación estándar tendrá como unidades
centímetros.

Cálculo de la desviación estándar

Desviación estándar poblacional


N

∑ ( xi −μ )2
i=1
σ=
N

Desviación estándar muestral para datos simples


n

∑ ( x i−x )2
i=1
s=
n−1

Desviación estándar muestral para datos agrupados discretos


n

∑ f i ( x i−x )2
i=1
s=
n−1

Desviación estándar muestral para datos agrupados continuos


n

∑ f i ( x 'i−x )2
i=1
s=
n−1

Cálculo de la varianza usando una calculadora Casio


Para conocer cómo calcular la desviación estándar en una calculadora
científica Casio mire el video: “Calcular media, varianza y desviación estándar
con calculadora CASIO fx-570ES”.
https://www.youtube.com/watch?v=Ds4vXpZ5jOw

Ejemplo 1
Calcule la varianza y la desviación estándar para la cantidad de plomo en una muestra de agua
potable en miligramos por litro.

35 73 30 15 36 60 47 19 15 38 10 35 31 21 22 20
69
UPC MA444 Estadística

Ejemplo 2
Calcule la varianza y desviación estándar del número de accidentes automovilísticos en una muestra
de 100 días.

Número de accidentes automovilísticos 0 1 2 3 4


fi 10 15 30 35 10

Ejemplo 3
Calcule la varianza y desviación estándar de los tiempos de exposición, en minutos, de un metal a
una sustancia química. Los resultados de una muestra de 66 reacciones son las siguientes:

Intervalos fi Marca de clase


[15,2 – 17,2] 12
]17,2 – 19,2] 13
]19,2 – 21,2] 20
]21,2 – 23,2] 16
]23,2 – 25,2] 5
Total 66

Calcule la varianza y desviación estándar.


70
UPC MA444 Estadística

Coeficiente de variación
Las medidas de variación estudiadas son medidas de variación absolutas pues estas se expresan en
las mismas unidades que la variable original (excepto la varianza que se expresa en unidades al
cuadrado).

El coeficiente de variación proporciona una estimación de la magnitud de las desviaciones con


respecto a la magnitud de la media.

El coeficiente de variación poblacional es un parámetro y se calcula por la siguiente fórmula:

σ
CV = × 100 %
μ

El coeficiente de variación muestral es un estadístico y se calcula por la siguiente fórmula:

s
CV = ×100 %
x

Características del coeficiente de variación

 Es una medida de dispersión relativa libre de unidades.


 Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o
iguales unidades, pero difieren a tal punto que una comparación directa de las respectivas
desviaciones estándar no es muy útil, por ejemplo, cuando las medias están muy distantes.
 El coeficiente de variación se calcula en variables medidas en escala de razón.

Ejemplo 1
A continuación, se presentan los tiempos de transmisión de un archivo, en segundos, evaluados en
una muestra de empresas que adoptaron la tecnología WAN y la tecnología LAN bajo condiciones
similares.
71
UPC MA444 Estadística
Tiempo de transmisión de un archivo con tecnología WAN
138 126 125 124 119 119 137 110 119 155 123 124 126 126 129

Distribución de empresas según tiempo de transmisión de un archivo con tecnología LAN


Tiempo de transmisión Frecuencia
[108 111] 3
]111 114] 35
]114 117] 66
]117 120] 57
]120 123] 29
]123 126] 16
Fuente: Consultora TEC

Determine para qué tipo de tecnología utilizada los tiempos de transmisión de datos son más
homogéneos. Justifique numéricamente su respuesta.

Medida de resumen WAN LAN

Promedio

Desviación estándar

Coeficiente de variación

Interpretación
La tecnología que presenta los tiempos de transmisión de datos más homogéneos es ……………
72
UPC MA444 Estadística
Ejercicios propuestos

18.Electro, empresa dedicada a la venta de artefactos electrónicos para el hogar cuenta con tres
tiendas A, B y C. Los últimos informes indican que las ventas de cierto producto electrónico han
descendido. El gerente, con el fin de enfrentar el problema, ha determinado que es necesario un
estudio estadístico de las ventas semanales de este producto, en miles de soles. A continuación,
se presentan los resultados obtenidos para cada tienda:

Distribución de semanas según ventas de cierto producto electrónico en la tienda A


Ventas semanales, en miles de soles Número de semanas
[100 – 200] 5
]200 – 300] 14
]300 – 400] 21
]400 – 500] 7
]500 – 600] 3
Total 50
Fuente: Empresa Electro

Distribución de semanas según ventas de cierto producto electrónico en la tienda B


Ventas semanales, en miles de soles Número de semanas
20 2
40 8
60 25
80 20
100 8
Total 63
Fuente: Empresa Electro

Ventas semanales, en miles de soles, de cierto producto electrónico en la tienda C


120 200 100 50 45 120 100 100 90 75 100 210 100 50 120

a. Calcule la media y la varianza de las ventas semanales en las tiendas A, B y C.

Medida de resumen Tienda A Tienda B Tienda C

Media

Desviación estándar

b. Determine en cuál de las tiendas las ventas realizadas son más homogéneas.

Tienda A Tienda B Tienda C


73
UPC MA444 Estadística
19.En el medio local hay dos plantas (planta 1 y planta 2) que se dedican a la fabricación de barras de
acero para la construcción. Las empresas proveedoras de barras de acero para la construcción,
que abastecen al mercado constructor, desean averiguar acerca de la media y la desviación
estándar de la resistencia a la tracción.

Para ello, se tomaron muestras aleatorias en ambas plantas y la información registrada acerca de
la resistencia a la tracción (en kg/cm2) se muestra en las siguientes tablas:

Distribución de barras de acero según resistencia a la tracción – Planta 1


Resistencia a la tracción – Planta 1 fi
[69,220 – 70,436] 14
]70,436 – 71,652] 5
]71,652 – 72,868] 6
]72,868 – 74,084] 8
]74,084 – 75,300] 7
]75,300 – 76,516] 17
]76,516 – 77,732] 5
Total 62
Fuente: Estudio de barras de acero de planta 1 y 2

Estadísticas descriptivas: Resistencia a la tracción – Planta 2


Tamaño de muestra 62
Media muestral 64,52
Desviación estándar muestral 2,983

Realice el análisis adecuado para la dispersión y responda ¿qué planta es más heterogénea en las
resistencias a la tracción? Sustente su respuesta estadísticamente.

Medida de resumen Planta 1 Planta 2

Promedio

Desviación estándar

Coeficiente de variación

20.En una reciente entrevista, el presidente de la Confederación Nacional de Instituciones


Empresariales Privadas (Confiep), sostuvo que, en el país y a largo plazo, la mejor forma de
prevenir los desastres naturales es la construcción de represas y reservorios.

Debido a la previsión de falta de agua, la Confiep ha encargado realizar un nuevo estudio de


prefactibilidad a cargo de profesionales de ingeniería civil, en zonas cercanas a los ríos de la costa
norte del país, Tumbes, Piura, y Lambayeque, para decidir la construcción de una represa.

La información recogida se presenta a continuación:


74
UPC MA444 Estadística
Zonas Tipo de estructura Ríos Caudal del río (m3/segundo)
1 Cimientos Tumbes 13,3
2 Cimientos Tumbes 20,9
3 Cimientos Tumbes 35,7
4 Cimientos Tumbes 41,9
5 Cimientos Tumbes 42,2
6 Cimientos Tumbes 48,0
7 Cimientos Tumbes 49,7
8 Cimientos Tumbes 52,4
9 Cimientos Tumbes 52,4
10 Cimientos Tumbes 56,3
11 Cimientos Tumbes 62,5
12 Cimientos Piura 38,1
13 Cimientos Piura 40,3
14 Cimientos Piura 49,8
15 Excavaciones Piura 56,2
16 Excavaciones Piura 57,2
17 Excavaciones Piura 61,3
18 Excavaciones Piura 61,3
19 Excavaciones Piura 71,1
20 Excavaciones Piura 77,5
21 Excavaciones Lambayeque 34,4
22 Excavaciones Lambayeque 42,8
23 Excavaciones Lambayeque 42,8
24 Terraplenes Lambayeque 44,5
25 Terraplenes Lambayeque 48,1
26 Terraplenes Lambayeque 49,4
27 Terraplenes Lambayeque 54,3

a. Según los especialistas un punto muy importante a considerar al momento de diseñar la


ubicación de las represas es evaluar el caudal (m 3/segundo) en cada uno de los ríos (Tumbes,
Piura y Lambayeque), porque si el caudal es muy bajo la represa no almacenaría la cantidad
de agua esperada para su posterior distribución. Por ello, el gerente de la empresa decidirá
construir la represa en aquella zona, que concentre los caudales del río en los valores más
altos. Según los resultados, ¿Cuál sería la recomendación de ustedes al gerente de la
empresa?

b. Ingenieros especialistas indicaron, que se debe realizar la construcción de la represa en


aquella zona que presente menor variabilidad posible en el caudal del río. Según la
información analizada, ¿en cuál de los ríos es más propicia la construcción de la represa?

21.Las represas constituyen una de las principales causas directas e indirectas de contaminación
ambiental. Una de estas causas es la filtración de sustancias contaminantes originando el
debilitamiento de la densidad de la superficie en la cual está construida la represa. Los resultados
que Andino S.A. obtuvo sobre las densidades de los terrenos, en gr/cm 3 en represas calificadas
con impacto ambiental regular y en represas con impacto ambiental fuerte se presentan a
continuación:
75
UPC MA444 Estadística
Densidad del terreno, en gr/cm3, en represas con impacto ambiental regular
15,2 20,7 16,6 22,7 35,6 17,1 25,2 26,6 10,4 23,6

Distribución de represas con impacto ambiental fuerte según den-


sidad del terreno, en gr/cm3
12

10
10
Cantidad de represas

8
7 7

6
5

4
3
2
2
1

0
5.5 9.8 14.1 18.4 22.7 27 31.3 35.635.6

Fuente: Andino S.A. Densidad del terreno

Para que una represa siga funcionando, la Confiep establece el cumplimiento de dos condiciones:

 Condición 1: La densidad promedio del terreno con impacto ambiental (regular o fuerte)
donde se ubica la represa debe ser por lo menos 17,5 gr/cm 3 para que ésta no se derrumbe.

 Condición 2: La densidad del terreno donde se ubica la represa con impacto ambiental (regular
o fuerte) debe tener una variabilidad relativa de a lo más 34%.

Verifique las condiciones de tal manera que pueda presentar un informe que ayude a identificar
qué tipo de represa (con impacto ambiental fuerte o regular) está habilitada para su normal
funcionamiento.
76
UPC MA444 Estadística
Medida de asimetría

Coeficiente de asimetría de Pearson

Mide si los datos aparecen ubicados simétricamente o no respecto de la media. El coeficiente de


asimetría para datos simples o agrupados se calcula con la siguiente fórmula:

As=3 ( x̄− Mediana


s )
Si el coeficiente de simetría As es:

Ejemplo 1

Complete los siguientes textos:

 Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una
concentración de datos en los valores ………

 Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
concentración de datos en los valores ………

 En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de
asimetría …………, porque …………

 En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente
tienen un coeficiente de asimetría ……………, porque …………………
77
UPC MA444 Estadística

Ejemplo 2

Comasa es una empresa que produce artículos pesados de acero y dispone de un equipo
especializado de operarios que se capacitan constantemente. El último año se ha observado un
aumento en el número de accidentes, incrementándose así el costo de atención inmediata. Con el
propósito de implementar estrategias de prevención de accidentes, se analizarán los costos de la
planta de producción de Lima Sur. A continuación, se presenta la información, en miles de soles:

8 9 10 11 11 12 12 13 13 13 13 14
14 15 15 16 17 17 18 18 19 19 20 21
22 23 24 25 25 26 27 28 28 29 30

a. ¿Qué forma presenta la distribución de esta variable? Presente la gráfica.

b. Analizando la forma de la distribución, ¿es preocupante para la empresa?


78
UPC MA444 Estadística
79
UPC MA444 Estadística
Ejercicios propuestos

22.Covisa es una empresa de construcción civil que compra ladrillos al proveedor Fax S.A. Para
continuar con el proveedor o cambiarlo, ha decidido realizar un análisis de la resistencia
transversal de los ladrillos, en Mn/m2.

A continuación, se presentan los resultados de una muestra de 40 ladrillos fabricados por el


proveedor:

3 4 4 4 5 5 6 6 6 7
8 8 8 8 8 9 9 9 10 11
11 11 11 11 11 12 12 12 12 13
13 13 14 15 15 17 17 18 19 20

¿Qué forma presenta la distribución de esta variable? Presente la gráfica.

23.Zinder y Crisis (1990), presentaron un algoritmo híbrido para resolver un problema de


programación matemática polinomial cero-uno. El algoritmo incorpora una combinación de
conceptos pseudo booleanos y procedimientos de enumeración implícitos probados y
comprobados.

Se resolvieron 52 problemas al azar utilizando el algoritmo híbrido; los tiempos de resolución


(tiempos de CPU en segundos) se listan en la siguiente tabla.

0,045 0,036 0,045 0,049 0,064 0,07 0,079 0,088 0,091 0,118 0,13 0,136
0,136 0,136 0,145 0,179 0,182 0,182 0,194 0,209 0,209 0,227 0,242 0,258
0,258 0,258 0,291 0,327 0,333 0,336 0,361 0,379 0,394 0,412 0,445 0,506
0,554 0,567 0,579 0,600 0,67 0,912 1,055 1,07 1,267 1,639 1,894 3,046
3,888 3,985 4,170 8,788

Se desea categorizar a los problemas según sus tiempos de resolución en categorías normal,
media y alta ¿Cuáles serán los límites de cada una de ellas si la categoría media contiene al 50%
central de la cantidad de problemas?

24.Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una


distribución de frecuencias simétrica de cinco intervalos de igual amplitud resultando que el
ingreso mínimo es de 125 dólares y la marca de clase del cuarto intervalo es de 300 dólares. Si el
8% de los ingresos son menores que 175 dólares y el 70% de los ingresos son menores a 275
dólares.

a. Determine las frecuencias relativas de cada intervalo.


b. ¿Qué porcentaje de ingresos son superiores a 285 dólares?

25.A continuación, se presenta al número de camiones que atendió la planta de Lurín en cada obra
con el objetivo de evaluar indicadores en las atenciones que realiza la planta de Lurín.
80
UPC MA444 Estadística

Distribución del número de obras según número de camiones enviados


16 15

14
12 11
Número de obras

10 9

8 7
6
6
4
4 3

2
0
0 1 2 3 4 5 6 7 8
Número de camiones
Fuente: Planta de Lurín

a. Calcule las medidas de tendencia central e interprete los resultados.


b. ¿Qué forma presenta la distribución de esta variable?

26.Cuando se diseña un puente los ingenieros deben determinar la tensión que el concreto puede
soportar. En lugar de probar cada pulgada cúbica de concreto para determinar su capacidad de
resistencia, los ingenieros toman una muestra, la prueban y llegan a la conclusión sobre qué tanta
tensión, en promedio, puede resistir este tipo de concreto. A continuación, se presenta la tensión
(en kg/cm2) obtenidos de una muestra de 30 bloques de concreto que se utilizarán para construir
un puente.

1,2 2,1 2,2 2,2 2,5 2,5 2,6 2,6 2,7 2,8
3,0 3,0 3,2 3,2 3,2 3,4 3,4 3,5 3,5 3,6
3,6 3,6 3,6 3,7 3,8 3,9 3,9 4,0 4,0 4,0

a. Calcule e interprete el valor de las siguientes medidas de posición: P 35, D8 y Q3


b. Calcule las medidas de tendencia central e interprete los resultados.
c. ¿Qué forma presenta la distribución de esta variable? Presente la gráfica.
81
UPC MA444 Estadística

Caso: Industria alimentaria

Multi Cereales S.R.L. es una empresa dedicada a la elaboración de cereales


para desayunos. La empresa ha adquirido una nueva máquina, la que
permitirá elevar la producción de 1200 a 1500 cajas por hora. Según las
especificaciones técnicas del producto, esta caja debe tener un peso promedio
de 500 gramos. Para monitorear el proceso de llenado, el inspector seleccionó
una muestra aleatoria de 20 cajas de avena en hojuelas del almacén cuyos
pesos (en gramos) se muestran a continuación:

471,13 472,19 476,25 477,32 478,52 481,02 490,65 496,66 497,66 498,40
502,77 504,44 503,78 506,14 512,88 515,06 516,23 516,89 523,45 523,78

Situación 1
Determinar si la nueva máquina llena las cajas de avena en hojuelas de acuerdo con la especificación
técnica.

La especificación técnica indica que el 90% central de las cajas de avena en hojuelas deben tener un
peso entre 480 y 520 gramos. El gerente de control de calidad sospecha que el peso de la caja no
está cumpliendo con la especificación técnica, y de ser así, significaría que la nueva máquina, al
momento de ser instalada, no fue calibrada correctamente.

¿La nueva máquina deberá ser recalibrada?


¿Dónde se concentran los pesos de las cajas de avena en hojuelas, en valores altos o en valores
bajos?

Cálculo Análisis Argumentación


El estudiante muestra los El estudiante indica con que El estudiante redacta la decisión
cálculos realizados para dar valor calculado responde el que tomará a partir del resultado
respuesta al problema. problema. del análisis.

Situación 2
Determinar qué proceso de producción tiene mayor variabilidad.

Una de las razones de la falta de calidad en un proceso productivo es la alta variabilidad en el


cumplimiento de las especificaciones técnicas, por lo que el gerente de control de calidad desea
comparar la variabilidad del proceso de llenado de las cajas de avena en hojuelas con la variabilidad
del porcentaje de grasa que deben tener las hojuelas de avena. El gerente ordenará una revisión
completa de aquel proceso que presente mayor variabilidad. ¿Cuál de los dos procesos deberá ser
revisado completamente?

Nota: Para el caso del proceso de llenado de la caja utilice los cálculos hechos para la situación 1.

Con los datos de la situación 1, el gerente obtuvo el siguiente gráfico:


82
UPC MA444 Estadística

Distribución de cajas de avena en hojuelas según porcentaje de grasa


8
7
7
6
5
Número de cajas
5
4
3
3
2 2
2
1
1
0
1.89 3.37 4.85 6.33 7.81 9.29 10.77 12.25 13.73 15.21
Porcentaje de grasa
Fuente: Multi Cereales S.R.L.

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante indica El estudiante El estudiante El estudiante redacta
redacta el la variable y que muestra los indica con que la decisión que
problema con un herramienta cálculos valor calculado tomará a partir del
lenguaje sencillo, estadística utilizará realizados para responde el resultado del análisis.
como pregunta u en la solución del dar respuesta problema.
objetivo. problema. al problema.
83
UPC MA444 Estadística

Unidad 2. Probabilidad y variable aleatoria

Logro
Al terminar la unidad, el estudiante utiliza las distribuciones de probabilidad para modelar variables
dentro de situaciones de incertidumbre en contextos reales

Temario
 Probabilidad: concepto. Experimento aleatorio, espacio muestral y evento
 Operaciones con eventos
 Probabilidad condicional
 Probabilidad total. Teorema de Bayes.
 Eventos independientes
 Variable aleatoria. Valor esperado y desviación estándar
 Distribución de probabilidad de una variable discreta: binomial y Poisson
 Distribución de densidad de una variable continua: normal y exponencial

Bibliografía
 Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 4.1 (pág. 124-
126) Capítulo 4.5 (pág. 139-143)
 Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 4.7 (pág. 152-
166)
 Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 6.1 (pág. 211)
 Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 6.1 (pág. 213)
84
UPC MA444 Estadística

Definiciones

Experimento aleatorio
Es una operación cuyo resultado no se puede predecir con certeza y que se realiza bajo las siguientes
condiciones:

 Se puede repetir indefinidamente donde los resultados dependen del azar, por lo que no se
pueden predecir con certeza.
 Se puede describir el conjunto de todos los resultados posibles.
 Cuando se repite un gran número de veces, aparece un modelo definido de regularidad.

Un experimento aleatorio se denota por .

Ejemplo 1

1: Lanzar un dado.


2 : Se lanzan dos monedas y se registra el resultado obtenido.
3 : Seleccionar un dispositivo electrónico y registrar si es defectuoso o no.
4 : Observar el tiempo de vida de un artefacto eléctrico.

Espacio muestral
Es el conjunto de todos los posibles resultados de un experimento aleatorio. Cada elemento de este
conjunto se le denomina punto muestral y se le denota con w .

Un espacio muestral se denota por .

Ejemplo 2

❑1={1 , 2 ,3 , 4 ,5 , 6 }
❑2={cc , cs , sc , ss }
❑3={defectuoso , no defectuoso }
❑4={t /t ≥ 0}

Evento
Es todo subconjunto del espacio muestral y representa cierta característica de ella. Se denotan
mediante las letras mayúscula de nuestro alfabeto, como por ejemplo A, B o C.

Evento simple
En un evento formado por un sólo un punto muestral. No se puede descomponer.

Ejemplo 3

Si 1 = {1, 2, 3, 4, 5, 6}, entonces {1},{2},{3},{4},{5},{6} son eventos simples.


Si 2 = {cc, cs, sc, ss}, entonces {cc},{cs},{sc},{ss} son eventos simples.
Si 3 = {defectuoso, no defectuoso}, entonces {defectuoso} y {no defectuoso} son eventos simples.
85
UPC MA444 Estadística

Evento compuesto
En un evento formado por más de un punto muestral.

Ejemplo 4

Si 1= {1, 2, 3, 4, 5, 6}, entonces A = {1, 3, 5} o A:= obtener un número impar es un evento
compuesto.

Si 2= {cc, cs, sc, ss}, entonces B= {cs, sc} o B:= obtener dos valores diferentes en las caras superiores
de las dos monedas es un evento compuesto.

Operaciones con eventos


Intersección
La intersección de dos eventos A y B es el evento que ocurre si tanto A como B ocurren en una sola
realización del experimento.

La intersección de los eventos A y B se denota mediante el símbolo A ∩ B.

Unión
La unión de dos eventos A y B es el evento que ocurre si A o B, o ambos ocurren en una sola
realización del experimento.

La unión de dichos eventos se denota mediante el símbolo A ∪B

Eventos mutuamente excluyentes


Son aquellos eventos donde la ocurrencia de uno de ellos excluye la ocurrencia del otro, esto es no
pueden ocurrir los dos a la vez.

Ejemplo 1

En el experimento : lanzamiento de un dado.

Sean los eventos:

A :=¿ Resulta un número menor que 5


B:=¿ Resulta un número par

a. Obtenga la intersección y la unión de los eventos A y B.


b. ¿Son los eventos A y B mutuamente excluyentes?
86
UPC MA444 Estadística
Solución

a. Obtenga la intersección y la unión de los eventos A y B.

Solución
El espacio muestral es:
¿ {1 , 2 ,3 , 4 ,5 , 6 }
Los eventos A y B son:

A={1 , 2, 3 , 4 }

B= {2 , 4 ,6 }

La intersección de los eventos A y B es:


A ∩ B= {2,4 }

La unión de los eventos A y B es:


A ∪ B={1 , 2 ,3 , 4 , 6 }

b. ¿Son los eventos A y B mutuamente excluyentes?

Solución

Como A ∩ B≠ ∅ , los eventos no son mutuamente excluyentes.

Ejemplo 2

Sea el experimento : lanzamiento de dos dados

El espacio muestral es:

¿ {( 1,1 ) , ( 1,2 )( 1,3 ) , … ,(6,1), (6,2) ,(6,3) ,(6,4) ,(6,5) ,(6,6)}

Se definen los eventos necesarios:

A :=¿ obtener una suma de seis.

A :={( 1,5 ) , ( 5,1 ) , ( 2,4 ) , ( 4,2 ) ,(3,3)}

B:=¿ obtener una suma de cinco.

B={(1,4) ,(4,1),(2,3) ,(3,2)}


87
UPC MA444 Estadística
Estos eventos A y B son mutuamente excluyentes, dado que ambos a la vez no pueden ocurrir, esto
es A ∩ B=∅, es decir la intersección de los eventos no tienen elementos en común.

Ejemplo 3

Se realiza el siguiente experimento aleatorio : lanzamiento de dos dados de seis caras.

a. Determine el espacio muestral.

b. Sean los eventos: A: suma de los dados es ocho; B: suma de los dados mayor a seis y C: suma de
los dados menor a nueve. Determine los elementos de los eventos.

c. Obtenga la intersección de los eventos A y B, la unión de los eventos B y C ¿Son los eventos A y C
mutuamente excluyentes?
88
UPC MA444 Estadística
89
UPC MA444 Estadística

Probabilidad
Sea  un experimento aleatorio,  el espacio muestral asociado y sea A un evento definido en el
espacio muestral .

La probabilidad del evento A es la medida del grado de posibilidad de ocurrencia del evento A
cuando se realiza una vez el experimento.

La probabilidad de un evento A es un valor numérico y se denota por P( A).

Axiomas de probabilidad

 0 ≤ P(A )≤ 1
 P( )=1
 Sean los eventos { Ai }, Ai ∈, i=1 , 2, 3 , … , n una sucesión de eventos mutuamente excluyentes,
entonces:

n
P( A1 ∪ A 2 ∪ A 3 ∪ … ∪ An )=∑ P ( Ai )
i=1

Además,
 Si P( A) tiende a 0 es poco probable que el evento A ocurra.
 Si P( A) tiende a 1 es un muy probable que el evento A ocurra.
 En un espacio muestral finito, la suma de las probabilidades de todos los eventos simples Ei es
igual a 1.
n

∑ P( Ei)=1, i=1 , 2 ,3 , … , k
i=1

Definición clásica de la probabilidad de un evento

Sea un experimento aleatorio cuyo correspondiente espacio muestral  está formado por un
número n finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces
definimos la probabilidad de un evento A como sigue:

n( A) número de casos favorables al evento A


P ( A )= =
n() número de caos totales
90
UPC MA444 Estadística
Ejemplo 1

Complete el siguiente cuadro.

Experimento aleatorio Espacio muestral Evento Probabilidad


Se lanza un dado, calcule la
probabilidad de que salga 3 ó 5.

n(A) ❑
 = {1, 2, 3, 4, 5, 6} A = 3, 5 P ( A )= =
n( ) ❑

Se lanzan dos dados, calcule la


probabilidad de que la suma sea
mayor a 7.

 = {(1,1); (1,2); n(A) ❑


A={ } P ( A )= =
(1,3); ….; (6,6)} n( ) ❑

Se saca una bola de una urna con


tres bojas rojas y cuatro negras,
calcule la probabilidad de que
sea roja.
n(A) ❑
={ } A={ } P ( A )= =
n( ) ❑
91
UPC MA444 Estadística

Eventos complementarios

El complemento de un evento A es el evento en el que A no ocurre, es decir, el evento formado por


todos los eventos simples que no están en el evento A. El complemento del evento A se denota
mediante el símbolo Ac.

c
A ∪ A =¿

Ac
A

La suma de las probabilidades complementarias es igual a 1.

c
P( A)+ P( A )=1

Regla aditiva de la probabilidad


La probabilidad de la unión de los eventos A y B es la suma de las probabilidades de los eventos A y B
menos la probabilidad de la intersección de los eventos A y B:

P( A ∪ B)=P( A)+ P(B)−P( A ∩B)

A B

A∩Bc A∩B Ac∩B

(AUB)c

Regla aditiva para eventos mutuamente excluyentes

Si dos eventos A y B son mutuamente excluyentes, la probabilidad de la unión de A y B es igual a la


suma de las probabilidades de A y B.

P ⁡( A ∪ B)=P( A)+ P(B)


92
UPC MA444 Estadística

Ejemplo 1

Metac S.A.C., es una organización orientada a suministrar productos, servicios y desarrollo de


soluciones de ingeniería aplicada. El gerente de esta organización considera que la probabilidad de
que los accidentes en transmisiones y ejes hayan sido ocasionados por las conexiones eléctricas es
0,24, por falla mecánica es 0,18 y por conexiones eléctricas o falla mecánica es 0,39. Si se selecciona
al azar un accidente producido en transmisiones y ejes.

a. Determine la probabilidad que se haya producido por ambos tipos de falla.

Solución

Definamos los eventos necesarios.

E :=¿ {Accidentes por conexiones eléctricas} P( E)=0,24


M :=¿ {Accidentes por falla mecánica} P(M )=0,18

Además, se sabe que:


P( E ∪ M )=0,39

Usando la regla aditiva de la probabilidad, se tiene que:

P ( E∪ M ) =P ( E )+ P ( M )−P ( E ∩ M )

Reemplazando valores:

0,39=0,24+ 0,18−P( E M )

P(E ∩ M )=0,03

E M

0,21 0,03 0,15

0,61

La probabilidad que se haya producido por ambos tipos de falla es P( E ∩ M )=0,03.

b. ¿Cuál es la probabilidad de que el accidente se haya producido por solo un tipo de falla?

Solución
93
UPC MA444 Estadística
La probabilidad pedida es:

P ( E ∩ M c ) =P ( E )−P ( E ∩ M )=0,24−0,03=0,21

P ( E ∩ M ) =P ( M ) −P ( E ∩ M )=0,18−0,03=0,15
c

P( E ∩ M c )+ P(E c ∩ M )=0,21+0,15=0,36

E M

0,21 0,03 0,15

0,61

Ejemplo 2

Una empresa fabricante de electrodomésticos cuenta en su almacén de productos terminados con


un lote de diez refrigeradoras, de las cuales tres de ellas presentan imperfecciones en la pintura. Un
comerciante compra tres de ellas, la empresa hace la elección de las refrigeradoras en forma
aleatoria, se pide determinar lo siguiente:

a. Indique el espacio muestral.


b. Calcule la probabilidad de que las tres refrigeradoras compradas por el comerciante no presenten
imperfecciones de pintura.
c. Calcule la probabilidad de que en la compra realizada por el comerciante se encuentre al menos
una refrigeradora con imperfecciones de pintura.

Solución

a. Indique el espacio muestral.

Solución
Definamos el evento I :=¿ que una refrigeradora tenga imperfecciones en la pintura.

Ω={( I , I , I ) ; ( I c , I , I ) ; ( I , I c , I ) ; ( I , I , I c ) ; ( I , I c , I c ) ; ; ( I c , I , I c ) ; ( I c , I c , I ) ; ( I c , I c , I c ) }

b. Calcule la probabilidad de que las tres refrigeradoras compradas por el comerciante no presenten
imperfecciones de pintura.

Solución

Definamos el evento necesario.


94
UPC MA444 Estadística
B:=¿ las tres refrigeradoras compradas por el comerciante no presenten imperfecciones de
pintura
La probabilidad pedida es:

7 3
C 3 ×C 0
P( B)= 10
=0,2917
C3

c. Calcule la probabilidad de que en la compra realizada por el comerciante se encuentre al menos


una refrigeradora con imperfecciones de pintura.

Solución

Definamos el evento necesario.

C :=¿ se seleccione al menos una refrigeradora con imperfecciones de pintura.

La probabilidad pedida es:

P ( C ) =1−P ( C ) =1−0,2917=0,7083
c

Ejemplo 3

La empresa Compusystem S.A. se dedicada a la venta de computadoras de diferentes marcas. En


estos momentos está ofertando cinco modelos diferentes de la marca A, seis modelos diferentes de
la marca B y cuatro de la marca C.

Una empresa de servicios ha decidido comprar tres computadoras a dicha empresa.

a. Determine la probabilidad de seleccionar las tres computadoras de diferente marca.

Solución

Definamos los eventos necesarios.

A :=¿ seleccionar una computadora de la marca de A n( A)=5


B:=¿ seleccionar una computadora de la marca de B n( B)=6
C :=¿ seleccionar una computadora de la marca de C n(C )=4

5A
6B
4C

N = 15 n=3
95
UPC MA444 Estadística
F :=¿ seleccionar una computadora de la marca A, una de la marca B y una de la marca C.

La probabilidad pedida es:

5 6 4
C 1 × C 1 ×C 1
P( F)= 15
=0,2637
C3

b. Determine la probabilidad de seleccionar dos de la marca A y una de la marca B.

Solución

Definamos el evento necesario.


D :=¿ seleccionar dos de la marca A y una de la marca B

La probabilidad pedida es:

5 6 4
C2 ×C 1 × C0
P ( D )= 15
=0,1319
C3

c. Determine la probabilidad de seleccionar al menos una computadora de la marca B.

Solución
Definamos el evento necesario.

E :=¿ al menos una computadora es de la marca B

La probabilidad pedida es:

6 9
C 0 ×C 3
P ( E )=1−P ( E )= c
15
=0,8154
C3

Ejemplo 4

Dos vendedores de seguros trabajan en la empresa Pacifico. La probabilidad de que el vendedor más
viejo llegue tarde cierto día es 0,20, de que el vendedor más joven llegue tarde cierto día es 0,15 y
que ambos lleguen tarde es 0,09.

a. Determine la probabilidad de que al menos un vendedor llegue tarde al trabajo cierto día.

Solución

Definamos los eventos necesarios:


96
UPC MA444 Estadística

A :=¿ que el vendedor más viejo llega tarde a la empresa P( A)=0,20


B:=¿ que el vendedor más joven llega tarde a la empresa P( B)=0,15

Se sabe que la probabilidad de que ambos lleguen tarde es 0,15, luego:

P ( A ∩ B )=0,09

Usando los diagramas de Venn tendremos:

A B

0,11 0,09 0,06

0,74
6
La probabilidad de que al menos un vendedor llegue tarde al trabajo cierto día es la probabilidad
de la unión de A con B, por lo tanto:
P ( A ∪ B ) =0,20+0,15−0,09=0,26

b. Determine la probabilidad de solo un vendedor llegue tarde al trabajo cierto día.


Solución
La probabilidad pedida es:
P (( A ∩ B ) ∪ ( A ∩ B ) )
c c

Usando los diagramas de Venn tendremos:

A B

0,11 0,09 0,06

Como los eventos A ∩ Bc y Ac ∩B son mutuamente excluyentes, entonces:

P ( ( A ∩ B ) ∪ ( A ∩ B ) ) =P ( A ∩ B ) + P ( A ∩ B ) =0,11+0,06=0,17
c c c c

c. Determine la probabilidad de alguno de los vendedores no llegue tarde al trabajo cierto día.
Solución
La probabilidad pedida es:
97
UPC MA444 Estadística
c c
P( A ∩ B )=1−P( A ∩ B)=1−0,09=0,91
Usando los diagramas de Venn tendremos:

A B

0,11 0,09 0,06

Ejemplo 5

Después de una política de mejora de la calidad de la producción de Chemilatex, tanto en el área de


llenado como el de sellado, los trabajadores fueron sensibilizados para realizar sus labores de
producción de la mejor manera y así disminuir los productos defectuosos en la producción. Para
corroborarlo se toma una muestra de 80 productos, encontrándose que 25 presentan defectos en el
llenado, 32 presentan defectos en el sellado y 30 no presentaban defectos. Si se selecciona un
producto al azar.

a. Determine la probabilidad de que se hayan producido ambos tipos de defectos.

b. ¿Cuál es la probabilidad de que se haya producido solo uno de los tipos de defectos?

c. ¿Los eventos defecto en el sellado y defecto en llenado son mutuamente excluyentes?


98
UPC MA444 Estadística
99
UPC MA444 Estadística
Principios fundamentales de conteo
Comprende un conjunto de procedimientos que permiten determinar el número de resultados de un
suceso o experimento sin necesidad de utilizar una enumeración e identificación directa de todos los
posibles resultados de dicho suceso o experimento.

Analicemos los siguientes experimentos aleatorios:

1: lanzar un dado y registrar el número de la cara superior.

❑1={1 , 2 ,3 , 4 ,5 , 6 }

Observamos que es fácil listar y contar los posibles resultados.

2: números pares de tres cifras que se pueden formar con los dígitos 1, 2, 3, 4, 5, 6, 7, 8, 9

❑2={174 ,148 , 184 , 198 ,194 ,144 , …}

Observamos que ya no es fácil listar y contar los posibles resultados, ante esta situación es necesario
utilizar técnicas que nos faciliten el conteo de estos posibles resultados.

Principio de la multiplicación
Si un procedimiento A puede realizarse de m maneras y otro procedimiento B puede realizarse de n
maneras, entonces los dos procedimientos A y B (uno seguido del otro) ocurren de m× n maneras o
formas.

Ejemplo 1

Un ensamblador de computadoras tiene cuatro microprocesadores de diferentes marcas y tres


memorias de diferentes marcas ¿de cuántas maneras posibles puede ensamblar una computadora?
100
UPC MA444 Estadística

Principio de la adición
Si un procedimiento A puede realizarse de m maneras y otro procedimiento B puede realizarse de n
maneras, y si no es posible que ambos se realicen en forma simultánea entonces los dos
procedimientos A o B ocurren de m+n maneras o formas.

Ejemplo 1

La biblioteca de la UPC tiene en uno de sus estantes 40 libros de Cálculo y 50 de Estadística. Si un


estudiante desea estudiar uno de estos dos temas. ¿De cuántas formas puede realizar la elección de
los libros?

Solución
Definamos los eventos:

C :=¿ elegir un libro de Cálculo n ( C )=40


E :=¿ elegir un libro de Estadística n ( E ) =50
L :=¿ elegir un libro

Por la regla de la adición:

n ( L )=n ( C ) +n ( E )=40+50=90

Se puede realizar la elección de los libros de 90 maneras diferentes.

Ejemplo 2

Un ingeniero de telecomunicaciones está proyectando un viaje a una provincia para instalar una
antena parabólica, debe decidir el viaje por bus o por tren. Si hay tres rutas para el bus y dos para el
tren ¿de cuántas maneras posibles puede realizar el viaje?
101
UPC MA444 Estadística

Técnica de conteo: Combinación

Es una técnica que permite contar el número de maneras de seleccionar o elegir aleatoriamente r
elementos de un total de n , sin considerar el orden de selección. Está dado por:

n!
C nr =
r ! ( n−r ) !

Ejemplo 1

Una empresa ha decidido que, para el trabajo remoto de su personal, tres de los 15 trabajadores del
área de Recursos Humanos deben asistir de manera presencial a la empresa, ¿de cuántas maneras
puede seleccionar al grupo?

Solución
Definamos el evento necesario:

C :=¿ elegir tres de los de los 15 trabajadores del área de Recursos Humanos para que asistan de
manera presencial a la empresa.

Como no implica orden, entonces:

15 15 !
n ( C )=C 3 = =455
3 ! ( 15−3 ) !

Se puede realizar la elección de los libros de 90 maneras diferentes.

Ejemplo 2

Una planta de producción emplea 20 trabajadores en el turno mañana, 15 trabajadores en el turno


tarde y 10 en el turno de noche. Un consultor de control de calidad selecciona a seis trabajadores de
un turno para ser entrevistados. ¿De cuántas formas se puede realizar la selección?

Solución

Definamos el evento necesario:

A :=¿ elegir seis trabajadores de un turno para ser entrevistados.

Como no implica orden, entonces:

n ( A ) =C20 15 10
6 +C 6 +C 6 =43 975
102
UPC MA444 Estadística
Ejemplo 3

Un grupo de 20 ingenieros civiles igualmente capacitados forman la plantilla de una empresa


constructora. Si se eligen al azar a tres de ellos para participar en un proyecto, ¿de cuántas maneras
posibles se pueden seleccionar a estos tres ingenieros?

Ejemplo 4

De un grupo de ocho pequeñas empresas se sabe que dos no cumplen con sus obligaciones
tributarias. La Sunat revisará el cumplimiento de los tributos de todas las pequeñas empresas si al
seleccionar tres empresas, la probabilidad de que por lo menos una no cumple con sus obligaciones
tributarias sea superior a 0,62 ¿Qué le recomendaría usted a la Sunat?
103
UPC MA444 Estadística

Probabilidad condicional
Si A y B son dos eventos de un espacio muestral Ω, entonces, la probabilidad condicional de que
ocurra el evento A dado B se determina por:

P (A ∩B)
P ( A /B )=
P( B)

Siendo P ( B )> 0.

Ejemplo 1

Para ocupar un puesto de trabajo en el departamento de diseño de ingeniería de una compañía


constructora de barcos, se han presentado postulantes, cuyas principales características se resumen
en el siguiente cuadro:

Egresado de ingeniería
No egresado de
Mecánica Industrial Total
universidad (N)
Años de experiencia (M) (I)
Al menos tres años de experiencia (A) 14 4 9 27
Menos de tres años de experiencia
25 11 27 63
(B)
Total 39 15 36 90

El orden en que el gerente de la estación entrevista a los aspirantes es aleatorio. Calcule la


probabilidad de que el primer entrevistado por el gerente:

a. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
b. Sea egresado de ingeniería mecánica o tenga al menos tres años de experiencia.
c. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
d. Tenga al menos tres años de experiencia dado que es egresado de ingeniería industrial.

Solución

a. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.

Solución

Definamos los eventos necesarios:

B:=¿ que el postulante tenga menos de tres años de experiencia


M :=¿ que el postulante sea egresado de mecánica

La probabilidad pedida es:


104
UPC MA444 Estadística
25
P( B ∩ M )= =0,278
90

b. Sea egresado de ingeniería mecánica o tenga al menos tres años de experiencia.

Solución

Definamos los eventos necesarios:

A :=¿ que el postulante tenga al menos de tres años de experiencia


M :=¿ que el postulante sea egresado de mecánica

La probabilidad pedida es:

39 27 14
P( M ∪ A)=P(M )+ P( A)−P (M ∩ A)= + − =0,578
90 90 90

c. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.

Solución

Definamos los eventos necesarios:

B:=¿ que el postulante tenga menos de tres años de experiencia


N :=¿ que el postulante no sea egresado de universidad

La probabilidad pedida es:

27
P ( N ∩B ) 90 27
P ( N /B )= = = =0,429
P ( B) 63 63
90

d. Tenga al menos tres años de experiencia dado que es egresado de ingeniería industrial.

Solución

Definamos los eventos necesarios:

A :=¿ que el postulante tenga al menos de tres años de experiencia


I :=¿ que el postulante sea egresado de ingeniería industrial

La probabilidad pedida es:


105
UPC MA444 Estadística
4
P ( A ∩ I ) 90 4
P ( A / I)= = = =0,267
P (I ) 15 15
90
106
UPC MA444 Estadística
Ejemplo 2

Un estudio de mejoramiento de la producción de un fabricante de semiconductores proporcionó


datos para una muestra de 530 placas de silicio. La siguiente tabla presenta el resumen de las
respuestas a dos interrogantes: ¿se encontraron partículas en el troquel que produjo la placa de
silicio? y ¿la placa es regular, buena o mala?

Condición del troquel

Sin partículas Cantidad media de Gran cantidad de Total


(S) partículas (P) partículas (G)
Calidad de la placa
Buena (B) 35 80 70 185
Regular (R) 40 125 30 195
Mala (M) 25 65 60 150
Total 100 270 160 530

Se selecciona al azar una placa de silicio.

a. ¿Cuál es la probabilidad que sea de calidad regular y tenga gran cantidad de partículas?
b. ¿Cuál es la probabilidad que tenga una cantidad media de partículas o sea de mala calidad?
c. ¿Cuál es la probabilidad de que la placa haya sido producida por un troquel con una cantidad
media de partículas o por un troquel con gran cantidad de partículas si la placa no es buena?
d. Dado que la placa de silicio es producida con un troquel que no tiene gran cantidad de
partículas, ¿cuál es la probabilidad que sea de buena calidad?

Solución

a. ¿Cuál es la probabilidad que sea de calidad regular y tenga gran cantidad de partículas?

Solución

Definamos los eventos necesarios:

R :=¿ que la placa sea de calidad regular


G :=¿ que el troquel tenga gran cantidad de partículas

La probabilidad pedida es:

30
P(R ∩G)= =0,0566
530

b. ¿Cuál es la probabilidad que tenga una cantidad media de partículas o sea de mala calidad?

Solución
107
UPC MA444 Estadística
Definamos los eventos necesarios:

M :=¿ que la placa sea de mala calidad


P :=¿ que el troquel tenga una cantidad media de partículas

La probabilidad pedida es:

P ( P ∪ M )=P ( P ) + P ( M ) −P ( P ∩ M )

270 150 65
¿ + − =0,6698
530 530 530

c. ¿Cuál es la probabilidad de que la placa haya sido producida por un troquel con una cantidad
media de partículas o por un troquel con gran cantidad de partículas si la placa no es buena?

Solución

Definamos los eventos necesarios:

G :=¿ que el troquel tenga gran cantidad de partículas


P :=¿ que el troquel tenga una cantidad media de partículas
B:=¿ que la placa sea de buena calidad

La probabilidad pedida es:

P ( P∪G /Bc )=P ( P/ Bc ) + P ( G/B c ) – P ( P ∩G/ Bc )

190 90 0
¿ + − =0,8116
345 345 345

d. Dado que la placa de silicio es producida con un troquel que no tiene gran cantidad de partículas,
¿cuál es la probabilidad que sea de buena calidad?

Solución
Definamos los eventos necesarios:

G :=¿ que el troquel tenga gran cantidad de partículas


B:=¿ que la placa sea de buena calidad

La probabilidad pedida es:

P(B ∩Gc ) 80+35


P( B/Gc )= = =0,3108
c
P(G ) 370
108
UPC MA444 Estadística

Ley multiplicativa de probabilidad

De la definición de probabilidad condicional, obtenemos la fórmula para hallar la probabilidad de la


intersección (o producto) de los eventos A y B, esto es, de:

P ⁡( A ∩ B)=P ⁡( A / B) P ⁡(B)=P ⁡( B/ A)P ⁡(A )

Ejemplo 1

Sean A y B son eventos tales que P( A)=0,4; P(B)=0,2 y P( A /B)=0,5 .

Calcule P( A ∪ B) .

Calcule P ¿).
109
UPC MA444 Estadística

Eventos independientes

Los eventos A y B son independientes si la ocurrencia de B no altera la probabilidad de que haya


ocurrido A, es decir, los eventos A y B son independientes si:

P ( A /B )=P ( A )

Si dos eventos no son independientes, se dice que son dependientes.

Regla multiplicativa para eventos independientes

Si los eventos A y B son independientes, la probabilidad de la intersección de A y B es igual al


producto de las probabilidades de A y B, es decir,

P ⁡( A ∩ B)=P ⁡( A) P(B)

Generalizando para los eventos independientes E1 , E2 ,… , E k.

P(¿ E1 ∩ E2 ∩... E k )=P (¿ E1) P(¿ E2 )⋯ P (¿ Ek )¿ ¿ ¿ ¿

Propiedades

Si los eventos A y B son independientes, entonces también son independientes:

 Ac y Bc ; entonces:
c c c c
P( A ∩ B )=P ( A ) P(B )
 Ac y B; entonces:
P( A c ∩ B)=P( Ac )P( B)
 A y Bc ; entonces:
c c
P( A ∩ B )=P( A)P(B )

Esta propiedad se puede generalizar para más de dos eventos.

Leyes de De Morgan

c c c
 P( ( A ∩ B ) )=P(A ∪ B )
c c c
 P( ( A ∪ B ) )=P (A ∩ B )

Estas leyes se pueden generalizar para más de dos eventos.


110
UPC MA444 Estadística
Ejemplo 1

Un sistema electrónico está compuesto por tres subsistemas A, B y C, de tal manera que las
probabilidades de fallar de cada uno son 0,15; 0,20 y 0,35. Si los subsistemas funcionan de manera
independiente, calcular:
a. Calcular la probabilidad de que al menos uno de los subsistemas falle.
b. Calcular la probabilidad de solo dos de los subsistemas funcione.

Solución

Definamos los eventos necesarios.

c
A :=¿ el subsistema A falle P( A)=0,15 P( A )=0,85
B:=¿ el subsistema B falle P( B)=0,20 P( Bc )=0,80
c
C :=¿ el subsistema C falle P(C)=0,35 P(C )=0,65

a. Calcular la probabilidad de que al menos uno de los subsistemas falle.

Solución

Definamos los eventos necesarios.

S :=¿ al menos uno de los sistemas falle


Sc :=¿ ninguno de los sistemas falle

P ( S )=1−P ( S c )

Para que ninguno de los sistemas falle, no debe fallar ninguno de los sistemas A , B y C .

P( S)=1−P ( A c ∩ Bc ∩ Cc )

Como los eventos A , B y C son independientes:

P( S)=1−P ( A c ) P( Bc ) P(C c )

P ( S )=1−0,85× 0,80 ×0,65=0,558

b. La probabilidad de solo dos de los subsistemas funcione.

Solución

Definamos los eventos necesarios.

S2 :=¿ solo dos de los sistemas funcionen.


111
UPC MA444 Estadística
Para que solo dos de los sistemas funcionen, deben funcionar A y C pero no B; B y C pero no A; A
y B pero no C. Por lo tanto:

P(S2 )=P( A c ∩ B∩ Cc )+ P (A ∩B c ∩C c )+ P( A c ∩ Bc ∩C)

Como los eventos A , B y C son independientes:

c c c c c c
P( S2 )=P( A )P(B) P (C )+ P( A )P( B )P(C )+ P( A ) P (B ) P (C)

Reemplazando los valores, tendremos:

P( S2 )=0,85 × 0,20× 0,65+0,15 ×0,80 × 0,65+0,85 ×0,80 ×0,35=0,4265

Ejemplo 2

Una empresa produce piezas en tres máquinas, M 1, M2 y M3, que pueden presentar desajustes de
manera independiente, con probabilidades 0,02; 0,01 y 0,06 respectivamente. Al inicio de un día de
operación se realiza una prueba en cada máquina. Si se observan desajustes en una máquina, ésta
debe pasar el día en revisión técnica. Para cumplir el nivel mínimo de producción diaria se necesita
que al menos dos de las tres máquinas funcionen.

a. ¿Cuál es la probabilidad de que una de las tres máquinas deba pasar el día en revisión técnica?
b. ¿Cuál es la probabilidad de cumplir con el nivel mínimo de producción diaria?

Solución

Definamos los eventos necesarios.

c
A :=¿ la máquina M1 presenta desajustes P( A)=0,02 P( A )=0,98
c
B:=¿ la máquina M2 presenta desajustes P(B)=0,01 P( B )=0,99
C :=¿ la máquina M3 presenta desajustes P(C)=0,06 P(C c )=0,94

a. ¿Cuál es la probabilidad de que una de las tres máquinas deba pasar el día en revisión técnica?

Solución

Se define el evento necesario:

R :=¿ una de las tres máquinas presenta desajustes

Para que solo una de las máquinas presente desajustes, deben presentarlos M1 pero no M2 y M3;
M2 pero no M1 y M3; M3 pero no M1 y M2.

Por lo tanto:
112
UPC MA444 Estadística
c c c c c c
P( R)=P( A ∩ B ∩C )+ P( A ∩B ∩C )+ P( A ∩ B ∩C )

Como los eventos A , B y C son independientes:

P(R)=P ( A ) P ( B c ) P(C c )+ P ( A c ) P ( B ) P (C c )+ P ( A c ) P ( Bc ) P (C)

Reemplazando los valores, tendremos:

P( R)=0,02 × 0,99× 0,94+0,98 × 0,01× 0,94+0,98 × 0,99× 0,06=0,086

b. ¿Cuál es la probabilidad de cumplir con el nivel mínimo de producción diaria?

Solución

Se define el evento necesario:

N :=¿ cumplir con el nivel mínimo de producción

Para cumplir el nivel mínimo de producción diaria se necesita que al menos dos de las tres
máquinas funcionen, es decir, funcionen dos de las máquinas o las tres.

P ( N )=P ( A ∩B ∩C ) + P ( A ∩ B ∩C ) + P ( A ∩ B ∩C ) + P ( A ∩B ∩C )
c c c c c c c c c

Como los eventos A , B y C son independientes:

P ( N )=P ¿

Reemplazando los valores, tendremos:

P ( N )=0,98 × 0,99× 0,06+0,98 × 0,01× 0,94+0,02 ×0,99 × 0,94+0,98 ×0,99 × 0,94

P(N )=0,9980
113
UPC MA444 Estadística
Aplicación al sistema de componentes: Confiabilidad de sistemas
Podemos aplicar el concepto de la independencia de eventos al caso en que se tenga un sistema de
componentes electrónicos acoplados en serie o en paralelo.

Sistema en serie
Un sistema de componentes acopladas en serie funciona si todos sus componentes funcionan.

Sean los eventos:


A ≔ el componente A funcione
B≔ el componente B funcione
S ≔el sistema funcione

Para que el sistema funcione S, ambos componentes, A y B, deben funcionar. Se asume que cada
componente funciona de forma independiente.

P(S)=P( A ∩ B)

Cada componente funciona de forma independiente, entonces:

P( S)=P( A) P(B)

Ejemplo 1

El sistema funcionará sólo si ambos componentes funcionan. El componente A funciona con una
probabilidad de 0,98 y el componente B funciona con una probabilidad de 0,95. Suponga que A y B
funcionan de manera independiente. Determine la probabilidad que el sistema funcione.

Solución
Sean los eventos:
A ≔ el componente A funcione
B≔ el componente B funcione
S ≔el sistema funcione

La probabilidad de que funcione el sistema es:

P( S)=P( A ∩ B)

Cada componente funciona de forma independiente, entonces:

P(S)=P( A) P(B)=0,98 ×0,95=0,931


114
UPC MA444 Estadística

Sistema en paralelo
Un sistema de componentes acoplada en paralelo funciona, si al menos una de sus componentes
funciona. El sistema funcionará si alguno de los componentes, A o B, funciona.

P ( S )=P ( A ∪ B ) =P ( A )+ P ( B )−P ( A ∩ B )

Se asume que cada componente funciona de forma independiente.

P ( S )=P ( A ∪ B ) =1−P ¿

Usando las leyes de De Morgan

P ( S )=P ( A ∪B ) =1−P ( A ∩B )
c C

Cada componente funciona de forma independiente, entonces la probabilidad de que el sistema


funcione es:

P( S)=1−P ( A c ) P(Bc )

Ejemplo 2
Los componentes A y B funcionan con una probabilidad de 0,90 y 0,85 respectivamente. Suponga
que los componentes A y B funcionan de manera independiente. Determine la probabilidad de que el
sistema funcione.

Solución

La probabilidad de que el sistema funcione es:

P ( S )=1−P ( A c ) P ( B c )=1− ( 0,10× 0,15 )=0,985


115
UPC MA444 Estadística
Ejemplo 3

Un sistema eléctrico consta de cuatro componentes. El sistema funciona si los componentes A y B


funcionan, y si funciona cualquiera de los componentes C o D. La confiabilidad (probabilidad de que
funcionen) de cada uno de los componentes también se muestra en la figura. Suponga que los cuatro
componentes funcionan de manera independiente.

a. Calcule la probabilidad que el sistema completo funcione.

b. Calcule la probabilidad que el componente C no funcione, dado que el sistema completo


funciona.
116
UPC MA444 Estadística
117
UPC MA444 Estadística

Probabilidad total y el teorema de Bayes

Probabilidad total

Sean los eventos A1 , A 2 ,... , A k , los cuales forman una partición del espacio muestral  mutuamente
excluyentes y exhaustivos y sea E otro evento cualquiera de , se cumple:

A1 A2 Ak

P ( E )=P ( A1 ) P ( E/ A1 ) + P ( A2 ) P ( E/ A 2 ) +…+ P ( A k ) P ( E / A l )

Donde a P( E) se le conoce como la probabilidad total.

Teorema de Bayes

Si los eventos A1 , A 2 ,... , A k constituyen una partición del espacio muestral , entonces para
cualquier evento E de , se cumple que:

P ( Ai ∩ E )
P ( Ai / E)= i=1, 2 , … , k
P( E)

P ( A i ) P ( E/ A i )
P ( Ai / E)=
P ( A1 ) P ( E/ A1 ) + P ( A2 ) P ( E/ A 2 ) +…+ P ( A k ) P ( E / A k )
118
UPC MA444 Estadística
Ejemplo 1
Una cadena de tiendas de suministros de construcción vende tres marcas diferentes de teodolitos.
De sus ventas de teodolitos, 50% son de la marca 1 (la menos cara), 30% son de la marca 2 y 20% son
de la marca 3 (la más cara).

Cada fabricante ofrece un año de garantía en las partes y mano de obra. Se sabe que 25% de los
teodolitos de la marca 1 requieren trabajo de reparación dentro del periodo de garantía, mientras
que los porcentajes correspondientes de las marcas 2 y 3 son 20% y 10%, respectivamente.

Determine:
a. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya adquirido un teodolito de
la marca 1 y que necesitará reparación mientras se encuentra dentro de garantía?
b. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya comprado un teodolito
que necesite reparación mientras se encuentra dentro de la garantía?
c. Si un cliente regresa a la tienda con un teodolito que necesita reparación dentro de garantía,
¿cuál es la probabilidad de que sea un teodolito de la marca 1?

Solución

Primero, definimos los eventos y a continuación elaboramos el diagrama del árbol.

A :=¿ que un comprador haya adquirido un teodolito de la marca A 1


B:=¿ que un comprador haya adquirido un teodolito de la marca A 2
C :=¿ que un comprador haya adquirido un teodolito de la marca A 3
N :=¿ necesita reparación mientras se encuentra dentro de la garantía

P ( N / A )=0,25 P(A∩N )
P ( A )=0,50
P ( N / A )=0,75 P(A ∩ N )
c c

P ( N /B )=0,20 P (B ∩ N )
P ( B )=0,30
P ( N /B )=0,80 P (B ∩ N )
c c

P ( N /C )=0,10 P (C ∩ N )
P ( C ) =0,20
P ( N /C ) =0,90 P (C ∩ N )
c c

a. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya adquirido un teodolito de


la marca 1 y que necesitará reparación mientras se encuentra dentro de garantía?

Solución
La probabilidad pedida es:
119
UPC MA444 Estadística

P( A ∩ B)=P(B/ A)P( A)=0,125

b. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya comprado un teodolito


que necesite reparación mientras se encuentra dentro de la garantía?

Solución

La probabilidad pedida es:

P ( N )=P ( A ∩ N ) + P ( B ∩ N ) + P (C ∩ N )

Usando el teorema de la probabilidad total.

P ( N )=P ( N / A ) P ( A ) + P ( N / B ) P ( B ) + P ( N /C ) P ( C )

¿ 0,5 ×0,25+ 0,30× 0,20+0,20 × 0,10=0,205

¿ 0,125+0,06+ 0,02=0,205

c. Si un cliente regresa a la tienda con un teodolito que necesita reparación dentro de la garantía,
¿cuál es la probabilidad de que sea un teodolito de la marca 1?

Solución

La probabilidad pedida es:

P( A ∩ N ) 0,5 × 0,25
P ( A / N )= = =0,6098
P(N ) 0,205

Ejemplo 2
Tres máquinas A, B y C, producen el 45%, 30% y 25% respectivamente del total de las piezas
producidas en una fábrica. El porcentaje de producción de piezas defectuosas de estas máquinas son
del 3%, 4% y 5% respectivamente.

a. Si seleccionamos una pieza al azar ¿cuál es la probabilidad de que sea defectuosa?


b. Si tomamos al azar una pieza y resulta defectuosa ¿cuál es la probabilidad de que haya sido
producida por la máquina B?
c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?

Solución

Primero, definimos los eventos y a continuación elaboramos el diagrama del árbol:

A :=¿ que la pieza sea producida por la máquina A P( A)=0,45


B:=¿ que la pieza sea producida por la máquina B P(B)=0,30
120
UPC MA444 Estadística
C :=¿ que la pieza sea producida por la máquina C P(C)=0,25
D :=¿ que se elija una pieza defectuosa

P ( D/ A )=0,03 P ( A ∩ D)
P ( A )=0,45
P ( D / A )=0,97 P(A ∩D )
c c

P ( D/B )=0,04 P (B ∩ D)
P ( B )=0,30
P ( D /B ) =0,96 P (B ∩ D )
c c

P ( D/C )=0,05 P (C ∩ D)
P ( C ) =0,25
P ( D /C ) =0,95 P (C ∩ D )
c c

a. Si seleccionamos una pieza al azar ¿cuál es la probabilidad de que sea defectuosa?

Solución
La probabilidad pedida es:

P( D)=0,45 × 0,03+0,30 ×0,04+ 0,25 ×0,05=0,038

b. Si tomamos al azar una pieza y resulta defectuosa ¿cuál es la probabilidad de que haya sido
producida por la máquina B?

Solución
La probabilidad pedida es:

P ( D/ B ) P( B) 0,04 ×0,30
P ( B /D )= = =0,3158
P(D) 0,038

c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?

Solución
Las probabilidades pedidas son:

P ( D / A ) P( A) 0,03 ×0,45
P ( A / D )= = =0,3553
P (D) 0,038

P ( D/ B ) P( B) 0,04 ×0,30
P ( B /D )= = =0,3158
P(D) 0,038
121
UPC MA444 Estadística

P ( D/C ) P(C) 0,05 ×0,25


P ( C/ D )= = =0,3289
P( D) 0,038

La máquina con mayor probabilidad de haber producido la pieza defectuosa es la máquina A.


122
UPC MA444 Estadística
Ejemplo 3

Una empresa se encuentra estudiando la posibilidad de importar para el próximo año un nuevo
modelo de celular de última generación. Al estudiar la situación económica del próximo año se
contemplan tres posibilidades: inflación, estabilidad o crecimiento, estimando dichas alternativas con
las siguientes probabilidades: 0,55; 0,35 y 0,10 respectivamente. La probabilidad de importar el
nuevo modelo de celular es 0,25 si existiera inflación; 0,40 si existiera estabilidad y 0,65 si existiera
crecimiento.

a. Defina los eventos y presente el diagrama del árbol.

b. Calcule la probabilidad de importar el nuevo modelo de celular para el próximo año.

c. Asumiendo que la empresa decidió importar el nuevo modelo de celular, ¿cuál es la probabilidad
que existiera inflación en la economía?
123
UPC MA444 Estadística
Ejemplo 4
17
La probabilidad que la construcción de un edificio termine a tiempo es , la probabilidad que no
20
3
haya huelga es y la probabilidad que la construcción se termine a tiempo dado que no hubo huelga
4
14 1
es ; la probabilidad que haya huelga y no se termine la construcción a tiempo es .
15 10

a. Calcule la probabilidad de que la construcción se termine a tiempo y no haya huelga.

b. No haya huelga dado que la construcción se terminó a tiempo.

c. La construcción no se termine a tiempo si hubo huelga.

d. La construcción no se termine a tiempo si no hubo huelga.


124
UPC MA444 Estadística

Ejercicios propuestos

27.Una empresa constructora emplea a tres ingenieros de ventas. El ingeniero 1 hace el trabajo de
estimar costos en 60% de las cotizaciones solicitadas a la empresa, el ingeniero 2 hace lo mismo
en 30% de las cotizaciones y el ingeniero 3 en el resto. Se sabe que la tasa de error para el
ingeniero 1 es tal que la probabilidad de encontrar un error en su trabajo es 0,02; la probabilidad
de encontrar un error en el trabajo del ingeniero 2 es 0,04 y la probabilidad de encontrar un error
en el ingeniero 3 es de 0,03.

Suponga que al revisar una solicitud de cotización se encuentra un error grave en la estimación de
los costos. ¿Qué ingeniero supondría usted que hizo los cálculos?

28.El informe de la comisión mundial de represas (ONU, 2015) indica numerosos impactos
ambientales que logran dañar represas, provocando en ellas averías muy serias. La Confiep debe
recomendar un tipo de estructura antes de diseñar una nueva represa. Por registros anteriores se
sabe que en el Perú el 55% de las represas están hechas a base de cimientos, el 28% con
terraplenes y el resto con excavaciones. Además, se conoce que, cuando el diseño de la estructura
de la represa es a base de cimientos ésta no presenta averías en un 80%, si es a base de
terraplenes presenta averías en un 35% y si la estructura es a base de excavaciones presenta
averías en un 25%.

Si se elige una represa al azar y ésta presenta averías ¿cuál es el tipo de diseño de estructura que
debería recomendar la Confiep?

29.Consideremos que tres máquinas Alpha, Beta y Gamma producen respectivamente el 50%, el 30%
y el 20% del número total de artículos de una fábrica. Si la proporción de artículos defectuosos
que produce cada una de estas máquinas es 0,03; 0,04 y 0,05 respectivamente y se selecciona un
artículo aleatoriamente.

a. Calcule la probabilidad de que el artículo sea defectuoso.


b. Calcule la probabilidad de que el artículo seleccionado al azar haya sido producido por la
máquina Alpha si se sabe que es defectuoso.
c. Calcule la probabilidad de que el artículo seleccionado al azar haya sido producido por la
máquina Alpha o la máquina Beta, si se sabe que es defectuoso.

30.Una empresa vende tres tipos de maquinaria pesada para la industria textil A, B y C. El 70% de las
máquinas son del tipo A, el 20% del tipo B y el 10% son del tipo C. Las máquinas A tienen una
probabilidad de 0,10 de producir una pieza defectuosa a lo largo de un año, las máquinas B tienen
una probabilidad de 0,30 y las máquinas C tienen una probabilidad 0,60 de producir una de tales
piezas defectuosas a lo largo de un año.
125
UPC MA444 Estadística

Una de estas máquinas ha estado funcionando durante un año de prueba y ha producido una
pieza defectuosa. ¿De cuál tipo de máquina es más probable que provenga la pieza defectuosa?

31.Una de las etapas de producción de drones es el ensamblado de la cubierta del casco para
exteriores. Se programan diariamente 1400 cascos utilizando a tres especialistas A, B y C. El
especialista A atiende 170 cascos, el especialista B atiende 500 cascos y el especialista C atiende
los restantes.

Cabe la posibilidad de que el ensamblado del casco no sea el correcto; por lo tanto, el casco
ensamblado sería defectuoso. La siguiente tabla muestra como varía la proporción del
ensamblado defectuoso del casco para cada especialista.

Especialista Proporción de cascos ensamblados defectuosos


A 0,02
B 0,04
C 0,03

Si se selecciona al azar un dron con casco ensamblado defectuoso, ¿cuál es la probabilidad de que
lo haya ensamblado el especialista B?

32.Una de las medidas que se consideran para regular el volumen de agua en m 3 en las represas, es
abrir las compuertas para que las represas no rebalsen. Las compuertas operan en forma
independiente de acuerdo con dos tipos de sistemas. Estos sistemas operan solo si hay una
trayectoria de dispositivos funcionales de izquierda a derecha. Su funcionamiento es muy
importante por lo que el ingeniero de mantenimiento recomendará utilizar aquel sistema que
presente mayor probabilidad de flujo de funcionamiento continuo.

¿Cuál de los dos sistemas deberá elegir para ser instalado en una compuerta? Suponga que cada
dispositivo funciona de manera independiente con una probabilidad de 0,85.

33.Considere el sistema de componentes electrónicos conectados como se muestra en la figura. Los


componentes funcionan de manera independiente uno del otro, y la probabilidad de que cada
componente funcione es 0,90; ¿cuál es la probabilidad de que el sistema electrónico funcione?
126
UPC MA444 Estadística
34.Electronic Systems Company que brinda soporte especializado en la instalación de redes con
tecnología LAN o WAN en diferentes empresas, sabe que el 15% de las empresas prefieren como
medio físico de transporte los cables de cobre de par trenzado, el 35% prefiere los cables
coaxiales, el 40% fibras ópticas y 10% el aire. Además, si la empresa elige los cables de cobre de
par trenzado como medio físico, la probabilidad que elija la tecnología WAN es 0,62. Las empresas
que eligen cables coaxiales tienen una probabilidad de 0,45 de elegir la tecnología LAN; las
empresas que eligen la fibra óptica tienen una probabilidad de 0,55 de elegir la tecnología WAN y
las empresas que eligen el aire como medio físico de transporte tienen una probabilidad de 0,5 de
elegir la tecnología LAN.

a. Calcule la probabilidad que una empresa elija para su red la tecnología LAN.
b. Si se selecciona al azar una empresa que utiliza tecnología WAN, ¿cuál es la probabilidad que
utilice como medio físico de transporte cables de cobre de par trenzado?

35.Si la probabilidad de que cada llave esté cerrada dejando pasar corriente es p=¿ 0,6 y las llaves
se cierran y se abren en forma independiente, calcular la probabilidad de que pase corriente de I
hacia O en el siguiente circuito.
127
UPC MA444 Estadística

Caso: Construcción de represas

El informe de la Comisión Mundial de Represas


(ONU,2015) indica que numerosos impactos
ambientales logran dañar represas, provocando en ellas
averías muy serias; por lo tanto, la Confiep debe
recomendar un tipo de material antes de diseñar una
nueva represa.

Por registros anteriores se sabe que en el Perú el 55%


de las represas están construidas a base de cimientos,
el 2B% con terraplenes y el resto con excavaciones. Además, se conoce que si el diseño de la
estructura de la represa es a base de cimientos esta no presenta averías en un B0%, si es a base de
terraplenes presenta averías en un 35% y si la estructura es a base de excavaciones presenta averías
en un 25%.

Si se elige una represa al azar y esta presenta averías, ¿cuál es el tipo de material que debería
recomendar la Confiep para que no ocurran fallas estructurales?
128
UPC MA444 Estadística

Variable aleatoria

Sea Ω un espacio muestral. Una variable aleatoria es una función X que transforma cada resultado w
del espacio muestral en un número real X (w) .

El rango de la variable aleatoria X es el conjunto RX de todos sus posibles valores.

Ejemplo 1
Al lanzar dos monedas para registrar los posibles resultados se obtiene el espacio muestral siguiente:

 = {cc, cs, sc, ss}

Si definimos la variable aleatoria X como número de caras que se obtiene, entonces a cada resultado
de , es posible asignarle un número real de la siguiente manera:

 cc, se le asigna el número real 2


 cs, se le asigna el número real 1
 sc, se le asigna el número real 1
 ss, se le asigna el número real 0

Clasificación de variables aleatorias

Una variable es discreta si su rango es un conjunto finito o infinito numerable.

Por ejemplo: número de circuitos electrónicos producidos por una empresa que cumplen con las
especificaciones técnicas, número de llamadas que recibe una central telefónica.

Una variable es continua si su rango es un conjunto infinito no numerable.

Por ejemplo: resistencia a la ruptura de un material plástico (onzas por pulgada cuadrada),
resistencia transversal de los ladrillos fabricados por una empresa (MN/m 2).
129
UPC MA444 Estadística

Variable aleatoria discreta

Sea X una variable aleatoria discreta. La función de probabilidad de una variable aleatoria discreta
representa la probabilidad de que la variable aleatoria tome un valor genérico igual a x y se denotará
de la siguiente manera:

f ( x)=P ( X=x )

La función de probabilidad de X debe cumplir las siguientes condiciones:

f (x) ≥ 0

∑ f (x)=1
Rango X

Ejemplo 1
El ingeniero de producción de la empresa Tecnotronics S.A. ha determinado que la distribución de
probabilidades del número de artículos defectuosos por lote es la siguiente:

Número de artículos defectuosos 0 1 2 3 4


f(x) = P(X = x) 0,25 a 0,10 0,25 0,25

a. Calcule el valor de la constante a para que la distribución sea de probabilidad.


b. Calcule la probabilidad de encontrar menos de dos artículos defectuosos por lote.
c. Si el lote tiene dos o más artículos defectuosos, es considerado malo; calcule la probabilidad que
el lote sea malo.
d. Si el número de artículos defectuosos por lote es al menos uno, calcule la probabilidad de que el
número de artículos defectuosos sea menor a tres.

Solución

a. Calcule el valor de la constante a para que la distribución sea de probabilidad.

Solución

Para hallar el valor de la constante usaremos la siguiente condición:

∑ f (x)=1
Rango X

f ( 0 )+ f ( 1 ) +f ( 2 ) + f ( 3 )+ f ( 4 )=1

0,25+ a+0,10+0,25+ 0,25=1

Despejando se tiene que a = 0,15


130
UPC MA444 Estadística

b. Calcule la probabilidad de encontrar menos de dos artículos defectuosos por lote.

Solución

La probabilidad pedida es:

P( X < 2)=P ( X=0)+ P( X=1)=0,25+ 0,15=0,40

c. Si el lote tiene dos o más artículos defectuosos, es considerado malo; calcule la probabilidad que
el lote sea malo.

Solución

Sea el evento A :=¿ el lote sea malo

El lote será malo si tiene dos o más artículos defectuosos, por lo tanto, la probabilidad pedida es:

P( A)=P( X ≥2)=1 – P( X <2)=1 – 0,40=0,60

d. Si se sabe que el número de artículos defectuosos por lote es al menos uno, calcule la
probabilidad de que el número de artículos defectuosos sea menor a tres.

Solución

La probabilidad pedida es:

P ( X <3/ X ≥ 1 )

P ( X < 3∩ X ≥1 )
¿
P( X ≥ 1)

P ( X =1 ) + P ( X=2 )
¿
1−P ( X=0 )

f ( 1 ) +f ( 2 )
¿
1−f ( 0 )

0,15+0,10
¿ =0,3333
1−0,25
131
UPC MA444 Estadística
Ejemplo 2

El departamento de control de calidad de una empresa selecciona al azar diariamente tres bombillas
de un lote que contiene 20 bombillas, para decidir si acepta el lote y los pasa al departamento de
producción o rechaza el lote y los devuelve al proveedor.

a. Construya la distribución de probabilidad del número de bombillas defectuosas que se encuentra


en la muestra, si el muestreo es sin reposición y bajo la suposición que el lote contiene dos
bombillas defectuosas.

Identificamos la variable X :=¿ número de bombillas defectuosas encontradas en la muestra.

Los valores del rango de la variable son R X =¿ { }

Definamos los eventos necesarios:

D :=¿ bombilla defectuosa P ( D )=¿


P ( D )=¿
c c
D :=¿ bombilla no defectuosa

P ( X=0 )=¿
P ( X=1 ) =¿
P ( X=2 )=¿

Finalmente, colocamos los resultados en la tabla de función de probabilidades.

Numero de bombillas defectuosas 0 1 2


f(x) = P(X = x)      

b. Si la regla de decisión es rechazar el lote si en la muestra se encuentra más de un artículo


defectuoso. ¿Cuál es la probabilidad de rechazar un lote?

c. En relación con la regla planteada en (b), si el lote es aceptado, ¿cuál es la probabilidad que la
muestra contenga un defectuoso?
132
UPC MA444 Estadística
133
UPC MA444 Estadística

Esperado de una variable aleatoria discreta

Sea X una variable aleatoria discreta con función de probabilidad f(x). Entonces el valor esperado o
media de X es:

μ= E ( X )= ∑ x f (x)
Rango X

Varianza de una variable aleatoria

Sea X una variable discreta con función de probabilidad f(x). Entonces, la varianza de X es:

σ =V ( X )=E ( ( X−μ ) )
2 2

La fórmula abreviada para el cálculo de la varianza es:

V ( X)=E(X 2 ) – [ E( X )] 2

donde:
E ( X 2) = ∑ x 2 f (x )
Rango X

Desviación estándar de una variable aleatoria

La desviación estándar de X es la raíz cuadrada positiva de la varianza de X .

σ =√ σ
2

Ejemplo 1

El número de fallas de energía eléctrica que afectan a cierta región en cualquier año dado se
considera una variable aleatoria que tiene la siguiente función de probabilidad:

x 0 1 2 3
P(X = x) 0,38 0,24 k 0,08

a. Calcule e interprete el valor esperado de X .


b. Calcule la desviación estándar y el coeficiente de variación de X.
134
UPC MA444 Estadística
Solución

a. Calcule e interprete el valor esperado de X .

Solución
En primer lugar, hallaremos el valor de k para que la distribución sea función de probabilidad:

0,38+0,24 +k + 0,08=1

Despejando, el valor de k =0,3.

El valor esperado de X se calcula con la siguiente fórmula:

μ= E ( X )= ∑ x f (x)
Rango X

Reemplazando:

μ= E ( X )=0 × f ( 0 ) +1 × f ( 1 ) +2 × f ( 2 )+3 × f (3)

¿ 0 ×0,38+ 1× 0,24+2 ×0,3+3 × 0,08=1,08

Interpretación
Si el experimento se repitiera muchas veces, en promedio el número de fallas de energía
eléctrica que afectan a cierta región en cualquier año dado sería de 1,08.

b. Calcule la desviación estándar y el coeficiente de variación de X.

Solución
Primero, calculamos la varianza y usaremos la fórmula:

2 2
V ( X)=E(X ) – [ E( X )]

Donde:

E( X 2)=0 2× 0,38+1 2× 0,24+2 2× 0,3+3 2× 0,08=2,16

Reemplazando:

V ( X )=2,16−1,082 =0,9936
Finalmente,

la desviación estándar de X es:


σ =DS ( X )= √ V ( X ) =¿

el coeficiente de variación de X es:


135
UPC MA444 Estadística
DS ( X ) ❑
CV ( X )= = =¿
E(X) ❑

Ejemplo 2
Un ingeniero civil del departamento de obras muestra la distribución de probabilidad de la variable
aleatoria X :=¿ número de habitaciones a construir en edificios residenciales.

x 4 5 7 8 9
f(x) 0,20 0,25 0,10 0,15 0,30

a. Si la gerencia del departamento de obras le impone que construya menos de ocho habitaciones y
suponiendo que se cumple con este requerimiento, ¿cuál es la probabilidad que construya por lo
menos cinco habitaciones?
b. Si el costo de una vivienda, en dólares, está en función del número de habitaciones de acuerdo
con la siguiente ecuación C ( X )=14000 X +5000 . Indique la media del costo de una vivienda.

Solución

a. Si la gerencia del departamento de obras le impone que construya menos de ocho habitaciones y
suponiendo que se cumple con este requerimiento, ¿cuál es la probabilidad que construya por lo
menos cinco habitaciones?

Solución

Se trata de una probabilidad condicional. Aplicando la fórmula se tiene que:

P ( ( 5 ≥ X ) ∩ ( X <8 ) ) P (5 ≤ X < 8 ) f (5)+ f (7)


P ( X ≥5 / X <8 )= = =
P ( X <8 ) P ( X <8 ) f ( 4 )+ f ( 5 ) + f ( 7 )

0,25+ 0,10 0,35


¿ = =0,6364
0,20+0,25+0,10 0,55

b. ¿Cuánto esperaría pagar un cliente por una vivienda?

Solución

Usando la fórmula se tiene que:

9
μ= E ( X )=∑ xf ( x )=4 × 0,20+5 × 0,25+ 7 ×0,10+8 × 0,15+9 ×0,30
x=4

E( X)=6,65 habitaciones

El valor esperado o media del costo será:


136
UPC MA444 Estadística
E ( C ( X ) )=E ( 14000 X +5000 ) =14000 E ( X )+ 5000

Por lo tanto, la media del costo de una vivienda es de 89100 dólares.


137
UPC MA444 Estadística
Ejercicios propuestos

36.Según el departamento de control de calidad de la empresa Construye S.A., el número de fallas


superficiales en la elaboración de cables de luz en su presentación de rollos de 20 metros
corresponde a una variable aleatoria X, la misma que presenta la siguiente función de
probabilidad:

Número de fallas superficiales 0 1 2 3 4


Probabilidad a 0,27 0,16 b 0,01

Si el valor esperado de X es 1,71 fallas por cable, ¿cuál es la probabilidad de que un cable presente
a lo más dos fallas?

37.Según el departamento de control de calidad de una empresa fabricante de tornillos, el número


de fallas superficiales en los tornillos corresponde a una variable aleatoria X con E( X)=¿0,88
por tornillo. Además, se sabe que la función de probabilidad está dada por:

x 0 1 2 3 4
f(x) a 0,37 0,16 b 0,01

a. Calcule la probabilidad de que un tornillo presente al menos dos fallas.


b. Calcule la varianza y el coeficiente de variación de X.

38.Una librería necesita hacer el pedido semanal de una revista especializada de ingeniería. Por
registros históricos, se sabe que las frecuencias relativas de vender una cantidad de ejemplares es
la siguiente:

Demanda de ejemplares 1 2 3 4 5 6
Frecuencia relativa 1/15 2/15 3/15 4/15 3/15 2/15

Calcule la media y varianza de la demanda de ejemplares.

39.En un almacén de aparatos electrónicos se almacenan 10 tostadoras para su distribución, cuatro


de la marca A y el resto de las marcas menos conocidas. Si un empleado selecciona al azar cinco
tostadoras para llevarlas por encargo a una tienda para su comercialización, calcular la
probabilidad de que en las cinco tostadoras seleccionadas:

a. Calcule la probabilidad de que en las cinco tostadoras seleccionadas existan exactamente dos
de la marca A.
b. Calcule la probabilidad de que en las cinco tostadoras seleccionadas, a lo sumo, haya una
tostadora de las marcas menos conocidas.
138
UPC MA444 Estadística

Distribuciones discretas especiales

Distribución binomial
El experimento consiste en n pruebas idénticas de Bernoulli. Cada prueba tiene únicamente dos
resultados: éxito o fracaso. P(éxito)=p y P(fracaso)=1− p se mantiene constante a lo largo de
todas las pruebas.

Las pruebas son independientes.

La probabilidad del evento considerado como éxito es constante en cada prueba y se denota por p.

La variable aleatoria binomial se define como:

X :=¿ número de éxitos que ocurren en los n ensayos o pruebas

La función de probabilidad de X es:

n x n−x
f ( x )=P ( X =x )=C x p ( 1−p ) , x=0,1, 2 , ..., n

donde:

n :=¿ número de ensayos o pruebas


p :=¿ probabilidad de éxito en cada ensayo
1 – p :=¿ probabilidad de fracaso

Notación
Si la variable aleatoria X sigue una distribución binomial con parámetros n y p se denota
X B(n , p) .

Media
¿ E ( X ) =np

Varianza
❑2=V ( X )=np(1− p)

Para el cálculo de probabilidades de una distribución binomial en Excel se usa la función:


=DISTR.BINOM.N( x ; n = número de repeticiones; p = probabilidad de éxito; acumulado = 1).
139
UPC MA444 Estadística
Ejemplo 1

La probabilidad de que el comprador de un osciloscopio haga uso del servicio dentro del plazo de
garantía es 0,20. Para los cinco osciloscopios que cierta empresa ha vendido independientemente a
cinco compradores este mes.

a. ¿Cuál es la probabilidad de que exactamente tres compradores hagan uso de la garantía?


b. ¿Cuál es la probabilidad que máximo un comprador haga uso de la garantía?
c. ¿Cuál es la probabilidad de que tres o más compradores hagan uso de la garantía?

Solución

X :=¿ número de compradores de osciloscopios que hagan uso de la garantía

X B(n=5 , p=0,20)

El rango de X es 0, 1, 2, …, 5

La función de probabilidad f ( x ) es:

5 x 5−x
f ( x)=P ( X=x )=C x 0,20 (1−0,20) , x=0 ,1 , 2 ,... , 5

a. ¿Cuál es la probabilidad de que exactamente tres compradores hagan uso de la garantía?

Solución

La probabilidad pedida es:

P ( X=3 )=f (3)=C 53 0,203 ( 1−0,20 )2=0,0512

b. ¿Cuál es la probabilidad que máximo un comprador haga uso de la garantía?

Solución

La probabilidad pedida es:

P ( X ≤1 ) =P ( X=0 ) + P ( X =1 )=f ( 0 )+ f (1)


5 0 5 5 1 4
P ( X ≤1 ) =C0 0,20 ( 1−0,20 ) +C 1 0,20 ( 1−0,20 ) =0,73728

c. ¿Cuál es la probabilidad de que tres o más compradores hagan uso de la garantía?

Solución

La probabilidad pedida es:


140
UPC MA444 Estadística

P ( X ≥3 )=1−P ( X <3 )

¿ 1−[P ( X =0 ) + P ( X =1 )+ P ( X =2 ) ]

¿ 1−[ C 0 0,20 ( 1−0,20 ) +C 1 0,2 ( 1−0,2 ) + C2 0,2 ( 1−0,2 ) ]


5 0 5 5 1 4 5 2 3

P ( X ≥3 )=1−0,94208=0,05792

Ejemplo 2

El supervisor de una obra ha determinado que un proveedor entrega los pedidos a tiempo alrededor
del 94% de las veces. Para su última obra, el supervisor seleccionó una muestra de 12 pedidos.

a. Calcule la probabilidad de que el proveedor entregue 11 pedidos a tiempo.


b. Calcule el valor esperado del número de pedidos entregados a tiempo.

Sea X :=¿ número de pedidos entregados a tiempo en una muestra de 12 pedidos

X B(n=12 , p=0,94)

El rango de X es 0, 1, 2, …, 12

La función de probabilidad f ( x ) es:

f ( x )=P ( X =x )=C 12 x
x 0,94 ( 1−0,94 )
12−x
x=0 , 1, 2 ,... , 12

a. Calcule la probabilidad de que el proveedor entregue 11 pedidos a tiempo.

Solución

La probabilidad pedida es:

12 11 1
P ( X=11 ) =C11 0,94 (1−0,94) =0,3645

c. Calcule el valor esperado del número de pedidos entregados a tiempo.

Solución

El valor esperado es:

E( X)=np=11,28
141
UPC MA444 Estadística
Ejemplo 3

En un proceso de fabricación se produce unidades precoladas con un 1% de unidades defectuosas.


Todos los días se someten a prueba 10 unidades seleccionadas al azar de la producción diaria. Si
existen fallas en una o más de estas unidades se detiene el proceso de producción.

La variable aleatoria X se define X :=¿

El rango de X es 0, 1, 2, …,

n x n−x
f ( x )=P ( X =x )=C x p ( 1−p ) x =0 ,1 , 2 ,... , n

a. ¿Cuál es la probabilidad de encontrar dos unidades defectuosas?

b. ¿Cuál es la probabilidad de encontrar al menos dos unidades defectuosas?

c. ¿Cuál es la probabilidad de detener el proceso?

d. Calcule el valor esperado y el coeficiente de variabilidad del número de unidades no defectuosas.


142
UPC MA444 Estadística

Ejercicios propuestos

40.Un cierto sistema mecánico contiene componentes y se han seleccionado al azar 10. Suponga que
la probabilidad de que cualquier componente individual falle es de 0,07 y que los componentes
fallan independientes unos de otros.

a. Calcule la probabilidad de que falle al menos uno de los componentes.


b. Calcule la probabilidad de que fallen exactamente dos componentes.
c. Calcule la probabilidad de que fallen entre dos y cinco componentes.
d. Obtenga los valores de E( X) y V ( X).
143
UPC MA444 Estadística

Caso: Ferrosa

Ferrosa es una empresa dedica a la venta al por mayor y


menor de artículos de ferretería. Actualmente, la gerencia de
comercialización ha detectado determinados problemas que
están afectando las ventas de la empresa, por lo que, encargó
a un grupo de profesionales realizar un estudio para identificar
dichos los problemas. Analizando la información, se
identificaron los siguientes problemas:

Problema 1
En el área de ventas de la empresa se han detectado reclamos por parte de los clientes que
adquirieron equipos de protección fallados y que serán devueltos. Si la probabilidad que se
devuelvan dos o más equipos en una semana es mayor a 0,35; se recomendará a la gerencia de
comercialización cambiar de proveedor. A continuación, se muestra la siguiente información:

Cantidad de equipos de protección fallados devueltos por semana 1 2 3 4 5


f(x) = P(X = x) 2k 0,42 k 0,20 0,08

¿Qué decisión deberá tomar el gerente de comercialización?

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para identificar Habilidad para Habilidad para Habilidad de
identificar el la variable(s) y elegir las determinar los analizar, comunicar y
problema a herramientas valores de las entender e sustentar la decisión
resolver estadísticas que usará probabilidades interpretar los final en base a los
para resolver el resultados resultados y el
problema análisis

Problema 2
Debido a la globalización y al desarrollo constante de las comunicaciones, los pedidos por internet se
han incrementado últimamente. Un grupo de profesionales de la empresa ha observado que el 25%
de sus clientes realiza sus compras por Internet. Si se eligen al azar 10 clientes y se obtiene que la
probabilidad de que más de tres de ellos realizaron sus compras por Internet supera el 0,2, entonces
se recomendará a la gerencia implementar la promoción de envió de pedidos a domicilio sin ningún
costo.

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para Habilidad para Habilidad para Habilidad de comunicar
identificar el identificar la variable(s) determinar los analizar, y sustentar la decisión
problema a y elegir las herramientas valores de las entender e final en base a los
resolver estadísticas que usará probabilidades interpretar los resultados y el análisis
para resolver el resultados
problema
144
UPC MA444 Estadística
Distribución Poisson
El experimento consiste en realizar el conteo del número X de veces que ocurre un evento en
particular durante una unidad de tiempo, área, volumen, peso, distancia o cualquier otra unidad de
medida dada.

La probabilidad de que un evento ocurra en una unidad dada de tiempo, área, etc.; es la misma para
todas las unidades.

El número de eventos que ocurren en una unidad de tiempo, área, volumen es independiente del
número de los que ocurren en otras unidades.

La variable aleatoria Poisson se define como:

X :=¿ número de veces que ocurre un evento durante un intervalo definido

La función de probabilidad f ( x )de X es:

e−μ μx
f ( x )=P ( X =x )= x=0 , 1 ,2 , 3 , …
x!

donde:

e :=¿ base del sistema de logaritmos neperianos


:=¿ razón promedio de ocurrencia
t :=¿ periodo de evaluación

Notación
La variable aleatoria X sigue una distribución Poisson con parámetro μ y se denota por X P(μ),
donde μ=t

Media
μ= E ( X )=λt

Varianza
σ 2=V ( X )=λt

Para el cálculo de probabilidades de una distribución Poisson en Excel se usa la función:


=POISSON.DIST(x; media = lambda; acumulado = 0).
145
UPC MA444 Estadística
Ejemplo 3
En la inspección del pavimento y asfalto de una carretera recién construida se ha detectado que hay,
en promedio 1,25 baches o fisuras cada cuatro kilómetros. Asumiendo una distribución de Poisson,
determine:

a. La probabilidad de que en el siguiente kilómetro se encuentre dos baches o fisuras.

Solución

Sea X :=¿ número de baches o fisuras cada kilómetro

Calculemos la media μ=t .

¿ 1,25 baches cada 4 km

t=1 km

Por lo tanto,
1,25 baches
μ=t= ×1 km=0,3125
4 km

X P(μ=0,3125)

La función de distribución de la variable Poisson es:

−0,3125 x
e 0,3125
f ( x )=P ( X =x )= x=0 ,1 , 2 ,3 , …
x!

La probabilidad pedida es:


e−0,3125 0,31252
f ( 2 ) =P ( X=2 )= =0,03572
2!

b. La probabilidad de que en los siguientes dos kilómetros se encuentre a lo más tres baches o
fisuras.

Solución

Sea Y :=¿ número de baches o fisuras cada dos kilómetros

Calculemos la media μ=t .

¿ 1,25 baches cada 4 km

t=2 km

Por lo tanto,
146
UPC MA444 Estadística
1,25 baches
μ=t= ×2 km=0,625
4 km

Y P(μ=0,625)

La función de distribución de la variable Poisson es:

−0,625 y
e 0,625
f ( y ) =P ( Y = y )= y=0 , 1 ,2 , 3 , …
y!

La probabilidad pedida es:

P ( X ≤3 )=P ( X=0 )+ P ( X=1 ) + P ( X=2 ) + P ( X =3 )

¿ f ( 0 )+ f ( 1 ) +f ( 2 ) + f ( 3 )

e−0,3125 0,31250 e−0,3125 0,31251 e−0,3125 0,31252 e−0,3125 0,31253


¿ + +
0! 1! 2! 3!

¿ 0,5353+0,3345+ 0,1045+ 0,0218=0,9961

c. El costo de reparación de estos defectos es de 35 dólares por cada bache o fisura detectada.
Calcule el costo esperado al inspeccionar 80 km de esta carretera.

Solución

Sea W :=¿ número de baches o fisuras en 80 kilómetros

Calculemos la media μ=t .

¿ 1,25 baches cada 4 km

t=80 km

Por lo tanto,
1,25 baches
μ=t= ×80 km=25
4 km

W P( μ=25)

Definamos la variable costo C ( X ).

C ( X )=35 X

Calculemos el esperado de la variable costo C ( X ).


147
UPC MA444 Estadística
E ( C ( X ) )=E ( 35 X ) =35 E ( X )=35 ×25=875

Luego, el costo esperado al inspeccionar 80 km de esta carretera es 875 dólares.

Ejemplo 3
En un estudio del tránsito en cierta intersección, se determinó que el número de automóviles que
llegan a un óvalo tiene distribución de Poisson con media igual a tres automóviles por segundo.

a. Calcule la probabilidad de que en dos segundos lleguen al óvalo exactamente dos automóviles.
b. Calcule la probabilidad de que en dos segundos lleguen al óvalo menos de tres automóviles.
c. Calcule la probabilidad de que en los siguientes tres segundos lleguen al óvalo por lo menos dos
automóviles.

Solución

a. Calcule la probabilidad de que en dos segundos lleguen al óvalo exactamente dos automóviles.

Solución

Sea X :=¿ número de automóviles que llegan a un óvalo en dos segundos

Calculemos la media μ=t .

¿ 3 autos cada segundo

t=2 segundos

Por lo tanto:

3 autos
μ=t= ×2 segundos=6
1 segundo

X P(μ=6)

La probabilidad pedida es:

2 −6
6 ×e
P ( X=2 )= =0,0446
2!

b. Calcule la probabilidad de que en dos segundos lleguen al ovalo menos de tres automóviles.

Solución

La probabilidad pedida es:


148
UPC MA444 Estadística
P ( X <3 ) =P ( X=0 )+ P ( X =1 )+ P ( X=2 )=f ( 0 ) + f ( 1 ) + f (2)

6 0 e−6 61 e−6 62 e−6


P ( X <3 ) = + +
0! 1! 2!

P ( X <3 ) =0,0620

c. Calcule la probabilidad de que en los siguientes tres segundos lleguen al óvalo por lo menos dos
automóviles.

Solución

Sea Y :=¿ número de automóviles que llegan a un óvalo en tres segundos

Calculemos la media μ=t .

¿ 3 autos cada segundo

t=3 segundos

Por lo tanto,
3 autos
μ=t= ×3 segundos=9
1 segundo

X P( μ=9)

La probabilidad pedida es:

P ( Y ≥ 2 )=1−P ( Y <2 )=1−[P ( Y =0 ) + P ( Y =1 ) ]

P ( Y ≥ 2 )=1− ( 90 × e−9 91 × e−9


0!
+
1! )
P ( Y ≥ 2 )=1−0,00123=0,9988

Ejemplo 4

Con la finalidad de diseñar un nuevo sistema de control de tráfico, un ingeniero recoge información
sobre el número de automóviles que llegan a una intersección. Por histórico, se sabe que en
promedio llegan cuatro autos a la intersección cada minuto según un proceso de Poisson.

a. ¿Qué probabilidad hay de que en 30 segundos lleguen tres autos?


b. ¿Qué probabilidad hay de que entre las 5:25 pm y 5:28 pm lleguen más de dos autos?
c. Si en un minuto llegaron más de tres autos, ¿cuál es la probabilidad que como máximo sean
cinco los autos que llegaron en ese minuto?
149
UPC MA444 Estadística
Solución

La variable aleatoria X se define X :=¿

X
El rango de X es

La función de probabilidad f ( x) es:

a. ¿Qué probabilidad hay de que en 30 segundos lleguen tres autos?

b. ¿Qué probabilidad hay de que entre las 5:25 pm y 5:28 pm lleguen más de dos autos?

c. Si en un minuto llegaron más de tres autos, ¿cuál es la probabilidad que como máximo sean
cinco los autos que llegaron en ese minuto?

Ejemplo 5
Cierto tipo de azulejo puede tener un número X de puntos defectuosos con media de tres puntos
defectuosos por azulejo. Calcule la probabilidad de que se presenten cinco defectos en un azulejo
elegido al azar.

La variable aleatoria X se define como X :=¿

X
El rango de X es

La función de probabilidad f ( x) es:


150
UPC MA444 Estadística
151
UPC MA444 Estadística
Ejercicios propuestos

41.Debido al calentamiento global, es muy común la presencia de caracoles en las represas debido a
sus aguas estancadas, lo cual hace que se produzcan enfermedades nocivas para el hombre y su
entorno. El número de caracoles presentes en las aguas estancadas sigue una distribución Poisson
con un promedio de 16 caracoles por cinco m 3 de agua.

La OMS establece que si la probabilidad de que haya más de un caracol presente en un m 3 de


agua estancada es mayor a 0,75 se deberá comprar un filtro especial como norma sanitaria. ¿Se
llegará a realizar la compra de dicho filtro?

42.En un estudio del tránsito en cierta intersección, se determinó que el número de automóviles que
llegan a un óvalo tiene distribución de Poisson con media igual a cinco automóviles por segundo.

a. Calcule la probabilidad de que en un segundo lleguen al óvalo más de dos automóviles.


b. Calcule la probabilidad de que en los siguientes diez segundos lleguen al óvalo 40
automóviles.
c. Suponga que el 90% de vehículos que llegan diariamente al óvalo mencionado son de
transporte privado. Para los siguientes cinco días, calcule la probabilidad de que lleguen al
óvalo por lo menos tres vehículos de transporte privado.
152
UPC MA444 Estadística

Caso: Ferrosa

Ferrosa es una empresa dedica a la venta al por mayor y


menor de artículos de ferretería. Actualmente, la
gerencia de comercialización ha detectado algunos
problemas que están afectando las ventas de la
empresa. Los clientes manifiestan que el tiempo que
esperan para pagar los productos es demasiado y
algunos optan por retirase y dirigirse a la competencia,
ocasionando pérdidas significativas para la empresa.

El grupo encargado de la investigación ha revisado la información histórica y determinó que en


promedio llegan a la ferretería 30 clientes cada hora según un proceso de Poisson. La gerencia de
comercialización establece que; si la probabilidad de que lleguen a la ferretería por lo menos tres
clientes en un lapso de cinco minutos es mayor a 0,30; tomará la decisión de ampliar el número de
ventanillas para el pago de productos.

¿La gerencia deberá ampliar el número de ventanillas para el pago de productos?

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para Habilidad para Habilidad para Habilidad de
identificar el identificar la variable(s) determinar los analizar, comunicar y
problema a y elegir las valores de las entender e sustentar la decisión
resolver herramientas probabilidades interpretar los final en base a los
estadísticas que usará resultados resultados y el
para resolver el análisis
problema
153
UPC MA444 Estadística

Variables aleatorias continuas


Función de densidad de una variable continua
Se denomina función de densidad f ¿ ) de una variable aleatoria continua X a la función f(x) integrable
que satisface:

Condición 1
f (x)≥ 0

Condición 2
+∞

∫ f ( x ) dx=1
−∞

Cálculo de una probabilidad usando la función de densidad

b
P ( a ≤ X ≤ b )=∫ f ( x ) dx
a
Para variables continuas se cumple:

P(a ≤ X ≤ b)=P(a< X ≤ b)=P(a ≤ X <b)=P(a< X <b)

Ejemplo 1
Sea k una constante y consideremos la función de densidad de la vida útil, en años, de cierto tipo de
computadora.

{
f ( x )= kx 0≤ x ≤ 2
0 en otro caso

a. Obtenga el valor de k , para que f (x) sea función de densidad.


b. Calcule P(0,5< X <1,8).
c. Calcule P( X > 1).
154
UPC MA444 Estadística
Solución

a. Obtenga el valor de k , para que f (x) sea función de densidad.

Solución

Para que f ( x) sea función de densidad debe satisfacer las siguientes condiciones:

Condición 1
f (x)≥ 0

Para el tramo 0 ≤ x ≤ 2
k x≥0
Por tanto, k debe ser positivo.

Condición 2
+∞

∫ f ( x ) dx=1
−∞

La función tiene el valor 0, fuera del tramo 0 ≤ x ≤ 2; por lo tanto:

∫ kx dx =1
0
Integrando:

( )|
2
2
x
k
2 0
Evaluando en 0 y 2. se tiene:
22 02
k −k =1
2 2

1
k=
2
Reemplazando tenemos:

{
1
x 0 ≤ x ≤2
f ( x )= 2
0 en otro caso

b. Calcule P(0,5< X <1,8).

Solución
La probabilidad pedida es:
155
UPC MA444 Estadística
1,8
1
P ( X >1 )=∫ x dx=0,7475
0,5 2

c. Calcule P( X > 1).

Solución
La probabilidad pedida es:
2
1
P ( X >1 )=∫ x dx=0,75
1 2

Ejemplo 2

El peso, en onzas, de un artículo de gasfitería usado en hogares y oficinas es una variable aleatoria X
con función densidad:

f ( x )= {k ( x−8
0
) 8 ≤ x ≤10
en otro caso

a. Obtenga el valor de k , para que f (x) sea una función de densidad.

b. Calcule la probabilidad que un artículo pese más de nueve onzas.

c. Los artículos con un peso menor a 8,5 onzas son separados. Calcule la probabilidad que un
artículo, seleccionado al azar, sea separado.
156
UPC MA444 Estadística
157
UPC MA444 Estadística
Ejercicios propuestos

43.El gerente de la empresa le informa al departamento de control de calidad que uno de los
principales clientes de la empresa ha exigido que las bombillas LED tengan como mínimo un
tiempo de encendido continuo de 2100 horas. La distribución de densidad del tiempo de
encendido continúo (en miles de horas) que obtuvo la empresa es la siguiente:

f ( x )= {k ( 17−x
0
) 1,8 ≤ x ≤2,2
en otro caso

a. ¿Cuál es la probabilidad de que el departamento de control de calidad pueda cumplir con la


exigencia del cliente?
b. ¿Cuál es la probabilidad de que el tiempo de encendido sea superior a 2000 horas?
158
UPC MA444 Estadística
Función de distribución acumulada

La función de distribución acumulativa F ( x) para una variable aleatoria continua X se define:

x
F (x)=P( X ≤ x )=∫ f ( t ) dt
−∞

Si F (x) es la función de distribución acumulativa para una variable aleatoria continua X , entonces la
función de densidad f ( x) para X es:

dF ( x)
f ( x )=
dx

Para la siguiente probabilidad se cumple que:

P(a < X ≤ b)=F(b)−F(a)

En general, para variables cuantitativas continuas se cumple:

P(a ≤ X ≤ b)=P(a< X ≤ b)=P(a ≤ X <b)=P(a< X <b)

Ejemplo 1
El tiempo, en minutos, que un tren se retrasa es una variable aleatoria continua X con la siguiente
función de densidad:

{
3 2
(25−x ) 0 ≤ x ≤5
f (x)= 250
0 en otro caso

a. Determine la función acumulada F ( X ).


b. Calcule P(X >2) haciendo uso de la función acumulada.
c. Calcule P(1,5< X <3,5) haciendo uso de la función acumulada.

Solución
159
UPC MA444 Estadística

a. Determine la función acumulada F ( X ).

Solución
Para hallar la función acumulada emplearemos la definición de la función de distribución
acumulada F ( x )=P ( X ≤ x ) .

Para el tramo 0 ≤ x<5 , se tiene:

x
F ( x )=P ( X ≤ x ) =∫ f ( t ) dt
−∞

Para el tramo descrito se tiene que:


x
3
F ( x )=∫ ( 25−t 2 ) dt
0 250

)|
x

(
3
3 t
¿ 25 t−
250 3 0

3
75 x−x
F ( x )=
250

Finalmente, la función de distribución acumulada se representa de la siguiente manera:

{
0 x <0
75 x−x 3
F ( x )= 0 ≤ x<5
250
1 x≥5

b. Calcule P(X >2) haciendo uso de la función acumulada.

Solución
La probabilidad pedida es:

P ( X >2 )=1−P( X ≤ 2)

Usando la definición de función de distribución acumulada.

F ( x )=P ( X ≤ x )

P ( X >2 )=1−P ( X ≤ 2 )=1−F ( 2 )


160
UPC MA444 Estadística
3
75 x−x
Reemplazando el valor X = 2 en F ( x)= .
250
3
75 ×2−2
¿ 1− =0,432
250

c. Usando la función acumulada, calcule P(1,5< X <3,5).

Solución
La probabilidad pedida es:

P ( 1,5< X <3,5 ) =F ( 3,5 )−F (1,5 )


3 3
75× 3,5−3,5 75 ×1,5−1,5
¿ − =0,442
250 250

Ejemplo 2
Los sondeos de mercado realizados por un fabricante sobre la demanda de un producto indican que
la demanda proyectada debe considerarse una variable aleatoria X con valores entre 0 y 25
toneladas. La función de densidad de X está dada por:

{
3 2
x 0 ≤ x ≤25
f ( x)= 253
0 en otro caso
a. Construir la función de distribución acumulada de X .

b. ¿Cuál es la probabilidad de tener una demanda entre 10 y 20 toneladas?

c. Calcule la mediana de la variable en estudio e interprete. Use el siguiente esquema para su


representación.
161
UPC MA444 Estadística
162
UPC MA444 Estadística
Ejercicios propuestos

44.El costo de una reparación de conexión domiciliaria, en soles, es una variable aleatoria cuya
función de distribución acumulada es:

{
0 x ≤ 20
x −20
F ( x )= 20< x <30
10
1 x ≥ 30

Calcule e interprete el valor de la mediana.

45.SAP Ingeniería, es una empresa que desarrolla soluciones específicas y busca ofrecer servicios de
telecomunicaciones, independientemente del tamaño y desempeño del sector o actividad
empresarial. De estudios anteriores se conoce que el tiempo de atención de un servicio, en
minutos, para cada tamaño de empresa, se tiene la función de densidad y la función de
distribución acumulada; respectivamente.

Pequeña empresa

{
( 80−x )
0< x <100
( )
f x = 3000
0 en otro caso

Mediana empresa

{
0 x <0
2
90 x
F ( x )= x− 0 ≤ x ≤120
3600 7200
1 x >120

El jefe de producto de telecomunicaciones desea implementar una reingeniería, por lo cual


necesita determinar, para cada tamaño de empresa, la probabilidad de que la atención de un
servicio sea menor a 55 minutos.
163
UPC MA444 Estadística
Esperado de una variable aleatoria continua

Sea X una variable aleatoria continua con función de densidad f ( x), entonces el valor esperado de
X es la siguiente:
+∞
μ= E ( X )= ∫ xf ( x ) dx
−∞

Varianza de una variable aleatoria continua

Sea X una variable aleatoria continua con función de densidad f (x). Entonces, la varianza de X es:

σ 2=V ( X )=E ( ( X−μ )2 )

La fórmula abreviada para el cálculo de la varianza es:

V ( X)=E(X 2 ) – [ E( X )] 2

Donde:

E ( X 2) = ∫ +¿ x 2 f ( x ) dx ¿
−¿¿

Desviación estándar de una variable aleatoria continua


Es la raíz cuadrada positiva de la varianza. La fórmula es la siguiente:

σ =√ σ 2

Coeficiente de variabilidad
Se define como:

σ
CV = × 100 %
μ

Ejemplo 1
El tiempo de anticipación (valores negativos de X ) o retraso (valores positivos de X ) en minutos, de
la llegada de un tren sobre su tiempo establecido, es una variable aleatoria continua X con la
siguiente función de densidad:

{
3
f ( x )= 500
( 25−x 2) −5< x <5
0 otro caso
164
UPC MA444 Estadística

a. Calcule e interprete el valor esperado.


b. Los supervisores de la estación ferroviaria han notado que últimamente los trenes no están
llegando en su hora establecida, para lo cual han fijado como norma que un tren puede llegar en a
lo más± 0,5 σ , donde σ es la desviación estándar. ¿Qué porcentaje de trenes cumplen la norma
fijada?

Solución

a. Calcule e interprete el valor esperado.

Solución

El cálculo del esperado se hace con la siguiente fórmula:

+∞
E ( X ) =∫ x f (x ) x dx
−∞

Como la función es diferente de cero solo en el tramo [-5 ; 5]

+5
3
E ( X ) =∫ x ( 25−x 2 ) dx
−5 500

Reemplazando los valores:

( ) ( )
2 4 2 4
3 25 5 3 25 5
E ( X )= − − + =0
500 2 4 500 2 4

El tiempo promedio de anticipación o retraso que tiene el tren sobre su hora establecida es 0
minutos, es decir llega en promedio puntual.

b. Los supervisores de la estación ferroviaria han notado que últimamente los trenes no están
llegando en su hora establecida, para lo cual han fijado como norma que un tren puede llegar en
a lo más± 0,5 σ , donde σ es la desviación estándar. ¿Qué porcentaje de trenes cumplen la norma
fijada?

Solución

Necesitamos el valor de la desviación estándar σ , por lo tanto, calcularemos la varianza de X ; por


lo tanto, necesitamos calcular E ( X 2) y E ( X ) .

+5
E ( X ) =∫ x f ( x ) dx
2 2

−5
165
UPC MA444 Estadística
+5
2 3
E ( X ) =∫ x ( 25−x 2 ) dx
2

−5 500

+5
3
E ( X )=
2
∫ ( 25 x 2−x 4 ) dx
500 −5

)|
5

(
3 5
3 x x
E ( X )=
2
25 −
500 3 5 −5

( ) ( )
3 5 3 5
3 5 5 3 −5 −5
E ( X 2) = 25 − − 25 +
500 3 5 500 3 5

E ( X 2) =5

La fórmula abreviada para el cálculo de la varianza es:

2 2 2
σ =V (X )=E (X )– [ E( X)]

Luego, el cálculo de la varianza es:

2 2
σ =V ( X )=5−0 =5

Como la desviación estándar σ es la raíz cuadrada de la varianza, se tiene:

σ =√ σ = √5=2,2361
2

La probabilidad de que un tren cumpla la norma fijada es:

P (−0,5 σ ≤ X ≤0,5 σ )

Reemplazando:

P (−0,5 ×2,236 ≤ X ≤0,5 × 2,236 )

¿ P(−1,118 ≤ X ≤1,118)
1,118
3
¿ ∫ 500
( 25−x 2) dx =0,32981
−1,118

Por lo tanto, el 32,981% de los trenes cumplen la norma fijada.


166
UPC MA444 Estadística
Ejemplo 2

El peso, en onzas, de un artículo de gasfitería usado en hogares y oficinas es una variable aleatoria X
con función densidad:

f ( x)=
{k (x−8)
0
8< x ≤ 10
otrocaso

a. Calcule el peso máximo que debe tener un artículo de manera que el 25% de los artículos tengan
pesos menores o iguales a dicho peso.

b. Calcule el valor esperado de la variable en estudio.

c. Calcule la variación relativa.


167
UPC MA444 Estadística
168
UPC MA444 Estadística
Ejercicios propuestos

46.Las utilidades netas, en miles de soles, de los propietarios de stands en una galería comercial es
una variable aleatoria con la siguiente función de densidad:

{
x
0≤ x≤4
f ( x)= 8
0 otro caso

a. ¿Estaría usted en condiciones de afirmar que más de la mitad de los propietarios tiene
utilidades superiores al promedio? Justifique.
b. Calcule la variación relativa de las utilidades.

47.Un estudio realizado por un grupo de ingenieros civiles determinó, que la resistencia a la
compresión en probetas de concreto con materiales propios de una región (en miles de psi), está
determinada por la siguiente función de densidad de probabilidad:

{
2
3x
0< x< 2
20
f ( x )= x
2≤x ≤4
10
0 otro caso

a. Para un proyecto en particular se requiere que la resistencia a la compresión del concreto


sea de por lo menos 3500 psi, ¿qué tan probable cumpla con el requerimiento?
b. Se desea conocer la resistencia mínima del 15% de los bloques de concreto que tienen
mayores resistencias a la compresión.
169
UPC MA444 Estadística

Caso: Proyectos de generación eléctrica

El grupo brasileño Alupar, a través de su subsidiaria La


Virgen S.A.C. está construyendo en Junín la central
hidroeléctrica La Virgen, con una inversión de 107 millones
de soles, la cual tendrá una potencia de 84 MW. Con esta
inversión, la producción de energía eléctrica podría crecer
5% este año.

El grupo tiene registrado a la fecha un total de 280


proyectos de generación eléctrica, de los cuales algunos están en proceso y otros ya culminaron.

Situación: Invertir con el grupo brasileño Alupar en función a las utilidades.

Un inversionista en proyectos de generación eléctrica desea invertir en nuevos proyectos con el


grupo brasileño Alupar, pues se siente atraído por los resultados de las utilidades generadas por
éste en los proyectos culminados.

Para decidir en qué región invertir, el grupo brasileño le muestra al inversionista la función de
densidad y la función de distribución acumulada de la utilidad, en millones de soles, generada por
los proyectos culminados en las regiones costa y sierra.

Las funciones se muestran a continuación:

Función de densidad de la utilidad generada por los proyectos culminados en la región costa

f ( x )= {k ( x−5
0
) 5≤ x ≤ 18
en otro caso

Función de distribución acumulada de la utilidad generada por los proyectos culminados en la


región sierra

{
0 x <7

( )
2
F ( x )= 2 x 7
−4 x + 7 ≤ x ≤20
247 2 2
1 x>20

La decisión de inversión se basará en aquella región (costa o sierra) que tenga mayor probabilidad
de obtener utilidades superiores a 15 millones de soles en proyectos culminados, ¿en qué región
deberá invertirse?
170
UPC MA444 Estadística

Principales distribuciones de variables aleatorias continuas


Distribución exponencial

Función de densidad

Una variable aleatoria X es exponencial con parámetro β >0, si su función de densidad es:

{
−x
1
e β
x≥0
f ( x )= β
0 otro caso

Notación

Si X sigue una distribución exponencial con parámetro β se denota por X exp( ).

Media
μ= E ( X )=β

Varianza
σ 2=V ( X )=β 2

Función de distribución acumulada

La definición de la función de distribución acumulada es:

x
F ( x )=P ( X ≤ x ) =∫ f ( x ) dx
−∞

Como el rango de X es de 0 a + ∞.

x −x −x
1
F ( x )=∫ e β
dx=1−e β

0 β
171
UPC MA444 Estadística

−x
β
F ( x )=1−e

Características

La variable puede tomar valores de 0 a +, no toma valores negativos.

La gráfica es descendente con sesgo a la derecha.

Existe una curva para cada valor de .

La distribución exponencial se usa para describir la vida útil de un dispositivo o tiempo de


funcionamiento hasta que falle y  es el promedio de la vida útil (vida media) del dispositivo.

Ejemplo 1

El tiempo de vida de un componente tiene la siguiente función de densidad:

−x
1 500
f ( x )= e x≥0
500

a. ¿Cuál es la probabilidad de que un componente dure más de 800 días?


b. Calcule el valor de la mediana.

Solución

a. ¿Cuál es la probabilidad de que un componente dure más de 800 días?

Solución

La probabilidad pedida es:

P ( X >800 )

¿ 1−P ( X ≤ 800 )

¿ 1−(1−e )=0,2019
−800
500

b. Calcule el valor de la mediana.

Solución

Por definición de mediana.


P ( X ≤ Me )=0,50
172
UPC MA444 Estadística

F ( Me )=0,50

−x
Usando la función de distribución acumulada F ( x )=1−e β de la variable exponencial tenemos
que:

−Me
(1−e 500 )=0,50

− Me
500
e =0,50

Tomamos logaritmo neperiano en ambos términos de la ecuación:

ln (e )=ln (0,50)
− Me
500

−Me
=ln ( 0,50 )
500

Despejando:

−Me=−0,693× 500

Me=346,5 días

El 50% de los componentes duran 346,5 días o menos.

Ejemplo 2

La duración, en miles de millas, que obtienen los dueños de automóviles con cierto tipo de
neumático es una variable aleatoria con la siguiente función de densidad:

{
−x
1 20
e x ≥0
f ( x)= 20
0 otro caso

a. Calcule la probabilidad de que un neumático dure como máximo diez mil millas.
173
UPC MA444 Estadística

b. Calcule la probabilidad de que un neumático dure entre 16 mil y 24 mil millas.

c. Calcule la probabilidad de que un neumático dure al menos 30 mil millas.


174
UPC MA444 Estadística
Ejercicios propuestos

48.La duración, en minutos, de una conversación telefónica de larga distancia nacional tiene
distribución exponencial con promedio de ocho minutos.

a. ¿Cuál es la probabilidad que una llamada dure entre tres y diez minutos?
b. ¿Cuál es la probabilidad que una llamada dure más de 9 minutos?
c. ¿Cuánto debe durar como mínimo una llamada para estar considerada dentro del 10% de las
de mayor duración?
d. Si la llamada dura más de cinco minutos ¿cuál es la probabilidad de que dure a lo más 8
minutos?

49.Suponga que la vida útil, en horas, de cierta marca de foco electrónico, es una variable aleatoria X
cuya función de densidad de probabilidad es:

{
−x
8000
ce x≥0
f ( x)=
0 otro caso

Calcule el valor de la constante c para que f ( x) sea función de densidad. Si se selecciona un foco
electrónico al azar, calcule la probabilidad de dure más de diez mil horas.

50.La vida, en horas, de un dispositivo electrónico es una variable aleatoria que tiene la siguiente
función de densidad:

{
−x
1 50
e x ≥0
f ( x)= 50
0 otro caso

a. Calcule e interprete la mediana. Si un lote tiene 20 de estos dispositivos, ¿cuántos se


esperaría que duren más que la mediana?
b. Si el dispositivo duró 80 horas, ¿cuál es la probabilidad de que dure 25 horas más?
175
UPC MA444 Estadística
Distribución normal
Esta distribución se aproxima a las distribuciones de frecuencias observadas de muchas medidas
naturales y físicas, como es el caso de pesos, alturas, ventas, vida útil de producción, coeficiente
intelectual, etc.

La curva normal tiene forma de campana y es simétrica con respecto a su media


La media, la mediana y la moda son iguales y se encuentran en x =  y la desviación estándar es .

Función de densidad

La variable aleatoria X es normal si su función de densidad se define de la siguiente manera:

( )
2
−1 x− μ
1 2 σ
f (x)= e −∞ < x <∞
√2π σ

Notación
Si la variable aleatoria tiene distribución normal con parámetros μ y σ 2 se denota:

2
X N (,❑ ).

X :=¿ variable aleatoria de interés


μ ≔media de la distribución
σ ≔desviación estándar de la distribución

Media
E( X)=¿

Varianza
2
V ( X)=❑
176
UPC MA444 Estadística

Distribución normal estándar

 La distribución normal estándar es una distribución de una variable aleatoria continua denotada
con la letra Z , que tiene media 0 y desviación estándar 1.
 Una variable aleatoria con distribución normal se puede convertir en una distribución normal
estándar si se realiza la siguiente transformación, llamada de estandarización o de tipificación.

X−μ
Z=
σ

Notación de una variable normal estándar

Si una variable es normal estándar se denota por:

Z N (0,1)
Ejemplo 1

Si las gráficas son simétricas, ¿qué las diferencia?

Función acumulada de la normal estándar

F (Z )=P(Z ≤ z)

La distribución de la variable Z se encuentra tabulada en la tabla estadística de la normal estándar.


177
UPC MA444 Estadística
178
UPC MA444 Estadística
Tabla de la distribución normal estándar

Área bajo la curva normal P ( Z ≤ z )=α

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233

-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350

-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621

-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275

-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681

-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866

-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854

-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
179
UPC MA444 Estadística
Tabla de la distribución normal estándar

Área bajo la curva normal P ( Z ≤ z )=α

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793

0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891

1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189

1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670

2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361

2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861

3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758

3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
180
UPC MA444 Estadística

La lectura en tabla presenta tres situaciones:

Situación 1 P ( Z ≤ a)

Situación 2 P ( Z >a )=1−P ( Z ≤ a )

Situación 3 P ≤b=P ( Z ≤ b )−P ( Z ≤ a )


181
UPC MA444 Estadística
Ejemplo 1

Calcule las siguientes probabilidades:

a. ¿Cuál es la probabilidad de que Z sea menor a 1,15?

b. ¿Cuál es la probabilidad de que Z sea mayor que 2,01?

c. ¿Cuál es la probabilidad de que Z esté entre –0,13 y 1,05?

d. ¿Cuál será el valor máximo de Z tal que el 15,87% de los valores son menores a Z?
182
UPC MA444 Estadística

e. ¿Cuál será el valor mínimo de Z tal que el 15,87% de los valores son mayores a Z?

Ejemplo 2
Raúl sabe que la gestión del proyecto se mide habitualmente en términos de utilidad, por lo que
analizó la utilidad, en millones de soles, de los proyectos grandes culminados el último año. Sabe,
además, que esta variable tiene distribución normal con media 111,5 millones de soles y desviación
estándar de 25 millones de soles. Si la probabilidad de que un proyecto grande culminado en el
último año genere una utilidad mayor a 112 millones de soles supera a 0,52, no tomará la decisión
de modificar los términos de referencia para invertir en más proyectos grandes caso contrario
modificará los términos de referencia. ¿Qué decisión tomará?

Solución
Definamos la variable:
X :=¿ utilidad, en millones de soles, de los grandes proyectos culminados en el último año

2 2
X N ( μ=111,5; σ =25 )

La probabilidad pedida es:


P ( X >112 )=1−P ( X ≤ 112 )

Estandarizando:

(
¿ 1−P Z <
112−111,5
25 )
¿ 1−P(Z <0,02)=1−0,50798=0,49202

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409

Como la P(X > 112)=0,49202< 0,52, entonces no cumple con lo establecido.

Por lo tanto, sí se tomará la decisión de modificar los términos de referencia para invertir en más
proyectos grandes.
183
UPC MA444 Estadística

Ejemplo 3
Una máquina llena recipientes con determinado producto. Se sabe que el peso de llenado de dicho
producto tiene distribución normal. Se sabe, de acuerdo con los datos históricos, que la media es
20,23 y la desviación estándar de pesos de llenado es de 0,6 onzas.

a. ¿Cuál es la probabilidad de que el peso de llenado sea menor que el promedio?


184
UPC MA444 Estadística

b. ¿Cuál es la probabilidad de que el peso de llenado sea mayor a 21 onzas?

c. Se dice que la máquina funciona correctamente si el peso de llenado del producto está entre
19,03 y 21,43 ¿Qué tan probable es que la máquina no funcione correctamente?

d. ¿Cuál debe ser el tiempo de llenado mínimo para pertenecer al 25% de recipientes con mayor
peso de llenado?
185
UPC MA444 Estadística
Ejercicios propuestos

51. La medición mensual de la contaminación por polvo atmosférico generado por residuos sólidos
de las construcciones y demoliciones de obras es una variable aleatoria distribuida normalmente
con media de 35 toneladas/km 2 y desviación estándar de 15 toneladas/km 2. Si la cantidad
máxima de contaminación aceptable según la norma ambiental es de 25 toneladas/km 2 por mes,
calcule la probabilidad de que la medición del próximo mes reporte un valor no aceptable.

52. Una máquina automática para el llenado de paquetes de arroz puede regularse de modo que la
cantidad media de arroz llenado sea la que se desee. Si la cantidad de arroz depositada se
distribuye normalmente con desviación estándar igual a 10 gramos, ¿cuál debe ser la regulación
media de modo que solo el 1% de los paquetes tengan un peso neto inferior a 990 gramos?

53. En un taller de la Industria Sideromecánica se fabrican árboles de leva para darles uso en
motores de gasolina. Después de investigaciones realizadas se ha llegado a la conclusión de que
la excentricidad de estos árboles de leva es una variable aleatoria normalmente distribuida con
media de 1,02 pulgadas y desviación estándar de 0,44 pulgadas.
a. Calcule la probabilidad que un árbol de leva tenga una excentricidad menor a una pulgada.
b. Calcule la probabilidad que un árbol de leva tenga una excentricidad mayor a 1,05 pulgadas.
c. Calcule el valor máximo para estar en el 30% de los árboles de leva con menor excentricidad.
d. Calcule el valor mínimo para estar en el 20% de los árboles de leva con mayor excentricidad.

54. La duración de las llamadas telefónicas en una empresa se modela con una variable normal con
media de 130 segundos y desviación estándar de 30 segundos. Calcule la probabilidad que una
llamada dure entre 90 y 170 segundos.

55. Un foco tiene una duración distribuida normalmente con una media de 7000 horas y una
desviación estándar de 1000 horas. Un competidor ha inventado un nuevo foco LED con una
duración distribuida normalmente con una media de 7500 horas y una desviación estándar de
1200 horas. ¿Cuál foco tiene mayor probabilidad de tener una duración mayor que 9000 horas?

56. Un contratista de construcción afirma que elaborar un proyecto demora en promedio 35 horas
de trabajo y el 97,5% de los proyectos demandan como máximo 38,92 horas. Considerando que
los tiempos para completar proyectos similares se distribuyen normalmente.
a. ¿Cuál es la probabilidad de que un proyecto demande menos de 32 horas?
b. Si el contratista demora más de 48 horas deberá devolver 2% del costo de dicho proyecto; si
en cambio demora menos de 29,5 horas, recibirá un incentivo de 5% del costo del proyecto,
¿cuánto esperaría recibir de incentivo?

57. Un fabricante de televisores asegura que el tiempo medio de funcionamiento sin fallas de los
aparatos es de dos años con una desviación estándar de 0,25 años. El tiempo de vida de los
aparatos sigue una distribución normal.
a. ¿Cuál es la probabilidad de que el tiempo de buen funcionamiento sea menor que 2,5 años?
b. Determine la probabilidad de que el tiempo de funcionamiento este entre 1 año y 1,75 años.
c. El fabricante garantiza que remplazará gratis cualquier aparato de televisión cuya duración
sin fallas sea menor que k años. Calcular k de tal modo que sólo el 1% de los aparatos
vendidos tenga que ser reemplazado.
186
UPC MA444 Estadística
187
UPC MA444 Estadística

Caso: Cemento Tumbo

Cemento Tumbo es una empresa con más de 50 años de


experiencia y vende productos de alta calidad para el
sector de la construcción. Entre sus principales
productos tenemos el cemento tipo I, II, V, que se
venden en bolsas de papel de 42,5 kilos y a granel.

La empresa cree que es bueno brindar productos de alta


calidad para mantenerse en el sitial en que se encuentra,
por lo que desea tener la certeza de que sus productos
cumplan con las especificaciones técnicas que promocionan.

El área de producción ha decidido incorporar un insumo en la elaboración de cemento que abarataría


los costos de producción, por lo que ahora la cantidad de cemento en un m 2 de concreto
premezclado de techo aligerado es una variable aleatoria que se distribuye normalmente, con media
0,31 m3 y desviación estándar 0,08 m3.

Enterado de esto, el jefe de control de calidad desea saber si el nuevo producto cumple con las
normas técnicas que indican que, por cada metro cuadrado de techo, la cantidad de cemento en
concreto premezclado debe tener un volumen entre 0,21 m 3 y 0,41 m3 y tomará la decisión de enviar
un reporte a la gerencia general pidiendo que se detenga la producción si la probabilidad de que no
se cumpla con la norma técnica es mayor a 0,10. ¿Qué decisión tomará?

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para identificar Habilidad para Habilidad para Habilidad de
identificar el la variable(s) y elegir las determinar los analizar, comunicar y sustentar
problema a herramientas estadísticas valores de las entender e la decisión final en
resolver que usará para resolver probabilidades interpretar los base a los resultados y
el problema resultados el análisis
188
UPC MA444 Estadística

Unidad 3. Inferencia estadística

Logro
Al terminar la unidad, el estudiante modela la relación entre dos variables para dar respuesta a un
problema en un contexto real donde implique la predicción o la generalización.

Temario
 Muestreo aleatorio simple
 Tamaño de muestra
 Prueba de hipótesis: para la media y para la proporción poblacional
 Prueba de hipótesis para dos varianzas y dos medias poblacionales
 Análisis de varianza de un factor
 Regresión lineal simple

Bibliografía
 Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 7.1 pág. 248-
250.
 Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 261.
 Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 9 pág. 364-
369.
 Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 295 – 307.
 Estadística. Mario Triola. 11a. Edición. Pearson Educación, México 2013 519.5 TRIO/E 2013
capitulo 7. pág. 297.
 Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 10 (pág. 386-
395) Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 375 – 388.
 Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 375 - 388.
189
UPC MA444 Estadística

Conceptos básicos
Unidad elemental
Es el objeto sobre el cual se hace la medición. También llamada unidad de observación, unidad de
análisis, unidad estadística o elemento. Por ejemplo, en estudios de poblaciones humanas, con
frecuencia ocurre que la unidad elemental es cada individuo.

Población muestreada
Es el conjunto de todas las unidades elementales posibles que podrían extraerse en una muestra; es
decir, es la población de donde se extrae la muestra.

Unidad de muestreo
Es la unidad donde realizamos la muestra. Por ejemplo, si queremos estudiar a las personas, pero no
tenemos la lista de todos los individuos que pertenecen a la población objetivo, la unidad de
muestreo sería cada familia y la unidad elemental sería cada individuo que vive en la familia .

Marco muestral
Es una lista de las unidades de muestreo que están disponibles para elección.

Para las encuestas telefónicas el marco de muestreo podría ser una lista de todos los números
telefónicos residenciales de la ciudad; para las entrevistas personales una lista de las direcciones de
todas las calles; para una encuesta de agricultura una lista de todas las granjas o un mapa con todas
las áreas que contienen granjas.

Censo
Es una investigación estadística que consiste en el recuento de la totalidad de los elementos que
componen la población por investigar. Es necesario que se especifique el espacio y el tiempo al que
se refiere el recuento.
Por ejemplo, el 22 de octubre del 2017 se realizaron los Censos Nacionales 2017: XII de Población, VII
de Vivienda y III de Comunidades Indígenas. Su finalidad es proveer información sobre la
composición, distribución geográfica y crecimiento de la población, los patrones de la concentración
urbana y rural, las características y servicios básicos de la vivienda para la ejecución de las políticas
públicas.

Muestreo
Cuando se opta por una investigación usando una muestra en vez de la población, el estudio
estadístico comprende por lo menos cuatro etapas:

1. Definición de la población objetivo y búsqueda del marco muestral.


2. Determinación del tamaño de la muestra.
3. Selección de las unidades.
4. Registro de las observaciones.

En el curso trabajaremos las dos últimas.


 La selección de las unidades y
190
UPC MA444 Estadística
 El registro de las observaciones

Por ejemplo, la Asociación Peruana de Empresas de Investigación realizaba una encuesta para
determinar el nivel socioeconómico de una persona. Hoy en día, ya no encuesta, sino más bien usa la
Encuesta Nacional de Hogares (ENAHO) realizada por el Instituto Nacional de Estadística e
Informática (INEI).

Niveles socioeconómicos en Lima Metropolitana y Callao


Ficha técnica
Universo de estudio
 Se consideró como universo de estudio a todos los hogares pertenecientes
a Lima Metropolitana entendida como los distritos de Lima ubicados en el
núcleo urbano (sin considerar balnearios) y la Provincia Constitucional del
Callao. Se definió como hogar, al conjunto de personas que, habitando en la
misma vivienda, preparan y consumen sus alimentos en común.
 La persona informante fue el jefe de familia, definido como aquella persona que
más aporta económicamente en el hogar.

Marco muestral
Para el desarrollo de la investigación se consideró como marco muestral:
 La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI).
 Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de
mayor crecimiento de la ciudad (conos)
Tamaño de la muestra
 Se entrevistó a un total de 3 598 hogares distribuidos en 41 distritos.
 El margen de error máximo probable con un nivel de confianza del 95,1% y considerando el
máximo de dispersión (p = q = 0,5) fue de ± 1,63%.
 Dentro de esta muestra se realizaron 200 entrevistas en Distritos con predominio de los N.S.E.
Muy Alto/Alto con el propósito de obtener una submuestra estadísticamente significativa para
este segmento.
 El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de cada
uno de los distritos de Lima Metropolitana.
Selección de la muestra
 Determinada la cantidad de entrevistas a aplicar por distrito, se
procedió a sortear tantas manzanas como entrevistas se
requerían.
 Dentro de cada manzana se seleccionó por un sistema aleatorio simple cinco viviendas: una
vivienda titular y cuatro viviendas suplentes. Los hogares titulares fueron visitados hasta en tres
oportunidades antes de proceder al reemplazo. Se controló que la tasa de reemplazo no
excediera el 10% del total de entrevistas originalmente sorteadas.
191
UPC MA444 Estadística

Muestreo probabilístico

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de


equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser seleccionadas.

Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra


extraída y son, por tanto, los más recomendables.

Dentro de los métodos de muestreo probabilísticos encontramos al muestreo simple aleatorio:

Muestreo aleatorio simple


Se selecciona una muestra en forma aleatoria y sin
reemplazo a n unidades de muestreo de una
población que contiene un total de N unidades. Se
garantiza que cada una de las muestras posibles
tiene la misma probabilidad de ser elegida.

Muestreo simple aleatorio


Se seleccionarán los elementos del marco muestral que conformarán la muestra aplicando la técnica
de muestreo simple aleatorio.

El procedimiento consiste en seleccionar una muestra de tamaño n en forma aleatoria y sin


reemplazo de una población que contiene un total de N unidades elementales. Se garantiza que cada
una de las muestras posibles tiene la misma probabilidad de ser elegida.

Los pasos son los siguientes:


 Enumere las unidades del marco muestral con números sucesivos.
 Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra.
 La selección de las unidades se realiza sin reemplazo.
 Para elegir a los elementos de la población, que formarán parte de la muestra, se hará uso de
una tabla llamada tabla de números aleatorios.

El muestreo aleatorio simple presenta dos propiedades:


 Equiprobable: Cada unidad tiene las mismas posibilidades de ser elegida.
 Independencia: La selección de una unidad no influye en la selección de otras unidades.

Pero en el mundo real es difícil encontrar muestras completamente independientes y


representativas. Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al
azar es un método no representativo pues no tiene en cuenta a los votantes que no disponen de
teléfono o cuenta varias veces a los que tienen varios números telefónicos.
192
UPC MA444 Estadística
Uso de la tabla de números aleatorios
Para usar la tabla de números aleatorios:

 Los números se eligen de arriba hacia abajo en las columnas seleccionadas.


 Las columnas se usan en el orden dado, no se reordenan.
 No es necesario usar todas las columnas.
 Las columnas que se usarán serán las necesarias hasta completar el tamaño de muestra
requerido.

Ejemplo 1

Por ejemplo, en un problema nos dicen que elijamos las columnas C 10, C7, C5 y C16.

 Si el tamaño de la población N = 87, esto implica que el número mayor 87 tiene dos cifras
significativas.

La primera columna elegida será C10 y usaremos una columna adicional a la derecha para
completar la cantidad de dígitos que tiene la población. Es decir, usaremos C 10C11 para elegir
números del 1 al 87 inclusive sin reemplazo.

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6

 Si el tamaño de la población N = 550, esto implica que el número mayor 550 tiene tres cifras
significativas.

La primera columna elegida será C10 y usaremos dos columnas adicionales a la derecha para
completar la cantidad de dígitos que tiene la población. Es decir, usaremos C 10C11C12 y elegir
números del 1 al 550 inclusive sin reemplazo.

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
193
UPC MA444 Estadística
194
UPC MA444 Estadística

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
195
UPC MA444 Estadística
Ejemplo 2

Una empresa de tiene un total de 150 empleados y ha registrado información acerca de las variables:
ingreso mensual, en soles (Ingreso) y años cumplidos en la empresa (Años).

Marco muestral: Trabajadores registrados


Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años
1 2300 5 39 2600 16 77 1800 3 115 1700 3
2 2800 11 40 2700 18 78 1700 5 116 2600 19
3 2400 4 41 2100 11 79 1700 4 117 1600 1
4 2500 2 42 2300 14 80 1700 0 118 1800 6
5 2300 3 43 1700 0 81 1700 1 119 2100 10
6 2100 2 44 2200 13 82 2100 6 120 1700 0
7 1700 2 45 2900 20 83 2600 17 121 2400 16
8 2000 0 46 1800 5 84 2400 9 122 2600 17
9 2200 7 47 2100 16 85 2600 19 123 2100 10
10 2100 4 48 2000 12 86 1900 7 124 2100 8
11 1700 0 49 2000 12 87 1600 0 125 2400 17
12 2500 2 50 2900 20 88 1900 3 126 1700 1
13 2800 13 51 2100 13 89 2100 14 127 2600 20
14 2400 9 52 2100 9 90 1700 0 128 2400 16
15 1700 1 53 1800 1 91 2100 15 129 2700 17
16 2400 9 54 2000 9 92 1700 1 130 2100 12
17 2200 10 55 2100 10 93 2300 14 131 1600 0
18 2200 4 56 1900 4 94 2500 16 132 2100 15
19 2300 10 57 2000 10 95 2600 18 133 1900 5
20 2800 11 58 2300 11 96 1900 3 134 2100 12
21 2100 7 59 2000 7 97 2500 19 135 2200 12
22 1700 1 60 1700 1 98 1800 6 136 2400 13
23 2500 6 61 1900 6 99 1700 2 137 1800 4
24 2400 9 62 2000 9 100 2000 10 138 2600 17
25 2700 17 63 2400 17 101 2400 16 139 2700 20
26 1700 0 64 1700 0 102 1700 0 140 2500 16
27 1600 2 65 1700 2 103 2500 12 141 2500 16
28 2600 17 66 2400 17 104 1700 3 142 1900 6
29 2500 13 67 2500 13 105 2400 17 143 2100 15
30 2500 16 68 2600 16 106 2400 16 144 1700 9
31 2700 17 69 2100 14 107 1900 7 145 1500 0
32 1700 1 70 1900 7 108 1700 1 146 1800 18
33 1600 1 71 2000 9 109 2100 6 147 2100 10
34 2400 11 72 1800 7 110 2000 5 148 2700 19
35 1900 3 73 2100 10 111 2000 3 149 1800 9
36 1800 5 74 2300 12 112 2500 13 150 2100 15
37 1800 3 75 2700 20 113 1700 0
38 2400 14 76 2800 20 114 2500 19

a. Seleccione una muestra de 16 trabajadores usando muestreo simple aleatorio. Elabore un listado
con el número seleccionado y el valor del ingreso mensual y años en la empresa. Use las
columnas C2, C7, C11 y C9 de la tabla de números aleatorios.
b. Con la muestra, estime e interprete las medidas de tendencia central para el ingreso mensual.
c. Con la muestra, estime e interprete el cuartil 1 para la variable años en la empresa.
196
UPC MA444 Estadística

Solución

a. Elabore un listado con el número seleccionado y el valor del ingreso mensual y años en la
empresa:

Posición
Ingreso mensual
Años en la empresa

Posición
Ingreso mensual
Años en la empresa

b. Con la muestra obtenida estime e interprete las medidas de tendencia central para la variable
ingreso mensual.

Medidas Valor Interpretación

Media

Mediana

Moda

c. Con la muestra obtenida estime e interprete los cuartiles para la variable años en la empresa.

Años en la empresa

Años en la empresa

Medidas Valor Interpretación

Cuartil 1

Ejemplo 3
El siguiente marco muestral muestra la información del total de usuarios de internet de una
determinada zona de un distrito de la ciudad capital. Las variables analizadas fueron las siguientes:
 Marca de computadora portátil
 Principales problemas con Internet
197
UPC MA444 Estadística
 Número de computadoras con Internet en casa
 Tiempo de navegación diaria en Internet (en minutos)

Marca de Número de Tiempo de navegación


Usuario Principales problemas
computadora computadoras diaria (min)
1 HP Saturación de la red 1 94,00
2 Dell Saturación de la red 1 74,45
3 IBM Saturación de la red 3 104,89
4 HP Saturación de la red 3 125,53
5 Dell Saturación de la red 3 123,97
6 HP Saturación de la red 4 134,66
7 Otra marca Saturación de la red 2 56,33
8 HP Saturación de la red 2 95,32
9 HP Saturación de la red 2 121,90
10 Lenovo Saturación de la red 2 78,27
11 Lenovo Saturación de la red 2 86,20
12 Apple Saturación de la red 2 66,19
13 Lenovo Saturación de la red 2 63,06
14 Dell Saturación de la red 1 80,45
15 Dell Saturación de la red 1 84,53
16 Apple Saturación de la red 1 57,64
17 HP Saturación de la red 1 88,64
18 HP Saturación de la red 3 91,92
19 Apple Saturación de la red 3 102,7
20 Apple Baja velocidad en la señal 3 92,69
21 Lenovo Baja velocidad en la señal 3 93,46
22 HP Baja velocidad en la señal 3 92,60
23 Dell Baja velocidad en la señal 4 126,85
24 HP Baja velocidad en la señal 2 98,29
25 Lenovo Baja velocidad en la señal 2 96,28
26 Apple Baja velocidad en la señal 1 89,74
27 Apple Baja velocidad en la señal 1 139,44
28 HP Baja velocidad en la señal 1 117,31
29 HP Baja velocidad en la señal 1 147,51
30 Otra marca Baja velocidad en la señal 3 86,90
31 Otra marca Baja velocidad en la señal 3 133,23
32 IBM Baja velocidad en la señal 4 67,75
33 Apple Baja velocidad en la señal 2 110,78
34 Apple Baja velocidad en la señal 2 118,04
35 Dell Baja velocidad en la señal 4 138,38
36 Dell Baja velocidad en la señal 2 98,31
37 Apple Baja velocidad en la señal 1 89,52
38 IBM Baja velocidad en la señal 1 113,50
39 HP Baja velocidad en la señal 1 92,37
40 Otra marca Baja velocidad en la señal 1 115,15
41 HP Baja velocidad en la señal 1 131,22
42 HP Calidad y durabilidad del modem 2 125,81
43 HP Calidad y durabilidad del modem 2 130,02
44 HP Calidad y durabilidad del modem 3 83,74
45 IBM Calidad y durabilidad del modem 2 133,69
46 IBM Calidad y durabilidad del modem 1 129,39
47 Lenovo Calidad y durabilidad del modem 1 111,01
198
UPC MA444 Estadística
48 Lenovo Lentitud para subir información 1 103,69
49 Lenovo Lentitud para subir información 1 121,70
50 Apple Lentitud para subir información 2 151,81
51 Apple Lentitud para subir información 2 125,43
52 Apple Lentitud para subir información 2 116,00
53 Dell Lentitud para subir información 3 139,41
54 Dell Lentitud para subir información 2 129,52
55 Dell Lentitud para subir información 1 127,74
56 Dell Lentitud para subir información 2 120,89
57 Dell Lentitud para subir información 3 126,33
58 Otra marca Lentitud para subir información 3 118,44
59 Otra marca Otros 1 113,04
60 Otra marca Otros 2 114,44
61 Lenovo Otros 1 119,66
62 Dell Otros 1 145,52

a. Se desea seleccionar una muestra de 10 usuarios de internet usando muestreo simple aleatorio.
Use las columnas C15, C1 y C8 de la tabla de números aleatorios para indicar la posición del
elemento seleccionado. Indique, además, el principal problema del usuario con Internet y el
tiempo diario de navegación, en minutos.

Posición

Problema

Tiempo (min.)

b. Con la muestra obtenida, estime el porcentaje de usuarios cuyo principal problema de Internet
es la baja velocidad en la señal.

c. Con la muestra obtenida, estime e interprete las medidas de tendencia central para el tiempo
diario de navegación.
199
UPC MA444 Estadística

Ejemplo 4

Telecom es una empresa que brinda soluciones integrales


en infraestructura de telecomunicaciones. Cuenta con más
de 12 años de experiencia y ha participado en diferentes
proyectos con los principales operadores y fabricantes de
equipos del sector, junto a un equipo de ingenieros,
técnicos y consultores de larga trayectoria profesional,
nacional e internacional.

La empresa está interesada en saber si existe una alta rotación de su personal, debido a ello, el
departamento de Recursos Humanos ha hecho un censo. Los resultados se muestran a continuación:

Marco muestral
Número Permanencia Grado de Remuneración
Posición Sexo Motivo de cese
de hijos (meses) instrucción bruta (soles)
1 M 0 26 Titulado 5000 Renuncia voluntaria
2 M 1 10 Titulado 12075 Renuncia voluntaria
3 M 0 11 Titulado 3000 Renuncia voluntaria
4 F 0 3 Titulado 1500 Renuncia voluntaria
5 M 0 2 Titulado 800 Renuncia voluntaria
6 M 0 28 Titulado 3000 Renuncia voluntaria
7 F 1 12 Post grado 5575 Renuncia voluntaria
8 F 1 32 Técnico completa 2000 Renuncia voluntaria
9 F 0 1 Técnico completa 2700 Renuncia voluntaria
10 F 0 0 Técnico completa 2575 Renuncia voluntaria
11 M 0 52 Titulado 12000 Renuncia voluntaria
12 F 0 0 Titulado 2000 Renuncia voluntaria
13 F 1 1 Titulado 3575 Renuncia voluntaria
14 M 0 15 Titulado 1500 Renuncia voluntaria
15 F 2 55 Post grado 5000 Renuncia voluntaria
16 F 0 2 Post grado 7500 Renuncia voluntaria
17 F 0 7 Titulado 2500 Renuncia voluntaria
18 F 1 1 Técnico completa 1500 Renuncia voluntaria
19 F 2 1 Post grado 4400 Renuncia voluntaria
20 F 2 10 Técnico completa 1985 Renuncia voluntaria
21 F 0 1 Titulado 3000 Renuncia voluntaria
22 F 0 5 Técnico completa 2200 Renuncia voluntaria
200
UPC MA444 Estadística
23 F 2 3 Técnico completa 2300 Renuncia voluntaria
24 F 0 20 Titulado 3085 Renuncia voluntaria
25 F 0 2 Técnico completa 1885 Renuncia voluntaria
26 F 2 23 Post grado 15085 Renuncia voluntaria
27 F 0 20 Titulado 3085 Renuncia voluntaria
28 F 0 2 Técnico completa 1885 Renuncia voluntaria
29 F 0 1 Técnico completa 1500 Renuncia voluntaria
30 F 0 1 Técnico completa 1500 Renuncia voluntaria
31 F 0 2 Técnico completa 1800 Renuncia voluntaria
32 F 0 2 Técnico completa 1800 Renuncia voluntaria
33 F 0 2 Titulado 2585 Renuncia voluntaria
34 F 0 3 Técnico completa 3000 Renuncia voluntaria
35 F 2 49 Post grado 6085 Renuncia voluntaria
36 M 0 33 Titulado 1800 Renuncia voluntaria
37 F 0 3 Técnico completa 950 Renuncia voluntaria
38 F 0 0 Técnico completa 1700 Renuncia voluntaria
39 F 0 0 Titulado 850 Renuncia voluntaria
40 F 0 6 Titulado 2800 Renuncia voluntaria
41 M 0 58 Titulado 2200 Renuncia voluntaria
42 F 1 26 Post grado 7000 Renuncia voluntaria
43 F 0 18 Titulado 1500 Renuncia voluntaria
44 M 0 7 Titulado 2000 Renuncia voluntaria
45 F 2 9 Titulado 3885 Renuncia voluntaria
46 F 1 9 Post grado 4585 Renuncia voluntaria
47 M 0 22 Titulado 1800 Renuncia voluntaria
48 F 0 41 Titulado 3300 Renuncia voluntaria
49 F 1 1 Titulado 2085 Renuncia voluntaria
50 F 1 3 Post grado 8085 Renuncia voluntaria
51 M 0 16 Post grado 1500 Renuncia voluntaria
52 F 0 2 Técnico completa 1200 Renuncia voluntaria
53 F 0 6 Titulado 2085 Renuncia voluntaria
54 F 0 5 Post grado 20000 Renuncia voluntaria
55 F 0 46 Técnico completa 2300 Renuncia voluntaria
56 M 0 10 Técnico completa 2000 Renuncia voluntaria
57 F 0 8 Técnico completa 2000 Término de contrato
58 F 0 1 Técnico completa 1500 Término de contrato
59 F 0 4 Técnico completa 1585 Término de contrato
60 F 0 7 Técnico completa 2300 Término de contrato
61 F 0 16 Técnico completa 1700 Término de contrato
62 F 0 7 Titulado 3000 Término de contrato
63 F 0 18 Titulado 1500 Término de contrato
64 M 0 19 Titulado 1500 Término de contrato
65 F 0 1 Técnico completa 2200 Término de contrato
66 F 1 1 Técnico completa 2500 Término de contrato
67 M 0 1 Técnico completa 2000 Término de contrato
68 F 0 14 Técnico completa 1200 Término de contrato
69 F 2 1 Titulado 2875 Término de contrato
70 M 0 1 Titulado 2000 Término de contrato
71 F 2 15 Titulado 2800 Término de contrato
72 F 1 2 Técnico completa 1600 Término de contrato
73 F 0 16 Técnico completa 2200 Término de contrato
74 F 0 25 Técnico completa 2800 Término de contrato
201
UPC MA444 Estadística
75 F 0 8 Titulado 3500 Término de contrato
76 F 1 4 Titulado 2300 Término de contrato
77 F 0 3 Titulado 4085 Término de contrato
78 F 0 16 Titulado 1585 Término de contrato
79 F 0 1 Técnico completa 1500 Término de contrato
80 F 2 4 Técnico completa 2000 Término de contrato
81 F 2 4 Técnico completa 2500 Término de contrato
82 F 2 38 Titulado 2500 Término de contrato
83 F 2 19 Titulado 2000 Término de contrato
84 F 2 59 Post grado 4085 Término de contrato
85 F 2 9 Titulado 2500 Término de contrato

a. Se desea seleccionar una muestra de 11 trabajadores usando muestreo simple aleatorio. Use las
columnas C13, C14 y C5 de la tabla de números aleatorios para indicar la posición del elemento
seleccionado. Indique, además, el motivo del cese y el número de hijos de cada trabajador.

Posición
Motivo
Número de hijos
Remuneración bruta

b. Con la muestra obtenida, estime el porcentaje de trabajadores cuyo motivo de cese fue por
renuncia voluntaria y el porcentaje de trabajadores que tienen hijos.

c. Con la muestra obtenida, estime e interprete el valor del cuartil 3 para la variable remuneración
bruta, en soles.

d. Con la muestra obtenida, estime e interprete el valor de las medidas de tendencia central para la
variable remuneración bruta, en soles.
202
UPC MA444 Estadística
203
UPC MA444 Estadística

Tamaño de muestra para estimar la media de una población

Al iniciar cualquier investigación, la pregunta que surge es:

 ¿Cómo podemos determinar el tamaño óptimo de una muestra?


 ¿Bastará con aplicar un cuestionario a 100 personas?
 ¿Será necesario encuestar a 500 individuos?
 ¿Cómo influye la variabilidad de las respuestas de cada encuestado?
 ¿Qué margen de error tendrán los resultados hallados en la encuesta?

La respuesta a cada una de estas preguntas nos la da la Estadística. A la hora de determinar el


tamaño que debe alcanzar una muestra hay que tener en cuenta: el parámetro a estimar, el margen
de error o error de estimación, la varianza poblacional y el nivel de confianza.

Margen de error
Es la diferencia entre un estadístico y su parámetro correspondiente. Nos da una idea clara de hasta
dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se
hubiera obtenido por medio de un censo completo. Un estadístico será más preciso cuando su error
sea más pequeño.

Nivel de confianza
Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al verdadero
valor del parámetro.

Varianza poblacional
Cuando una población es más homogénea la varianza es menor y el número de entrevistas
necesarias será más pequeño. Cuando no se dispone del valor de la varianza de la población, ésta
puede ser estimada a partir de una muestra preliminar o piloto.

La fórmula para determinar el tamaño de muestra n es:

(( ))
2
Z α
.s
1−
2
n=
e

Si la población es finita; es decir, se conoce el tamaño de la población N, el tamaño de la muestra se


corrige con la siguiente fórmula:
n
n c=
n
1+
N

El muestreo se ilustrará con el siguiente esquema:


204
UPC MA444 Estadística
205
UPC MA444 Estadística

Se tiene una población de tamaño N

Marco muestral: N trabajadores registrados

Se registran las N unidades elementales en el


marco muestral.

Para realizar la estimación del promedio, es necesario determinar, en primer lugar, ¿a cuántas
unidades elementales debemos entrevistar?

Si se conoce el tamaño de la población N, el tamaño


Establecemos un nivel de confianza, un de la muestra se corrige con la siguiente fórmula:
margen de error y estimamos la desviación ݊
estándar de la variable en estudio. La ݊௖ ൌ ݊
fórmula es la siguiente: ͳ൅ ܰ
‫ ݏ‬ଶ
‫ݖ‬ቀଵିఈቁ ൈ

݊ൌ
൭ ൱
݁

Para seleccionar a las n unidades elementales usaremos muestreo aleatorio simple. La tabla de números
aleatorios nos permitirá seleccionar a estos elementos.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4

Una vez obtenida la muestra, realizar la


estimación
206
UPC MA444 Estadística
Ejemplo 1

Se tiene una población de 108 trabajadores de una empresa y se desea estimar el tiempo promedio
de servicio a partir de una muestra elegida al azar por muestreo aleatorio simple.

N = 108 trabajadores

Si queremos estimar el tiempo


promedio, en años, que tienen los
trabajadores en la empresa, ¿a
cuántos trabajadores debemos
entrevistar?

( )
2
z ×s
n= (1−¿2 ) = 9,8 = … trabajadores
e

n=…

Para seleccionar la muestra de trabajadores


mediante muestreo aleatorio simple, usar
las columnas: C12, C5, C10 de la tabla de
números aleatorios

Una vez obtenida la muestra,


¿qué le preguntaremos a cada
unidad elemental?

Posición
Trabajador (en la tabla de números X= …
aleatorios)
1
2
3
4
5
6
7
8
9
10
Promedio
207
UPC MA444 Estadística

Marco muestral: Trabajadores registrados


Nº Ingreso Tiempo   Nº Ingreso Tiempo   Nº Ingreso Tiempo
1 2300 5   37 2600 16   73 1800 3
2 2800 11   38 2700 18   74 1700 5
3 2400 4   39 2100 11   75 1700 4
4 2500 2   40 2300 14   76 1700 0
5 2300 3   41 1700 0   77 1700 1
6 2100 2   42 2200 13   78 2100 6
7 1700 2   43 2900 20   79 2600 17
8 2000 0   44 1800 5   80 2400 9
9 2200 7   45 2100 16   81 2600 19
10 2100 4   46 2000 12   82 1900 7
11 1700 0   47 2000 12   83 1600 0
12 2500 2   48 2900 20   84 1900 3
13 2800 13   49 2100 13   85 2100 14
14 2400 9   50 2100 9   86 1700 0
15 1700 1   51 1800 1   87 2100 15
16 2400 9   52 2000 9   88 1700 1
17 2200 10   53 2100 10   89 2300 14
18 2200 4   54 1900 4   90 2500 16
19 2300 10   55 2000 10   91 2600 18
20 2800 11   56 2300 11   92 1900 3
21 2100 7   57 2000 7   93 2500 19
22 1700 1   58 1700 1   94 1800 6
23 2500 6   59 1900 6   95 1700 2
24 2400 9   60 2000 9   96 2000 10
25 2700 17   61 2400 17   97 2400 16
26 1700 0   62 1700 0   98 1700 0
27 1600 2   63 1700 2   99 2500 12
28 2600 17   64 2400 17   100 1700 3
29 2500 13   65 2500 13   101 2400 17
30 2500 16   66 2600 16   102 2400 16
31 2700 17   67 2100 14   103 1900 7
32 1700 1   68 1900 7   104 1700 1
33 1600 1   69 2000 9   105 2100 6
34 2400 11   70 1800 7   106 2000 5
35 1900 3   71 2100 10   107 2000 3
36 1800 5   72 2300 12   108 2500 13

Tabla de números aleatorios


208
UPC MA444 Estadística
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
209
UPC MA444 Estadística
Tabla de la distribución normal estándar

Área bajo la curva normal: P ( Z ≤ z )=α


Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240

0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214

1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408

1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169

2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361

2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861

3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758

3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
210
UPC MA444 Estadística
Ejemplo 2

El jefe de la Oficina de Seguridad del distrito de San Martín de Porres desea realizar una estimación
de cuánto tiempo, en promedio, estarían dispuestos a permanecer en las charlas sobre rondas
vecinales los vecinos del distrito. En estudios anteriores se estimó que el tiempo medio era de 45,25
minutos con una varianza de 18,75 minutos 2, ¿A cuántas personas se debería entrevistar si se estima
un error máximo de 1,25 minutos y un nivel de confianza del 95%? Suponga que esta variable se
distribuye normalmente.

Solución

El margen de error e es: e = 1,25 minutos

La desviación estándar muestral es: s = √ 18,75=4,33 minutos

Como el nivel de confianza es el 95% entonces ( 1−α )=0,95. Por lo tanto, α = 0,05.

Luego, se tiene que:

α 0,05
1− =1− =0,975.
2 2

Buscamos dentro de la tabla el valor más cercano a 0,975 y desde este valor salimos a los bordes de
la tabla.

Z
El valor de (1− α2 )en la tabla normal estándar es Z 0,975=1,96.
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169

Entonces, reemplazando en la fórmula:

(( ) )
2
Z α
×s
1−
2
n=
e

( )
2
1,96 × 4,33
n=
1,25

n=46,09

El valor del tamaño de muestra se redondea siempre al entero mayor, por lo tanto, se necesita
seleccionar a una muestra de 47 vecinos del distrito de San Martin de Porres.
211
UPC MA444 Estadística
Ejemplo 3

¿Cuál debe ser el tamaño de muestra si se desea estimar el tiempo promedio, en horas, que
demoran los estudiantes en llegar a la universidad con un nivel de confianza del 94% y con un error
de estimación de 0,1 horas? Una muestra piloto de 8 alumnos arrojó los siguientes resultados:

2,0 1,5 0,45 1,45 1,0 0,30 1,20 1,30

¿Qué tamaño de muestra deberá seleccionar?

Ejemplo 4

La gerencia de un diario local desea estimar el gasto promedio mensual que las familias destinan a la
compra de diarios. La gerencia desea que sus resultados tengan un nivel de confianza del 95% y un
error de estimación no mayor a tres soles. Si la desviación estándar de los gastos en compra de
diarios en una muestra piloto fue de 20 soles ¿Qué tamaño de muestra deberá seleccionar?
212
UPC MA444 Estadística
Ejercicios propuestos

58. Se desea realizar una encuesta para estimar el número promedio de amigos que los jóvenes
tienen en su cuenta de Facebook. Con un error de estimación de cinco amigos y con un nivel de
confianza del 95%, determine el tamaño de muestra adecuado si en una muestra piloto se
obtuvo que el valor de la desviación estándar del número de amigos es igual a 42. Rpta:
272

59. El jefe de la oficina de seguridad del distrito de San Borja desea realizar una estimación de
cuánto tiempo, en promedio, estarían dispuestos a permanecer los vecinos escuchando charlas
sobre seguridad vecinal. En estudios anteriores se estimó que el tiempo promedio era de 45,25
minutos con una varianza de 18,75 minutos 2. ¿A cuántas personas se debería entrevistar si se
estima un error máximo de un minuto y una confianza del 95%? Suponga que esta variable se
distribuye normalmente. Rpta:
73

60. La máquina de refrescos de una universidad está ajustada de tal manera que la cantidad de
líquido despachada se distribuye aproximadamente en forma normal. ¿Qué tan grande se
requiere que sea la muestra si se desea tener una confianza de 98% de que su media muestral
esté dentro de 0,05 centilitros del promedio real? Se cuenta con la siguiente información de una
muestra preliminar o piloto de tamaño 24. Rpta:
60

1,99 1,98 2,04 1,97 2,18 2,04 2,13 2,03 2,08 2,72 2,04 2,09
2,11 2,13 2,14 1,98 2,29 2,02 1,94 1,82 2,02 2,10 2,19 2,13

61. Una editorial desea evaluar la media muestral del tiempo de distribución de su último best seller
en cada uno de sus 400 puntos de venta. Para este estudio se desea tener un error de
estimación de tres minutos con un nivel de confianza del 90%. Además, se sabe que la
desviación estándar de los tiempos de distribución es de 17 minutos. ¿Qué tamaño de muestra
debe emplearse para el estudio?
Rpta: 72
213
UPC MA444 Estadística

Caso: Cemento Tumbo

La empresa Cemento Tumbo considera que el tiempo de


secado del cemento tipo II es un factor muy importante en
las grandes edificaciones como puentes, túneles, represas,
etc. El encargado de control de calidad desea estimar el
tiempo promedio de secado del cemento tipo II.

Asumiendo un margen de error de 1,5 minutos y un nivel de


confianza de 95%, ¿cuántas bolsas de cemento deberá seleccionar para llevar a cabo dicha
estimación?

Para obtener la desviación estándar tomará una muestra piloto de ocho bolsas del almacén mediante
muestreo simple aleatorio.

Use las columnas C7, C11, C15 de la tabla de números aleatorios.

Considere que el marco muestral es el siguiente:

N° Tiempo N° Tiempo N° Tiempo N° Tiempo


1 40 8 43 15 41 22 35
2 47 9 36 16 44 23 42
3 47 10 38 17 42 24 42
4 40 11 47 18 47 25 45
5 38 12 39 19 43 26 37
6 37 13 50 20 41 27 49
7 37 14 50 21 38 28 43
214
UPC MA444 Estadística

Prueba de hipótesis
La prueba de hipótesis involucra una suposición acerca de un parámetro de la población. Después se
toma una muestra para ver si la hipótesis podría ser correcta. La hipótesis que contrastamos se llama
hipótesis nula ( H 0). La hipótesis nula se contrasta con la hipótesis alternativa ( H 1).

Luego, a partir de los resultados obtenidos de la muestra, o bien rechazamos la hipótesis nula a favor
de la alternativa, o bien no rechazamos la hipótesis nula y suponemos que nuestra estimación inicial
del parámetro poblacional podría ser correcta.

El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta. Significa simplemente que
los datos de la muestra son insuficientes para inducir un rechazo de la hipótesis nula.

Contraste de hipótesis
La hipótesis que se contrasta es rechazada o no en función de la información muestral. La hipótesis
alternativa se especifica como opción posible si se rechaza la nula.

Tipos de errores

Información muestral
No rechazar H0 Rechazar H0
H0 es cierta No hay error Error tipo I
La realidad
H0 es falsa Error tipo II No hay error

Error tipo I
Ocurre cuando se rechaza una hipótesis H 0 que es verdadera. La probabilidad de cometer error tipo I
viene a ser la probabilidad de rechazar H 0 cuando ésta es cierta.

P ( Cometer error tipo I )=P ( Rechazar Ho/Ho es cierta )=α

El valor  es fijado por la persona que realiza la investigación. Por lo general, 1%, 5% o 10%

Error tipo II
Ocurre cuando se acepta una hipótesis H 0 que es falsa, la probabilidad de cometer error tipo II es la
probabilidad de no rechazar H0 cuando ésta es falsa.

P ( Cometer error tipo II ) =P ( No rechazar Ho/Ho es falsa )=β

Debido a que el valor real del parámetro es desconocido este error no puede ser fijado.
215
UPC MA444 Estadística
Pasos para realizar una prueba de hipótesis

Paso 1

Plantear las hipótesis: la hipótesis nula, Ho y la hipótesis alterna, H 1

Paso 2

Fijar el nivel de significancia, 

Paso 3

Calcular el estadístico de la prueba o valor calculado

Paso 4

Presentar la gráfica y obtener los valores críticos

Paso 5

Aplicar los criterios de decisión

Paso 6

Concluir
216
UPC MA444 Estadística
Prueba de hipótesis para una media con varianza poblacional desconocida
1. Plantear las hipótesis

Prueba unilateral izquierda Prueba bilateral Prueba unilateral derecha


¿ H 0 :μ ≥ μ0 ¿ H 0 :μ=μ0 ¿ H 0 :μ ≤ μ0
¿ H 1 : μ< μ 0 ¿ H 1: μ ≠ μ0 ¿ H 1 : μ> μ 0

2. Fijar el nivel de significación .


3. Calcular el valor del estadístico de la prueba. El estadístico sigue una distribución t Student.

X−μ 0
T= t n−1 gl
S
√n
La tabla t Student necesita los datos: probabilidad (cola) y grados de libertad ( gl=n−1).

4. Establecer las regiones críticas.

H 1 : μ< μ 0
Unilateral izquierda

Bilateral H 1 : μ ≠ μ0

Unilateral derecha H 1 : μ> μ 0

5. Aplicar los criterios de decisión: Rechazar H 0 o no rechazar H0.


6. Realizar la conclusión.
217
UPC MA444 Estadística
218
UPC MA444 Estadística
Ejemplo 1

Para la siguiente prueba de hipótesis bilateral, establezca la región crítica.

1. Plantear las hipótesis.


H 0 : μ=5
H 1 : μ ≠5

2. Fijar el nivel de significación .


¿ 0,05

3. Estadístico de la prueba: Distribución t Student

Tamaño de muestra: n=10

La tabla t Student necesita los siguientes datos: probabilidad y grados de libertad ( gl )

t(probabilidad, gl ) = t(…………. , ……..…..) = ……………………… (con todos los decimales)

Probabilidad (cola):

Grados de libertad: ( gl=n−1)

Bilateral H 1 : μ ≠ μ0
219
UPC MA444 Estadística
Ejemplo 2

La lucha contra el COVID-19 también se lleva a cabo con el uso de la tecnología. Esta vez, se ve
desarrollada en robots que ayudan a desinfectar habitaciones de hospitales y centros médicos. Este
robot usa lámparas germicidas de irradiación ultravioleta (UVGI). La clave de este robot para que
funcione de manera autónoma está en el software que registra la máquina vía wifi en el servidor del
centro médico. Con el uso de este robot, todas las estancias hospitalarias quedan libres de cualquier
virus, pues con este método destruye tanto el ADN como el ARN que es donde justamente se
encuentra la programación genética de los virus y bacterias.

La clínica El Porvenir desea adquirir estos equipos para la desinfección de sus áreas. Pero el jefe de
adquisiciones sospecha que el promedio de los datos consumidos por el robot del modelo ASEPT-2X
es de 20 GB. Para confirmar esta suposición eligió una muestra de 10 robots de este modelo. Los
datos se presentan a continuación:

16 16 20 19 18 16 22 19 23 22

De confirmarse la sospecha, pedirá un lote previo de cinco robots con el fin de no congestionar la red
inalámbrica de la clínica. Use un nivel de significación es α =¿ 0,05.

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Define la Determina Establece las regiones Presenta un informe
problemática, variable, el correctamente críticas con el (los) sobre la problemática
señalando parámetro, la el valor del valor(es) crítico(s) que se deseaba
claramente el técnica estadístico de correcto(s). Fundamenta resolver, dando
objetivo del caso. estadística y prueba. correctamente la respuesta al objetivo.
presenta las decisión estadística y la
hipótesis. conclusión.

Solución

Usemos las cinco dimensiones del razonamiento cuantitativo.

Interpretación

Determinar si se debe adquirir un lote previo de cinco robots con el fin de no congestionar la red
inalámbrica de la clínica

Representación

Definamos la variable en estudio.

X ≔cantidad de datos consumidos diariamente por el robot (en gigabytes)

Definamos el parámetro en estudio.


μ ≔media poblacional
220
UPC MA444 Estadística
Herramienta estadística: Prueba de hipótesis para la media poblacional

Plantear las hipótesis.


H 0 : μ=20
H 1 : μ ≠20
Fijar el nivel de significación
α =0,05

Cálculo
El valor del estadístico de prueba es:

x −μ o 19,1−20
t c= = =−1,076
s 2,644
√n √10
La prueba es bilateral pues H 1 : μ ≠ μ0.

-2,26216 2,26216

 

0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
6 0.26483 0.55338 0.90570 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743 6
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948 7
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539 8
9 0.26096 0.54348 0.88340 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.57380 2.82144 3.24984 9
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927 10

Análisis
Como t c =−1,076>−2,26216 ; entonces no se rechaza H0. Con un nivel de significación del 5%, es
posible afirmar que el consumo promedio de los datos que usan los robots es igual a 20 GB.

Argumentación
El jefe de adquisiciones sí deberá adquirir el lote previo de cinco robots del modelo ASEPT-2X.
221
UPC MA444 Estadística
Tabla de la distribución t-Student

Área bajo la curva P ( T ≥ c )=α

  
0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1 0.32492 0.72654 1.37638 1.96261 3.07768 6.31375 7.91582 10.57889 12.7062 15.89454 21.20495 31.82052 63.65674 1
2 0.28868 0.61721 1.06066 1.38621 1.88562 2.91999 3.31976 3.89643 4.30265 4.84873 5.64278 6.96456 9.92484 2
3 0.27667 0.58439 0.97847 1.24978 1.63774 2.35336 2.60543 2.95051 3.18245 3.48191 3.89605 4.54070 5.84091 3
4 0.27072 0.56865 0.94096 1.18957 1.53321 2.13185 2.33287 2.60076 2.77645 2.99853 3.29763 3.74695 4.60409 4
5 0.26718 0.55943 0.91954 1.15577 1.47588 2.01505 2.19096 2.42158 2.57058 2.75651 3.00287 3.36493 4.03214 5
6 0.26483 0.55338 0.90570 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743 6
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948 7
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539 8
9 0.26096 0.54348 0.88340 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.57380 2.82144 3.24984 9
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927 10
   
11 0.25956 0.53994 0.87553 1.08767 1.36343 1.79588 1.92843 2.09614 2.20099 2.32814 2.49066 2.71808 3.10581 11
12 0.25903 0.53862 0.87261 1.08321 1.35622 1.78229 1.91231 2.07644 2.17881 2.30272 2.46070 2.68100 3.05454 12
13 0.25859 0.5375 0.87015 1.07947 1.35017 1.77093 1.89887 2.06004 2.16037 2.2816 2.43585 2.65031 3.01228 13
14 0.25821 0.53655 0.86805 1.07628 1.34503 1.76131 1.8875 2.04617 2.14479 2.26378 2.4149 2.62449 2.97684 14
15 0.25789 0.53573 0.86624 1.07353 1.34061 1.75305 1.87774 2.03429 2.13145 2.24854 2.39701 2.60248 2.94671 15
16 0.25760 0.53501 0.86467 1.07114 1.33676 1.74588 1.86928 2.02400 2.11991 2.23536 2.38155 2.58349 2.92078 16
17 0.25735 0.53438 0.86328 1.06903 1.33338 1.73961 1.86187 2.01500 2.10982 2.22385 2.36805 2.56693 2.89823 17
18 0.25712 0.53382 0.86205 1.06717 1.33039 1.73406 1.85534 2.00707 2.10092 2.21370 2.35618 2.55238 2.87844 18
19 0.25692 0.53331 0.86095 1.06551 1.32773 1.72913 1.84953 2.00002 2.09302 2.20470 2.34565 2.53948 2.86093 19
20 0.25674 0.53286 0.85996 1.06402 1.32534 1.72472 1.84433 1.99371 2.08596 2.19666 2.33624 2.52798 2.84534 20
   
21 0.25658 0.53246 0.85907 1.06267 1.32319 1.72074 1.83965 1.98804 2.07961 2.18943 2.32779 2.51765 2.83136 21
22 0.25643 0.53208 0.85827 1.06145 1.32124 1.71714 1.83542 1.98291 2.07387 2.18289 2.32016 2.50832 2.81876 22
23 0.25630 0.53175 0.85753 1.06034 1.31946 1.71387 1.83157 1.97825 2.06866 2.17696 2.31323 2.49987 2.80734 23
24 0.25617 0.53144 0.85686 1.05932 1.31784 1.71088 1.82805 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694 24
25 0.25606 0.53115 0.85624 1.05838 1.31635 1.70814 1.82483 1.97010 2.05954 2.16659 2.30113 2.48511 2.78744 25
26 0.25595 0.53089 0.85567 1.05752 1.31497 1.70562 1.82186 1.96651 2.05553 2.16203 2.29581 2.47863 2.77871 26
27 0.25586 0.53065 0.85514 1.05673 1.3137 1.70329 1.81913 1.96320 2.05183 2.15782 2.29091 2.47266 2.77068 27
28 0.25577 0.53042 0.85465 1.05599 1.31253 1.70113 1.81659 1.96014 2.04841 2.15393 2.28638 2.46714 2.76326 28
29 0.25568 0.53021 0.85419 1.0553 1.31143 1.69913 1.81424 1.95729 2.04523 2.15033 2.28217 2.46202 2.75639 29
30 0.25561 0.53002 0.85377 1.05466 1.31042 1.69726 1.81205 1.95465 2.04227 2.14697 2.27826 2.45726 2.75000 30
   
31 0.25553 0.52984 0.85337 1.05406 1.30946 1.69552 1.81000 1.95218 2.03951 2.14383 2.27461 2.45282 2.74404 31
32 0.25546 0.52967 0.85300 1.05350 1.30857 1.69389 1.80809 1.94987 2.03693 2.14090 2.27120 2.44868 2.73848 32
33 0.25540 0.5295 0.85265 1.05298 1.30774 1.69236 1.80629 1.9477 2.03452 2.13816 2.26801 2.44479 2.73328 33
34 0.25534 0.52935 0.85232 1.05248 1.30695 1.69092 1.80461 1.94567 2.03224 2.13558 2.26501 2.44115 2.72839 34
35 0.25528 0.52921 0.85201 1.05202 1.30621 1.68957 1.80302 1.94375 2.03011 2.13316 2.26219 2.43772 2.72381 35
36 0.25523 0.52908 0.85172 1.05158 1.30551 1.6883 1.80153 1.94195 2.02809 2.13087 2.25953 2.43449 2.71948 36
37 0.25518 0.52895 0.85144 1.05117 1.30485 1.68709 1.80012 1.94024 2.02619 2.12871 2.25702 2.43145 2.71541 37
38 0.25513 0.52883 0.85118 1.05077 1.30423 1.68595 1.79878 1.93863 2.02439 2.12667 2.25465 2.42857 2.71156 38
39 0.25508 0.52871 0.85094 1.05040 1.30364 1.68488 1.79751 1.93711 2.02269 2.12474 2.25240 2.42584 2.70791 39
40 0.25504 0.52861 0.85070 1.05005 1.30308 1.68385 1.79631 1.93566 2.02108 2.12291 2.25027 2.42326 2.70446 40
222
UPC MA444 Estadística
Ejemplo 3

Se sabe que el rendimiento promedio (en porcentaje) de un proceso químico es 12. Sin embargo,
últimamente se observa muchos valores menores. Para comprobar que efectivamente el
rendimiento promedio ha disminuido, se toma una muestra aleatoria de un lote de materia prima y
se registra las siguientes observaciones:

9,7 12,8 8,7 13,4 8,3 11,7 10,7 8,1 9,1 10,5

Suponiendo normalidad y a partir de la información muestral, verifique si efectivamente el


rendimiento promedio ha disminuido. Use α = 0,04.
223
UPC MA444 Estadística
Ejercicios propuestos

62. Las bombillas LED poseen un rendimiento promedio luminoso superior a todas las tecnologías
existentes. La empresa Solari afirma que el rendimiento luminoso de las bombillas LED que
produce es de 70 lumens/watio. Sin embargo, debido a la competencia en el mercado, introduce
nuevos cambios en su tecnología con la finalidad de lograr un mejor rendimiento.

Para poder comprobar los nuevos resultados, toma una muestra aleatoria de 61 bombillas
actuales, sometiéndolas a pruebas rigurosas, obteniendo un promedio de 75 lumens/watio y
una desviación estándar de 6,8 lumens/watio. Con un nivel de significación del 4%, ¿Se puede
afirmar que los nuevos cambios mejoraron el rendimiento promedio luminoso de las bombillas
LED?

63. Cierto fabricante de motocicletas anuncia en un comercial de televisión que su vehículo rendirá
en promedio 87 millas por galón. Los millajes (recorrido en millas) en ocho viajes prolongados
fueron:

88 82 81 87 80 78 79 89

Al nivel de significación del 5% ¿el millaje medio es menor que el anunciado?

64. La densidad de ciertos fluidos es muy volátil por lo que se requiere que la densidad promedio
sobrepase al valor de 0,031 para poder utilizarlo. La empresa 3C Ingenieros, encargada de
realizar los análisis fisicoquímicos, debe evaluar la densidad de la sustancia XP90.

Para estos fines se seleccionó aleatoriamente 10 muestras de distintos lotes de producción y se


registró la densidad. Los datos se muestran a continuación:

0,033 0,040 0,031 0,034 0,036 0,031 0,036 0,034 0,034 0,032

¿La empresa 3C Ingenieros recomendará usar la sustancia XP90? Use un α = 0,02.

65. Una de las últimas innovaciones en el campo de la iluminación es el proyector de cabeza móvil.
Este proyector está compuesto por un foco halógeno que permite variar la intensidad luminosa.
El gerente de ventas de la empresa Visual Systems ha decidido este año exportar este novedoso
proyector si la intensidad luminosa promedio de estos proyectores es superior a 2600 lúmenes.

Al seleccionar 12 proyectores y medir la intensidad luminosa de cada proyector se obtuvieron


los siguientes datos:

2600 2800 3000 2000 2400 2800 2700 2600 3000 3200 3100 2500
Suponiendo que la intensidad luminosa tiene distribución normal ¿Visual Systems deberá decidir
realizar la exportación del lote? Use un nivel de significación de 3%.

66. Según las últimas investigaciones en hidrografía, los ingenieros civiles usan actualmente
telémetros de láser manuales de bajo peso debido a su gran precisión al momento de realizar
una medición.
224
UPC MA444 Estadística
Un ingeniero civil de una importante constructora está encargado de analizar la eficiencia de
una marca de estos aparatos, por lo que decide realizar pruebas con este equipo, obteniendo los
siguientes resultados del error de lectura, en milímetros, en la localización de un objeto situado
a 500 metros.

5,1 5,4 4,9 5,2 5,4 5,1 5,3 5,0 4,8

La calibración de un telemetro juega un papel muy importante en la exactitud de una medida. Si,
en promedio, los errores de lectura sobrepasan los 5 mm, estaríamos en una sobreestimación de
la lectura, por lo que debería ser devuelto al laboratorio de calibración para su ajuste. Usando la
información de la muestra ¿el telémetro debería ir al laboratorio de recalibración? Use un nivel
de significación del 4%.

67. Los drones tienen un accesorio en su fabricación llamado acelerómetro. Este accesorio registra
las variaciones de aceleración o velocidad en el aire. La norma de la Agencia Estatal de Seguridad
Aérea indica que la velocidad promedio que debe alcanzar un dron en áreas urbanas no debe
sobrepasar los 20,5 metros/segundo. Por lo tanto, ante la sospecha que no se está cumpliendo
con la norma, se seleccionaron al azar 42 drones y se realizó una prueba para medir sus
velocidades. A continuación, se presentan los resultados:

Distribución de drones probados según velocidad registrada


Velocidad (metros/segundo) Número de drones probados
[14,5 – 16,5] 7
]16,5 – 18,5] 9
]18,5 – 20,5] 14
]20,5 – 22,5] 8
]22,5 – 24,5] 4

¿Se puede afirmar que no se está cumpliendo con la norma? Use un nivel de significancia del 1%.
225
UPC MA444 Estadística

Caso: Aceros Perú

Aceros Perú es una empresa siderúrgica con más de 40 años de


experiencia, vende productos de alta calidad para los sectores
de la construcción, industria y minería. Entre sus principales
productos de producción tenemos las barras de acero
corrugado ASTM A615-grado 60 con diferentes medidas de
producción.

Últimamente, se están importando productos siderúrgicos de


diferentes partes del mundo, razón por la cual el jefe del área
de Control de Calidad desea conocer el estado real de los diferentes productos que comercializa para
establecer hitos de control. Para ello, hará una investigación minuciosa teniendo en cuenta las
siguientes variables: longitud (metros), resistencia a la tracción (kg/cm 2), diámetro (cm), peso (kg).

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Define la variable, Determina Grafica las regiones Presenta un informe
problemática, el parámetro, la correctamente críticas con el (los) valor sobre la
señalando técnica el valor del (es) crítico (s) correcto (s). problemática que se
claramente el estadística y estadístico de Fundamenta deseaba resolver,
objetivo del presenta las prueba. correctamente la decisión dando respuesta al
caso. hipótesis. estadística y la conclusión. objetivo.

Objetivo: Determinar si se regularán las máquinas cortadoras de acero.

El jefe de Control de calidad ordena realizar el estudio de la longitud de las barras de acero ASTM
A615-grado 60, las cuales deben tener una longitud estándar de nueve metros. Según reclamos, los
clientes manifiestan que la longitud es menor a dicho valor. De ser cierto, procederá a regular las
máquinas cortadoras de las barras de acero. Para ello, seleccionó una muestra aleatoria de 20 barras
de acero ASTM A615- grado 60. Con 5% de significación, ¿se procederá con la regulación de las
máquinas cortadoras de barras de acero? Utilice las cinco dimensiones para la solución del caso.

8,90 8,91 8,92 8,93 8,93 8,94 8,95 8,95 8,97 8,98
8,99 8,99 8,99 9,01 9,02 9,02 9,03 9,04 9,05 9,06
226
UPC MA444 Estadística
Prueba de hipótesis para una proporción poblacional
1. Plantear las hipótesis.

Prueba unilateral izquierda Prueba bilateral Prueba unilateral derecha


H 0 : p ≥ p0 H 0 : p= p0 H 0 : p ≤ p0
H 1 : p< p 0 H 1 : p ≠ p0 H 1 : p> p 0

2. Fijar el nivel de significación. α

3. Calcular el estadístico de la prueba.


^p − po
Z= Z( 0,1)

√ p o (1− p o)
n

4. Establecer las regiones críticas.

Unilateral izquierda H 1 : p< p 0

Bilateral H 1 : p ≠ p0

Unilateral derecha H 1 : p> p 0

5. Aplicar las reglas de decisión: Rechazar H 0 o no rechazar H0.

6. Realizar la conclusión.
227
UPC MA444 Estadística
228
UPC MA444 Estadística
Ejemplo 1
Kubick S.A. es una empresa que fabrica y comercializa termas de uso doméstico e industrial. Debido a
los constantes reclamos presentados por los clientes sobre el mal funcionamiento de las termas a
gas, el ingeniero de planta sostiene que el porcentaje de unidades defectuosas producidas debe ser a
lo más 4%. Si esto no se cumple, se implementará un programa de capacitación a los trabajadores. A
partir de una muestra aleatoria de 150 termas a gas donde se encontró que 12 de ellas están
defectuosas. Usando un nivel de significación del 4%, ¿se llevará a cabo el programa de capacitación?

Solución
Interpretación
Determinar si se implementará un programa de capacitación para los trabajadores.

Representación
Variable: Funcionamiento de las termas a gas (buen funcionamiento, mal funcionamiento)
Parámetro: Proporción poblacional de terma a gas con mal funcionamiento
Herramienta: Prueba de hipótesis de la proporción

H0 p ≤ 0,04
H1 p>0,04

El valor hipotético p0 es 0,04.

El nivel de significación es 4% es decir, α = 0,04.

Cálculo
La proporción muestral de terma a gas con mal funcionamiento es:

12
^p= =0,08
150

El valor del estadístico de prueba es:

^p −p 0 (0,08−0,04)
Z= = =2,5

√ p 0 ( 1− p0 )
n √ 0,04(1−0,04)
150

La prueba es unilateral derecha pues H 1 : p> 0,04.

1,75
229
UPC MA444 Estadística

Análisis
Como Z calc = 2,5 > Z crítico = 1,75; se rechaza H0.

Conclusión
Con un nivel de significación del 4% es posible afirmar que el porcentaje de termas a gas defectuosas
es mayor al 4%.

Argumentación
Se sugiere implementar un programa de capacitación para los trabajadores de las plantas de la
empresa Kubick.

Ejemplo 2
El jefe de control de calidad de Whitney Motor está preocupado porque las máquinas de controlador
electrónico de motor (CEM), que fabrican, no se les ha dado el mantenimiento programado, y supone
que el porcentaje de CEMs con algún defecto de fabricación es superior a 20%. De ser cierta su
suposición, deberá detener el proceso de producción y realizar mantenimiento a dichas máquinas.
Para comprobarlo se seleccionó una muestra de 55 CEMs. Los resultados obtenidos del estado de
fabricación se presentan a continuación:

Distribución de CEMs según su estados de fabricación

Defectuoso
13

Normal
42

Fuente: Whitney Motor

¿Qué decisión tomará el jefe de control de calidad? Use un nivel de significación del 5%.

Solución
Interpretación

Determinar si el jefe de control de calidad no deberá detener el proceso de producción y realizar un


mantenimiento a dichas máquinas.

Representación

Variable: estado de fabricación (defectuoso, normal)


Parámetro: proporción poblacional de CEMs con algún defecto de fabricación
230
UPC MA444 Estadística
Herramienta: prueba de hipótesis para la proporción

H0 p ≤ 0,20
H1 p>0,20

El nivel de significación es 4% es decir, α = 0,04.

Cálculo

La proporción muestral de CEMs con algún defecto de fabricación es:

13
^p= =0,2364
55

El valor del estadístico de prueba es:

^p −p 0,2364−0,20
Z= = =0,6749

√ p (1− p)
n √ 0,20(1−0,20)
55

Análisis

La prueba es unilateral derecha, pues H 1 : p> 0,20.

1,65

Como Z calc=¿ 0,6749 < Z critico = 1,65; no se rechaza H0. Con un nivel de significancia de 5%, no es
posible afirmar que el porcentaje de CEMs con algún defecto de fabricación es superior al 20%.

Argumentación

El jefe de control de calidad no deberá detener el proceso de producción y realizar mantenimiento a


dichas máquinas.
231
UPC MA444 Estadística

Ejemplo 3

La Municipalidad de Lima ampliará el presupuesto para fiscalizar las obras de la ciudad de Lima si
más del 30% de estas obras no cumplen o cumplen parcialmente con las normas de seguridad y
acabados en las obras de construcción civil. Al selecciona al azar una muestra de 94 obras de la
ciudad se obtuvo el siguiente gráfico:

Distribución de obras de la ciudad de Lima según el cumplimiento


de las normas de seguridad
70 64
Número de obras

60
50
40
30 22
20
8
10
0
No cumplen Cumplen parcialmente Cumplen totalemnte

Cumplimiento de las normas de seguridad


Fuente: Municipalidad de Lima

Con un nivel de significación del 2% y asumiendo normalidad, ¿la Municipalidad de Lima ampliará el
presupuesto para fiscalizar las obras de construcción civil de la ciudad?
232
UPC MA444 Estadística

Ejemplo 4

Un fabricante sostiene que al menos el 95% de los equipos que envía a una fábrica está acorde con
las especificaciones técnicas. Una revisión de una muestra de 200 piezas reveló que 18 estaban
defectuosas. Asumiendo normalidad, pruebe la afirmación del fabricante al nivel de significancia de
1%.
233
UPC MA444 Estadística

Ejercicios propuestos

68. El fabricante de un nuevo controlador de errores de comunicación asegura que la proporción de


procesos en los que se pierden datos cuando su controlador está operando es menor de 0,10. A
fin de probar esta aseveración, se vigila el enlace de comunicación entre una terminal de
gráficos y una computadora con el controlador de errores funcionando. En una muestra de 300
elementos se observó que en 10 de ellos sí se perdieron datos cuando el controlador del
fabricante estaba operando. ¿La información recolectada refuta la aseveración del fabricante?
Use un nivel de significancia del 3%.

69. El jefe del área de Gestión Ambiental de la Municipalidad de Lima recomendará a la


Municipalidad de Los Olivos reformular el plan de segregación de residuos sólidos domiciliarios
si más del 51% de las viviendas de este distrito generan residuos de composición de materia
orgánica. Para ello se seleccionaron al azar 80 viviendas del distrito. Con un nivel de significancia
del 4%, ¿los resultados sustentan la recomendación del jefe del área de Gestión Ambiental de la
Municipalidad de Lima?

70. Una encuestadora realizó una consulta a los pobladores de la urbanización Lomas para saber si
están de acuerdo o no con la construcción de un nuevo centro comercial en el lugar. Al
seleccionar una muestra al azar de 250 pobladores de dicha urbanización, se obtuvo que 85 de
ellos apoyaban la construcción del nuevo centro comercial. La construcción empezará solo si
más del 30% de los ciudadanos apoyan el proyecto, de lo contrario se debe optar por otras
234
UPC MA444 Estadística
urbanizaciones vecinas. Realice la prueba estadística respectiva a un nivel de significación del
3%.

71. Los usuarios de la sustancia XP90 indican que cuando esta sustancia no es óptima ocurre un
fenómeno conocido como licuefacción y se requiere un reproceso. La certificadora, encargada
de la realización de los análisis fisicoquímicos, asegura que la proporción de reprocesos
disminuye cuando la sustancia está certificada por lo tanto una de las metas de la empresa es
tener más del 20% de sustancias certificadas. De una muestra de 120 reprocesos se identificó
que 26 usaron sustancias certificadas. En base a esta información podemos afirmar que ¿la
empresa ha logrado la meta? Use un nivel de significación del 3%.
235
UPC MA444 Estadística
Prueba de hipótesis para la razón de varianzas poblacionales
1. Plantear las hipótesis

2 2
¿ H 0 : σ 1=σ 2
¿ H 1 : σ 21 ≠ σ 22

2. Fijar el nivel de significación: α

3. Calcular el estadístico de la prueba.

2
S1 1
F c= 2
. 2
F (n −1 , n −1 )
S 2 σ2 1 2

2
σ1

4. Establecer las regiones críticas.

Donde:
1
F 1=
F (α ¿¿ 2; n −1 , n −1¿ )¿ ¿
2 1

F 2=F(¿ α )¿
; n 1−1 , n 2−1
2

5. Aplicar las reglas de decisión: Rechazar H 0 o no rechazar H0.

6. Realizar la conclusión.
236
UPC MA444 Estadística
Ejemplo 1

La producción de compuestos inflamables es delicada y requiere técnicas muy precisas para lograr
resultados óptimos. Actualmente, en el laboratorio se aplica la técnica A y se desea probar una nueva
técnica, B. La siguiente información muestra el resultado de los tiempos, en minutos, que utilizó cada
técnica por proceso.

Técnicas Tamaño de muestra Promedio Desviación estándar


Técnica A 16 9,97 6,56
Técnica B 11 9,27 2,05

Un ingeniero desea probar si la variabilidad entre los tiempos usados por ambas técnicas no es
similar. Use  = 0,05

1. Plantear las hipótesis

¿ H 0 : σ 21=σ 22
2 2
¿ H1: σ 1≠ σ2

2. Fijar el nivel de significación: α = 0,05

3. Calcular el valor del estadístico de la prueba.

2
S1 6,562
F c= 2
= 2
=10,24
S2 2,05

4. Establecer las regiones críticas.

donde:
1
F 1=
F ( α2 ; n −1 , n −1)
2 1

1 1
¿ = =0,3268
F ( 0,025 ;10 ; 15 ) 3,06
237
UPC MA444 Estadística

F 2=F ( 0,025 , 15,10 )=3,52

Área bajo la curva: P ( F ≥ c )=α


v1
α v2 1 2 3 4 5 6 7 8 9 10

0.050 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54
0.025 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06
0.010 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80
0.005 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42

v1
α v2 12 15 20 24 30 40 50 60 70 120
0.050 10 2.91 2.85 2.77 2.74 2.70 2.66 2.64 2.62 2.61 2.58
0.025 3.62 3.52 3.42 3.37 3.31 3.26 3.22 3.20 3.18 3.14
0.010 4.71 4.56 4.41 4.33 4.25 4.17 4.12 4.08 4.06 4.00
0.005 5.66 5.47 5.27 5.17 5.07 4.97 4.90 4.86 4.83 4.75

5. Aplicar las reglas de decisión.

Como Fc = 10,24 > F2 = 3,52, entonces Rechazar H0.

6. Realizar la conclusión.

Con un nivel de significancia del 5%, sí es posible afirmar que la variabilidad entre los tiempos
usados por ambas técnicas no es similar.
238
UPC MA444 Estadística
Prueba de hipótesis para la diferencia de medias poblacionales

Caso 1: Varianzas poblacionales desconocidas y homogéneas

1. Plantear las hipótesis

Unilateral izquierda Bilateral Unilateral derecha


H 0 : μ1−μ2 ≥ k H 0 : μ1−μ2=k H 0 : μ1−μ2 ≤ k
H 1 : μ 1−μ2 <k H 1 : μ 1−μ2 ≠ k H 1 : μ 1−μ2 >k

2. Fijar el nivel de significación: α

3. Calcular el valor del estadístico de prueba.

( x1 −x2 ) −(μ1 −μ 2)
t c= t (n +n −2)

√ ( )
1 2
2 1 1
S p +
n1 n 2

2
Calcular el valor de la varianza combinada S p .
2 2
(n1−1)S1 +(n2−1)S 2
S2p=
n1+ n2−2

4. Establecer las regiones críticas.

Unilateral izquierda H 1 : μ 1−μ2 <k

−t α ;n +n −2
1 2
239
UPC MA444 Estadística

Bilateral H 1 : μ 1−μ2 ≠ k

−t α tα
; n 1+n2−2 ; n1 +n2−2
2 2

Unilateral derecha H 1 : μ 1−μ2 >k

t α ; n +n −2
1 2

5. Aplicar las reglas de decisión: Rechazar H 0 o no rechazar H0.

6. Realizar la conclusión.

Caso 2: Varianzas poblacionales desconocidas y heterogéneas

1. Plantear las hipótesis.

Unilateral izquierda Bilateral Unilateral derecha


H 0 : μ1−μ2 ≥ k H 0 : μ1−μ2=k H 0 : μ1−μ2 ≤ k
H 1 : μ 1−μ2 <k H 1 : μ 1−μ2 ≠ k H 1 : μ 1−μ2 >k

2. Fijar el nivel de significación. α

3. Calcular el estadístico de prueba.

( x1 −x2 ) −( μ1 −μ 2)
t c=

√ S 21 S 22
+
n1 n 2

Los grados de libertad se obtienen de la siguiente manera:


240
UPC MA444 Estadística

( )
2 2 2
S 1 S2
+
n 1 n2
υ=

( ) ( )
2 2
S 21 S 22
n1 n2
+
( n1−1 ) ( n2−1 )

El valor de v debe ser un valor entero y deberá redondearse al entero menor. Por ejemplo, si v =
18,12608, entonces v = 18.

4. Establecer las regiones críticas.

Unilateral izquierda H 1 : μ 1−μ2 <k

−t α ;v

Bilateral H 1 : μ 1−μ2 ≠ k

−t α tα
;v ;v
2 2

Unilateral derecha H 1 : μ 1−μ2 >k

t α; v

5. Aplicar las reglas de la decisión: Rechazar H 0 o no rechazar H0.

6. Realizar la conclusión.
241
UPC MA444 Estadística
Ejemplo 1
Para determinar la concentración de partículas de nitrato en el aire en dos centros poblados, Larrea
(Pasco) y San Marcos (Ancash), cuya principal actividad económica es la minería, se tomaron 8
muestras de aire en Larrea y 6 muestras de aire en San Marcos. Los resultados se muestran a
continuación:

Centros poblados Tamaño de muestra Media (fibra/litro) Desviación estándar (fibra/litro)


Larrea (1) 8 0,04806 0,00610
San Marcos (2) 6 0,03286 0,00135

El Ministerio del Medio Ambiente, desea realizar una inspección exhaustiva de la calidad de aire que
respiran los habitantes de estos centros poblados, pero por cuestiones de presupuesto solo podrá
realizarlo en el centro poblado de Larrea, siempre y cuando se llegue a demostrar que la
concentración promedio de nitrato es mayor que en el centro poblado de San Marcos; caso
contrario, se esperará el próximo año para inspeccionar los dos centros poblados. Usando un nivel de
significancia 5%. ¿Cuál será la decisión que tomará el Ministerio de Medio Ambiente?

Solución
Resolviendo con las cinco dimensiones:

Interpretación
Determinar si el Ministerio de Medio Ambiente realizará una inspección exhaustiva de la calidad de
aire que respiran los habitantes de los centros poblados de Larrea y San Marcos; caso contrario, se
esperará el próximo año para inspeccionar los dos centros poblados.

Representación
Variable: Concentración de nitrato (fibra/litro)
Variable de agrupación: Centro poblado: Larrea (1) San Marcos (2)
Herramienta estadística: Prueba de hipótesis para la diferencia de medias y prueba de
hipótesis para la razón de varianzas

Cálculo
Para establecer cuál es el estadístico de prueba adecuado para la prueba de diferencia de medias
poblacionales, debemos realizar primero una prueba de razón de varianzas para determinar si
consideramos que las varianzas poblacionales son iguales o diferentes.

Prueba de hipótesis para la razón de varianzas


Las hipótesis para la razón de varianzas son:

2 2
H 0 :σ 1=σ 2
2 2
H 1: σ1≠ σ 2

El nivel de significancia es de  = 0,05.

El valor del estadístico de prueba es:


242
UPC MA444 Estadística
2 2
s1 0,00610
F cal= 2
= 2
=20,42
s2 0,00135

Donde:
1 1 1
F 1= = = =0,1890
Fα F 0,025;5 ;7 5,29
;n2−1 ,n1−1
2

F 2=F0,025 ;7 ;5 =6,85

Aplicando las reglas de decisión, se rechaza H0.

Conclusión
Con un nivel de significancia de 5%, es posible afirmar que las varianzas poblacionales son
heterogéneas.

Prueba de hipótesis para la diferencia de medias

Las hipótesis para la diferencia de medias son:

H 0 μ1≤ μ2
H 1 μ1 > μ2

H 0 μ 1−μ2 ≤ 0
H 1 μ1−μ 2> 0

El nivel de significancia es de  = 0,05.

De acuerdo con la prueba de razón de varianzas, se acepta de las varianzas poblacionales son
heterogéneas, por lo tanto, el estadístico de la prueba adecuado para la diferencia de medias es:
243
UPC MA444 Estadística
( x 1−x 2 )−k
t cal=

√ S21 S22
+
n1 n2

Reemplazando los valores:

( 0,04806−0,03286 )−0
t cal= =6,83

√ 0,006102 0,001352
8
+
6

Los grados de libertad del estadístico de prueba se obtienen de la siguiente manera:

( )
2
S 21 S22
+
n 1 n2
υ=

( ) ( )
2 2
S 21 S 22
n1 n2
+
( n1−1 ) ( n2−1 )

Reemplazando los valores:

( )
2 2 2
0,00610 0,00135
+
8 6
υ= =7,90
( ) ( )
2 2
0,006102 0,001352
8 6
+
( 8−1 ) ( 6−1 )

Los grados de libertad son v=7,90. Se redondea al entero menor, v=7.

La prueba es unilateral derecha.

1,89458

El valor crítico es t 0,05 ;7=1,89458 .


244
UPC MA444 Estadística

υ 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015
6 0.26483 0.55338 0.9057 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381

Análisis

Como t cal=6,83 ¿ t critico=1,89458 , entonces se rechaza H0.

Conclusión
A un nivel de confianza de 5%, existe evidencia estadística suficiente para afirmar que la
concentración promedio de nitrato en Larrea es mayor que en San Marcos.

Argumentación
Debido a que la concentración promedio de nitrato en Larrea es mayor que en San Marcos, el
Ministerio de Medio Ambiente realizará una inspección exhaustiva de la calidad de aire en el centro
poblado de Larrea.

Ejemplo 2

La empresa de ingeniería Forte pertenece al rubro de la construcción. Para un proyecto realizado a


una empresa minera de Ancash, se tuvo como principal tarea el movimiento de tierras. Ante ello, es
evidente que el soporte de mantenimiento que necesita esta división es elemental para la eficiencia
del trabajo.

El jefe del área de mantenimiento enviará personal de la zona norte a la zona centro cuando los
costos de mano de obra en la zona centro superen a los costos en la zona norte. Para decidir, use un
nivel de significación del 4%. Asuma que los costos se distribuyen normalmente y que las varianzas
poblacionales son desconocidas y homogéneas.

Costo de mano de obra en la zona Centro (1)


2506,46 2563,99 2501,06 2581,49 2730,66 2544,64 2534,54 2666,93

Costo de mano de obra en la zona Norte (2)


Tamaño de muestra Media Desviación estándar
10 2484,5 55,5
245
UPC MA444 Estadística
246
UPC MA444 Estadística

Ejemplo 3

Un componente de los satélites son los paneles solares. La compañía Intel está probando dos tipos
de paneles solares: el EQM y el EM3, los cuales deben pasar un estricto control de calidad. Según
información del departamento de calidad si la potencia de los paneles solares EQM supera en más de
dos kW a los de EM3, se sugiere dejar de fabricar el modelo EM3.

El jefe de producción seleccionó al azar dos muestras de paneles de ambos modelos y registra las
potencias de estos. A continuación, se presenta la siguiente información:

Variable Tamaño de muestra Promedio Desviación estándar


Panel EQM (1) 16 27,21 1,620
Panel EM3 (2) 21 23,63 3,490

Considerando que la potencia se distribuye normalmente, con un nivel de significación del 5%, ¿se
debe dejar de fabricar el modelo EM3?
247
UPC MA444 Estadística
248
UPC MA444 Estadística
249
UPC MA444 Estadística
Ejercicios propuestos

72. Los siguientes datos corresponden a la resistencia a la compresión a los 28 días, en kg/cm 2,
reportados por dos laboratorios:

Laboratorio 1 287,0 238,2 314,3 365,9 362,0 388,7 292,9 290,3


Laboratorio 2 306,0 338,0 349,4 307,4 316,2 326,9

Con 5% de nivel de significación, ¿los laboratorios reportan resultados en promedio similares?


Asuma poblaciones normales.

73. La exactitud obtenida en mediciones con GPS depende del equipo receptor. Uno de los
fabricantes de receptores está realizando un estudio para comparar la exactitud de dos
modelos, GPSMAP (1) y Oregón (2). Según información del departamento de control de calidad,
la exactitud del modelo GPSMAP es menor que la de Oregón, por lo cual se sugiere dejar de
fabricarla.

El jefe de producción seleccionó al azar dos muestras de receptores de ambos modelos con la
finalidad de realizar la prueba correspondiente y registra la exactitud, en mm, obtenida por
ambos receptores. Considerando que la exactitud se distribuye normalmente y con un nivel de
significación del 4%, ¿la empresa debe dejar de fabricar el modelo GPSMAP.

74. El tiempo de exposición, en minutos, de un metal con una sustancia química hasta lograr un
adherido perfecto es parte de un proceso de producción. Se considera que el menor tiempo de
exposición es mejor. Como parte de la mejora del proceso se somete a prueba dos
procedimientos y se mide el tiempo de exposición para dos muestras independientes.

Procedimiento Tamaño de muestra Media Desviación estándar


Procedimiento A 31 12,97 4,25
Procedimiento B 25 11,99 2,47

a. Asumiendo que los tiempos de exposición tienen distribución normal, ¿se puede afirmar que hay
diferencia en la variación de los tiempos? Use un nivel de significación del 10%.
b. Asumiendo que los tiempos de exposición tienen distribución normal y usando un nivel de
significación del 5%, ¿recomendaría el procedimiento B?
250
UPC MA444 Estadística

Caso: Constructora R&P

Constructora R&P es una empresa dedicada a la construcción de


puentes y carreteras. Recientemente adquirió la buena pro por
parte de la autoridad competente para la construcción de un
puente en la provincia de Virú al norte del país. Los fierros de
construcción son materiales básicos para la construcción del puente
porque brinda la resistencia a la flexión. En el mercado existen
fierros de construcción tanto de procedencia nacional como
importados.

El jefe del área de compra de materiales sospecha que el promedio de la resistencia a la flexión de las
columnas es mayor cuando se usan los fierros de procedencia nacional que cuando se usan los fierros
importados. De ser cierta su sospecha, elegirá fierros nacionales para la construcción. Para ello,
seleccionó al azar registros del último año de la resistencia a la flexión, en kg/cm 2, de las columnas
construidas con cada tipo de fierro obteniendo los siguientes resultados:

Fierro nacional (1) Fierro importado (2)


Tamaño de muestra 21 16
Media 41,8 39,1
Desviación estándar 2,57 2,02

Sabiendo que la resistencia a flexión de las columnas se distribuye normalmente y que sus varianzas
poblacionales son homogéneas. A un nivel de significación del 5% ¿cuál será la decisión del jefe del
área de compra de materiales?

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante El estudiante El estudiante grafica El estudiante
identifica la identifica la determina las regiones críticas presenta un informe
problemática y lo variable, la técnica correctamente, con el (los) valor(es) sobre la
redacta como estadística y con precisión, el crítico(s). problemática que se
problema o como presenta las valor del Fundamenta deseaba resolver,
objetivo. hipótesis. estadístico de correctamente la dando respuesta al
prueba. decisión estadística y objetivo.
la conclusión.
251
UPC MA444 Estadística

Diseño de experimentos
Un experimento diseñado es una prueba o serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada (factores controlables) de un proceso o sistema, de manera
que sea posible observar e identificar las causas de los cambios en la variable de salida (variable
respuesta).

Variable de entrada
(Factores Variable de salida
Proceso
controlables y no (Variable respuesta)
controlables)

Ejemplo 1

Se tienen dos poblaciones, una de alumnos que lleva el curso de Estadística en modalidad presencial
y otra de alumnos que lleva el curso en modalidad blended. Se quiere saber si la nota promedio de
los alumnos es similar en ambas modalidades.

N1: modalidad presencial N2: modalidad blended

¿µ1 = µ2?

n1 = 5
n2 = 10

Variable en estudio

Variable de agrupación (poblaciones)

Elemento

Parámetro
252
UPC MA444 Estadística

Herramienta estadística
253
UPC MA444 Estadística
Conceptos generales
Factor
Variable independiente que afecta los resultados del experimento: controlables o no controlables. En
un experimento se puede evaluar uno o más factores.

Tratamiento
Un tratamiento corresponde a los niveles de un factor o a la combinación de los niveles de dos o más
factores. Es un conjunto de procedimientos cuyo efecto sobre la variable respuesta nos interesa
estudiar. Su efecto se mide y se compara con otros tratamientos.

Variable respuesta
Es la variable en la cual se evaluarán los efectos de los tratamientos.

Unidad experimental
Es la unidad, sujeto u objeto, al el cual se le aplica un tratamiento.

Ejemplo 2

Se tienen ahora tres poblaciones, una de alumnos que lleva el curso de Estadística en modalidad
presencial, otra en modalidad blended y otra en modalidad online. Se quiere saber si la nota
promedio de los alumnos es similar en las tres modalidades.

N1: modalidad presencial N2: modalidad blended N3: modalidad online

¿µ1 = µ2 = µ3?

n1 = 5 n2 = 10 n3 = 5
254
UPC MA444 Estadística
Identifique los conceptos generales:

Antes Ahora Identifique

Variable en estudio Variable respuesta

Variable de agrupación (poblaciones) Factor

Categorías de la variable de agrupación Tratamientos

Elemento Unidad de análisis

Herramienta estadística

A continuación, se presentan los datos recolectados, los mismos que se han tabulado en una matriz
de datos. El Y ij representa la variable en estudio, siendo i el tratamiento y j las repeticiones.

Tratamientos
Repeticiones
Tratamiento 1 Tratamiento 2 Tratamiento 3
1 Y 11 Y 21 Y 31
2 Y 12 Y 22 Y 32
3 Y 13 Y 23 Y 33
… … … …
j Y1j Y2j Y3j
… … … …
ni Y 1n 1
Y 2n 2
Y 3n 3

Total Y 1. Y 2. Y 3.

Ejemplo 3

El gerente de una compañía dedicada a ensamblar piezas de equipos electrónicos realizó un estudio
con el fin de comparar la eficacia de tres programas de capacitación, A, B y C. Para ello se asignaron
al azar quince empleados, cinco a cada uno de los tres programas. Después de terminado los cursos
de capacitación se registró el tiempo, en minutos, que les tomó ensamblar las piezas en los equipos
electrónicos.

Complete lo solicitado:

Variable respuesta

Factor

Tratamientos

Unidad experimental
255
UPC MA444 Estadística
256
UPC MA444 Estadística
Diseño completamente al azar
En el diseño completamente al azar (DCA) suponga que se cuenta con los resultados de k muestras
aleatorias independientes, cada una de tamaño ni , obtenidas desde k diferentes poblaciones y se
desea probar la hipótesis de que las medias de estas k poblaciones son todas iguales.

Las poblaciones que se desea comparar suelen ser producto de la aplicación de distintos
tratamientos a ciertas unidades de análisis.

Considere el caso en el que se desea comparar el efecto de cinco programas de incentivos en la


productividad de los trabajadores.

En este caso:
 Los cinco programas de incentivos serían los cinco tratamientos aplicados (los cuales definen las
cinco poblaciones que se van a comparar).
 La unidad de análisis sería un trabajador (quien recibe el tratamiento).

Los datos para analizar pueden arreglarse en una tabla como la que se muestra a continuación:

Tratamientos
Repeticiones
Tratamiento 1 Tratamiento 2 … Tratamiento i … Tratamiento k
1 Y 11 Y 21 … Y i1 … Yk1
2 Y 12 Y 22 … Y i2 … Yk2
3 Y 13 Y 23 … Y i3 … Yk3
… … … … … … …
j Y1j Y2j … Y ij … Y kj
… … … … … … …
ni Y 1n 1
Y 2n 2
… Y in i
… Ykn k

Total Y 1. Y 2. … Y i. … Yk.

Para probar la hipótesis de la igualdad de las medias, se deben probar los siguientes supuestos:

 Homogeneidad de las varianzas


 Normalidad de los errores.

Supuesto 1: Homogeneidad de varianzas

Las hipótesis son:

H0 : σ 21=σ 22 ¿ σ 23=σ 24
2
H 1 : Al menosuna σ i es diferente ; i=1 , 2, 3 , 4

La hipótesis H 0 significa la varianza es la misma en las cuatro sucursales y la hipótesis H 1 significa


que al menos una varianza es diferente.
257
UPC MA444 Estadística

Los resultados de Minitab son:

Como el p valor (P-value) es mayor al nivel de significancia α (0,988 > 0,05), no se rechaza H0, el
resultado de esta prueba indica que no hay suficiente evidencia estadística afirmar que alguna de las
varianzas poblacionales es diferente, es decir, se acepta que el supuesto de homogeneidad de
varianzas al 5% de nivel de significancia.

Supuesto 2: Normalidad de los errores


Las hipótesis son:

H 0 : Los errores del modelo sí tienen distribución normal


H 1 : Los errores del modelo no tienen distribución normal

Los resultados de Minitab son:

Como el p valor (P-value) es mayor al nivel de significancia α (0,150 > 0,05), no se rechaza H0, el
resultado de esta prueba indica que no hay suficiente evidencia estadística para afirmar que los
258
UPC MA444 Estadística
errores del modelo no tienen distribución normal, es decir se acepta el supuesto de normalidad al 5%
de nivel de significancia.
Observación

Ambos supuestos se han obtenido con el software Minitab. Para efectos del curso se asumirán
ambos supuestos.

El modelo para este diseño es el siguiente:

y ij =μ+ τ i+ ε ij i=1 , 2, ⋯ , k ; j=1 , 2, ⋯ ,n i

donde:
y ij :=¿valor observado del i -ésimo tratamiento en la j -ésima repetición
μ :=¿efecto de la media poblacional
τi :=¿efecto del i -ésimo tratamiento
ε ij :=¿error experimental asociado a la observación y ij

Por ejemplo, podríamos usar en análisis de varianza para responder a las siguientes situaciones:

 Una importante compañía de construcciones desea comparar tres marcas de taladros para
determinar cuánto tiempo pasa antes de necesitar una reparación; si los tiempos de vida de los
taladros de cada marca se distribuyen normalmente. ¿Las marcas de taladro tienen un tiempo de
vida útil promedio similar a las otras marcas antes de requerir una reparación?

 Un ingeniero civil residente de una obra desea evaluar el efecto que tiene las técnicas de
mezclado de concreto sobre la resistencia (kg/cm 2) a la compresión. Para ello evalúa cuatro
técnicas diferentes y para realizar la prueba produce especímenes de concreto. ¿La resistencia
promedio a la compresión es la misma para cada técnica de mezclado?

 Una empresa constructora brinda capacitación con diferentes métodos a sus operarios. ¿El
rendimiento promedio de los operarios en la empresa es el mismo según los métodos de
adiestramiento recibido por el operario?

 Una importante compañía de construcciones desea comparar tres marcas de camiones antes de
ordenar toda una nueva flota de una clase de camión. ¿Los costos medios de operación por
kilómetro de cada camión es el mismo para cada marca de camión?
259
UPC MA444 Estadística

Análisis de la varianza

El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar tres o más
medias. Se desea medir el efecto del factor en estudio (variable independiente de naturaleza
cualitativa o cuantitativa) sobre la variable respuesta (variable dependiente de naturaleza
cuantitativa).

En un diseño completamente al azar (DCA) los tratamientos se asignan aleatoriamente a las unidades
experimentales.

Hay k poblaciones (k tratamientos) y se seleccionan k muestras aleatorias independientes, una de


cada población.

Esta técnica estadística permite descomponer la variabilidad total de los resultados de un


experimento en sus distintas fuentes (tratamientos, error experimental), con la finalidad de
compararlas e identificar su importancia relativa en la explicación de la variación total.

Variabilidad entre grupos Variabilidad dentro de los grupos

Mide el efecto de los tratamientos Mide la variabilidad del error experimental

Tabla del ANOVA o ANVA


Fuente de
Grados de libertad Suma de cuadrados Cuadrado medio Fc
variación
SMTR
Tratamientos k −1 SCTR CMTR=
k−1 CMTR
SCE CME
Error n−k SCE=SCT−SCTR CME=
n •−k

Total n−1 SCT

La prueba para k medias o el análisis de varianza se basa en la descomposición de la variación total


de los datos con respecto a la media global ( SCT ) en dos partes:

ni ni
k k
y 2..
SCT =∑ ∑ ( y ij − y ) =∑ ∑
2 2
y−
ij
i=1 j=1 i=1 j=1 n.

Variación dentro de las muestras o variación intragrupos que denotaremos como SCTR.
260
UPC MA444 Estadística
k k 2 2
y i. y ..
SCTR=∑ ni ( y i− y ) =∑
2

i=1 i=1 ni n.

Variación entre muestras o variación intergrupos que denotaremos como SCE.

k ni
SCE=SCT−SCTR=∑ ∑ ( y ij − yi )
2

i=1 j=1

donde:

SCT : Suma de cuadrados del total


SCTR: Suma de cuadrados de los tratamientos
SCE: Suma de cuadrados del error
ni : Tamaño de muestra del i -ésimo tratamiento
n: Tamaño de muestra total n=n1 +n2 +⋯ +nk
k: Número de tratamientos
Y i: Total de la i -ésima muestra Y =Y 1+Y 2+ ⋯+Y k

Asumiendo el cumplimiento de los supuestos antes mencionados, y que en realidad no hay


diferencia entre los tratamientos, la cantidad Fc del cuadro de análisis de varianza seguiría una
distribución F con los grados de libertad del tratamiento y con los grados de libertad del error.

Entonces, se puede utilizar esta distribución para evaluar la hipótesis nula de que no hay diferencias
entre las medias de los tratamientos.

Hipótesis estadística

1. Formular las hipótesis.

H0 : μ1 =μ 2=…=μk
H 1 : Al menosuna μi es diferente a los demás

H 0 es la afirmación de que no hay diferencia entre las medias poblacionales, es decir, que el
factor en estudio no afecta a la variable respuesta.

H 1 es la afirmación de que sí hay diferencia entre las medias poblacionales, es decir, que el
factor en estudio sí afecta a la variable respuesta.

2. Fijar el nivel de significación: α

3. Calcular el estadístico de prueba.

CMTR
F c=
CME

4. Establecer la región crítica.


261
UPC MA444 Estadística

El valor crítico es: F critico=F ;gl tratamiento ; glerror =F ;k−1 ;n−k

5. Aplicar los criterios de decisión.

El valor crítico es:

F critico=F ;gl tratamiento ; glerror =F ;k−1 ;n−k

Para tomar una decisión seguimos la siguiente regla:

Si F c ≤ F critico , no se rechaza H 0
Si F c > F critico , sí se rechaza H 0

6. Realizar la conclusión.

Ejemplo 1
La gerente de mercadeo de un banco planea poner en marcha cierto tipo de promociones para atraer
nuevos clientes en cuatro sucursales del banco. Ella está convencida que diferentes tipos de
promociones atraerán a personas de diferentes grupos de ingreso, por lo que, de haber diferencias
entre los ingresos medios de los clientes de cada sucursal, se optará por un programa de
promociones distinto para cada una.

Considere a los montos de los depósitos, en miles de soles, como una medida representativa de los
ingresos de los clientes. Se presentan datos para una muestra de siete depósitos de cada sucursal
¿Debe la gerente optar por un programa de promociones distinto para cada sucursal? Evalúe esta
posibilidad con un nivel de significación del 5%.

Depósito Sucursal 1 Sucursal 2 Sucursal 3 Sucursal 4


1 Y11 = 5,3 Y21 = 3,3 Y31 = 3,6 Y41 = 4,3
2 Y12 = 2,6 Y22 = 4,6 Y32 = 2,8 Y42 = 2,5
3 Y13 = 3,6 Y23= 2,1 Y33 = 4,5 Y43 = 1,8
4 Y14 = 3,8 Y24 = 3,5 Y34 = 3,8 Y44 = 3,0
5 Y15 = 2,7 Y25 = 5,0 Y35 = 1,9 Y45 = 3,9
6 Y16 = 5,1 Y26 = 2,8 Y36 = 4,1 Y46 = 3,5
7 Y17 = 4,2 Y27 = 2,5 Y37 = 5,1 Y47 = 4,1
Total, Yi. Y1. = 27,3 Y2. = 23,8 Y 3. = 25,8 Y 4. = 23,1

Solución

Variable respuesta
262
UPC MA444 Estadística

Factor

Tratamientos

Unidad experimental

1. Formular las hipótesis.

H0 : μ1=μ 2=μ3
H 1 : Al menosuna μi es diferente a los demás; i=1 , 2 ,3

H 0 es la afirmación de que no hay diferencia entre las medias poblacionales, es decir, que el
factor en estudio no afecta a la variable respuesta.

H 1 es la afirmación de que sí hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio sí afecta a la variable respuesta.

2. Establecer el nivel de significación: ¿ 0,05

3. Calcular el valor del estadístico de prueba.

Los cálculos para obtener las sumas de cuadrados son:

(∑ ∑ )
k=4 7 2

2
y ij
y .. i=1 j=1 ( 27,3+23,8+25,8+ 23,1 )2 1002
TC = = = = =357,1429
n k=4
7+7+ 7+7 28
∑ ni
i=1

La suma de cuadrados total es:

k= 4 7 2
y ..
SCT =∑ ∑ y ij − = ( 5,3 + 2,6 +…+ 4,1 )−357,1429=27,0171
2 2 2 2

i=1 j=1 n.

La suma de cuadrados de los tratamientos es:

( )
k=4 2 2
y i . y .. 27,3 2 23,8 2 25,8 2 23,1 2
SCTR=∑ − = + + + −357,1429=1,568
i=1 ni n. 7 7 7 7

La suma de cuadrados de los errores es:

SCE=SCT−SCTR=27,0171−1,568=25,4486

La tabla del análisis de varianza:


263
UPC MA444 Estadística
Fuente de Suma de Cuadrados
Grados de libertad Fcalculado
variación cuadrados medio
1,569 0,523
Tratamientos k −1=4−1=3 SCTR=1,569 =0,523 =0,49
3 1,060
25,449
Error n−k =28−4=24 SCE=25,449 =1,060
24
Total n−1=28−1=27 SCT =27,017

El valor del estadístico de prueba es:


F calculado=0,49

4. Establecer la región crítica.

Esta es una prueba unilateral izquierda.

El valor crítico es:

F critico=F ;gl tratamientos ;gl error =F; k−1; n−k =F 0,05; 3; 24=3,01

v1
α
v2 1 2 3 4 5 6 7 8 9 10
       
0.050 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25
0.025   5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64
0.010   7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17
0.005   9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59

5. Aplicar los criterios de decisión.

F calculado=0,49< F critico =3,01; entonces no se rechaza H 0.

6. Realizar la conclusión.
264
UPC MA444 Estadística
Al 5% de significación, no es posible afirmar que al menos un depósito promedio sea diferente a
los demás.
265
UPC MA444 Estadística
Método de comparaciones múltiples: Prueba de Tukey - Kramer
Se supone que el experimentador tiene a su disposición mediciones relativas a varios tratamientos. El
análisis de varianza indica si hay evidencias de que al menos una de las medias sea diferente o no.
Cuando se rechaza la hipótesis nula, el análisis de varianza no revela cuál o cuáles de las medias son
significativamente diferentes. En este caso, se debe utilizar otra prueba estadística.

Cuando el experimentador desea determinar todos los pares de medias que se puede concluir que
difieren de otro (µi versus µj) se utiliza la prueba de comparación múltiple de Tukey – Kramer, con el
fin de probar todas las hipótesis nulas simultáneas. Para fines de este curso se presentará la salida
obtenida con MINITAB.

Ejemplo 1
Croma Color S.A. es una empresa especializada en la comercialización de pinturas envasadas a nivel
industrial, comercial y residencial. El gerente de marketing propone lanzar una campaña publicitaria
para incrementar las ventas de las pinturas. La campaña publicitaria se lanzará en el distrito o
distritos donde las ventas promedio, sean menores. Para identificar el distrito dónde se lanzará la
campaña publicitaria, se registró el monto de venta, en miles de soles, de algunos meses del último
año tomados al azar. Los resultados se presentan a continuación:

Santa Anita Breña Ate


70 30 40
60 40 50
60 30 70
80 40 80
60 40 60

Los resultados de la prueba de Tukey – Kramer son:

Factor N Mean Grouping


Santa Anita 5 66.00 A
Ate 5 60.00 A
Breña 5 36.00 B

¿En qué distrito o distritos se debe lanzar la campaña publicitaria? Utilice un nivel de significación del
1%.

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Identifica el factor, Realiza la prueba de Realiza y analiza Sustenta los
problemática, tratamientos, la técnica las comparaciones resultados
señalando variable de estadística aplicada múltiples encontrados en la
claramente el respuesta, unidad e interpreta. muestra y brinda
objetivo del experimental una
caso. Identifica la técnica recomendación al
estadística a usar. problema.
266
UPC MA444 Estadística

Solución

Interpretación

Determinar en qué distrito o distritos se debe lanzar la campaña publicitaria.

Representación

Factor: Distrito
Tratamientos: Santa Anita, Breña, Ate
Variable respuesta: Monto de ventas de pintura envasada, en miles de soles
Unidad experimental: Un mes de venta de pintura envasada
Herramienta estadística: Usaremos la herramienta del diseño completamente al azar (DCA)

1. Formular las hipótesis.

H0 : μ1=μ 2=μ3
H 1 : Al menosuna μi es diferente a las demás; i=1 , 2 ,3

2. Establecer el nivel de significación: ¿ 0,05

Cálculo

3. Calcular el valor del estadístico de prueba.

Fuente de Suma de
Grados de libertad Cuadrados medio Fcalculado
variación cuadrados
2520 1260
Tratamientos k – 1=3−1=2 SCTR=2520 =1260 =10,5
2 120
1440
Error n−k =15−3=12 SCE=1440 =120
12
Total n−1=15−1=14 SCT =3960

Finalmente, la tabla del análisis de varianza es:

Fuente de Suma de
Grados de libertad Cuadrado medio Fcalculado
variación cuadrados
Distritos 2 2520 1260 10,5
Error 12 1440 120
Total 14 3960

El valor del estadístico de prueba es:


267
UPC MA444 Estadística
F calculado=10,5

El valor crítico es:

F critico=F ;gl tratamiento ; glerror =F ;k−1 ;n−k =F 0,05 ;2 ;12=3,89

v1
α
v2 1 2 3 4 5 6 7 8 9 10
 
0.05
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75
0
0.02
6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37
5
0.01
9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30
0
0.00
11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09
5

Análisis

Para decidir comparamos el valor del estadístico de prueba y el valor crítico.

F calculado=10,5> F critico=3,89

Por lo tanto, se rechaza H0.

Conclusión: Al 1% de nivel de significancia, se puede afirmar que existe diferencia en al menos un


monto promedio de venta de pintura envasada, en miles de soles.

De la prueba Tukey - Kramer

µBreña µAte µSanta Anita


36,0 60,0 66,0

Se puede observar que no hay diferencia significativa entre las ventas de los distritos de Ate y Santa
Anita. Los distritos con mayor monto promedio de ventas de pintura envasada son Ate y Santa Anita.
Por lo tanto, la empresa debe decidir por dichos distritos para lanzar la campaña publicitaria.
268
UPC MA444 Estadística

Argumentación

La campaña publicitaria se lanzará solo en el distrito de Breña, porque las ventas promedio de
pintura envasada son menores.
269
UPC MA444 Estadística
Ejemplo 2

Un ingeniero civil residente de una obra desea evaluar el efecto que tienen las técnicas de mezclado
de concreto sobre la resistencia (kg/cm 2) a la compresión. Para ello evalúa cuatro técnicas diferentes
y para realizar la prueba produce especímenes de concreto. La resistencia a la compresión del
concreto de cada técnica se distribuye normalmente y tienen la misma varianza. Los datos
recolectados son los siguientes:

Técnica 1 Técnica 2 Técnica 3 Técnica 4


2765 3200 2800 2600
2665 3300 3150 2700
2865 2975 2885 2600
2890 3150 2850 2765

Factor N Mean Grouping


Técnica 2 4 3156.3 A
Técnica 3 4 2921.3 A B
Técnica 1 4 2796.3 B
Técnica 4 4 2666.3 B

a. Identifique:

Variable respuesta

Factor

Tratamientos

Unidad experimental

b. Al 5% de significación, ¿al menos una técnica de mezclado influye en la resistencia a la


compresión del concreto?

Anova con Excel

Fuente de Grados de Suma de


Cuadrados medio Fcalculado
variación libertad cuadrados
Tratamientos

Error

Total

1. Formular las hipótesis de trabajo

H0:
H1:
270
UPC MA444 Estadística
2. Establecer el nivel de significación:  =

3. Calcular el valor del estadístico de prueba: Fc =

4. Aplicar el criterio de decisión.

Como Fc = …………… …… Fcrit (…………; ………., ……….) = ……….….. entonces …….. rechaza H0.

5. Realizar la conclusión.

c. Si la prueba resulta significativa, ¿qué técnica recomendaría utilizar?


271
UPC MA444 Estadística
Ejercicios propuestos

75. Una compañía que produce ladrillos efectuó un experimento para determinar si cuatro
temperaturas de cocción específicas, en °F, afectan la densidad de cierto tipo de ladrillo, en
gr/cm3. La densidad de los ladrillos para cada temperatura se distribuye normalmente y tienen la
misma varianza.
Temperaturas
100°F (1) 125°F (2) 150°F (3) 175°F (4)
19,9 21,7 20,9 21,8
19,7 21,4 20,8 21,9
19,8 21,5 20,8 21,7
19,7 21,5 20,6 21,6
20,0 21,7
Factor N Mean Grouping
175°F (4) 5 21.7400 A
125°F (2) 4 21.5250 A
150°F (3) 4 20.7750 B
100°F (1) 5 19.8200 C

a. Interprete el valor de Y23.


b. Complete el siguiente cuadro:

Variable respuesta

Factor

Tratamientos

Unidad experimental

c. Utilice nivel de significación de 5% para probar si al menos una temperatura de cocción


influye en la densidad de los ladrillos. Presente el ANOVA del Excel.
d. Si la prueba resulta significativa, ¿qué temperatura recomendaría utilizar?

76. Una importante compañía de construcciones desea comparar tres marcas de taladros para
determinar cuánto tiempo pasa antes de necesitar una reparación. Los tiempos de vida de los
taladros de cada marca se distribuyen normalmente y tienen la misma varianza. Los datos de los
tiempos de vida útil, en decenas de horas, para cada marca se encuentran en la siguiente tabla:

Marca A Marca B Marca C


6 10 3
2 9 2
4 8 5
1 6 4
7
272
UPC MA444 Estadística

Factor N Mean Grouping


Marca B 4 8.250 A
Marca A 5 4.000 B
Marca C 4 3.500 B

a. Identifique:

Variable respuesta

Factor

Tratamientos

Unidad experimental

b. Interprete el valor de Y13.


c. ¿Sugieren los datos que el tiempo promedio de vida es el mismo para cada marca de taladro
antes de una reparación? Utilice nivel de significación de 5%.
d. Si la prueba resulta significativa, ¿qué marca de taladro recomendaría utilizar?

77. Un empresario debe elegir la alternativa más eficiente para fabricar un mismo producto. Se
analiza el costo por unidad, en soles, de tres alternativas. El costo por unidad para cada
alternativa se distribuye normalmente y tienen la misma varianza, ¿qué alternativa deberá
elegirse?

Alternativa A Alternativa B Alternativa C


9,35 8,35 9,35
8,35 8,35 10,35
7,35 7,35 9,35
8,35 7,35 8,35
9,35 8,35 9,35
7,35 7,35 9,35

Factor N Mean Grouping


Alternativa C 6 9.350 A
Alternativa A 6 8.350 A B
Alternativa B 6 7.850 B

a. Pruebe si existe alguna diferencia significativa en los costos unitarios de las tres alternativas
de fabricación. Utilice nivel de significación de 5%.
b. Si existen diferencias, ¿entre qué grupos están las diferencias? Utilice nivel de significación
de 5%.
273
UPC MA444 Estadística
78. Importación Bombardera desea determinar si el tipo de chip (A, B, C) que tienen las laptops que
ellos importan influye en el tiempo de respuesta (microsegundos). El tiempo de respuesta para
cada tipo de chip se distribuye normalmente y tienen la misma varianza. Al probar cinco laptops
con cada tipo de chip, se obtuvieron los siguientes resultados, en microsegundos:

Tipo A Tipo B Tipo C


18 24 17
23 25 14
21 30 19
18 27 20
24 38 17

Factor N Mean Grouping


Tipo B 5 28.80 A
Tipo A 5 20.80 B
Tipo C 5 17.40 B

a. Al nivel de significancia del 5%, ¿la importadora puede concluir que hay diferencia en los
tiempos promedio de respuesta según el tipo de chip utilizado?
b. Si la prueba resulta significativa, ¿qué tipo de chip recomendaría utilizar?

79. Para determinar si la resistencia a la ruptura (libras/ pulg 2) difiere según el tipo de estructura, se
tomó al azar una muestra de zonas con estructura tipo cimientos, zonas con estructura tipo
terraplenes y zonas con estructura tipo excavación. Asuma que se cumplen los supuestos de
normalidad y de homogeneidad. Los resultados de la resistencia a la ruptura (libras/ pulg 2) se
presenta en el siguiente cuadro:

Cimiento Terraplenes Excavación


2050 2200 2300
2100 2230 2180
2100 2150 2200
2100 2150 2200
2150 2200

Tipo_estructura N Media Agrupación


Excavación 5 2216.0 A
Terraplenes 5 2176.0 A
Cimiento 4 2087.5 B

a. Complete la siguiente información:

Variable respuesta
Factor
Tratamientos
Unidad experimental
274
UPC MA444 Estadística
b. Explique y fundamente, con un nivel de significación del 5%, ¿con qué tipo de estructura se
debería construir la represa?

Caso: Compañía Clean

La compañía Clean S.A ha diseñado cuatro sistemas diferentes (A, B, C y


D) para limpiar manchas de grasa en departamentos. Los especialistas
desean determinar cuál de estos sistemas es más efectivo. Para ello,
diseñan un experimento de la siguiente manera: de una muestra de 19
trabajadores de la empresa (todos con la misma destreza en el trabajo)
se seleccionaron aleatoriamente cinco trabajadores para el sistema A,
cinco para el sistema B, cuatro para el sistema C y cinco para el sistema
D, de tal manera que cada grupo de trabajadores limpia las manchas de grasa con un determinado
sistema.

La siguiente tabla contiene los resultados, medidos por área, en m 2, que se limpian en una hora:

Sistema A Sistema B Sistema C Sistema D


15 22 16 13
14 20 18 15
20 26 18 12
17 23 20 10
22 23 12

Factor N Mean Grouping


Sistema 2 5 22.800 A
Sistema 3 4 18.000 B
Sistema 1 5 17.600 B
Sistema 4 5 12.400 C

¿Qué sistema o sistemas para limpiar manchas de grasa en departamentos es más efectiva de tal
manera que se pueda trabajar exclusivamente con dicho sistema? Asuma que se cumplen los
supuestos de normalidad y homogeneidad. Utilice un nivel de significación del 5%.

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Identifica el factor, Realiza las pruebas Presenta el valor de la Sustenta los
problemática, niveles, necesarias de la tabla. resultados
señalando tratamientos, técnica estadística Realiza la decisión y encontrados en la
claramente el variable de aplicada e conclusión estadística. muestra y brinda
objetivo del respuesta, unidad interpreta. Realiza y analiza las una
caso. experimental comparaciones recomendación al
Identifica la técnica múltiples problema.
estadística a usar.
Plantea la hipótesis.
275
UPC MA444 Estadística

Regresión lineal simple


Podemos hacernos muchas preguntas sobre la relación entre dos variables:

 ¿La velocidad de transferencia de datos de un disco duro depende de la velocidad en que giran
los discos del plato del disco duro o de su capacidad de almacenamiento?
 ¿El tiempo de ejecución de una obra civil depende del número de trabajadores o del índice de
automatización?
 ¿El tiempo de falla de los equipos electrónicos dependerá de la resistencia de los resistores?
 ¿El sueldo dependerá del grado de instrucción?
 ¿El tiempo de procesamiento de trabajos estará relacionado con el número de trabajos por día?
 ¿La temperatura está relacionada con la presión sobre el rendimiento de un producto químico?

Estas preguntas surgen cuando queremos estudiar dos variables de una población con el fin de
examinar la relación existente entre ellas. Las dos variables en estudio son variables cuantitativas que
nos permitirá construir una ecuación lineal que modela la relación existente entre estas dos
variables.

En el análisis de regresión la ecuación lineal puede usarse para estimar o predecir los valores de una
variable dependiente, llamada Y, cuando se conocen o se suponen conocidos los valores de otra
variable, variable independiente, llamada X.

El análisis de correlación permite determinar el grado de relación lineal existente entre dos variables.
Es útil en un trabajo exploratorio cuando el investigador desea encontrar el grado o la fuerza de esa
relación.

La regresión lineal simple es modelar la dependencia de la variable Y en función de la variable X a


través de la ecuación de una recta

Y i=β 0 ± β1 X i +e i i=1 , 2 ,3 , … , n
Donde:
X :=¿ variable independiente
Y :=¿ variable dependiente

Se trabaja con variables de tipo cuantitativas, entre las cuales se puede establecer una relación
funcional.

Y =f ( X )

Entonces diremos que la variable Y depende de la variable X.


276
UPC MA444 Estadística
Ejemplo 1

Para cada par de variables, identifique la variable dependiente (Y ) e independiente ( X ), la pendiente


(positiva o negativa) y el tipo de relación (inversa o directa) y qué significa el tipo de relación:

Ingreso mensual (soles)


Variables
Consumo mensual (soles)

Variable dependiente

Variable independiente

Pendiente

Tipo de relación

Significado de la relación

Precio de venta del auto (dólares)


Variables
Antigüedad (años)

Variable dependiente

Variable independiente

Pendiente

Tipo de relación

Significado de la relación
277
UPC MA444 Estadística
Diagrama de dispersión o gráfico del plot
El primer paso en el análisis de regresión es registrar simultáneamente los valores de las dos
variables asociadas ( X , Y ) en una gráfica bidimensional para ver si existe una tendencia lineal que
podría explicar la relación entre estas dos variables

Método de los mínimos cuadrados


Mediante este método es posible seleccionar la recta que se ajuste mejor a los datos. La recta
resultante tiene dos características importantes:

 La suma de las desviaciones verticales de los puntos con relación a la recta es cero.
 La suma de los cuadrados de las desviaciones es mínima (es decir, ninguna otra recta daría una
n
menor suma de cuadrados de tales desviaciones). Es decir, ∑ ( y i −^y i ) es mínima.
2

i=1

Los valores de b 0 y b1 que minimizan la suma de los cuadrados de las desviaciones, son las soluciones
de las llamadas ecuaciones normales de la recta de regresión:

( )
n n

∑ yi =¿ n b0 +b 1 ∑ x i ¿
i=1 i=1

( ) (∑ )
n n n

∑ x i y i=¿ b0 ∑ xi +b1 x2i ¿


i=1 i=1 i=1
278
UPC MA444 Estadística

Este método nos permite estimar los parámetros del modelo de regresión. Resolviendo las
ecuaciones simultáneas para b o y b 1 tenemos:

( ) ( )( )
n n n
n ∑ xi yi − ∑ xi ∑ yi
i=1 i=1 i =1
b 1=

(∑ ) (∑ )
n n 2

n x 2i − xi
i=1 i=1

b o= y−b1 x

Recta o ecuación de regresión

El modelo poblacional es:

Y = β0 + β 1 X +e

El modelo muestral es:

^y =b0 +b1 x

donde:
b 1 es la pendiente de la recta o coeficiente de regresión.
b 0 es la ordenada en el origen o intercepto de la recta con eje Y.

Ejemplo 1
Para las siguientes variables:
Y :=¿ ingreso mensual (soles)
X :=¿ experiencia profesional (años)

a. Indique la relación entre las variables.


279
UPC MA444 Estadística

b. Interprete el valor de los coeficientes de regresión.

b0 = …

b 1= …

Ejemplo 2
Se desea modelar la vida útil (en años) de un satélite en función de la cantidad de combustible (en
kg) requerido para moverlo de su posición orbital, usando un modelo lineal. Los datos se muestran a
continuación:

Vida útil 10,8 11,5 12 12,4 13,2 13,7 13,9 14,1 14,8 15
Cantidad de combustible 150,4 156,3 162,5 165,8 172,5 168,9 184,5 185,9 187,2 199,4

Dispersión de la vida útil vs la cantidad de combustible

15

14
Vida útil

13

12

11
150 155 160 165 170 175 180 185 190 195 200
Cantidad de combustible
Fuente: Empresa A

a. Comente el diagrama de dispersión de estas variables.


280
UPC MA444 Estadística

b. Calcule e interprete los coeficientes de regresión estimados del ejemplo anterior, considerando
la siguiente información:

X:= cantidad de
N° Y:= vida útil xy x2 y2
combustible
1 150,4 10,8 1624,32 22620,16 116,64
2 156,3 11,5 1797,45 24429,69 132,25
3 162,5 12,0 1950,00 26406,25 144,00
4 165,8 12,4 2055,92 27489,64 153,76
5 172,5 13,2 2277,00 29756,25 174,24
6 168,9 13,7 2313,93 28527,21 187,69
7 184,5 13,9 2564,55 34040,25 193,21
8 185,9 14,1 2621,19 34558,81 198,81
9 187,2 14,8 2770,56 35043,84 219,04
10 199,4 15,0 2991,00 39760,36 225,00
Total 1733,4 131,4 22965,92 302632,46 1744,64

c. Interprete los valores de los coeficientes de regresión.

b0

b1
281
UPC MA444 Estadística
Validación del modelo de regresión lineal
No siempre la ecuación estimada es válida. Puede ocurrir que no exista pendiente, es decir que la
pendiente poblacional sea igual a 0. Esto significaría que no existe relación lineal entre las variables X
e Y. Es necesario entonces verificar si el modelo es válido.

El objetivo de esta prueba es probar que la pendiente poblacional β 1 es diferente a cero.

1. Establecer las hipótesis:

H 0 : β 1=0
H 1 : β1 ≠ 0

2. Fijar el nivel de significancia: α

3. Calcular el valor del estadístico de prueba.

CMReg
F cal=
CMError

El valor F cal se obtiene de la tabla del análisis de varianza. El análisis de la varianza es la


descomposición de la variación total en sus fuentes de variación: regresión y error (residual).

Fuente de Grados de Suma de Cuadrado medio Estadístico de


variación libertad cuadrados prueba
SCReg CMReg
Regresión 1 SCReg CMReg= F c=
1 CME
SCE
Error (residual) n –2 SCE CME=
n−2
Total n –1 SCT

Donde:

La suma de cuadrados de la regresión se calcula con:

( (∑ ) )
n 2

n
xi
SCReg= ^β ∑x −
2 2 i=1
1 i
i=1 n

La suma de cuadrados de los errores se calcula con:

SCE=SCT−SCReg
282
UPC MA444 Estadística
La suma de cuadrados total se calcula con:

( )
n 2

n ∑ yi
SCT =∑ y 2i −
i=1

i=1 n

4. Establecer la región crítica.

El valor crítico es F crit (α , 1 , n−2)

5. Aplicar los criterios de decisión.

Si F cal > Fcrit (α , 1 ,n−2), entonces se rechaza Ho


Si F cal ≤ F crit (α , 1 , n−2),entonces no se rechaza Ho

6. Realizar la conclusión

Si se rechaza Ho; con un nivel de significancia , el modelo de regresión es válido.


Si no se rechaza Ho; con un nivel de significancia , el modelo de regresión no es válido.

Ejemplo 1

A un nivel de significación del 5%, valide el modelo de regresión lineal del ejercicio anterior. Obtenga
el ANOVA del Excel.

1. Establecer las hipótesis:

H0 :
H1:

2. Fijar el nivel de significancia: α

3. Calcular el valor del estadístico de prueba.

CMReg
F cal=
CMError

4. Establecer la región crítica.

5. Aplicar los criterios de decisión.

6. Realizar la conclusión.
283
UPC MA444 Estadística
284
UPC MA444 Estadística
Coeficiente de determinación
Es una medida de bondad de ajuste del modelo. Nos indica que tan bueno es el modelo para explicar
el porcentaje de variabilidad de la variable dependiente Y. Por lo tanto, el coeficiente de
determinación R2 indica el porcentaje de la variabilidad de la variable Y que es explicada por X en el
modelo de regresión lineal estimado.

También nos ayuda a saber la precisión con la que se puede predecir o pronosticar el valor de la
variable dependiente, si se conocen los valores de la variable dependiente.

El coeficiente de determinación R2 se calcula de la siguiente manera:

2 SCReg
R= ×100 %
SCTot

Coeficiente de correlación
El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X e
Y. El coeficiente de correlación muestral se denota por r y varía dentro del intervalo de -1 a 1. El
coeficiente de correlación r siempre tiene el signo de la pendiente b1

r=
{√ R2
−√R
2
si b1 >0
si b1 <0

 Si b1 y r son positivos, entonces la relación entre las variables es directa.


 Si b1 y r son negativos, entonces la relación entre las variables es inversa.

Además,

 Cuando r = 0, indica que no existe correlación o asociación entre las variables.


 Cuando r se acerca -1 o a +1 indica que existe una asociación fuerte.
 Cuando r = -1 o r = +1, la correlación o asociación entre estas variables es perfecta.

En los resultados del Excel, el valor de r siempre se muestra en positivo. En el caso de que la
pendiente b1 sea negativa, deberá colocar al coeficiente de correlación r el signo negativo.

Los valores que se pueden tomar como referencia para determinar si existe o no una relación lineal
directa o inversa se muestra a continuación y pueden variar de acuerdo con el campo de estudio:
285
UPC MA444 Estadística
-1,0 -0,65 -0,2 0,2 0,65 1,0
Relación lineal fuerte e inversa No existe relación lineal Relación lineal fuerte y directa
Ejemplo 1

Indique qué valor de r2 y r que le corresponde a cada gráfico. Considere los siguientes valores: r =
0,95; r = -0,78 y r = 0,52. Además, indique el tipo de relación entre las variables.

Rellene los espacios en blanco.

Situación 1

El coeficiente de correlación es ……………..…………., por tanto, la relación entre las variables es


…………………….. y …………………………

El coeficiente de determinación es ……………………….

Situación 2

El coeficiente de correlación es …………………….……., por tanto, la relación entre las variables es


……………………….. y …………………………

El coeficiente de determinación es …………………….

Situación 3

El coeficiente de correlación es …………………………., por tanto, la relación entre las variables es


……………………….. y …………………………

El coeficiente de determinación es …………………….


286
UPC MA444 Estadística

Regresión usando una calculadora Casio

Coeficientes de regresión usando calculadora

Los pasos para obtener los valores de los coeficientes de regresión b 0 y b 1, el coeficiente de regresión
r usando una calculadora Casio son los siguientes:

1. Desactive la opción de frecuencias.


2. Ingrese al MODE 3: STAT.

3. Elija la opción 2: A+BX.

4. Ingrese los datos en ambas columnas, X e Y.

5. Presione Shift + 1. A continuación, presione 5: Reg.


287
UPC MA444 Estadística

Las opciones que se muestran son las siguientes:

1: A es el valor del intercepto b 0


2: B es el valor de la pendiente b 1
3: r es el valor del coeficiente de correlación
4: ^x es el valor estimado de la variable X para un valor dado de la variable Y
5: ^y es el valor estimado de la variable Y para un valor dado de la variable X

En la calculadora, b 0= A y b 1= B. Luego, el modelo de regresión es:

Y = A + B X ¿ b 0 + b1 x

En la calculadora, el coeficiente de correlación r = r.

Análisis de varianza usando calculadora

La tabla de análisis de varianza ANVA es la siguiente:

Fuente de Grados de Suma de Cuadrados Estadístico de


variación libertad cuadrados medio prueba
CMReg
Regresión 1 SCReg CMReg Fc=
CME
Error (residual) n−2 SCE CME

Total n−1 SCT

Para realizar la tabla de análisis de varianza se necesita calcular la suma de cuadrados total SCT , la
suma de cuadrados de la regresión SCReg y la suma de cuadrados de errores SCE.
288
UPC MA444 Estadística

Para calcular la suma de cuadrados total SCT usaremos la siguiente fórmula:

SCT =( n−1 ) S 2Y

Para calcular la suma de cuadrados de la regresión SCReg usaremos la siguiente fórmula:

2
SCReg=R × SCT

Para calcular la suma de cuadrados de errores SCE usaremos la siguiente fórmula:

SCE=SCT−SCReg

Los pasos en la calculadora son los siguientes:

1. Para calcular el valor del coeficiente de correlación r presione Shift + 1 y seleccione Reg, opción 3.
2. Para calcular el valor del coeficiente de determinación R2 eleve al cuadrado el valor de r.
3. Para calcular el valor SY ; seleccione Shift + 1, luego la opción 4 y luego elija 7: sy.

Ejemplo 1
Usando una calculadora Casio
Una empresa dedicada a la fabricación de equipos de telecomunicación considera que la vida útil de
los equipos puede estar explicada por la temperatura del ambiente en el que trabaja mediante una
relación lineal. Para encontrar la ecuación de regresión lineal de la vida útil de los quipos en función
de la temperatura del ambiente se tomó una muestra de 11 datos, los cuales se muestran en la tabla
siguiente:

Temperatura (ºC) 24 20 18 16 10 12 13 28 16 15 23
Vida útil (en años) 8,0 6,4 5,5 4,6 3,8 3,9 5,6 8,5 6,6 4,5 8,8

a. Indique la variable dependiente y la independiente.


b. Estime el modelo de regresión e interprete el coeficiente de regresión b 1.
c. Calcule e interprete el coeficiente de correlación.
d. Calcule e interprete el coeficiente de determinación.
a. Estime la vida útil de un equipo, en años, si la temperatura del medio ambiente donde trabaja es
de 10,5 °C.
e. Presente el cuadro de análisis de varianza.
289
UPC MA444 Estadística
f. Valide el modelo de regresión. Use un nivel de significancia del 5%.

Solución
a. Indique la variable dependiente y la independiente.

Solución

Variable dependiente: vida útil de los equipos (en años)


Variable independiente: temperatura del medio ambiente (en °C)

b. Estime el modelo de regresión e interprete el coeficiente de regresión b 1.

Solución

Siguiendo los pasos descritos en una calculadora Casio obtendrá las siguientes pantallas.

La ecuación del modelo de regresión es:

^y =b0 +b1 x= A+ Bx

Usando los valores de la calculadora:

^y =0,7984+0,2944 x

b 1 = 0,2944. Ante el incremento de 1°C en la temperatura del ambiente, la vida útil del equipo se
incrementa, en promedio, 0,2944 años.

c. Interprete el coeficiente de correlación.

Solución
290
UPC MA444 Estadística

El valor del coeficiente de correlación r = 0,9041


Entre las variables vida útil del equipo y la temperatura del medio ambiente en el que trabaja
existe una fuerte relación y es directa por ser el valor del coeficiente cercano a 1.

d. Interprete el coeficiente de determinación.

Solución

El valor del coeficiente de determinación R2 se obtiene elevando al cuadrado el valor del


coeficiente de correlación r. Luego, R2 = r2 = 0,90412 = 0,8174.

El 81,74% de la variabilidad total de la vida útil de un equipo está siendo explicada por la
temperatura del ambiente en el que trabaja en el modelo de regresión estimado.

e. Estime la vida útil de un equipo, en años, si la temperatura del medio ambiente donde trabaja es
de 10,5 °C.

Solución

Para estimar la vida útil, reemplazamos X = 10,5 en la ecuación de regresión:

^y =0,7984+0,2944 x

^y =0,7984+0,2944 × 10,5=3,89

La vida útil de un equipo, en años, estimada es 3,89 años; si la temperatura del medio ambiente
donde trabaja es de 10,5 °C.

f. Presente el cuadro de análisis de varianza.

Solución

La tabla de análisis de varianza ANVA es la siguiente:

Fuente de Grados de Suma de Cuadrados Estadístico de


variación libertad cuadrados medio prueba
CMReg
Regresión 1 SCReg CMReg Fc=
CME
291
UPC MA444 Estadística

Error (residual) n−2 SCE CME

Total n−1 SCT

Para realizar la tabla de análisis de varianza se necesitan calcular la suma de cuadrados de la


regresión SCReg, la suma de cuadrados de errores SCE y la suma de cuadrados total SCT .

Para calcular la suma de cuadrados total SCT usaremos la siguiente fórmula:

2
SCT =( n−1 ) S Y

Para calcular la suma de cuadrados de la regresión SCReg usaremos la siguiente fórmula:

2
SCReg=R × SCT

Para calcular la suma de cuadrados de errores SCE usaremos la siguiente fórmula:

SCE=SCT−SCReg

Usando los valores de la calculadora:

El valor del coeficiente de correlación r es r = 0,9040953415.

El valor del coeficiente de determinación R2 es r2 = 0,90409534152 = 0,8174.

Reemplazando:
SCT =( n−1 ) S 2y =10 ×1,80212=32,4756

SCReg=R2 × SCT =0,90412 × 32,4756=26,5456

SCE=SCT−SCReg=32,4756 – 26,545=5,9300

La tabla de análisis de varianza ANVA se calcula de la siguiente manera:

Fuente Grados de libertad Suma de Cuadrados medio Estadístico de


de cuadrados prueba
variación
26,5456 26,5456
Regresión 1 SCReg=26,5456 CMReg= Fc=
1 0,6589
292
UPC MA444 Estadística
Error 5,9300
n−2=11−2=9 SCE=5,9300 CME=
(residual) 9
Total n−1=11−1=10 SCT =32,4756

La tabla de análisis de varianza ANVA quedaría de la siguiente manera:


Fuente de Grados de libertad Suma de Cuadrado medio Estadístico de
variación cuadrados prueba
Regresión 1 26,5456 26,5456 40,2878
Error
9 5,9300 0,6589
(residual)
Total 10 32,4756

g. Valide el modelo de regresión. Considere un nivel de significancia del 5%.

Solución

Validar el modelo de regresión implica probar que la pendiente poblacional es diferente de cero,
por tanto, las hipótesis son:

H 0 β 1=0
H 1 β1≠ 0

El nivel de significancia del 5%; luego,  = 0,05.

El valor del estadístico de la prueba es:

CMReg 26,5458
F c= = =40,2878
CME 0,6590

Establecer la región crítica

F critico ( 0,05;1 ;11−2 ) =F critico (0.05 ;1 ; 9)=5,12


293
UPC MA444 Estadística
v1
α
v2 1 2 3 4 5 6 7 8 9 10

0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42

Decisión

Fc=40,2878> F critico (0.05; 1 ;9)=5,12, entonces, se rechaza H0.

Conclusión
Con un nivel de significación del 5%, el modelo es válido. Por lo tanto, existe una relación lineal
entre la vida útil del equipo y la temperatura del ambiente.

Caso: SYMA

Syma es una de las marcas más populares de drones sobre todo


porque lleva muchos años innovando y lanzando infinidad de
cuadricópteros que conquistan el mercado una y otra vez. Estos
drones destacan sobre todo por su bajo precio, su facilidad de
manejo y su robustez. Debido a las últimas investigaciones se sabe
que el tiempo de vuelo de los drones está en función de la
temperatura del medio ambiente.

La empresa desea incursionar en América Latina, donde las temperaturas son más cálidas, para lo
cual debe cumplir con un tiempo mínimo de vuelo de seis minutos a una temperatura ambiente de
30°C. De cumplir con la exigencia, ingresará al mercado latino, de lo contrario deberá realizar
reajustes a su dron.

Se ha encargado al área de producción realizar la estimación solicitada, para ello se seleccionó una
muestra de 10 drones. Los resultados se presentan a continuación:

Temperatura (°C) 25 26 20 25 23 18 18 20 21 22
Duración (minutos) 8,0 9,0 10,3 8,4 8,6 12,5 14,0 11,5 8,9 10,0

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Identifica las Realiza las pruebas En base a los Brinda una
problemática, variables, comenta necesarias de la resultados de la recomendación al
señalando el diagrama de técnica estadística evidencia muestral problema, sustentada
claramente el dispersión. aplicada e interpreta. interpreta los en los resultados
objetivo del Presenta el modelo Presenta el modelo valores de los encontrados en la
caso. a estimar e indica estimado y realiza la coeficientes de muestra de acuerdo
la herramienta a estimación puntual. correlación y con el contexto
usar. determinación. presentado.

Solución
294
UPC MA444 Estadística

Interpretación

Determinar si Syma ingresará al mercado latino donde las temperaturas son más cálidas.

Representación

Variable dependiente: Tiempo de vuelo (minutos)


Variable independiente: Temperatura del medio ambiente (°C)

Dispersión de del tiempo de vuelo vs la temperatura del medio ambiente

15
14
13
12
Duración (min)

11
10
9
8
7
6
17 18 19 20 21 22 23 24 25 26 27
Temperatura (°C)
Fuente Syma S.A.

Se observa una relación inversa, es decir a mayor valor de la temperatura en el ambiente menor será
el tiempo de vuelo (minutos).

El modelo por estimar es:


Y^ =b0 ±b 1 X

La herramienta que usaremos será la regresión lineal simple.

Cálculo

Fuente de variación Grados de libertad Suma de cuadrados Promedio de los cuadrados F


Regresión 1 26.147 26.1467 23.17
Residuos 8 9.029 1.1287
Total 9 35.176

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.86215497
Coeficiente de determinación R^2 0.74331119
295
UPC MA444 Estadística
El modelo de regresión estimado es:

Y^ =b0−b1 X

Y^ =22,94−0,588 X

La interpretación de la pendiente es b 1=−0,588 .

Si la temperatura del medio ambiente se incrementa en 1°C el tiempo de vuelo de los drones
disminuye en 0,588 minutos.

Validación del modelo

Validar el modelo de regresión implica probar que la pendiente poblacional es diferente de cero, por
tanto, las hipótesis son:

H 0 β 1=0
H 1 β1≠ 0

El nivel de significancia del 5%; luego,  = 0,05.

El valor del estadístico de la prueba es:

CMReg 26,1467
F cal= = =23,17
CMError 1,1287

Establezcamos la región crítica:

El valor crítico es:

F crítico (0,05 , 1 ,9)=5,12

v1
α
v2 1 2 3 4 5 6 7 8 9 10
     
0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025   7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010   10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005   13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42
296
UPC MA444 Estadística

Como F cal=23,17> F crítico =5,12, entonces se rechaza H0.

Conclusión
Con un nivel de significación del 5 %, el modelo es válido. Por lo tanto, existe una relación lineal entre
la vida útil del equipo y la temperatura del ambiente.

Y^ =22,94−0,588× 30=5,3

Para una temperatura de 30°C, el tiempo de vuelo estimado es de 5,3 minutos.

Análisis
R2 = (26,147/35,176) x100% = 74,33% o directamente de la tabla 0,7433x100% = 74,33%

Interpretación
El 74,33% de la variabilidad total de la duración del tiempo de vuelo de los drones es explicada por la
temperatura en el modelo de regresión estimado.

r = 0,8622
Entre las variables tiempo de vuelo y la temperatura del medio ambiente existe una relación fuerte y
es directa por ser el valor del coeficiente de correlación cercano a 1.

Argumentación
No se cumple con la exigencia de un tiempo mínimo de vuelo de 6 minutos a una temperatura de
30°C. Por lo tanto, la empresa deberá realizar ajustes a su dron.
297
UPC MA444 Estadística
Ejercicios propuestos

80. Para la construcción de carreteras que experimentan heladas intensas, es importante que la
densidad del concreto (kg/m2) seleccionado tenga un valor bajo de conductividad térmica
(watts/metros.Kelvin) para reducir al mínimo los daños provocados por cambios de
temperatura. Por lo tanto, se desea estimar la conductividad térmica en función de la densidad
que posee el concreto. Por lo tanto, se toman 12 trozos al azar de diferentes densidades de
concreto y se registra la conductividad. Los datos se muestran en la siguiente tabla:

Densidad del concreto 300 400 500 600 700 800 900 1000 1100 1200 1400 1600
Conductividad térmica 0,065 0,08 0,095 0,115 0,13 0,15 0,175 0,205 0,23 0,27 0,346 0,436

a. Indique la variable dependiente y la independiente.


b. Comente el diagrama de dispersión o plot.
c. Presente la ecuación de la recta o modelo de regresión estimado.
d. Interprete el valor de la pendiente de la recta.
e. Valide el modelo Use 1% de significancia.
f. Interprete el coeficiente de determinación y correlación.
g. Estime la conductividad térmica cuando la densidad del concreto es 850 kg/m2.

81. Export es una empresa proveedora de GPS para automóviles de diferentes modelos. El jefe del
departamento de ventas ha implementado charlas motivadoras para sus agentes vendedores y
desea modelar mediante una relación lineal la eficiencia en ventas (%) en función al tiempo
acumulado de horas en las que estuvo presente el agente vendedor en las charlas de
capacitación durante el último trimestre.

Los siguientes datos corresponden a una muestra aleatoria de 10 agentes vendedores. Se


registró el tiempo acumulado de horas en las que estuvo presente el agente vendedor en las
charlas de capacitación durante el último trimestre y la eficiencia de sus ventas.

Eficiencia en las ventas (%) 47 84 80 46 62 72 52 87 37 68


Tiempo acumulado, en horas 27 45 41 19 35 39 19 49 15 31

a. Indique la variable dependiente y la independiente.


b. Presente el gráfico del plot y comente.
c. Presente la ecuación de la recta.
d. Interprete los coeficientes del modelo de regresión estimado.
e. Realice el proceso de validación del modelo, con un nivel de significación de 5%.
f. Interprete el coeficiente de determinación y el de correlación.
g. Estime la eficiencia de la venta cuando el agente vendedor ha acumulado 20 horas de
capacitación.

82. El área de producción del fabricante NanoTec registró el tiempo de vuelo de los drones del
modelo CX-STAR en función de la temperatura del medio ambiente. Para una muestra de 10
drones se tienen los siguientes resultados:

Temperatura (°C) 25 26 20 25 23 18 18 20 21 22
Tiempo de vuelo (min.) 8 9 10,3 8,4 8,6 12,5 14 11,5 8,9 10
298
UPC MA444 Estadística

a. Presente el gráfico del plot y comente.


b. Obtenga el modelo estimado de regresión lineal simple.
c. Interprete el coeficiente de regresión.
d. Valide el modelo estimado. Use  = 0,05.
e. Determine e interprete el coeficiente de determinación.
f. Estime el tiempo de vuelo cuando la temperatura del medio ambiente es 24°C.
299
UPC MA444 Estadística

Tablas estadísticas
Tabla de la distribución normal estándar

Área bajo la curva normal P ( Z ≤ z )=α

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233
-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350
                     
-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621
-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
                     
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681
-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866
                     
-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
300
UPC MA444 Estadística
301
UPC MA444 Estadística
Tabla de la distribución normal estándar

Área bajo la curva normal P ( Z ≤ z )=α

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
                     
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
                     
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
                     
3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
302
UPC MA444 Estadística
Tabla de la distribución t - Student

Área bajo la curva P ( T ≥ c )=α

α
υ 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1 0.32492 0.72654 1.37638 1.96261 3.07768 6.31375 7.91582 10.57889 12.7062 15.89454 21.20495 31.82052 63.65674
2 0.28868 0.61721 1.06066 1.38621 1.88562 2.91999 3.31976 3.89643 4.30265 4.84873 5.64278 6.96456 9.92484
3 0.27667 0.58439 0.97847 1.24978 1.63774 2.35336 2.60543 2.95051 3.18245 3.48191 3.89605 4.54070 5.84091
4 0.27072 0.56865 0.94096 1.18957 1.53321 2.13185 2.33287 2.60076 2.77645 2.99853 3.29763 3.74695 4.60409
5 0.26718 0.55943 0.91954 1.15577 1.47588 2.01505 2.19096 2.42158 2.57058 2.75651 3.00287 3.36493 4.03214
6 0.26483 0.55338 0.9057 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539
9 0.26096 0.54348 0.8834 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.5738 2.82144 3.24984
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927

11 0.25956 0.53994 0.87553 1.08767 1.36343 1.79588 1.92843 2.09614 2.20099 2.32814 2.49066 2.71808 3.10581
12 0.25903 0.53862 0.87261 1.08321 1.35622 1.78229 1.91231 2.07644 2.17881 2.30272 2.46070 2.68100 3.05454
13 0.25859 0.5375 0.87015 1.07947 1.35017 1.77093 1.89887 2.06004 2.16037 2.2816 2.43585 2.65031 3.01228
14 0.25821 0.53655 0.86805 1.07628 1.34503 1.76131 1.8875 2.04617 2.14479 2.26378 2.41490 2.62449 2.97684
15 0.25789 0.53573 0.86624 1.07353 1.34061 1.75305 1.87774 2.03429 2.13145 2.24854 2.39701 2.60248 2.94671
16 0.25760 0.53501 0.86467 1.07114 1.33676 1.74588 1.86928 2.02400 2.11991 2.23536 2.38155 2.58349 2.92078
17 0.25735 0.53438 0.86328 1.06903 1.33338 1.73961 1.86187 2.01500 2.10982 2.22385 2.36805 2.56693 2.89823
18 0.25712 0.53382 0.86205 1.06717 1.33039 1.73406 1.85534 2.00707 2.10092 2.21370 2.35618 2.55238 2.87844
19 0.25692 0.53331 0.86095 1.06551 1.32773 1.72913 1.84953 2.00002 2.09302 2.20470 2.34565 2.53948 2.86093
20 0.25674 0.53286 0.85996 1.06402 1.32534 1.72472 1.84433 1.99371 2.08596 2.19666 2.33624 2.52798 2.84534

21 0.25658 0.53246 0.85907 1.06267 1.32319 1.72074 1.83965 1.98804 2.07961 2.18943 2.32779 2.51765 2.83136
22 0.25643 0.53208 0.85827 1.06145 1.32124 1.71714 1.83542 1.98291 2.07387 2.18289 2.32016 2.50832 2.81876
23 0.25630 0.53175 0.85753 1.06034 1.31946 1.71387 1.83157 1.97825 2.06866 2.17696 2.31323 2.49987 2.80734
24 0.25617 0.53144 0.85686 1.05932 1.31784 1.71088 1.82805 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694
25 0.25606 0.53115 0.85624 1.05838 1.31635 1.70814 1.82483 1.9701 2.05954 2.16659 2.30113 2.48511 2.78744
26 0.25595 0.53089 0.85567 1.05752 1.31497 1.70562 1.82186 1.96651 2.05553 2.16203 2.29581 2.47863 2.77871
27 0.25586 0.53065 0.85514 1.05673 1.3137 1.70329 1.81913 1.96320 2.05183 2.15782 2.29091 2.47266 2.77068
28 0.25577 0.53042 0.85465 1.05599 1.31253 1.70113 1.81659 1.96014 2.04841 2.15393 2.28638 2.46714 2.76326
29 0.25568 0.53021 0.85419 1.05530 1.31143 1.69913 1.81424 1.95729 2.04523 2.15033 2.28217 2.46202 2.75639
30 0.25561 0.53002 0.85377 1.05466 1.31042 1.69726 1.81205 1.95465 2.04227 2.14697 2.27826 2.45726 2.75000

31 0.25553 0.52984 0.85337 1.05406 1.30946 1.69552 1.81000 1.95218 2.03951 2.14383 2.27461 2.45282 2.74404
32 0.25546 0.52967 0.853 1.0535 1.30857 1.69389 1.80809 1.94987 2.03693 2.14090 2.27120 2.44868 2.73848
33 0.25540 0.5295 0.85265 1.05298 1.30774 1.69236 1.80629 1.94770 2.03452 2.13816 2.26801 2.44479 2.73328
34 0.25534 0.52935 0.85232 1.05248 1.30695 1.69092 1.80461 1.94567 2.03224 2.13558 2.26501 2.44115 2.72839
35 0.25528 0.52921 0.85201 1.05202 1.30621 1.68957 1.80302 1.94375 2.03011 2.13316 2.26219 2.43772 2.72381
36 0.25523 0.52908 0.85172 1.05158 1.30551 1.6883 1.80153 1.94195 2.02809 2.13087 2.25953 2.43449 2.71948
37 0.25518 0.52895 0.85144 1.05117 1.30485 1.68709 1.80012 1.94024 2.02619 2.12871 2.25702 2.43145 2.71541
38 0.25513 0.52883 0.85118 1.05077 1.30423 1.68595 1.79878 1.93863 2.02439 2.12667 2.25465 2.42857 2.71156
39 0.25508 0.52871 0.85094 1.0504 1.30364 1.68488 1.79751 1.93711 2.02269 2.12474 2.25240 2.42584 2.70791
40 0.25504 0.52861 0.85070 1.05005 1.30308 1.68385 1.79631 1.93566 2.02108 2.12291 2.25027 2.42326 2.70446
303
UPC MA444 Estadística
Tabla de la distribución t – Student

Área bajo la curva P ( T ≥ c )=α

α
υ 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
41 0.25500 0.52850 0.85048 1.04971 1.30254 1.68288 1.79517 1.93428 2.01954 2.12117 2.24825 2.42080 2.70118
42 0.25496 0.52840 0.85026 1.04939 1.30204 1.68195 1.79409 1.93298 2.01808 2.11952 2.24633 2.41847 2.69807
43 0.25492 0.52831 0.85006 1.04908 1.30155 1.68107 1.79305 1.93173 2.01669 2.11794 2.24449 2.41625 2.69510
44 0.25488 0.52822 0.84987 1.04879 1.30109 1.68023 1.79207 1.93054 2.01537 2.11644 2.24275 2.41413 2.69228
45 0.25485 0.52814 0.84968 1.04852 1.30065 1.67943 1.79113 1.92941 2.0141 2.11500 2.24108 2.41212 2.68959
46 0.25482 0.52805 0.84951 1.04825 1.30023 1.67866 1.79023 1.92833 2.0129 2.11364 2.23949 2.41019 2.68701
47 0.25479 0.52798 0.84934 1.04800 1.29982 1.67793 1.78937 1.92729 2.01174 2.11233 2.23797 2.40835 2.68456
48 0.25476 0.52790 0.84917 1.04775 1.29944 1.67722 1.78855 1.92630 2.01063 2.11107 2.23652 2.40658 2.68220
49 0.25473 0.52783 0.84902 1.04752 1.29907 1.67655 1.78776 1.92535 2.00958 2.10987 2.23512 2.40489 2.67995
50 0.25470 0.52776 0.84887 1.04729 1.29871 1.67591 1.78700 1.92444 2.00856 2.10872 2.23379 2.40327 2.67779

51 0.25467 0.52769 0.84873 1.04708 1.29837 1.67528 1.78627 1.92356 2.00758 2.10762 2.2325 2.40172 2.67572
52 0.25465 0.52763 0.84859 1.04687 1.29805 1.67469 1.78558 1.92272 2.00665 2.10655 2.23127 2.40022 2.67373
53 0.25462 0.52757 0.84846 1.04667 1.29773 1.67412 1.78491 1.92191 2.00575 2.10553 2.23009 2.39879 2.67182
54 0.25460 0.52751 0.84833 1.04648 1.29743 1.67356 1.78426 1.92114 2.00488 2.10455 2.22895 2.39741 2.66998
55 0.25458 0.52745 0.84821 1.04630 1.29713 1.67303 1.78364 1.92039 2.00404 2.10361 2.22785 2.39608 2.66822
56 0.25455 0.52740 0.84809 1.04612 1.29685 1.67252 1.78304 1.91967 2.00324 2.10270 2.22679 2.39480 2.66651
57 0.25453 0.52735 0.84797 1.04595 1.29658 1.67203 1.78246 1.91897 2.00247 2.10182 2.22577 2.39357 2.66487
58 0.25451 0.52730 0.84786 1.04578 1.29632 1.67155 1.78190 1.9183 2.00172 2.10097 2.22479 2.39238 2.66329
59 0.25449 0.52725 0.84776 1.04562 1.29607 1.67109 1.78137 1.91765 2.00100 2.10015 2.22384 2.39123 2.66176
60 0.25447 0.52720 0.84765 1.04547 1.29582 1.67065 1.78085 1.91703 2.00030 2.09936 2.22292 2.39012 2.66028

61 0.25445 0.52715 0.84755 1.04532 1.29558 1.67022 1.78034 1.91642 1.99962 2.0986 2.22204 2.38905 2.65886
62 0.25444 0.52711 0.84746 1.04518 1.29536 1.6698 1.77986 1.91584 1.99897 2.09786 2.22118 2.38801 2.65748
63 0.25442 0.52706 0.84736 1.04504 1.29513 1.6694 1.77939 1.91527 1.99834 2.09715 2.22035 2.38701 2.65615
64 0.25440 0.52702 0.84727 1.04490 1.29492 1.66901 1.77893 1.91472 1.99773 2.09645 2.21955 2.38604 2.65485
65 0.25439 0.52698 0.84719 1.04477 1.29471 1.66864 1.77849 1.91419 1.99714 2.09578 2.21877 2.38510 2.65360
66 0.25437 0.52694 0.84710 1.04464 1.29451 1.66827 1.77806 1.91368 1.99656 2.09514 2.21802 2.38419 2.65239
67 0.25436 0.52690 0.84702 1.04452 1.29432 1.66792 1.77765 1.91318 1.99601 2.09451 2.21729 2.38330 2.65122
68 0.25434 0.52687 0.84694 1.04440 1.29413 1.66757 1.77724 1.91269 1.99547 2.09390 2.21658 2.38245 2.65008
69 0.25433 0.52683 0.84686 1.04428 1.29394 1.66724 1.77685 1.91222 1.99495 2.09330 2.21589 2.38161 2.64898
70 0.25431 0.52680 0.84679 1.04417 1.29376 1.66691 1.77647 1.91177 1.99444 2.09273 2.21523 2.38081 2.64790

75 0.25425 0.52664 0.84644 1.04365 1.29294 1.66543 1.77473 1.90967 1.9921 2.09008 2.21216 2.37710 2.64298
80 0.25419 0.5265 0.84614 1.04320 1.29222 1.66412 1.77321 1.90784 1.99006 2.08778 2.20949 2.37387 2.63869
85 0.25414 0.52637 0.84587 1.0428 1.29159 1.66298 1.77187 1.90623 1.98827 2.08574 2.20713 2.37102 2.63491
90 0.25410 0.52626 0.84563 1.04244 1.29103 1.66196 1.77068 1.90480 1.98667 2.08394 2.20504 2.36850 2.63157
95 0.25406 0.52616 0.84542 1.04212 1.29053 1.66105 1.76961 1.90352 1.98525 2.08233 2.20317 2.36624 2.62858
100 0.25402 0.52608 0.84523 1.04184 1.29007 1.66023 1.76866 1.90237 1.98397 2.08088 2.20150 2.36422 2.62589
105 0.25399 0.52600 0.84506 1.04158 1.28967 1.65950 1.76779 1.90133 1.98282 2.07958 2.19998 2.36239 2.62347
110 0.25396 0.52592 0.84490 1.04134 1.28930 1.65882 1.76701 1.90039 1.98177 2.07839 2.19861 2.36073 2.62126
120 0.25391 0.52580 0.84463 1.04093 1.28865 1.65765 1.76564 1.89874 1.97993 2.07631 2.19620 2.35782 2.61742
∞ 0.25335 0.52440 0.84162 1.03643 1.28156 1.64484 1.75069 1.88079 1.95997 2.05375 2.17009 2.32635 2.57583
304
UPC MA444 Estadística
Tabla de la distribución F

Área bajo la curva: P ( F ≥ c )=α


v1
α v2 1 2 3 4 5 6 7 8 9 10
0.050 1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 241.88
0.025   647.79 799.48 864.15 899.60 921.83 937.11 948.20 956.64 963.28 968.63
0.010   4052.18 4999.34 5403.53 5624.26 5763.96 5858.95 5928.33 5980.95 6022.40 6055.93
0.005   16212.46 19997.36 21614.13 22500.75 23055.82 23439.53 23715.20 23923.81 24091.45 24221.84
     

0.050 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40
0.025   38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40
0.010   98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40
0.005   198.50 199.01 199.16 199.24 199.30 199.33 199.36 199.38 199.39 199.39
     

0.050 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79
0.025   17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42
0.010   34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23
0.005   55.55 49.80 47.47 46.20 45.39 44.84 44.43 44.13 43.88 43.68
     

0.050 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96
0.025   12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84
0.010   21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55
0.005   31.33 26.28 24.26 23.15 22.46 21.98 21.62 21.35 21.14 20.97
     

0.050 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74
0.025   10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62
0.010   16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05
0.005   22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62
     

0.050 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06
0.025   8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46
0.010   13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87
0.005   18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25
     

0.050 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64
0.025   8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76
0.010   12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62
0.005   16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38
     

0.050 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35
0.025   7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30
0.010   11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81
0.005   14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21
     

0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025   7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010   10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005   13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42
     

0.050 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98
0.025   6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72
0.010   10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85
0.005   12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85
     

0.050 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85
0.025   6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53
0.010   9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54
0.005   12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.42
     

0.050 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75
0.025   6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37
0.010   9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30
0.005   11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09
305
UPC MA444 Estadística
306
UPC MA444 Estadística
Tabla de la distribución F

Área bajo la curva: P ( F ≥ c )=α


v1
α v2 12 15 20 24 30 40 50 60 70 120
0.050 1 243.90 245.95 248.02 249.05 250.10 251.14 251.77 252.20 252.50 253.25
0.025   976.72 984.87 993.08 997.27 1001.40 1005.60 1008.10 1009.79 1011.01 1014.04
0.010   6106.68 6156.97 6208.66 6234.27 6260.35 6286.43 6302.26 6312.97 6320.89 6339.51
0.005   24426.73 24631.62 24836.51 24937.09 25041.40 25145.71 25212.76 25253.74 25283.55 25358.05
     

0.050 2 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.48 19.48 19.49
0.025   39.41 39.43 39.45 39.46 39.46 39.47 39.48 39.48 39.48 39.49
0.010   99.42 99.43 99.45 99.46 99.47 99.48 99.48 99.48 99.48 99.49
0.005   199.42 199.43 199.45 199.45 199.48 199.48 199.48 199.48 199.48 199.49
     

0.050 3 8.74 8.70 8.66 8.64 8.62 8.59 8.58 8.57 8.57 8.55
0.025   14.34 14.25 14.17 14.12 14.08 14.04 14.01 13.99 13.98 13.95
0.010   27.05 26.87 26.69 26.60 26.50 26.41 26.35 26.32 26.29 26.22
0.005   43.39 43.08 42.78 42.62 42.47 42.31 42.21 42.15 42.10 41.99
     

0.050 4 5.91 5.86 5.80 5.77 5.75 5.72 5.70 5.69 5.68 5.66
0.025   8.75 8.66 8.56 8.51 8.46 8.41 8.38 8.36 8.35 8.31
0.010   14.37 14.20 14.02 13.93 13.84 13.75 13.69 13.65 13.63 13.56
0.005   20.70 20.44 20.17 20.03 19.89 19.75 19.67 19.61 19.57 19.47
     

0.050 5 4.68 4.62 4.56 4.53 4.50 4.46 4.44 4.43 4.42 4.40
0.025   6.52 6.43 6.33 6.28 6.23 6.18 6.14 6.12 6.11 6.07
0.010   9.89 9.72 9.55 9.47 9.38 9.29 9.24 9.20 9.18 9.11
0.005   13.38 13.15 12.90 12.78 12.66 12.53 12.45 12.40 12.37 12.27
     

0.050 6 4.00 3.94 3.87 3.84 3.81 3.77 3.75 3.74 3.73 3.70
0.025   5.37 5.27 5.17 5.12 5.07 5.01 4.98 4.96 4.94 4.90
0.010   7.72 7.56 7.40 7.31 7.23 7.14 7.09 7.06 7.03 6.97
0.005   10.03 9.81 9.59 9.47 9.36 9.24 9.17 9.12 9.09 9.00
     

0.050 7 3.57 3.51 3.44 3.41 3.38 3.34 3.32 3.30 3.29 3.27
0.025   4.67 4.57 4.47 4.41 4.36 4.31 4.28 4.25 4.24 4.20
0.010   6.47 6.31 6.16 6.07 5.99 5.91 5.86 5.82 5.80 5.74
0.005   8.18 7.97 7.75 7.64 7.53 7.42 7.35 7.31 7.28 7.19
     

0.050 8 3.28 3.22 3.15 3.12 3.08 3.04 3.02 3.01 2.99 2.97
0.025   4.20 4.10 4.00 3.95 3.89 3.84 3.81 3.78 3.77 3.73
0.010   5.67 5.52 5.36 5.28 5.20 5.12 5.07 5.03 5.01 4.95
0.005   7.01 6.81 6.61 6.50 6.40 6.29 6.22 6.18 6.15 6.06
     

0.050 9 3.07 3.01 2.94 2.90 2.86 2.83 2.80 2.79 2.78 2.75
0.025   3.87 3.77 3.67 3.61 3.56 3.51 3.47 3.45 3.43 3.39
0.010   5.11 4.96 4.81 4.73 4.65 4.57 4.52 4.48 4.46 4.40
0.005   6.23 6.03 5.83 5.73 5.62 5.52 5.45 5.41 5.38 5.30
   

0.050 10 2.91 2.85 2.77 2.74 2.70 2.66 2.64 2.62 2.61 2.58
0.025 3.62 3.52 3.42 3.37 3.31 3.26 3.22 3.20 3.18 3.14
0.010 4.71 4.56 4.41 4.33 4.25 4.17 4.12 4.08 4.06 4.00
0.005 5.66 5.47 5.27 5.17 5.07 4.97 4.90 4.86 4.83 4.75
   

0.050 11 2.79 2.72 2.65 2.61 2.57 2.53 2.51 2.49 2.48 2.45
0.025 3.43 3.33 3.23 3.17 3.12 3.06 3.03 3.00 2.99 2.94
0.010 4.40 4.25 4.10 4.02 3.94 3.86 3.81 3.78 3.75 3.69
0.005 5.24 5.05 4.86 4.76 4.65 4.55 4.49 4.45 4.41 4.34
   

0.050 12 2.69 2.62 2.54 2.51 2.47 2.43 2.40 2.38 2.37 2.34
0.025 3.28 3.18 3.07 3.02 2.96 2.91 2.87 2.85 2.83 2.79
0.010 4.16 4.01 3.86 3.78 3.70 3.62 3.57 3.54 3.51 3.45
0.005 4.91 4.72 4.53 4.43 4.33 4.23 4.17 4.12 4.09 4.01
307
UPC MA444 Estadística
308
UPC MA444 Estadística
Tabla de la distribución F

Área bajo la curva: P ( F ≥ c )=α


v1
α v2 1 2 3 4 5 6 7 8 9 10
0.050 13 4.7 3.8 3.4 3.2 3.0 2.9 2.8 2.8 2.7 2.7
0.025   6.4 5.0 4.3 4.0 3.8 3.6 3.5 3.4 3.3 3.2
0.010   9.1 6.7 5.7 5.2 4.9 4.6 4.4 4.3 4.2 4.1
0.005   11.4 8.2 6.9 6.2 5.8 5.5 5.3 5.1 4.9 4.8
       

0.050 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60
0.025   6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15
0.010   8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94
0.005   11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.60
       

0.050 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54
0.025   6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06
0.010   8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80
0.005   10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42
       

0.050 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35
0.025   5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77
0.010   8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37
0.005   9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85
       

0.050 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25
0.025   5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64
0.010   7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17
0.005   9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59
       

0.050 30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16
0.025   5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51
0.010   7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98
0.005   9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.34
       

0.050 40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08
0.025   5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39
0.010   7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80
0.005   8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.12
       

0.050 45 4.06 3.20 2.81 2.58 2.42 2.31 2.22 2.15 2.10 2.05
0.025   5.38 4.01 3.42 3.09 2.86 2.70 2.58 2.49 2.41 2.35
0.010   7.23 5.11 4.25 3.77 3.45 3.23 3.07 2.94 2.83 2.74
0.005   8.71 5.97 4.89 4.29 3.91 3.64 3.43 3.28 3.15 3.04
       

0.050 50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03
0.025   5.34 3.97 3.39 3.05 2.83 2.67 2.55 2.46 2.38 2.32
0.010   7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70
0.005   8.63 5.90 4.83 4.23 3.85 3.58 3.38 3.22 3.09 2.99
       

0.050 60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99
0.025   5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27
0.010   7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63
0.005   8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.90
       

0.050 70 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.02 1.97
0.025   5.25 3.89 3.31 2.97 2.75 2.59 2.47 2.38 2.30 2.24
0.010   7.01 4.92 4.07 3.60 3.29 3.07 2.91 2.78 2.67 2.59
0.005   8.40 5.72 4.66 4.08 3.70 3.43 3.23 3.08 2.95 2.85
       

0.050 120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91
0.025   5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16
0.010   6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47
0.005   8.18 5.54 4.50 3.92 3.55 3.28 3.09 2.93 2.81 2.71
309
UPC MA444 Estadística
310
UPC MA444 Estadística
Tabla de la distribución F

Área bajo la curva: P ( F ≥ c )=α


v1
α v2 12 15 20 24 30 40 50 60 70 120
0.050 13 2.6 2.5 2.5 2.4 2.4 2.3 2.3 2.3 2.3 2.3
0.025   3.2 3.1 2.9 2.9 2.8 2.8 2.7 2.7 2.7 2.7
0.010   4.0 3.8 3.7 3.6 3.5 3.4 3.4 3.3 3.3 3.3
0.005   4.6 4.5 4.3 4.2 4.1 4.0 3.9 3.9 3.8 3.8
       

0.050 14 2.53 2.46 2.39 2.35 2.31 2.27 2.24 2.22 2.21 2.18
0.025   3.05 2.95 2.84 2.79 2.73 2.67 2.64 2.61 2.60 2.55
0.010   3.80 3.66 3.51 3.43 3.35 3.27 3.22 3.18 3.16 3.09
0.005   4.43 4.25 4.06 3.96 3.86 3.76 3.70 3.66 3.62 3.55
       

0.050 15 2.48 2.40 2.33 2.29 2.25 2.20 2.18 2.16 2.15 2.11
0.025   2.96 2.86 2.76 2.70 2.64 2.59 2.55 2.52 2.51 2.46
0.010   3.67 3.52 3.37 3.29 3.21 3.13 3.08 3.05 3.02 2.96
0.005   4.25 4.07 3.88 3.79 3.69 3.59 3.52 3.48 3.45 3.37
       

0.050 20 2.28 2.20 2.12 2.08 2.04 1.99 1.97 1.95 1.93 1.90
0.025   2.68 2.57 2.46 2.41 2.35 2.29 2.25 2.22 2.20 2.16
0.010   3.23 3.09 2.94 2.86 2.78 2.69 2.64 2.61 2.58 2.52
0.005   3.68 3.50 3.32 3.22 3.12 3.02 2.96 2.92 2.88 2.81
       

0.050 24 2.18 2.11 2.03 1.98 1.94 1.89 1.86 1.84 1.83 1.79
0.025   2.54 2.44 2.33 2.27 2.21 2.15 2.11 2.08 2.06 2.01
0.010   3.03 2.89 2.74 2.66 2.58 2.49 2.44 2.40 2.38 2.31
0.005   3.42 3.25 3.06 2.97 2.87 2.77 2.70 2.66 2.63 2.55
       

0.050 30 2.09 2.01 1.93 1.89 1.84 1.79 1.76 1.74 1.72 1.68
0.025   2.41 2.31 2.20 2.14 2.07 2.01 1.97 1.94 1.92 1.87
0.010   2.84 2.70 2.55 2.47 2.39 2.30 2.25 2.21 2.18 2.11
0.005   3.18 3.01 2.82 2.73 2.63 2.52 2.46 2.42 2.38 2.30
       

0.050 40 2.00 1.92 1.84 1.79 1.74 1.69 1.66 1.64 1.62 1.58
0.025   2.29 2.18 2.07 2.01 1.94 1.88 1.83 1.80 1.78 1.72
0.010   2.66 2.52 2.37 2.29 2.20 2.11 2.06 2.02 1.99 1.92
0.005   2.95 2.78 2.60 2.50 2.40 2.30 2.23 2.18 2.15 2.06
       

0.050 45 1.97 1.89 1.81 1.76 1.71 1.66 1.63 1.60 1.59 1.54
0.025   2.25 2.14 2.03 1.96 1.90 1.83 1.79 1.76 1.74 1.68
0.010   2.61 2.46 2.31 2.23 2.14 2.05 2.00 1.96 1.93 1.85
0.005   2.88 2.71 2.53 2.43 2.33 2.22 2.16 2.11 2.08 1.99
       

0.050 50 1.95 1.87 1.78 1.74 1.69 1.63 1.60 1.58 1.56 1.51
0.025   2.22 2.11 1.99 1.93 1.87 1.80 1.75 1.72 1.70 1.64
0.010   2.56 2.42 2.27 2.18 2.10 2.01 1.95 1.91 1.88 1.80
0.005   2.82 2.65 2.47 2.37 2.27 2.16 2.10 2.05 2.02 1.93
       

0.050 60 1.92 1.84 1.75 1.70 1.65 1.59 1.56 1.53 1.52 1.47
0.025   2.17 2.06 1.94 1.88 1.82 1.74 1.70 1.67 1.64 1.58
0.010   2.50 2.35 2.20 2.12 2.03 1.94 1.88 1.84 1.81 1.73
0.005   2.74 2.57 2.39 2.29 2.19 2.08 2.01 1.96 1.93 1.83
       

0.050 70 1.89 1.81 1.72 1.67 1.62 1.57 1.53 1.50 1.49 1.44
0.025   2.14 2.03 1.91 1.85 1.78 1.71 1.66 1.63 1.60 1.54
0.010   2.45 2.31 2.15 2.07 1.98 1.89 1.83 1.78 1.75 1.67
0.005   2.68 2.51 2.33 2.23 2.13 2.02 1.95 1.90 1.86 1.77
       

0.050 120 1.83 1.75 1.66 1.61 1.55 1.50 1.46 1.43 1.41 1.35
0.025   2.05 1.94 1.82 1.76 1.69 1.61 1.56 1.53 1.50 1.43
0.010   2.34 2.19 2.03 1.95 1.86 1.76 1.70 1.66 1.62 1.53
0.005   2.54 2.37 2.19 2.09 1.98 1.87 1.80 1.75 1.71 1.61
311
UPC MA444 Estadística
312
UPC MA444 Estadística
Índice

B Circular, 19
de barras, 19
Bayes histograma, 36
Teorema de, 89 ojiva, 36
Pareto, 22
C
M
Censo, 147
Coeficiente de correlación, 221 Marca de clase, 32
Coeficiente de determinación, 221 Media
aritmética, 43
Medidas de tendencia central, 43
D Medidas de variación
Distribución Desviación estándar, 54
binomial, 105 Varianza, 54
continua, 130 Moda, 49
exponencial, 130 Muestra, 7
normal, 134 Muestreo, 147
normal estándar, 134, 135 aleatorio simple, 149
Poisson, 109 probabilístico, 149

E P
Escalas de medición Parámetro, 16, 42
intervalo, 10 Probabilidad
nominal, 10 condicional, 80
ordinal, 10 Prueba de hipótesis
razón, 10 media poblacional, 167
Esperado medias poblacionales, 186
de una variable discreta, 102 proporción poblacional, 176
de variable continua, 125 varianzas poblacionales, 183
Estadística
definición, 6 R
descriptiva, 6, 98
inferencial, 6 Regla multiplicativa
Estadístico, 16, 42 para eventos independientes, 83
Evento Regresión
complementario, 70 lineal, 215
compuesto, 67
independientes, 83
mutuamente excluyentes, 67
T
simple, 66 Tamaño de muestra
Experimento aleatorio, 66 media de una población, 158
Tipos de errores, 165
F
Frecuencia
V
acumulada absoluta, 28 Variable
porcentual, 28 aleatoria continua, 117
Función aleatoria discreta, 99
de densidad, 117 continua, 9
de distribución acumulada, 120 cualitativa, 9
cuantitativa, 9
G discreta, 9
Varianza
Gráfico de una variable aleatoria, 102, 125
bastones, 28
313
UPC MA444 Estadística

También podría gustarte