Libro de Inferencial OTI 2017 PDF
Libro de Inferencial OTI 2017 PDF
Libro de Inferencial OTI 2017 PDF
EL SECTOR INDUSTRIAL
TERCERA EDICION
UNIVERSIDAD SURCOLOMBIANA
2015
Universidad Surcolombiana
Av. Pastrana con Cra 1.
Tel (098)8754753 Neiva ( H )
ISBN: 978-958-8324-76-0
Segunda Edición
IMPRESIÓN
En los talleres de OTIMPRESOS
Calle 28 No. 1A-46 Cándido
Telefax (098)8758485
Neiva – Huila – Colombia.
Portada:
Mauricio Fernando Molina
[email protected]
Prohibida la reproducción total o parcial de este libro, por cualquier medio especialmente por fotocopias. Ley
23 de 1982.
PROLOGO
i
Contenido
I. Probabilidad .............................................................................................. 1
competencias ......................................................................................................... 1
1.1. Conceptos generales ................................................................................... 2
1.1.1.experimento aleatorio ............................................................................. 2
1.1.3. Suceso o evento .................................................................................. 3
1.1.4. Operaciones de sucesos ...................................................................... 3
1.1.5. Definición de probabilidad ................................................................... 3
ejercicios seccion 1.1. ........................................................................................... 5
1.2. Eventos dependiente e independientes ....................................................... 6
1.2.1. Eventos dependiente ............................................................................ 6
1.2.2. Eventos independientes ........................................................................ 9
1.3. Tecnicas de conteo...................................................................................... 9
1.3.1. Permutacion. ....................................................................................... 10
1.3.2 combinacion. ....................................................................................... 10
ejercicios seccion 1.2- 1.3 ................................................................................... 11
1.4. Variable aleatoria ...................................................................................... 13
1.4.1. Esperanza matemática o valor esperado . ........................................ 13
1.4.2. Varianza. ............................................................................................ 14
ejercicios seccion 1,4 .......................................................................................... 15
1.5. Distribuciones de probabilidad para algunas variables aleatorias ............. 15
1.5.1. La distribución binomial ...................................................................... 16
1.5.2. La distribución poisson ........................................................................ 18
ejercicios seccion 1.5.1.– 1.5.2 ............................................................................ 19
1.5.3. La distribución exponencial. ................................................................ 20
1.5.4 la distribucion normal .......................................................................... 21
1.5.5. La distribucion normal estandar ......................................................... 23
ejercicios 1.5.3. – 1.5.5. ....................................................................................... 27
Competencias ...................................................................................................... 29
2.1. Distribucion muestral de la media .............................................................. 31
2.1.1. Teorema del limite central ................................................................... 34
2.2. Distribucion muestral de la proporcion. ...................................................... 35
ejercicios .............................................................................................................. 36
ii
III. ESTIMACION ................................................................................................ 39
Competencias ...................................................................................................... 39
3.1. Conceptos generales de estimacion .......................................................... 40
3.1.1. Estimacion puntual .............................................................................. 40
3.2. Estimacion por intervalo de confianza........................................................ 41
3.2.1. Intervalo de confianza para la media poblacional ().......................... 41
3.2.1. Intervalo de confianza para la media poblaciónal , muestra pequeña
(n ˂ 30). ........................................................................................................ 42
3.3. Estimacion por intervalo de confianza para la proporción poblaciónal
(muestras grandes). ......................................................................................... 44
ejercicios .............................................................................................................. 45
Competencias ...................................................................................................... 47
4.1. Muestreo no probabilistico ......................................................................... 48
4.1.1. Muestreo por conveniencia ................................................................. 48
4.1.2. Muestreo de juicio o a proposito .......................................................... 48
4.1.3. Muestreo por cuotas ........................................................................... 48
4.2. Muestreo probabilistico .............................................................................. 48
4.2.1. Muestreo aleatorio simple ................................................................... 49
4.2.2. Muestreo sistematico .......................................................................... 62
competencias ....................................................................................................... 65
5.1. Prueba de hipotesis para la media de una poblacion distribuida
normalmente .................................................................................................... 67
5.1.1. Metodo del valor p para la prueba de hipotesis .................................. 71
5.2. Prueba de hipotesis para la proporción poblacional ................................... 72
ejercicios seccion 5.1 – 5.2 .................................................................................. 74
Prueba de hipótesis para dos medias poblacionales ........................................ 75
5.3.1. Prueba de hipótesis para dos medias poblacionales. Muestras
independientes. Varianzas diferentes y muestras mayores o iguales a 30. ... 76
5.3.2. Prueba de hipótesis para dos medias poblacionales. Muestras
dependientes. ............................................................................................... 78
5.4. Prueba de hipótesis para tres o mas medias poblacionales. Muestras
independientes. Analisis de varianza. –anova- ................................................ 81
ejercicios seccion 5.3 – 5.4 .................................................................................. 86
iii
APENDICE .......................................................................................................... 90
iv
I. PROBABILIDAD
COMPETENCIAS
1
1.1. CONCEPTOS GENERALES
La teoría de la probabilidad proporciona la base para la inferencia estadística. Esta teoría tiene sus
raíces en los juegos del azar, cuando lanzamos una moneda o estamos en un juego de cartas, no
es posible predecir de antemano el resultado (cara, sello, as de corazón, trébol, etc.). Esta
imposibilidad de predicción constituye la aleatoriedad, el elemento que caracteriza la falta de
certeza. Por otra parte, existe entre los diversos resultados de los juegos al azar una simetría
recíproca que nos hace considerar todos éstos resultados como equivalentes desde el punto de
vista del juego (para un jugador es igualmente favorable arriesgar su apuesta a uno de los
resultados posibles).
El capítulo trata éste tipo de fenómenos y se formulan modelos matemáticos que sirven para
investigar en forma bastante precisa, los fenómenos.
1.1.1.EXPERIMENTO ALEATORIO
No existe una definición bastante simple para esta clase de experimento, pero con algunos
ejemplos ilustran el concepto:
Ejemplo 1: Lanzar una moneda dos veces y contar el número total de sellos obtenidos.
Ejemplo 2: Lanzar un dado y observar el número que aparece en la cara superior.
Ejemplo 3: Fabrican bombillas, luego prueban su duración en un portalámparas y anotar el
tiempo transcurrido en horas hasta que se quema.
Ejemplo 4: Se fabrica fusibles en un período de tiempo determinado y seleccionar un fusible y
observar si es defectuoso.
Los experimentos anteriores tienen en común las siguientes propiedades:
Cada experimento tiene varios resultados posibles que pueden especificarse (tabla 1.1.).
La incertidumbre de cada experimento . Para el experimento 4 no estamos seguros si
el fusible seleccionado sea defectuoso o no; al lanzar el dado no sabemos si caerá el
número 1,2,.....6.
El experimento se puede repetir indefinidamente sin cambiar las condiciones.
Si el experimento se repite un gran número de veces aparece un modelo definido de
regularidad. Esta regularidad permite la construcción del modelo matemático; por ejemplo
si lanzamos una moneda varias veces la proporción de caras será aproximadamente igual a
la de sellos.
2
1.1.3. SUCESO O EVENTO
Son subconjunto del espacio muestral La notación de los sucesos se utiliza cualquier letra del
abecedario y entre llaves los resultados . Para los ejemplos anteriores algunos sucesos de la tabla
1.1 son:
Ejemplo 1, se crea el siguiente evento: A1={ que ocurran dos caras } , entonces A1={ cc }
Ejemplo 2, se crea el siguiente evento: A2= {Un número impar ocurre} esto es A2= {1,3,5}
Existen varias definiciones de probabilidad. La mas sencilla es la siguiente: "La probabilidad de que
se presente determinado suceso (A) es igual al cociente del número de casos que son favorables a
este suceso, por el número total de casos posibles (S) con tal de que todos estos casos sean
mutuamente simétricos".
Ejemplo. En un póker extraer una carta. Cuál es la probabilidad de que salga un as o un rey?
Solución. Las pregunta es: P(salga un as o un rey) ?. A continuación se crean los siguientes
eventos: A = as R= rey
Los dos eventos son mutuamente excluyentes porque una carta al mismo tiempo no puede ser as
y rey. Para obtener la probabilidad de que salga un as o un rey, se aplica la propiedad "c" de la
probabilidad. P (A R ) P A P R
Aplicando la definición de probabilidad
P( A R) P A PR
4 4
0.154
52 52
Ejemplo. Lanzar un dado no cargado ¿ cuál es la probabilidad de que salga un número par o un
número impar?
Solución: Las pregunta es: P(número par o un número impar) ?. A continuación se crean los
siguientes eventos: I = Impar M = Par .Los dos sucesos son mutuamente excluyentes,
aplicando la propiedad “c” de la probabilidad: P (I M ) P I P M
P( I M ) PI PM
3 3
1
Luego se aplica la definición de probabilidad 6 6
Hay que notar el suceso ( I U M ) es equivalente al espacio muestral.
Hay que elegir un empleado para enviarlo a EE. UU. Cuál es la probabilidad de que sea : a) un
varón? b) una mujer y que trabaje en mantenimiento. c) No trabaje en producción.
Solución:
40
a) Sea V= Varón entonces P(V) = ? aplicando la definición de probabilidad P (V ) 0.40
100
b) Sea los eventos M= femenino y T= trabaje en mantenimiento, entonces aplicando la definición
20
de probabilidad: P( M T ) 0.20
100
P(no trabaje en producción)= ? D=trabaje en producción y D´= no trabaje en
c)
50
producción. Aplicando teorema 1.2 P( D´' ) 1 P( D) 1 0.5
100
5
3) Julio baja dos papayas biches y las envuelve en papel periódico, luego las guarda en un canasto.
Después de una semana observa el estado de las papayas. Describa el espacio muestral del estado
de las papayas.
4) En una empresa textil existen los siguientes empleados que se encuentran clasificados por el
color de la piel y el partido político que milita. Sí se selecciona un empleado al azar, cuál es la
probabilidad de que sea:
a) blanco b) liberal o tenga el color de la piel blanca. c) liberal y amarillo
d) conservador y sea negro e) negro o blanco f) no sea liberal g) sea liberal.
Partido Negro Blanco Amarillo
Liberal 10 25 15
Conservador 20 30 18
Otros 19 26 32
5) Un artículo proveniente de una área de producción son señalado como defectuosos (d) o no
defectuosos (N), los artículos son observados y anotada su condición. Este análisis continua hasta
que sean elaborados consecutivamente 2 defectuoso o hayan sido inspeccionados 4 artículos
(cualquier situación que se presente primero). Describa el espacio muestral para este experimento.
6) De 500 personas que presentaron solicitud para un puesto de contador en una empresa grande
el año pasado 40% tenían alguna experiencia de trabajo y 30% tenían un diploma profesional. Sin
embargo, 20% de los solicitantes tenían tanto experiencia de trabajo como diploma y por ello están
incluidos en ambos conteos. Cuál es la probabilidad de que un solicitante elegido al azar tenga
experiencia de trabajo o tenga diploma de profesional.
7) Cuando un ingeniero industrial efectúa una llamada telefónica es posible que obtenga la
comunicación inmediatamente o por el contrario tenga que esperar. Describa el espacio muestral.
8) Un dado es balanceado de tal forma que la probabilidad de cada una de sus caras sea
proporcional al número de puntos de dicha de cara. Cuál es la probabilidad de obtener un número
impar en un lanzamiento.
9). En cierta universidad el 39% de los estudiantes tiene el cabello dorado, el 19% tiene los ojos
azules y el 4.5% tiene los ojos azules y el cabello dorado. Selecciona una persona al azar. Halle la
probabilidad de que tenga el cabello dorado o los ojos azules.
10) El 35% de los administradores de empresas ven el programa Informe Financiero, el 42% ven
el programa Defalcos mundiales y el 10% ven ambos programas. Selecciona un administrador de
empresas al azar, halle la probabilidad de que presencie programa Informe Financiero o el
programa Defalcos mundiales?
Ejemplo. Suponga que entre los empleados de la empresa Petra (tabla 1.2) se elige al azar un
empleado de sexo femenino, cuál es la probabilidad de que el empleado trabaje en
mantenimiento.
Solución: aplicando la definición de probabilidad condicional:
20
P( M T ) 100
PT / M 0.33
P( M ) 60
100
PARTICION. Los sucesos B1, B2 , B3, ...... BK, representan una partición del espacio muestral S,
k
si: a) Bi B j 0 para todo i diferente de j. b) Bi S c) P( Bi ) 0 para todo i.
i 1
Sea B1, B2 , B3, ... BK, sucesos representan una partición del espacio muestral S, y A un evento
cualesquiera asociado a S (ver figura 1.1). Entonces A=AB1+AB2 + AB3, + ..+A BK.
Solución. La pregunta
Dónde: P( B1 )= 0.6 P( B2 )= 0.25 P( B3 )= 0.15 P(A/B1)= 0.85 P(A/B2)= 0.5 P(A/B3)= 0.2
P(A)= P(A/B1 ) P(B1) + P(A/B2) P(B2) + P(A/B3 ) P(B3) aplicando probabilidad total.
P(A) = 0.85*0.6 + 0.5*0.25 + 0.2*0.15 = 0.665
Algunas veces hay que determinar un probabilidad condicional como función de la partición, por
ejemplo en la elección al candidato de la asociación, si preguntara ¿si se aumentó la cuota de
afiliación cual es la probabilidad de que se haya elegido al contador público de la USCO?.
Sea B1, B2 , B3, ...... BK, sucesos representan una partición del espacio muestral S, y A un evento
cualesquiera asociado a S, entonces:
P(A/B i )P(B i )
P(B i /A)
P(A/B 1 )P(B 1 ) P(A/B 2 )P(B 2 ) P(A/B 3 )P(B 3 ) .... P(A/B K )P(B K )
Solución.
P( aumento la cuota de afiliación, cual es la probabilidad de que se haya elegido al contador público
de la USCO).
Sea: A= aumento en la cuota de afiliación B1 = se elige al contador público de la UCC
B2 = se elige al contador público de la USCO B3 = se elige al contador público de la CORHUILA
P(B2/A ) = ? Aplicando el teorema de Bayes:
P(A/B i )P(B i )
P(B i /A)
P(A/B 1 )P(B 1 ) P(A/B 2 )P(B 2 ) P(A/B 3 )P(B 3 ) .... P(A/B K )P(B K )
Siendo i = 2. Entonces
8
P(A/B 2 )P(B 2 )
P(B 2 /A)
P(A/B 1 )P(B 1 ) P(A/B 2 )P(B 2 ) P(A/B 3 )P(B 3 )
Definición: Dos o más eventos son independientes, si el resultado de los eventos en ningún modo
se afecta uno de otro. La probabilidad de que ambos eventos independientes A y B ocurran es:
P(AB) = P(A) P(B)
Ejemplo. Cuál es la probabilidad de obtener dos caras si se lanza sucesivamente dos veces una
moneda?
Solución. Sea C1 = Obtener cara en el primer lanzamiento. C2 = Obtener cara en el segundo
lanzamiento.
Los anteriores sucesos son independientes es decir si se obtiene una cara en el primer lanzamiento
no va a influir en el resultado del segundo lanzamiento. Aplicando la fórmula de independencia:
1 1 1
P(C1 C 2) P(C1) P(C 2) * 0.25
2 2 4
Esta técnicas son útiles cuando los espacios muéstrales son grandes y se necesita contar el número
de eventos que satisfacen algunas condiciones. El primer concepto a definir es el factorial.
FACTORIAL. Dado un entero positivo n, el producto de todos los números enteros de n hasta 1
se llama factorial de n y se escribe n! y la formula general es: n! = n(n-1)(n-2)(n-3)..........1
Por definición 0! = 1
9
1.3.1. PERMUTACION.
Solución: como los cargos son tres y hay disponibles seis candidatos entonces interesa el orden.
Por ejemplo si los candidatos son : Roberto, Ana, Pablo, Cecilia, Carlos y José, entonces un grupo
puede ser:
GRUPO I GRUPO II
Observe que el grupo uno es diferente al grupo dos aunque sean los mismo candidatos pero no
ocupan el mismo cargo. Significa que si interesa el orden. Como interesa el orden hay que calcular
una permutación :
n!
n Pr Donde: n=6 r =3, entonces:
(n r )!
n 6! 6 * 5 * 4 * 3 * 2 *1
Pr 120
(n r )! 6 3! Hay 120 grupos o arreglos
n
3!
diferentes
1.3.2. COMBINACION.
Una combinación es un arreglo de objetos diferentes sin tener en cuenta el orden. El número de
combinaciones de n objetos tomados r a la vez se escribe nCr y se define como:
n!
n Cr
r!(n r )!
Ejemplo. Suponga que hay 12 personas para formar un comité de tres personas para dialogar con
10
el director de Hocol. ¿ Cuántos comité diferentes se pueden formar?
Solución. Un comité puede estar formado por Juan, Pablo y Sofía. Ellos van dialogar con el director.
Si invierten el orden por ejemplo, Pablo, Sofía y Juan, entonces es el mismo comité ya que cumple
la misma función. Entonces no interesa el orden. En este caso n = 12 y r =3.
n! 12!
Cr 220
r!(n r )! 312 3!
n
1) En una encuesta entre 56 empleados de una planta acerca de la conveniencia de la afiliación del
sindicato, los resultados están a continuación:
Trabajadores
Opinión Capataces Trabajadores temporales
fijos
A Favor de afiliación 1 25 4
Contra la afiliación 3 10 6
Sin opinión 1 4 2
a) Seleccionan un capataz al azar, cual es la probabilidad de que este en contra de la afiliación.
b) Seleccionan al azar un trabajador que esta en contra de la afiliación, cual es la probabilidad de
que sea un empleado temporal.
2) Dos divisiones de productos distintos de una empresa grande son productos marinos y equipos
de oficina. Se estima que la probabilidad de que productos marinos tengan utilidad en este año es
de 0.30, la probabilidad de que la división de equipo de oficina tengan utilidad en este año es de
0.70 y la probabilidad de que ambas divisiones tengan utilidad en este año es 0.06. Cuál es la
probabilidad de que la división de productos marinos tenga utilidad en este año dado que la división
de equipos de oficina también tiene utilidad en este año.
3) Se estima que la probabilidad de que aumente las ventas de automóviles en el siguiente mes es
de 0.40. Se estima que la probabilidad de que aumenten las ventas de refacciones es de 0.50. Se
estima que la probabilidad de que ambas industrias experimenten un aumento en las ventas es de
0.10. ¿ Cuál es la probabilidad de que: a) hayan aumentado las ventas de automóviles durante el
mes, dado que existe información de que han aumentado las ventas de refacciones. b) hayan
aumentado las ventas de refacciones, dado que existe información de que aumentaron las ventas
de automóviles durante el mes?.
4) La junta directiva de la compañía JR consta de 15 miembros, ¿ de cuantas formas se puede
elegir presidente, vicepresidente y secretario?
5) Un club tiene 10 miembros. ¿ De cuantas formas se puede elegir una junta directiva de 4
miembros
6) A los habitantes de una gran ciudad se le hizo una encuesta con el propósito de determinar el
número de lectores del periódico el Tempo. los resultados son los siguientes: 20% de los
habitantes lee El Tempo, el 16% leen El Especta, y un 1% leen ambos periódicos.
11
a) si se selecciona al azar a un lector del Tempo, cual es la probabilidad de que también lea El
Especta.
b) si se selecciona al azar a un lector del Espectador cual es la probabilidad de que también lea El
Tempo.
7) En un día lluvioso la probabilidad de que Pedro llegue tarde a clase es de 0.8, mientras que en
un día de sol, la probabilidad de que llegue tarde es solo 0.1, y la probabilidad de que llegue tarde
cualquier día (lluvioso y sol) es de 0.03. ¿Cuál es la probabilidad de que Pedro llegue tarde si está
haciendo sol o este lloviendo?.
8) Una profesor ha estado enseñado la asignatura calculo por muchos años. Sabe que el 95% de
los estudiantes hacen la tarea. Además determino que los estudiantes que hacen la tarea el 85%
aprobarán el curso. De aquellos estudiantes que no realizan la tarea, 60% aprobarán el curso. a)
Mario Rojas tomó la asignatura calculo con el profesor y aprobó la materia. Cuál es la probabilidad
de que sí haya hecho las tareas.
9) La siguiente tabla muestra a cuatro proveedores ropa de trabajo a la empresa Petroleun. El
cuadro muestra las cantidades adquiridas a cada proveedor y el porcentaje de materia prima
defectuosa que cada uno proporciona.
Ropeiro 30 2,5
Salas 24 1,7
Reino 29 2,8
Carla 17 0,98
Es un variable cuyos valores numéricos quedan determinados por los resultados de un experimento
aleatorio. Por ejemplo se lanzan tres monedas no cargadas. Los resultados posibles del
experimento junto con el número de caras asociadas con cada resultado se enumeran en la tabla
1.3.
La variable X representa el número de caras obtenidas al lanzar tres monedas. Esta es una variable
aleatoria la cual toma los siguientes valores: X = [ 0 , 1 , 2 , 3 ]
Es importante diferenciar entre la variable aleatoria y los valores numéricos que ella puede tomar.
Para ello se simboliza la variable aleatoria por la letra mayúscula X y los valores que ella tome con
la letra minúscula x, como se nota a continuación: X x 1 , x 2 , x 3 , x 4......... x n
Sea X una variable aleatoria discreta, se define la esperanza matemática como la suma del
producto de cada valor puntual que toma la variable aleatoria por su correspondiente probabilidad
de ocurrencia. Los resultados están en la tabla 1.3 ( ver diagrama de árbol 1.1.a)
Tabla 1.3. Resultados de lanzar tres monedas Figura 1.1.a. Diagrama de árbol
Resultado X = número de caras
SSS 0
SCS 1
SSC 1
CSS 1
CSC 2
SCC 2
CCS 2
CCC 3
E X xi P ( X xi )
n
i 1
13
Ejemplo. Calcular el valor esperado de la tabla número 3. Para calcular el valor esperado se
determinó los valores en la tabla 1.4
Tabla No. 1.4. Calculo de la esperanza matemática
Xi = Número de caras (1) P(xi)=P(X=xi) (2) xi*P(xi) (3)
0 1/8 0
1 3/8 3/8
2 3/8 6/8
3 1/8 3/8
Total 1 12/8
Nota: La columna (1) da todos los valores posibles de la variable aleatoria X; la columna 2 es la
correspondiente probabilidad y la columna 3 da al producto de cada valor de la variable aleatoria
por su correspondiente probabilidad (distribución de probabilidad).
EX xi P( X xi )
n
12
1.5..caras
i 1 8
Interpretación: Si lanzan simultáneamente 3 monedas el promedio de caras es de 1.5.
Ejemplo. Las ventas por hora de una máquina automática pueden ser 20,21,22 cajetillas de
cigarrillos con probabilidades de 0.3, 0.5 y 0.2 respectivamente, cuál es la venta por hora esperada
para ésta máquina?
Solución:
E X xi P ( X xi )
n
i 1
Interpretación: La venta promedio por hora de ésta máquina es de 20.9 21 cajetillas.
1.4.2. VARIANZA.
Donde : EX x * P( X x )
E X E X .
2 2 2 2
i i
Solución. 2 E X 2 E X Donde :
EX 2 xi2 * P( X xi )
E X 2 x 2 * P( X x i )
i
E[X2] = (20)2 (0.3) + (21)2 (0.5) + (22)2 (0.2) = 437.3
(E[x])2 = (20.9)2 = 436.81 . 2
= 437.3 - 436.81 = 0.49 La desviación estándar es:
= 0.49 0.7
2
1) Sea X= número de caras obtenidas al lanzar tres monedas. Si salen dos o más caras se recibe
$200, si no, hay que pagar $100. ¿ Cuál es la ganancia esperada ?
2) Las ventas en expendio de publicaciones de una revista mensual tiene la siguiente distribución
de probabilidad.
Numero de 15 16 17 18 19 20
revista
Probabilidad 0.05 0.10 0.25 0.30 0.20 0.10
Calcule la venta promedio mensual de revista y su desviación estándar.
3) La siguiente tabla muestra la distribución de las ventas diarias del almacén YA, con sus
respectivas probabilidades.
Ventas (millones $) 10 20 30 40
Probabilidad 0.30 0.20 0.40 0.10
En ésta sección se presentan ciertos modelos matemáticos que sirven para representar un gran
número de fenómenos que cumplen ciertas condiciones.
15
La distribución de probabilidad es una tabla, gráfica o formula que se usa para especificar todos
los valores posibles de una variable aleatoria junto con sus probabilidades respectivas.
Algunas distribuciones son :
La distribución Binomial
La distribución Multinomial Distribución de probabilidad para variables
La distribución Poisson aleatorias discretas
La distribución Geométrica
La distribución Hipergeométrica
Etc.
La distribución Normal
La distribución Normal Estándar Distribución de probabilidad para variables
La distribución Exponencial aleatoria continúas
La distribución Gamma
Etc.
La distribución Binomial se obtiene del experimento que cumple las siguientes condiciones:
Sea X una variable Binomial (es decir que cumpla las condiciones anteriores) basada en n
n! x n x
repeticiones entonces: P( X x) P Q o
x!(n x)!
x nx n!
P( X x) n CxP Q Cx donde x es = 0 1....n
x! (n x)!
n
Los ensayos son independientes, en otras palabras si en el primer lanzamiento sale cara, en el
segundo lanzamientos se puede obtener cualquiera de los 2 resultados posibles.
Como el experimento cumple las condiciones anteriores entonces la variable aleatoria X = (Número
de caras obtenidas) se distribuye binomialmente y la:
3 303
1 1
P( X 3) 30 C3 * 2.2687 * 10 5 0.00000378
2 2
La probabilidad de obtener exactamente tres caras en 30 lanzamientos es de 2.2687 X 10-5 .
P ( X≤ 2 ) = P (X = 0) + P ( X = 1 ) + P ( X = 2). entonces :
0 30 0
1 1
P( X 0) 30 C0 2 9.31323 * 10 10
2
1 301
1 1
P( X 1) 30 C1 2 2.79397 * 10 8
2
2 30 2
1 1
P( X 2) 30 C 2 4.05125 * 10 7
2 2
Teorema 1.4. Sí X es una variable aleatoria distribuida binomialmente, el valor esperado y varianza
es:
E X nP 2 nPQ
Ejemplo. La probabilidad de que un prospecto de ventas elegido al azar realiza una compra es de
0.20. Sí realiza 15 visitas de prospecto, cual es la venta promedio y su desviación estándar ?
Solución: Como la variable X = número de ventas. Esta variable se distribuye en forma binomial,
entonces:
17
1.5.2. LA DISTRIBUCIÓN POISSON
Sí una variable aleatoria X esta distribuida en forma Poisson, entonces la probabilidad de obtener
exactamente x resultados en un intervalo de tiempo, espacio o volumen es:
e
x
P( X x) Para X= 0, 1, 2, 3,........K
x!
Donde: = Tasa media de ocurrencia de los sucesos por cualquier unidad de tiempo,
espacio o volumen.
X = Número de ocurrencias del suceso en una unidad de tiempo, espacio o volumen.
Ejemplo. El gerente de un banco sabe por experiencia que entre la 9:00 y 10:00 de la mañana, la
tasa media de llegada de los clientes es de 60 por hora. El desea determinar la probabilidad de
que: a) lleguen dos clientes por minuto entre las 9:00 y 10:00 de la mañana. b) Lleguen a lo
máximo clientes por minuto entre las 9:00 y 10:00 de la mañana.
Solución.
a) P(lleguen dos clientes por minuto entre las 9:00 y 10:00 de la mañana).
Sea X = total de clientes por minuto que llegan al banco entre las 9:00 y 10:00 de la mañana
= promedio de llegada de los clientes por minuto = 60 clientes/60 minutos = 1 cliente por
minuto
La variable aleatoria se distribuye en forma Poisson ( número de sucesos por unidad de tiempo)
entonces para determinar la probabilidad de que lleguen dos clientes por minuto entre las 9:00 y
e
x
Teorema 1.6. Sea X una variable aleatoria distribuida en forma Poisson, entonces el valor esperado
y la varianza es igual a Landa ( ).
E[X]= ² =
18
EJERCICIOS SECCION 1.5.1.– 1.5.2
1) Una empresa que fabrica bombillos sabe por experiencia que la probabilidad de que salga un
bombillo defectuoso es de 0.03. Como usted es el contador de la empresa selecciona 12 bombillos,
cual es la probabilidad de que salgan 3 defectuosos.
2) El 90% de los artículos que produce una máquina son buenos. Sí seleccionamos aleatoriamente
10 artículos producido por la máquina, cuál es la probabilidad de que a) exactamente 2 de ellos
sean buenos b) Menos de dos sean buenos c) A lo máximo uno sea bueno .
a) cuál es la probabilidad de que exactamente 3 de ellos sean de sexo femenino. b) Ninguno sea
mujer c) Más de uno sea mujer d) menos de 3 sean mujeres e) dos sean hombres.
f) más de uno sea hombre.
4) El número de accidentes por año en la ciudad de Descanso es de 4 por cada 100000 habitante.
Hallar la probabilidad de que en esa ciudad ocurran por cada 100000 habitantes:
6) En una estación de gasolina se sabe que el promedio de vehículos que llegan por hora es de 30.
Cuál es la probabilidad de que una hora lleguen:
10) Cuando una variable aleatoria se distribuye en forma geométrica y como calcula la
probabilidad.
11) Cuando una variable aleatoria se distribuye en forma multinomial y como calcula la
probabilidad.
12) En una panadería se sabe que 1 de cada 50 panes inspeccionados esta quemado. ¿Cuál es la
probabilidad de que el sexto pan inspeccionado sea el primer pan quemado?
La distribución exponencial miden el tiempo transcurrido entre ocurrencias. Esta distribución esta
relacionada con la distribución Poisson que es discreta, mientras que la distribución exponencial es
continua ya que la variable tiempo es continua.
La distribución exponencial mide el tiempo de atención para ser atendido en una entidad bancaria,
un supermercado, en una estación de gasolina etc., es decir, esta distribución se utilizan como
modelo para representar tiempos de funcionamiento o tiempos de espera.
Una variable aleatoria continua se distribuye en forma exponencial si su función de densidad es:
f (T ) e t
Para calcular cualquier probabilidad de una variable continua esta se representa una área en el
plano y por consiguiente hay que calcular la integral entre los tiempos o tiempo solicitado en la
espera. Para disminuir el tiempo en la solución de cualquier ejemplo se ha elaborado una tabla
acumulativa de la distribución exponencial (apéndice, tabla I).
Ejemplo. El cajero del supermercado YA atiende en promedio 4 cliente cada cinco minuto minutos.
a) ¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3 minutos?
b) ¿Cuál es la probabilidad de que una persona sea atendida entre 3 minutos y 5 minutos? c)
¿Cuál es la probabilidad de que una persona se demore mas de 4 minutos en ser atendida?
Solución.
a) ¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3 minutos?
P(una persona sea atendida antes de que transcurran 3 minutos).
4
Sea T= tiempo de atención. P(T 3) ? Además
5
4 3 54 *3
reemplazando la integral P(T 3) 0 e dt Para evitar la integración
5
20
P(T 3) ? para un
utilizar la tabla exponencial (tabla I ) 2, el cual tienen la t
4
específico. Utilizando la tabla se busca t * 3 2.4 y la probabilidad es
5
P(T 3) 0.909
b) ¿Cuál es la probabilidad de que una persona sea atendida entre 3 minutos y 5 minutos?
P(una persona sea atendida entre 3 minutos y 5 minutos)
Sea T= tiempo de atención. P(3 T 5) ?
4
Se sabe qué
. Para utilizar la tabla exponencial (tabla I) realizo la siguiente conversión:
5
P(3 T 5) P(T 5) P(T 3)
4
P(T 5) ? para un * 5 4 P(T 5) 0.982
5
4
P(T 3) ? para un * 3 2.4 entonces
5
P(T 3) 0.909
Luego P(3 T 5) 0.982 0.909 0.073
c) ¿Cuál es la probabilidad de que una persona se demore más de 4 minutos en ser atendida?
E T
1 1
valor esperado y su varianza es: y 2
2
1.5.4 LA DISTRIBUCION NORMAL
El modelo probabilístico más frecuentemente usado en las decisiones económicas, sociales, etc., es
la distribución normal, la cual puede ser presentada en forma general o estándar.
2 2
los parámetros (media) deben satisfacer las condiciones - < < y (desviación estándar)
> 0.
La gráfica de la distribución normal produce la conocida curva en forma de campana que se muestra
en la figura 1.1.A.
a) Es simétrica respecto a la media ( ), es decir la curva hacia cualquiera de los dos lados de ,
es una imagen reflejada de la del otro lado.
b) La media, la mediana y la moda son iguales.
c) El área total de la curva por encima del eje x es una unidad.
Debido a la simetría ya mencionada, el 50% del área está hacia la derecha de una perpendicular
levantada en la media y el 50% está hacia la izquierda.
d) Sí se levantan perpendiculares a una distancia de una desviación estándar de la media, en
ambas direcciones, el área encerrada por estas perpendiculares, el eje X y la curva será
aproximadamente el 68% del área total. Sí se levantan perpendiculares a dos desviaciones
estándar hacia cada uno de los lados de la media, se encerrará aproximadamente el 95% del área
total, y sí se levantan perpendiculares a tres desviaciones estándar a lado y lado de la media, se
encerrará aproximadamente el 99.7% del área total ( figura 1.2).
22
Figura 1.3. Subdivisión del área bajo la curva normal con medias diferentes
La última propiedad de la distribución normal implica, que en realidad esta es una familia de
distribuciones. La más importante de esta familia es la distribución normal estándar o unitaria.
x
Sea X una variable aleatoria continua y Z entonces Z se distribuye en forma normal
estándar con media = 0 y 2 = 1 y su función de densidad de probabilidad es de la forma:
2
1 Z2
f (Z ) e . La figura 1.5. se muestra la gráfica de la distribución normal estándar.
2
La distribución normal estándar posee las mismas propiedades de la distribución normal . Para
encontrar la probabilidad de cualquier valor de Z entre un punto o dos se utiliza la tabla II.
El cuerpo de la tabla II del apéndice está el área bajo la curva entre cero y un valor de Zi . El
valor de Zi está en la primera columna y en la primera fila de la tabla. El área sombreada de la
figura 1.6 presenta el área ( o probabilidad) es la dada en la tabla para valores de Z entre
cero y Z0.
23
Figura 1.6. Área dada en tabla II. P ( 0<Z < Zi)
Ejercicio: Dada una distribución normal estándar, encontrar: a) P( 0 < Z < 2.20 )
b) P( -0.56 < Z < 0) c) P ( Z > 1.56 ) d) P( 0 < Z < 2.32 ) e) P (Z<- 1.50) .
24
Ejercicios propuestos. Determine las siguientes probabilidades:
1) Los contadores públicos mantienen en promedio una contabilidad de tres años con una desviación
estándar de 0.5 años. Suponga que el tiempo de duración de llevar las contabilidades de los contadores
públicos está distribuida aproximadamente en forma normal. Determine la probabilidad de que un contador
público dure; a) más de 3.5 años en llevar una contabilidad. b) menos de 3.4 años en llevar una
contabilidad. c) más de 2.3 años en llevar una contabilidad. e) entre 2.5 y 3.3 años en llevar una
contabilidad.
Solución La pregunta es determinar la probabilidad de que un contador público dure; más de 3.5 años en
llevar una contabilidad más de 3.5 años. La notación es:P(un contador público dure más de 3.5 años en
llevar una contabilidad). Entonces crear la variable aleatoria X, donde X = tiempo de duración en llevar
una contabilidad el contador público
Reemplazando la pregunta P ( X > 3.5 ) = ?. Para encontrar la P ( X > 3.5 ), es necesario hacer la figura
1.9.
El enunciado del problema da los siguientes valores: = 3 años y = 0.5 . Para determinar P (X >3.5 ),
es decir el área de la figura 1.9 hay que realizar una integral. Para evitar la integración se lleva a una
x
distribución normal estándar (Z) mediante el siguiente cambio de variable: Z .A continuación
3.5 3.0
se realiza el cambio: P X 3.5 P Z PZ 1 Gráficamente se presenta la figura 1.10.
0.5
b) Determine la probabilidad de que un contador público dure menos de 3.4 años en llevar una
contabilidad. . Para encontrar la P ( X < 3.4 ), donde X = tiempo de duración en llevar una contabilidad,
es necesario hacer la figura 1.11 .El enunciado del problema da los siguientes valores: = 3 años y =
0.5. Para hallar la probabilidad P (X< 3.4) se debe realizar una integral. Para evitar la integración se lleva a
x
una distribución normal estándar (Z) mediante el siguiente cambio de variable: Z . A
continuación se realiza el cambio:
34 30
P ( X < 3.5 ) = Z = P ( Z < 0.8). Gráficamente se presenta la figura 1.12.
0.5
Para hallar P ( Z < 0.8) en la tabla II, debe hacerse de la siguiente forma: P ( Z < 0.8 ) = 0.5 + valor de la
tabla de 0.8, P ( Z < 0.8 ) = = 0.5 + 0.2881 = 0.7881. En la figura 1.12 se observa el cambio de variable.
c) Determine la probabilidad de que un contador público dure más de 2.3 años en llevar una contabilidad.
Solución. Para encontrar la P ( X > 2.3 ), donde X es el tiempo de llevar la contabilidad. El enunciado del
problema da los siguientes valores: = 3 años y = 0.5. Para hallar la probabilidad P( X > 2.3 ) se debe
realizar una integral. Para evitar la integración la transformamos en una distribución normal estándar (Z)
x
mediante el siguiente cambio de variable: Z A continuación se realiza el
2.3 3.0
P(X > 2.3) P Z > =
cambio
0.5
PZ > -1.4 0.5. valor tab la 1.4 0.5 0.4192 0.9192
e) Determine la probabilidad de que un contador público dure Entre 2.5 y 3.3 años en llevar una
contabilidad.
26
Para encontrar la P (2.5 < X < 3.3 ), definir X como el tiempo de llevar la contabilidad. El enunciado del
problema da los siguientes valores: = 3 años y = 0.5 . Para hallar la probabilidad P (2.5 < X < 3.3 )
se debe realizar una integral. Para evitar la integración la transformamos en una distribución normal
x
estándar (Z) mediante el siguiente cambio de variable: Z . A continuación se realiza el cambio:
) P - 1 < X < 0.6
2.5 - 3.0 3.3 - 3.0
P(2.5 < X < 3.3 ) P( <X< . Para
0.5 0.5
hallar P ( -1 < Z < 0.6 ) se utiliza el tabla II y es la siguiente forma: P ( -1 < Z < 0.6 ) = valor tabla de 1
+ valor tabla de 0.6. Entonces P ( -1 < Z < 0.6 ) = 0.3413 + 0.2257 = 0.567
1). En el aeropuerto el Veloz llegan en promedio 2 aviones por día. ¿ Cuál es la probabilidad de
que, después de la llegada de un avión, tenga que esperar a lo máximo tres días para la llegada
del siguiente avión?
2) En una estación de gasolina llegan en promedio 4 clientes cada hora. Determine la
probabilidad de que el bombero de la estación tenga que esperar entre dos y tres minutos para
que le soliciten el servicio.
3) En el banco Tacaño llegan en promedio 15 clientes cada media hora. Determine la
probabilidad de que el tiempo entre un cliente y otro que llegan al banco Tacaño este entre tres
y cinco minutos.
4) Determinar el área bajo la curva normal estándar.
a) P ( Z >1.78 ) b) P ( Z < 2.35 ) c) P(-1.56<Z<2.98)
d) P (Z< - 1.43 ) e) P (0.89<Z<3.04 ) f) P (-2.3 < Z < 4.1 )
5) Pruebas realizadas en bombillas eléctricas de cierta marca, indican que el período de
duración se distribuye normalmente con media igual a 1862 horas y desviación estándar de 68
horas. Estimar el porcentaje de bombillas que duren:
a) más de 1890 horas, b) menos de 1780 horas, c) entre 1870 y 1880 horas,
d) más de 1790 horas , e) entre 1785 y 1883 horas.
6) El peso de las guanábanas en cierto municipio están distribuidas normalmente con un peso
medio de 4 libras. El 15% de las guanábanas que pesan menos de 3 libras. ¿Cuál es la
desviación estándar?.
7) La duración de ciertas lámparas para oficinas están distribuidas normalmente; si el 2.28% de
la lámparas que más duran, tiene una duración mínima de 4 meses y el 6.68% de las que
menos duran, tiene una duración máxima de 1.5 meses. Determine la duración media y la
desviación estándar.
8) Una fábrica de cemento empaca su producto en bolsas cuyos pesos se saben que son
distribuidos normalmente, con una media de 50 kilos y una varianza de 4 kilos. Encuentre la
probabilidad de sacar una bolsa de cemento que contenga;
a) por lo menos 51 kilo, b) como máximo 52 kilos, c) de 49 a 54 kilos.
9). Los salario semanales de los contadores públicos se distribuyen normalmente con una
27
desviación estándar de $10000. Por experiencia se sabe que 12% de los salarios semanales más
bajos de los contadores públicos son de $550000. Determinar el salario promedio semanal de
los contadores públicos.
10) La edad de los equinos en el Huila se distribuyen normalmente con una edad media de 6
años y una desviación estándar de 0.5 año.¿ Que porcentajes de equinos tienen una edad entre
5 y 6.1 años?
11) La longitud de los tornillos que produce una maquina se distribuye normalmente, con un
diámetro promedio de 13.0 mm y una varianza de 0.01 mm2. Determinar la probabilidad de que
un tornillo elegido al azar tenga un diámetro entre 12.8 mm y 13.3 mm ?
12).El salario mensual de los administradores de empresas se distribuye normalmente con un
salario promedio mensual de 1500 Euros. El 3.44 % de administradores de empresas son
superiores a 1510 Euros. Cuál es la desviación estándar ?
13).La edad de los ingenieros industriales se distribuye normalmente con edad media de 35
años y una varianza de 9 años2.
a) Que porcentajes de ingenieros industriales tienen más de 41 años.
b) Que porcentajes de ingenieros industriales tienen entre 32 y 39 años.
14) La vida útil de las llantas panteras se distribuye normalmente con una duración media de
28000 kilómetros y una desviación estándar de 3000 kilómetros. Si la fábrica no desea
reemplazar más del 4.85% de las llantas vendidas, ¿ qué tiempo de garantía debe ofrecer?.
15) El tiempo de tramitar papeles para la legalización de un vehículo en las oficinas de tránsito
en un departamento de Colombia se distribuye normalmente con una media de 5 horas y una
desviación de 1 hora. Determinar el porcentaje de legalizaciones que duran:
a) más de 7 horas b) menos de 4 horas
c) A lo máximo 3 horas d) Mas de 3.5 horas.
16) El tiempo que utilizan para graduarse como profesionales en cierta universidad se distribuye
normalmente con una media de 6 años y una desviación estándar de 1 año.
a) Que porcentajes de estudiantes de la universidad duran a lo máximo 7 años para
graduarse.
b) Que porcentajes de estudiantes de la universidad duran por lo mínimo 6.5 años para
graduarse.
c) Que porcentajes de estudiantes de la universidad duran entre 6 y 8 años para graduarse.
d) Que porcentajes de estudiantes de la universidad duran entre 5 y 7.5 años para graduarse.
e) Cuanto tiempo dura en graduarse el 14.92% de los estudiantes de más bajo rendimiento
académico.
f) Cuanto t tiempo dura en graduarse el 9.01% de los estudiantes de mejor rendimiento
académico.
17). Cierto restaurante de la ciudad, la distribución de los almuerzo diario que vende es
aproximadamente de forma normal con un promedio diario de 200 almuerzo y una desviación
estándar de 10 almuerzo. Para cualquier día especifico cuantos almuerzo debe hacer el
restaurante de manera que la probabilidad de quedarse sin almuerzos sea menor al 0.05.
28
II. ALGUNAS DISTRIBUCIONES MUESTRALES
COMPETENCIAS
MUESTRA.
Una muestra es una parte de la población. Se denomina muestra aleatoria a elementos que
conforman la muestra y han sido seleccionados al azar.
DISTRIBUCION MUESTRAL
Es la distribución de todos los valores posibles que pueden ser tomados por alguna estadística
calculadas a partir de muestras del mismo tamaño extraída aleatoriamente de la misma población.
30
Por lo general se tiene interés de conocer tres aspectos de la distribución muestral; la media, la
varianza y la forma funcional (gráfica).
a) De una población finita discreta de tamaño N, se extrae aleatoriamente todas las muestras
posibles de tamaño n.
b) Calcular la estadística de interés para cada muestra.
c) En una tabla se ubica los valores posibles que toma la estadística con el correspondiente valor
en que se repite el valor.
Dada una población distribuida normalmente con media y varianza 2, la distribución muestral de
la media se distribuirá aproximadamente en forma normal con media
x =µ y varianza
2
n
x
n
x
Para construir empíricamente la distribución muestral de la media para una población finita,
seleccionan aleatoriamente muestras de tamaño dos y con sustitución para probar la definición de
distribución muestral de la media:
2 (X )
2
8
N
Las anteriores medidas son los llamados parámetros. Los Pasos a seguir para calcular la
distribución muestral.
Determinar todas las muestras posibles de tamaño 2 en la población, los datos se
presentan en la tabla 2.1.
Calcular la estadística de interés, para nuestro caso la media aritmética.
31
x
x i
n
Los valores de las medias para cada muestra se presentan en la tabla 2.2.
X x P( X x )
i i
2 1/25
3 2/25
4 3/25
5 4/25
6 5/25
7 4/25
8 3/25
9 2/25
10 1/25
Total 1
Calcular la distribución muestral de la media.
32
x p ( X x ) 2(1/25)+3(2/25)+4(3/25)+5(4/25)+6(5/25)+7(4/25)+8(3/25)+
x i i
EX 2
x
- 2
2
Dónde: E X 2
x i
2
* PX x i
x2 40 - 36 4
Como se puede observar la varianza poblacional es diferente a la varianza muestral ( 8 4 ), pero
sí aplicamos la definición de la varianza poblacional de la distribución muestral de la media.
2 8
x 2
4
n 2
Ahora hay que determinar si la distribución muestral de la media es normal. Un método aproximado
es el gráfico ( figura 2.2.) y se observa que presenta una tendencia normal.
NOTA: Cuando se muestrea sin reemplazo de una población finita, la distribución muestral de la
N n2
media tendrá :como media x y varianza x
2
.
N 1 n
33
N n
El factor se llama corrección por población finita y puede ignorarse cuando el tamaño de
N 1
la muestra es pequeño en comparación con el tamaño de la población.
A la raíz cuadrada de la varianza de las medias se denomina el error de muestreo debido a la media
y se nota x. x
n
Ahora la pregunta es: ¿qué pasa sí la población no se distribuye normalmente ?. Debe utilizarse el
teorema del límite central.
" Dada una población de cualquier forma funcional con media y varianza 2, la distribución
muestral de la media, se distribuirá aproximadamente en forma normal con media x = y
varianza 2 x /n, siempre y cuando el tamaño de la muestra sea grande ( n > 30 ) ".
Ejercicio. Cierta marca de bombillo tiene una duración media de 21000 horas con una desviación
estándar de 800 horas. Suponiendo que el tiempo de duración de los bombillos está distribuido
normalmente, ¿cuál es la probabilidad de que la duración media de 64 bombillos sea inferior a
20900 horas ?.
Solución: Se sabe que la muestra bajo en consideración es una de las muestras posibles de tamaño
64 que puede extraerse de la población y X = tiempo de duración de las bombillas se
distribuye normalmente (figura 2.3) entonces:
Para hallar la P( Z < -1 ) se utiliza la tabla II del apéndice: P( Z < -1 ) = 0.5 - P( 0 < Z < -1 )
P( P(Z < -1 ) = 0.5- 0.3413 = 0.1587.
Ejercicio propuesto: Para el ejercicio anterior calcular la probabilidad de que la duración media de
las 64 bombillas sean: a) superior a 22550 horas b) inferior a 22410 horas c) estén entre 20500
y 21135 horas d) estén entre 19590 y 20980 horas.
" Dada una población distribuida binomialmente con media P y varianza PQ, entonces la
distribución muestral de la proporción se distribuirá aproximadamente en forma normal con media
PQ
p P y varianza p
2
siempre y cuando el tamaño de la muestra sea grande".
n
Nota a la raíz cuadrada de p2 se le denomina el error estándar de la proporción y es:
35
PQ
p
n
Ejercicio. Es sabido que el 64% de los votantes inscritos en cierto distrito electoral apoyan al
partido A. ¿Cuál es la probabilidad de que en una muestra aleatoria de 100 votantes en ese distrito
de una proporción de simpatizantes del partido A superior al 0.60 ?
Ejercicios propuesto.
EJERCICIOS
1) En el banco del Sol, la cuenta media es de $ 25.000 con una desviación estándar de $ 1.000. ¿
Cuál es la probabilidad de que un grupo de 500 cuentas elegidas al azar tenga:
36
a) un deposito medio entre $ 24.900 y $ 25.050 ?.
B) un deposito medio mayor de $24.850 ?.
C) un deposito medio menor de $ 25.075 ?.
2) Se ha demostrado por reclamos que se han hecho que el 20% de las encomiendas llegan
averiadas al utilizar una Cía. de transporte intermunicipal. ¿ Cuál es la probabilidad al enviar 63
encomiendas de un porcentaje del 25% o menos de encomiendas averiadas ?.
3) Si los pesos individuales de las personas que viajan en la empresa de transporte El Rápido se
distribuyen normalmente con un peso medio de 70 kilos y una desviación estándar de 3 kilos. ¿
Cuál es la probabilidad de que un bus de esa empresa con 25 pasajeros tenga un peso promedio
por pasajero mayor de 75 kilos?.
4) Se toma una muestra aleatoria de 200 unidades producidas en una hora por una máquina, ¿
Cuál es la probabilidad de que 16% o menos resulten defectuosas ?, sí se sabe que el 10% de las
unidades producidas en la muestra por la máquina son defectuosas.
5) El 25% de los alumnos de una facultad habilitan para la aprobación de un curso. ¿ Cuál es la
probabilidad en un grupo de 36 estudiantes, 8 o menos habiliten para la aprobación del curso ?.
6) El promedio de compra por cliente en cierta tienda es de $ 12000 con una desviación estándar
de $5500. Si se toma una muestra de tamaño 36, ¿ cuál es la probabilidad :
a) de que la media de la muestra sea superior a $ 13500 ?.
b) de que sea superior a $ 13200 e inferior a $ 11550 ?.
7) En las fábricas grandes de computadores la media de los salarios es de 1050 Euros, con una
desviación estándar de 250 Euros. Seleccionan al azar 35 empleados
a) ¿Cuál es la probabilidad de que tengan un salario promedio inferior 1000 Euros?
b) ¿Cuál es la probabilidad de que tengan un salario promedio entre 1025 y 1078 Euros?
8) Como director de pesos y medidas visito una planta de empacado que enlata de fríjol, para
verificar que el peso neto de las latas sea el indicado . El gerente de la planta me asegura que el
peso promedio de las latas es de 700 gramos con una desviación de 5 gramos. Selecciono al azar
81 latas ¿qué tan probable es tener un peso promedio inferior de 695 gramos?
9) La verdadera proporción de los componentes defectuosos fabricadas por una empresa es de
0.04 . Encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga:
a) Menos del 3.2 % de los componentes defectuosos.
b) Más del 1.2% pero menos del 4.9% de partes defectuosas.
10) ¿ Las siguientes afirmaciones son falsas o verdaderas?
El parámetro es una medida estadística calculada a partir de una muestra
Una estadística es una medida estadística calculada a partir de una muestra
El error estándar de estimación es una medida de variación entre todas las muestras posibles
del mismo tamaño extraída aleatoriamente de una misma población.
Un error estándar de estimación pequeño significa que la muestra es representativa para la
población.
11) El capital de las empresas agropecuarias en un país se distribuye normalmente con una media
de 800000 euros y una desviación estándar de 50000. Si seleccionan un muestra aleatoria de 60
empresas agropecuarias, cual es la probabilidad de que tengan un capital medio : a) superior a los
37
802000 euros b) inferior a los 796000 euros c) mayor a los 797000 euros d) entre 802000
euros y 804000 euros e) entre 797000 euros y 804000 euros .
12) Una empresa compra termos de cristal y algunos de ellos tienen imperfectos. En un día
especifico compra una lote de termos de cristal y se sabe que el 4.58% de los termos de cristal
tienen imperfectos. Cuál es la probabilidad de que una muestra aleatoria de 90 termos de cristal
hayan : a) más de 5% de termos de cristal con imperfectos? b)menos de 5% los termos de cristal
con imperfectos c)Entre el 3.5% y 6.3% de termos de cristal con imperfectos d)Entre el 5% y el
6.2% de termos de cristal con imperfectos.
13) Para qué sirve el error estándar de estimación :a) Para medir las variaciones de la
X
variable. b) Para determinar si la población es homogénea. c) Para medir las variaciones entre las
muestras del mismo tamaño. d) Ninguna de las anteriores.
a) una variable aleatoria o regla de como estimar el parámetro de la población.
b) Una medida estadística calculada a partir de una población.
c) Un medida estadística calculada a partir de una muestra.
d) es el valor numérico que obtenemos con una muestra.
e) Ninguna de las anteriores.
15) El error estándar de estimación sirve: a). Para medir las variaciones de las variables. b) Para
determinar si la población es homogénea. c) Para medir las variaciones entre las muestras del
mismo tamaño. d) Ninguna de las anteriores.
16) Soy el gerente de una multinacional y afirmo que los obreros de la empresa se encuentran
bien pagos ya que tienen un salario promedio quincenal de 650 dólares. Para probar que los
obreros están mal pagos con una confiabilidad del 95% selecciono una muestra aleatoria de 15
obreros y obtengo un salario quincenales promedio de 649 dólares y una desviación estándar de
30 dólares. Para solucionar este problema debo calcular: a) Un mínimo para la media poblacional
b) Un máximo para la media poblacional c) Un intervalo de confianza completo para la media
poblacional d) Un mínimo para la proporción poblacional e) Un máximo para la proporción
poblacional f) Un intervalo de confianza completo para la proporción poblacional.
17) El propietario de la fábrica de bicicletas EL Radial quiere determinar por intervalo de confianza
con una confiabilidad del 90%, el porcentaje de ciclistas que utilizan esta marca en cierto
departamento de Colombia. Selecciono al alzar 250 propietarios de bicicletas y se aplicó una
encuesta donde preguntaba si compran esta marca de bicicleta. De las 250 personas entrevistadas
150 afirman que sí lo utilizan.
38
III. ESTIMACION
COMPETENCIAS
En este capítulo se explican algunos métodos estadísticos para tomar decisiones acerca de un gran
volumen de datos, examinando una pequeña parte de ellos (muestra).
En la estadística inferencial existen dos métodos para tomar decisiones: estimación y la prueba
de hipótesis.
39
3.1. CONCEPTOS GENERALES DE ESTIMACION
PARAMETRO ESTIMADOR
n
X
i1
i
X
n
X X
2 n
2
i
i 1
S2
n
σ
S S2
P Casos favorables
p
Total de casos n
Q q 1 p
Existen dos clases de estimaciones: estimación puntual y estimación por intervalo de confianza.
Sí a partir de las observaciones de una muestra aleatoria se calcula un valor como estimación de un
parámetro de población desconocido, el procedimiento se denomina estimación puntual, ya que
utiliza como estimación un solo punto del conjunto de todos los valores posibles del parámetro.
Ejemplo, suponga que en el barrio las Granjas se desea estimar el porcentaje de hogares que
consumen chocolate Neivano y el promedio de barras diarias consumidas de chocolate Neivano .
Para estimar los parámetros ( % y ), seleccionan aleatoriamente 45 hogares en el barrio a los
cuales se aplicó la encuesta y los resultados son: un 30% de los hogares consumen chocolate
Neivano con un promedio de 3 barras diarias. Concluyó que aproximadamente una tercera parte
de los hogares del barrio las Granjas consumen chocolate Neivano con un promedio diario de tres
barras. En este caso es una estimación puntual.
Para realizar estimaciones puntuales se debe tener en cuenta las propiedades de un "buen
estimador".
40
3.2. ESTIMACION POR INTERVALO DE CONFIANZA.
La estimación por intervalo de confianza consiste en dos valores numéricos que con grados de
confianza se considera que incluye el parámetro que está estimando.
Interpretación:"con una confiabilidad del (1- )% el parámetro esta entre (-K ) y (+K ).
Para determinar los intervalos de confianza para la media poblacional hay que observar si la
población se distribuye normalmente o si la muestra es pequeña.
PX Zσ X . X Zσ X 1 α
Donde:
S
x = Promedio poblacional. x = Error estándar de la media
n
Z = Percentil de la distribución normal X = Promedio de la muestra (1 - )% = Confiabilidad.
Ejemplo. Estimar por intervalo de confianza (95%) el salario promedio mensual de un auxiliar
contable en el país A. Una muestra aleatoria de 256 auxiliares contables del país A, presentó un
salario promedio mensual de $843542 con una desviación estándar de $20500.
Solución: Como solicita el intervalo para salario promedio mensual de un auxiliar contable, no se
sabe como se distribuye la población y la muestra es mayor de 30, debe utilizar el siguiente
intervalo:
PX Zσ X . X Zσ X 1 α
41
S
Donde: x = Promedio poblacional. x = Error estándar de la media
n
Z = Percentil de la distribución normal X = Promedio de la muestra (1 - )% = Confiabilidad.
(843542 - 1.96 [1281.25) < <843542 + 1.96 [1281.25]) (841030,75 < < 846053.25)
Interpretación: Con una confiabilidad del 95%, el ingreso promedio mensual del auxiliar contable
del país A, están entre $841030,75 y $846053,25).
S
Donde: x = Promedio poblacional.
n
x = Error estándar de la media X = Promedio de la muestra
P.. X t , n 1 X
1 Máximo
Nota: la distribución t-student tiene características similares a la distribución normal estándar se
utiliza para muestras pequeñas (n ˂ 30) y no se conoce la varianza. La media de la distribución t-
student es cero y las varianzas son mayores que 1 (grafico 3.1).
Ejemplo. Estimar por intervalo de confianza con una confiabilidad del 95%, los gastos promedios
mensuales (en millones de pesos) en publicidad de las empresas textiles del país A. Una muestra
aleatoria de 15 empresas textiles presentan los siguientes gastos mensuales en publicidad: 3.4 2.8
4.4 2.5 3.3 4.0 4.8 2.9 5.6 5.2 3.7 3.0 3.6 4.8 4.9 . Suponga que los gastos mensuales en
42
publicidad de las empresas textiles del país A, se distribuyen aproximadamente en forma normal.
Utilizando otra familiar de la distribución normal, la distribución t - Student (tabla III . t-Student en
el apéndice III ), la cual es utilizada cuando no se conoce la varianza poblacional y la muestras son
pequeñas (n < 30 ). La distribución t-Student depende de dos parámetros; confiabilidad (1-) y el
tamaño de la muestra (n-1), es decir, t(),(n-1). Donde ( 1 - ) = 0.95. Entonces despejando alfa
= 0.05. Luego se busca t(/),(n-1). = t(0.05),(15-1). = t(0.05),(14). = 2.1448 (valor tabla a dos colas )
Reemplazando el intervalo
Interpretación: Con una confiabilidad del 95% el gasto promedio mensual en publicidad de las
empresas textiles del país A, están entre $3.390.000 y $4.470.000.
Pp Zσ p μ .p Zσ p 1 α
No. de éxitos
Donde: p
pq p
n n
q 1 p
Ejemplo. un fabricante de jabón desea saber la preferencia del jabón de marca H. Una muestra
seleccionada al azar de 100 amas de casa en un municipio, les pregunta sí prefieren el jabón de
marca H, y 20 afirma que si lo prefieren. Determine el intervalo de confianza del 95% para la
verdadera proporción (%) de amas de casa del municipio.
Pp Zσ p μ .p Zσ p 1 α
amas de casa que prefieren el jabón de marca H
p
n
No. de éxitos 20
Entonces p 0,2 q = 1 – p = 1 – 0.2 =0.8
n 100
pq 0 . 2 * 0 .8
p 0.04
n 100
Reemplazando el intervalo, (0.2 - 1.96 [0.04] < P < 0.2 + 1.96 [0.04])
44
(0.1216 < P < 0.2784) (12,16 < % < 27,84)
Interpretación: con una confiabilidad del 95%, el porcentaje de amas de casa que prefieren el
jabón H esta entre 12,16% y 27,84%
EJERCICIOS
1. Un distribuidor de acetona mantiene registros minuciosos sobre algunas operaciones con sus
clientes. El quiere estimar por intervalo de confianza las ventas promedios de acetona (en galones)
por clientes. Toma una muestra aleatoria de 18 registros, indica que las ventas promedio es de
63.84 galones con una desviación estándar de 2.75 galones. Asuma una confiabilidad del 99%.
Suponga normalidad.
a) Determine la venta promedio mínima por cliente. b) Determine la venta promedio máxima por
cliente.
2. La vida útil de un micromotor de marca A se distribuye normalmente. Realice una estimación por
intervalo de confianza (95%) para la vida útil media de los micromotores de marca A. Al
Seleccionar una muestra aleatoria de 50 propietarios de micromotores de marca A presentan una
vida útil media de 15 años con una varianza de 4 años2.
3. El propietario del lápiz marca Raya quiere lanzar el producto en cierto departamento de
Colombia. Para tomar la decisión si lo comercializa define el siguiente criterio: "debe utilizarlo como
mínimo el 20% de los habitantes del departamento". El propietario le adjudica al jefe de compras
de la empresa esta tarea. Para ello seleccionó 250 personas del departamento y aplicó una
encuesta donde les preguntaba si utilizarían esta marca de lápiz. De las 250 personas entrevistadas
100 afirman que sí lo utilizan, 140 no lo utilizan y 10 no responden. Asuma una confiabilidad del
90%.¿ De acuerdo a esta información que recomendación le haría al propietario de la empresa
Raya?.
4. Una investigación efectuada a 400 familias de clase media en el Huila, reveló que en la
realización de fiestas familiares, un 92% preferían aguardiente DOBLE ANIS a cualquier otra clase
de licor. Calcule por intervalo de confianza el porcentaje de familias de clase media del Huila que
utilizan el aguardiente Doble Anís para las fiestas (confiabilidad 95%).
5. En los últimos 9 días una planta de productos químicos ha producido un promedio de 541
toneladas diarias de cierto producto químico. Por experiencia pasada, el gerente de la planta sabe
que la varianza es de 69.5. Construya un intervalo de confianza del 99% para la producción media
diaria de la empresa química.
6. El director de una empresa desea construir un intervalo de confianza para el porcentaje de
empleados que llegan tarde al trabajo. Selecciona una muestra aleatoria de 220 empleados y 175
llegan a tiempo en un día específico. Confiabilidad del 90%.
7. Estoy pensando adquirir un lote de cierto artículo deportivo. Me han informado otros empresarios
que dicha marca deportiva presenta gran cantidad de artículos defectuosos. Para tomar la decisión
45
de comprarlo asumo el siguiente criterio: "sí un lote tiene más de 2% de artículos defectuosos no
acepta el lote y por consiguiente no adquiere el producto". Toma una muestra aleatoria de 320
artículos y 4 de ellos son defectuosos. ¿Compro los artículos deportivos?. Confiabilidad del 95%.
8. El Presidente de un banco desea construir un intervalo de confianza para el porcentaje máximo
de empleados que llegan a tiempo al banco. Selecciona una muestra aleatoria de 330 empleados y
175 llegan a tiempo en un día específico. Confiabilidad del 90%.
9. Una empresa fabrica focos, afirma que la duración media de los focos es 782 horas y está
distribuida normalmente. Para probar esta afirmación selecciona una muestra de 25 focos y
obtiene una vida media de 780 horas, con una varianza de 40 horas². Confiabilidad 95%.
10. Para estimar por intervalo de confianza el número promedio de errores en los libros diarios de
las empresas de Neiva, usted selecciona 14 libros y encontró los siguiente errores por libro: 6, 8, 4,
6, 7, 9, 5, 7, 6, 7, 8, 9, 7, 5. Confiabilidad 90%
11. Determinen por intervalo de confianza el porcentaje de sucursales del banco en Colombia que
no cuentan con cajeros automáticos. Selecciona una muestra aleatoria de 45 de sucursales del
banco y 35 de ellos cuentan con cajeros automáticos. confiabilidad 90%.
12. Un administrador de empresas quiere estimar por intervalo de confianza el gasto promedio
mensual de los aficionados al fútbol en un departamentos de Colombia, con una confiabilidad del
95%. Selecciona una muestra aleatoria de 12 aficionados al fútbol y obtiene los siguientes gastos
promedios mensuales (dólares): 840 870 860 820 900 750 765 768
770 750 705 712.
13. El ingeniero Roberto Torres está interesado en conocer el consumo medio mensual de
cigarrillos de los estudiantes universitarios, con una confiabilidad del 96%. Selecciona una muestra
aleatoria de 650 estudiantes universitarios y obtiene un consumo medio mensual de 10 cigarrillos
con una desviación estándar de 2 cigarrillos mensuales.
14. En una muestra aleatoria de 700 personas mayores de 18 años en una gran ciudad, se obtuvo
que 200 apoyan al candidato Filomeno Rojas para la alcaldía. Halle, con un nivel de confianza del
92%, un intervalo de confianza que permita estimar la proporción de votantes que apoyan al
candidato Filomeno Rojas en esa ciudad.
15. En una encuesta realizada a 1200 mujeres adultas de una población se encontró que 810 de
ellas son amas de casa actualmente. Construya con estos datos un intervalo de confianza, con un
nivel del 95%, para la proporción de mujeres que son amas de casa actualmente en esa población.
16. Una universidad quiere estimar por intervalo de confianza la proporción de hogares con
conexión a Internet en una gran ciudad, con una confiabilidad del 93%. seleccionan al azar 455
hogares y 236 cuentan con conexión a Internet. Como estudiante de esta universidad me solicitan
calcular el intervalo de confianza con esta información.
17. Se quiere estimar la duración media de los bombillos marca Brillo, con una confiabilidad del
95%. Se toma una muestra aleatoria de 20 focos, la cual resulta tener una duración promedio de
2200 horas y una desviación estándar de 40 horas. a)Construya un intervalo de confianza la
duración media de los bombillos marca Brillo. b) Construya un límite inferior de confianza la
duración media de los bombillos marca Brillo.
46
IV. DISEÑO DE LA MUESTRA
COMPETENCIAS
Estamos acostumbrados a sacar conclusiones acerca de una gran población basando en una
muestra pequeña, por ejemplo en el periódico durante la semana leemos resultados sobre la
opinión que tienen los colombianos acerca de un político o sobre la gestión del presidente de la
república entrevistando solamente unos cuantos individuos (muestra). Al trabajar con una muestra
y no con una población se disminuyen; costos, tiempo y errores de recolección de información.
47
Para determinar el tamaño de la muestra debe tener en cuenta; la característica del estudio, las
variables, los costos y el tiempo requerido para la investigación. Los factores anteriores determinan
el tipo de muestreo a utilizar.
Existen dos grandes tipos de muestreo: muestreo probabilístico y el muestreo no probabilístico.
Es un caso especial del muestreo de juicios. Por ejemplo el investigador define una o más variables
de control para seleccionar la muestra. Una variable de control en una investigación puede ser la
edad, el sexo, etc. Entonces el investigador define con criterio propio cuantas personas va a
encuestar en un grupo de edad determinado y a cuantas de sexo masculino.
El muestreo probabilístico tiene como base la teoría de la probabilidad, por consiguiente, tiene
soporte matemático. Un muestreos es probabilístico cuando todos los miembros de la población
tienen una probabilidad conocida de ser incluido en la muestra.
Algunos tipos de muestreo son: Muestreo aleatorio simple (con o sin reemplazamiento),
48
muestreo aleatorio estratificado, muestreo aleatorio por conglomerado, muestreo sistemático, etc.
Cuando hay que efectuar un muestreo, es importante definir la unidad de muestreo y se define
como la persona u objeto a la que se aplica la encuesta o se le realiza la observación. Por ejemplo,
si van a determinar el perfil del consumidor de la chocolatina El Meloso en Neiva, entonces la
unidad de muestreo es la persona entre siete y 50 años en el municipio de Neiva.
n
X
i
X i 1
n estimación puntual
49
S
X error de muestreo para población infinita
n
N n S
X error de muestreo para población finita
N n
No.de.éxitos
p q 1 p Estimación puntual
n
PQ
P error de muestreo para población infinita
n
N n PQ
P error de muestreo para población finita
N 1 n
Establecidas las características a estimar y prefijados la precisión requerida, hay que decidir cuál va
a ser el tamaño de la muestra o el número de elementos a seleccionar por el procedimiento de
muestreo que va a utilizar, de modo que el resultado no sea en exceso costoso o impreciso. Para
este tipo de muestreo hay utilizar las siguientes fórmulas para determinar el tamaño de la muestra.
NK 2 2
n
Ne 2 K 2 2 Población finita cuando estima la media poblacional.
50
NK 2 PQ
n
N 1e2 K 2 PQ Población finita cuando estima la proporción poblacional.
K 2 2
n Población infinita cuando se estima la media poblacional
e2
K 2 PQ
n Población infinita cuando se estima la proporción poblacional
e2
Donde:
N= tamaño de la población.
n= tamaño de la muestra.
2 =varianza poblacional.
PQ= varianza poblacional.
Q=1-P
Nota: para las formulas anteriores se fija la confiabilidad de que el error máximo admitido no
supere a lo prefijado. El error es de acuerdo a cada investigación y hay que fijarlo de acuerdo a la
característica de la población.
51
d) tipo de muestreo a utilizar.
e) Como no se conoce la varianza poblacional, debe estimarse. Existen varios métodos para
estimar la varianza poblacional. Algunos de ellos son:
Seleccionar una premuestra aleatoria (muestra piloto) con el fin de estimar la varianza y al
mismo tiempo probar el instrumento de medida (encuesta).
f) Realizados los pasos anteriores, reemplazar la fórmula del tamaño de la muestra y se obtiene la
muestra definitiva.
g) Aplicando la encuesta a los elementos seleccionados que conforman la muestra debe realizar las
estimaciones, ya sea puntual o por intervalos de confianza.
Ejemplo. El propietario del shampoo Caspin en forma de cojín, desea estimar la comisión
promedio deseada por los distribuidores del producto. Como no cuenta con el dinero y tiempo
necesario para encuestar a todos los distribuidores solicita al investigador de mercados, que con
base a una muestra aleatoria, estime la comisión el promedio solicitada por los distribuidores,
para adicionarla a los costos del producto.
Como criterio para la determinación de la muestra, el propietario fija una confiabilidad del 95%
para un error máximo admitido en la estimación de $4.90 por producto.
Como solicita determinar el tamaño de la muestra el investigador de mercados aplica los pasos de
la página No. 50 y dice:
a) La población para este estudio son 110 distribuidores, correspondiente al mes de febrero del año
2012.
b) El marco poblacional es el listado de los distribuidores generado por la sección de sistemas de la
empresa (tabla 4.1).
c) Confiabilidad del 95% y error máximo admitido de $4.90
d) Como la población es pequeña utilizó un MAS para estimar la comisión promedio solicitada por
los distribuidores.
A continuación presenta la fórmula a utilizar:
NK 2 2
n Población finita cuando estima la media poblacional.
Ne 2 K 2 2
e) Como no conocen la varianza poblacional, la estiman con una premuestra aleatoria de tamaños
8.
Para que sea aleatoria utilizar la tabla de números aleatorios (tabla IV, apéndice) con los
siguientes criterios:
52
Tabla 4.1. Listado de los distribuidores de Shampoo Caspin. 2014
40 CONSTANZA ARTUNDUAGA 80 LINA PEREZ
1 AURELIANO SANCHEZ PEREZ 41 TULIA FIGUEROA H. 81 SILVIA CASTRO
2 CARLOS A. BOHORQUEZ 42 MIREYA BELTRAN 82 HAROLD MANRIQUE
3 DERLY SOLEY PERDOMO 43 MARGOTH RAMIRES S. 83 ALEXI POLANIA
4 ROBINSON QUIMBAYA VANEGAS 44 JIMENA SALAZAR P. 84 DELIA BAHAMON
5 GLORIA HELENA TORRES 45 FERNANDA GUZMAN P. 85 BLANCA SALAS
6 NORMA COSTANZA ARTUNDIAGA N. 46 CONSTANZA ROJAS 86 GLORIA MORERA
7 IMNA FIGUEROA HERNANDEZ 47 LILIANA RAMOS 87 PEDRO CASTYRO
8 SILVIA MIREYA BELTRAN M. 48 YESID MANRIQUE 88 SERGIO MORENO
9 LEILA MARGOTH RAMIREZ S. 49 ALEXIS RUBIANO P. 89 LUCY MOYANO
10 MARIA JIMENA SALAZAR ROA 50 EBELIA CORTES IPUS 90 CARLOS SOTO
11 MARA FERNANDA GUZMAN C. 51 MIRIAM MORALES T. 91 JESUS SANTANDER
12 LINA CONSTANZA ROJAS 52 GLORIA TORA 92 ROSA TRUJILLO
13 SILVIA LILIANA RAMOS G. 53 ROSA ESQUIBEL N. 93 JORGE PAREDES
14 HAROL YESID MANRIQUE 54 JOSE CULMA A. 94 HAROLD CASTRO
15 HERMES ALEXI RUBIANO 55 JASMIN PEDRAZA V. 95 CESAR ROJAS
16 DELIA CORTEZ IPUS 56 AUGUSTO MUÑOS 96 BEATRIZ MARIN
17 BLANCA MIRIAM MORALES 57 ANTONIO CORRALES I. 97 HECTOR PEREZ
18 GLORIA LENID TORO 58 CLAUDIA ROJAS A. 98 OLGA DONATTO
19 PEDRO ESQUIVEL P. 59 WILMER LOPEZ T. 99 RAMON QUINTERO
20 SERGIO JOSE CULMA 60 HAROLD SOLAR 100 LUZ MERY SALAS
21 LUCI JASMIS ARTEHORTUA 61 CESAR VERACRUZ 101 EDGAR ALVAREZ
22 CARLOS AUGUSTO BRAVO 62 BETRIZ REYES 102 CARLOS GUZMAN
23 JESUS ANTONIO CORREA 63 JORGE GONZALEZ 103 AURELIANO ROSAL
24 ROSA CLAUDIA ROJAS 64 OLGA PATRICIA LUCAI 104 CARLOS MARIN
25 WILHEIN YOAKOV LOPEZ 65 RAMON MACIAS 105 DERLY SANCHEZ
26 HAROL SOLORSANO ORDONEZ 66 LUZ MERY DURAN 106 ROBINSON SANCHEZ
27 CANDIDO HERRERA 67 ANIBAL CUELLAR 107 CLAUDIA VANEGAS
28 SILVINA HURTADO 68 JAVIER YELA 108 NORMA TRUJILLO
29 CESAR VERA 69 AURELIANO PEREZ 109 IRNA PEREZ
30 OLGA PATRICIA LUCUARA 70 ALBERTO ROJAS 110 SILVIA LOSADA
31 RAMON DUSSAN MACIAS 71 DERLY SOTIL
32 LUZ MERY LUCUARA 72 ROBINSON QUIMBAYA
33 EDGAR ANIBAL CUELLAR 73 CLAUDIA MARIN
34 CARLOS JAVIER PAPA YELA 74 NORMA PEREA
35 AUREL SALDARRIAGA 75 IRMA FIGUERO H.
36 ALBERTO BOHORQUEZ Z. 76 SILVIA PEDRASA
37 SOLEY PERDOMO 77 LEYLA ROMA
38 ROBIN VANEGAS 78 MARIA ROA
39 HELENA TORRES E. 79 FERNANDA PEREZ
53
Los tres primeros números aleatorios (N.A.) por fila, empezando por el número 04470. Los números
aleatorios seleccionados son: 044, 108, 091, 005, 007, 073, 053, 010, y corresponden a los
siguientes distribuidores (tabla 4.2).
Entonces S2 = 54.4
S2 = 54.4 e = 4.9
La muestra definitiva para estimar la comisión promedio de los distribuidores de la empresa es 12.
g) La premuestra es de 8 distribuidores, agregar cuatro distribuidores escogidos aleatoriamente en
la tabla de números aleatorios (continuando donde terminó el último número aleatorio de la
premuestra 010). Los números aleatorios son: 018 y 035, 077 y 042. La muestra definitiva con las
54
respectivas comisiones están en la tabla 4.4.
Para estimar la comisión promedio deseada por los distribuidores, utilice el siguiente intervalo con
una confiabilidad del 95%:
_ _
P [ X - t(), (n - 1) x < < X + t(), (n - 1) x ] = 1 -
Donde:
N n S
X Población finita
N n
Con la muestra definitiva se obtiene:
_
X = 200 S = 17.57
110 12 17.57
X * 4.51
110 12
Reemplazando el intervalo:
Con una confiabilidad del 95% la comisión promedio deseada por los distribuidores de la empresa
para el shampoo Caspin está entre $ 190,08 y $209,93.
55
Ejemplo.
El propietario del shampoo Caspin desea determinar si los distribuidores del producto están
satisfechos con la distribución de los productos. Como no cuenta con el dinero y tiempo necesario
para encuestar a todos los distribuidores, me solicita, que con base a una muestra aleatoria estime
el porcentaje de distribuidores que están satisfechos con la distribución de los productos de la
empresa. Como criterio para la determinación de la muestra, el propietario fija una confiabilidad
del 90% para un error máximo admitido en la estimación del 12%.
a) La población para este estudio son los 110 distribuidores de la empresa, correspondiente al año
2012.
b) El marco poblacional es el listado de los distribuidores generado por la sección de sistemas de la
empresa (ver tabla 4.1).
c) Confiabilidad del 90% y error máximo admitido de 0.12
d) Como la población es pequeña utilizar un MAS para estimar si está satisfecho con la distribución
de los productos. A continuación se presenta la fórmula a utilizar:
NK 2 PQ
n Población finitas cuando estima la proporción poblacional.
N 1e2 K 2 PQ
e) Como no conocen la varianza poblacional la estiman con una premuestra aleatoria de 12.
Para que sea aleatoria utilizó la tabla de números aleatorios con los siguientes criterios: los tres
últimos números por columna, empezando por el número 28704. Los números aleatorios (N.A.)
seleccionados son: 0.87, 018, 098, 019, 014, 007, 110, 108, 101, 059, y corresponden a los
distribuidores de la tabla 4.5.
e) Aplicar una encuesta a los distribuidores seleccionados en la premuestra donde les pregunta:
56
¿están satisfecho con la distribución de los productos de la empresa ?. Los resultados están en
la tabla 4.6.
Tabla 4,6 Está satisfecho con la distribución del Shampoo Caspin. 2014
Reemplazando la formula
NK 2 PQ 110 *1.8332 * 0.9 * 0.1
n n 17.7 18
N 1e2 K 2 PQ 110 10.122 1.8332 * 0.9 * 0.1
La muestra definitiva para estimar el porcentaje de distribuidores de la empresa es de 18 .
Donde:
N n PQ
P Población finita
N 1 n
57
Tabla 4.7 ¿Está satisfecho con la distribución del Shampoo
Caspin ?. Muestra definitiva 2014
87. PEDRO CASTRO SI
18. GLORIA LENID TORO O. SI
98. OLGA DONATTO SI
14. HAROLD YESID MANRIQUE P NO
19. PEDRO ESQUIVEL P. SI
07. FIGUEROA HERNANDEZ SI
110. SILVIA LOSADA SI
108. NORMA TRUJILLO SI
101. EDGAR ALVAREZ SI
59. WILMER LOPEZ A. SI
79. FERNANDA PEREZ NO
66. LUZ MERY LURAN SI
89. LUCY MOYANO SI
9. LEYLA MARGOTH RAMIREZ S. SI
74. NORMA PEREA SI
109. IRMA PEREZ NO
45. FERNANDA GUZMAN P. SI
15. HERMES ALEXY RUBIANO E. SI
Reemplazando el intervalo:
( 0.83 - 1.74 [0.081] < P < 0.83 + 1.74 [0.081] ) (0.6891 < P < 0.9709)
Interpretación: Con una confiabilidad del 90% el porcentaje de distribuidores de la empresa que se
encuentra satisfecho en la distribución de los productos esta entre 68.91% y el 97.09%.
Cuando hay que presentar un informe ejecutivo es necesario incluir la ficha técnica. Un modelo
general de ficha técnica de muestreo para el ejercicio de distribuidores del shampoo Caspin está a
continuación:
58
4.2.1.3. CASOS ADICIONALES PARA DETERMINAR TAMAÑOS DE
MUESTRA
Caso 1: Asumir la máxima varianza P=0.5 y Q=0.5, la confiabilidad y el error máximo que desea
(recomendar que debe ser menor o igual del 5%).
Ejemplo. Un ingeniero quiere determinar el porcentaje de amas de casa en Neiva que prefieren el
jabón Amarillo en Neiva.
Para este caso el valor de K es el percentil de una distribución normal correspondiente al 95%. El
error máximo admitido en las estimaciones “ e” lo asumió en un 4% que equivale en proporción
0.04. Asumiendo la máxima varianza P = 0.5 y Q= 0.5, reemplazo la formula y obtiene que para
el estudio debe encuestar al azar 601 ama de casa:
59
K 2 PQ 1.962 * 0.05 * 0.05
n 600.25 601 encuestas
e2 0.042
Caso 2. Cuando el contratista tiene una cantidad de dinero para la recolección de información. En
este caso se determina el valor de la encuesta en recolección y se realiza un cociente entre estas
dos cantidades. Con base a esta muestra definitiva se obtiene el error máximo admitido asumiendo
un confiabilidad del 95% y la máxima varianza (P=0.5 Q=0.5). A continuación se explica con un
ejemplo.
El alcalde de un municipio solicita al economista Petro Ramos que determine un tamaño de muestra
para que evalué la gestión del año 2008. El alcalde le informa que para la aplicación de la encuesta
tienen un presupuesto de $1.000.000. Petro realiza una estimación aproximada por el valor de la
aplicación de la encuesta y obtiene como resultado el costo de $4000. Entonces el tamaño de la
muestra es de 250 encuestas ( n = 1.000.000/ 4000 = 250).
Caso 3. Las encuesta tiene varias preguntas, entonces para determinar el tamaño de la muestra
una alternativa es averiguar cuáles son las preguntas importantes y a estas le determina el tamaño
de la muestra a cada una (con el mismo error y la misma confiabilidad) y la que tenga el tamaño
de muestra más grande es la muestra definitiva.
Ejemplo. Para ser un estudio de mercado que tiene como objetivo determinar el nivel de
satisfacción del cliente del jabón El Rojo en Neiva. La encuesta tiene 30 preguntas. Para
determinar el tamaño de la muestra el especialista de mercados considero tres preguntas
principales :
Solución: Como la población es grande, utilizo la siguiente formula, para una confiabilidad del 95%
para un error máximo en las estimaciones del 5% (lo prefijo el cliente).
K 2 PQ
n
e2
Para este caso el valor de K es una Z=1.96. Esta se busca en la tabla Z para una confiabilidad del
95. El error e= 0.05 y como no se conoce la varianza P Q, aplico una premuestra en Neiva de 40
encuesta. Los resultados de las encuesta son:
Con estos datos determinó el tamaño de la muestra para cada pregunta, con el mismo error (0.05)
60
y la misma confiabilidad del 95% ( Z=1.96)
Para la pregunta ¿Sí no encuentra el jabón Rojo en la tienda compraría otro jabón?
P = 32/40 = 0.875 Q=1-P=1-0.875 = 0.125
Concluye que para la primera pregunta debo encuestar a 288 personas; en la segunda pregunta
debe encuestar a 246 personas y en la tercera pregunta solo a 168 personas. Entonces selecciona
el tamaño de muestra más grande que es 288 y esta es la muestra definitiva. Es decir que debe
encuestar en Neiva solo a 288 personas.
Ejercicio propuesto. El alcalde del municipio de Pitalito lo contrato para realizar el siguiente estudio:
61
4.2.2. MUESTREO SISTEMATICO
Para los diseños de muestra anteriores se ha supuesto que para obtener cada elemento de la
muestra se efectuaba una selección probabilística, utilizando la tabla de números aleatorios. El
muestreo sistemático consiste en tomar aleatoriamente un número i que designará en una lista o
población de N elementos, al primero que va a formar parte de la muestra. De manera rígida y
sistemática los elementos i+k, i+2k, y así sucesivamente hasta completar el tamaño de muestra n.
La constante k se obtiene del siguiente cociente: k = N/n.
Los pasos a seguir en una muestra sistemática son:
a) Calcule k = N/n.
b) Si k resulto entero.
c) Si k no resulto entero.
Este tipo de selección es importante y presenta mayor ventaja de la selección aleatoria debido a
que queda mejor distribuida la muestra en la población. En trabajo de campo, el encuestador
puede ir determinando la unidades a encuestar en forma sencilla y práctica, por ejemplo; se va a
seleccionar en un barrio de 120 viviendas, una muestra de 15 viviendas. El encuestador selecciona
un entre 1 y 120. El número aleatorio seleccionado al zar al encuestador se le informa que ubique
en esa dirección y a partir de ella, cada octava vivienda debe observar las características analizar (
k =N/n=20/15=8 ).
62
número 4, l cual es i.
Tabla 4.8. Listado de socios del club Los Elefantes 2015.
La muestra queda conformada por las siguientes unidades muestrales: 4, 13, 22, 31, 40, 49, 58,
67, 76, 85. (i, i+k, i+2k, i+3k, i+4k....). Los socios correspondientes a estos números están en
la tabla 4.9
63
Tabla 4.9 Listado de los socios del Club Los Elefantes.
Muestra sistemática
NOMBRE Y APELLIDOS
4 ROBINSON QUIMBAYA V.
13 SILVIA LILIANA RAMOS G.
22 CARLOS AUGUSTO BRAVO
31 RAMON DUSSAN MACIAS
40 CONSTANZA ARTUNDUAGA
49 ALEXIS RUBIANO P.
58 CLAUDIA ROJAS A.
67 ANIBAL CUELLAR
76 SILVIA PEDRASA
85 BLANCA SALAS
Ejercicios propuestos.
1. Seleccionar una muestra sistemática de tamaño 11 para los socios del Club Los Elefantes.
3. En la comuna uno de Neiva se desea determinar un tamaño de muestra para aplicar una
encuesta la cual tiene como objetivo determinar la proporción de persona que están de
acuerdo con la gestión del alcalde. Determine el tamaño de la muestra.
5. La fábrica de llantas RODAL cuenta con 1312 empleados. Se quiere estimar con base a una
muestra aleatoria el ahorro promedio mensual de los empleados, con una confiabilidad del
95% para un error máximo admitido en la estimaciones de $2000. Como no se conoce la
varianza poblacional selecciona una muestra piloto de 15 empleados y se obtiene una
desviación estándar de $30000. Determine el tamaño de la muestra.
64
V. PRUEBA DE HIPÓTESIS
α
β
COMPETENCIAS
En la sección anterior trató el problema de estimar los parámetros a partir de una muestra
aleatoria. En otras investigaciones debemos decidir si una afirmación relativa a un parámetro es
verdadera o falsa. Esto es, probar una hipótesis relativa a un parámetro. Por ejemplo se quiere
probar que:
Las pruebas de hipótesis paramétricas son aquellas hipótesis, donde se plantean en función de
parámetros estadísticos (, , P, % ) y la escala de medida debe ser de intervalo o de razón. Las
pruebas no paramétricas son aquellas, donde no plantean las hipótesis en función de los
parámetros estadísticos y exigen como escalas de medición la nominal.
El modelo general para el procedimiento de una prueba de hipótesis, según la naturaleza de los
datos y los supuestos de la distribución de la población es:
b) Estadística de trabajo: Es una estadística para calcular a partir de los datos de la muestra.
Existen muchos valores posibles que pueden tener la estadística de prueba, dependiendo el valor
particular observado de la muestra particular extraída. Esta estadística de trabajo sirve como
productor de decisiones, ya que la decisión de rechazar o no H 0 depende de la magnitud de la
estadística de trabajo.
X o X o
Ejemplos de estadística de trabajo son: tc Zc etc.
S S
n n
d) Regla de decisión: Todos los valores posibles de la estadística de trabajo que pueda tener,
son puntos sobre el eje horizontal y se dividen en dos grupos; uno de los grupos constituye lo que
se conoce como región de rechazo H0 y el otro grupo como la Región de Aceptación de H 0. Los
valores de la estadística de trabajo que comprenden la región de rechazo, son aquellos que tienen
la menor probabilidad de ocurrir sí la hipótesis nula es verdadera, mientras los valores que forman
66
la región de aceptación son los que tienen mayor probabilidad de ocurrir si la hipótesis nula es
verdadera. La regla de decisión nos dice: rechace la hipótesis nula sí el valor de estadística de
trabajo que se calcule a partir de la muestra, es uno de los valores en la región de rechazo y que
no se rechace (o se acepte) la hipótesis nula, sí el valor calculado de la estadística de trabajo es
uno de los valores en la región de aceptación. Por lo que respecta ¿cuáles valores van hacia la
región de rechazo y cuáles a la región de aceptación?, lo define el nivel de significancia, designado
por alfa y se nota por .
El nivel de significación alfa ( ) especifica el área bajo la curva de la distribución de la
estadística de trabajo que está por encima de los valores sobre el eje horizontal y
constituyen la región de rechazo. Entonces se ve que es una probabilidad y, de hecho, es la
probabilidad de rechazar una hipótesis nula verdadera. Como rechazar una hipótesis nula
verdadera constituiría un error, únicamente parece razonable que debe hacerse
pequeña la probabilidad de rechazar una hipótesis nula verdadera y en efecto, esto es
lo que se hace.
El error que se comete cuando se rechaza una hipótesis nula verdadera se llama error del tipo I (
) o nivel de significancia. El error del tipo II se comete cuando se acepta una hipótesis nula
falsa. La probabilidad de cometer un error del tipo II se designa por ( ß ).
Siempre que se rechaza una hipótesis nula se tiene riesgo concomitante de cometer un
error del tipo I, (rechazar una hipótesis nula verdadera). Siempre que se acepte una
hipótesis nula (error tipo II) se tiene el riesgo de que esta sea falsa.
En general no ejerce control sobre ß, aunque se sabe que, como regla, es mayor que . Nunca se
sabe si se ha cometido o no uno de estos errores cuando se rechaza o se deja de rechazar una
hipótesis nula, debido a que se desconoce el enunciado verdadero de los asuntos. Si el
procedimiento de prueba conduce al rechazo de la hipótesis nula verdadera, puede ser un consuelo
el hecho de que se ha empequeñecido y por lo tanto fue pequeña la probabilidad de cometer un
error del tipo I. Sí se acepta la hipótesis nula no se conoce el riesgo concurrente de cometer un
error del tipo II ya que por lo común se desconoce ß pero, como ha señalado, se sabe que en
general es mayor que .
Cuando una población está distribuida normalmente y se quiere realizar una prueba de hipótesis
sobre el parámetro media hay que utilizar los modelos que están en la figura 5.1 Para aplicar uno
de los tres modelos (figura 5.1) hay que observar si la población se distribuye aproximadamente
en forma normal o las muestras son mayores que 30 o sin son menores de 30. Si la muestra es
menores de 30 y la población se distribuye aproximadamente en forma normal, hay que calcular la
estadística t; si la muestra es mayor de 30 o se distribuye normalmente se calcula la estadística Zc.
67
FIGURA 5.1. PRUEBA DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN
NORMAL
Ho : = o vs Ho : o vs Ho : o vs
H1 : o H1 : o H1 : o
b) Estadística de trabajo:
b) Estadística de trabajo: b) Estadística de trabajo:
X o
X o X o tc
tc | tc S
S S n
n n X o
X o X o Zc
Zc Zc S
S S n
n n
Ejemplo. El fabricante de la ambulancia marca Veloz, afirma que el consumo promedio de gasolina
68
es superior a 14 kilómetros por galón de gasolina corriente. Un organismo de defensa al
consumidor piensa que ese kilometraje promedio ha sido exagerado por el fabricante. Toma una
muestra aleatoria de 9 ambulancias de marca veloz y son conducidos del mismo modo con un
galón de gasolina corriente. Los kilómetros recorridos por las diversa ambulancias son: 13 - 13 -
14 - 12 - 12 - 12 - 13 - 12 - 12. Si el organismo supone que el consumo de gasolina se distribuye
normalmente, ¿puede este rechazar dicha afirmación a un nivel de significancia del 5%? (Alfa =
0.05)
Solución. Como supone que la distribución de los kilometrajes recorridos con un galón de gasolina
corriente se distribuye normalmente, además la afirmación involucra el parámetro promedio y la
muestra aleatoria es menor de 30; el modelo III es el adecuado.
Ho : 14 vs H1 : 14
c) Decisión
donde: -t = - t(), (n-1) Para determinar el valor de t(), ,(n-1) -t(0.05),(8) en la tabla t-student (tabla
III ) es igual -1.86. Ubica este valor en la figura. Luego ubica tc = -5.95 en la figura y cae en la
región de rechazo de Ho. Entonces la decisión estadística es: como tc cayó en RR (región de
rechazo de Ho), entonces rechazo Ho y acepto H1.
Ejemplo. Para el ejercicio anterior el organismo de defensa de consumidor quiere demostrar que
el kilometraje medio recorrido por la ambulancia marca "veloz", es diferente a 15 kilómetros por
galón de gasolina corriente. Alfa = 0.01.
Solución: Para esta afirmación la prueba de hipótesis es la siguiente (modelo I figura 5.1).
69
a) Planteamiento de hipótesis
Ho : = 15 vs H1 : 15
X o 12.56 15
tc 10.08
S 0.72
n 9
c) Decisión
donde: -t = - t(/), (n-1). Para determinar el valor de t() ,(n-1) = t(0.05),(8) en el tabla III, t-student
(tabla III) a dos colas es igual 2.306. Ubica este valor en la figura. Luego ubica tc = -10.08 en la
figura y cae en la región de rechazo de Ho. Entonces la decisión estadística es: como tc cayó en
RR (región de rechazo de Ho), entonces rechazo Ho y acepto H1.
Conclusión. El kilometraje medio recorrido por la ambulancia marca veloz es diferente a los 15
kilómetros por galón de gasolina corriente.
Ejemplo. El propietario del almacén veterinario el Tigre quiere probar que las ventas promedios
diarias son superiores al $1.000.000 . Para confirmar esta afirmación selecciona en contabilidad
60 días de ventas aleatoriamente y obtiene una venta promedio diaria de $1.045.000 con una
desviación estándar de $180.000. Nivel de significancia 5%.
70
b) Estadística de trabajo:
X o
Zc muestra mayor de 30 Como:
S
n
S = $80.000 n =60 X 1045000
X o 1045000 1000000
Zc 1.94
S 180000
n 60
Decisión:
Para determinar el valor Z para la figura que esta a continuación, utilizando la tabla II del
apéndice de Z para un nivel de significancia de 5%. El valor de Z corresponde a 1.65 y con este
valor lo ubica en la figura. A continuación ubico el Zc= 1.94 en la figura y cae en la región de
rechazo de Ho. Entonces la decisión estadística es: como Zc cayó en RR (región de rechazo de
Ho), entonces rechazo Ho y acepto H1.
decisión estadística es: como Zc cayó en RR (región de rechazo de Ho), entonces rechazo Ho y
acepto H1.
Conclusión. Confirmo que las ventas promedios diarias del almacén veterinario el Tigre es superior
al $1.000.000.
En los ejemplos anteriores, para rechazar la hipótesis nula se prefijo de antemano el nivel de
significancia (0.05 o 5%). Otro método es buscar el valor p, que es la probabilidad de obtener una
estadística de prueba igual o más extremo que el resultado de la estadística de trabajo, dado que la
hipótesis nula es cierta.
El valor p es el nivel de significancia observado y es aquel nivel más pequeño en el que se puede
rechazar Ho.
71
La decisión, utilizando este método es:
Si el valor p es mayor o igual que , no se rechaza la hipótesis nula.
Si el valor p es menor que , se rechaza la hipótesis nula.
Para determinar el valor de p en la tabla de la distribución normal estándar se realiza de la
siguiente forma:
Hasta el momento se han presentado las pruebas de hipótesis en las cuales se basan en un
promedio poblacional por ejemplo: el salario promedio del veterinario o la edad media de los
administradores de empresas.
En las empresas algunas veces los analista están interesados en el porcentaje de elementos de una
población que cumple cierta características, por ejemplo los gerentes de las EPS están interesado
por el porcentaje de afiliados que utilizan los servicios; los ingenieros les interesa demostrar el
porcentaje de contratistas que sí cumplen con las especificaciones de las obras.
De la misma forma que se aplicaron los tres modelos para la media poblacional (planteamiento de
hipótesis, estadística de trabajo y decisión), se aplican los modelos para las prueba de hipótesis de
la proporción (figura 5.2)
Ejemplo. El veterinario de zoonosis quiere probar que menos del 40% de los canes que recogen en
la ciudad tienen garrapatas con un nivel de significancia del 2.5%. Para demostrar seleccionan al
azar 150 canes y observa que 35 de ellos tienen garrapatas.
Solución. Como se quiere probar que menos del 40% de los canes que recogen en la ciudad tienen
garrapatas y la muestra es mayor de 30, el planteamiento de hipótesis es:
Ho : P 0.40 vs H1 : P 0.40
72
FIGURA 5.2. PRUEBA DE HIPÓTESIS PARA LA PROPORCION
POBLACIONAL.(Muestras mayores o iguales a 30)
c) Decisión c) Decisión
c) Decisión
73
b) Estadística de trabajo
p PO No....de....éxitos 35
Zc Donde: p 0.233 q=1-p =1-0.233=0.767
pq n 150
n
c) Decisión
Para determinar cuál de las siguientes decisiones hay que determinar dónde empieza la región de
rechazo y si :
Si Zc cae en RR, entonces rechazo Ho y acepto H1.
Si Zc cae en RA, entonces afirmo que con estos datos no tomo ninguna decisión.
El valor de Z de la tabla de la normal estándar para un alfa de 0.05 es 1.96 y la ubico en la gráfica.
Luego ubicar la estadística de trabaja Zc y como cae en la región de rechazo de Ho, entonces la
decisión es: “ como Zc cae en RR, entonces rechazo Ho y acepto H 1”
Conclusión. Menos del 40% de los canes que llegan a Zonocis tienen garrapata.
1. Está probando un nuevo tipo de trampa para ratones. El fabricante afirma que la trampa atrae y
mata más del 80% de los ratones que llegan a la trampa. Para ello realiza un experimento con 75
ratones y 70 de ellos los atrae y los mata. Nivel de significancia 4%, probar la afirmación dl
fabricante.
2. Usted no está de acuerdo con la afirmación del fabricante, probar la hipótesis para un nivel de
significancia del 5%.
3. Está interesado en probar que el peso promedio de las profesores de las universidades es
diferente a 60 kilos. Una muestra aleatoria de 65 profesores fue seleccionada al azar para probar la
afirmación y dio un peso medio de 70 kilos con una desviación estándar de 2 kilos. Nivel de
significancia del 1%.
74
4. Una empresa de detergente afirma que una caja de 500 gramos lava en promedio mas de 120
platos. Como usuario no estoy de acuerdo con la afirmación. Para demostrarlo selecciono una
muestra aleatoria de 36 cajas de detergentes y obtengo que lava en promedio 95 platos con una
varianza de 16 platos2. Nivel de significancia 4%.
5. Un veterinario quiere probar que el peso promedio de los equinos en el municipio de Yoral, es
inferior a 400 kilogramos. Selecciona una muestra aleatoria de 15 equinos obtiene los siguiente
pesos: 401 399 380 370 388 376 375 401 399 380 370 388 376 375 388 Nivel de
significancia 5%.
6. Una máquina embotelladora de gaseosas está diseñada para embotellar liquido de gaseosas de
100 centímetros cúbicos. De acuerdo a las especificaciones del fabricante, la maquina embotella
menos de 10 botellas diariamente con liquido de gaseosa inferior 100 centímetros cúbicos las
cuales la consideran defectuosas. El director de control de calidad quiere probar que la maquina
está en control, con un nivel de significancia del 5%. En un día especifico el director de control de
calidad selecciona una muestra aleatoria de 80 botellas de gaseosas y obtiene un promedio de 7
botellas con liquido de gaseosa inferior 100 centímetros cúbicos y una varianza=4. a) Plantee las
hipótesis b) Calcule la estadística de trabajo c) Cual es la decisión.
7. En la empresa de alimentos S.A. está enlatando el fríjol bala en tarro, con un peso de 550
gramos. Como dueño de la empresa de alimentos S.A. sospecho que la maquina enlatadora está
favoreciendo en peso al consumidor y por consiguiente está perdiendo plata en ese producto. Para
demostrarlo selecciono una muestra aleatoria de latas de frijol bala y revisó su peso obteniendo los
siguientes resultados en gramos: 598 601 596 600 601 598 599 600 600 600 600 600 600
599 600 599 600 598 601 596 600 601 598 599 600 600 600 600 600 600 599 600 599
Nota: nivel de significancia 4.0 %
8. Una máquina que produce tuercas se dice que esta fuera de control si en cada lote de
producción (producción diaria) hay en promedio menos 4 tuercas defectuosas. Para demostrar que
la máquina está funcionando bien, toman una muestra aleatoria de 20 lotes y obtienen un
promedio de 2 tuercas defectuosa y con una desviación estándar de 0.1. Alfa = 0.05
9. El director de la fábrica de tornillos El Milimétrico solicita, que le explique en breves palabras y
que el entienda, ¿ cómo se procedería para probar que menos del 1% de los tornillos que se
fabrican en esta empresas son defectuosos.
10. Un veterinario afirma que más del 70% de las vivienda tienen canes criollos en Neiva. Para
probar la afirmación con un nivel de significancia del 5%, selecciona una muestra aleatoria de 250
viviendas y encuentra que 175 canes son criollos.
11). El estudiante Jorge Rico, afirma que menos del 30% de los propietarios de canes de raza lleva
su can al veterinario. Selecciona una muestra aleatoria de 245 canes de raza y observa que 205 de
estos canes no los llevan al veterinario.
75
5.3.1. PRUEBA DE HIPÓTESIS PARA DOS MEDIAS POBLACIONALES ( 1,
2 ). MUESTRAS INDEPENDIENTES. VARIANZAS DIFERENTES Y
MUESTRAS MAYORES O IGUALES A 30.
En dos sectores de producción se quiere probar que un sector es más productivo que el otro o si
existen diferencias significativas entre los dos sectores de producción, con medias 1 y 2
respectivamente hay que aplicar esta prueba de hipótesis. Para realizar esta prueba seleccionan
una muestra aleatorias de cada población y luego deben identificar que se debe probar, para
identificar cuál es el grupo uno y cuál es el grupo dos.
Con base a lo anterior se escoge el modelo adecuado de la prueba que se describe en la figura 5.3.
Ejemplo. Un Administrador agropecuario afirma que el shampoo Matapulgas se vende más en los
almacenes veterinario donde hay promociones que en los almacenes veterinarios donde no hay
promociones. Para comprobar esta afirmación con un nivel de significancia del 5%, selecciono 35
almacenes veterinarios con promociones y 40 almacenes veterinarios donde no hay promociones.
La información resultante está en la tabla 5.1.
Solución.
Como existen dos poblaciones diferentes s (independientes), y se quiere probar las ventas de tarros
de shampoo Matapulgas son mayores en los almacenes veterinarios con promoción, que en los
almacenes veterinarios donde no existe la promoción.
Entonces el modelo II de hipótesis es el adecuado (figura 5.3)y se define como grupo “1”
almacenes veterinarios con promoción y el grupo “2” a los almacenes veterinarios sin promoción.
Los datos son: X1 30 X 2 20 S1= 2 S2 =3 n1 = 35 n2 = 40
Pasos a seguir:
Ho : 1 2 vs H 1 : 1 2
X1 X 2 30 20
Zc Zc 17
S12 S 22 22 32
35
40
n1 n2
76
FIGURA 5.3. PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE DOS MEDIAS
(1 2 ) POBLACIÓNALES, MUESTRAS INDEPENDIENTES
Ho : 1 = 2 vs Ho : 1 2 vs Ho : 1 2 vs
H1 : 1 2 H1 : 1 2 H1 : 1 2
X1 X 2 X1 X 2 X1 X 2
Zc Zc Zc
S12 S 22 S12 S 22 S12 S 22
n1 n2 n1 n2 n1 n2
X X
t 1 2
X X X X
c 2 2
S n 1 S n 1 1 1 t 1 2 t 1 2
1 1 2 2
n n 2 n
n
c 2 2
S n 1 S n 1 1 1
1 1 2 2
c 2
1 1
2
S n 1 S n 1 1 1
2 2
1 2 1 2
n n 2 n n n n 2 n n
1 2 1 2 1 2 1 2
Para determinar el valor Z, utilizar la tabla Z para una nivel de significancia de 5%. El valor de Z
corresponde a 1.65 y con este valor en lo ubico en la figura. A continuación ubicar el Z c= 17 en la
figura y cae en la región de rechazo de Ho. Entonces la decisión estadística es: Como Zc cayó en
RR (región de rechazo de Ho), entonces rechazo Ho y acepto H1.
Conclusión. las ventas de frascos del shampoo Matapulgas son mayores en los almacenes
veterinarios con promoción de alimentos, que en los almacenes veterinarios donde no existen
promociones.
Cuando a una población de animales le observa una característica en dos instantes de tiempo hay
que utilizar este modelo. La información que produce en cada instante de tiempo se considera
como un grupo o población. Los tres modelos de pruebas de hipótesis con varianzas diferentes y
muestras menores de 30 se describen en la siguiente página (figura 5.4).
Ejemplo. Un empresario afirma que la música incentiva en el rendimiento laboral de los empleados.
Para probar esta afirmación selecciona al azar 8 operarios de la empresa Madrigal. Durante 10 días
observan el total de artículos elaborados sin música y luego durante los 10 días siguientes a la
empresa la ambientan con música y observa a estos mismo 10 operarios el total de artículos
elaborados. Los resultados están en la tabla 5.2.
Sin música 50 48 46 47 48 48 49 49
Con música 50 51 53 46 48 49 56 55
78
FIGURA 5.4. PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE DOS MEDIAS
POBLACIÓNALES, MUESTRAS DEPENDIENTES
MODELO I MODELO II MODELO III
Ho : 1 = 2 vs Ho : 1 2 vs Ho : 1 2 vs
H1 : 1 2 H1 : 1 2 H1 : 1 2
d
i 1
i d
i 1
i d
i 1
i
tc n tc n tc n
Sd / n Sd / n Sd / n
Donde:
Donde: Donde: n
n n ( d i ) 2
( d i ) 2 ( d i ) 2
n
d i 1
2
n n
d d
i
i 1
i 1 n
2 2
i i Sd i 1
Sd i 1 n
Sd i 1 n n 1
n 1 n 1
di= X1-X2 diferencia entre
di= X1-X2 diferencia entre di= X1-X2 diferencia entre parejas
parejas parejas
c) Decisión
c) Decisión c) Decisión
a) Planteamiento de hipótesis Ho : 1 2 vs H 1 : 1 2
d
i 1 23 i
tc n 8 8.21
Sd / n 0.99 / 8
Donde:
n
( d i ) 2
( 23) 2
d i 1
2
i 145
n 8 0.99
Sd i 1
n 1 8 1
c) Decisión
t = t(), (n-1). Para determinar el valor de t( ),(n-1)= t(0.05),(7) = 1.895 en la tabla III t-student es
igual 1.895, ubico este valor en la figura. Luego ubicar tc = 8.21 en la figura y cae en la región de
80
rechazo de Ho. Entonces la decisión estadística es: como t c cayó en RR (región de rechazo de Ho),
entonces rechazo Ho y acepto H1.
Conclusión. la música incrementa el rendimiento laboral de los operarios en las empresa
Cuando existen tres o más poblaciones a los cuales están interesado en determinar si en las
poblaciones (tratamiento) existen diferencias significativas entre los tratamiento, hay que recurrir a
un modelo estadístico denominado el análisis de varianza (ANOVA). El análisis de varianza se utiliza
para probar existen diferencias significativas entre los tratamiento.
Cuando se ha probado que existen diferencias significativas entre los tratamiento, hay que aplicar
una segunda prueba (Scheffe, Rangos múltiple de Duncan, Tukey, etc) con el fin de determinar
cuales medias o tratamientos son los que presentan esas diferencias significativas y cuales no las
presentan. A continuación se describe el modelo.
a) Planteamiento de Hipótesis
b) Estadística de trabajo: Para determinar la estadística de trabajo notada por Fc, hay que
elaborar la tabla de ANOVA (tabla 5.4).
81
Tabla 5.4. Tabla de Anova.
Fuente de Suma de Grados libertad Suma de cuadrado Estadística Fc
variación cuadrado medios
Entre SCE K-1 CME Fc
tratamientos
El proceso de cálculo de la tabla de ANOVA los datos muestrales deben aparecer de la siguiente
forma (tabla 5.5).
Donde :
K = total de tratamientos o grupos
i = variación de la fila i = 1,2,..................nj
j = variación de columnas j = 1,2,3...............K
nj = Es el número de observaciones para cada tratamiento o grupo.
n = es el número total de observaciones
Ti = Indica sumar todas las observaciones para cada tratamiento o grupo respectivo
Ti 2 = Indica elevar al cuadrado el total de cada columna o tratamiento
T = suma de todos las observaciones
T = T1 + T2 +T3 + .............. + TK
T2 = Indica elevar al cuadrado el T.
G1 G2 G3 …… GK
X11 X12 X13 …… X1K
82
K T j2 T2
SCE Donde:
j1 n j n
K T j2
n
j 1 j
= Indica sumar cada cociente Tj2 / nj de cada tratamiento o grupo.
i 1 j 1 j 1 n j
ni ni
T2
SCT ( X ij2 ) Donde: ( X ij ) = Indica sumar cada observación al cuadrado.
2
i 1 n i 1
c) Decisión
Ejemplo. La Cámara de Comercio de Neiva quiere probar que existen diferencias significativas entre
las ventas promedios diarias de las tiendas en Neiva por estrato (Alto, medio y bajo) Durante
varios meses se observó las ventas diarias y se obtuvo los siguientes resultados.
Como se tiene tres grupos de tiendas hay que aplicar la prueba de hipótesis para tres o más
medias.
a) Planteamiento de Hipótesis
Ho : 1 = 2 = 3 vs H1 : no todas 1 = 2 = 3 . Otra forma es:
Ho : No existen diferencias significativas en las ventas diarias de las tiendas por estrato vs
H1 : Existen diferencias significativas en las ventas diarias de las tiendas por estrato
83
b)Estadística de trabajo
Para determinar la estadística de trabajo notada por Fc, hay que elaborar la tabla 5.7 de ANOVA
Tabla 5.7. Tabla de Anova para las ventas diarias en dólares en 15 tiendas por estrato
FUENTE DE VARIACION SUMA DE GRADOS CUADRADO ESTADÍSTICA Fc
CUADRADO LIBERTAD MEDIOS
ENTRE ESTRATO SCE K-1 CME Fc
El proceso de cálculo de la tabla 5.7 de ANOVA se utilizan los datos muestrales de la tabla 5.6 y se
obtiene la tabla 5.8. Donde :
n1 = 5 n2 = 5 n3 =5 n=15
K T j2 T 2 3 T j2 T 2
SCE SCE
j 1 n j n j 1 n j n
T 2
T 2
T T
2 2
57 2
56 2 84 2 197 2
SCE 1 2 3 2688.2 2587.27 100.93
n 1 n 2 n3 n 5 5 5 15
ni
T2
SCT ( X ij2 )
i 1 n
84
SCT = (152+152+192+102+112+182+16+122+162+52+62+112+112+122+202)– (2587.27)
Tabla 5.9. Tabla de Anova para las ventas diarias (dólares) de tiendas por estrato.
SUMA DE GRADOS CUADRADO ESTADÍSTICA
FUENTE DE VARIACION
CUADRADO LIBERTAD MEDIOS Fc
TOTAL 271.73 14
C) Decisión
Para un nivel de significancia especificado (= 0.05) en la primera fila de la tabla V se localiza el
número de tratamientos menos 1 ( K-1= 3-1=2) y por la primera columna se localiza el (n – K =
15-3=12). La notación general para la Ftabla, es: Ftabla, = F(), [(k-1),(n-k)] = F(0,05), [(2),(12)] = 3,89
Como Fc > Ftabla, ( 3.55 ‹ 3,89 ) entonces acepto Ho.
Conclusión. No existen diferencias diferencia significativas de las ventas diarias de las tiendas en
los diferentes estratos.
85
EJERCICIOS SECCION 5.3 – 5.4
1. Una compañía produce cuatro tipos de bombillas para salas de cirugías A , B, C, D y desea
probar si existen diferencias significativas en la durabilidad de las bombillas con un nivel de
significancia de 5%. Toman muestras aleatorias para las bombillas A, B, C, D ,de tamaño n A = 5
nB = 9 nC = 7 nD= 5 y se obtienen los siguientes resultados:
A 12 18 14 15 16
B 60 65 64 68 70 74 75 74 74
C 13 15 18 13 16 14 15
D 15 18 18 19 17
2. Un Máster en veterinaria quiere probar que existen diferencias significativas entre los pesos de
los pollos de tres razas de pollo, con un nivel de significancia de 1%. Durante 45 días se les
suministro el mismo concentrados. Los pesos en libras son:
3. Se desea comparar a tres sicólogos con relación con la duración (en horas) de tratamientos
aplicados a 24 pacientes (8 pacientes por sicólogos) para un mismo comportamiento. Los
resultados están está a continuación.
SICO 1 4 5 5 4 6 4 5 4
SICO 2 4 5 4 3 4 3 4 2
SICO 3 5 7 6 7 7 7 4 6
Existe diferencia significativas entre el tiempo de tratamientos aplicados por los sicólogos (nivel de
significancia 5 %).
4. Un investigador de mercados quiere probar que existen diferencias significativas entre tres tipos
de promociones para incrementar las ventas en el hipermercado, con un nivel de significancia 5 %.
El investigador de mercados realiza el experimento en 15 hipermercado. Realizo las tres
promociones (A, B, C) en los 15 hipermercados seleccionados al azar de diferentes municipio y en
un día especifico. El incremento en las ventas (Euros) están a continuación.
86
Tipo de promoción Incremento en las ventas (miles de Euros)
A 70 75 73 72
B 55 57 60 60 59
C 50 55 55 60 65 60
5. La siguiente tabla de anova, probar si existen diferencias significativas entre los grupos o
tratamientos.
TABLA DE ANOVA.
FUENTE DE VARIACION SUMA DE GRADOS CUADRADO ESTADÍSTICA Fc
CUADRADO LIBERTAD MEDIOS
Entre tratamientos 180 4
Dentro de tratamientos 120 20
Total
6. Los siguientes datos son los tiempos que tardan dos grupos de estudiantes de ingeniería
industrial para responder un examen de estadística inferencial.
Pruebe que el tiempo de duración promedio para responder el examen del grupo I es mayor que el
de grupo II.
7. En una escuela se escogieron 10 niños al azar que tenia similitud de inteligencia y preparación.
A cada niño se evaluó su lectura en puntos. Después fueron enseñando a leer aplicando un nuevo
método. Terminado el curso se evalúo su lectura en puntos y se obtuvo los siguientes resultados.
Método Puntos
Inicio 65 68 70 63 64 65 64 66 68 67
Nuevo método 66 70 74 67 65 68 69 69 72 71
8. La empresa TLT cuenta con un curso de capacitación para aumentar el rendimiento de las
importaciones con un nivel de significancia del 1%. El gerente va a determinar, sí existe
diferencia significativas en el rendimiento de las importaciones al darle la capacitación al personal.
Para ello se forma un grupo de 7 empleados y le mide cuánto está importando antes de empezar
el curso. Durante tres meses le da la capacitación para importar. Luego a este mismo grupo
nuevamente observa cuánto está importando. Los resultados se muestran a continuación (en miles
de artículos importados).
87
Aplicación Artículos importados (en miles de artículos )
11. Un publicista está interesado en mostrar que el comercial de televisión que presenta una
modelo es más atractivo que un comercial que presenta a un sacerdote. Le enseño ambos
comerciales a 10 televidentes y solicito que los calificara en una escala de 1 a 50 . Los resultados
son los siguientes. Nivel de significancia del 5%
12. En un país, un ingeniero industrial quiere probar que los ingenieros electrónicos tienen mejor
rendimiento universitario que los ingenieros industriales en las universidades privadas. Para probar
esta afirmación el ingeniero industrial selecciona al azar 70 ingenieros electrónicos y 60 ingenieros
industriales. A estos ingenieros les pregunto ¿ cuantos semestres estudiaron en la universidad para
obtener el título profesional?. Los resultados están a continuación.
13. Un nuevo tratamiento de pasto se quiere probar para disminuir el colesterol a los porcinos. Se
le tomo el colesterol a 9 cerdos antes y después de aplicado el tratamiento. Los resultados de
colesterol fueron los siguientes:
88
APENDICES
89
APENDICES
APENDICE A. Tablas
APENDICE B. Bibliografía
90
APENDICE A.
LISTA DE TABLAS
91
Tabla I. Distribución Exponencial
_____________________________________________________________
T F(T) T F(T) T F(T) T F(T)
_____________________________________________________________
0,0 0,000 2,5 0,918 5,0 0,9933 7,5 0,99945
0,1 0,095 2,6 0,926 5,1 0,9939 7,6 0,99950
0,2 0,181 2,7 0,933 5,2 0,9945 7,7 0,99955
0,3 0,259 2,8 0,939 5,3 0,9950 7,8 0,99959
0,4 0,330 2,9 0,945 5,4 0,9955 7,9 0,99963
0,5 0,393 3,0 0,950 5,5 O,9959 8,0 0,99966
0,6 0,451 3,1 0,955 5,6 0,9963 8,1 0,99970
0,7 0,503 3,2 0,959 5,7 0,9967 8,2 0,99972
0,8 0,551 3,3 0,963 5,8 0,9970 8,3 0,99975
0,9 0,593 3,4 0,967 5,9 0,9973 8,4 0,99978
1,0 0,632 3,5 0,970 6,0 0,9975 8,5 0,99980
1,1 0,667 3,6 0,973 6,1 0,9978 8,6 0,99982
1,2 0,699 3,7 0,975 6,2 0,9980 8,7 0,99983
1,3 0,727 3,8 0,978 6,3 0,9982 8.8 0,99985
1,4 0,753 3,9 0,980 6,4 0,9983 8,9 0,99986
1,5 0,777 4,0 0,982 6,5 0,9985 9,0 0,99989
1,6 0,798 4,1 0,983 6,6 0,9986 9,1 0,99989
1,7 0,817 4,2 0,985 6,7 0,9988 9,2 0,99990
1,8 0,835 4,3 0,986 6,8 0,9989 9,3 0,99991
1,9 0,850 4,4 0,988 6,9 0,9990 9,4 0,99992
2,0 0,865 4,5 0,989 7,0 0,9991 9,5 0,99992
2,1 0,878 4,6 0,990 7,1 0,9992 9,6 0,99993
2,2 0,889 4,7 0,991 7,2 0,9993 9,7 0,99994
2,3 0,900 4,8 0,992 7,3 0,9993 9,8 0,99994
2,4 0,909 4,9 0,993 7,4 0,9993 9,9 0,99995
_____________________________________________________________
92
Tabla II. Distribución Normal Estándar
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0369
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0,2422 0.2454 0.2486 0.2518 0.2549
0.7 0.2580 0.2612 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49897 0.49900
3.1 0.49903 0.49906 0.49910 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929
3.2 0.49931 0.49934 0.49936 0.49938 0.49940 0.49942 0.49944 0.49946 0.49948 0.49950
3.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.49960 0.49961 0.49962 0.49964 0.49965
3.4 0.49966 0.49968 0.49969 0.49970 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976
3.5 0.49977 0.49978 0.49978 0.49979 0.49980 0.49981 0.49981 0.49982 0.49983 0.49983
3.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989
3.7 0.49989 0.49990 0.49990 0.49990 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992
3.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995
3.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997
93
Tabla III. Distribución t de Student
_______________________________________
Nivel de significación para prueba de una cola
___________________________________________________
0.10 0.05 0.025 0.01 0.005
___________________________________________________
Nivel de significación para prueba de dos colas
___________________________________________________
g.l. 0.20 0.10 0.05 0.02 0.01
___________________________________________________
1 3.078 6.3138 12.706 31.821 63.657
2 1.886 2.9200 4.3027 6.965 9.9248
3 1.638 2.3534 3.1825 4.541 5.8409
4 1.533 2.1318 2.7764 3.747 4.6041
5 1.476 2.0150 2.5706 3.365 4.0321
6 1.440 1.9432 2.4469 3.143 3.7074
7 1.415 1.8946 2.3646 2.998 3.4995
8 1.397 1.8595 2.3060 2.896 3.3554
9 1.383 1.8331 2.2622 2.821 3.2498
10 1.372 1.8125 2.2281 2.764 3.1693
11 1.363 1.7959 2.2010 2.718 3.1058
12 1.356 1.7823 2.1788 2.681 3.0545
13 1.350 1.7709 2.1604 2.650 3.0123
14 1.345 1.7613 2.1448 2.624 2.9768
15 1.341 1.7530 2.1315 2.602 2.9467
16 1.337 1.7459 2.1199 2.583 2.9208
17 1.333 1.7396 2.1098 2.567 2.8982
18 1.330 1.7341 2.1009 2.552 2.8784
19 1.328 1.7291 2.0930 2.539 2.8609
20 1.325 1.7247 2.0860 2.528 2.8453
21 1.323 1.7207 2.0796 2.518 2.8314
22 1.321 1.7171 2.0739 2.508 2.8188
23 1.319 1.7139 2.0687 2.500 2.8073
24 1.318 1.7109 2.0639 2.492 2.7969
25 1.316 1.7081 2.0595 2.485 2.7874
26 1.315 1.7056 2.0555 2.479 2.7787
27 1.314 1.7033 2.0518 2.473 2.7707
28 1.313 1.7011 2.0484 2.467 2.7633
29 1.311 1.6991 2.0452 2.462 2.7564
30 1.310 1.6973 2.0423 2.457 2.7500
35 1.3062 1.6896 2.0301 2.438 2.7239
40 1.3031 1.6839 2.0211 2.423 2.7045
45 1.3007 1.6794 2.0141 2.412 2.6896
50 1.2987 1.6759 2.0086 2.403 2.6778
60 1.2959 1.6707 2.0003 2.390 2.6603
70 1.2938 1.6669 1.9945 2.381 2.6480
80 1.2922 1.6641 1.9901 2.374 2.6388
90 1.2910 1.6620 1.9867 2.368 2.6316
100 1.2901 1.6602 1.9840 2.364 2.6260
120 1.2887 1.6577 1.9799 2.358 2.6175
140 1.2876 1.6558 1.9771 2.353 2.6114
160 1.2869 1.6545 1.9749 2.350 2.6070
180 1.2863 1.6534 1.9733 2.347 2.6035
200 1.2858 1.6525 1.9719 2.345 2.6006
1.282 1.645 1.96 2.326 2.576
___________________________________________________
94
Tabla IV. Dígitos aleatorios
85967 73152 14511 85285 36009 95892 36962 67835 63314 50162
07483 51453 11649 86348 76431 81594 95844 83673 82501 41546
96283 01898 61414 83525 04231 13604 75339 11730 85423 60698
49174 12074 98551 37895 93547 24769 09404 76548 05393 96770
97366 39941 21225 93629 19574 71565 33413 56087 40875 13351
90474 41469 16812 81542 81652 45554 27931 93994 22375 00953
28599 64109 09497 76235 41383 31555 12639 00619 22909 29563
25254 16210 89717 65997 82667 74624 36348 44018 64732 93589
28785 02760 24359 99410 77319 73408 58993 61098 04393 48245
84725 86576 86944 93296 10081 82454 76810 52975 10324 15457
41059 66456 47679 66810 15941 84602 14493 65515 19251 41642
67434 41045 82830 47617 36932 46728 71183 36345 41404 81110
72766 68816 37643 19959 57550 49620 98480 25640 67257 18671
92079 46784 66125 94932 64451 29275 57669 66658 30818 58353
29187 40350 62533 73603 34075 16451 42885 03448 37390 96328
74220 17612 65522 80607 19184 64164 66962 82310 18163 63495
03786 02407 06098 92917 40434 60602 82175 04470 78754 90775
75085 55558 15520 27038 25471 76107 90832 10819 56797 33751
09161 33015 19155 11715 00551 24909 31894 37774 37953 78837
75707 48992 64998 87080 39333 00767 45637 12538 67439 94914
21333 48660 31288 00086 79889 75532 28704 62844 92337 99695
65626 50061 42539 14812 48895 11196 34335 60492 70650 51108
84380 07389 87891 76255 89604 41372 10837 66992 93183 56920
46479 32072 80083 63868 70930 89654 05359 47196 12452 38234
59847 97197 55147 76639 76971 55928 36441 95141 42333 67483
31416 11231 27904 57383 31852 69137 96667 14315 01007 31929
82066 83436 67914 21465 99605 83114 97885 74440 99622 87912
01850 42782 39202 18582 46214 99228 79541 78298 75404 63648
32315 89276 89582 87138 16165 15984 21466 63830 30475 74729
59388 42703 55198 80380 67067 97155 34160 85019 03527 78140
58089 27632 50987 91373 07736 20436 96130 73483 85332 24384
61705 57285 30392 23660 75841 21931 04295 00875 09114 32101
18914 98982 60199 99275 41967 35208 30357 76772 92656 62318
11965 94089 34803 48941 69709 16784 44642 89761 66864 62803
85251 48111 80936 81781 93248 67877 16498 31924 51315 79921
66121 96986 84844 93873 46352 92183 51152 85878 30490 15974
53972 96642 24199 58080 35450 03482 66953 49521 63719 57615
14509 16594 78883 43222 23093 58645 60257 89250 63266 90858
37700 07688 65533 72126 23611 93993 01848 03910 38552 17472
85466 59392 72722 15473 73295 49759 56157 60477 83284 56367
52969 55863 42312 67842 05673 91878 82738 36563 79540 61935
42744 68315 17514 02878 97291 74851 42725 57894 81434 62041
26140 13336 67726 61876 29971 99294 96664 52817 90039 53211
95589 56319 14563 24071 06916 59555 18195 32280 79357 04224
39113 13217 59999 49952 83021 47709 53105 19295 88318 41626
41692 17622 18994 98283 07249 52289 24209 91139 30715 06604
54684 53645 79246 70183 87731 19185 08541 33519 07223 97413
89442 61001 36658 57444 95388 36682 38052 46719 09428 94012
36751 16778 54888 15357 68003 43564 90976 58904 40512 07725
98159 02564 21416 74944 53049 88749 02865 25772 89853 88714
95
Tabla V. Distribución F. Valores críticos a un nivel de significación del 5% (0.05)
K-1
n-k 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 Inf.
1 161 200 216 225 230 234 2,37 239 241 242 244 246 248 249 250 251 252 253 254
2 18,5 19,0 19,2 19,2 19,3 19,3 19,4 29,4 19,4 19,4 19,4 19,4 19,4 19,5 19,5 19,5 15,5 19,5 19,5
3 10,1 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,76 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,38
6 5,99 5,14 4,76 4,53 4,39 4,28 4,25 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,96 2,90 2,85 2,79 2,75 2,65 2,61 2,70 2,53 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 5,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 1,12 2,08 2,04 1,99 1,95 1,90 1,84
21 4,30 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,73
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,81 1,75 1,70 1,65 1,59 1,53 1,17 1,39
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,60 1,55 1,50 1,49 1,14 1,25
Inf 3,81 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00
96
Tabla VI. Distribución F. Valores críticos a un nivel de significación del 1% (0.01)
n-k
k-1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 Inf.
1 4052 5000 5403 5625 5764 5859 5928 5982 6023 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 98,5 99,9 99,2 99,2 99,3 99,3 99,4 99,4 99,4 99,4 99,4 99,4 99,4 99,5 99,5 99,5 99,5 99,5 99,5
3 34,1 30,80 29,50 28,70 28,20 27,90 27,70 27,50 27,30 27,20 27,10 26,90 26,70 26,60 26,50 26,40 26,30 26,02 26,10
4 21,20 18,00 16,70 16,70 15,50 15,20 15,00 14,80 14,70 14,50 14,40 14,20 14,00 13,90 13,80 13,70 13,70 13,60 13,50
5 16,30 13,30 12,10 11,40 11,00 10,70 10,50 10,30 10,20 10,10 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02
6 13,70 10,90 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88
7 12,20 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65
8 11,30 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86
9 10,60 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31
10 10,00 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,69 3,60
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,45 3,36
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,25 3,17
14 8,86 6,51 5,56 5,040 4,70 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,09 3,00
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,96 2,87
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,55 3,41 3,26 3,18 3,10 3,02 2,93 2,84 2,75
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,75 2,65
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,37 3,23 3,08 3,00 2,92 2,84 2,75 2,66 2,57
19 8,19 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,30 3,15 3,00 2,92 2,84 2,76 2,67 2,58 2,49
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,52 2,42
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,17 3,03 2,88 2,80 2,72 2,64 2,55 2,46 2,36
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,41 3,35 3,26 3,12 2,98 2,83 2,75 2,67 2,58 2,50 2,40 2,31
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,07 2,93 2,78 2,70 2,62 2,54 2,45 2,35 2,26
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,31 2,21
25 7,77 5,57 4,68 4,18 3,86 3,63 3,46 3,32 3,22 3,13 2,99 2,85 2,70 2,62 2,53 2,45 2,36 2,27 2,17
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,11 2,01
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,92 1,80
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,73 1,60
120 6,85 4,79 3,95 3,48 3,70 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,53 1,38
Inf. 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,32 1,00
97
APENDICE B.
Bibliografía.
98
APENDICE C.
CAPITULO I
Sección 1.1
1) a) 0.86 b) 0.13
2) a) 0.34 b) 0.70 c) 0.04 d) 0.66 e) 0.68 f) 0.88 g) 0.05 h)
0.79
3) S={v,m,p} donde: v = verde m= madura p= podrida
4) a) 0.41 b) 0.54 c) 0.07 d) 0.10 e) 0.665 f) 0.743 g) 0.25
5) S={dd,dndd,dndn,dnnd,dnnn,ndd,ndnd,ndnn,nndd,nndn,nnnn,nnnd }
6) 0.50
7) S={t/ 0 ≤ t ≤ n} Donde t= tiempo de espera en segundos
8) 0.43
9) 0.535
10) 0.67
1) a) 0.6 b) 0.32
2) 0.09
3) a) 0.20 b) 0.25
4) 2730
5) 210
6) a) 0.05 b) 0.06
7) 0.87
8) 0.90
9) a) 0.17 b) 0.05
10) a) 0.06 b) 0.41
11) a) 0.12 b) 0.06
12) 0.028
13) a) 0.09 0.38
Sección 1.4
1) $50
2) µ = 17.8 σ = 1.28
99
3) µ = 23 σ = 10.04
1) 0.0045
2) a) 3.645*10-7 b) 9.1*10-09 c) 9.1*10-09
3) a) 0.0098 b)0 .612 c) 0.082 d) 0.989 e) 6.37*10-13 f) 1
4) a) 0.14 b)0.07 c)0.09 d) 0.09 e) 0.91 f) 0.98
5) 0.125
6) a) 4.210*10-10 b) 2.900*10-12 c) 9.357*10-14 d) 1 e) 1 f) 2.807*10-12
7) a) 30 b) 5.47
8) a) 0.135 b) 0.68 c) 0.135 d) 0.999
9) a) 0.216 b) 0.784 c) 0.192 d) 0.028 e) 2.4*10-18 f) 0.24 g)
0.4849.
12) 0.018
13) 0.1024
1) 0.9975
2) 0.086
3) 0.141
5) a) 0.3409 b) 0.11 c) 0.0588
6) 0.96
7) µ = 2.57 σ = 0.715
8) a) 0.0.3085 b) 0.8413 c) 06687
9) 561800
10) 55.65%
11) 0.97585
12) σ = 5.5 euros
13) a) 2.28% b) 74.95%
14) 23020 kilómetros
15) a) 2.28% b) 15.87% c) 2.28% d) 93.32%
16) a) 84.13% b) 30.85% c) 47.72% d) 77.45% e) 7.04 años f) 4.66
años
CAPITULO II
100
CAPITULO III
CAPITULO V
control
11) Menos del 30% de los propietarios de canes de raza lleva su can al veterinario.
101
Sección 5.3 – 5.4
sicólogos.
4) existen diferencias significativas entre tres tipos de promociones para incrementar las
ventas en el hipermercado.
capacitación al personal
9) Los salarios de los contadores públicos hombres son mejores que los salarios de los
11) El comercial de televisión que presenta una modelo es más atractivo que el comercial
12) que los ingenieros electrónicos tienen mejor rendimiento universitario que los
102
INDICE
A
Combinaciones 10.
Competencias 1, 29, 39, 49, 65.
Confianza, intervalo 41.
para muestras pequeña 42.
para muestras grandes 41.
para una media 41, 42.
para una proporción 44.
Efecto 81.
Efectos de tratamientos 81.
Error estándar de estimación 40.
De la media 31, 41, 42, 43, 49.
De la proporción 35, 49, 50.
Error 47.
máximo admitido 50, 59.
Error de muestreo 33, 37, 50.
Error tipo I 67.
Error tipo II 67.
Espacio muestral 2.
Esperanza matemática 13.
Estadística 30.
inferencial 2, 29.
no paramétricas 66.
paramétricas 66.
Estimación 39.
Puntual 40.
por intervalo de confianza 41.
Estimador 40, 41, 49, 50.
104
G
Parámetro 30
Paramétricas 67.
105
Población 30.
Probabilidad 1.
Proporción 2.
distribución muestral 66.
estimación puntual 40.
estimación por intervalo de confianza 44.
Prueba de hipótesis 67, 72, 75, 78, 81.
Análisis de varianza 81.
Duncan, prueba de rangos múltiples 82.
media 68.
para dos medias 75.
no paramétricas 66.
Valor de P 72.
Varianza 14, 17, 21, 31, 33, 51.
Varianza, análisis 81.
106