Libro de Inferencial OTI 2017 PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 112

ESTADISTICA INFERENCIAL PARA

EL SECTOR INDUSTRIAL

TERCERA EDICION

JOAQUIN MONTAÑA RODRIGUEZ

UNIVERSIDAD SURCOLOMBIANA
2015
Universidad Surcolombiana
Av. Pastrana con Cra 1.
Tel (098)8754753 Neiva ( H )

ISBN: 978-958-8324-76-0
Segunda Edición

IMPRESIÓN
En los talleres de OTIMPRESOS
Calle 28 No. 1A-46 Cándido
Telefax (098)8758485
Neiva – Huila – Colombia.

Portada:
Mauricio Fernando Molina
[email protected]

Prohibida la reproducción total o parcial de este libro, por cualquier medio especialmente por fotocopias. Ley
23 de 1982.
PROLOGO

Como docente de las universidades he observado el contenido de los libros publicados de


estadística inferencial. Estos contenidos ha sido desarrollados con el objetivo de
familiarizar a los usuarios sobre las técnicas de la estadística inferencial, especialmente en
el cálculo.
En entrevistas con: empresarios, ingenieros egresados y estudiantes de administración de
empresas, comentaban lo importante publicar un texto de estadística inferencial que
tenga como objetivo el cálculo y haciendo énfasis en la interpretación de los resultados.
El texto aplica el cálculo de las diferentes técnicas estadísticas pero haciendo énfasis en el
análisis de los resultados.

i
Contenido

I. Probabilidad .............................................................................................. 1

competencias ......................................................................................................... 1
1.1. Conceptos generales ................................................................................... 2
1.1.1.experimento aleatorio ............................................................................. 2
1.1.3. Suceso o evento .................................................................................. 3
1.1.4. Operaciones de sucesos ...................................................................... 3
1.1.5. Definición de probabilidad ................................................................... 3
ejercicios seccion 1.1. ........................................................................................... 5
1.2. Eventos dependiente e independientes ....................................................... 6
1.2.1. Eventos dependiente ............................................................................ 6
1.2.2. Eventos independientes ........................................................................ 9
1.3. Tecnicas de conteo...................................................................................... 9
1.3.1. Permutacion. ....................................................................................... 10
1.3.2 combinacion. ....................................................................................... 10
ejercicios seccion 1.2- 1.3 ................................................................................... 11
1.4. Variable aleatoria ...................................................................................... 13
1.4.1. Esperanza matemática o valor esperado . ........................................ 13
1.4.2. Varianza. ............................................................................................ 14
ejercicios seccion 1,4 .......................................................................................... 15
1.5. Distribuciones de probabilidad para algunas variables aleatorias ............. 15
1.5.1. La distribución binomial ...................................................................... 16
1.5.2. La distribución poisson ........................................................................ 18
ejercicios seccion 1.5.1.– 1.5.2 ............................................................................ 19
1.5.3. La distribución exponencial. ................................................................ 20
1.5.4 la distribucion normal .......................................................................... 21
1.5.5. La distribucion normal estandar ......................................................... 23
ejercicios 1.5.3. – 1.5.5. ....................................................................................... 27

II. ALGUNAS DISTRIBUCIONES MUESTRALES .............................................. 29

Competencias ...................................................................................................... 29
2.1. Distribucion muestral de la media .............................................................. 31
2.1.1. Teorema del limite central ................................................................... 34
2.2. Distribucion muestral de la proporcion. ...................................................... 35
ejercicios .............................................................................................................. 36

ii
III. ESTIMACION ................................................................................................ 39

Competencias ...................................................................................................... 39
3.1. Conceptos generales de estimacion .......................................................... 40
3.1.1. Estimacion puntual .............................................................................. 40
3.2. Estimacion por intervalo de confianza........................................................ 41
3.2.1. Intervalo de confianza para la media poblacional ().......................... 41
3.2.1. Intervalo de confianza para la media poblaciónal , muestra pequeña
(n ˂ 30). ........................................................................................................ 42
3.3. Estimacion por intervalo de confianza para la proporción poblaciónal
(muestras grandes). ......................................................................................... 44
ejercicios .............................................................................................................. 45

IV. DISEÑO DE LA MUESTRA ........................................................................... 47

Competencias ...................................................................................................... 47
4.1. Muestreo no probabilistico ......................................................................... 48
4.1.1. Muestreo por conveniencia ................................................................. 48
4.1.2. Muestreo de juicio o a proposito .......................................................... 48
4.1.3. Muestreo por cuotas ........................................................................... 48
4.2. Muestreo probabilistico .............................................................................. 48
4.2.1. Muestreo aleatorio simple ................................................................... 49
4.2.2. Muestreo sistematico .......................................................................... 62

V. PRUEBA DE HIPÓTESIS .............................................................................. 65

competencias ....................................................................................................... 65
5.1. Prueba de hipotesis para la media de una poblacion distribuida
normalmente .................................................................................................... 67
5.1.1. Metodo del valor p para la prueba de hipotesis .................................. 71
5.2. Prueba de hipotesis para la proporción poblacional ................................... 72
ejercicios seccion 5.1 – 5.2 .................................................................................. 74
Prueba de hipótesis para dos medias poblacionales ........................................ 75
5.3.1. Prueba de hipótesis para dos medias poblacionales. Muestras
independientes. Varianzas diferentes y muestras mayores o iguales a 30. ... 76
5.3.2. Prueba de hipótesis para dos medias poblacionales. Muestras
dependientes. ............................................................................................... 78
5.4. Prueba de hipótesis para tres o mas medias poblacionales. Muestras
independientes. Analisis de varianza. –anova- ................................................ 81
ejercicios seccion 5.3 – 5.4 .................................................................................. 86

iii
APENDICE .......................................................................................................... 90

lista de tablas ....................................................................................................... 91


Tabla i. Distribución exponencial ......................................................................... 92
Tabla ii. Distribución normal estándar .................................................................. 93
Tabla iii. Distribución t student ............................................................................. 94
Tabla iv. Dígitos aleatorios ................................................................................... 95
Tabla v. Dístribuciòn F ......................................................................................... 96
Bibliografía. .......................................................................................................... 98
Respuestas a ejercicios seleccionados ................................................................ 99
Indice ................................................................................................................. 103

iv
I. PROBABILIDAD

COMPETENCIAS

 Comprender el significado de probabilidad y de experimentos aleatorios.


 Diferenciar los evento dependientes e independientes
 Calcular y aplicar las principales distribuciones de probabilidad

1
1.1. CONCEPTOS GENERALES
La teoría de la probabilidad proporciona la base para la inferencia estadística. Esta teoría tiene sus
raíces en los juegos del azar, cuando lanzamos una moneda o estamos en un juego de cartas, no
es posible predecir de antemano el resultado (cara, sello, as de corazón, trébol, etc.). Esta
imposibilidad de predicción constituye la aleatoriedad, el elemento que caracteriza la falta de
certeza. Por otra parte, existe entre los diversos resultados de los juegos al azar una simetría
recíproca que nos hace considerar todos éstos resultados como equivalentes desde el punto de
vista del juego (para un jugador es igualmente favorable arriesgar su apuesta a uno de los
resultados posibles).
El capítulo trata éste tipo de fenómenos y se formulan modelos matemáticos que sirven para
investigar en forma bastante precisa, los fenómenos.

1.1.1.EXPERIMENTO ALEATORIO
No existe una definición bastante simple para esta clase de experimento, pero con algunos
ejemplos ilustran el concepto:
Ejemplo 1: Lanzar una moneda dos veces y contar el número total de sellos obtenidos.
Ejemplo 2: Lanzar un dado y observar el número que aparece en la cara superior.
Ejemplo 3: Fabrican bombillas, luego prueban su duración en un portalámparas y anotar el
tiempo transcurrido en horas hasta que se quema.
Ejemplo 4: Se fabrica fusibles en un período de tiempo determinado y seleccionar un fusible y
observar si es defectuoso.
Los experimentos anteriores tienen en común las siguientes propiedades:

 Cada experimento tiene varios resultados posibles que pueden especificarse (tabla 1.1.).
 La incertidumbre de cada experimento . Para el experimento 4 no estamos seguros si
el fusible seleccionado sea defectuoso o no; al lanzar el dado no sabemos si caerá el
número 1,2,.....6.
 El experimento se puede repetir indefinidamente sin cambiar las condiciones.
 Si el experimento se repite un gran número de veces aparece un modelo definido de
regularidad. Esta regularidad permite la construcción del modelo matemático; por ejemplo
si lanzamos una moneda varias veces la proporción de caras será aproximadamente igual a
la de sellos.

1.1.2. ESPACIO MUESTRAL


Es el conjunto de todos los resultados posibles de un experimento aleatorio lo designa como S
(tabla1.1).

Tabla No. 1.1. Resultados posibles de los experimentos E1....E4.


Experimento ( E ) Resultados posibles (S)
Ejemplo No. 1 (cc, ch, hc, hh)
Ejemplo No. 2 (1,2,3,4,5,6)
Ejemplo No. 3 (T/T<0) Donde T= tiempo de duración
Ejemplo No. 4 Defectuoso o no defectuoso

2
1.1.3. SUCESO O EVENTO

Son subconjunto del espacio muestral La notación de los sucesos se utiliza cualquier letra del
abecedario y entre llaves los resultados . Para los ejemplos anteriores algunos sucesos de la tabla
1.1 son:

Ejemplo 1, se crea el siguiente evento: A1={ que ocurran dos caras } , entonces A1={ cc }

Ejemplo 2, se crea el siguiente evento: A2= {Un número impar ocurre} esto es A2= {1,3,5}

1.1.4. OPERACIONES DE SUCESOS

 Si A y B son suceso, AUB es el suceso que ocurre si A y solo si A o B (o ambos) ocurren.


 Si a y B son sucesos A  B es el suceso que ocurre si y solo si A y B ocurren.
 Si A es un suceso, A’ es suceso que ocurre si y solo si A no ocurren
n
 Si A1 A2......An... es cualquier colección infinita numerable de sucesos, entonces  Ai
i 1
es el suceso que ocurre si y sólo si al menos uno de los sucesos de A i ocurren. Esta
operación se puede generalizar hasta infinito
n
 Si A1 A2......An... es cualquier colección infinita numerable de sucesos, entonces  Ai
i 1
es el suceso que ocurre si y sólo si todos los sucesos ocurren. Esta operación se puede
generalizar hasta infinito

1.1.5. DEFINICIÓN DE PROBABILIDAD

Existen varias definiciones de probabilidad. La mas sencilla es la siguiente: "La probabilidad de que
se presente determinado suceso (A) es igual al cociente del número de casos que son favorables a
este suceso, por el número total de casos posibles (S) con tal de que todos estos casos sean
mutuamente simétricos".

Casos favorables.al evento A


P (A ) 
Total.de .casos posibles S 

Ejemplo. Se lanza un dado, ¿cuál es la probabilidad de obtener un seis?

Solución. La pregunta es P(salga un seis) Crear el siguiente evento: A={salga un seis}


P(A) = ? El espacio muestral para el experimento es: [1,2,3,4,5,6] .Aplicando definición
de probabilidad:

Casos favorables.al evento A Sa lg a seis 1


P (A )    0.167
Total de .casos posibles Todos los numeros 6
3
1.1.5.1. PROPIEDADES DE LA PROBABILIDAD
a) Sea E un experimento aleatorio y S un espacio muestral. Si A es un suceso asociado a S,
entonces 0  P(A)  1 . Significa que cuando calcule cualquier probabilidad, ésta se encuentra
en el intervalo cerrado entre ( 0 y 1).
b) P(S) = 1. Significa que la probabilidad de que salga el espacio muestral es igual a la unidad.
c) Si A y B son sucesos mutuamente excluyente (A  B = 0 ) entonces: P(AUB)= P(A) + P(B).
n n
d) Si A1 A2......An... son sucesos mutuamente excluyentes entonces P ( Ai )   P ( Ai )
i 1 i 1

Ejemplo. En un póker extraer una carta. Cuál es la probabilidad de que salga un as o un rey?

Solución. Las pregunta es: P(salga un as o un rey) ?. A continuación se crean los siguientes
eventos: A = as R= rey

Los dos eventos son mutuamente excluyentes porque una carta al mismo tiempo no puede ser as
y rey. Para obtener la probabilidad de que salga un as o un rey, se aplica la propiedad "c" de la
probabilidad. P (A  R )  P A   P R 
Aplicando la definición de probabilidad

P( A  R)  P A  PR  
4 4
  0.154
52 52
Ejemplo. Lanzar un dado no cargado ¿ cuál es la probabilidad de que salga un número par o un
número impar?

Solución: Las pregunta es: P(número par o un número impar) ?. A continuación se crean los
siguientes eventos: I = Impar M = Par .Los dos sucesos son mutuamente excluyentes,
aplicando la propiedad “c” de la probabilidad: P (I  M )  P I   P M 

P( I  M )  PI   PM  
3 3
 1
Luego se aplica la definición de probabilidad 6 6
Hay que notar el suceso ( I U M ) es equivalente al espacio muestral.

Teorema 1.1. Si  es el conjunto vacío, entonces P() = 0


Teorema 1.2. Si A’ es el suceso complementario de A, entonces P(A’)= 1 - P(A)
Teorema 1.3. Si A y B son dos sucesos cualesquiera entonces: P(AUB) = P(A) + P(B) - P(A  B)
Ejemplo. Un contador público entra a una librería. La probabilidad de que compre un libro de
matemáticas es 0.50, la probabilidad de que compre un libro de literatura es 0.3 y la probabilidad
de que compre un libro de que compre uno de matemáticas y literatura es 0.20. Cuál es la
probabilidad de que compre un libro de matemáticas o de literatura o ambos?

Solución. Sean los sucesos: M = El contador público compra un libro de matemáticas.


E = El contador público compra un libro de literatura.
Entonces la pregunta es: P(MUE) = ?Aplicando el teorema 1.3.

P(MUE) = P(M) + P(E) - P(M  E)  P(MUE) = 0.5+0.3- 0.2 = 0.6


4
Ejemplo. Suponga que la distribución de los empleados de la empresa petrolera Petra están
clasificados por sexo y dependencia donde labora ( tabla 1.2).

Tabla 1.2. Clasificación de los empleados por sexo y dependencia. Empresa


Petra.2015
Sexo Producción (D) Mantenimiento Administración Total
(T) (A)
Masculino (V) 20 10 10 40
Femenino (M) 30 20 10 60
Total 50 30 20 100

Hay que elegir un empleado para enviarlo a EE. UU. Cuál es la probabilidad de que sea : a) un
varón? b) una mujer y que trabaje en mantenimiento. c) No trabaje en producción.

Solución:
40
a) Sea V= Varón entonces P(V) = ? aplicando la definición de probabilidad P (V )   0.40
100
b) Sea los eventos M= femenino y T= trabaje en mantenimiento, entonces aplicando la definición
20
de probabilidad: P( M  T )   0.20
100
P(no trabaje en producción)= ?  D=trabaje en producción y D´= no trabaje en
c)
50
producción. Aplicando teorema 1.2 P( D´' )  1  P( D)  1   0.5
100

EJERCICIOS SECCION 1.1.

1) Un reparador de televisores ha mezclado accidentalmente 3 tubos malos con 20 buenos. Sí no


puede determinar por examen visual que tubo es bueno:
a) cual es la probabilidad de que seleccione al azar un tubo bueno. b) cual es la probabilidad de
que seleccione al azar un tubo malo.

2) Se efectúa una encuesta entre 56 empleados de una planta acerca de la conveniencia de la


afiliación del sindicato. Los resultados de la encuesta se encuentran a continuación:

Opinión Capataces Trabajadores. Trabajadores.


Fijos Temporales
A Favor de afiliación 1 25 4
Contra la afiliación 3 10 6
Sin opinión 1 4 2

Si seleccionamos un trabajador aleatoriamente, ¿ cuál es la probabilidad de que: a) se oponga a la


afiliación. b) sea un trabajador fijo. c) sea un trabajador temporal sin opinión. d) Este a favor o sin
opinión. e) Este a favor de la afiliación o sea temporal. f) Que haya opinado. g) que sea capataz y
esté en contra de la afiliación. h) No sea un trabajador temporal.

5
3) Julio baja dos papayas biches y las envuelve en papel periódico, luego las guarda en un canasto.
Después de una semana observa el estado de las papayas. Describa el espacio muestral del estado
de las papayas.

4) En una empresa textil existen los siguientes empleados que se encuentran clasificados por el
color de la piel y el partido político que milita. Sí se selecciona un empleado al azar, cuál es la
probabilidad de que sea:
a) blanco b) liberal o tenga el color de la piel blanca. c) liberal y amarillo
d) conservador y sea negro e) negro o blanco f) no sea liberal g) sea liberal.
Partido Negro Blanco Amarillo

Liberal 10 25 15

Conservador 20 30 18
Otros 19 26 32

5) Un artículo proveniente de una área de producción son señalado como defectuosos (d) o no
defectuosos (N), los artículos son observados y anotada su condición. Este análisis continua hasta
que sean elaborados consecutivamente 2 defectuoso o hayan sido inspeccionados 4 artículos
(cualquier situación que se presente primero). Describa el espacio muestral para este experimento.
6) De 500 personas que presentaron solicitud para un puesto de contador en una empresa grande
el año pasado 40% tenían alguna experiencia de trabajo y 30% tenían un diploma profesional. Sin
embargo, 20% de los solicitantes tenían tanto experiencia de trabajo como diploma y por ello están
incluidos en ambos conteos. Cuál es la probabilidad de que un solicitante elegido al azar tenga
experiencia de trabajo o tenga diploma de profesional.
7) Cuando un ingeniero industrial efectúa una llamada telefónica es posible que obtenga la
comunicación inmediatamente o por el contrario tenga que esperar. Describa el espacio muestral.
8) Un dado es balanceado de tal forma que la probabilidad de cada una de sus caras sea
proporcional al número de puntos de dicha de cara. Cuál es la probabilidad de obtener un número
impar en un lanzamiento.
9). En cierta universidad el 39% de los estudiantes tiene el cabello dorado, el 19% tiene los ojos
azules y el 4.5% tiene los ojos azules y el cabello dorado. Selecciona una persona al azar. Halle la
probabilidad de que tenga el cabello dorado o los ojos azules.
10) El 35% de los administradores de empresas ven el programa Informe Financiero, el 42% ven
el programa Defalcos mundiales y el 10% ven ambos programas. Selecciona un administrador de
empresas al azar, halle la probabilidad de que presencie programa Informe Financiero o el
programa Defalcos mundiales?

1.2. EVENTOS DEPENDIENTE E INDEPENDIENTES


1.2.1. EVENTOS DEPENDIENTE
Dos o más eventos son dependiente cuando un evento afecta el resultado del siguiente evento.
Ejemplo; la selección de dos artículos de un lote de producción, utilizando la selección sin
reemplazamiento (sin sustitución).
6
1.2.1.1. PROBABILIDAD CONDICIONAL

La probabilidad condicional de un evento B dado que el evento A sucedió es igual a la probabilidad


de AB, dividida entre la probabilidad de A.
P( A  B) Para toda P(A)  0
P( B / A) 
P( A)

Ejemplo. Suponga que entre los empleados de la empresa Petra (tabla 1.2) se elige al azar un
empleado de sexo femenino, cuál es la probabilidad de que el empleado trabaje en
mantenimiento.
Solución: aplicando la definición de probabilidad condicional:
20
P( M  T ) 100
PT / M     0.33
P( M ) 60
100
PARTICION. Los sucesos B1, B2 , B3, ...... BK, representan una partición del espacio muestral S,

k
si: a) Bi  B j  0 para todo i diferente de j. b) Bi  S c) P( Bi )  0 para todo i.
i 1

Sea B1, B2 , B3, ... BK, sucesos representan una partición del espacio muestral S, y A un evento
cualesquiera asociado a S (ver figura 1.1). Entonces A=AB1+AB2 + AB3, + ..+A BK.

Figura 1.1 Partición

Como AB1, ............ ABK son mutuamente excluyentes entonces:


P(A)= P(AB1 )+ P(A B2 )+P( AB3, )+ .....+P(A BK). Por definición de probabilidad
condicional:

P(A)= P(A/B1 ) P(B1)+P(A/B2 ) P(B2) P(A/ B2 )+ P(A/B3 ) P(B3) + .....+P(A/Bk ) P(Bk)


A la anterior formula se denomina probabilidad total.
Ejemplo. Para el puesto de presidente de la asociación de contadores públicos han sido nominados
tres ingenieros de diferentes universidades. La probabilidad de que elijan al contador público de
UCC es de 0.6 ; la probabilidad de que sea elegido un contador público de la USCO es de 0.25 y la
probabilidad de que sea elegido uno de la CORHUILA es de 0.15. Sí se elige al de la UCC la
probabilidad de que aumente la cuota de afiliación es de 0.85. Si eligen al de la USCO la
probabilidad de que aumente la cuota de afiliación es de 0.5 y si eligen al de la CORHUILA la
probabilidad de que aumente la cuota de afiliación es de 0.2. ¿ Cuál es la probabilidad de que haya
7
un aumento en la cuota de afiliación en la asociación de contadores públicos?.

Solución. La pregunta

P(de que haya un aumento en la cuota de afiliación en la asociación de ingenieros industriales).


Sea los eventos:
A= aumento en la cuota de afiliación B1 = se elige al ing. de la UCC
B2 = se elige al contador público de la USCO
B3 = se elige al contador público de la CORHUILA
P(A) = ? Como A esta conformado con la partición de Bi entonces aplicando la fórmula de
probabilidad total:

P(A)= P(A/B1 ) P(B1) + P(A/B2 ) P(B2) P(A B2 )+ P(A/B3 ) P(B3)

Dónde: P( B1 )= 0.6 P( B2 )= 0.25 P( B3 )= 0.15 P(A/B1)= 0.85 P(A/B2)= 0.5 P(A/B3)= 0.2

P(A)= P(A/B1 ) P(B1) + P(A/B2) P(B2) + P(A/B3 ) P(B3) aplicando probabilidad total.
P(A) = 0.85*0.6 + 0.5*0.25 + 0.2*0.15 = 0.665

Algunas veces hay que determinar un probabilidad condicional como función de la partición, por
ejemplo en la elección al candidato de la asociación, si preguntara ¿si se aumentó la cuota de
afiliación cual es la probabilidad de que se haya elegido al contador público de la USCO?.

P(B2/A ) = ?. Cuando sucede este caso se debe utilizar el teorema de Bayes.

1.2.1.2. TEOREMA DE BAYES.

Sea B1, B2 , B3, ...... BK, sucesos representan una partición del espacio muestral S, y A un evento
cualesquiera asociado a S, entonces:
P(A/B i )P(B i )
P(B i /A) 
P(A/B 1 )P(B 1 )  P(A/B 2 )P(B 2 )  P(A/B 3 )P(B 3 )  .... P(A/B K )P(B K )

Ejemplo. Para el ejercicio anterior si se aumentó la cuota de afiliación cual es la probabilidad de


que se haya elegido al contador público de la USCO.

Solución.
P( aumento la cuota de afiliación, cual es la probabilidad de que se haya elegido al contador público
de la USCO).
Sea: A= aumento en la cuota de afiliación B1 = se elige al contador público de la UCC
B2 = se elige al contador público de la USCO B3 = se elige al contador público de la CORHUILA
P(B2/A ) = ? Aplicando el teorema de Bayes:
P(A/B i )P(B i )
P(B i /A) 
P(A/B 1 )P(B 1 )  P(A/B 2 )P(B 2 )  P(A/B 3 )P(B 3 )  .... P(A/B K )P(B K )
Siendo i = 2. Entonces

8
P(A/B 2 )P(B 2 )
P(B 2 /A) 
P(A/B 1 )P(B 1 )  P(A/B 2 )P(B 2 )  P(A/B 3 )P(B 3 )

Donde: P( B1 )= 0.6 P( B2 ) = 0.25 P( B3 )= 0.15

P(A/B1 ) = 0.85 P(A/B2 )= 0.5 P(A/B3 )= 0.2 . Entonces

0.5 * 0.25 0.125


P(B2 / A) = ______________________________=___________= 0.188
0.85 * 0.6 + 0.5 * 0.25 + 0.2 * 0.15 0.665

1.2.2. EVENTOS INDEPENDIENTES

Definición: Dos o más eventos son independientes, si el resultado de los eventos en ningún modo
se afecta uno de otro. La probabilidad de que ambos eventos independientes A y B ocurran es:
P(AB) = P(A) P(B)

Ejemplo. Cuál es la probabilidad de obtener dos caras si se lanza sucesivamente dos veces una
moneda?
Solución. Sea C1 = Obtener cara en el primer lanzamiento. C2 = Obtener cara en el segundo
lanzamiento.

Los anteriores sucesos son independientes es decir si se obtiene una cara en el primer lanzamiento
no va a influir en el resultado del segundo lanzamiento. Aplicando la fórmula de independencia:
1 1 1
P(C1  C 2)  P(C1) P(C 2)  *   0.25
2 2 4

1.3. TECNICAS DE CONTEO

Esta técnicas son útiles cuando los espacios muéstrales son grandes y se necesita contar el número
de eventos que satisfacen algunas condiciones. El primer concepto a definir es el factorial.

FACTORIAL. Dado un entero positivo n, el producto de todos los números enteros de n hasta 1
se llama factorial de n y se escribe n! y la formula general es: n! = n(n-1)(n-2)(n-3)..........1

Ejemplo. Calcular 7! Aplicando la formula anterior. 7! = 7*6*5*4*3*2*1 = 5040

Por definición 0! = 1

Una propiedad de n! es: n! = n(n-1)! = n(n-1)(n-2)! Por ejemplo: 6! = 6*5*4!

9
1.3.1. PERMUTACION.

Una permutación es un arreglo ordenado de objetos. Designemos por n el número objetos


diferentes de los cuales se va a obtener un arreglo ordenado y por r el número de objetos en el
arreglo. El número de permutaciones de n objetos tomados r a la vez, se nota como nPr y se define
n!
como: n Pr 
(n  r )!
Ejemplo. La junta directiva de la asociación de contadores públicos va a ser elegida. Los cargos
son: presidente, secretario y tesorero. Hay de seis candidatos para ocupar los cargos. Cuántos
grupos diferentes se puede formar para ocupar los cargos?.

Solución: como los cargos son tres y hay disponibles seis candidatos entonces interesa el orden.
Por ejemplo si los candidatos son : Roberto, Ana, Pablo, Cecilia, Carlos y José, entonces un grupo
puede ser:

Presidente secretario tesorero Presidente secretario tesorero


Ana Pablo Carlos Pablo Ana Carlos

GRUPO I GRUPO II

Observe que el grupo uno es diferente al grupo dos aunque sean los mismo candidatos pero no
ocupan el mismo cargo. Significa que si interesa el orden. Como interesa el orden hay que calcular
una permutación :

n!
n Pr  Donde: n=6 r =3, entonces:
(n  r )!

n 6! 6 * 5 * 4 * 3 * 2 *1
Pr     120
(n  r )! 6  3! Hay 120 grupos o arreglos
n
3!
diferentes

1.3.2. COMBINACION.

Una combinación es un arreglo de objetos diferentes sin tener en cuenta el orden. El número de
combinaciones de n objetos tomados r a la vez se escribe nCr y se define como:

n!
n Cr 
r!(n  r )!
Ejemplo. Suponga que hay 12 personas para formar un comité de tres personas para dialogar con
10
el director de Hocol. ¿ Cuántos comité diferentes se pueden formar?
Solución. Un comité puede estar formado por Juan, Pablo y Sofía. Ellos van dialogar con el director.
Si invierten el orden por ejemplo, Pablo, Sofía y Juan, entonces es el mismo comité ya que cumple
la misma función. Entonces no interesa el orden. En este caso n = 12 y r =3.

n! 12!
Cr    220
r!(n  r )! 312  3!
n

EJERCICIOS SECCION 1.2- 1.3

1) En una encuesta entre 56 empleados de una planta acerca de la conveniencia de la afiliación del
sindicato, los resultados están a continuación:

Trabajadores
Opinión Capataces Trabajadores temporales
fijos

A Favor de afiliación 1 25 4

Contra la afiliación 3 10 6
Sin opinión 1 4 2
a) Seleccionan un capataz al azar, cual es la probabilidad de que este en contra de la afiliación.
b) Seleccionan al azar un trabajador que esta en contra de la afiliación, cual es la probabilidad de
que sea un empleado temporal.
2) Dos divisiones de productos distintos de una empresa grande son productos marinos y equipos
de oficina. Se estima que la probabilidad de que productos marinos tengan utilidad en este año es
de 0.30, la probabilidad de que la división de equipo de oficina tengan utilidad en este año es de
0.70 y la probabilidad de que ambas divisiones tengan utilidad en este año es 0.06. Cuál es la
probabilidad de que la división de productos marinos tenga utilidad en este año dado que la división
de equipos de oficina también tiene utilidad en este año.
3) Se estima que la probabilidad de que aumente las ventas de automóviles en el siguiente mes es
de 0.40. Se estima que la probabilidad de que aumenten las ventas de refacciones es de 0.50. Se
estima que la probabilidad de que ambas industrias experimenten un aumento en las ventas es de
0.10. ¿ Cuál es la probabilidad de que: a) hayan aumentado las ventas de automóviles durante el
mes, dado que existe información de que han aumentado las ventas de refacciones. b) hayan
aumentado las ventas de refacciones, dado que existe información de que aumentaron las ventas
de automóviles durante el mes?.
4) La junta directiva de la compañía JR consta de 15 miembros, ¿ de cuantas formas se puede
elegir presidente, vicepresidente y secretario?
5) Un club tiene 10 miembros. ¿ De cuantas formas se puede elegir una junta directiva de 4
miembros
6) A los habitantes de una gran ciudad se le hizo una encuesta con el propósito de determinar el
número de lectores del periódico el Tempo. los resultados son los siguientes: 20% de los
habitantes lee El Tempo, el 16% leen El Especta, y un 1% leen ambos periódicos.
11
a) si se selecciona al azar a un lector del Tempo, cual es la probabilidad de que también lea El
Especta.
b) si se selecciona al azar a un lector del Espectador cual es la probabilidad de que también lea El
Tempo.
7) En un día lluvioso la probabilidad de que Pedro llegue tarde a clase es de 0.8, mientras que en
un día de sol, la probabilidad de que llegue tarde es solo 0.1, y la probabilidad de que llegue tarde
cualquier día (lluvioso y sol) es de 0.03. ¿Cuál es la probabilidad de que Pedro llegue tarde si está
haciendo sol o este lloviendo?.
8) Una profesor ha estado enseñado la asignatura calculo por muchos años. Sabe que el 95% de
los estudiantes hacen la tarea. Además determino que los estudiantes que hacen la tarea el 85%
aprobarán el curso. De aquellos estudiantes que no realizan la tarea, 60% aprobarán el curso. a)
Mario Rojas tomó la asignatura calculo con el profesor y aprobó la materia. Cuál es la probabilidad
de que sí haya hecho las tareas.
9) La siguiente tabla muestra a cuatro proveedores ropa de trabajo a la empresa Petroleun. El
cuadro muestra las cantidades adquiridas a cada proveedor y el porcentaje de materia prima
defectuosa que cada uno proporciona.

Proveedor % Adquirido % Defectuosos

Ropeiro 30 2,5
Salas 24 1,7
Reino 29 2,8
Carla 17 0,98

a) A un empleado de la empresa Petroleun se le entrego la ropa de trabajo y resulto defectuosa ,


cuál es la probabilidad de que la haya comprado al proveedor Reino. b) Cual es la probabilidad de
que la ropa salga defectuosa.
10) La gobernación del Huila utiliza tres hoteles locales para proporcionar alojamiento a sus
invitados en la noche. Por experiencia se sabe que al 20% de los visitante se le asigna habitación
en el hotel Tumbo, al 50% en el hotel Plazal y al 30% en el hotel Chico. Sí existe una falla en el
servicio de plomería en el 5% de los cuartos del hotel Tumbo en el 4.5% de cuartos del hotel
Plazal y un 7.5% de los cuartos del hotel Chico, ¿ cuál es la probabilidad que a) ¿ cuál es la
probabilidad que a un invitado de la gobernación se le asigne un cuarto con problemas de plomería
? b) ¿ cuál es la probabilidad que A un invitado de la gobernación con un cuarto que tenga
problemas de plomería se le asigne acomodo en el hotel Plazal?
11) En Manizales los estudiantes universitario se distribuyen de la siguiente manera: el 19%
estudian arquitectura, el 36% medicina y el 45% economía. El porcentaje de alumnos que finalizan
sus estudios en cada caso es del 4%, 11% y del 16%.
a) Elijen un alumno universitario al azar, determine la probabilidad de que haya acabado los
estudios. b) Si elige un estudiante de arquitectura, cuál es la probabilidad de que acabe los
estudios.
12)La fábrica de enlatados produce 5000 envases diarios. La máquina A produce 3500 de estos
envases, de los que el 2.3% son defectuosos y la máquina B produce los 1500 restantes de los que
se sabe que el 3.9% son defectuosos. Determinar la probabilidad de que un envase elegido al azar
sea defectuoso.
12
13) Como almacenista de un almacén recibo pedidos de cierto artículo de 3 proveedores distintos
(A, B y C). El 40% del total de pedidos se le compro al proveedor A, mientras que a B y C le
compran el 30% a cada uno. El porcentaje de artículos en malas condiciones que proporciona los
proveedores A, B y C son de 4%, 11% y 13%, respectivamente. Si los artículos se almacenan sin
importar quién es el proveedor y seleccionan uno al azar: a)Determine la probabilidad de que sea
defectuoso. b) Si es defectuoso, ¿cuál es la probabilidad de que haya sido despachado por el
proveedor B?

1.4. VARIABLE ALEATORIA

Es un variable cuyos valores numéricos quedan determinados por los resultados de un experimento
aleatorio. Por ejemplo se lanzan tres monedas no cargadas. Los resultados posibles del
experimento junto con el número de caras asociadas con cada resultado se enumeran en la tabla
1.3.
La variable X representa el número de caras obtenidas al lanzar tres monedas. Esta es una variable
aleatoria la cual toma los siguientes valores: X = [ 0 , 1 , 2 , 3 ]
Es importante diferenciar entre la variable aleatoria y los valores numéricos que ella puede tomar.
Para ello se simboliza la variable aleatoria por la letra mayúscula X y los valores que ella tome con
la letra minúscula x, como se nota a continuación: X  x 1 , x 2 , x 3 , x 4......... x n 

1.4.1. ESPERANZA MATEMÁTICA O VALOR ESPERADO E [ X ],  .

Sea X una variable aleatoria discreta, se define la esperanza matemática como la suma del
producto de cada valor puntual que toma la variable aleatoria por su correspondiente probabilidad
de ocurrencia. Los resultados están en la tabla 1.3 ( ver diagrama de árbol 1.1.a)
Tabla 1.3. Resultados de lanzar tres monedas Figura 1.1.a. Diagrama de árbol
Resultado X = número de caras
SSS 0
SCS 1
SSC 1
CSS 1
CSC 2
SCC 2
CCS 2
CCC 3

E  X    xi P ( X  xi )
n

i 1

Sea X una variable aleatoria continua, la esperanza matemática es E X    


  f x dx

Nota: A la colección de pares [ xi, p(xi) ] se le denomina distribución de probabilidad y se nota de


la siguiente forma: P(xi) = P(X = xi)

13
Ejemplo. Calcular el valor esperado de la tabla número 3. Para calcular el valor esperado se
determinó los valores en la tabla 1.4
Tabla No. 1.4. Calculo de la esperanza matemática
Xi = Número de caras (1) P(xi)=P(X=xi) (2) xi*P(xi) (3)
0 1/8 0
1 3/8 3/8
2 3/8 6/8
3 1/8 3/8
Total 1 12/8
Nota: La columna (1) da todos los valores posibles de la variable aleatoria X; la columna 2 es la
correspondiente probabilidad y la columna 3 da al producto de cada valor de la variable aleatoria
por su correspondiente probabilidad (distribución de probabilidad).

EX    xi P( X  xi ) 
n
12
 1.5..caras
i 1 8
Interpretación: Si lanzan simultáneamente 3 monedas el promedio de caras es de 1.5.

Ejemplo. Las ventas por hora de una máquina automática pueden ser 20,21,22 cajetillas de
cigarrillos con probabilidades de 0.3, 0.5 y 0.2 respectivamente, cuál es la venta por hora esperada
para ésta máquina?

Solución:

X = Número de cajetillas P(X= xi) xi* P(X= xi)


20 0.3 6.0
21 0.5 10.5
22 0.2 4.4
Total 1.0 20.9

E  X    xi P ( X  xi )
n

i 1
Interpretación: La venta promedio por hora de ésta máquina es de 20.9  21 cajetillas.

1.4.2. VARIANZA.

 se calcula de la siguiente forma:


Sea X una variable aleatoria. La varianza de X, denotada por
2

Donde : EX    x * P( X  x )
  E X   E  X  .
2 2 2 2
i i

La raíz cuadrada positiva de  se llama desviación estándar de X y se nota por  .


2

Ejemplo. Calcular la varianza y la desviación estándar al ejemplo anterior (venta de cajetillas en la


máquina automática).
14
Tabla 1.5. Calculo de la varianza.
X = Número de cajetillas P(X= xi) xi* P(X= xi) xi2 xi2 * P( X  xi )
20 0.3 6.0 400 120
21 0.5 10.5 441 221
22 0.2 4.4 484 97
Total 1.0 20.9 437.3

Solución.  2  E X 2   E  X  Donde :

EX 2    xi2 * P( X  xi )  
E X 2   x 2 * P( X  x i ) 
i
E[X2] = (20)2 (0.3) + (21)2 (0.5) + (22)2 (0.2) = 437.3


(E[x])2 = (20.9)2 = 436.81 .  2
= 437.3 - 436.81 = 0.49 La desviación estándar es:

=   0.49  0.7
2

EJERCICIOS SECCION 1,4

1) Sea X= número de caras obtenidas al lanzar tres monedas. Si salen dos o más caras se recibe
$200, si no, hay que pagar $100. ¿ Cuál es la ganancia esperada ?

2) Las ventas en expendio de publicaciones de una revista mensual tiene la siguiente distribución
de probabilidad.
Numero de 15 16 17 18 19 20
revista
Probabilidad 0.05 0.10 0.25 0.30 0.20 0.10
Calcule la venta promedio mensual de revista y su desviación estándar.

3) La siguiente tabla muestra la distribución de las ventas diarias del almacén YA, con sus
respectivas probabilidades.

Ventas (millones $) 10 20 30 40
Probabilidad 0.30 0.20 0.40 0.10

Calcular el promedio de ventas diarias del almacén y su desviación estándar.

1.5. DISTRIBUCIONES DE PROBABILIDAD PARA ALGUNAS


VARIABLES ALEATORIAS

En ésta sección se presentan ciertos modelos matemáticos que sirven para representar un gran
número de fenómenos que cumplen ciertas condiciones.
15
La distribución de probabilidad es una tabla, gráfica o formula que se usa para especificar todos
los valores posibles de una variable aleatoria junto con sus probabilidades respectivas.
Algunas distribuciones son :

La distribución Binomial
La distribución Multinomial Distribución de probabilidad para variables
La distribución Poisson aleatorias discretas
La distribución Geométrica
La distribución Hipergeométrica
Etc.

La distribución Normal
La distribución Normal Estándar Distribución de probabilidad para variables
La distribución Exponencial aleatoria continúas
La distribución Gamma
Etc.

1.5.1. LA DISTRIBUCIÓN BINOMIAL

La distribución Binomial se obtiene del experimento que cumple las siguientes condiciones:

 Cada ensayo (experimento) conduce a uno de dos resultados posibles mutuamente


exclusivos. Uno de los resultados posibles se denota (arbitrariamente) como Éxito y el
otro se nota como fracaso.
 La probabilidad de Éxito denotado por P, permanece constante de ensayo a ensayo. La
probabilidad de Fracaso, 1-P, se denota por Q.
 Los ensayos son independientes es decir el resultado de cualquier ensayo particular no es
afectado por el otro ensayo.

Sea X una variable Binomial (es decir que cumpla las condiciones anteriores) basada en n
n! x n x
repeticiones entonces: P( X  x)  P Q o
x!(n  x)!
x nx n!
P( X  x)  n CxP Q Cx  donde x es = 0 1....n
x! (n  x)!
n

Ejemplo. El ejemplo tradicional es el lanzamiento de una moneda. Se lanza la moneda 30 veces: a)


Cuál es la probabilidad de obtener exactamente 3 caras. b) Cuál es la probabilidad de obtener por
lo menos 3 caras.

Solución. a) El experimento consiste en el lanzamiento de la moneda. Cada lanzamiento (ensayo)


produce 2 resultados posibles: cara o sello.
16
La probabilidad de éxito P permanece constante de ensayo a ensayo, es decir P = 1/2 y es la
probabilidad de obtener cara.

Los ensayos son independientes, en otras palabras si en el primer lanzamiento sale cara, en el
segundo lanzamientos se puede obtener cualquiera de los 2 resultados posibles.

Como el experimento cumple las condiciones anteriores entonces la variable aleatoria X = (Número
de caras obtenidas) se distribuye binomialmente y la:
3 303
1 1
P( X  3)  30 C3 *      2.2687 * 10 5  0.00000378
2 2
La probabilidad de obtener exactamente tres caras en 30 lanzamientos es de 2.2687 X 10-5 .

b) P(X ≥3) = ? Solución: P( X ≥ 3) = 1 - P( X ≤ 2), Donde

P ( X≤ 2 ) = P (X = 0) + P ( X = 1 ) + P ( X = 2). entonces :
0 30 0
1  1
P( X  0)  30 C0    2   9.31323 * 10 10
2
1 301
1 1
P( X  1)  30 C1   2  2.79397 * 10 8
2  
2 30 2
1 1
P( X  2)  30 C 2      4.05125 * 10 7
2 2

Luego, P ( X≤ 2 ) = 9.31323 * 10-10 + 2.79397 * 10-8 + 4.05125 * 10-7

P ( X≤ 2 ) = 4.33996 * 10-7  P ( X ≥ 3) = 1 - 4.33996 * 10-7 = 0.99

La probabilidad de obtener por lo menos tres caras en 30 lanzamientos es de 0.99.

Teorema 1.4. Sí X es una variable aleatoria distribuida binomialmente, el valor esperado y varianza
es:
E  X   nP  2  nPQ
Ejemplo. La probabilidad de que un prospecto de ventas elegido al azar realiza una compra es de
0.20. Sí realiza 15 visitas de prospecto, cual es la venta promedio y su desviación estándar ?

Solución: Como la variable X = número de ventas. Esta variable se distribuye en forma binomial,
entonces:

E  X   nP  2  nPQ Como n = 15 y P =0.20 q = 0.80 entonces E [X] = 15 * 0.20

= 3.0  2  nPQ = 15 * 0.20 * 0.80 = 2.4 s= 2.4  1.55

17
1.5.2. LA DISTRIBUCIÓN POISSON

La distribución Poisson es otra distribución de naturaleza discreta. Esta distribución es aplicable a


procesos (experimento) en los que ocurren en determinado sucesos por unidad de espacio,
tiempo, área y volumen.
La variable aleatoria X en una distribución Poisson representa el número de resultados que ocurren
en un intervalos de tiempo dado (segundos, minuto, hora, día) o en una región(espacio) o volumen
específico.

Sí una variable aleatoria X esta distribuida en forma Poisson, entonces la probabilidad de obtener
exactamente x resultados en un intervalo de tiempo, espacio o volumen es:
e  
x

P( X  x)  Para X= 0, 1, 2, 3,........K
x!
Donde:  = Tasa media de ocurrencia de los sucesos por cualquier unidad de tiempo,
espacio o volumen.
X = Número de ocurrencias del suceso en una unidad de tiempo, espacio o volumen.

Ejemplo. El gerente de un banco sabe por experiencia que entre la 9:00 y 10:00 de la mañana, la
tasa media de llegada de los clientes es de 60 por hora. El desea determinar la probabilidad de
que: a) lleguen dos clientes por minuto entre las 9:00 y 10:00 de la mañana. b) Lleguen a lo
máximo clientes por minuto entre las 9:00 y 10:00 de la mañana.

Solución.
a) P(lleguen dos clientes por minuto entre las 9:00 y 10:00 de la mañana).
Sea X = total de clientes por minuto que llegan al banco entre las 9:00 y 10:00 de la mañana
 = promedio de llegada de los clientes por minuto  = 60 clientes/60 minutos = 1 cliente por
minuto

La variable aleatoria se distribuye en forma Poisson ( número de sucesos por unidad de tiempo)
entonces para determinar la probabilidad de que lleguen dos clientes por minuto entre las 9:00 y
e  
x

10:00 de la mañana se aplica la siguiente formula. P( X  x)  Reemplazando:


x!
2
e  11
P( X  2)   0.183
2!
Solución.
b) P(lleguen a lo máximo dos clientes por minuto entre las 9:00 y 10:00 de la mañana).

P ( X  2) = P(X=0) + p(X=1) + p(X=2) = 0.3679 + 0.3679 + 0.183 = 0.9188

Teorema 1.6. Sea X una variable aleatoria distribuida en forma Poisson, entonces el valor esperado
y la varianza es igual a Landa (  ).
E[X]= ² = 

18
EJERCICIOS SECCION 1.5.1.– 1.5.2

1) Una empresa que fabrica bombillos sabe por experiencia que la probabilidad de que salga un
bombillo defectuoso es de 0.03. Como usted es el contador de la empresa selecciona 12 bombillos,
cual es la probabilidad de que salgan 3 defectuosos.

2) El 90% de los artículos que produce una máquina son buenos. Sí seleccionamos aleatoriamente
10 artículos producido por la máquina, cuál es la probabilidad de que a) exactamente 2 de ellos
sean buenos b) Menos de dos sean buenos c) A lo máximo uno sea bueno .

3) El 4% de los ingenieros industriales son de sexo femenino. Sí seleccionamos aleatoriamente 12


ingenieros industriales,

a) cuál es la probabilidad de que exactamente 3 de ellos sean de sexo femenino. b) Ninguno sea
mujer c) Más de uno sea mujer d) menos de 3 sean mujeres e) dos sean hombres.
f) más de uno sea hombre.
4) El número de accidentes por año en la ciudad de Descanso es de 4 por cada 100000 habitante.
Hallar la probabilidad de que en esa ciudad ocurran por cada 100000 habitantes:

a) dos accidentes por año. b) un accidente por año.


c) a lo máximo un accidente por año. d) menos de dos accidentes por año.
e) más de un accidente por año. f) como mínimo un accidente por año.
g) Entre uno accidentes y tres accidentes por año.

5) Al bombero de una surtidora de gasolina se le paga de acuerdo al número de automóviles que


atienda. la probabilidad de que atienda un día ordinario es de 6/8 y en un día festivo es de 2/8. El
pago por atender un automóvil en día festivo es de $0.20 y en un día ordinario es de $0.10.
Encuentre la ganancia esperada para el bombero.

6) En una estación de gasolina se sabe que el promedio de vehículos que llegan por hora es de 30.
Cuál es la probabilidad de que una hora lleguen:

a) 3 vehículos. b) Menos de dos vehículos. c) Ningún vehículo


d) mas de 1 vehículos. e) Como mínimo dos vehículos. f) un vehículo.

7) Para el ejercicio anterior determine la media y la varianza.

8) En el conmutador de la universidad entran en promedio 2 llamadas por minuto. Encuentre la


probabilidad de:

a) No entre llamadas por minuto b) no más de dos llamadas por minuto.


c) Menos de 1 llamada por minuto d) Mas de 1 llamadas en un periodo de 6 minutos.

9) Se sabe que un máquina produce diariamente el 2% de los artículo defectuosos. Si seleccionan


12 artículos, cual es la probabilidad de que:
a) Al menos uno sea defectuoso. b) Ninguno sea defectuoso. c) Uno sea defectuoso.
19
d) más de uno sea defectuoso e) Uno sea bueno. f) Promedio de artículos defectuosos.
g) Desviación estándar de artículos defectuosos.

10) Cuando una variable aleatoria se distribuye en forma geométrica y como calcula la
probabilidad.

11) Cuando una variable aleatoria se distribuye en forma multinomial y como calcula la
probabilidad.

12) En una panadería se sabe que 1 de cada 50 panes inspeccionados esta quemado. ¿Cuál es la
probabilidad de que el sexto pan inspeccionado sea el primer pan quemado?

13) La probabilidad de que un estudiante pase en la universidad Nacional es de 0.2.Encuentre la


probabilidad de que un estudiante pase en la universidad Nacional en el cuarto intento.
A continuación se describen algunas distribuciones de probabilidad para variable continua.

1.5.3. LA DISTRIBUCIÓN EXPONENCIAL.

La distribución exponencial miden el tiempo transcurrido entre ocurrencias. Esta distribución esta
relacionada con la distribución Poisson que es discreta, mientras que la distribución exponencial es
continua ya que la variable tiempo es continua.

La distribución exponencial mide el tiempo de atención para ser atendido en una entidad bancaria,
un supermercado, en una estación de gasolina etc., es decir, esta distribución se utilizan como
modelo para representar tiempos de funcionamiento o tiempos de espera.

Una variable aleatoria continua se distribuye en forma exponencial si su función de densidad es:

f (T )  e  t
Para calcular cualquier probabilidad de una variable continua esta se representa una área en el
plano y por consiguiente hay que calcular la integral entre los tiempos o tiempo solicitado en la
espera. Para disminuir el tiempo en la solución de cualquier ejemplo se ha elaborado una tabla
acumulativa de la distribución exponencial (apéndice, tabla I).

Ejemplo. El cajero del supermercado YA atiende en promedio 4 cliente cada cinco minuto minutos.
a) ¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3 minutos?
b) ¿Cuál es la probabilidad de que una persona sea atendida entre 3 minutos y 5 minutos? c)
¿Cuál es la probabilidad de que una persona se demore mas de 4 minutos en ser atendida?
Solución.
a) ¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3 minutos?
P(una persona sea atendida antes de que transcurran 3 minutos).
4
Sea T= tiempo de atención.  P(T  3)  ? Además  
5
4 3  54 *3
reemplazando la integral P(T  3)  0 e dt Para evitar la integración
5
20
P(T  3)  ? para un
utilizar la tabla exponencial (tabla I ) 2, el cual tienen la t

4
específico. Utilizando la tabla se busca t  * 3  2.4 y la probabilidad es
5
P(T  3)  0.909
b) ¿Cuál es la probabilidad de que una persona sea atendida entre 3 minutos y 5 minutos?
P(una persona sea atendida entre 3 minutos y 5 minutos)
Sea T= tiempo de atención.  P(3  T  5)  ?
4
Se sabe qué 
. Para utilizar la tabla exponencial (tabla I) realizo la siguiente conversión:
5
P(3  T  5)  P(T  5)  P(T  3) 
4
P(T  5)  ? para un   * 5  4  P(T  5)  0.982
5
4
P(T  3)  ? para un   * 3  2.4 entonces
5
P(T  3)  0.909
Luego P(3  T  5)  0.982  0.909  0.073

c) ¿Cuál es la probabilidad de que una persona se demore más de 4 minutos en ser atendida?

P(T  4)  1  P(T  4)  1  0.959  0.041


4
  * 4  3.2
5
Teorema 1.6. Sea T una variable aleatoria continua distribuida en forma exponencial, entonces, el

E T  
1 1
valor esperado y su varianza es: y 2 
 2
1.5.4 LA DISTRIBUCION NORMAL

El modelo probabilístico más frecuentemente usado en las decisiones económicas, sociales, etc., es
la distribución normal, la cual puede ser presentada en forma general o estándar.

La importancia de la distribución reside en sus convenientes propiedades matemáticas que llevan


directamente a muchas partes de la teoría de la estadística disponible como base para la práctica
en su totalidad como aproximación a otra distribuciones en su aplicación a muchas variables
aleatorias que, o están distribuidas aproximadamente de manera normal, o se puede transformar
fácilmente para aproximarlas a variables normales.
Definición. Sea X la variable aleatoria continua que toma todos los valores reales entre -∞<X<∞
21
se dice que tiene distribución normal si su función de densidad de probabilidad f(X) es de la forma.
2
 1   X  
1    
f (X )  e  2   

2 2

los parámetros  (media) deben satisfacer las condiciones - <  <  y  (desviación estándar)
 > 0.
La gráfica de la distribución normal produce la conocida curva en forma de campana que se muestra
en la figura 1.1.A.

Figura 1.1A. La distribución normal

1.5.4.1 PROPIEDADES DE LA DISTRIBUCIÓN NORMAL

a) Es simétrica respecto a la media (  ), es decir la curva hacia cualquiera de los dos lados de ,
es una imagen reflejada de la del otro lado.
b) La media, la mediana y la moda son iguales.
c) El área total de la curva por encima del eje x es una unidad.
Debido a la simetría ya mencionada, el 50% del área está hacia la derecha de una perpendicular
levantada en la media y el 50% está hacia la izquierda.
d) Sí se levantan perpendiculares a una distancia de una desviación estándar de la media, en
ambas direcciones, el área encerrada por estas perpendiculares, el eje X y la curva será
aproximadamente el 68% del área total. Sí se levantan perpendiculares a dos desviaciones
estándar hacia cada uno de los lados de la media, se encerrará aproximadamente el 95% del área
total, y sí se levantan perpendiculares a tres desviaciones estándar a lado y lado de la media, se
encerrará aproximadamente el 99.7% del área total ( figura 1.2).

Figura 1.2. Subdivisión del área bajo la curva normal


La distribución normal queda completamente determinada por los parámetros  y  decir cualquier
cambio de  desplaza la distribución normal, mientras que un cambio de , únicamente altera la
forma de la distribución ( figura 1.3 y 1.4).

22
Figura 1.3. Subdivisión del área bajo la curva normal con medias diferentes

Figura 1.4. Distribución normal con varianzas diferentes

La última propiedad de la distribución normal implica, que en realidad esta es una familia de
distribuciones. La más importante de esta familia es la distribución normal estándar o unitaria.

1.5.5. LA DISTRIBUCION NORMAL ESTANDAR ( Z )

x
Sea X una variable aleatoria continua y Z entonces Z se distribuye en forma normal

estándar con media  = 0 y 2 = 1 y su función de densidad de probabilidad es de la forma:
2
1  Z2
f (Z )  e . La figura 1.5. se muestra la gráfica de la distribución normal estándar.
2

Figura 1.5. Distribución normal estándar

La distribución normal estándar posee las mismas propiedades de la distribución normal . Para
encontrar la probabilidad de cualquier valor de Z entre un punto o dos se utiliza la tabla II.

El cuerpo de la tabla II del apéndice está el área bajo la curva entre cero y un valor de Zi . El
valor de Zi está en la primera columna y en la primera fila de la tabla. El área sombreada de la
figura 1.6 presenta el área ( o probabilidad) es la dada en la tabla para valores de Z entre
cero y Z0.

23
Figura 1.6. Área dada en tabla II. P ( 0<Z < Zi)

Ejercicio: Dada una distribución normal estándar, encontrar: a) P( 0 < Z < 2.20 )
b) P( -0.56 < Z < 0) c) P ( Z > 1.56 ) d) P( 0 < Z < 2.32 ) e) P (Z<- 1.50) .

Solución. Para encontrar estas probabilidades (áreas) es importante hacer la figura de la


distribución normal estándar y sombrear el área que solicitan:
a) P( 0 < Z < 2.20 ). ¿ Cómo se encuentra esta área?. En tabla II. se localiza el valor de Z
igual a 2.20 es decir, el 2.2 en la primera columna y el cero en la primera fila, y leer el valor
correspondiente en la intercesión del cuerpo de la tabla II, que es 0.4681.
La figura 1.7 muestra el área solicitada.

Figura 1.7. Área solicitada


b) P(-0.56 < Z < 0) Esta probabilidad se encuentra de la misma forma que en el punto a. Es
decir cualquier valor negativo de Z se trata como positivo. Buscando el valor 0.56 en la tabla
II, la probabilidad es de 0.2123. ( figura 1.8).
c)

Figura 1.8. Área solicitada


c) P ( Z > 1.56 ) .El área sombreada es diferente a la que se presenta en la tabla II. Debe
llevarse a esa forma , ¿ cómo ? . Como la mitad del área de la normal vale 0.5 por propiedad,
entonces:
P ( Z > 1.56 ) = 0.5 - P ( 0 < Z < 1.56 ) = 0.5 - 0.4406= 0.0594
d) P ( Z < - 1.50). Para hallar esta probabilidad el valor de z se vuelve positivo y se le da el
mismo tratamiento del punto c. Entonces:
P ( Z < - 1.50) = P ( Z > 1.50 ) = 0.5-P(0<Z<1.50) = 0.5 - 0.4332 =0.0668

24
Ejercicios propuestos. Determine las siguientes probabilidades:

a) P( 0< Z<4.20 ) b) P( 2 <Z<3.06) c) P (Z < 1.567)


d) P(-1.35 <Z< 2.32 ) e) P ( Z < -14.0)

1.5.5.1. APLICACIONES DE LA DISTRIBUCIÓN NORMAL.

1) Los contadores públicos mantienen en promedio una contabilidad de tres años con una desviación
estándar de 0.5 años. Suponga que el tiempo de duración de llevar las contabilidades de los contadores
públicos está distribuida aproximadamente en forma normal. Determine la probabilidad de que un contador
público dure; a) más de 3.5 años en llevar una contabilidad. b) menos de 3.4 años en llevar una
contabilidad. c) más de 2.3 años en llevar una contabilidad. e) entre 2.5 y 3.3 años en llevar una
contabilidad.

Solución La pregunta es determinar la probabilidad de que un contador público dure; más de 3.5 años en
llevar una contabilidad más de 3.5 años. La notación es:P(un contador público dure más de 3.5 años en
llevar una contabilidad). Entonces crear la variable aleatoria X, donde X = tiempo de duración en llevar
una contabilidad el contador público

Reemplazando la pregunta P ( X > 3.5 ) = ?. Para encontrar la P ( X > 3.5 ), es necesario hacer la figura
1.9.
El enunciado del problema da los siguientes valores:  = 3 años y  = 0.5 . Para determinar P (X >3.5 ),
es decir el área de la figura 1.9 hay que realizar una integral. Para evitar la integración se lleva a una

Figura 1.9. Distribución del tiempo de llevar la contabilidad

x
distribución normal estándar (Z) mediante el siguiente cambio de variable: Z .A continuación

 3.5  3.0 
 
se realiza el cambio: P X  3.5  P Z    PZ  1 Gráficamente se presenta la figura 1.10.
 0.5 

Figura 1.10. Cambio de variable


25
Para hallar P ( Z > 1 ) en el tabla II debe hacerse de la siguiente forma: P ( Z > 1 ) = 0.5 – valor de la
tabla II. Entonces P ( Z > 1 ) = 0.5 - 0.3413 = 0.1587.

b) Determine la probabilidad de que un contador público dure menos de 3.4 años en llevar una
contabilidad. . Para encontrar la P ( X < 3.4 ), donde X = tiempo de duración en llevar una contabilidad,
es necesario hacer la figura 1.11 .El enunciado del problema da los siguientes valores:  = 3 años y =
0.5. Para hallar la probabilidad P (X< 3.4) se debe realizar una integral. Para evitar la integración se lleva a
x
una distribución normal estándar (Z) mediante el siguiente cambio de variable: Z  . A

continuación se realiza el cambio:

Figura 1.11. Distribución del tiempo de llevar la contabilidad

34  30
P ( X < 3.5 ) = Z  = P ( Z < 0.8). Gráficamente se presenta la figura 1.12.
0.5

Figura 1.12. Cambio de variable de la normal a la estándar

Para hallar P ( Z < 0.8) en la tabla II, debe hacerse de la siguiente forma: P ( Z < 0.8 ) = 0.5 + valor de la
tabla de 0.8, P ( Z < 0.8 ) = = 0.5 + 0.2881 = 0.7881. En la figura 1.12 se observa el cambio de variable.

c) Determine la probabilidad de que un contador público dure más de 2.3 años en llevar una contabilidad.
Solución. Para encontrar la P ( X > 2.3 ), donde X es el tiempo de llevar la contabilidad. El enunciado del
problema da los siguientes valores: = 3 años y  = 0.5. Para hallar la probabilidad P( X > 2.3 ) se debe
realizar una integral. Para evitar la integración la transformamos en una distribución normal estándar (Z)
x
mediante el siguiente cambio de variable: Z A continuación se realiza el

 2.3  3.0 
P(X > 2.3)  P Z > =
cambio
 0.5 
PZ > -1.4  0.5.  valor tab la 1.4  0.5  0.4192  0.9192
e) Determine la probabilidad de que un contador público dure Entre 2.5 y 3.3 años en llevar una
contabilidad.
26
Para encontrar la P (2.5 < X < 3.3 ), definir X como el tiempo de llevar la contabilidad. El enunciado del
problema da los siguientes valores:  = 3 años y  = 0.5 . Para hallar la probabilidad P (2.5 < X < 3.3 )
se debe realizar una integral. Para evitar la integración la transformamos en una distribución normal
x
estándar (Z) mediante el siguiente cambio de variable: Z . A continuación se realiza el cambio:

)  P - 1 < X < 0.6
2.5 - 3.0 3.3 - 3.0
P(2.5 < X < 3.3 )  P( <X< . Para
0.5 0.5
hallar P ( -1 < Z < 0.6 ) se utiliza el tabla II y es la siguiente forma: P ( -1 < Z < 0.6 ) = valor tabla de 1
+ valor tabla de 0.6. Entonces P ( -1 < Z < 0.6 ) = 0.3413 + 0.2257 = 0.567

EJERCICIOS 1.5.3. – 1.5.5.

1). En el aeropuerto el Veloz llegan en promedio 2 aviones por día. ¿ Cuál es la probabilidad de
que, después de la llegada de un avión, tenga que esperar a lo máximo tres días para la llegada
del siguiente avión?
2) En una estación de gasolina llegan en promedio 4 clientes cada hora. Determine la
probabilidad de que el bombero de la estación tenga que esperar entre dos y tres minutos para
que le soliciten el servicio.
3) En el banco Tacaño llegan en promedio 15 clientes cada media hora. Determine la
probabilidad de que el tiempo entre un cliente y otro que llegan al banco Tacaño este entre tres
y cinco minutos.
4) Determinar el área bajo la curva normal estándar.
a) P ( Z >1.78 ) b) P ( Z < 2.35 ) c) P(-1.56<Z<2.98)
d) P (Z< - 1.43 ) e) P (0.89<Z<3.04 ) f) P (-2.3 < Z < 4.1 )
5) Pruebas realizadas en bombillas eléctricas de cierta marca, indican que el período de
duración se distribuye normalmente con media igual a 1862 horas y desviación estándar de 68
horas. Estimar el porcentaje de bombillas que duren:
a) más de 1890 horas, b) menos de 1780 horas, c) entre 1870 y 1880 horas,
d) más de 1790 horas , e) entre 1785 y 1883 horas.
6) El peso de las guanábanas en cierto municipio están distribuidas normalmente con un peso
medio de 4 libras. El 15% de las guanábanas que pesan menos de 3 libras. ¿Cuál es la
desviación estándar?.
7) La duración de ciertas lámparas para oficinas están distribuidas normalmente; si el 2.28% de
la lámparas que más duran, tiene una duración mínima de 4 meses y el 6.68% de las que
menos duran, tiene una duración máxima de 1.5 meses. Determine la duración media y la
desviación estándar.
8) Una fábrica de cemento empaca su producto en bolsas cuyos pesos se saben que son
distribuidos normalmente, con una media de 50 kilos y una varianza de 4 kilos. Encuentre la
probabilidad de sacar una bolsa de cemento que contenga;
a) por lo menos 51 kilo, b) como máximo 52 kilos, c) de 49 a 54 kilos.
9). Los salario semanales de los contadores públicos se distribuyen normalmente con una
27
desviación estándar de $10000. Por experiencia se sabe que 12% de los salarios semanales más
bajos de los contadores públicos son de $550000. Determinar el salario promedio semanal de
los contadores públicos.
10) La edad de los equinos en el Huila se distribuyen normalmente con una edad media de 6
años y una desviación estándar de 0.5 año.¿ Que porcentajes de equinos tienen una edad entre
5 y 6.1 años?
11) La longitud de los tornillos que produce una maquina se distribuye normalmente, con un
diámetro promedio de 13.0 mm y una varianza de 0.01 mm2. Determinar la probabilidad de que
un tornillo elegido al azar tenga un diámetro entre 12.8 mm y 13.3 mm ?
12).El salario mensual de los administradores de empresas se distribuye normalmente con un
salario promedio mensual de 1500 Euros. El 3.44 % de administradores de empresas son
superiores a 1510 Euros. Cuál es la desviación estándar ?
13).La edad de los ingenieros industriales se distribuye normalmente con edad media de 35
años y una varianza de 9 años2.
a) Que porcentajes de ingenieros industriales tienen más de 41 años.
b) Que porcentajes de ingenieros industriales tienen entre 32 y 39 años.
14) La vida útil de las llantas panteras se distribuye normalmente con una duración media de
28000 kilómetros y una desviación estándar de 3000 kilómetros. Si la fábrica no desea
reemplazar más del 4.85% de las llantas vendidas, ¿ qué tiempo de garantía debe ofrecer?.
15) El tiempo de tramitar papeles para la legalización de un vehículo en las oficinas de tránsito
en un departamento de Colombia se distribuye normalmente con una media de 5 horas y una
desviación de 1 hora. Determinar el porcentaje de legalizaciones que duran:
a) más de 7 horas b) menos de 4 horas
c) A lo máximo 3 horas d) Mas de 3.5 horas.
16) El tiempo que utilizan para graduarse como profesionales en cierta universidad se distribuye
normalmente con una media de 6 años y una desviación estándar de 1 año.
a) Que porcentajes de estudiantes de la universidad duran a lo máximo 7 años para
graduarse.
b) Que porcentajes de estudiantes de la universidad duran por lo mínimo 6.5 años para
graduarse.
c) Que porcentajes de estudiantes de la universidad duran entre 6 y 8 años para graduarse.
d) Que porcentajes de estudiantes de la universidad duran entre 5 y 7.5 años para graduarse.
e) Cuanto tiempo dura en graduarse el 14.92% de los estudiantes de más bajo rendimiento
académico.
f) Cuanto t tiempo dura en graduarse el 9.01% de los estudiantes de mejor rendimiento
académico.
17). Cierto restaurante de la ciudad, la distribución de los almuerzo diario que vende es
aproximadamente de forma normal con un promedio diario de 200 almuerzo y una desviación
estándar de 10 almuerzo. Para cualquier día especifico cuantos almuerzo debe hacer el
restaurante de manera que la probabilidad de quedarse sin almuerzos sea menor al 0.05.

28
II. ALGUNAS DISTRIBUCIONES MUESTRALES

COMPETENCIAS

 Diferenciar los conceptos de parámetros y estadística.


 Fundamentar teóricamente el método inductivo a través de las distribuciones muéstrales

El campo de la inferencia estadística trata básicamente de generalizaciones y predicciones con base


a muestra aleatorias. Los conceptos generales del análisis de datos (media aritmética, mediana,
moda, varianza, desviación estándar, etc.) y la probabilidad son técnicas estadísticas que se
utilizan en esta sección .
29
Las distribuciones muéstrales es una teoría que sirve para dar un soporte matemático a los
métodos estadísticos de la estadística inferencial, temas que se tratan en los capítulos siguientes. A
continuación se definen algunos conceptos básicos:

POBLACION: Es la totalidad de valores posibles (mediciones o conteos) de una característica


particular en un grupo específico de personas u objetos.

PARAMETRO: Medida estadística calculada a partir de una población (figura 2.1.).

ESTADISTICA: Medida estadística calculada a partir de una muestra.

Figura 2.1 . Parámetro y estadística

MUESTRA.

Una muestra es una parte de la población. Se denomina muestra aleatoria a elementos que
conforman la muestra y han sido seleccionados al azar.

DISTRIBUCION MUESTRAL

Es la distribución de todos los valores posibles que pueden ser tomados por alguna estadística
calculadas a partir de muestras del mismo tamaño extraída aleatoriamente de la misma población.

30
Por lo general se tiene interés de conocer tres aspectos de la distribución muestral; la media, la
varianza y la forma funcional (gráfica).

Empíricamente puede construirse distribuciones muéstrales cuando la población es finita discreta.


Para construir una distribución muestral se procede como sigue:

a) De una población finita discreta de tamaño N, se extrae aleatoriamente todas las muestras
posibles de tamaño n.
b) Calcular la estadística de interés para cada muestra.
c) En una tabla se ubica los valores posibles que toma la estadística con el correspondiente valor
en que se repite el valor.

En la siguiente sección, se tratan algunas distribuciones muéstrales.

2.1. DISTRIBUCION MUESTRAL DE LA MEDIA

Dada una población distribuida normalmente con media  y varianza 2, la distribución muestral de
la media se distribuirá aproximadamente en forma normal con media 
x =µ y varianza


  2

n
x

NOTA: a la raíz cuadrada de  2


x
se le denomina el error estándar de la media, es decir:


 
n
x

Para construir empíricamente la distribución muestral de la media para una población finita,
seleccionan aleatoriamente muestras de tamaño dos y con sustitución para probar la definición de
distribución muestral de la media:

Supongan que se tiene la siguiente población : 2, 4, 6, 8, 10. La media poblacional 


 = X/N = 6 y la varianza poblacional

 
2 (X  )
2

8
N
Las anteriores medidas son los llamados parámetros. Los Pasos a seguir para calcular la
distribución muestral.
 Determinar todas las muestras posibles de tamaño 2 en la población, los datos se
presentan en la tabla 2.1.
 Calcular la estadística de interés, para nuestro caso la media aritmética.

31
x
x i

n
Los valores de las medias para cada muestra se presentan en la tabla 2.2.

 Calcular la distribución muestral de la media

Tabla 2.1. Muestras posibles de la población y medias muéstrales

Primera Segunda extracción


extracción 2 4 6 8 10
2 (2,2) (2,4) (2,6) (2,8) (2,10)
[2] [3] [4] [5] [6]
4 (4,2) (4,4) (4,6) (4,8) (4,10)
[3] [4] [5] [6] [7]
6 (6,2) (6,4) (6.6) (6,8) (6,10)
[4] [5] [6] [7] [8]
8 (8,2) (8,4) (8,6) (8,8) (8,10)
[5] [6] [7] [8] [9]
10 (10,2) (10,4) (10,6) (10,8) (10,10)
[6] [7] [8] [9] [10]

Tabla 2.2. Distribución muestral de la media

X x P( X  x )
i i
2 1/25
3 2/25
4 3/25
5 4/25
6 5/25
7 4/25
8 3/25
9 2/25
10 1/25
Total 1
 Calcular la distribución muestral de la media.

32
  x p ( X  x )  2(1/25)+3(2/25)+4(3/25)+5(4/25)+6(5/25)+7(4/25)+8(3/25)+
x i i

9(2/25)+ 10(1/25) = 150/25 = 6   


x
Entonces la media poblacional es igual a la media muestral. Veamos ahora que pasa con la varianza
de distribución muestral de la media:

  EX 2
x
- 2
 2

Dónde: E X 2
 x i
2
* PX  x  i
 x2  40 - 36  4
Como se puede observar la varianza poblacional es diferente a la varianza muestral ( 8  4 ), pero
sí aplicamos la definición de la varianza poblacional de la distribución muestral de la media.

2 8
x  2
 4
n 2
Ahora hay que determinar si la distribución muestral de la media es normal. Un método aproximado
es el gráfico ( figura 2.2.) y se observa que presenta una tendencia normal.

NOTA: Cuando se muestrea sin reemplazo de una población finita, la distribución muestral de la
N n2
media tendrá :como media x   y varianza x 
2
.
N 1 n

33
N n
El factor se llama corrección por población finita y puede ignorarse cuando el tamaño de
N 1
la muestra es pequeño en comparación con el tamaño de la población.

A la raíz cuadrada de la varianza de las medias se denomina el error de muestreo debido a la media

y se nota x. x 
n
Ahora la pregunta es: ¿qué pasa sí la población no se distribuye normalmente ?. Debe utilizarse el
teorema del límite central.

2.1.1. TEOREMA DEL LIMITE CENTRAL

" Dada una población de cualquier forma funcional con media  y varianza 2, la distribución
muestral de la media, se distribuirá aproximadamente en forma normal con media x =  y
varianza 2 x /n, siempre y cuando el tamaño de la muestra sea grande ( n > 30 ) ".

Ejercicio. Cierta marca de bombillo tiene una duración media de 21000 horas con una desviación
estándar de 800 horas. Suponiendo que el tiempo de duración de los bombillos está distribuido
normalmente, ¿cuál es la probabilidad de que la duración media de 64 bombillos sea inferior a
20900 horas ?.

Solución: Se sabe que la muestra bajo en consideración es una de las muestras posibles de tamaño
64 que puede extraerse de la población y X = tiempo de duración de las bombillas se
distribuye normalmente (figura 2.3) entonces:

Figura 2.3. tiempo de duración de las bombillas

Aplicando la definición de distribución muestral de la media, entonces x = 21000 y


 800
x = --= ----= 100
n 64

Gráficamente (figura 2.4.) la distribución muestral de la media es:


34
Figura 2.4. Distribución muestral del tiempo promedio de duración de las bombillas

El área sombreada es la P(x < 20900). Estandarizando la distribución muestral de la media

X-  20900  21000 


Z P( X  20900)  P Z    PZ  1
  1000 
Gráficamente (figura 2.5.) el cambio de variable se presenta a continuación :

Figura 2.5. Cambio de variable de la distribución muestral del tiempo promedio de


duración de las bombillas

Para hallar la P( Z < -1 ) se utiliza la tabla II del apéndice: P( Z < -1 ) = 0.5 - P( 0 < Z < -1 )
P( P(Z < -1 ) = 0.5- 0.3413 = 0.1587.

Ejercicio propuesto: Para el ejercicio anterior calcular la probabilidad de que la duración media de
las 64 bombillas sean: a) superior a 22550 horas b) inferior a 22410 horas c) estén entre 20500
y 21135 horas d) estén entre 19590 y 20980 horas.

2.2. DISTRIBUCION MUESTRAL DE LA PROPORCION P.

" Dada una población distribuida binomialmente con media P y varianza PQ, entonces la
distribución muestral de la proporción se distribuirá aproximadamente en forma normal con media
PQ
p  P y varianza  p
2
 siempre y cuando el tamaño de la muestra sea grande".
n
Nota a la raíz cuadrada de  p2 se le denomina el error estándar de la proporción y es:
35
PQ
p 
n
Ejercicio. Es sabido que el 64% de los votantes inscritos en cierto distrito electoral apoyan al
partido A. ¿Cuál es la probabilidad de que en una muestra aleatoria de 100 votantes en ese distrito
de una proporción de simpatizantes del partido A superior al 0.60 ?

Solución: Como la población es de forma binomial (simpatizante o no ) y la muestra es grande, hay


que aplicar la definición de distribución muestral de la proporción. Los datos dados en el problema
son: P = 0.64 y Q = 0.36, entonces, por definición:
PQ 0.64 * 0.36
p = P = 0.64 y  p  p   0.048 , entonces gráficamente es la figura 2.6
n 100

Figura 2.6. Distribución muestral de la proporción

La probabilidad de la proporción solicitada es: P( p > 0.6 ) = ? El área solicitada se encuentra


sombreada en la gráfica anterior. Para encontrar la probabilidad debemos estandarizar la variable
p-P
utilizando el siguiente cambio de variable Z . A continuación se realiza el proceso:
p
P( p > 0.6 ) = P ( Z > 0.6 - 0.64/0.048) = P(Z>0.20). Utilizando la tabla II del apéndice se tiene:

P(Z>0.20)= 0.5 + P ( 0 < Z < 0.20)= 0.5 + 0.0793 = 0.5793

Ejercicios propuesto.

El propietario de la cafetería de la Universidad Surcolombiana sabe que el 20% de los estudiantes


utilizan la cafetería. ¿ Cuál es la probabilidad de que en una muestra aleatoria de 150 estudiantes
de un porcentaje: a) superior al 18% estudiantes que utilizan el servicio ? b) inferior al 22%
estudiantes que utilizan el servicio ? c) entre el 18.5% y el 19.5% de estudiantes que utilizan el
servicio ? d) entre 19.2% y el 23.6% de estudiantes que utilizan el servicio ?.

EJERCICIOS
1) En el banco del Sol, la cuenta media es de $ 25.000 con una desviación estándar de $ 1.000. ¿
Cuál es la probabilidad de que un grupo de 500 cuentas elegidas al azar tenga:

36
a) un deposito medio entre $ 24.900 y $ 25.050 ?.
B) un deposito medio mayor de $24.850 ?.
C) un deposito medio menor de $ 25.075 ?.
2) Se ha demostrado por reclamos que se han hecho que el 20% de las encomiendas llegan
averiadas al utilizar una Cía. de transporte intermunicipal. ¿ Cuál es la probabilidad al enviar 63
encomiendas de un porcentaje del 25% o menos de encomiendas averiadas ?.
3) Si los pesos individuales de las personas que viajan en la empresa de transporte El Rápido se
distribuyen normalmente con un peso medio de 70 kilos y una desviación estándar de 3 kilos. ¿
Cuál es la probabilidad de que un bus de esa empresa con 25 pasajeros tenga un peso promedio
por pasajero mayor de 75 kilos?.
4) Se toma una muestra aleatoria de 200 unidades producidas en una hora por una máquina, ¿
Cuál es la probabilidad de que 16% o menos resulten defectuosas ?, sí se sabe que el 10% de las
unidades producidas en la muestra por la máquina son defectuosas.
5) El 25% de los alumnos de una facultad habilitan para la aprobación de un curso. ¿ Cuál es la
probabilidad en un grupo de 36 estudiantes, 8 o menos habiliten para la aprobación del curso ?.
6) El promedio de compra por cliente en cierta tienda es de $ 12000 con una desviación estándar
de $5500. Si se toma una muestra de tamaño 36, ¿ cuál es la probabilidad :
a) de que la media de la muestra sea superior a $ 13500 ?.
b) de que sea superior a $ 13200 e inferior a $ 11550 ?.
7) En las fábricas grandes de computadores la media de los salarios es de 1050 Euros, con una
desviación estándar de 250 Euros. Seleccionan al azar 35 empleados
a) ¿Cuál es la probabilidad de que tengan un salario promedio inferior 1000 Euros?
b) ¿Cuál es la probabilidad de que tengan un salario promedio entre 1025 y 1078 Euros?
8) Como director de pesos y medidas visito una planta de empacado que enlata de fríjol, para
verificar que el peso neto de las latas sea el indicado . El gerente de la planta me asegura que el
peso promedio de las latas es de 700 gramos con una desviación de 5 gramos. Selecciono al azar
81 latas ¿qué tan probable es tener un peso promedio inferior de 695 gramos?
9) La verdadera proporción de los componentes defectuosos fabricadas por una empresa es de
0.04 . Encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga:
a) Menos del 3.2 % de los componentes defectuosos.
b) Más del 1.2% pero menos del 4.9% de partes defectuosas.
10) ¿ Las siguientes afirmaciones son falsas o verdaderas?
 El parámetro es una medida estadística calculada a partir de una muestra
 Una estadística es una medida estadística calculada a partir de una muestra
 El error estándar de estimación es una medida de variación entre todas las muestras posibles
del mismo tamaño extraída aleatoriamente de una misma población.
 Un error estándar de estimación pequeño significa que la muestra es representativa para la
población.
11) El capital de las empresas agropecuarias en un país se distribuye normalmente con una media
de 800000 euros y una desviación estándar de 50000. Si seleccionan un muestra aleatoria de 60
empresas agropecuarias, cual es la probabilidad de que tengan un capital medio : a) superior a los

37
802000 euros b) inferior a los 796000 euros c) mayor a los 797000 euros d) entre 802000
euros y 804000 euros e) entre 797000 euros y 804000 euros .
12) Una empresa compra termos de cristal y algunos de ellos tienen imperfectos. En un día
especifico compra una lote de termos de cristal y se sabe que el 4.58% de los termos de cristal
tienen imperfectos. Cuál es la probabilidad de que una muestra aleatoria de 90 termos de cristal
hayan : a) más de 5% de termos de cristal con imperfectos? b)menos de 5% los termos de cristal
con imperfectos c)Entre el 3.5% y 6.3% de termos de cristal con imperfectos d)Entre el 5% y el
6.2% de termos de cristal con imperfectos.

13) Para qué sirve el error estándar de estimación   :a) Para medir las variaciones de la
 X 
variable. b) Para determinar si la población es homogénea. c) Para medir las variaciones entre las
muestras del mismo tamaño. d) Ninguna de las anteriores.
a) una variable aleatoria o regla de como estimar el parámetro de la población.
b) Una medida estadística calculada a partir de una población.
c) Un medida estadística calculada a partir de una muestra.
d) es el valor numérico que obtenemos con una muestra.
e) Ninguna de las anteriores.

15) El error estándar de estimación sirve: a). Para medir las variaciones de las variables. b) Para
determinar si la población es homogénea. c) Para medir las variaciones entre las muestras del
mismo tamaño. d) Ninguna de las anteriores.

16) Soy el gerente de una multinacional y afirmo que los obreros de la empresa se encuentran
bien pagos ya que tienen un salario promedio quincenal de 650 dólares. Para probar que los
obreros están mal pagos con una confiabilidad del 95% selecciono una muestra aleatoria de 15
obreros y obtengo un salario quincenales promedio de 649 dólares y una desviación estándar de
30 dólares. Para solucionar este problema debo calcular: a) Un mínimo para la media poblacional
b) Un máximo para la media poblacional c) Un intervalo de confianza completo para la media
poblacional d) Un mínimo para la proporción poblacional e) Un máximo para la proporción
poblacional f) Un intervalo de confianza completo para la proporción poblacional.
17) El propietario de la fábrica de bicicletas EL Radial quiere determinar por intervalo de confianza
con una confiabilidad del 90%, el porcentaje de ciclistas que utilizan esta marca en cierto
departamento de Colombia. Selecciono al alzar 250 propietarios de bicicletas y se aplicó una
encuesta donde preguntaba si compran esta marca de bicicleta. De las 250 personas entrevistadas
150 afirman que sí lo utilizan.

38
III. ESTIMACION

COMPETENCIAS

 Pronosticar parámetros por el método de intervalos de confianza, tomando como base la


muestra aleatoria.
 Aprender las ventajas y desventajas que existen entre las estimaciones puntuales y las
estimaciones por intervalo de confianza.

En este capítulo se explican algunos métodos estadísticos para tomar decisiones acerca de un gran
volumen de datos, examinando una pequeña parte de ellos (muestra).

En la estadística inferencial existen dos métodos para tomar decisiones: estimación y la prueba
de hipótesis.

39
3.1. CONCEPTOS GENERALES DE ESTIMACION

La estimación es una de las dos áreas generales de la inferencia estadística. La segunda se


denomina prueba de hipótesis. A continuación se definirán algunos conceptos fundamentales:

PARAMETRO: medida estadística calculada a partir de una población.

ESTIMACION ESTADISTICA: es el proceso mediante el cuál intentamos determinar el valor de


un parámetro de la población.

ESTIMACION: es el valor numérico que creemos que tiene el parámetro poblacional.

ESTIMADOR: es una variable aleatoria o regla de como estimar el parámetro de la población.


Algunos estimadores son:

PARAMETRO ESTIMADOR
 n

X
i1
i
X
n

 X  X
2 n
2
i
i 1
S2 
n
σ
S S2

P Casos favorables
p
Total de casos n
Q q  1 p

Existen dos clases de estimaciones: estimación puntual y estimación por intervalo de confianza.

3.1.1. ESTIMACION PUNTUAL

Sí a partir de las observaciones de una muestra aleatoria se calcula un valor como estimación de un
parámetro de población desconocido, el procedimiento se denomina estimación puntual, ya que
utiliza como estimación un solo punto del conjunto de todos los valores posibles del parámetro.
Ejemplo, suponga que en el barrio las Granjas se desea estimar el porcentaje de hogares que
consumen chocolate Neivano y el promedio de barras diarias consumidas de chocolate Neivano .
Para estimar los parámetros ( % y  ), seleccionan aleatoriamente 45 hogares en el barrio a los
cuales se aplicó la encuesta y los resultados son: un 30% de los hogares consumen chocolate
Neivano con un promedio de 3 barras diarias. Concluyó que aproximadamente una tercera parte
de los hogares del barrio las Granjas consumen chocolate Neivano con un promedio diario de tres
barras. En este caso es una estimación puntual.

Para realizar estimaciones puntuales se debe tener en cuenta las propiedades de un "buen
estimador".
40
3.2. ESTIMACION POR INTERVALO DE CONFIANZA.

La estimación por intervalo de confianza consiste en dos valores numéricos que con grados de
confianza se considera que incluye el parámetro que está estimando.

La forma general del intervalo de confianza es :

P ( - K <  < - K ) = 1 -


límite inferior límite superior

Donde: = Parámetro.  = Estimador del parámetro. K = Coeficiente de confianza.


 = error estándar del estimador. 1 - = probabilidad de la confiabilidad.

Interpretación:"con una confiabilidad del (1- )% el parámetro  esta entre (-K ) y (+K ).

3.2.1. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL ()

Para determinar los intervalos de confianza para la media poblacional hay que observar si la
población se distribuye normalmente o si la muestra es pequeña.

3.2.1.1. EL INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL,


CUANDO LA POBLACIÓN SE DISTRIBUYE NORMALMENTE O LA MUESTRA ES
GRANDE (n  30):

PX  Zσ X   . X  Zσ X   1  α
Donde:
S
x   = Promedio poblacional.  x = Error estándar de la media
n
Z = Percentil de la distribución normal X = Promedio de la muestra (1 - )% = Confiabilidad.

Para calcular un minino o máximo las formulas adecuadas son:

PX  Z X X   1   Mínimo PX  Z X   1   Máximo

Ejemplo. Estimar por intervalo de confianza (95%) el salario promedio mensual de un auxiliar
contable en el país A. Una muestra aleatoria de 256 auxiliares contables del país A, presentó un
salario promedio mensual de $843542 con una desviación estándar de $20500.

Solución: Como solicita el intervalo para salario promedio mensual de un auxiliar contable, no se
sabe como se distribuye la población y la muestra es mayor de 30, debe utilizar el siguiente
intervalo:

PX  Zσ X   . X  Zσ X   1  α
41
S
Donde: x   = Promedio poblacional.  x = Error estándar de la media
n
Z = Percentil de la distribución normal X = Promedio de la muestra (1 - )% = Confiabilidad.

Entonces: X = $843542 S = $20500 Z= 1.96 ( tabla de la distribución normal estándar).


S 20500
x    1281 .25
n 256
El Intervalo de confianza:

(843542 - 1.96 [1281.25) <  <843542 + 1.96 [1281.25])  (841030,75 <  < 846053.25)

Interpretación: Con una confiabilidad del 95%, el ingreso promedio mensual del auxiliar contable
del país A, están entre $841030,75 y $846053,25).

3.2.1. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIÓNAL (),


MUESTRA PEQUEÑA (n ˂ 30).

El intervalo de confianza para la media poblacional, cuando la población se distribuye normalmente


y la muestra es pequeña (n<30).

PX  t α ,n 1σ X μ. .X  t α ,n 1σ X   1  α

S
Donde: x   = Promedio poblacional.
n
 x = Error estándar de la media X = Promedio de la muestra

(1 - )% = Confiabilidad. t(),(n-1) = Percentil de la distribución t-Students (tabla III)

Para calcular un mínimo o máximo las fórmulas adecuadas son:

PX  t , n1 X ..   1   Mínimo

P.. X  t     , n 1 X
  1 Máximo
Nota: la distribución t-student tiene características similares a la distribución normal estándar se
utiliza para muestras pequeñas (n ˂ 30) y no se conoce la varianza. La media de la distribución t-
student es cero y las varianzas son mayores que 1 (grafico 3.1).
Ejemplo. Estimar por intervalo de confianza con una confiabilidad del 95%, los gastos promedios
mensuales (en millones de pesos) en publicidad de las empresas textiles del país A. Una muestra
aleatoria de 15 empresas textiles presentan los siguientes gastos mensuales en publicidad: 3.4 2.8
4.4 2.5 3.3 4.0 4.8 2.9 5.6 5.2 3.7 3.0 3.6 4.8 4.9 . Suponga que los gastos mensuales en
42
publicidad de las empresas textiles del país A, se distribuyen aproximadamente en forma normal.

Grafico 3.1. Distribución t student.

Solución: Como la muestra es menor que 30 y la población se distribuye normalmente, al estimar el


gasto promedio mensual de publicidad de las empresas textiles del país A, utilizar el siguiente
intervalo:

PX  t α ,n 1σ X μ. .X  t α ,n 1σ X   1  α


S
Donde: x   = Gasto Promedio en publicidad de las empresas textiles.
n
 x = Error estándar de la media t(),(n-1) = Percentil de la distribución t-student’s (tabla III)

X = promedio de gastos de publicidad en la muestra 1 -  = confiabilidad.


S 0.97
De acuerdo a los datos la X = 3.93 , S = 0.97 y x  x   0.25
n 15
Por definición 1 - = 0.95, entonces = 1 - 0.95 = 0.05.

Utilizando otra familiar de la distribución normal, la distribución t - Student (tabla III . t-Student en
el apéndice III ), la cual es utilizada cuando no se conoce la varianza poblacional y la muestras son
pequeñas (n < 30 ). La distribución t-Student depende de dos parámetros; confiabilidad (1-) y el
tamaño de la muestra (n-1), es decir, t(),(n-1). Donde ( 1 -  ) = 0.95. Entonces despejando alfa
 = 0.05. Luego se busca t(/),(n-1). = t(0.05),(15-1). = t(0.05),(14). = 2.1448 (valor tabla a dos colas )

Nota. Cuando el intervalo es completo la tabla t.student , se maneja de la siguiente forma:

- Buscar el título donde dice dos colas


- En la primera columna buscar (n-1) en nuestro caso es 14
- En la primera fila buscar alfa. En este caso alfa=0.05.
- El valor de t es la intersección entre la fila y la columna, es decir 2.1448.

Reemplazando el intervalo

PX  t α ,n1σ X μ. .X  t α ,n1σ X   1  α


43
(3.93 - 2.1448 [0.25]) <  < 3.93 + 2.1448 [0.25]) (3.39 <  < 4.47 )

Interpretación: Con una confiabilidad del 95% el gasto promedio mensual en publicidad de las
empresas textiles del país A, están entre $3.390.000 y $4.470.000.

3.3. ESTIMACION POR INTERVALO DE CONFIANZA PARA LA


PROPORCIÓN POBLACIÓNAL P (muestras grandes).

Pp  Zσ p μ .p  Zσ p   1  α

No. de éxitos
Donde: p 
pq p
n n
q 1 p
Ejemplo. un fabricante de jabón desea saber la preferencia del jabón de marca H. Una muestra
seleccionada al azar de 100 amas de casa en un municipio, les pregunta sí prefieren el jabón de
marca H, y 20 afirma que si lo prefieren. Determine el intervalo de confianza del 95% para la
verdadera proporción (%) de amas de casa del municipio.

Solución: Como solicitan estimar el intervalo de confianza para la proporción poblacional,


entonces:

Pp  Zσ p μ .p  Zσ p   1  α
amas de casa que prefieren el jabón de marca H
p
n
No. de éxitos 20
Entonces p   0,2 q = 1 – p = 1 – 0.2 =0.8
n 100

pq 0 . 2 * 0 .8
p    0.04
n 100

Z = Percentil de la distribución normal, entonces Z= 1.96 (ver tabla II )

Reemplazando el intervalo, (0.2 - 1.96 [0.04] < P < 0.2 + 1.96 [0.04])

44
(0.1216 < P < 0.2784)  (12,16 < % < 27,84)

Interpretación: con una confiabilidad del 95%, el porcentaje de amas de casa que prefieren el
jabón H esta entre 12,16% y 27,84%

EJERCICIOS

1. Un distribuidor de acetona mantiene registros minuciosos sobre algunas operaciones con sus
clientes. El quiere estimar por intervalo de confianza las ventas promedios de acetona (en galones)
por clientes. Toma una muestra aleatoria de 18 registros, indica que las ventas promedio es de
63.84 galones con una desviación estándar de 2.75 galones. Asuma una confiabilidad del 99%.
Suponga normalidad.
a) Determine la venta promedio mínima por cliente. b) Determine la venta promedio máxima por
cliente.
2. La vida útil de un micromotor de marca A se distribuye normalmente. Realice una estimación por
intervalo de confianza (95%) para la vida útil media de los micromotores de marca A. Al
Seleccionar una muestra aleatoria de 50 propietarios de micromotores de marca A presentan una
vida útil media de 15 años con una varianza de 4 años2.
3. El propietario del lápiz marca Raya quiere lanzar el producto en cierto departamento de
Colombia. Para tomar la decisión si lo comercializa define el siguiente criterio: "debe utilizarlo como
mínimo el 20% de los habitantes del departamento". El propietario le adjudica al jefe de compras
de la empresa esta tarea. Para ello seleccionó 250 personas del departamento y aplicó una
encuesta donde les preguntaba si utilizarían esta marca de lápiz. De las 250 personas entrevistadas
100 afirman que sí lo utilizan, 140 no lo utilizan y 10 no responden. Asuma una confiabilidad del
90%.¿ De acuerdo a esta información que recomendación le haría al propietario de la empresa
Raya?.
4. Una investigación efectuada a 400 familias de clase media en el Huila, reveló que en la
realización de fiestas familiares, un 92% preferían aguardiente DOBLE ANIS a cualquier otra clase
de licor. Calcule por intervalo de confianza el porcentaje de familias de clase media del Huila que
utilizan el aguardiente Doble Anís para las fiestas (confiabilidad 95%).
5. En los últimos 9 días una planta de productos químicos ha producido un promedio de 541
toneladas diarias de cierto producto químico. Por experiencia pasada, el gerente de la planta sabe
que la varianza es de 69.5. Construya un intervalo de confianza del 99% para la producción media
diaria de la empresa química.
6. El director de una empresa desea construir un intervalo de confianza para el porcentaje de
empleados que llegan tarde al trabajo. Selecciona una muestra aleatoria de 220 empleados y 175
llegan a tiempo en un día específico. Confiabilidad del 90%.
7. Estoy pensando adquirir un lote de cierto artículo deportivo. Me han informado otros empresarios
que dicha marca deportiva presenta gran cantidad de artículos defectuosos. Para tomar la decisión
45
de comprarlo asumo el siguiente criterio: "sí un lote tiene más de 2% de artículos defectuosos no
acepta el lote y por consiguiente no adquiere el producto". Toma una muestra aleatoria de 320
artículos y 4 de ellos son defectuosos. ¿Compro los artículos deportivos?. Confiabilidad del 95%.
8. El Presidente de un banco desea construir un intervalo de confianza para el porcentaje máximo
de empleados que llegan a tiempo al banco. Selecciona una muestra aleatoria de 330 empleados y
175 llegan a tiempo en un día específico. Confiabilidad del 90%.
9. Una empresa fabrica focos, afirma que la duración media de los focos es 782 horas y está
distribuida normalmente. Para probar esta afirmación selecciona una muestra de 25 focos y
obtiene una vida media de 780 horas, con una varianza de 40 horas². Confiabilidad 95%.
10. Para estimar por intervalo de confianza el número promedio de errores en los libros diarios de
las empresas de Neiva, usted selecciona 14 libros y encontró los siguiente errores por libro: 6, 8, 4,
6, 7, 9, 5, 7, 6, 7, 8, 9, 7, 5. Confiabilidad 90%
11. Determinen por intervalo de confianza el porcentaje de sucursales del banco en Colombia que
no cuentan con cajeros automáticos. Selecciona una muestra aleatoria de 45 de sucursales del
banco y 35 de ellos cuentan con cajeros automáticos. confiabilidad 90%.
12. Un administrador de empresas quiere estimar por intervalo de confianza el gasto promedio
mensual de los aficionados al fútbol en un departamentos de Colombia, con una confiabilidad del
95%. Selecciona una muestra aleatoria de 12 aficionados al fútbol y obtiene los siguientes gastos
promedios mensuales (dólares): 840 870 860 820 900 750 765 768
770 750 705 712.
13. El ingeniero Roberto Torres está interesado en conocer el consumo medio mensual de
cigarrillos de los estudiantes universitarios, con una confiabilidad del 96%. Selecciona una muestra
aleatoria de 650 estudiantes universitarios y obtiene un consumo medio mensual de 10 cigarrillos
con una desviación estándar de 2 cigarrillos mensuales.

14. En una muestra aleatoria de 700 personas mayores de 18 años en una gran ciudad, se obtuvo
que 200 apoyan al candidato Filomeno Rojas para la alcaldía. Halle, con un nivel de confianza del
92%, un intervalo de confianza que permita estimar la proporción de votantes que apoyan al
candidato Filomeno Rojas en esa ciudad.

15. En una encuesta realizada a 1200 mujeres adultas de una población se encontró que 810 de
ellas son amas de casa actualmente. Construya con estos datos un intervalo de confianza, con un
nivel del 95%, para la proporción de mujeres que son amas de casa actualmente en esa población.

16. Una universidad quiere estimar por intervalo de confianza la proporción de hogares con
conexión a Internet en una gran ciudad, con una confiabilidad del 93%. seleccionan al azar 455
hogares y 236 cuentan con conexión a Internet. Como estudiante de esta universidad me solicitan
calcular el intervalo de confianza con esta información.

17. Se quiere estimar la duración media de los bombillos marca Brillo, con una confiabilidad del
95%. Se toma una muestra aleatoria de 20 focos, la cual resulta tener una duración promedio de
2200 horas y una desviación estándar de 40 horas. a)Construya un intervalo de confianza la
duración media de los bombillos marca Brillo. b) Construya un límite inferior de confianza la
duración media de los bombillos marca Brillo.

46
IV. DISEÑO DE LA MUESTRA

COMPETENCIAS

 Aprender a determinar el tamaño de la muestra para cualquier nivel de precisión.


 Aplicar el tipo de muestreo adecuado en una población.

Estamos acostumbrados a sacar conclusiones acerca de una gran población basando en una
muestra pequeña, por ejemplo en el periódico durante la semana leemos resultados sobre la
opinión que tienen los colombianos acerca de un político o sobre la gestión del presidente de la
república entrevistando solamente unos cuantos individuos (muestra). Al trabajar con una muestra
y no con una población se disminuyen; costos, tiempo y errores de recolección de información.

47
Para determinar el tamaño de la muestra debe tener en cuenta; la característica del estudio, las
variables, los costos y el tiempo requerido para la investigación. Los factores anteriores determinan
el tipo de muestreo a utilizar.
Existen dos grandes tipos de muestreo: muestreo probabilístico y el muestreo no probabilístico.

4.1. MUESTREO NO PROBABILISTICO

El muestreo no probabilístico consiste en diseños en los cuales no se tiene en cuenta la teoría de la


probabilidad. El uso de este tipo de muestreo es muy popular en mercadotecnia y la desventaja es
que no garantizan el tamaño de error que se está cometiendo al realizar las estimaciones. Algunos
tipos de muestreo no probabilísticos son: muestreo de conveniencia, muestreo de juicio, muestreo
por cuotas, etc.

4.1.1. MUESTREO POR CONVENIENCIA

La muestra se selecciona de acuerdo a la conveniencia del investigador. Algunos ejemplos son:


 Solicitar la opinión de las personas que transitan en el centro comercial Metropolitano.
 Entrevistar los clientes en un supermercado para evaluar la preferencia del pan Bamby
 Solicitar a algunas personas que colaboren voluntariamente para probar un producto, por
ejemplo, el aguardiente .
Los anteriores ejemplos no se pueden proyectar a toda la población porque no todas las personas
tienen la oportunidad de ser seleccionados.
Este tipo de muestreo se puede aplicar en una etapa exploratoria de la investigación como base
para generar hipótesis, y para estudios concluyentes en los cuales el gerente desea aceptar el
riesgo de los resultados del estudio.

4.1.2. MUESTREO DE JUICIO O A PROPOSITO

El muestreo a juicio se utiliza cuando el investigador conoce la población y el define la muestra en


la población porque cree que es la representativa para la población. Ejemplo a lanzar un nuevo
producto el mercadotecnita escoge en que ciudades pone a prueba la posible venta del producto.

4.1.3. MUESTREO POR CUOTAS

Es un caso especial del muestreo de juicios. Por ejemplo el investigador define una o más variables
de control para seleccionar la muestra. Una variable de control en una investigación puede ser la
edad, el sexo, etc. Entonces el investigador define con criterio propio cuantas personas va a
encuestar en un grupo de edad determinado y a cuantas de sexo masculino.

4.2. MUESTREO PROBABILISTICO

El muestreo probabilístico tiene como base la teoría de la probabilidad, por consiguiente, tiene
soporte matemático. Un muestreos es probabilístico cuando todos los miembros de la población
tienen una probabilidad conocida de ser incluido en la muestra.

Algunos tipos de muestreo son: Muestreo aleatorio simple (con o sin reemplazamiento),
48
muestreo aleatorio estratificado, muestreo aleatorio por conglomerado, muestreo sistemático, etc.

¿ Cuándo hay que utilizar una muestra ?

 Cuando la población es infinita o demasiado grande.


 Cuando el proceso de medida o investigación de la característica de cada
elemento sea destructivo, como ocurre al consumir un artículo para juzgar la calidad
(degustación).
 Por economía, es decir, al examinar todos los elementos, se recurre a unos cuantos
reduciendo los costos de la investigación.
 Por tiempo.

Cuando hay que efectuar un muestreo, es importante definir la unidad de muestreo y se define
como la persona u objeto a la que se aplica la encuesta o se le realiza la observación. Por ejemplo,
si van a determinar el perfil del consumidor de la chocolatina El Meloso en Neiva, entonces la
unidad de muestreo es la persona entre siete y 50 años en el municipio de Neiva.

A continuación se presentan algunos diseños de muestras, en el cual se determinan; los


estimadores, errores de muestreo y tamaño de la muestra.

4.2.1. MUESTREO ALEATORIO SIMPLE

"Consiste en seleccionar n elementos de la población de tamaño N, de modo que todos los


elementos que conforman la población tienen la misma posibilidad de conformar la muestra".

¿Cuándo se debe utilizar el muestreo aleatorio simple?.

 Cuando la población es pequeña.


 Población grande pero homogénea.

4.2.1.1. ESTIMADORES Y ERRORES ESTANDAR DE MUESTREO.

 El estimador de la media poblacional µ el error estándar de la media son:

n
 X
i
X i 1
n estimación puntual

PX  K X ....X  K X   1   estimación por intervalos de


confianza

49
S
X  error de muestreo para población infinita
n
N n S
X  error de muestreo para población finita
N n

 El estimador de la proporción poblacional P y el error estándar de la proporción son:

No.de.éxitos
p q 1 p Estimación puntual
n

P p  Z p .... p  Z p   1   Estimación por intervalos de


confianza

PQ
P  error de muestreo para población infinita
n

N  n PQ
P  error de muestreo para población finita
N 1 n

4.2.1.2. TAMAÑO DE LA MUESTRA

Establecidas las características a estimar y prefijados la precisión requerida, hay que decidir cuál va
a ser el tamaño de la muestra o el número de elementos a seleccionar por el procedimiento de
muestreo que va a utilizar, de modo que el resultado no sea en exceso costoso o impreciso. Para
este tipo de muestreo hay utilizar las siguientes fórmulas para determinar el tamaño de la muestra.

NK 2 2
n
Ne 2  K 2 2 Población finita cuando estima la media poblacional.

50
NK 2 PQ
n
N  1e2  K 2 PQ Población finita cuando estima la proporción poblacional.

K 2 2
n Población infinita cuando se estima la media poblacional
e2
K 2 PQ
n Población infinita cuando se estima la proporción poblacional
e2
Donde:

N= tamaño de la población.

n= tamaño de la muestra.

k= percentil de una distribución z o t correspondiente a un nivel de confianza deseado.

e= error máximo admitido en las estimaciones.

 2 =varianza poblacional.
PQ= varianza poblacional.

P = proporción poblacional de los elementos que poseen la característica de estudio.

Q = proporción poblacional de los elementos que NO poseen la característica de estudio.

Q=1-P

Nota: para las formulas anteriores se fija la confiabilidad de que el error máximo admitido no
supere a lo prefijado. El error es de acuerdo a cada investigación y hay que fijarlo de acuerdo a la
característica de la población.

Para determinar el tamaño de la muestra deben seguir los siguientes pasos:

a) Definir el universo o población


b) Contar con un marco poblacional. Consiste en un listado o mapa donde se encuentran
descriptos los elementos de la población ( unidad muestral). Este marco poblacional debe ser
actualizado.
c) Prefijar la confiabilidad (K) y el error máximo admitido (e). El error máximo admitido debe estar
dado en la misma unidad de la variable que va a estimar y en general debe ser menor o igual a
5%.

51
d) tipo de muestreo a utilizar.

e) Como no se conoce la varianza poblacional, debe estimarse. Existen varios métodos para
estimar la varianza poblacional. Algunos de ellos son:

 Sí la variable a sido tratada anteriormente debe utilizar la misma varianza.

 Seleccionar una premuestra aleatoria (muestra piloto) con el fin de estimar la varianza y al
mismo tiempo probar el instrumento de medida (encuesta).

 Algunas veces el contratista prefija la varianza

f) Realizados los pasos anteriores, reemplazar la fórmula del tamaño de la muestra y se obtiene la
muestra definitiva.
g) Aplicando la encuesta a los elementos seleccionados que conforman la muestra debe realizar las
estimaciones, ya sea puntual o por intervalos de confianza.

Ejemplo. El propietario del shampoo Caspin en forma de cojín, desea estimar la comisión
promedio deseada por los distribuidores del producto. Como no cuenta con el dinero y tiempo
necesario para encuestar a todos los distribuidores solicita al investigador de mercados, que con
base a una muestra aleatoria, estime la comisión el promedio solicitada por los distribuidores,
para adicionarla a los costos del producto.

Como criterio para la determinación de la muestra, el propietario fija una confiabilidad del 95%
para un error máximo admitido en la estimación de $4.90 por producto.

Como solicita determinar el tamaño de la muestra el investigador de mercados aplica los pasos de
la página No. 50 y dice:

a) La población para este estudio son 110 distribuidores, correspondiente al mes de febrero del año
2012.
b) El marco poblacional es el listado de los distribuidores generado por la sección de sistemas de la
empresa (tabla 4.1).
c) Confiabilidad del 95% y error máximo admitido de $4.90
d) Como la población es pequeña utilizó un MAS para estimar la comisión promedio solicitada por
los distribuidores.
A continuación presenta la fórmula a utilizar:

NK 2 2
n Población finita cuando estima la media poblacional.
Ne 2  K 2 2
e) Como no conocen la varianza poblacional, la estiman con una premuestra aleatoria de tamaños
8.
Para que sea aleatoria utilizar la tabla de números aleatorios (tabla IV, apéndice) con los
siguientes criterios:
52
Tabla 4.1. Listado de los distribuidores de Shampoo Caspin. 2014
40 CONSTANZA ARTUNDUAGA 80 LINA PEREZ
1 AURELIANO SANCHEZ PEREZ 41 TULIA FIGUEROA H. 81 SILVIA CASTRO
2 CARLOS A. BOHORQUEZ 42 MIREYA BELTRAN 82 HAROLD MANRIQUE
3 DERLY SOLEY PERDOMO 43 MARGOTH RAMIRES S. 83 ALEXI POLANIA
4 ROBINSON QUIMBAYA VANEGAS 44 JIMENA SALAZAR P. 84 DELIA BAHAMON
5 GLORIA HELENA TORRES 45 FERNANDA GUZMAN P. 85 BLANCA SALAS
6 NORMA COSTANZA ARTUNDIAGA N. 46 CONSTANZA ROJAS 86 GLORIA MORERA
7 IMNA FIGUEROA HERNANDEZ 47 LILIANA RAMOS 87 PEDRO CASTYRO
8 SILVIA MIREYA BELTRAN M. 48 YESID MANRIQUE 88 SERGIO MORENO
9 LEILA MARGOTH RAMIREZ S. 49 ALEXIS RUBIANO P. 89 LUCY MOYANO
10 MARIA JIMENA SALAZAR ROA 50 EBELIA CORTES IPUS 90 CARLOS SOTO
11 MARA FERNANDA GUZMAN C. 51 MIRIAM MORALES T. 91 JESUS SANTANDER
12 LINA CONSTANZA ROJAS 52 GLORIA TORA 92 ROSA TRUJILLO
13 SILVIA LILIANA RAMOS G. 53 ROSA ESQUIBEL N. 93 JORGE PAREDES
14 HAROL YESID MANRIQUE 54 JOSE CULMA A. 94 HAROLD CASTRO
15 HERMES ALEXI RUBIANO 55 JASMIN PEDRAZA V. 95 CESAR ROJAS
16 DELIA CORTEZ IPUS 56 AUGUSTO MUÑOS 96 BEATRIZ MARIN
17 BLANCA MIRIAM MORALES 57 ANTONIO CORRALES I. 97 HECTOR PEREZ
18 GLORIA LENID TORO 58 CLAUDIA ROJAS A. 98 OLGA DONATTO
19 PEDRO ESQUIVEL P. 59 WILMER LOPEZ T. 99 RAMON QUINTERO
20 SERGIO JOSE CULMA 60 HAROLD SOLAR 100 LUZ MERY SALAS
21 LUCI JASMIS ARTEHORTUA 61 CESAR VERACRUZ 101 EDGAR ALVAREZ
22 CARLOS AUGUSTO BRAVO 62 BETRIZ REYES 102 CARLOS GUZMAN
23 JESUS ANTONIO CORREA 63 JORGE GONZALEZ 103 AURELIANO ROSAL
24 ROSA CLAUDIA ROJAS 64 OLGA PATRICIA LUCAI 104 CARLOS MARIN
25 WILHEIN YOAKOV LOPEZ 65 RAMON MACIAS 105 DERLY SANCHEZ
26 HAROL SOLORSANO ORDONEZ 66 LUZ MERY DURAN 106 ROBINSON SANCHEZ
27 CANDIDO HERRERA 67 ANIBAL CUELLAR 107 CLAUDIA VANEGAS
28 SILVINA HURTADO 68 JAVIER YELA 108 NORMA TRUJILLO
29 CESAR VERA 69 AURELIANO PEREZ 109 IRNA PEREZ
30 OLGA PATRICIA LUCUARA 70 ALBERTO ROJAS 110 SILVIA LOSADA
31 RAMON DUSSAN MACIAS 71 DERLY SOTIL
32 LUZ MERY LUCUARA 72 ROBINSON QUIMBAYA
33 EDGAR ANIBAL CUELLAR 73 CLAUDIA MARIN
34 CARLOS JAVIER PAPA YELA 74 NORMA PEREA
35 AUREL SALDARRIAGA 75 IRMA FIGUERO H.
36 ALBERTO BOHORQUEZ Z. 76 SILVIA PEDRASA
37 SOLEY PERDOMO 77 LEYLA ROMA
38 ROBIN VANEGAS 78 MARIA ROA
39 HELENA TORRES E. 79 FERNANDA PEREZ
53
Los tres primeros números aleatorios (N.A.) por fila, empezando por el número 04470. Los números
aleatorios seleccionados son: 044, 108, 091, 005, 007, 073, 053, 010, y corresponden a los
siguientes distribuidores (tabla 4.2).

Tabla 4.2. Premuestra distribuidores de Shampoo Caspin. 2014

44. JIMENA SALAZAR P. 7. IMNA FIGUEROA HERNANDEZ

108. NORMA TRUJILLO 73. CLAUDIA MARIN


91. JESUS SANTANDER 53. ROSA ESQUIVEL P.

5. CLAUDIA HELENA TORRES E. 10. MARIA JIMENA SALAZAR ROA

A estos distribuidores, le aplica una encuesta de la premuestra donde le pregunta ¿ sí usted


vendiera el shampoo Caspin en tamaño cojín, ¿cuál es la comisión por la venta?. Los resultados
están en la tabla 4.3.

Tabla 4,3 Premuestra distribuidores de Shampoo Caspin. 2014


NOMBRE COMISION ($)
44. JIMENA SALAZAR P. 180
108. NORMA TRUJILLO 190
91. JESUS SANTANDER 200
5. CLAUDIA HELENA TORRES E. 185
7. IMNA FIGUEROA HERNANDEZ 199
73. CLAUDIA MARIN 184
53. ROSA ESQUIVEL P. 196
10. MARIA JIMENA SALAZAR ROA 193

Entonces S2 = 54.4

f) De acuerdo a los datos:

N = 110 K = t(), (n-1) = t(0.05), (7) = 2.3646

S2 = 54.4 e = 4.9

110 * 2.3646 * 54.4


2
n  11.36  12
110 * 4.9  2.3646 54.4
2 2

La muestra definitiva para estimar la comisión promedio de los distribuidores de la empresa es 12.
g) La premuestra es de 8 distribuidores, agregar cuatro distribuidores escogidos aleatoriamente en
la tabla de números aleatorios (continuando donde terminó el último número aleatorio de la
premuestra 010). Los números aleatorios son: 018 y 035, 077 y 042. La muestra definitiva con las

54
respectivas comisiones están en la tabla 4.4.

Tabla 4.4. Muestra distribuidores de Shampoo Caspin. 2014


44. JIMENA SALAZAR P. 180
108. NORMA TRUJILLO 190
91. JESUS SANTANDER 200
5. CLAUDIA HELENA TORRES E. 185
7. IMNA FIGUEROA HERNANDEZ 199
73. CLAUDIA MARIN 184
53. ROSA ESQUIVEL P. 196
10. MARIA JIMENA SALAZAR ROA 193
18. GLORIA LENID TORO O. 240
35. AUREL SANCHEZ PEREZ 220
77. LEYLA ROMA 218
42. MIREYA BELTRAN 195

Para estimar la comisión promedio deseada por los distribuidores, utilice el siguiente intervalo con
una confiabilidad del 95%:

_ _
P [ X - t(), (n - 1) x <  < X + t(), (n - 1) x ] = 1 - 

Donde:

N n S
X  Población finita
N n
Con la muestra definitiva se obtiene:
_
X = 200 S = 17.57

t(/2), (n - 1) x = t(0.05/2), (12 - 1) x = 2,201

110  12 17.57
X  *  4.51
110 12

Reemplazando el intervalo:

[ 200 - 2.201 * 4.51 <  < 200 - 2.201 * 4.51 ]

[ 190.075 < < 209.927].

Con una confiabilidad del 95% la comisión promedio deseada por los distribuidores de la empresa
para el shampoo Caspin está entre $ 190,08 y $209,93.
55
Ejemplo.
El propietario del shampoo Caspin desea determinar si los distribuidores del producto están
satisfechos con la distribución de los productos. Como no cuenta con el dinero y tiempo necesario
para encuestar a todos los distribuidores, me solicita, que con base a una muestra aleatoria estime
el porcentaje de distribuidores que están satisfechos con la distribución de los productos de la
empresa. Como criterio para la determinación de la muestra, el propietario fija una confiabilidad
del 90% para un error máximo admitido en la estimación del 12%.

Nota: le informo al propietario que el error máximo admitido del 12% no es


aconsejable y debe ser menor igual al 5%. Como respuesta el propietario decide que
este debe ser el error (12%).

Como solicita determinar el tamaño de la muestra realizo los siguientes pasos:

a) La población para este estudio son los 110 distribuidores de la empresa, correspondiente al año
2012.
b) El marco poblacional es el listado de los distribuidores generado por la sección de sistemas de la
empresa (ver tabla 4.1).
c) Confiabilidad del 90% y error máximo admitido de 0.12
d) Como la población es pequeña utilizar un MAS para estimar si está satisfecho con la distribución
de los productos. A continuación se presenta la fórmula a utilizar:

NK 2 PQ
n Población finitas cuando estima la proporción poblacional.
N  1e2  K 2 PQ
e) Como no conocen la varianza poblacional la estiman con una premuestra aleatoria de 12.
Para que sea aleatoria utilizó la tabla de números aleatorios con los siguientes criterios: los tres
últimos números por columna, empezando por el número 28704. Los números aleatorios (N.A.)
seleccionados son: 0.87, 018, 098, 019, 014, 007, 110, 108, 101, 059, y corresponden a los
distribuidores de la tabla 4.5.

Tabla 4,5 Premuestra distribuidores de Shampoo Caspin. 2014


87. PEDRO CASTRO
18. GLORIA LENID TORO O.
98. OLGA DONATTO
14. HAROLD YESID MANRIQUE P.
19. PEDRO ESQUIVEL P.
07. FIGUEROA HERNANDEZ
110. SILVIA LOSADA
108. NORMA TRUJILLO
101. EDGAR ALVAREZ
59. WILMER LOPEZ A.

e) Aplicar una encuesta a los distribuidores seleccionados en la premuestra donde les pregunta:

56
¿están satisfecho con la distribución de los productos de la empresa ?. Los resultados están en
la tabla 4.6.

Tabla 4,6 Está satisfecho con la distribución del Shampoo Caspin. 2014

87. PEDRO CASTRO SI


18. GLORIA LENID TORO O. SI
98. OLGA DONATTO SI
14. HAROLD YESID MANRIQUE P. NO
19. PEDRO ESQUIVEL P. SI
07. FIGUEROA HERNANDEZ SI
110. SILVIA LOSADA SI
108. NORMA TRUJILLO SI
101. EDGAR ALVAREZ SI
59. WILMER LOPEZ A. SI

p= casos favorables q=1-p


n
Entonces p = 9/10 = 0.9 q = 1- p = 0.1

N = 110 K=t (/2), (n - 1 ) = t(0.1), (9) = 1.833

Reemplazando la formula
NK 2 PQ 110 *1.8332 * 0.9 * 0.1
n n  17.7  18
N  1e2  K 2 PQ 110  10.122  1.8332 * 0.9 * 0.1
La muestra definitiva para estimar el porcentaje de distribuidores de la empresa es de 18 .

g) La premuestra es de 10 distribuidores, le agregamos 8 distribuidores escogidos aleatoriamente


en la tabla de números aleatorios ( continuando donde se terminó el último número aleatorio de la
premuestra 010). Los números aleatorios y opinión de los distribuidores se encuentran el la tabla
4.7.
Para estimar el porcentaje de distribuidores que están satisfecho se utiliza la siguiente fórmula:

P ( p - t (), (n - 1 ) p < P < p + t = t (), (n - 1 ) p ) = 1 - 

Donde:

N n PQ
P  Población finita
N 1 n

57
Tabla 4.7 ¿Está satisfecho con la distribución del Shampoo
Caspin ?. Muestra definitiva 2014
87. PEDRO CASTRO SI
18. GLORIA LENID TORO O. SI
98. OLGA DONATTO SI
14. HAROLD YESID MANRIQUE P NO
19. PEDRO ESQUIVEL P. SI
07. FIGUEROA HERNANDEZ SI
110. SILVIA LOSADA SI
108. NORMA TRUJILLO SI
101. EDGAR ALVAREZ SI
59. WILMER LOPEZ A. SI
79. FERNANDA PEREZ NO
66. LUZ MERY LURAN SI
89. LUCY MOYANO SI
9. LEYLA MARGOTH RAMIREZ S. SI
74. NORMA PEREA SI
109. IRMA PEREZ NO
45. FERNANDA GUZMAN P. SI
15. HERMES ALEXY RUBIANO E. SI

Con la muestra obtenemos los siguientes valores:

p = 15/18 = 0.83 q = 3/18 = 0.17

110  18 0.83 * 0.17


P   0.081 Población finita
110  1 18
Confiabilidad del 90%

t (), (n - 1 ) = t (0.1), (18 - 1 ) = t (0.1), (17 ) = 1.74

Reemplazando el intervalo:

( 0.83 - 1.74 [0.081] < P < 0.83 + 1.74 [0.081] )  (0.6891 < P < 0.9709)

Interpretación: Con una confiabilidad del 90% el porcentaje de distribuidores de la empresa que se
encuentra satisfecho en la distribución de los productos esta entre 68.91% y el 97.09%.

Cuando hay que presentar un informe ejecutivo es necesario incluir la ficha técnica. Un modelo
general de ficha técnica de muestreo para el ejercicio de distribuidores del shampoo Caspin está a
continuación:
58
4.2.1.3. CASOS ADICIONALES PARA DETERMINAR TAMAÑOS DE
MUESTRA

Para determinar un tamaño de muestra rápidamente hay varias alternativas. A continuación se


presentan algunos casos.

Caso 1: Asumir la máxima varianza P=0.5 y Q=0.5, la confiabilidad y el error máximo que desea
(recomendar que debe ser menor o igual del 5%).

Ejemplo. Un ingeniero quiere determinar el porcentaje de amas de casa en Neiva que prefieren el
jabón Amarillo en Neiva.

Como la población es grande y va a estimar un porcentaje entonces utiliza la fórmula de tamaño de


la muestra para proporción e infinita.
K 2 PQ
n
e2

Para este caso el valor de K es el percentil de una distribución normal correspondiente al 95%. El
error máximo admitido en las estimaciones “ e” lo asumió en un 4% que equivale en proporción
0.04. Asumiendo la máxima varianza P = 0.5 y Q= 0.5, reemplazo la formula y obtiene que para
el estudio debe encuestar al azar 601 ama de casa:

59
K 2 PQ 1.962 * 0.05 * 0.05
n   600.25  601 encuestas
e2 0.042
Caso 2. Cuando el contratista tiene una cantidad de dinero para la recolección de información. En
este caso se determina el valor de la encuesta en recolección y se realiza un cociente entre estas
dos cantidades. Con base a esta muestra definitiva se obtiene el error máximo admitido asumiendo
un confiabilidad del 95% y la máxima varianza (P=0.5 Q=0.5). A continuación se explica con un
ejemplo.

El alcalde de un municipio solicita al economista Petro Ramos que determine un tamaño de muestra
para que evalué la gestión del año 2008. El alcalde le informa que para la aplicación de la encuesta
tienen un presupuesto de $1.000.000. Petro realiza una estimación aproximada por el valor de la
aplicación de la encuesta y obtiene como resultado el costo de $4000. Entonces el tamaño de la
muestra es de 250 encuestas ( n = 1.000.000/ 4000 = 250).

Caso 3. Las encuesta tiene varias preguntas, entonces para determinar el tamaño de la muestra
una alternativa es averiguar cuáles son las preguntas importantes y a estas le determina el tamaño
de la muestra a cada una (con el mismo error y la misma confiabilidad) y la que tenga el tamaño
de muestra más grande es la muestra definitiva.

Ejemplo. Para ser un estudio de mercado que tiene como objetivo determinar el nivel de
satisfacción del cliente del jabón El Rojo en Neiva. La encuesta tiene 30 preguntas. Para
determinar el tamaño de la muestra el especialista de mercados considero tres preguntas
principales :

Utiliza el jabón Rojo? ………………………………………………………………………...SI No


El empaque del jabón Rojo es :……………………………………………………… Bueno Regular
Malo
¿Sì no encuentra el jabón Rojo en la tienda compraría otro jabón ?...... …SI No

Solución: Como la población es grande, utilizo la siguiente formula, para una confiabilidad del 95%
para un error máximo en las estimaciones del 5% (lo prefijo el cliente).

K 2 PQ
n
e2
Para este caso el valor de K es una Z=1.96. Esta se busca en la tabla Z para una confiabilidad del
95. El error e= 0.05 y como no se conoce la varianza P Q, aplico una premuestra en Neiva de 40
encuesta. Los resultados de las encuesta son:

 Utiliza el Jabón Rojo? SI = 30 No = 10


 El empaque del jabón Rojo es: Bueno =32 Regular =6 Malo = 2
 ¿Sí no encuentra el jabón Rojo en la tienda compraría otro jabón? SI= 5 y NO =35

Con estos datos determinó el tamaño de la muestra para cada pregunta, con el mismo error (0.05)

60
y la misma confiabilidad del 95% ( Z=1.96)

Para la pregunta ¿ utiliza el jabón Rojo P = 30/40 = 0.75 Q=1-P=1-0.75=0.25


Entonces:

K 2 PQ 1.96 2 * 0.75 * 0.25


n   288.12  288 encuestas
e2 0.052
Para la pregunta ¿ el empaque del jabón Rojo es? P = 32/40 = 0.8 Q=1-P=1-0.8=0.2 
Entonces:
2 2
K PQ 1.96 * 0.8 * 0.2
n   245.8  246 encuestas
e2 0.052

Para la pregunta ¿Sí no encuentra el jabón Rojo en la tienda compraría otro jabón?
P = 32/40 = 0.875 Q=1-P=1-0.875 = 0.125 

K 2 PQ 1.96 2 * 0.875 * 0.125


n   168.07  168 encuestas
e2 0.052

Concluye que para la primera pregunta debo encuestar a 288 personas; en la segunda pregunta
debe encuestar a 246 personas y en la tercera pregunta solo a 168 personas. Entonces selecciona
el tamaño de muestra más grande que es 288 y esta es la muestra definitiva. Es decir que debe
encuestar en Neiva solo a 288 personas.

Ejercicio propuesto. El alcalde del municipio de Pitalito lo contrato para realizar el siguiente estudio:

 Determinar el número promedio de personas por hogar


 El porcentaje de habitantes del municipio de Pitalito que están de acuerdo con la gestión
del alcalde.
a) Como usted recibió una capacitación en estadística, diseñe una encuesta para determinar lo
solicitado por el Alcalde.

b) Una de las limitaciones del contrato, es en el trabajo de recolección (aplicación de encuestas)


de información. El alcalde destinó un presupuesto de $2.000.000, ya que cada encuesta
diligenciada tiene un costo unitario de $6.000. Con estos criterios determine el tamaño de la
muestra.
Ayuda:
 En un estudio realizado en 2008 la desviación estándar del promedio de personas por
hogar es de 0.4.
 El alcalde cree que el 80% de la población están de acuerdo con la gestión del alcalde.
c) En palabras describa, ¿cómo sería el proceso de selección para encuestar los habitantes que
conformaran la muestra?.

61
4.2.2. MUESTREO SISTEMATICO

Para los diseños de muestra anteriores se ha supuesto que para obtener cada elemento de la
muestra se efectuaba una selección probabilística, utilizando la tabla de números aleatorios. El
muestreo sistemático consiste en tomar aleatoriamente un número i que designará en una lista o
población de N elementos, al primero que va a formar parte de la muestra. De manera rígida y
sistemática los elementos i+k, i+2k, y así sucesivamente hasta completar el tamaño de muestra n.
La constante k se obtiene del siguiente cociente: k = N/n.
Los pasos a seguir en una muestra sistemática son:

a) Calcule k = N/n.

b) Si k resulto entero.

 Elegir un número aleatorio entre 1 y k, denominarlo i


 La muestra está conformada por las siguientes unidades muestrales: i, i+k, i+2k, i+3k,
i+4k......................

c) Si k no resulto entero.

 Elegir un número aleatorio entre 1 y N, denominarlo i.


 La muestra está conformada por las siguientes unidades muéstrales: i, i+k, i+2k, i+3k,
i+4k...................... donde k es el entero más próximo a N/n.

Este tipo de selección es importante y presenta mayor ventaja de la selección aleatoria debido a
que queda mejor distribuida la muestra en la población. En trabajo de campo, el encuestador
puede ir determinando la unidades a encuestar en forma sencilla y práctica, por ejemplo; se va a
seleccionar en un barrio de 120 viviendas, una muestra de 15 viviendas. El encuestador selecciona
un entre 1 y 120. El número aleatorio seleccionado al zar al encuestador se le informa que ubique
en esa dirección y a partir de ella, cada octava vivienda debe observar las características analizar (
k =N/n=20/15=8 ).

Ejemplo. seleccionar una muestra sistemática de tamaño 10 para la población de socios


perteneciente al Club Los Elefantes. Los socios pertenecientes al Club los Elefantes se relacionan en
la tabla 4.8.

Los pasos a seguir en una muestra sistemática son:


a) Calcule k = N/n Los valores de N = 90 y n = 10, entonces k = 90/10 = 9

b) Como K resulto entero, entonces elegimos un número aleatorio entre 1 y 9, resultando el

62
número 4, l cual es i.
Tabla 4.8. Listado de socios del club Los Elefantes 2015.

NOMBRE Y APELLIDOS NOMBRE Y APELLIDOS NOMBRE Y APELLIDOS


1 Aureliano Sanchez Perez 2 Carlos Alberto Bohorquez 3 Derly Soley Perdomo
4 Robinson Quimbaya V. 5 Gloria Helena Torres 6 Norma C. Artundiaga
7 Imna Figueroa Hernandez 8 Silvia Mireya Beltran M. 9 Leila Margoth Ramirez
10 Maria Jimena Salazar Roa 11 Mara Fernanda Guzman C. 12 Lina Constanza Rojas
13 Silvia Liliana Ramos G. 14 Harol Yesid Manrique 15 Hermes A Pubiano
16 Delia Cortez Ipus 17 Blanca Miriam Morales 18 Gloria Lenid Toro
19 Pedro Esquivel P. 20 Sergio Jose Culma 21 Luci J Artehortua
22 Carlos Augusto Bravo 23 Jesus Antonio Correa 24 Rosa Claudia Rojas
25 Wilhein Yoakov Lopez 26 Harol Solorsano Ordonez 27 Candido Herrera
28 Silvina Hurtado 29 Cesar Vera 30 Olga Patricia Lucuara
31 Ramon Dussan Macias 32 Rojo Mery Lucuara 33 Edgar Anibal Cuellar
34 Carlos Javier Papa Yela 35 Aurel Cristancho S. 36 Alberto Bohórquez Z.
37 Soley Perdomo 38 Robin Vanegas 39 Helena Torres E.
40 Constanza Artunduaga 41 Tulia Figueroa Hernandez 42 Mireya Beltran
43 Margoth Ramires S. 44 Jimena Salazar Papuja 45 Fernanda Guzman P.
46 Constanza Rojas 47 Liliana Ramos 48 Yesid Manrique
49 Alexis Rubiano P. 50 Ebelia Cortes Ipus 51 Miriam Morales T.
52 Gloria Tora 53 Rosa Esquibel N. 54 Jose Culma A.
55 Jasmin Pedraza V. 56 Augusto Muños 57 Antonio Corrales I.
58 Claudia Rojas A. 59 Wilmer Lopez T. 60 Harold Solar
61 Cesar Veracruz 62 Betriz Reyes 63 Jorge Gonzalez
64 Olga Patricia Lucai 65 Ramon Macias 66 Rojo Mery Duran
67 Anibal Cuellar 68 Javier Yela 69 Aureliano Perez
70 Alberto Rojas 71 Derly Sotil 72 Robinson Quimbaya
73 Claudia Marin 74 Norma Perea 75 Irma Figuero H.
76 Silvia Pedrasa 77 Leyla Roma 78 Maria Roa
79 Fernanda Perez 80 Lina Perez 81 Silvia Castro
82 Harold Manrique 83 Alexi Polania 84 Delia Bahamon
85 Blanca Salas 86 Gloria Morera 87 Pedro Castyro
88 Sergio Moreno 89 Lucy Moyano 90 Carlos Soto

La muestra queda conformada por las siguientes unidades muestrales: 4, 13, 22, 31, 40, 49, 58,
67, 76, 85. (i, i+k, i+2k, i+3k, i+4k....). Los socios correspondientes a estos números están en
la tabla 4.9

63
Tabla 4.9 Listado de los socios del Club Los Elefantes.
Muestra sistemática

NOMBRE Y APELLIDOS
4 ROBINSON QUIMBAYA V.
13 SILVIA LILIANA RAMOS G.
22 CARLOS AUGUSTO BRAVO
31 RAMON DUSSAN MACIAS
40 CONSTANZA ARTUNDUAGA
49 ALEXIS RUBIANO P.
58 CLAUDIA ROJAS A.
67 ANIBAL CUELLAR
76 SILVIA PEDRASA
85 BLANCA SALAS

Ejercicios propuestos.

1. Seleccionar una muestra sistemática de tamaño 11 para los socios del Club Los Elefantes.

2. El secretario de agricultura del departamento del Huila quiere estimar en un municipio, el


porcentaje de fincas que cuenta con mayordomo. Por tiempo le solicita que determine un
tamaño de muestra para realizar la estimación, con un nivel de confianza del 95%, para
un error máximo admito en la estimación del 2.78%. Le informa que en este municipio hay
1231 fincas.

3. En la comuna uno de Neiva se desea determinar un tamaño de muestra para aplicar una
encuesta la cual tiene como objetivo determinar la proporción de persona que están de
acuerdo con la gestión del alcalde. Determine el tamaño de la muestra.

4. Se desea realizar una encuesta entre la juventud de la población de Garzón para


determinar la proporción de jóvenes que estaría a favor de ubicar la zona rosa, frente al
parque principal del municipio. Determinar el tamaño de muestra necesario para estimar el
porcentaje de jóvenes que están a favor, garantizándola con una confiabilidad del 95%
para un error máximo admitido en la estimación del 4.3%.

5. La fábrica de llantas RODAL cuenta con 1312 empleados. Se quiere estimar con base a una
muestra aleatoria el ahorro promedio mensual de los empleados, con una confiabilidad del
95% para un error máximo admitido en la estimaciones de $2000. Como no se conoce la
varianza poblacional selecciona una muestra piloto de 15 empleados y se obtiene una
desviación estándar de $30000. Determine el tamaño de la muestra.

64
V. PRUEBA DE HIPÓTESIS

α
β
COMPETENCIAS

 Aprender los modelos de pruebas de hipótesis


 Diferenciar los conceptos de error tipo I y error tipo II.

En la sección anterior trató el problema de estimar los parámetros a partir de una muestra
aleatoria. En otras investigaciones debemos decidir si una afirmación relativa a un parámetro es
verdadera o falsa. Esto es, probar una hipótesis relativa a un parámetro. Por ejemplo se quiere
probar que:

 El medicamento es efectivo para cierta enfermedad


 El jabón Matapulgas es mejor que el jabón Pulgoso.
 La vida útil media de cierta lámpara quirúrgica es inferior a 250 horas.
 La venta diaria promedio de la veterinaria YA es superior a $5.000.000
65
¿Qué es una hipótesis estadística? es una afirmación de uno o mas parámetros poblacionales. En
estadísticas existen dos tipos de pruebas de hipótesis: pruebas de hipótesis paramétricas y no
paramétricas.

Las pruebas de hipótesis paramétricas son aquellas hipótesis, donde se plantean en función de
parámetros estadísticos (, , P, % ) y la escala de medida debe ser de intervalo o de razón. Las
pruebas no paramétricas son aquellas, donde no plantean las hipótesis en función de los
parámetros estadísticos y exigen como escalas de medición la nominal.

El modelo general para el procedimiento de una prueba de hipótesis, según la naturaleza de los
datos y los supuestos de la distribución de la población es:

a) Planteamiento de la hipótesis: La Prueba de Hipótesis trabaja con dos hipótesis:

 Hipótesis Nula ( H0 ): una proposición de conformidad con condiciones verdaderas para


ser desacreditada (rechazada). La hipótesis Nula se compara con otras hipótesis
denominada Hipótesis Alternativa.
 Hipótesis Alternativa (H1 o HA ) : Es la proposición opuesta a la Hipótesis Nula. En
general aquí se plantea lo que el veterinario quiere probar.

En el proceso de prueba, la hipótesis H0, se rechaza o bien no se rechaza. Sí H0 no se rechaza, se


dirá que los datos sobre los cuales se basa la prueba, no proporcionan evidencia para que provoque
el rechazo. Sí el procedimiento de la prueba conduce al rechazo, concluirá que los datos disponibles
no son compatibles con H0 pero son apoyo a otra hipótesis que se conoce como H1.

b) Estadística de trabajo: Es una estadística para calcular a partir de los datos de la muestra.
Existen muchos valores posibles que pueden tener la estadística de prueba, dependiendo el valor
particular observado de la muestra particular extraída. Esta estadística de trabajo sirve como
productor de decisiones, ya que la decisión de rechazar o no H 0 depende de la magnitud de la
estadística de trabajo.

X  o X  o
Ejemplos de estadística de trabajo son: tc  Zc  etc.
S S
n n

c) Distribución de la estadística de Prueba: La clave de la estadística inferencial es la


distribución de probabilidad de la estadística de trabajo.
X  o
Zc  La estadística anterior sigue una distribución normal estándar, sí la H0
S
n
verdadera y satisface las suposiciones.

d) Regla de decisión: Todos los valores posibles de la estadística de trabajo que pueda tener,
son puntos sobre el eje horizontal y se dividen en dos grupos; uno de los grupos constituye lo que
se conoce como región de rechazo H0 y el otro grupo como la Región de Aceptación de H 0. Los
valores de la estadística de trabajo que comprenden la región de rechazo, son aquellos que tienen
la menor probabilidad de ocurrir sí la hipótesis nula es verdadera, mientras los valores que forman
66
la región de aceptación son los que tienen mayor probabilidad de ocurrir si la hipótesis nula es
verdadera. La regla de decisión nos dice: rechace la hipótesis nula sí el valor de estadística de
trabajo que se calcule a partir de la muestra, es uno de los valores en la región de rechazo y que
no se rechace (o se acepte) la hipótesis nula, sí el valor calculado de la estadística de trabajo es
uno de los valores en la región de aceptación. Por lo que respecta ¿cuáles valores van hacia la
región de rechazo y cuáles a la región de aceptación?, lo define el nivel de significancia, designado
por alfa y se nota por .
El nivel de significación alfa (  ) especifica el área bajo la curva de la distribución de la
estadística de trabajo que está por encima de los valores sobre el eje horizontal y
constituyen la región de rechazo. Entonces se ve que  es una probabilidad y, de hecho, es la
probabilidad de rechazar una hipótesis nula verdadera. Como rechazar una hipótesis nula
verdadera constituiría un error, únicamente parece razonable que debe hacerse
pequeña la probabilidad de rechazar una hipótesis nula verdadera y en efecto, esto es
lo que se hace.
El error que se comete cuando se rechaza una hipótesis nula verdadera se llama error del tipo I (
) o nivel de significancia. El error del tipo II se comete cuando se acepta una hipótesis nula
falsa. La probabilidad de cometer un error del tipo II se designa por ( ß ).

Siempre que se rechaza una hipótesis nula se tiene riesgo concomitante de cometer un
error del tipo I, (rechazar una hipótesis nula verdadera). Siempre que se acepte una
hipótesis nula (error tipo II) se tiene el riesgo de que esta sea falsa.

En general no ejerce control sobre ß, aunque se sabe que, como regla, es mayor que . Nunca se
sabe si se ha cometido o no uno de estos errores cuando se rechaza o se deja de rechazar una
hipótesis nula, debido a que se desconoce el enunciado verdadero de los asuntos. Si el
procedimiento de prueba conduce al rechazo de la hipótesis nula verdadera, puede ser un consuelo
el hecho de que se ha empequeñecido  y por lo tanto fue pequeña la probabilidad de cometer un
error del tipo I. Sí se acepta la hipótesis nula no se conoce el riesgo concurrente de cometer un
error del tipo II ya que por lo común se desconoce ß pero, como ha señalado, se sabe que en
general es mayor que .

e) Calcular la estadística de trabajo: A partir de los datos de la muestra, calcular un valor de


la estadística de trabajo y comparar con las regiones de aceptación y de rechazo.

f) Decisión: La decisión estadística consiste en el rechazo o no rechazo de la hipótesis nula. Se


rechaza, si el valor calculado de la estadística de trabajo cae en la región de rechazo y no se
rechaza, si el valor calculado de la estadística de trabajo cae en la región de aceptación.
A continuación se tratan algunas pruebas paramétricas.

5.1. PRUEBA DE HIPOTESIS PARA LA MEDIA DE UNA POBLACION


DISTRIBUIDA NORMALMENTE

Cuando una población está distribuida normalmente y se quiere realizar una prueba de hipótesis
sobre el parámetro media hay que utilizar los modelos que están en la figura 5.1 Para aplicar uno
de los tres modelos (figura 5.1) hay que observar si la población se distribuye aproximadamente
en forma normal o las muestras son mayores que 30 o sin son menores de 30. Si la muestra es
menores de 30 y la población se distribuye aproximadamente en forma normal, hay que calcular la
estadística t; si la muestra es mayor de 30 o se distribuye normalmente se calcula la estadística Zc.
67
FIGURA 5.1. PRUEBA DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN
NORMAL

MODELO I MODELO II MODELO III

a) Planteamiento de a) Planteamiento de a) Planteamiento de


hipótesis hipótesis hipótesis

Ho :  = o vs Ho :   o vs Ho :   o vs
H1 :   o H1 :   o H1 :   o

b) Estadística de trabajo:
b) Estadística de trabajo: b) Estadística de trabajo:
X  o
X  o X  o tc 
tc  | tc  S
S S n
n n X  o
X  o X  o Zc 
Zc  Zc  S
S S n
n n

c) Decisión d) Decisión c) Decisión

Donde: -t = -t(), (n-1)


donde: t= t(), (n-1) donde: t = t(), (n-1)
- Si Zc o tc cae en RR,
- Si Zc o tc cae en RR, - Si Zc o tc cae en RR, entonces rechazo Ho y
entonces rechazo Ho y entonces rechazo Ho y acepto H1.
acepto H1. acepto H1.
- Si Zc o tc cae en RA,
- Si Zc o tc cae en RA, - Si Zc o tc cae en RA, entonces afirmo que
entonces afirmo que entonces afirmo que con estos datos no
con estos datos no con estos datos no tomo ninguna decisión
tomo ninguna decisión tomo ninguna decisión

Ejemplo. El fabricante de la ambulancia marca Veloz, afirma que el consumo promedio de gasolina
68
es superior a 14 kilómetros por galón de gasolina corriente. Un organismo de defensa al
consumidor piensa que ese kilometraje promedio ha sido exagerado por el fabricante. Toma una
muestra aleatoria de 9 ambulancias de marca veloz y son conducidos del mismo modo con un
galón de gasolina corriente. Los kilómetros recorridos por las diversa ambulancias son: 13 - 13 -
14 - 12 - 12 - 12 - 13 - 12 - 12. Si el organismo supone que el consumo de gasolina se distribuye
normalmente, ¿puede este rechazar dicha afirmación a un nivel de significancia del 5%? (Alfa =
0.05)

Solución. Como supone que la distribución de los kilometrajes recorridos con un galón de gasolina
corriente se distribuye normalmente, además la afirmación involucra el parámetro promedio y la
muestra aleatoria es menor de 30; el modelo III es el adecuado.

a) Planteamiento de las hipótesis

Ho :   14 vs H1 :   14

b)..Estadística de trabajo. Como la muestra es menor de 30 utilizar la estadística t c,, donde:

X  12.56 = 12.56 S = 0.72 n= 9 o = 14


X   o 2.56  14
tc    -5.95
S 0.72
n 9

c) Decisión

donde: -t = - t(), (n-1) Para determinar el valor de t(), ,(n-1) -t(0.05),(8) en la tabla t-student (tabla
III ) es igual -1.86. Ubica este valor en la figura. Luego ubica tc = -5.95 en la figura y cae en la
región de rechazo de Ho. Entonces la decisión estadística es: como tc cayó en RR (región de
rechazo de Ho), entonces rechazo Ho y acepto H1.

Conclusión. El kilometraje medio recorrido por la ambulancia marca veloz, es inferior a 14


kilómetros por galón de gasolina corriente.

Ejemplo. Para el ejercicio anterior el organismo de defensa de consumidor quiere demostrar que
el kilometraje medio recorrido por la ambulancia marca "veloz", es diferente a 15 kilómetros por
galón de gasolina corriente. Alfa = 0.01.
Solución: Para esta afirmación la prueba de hipótesis es la siguiente (modelo I figura 5.1).
69
a) Planteamiento de hipótesis

Ho :  = 15 vs H1 :   15

b). La estadística de trabajo:

X  12.56 S = 0.72 n= 9  o = 15.

X   o 12.56  15
tc    10.08
S 0.72
n 9

c) Decisión

donde: -t = - t(/), (n-1). Para determinar el valor de t() ,(n-1) = t(0.05),(8) en el tabla III, t-student
(tabla III) a dos colas es igual 2.306. Ubica este valor en la figura. Luego ubica tc = -10.08 en la
figura y cae en la región de rechazo de Ho. Entonces la decisión estadística es: como tc cayó en
RR (región de rechazo de Ho), entonces rechazo Ho y acepto H1.

Conclusión. El kilometraje medio recorrido por la ambulancia marca veloz es diferente a los 15
kilómetros por galón de gasolina corriente.

Ejemplo. El propietario del almacén veterinario el Tigre quiere probar que las ventas promedios
diarias son superiores al $1.000.000 . Para confirmar esta afirmación selecciona en contabilidad
60 días de ventas aleatoriamente y obtiene una venta promedio diaria de $1.045.000 con una
desviación estándar de $180.000. Nivel de significancia 5%.

Solución. Para esta afirmación, la prueba de hipótesis es la siguiente (modelo II):

a) Planteamiento de las hipótesis.


Ho :   1.000.000 vs H1 :   1.000.000

70
b) Estadística de trabajo:
X  o
Zc  muestra mayor de 30 Como:
S
n
S = $80.000 n =60 X  1045000

X   o 1045000  1000000
Zc    1.94
S 180000
n 60
Decisión:

Para determinar el valor Z para la figura que esta a continuación, utilizando la tabla II del
apéndice de Z para un nivel de significancia de 5%. El valor de Z corresponde a 1.65 y con este
valor lo ubica en la figura. A continuación ubico el Zc= 1.94 en la figura y cae en la región de
rechazo de Ho. Entonces la decisión estadística es: como Zc cayó en RR (región de rechazo de
Ho), entonces rechazo Ho y acepto H1.

decisión estadística es: como Zc cayó en RR (región de rechazo de Ho), entonces rechazo Ho y
acepto H1.

Conclusión. Confirmo que las ventas promedios diarias del almacén veterinario el Tigre es superior
al $1.000.000.

5.1.1. METODO DEL VALOR p PARA LA PRUEBA DE HIPOTESIS

En los ejemplos anteriores, para rechazar la hipótesis nula se prefijo de antemano el nivel de
significancia (0.05 o 5%). Otro método es buscar el valor p, que es la probabilidad de obtener una
estadística de prueba igual o más extremo que el resultado de la estadística de trabajo, dado que la
hipótesis nula es cierta.

El valor p es el nivel de significancia observado y es aquel nivel más pequeño en el que se puede
rechazar Ho.
71
La decisión, utilizando este método es:
 Si el valor p es mayor o igual que , no se rechaza la hipótesis nula.
 Si el valor p es menor que , se rechaza la hipótesis nula.
Para determinar el valor de p en la tabla de la distribución normal estándar se realiza de la
siguiente forma:

A una cola P= P[ 0.5 - el valor absoluto de Zc de la tabla Z]


Valor de P =

A dos colas P= 2P[0.5 - del valor absoluto de Zc de la tabla Z]

Utilizando el método de p para el ejemplo del almacén veterinario el Tigre, es de la siguiente


forma: como la prueba de hipótesis es a una cola y la estadística de trabajo (valor critico)
Zc = 1.94,entonces es necesario encontrar la probabilidad del valor de Zc en la tabla Z (apéndice )
y es 0.4788. Entonces

P= P[ 0.5 - el valor absoluto de Zc de la tabla Z]  P= P[ 0.5 – 0.4788]  P=0.0262


como p es menor que =0.05, se rechaza la hipótesis nula.

5.2. PRUEBA DE HIPOTESIS PARA LA PROPORCIÓN POBLACIONAL

Hasta el momento se han presentado las pruebas de hipótesis en las cuales se basan en un
promedio poblacional por ejemplo: el salario promedio del veterinario o la edad media de los
administradores de empresas.

En las empresas algunas veces los analista están interesados en el porcentaje de elementos de una
población que cumple cierta características, por ejemplo los gerentes de las EPS están interesado
por el porcentaje de afiliados que utilizan los servicios; los ingenieros les interesa demostrar el
porcentaje de contratistas que sí cumplen con las especificaciones de las obras.

De la misma forma que se aplicaron los tres modelos para la media poblacional (planteamiento de
hipótesis, estadística de trabajo y decisión), se aplican los modelos para las prueba de hipótesis de
la proporción (figura 5.2)

Ejemplo. El veterinario de zoonosis quiere probar que menos del 40% de los canes que recogen en
la ciudad tienen garrapatas con un nivel de significancia del 2.5%. Para demostrar seleccionan al
azar 150 canes y observa que 35 de ellos tienen garrapatas.

Solución. Como se quiere probar que menos del 40% de los canes que recogen en la ciudad tienen
garrapatas y la muestra es mayor de 30, el planteamiento de hipótesis es:
Ho : P  0.40 vs H1 : P  0.40

72
FIGURA 5.2. PRUEBA DE HIPÓTESIS PARA LA PROPORCION
POBLACIONAL.(Muestras mayores o iguales a 30)

MODELO I MODELO II MODELO III

a) Planteamiento de a) Planteamiento de a) Planteamiento de


hipótesis hipótesis hipótesis
Ho : P = Po vs Ho : P  Po vs Ho : P  Po vs
H1 : P  Po H1 : P  Po H1 : P  Po

b) Estadística de b) Estadística de b) Estadística de


trabajo: trabajo: trabajo
p  PO p  PO
Zc  Zc  p  PO
pq pq Zc 
n n pq
Donde: Donde n
Donde
No....de....éxitos No....de....éxitos
p p
n n No....de....éxitos
p
q= 1-p q= 1-p n
q= 1-p

c) Decisión c) Decisión
c) Decisión

- Si Zc cae en RR, - Si Zc cae en RR, - Si Zc cae en RR,


entonces rechazo Ho y entonces rechazo Ho y entonces rechazo Ho y
acepto H1. acepto H1. acepto H1.
- Si Zc cae en RA, - Si Zc cae en RA, -Si Zc cae en RA,
entonces afirmo que con entonces afirmo que con entonces afirmo que con
estos datos no tomó estos datos no tomó estos datos no tomó
ninguna decisión ninguna decisión ninguna decisión.

73
b) Estadística de trabajo

p  PO No....de....éxitos 35
Zc  Donde: p   0.233 q=1-p =1-0.233=0.767
pq n 150
n

p  PO 0.233  0.767 0.534


Zc     15.2
pq 0.233 * 0.767 0.035
n 150

c) Decisión

Para determinar cuál de las siguientes decisiones hay que determinar dónde empieza la región de
rechazo y si :
 Si Zc cae en RR, entonces rechazo Ho y acepto H1.
 Si Zc cae en RA, entonces afirmo que con estos datos no tomo ninguna decisión.

El valor de Z de la tabla de la normal estándar para un alfa de 0.05 es 1.96 y la ubico en la gráfica.
Luego ubicar la estadística de trabaja Zc y como cae en la región de rechazo de Ho, entonces la
decisión es: “ como Zc cae en RR, entonces rechazo Ho y acepto H 1”
Conclusión. Menos del 40% de los canes que llegan a Zonocis tienen garrapata.

EJERCICIOS SECCION 5.1 – 5.2

1. Está probando un nuevo tipo de trampa para ratones. El fabricante afirma que la trampa atrae y
mata más del 80% de los ratones que llegan a la trampa. Para ello realiza un experimento con 75
ratones y 70 de ellos los atrae y los mata. Nivel de significancia 4%, probar la afirmación dl
fabricante.
2. Usted no está de acuerdo con la afirmación del fabricante, probar la hipótesis para un nivel de
significancia del 5%.
3. Está interesado en probar que el peso promedio de las profesores de las universidades es
diferente a 60 kilos. Una muestra aleatoria de 65 profesores fue seleccionada al azar para probar la
afirmación y dio un peso medio de 70 kilos con una desviación estándar de 2 kilos. Nivel de
significancia del 1%.

74
4. Una empresa de detergente afirma que una caja de 500 gramos lava en promedio mas de 120
platos. Como usuario no estoy de acuerdo con la afirmación. Para demostrarlo selecciono una
muestra aleatoria de 36 cajas de detergentes y obtengo que lava en promedio 95 platos con una
varianza de 16 platos2. Nivel de significancia 4%.
5. Un veterinario quiere probar que el peso promedio de los equinos en el municipio de Yoral, es
inferior a 400 kilogramos. Selecciona una muestra aleatoria de 15 equinos obtiene los siguiente
pesos: 401 399 380 370 388 376 375 401 399 380 370 388 376 375 388 Nivel de
significancia 5%.
6. Una máquina embotelladora de gaseosas está diseñada para embotellar liquido de gaseosas de
100 centímetros cúbicos. De acuerdo a las especificaciones del fabricante, la maquina embotella
menos de 10 botellas diariamente con liquido de gaseosa inferior 100 centímetros cúbicos las
cuales la consideran defectuosas. El director de control de calidad quiere probar que la maquina
está en control, con un nivel de significancia del 5%. En un día especifico el director de control de
calidad selecciona una muestra aleatoria de 80 botellas de gaseosas y obtiene un promedio de 7
botellas con liquido de gaseosa inferior 100 centímetros cúbicos y una varianza=4. a) Plantee las
hipótesis b) Calcule la estadística de trabajo c) Cual es la decisión.
7. En la empresa de alimentos S.A. está enlatando el fríjol bala en tarro, con un peso de 550
gramos. Como dueño de la empresa de alimentos S.A. sospecho que la maquina enlatadora está
favoreciendo en peso al consumidor y por consiguiente está perdiendo plata en ese producto. Para
demostrarlo selecciono una muestra aleatoria de latas de frijol bala y revisó su peso obteniendo los
siguientes resultados en gramos: 598 601 596 600 601 598 599 600 600 600 600 600 600
599 600 599 600 598 601 596 600 601 598 599 600 600 600 600 600 600 599 600 599
Nota: nivel de significancia 4.0 %
8. Una máquina que produce tuercas se dice que esta fuera de control si en cada lote de
producción (producción diaria) hay en promedio menos 4 tuercas defectuosas. Para demostrar que
la máquina está funcionando bien, toman una muestra aleatoria de 20 lotes y obtienen un
promedio de 2 tuercas defectuosa y con una desviación estándar de 0.1. Alfa = 0.05
9. El director de la fábrica de tornillos El Milimétrico solicita, que le explique en breves palabras y
que el entienda, ¿ cómo se procedería para probar que menos del 1% de los tornillos que se
fabrican en esta empresas son defectuosos.
10. Un veterinario afirma que más del 70% de las vivienda tienen canes criollos en Neiva. Para
probar la afirmación con un nivel de significancia del 5%, selecciona una muestra aleatoria de 250
viviendas y encuentra que 175 canes son criollos.
11). El estudiante Jorge Rico, afirma que menos del 30% de los propietarios de canes de raza lleva
su can al veterinario. Selecciona una muestra aleatoria de 245 canes de raza y observa que 205 de
estos canes no los llevan al veterinario.

5.3. PRUEBA DE HIPÓTESIS PARA DOS MEDIAS POBLACIONALES


( 1, 2 ).
Cuando desean comparar si existen diferencias significativas entre dos poblaciones de
consumidores con medias 1 y 2 respectivamente y las muestras son aleatorias, hay que tener en
cuenta sí las comparaciones se realizan con grupos diferentes (muestras independientes) o con
el mismo grupo ( muestras dependientes o pareadas).

75
5.3.1. PRUEBA DE HIPÓTESIS PARA DOS MEDIAS POBLACIONALES ( 1,
2 ). MUESTRAS INDEPENDIENTES. VARIANZAS DIFERENTES Y
MUESTRAS MAYORES O IGUALES A 30.

En dos sectores de producción se quiere probar que un sector es más productivo que el otro o si
existen diferencias significativas entre los dos sectores de producción, con medias 1 y 2
respectivamente hay que aplicar esta prueba de hipótesis. Para realizar esta prueba seleccionan
una muestra aleatorias de cada población y luego deben identificar que se debe probar, para
identificar cuál es el grupo uno y cuál es el grupo dos.

Con base a lo anterior se escoge el modelo adecuado de la prueba que se describe en la figura 5.3.
Ejemplo. Un Administrador agropecuario afirma que el shampoo Matapulgas se vende más en los
almacenes veterinario donde hay promociones que en los almacenes veterinarios donde no hay
promociones. Para comprobar esta afirmación con un nivel de significancia del 5%, selecciono 35
almacenes veterinarios con promociones y 40 almacenes veterinarios donde no hay promociones.
La información resultante está en la tabla 5.1.

Tabla 5.1. Cantidad de frasco mensuales de Shampoo Matapulgas en dos almacenes


veterinarios.

Tienda Venta promedio de frascos Desviación estándar


Con promoción I 30 2
Sin promoción I I 20 3

Solución.

Como existen dos poblaciones diferentes s (independientes), y se quiere probar las ventas de tarros
de shampoo Matapulgas son mayores en los almacenes veterinarios con promoción, que en los
almacenes veterinarios donde no existe la promoción.

Entonces el modelo II de hipótesis es el adecuado (figura 5.3)y se define como grupo “1”
almacenes veterinarios con promoción y el grupo “2” a los almacenes veterinarios sin promoción.
Los datos son: X1  30 X 2  20 S1= 2 S2 =3 n1 = 35 n2 = 40
Pasos a seguir:

b) Planteamiento de las hipótesis

Ho : 1  2 vs H 1 : 1  2

b) Calculo de la estadística de trabajo:

X1  X 2 30  20
Zc   Zc   17
S12 S 22 22 32
 35

40
n1 n2
76
FIGURA 5.3. PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE DOS MEDIAS
(1 2 ) POBLACIÓNALES, MUESTRAS INDEPENDIENTES

MODELO I MODELO II MODELO III

a) Planteamiento de a) Planteamiento de a) Planteamiento de


hipótesis hipótesis hipótesis

Ho : 1 = 2 vs Ho : 1  2 vs Ho : 1  2 vs
H1 : 1  2 H1 : 1  2 H1 : 1  2

b) Estadística de b) Estadística de b) Estadística de


trabajo: trabajo: trabajo:

X1  X 2 X1  X 2 X1  X 2
Zc  Zc  Zc 
S12 S 22 S12 S 22 S12 S 22
  
n1 n2 n1 n2 n1 n2
X X
t  1 2
X X X X
c 2   2
S n 1  S n 1 1 1  t  1 2 t  1 2
1 1 2 2
n n 2 n

n
c 2   2
S n 1  S n 1 1 1
1 1 2 2 
 c 2  
1 1
2
S n 1  S n 1 1 1
2 2 

1 2 1 2
n n 2 n n n n 2 n n
1 2 1 2 1 2 1 2

c) Decisión c) Decisión c) Decisión

Donde: t(), (n1 + n2 -2) Donde: - t(), (n1 + n2 -2)


Donde: t(), (n1 + n2 -2)

Si Zc o tc cae en RR, - Si Zc o tc cae en RR,


- Si Zc o tc cae en RR, -
entonces rechazo Ho entonces rechazo Ho
entonces rechazo Ho
y acepto H1. y acepto H1.
y acepto H1.
Si Zc o tc cae en RA, - Si Zc o tc cae en RA,
- Si Zc o tc cae en RA, -
entonces afirmo que entonces afirmo que
entonces afirmo que
con estos datos no con estos datos no
con estos datos no
tomo ninguna tomo ninguna
tomo ninguna
decisión decisión
decisión
77
c) Decisión

Para tomar la decisión graficar la distribución normal.

Para determinar el valor Z, utilizar la tabla Z para una nivel de significancia de 5%. El valor de Z
corresponde a 1.65 y con este valor en lo ubico en la figura. A continuación ubicar el Z c= 17 en la
figura y cae en la región de rechazo de Ho. Entonces la decisión estadística es: Como Zc cayó en
RR (región de rechazo de Ho), entonces rechazo Ho y acepto H1.

Conclusión. las ventas de frascos del shampoo Matapulgas son mayores en los almacenes
veterinarios con promoción de alimentos, que en los almacenes veterinarios donde no existen
promociones.

5.3.2. PRUEBA DE HIPÓTESIS PARA DOS MEDIAS POBLACIONALES ( 1, 2 ). MUESTRAS


DEPENDIENTES.

Cuando a una población de animales le observa una característica en dos instantes de tiempo hay
que utilizar este modelo. La información que produce en cada instante de tiempo se considera
como un grupo o población. Los tres modelos de pruebas de hipótesis con varianzas diferentes y
muestras menores de 30 se describen en la siguiente página (figura 5.4).

Ejemplo. Un empresario afirma que la música incentiva en el rendimiento laboral de los empleados.
Para probar esta afirmación selecciona al azar 8 operarios de la empresa Madrigal. Durante 10 días
observan el total de artículos elaborados sin música y luego durante los 10 días siguientes a la
empresa la ambientan con música y observa a estos mismo 10 operarios el total de artículos
elaborados. Los resultados están en la tabla 5.2.

Tabla 5.2 Total de artículos elaborados por los 8 operarios de la empresa


Madrigal.2015

Tratamiento Total de artículos elaborados

Sin música 50 48 46 47 48 48 49 49

Con música 50 51 53 46 48 49 56 55

78
FIGURA 5.4. PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE DOS MEDIAS
POBLACIÓNALES, MUESTRAS DEPENDIENTES
MODELO I MODELO II MODELO III

a). Planteamiento de a) Planteamiento de a) Planteamiento de


hipótesis hipótesis hipótesis

Ho : 1 = 2 vs Ho : 1  2 vs Ho : 1  2 vs
H1 : 1  2 H1 : 1  2 H1 : 1  2

b) Estadística de b) Estadística de b) Estadística de


trabajo: trabajo: trabajo:
n n n

d
i 1
i d
i 1
i d
i 1
i

tc  n tc  n tc  n
Sd / n Sd / n Sd / n
Donde:
Donde: Donde: n
n n ( d i ) 2
( d i ) 2 ( d i ) 2
n

d  i 1
2
n n

d d
i
 i 1
 i 1 n
2 2
i i Sd  i 1

Sd  i 1 n
Sd  i 1 n n 1
n 1 n 1
di= X1-X2 diferencia entre
di= X1-X2 diferencia entre di= X1-X2 diferencia entre parejas
parejas parejas
c) Decisión
c) Decisión c) Decisión

Donde: t(), (n1 -1) Donde: t(), (n1 - 1)


Donde: - t(), (n1 -1)

- Si tc cae en RR, - Si tc cae en RR,


entonces rechazo Ho entonces rechazo Ho -Si tc cae en RR,
y acepto H1. y acepto H1. entonces rechazo Ho y
- Si tc cae en RA, - Si tc cae en RA, acepto H1.
entonces afirmo que entonces afirmo que -Si tc cae en RA,
con estos datos no con estos datos no entonces afirmo que con
tomo ninguna tomo ninguna estos datos no tomo
decisión decisión. ninguna decisión.
79
Como a la población de operarios se aplicó el experimento (sin música y con música) y se
considera las dos muestras como dependientes. El proceso para la pruebas de hipótesis se aplica a
continuación:

Grupo I = con música Grupo II = sin música. El planteamiento de hipótesis es:

a) Planteamiento de hipótesis Ho : 1  2 vs H 1 : 1  2

b) Calculo de la estadística de trabajo:

d
i 1 23 i

tc  n  8  8.21
Sd / n 0.99 / 8

Donde:

n
( d i ) 2
( 23) 2
d  i 1
2
i 145 
n 8  0.99
Sd  i 1

n 1 8 1

di= X1-X2 diferencia entre parejas

Para determinar la estadística de trabajo hay que elaborar la tabla 5.3.

Tabla 5.3. Calculo de las sumatorias para la estadística de trabajo

Grupo II Sin= X2 Grupo I Con=X 1 d i = X1 -X2 di2


50 50 0 0
48 51 3 9
46 53 7 49
47 46 -1 1
48 48 0 0
48 49 1 1
49 56 7 49
49 55 6 36

Total 23 145

c) Decisión
t = t(), (n-1). Para determinar el valor de t( ),(n-1)= t(0.05),(7) = 1.895 en la tabla III t-student es
igual 1.895, ubico este valor en la figura. Luego ubicar tc = 8.21 en la figura y cae en la región de

80
rechazo de Ho. Entonces la decisión estadística es: como t c cayó en RR (región de rechazo de Ho),
entonces rechazo Ho y acepto H1.
Conclusión. la música incrementa el rendimiento laboral de los operarios en las empresa

5.4. PRUEBA DE HIPÓTESIS PARA TRES O MAS MEDIAS


POBLACIONALES. ( 1, 2, 3,........,K). MUESTRAS INDEPENDIENTES.
ANALISIS DE VARIANZA. –ANOVA-

Cuando existen tres o más poblaciones a los cuales están interesado en determinar si en las
poblaciones (tratamiento) existen diferencias significativas entre los tratamiento, hay que recurrir a
un modelo estadístico denominado el análisis de varianza (ANOVA). El análisis de varianza se utiliza
para probar existen diferencias significativas entre los tratamiento.

Cuando se ha probado que existen diferencias significativas entre los tratamiento, hay que aplicar
una segunda prueba (Scheffe, Rangos múltiple de Duncan, Tukey, etc) con el fin de determinar
cuales medias o tratamientos son los que presentan esas diferencias significativas y cuales no las
presentan. A continuación se describe el modelo.

a) Planteamiento de Hipótesis

Ho : 1 = 2 = 3 ..... = k vs H1 : no todas 1 = 2= 3 ....... = k

En significancia el planteamiento de hipótesis es:

Ho : No existen diferencias significativas entre los tratamientos vs

H1 : Existen diferencias significativas entre los entre los tratamientos

b) Estadística de trabajo: Para determinar la estadística de trabajo notada por Fc, hay que
elaborar la tabla de ANOVA (tabla 5.4).
81
Tabla 5.4. Tabla de Anova.
Fuente de Suma de Grados libertad Suma de cuadrado Estadística Fc
variación cuadrado medios
Entre SCE K-1 CME Fc
tratamientos

Dentro SCD n–K CMD


Tratamientos
Total SCT n–1

El proceso de cálculo de la tabla de ANOVA los datos muestrales deben aparecer de la siguiente
forma (tabla 5.5).

Donde :
K = total de tratamientos o grupos
i = variación de la fila i = 1,2,..................nj
j = variación de columnas j = 1,2,3...............K
nj = Es el número de observaciones para cada tratamiento o grupo.
n = es el número total de observaciones
Ti = Indica sumar todas las observaciones para cada tratamiento o grupo respectivo
Ti 2 = Indica elevar al cuadrado el total de cada columna o tratamiento
T = suma de todos las observaciones
T = T1 + T2 +T3 + .............. + TK
T2 = Indica elevar al cuadrado el T.

Tabla 5.5. Símbolos de datos reales

G1 G2 G3 …… GK
X11 X12 X13 …… X1K

X21 X22 X23 …… X2K


X31 X32 X33 …… X3K

X41 X42 X43 …… X4K


…. …. …. …… ….
…. …. …. …… ….
Xn11 Xn12 Xn13 …… XnK
T2 T3 ……… TK
T1

82
 K T j2  T2
SCE     Donde:
 j1 n j  n
 
K T j2
n
j 1 j
= Indica sumar cada cociente Tj2 / nj de cada tratamiento o grupo.

T2 /n = Indica hacer cociente (dividir) entre T2 y n


n K j k T2
SCD  ( X i2, j )   o SCD = SCT - SCE
j

i 1 j 1 j 1 n j

ni ni
T2
SCT  ( X ij2 )  Donde: ( X ij ) = Indica sumar cada observación al cuadrado.
2

i 1 n i 1

SCE SCD CME


CME  CMD  FC 
K 1 nK CMD

c) Decisión

 Si Fc > Ftabla, entonces rechazo Ho y acepto H1.


 En caso contrario acepto Ho
Nota: el Ftabla, está en apéndice (tabla V, VI ) de la distribución F. El manejo es de la siguiente
forma:

Para un nivel de significancia especificado () en la primera fila se localiza el número de


tratamientos menos 1 ( K-1) y por la primera columna se localiza el (n – K). La notación general
para la Ftabla, es: Ftabla, = F(), [(k-1),(n-k)],

Ejemplo. La Cámara de Comercio de Neiva quiere probar que existen diferencias significativas entre
las ventas promedios diarias de las tiendas en Neiva por estrato (Alto, medio y bajo) Durante
varios meses se observó las ventas diarias y se obtuvo los siguientes resultados.

Tabla 5.6. Ventas diarias en cientos de dólares en 15 tiendas por estrato.2009


Bajo Medio Alto
15 15 19
10 11 18
16 12 16
5 6 11
11 12 20

Como se tiene tres grupos de tiendas hay que aplicar la prueba de hipótesis para tres o más
medias.

a) Planteamiento de Hipótesis
Ho : 1 = 2 = 3 vs H1 : no todas 1 = 2 = 3 . Otra forma es:
Ho : No existen diferencias significativas en las ventas diarias de las tiendas por estrato vs
H1 : Existen diferencias significativas en las ventas diarias de las tiendas por estrato

83
b)Estadística de trabajo

Para determinar la estadística de trabajo notada por Fc, hay que elaborar la tabla 5.7 de ANOVA

Tabla 5.7. Tabla de Anova para las ventas diarias en dólares en 15 tiendas por estrato
FUENTE DE VARIACION SUMA DE GRADOS CUADRADO ESTADÍSTICA Fc
CUADRADO LIBERTAD MEDIOS
ENTRE ESTRATO SCE K-1 CME Fc

DENTRO ESTRATO SCD n-K CMD

TOTAL SCT n-1

El proceso de cálculo de la tabla 5.7 de ANOVA se utilizan los datos muestrales de la tabla 5.6 y se
obtiene la tabla 5.8. Donde :

K = total de tratamientos ( estrato) = 3 i = variación de la fila


i = 1,2,...............nj j = variación de columnas
j = 1,2,3...............K = 1,2, 3
TI = suma total de valores de cada tratamiento o grupo
TI = 50TI = 56 TI = 84
T = suma de todos los valores observados. T = T1 + T2 +T3 = 50 + 56 + 84 = 190
n = n1 + n2 +n3 = 5 + 5 + 5 = 15. es el número total de observaciones

Tabla 5.8. Ventas diarias en dólares en 15 tiendas por estrato


Bajo Medio Alto
15 15 19
10 11 18
16 12 16
5 6 11
11 12 20
T1 = 57 T2 = 56 T3 =84 T=197

n1 = 5 n2 = 5 n3 =5 n=15

 K T j2  T 2  3 T j2  T 2
SCE      SCE    
 j 1 n j  n  j 1 n j  n
   
T 2
T 2
T  T
2 2
 57 2
56 2 84 2  197 2
SCE   1  2  3          2688.2  2587.27  100.93
 n 1 n 2 n3  n  5 5 5  15
ni
T2
SCT  ( X ij2 ) 
i 1 n

84
SCT = (152+152+192+102+112+182+16+122+162+52+62+112+112+122+202)– (2587.27)

SCT= 2859 – 2587.27 = 271.73

Como SCT = SCE + SCD,  SCD = SCT – SCE

SCD = SCT - SCE = 271.73 -100.93 = 170.8

SCE 100.93 SCD 170.8


CME   CME   50.47 CMD   CMD   14.23
K 1 2 nK 12
CME 50.47
FC   FC   3.55
CMD 14.23

Con la información resultante de la tabla 5.8 se elabora la tabla 5.9.

Tabla 5.9. Tabla de Anova para las ventas diarias (dólares) de tiendas por estrato.
SUMA DE GRADOS CUADRADO ESTADÍSTICA
FUENTE DE VARIACION
CUADRADO LIBERTAD MEDIOS Fc

ENTRE ESTRATO 100.93 2 50.47 Fc=3.55

DENTRO ESTRATO 170.8 12 14.23

TOTAL 271.73 14

C) Decisión

 Si Fc > Ftabla, entonces rechazo Ho y acepto H1.


 En caso contrario acepto Ho

Nota: el Ftabla, está en la tabla de la distribución F. El manejo es de la siguiente forma:

Para un nivel de significancia especificado (= 0.05) en la primera fila de la tabla V se localiza el
número de tratamientos menos 1 ( K-1= 3-1=2) y por la primera columna se localiza el (n – K =
15-3=12). La notación general para la Ftabla, es: Ftabla, = F(), [(k-1),(n-k)] = F(0,05), [(2),(12)] = 3,89
Como Fc > Ftabla, ( 3.55 ‹ 3,89 ) entonces acepto Ho.

Conclusión. No existen diferencias diferencia significativas de las ventas diarias de las tiendas en
los diferentes estratos.

85
EJERCICIOS SECCION 5.3 – 5.4

1. Una compañía produce cuatro tipos de bombillas para salas de cirugías A , B, C, D y desea
probar si existen diferencias significativas en la durabilidad de las bombillas con un nivel de
significancia de 5%. Toman muestras aleatorias para las bombillas A, B, C, D ,de tamaño n A = 5
nB = 9 nC = 7 nD= 5 y se obtienen los siguientes resultados:

BOMBILLA DURACION EN HORAS

A 12 18 14 15 16
B 60 65 64 68 70 74 75 74 74
C 13 15 18 13 16 14 15
D 15 18 18 19 17

2. Un Máster en veterinaria quiere probar que existen diferencias significativas entre los pesos de
los pollos de tres razas de pollo, con un nivel de significancia de 1%. Durante 45 días se les
suministro el mismo concentrados. Los pesos en libras son:

PESO DE LOS POLLOS (LIBRAS)


Raza A Raza B Raza C
3,0 3,5 3.6
3,6 3,8 3.7
3,7 3,8 3.8
4.0 4.1 3.7
4.2 3.5 4.0
6.0 3.7 3.8
6.3 3.8 3,9

3. Se desea comparar a tres sicólogos con relación con la duración (en horas) de tratamientos
aplicados a 24 pacientes (8 pacientes por sicólogos) para un mismo comportamiento. Los
resultados están está a continuación.

SICO 1 4 5 5 4 6 4 5 4
SICO 2 4 5 4 3 4 3 4 2
SICO 3 5 7 6 7 7 7 4 6

Existe diferencia significativas entre el tiempo de tratamientos aplicados por los sicólogos (nivel de
significancia 5 %).
4. Un investigador de mercados quiere probar que existen diferencias significativas entre tres tipos
de promociones para incrementar las ventas en el hipermercado, con un nivel de significancia 5 %.
El investigador de mercados realiza el experimento en 15 hipermercado. Realizo las tres
promociones (A, B, C) en los 15 hipermercados seleccionados al azar de diferentes municipio y en
un día especifico. El incremento en las ventas (Euros) están a continuación.

86
Tipo de promoción Incremento en las ventas (miles de Euros)
A 70 75 73 72
B 55 57 60 60 59
C 50 55 55 60 65 60

5. La siguiente tabla de anova, probar si existen diferencias significativas entre los grupos o
tratamientos.
TABLA DE ANOVA.
FUENTE DE VARIACION SUMA DE GRADOS CUADRADO ESTADÍSTICA Fc
CUADRADO LIBERTAD MEDIOS
Entre tratamientos 180 4
Dentro de tratamientos 120 20
Total

6. Los siguientes datos son los tiempos que tardan dos grupos de estudiantes de ingeniería
industrial para responder un examen de estadística inferencial.

Grupo Tiempo minino(minutos)


I 100 84 96 107 89
II 79 163 95 132 91

Pruebe que el tiempo de duración promedio para responder el examen del grupo I es mayor que el
de grupo II.

7. En una escuela se escogieron 10 niños al azar que tenia similitud de inteligencia y preparación.
A cada niño se evaluó su lectura en puntos. Después fueron enseñando a leer aplicando un nuevo
método. Terminado el curso se evalúo su lectura en puntos y se obtuvo los siguientes resultados.

Método Puntos
Inicio 65 68 70 63 64 65 64 66 68 67
Nuevo método 66 70 74 67 65 68 69 69 72 71

Pruebe que el nuevo método de lectura aumento el rendimiento en los niños.

8. La empresa TLT cuenta con un curso de capacitación para aumentar el rendimiento de las
importaciones con un nivel de significancia del 1%. El gerente va a determinar, sí existe
diferencia significativas en el rendimiento de las importaciones al darle la capacitación al personal.
Para ello se forma un grupo de 7 empleados y le mide cuánto está importando antes de empezar
el curso. Durante tres meses le da la capacitación para importar. Luego a este mismo grupo
nuevamente observa cuánto está importando. Los resultados se muestran a continuación (en miles
de artículos importados).

87
Aplicación Artículos importados (en miles de artículos )

Antes del curso 3 5 6 5 8 9 8


Después del curso 4 5 12 7 11 6 12
9. Un empresario quiere probar que los salarios de los contadores públicos hombres son mejores
que los salarios de los contadores públicos de sexo femenino. Selecciona 50 contadores públicos
hombres y 60 contadores públicos mujeres y obtuvo un salario promedio de $2.250.000 y
$2.000.000 con una desviación estándar de $70.000 y $90.000 respectivamente. Nivel de
significancia 1%
10. Un zootecnista está interesado en determinar la efectividad del concentrado B con respecto al
concentrado A para aumentar el peso de los cerdos. Durante seis meses se alimentó con
concentrados diferentes a cada grupos de cerdo, obteniendo los siguientes resultados. (nivel de
significancia 4%)

CONCENTRADO PESO PROMEDIO Desviación estándar (Kg) No. De cerdos


A 80 5 39
B 90 6 34

11. Un publicista está interesado en mostrar que el comercial de televisión que presenta una
modelo es más atractivo que un comercial que presenta a un sacerdote. Le enseño ambos
comerciales a 10 televidentes y solicito que los calificara en una escala de 1 a 50 . Los resultados
son los siguientes. Nivel de significancia del 5%

Comercial Calificación de los televidentes (puntos)


Modelo 40 39 45 48 40 46 46 42 43 49
Sacerdote 35 36 38 37 36 38 30 32 34 32

12. En un país, un ingeniero industrial quiere probar que los ingenieros electrónicos tienen mejor
rendimiento universitario que los ingenieros industriales en las universidades privadas. Para probar
esta afirmación el ingeniero industrial selecciona al azar 70 ingenieros electrónicos y 60 ingenieros
industriales. A estos ingenieros les pregunto ¿ cuantos semestres estudiaron en la universidad para
obtener el título profesional?. Los resultados están a continuación.

Carrera Ingenieros Promedio de semestres Varianza


Ingeniería Electrónica 70 48 2
Ingeniería Industrial 60 60 3
Nivel de significancia 5%.

13. Un nuevo tratamiento de pasto se quiere probar para disminuir el colesterol a los porcinos. Se
le tomo el colesterol a 9 cerdos antes y después de aplicado el tratamiento. Los resultados de
colesterol fueron los siguientes:

Tratamiento Nivel de colesterol


Antes 150 148 152 145 158 143 144 183
Después 148 130 136 129 160 113 104 150

88
APENDICES

89
APENDICES
APENDICE A. Tablas

APENDICE B. Bibliografía

APENDICE C. Respuestas a ejercicios


seleccionados

90
APENDICE A.

LISTA DE TABLAS

Tabla I. Distribución exponencial


Tabla II. Distribución Normal estándar
Tabla III. Distribución T- student´s
Tabla IV. Dígitos aleatorios
Tabla V. Distribución F
Tabla VI. Distribución F

91
Tabla I. Distribución Exponencial

La tabla da la probabilidad de observar un valor de T, F(T)=P( T  t ) y y un T


especifico.

_____________________________________________________________
T F(T) T F(T) T F(T) T F(T)
_____________________________________________________________
0,0 0,000 2,5 0,918 5,0 0,9933 7,5 0,99945
0,1 0,095 2,6 0,926 5,1 0,9939 7,6 0,99950
0,2 0,181 2,7 0,933 5,2 0,9945 7,7 0,99955
0,3 0,259 2,8 0,939 5,3 0,9950 7,8 0,99959
0,4 0,330 2,9 0,945 5,4 0,9955 7,9 0,99963
0,5 0,393 3,0 0,950 5,5 O,9959 8,0 0,99966
0,6 0,451 3,1 0,955 5,6 0,9963 8,1 0,99970
0,7 0,503 3,2 0,959 5,7 0,9967 8,2 0,99972
0,8 0,551 3,3 0,963 5,8 0,9970 8,3 0,99975
0,9 0,593 3,4 0,967 5,9 0,9973 8,4 0,99978
1,0 0,632 3,5 0,970 6,0 0,9975 8,5 0,99980
1,1 0,667 3,6 0,973 6,1 0,9978 8,6 0,99982
1,2 0,699 3,7 0,975 6,2 0,9980 8,7 0,99983
1,3 0,727 3,8 0,978 6,3 0,9982 8.8 0,99985
1,4 0,753 3,9 0,980 6,4 0,9983 8,9 0,99986
1,5 0,777 4,0 0,982 6,5 0,9985 9,0 0,99989
1,6 0,798 4,1 0,983 6,6 0,9986 9,1 0,99989
1,7 0,817 4,2 0,985 6,7 0,9988 9,2 0,99990
1,8 0,835 4,3 0,986 6,8 0,9989 9,3 0,99991
1,9 0,850 4,4 0,988 6,9 0,9990 9,4 0,99992
2,0 0,865 4,5 0,989 7,0 0,9991 9,5 0,99992
2,1 0,878 4,6 0,990 7,1 0,9992 9,6 0,99993
2,2 0,889 4,7 0,991 7,2 0,9993 9,7 0,99994
2,3 0,900 4,8 0,992 7,3 0,9993 9,8 0,99994
2,4 0,909 4,9 0,993 7,4 0,9993 9,9 0,99995
_____________________________________________________________

92
Tabla II. Distribución Normal Estándar

P(Zi  Z  0) P(0  Z  Zi)


Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0369
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0,2422 0.2454 0.2486 0.2518 0.2549
0.7 0.2580 0.2612 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49897 0.49900
3.1 0.49903 0.49906 0.49910 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929
3.2 0.49931 0.49934 0.49936 0.49938 0.49940 0.49942 0.49944 0.49946 0.49948 0.49950
3.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.49960 0.49961 0.49962 0.49964 0.49965
3.4 0.49966 0.49968 0.49969 0.49970 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976
3.5 0.49977 0.49978 0.49978 0.49979 0.49980 0.49981 0.49981 0.49982 0.49983 0.49983
3.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989
3.7 0.49989 0.49990 0.49990 0.49990 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992
3.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995
3.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997

93
Tabla III. Distribución t de Student
_______________________________________
Nivel de significación para prueba de una cola
___________________________________________________
0.10 0.05 0.025 0.01 0.005
___________________________________________________
Nivel de significación para prueba de dos colas
___________________________________________________
g.l. 0.20 0.10 0.05 0.02 0.01
___________________________________________________
1 3.078 6.3138 12.706 31.821 63.657
2 1.886 2.9200 4.3027 6.965 9.9248
3 1.638 2.3534 3.1825 4.541 5.8409
4 1.533 2.1318 2.7764 3.747 4.6041
5 1.476 2.0150 2.5706 3.365 4.0321
6 1.440 1.9432 2.4469 3.143 3.7074
7 1.415 1.8946 2.3646 2.998 3.4995
8 1.397 1.8595 2.3060 2.896 3.3554
9 1.383 1.8331 2.2622 2.821 3.2498
10 1.372 1.8125 2.2281 2.764 3.1693
11 1.363 1.7959 2.2010 2.718 3.1058
12 1.356 1.7823 2.1788 2.681 3.0545
13 1.350 1.7709 2.1604 2.650 3.0123
14 1.345 1.7613 2.1448 2.624 2.9768
15 1.341 1.7530 2.1315 2.602 2.9467
16 1.337 1.7459 2.1199 2.583 2.9208
17 1.333 1.7396 2.1098 2.567 2.8982
18 1.330 1.7341 2.1009 2.552 2.8784
19 1.328 1.7291 2.0930 2.539 2.8609
20 1.325 1.7247 2.0860 2.528 2.8453
21 1.323 1.7207 2.0796 2.518 2.8314
22 1.321 1.7171 2.0739 2.508 2.8188
23 1.319 1.7139 2.0687 2.500 2.8073
24 1.318 1.7109 2.0639 2.492 2.7969
25 1.316 1.7081 2.0595 2.485 2.7874
26 1.315 1.7056 2.0555 2.479 2.7787
27 1.314 1.7033 2.0518 2.473 2.7707
28 1.313 1.7011 2.0484 2.467 2.7633
29 1.311 1.6991 2.0452 2.462 2.7564
30 1.310 1.6973 2.0423 2.457 2.7500
35 1.3062 1.6896 2.0301 2.438 2.7239
40 1.3031 1.6839 2.0211 2.423 2.7045
45 1.3007 1.6794 2.0141 2.412 2.6896
50 1.2987 1.6759 2.0086 2.403 2.6778
60 1.2959 1.6707 2.0003 2.390 2.6603
70 1.2938 1.6669 1.9945 2.381 2.6480
80 1.2922 1.6641 1.9901 2.374 2.6388
90 1.2910 1.6620 1.9867 2.368 2.6316
100 1.2901 1.6602 1.9840 2.364 2.6260
120 1.2887 1.6577 1.9799 2.358 2.6175
140 1.2876 1.6558 1.9771 2.353 2.6114
160 1.2869 1.6545 1.9749 2.350 2.6070
180 1.2863 1.6534 1.9733 2.347 2.6035
200 1.2858 1.6525 1.9719 2.345 2.6006
 1.282 1.645 1.96 2.326 2.576
___________________________________________________
94
Tabla IV. Dígitos aleatorios
85967 73152 14511 85285 36009 95892 36962 67835 63314 50162
07483 51453 11649 86348 76431 81594 95844 83673 82501 41546
96283 01898 61414 83525 04231 13604 75339 11730 85423 60698
49174 12074 98551 37895 93547 24769 09404 76548 05393 96770
97366 39941 21225 93629 19574 71565 33413 56087 40875 13351
90474 41469 16812 81542 81652 45554 27931 93994 22375 00953
28599 64109 09497 76235 41383 31555 12639 00619 22909 29563
25254 16210 89717 65997 82667 74624 36348 44018 64732 93589
28785 02760 24359 99410 77319 73408 58993 61098 04393 48245
84725 86576 86944 93296 10081 82454 76810 52975 10324 15457
41059 66456 47679 66810 15941 84602 14493 65515 19251 41642
67434 41045 82830 47617 36932 46728 71183 36345 41404 81110
72766 68816 37643 19959 57550 49620 98480 25640 67257 18671
92079 46784 66125 94932 64451 29275 57669 66658 30818 58353
29187 40350 62533 73603 34075 16451 42885 03448 37390 96328
74220 17612 65522 80607 19184 64164 66962 82310 18163 63495
03786 02407 06098 92917 40434 60602 82175 04470 78754 90775
75085 55558 15520 27038 25471 76107 90832 10819 56797 33751
09161 33015 19155 11715 00551 24909 31894 37774 37953 78837
75707 48992 64998 87080 39333 00767 45637 12538 67439 94914
21333 48660 31288 00086 79889 75532 28704 62844 92337 99695
65626 50061 42539 14812 48895 11196 34335 60492 70650 51108
84380 07389 87891 76255 89604 41372 10837 66992 93183 56920
46479 32072 80083 63868 70930 89654 05359 47196 12452 38234
59847 97197 55147 76639 76971 55928 36441 95141 42333 67483
31416 11231 27904 57383 31852 69137 96667 14315 01007 31929
82066 83436 67914 21465 99605 83114 97885 74440 99622 87912
01850 42782 39202 18582 46214 99228 79541 78298 75404 63648
32315 89276 89582 87138 16165 15984 21466 63830 30475 74729
59388 42703 55198 80380 67067 97155 34160 85019 03527 78140
58089 27632 50987 91373 07736 20436 96130 73483 85332 24384
61705 57285 30392 23660 75841 21931 04295 00875 09114 32101
18914 98982 60199 99275 41967 35208 30357 76772 92656 62318
11965 94089 34803 48941 69709 16784 44642 89761 66864 62803
85251 48111 80936 81781 93248 67877 16498 31924 51315 79921
66121 96986 84844 93873 46352 92183 51152 85878 30490 15974
53972 96642 24199 58080 35450 03482 66953 49521 63719 57615
14509 16594 78883 43222 23093 58645 60257 89250 63266 90858
37700 07688 65533 72126 23611 93993 01848 03910 38552 17472
85466 59392 72722 15473 73295 49759 56157 60477 83284 56367
52969 55863 42312 67842 05673 91878 82738 36563 79540 61935
42744 68315 17514 02878 97291 74851 42725 57894 81434 62041
26140 13336 67726 61876 29971 99294 96664 52817 90039 53211
95589 56319 14563 24071 06916 59555 18195 32280 79357 04224
39113 13217 59999 49952 83021 47709 53105 19295 88318 41626
41692 17622 18994 98283 07249 52289 24209 91139 30715 06604
54684 53645 79246 70183 87731 19185 08541 33519 07223 97413
89442 61001 36658 57444 95388 36682 38052 46719 09428 94012
36751 16778 54888 15357 68003 43564 90976 58904 40512 07725
98159 02564 21416 74944 53049 88749 02865 25772 89853 88714

95
Tabla V. Distribución F. Valores críticos a un nivel de significación del 5% (0.05)
K-1
n-k 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 Inf.

1 161 200 216 225 230 234 2,37 239 241 242 244 246 248 249 250 251 252 253 254

2 18,5 19,0 19,2 19,2 19,3 19,3 19,4 29,4 19,4 19,4 19,4 19,4 19,4 19,5 19,5 19,5 15,5 19,5 19,5

3 10,1 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53

4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,76 5,63

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,38

6 5,99 5,14 4,76 4,53 4,39 4,28 4,25 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,96 2,90 2,85 2,79 2,75 2,65 2,61 2,70 2,53 2,49 2,45 2,40

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21

14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01

17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 5,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96

18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92

19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 1,12 2,08 2,04 1,99 1,95 1,90 1,84

21 4,30 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81

22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78

23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76

24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,73

30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62

40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51

60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,81 1,75 1,70 1,65 1,59 1,53 1,17 1,39

120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,60 1,55 1,50 1,49 1,14 1,25

Inf 3,81 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00

96
Tabla VI. Distribución F. Valores críticos a un nivel de significación del 1% (0.01)
n-k
k-1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 Inf.

1 4052 5000 5403 5625 5764 5859 5928 5982 6023 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366

2 98,5 99,9 99,2 99,2 99,3 99,3 99,4 99,4 99,4 99,4 99,4 99,4 99,4 99,5 99,5 99,5 99,5 99,5 99,5

3 34,1 30,80 29,50 28,70 28,20 27,90 27,70 27,50 27,30 27,20 27,10 26,90 26,70 26,60 26,50 26,40 26,30 26,02 26,10

4 21,20 18,00 16,70 16,70 15,50 15,20 15,00 14,80 14,70 14,50 14,40 14,20 14,00 13,90 13,80 13,70 13,70 13,60 13,50

5 16,30 13,30 12,10 11,40 11,00 10,70 10,50 10,30 10,20 10,10 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02

6 13,70 10,90 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88

7 12,20 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65

8 11,30 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86

9 10,60 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31

10 10,00 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91

11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,69 3,60

12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,45 3,36

13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,25 3,17

14 8,86 6,51 5,56 5,040 4,70 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,09 3,00

15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,96 2,87

16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,55 3,41 3,26 3,18 3,10 3,02 2,93 2,84 2,75

17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,75 2,65

18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,37 3,23 3,08 3,00 2,92 2,84 2,75 2,66 2,57

19 8,19 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,30 3,15 3,00 2,92 2,84 2,76 2,67 2,58 2,49

20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,52 2,42

21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,17 3,03 2,88 2,80 2,72 2,64 2,55 2,46 2,36

22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,41 3,35 3,26 3,12 2,98 2,83 2,75 2,67 2,58 2,50 2,40 2,31

23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,07 2,93 2,78 2,70 2,62 2,54 2,45 2,35 2,26

24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,31 2,21

25 7,77 5,57 4,68 4,18 3,86 3,63 3,46 3,32 3,22 3,13 2,99 2,85 2,70 2,62 2,53 2,45 2,36 2,27 2,17

30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,11 2,01

40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,92 1,80

60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,73 1,60

120 6,85 4,79 3,95 3,48 3,70 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,53 1,38

Inf. 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,32 1,00

97
APENDICE B.

Bibliografía.

 BERENSON LEVINE. Estadística básica en Administración. Conceptos y


 HANKE Y REITSCH. Estadística para los negocios. Editorial Irwin. 1995. Segunda
edición.
 HWONNACOTT TOMAS Y RONALT. Introducción a la Estadística. Editorial Limusa.
2002. Segunda edición
 KASMIER LEONARD. Estadística Aplicada a la Administración y la Economía.
Editorial Schaum 1978. Segunda edición
 MARTINEZ BENCARDINO CIRO. Estadística. Apuntes y 614 problemas resueltos.
Editorial ECOE. 1.987. Segunda edición
 MARTINEZ BENCARDINO CIRO. Estadística y Muestreo.. Editorial ECOE. 2005.
Decimo segunda edición.
 MASON DOUGLAS Y OTROS. Estadística para la Administración y la Economía. .
Editorial Mcgraw Hill. 1.980. Primera edición
 MILL RICHARD L. Estadística para Economía y Administración. Editorial Mcgraw
Hill. 1.980. Segunda edición
 MONTAÑA RODRIGUEZ JOAQUIN. Estadística Aplicada a la Medicina Veterinaria.
Editorial Otis. Primera edición. 2000
 MURRAY E. SPIEGEL. Estadística. Editorial serie Schaum. 1978
 PEREZ CESAR. Estadística aplicada a través de Excel. Editorial Pearson . 2002
Primera Edición.
 REMINGTON RICHARD. Estadística Biométrica y Sanitaria. Editorial Prentice/may
Internacional. 1974. Primera edición.
 STELL TORRIE. Bioestadística. Editorial Mcgraw Hill. 1.980. Segunda edición
 WALPOLE RONALD Y OTRO. Porbabi9lidad y Estadística. . Editorial Mcgraw Hill.
1.992. Cuarta edición
 WAYNE DANIELS. Bioestadística. Editorial Fondo Educativo Interamericano
S.A. 1.988.
 ZUWAYLIF FADIL. Estadística general aplicada. Editorial. Fondo Educativo
Interamericano S.A. 1.977. Primera edición

98
APENDICE C.

Respuestas a ejercicios seleccionados

CAPITULO I

Sección 1.1

1) a) 0.86 b) 0.13
2) a) 0.34 b) 0.70 c) 0.04 d) 0.66 e) 0.68 f) 0.88 g) 0.05 h)
0.79
3) S={v,m,p} donde: v = verde m= madura p= podrida
4) a) 0.41 b) 0.54 c) 0.07 d) 0.10 e) 0.665 f) 0.743 g) 0.25
5) S={dd,dndd,dndn,dnnd,dnnn,ndd,ndnd,ndnn,nndd,nndn,nnnn,nnnd }
6) 0.50
7) S={t/ 0 ≤ t ≤ n} Donde t= tiempo de espera en segundos
8) 0.43
9) 0.535
10) 0.67

Sección 1.2 – 1.3

1) a) 0.6 b) 0.32
2) 0.09
3) a) 0.20 b) 0.25
4) 2730
5) 210
6) a) 0.05 b) 0.06
7) 0.87
8) 0.90
9) a) 0.17 b) 0.05
10) a) 0.06 b) 0.41
11) a) 0.12 b) 0.06
12) 0.028
13) a) 0.09 0.38

Sección 1.4

1) $50
2) µ = 17.8 σ = 1.28
99
3) µ = 23 σ = 10.04

Sección 1.5.1 - 1.5.2.

1) 0.0045
2) a) 3.645*10-7 b) 9.1*10-09 c) 9.1*10-09
3) a) 0.0098 b)0 .612 c) 0.082 d) 0.989 e) 6.37*10-13 f) 1
4) a) 0.14 b)0.07 c)0.09 d) 0.09 e) 0.91 f) 0.98
5) 0.125
6) a) 4.210*10-10 b) 2.900*10-12 c) 9.357*10-14 d) 1 e) 1 f) 2.807*10-12
7) a) 30 b) 5.47
8) a) 0.135 b) 0.68 c) 0.135 d) 0.999
9) a) 0.216 b) 0.784 c) 0.192 d) 0.028 e) 2.4*10-18 f) 0.24 g)
0.4849.
12) 0.018
13) 0.1024

Sección 1.5.3 - 1.5.5.

1) 0.9975
2) 0.086
3) 0.141
5) a) 0.3409 b) 0.11 c) 0.0588
6) 0.96
7) µ = 2.57 σ = 0.715
8) a) 0.0.3085 b) 0.8413 c) 06687
9) 561800
10) 55.65%
11) 0.97585
12) σ = 5.5 euros
13) a) 2.28% b) 74.95%
14) 23020 kilómetros
15) a) 2.28% b) 15.87% c) 2.28% d) 93.32%
16) a) 84.13% b) 30.85% c) 47.72% d) 77.45% e) 7.04 años f) 4.66
años

CAPITULO II

1) a) 0.854 b) 0.9922 c) 0.9535 2) 0.8413 3) 0 4) 1


5) 0.3372
6) a) 0.0516 b) 0 7) 0.119 8) 0 9) a) 0.3783 b) 0.5011
11) a) 0.3783 b) 0.2676 c) 0.6772 d) 0.4096
12) a) 0.4761 b) 0.5239 c) 0.1544

100
CAPITULO III

1) a) 62.17 b) 65.50 2) 14.45...15.54


3) si debe comercializarlo 4) 89.3.%.94.6
5) 533.8...548.1 6) 14 .%27 .9
7) No compro el lote de artículo deportivo
8) %.52.56 10) 6.03...7.38
11) 10.%.35 12)
13) 9.67    10.32  14) 25 .52  %  31 .47 
15) 64 .8 %  70.1 16) 48  %  56 
17) 2181 .2   2218,4 

CAPITULO V

Sección 5.1 – 5.2


1) La trampa atrae y mata más del 80% de los ratones.

2) Con estos datos no tomo ninguna decisión.

3) El peso promedio de los docentes de las universidades es diferente a 60 kilos

4) La caja detergente lava en promedio menos de 120 platos

5) El peso promedio de los equinos en el municipio de Yoral es inferior a 400 kilogramos.

6) a) Ho :   10 vs H1 :   10 b) -13.4 c) la maquina embotelladora esta en

control

7) La máquina enlatadora está favoreciendo en peso al consumidor.

8) La máquina está funcionando bien.

10) Con estos datos no tomo ninguna decisión.

11) Menos del 30% de los propietarios de canes de raza lleva su can al veterinario.

101
Sección 5.3 – 5.4

1) Existen diferencias significativas en la durabilidad de las bombillas.

2) No existen diferencias significativas entre los pesos de los pollos

3) Existe diferencia significativas entre el tiempo de tratamientos aplicados por los

sicólogos.

4) existen diferencias significativas entre tres tipos de promociones para incrementar las

ventas en el hipermercado.

6) Con estos datos no se toma ninguna decisión.

7) El nuevo método de lectura aumenta el rendimiento en los niños.

8) Existe diferencias significativas en el rendimiento de las importaciones al darle la

capacitación al personal

9) Los salarios de los contadores públicos hombres son mejores que los salarios de los

contadores públicos de sexo femenino.

10) El concentrado B es más efectivo que el concentrado A

11) El comercial de televisión que presenta una modelo es más atractivo que el comercial

que presenta a un sacerdote.

12) que los ingenieros electrónicos tienen mejor rendimiento universitario que los

ingenieros industriales en las universidades privadas.

13) El nuevo tratamiento de pasto disminuye el colesterol a los porcinos.

102
INDICE
A

Aceptación, región 66, 67,68.


Aleatorio 1,2,3.
Alternativa, hipótesis 66.
Alfa 67.
Análisis de varianza (ANOVA) 81, 82.
factor (tratamiento) 82.
grados de libertad 82.
prueba de Tukey 81.
tabla de Anova 81.
tratamiento 81.

Beta error tipo II 65, 67.


Bibliografía 98.

Combinaciones 10.
Competencias 1, 29, 39, 49, 65.
Confianza, intervalo 41.
para muestras pequeña 42.
para muestras grandes 41.
para una media 41, 42.
para una proporción 44.

Decisión estadística 67, 68.


Desviación estándar 14, 17, 21 .
Distribución 13, 14, 15.
Distribución Binomial 16.
Media 17.
Varianza 17.
Distribuciones continuas 20.
Distribución de muestreo 30.
103
de la media 31.
de la proporción 35.
Distribuciones discretas 16.
Distribución exponencial 20.
Media 21.
Varianza 21.
Tabla 92.
Distribución F 83, 85.
Tabla 96, 97.
Distribución normal 21.
Parámetros 21.
Propiedades 22.
Distribución normal estándar 23.
Aplicaciones 25.
Tabla 93.
Distribución t – de Student 42.
Tabla 94.

Efecto 81.
Efectos de tratamientos 81.
Error estándar de estimación 40.
De la media 31, 41, 42, 43, 49.
De la proporción 35, 49, 50.
Error 47.
máximo admitido 50, 59.
Error de muestreo 33, 37, 50.
Error tipo I 67.
Error tipo II 67.
Espacio muestral 2.
Esperanza matemática 13.
Estadística 30.
inferencial 2, 29.
no paramétricas 66.
paramétricas 66.
Estimación 39.
Puntual 40.
por intervalo de confianza 41.
Estimador 40, 41, 49, 50.

F, distribución 83, 85.

104
G

Grados de libertad 83.


distribución F 85.

Hipótesis alternativa 66.


Hipótesis estadística 66.
Hipótesis nula 66.

Inferencial estadística 2, 29.


Intervalos, estimación por, 41.

Media 22, 30.


error estándar de estimación 31, 41, 42, 43, 49.
estimación puntual 40.
estimación de intervalos para 41.
prueba de hipótesis 67.
Mediana 22.
Moda 22.
Método del valor p 71.
Método en hipótesis 92. 95. 99, 100.
Muestra dependientes 75, 76.
Muestra independientes 75, 76.
Muestral distribución 29.
para la media 31.
para la proporción 35.

Nivel de confianza 51.


Nivel de significancia 67.
Normal estándar 23.

Parámetro 30
Paramétricas 67.

105
Población 30.
Probabilidad 1.
Proporción 2.
distribución muestral 66.
estimación puntual 40.
estimación por intervalo de confianza 44.
Prueba de hipótesis 67, 72, 75, 78, 81.
Análisis de varianza 81.
Duncan, prueba de rangos múltiples 82.
media 68.
para dos medias 75.
no paramétricas 66.

Rangos múltiples de Duncan 81.

Sheffe, prueba 81.

Tabla de dígitos aleatorios 91.


Tabla normal estándar 93.
Tabla t – student 94.
Tabla F 96, 97.
Tasa media 18.
Tipo I y tipo II 67.
Teorema del limite central 8.
Tukey, prueba 82.

Valor de P 72.
Varianza 14, 17, 21, 31, 33, 51.
Varianza, análisis 81.

106

También podría gustarte