Intervalos de Confianza para Dos Poblaciones PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Intervalos de Confianza: dos poblaciones

1.- Intervalo de Confianza para diferencia de medias de poblaciones


independientes con varianzas conocidas  12 y  22 respectivamente.

Estimador y estadístico:

x1  N ( 1 ;  12 )  12  22
x1  x 2  N ( 1   2 ;  )
x2  N ( 2 ; ) 2
2
n1 n2

El estadístico para este caso es:

( x1  x 2 )  ( 1   2 )
z y tiende a una distribución normal estándar
 12  22

n1 n2

Intervalo de confianza con un nivel de confianza de 1- 

 12  22  12  22
P(( x1  x 2 )  z   1   2  ( x1  x 2 )  z  )  1
2 n1 n2 2 n1 n2

Ejemplo:

Para comparar dos métodos de la enseñanza de las matemáticas, el


tradicional y el nuevo, los datos obtenidos aparecen en la siguiente tabla:

Método Tamaño de la Media muestral Desviación estándar


muestra
Tradicional 64 13 3
Nuevo 60 15 4

a) En base a esta información entregada previamente, encuentre un


intervalo de confianza para la diferencia entre los promedios de los
métodos tradicional y nuevo con un nivel de confianza del 95%.
b) ¿Cree usted que no hay diferencias en los resultados promedios de los
dos métodos?
9 16 9 16
P((13  15)  1,96   1   2  (13  15)  1,96  )  0,95
64 60 64 60
9 16
(13  15)  1,96 
64 60

1
 3,25;0,75 , como podemos observar el cero no
pertenece al intervalo, por lo que podemos concluir que
existen diferencias significativas entre los métodos y como
ambos extremos del intervalo de confianza son negativos,
podemos afirmar que 1   2

2.-Intervalo de Confianza para diferencia de medias de poblaciones normales e


independientes, con varianzas poblacionales desconocidas y suponiendo
igualdad entre ellas  12   22

1 1 1 1
P(( x1  x 2 )  t  , n1  n2  2
Sp   1   2  ( x1  x 2 )  t ,n  n  2 S p  ) 1 
2 n1 n2 2 1 2
n1 n2

(n1  1) s12  (n2  1) s22


S 2

n1  n2  2
p

Ejemplo:

Para comparar el rendimiento de una nueva variedad de uva con la variedad


tradicional, se diseñó un experimento en un viñedo, los pesos en gramos de
10 y 9 racimos de uvas escogidas al azar de ambas variedades se muestran
a continuación:
Variedad nueva: 400 410 420 380 390 410 400 405 405 400
Variedad tradic.: 390 395 380 390 400 380 370 390 380

Asumiendo que los pesos se distribuyen normalmente, con varianzas iguales y


utilizando un intervalo de confianza del 95% para la diferencia de los pesos
promedios por racimo de toda la producción .¿Es válido inferir que las dos
variedades rinden igual?.

1. Solución:

Calculando las medias y varianzas de cada variedad, tenemos:

Variable Mean StDev Variance


vnueva 402.00 11.11 123.33
tradicional 386.11 9.28 86.11

El estimador combinado de la varianza es:

2
(n1  1) s12  (n2  1) s22 (10  1)123,33  (9  1)86,11
S  2
  105,815
n1  n2  2 10  9  2
p

Al calcular la raíz cuadrada a este valor nos queda que sp = 10,2866

1 1 1 1
( x1  x 2 )  t , n1 n2  2
sp  = (402-386,11)  2,11. 10,2866 
2 n1 n 2 10 9

El resultado es (5,917 25,863)

Interpretación: Como el cero no pertenece al intervalo de confianza,


podemos inferir con un 95% de confianza que existen diferencias
significativas entre los pesos medios por racimo de las dos variedades
de uva.

3.-Intervalo de Confianza para diferencia de medias de poblaciones normales e


independientes, con varianzas desconocida y suponiendo diferencia entre ellas
 12   22

Estimador y estadístico:

x1  N ( 1 ;  12 )  12  22
x1  x 2  N ( 1   2 ;  )
x 2  N (  2 ;  22 ) n1 n2

Pero las varianzas son desconocidas. Ello lleva a estimarlas y ha generar un


nuevo estimador para la varianza de diferencia de medias. Consecutivamente
se origina el siguiente estadístico:

( x1  x 2 )  ( 1   2 )
T= que se distribuye como una t-
s12 s 22

n1 n 2
Student con g.l. grados de libertad que se obtiene de la siguiente expresión:

2
 s12 s 22 
  
gl   n1 n2  2
2 2
 s12  1  s2  1
    2 
 n1  n1  1  n2  n2  1

3
Intervalo de confianza:

s12 s 22 s12 s 22
P ( ( x1  x 2 ) - t   1   2  ( x1  x 2 ) + t   )= 1
2
, g .l . n1 n2 2
, g .l . n1 n 2

Ejemplo

Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o


de la marca B . Para estimar la diferencia entre los promedios de desgaste a
través de Km. recorridos, de las dos marcas, se lleva a cabo un experimento
utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se
desgastan, dando como resultado promedio para la marca A 36.300 kilómetros,
con una desviación estándar de 5000 kilómetros y para la marca B 38.100
kilómetros con una desviación estándar de 6100 kilómetros. Calcule un
intervalo de confianza de 95% para la diferencia promedio de las dos marcas,
si se sabe que las poblaciones se distribuyen de forma aproximadamente
normal para la marca A y para la marca B. Asuma que las dos varianzas
poblacionales son distintas.

Resp: [  6551,158; 2851,158 ]

4.- INTERVALO DE CONFIANZA PARA LA  D


(OBSERVACIONES PAREADAS)

Este es un procedimiento de estimación para la diferencia de dos medias


cuando las muestras son dependientes y las varianzas de las dos poblaciones
no necesariamente son iguales.
Las muestras pareadas involucran un procedimiento en el cual varios pares de
observaciones se equiparan de la manera más próxima posible, en términos de
características relevantes. Los dos grupos de observaciones son diferentes
sólo en un aspecto o "tratamiento". Toda diferencia subsiguiente en los dos
grupos se atribuye a dicho tratamiento. Las ventajas de las muestras pareadas
son:
1) Pueden utilizar muestras pequeñas.

2) Se encuentran varianzas más pequeñas.

3) Menos grados de libertad se pierden en el análisis.

4) Resulta un error de muestreo más pequeño (la variación entre


observaciones reduce debido a que corresponden de la forma más próxima
posible).

4
Otro método para utilizar muestras pareadas a diferencia de la situación que se
describió cuando las muestras son independientes, las condiciones de las dos
poblaciones no se signan de forma aleatoria a las unidades experimentales.
Más bien, cada unidad experimental homogénea recibe ambas condiciones
poblacionales; como resultado, cada unidad experimental tiene un par de
observaciones, una para cada población. Por ejemplo, si realizamos una
prueba de una nueva dieta con 15 individuos, el peso antes y después de llevar
a cabo la dieta forman la información de nuestras dos muestras. Estas dos
poblaciones son "antes" y "después" y la unidad experimental es el individuo.
Obviamente las observaciones en un par tienen algo en común. Para
determinar si la dieta es efectiva consideramos las diferencias d 1, d2, ……dn en
las observaciones pareadas. Estas diferencias son los valores de una muestra
aleatoria D1, D2, . . . . . Dn de una población de diferencias que
supondremos distribuidas normalmente con media  D  1   2 y varianza
 D2 . Estimamos  D2 mediante sd2 , la varianza de las diferencias que constituyen
nuestra muestra. El estimador puntual de  D será d

Se puede establecer un intervalo de confianza de (1 -  )100% para  D

- t/2 t/2

P (- t/2 < T < t/2)

Donde : El estadístico

d  D
T= se distribuye como una t de Student con n - 1 grados
sd
n
de libertad

d Sd 
 (d i  d )2
d
i

n n 1

Intervalo de confianza

sd sd
P ( d  t , n 1
  D  d  t , n 1
)  1
2 n 2 n

5
Ejemplo:

Se asume que se tienen puntajes respecto al tiempo empleado en cierta labor


de 10 empleados antes y después de habérseles impartido capacitación
laboral adicional. Establezca un intervalo de confianza del 90% para la media
de la diferencia en los puntajes antes y después de la capacitación.
Los puntajes aparecen en la tabla:
Solución

Datos
Empleado Puntaje antes de Puntaje después de
La capacitación del La capacitación del
empleado empleado di di2
1 9.0 9.2 -0.2 0.04
2 7.3 8.2 -0.9 0.81
3 6.7 8.5 -1.8 3.24
4 5.3 4.9 0.4 0.16
5 8.7 8.9 -0.2 0.04
6 6.3 5.8 0.5 0.25
7 7.9 8.2 -0.3 0.09
8 7.3 7.8 -0.5 0.25
9 8.0 9.5 -1.5 2.25
10 8.0 8.5 -0.5 0.25
7.4 7.9 -5.0 7.38

Encontrar la estimación puntual y la desviación estándar muestral de d.

5
d= = - 0.5 (estimación puntual de  D )
10

d i
2
 nd 2
7,3  10(0,5) 2
s 
2 i 1
=  0,736
n 1
d
9

Determinar los valores de la variable aleatoria t de acuerdo al nivel de


confianza preestablecido

P ( -1.833
 t 1.833 ) = 0.90

6
Encontrar los límites inferiores y superiores dentro de los cuales se encuentra
el parámetro
0.736
Límite superior de confianza  D : -0.5 + ( 1.833) 10 = -0.073

0.736
Límite inferior de confianza D : -0.5 + ( 1.833) 10 = -0.927

Conclusión:

Debido a que se restan los puntajes posteriores al entrenamiento de los


puntajes anteriores al entrenamiento, produciendo valores negativos, se
puede estar 90% seguro de que la media de los puntajes posteriores al
entrenamiento está entre - 0.073 y - 0.927; ello denotaría que hay una
rebaja en los puntajes relativos a los tiempos empleados en cierta labor,
indicando a su vez una mayor eficiencia.

También podría gustarte