PyE2 Unidad2 ML

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 25

Probabilidad y Estadística II

Teoría de Estimación

Material elaborado por:

Lic. Roberto Adriano Páez Giménez

Campus Universitario

San Lorenzo, Paraguay


Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Índice
1. Teoría de Estimación .................................................................................................. 3
1.1. Introducción ................................................................................................................. 3
2. Estimación Puntual ..................................................................................................... 3
2.1. Población...................................................................................................................... 3
2.2. Propiedades de los Estimadores Puntuales ................................................................. 6
3. Estimación por Intervalo ............................................................................................. 6
3.1. Estimación por intervalo de la media a partir de muestras grandes .......................... 7
3.2. Estimación por intervalo de la proporción a partir de muestras grandes................. 15
3.3. Estimación por intervalo para la diferencia de medias de dos poblaciones, a partir
de muestras grandes............................................................................................................. 17
3.4. Estimación por intervalo para la diferencia de proporciones de dos poblaciones, a
partir de muestras grandes................................................................................................... 20
3.5. Intervalo de confianza para la varianza (muestras grandes) ..................................... 23
Bibliografía...................................................................................................................... 25

2 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

1. Teoría de Estimación

1.1. Introducción
Cuando queremos realizar una investigación cualquiera en una población determinada, de la
cual desconocemos sus parámetros, como la media de ingreso por vivienda de la zona
urbana, o la proporción de mujeres con empleo fijo, y la posibilidad de estudiar a toda la
población es muy costosa, requiere mucho tiempo, mucha mano de obra y muchos otros
inconvenientes, entonces tomar una muestra aleatoria de la población es un buen recurso.
De la muestra calculamos una media que será una medida aproximada del verdadero valor
de la media poblacional, así como podemos calcular también una medida aproximada de la
proporción de mujeres mencionada. Cada una de estas aproximaciones recibe el nombre de
Estimación.

La teoría de la inferencia estadística nos indica los procedimientos con los cuales podemos
trabajar con muestras y los datos así obtenidos generalizarlos a toda la población. En esta
temática, la teoría de la estimación nos proporciona fórmulas y propiedades para calcular
valores puntuales para el verdadero valor del parámetro, así como establecer intervalos de
valores posibles para estos parámetros.

2. Estimación Puntual

2.1. Población

Una estimación puntual de un parámetro poblacional desconocido (como puede ser la


media µ, la varianza σ2, la proporción P), es un número que se obtiene de la muestra y que
pretende estimar el verdadero valor de dichos parámetros.

Walpole, Myers, Ye (2007) señalan lo siguiente:

“. . . el valor x del estadístico X , que se calcula a partir de una muestra de tamaño n, es


^ x
una estimación puntual del parámetro poblacional µ. De manera similar p = es una
n
estimación puntual de la verdadera proporción P”

No debemos esperar que un estadístico realice una estimación exacta del parámetro
poblacional, sino que en realidad esperamos que sea un valor que no se aleje mucho.
Siempre estaremos por lo tanto trabajando con un margen de error, error que debemos
controlar y recordar siempre, a la hora de sacar conclusiones y tomar decisiones.

3 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Ejemplo 2.1

La tabla 1 indica, entre otras cosas, el puntaje promedio en matemática de 20 alumnos de un


colegio, seleccionados aleatoriamente y que pertenecen a diferentes grados o cursos. Con
esta información indiquemos:

a) Una estimación puntual del puntaje medio en matemática de todo el colegio


b) Una estimación puntual de la desviación estándar del puntaje medio en matemática
de todo el colegio.
c) Una estimación puntual de la proporción de estudiantes que fuman. Utilice para ello
la información adicional de la tabla

Alumno Puntaje Fuma Alumno Puntaje Fuma


medio en medio en
matemática matemática
1. 4,2 Si 11. 3,1 Si
2. 3,1 No 12. 3,8 Si
3. 2,1 No 13. 3,6 Si
4. 5,0 No 14. 2,5 No
5. 2,3 No 15. 4,2 No
6. 2,4 Si 16. 5,0 No
7. 2,4 No 17. 4,4 No
8. 3,1 Si 18. 1,8 No
9. 4,0 Si 19. 2,1 No
10. 3,2 No 20. 2,6 Si
Tabla 1: datos de la muestra de 20 estudiantes del colegio

Solución

Para estimar la media de puntajes µ, usamos el estadístico X =


∑ i =1
xi
, extraemos de la
n
tabla los veinte puntajes y calculamos el promedio:

4,2 + 3,1 + 2,1 + ...... + 1,8 + 2,1 + 2,6 x = 3,245


x=
20

Observemos que el valor puntual 3,245 es la media de los puntajes en matemática de los
veinte alumnos tomados en la muestra, este valor sin embargo es una aproximación del
promedio µ de todo el colegio. Por lo tanto, es una estimación puntual del parámetro
poblacional.

Destaquemos que con esto no decimos que el promedio de todo el colegio es 3,245 , sino
que esperamos que ese valor desconocido no se aleje mucho de la media muestral.

4 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

El valor de la desviación estándar de los puntajes de toda la población, σ, lo vamos a estimar

∑ (X )
n 2
∧ −X
con el estadístico S = i =1 i

n −1

Con los datos de la tabla y con la media calculada en a), tenemos que


s=
(4,2 − 3,245)2 + (3,1 − 3,245)2 + ...... + (2,1 − 3,245)2 + (2,6 − 3,245)2
20 − 1


s = 0,98 , aproximadamente 1

Esperamos que la desviación estándar del puntaje medio de todos los alumnos del colegio
sea aproximadamente 1 punto.

Para estimar la proporción de estudiantes que fuman, de todo el colegio, utilizamos el


cantidad de estudiantes que fuman
estadístico p =
tamaño de la muestra

Contamos la cantidad de alumnos que fuman, información dada en la tabla 1 y calculamos el


valor de p

8
p= = 0,40
20

Este dato puntual nos indica que la proporción de alumnos fumadores de todo el colegio es
alrededor del 40%.

Medida de Resumen Parámetro Estadístico para la estimación puntual

Media o Promedio µ n

X =
∑ i =1
xi
n

σ2
∑ (x )
2
Varianza ∧2
n
−x
= i =1 i
S
n −1

∑ (x )
Desviación Estándar σ n 2

i =1
−x
S=
i

n −1
Proporción P número de éxitos
p=
n

Tabla 2: Estimadores puntuales

5 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

2.2. Propiedades de los Estimadores Puntuales

Veamos dos propiedades importantes de los estimadores puntuales:

a) Insesgo: Cuando el valor esperado del estadístico muestral es igual al parámetro


poblacional, decimos que ese estadístico es un estimador insesgado del parámetro
poblacional. Esto nos indica que la media de todos los valores posibles del estadístico
debe ser igual al parámetro. Si los estimadores no cumplen con esta condición,
tenemos una gran probabilidad de equivocarnos a la hora de emitir una conclusión
(sobrestimaciones o subestimaciones de las medidas de resumen)

Algunos estimadores insesgados son:

• La proporción muestral “p” como estimador de la proporción poblacional “P”


• La media muestral X como estimador de la media poblacional µ

• La varianza muestral S 2 como estimador de la varianza poblacional σ2

b) Eficiencia: Hablamos de eficiencia cuando tenemos dos o más estimadores


puntuales, siempre preferimos aquel que tenga menor desviación estándar porque
tiende a proporcionar estimaciones más cercanos al parámetro.
Por ejemplo, si tomamos muestras aleatorias de una población y calculamos la media
muestral y la mediana, y luego sus respectivas desviaciones estándar, veremos que la
desviación estándar de las medias muestrales es menor que la desviación estándar
de las medianas. Por lo tanto la media muestral es más eficiente que la mediana.

3. Estimación por Intervalo


En la estimación puntual atribuimos al parámetro un único valor obtenido con los datos
muestrales, y este valor difícilmente coincidirá con el verdadero valor del parámetro, por ello
optamos por la estimación por intervalo.

La estimación por intervalo consiste en atribuir al parámetro desconocido un rango de posibles


valores (información obtenida de la muestra), donde se espera esté contenido el verdadero
valor del parámetro.

Supongamos que estimamos el gasto promedio en pasajes y otros gastos en los que incurren
los estudiantes de la Universidad Nacional de Asunción para acudir a las clases de sus
respectivas carreras. Para ello, se tomó una muestra de 50 estudiantes y la estimación puntual
fue de Gs.1.420.000 .

Pero también imaginemos que existen estudiantes que podrían gastar más o menos que este
valor y para los cuales este valor puntual no es muy adecuado. Es ahí donde evidenciamos la

6 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

importancia de la estimación por intervalo, daremos un rango de valores donde podría


encontrarse el gasto mensual medio de todos los estudiantes.

Para construir el intervalo de confianza (IC), como primer paso, seleccionamos un nivel de
confianza (NC), que es la probabilidad de que el intervalo contenga al verdadero valor del
parámetro. Imaginemos que este NC es del 95%.

Teniendo en cuenta el NC, como segundo paso, calculamos el error estándar de la medición
muestral y a partir de allí el error de la estimación; supongamos que ese error, para nuestro
ejemplo es de Gs. 420.000 .

Finalmente, como tercer paso calculamos los límites del intervalo de confianza:

• Límite inferior (LI) = estimación puntual – error de la estimación

Gs.1.420.000 – Gs. 420.000 = Gs.1.000.000

• Límite superior (LS) = estimación puntual + error de la estimación

Gs.1.420.000 + Gs. 420.000 = Gs.1.840.000

Esto significa que con una confianza del 95%, la media del gasto de cada estudiante está
comprendida entre Gs.1.000.000 y Gs.1.840.000

Figura 1: IC para el gasto medio

Gráfica 1: Límites del IC para el gasto medio

Fuente: http://docentes.educacion.navarra.es/msadaall/geogebra/figuras/normal5b.html

3.1. Estimación por intervalo de la media a partir de muestras grandes

Para el cálculo de probabilidades en la distribución muestral de medias utilizamos la fórmula


x−µ
z= , si de esta fórmula despejamos el valor de µ, tenemos que:
σ
n

σ
µ = x ± z.
n

7 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

σ
x difiere de µ en z. , por ello concluimos que el error de la estimación (E) es:
n

σ
E = z.
n

σ
Y como el cociente se conoce como error estándar de la media (EE), tenemos que el error
n
máximo de la estimación es:

E = z.EE

De esta última fórmula notemos que para calcular debemos conocer el tamaño “n” de la
muestra, la desviación estándar σ de la población y el valor de z.

Para calcular el valor de z establecemos un nivel de confianza y con ese dato buscamos en la
Tabla de la distribución z el valor correspondiente.

Si σ es desconocido, pero la muestra es grande (n>30), utilizaremos s en lugar de σ.

Ejemplo 3.1.1

Se desea estimar la edad promedio de los empleados de una empresa multinacional que cuenta
con miles de empleados. Para la realización de la investigación se tomó una muestra de 250
empleados y se encontró que la edad promedio es de 30 años con una desviación estándar de
5,2 años.

a) ¿Cuál es el error estándar de la media?


b) Estima un intervalo de confianza del 95% para la edad promedio de la población

Solución

El tamaño de la muestra es n = 250



La estimación puntual de la media es x = 30 años y la desviación estándar es s = 5,2 años.

σ ∧
a) El error estándar de la media muestral es EE = , utilizaremos s como σ puesto que
n
n>30

5,2
EE = , de donde obtenemos que EE = 0,3289
250

b) Para estimar el intervalo de confianza necesitamos el valor de z que se corresponda con


el nivel de confianza

8 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Gráfica 2: Límites del IC para la edad promedio

Fuente: http://docentes.educacion.navarra.es/msadaall/geogebra/figuras/normal5b.html

La región sombreada en la gráfica de la distribución normal indica el nivel de confianza del


intervalo que es de 95%=0,95.

Para determinar el valor de z debemos dividir entre dos este nivel de confianza y tendremos
que 0,95 ÷ 2 = 0,475.

Gráfica 3: Valor de Z para un área de 0 a z

Fuente: http://docentes.educacion.navarra.es/msadaall/geogebra/figuras/normal5b.html

Veamos una sección de la Tabla de la distribución Z, dentro de ellas buscamos el valor de


0,475 que es el área que deseamos

9 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Tabla 3: Valor de z para 0,475

Fuente: Levin, R., “Estadística para administración y economía”

Por lo tanto, notamos que el valor de z = 1,96

Ahora podemos calcular el error máximo de la estimación:

E = z.EE = 1,96 . 0,3289

E = 0,6446

Y por lo tanto los límites del IC

LI = x − E LI = 30 − 0,6446 LI = 29,3554

LS = x + E LS = 30 + 0,6446 LS = 30,6446

Tenemos 95% de confianza de que la edad promedio de los empleados de la empresa esté
comprendida entre 29,3554 y 30,6446 años.

O lo que es lo mismo P(29,3354 < µ < 30,6446) = 0,95

Por lo tanto el intervalo de confianza para la media es igual a:

10 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Ejemplo 3.1.2

El dueño de un restaurante recién inaugurado, ha tenido problemas para estimar la cantidad


de comida que debe de hacerse cada día. Por eso decidió determinar el número promedio
de clientes a quienes atienden cada noche, seleccionó una muestra de 49 noches, de las que
lleva abriendo, y obtuvo por resultado una media de 71. La desviación estándar de la
población ha sido establecida como 8,4.

a) ¿Cuál es el error estándar de la media?

b) Realiza una estimación por un intervalo que tenga una probabilidad de 90% de incluir a la
media de la población.

Solución

Tomamos los datos referentes al número medio de clientes atendidos y obtenemos los
siguientes resultados:

Tamaño de la muestra n = 49

Media de la muestra x = 71

Desviación estándar de la población σ = 8,4

El problema nos pide que encontremos una estimación de intervalo con un nivel de
confianza del 90%. El tamaño de la muestra es mayor que 30, calculamos el error estándar
σ
de la media con la ecuación E.E =
n

8,4
E .E = E.E = 1,2
49

Como un nivel de confianza del 90% incluirá 45% del área que se encuentra a ambos lados
de la media de la distribución muestral, podemos buscar en la Tabla de la Distribución Z el
valor correspondiente a 0,45.

11 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Evidenciamos en la tabla que un área de 0,45 corresponde al promedio de los valores de


1,64 y 1,65 , por lo tanto el valor que utilizaremos para determinar los límites del intervalo es
1,64 + 1,65
z= = 1,645
2

Ahora podemos calcular el error máximo de la estimación:

E = z.EE = 1,645 . 1,2

E = 1,974

Tabla 4: Valor de z para 0,45

Fuente: Levin, R., “Estadística para administración y economía”

Y, por lo tanto, los límites del IC

LI = x − E LI = 71 − 1,974 LI = 69,026

LS = x + E LS = 71 + 1,974 LS = 72,974

Tenemos 90% de confianza de que la cantidad promedio de clientes atendidos por día está
comprendida entre 69 y 73, aproximadamente.

O lo que es lo mismo P(69 < µ < 73) = 0,90

12 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Gráfica 4: Límites del IC del 90% para el promedio de clientes

Fuente: http://docentes.educacion.navarra.es/msadaall/geogebra/figuras/normal5b.html

Ejemplo 3.1.3

El departamento de servicio social de una dependencia gubernamental local está interesado


en estimar el ingreso medio anual de 700 familias que viven en una sección de 4 manzanas
de una comunidad. Para ello, se toma una muestra aleatoria de 50 familias y se encuentra
que la media es 1.118.000 guaraníes con una desviación estándar de 95.000 guaraníes.

Determina un intervalo de confianza del 99% para el ingreso medio anual.

Solución

De la muestra aleatoria obtuvimos los siguientes resultados:

Tamaño de la muestra n = 50

Media de la muestra x = 1.118.000



Desviación estándar de la población s = 95.000

Tamaño de la población N = 700



No conocemos la desviación estándar de la población y por tanto utilizaremos s = 95.000
como σ para nuestros cálculos.

σ N −n
Para estimar el error estándar utilizaremos la fórmula E.E = . , así:
n N −1

95.000 700 − 50
E .E = . E.E = 12.955,575
50 700 − 1

Luego consideramos el nivel de confianza del 99%, que incluirá 49,5% del área que se
encuentra a ambos lados de la media de la distribución de muestreo. Observamos la tabla
correspondiente a la distribución Z y buscamos el valor correspondiente a 0,495.

13 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Notamos que para 0,4975 el valor de z corresponde al promedio de 2,57 y 2,58 , por lo
tanto el valor que utilizaremos para determinar los límites del intervalo es
2,57 + 2,58
z= = 2,575
2

El error máximo de la estimación es:

E = z.EE = 2,575 × 12.955,575

E = 33.361

Con ello calculamos los límites del IC

LI = x − E LI = 1.118.000 − 33.361 LI = 1.084.639

LS = x + E LS = 1.118.000 + 33.361 LS = 1.151.361

Para un nivel de confianza del 99%, el ingreso promedio anual está comprendido entre
1.084.639 y 1.151.361 guaraníes.

Tabla 5: Valor de z para 0,495

Fuente: Levin, R., “Estadística para administración y economía”

14 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

En general, decimos que:

3.2. Estimación por intervalo de la proporción a partir de muestras


grandes

Si el estadístico que deseamos estudiar es la proporción de éxitos en una muestra de tamaño


n sacada de una población binomial en la que p es la proporción de éxitos en la
mencionada muestra, entonces los límites de confianza para p vienen dados por:

Límite del Intervalo = proporción muestral ± error de estimación

Error de la estimación (E)

E = z.EE

Error estándar (EE)

p(1 − p)
• EE = , si el muestreo es de una población infinita o finita con reposición
n

p(1 − p) N − n
• EE = . , si el muestreo es de una población finita y sin reposición
n N −1

Ejemplo 3.2.1

Un sondeo de 99 votantes elegidos al azar en un distrito del departamento Central indica


que el 55% de ellos estaban a favor de un cierto candidato. Halla los límites de confianza
para un nivel del 95%.

Solución

Indicamos los datos del problema; n = 99 , p = 0,55

Calculamos el error estándar de la proporción

p(1 − p) 0,55.(1 − 0,55)


EE = EE = EE = 0,05
n 99

Seguidamente consideramos el nivel de confianza del 95%, que incluirá 47,5% del área que
se encuentra a ambos lados de la proporción media de la distribución de muestreo.
Observamos la tabla correspondiente a la distribución Z y buscamos el valor correspondiente
a 0,475. Ya hicimos este cálculo en el ejemplo 2 y vimos que z = 1,96 .

15 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Luego hallamos el error máximo de la estimación:

E = z.EE = 1,96 × 0,05

E = 0,098

Finalmente calculamos los límites del IC

LI = p − E LI = 0,55 − 0,098 LI = 0,452

LS = p + E LS = 0,55 + 0,098 LS = 0,648

Para un nivel de confianza del 95%, la proporción de votantes a favor de un candidato está
comprendida entre 0,452 y 0,648, o lo que es lo mismo entre 45,2% y 64,8% .

En general:

Ejemplo 3.2.2

El gerente de créditos de un banco local investigó aleatoriamente 150 préstamos concedidos


por la entidad de las 3.000 realizadas en el último semestre, y determinó que el 60% estaba
en condiciones excelentes. Construya un intervalo de confianza del 90% para la proporción
de cuentas con calificación excelente.

Solución

Extraemos los datos del problema; N = 3.000 , n = 150 , p = 0,60

Con los datos hallamos el error estándar de la proporción

p(1 − p) N − n 0,60.(1 − 0,60) 3000 − 150


EE = . EE = .
n N −1 150 3000 − 1

EE = 0,039

Consideramos el nivel de confianza del 90%, que incluirá 45% del área que se encuentra a
ambos lados de la proporción media de la distribución de muestreo. Observamos la tabla

16 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

correspondiente a la distribución Z y buscamos el valor correspondiente a 0,45. Ya hicimos


este cálculo en el ejemplo 3) y vimos que z = 1,645 .

Hallamos el error máximo de la estimación:

E = z.EE = 1,645 × 0,039

E = 0,064

Y concluimos con los límites del IC

LI = p − E LI = 0,60 − 0,064 LI = 0,536

LS = p + E LS = 0,60 + 0,064 LS = 0,664

Para un nivel de confianza del 90%, la proporción de cuantas que tienen una excelente
calificación, está comprendida entre 0,536 y 0,664 , es decir entre 53,6% y 66,4% .

En general:

3.3. Estimación por intervalo para la diferencia de medias de dos


poblaciones, a partir de muestras grandes

Si el estadístico que deseamos estudiar es la diferencia de las medias X 1 − X 2 , de dos


poblaciones normales con varianzas conocidas σ 1 y σ 2 , podemos estimar un intervalo de
2 2

confianza para la verdadera diferencia de las medias poblacionales, µ1 − µ 2 .

Límite del Intervalo = diferencia de las medias muestrales ± error de estimación

Error de la estimación (E)

E = z.EE

17 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Error estándar (EE)

σ 12 σ 22
EE = + ,
n1 n2

Donde n1 es el tamaño de la muestra tomada de la población 1 y n2 es el tamaño la muestra


seleccionada de la población 2.

Ejemplo 3.3.1

Dos maquinarias A y B, usadas para el corte de piezas de cartón, tienen que ser comparadas
para comprobar la calidad de la producción. Se extrae una muestra de 50 elementos por la
maquinaria A y 45 para la maquinaria B. También, se sabe que la varianza de los cortes es de
9 cm para el grupo A y 16 para el grupo B. Sabiendo que las medias maestrales obtenidas
son respectivamente iguales a 140 cm y 120 cm, hallar un intervalo de confianza al 95% para
la diferencia de las medias de las dos poblaciones.

Solución

La primera población hace referencia a los datos de la máquina A y la segunda población a


los datos de la máquina B.

Extraemos los datos del problema; n1 = 50 , n2 = 45 , las medias muestrales son x1 = 140 cm ,
x 2 = 120 cm y las varianzas poblaciones σ 1 = 9 y σ 2 = 16 .
2 2

Con los datos hallamos el estadístico diferencia de medias y luego el error estándar del
mismo:

X 1 − X 2 = 140 − 120 = 20

σ 12 σ 22 9 16
EE = + EE = +
n1 n2 50 45

EE = 0,7318

Para el nivel de confianza del 95%, vimos que z = 1,96

Hallamos el error máximo de la estimación:

E = z.EE = 1,96 × 0,7318

E = 1,4343

Los límites del IC son:

(
LI = X 1 − X 2 − E) LI = 20 − 1,4343 LI = 18,5657

LS = (X 1 − X )+ E
2 LS = 20 + 1,4343 LS = 21,4343

18 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Para un nivel de confianza del 95%, la diferencia entre las medias de las mediciones hechas
por las máquinas A y B, está comprendida entre 18,5657 cm y 21,4343 cm .

Es decir 18,5657 < µ1 − µ 2 < 21,4343

En general:

Ejemplo 3.3.2

Una compañía de taxis está tratando de decidir la compra de neumáticos de las marcas 1 ó 2
para sus vehículos. Para estimar la diferencia de las dos marcas se realiza un experimento
empleando 40 neumáticos de cada marca. Los neumáticos se hacen correr hasta su desgaste
total. Los resultados son:

Marca 1 Marca 2
x1 = 38.600 km x 2 = 35.400 km
∧ ∧
s 1 = 500 km s 2 = 800 km

Estimar un intervalo del 90% para µ1 − µ 2

Solución

Indicamos los datos del problema:

Tamaño de las muestras: n1 = n2 = 40

Medias muestrales: x1 = 38.600 km y x 2 = 35.400 km

La diferencia de medias: X 1 − X 2 = 38.600 − 35.400 = 3.200


∧ ∧
Utilizaremos s 1 = 500 km y s 2 = 800 km como estimaciones de σ 1 y σ 2 respectivamente, ya
que los tamaños muestrales son mayores que 30.

Para el nivel de confianza de 90% recordemos que z = 1,645 .

19 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

El intervalo pedido es:

(X 1 )
− X 2 − z.
σ 12
n1
+
σ 22
n2
( )
< µ 1 − µ 2 < X 1 − X 2 + z.
σ 12
n1
+
σ 22
n2

500 2 800 2 500 2 800 2


3.200 − 1,645. + < µ1 − µ 2 < 3.200 + 1,645. +
40 40 40 40

2954,62 < µ1 − µ 2 < 3445,38

Gráfica 5: Límites del IC del 90% para la diferencia de medias

Fuente: http://docentes.educacion.navarra.es/msadaall/geogebra/figuras/normal5b.html

3.4. Estimación por intervalo para la diferencia de proporciones de dos


poblaciones, a partir de muestras grandes

Si el estadístico que deseamos estudiar es la diferencia de las proporciones p1 − p 2 , de dos


poblaciones normales, podemos estimar un intervalo de confianza para la verdadera
diferencia de las proporciones poblacionales, P1 − P2 .

Límite del Intervalo = diferencia de las proporciones muestrales ± error de estimación

Error de la estimación (E)

E = z.EE

20 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Error estándar (EE)

p1 .(1 − p1 ) p 2 .(1 − p 2 )
EE = + ,
n1 n2

Donde n1 es el tamaño de la muestra tomada de la población 1 y n2 es el tamaño la muestra


seleccionada de la población 2.

Ejemplo 3.4.1

Se comparan dos áreas de un país respecto a la proporción de adolescentes con caries. Una
de las regiones es netamente urbana y la otra es rural. En la muestra del área rural, 425 de
1.000 adolescentes tenían por lo menos una caries. En la muestra del área urbana, 376 de
1.000 jóvenes tenían por lo menos una caries. Construye un intervalo de confianza del 95%
para la diferencia de proporciones de adolescentes con caries de la zona rural y la zona
urbana.

Solución

La primera población hace referencia a los datos de la zona rural y la segunda población a los
datos de la zona urbana.

Extraemos los datos del problema; n1 = 1.000 , n2 = 1.000 , las proporciones muestrales de
425 376
adolescentes con caries son p1 = = 0,425 , p 2 = = 0,376
1.000 1.000

Con los datos hallamos el estadístico diferencia de proporciones y luego el error estándar
del mismo:

p1 − p 2 = 0,425 − 0,376 = 0,049

p1 .(1 − p1 ) p 2 .(1 − p 2 ) 0,425.(1 − 0,425) 0,376.(1 − 0,376)


EE = + EE = +
n1 n2 1.000 1.000

EE = 0,022

Para el nivel de confianza del 95%, vimos que z = 1,96

Hallamos el error máximo de la estimación:

E = z.EE = 1,96 × 0,022

E = 0,043

Los límites del IC son:

LI = ( p1 − p 2 ) − E LI = 0,049 − 0.043 LI = 0,006

LS = ( p1 − p 2 ) + E LS = 0,049 + 0.043 LS = 0,092

21 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Para un nivel de confianza del 95%, la diferencia entre las proporciones de adolescentes con
caries de la zona rural y urbana, está comprendida entre 0,006 y 0,092 , o lo que es
equivalente, entre 0,6% y 9,2%.

Es decir 0,006 < P1 − P2 < 0,092

En general:

Ejemplo 3.4.2

Se está considerando cambiar el procedimiento de manufactura de partes. Se toman


muestras del procedimiento actual así como del nuevo para determinar si este último resulta
mejor. Si 75 de 1.000 artículos del procedimiento actual presentaron defectos y lo mismo
sucedió con 80 de 2.500 partes del nuevo, determine un intervalo de confianza del 90% para
la verdadera diferencia de proporciones de partes defectuosas.

Solución

La primera población hace referencia a los datos del procedimiento actual y la población dos
al procedimiento nuevo.

Extraemos los datos del problema:

Tamaño de las muestras: n1 = 1.000, n2 = 2.500

75 80
Proporciones muestrales: p1 = = 0,075 y p 2 = = 0,032
1.000 2500

La diferencia de proporciones: p1 − p 2 = 0,075 − 0,032 = 0,043

Para el nivel de confianza de 90% recordemos que z = 1,645

22 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

El intervalo pedido es:

p1 .(1 − p1 ) p 2 .(1 − p 2 ) p .(1 − p1 ) p 2 .(1 − p 2 )


( p1 − p 2 ) − z. + < P1 − P2 < ( p1 − p 2 ) + z. 1 +
n1 n2 n1 n2

0,075.(1 − 0 ,075) 0,032.(1 − 0,032) 0,075.(1 − 0,075) 0,032.(1 − 0,032)


0,043 − 1,645. + < P1 − P2 < 0,043 − 1,645. +
1.000 2,500 1.000 2,500

0,028 < P1 − P2 < 0,058

3.5. Intervalo de confianza para la varianza (muestras grandes)

Los límites de confianza para la varianza σ 2 de una población distribuida normalmente,



estimada a partir de una muestra con varianza s 2 está dada por:

Ejemplo 3.5.1

La varianza en la resistencia a la ruptura encontrada en 100 cables producidos por una


empresa es de 32.400 kilogramos al cuadrado. Dar los límites de confianza para la
variabilidad en un nivel del 99%.

Solución

El tamaño de la muestra es de n = 100 y de ella obtuvimos la varianza s 2 = 32.400 , para el
nivel de 99%, z = 2,575

El intervalo pedido es:


∧ ∧
∧ ∧
s2 2 s
2
s −z .
2 2
<σ < s − z .
2 2

2n 2n

32.400 32.400
32.400 − 2,575 2. < σ 2 < 32.400 + 2,575 2.
2 × 100 2 × 100

31.326 < σ 2 < 33.474

Si deseamos obtener un intervalo de confianza para la desviación estándar de la población,


σ , tomamos raíz cuadrada en ambos miembros de la desigualdad anterior.

23 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

31.326 < σ 2 < 33.474

177 < σ < 183

Por lo tanto, para un nivel de confianza del 99%, desviación estándar de la resistencia media
a la ruptura de los cables fabricados está comprendida entre 177 y 183 kg.

24 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Bibliografía
LEVIN, R.; RUBIN, R. 2010. Estadística para administración y economía. 7ª Edición. México.
Pearson Educación.

WALPOLE, R.; MYERS, R.; MYERS, S.; YE, K. 2007. Probabilidad y Estadística para ingeniería y
ciencias. 8ª Edición. México. Pearson Educación. 816 p.

DEVORE, J. 2008. Probabilidad y Estadística para Ingeniería y Ciencias. 7ª Edición. México.


Thomson Editores S.A. 715 p.

MIGALLÓN V. 2011. Distribución Normal con Geogebra (en línea). Consultado 8 agosto 2013.
Disponible en http://blogs.ua.es/violeta/2011/04/01/distribucion-normal-con-
geogebra/

SPIEGEL, M. 2000. Estadística. 2ª Edición. México. McGraw-Hill. 556 p.

SPIEGEL, M.; SCHILLER, J.; ALU, R. 2003. Probabilidad y Estadística. 2ª Edición. México.
McGraw-Hill. 416 p.

25 www.virtual.facen.una.py

También podría gustarte