2018 Bioestadística Módulo III - Estimación e Inferencia
2018 Bioestadística Módulo III - Estimación e Inferencia
2018 Bioestadística Módulo III - Estimación e Inferencia
SUBPROGRAMA
MEDICINA VETERINARIA
SUBPROYECTO
BIOESTADÍSTICA CON EL SOFTWARE STATISTICAL
PRODUCT AND SERVICE SOLUTIONS (SPSS)
FACILITADOR
PROF. ECON. CARLOS DÍAZ
0424-5891014
[email protected]
Intervalos de Confianza
Su discusión se centró en los esfuerzos de la agencia por mantener una gran base de
datos sobre estadísticas criminales que pudieran utilizarse para predecir la actividad
criminal y así poder anticiparse dónde y cuándo puede ocurrir un acto ilegal. Ella
menciono vario casos que se habían resuelto, en gran parte gracias al trabajo realizado
por estadísticos profesionales que proporcionaron estimaciones sobre tasas de
reincidencia de los infractores, así como otras actividades que proporcionan alguna
pista que ayude a su arresto. Esta información mostró ser de extrema utilidad para los
agentes que trabajan en el área y cuya función es ubicar a quienes están en la lista de
los más buscados por el FBI.
Introducción
Actualmente se debe estar bien consciente de que las poblaciones son generalmente
muy grandes como para ser estudiadas en su totalidad. Su tamaño requiere que se
seleccionen muestras, las cuales se pueden utilizar más tarde para hacer inferencias
sobre las poblaciones. Si un gerente de una tienda minorista desea saber sobre el gasto
promedio de sus clientes durante el año anterior, podría encontrar difícil calcular el
promedio de los cientos o quizá miles de clientes que pasaron por su tienda. Sería
mucho más fácil estimar la media poblacional con la media de una muestra
representativa.
Hay por lo menos dos tipos de estimadores que se utilizan más comúnmente para este
propósito: un estimador puntual y un estimador por intervalo. Un estimador puntual
utiliza un estadístico para estimar el parámetro en un solo valor o punto. Suponga que
se desea estimar el peso promedio de los novillos de una unidad de producción que
posee una extensión de 5.000 hectáreas, con una población de 2.000 ejemplares. El
investigador puede seleccionar una muestra de 200 animales (n=200), la media de la
muestra fue = 470 kilogramos, este valor sirve como una estimación puntual para la
media poblacional.
Una estimación por intervalo específica el rango dentro del cual está el parámetro
desconocido. El investigador puede decidir que la media poblacional está en algún sitio
entre 400 kilogramos y 540 kilogramos. Tal intervalo con frecuencia va acompañado de
una afirmación sobre el nivel de confianza que se da en su exactitud. Por tanto se llama
intervalo de confianza (I.C.)
Prof. Econ. Carlos M. Díaz N. Subproyecto: Bioestadística Página 2 de 17
Estimador: un estimador puntual utiliza un número único o valor para localizar una
estimación del parámetro. Un intervalo de confianza denota un rango dentro del cual
puede encontrarse el parámetro, y el nivel de con fianza que el intervalo contiene del
parámetro.
En realidad hay tres niveles de confianza relacionados comúnmente con los intervalos
de confianza: 99, 95 y 90%. No hay nada mágico sobre estos tres valores. Se podría
calcular un intervalo de confianza del 82% si se deseará. Estos tres niveles de
confianza, denominados coeficientes de confianza, son simplemente convencionales. El
investigador mencionado anteriormente puede tener un 95% de confianza en que la
media poblacional está entre 400 y 540 kilogramos.
¿Cómo se puede construir un intervalo y luego argumentar que se puede tener un 95%
de confianza en que contiene μ, si incluso no se sabe cuál es la media poblacional?
Recuérdese la Regla Empírica.
Uno de los usos más comunes de los intervalos de confianza es estimar la media
poblacional. Un fabricante puede querer estimar la producción mensual promedio de su
planta, un representante de mercadeo puede interesarse en la reducción en las ventas
semanales promedio, al jefe financiero puede interesarse por los rendimientos
trimestrales promedio que se tuvieron en las operaciones corporativas. El número de
circunstancias que se encuentra comúnmente en el mundo de los negocios y que
requiere de una estimación de la media poblacional es casi ilimitado.
Donde,
Z= nivel de confianza deseado (ver valores según Tabla E. Distribución Normal).
σx= , donde σ desviación estándar poblacional , n tamaño de la muestra.
√
Donde,
Z= nivel de confianza deseado (ver valores según Tabla E. Distribución Normal).
Sx= , donde s es desviación estándar de la muestra.
√
Al igual que la distribución Z, la distribución t tiene una media cero, es simétrica con
respecto a la media y oscila entre -∞ y +∞. Sin embargo, mientras que la distribución Z
Varianza de la distribución t
La familia de
distribuciones t
EJERCICIOS
1.- Un estudio abarca la selección de una muestra aleatoria de 256 novillos, el peso
promedio es un punto de interés. La media de la muestra es de 455 kilos, con una
desviación estándar de 35 kilos.
a.- ¿Cuál es el ingreso medio estimado de todos los gerentes (la población)? Es decir,
la estimación puntual
b.- ¿Cuál es el intervalo de confianza del 95% para la media?
c.- ¿Cuáles son los límites del 95% del nivel de confianza para la media de la
población?
d.- ¿Qué grado de confianza se utiliza?
e.- Interprete los resultados
5.- Una empresa de investigación realizó una encuesta para determinar la cantidad
media que los fumadores continuos gastan en cigarros cada semana. Una muestra de
49 fumadores continuos revelo que X= $20 y s=$5.
6.- Un profesor de inglés contó el número de palabras mal escritas en un ensayo que
asignó hace poco a sus alumnos. Para una clase de 40 alumnos, el número medio de
palabras mal escritas fue de 6.05 y la desviación estándar fue de 2.44. Construya un
intervalo de confianza de 95% para el número medio de palabras mal escritas en la
población de estudiantes.
7.- The Lucky Lady, una tertulia de estudiantil popular, vende vasos de cerveza de 16
onzas. Diez estudiantes compran un total de 22 vasos, y utilizando su propia taza de
media, estiman los contenidos promedio. La media de la muestra es de 15.2 onzas, con
s= 0.86 ¿Con un nivel de confianza del 95% los estudiantes creen que su dinero lo
vale? Interprete el intervalo
8.- Dell Publishings muestra 23 de paquetes para estimar el costo postal promedio, la
media muestral es de US$ 23.56 con s= US$ 4.65. Analice los resultados.
(1 − )
=
0,55(1 − 0,55)
= = 0,022
500
En la tabla de la distribución normal cuando el nivel de confianza es de 90%, Z= 1,65.
El gerente puede tener un 90% de confianza que entre el 51,4% y el 58,6% de las
casas de la ciudad tienen más de dos televisores.
3.- CNN informó que el 68% de todos los estudiantes de secundaria tenía
computadoras en sus casas. Si una muestra de 1.020 estudiantes revela que 673 tienen
computadores caseros ¿un intervalo del 99% apoya a CNN?
4.- Si 796 de 1.098 turistas americanos planean viajes para regresar a Irlanda, con un
nivel de confianza del 92% ¿qué proporción de todos los turistas americanos repetirían
sus vacaciones?
Introducción
7.- conclusiones
Preguntas y ejercicios
1.- ¿Qué es el error Tipo I, Qué es el error Tipo II, Qué es una prueba de hipótesis de
una cola o unidireccional y Qué es una prueba de hipótesis de dos colas o
bidireccional?
2.- Cuando venían de regreso de las minas a la casa los siete enanos le dicen a
Blancanieves que excavaron un promedio semanal de 12 toneladas de oro. Pero sin
estar dispuesta a creer esta afirmación sin prueba alguna, la señorita Nieves recolecta
datos sobre 49 semanas y descubre una media de 11.5 toneladas y con s= 1.1
toneladas. ¿A un nivel del 10% parece que los enanos están en lo correcto?
3.- Un vendedor de semen asegura que un toro produce terneros con un peso al
nacimiento menor a 42 Kg. Para probarlo se inseminaron las vaquillonas de un
establecimiento y se registró el peso de los terneros al nacimiento. De un total de 100
terneros se obtuvo un peso promedio de 41.3 Kg. Sabiendo que la variancia de la
población es de 9 Kg2, ¿es cierto lo que afirma el vendedor, con un 95 % de confianza?
= en donde:
(1 − )
=
1.- Como director de las operaciones de mercadeo para una gran cadena minorista,
usted considera que el 60% de los clientes de la firma se han graduado de la
universidad. Usted intenta establecer una importante política respecto a la estructura de
precios sobre esta proporción. Una muestra de 800 clientes revela que 492 clientes
tiene grado universitario, produciendo una proporción muestral de p= 492/800= 0,615. A
un nivel de 5%, ¿qué puede concluir sobre la proporción de todos los clientes que se
han graduado de la universidad?
7.- Conclusión
Con un nivel de confianza del 95% no se rechaza Ho, por lo tanto, la evidencia de la
muestra confirma la hipótesis de que π=0,6. El director puede desarrollar su política de
precio
2.- El CEO de una gran firma manufacturera debe garantizar por lo menos 75% de sus
empleados ha concluido un curso avanzado de capacitación. De los 1.200 empleados
seleccionados aleatoriamente, 875 lo han hecho. El CEO registra su asistencia para
probar esta hipótesis y calcular el valor de p. a un nivel de significancia del 5%. ¿qué
conclusiones incluye usted en su reporte?
3.- Tradicionalmente el 35% de todos los créditos otorgados por un banco han sido para
miembros de grupos minoritarios. Durante el año pasado, el banco ha hecho esfuerzos
por incrementar esta proporción. De 150 créditos actualmente en curso, 56 están
µµidentificados claramente por haber sido otorgados a los grupos minoritarios. ¿el
banco ha tenido éxito en sus esfuerzos por atraer más clientes de las minorías? Prueba
la hipótesis con un nivel de significancia del 5%?. Calcule el valor de p
La prueba de hipótesis para diferencia entre las medias siguen un procedimiento en que
las muestras son o bien 1) independientes o 2) pareadas. Sin embargo, en esta prueba
de hipótesis, lo que se persigue es si existe o no existe diferencias entre las medias.
Ho: µ1= µ2
Ha: µ1≠ µ2
O el equivalente
El valor de Z es:
( − ) − (µ − µ )
=
+
A este factor de le conoce como error estándar de las diferencias en las medias
muestrales
̅ ̅ = +
1.- En una finca existe dos tipos de ganado lechero, una pardo suizo y otra carora, se
desea comparar la producción de leche de las dos razas. En una muestra de 50
ejemplares de pardo suizo la media fue de 4,5 litros por vaca y una desviación
estándar de 1,8 litros de leche. Por otro lado, el promedio de las 40 vacas carora fue de
5,1 litros por animal con una desviación estándar de 2,0 litros de leche
Solución ejercicio 1
( , , ) , ,
4.- = = = = −1,072
, , ,
7.- Conclusión
Con un nivel de confianza del 95% se rechaza Ho. Por lo tanto, la evidencia estadística
de los datos muestrales indican que no existe diferencia de promedios en la producción
láctea de las dos razas en estudio.
( ̅ − ̅ ) − (µ − µ )
=
+
1.- Una empresa está a punto de tener problemas salariales entre sus plantas. Existe un
desacuerdo salarial promedio entre los trabajadores de la planta A y planta B. se
recolectaron los datos que se muestran a continuación
( − 1) + ( − 1)
=
+ +2
92,10(23 − 1) + 87,10(19 − 1)
= = 89,85
23 + 19 + 2
Solución
1.- Ho: µA = µB
2.- Ha: µA ≠ µB
3.- α= 0,02
( , , ) ( )
4.- = , ,
= 0,69
7.- Conclusión
Con un nivel de confianza de 98% no se rechaza Ho. Por lo tanto, no existe diferencia
promedio entre los salarios de la planta A y B.
( ̅ − ̅ ) − (µ − µ )
=
+
2.- Una empresa vende dos tipos de amortiguadores para coches para bebés. Se
recolectó una muestra de 13 amortiguadores tipo 1 dando como resultados de duración
en promedio 11,3 semanas con una desviación típica de 3,5 semanas. Por otro lado,
para los resultados del amortiguador tipo 2 se utilizó una muestra de 10, el promedio
fue de 7,5 semanas con una desviación estándar de 2,7 semanas. ¿Existe diferencia
entre las durabilidad de los amortiguadores?. Utilice un nivel de significación del 2%.
Solución
1.- Ho: µ1 = µ2
2.- Ha: µ1 ≠ µ2
3.- α= 0,02
( , , ) ( )
4.- = , ,
= 0,69
7.- Conclusión
Con un nivel de confianza de 98% se rechaza Ho. Por lo tanto, existe diferencia
significativa en el promedio de la durabilidad de los amortiguadores 1 y 2.
Ejercicios de repaso
REFERENCIAS BIBLIOGRÁFICAS