1.2. Estadística Inferencial

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 45

Estadística inferencial

DR. RAFAEL RAMÍREZ ARPIDE

e-mail: [email protected]
septiembre 2023
Objetivo de
aprendizaje
Identificar los elementos de estadística
inferencial y su importancia en el diseño de
experimentos.
Población y
muestra
Población: es una colección o totalidad de posibles
individuos, especímenes, objetos o medidas de
interés sobre los que se hace un estudio.

Muestra: Es una parte de una población,


seleccionada adecuadamente, que conserva los
aspectos clave de la población.
Estadística inferencial
El objetivo de la inferencia estadística es hacer afirmaciones válidas
acerca de la población o proceso con base en la información contenida
en una muestra. Estas afirmaciones tienen por objetivo coadyuvar en la
toma de decisiones.
Parámetros
Características que, mediante su
valor numérico, describen a un
conjunto de elementos o
individuos.

Estadístico
Cualquier función de los datos
muestrales que no contiene
parámetros desconocidos.
Parámetro / Estadístico Población Muestra

Media Σ𝑋 Σ𝑥
𝜇= 𝑋& =
𝑁 𝑛

Varianza Σ(𝑋 − 𝜇) ! Σ(𝑥 − & !


𝑋)
𝜎! = 𝑠! =
𝑁 𝑛−1

Desviación estándar
Σ(𝑋 − 𝜇)! Σ(𝑥 − 𝑥)̅ !
𝜎 = 𝑠 =
𝑁 𝑛−1

Proporción 𝑋 𝑥
𝑃= 𝑝=
𝑁 𝑛
Donde X es, por ejemplo, el Donde x es, por ejemplo, el
número de artículos número de artículos
defectuosos defectuosos
Ejemplo
Considere los siguientes datos: 5, 6, 6, 7, 8

a) Considere que los datos son de una población, determine media, varianza y
desviación estándar.

b) Considere que los datos son de una muestra, determine media, varianza y
desviación estándar.
Estadística inferencial
o Un aspecto clave en la interpretación y utilización de cualquier
estadístico es que se trata de una variable aleatoria, ya que su valor
depende de los elementos que son seleccionados en la muestra y, por lo
tanto, varía de una muestra a otra. La forma de tomar en cuenta este
hecho es conocer la distribución de probabilidad de cada estadístico.
o Al conocer la distribución de probabilidad del estadístico se podrán
hacer estimaciones acerca de cuál es el valor del parámetro
poblacional.
oy será posible probar o verificar la validez de hipótesis o conjeturas que
se tengan sobre la población o proceso.

oPor ejemplo, un proveedor de leche a una industria lactea asegura que


el contenido de grasa es de 4.5 %.
Distribución de probabilidad
Relaciona el conjunto de valores de X con la probabilidad asociada con
cada uno de estos valores.
Las distribuciones de probabilidad que más se usan en intervalos de
confianza y pruebas de hipótesis son las distribuciones:
Ø normal,
ØT de Student,
Øji-cuadrada y
ØF.
La distribución T de Student tiende a la distribución normal estándar cuando el tamaño de
muestra crece, y prácticamente es la misma distribución para n > 30
Grados de libertad
Los parámetros que definen por completo las distribuciones T de Student, ji-cuadrada
y F, reciben el nombre de grados de libertad, que tienen que ver con los tamaños
muestrales involucrados.

Por ejemplo, si se tiene una muestra de tamaño 20, será de interés una distribución T
de Student con 19 grados de libertad para hacer inferencia sobre la media
poblacional; o una ji-cuadrada con 19 grados de libertad para hacer inferencias sobre
la varianza poblacional.
• Las distribuciones normal y T de Student sirven para hacer inferencias sobre
las medias;
• mientras que la distribución ji-cuadrada será de utilidad para hacer
inferencias sobre varianzas y
• la distribución F se empleará para comparar varianzas.

Es por esto que la distribución F es la de mayor relevancia en diseño de


experimentos, dado que el análisis de la variabilidad que se observó en un
experimento se hace comparando varianzas.
Comparación de dos tratamientos
Un problema frecuente
que se presenta es
comparar la media de
dos procesos o dos
tratamientos. Por
ejemplo,
• comparar dos proveedores,
• dos materiales,
• dos máquinas o
• dos métodos de trabajo.
Nota: Sp=Estimador de la varianza muestral
a) Si común
𝜈 (nu)=Estimador de la varianza
b) Si
muestral común
Ejemplo
Comparación de dos centrifugadoras. La calidad de la pintura látex depende,
entre otras cosas, del tamaño de la partícula. Para medir esta característica se
utilizan dos centrifugadoras, y se sospecha que éstas reportan mediciones distintas
para la misma pintura. Se decide hacer un estudio que permita comparar las medias
y las varianzas reportadas por los dos equipos; para lo cual, de un mismo lote de
pintura se tomaron 13 lecturas con cada centrifugadora. Los resultados son los
siguientes:
Para comparar las medias se plantea la hipótesis de igualdad de
medias con la alternativa bilateral, puesto que no hay ninguna
conjetura del experimentador acerca de cuál centrifugadora
puede reportar valores mayores. Luego, el planteamiento es:

Pruebe la hipótesis considerando un α = 0.05


No Muestra Maquina 1 Maquina 2
1 4714 4295
2 4601 4271
3 4696 4326
4 4896 4530
5 4905 4618
6 4870 4779
7 4987 4752
8 5144 4744
9 3962 3764
10 4066 3797
11 4561 4401
12 4626 4339
13 4924 4700
Media 4688.6 4408.9
Var 118228.9 112019.9
Desv Est 343.8 334.7
Gráfica de cajas
Estadístico de prueba
Criterio de rechazo

𝑡! > 𝑡" , %
# ! &%" '#
Prueba para la igualdad de varianza
En muchos experimentos lo que interesa es la diferencia
del nivel de media para dos tratamientos. Sin embargo,
en algunos estudios lo que importa es el grado de
variabilidad.

Ø En la industria alimentaria y de bebidas es importante


que la variabilidad del equipo de empaque sea
pequeña para que todos los paquetes tengan el
mismo peso o volumen.
Ø En los laboratorios químicos se desea comparar la
variabilidad de dos métodos de análisis.
Desarrollar la comparación de varianzas del ejemplo
de las centrifugadoras
Comparación de proporciones
Una situación de frecuente interés es investigar la igualdad de las
proporciones de dos poblaciones o tratamientos, es decir, se requiere
probar la siguiente hipótesis:

donde p y p son las proporciones de cada una de las poblaciones o


1 2

tratamientos.
Ejemplo
Para evaluar dos fármacos contra cierta enfermedad se integran dos
grupos formados por dos muestras aleatorias de n = n = 100 personas
1 2

cada una. A cada grupo se le suministra un fármaco diferente.


Transcurrido el tiempo de prueba se observan x = 65 y x = 75 personas
1 2

que se recuperaron con el fármaco en los grupos correspondientes. Para


ver si estas diferencias son significativas a favor del fármaco 2, se
necesita probar la hipótesis de igualdad de proporciones.
Criterio de Rechazo

−1.543 > 𝑧𝛼 = 1.96


2

1.543 > 1.96


Por lo tanto, se acepta la Ho y entonces los dos fármacos tienen una efectividad
estadísticamente igual.
Poblaciones pareadas (comparación de dos
medias con muestras dependientes)
Muestras pareadas
Son aquellas en las que los datos de
ambos tratamientos se obtienen por
pares, de manera que éstos tienen
algo en común y no son
independientes.
Ejemplo
Comparación de dos básculas. Se desea ver si dos básculas están
sincronizadas. Para ello se toma una muestra aleatoria de 10 objetos y cada uno
se pesa en ambas básculas, cuidando que el orden en que se utilizan sea elegido
al azar. El trabajo lo realiza el mismo operador y los datos obtenidos se
muestran en la tabla:

Realice la prueba de hipótesis adecuada considerando un α=0.05


Ejemplo
Impurezas en cofres levantados y bajados. En una fábrica de autos se
tiene la hipótesis de que el número de impurezas en la pintura de los
cofres de los autos es diferente, dependiendo de si el auto pasó con el
cofre cerrado o abierto por los hornos de secado. Se decide correr un
experimento para comparar el número promedio de impurezas en cada
situación del cofre (tratamientos). Se consideró que no era adecuado
utilizar muestras independientes, ya que se sabía que los días de la
semana o los turnos podían tener influencia en el número de impurezas.
Estos dos factores se incluyen en el estudio como el criterio de
apareamiento, como se muestra en la tabla en la cual también se aprecian
los datos obtenidos. Así, en cada combinación de día y turno se asignaron
carros con el cofre levantado y cerrado.
Cada dato en las columnas levantado y bajado en la tabla representa el
promedio de impurezas en 10 autos, de tal forma que en el experimento
se utilizaron en total 200 autos. La aleatoridad se llevó a cabo por
parejas de autos: antes de la entrada a los hornos se aleatorizó si el cofre
del primero estaría levantado o bajado; si le tocaba levantado, el cofre
del segundo auto debía estar bajado. El planteamiento estadístico
consiste en probar la hipótesis de que la media de la diferencias es cero:

También podría gustarte