Trabajo Estadística
Trabajo Estadística
Trabajo Estadística
DISTRIBUCIÓN MUESTRALES.
Sección: 204A1
Introducción.
DISTRIBUCIÓN MUESTRALES.
En estadística, la distribución muestral es lo que resulta de considerar todas las
muestras posibles que pueden ser tomadas de una población. Su estudio
permite calcular la probabilidad que se tiene, dada una sola muestra, de
acercarse al parámetro de la población.
ERRORES MUESTRALES Y NO MUESTRALES
El error muestral se refiere a la variación natural existente entre muestras
tomadas de la misma población.
Cuando una muestra no es una copia exacta de la población; aún si se ha
tenido gran cuidado para asegurar que dos muestras del mismo tamaño sean
representativas de una cierta población, no esperaríamos que las dos sean
idénticas en todos sus detalles. El error muestral es un concepto importante
que ayudará a entender mejor la naturaleza de la estadística inferencial.
Fórmula del Error Muestral
El error muestral depende:
De la amplitud del universo (N).
Del tamaño de la muestra (n).
De la desviación típica (s) en variables de intervalo y razón. De la
variabilidad ( p*q) en variables nominales y ordinales.
Notas: La VARIABLIDAD de una variable nominal u ordinal:
Juega el mismo papel que la varianza (s²) en variables de intervalo.
Un atributo (variable nominal) o una posición en una escala (variable
ordinal) representa una proporción (p) de la población frente al resto
(q=1-p).
Podemos tratar la proporción como una variable booleana.
El error no muestral son errores en las estimaciones de muestra que no pueden
atribuirse a las fluctuaciones del muestreo.
MUESTRA PROBABILISTICA Y NO PROBABILISTICA
El muestreo probabilístico es un método de muestreo (muestreo se refiere al
estudio o el análisis de grupos pequeños de una población) que utiliza formas
de métodos de selección aleatoria.
El requisito más importante del muestreo probabilístico es que todos en una
población tengan la misma oportunidad de ser seleccionados.
Fórmula del Muestreo Probabilístico: Existe una gran cantidad de formulas para
realizar un muestreo probabilístico, una de las más comunes por su sencillez
es la del muestreo estatificado:
De todas las posibles distribuciones básicas es, sin duda, la distribución normal
la más importante por el gran número de poblaciones que se distribuyen así,
real o asintóticamente. La distribución normal es una distribución con forma de
campana donde las desviaciones estándar sucesivas con respecto a la media
establecen valores de referencia para estimar el porcentaje de observaciones
de los datos. Estos valores de referencia son la base de muchas pruebas de
hipótesis, como las pruebas Z y t.
Dada una variable aleatoria X, decimos que la frecuencia de sus observaciones
puede aproximarse satisfactoriamente a una distribución normal tal que:
Variable aleatoria X, aproximada a una distribución normal.
Ejemplo:
En una ciudad se estima que la temperatura máxima en el mes de junio sigue
una distribución normal, con media 23° y desviación típica 5°. Calcular el
número de días del mes en los que se espera alcanzar máximas entre 21° y
27°.
El teorema central del límite (TCL) es una teoría estadística que establece que,
dada una muestra suficientemente grande de la población, la distribución de las
medias muéstrales seguirá una distribución normal.
Además, el TCL afirma que a medida que el tamaño de la muestra se
incrementa, la media muestra se acercará a la media de la población. Por
tanto, mediante el TCL podemos definir la distribución de la media muestra de
una determinada población con una varianza conocida. De manera que la
distribución seguirá una distribución normal si el tamaño de la muestra es lo
suficientemente grande.
Ejemplo:
La renta media de los habitantes de un país se distribuye uniformemente entre
4,0 millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al
seleccionar al azar a 100 personas la suma de sus rentas supere los 725
millones ptas.
m = (4 + 10 ) / 2 = 7
s 2 = (10 - 4)^2 / 12 = 3
Por tanto, la suma de las 100 variables se distribuye según una normal cuya
media y varianza son:
Para calcular la probabilidad de que la suma de las rentas sea superior a 725
millones ptas, comenzamos por calcular el valor equivalente de la variable
normal tipificada:
Luego:
P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749
Es decir, la probabilidad de que la suma de las rentas de 100 personas
seleccionadas al azar supere los 725 millones de pesetas es tan sólo del 7,49%
DISTRIBUCION MUESTRAL DE DIFERENCIA DE MEDIA Y DIFERENCIA DE
PROPORCIONES
Distribución muestral de diferencia de media
Suponga que se tienen dos poblaciones distintas, la primera con media 1y
desviación estándar 1, y la segunda con media 2 y desviación estándar 2.
Más aún, se elige una muestra aleatoria de tamaño n1 de la primera población
y una muestra independiente aleatoria de tamaño n2 de la segunda población;
se calcula la media muestral para cada muestra y la diferencia entre dichas
medias. La colección de todas esas diferencias se llama distribución muestral
Ejemplo:
A = 7.2 años
B = 6.7 años
A = 0.8 años
B = 0.7 años
nA = 34 tubos
nB = 40 tubos
= ?
Los hombres y mujeres adultos radicados en una ciudad grande del norte
difieren en sus opiniones sobre la promulgación de la pena de muerte para
personas culpables de asesinato. Se cree que el 12% de los hombres adultos
están a favor de la pena de muerte, mientras que sólo 10% de las mujeres
adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y
100 mujeres su opinión sobre la promulgación de la pena de muerte, determine
la probabilidad de que el porcentaje de hombres a favor sea al menos 3%
mayor que el de las mujeres.
Datos:
PH = 0.12
PM = 0.10
nH = 100
nM = 100
p(pH-pM 0.03) = ?
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una
distribución binomial y se está utilizando la distribución normal.
Conclusión.