Trabajo Estadística

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 12

República Bolivariana de Venezuela

Ministerio de Educación Superior


Universidad José Antonio Páez
San Diego – Carabobo

DISTRIBUCIÓN MUESTRALES.

Profesor: Carmelo Parra Integrantes:


Valeria Blanco
Henry Pinto
Génesis Nicoliello 27.711.159
Carlos Pacheco

Sección: 204A1
Introducción.
DISTRIBUCIÓN MUESTRALES.
En estadística, la distribución muestral es lo que resulta de considerar todas las
muestras posibles que pueden ser tomadas de una población. Su estudio
permite calcular la probabilidad que se tiene, dada una sola muestra, de
acercarse al parámetro de la población.
ERRORES MUESTRALES Y NO MUESTRALES
El error muestral se refiere a la variación natural existente entre muestras
tomadas de la misma población.
Cuando una muestra no es una copia exacta de la población; aún si se ha
tenido gran cuidado para asegurar que dos muestras del mismo tamaño sean
representativas de una cierta población, no esperaríamos que las dos sean
idénticas en todos sus detalles. El error muestral es un concepto importante
que ayudará a entender mejor la naturaleza de la estadística inferencial.
Fórmula del Error Muestral
El error muestral depende:
 De la amplitud del universo (N).
 Del tamaño de la muestra (n).
 De la desviación típica (s) en variables de intervalo y razón. De la
variabilidad ( p*q) en variables nominales y ordinales.
Notas: La VARIABLIDAD de una variable nominal u ordinal:
 Juega el mismo papel que la varianza (s²) en variables de intervalo.
 Un atributo (variable nominal) o una posición en una escala (variable
ordinal) representa una proporción (p) de la población frente al resto
(q=1-p).
 Podemos tratar la proporción como una variable booleana.
El error no muestral son errores en las estimaciones de muestra que no pueden
atribuirse a las fluctuaciones del muestreo.
MUESTRA PROBABILISTICA Y NO PROBABILISTICA
El muestreo probabilístico es un método de muestreo (muestreo se refiere al
estudio o el análisis de grupos pequeños de una población) que utiliza formas
de métodos de selección aleatoria.
El requisito más importante del muestreo probabilístico es que todos en una
población tengan la misma oportunidad de ser seleccionados.
Fórmula del Muestreo Probabilístico: Existe una gran cantidad de formulas para
realizar un muestreo probabilístico, una de las más comunes por su sencillez
es la del muestreo estatificado:

Donde N representa el número de elementos de la población, n representa la


muestra, Ni el del estrato i.

Pasos para llevar a cabo un muestreo probabilístico:


1.- Elige cuidadosamente tu población de interés: piensa detenidamente y elige
entre la población de manera correcta. Las personas que crees que tienen
opiniones que deban recopilarse son las que tienes que incluir en tu muestra.

2.- Determina un marco de muestra adecuado: tu marco debe incluir una


muestra de tu población de interés y nadie del exterior. Esto es importante si
quieres recopilar datos precisos y que te sirvan.

3.-Selecciona tu muestra y comienza tu encuesta: a veces puede ser difícil


encontrar la muestra correcta y determinar el marco de muestra adecuado.
Incluso cuando todos los factores están a nuestro favor, muchas veces pueden
haber problemas imprevistos como el factor de costo, la calidad de los
encuestados y la rapidez de estos en responder.
¿Cuándo utilizar el muestreo probabilístico?
 Cuando se tiene que reducir el sesgo en el muestreo: este método de
muestreo se utiliza comúnmente cuando el sesgo debe ser mínimo.
 Para crear una muestra precisa: el muestreo probabilístico ayuda a los
investigadores a crear una muestra precisa de su población. Los
investigadores pueden utilizar este método para crear un tamaño de
muestra preciso que les pueda ayudar a obtener datos bien definidos.
 Cuando la población es diversa: cuando el tamaño de la población es
grande y diversa, este método de muestreo es útil ya que ayuda a los
investigadores a crear muestras que representan completamente a la
población.
El muestreo no probabilístico es una técnica de muestreo en la cual el
investigador selecciona muestras basadas en un juicio subjetivo en lugar de
hacer la selección al azar. En el muestreo no probabilístico, no todos los
miembros de la población tienen la oportunidad de participar en el estudio
El muestreo no probabilístico es un método menos estricto, este método de
muestreo depende en gran medida de la experiencia de los investigadores.
¿Cuándo usar el muestreo no probabilístico?
 Este tipo de muestreo se usa para indicar si existe un rasgo o
característica particular en una población.
 El muestreo no probabilístico se usa cuando los investigadores tienen un
tiempo limitado para llevar a cabo la investigación o tienen limitaciones
presupuestarias.
 Esta técnica de muestreo es ampliamente utilizada cuando los
investigadores realizan investigaciones cualitativas, estudios piloto o
investigación exploratoria.
 El muestreo no probabilístico se realiza para observar si un tema en
particular necesita un análisis en profundidad

DISTRIBUCION DE MEDIA Y PROPORCION MUESTRAL


Distribución muestral de media
Si recordamos a la distribución normal, esta es una distribución continua, en
forma de campana en donde la media, la mediana y la moda tienen un mismo
valor y es simétrica.
Con esta distribución podíamos calcular la probabilidad de algún evento
relacionado con la variable aleatoria, mediante la siguiente fórmula:
En donde z es una variable estandarizada con media igual a cero y varianza
igual a uno. Con esta fórmula se pueden a hacer los cálculos de probabilidad
para cualquier ejercicio, utilizando la tabla de la distribución z.
Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien de
cualquier tamaño de una población normal, la distribución muestral de medias
tiene un comportamiento aproximadamente normal, por lo que se puede utilizar
la fórmula de la distribución normal con y , entonces la fórmula
para calcular la probabilidad del comportamiento del estadístico, en este caso
la media de la muestra, quedaría de la siguiente manera:

Y para poblaciones finitas y muestro con reemplazo:

Distribución muestral de proporciones


Existen ocasiones en las cuales no estamos interesados en la media de la
muestra, sino que queremos investigar la proporción de artículos defectuosos o
la proporción de alumnos reprobados en la muestra. La distribución muestral de
proporciones es la adecuada para dar respuesta a estas situaciones. Esta
distribución se genera de igual manera que la distribución muestral de medias,
a excepción de que al extraer las muestras de la población se calcula el
estadístico proporción (p=x/n en donde "x" es el número de éxitos u
observaciones de interés y "n" el tamaño de la muestra) en lugar del estadístico
media.
Una población binomial está estrechamente relacionada con la distribución
muestral de proporciones; una población binomial es una colección de éxitos y
fracasos, mientras que una distribución muestral de proporciones contiene las
posibilidades o proporciones de todos los números posibles de éxitos en un
experimento binomial, y como consecuencia de esta relación, las afirmaciones
probabilísticas referentes a la proporción muestral pueden evaluarse usando la
aproximación normal a la binomial, siempre que np5 y n(1-p) 5. Cualquier
evento se puede convertir en una proporción si se divide el número obtenido
entre el número de intentos.
Para calcular la media de la distribución muestral de proporciones se tendría
que hacer la sumatoria de la frecuencia por el valor de la proporción muestral y
dividirla entre el número total de muestras.

TEOREMA POBLACION NORMAL Y TEOREMA LIMITE CENTRAL

De todas las posibles distribuciones básicas es, sin duda, la distribución normal
la más importante por el gran número de poblaciones que se distribuyen así,
real o asintóticamente. La distribución normal es una distribución con forma de
campana donde las desviaciones estándar sucesivas con respecto a la media
establecen valores de referencia para estimar el porcentaje de observaciones
de los datos. Estos valores de referencia son la base de muchas pruebas de
hipótesis, como las pruebas Z y t.
Dada una variable aleatoria X, decimos que la frecuencia de sus observaciones
puede aproximarse satisfactoriamente a una distribución normal tal que:
Variable aleatoria X, aproximada a una distribución normal.

Ejemplo:
En una ciudad se estima que la temperatura máxima en el mes de junio sigue
una distribución normal, con media 23° y desviación típica 5°. Calcular el
número de días del mes en los que se espera alcanzar máximas entre 21° y
27°.
El teorema central del límite (TCL) es una teoría estadística que establece que,
dada una muestra suficientemente grande de la población, la distribución de las
medias muéstrales seguirá una distribución normal.
Además, el TCL afirma que a medida que el tamaño de la muestra se
incrementa, la media muestra se acercará a la media de la población. Por
tanto, mediante el TCL podemos definir la distribución de la media muestra de
una determinada población con una varianza conocida. De manera que la
distribución seguirá una distribución normal si el tamaño de la muestra es lo
suficientemente grande.

Ejemplo:
La renta media de los habitantes de un país se distribuye uniformemente entre
4,0 millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al
seleccionar al azar a 100 personas la suma de sus rentas supere los 725
millones ptas.

La media y varianza de cada variable individual es:

m = (4 + 10 ) / 2 = 7

s 2 = (10 - 4)^2 / 12 = 3
Por tanto, la suma de las 100 variables se distribuye según una normal cuya
media y varianza son:

Media: n * m = 100 * 7 = 700


Varianza: n * s2 = 100 * 3 = 300

Para calcular la probabilidad de que la suma de las rentas sea superior a 725
millones ptas, comenzamos por calcular el valor equivalente de la variable
normal tipificada:
Luego:
P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749
Es decir, la probabilidad de que la suma de las rentas de 100 personas
seleccionadas al azar supere los 725 millones de pesetas es tan sólo del 7,49%
DISTRIBUCION MUESTRAL DE DIFERENCIA DE MEDIA Y DIFERENCIA DE
PROPORCIONES
Distribución muestral de diferencia de media
Suponga que se tienen dos poblaciones distintas, la primera con media 1y
desviación estándar 1, y la segunda con media 2 y desviación estándar 2.
Más aún, se elige una muestra aleatoria de tamaño n1 de la primera población
y una muestra independiente aleatoria de tamaño n2 de la segunda población;
se calcula la media muestral para cada muestra y la diferencia entre dichas
medias. La colección de todas esas diferencias se llama distribución muestral

de las diferencias entre medias o la distribución muestral del estadístico 


La distribución es aproximadamente normal para n1 30 y n2 30. Si las
poblaciones son normales, entonces la distribución muestral de medias es
normal sin importar los tamaños de las muestras.

En ejercicios anteriores se había demostrado que  y que  , por lo

que no es difícil deducir que y que La fórmula


que se utilizará para el cálculo de probabilidad del estadístico de diferencia de
medias es:

Ejemplo:

Uno de los principales fabricantes de televisores compra los tubos de rayos


catódicos a dos compañías. Los tubos de la compañía A tienen una vida media
de 7.2 años con una desviación estándar de 0.8 años, mientras que los de la B
tienen una vida media de 6.7 años con una desviación estándar de 0.7.
Determine la probabilidad de que una muestra aleatoria de 34 tubos de la
compañía A tenga una vida promedio de al menos un año más que la de una
muestra aleatoria de 40 tubos de la compañía B.

A  = 7.2 años
B = 6.7 años

A  = 0.8 años

B  = 0.7 años

nA = 34 tubos

nB = 40 tubos

 = ?

Distribución Muestral de Diferencia de Proporciones


Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con
dos proporciones muestrales, la distribución muestral de diferencia de
proporciones es aproximadamente normal para tamaños de muestra grande
(n1p15, n1q15, n2p25 y n2q25). Entonces p1 y p2 tienen distribuciones
muestrales aproximadamente normales, así que su diferencia p1-p2 también
tiene una distribución muestral aproximadamente normal. Cuando se estudió a

la distribución muestral de proporciones se comprobó que y que ,

por lo que no es difícil deducir que y que


La fórmula que se utilizará para el cálculo de probabilidad del estadístico de
diferencia de proporciones es:
Ejemplo:

Los hombres y mujeres adultos radicados en una ciudad grande del norte
difieren en sus opiniones sobre la promulgación de la pena de muerte para
personas culpables de asesinato. Se cree que el 12% de los hombres adultos
están a favor de la pena de muerte, mientras que sólo 10% de las mujeres
adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y
100 mujeres su opinión sobre la promulgación de la pena de muerte, determine
la probabilidad de que el porcentaje de hombres a favor sea al menos 3%
mayor que el de las mujeres.

Datos:

PH = 0.12

PM = 0.10

nH = 100

nM = 100

p(pH-pM  0.03) = ?

Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una
distribución binomial y se está utilizando la distribución normal.
Conclusión.

También podría gustarte