Inv de Los Temas de La Unidad 6
Inv de Los Temas de La Unidad 6
Inv de Los Temas de La Unidad 6
TAMAZUNCHALE
PROBABILIDAD Y ESTADISTICA
Introducción
El uso de estos métodos de muestreo, como su propio nombre indica, nos ayuda a obtener
información fiable de la población a partir de una muestra de la que extraer inferencias
estadísticas con un margen de error medido en términos de probabilidades. En otras
palabras, en una investigación por muestreo podremos estudiar el comportamiento y las
opiniones de toda una población analizando únicamente una parte de esta, teniendo en
cuenta que siempre existirá un margen de error a la hora de realizar dichos cálculos.
Definición de muestreo
El muestreo es un proceso o conjunto de métodos para obtener una muestra finita de
una población finita o infinita, con el fin de estimar valores de parámetros o corroborar
hipótesis sobre la forma de una distribución de probabilidades o sobre el valor de un
parámetro de una o más poblaciones.
El muestreo además de ser una ciencia Estadística, es un arte, donde no solo los elementos
se seleccionan al azar con una medida de probabilidad, si no que, además, requiere pericia
por parte de investigador/a en el diseño de la muestra a la hora de determinar:
En este método de muestreo lo principales es tener una idea clara de cuantos sujetos serán
necesarios para completar el tamaño de la muestra que se va a investigar, pues este consiste
en que a cada sujeto de la población se le debe asignar un número, para que posteriormente
mediante algún sorteo, o generando números aleatorios con ayuda de rifas o algún
ordenador se logre dar a conocer los números de los sujetos seleccionados que serán
tomados como muestra.
2. Muestreo sistemático:
Pues en este método como en el primero, los sujetos que conforman a la población son
enumerados, pero en lugar de dar a conocer los que serán incluidos mediante el azar en
este caso incluyen otra técnica. Posteriormente de que son enumerados, los investigadores
dividen el total de la población que se presenta entre el total de sujetos que requieren para
la muestra.
3. Muestreo estratificado:
Mediante este método, el investigador se encarga de elegir de acuerdo a sus propios criterios
o alcances a los sujetos que formaran parte de la muestra.
En este método se hace contacto con algún sujeto en específico y este se encargara de
buscar a otros sujetos o nuevos participantes consecutivamente. Haciéndolo de esta forma
hasta cumplir con el tamaño de muestra o cantidad de sujetos que se necesitan.
4. Muestreo discrecional:
Mediante este método, se aplica una técnica parecida a la del método intencional, pues el
investigador recluta a los sujetos según sus criterios; pero en este caso, los busca de acuerdo
a lo que piensen que estos sujetos puedan aportar a la investigación.
Si tenemos una muestra aleatoria de una población N(, ), se sabe (Teorema del límite
central) que la fdp de la media muestral es también normal con media y varianza 2/n. Esto
es exacto para poblaciones normales y aproximado (buena aproximación con n>30) para
Cuando en una población procedemos a estudiar una característica con sólo dos posibles
valores (éxito/fracaso), entonces la población sigue una distribución binomial. Cada muestra
de la población tiene un porcentaje de individuos que tiene esta característica. p es la
proporción de éxito de esta variable aleatoria de la población. La proporción de fracaso es q
=1–p
Sean todas las muestras de tamaño n de la población. Cada muestra tiene una proporción
de individuos con esa característica.
La distribución asociada a la variable aleatoria que une cada muestra con su proporción se
llama distribución muestral de proporciones.
Supóngase que se tiene una población en la que se estudia una variable aleatoria X con
distribución conocida y parámetro desconocido (o parámetros desconocidos) y se desea
disminuir el grado de desconocimiento de 0 en f(x;0) , de esta población se extrae una
muestra aleatoria de tamaño :
X1,X2,…..,Xn y se trata de calcular, a partir de los valores muestrales, una función de los
mismos que proporcione un estadístico 0=T (X1,X2,…..,Xn) que le asigne un valor al
parámetro desconocido de la población, de forma que sean lo más cercanos en algún
sentido; a 0 se le llama estimador.
Por ejemplo, una estimación de la media de una determinada característica de una población
de tamaño N podría ser la media de esa misma característica para una muestra de
tamaño n.
La estimación se divide en tres grandes bloques, cada uno de los cuales tiene distintos
métodos que se usan en función de las características y propósitos del estudio:
• Estimación puntual.
• Método de los momentos.
• Método de la máxima verosimilitud.
• Método de mínimos cuadrados.
• Estimación por intervalos.
• Estimación bayesiana.
que corresponde a la varianza de la muestra, pero dividiendo por n−1, en lugar de dividir
por n. En el capítulo de estadística descriptiva, ya comentamos que el R, por defecto, al
calcular la desviación típica de una muestra, mediante el comando sd, calcula directamente
la cuasi-varianza y luego obtiene la raiz cuadrada.
La evaluación del estimador sobre la muestra fija da lugar a una estimación puntual.
Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución
Normal, y resulta:
En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es
(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral
son los valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se
pueden obtener en las tablas de la distribución Normal estandarizada o de funciones en
aplicaciones informáticas como Excel). Seguidamente generamos una muestra de la
población y obtenemos su Media, que es igual a 4.5. Si establecemos el intervalo alrededor
de la Media muestral, el parámetro poblacional (5.1) está incluido dentro de sus límites:
Ejemplo
La siguiente imagen muestra la distribución de las Medias muestrales obtenidas de 100000
muestras aleatorias y los intervalos alrededor de cada una de las Medias obtenidas de diez
de las muestras:
donde ls y le simbolizan los límites superior e inferior del intervalo de confianza al 95%.
Nueve de los diez intervalos (salvo el definido alrededor de la Media muestral igual a 3.7)
incluyen el valor del parámetro dentro sus límites.
Por ejemplo, si el intervalo de confianza del 95% para la media de una población es (6,10),
significa que el 95% de veces la media poblacional estará entre 6 y 10.
Por lo tanto, el intervalo de confianza para la media se usa para estimar dos valores entre
los cuales se encuentra la media de una población. Así pues, el intervalo de confianza para
la media resulta muy útil para aproximar el promedio de una población cuando se
desconocen todos sus valores.
Para tamaños muestrales grandes y un nivel de confianza del 95% el valor crítico es
Zα/2=1,96 y para un nivel de confianza del 99% el valor crítico es Zα/2=2,576.
Donde:
• es la media de la muestra.
• es el valor de la distribución t de Student de n-1 grados de libertad con una
probabilidad de α/2.
• es la desviación típica de la muestra.
• es el tamaño de la muestra.
Usamos la siguiente fórmula para calcular un intervalo de confianza para una proporción de
población:
dónde:
• p: proporción de la muestra
• z: el valor z elegido
• n: tamaño de la muestra
El valor z que utilizará depende del nivel de confianza que elija. La siguiente tabla muestra
el valor z que corresponde a las opciones de nivel de confianza más populares:
0,95 1,96
0,99 2,58
Tenga en cuenta que los niveles de confianza más altos corresponden a valores z más
grandes, lo que conduce a intervalos de confianza más amplios. Esto significa que, por
ejemplo, un intervalo de confianza del 95% será más amplio que un intervalo de confianza
del 90% para el mismo conjunto de datos.
1.
Figura 1 Distribución de un estadístico, en este caso z, y decisión entre la hipótesis nula o
su alternativa. En blanco, área de aceptación y sombreada área crítica de rechazo de la
H0. En A, se destaca el área crítica en un extremo o cola de la distribución correspondiente
a p = 0,05; en B, las áreas se distribuyen por mitades en los dos extremos o colas. Es
aparente que se necesita un valor menor del estadístico para rechazar H0 cuando se trata
sólo de un extremo.
Error de tipo II
Cuando la hipótesis nula es falsa y usted no la rechaza, comete un error de tipo II. La
probabilidad de cometer un error de tipo II es β, que depende de la potencia de la prueba.
Puede reducir el riesgo de cometer un error de tipo II al asegurarse de que la prueba tenga
suficiente potencia. Para ello, asegúrese de que el tamaño de la muestra sea lo
suficientemente grande como para detectar una diferencia práctica cuando esta realmente
exista.
La probabilidad de rechazar la hipótesis nula cuando es falsa es igual a 1–β. Este valor es
la potencia de la prueba.
Como tiene que asegurarse de que los tubos no sean más grandes ni más pequeños de
5 cm, el gerente elige la hipótesis alternativa bilateral, que indica que la media de la población
de todos los tubos no es igual a 5 cm. Formalmente, esto se escribe como H1: μ ≠ 5
⚫ Recolectar los datos. Recoge una muestra de tubos y mide los diámetros.
Comparar el valor p de la prueba con el nivel de significancia.
Después de realizar la prueba de hipótesis, el gerente obtiene un valor p de 0.004. El valor p
es menor que el nivel de significancia de 0.05.
En donde:
n: Tamaño de la muestra
x: Cantidad de elementos de la muestra que cumplen con el criterio deseado
p0: Proporción a probar
Se supone que x tiene distribución binomial (lo que significa que solo puede tener dos
posibles resultados, por ejemplo defectuoso o no defectuoso) y n es un tamaño relativamente
grande.
Las hipótesis son las siguientes:
Prueba de dos colas:
H0: p=p0
H1: p≠p0
Pruebas de una cola
H0: p=p0
H1: p>p0
H0: p=p0
H1: p<p0
Es decir, se quiere verificar si el valor de una cierta proporción poblacional p es igual a p0
Los criterios de rechazo de H0 son los siguientes:
Si es de dos colas se rechaza H0 si |z0|>z(α/2)
Si H1: p>p0 se rechaza H0 si z0>zα
Si H1: p
CONCLUSIONES
poisson/GaloSánchez,J.R.(n.d.).ModeloEstadística.Proyectodescartes.org.RetrievedApril3,
2023,fromhttps://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProba
bilidadInferencia/VAdiscreta/4_1DistribucionHipergeometrica/index.htmlPerfil,V.T.mi.(n.d.-
a).ESTADISTICADELAPROBABILIDAD.Blogspot.com.RetrievedApril3,2023,fromhttp://esta
distidicadelaprobabilidadachury.blogspot.com/2016/05/unidad-4-distribuciones-de-
probabilidad.htmlPerfil,V.T.mi.(n.d.-
b).ESTADISTICADELAPROBABILIDAD.Blogspot.com.RetrievedApril3,2023,fromhttp://esta
distidicadelaprobabilidadachury.blogspot.com/2016/05/unidad-4-distribuciones-de-
probabilidad.htmlRodó,P.(2019,November5).DistribucióntdeStudent.Economipedia.https://e
conomipedia.com/definiciones/distribucion-t-de-
student.html(N.d.).Sergas.Es.RetrievedApril3,2023,fromhttps://www.sergas.es/Saude-
publica/Documents/1899/Ayuda_Epidat_4_Distribuciones_de_probabilidad_Octubre2014.p
df
Ejemplo de cómo realizar una prueba de hipótesis básica. (s/f). Recuperado el 31 de mayo
de 2023, de https://support.minitab.com/es-mx/minitab/20/help-and-how-
to/statistics/basic-statistics/supporting-topics/basics/example-of-a-hypothesis-test/
¿Qué son los errores de tipo I y tipo II? (s/f). Recuperado el 31 de mayo de 2023, de
https://support.minitab.com/es-mx/minitab/20/help-and-how-to/statistics/basic-
statistics/supporting-topics/basics/type-i-and-type-ii-error/
ramonalfonso. (2019, abril 30). Prueba de hipótesis para una proporción poblacional. Hay
una luz que nunca se apaga. https://ramonchung.wordpress.com/2019/04/29/prueba-
de-hipotesis-para-una-proporcion-poblacional