Instituto Tecnológico Superior de
Coatzacoalcos
Ingeniería Mecánica
Macedonio Mendoza Cristian Oswaldo
Integrantes del equipo: Solano Osorio Luis Armando
Azamar Hernández Lisette Jasuri
Actividad: TESINA
Tema: UNIDAD IV. TÉCNICAS DE MUESTREO
Nombre de la Asignatura: Periodo:
PROBABILIDAD Y ESTADÍSTICA FEBRERO-JULIO 2022
Semestre: Segundo Grupo: C
Nombre del Docente: HERNÁNDEZ OSORIO JUAN CRUZ
Apellido Paterno Apellido Materno Nombre(s)
COATZACOALCOS VER A 11 DE ABRIL DEL 2022
Contenido
Introducción
4.1. Muestreo aleatorio simple
4.2. Estimación puntual
4.3. Introducción a las distribuciones muestrales
4.4. Distribución muestral de X̃
4.5. Distribución muestral de p̃.
4.6. Otros métodos de muestreo
Conclusión
Fuentes consultadas
Introducción
Las técnicas de muestreo son un conjunto de técnicas estadísticas que estudian la
forma de seleccionar una muestra representativa de la población, es decir, que
represente lo más fielmente posible a la población a la que se pretende extrapolar
o inferir los resultados de la investigación, asumiendo un error. La presente busca
dar a conocer algunos de los elementos que tienen importancia en el ámbito de las
antes mencionadas técnicas de muestreo, esperando que la información, sea
clara.
4.1. Muestreo aleatorio simple
El muestreo es el proceso de seleccionar un conjunto de individuos de una
población con el fin de estudiarlos y poder caracterizar el total de la población, a
continuación, hablaremos del muestreo aleatorio simple.
El muestreo aleatorio simple es una técnica de muestreo en la que todos los
elementos que forman el universo - y que por lo tanto están incluidos en el marco
muestral - tienen idéntica probabilidad de ser seleccionados para la muestra.
El proceso de muestreo que emplea esta técnica es equivalente a hacer un sorteo
entre los individuos del universo: asignamos a cada persona un boleto,
introducimos los boletos en una urna y empezamos a extraer boletos al azar.
Todos los individuos que tengan un boleto extraído de la urna formarían la
muestra.
Dependiendo de si los individuos del universo pueden ser seleccionados más de
una vez en la muestra o no, hablaremos de muestreo aleatorio simple con
reposición o sin reposición.
Si usamos reposición, el hecho de que seleccione un individuo al azar para la
muestra no impide que este mismo individuo pueda volver a ser seleccionado.
Siguiendo con el símil de la urna y los boletos, usar reposición equivale a
reintroducir los boletos de los individuos seleccionados para la muestra antes de
extraer el siguiente boleto.
Si, por el contrario, no usamos reposición, un individuo seleccionado para la
muestra ya no entraría nuevamente en el sorteo. Un individuo solo puede aparecer
una única vez en una muestra.
Supón el siguiente caso.
Tienes una población grande de N individuos (supongamos que de más de
100,000 individuos). Pones un boleto para cada individuo en una urna. Extraes un
boleto, anotas la identidad del individuo y reintroduces el boleto en la urna. Repites
el proceso n veces, hasta obtener una muestra de tamaño n en la que un individuo
podría aparecer varias veces. Esto es poco probable si N es muy grande y n es
mucho menor que N, algo habitual ya que usamos muestras para no tener que
analizar todo el universo.
Una muestra seleccionada de esta forma tiene una propiedad muy útil: la media de
cualquier variable que midamos en la muestra se parecerá a la media calculada en
el total de la población. Y se parecerá de una forma muy concreta: la media en la
muestra seguirá una distribución normal centrada en la media poblacional y con
varianza igual a la varianza poblacional dividida por el tamaño de la muestra n.
Esta relación entre muestra y población se conoce como teorema central del
límite. gracias a esta propiedad (es decir, a que sabemos cómo se relaciona la
media de la muestra con la de la población) podemos calcular la probabilidad de
que la media de la muestra esté dentro de un intervalo de valores. Y esto nos
permite saber qué error máximo vamos a tener cuando usamos la media de la
muestra como estimación de la media de la población. En concreto, se cumple que
Figura 1.1.-
teorema central
del límite
En la que:
- e es el error máximo que vamos a tener (máxima diferencia entre la media de la
muestra y la media de la población).
- ZNC es el valor crítico de corte de una distribución de probabilidad normal para un
nivel de confianza NC.
- σ es la desviación típica (=raíz de la varianza) de la variable que nos interesa en
la población.
- n es el tamaño de muestra.
Si invertimos esta expresión, podemos calcular qué tamaño de muestra n necesito
para garantizar que el error de estimación no supera el margen de error e con un
nivel de confianza NC. (Figura 1.2)
Figura 1.2
Es posible demostrar que, en un muestreo sin reposición, cuando el universo no
se puede considerar infinito (<100,000 individuos), el tamaño de muestra
necesario para un determinado margen de error es inferior al que necesitarías si el
universo es infinito. En concreto, el tamaño de muestra para un universo finito se
relaciona con el tamaño de muestra para universo infinito de la siguiente manera
(figura 1.3)
Figura 1.3
donde ninf es el tamaño de muestra necesario para un universo infinito y N es el
tamaño del universo finito.
Sabiendo que el tamaño de muestra cuando usamos reemplazo (nr) es siempre
igual al tamaño necesario para universo infinito (nr=ninf), podemos concluir que:
Figura 1.4
Las ventajas del muestreo aleatorio simple son las siguientes:
Es sencillo para armar las muestras.
Toma de forma equitativa la selección de las muestras a partir de una
población.
En general, todos los individuos de la población tienen iguales
oportunidades de ser seleccionados.
La población es representativa, siendo el único margen de error la suerte,
llamada error de muestreo.
Es el mejor método a la hora de explicar los resultados, ya que su selección
es aleatoria e imparcial.
Por la representatividad obtenida se pueden realizar generalizaciones con
respecto a la población, a partir de los resultados de las muestras.
Las desventajas del muestreo aleatorio simple son las siguientes:
Se requiere de una lista completa de todos los miembros de la población.
Esta lista debe estar debidamente elaborada, completa y actualizada.
En las poblaciones grandes es difícil disponer de los datos necesarios para
este tipo de muestreo, por lo que se recomienda utilizar otra técnica.
Dificultad de llevarlo a la práctica en investigaciones reales, al ser una
técnica probabilística, es necesario un marco muestral con todos los
individuos y que todos ellos sean seleccionables para la muestra.
Ejemplo de muestreo aleatorio simple
Una consultora que realiza auditorías sobre diversas organizaciones decide
realizar una investigación en una empresa donde trabajan 500 empleados.
Para llevar a cabo dicho estudio, la consultora debe trabajar sobre una muestra
estadística de 50 personas (10%), por lo que escoge utilizar el método de
muestreo aleatorio simple, para el cual sigue los siguientes pasos:
1. Enlistar con número a los 500 empleados de la organización.
2. Elegir 50 números al azar.
3. Finalmente, aquellos 50 números que correspondan a un empleado serán
los individuos que conformen la muestra.
De esta manera quedará conformada la muestra para realizar la investigación,
habiéndole otorgado, a todos los empleados de la organización, las mismas
posibilidades de ser seleccionados.
4.2. Estimación puntual
Se llama estimación al conjunto de técnicas que permiten dar un valor aproximado
de un parámetro de una población a partir de los datos proporcionados por una
muestra. En una situación práctica, puede haber varias estadísticas que podrían
usarse como estimadores puntuales para un parámetro poblacional. Para
determinar cuál de las opciones es mejor, usted necesita saber cómo se comporta
el estimador en muestreo repetido, descrito por su distribución muestral.
El objetivo inmediato de la estimación puntual es el de obtener estimaciones
razonables de parámetros de alguna distribución (p.e., la media) desconocida —o
parcialmente desconocida— de la que se tiene una muestra, así como las
correspondientes estimaciones del error cometido.
Las distribuciones muestrales dan información que se puede usar para seleccionar
el mejor estimador. La distribución muestral del estimador puntual debe estar
centrada sobre el verdadero valor del parámetro a ser estimado. Esto es, el
estimador no debe subestimar o sobreestimar de manera consistente al parámetro
de interés. Un estimador como éste se dice que es insesgado, es insesgado si la
media de su distribución es igual al verdadero valor del parámetro. De otro modo,
se dice que el estimado está sesgado.
La media de la población se puede estimar puntualmente mediante la
media de la muestra:
La proporción de la población se puede estimar puntualmente mediante la
proporción de la muestra:
La desviación típica de la población se puede estimar puntualmente mediante la
desviación típica de la muestra, aunque hay mejores estimadores:
La estimación puntual busca usar una muestra para obtener números que, en
algún sentido, sean los que mejor representan a los verdaderos valores de los
parámetros de interés.
Ejemplo de estimación puntual
Con el fin de estudiar si un dado es o no equilibrado, se arroja el dado 100 veces
en forma independiente, obteniéndose 21 ases. ¿Qué valor podría
utilizarse, en base a esa información, como estimación de la probabilidad
de as? Parece razonable utilizar la frecuencia relativa de ases. En este caso, si
llamamos p a la probabilidad que queremos estimar, quedaría como se ve en la
Figura 2.1-
estimación del
figura 2.1. ejemplo
Métodos de estimación puntual
¿Cómo obtener estimadores para un problema dado? Existen métodos que
permiten obtenerlos, veamos a continuación dos métodos clásicos que
proporcionan estimadores puntuales: el método de momentos y el método de
máxima verosimilitud. Tanto el método de los momentos como el método de
máxima verosimilitud proporcionan estimadores que no siempre son insesgados,
por lo que es deseable analizar posteriormente todas las propiedades de los
estimadores que se obtengan por cualquiera de estos métodos; y dado el caso,
corregirlos si ello es posible.
Método de momentos: La idea básica consiste en igualar ciertas características
muestrales con las correspondientes características poblacionales.
consiste fundamentalmente en proponer como estimadores de los momentos
poblacionales respecto al origen, a los
correspondientes momentos muestrales.
Si X en una variable aleatoria, se define el k-
ésimo momento poblacional como:
En la que f(x) es la
función de densidad
de
probabilidad de la variable aleatoria X, si X es continua, ó P(x) es la distribución de
probabilidad de X, si X es discreta.
Mientras que, si se tiene una muestra aleatoria simple, de tamaño n, el k-ésimo
momento muestral se define como:
El método de los momentos
consiste en igualar los momentos
poblacionales con los
correspondientes momentos
muestrales, planteando tantas ecuaciones como parámetros desconocidos se
tengan, resolviendo luego el sistema de ecuaciones para los parámetros
desconocidos. Finalmente, se proponen como estimadores de los parámetros a
aquellos que son soluciones del sistema de ecuaciones Si t es el número de
parámetros desconocidos el sistema de ecuaciones está dado por:
Método de máxima verosimilitud: La Estimación de Máxima Verosimilitud (EMV) es
un modelo general para estimar parámetros de una distribución de probabilidad
que depende de las observaciones de la muestra.
Cuando hablamos de estimación de máxima verosimilitud, debemos hablar de la
función de máxima verosimilitud. Matemáticamente, dada una muestra x=(x1,
…,xn) y parámetros, θ = (θ1, … , θn) entonces:
Este símbolo significa lo mismo que el sumatorio para las sumas. En este caso, es
la multiplicación de todas las funciones de densidad que dependen de las
observaciones de la muestra (xi) y de los parámetros θ. Cuanto más grande el
valor de L(θ | x), es decir, el valor de la función de máxima verosimilitud, más
probables serán los parámetros basados en la muestra. Para encontrar las
estimaciones de máxima verosimilitud tenemos que diferenciar (derivar) los
productos de funciones de densidad y no es la manera más cómoda de hacerlo.
En este caso, la transformación monótona la hacemos mediante logaritmos
naturales dado que son funciones monótonas y crecientes. Matemáticamente:
Las propiedades de los logaritmos nos permiten expresar la multiplicación anterior
como el sumatorio de logaritmos naturales aplicados a las funciones de densidad.
La transformación monótona mediante logaritmos simplemente es un “cambio de
escala” hacia números más pequeños.
El valor estimado de los parámetros que maximice la probabilidad de los
parámetros de la función de máxima verosimilitud con logaritmos es equivalente al
valor estimado de los parámetros que maximice la probabilidad de los parámetros
de la función de máxima verosimilitud original. Entonces, siempre vamos a tratar
con la modificación monótona de la función de máxima verosimilitud dada su
mayor facilidad para los cálculos.
4.3. Introducción a las distribuciones muestrales
Una distribución de muestral es una distribución de probabilidad de una estadística
obtenida de un mayor número de muestras extraídas de una población específica.
La distribución muestral de una población dada es la distribución de frecuencias
de un rango de resultados diferentes que posiblemente podrían ocurrir para una
estadística de una población.
En estadística, una población es el conjunto completo del que se extrae una
muestra estadística. Una población puede referirse a un grupo completo de
personas, objetos, eventos, visitas al hospital o mediciones. Por tanto, se puede
decir que una población es una observación agregada de sujetos agrupados por
una característica común.
Una distribución muestral es una estadística que se obtiene mediante un
muestreo repetido de una población más grande.
Describe un rango de posibles resultados de una estadística, como la
media o la moda de alguna variable, ya que realmente existe una población.
La mayoría de los datos analizados por los investigadores provienen de
muestras y no de poblaciones.
Una gran cantidad de datos extraídos y utilizados por académicos, estadísticos,
investigadores, comercializadores, analistas, etc. son en realidad muestras, no
poblaciones. Una muestra es un subconjunto de una población.
Cada muestra tiene su propia media muestral y la distribución de las medias
muestrales se conoce como distribución muestral. Otras estadísticas , como la
desviación estándar, la varianza, la proporción y el rango se pueden calcular a
partir de datos de muestra. La desviación estándar y la varianza miden la
variabilidad de la distribución muestral.
El número de observaciones en una población, el número de observaciones en
una muestra y el procedimiento utilizado para extraer los conjuntos de muestras
determinan la variabilidad de una distribución muestral. La desviación estándar de
una distribución muestral se denomina error estándar . Si bien la media de una
distribución muestral es igual a la media de la población, el error estándar
depende de la desviación estándar de la población, el tamaño de la población y el
tamaño de la muestra.
Saber cuán separada está la media de cada uno de los conjuntos de muestras
entre sí y de la media de la población dará una indicación de qué tan cerca está la
media de la muestra de la media de la población. El error estándar de la
distribución muestral disminuye a medida que aumenta el tamaño de la muestra.
Existen dos tipos de distribución de muestreo: la distribución de la muestra, que es
la que caracteriza la distribución de los elementos de una muestra extraída de una
población, y la distribución muestral, que describe la conducta esperada de un
gran número de muestras aleatorias simples extraídas de la misma población.
DISTRIBUCIÓN DE LAS MEDIAS MUESTRALES: Es una distribución de
probabilidad de todas las posibles
medias de las muestras, de un determinado tamaño, obtenida de la población.
La medida de tendencia central más utilizada en las distribuciones muestrales es
la media aritmética (x) y
en este se puede suponer que la población está distribuida normalmente. Entre
varias propiedades de la media podemos destacar:
1. IMPARCIALIDAD: implica el hecho de que el promedio de todas las medias de
las muestras posibles (de un tamaño de muestra dado n) será igual a la media de
la población (µ). Cuando los datos están disponibles, la media y la desviación
estándar pueden calcularse así:
Media: µ= ƸX/N
Desvío: S= √(X-µ)/N
2. EFICIENCIA: se refiere a la precisión de la muestra de estadística como un
estimador del parámetro de población. La media de muestra se acercará más a la
media de la población que cualquier otro estimador imparcial, por lo que la media
de muestra es una mejor estimación de la media de la población.
3. CONSISTENCIA: se refiere al efecto del tamaño de la muestra sobre la utilidad
de un estimador. Al incrementarse el tamaño de la muestra sobre la utilidad, la
variación de la media de la muestra de la media de la población se hace más
pequeña, de manera que la media de muestra se vuelve una mejor estimación de
la media de población.
Al tratar con una variable categórica, los resultados posibles se les podrían asignar
resultados de 1 o 0 para representar la presencia o ausencia de la característica.
Si solo se dispusiera de muestra aleatoria de n individuos, la media de la muestra
para tal variable categórica se encontraría sumando todos los resultados
1 y 0 y luego dividendo por n. Por lo tanto, al tratar con datos categóricos, la media
de la muestra X (de los
resultados 1 y 0) es la misma proporción de muestra P, que tiene la característica
de interés. Así pues, la proporción de muestra p, puede definirse como el cociente
entre el número de sucesos y el tamaño de la
muestra (p=X/n).
Mientras que la media de la muestra (X) es un estimador de la media de la
población (µ), la estadística p, es
un estimador de la proporción de la población P.
ERROR ESTANDAR = √(p (1-P)/n
Algunos tipos de distribución muestral son:
Distribución muestral de las medias
Parámetros de la distribución muestral de las medias de tamaño 2
Distribución muestral de las medias de tamaño n
Distribución muestral de las proporciones
Bibliografía:
Aguilar, Adrián. QuestionPro: Muestreo aleatorio simple, uno de los tipos de
muestreo de probabilidad:
https://www.questionpro.com/blog/es/muestreo-aleatorio-simple/#:~:text=El%20muestreo
%20aleatorio%20simple%20es%20un%20procedimiento%20de%20muestreo%
Ochoa, Carlos (2015) Netquest: Muestreo probabilístico: muestreo aleatorio
simple
https://www.netquest.com/blog/es/blog/es/muestreo-probabilistico-muestreo-aleatorio-
simple#:~:text=El%20muestreo%20aleatorio%20simple%20es,ser%20seleccionados%20para
%20la%20muestra.
Enciclopedia económica: Muestreo aleatorio simple
https://enciclopediaeconomica.com/muestreo-aleatorio-simple/
Bianco y Martínez. Facultad de Ciencias Exactas y Naturales. Universidad de
Buenos Aires: Inferencia estadística - Estimación puntual
http://www.dm.uba.ar/materias/probabilidades_estadistica_C/2011/1/PyEC132011.pdf
Valdez, Irene. Notas de estadística: MÉTODO DE LOS MOMENTOS PARA
OBTENER ESTIMADORES PUNTUALES
http://dcb.fi-c.unam.mx/profesores/irene/Notas/Metodo_de_los_momentos.pdf
Amarauna: Distribución muestral: https://www.amarauna.euskadi.eus/es/recurso/distribucion-muestral/
e77c347f-b4f5-451a-88a3-139e44a780ba