Capítulo Iv

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 24

CAPÍTULO IV. DEFINICIÓN DE MUESTREO.

El muestreo es el proceso mediante el cual se selecciona un grupo de


observaciones que pertenecen a una población. Esto, con el fin de realizar
un estudio estadístico.
El muestreo, en otras palabras, es el procedimiento mediante el cual se toman a
ciertos individuos que pertenecen a una población que está siendo sujeto de un
análisis.
El muestreo es necesario por el hecho de que las poblaciones pueden ser
demasiado grandes y no es factible (económica y materialmente hablando) tomar
datos de todos los individuos.
El objetivo es que la muestra sea representativa. Es decir, que sus indicadores
como la media de edad, el ingreso promedio, el porcentaje de hombres y de
mujeres, entre otros, sea el mismo, o muy similar al de la población.
El muestreo de datos es el proceso de seleccionar y estudiar un subconjunto de su
tráfico, denominado muestra, que se usa para realizar un análisis estadístico de
tendencias. Esta práctica se usa a menudo para reducir la carga computacional y
proporciona resultados que están cerca del análisis de un conjunto de datos
completo. No se aplica ningún muestreo en Analytics Suite para mantener un
análisis preciso y confiable.

 
4.1.1 TIPOS DE MUESTREO ALEATORIO
SISTEMATIZADO, ESTRATIFICADO Y
CONGLOMERADOS.
Un MUESTREO SISTEMÁTICO es aquel en el que se elige un elemento al azar y,
para escoger el resto de la muestra, se utilizan intervalos regulares basados en
un valor numérico.

¿Por qué realizar un muestreo sistemático?


Este tipo de muestreo es muy útil en determinadas circunstancias.

Así pues, veamos, para ello, sus ventajas e inconvenientes:

 En primer lugar, el método de selección es sencillo, no requiere de ninguna


preparación. El mismo sistema, utilizado en otros muestreos aleatorios, nos
permite elegir el primer caso. A partir de aquí solo hay que contar, como
veremos en el ejemplo.
 Por otro lado, elimina la posibilidad de autocorrelación, que puede darse
en otros tipos de muestreo. Esta es un problema para el investigador, ya
que dos variables correlacionadas pueden estar midiendo la misma cosa.
 Entre sus inconvenientes, podemos destacar que, a diferencia del simple,
la probabilidad de elegir un individuo no es la misma en todos los casos.
Además, puede aumentar la variabilidad de la muestra elegida.

Pasos para realizar un muestreo sistemático

os pasos para realizarlo son similares en cualquier muestreo aleatorio. Sobre todo,
hay que tener en cuenta qué queremos y con qué vamos a contar.

 Seleccionar la población: Primero, hay que elegir la población. Este es el


paso esencial cuando investigamos un tema. Tenemos que saber a quién, o
a qué, va a ir dirigido nuestro análisis.
 Tamaño de la
muestra: Una vez
hemos realizado el
primer paso, toca
decidir el tamaño de la
muestra. Existen
diferentes fórmulas
para calcularlo, todo
ello teniendo en cuenta si la población es finita o no.
 Intervalos: Una vez tenemos la muestra, dividimos la población entre ella y
redondeamos el número que salga, si este tiene decimales. A este número
se le llama intervalo de muestreo.
 Entonces, hecho todo lo anterior, empezamos a contar. El primer caso lo
elegimos al azar y, a partir de este, vamos sumando el número anterior. Es
un proceso sencillo, como veremos en el ejemplo.
Ejemplos del muestreo sistemático

Por ejemplo, supongamos que necesitamos extraer


una muestra de 10 personas a partir de una
población total de 100 y el primer individuo
seleccionado para la muestra es el número 3. A
partir de este, mediante un intervalo de 4 decidido
por el investigador, se seleccionarán los próximos
individuos hasta completar la muestra, de manera
que serán los números 7, 11, 15, etc.

Muestreo estratificado, un tipo de muestreo de probabilidad.

El muestreo estratificado es uno de los


tipos de muestreo probabilístico del que
podemos hacer uso.

El muestreo estratificado es un
procedimiento de muestreo en el que el
objetivo de la población se separa en
segmentos exclusivos, homogéneos
(estratos), y luego una muestra aleatoria
simple se selecciona de cada segmento
(estrato).

Las muestras seleccionadas de los diversos estratos se combinan en una una sola
muestra. Este procedimiento de muestreo se refiere a veces como» muestreo de
cuota aleatorio».

Pasos de selección para un muestreo estratificado


Hay ocho pasos principales en la selección de una muestra aleatoria estratificada:
1. Define la población objetivo.
2. Identifica la variable o variables de estratificación y determinar el número de
estratos a usarse. Las variables de estratificación deben estar relacionados
con el propósito de estudio. Si el propósito del estudio es hacer
estimaciones de los subgrupos, las variables de estratificación deben estar
relacionados con esos subgrupos.
La disponibilidad de información auxiliar a menudo determina las variables
de estratificación que se utilizan. Puede ser utilizada más de una variable
de estratificación. Considera que a medida que el número de variables de
estratificación aumenta, incrementa la probabilidad de que algunas de las
variables cancelen los efectos de otras variables, no más de cuatro a seis
variables de estratificación y no se deben utilizar más de seis estratos de
una variable en particular.
3. Identifica un marco de muestreo existente o desarrolla uno que incluya
información sobre la o las variables de estratificación para cada elemento
de la población objetivo. Si el marco de la muestra no incluye la información
en las variables de estratificación, la estratificación no sería posible.
4. Evalúa el marco de muestreo para la falta de cobertura, cobertura excesiva,
múltiple, y la agrupación, y haz los ajustes cuando sea necesario.
5. Divide el marco de muestreo en estratos, categorías de la estratificación de
la o las variables, creando un marco de muestreo para cada estrato. Dentro
del estrato las diferencias deben reducirse al mínimo, y las diferencias entre
los estratos deben maximizarse. Los estratos no deben estar superpuestos,
en conjunto, debe constituir toda la población. Los estratos deben ser
independientes y mutuamente exclusivos del subconjunto de la población.
Cada elemento de la la población debe estar en un sólo estrato.
6. Asigna un número único a cada elemento. 
7. Determina el tamaño de la muestra para cada estrato. La distribución
numérica de los elementos incluidos en la muestra a través de los diversos
estratos determina el tipo de muestreo a implementar. Puede ser un
muestreo proporcional estratificado o uno de los diversos tipos de muestreo
estratificado desproporcionado.
8. Selecciona al azar el número específico de elementos de cada estrato. Al
menos un elemento se debe seleccionar de cada estrato para la
representación de la muestra; y por lo menos dos elementos deben ser
elegidos de cada estrato para el cálculo del margen de error de las
estimaciones calculadas a partir de los datos recogidos.

El muestreo estratificado proporcional


Hay dos subtipos principales de muestreo estratificado: el proporcional y el
muestreo desproporcionado. En el estratificado proporcional, el número de
elementos asignados a diversos estratos es proporcional a la representación de
los estratos de la población objetivo. Es decir, el tamaño de la muestra extraída de
cada estrato es proporcional con el tamaño relativo de ese estrato de la población
objetivo.

La fracción de muestreo es aplicada a cada estrato, dando a cada elemento de la


población la misma oportunidad para ser seleccionados. La muestra resultante es
una muestra autoponderada. Este procedimiento de muestreo se utiliza cuando el
propósito de la investigación es estimar los parámetros poblacionales.
Un ejemplo hipotético de asignación proporcional se presenta en la siguiente tabla:

En este ejemplo, los elementos incluidos en la muestra se asignaron a través de


las cuatro zonas de una región de marketing de manera que la proporción de
elementos que se tomaron para la muestra de cada zona es idéntica a la
proporción de elementos de cada zona de la población total. La fracción de
muestreo en cada zona es el mismo 1 de 22 elementos. Cada zona está
igualmente representada en la muestra.

Muchas veces el investigador no sólo desea estimar parámetros poblacionales


sino también hacer análisis detallado dentro de un estrato relativamente pequeño
y/o comparar los estratos entre sí. El muestreo estratificado proporcional puede no
dar resultados en algunos de los estratos de este tipo de análisis.

Tomando el ejemplo descrito en nuestra tabla,  no sería posible realizar un análisis
detallado de los elementos de la zona 2  ya que sólo 12 de los elementos se
encuentran en la muestra. Además, la comparación de los elementos de la zona 2
con las otras zonas serían dudoso.

El muestreo estratificado proporcional no es una buena elección de muestreo para


llevar a cabo este tipo de análisis. El desproporcional puede ser una mejor
elección.

El muestreo estratificado desproporcionado


El muestreo desproporcionado es un procedimiento en que el número de
elementos incluidos en la muestra de cada estrato no es proporcional a su
representación en la población total. Los elementos de la población no tienen la
misma oportunidad de ser incluidos en la muestra. La misma fracción de muestreo
no se aplica a cada estrato.
Por otra parte, los estratos tienen diferentes fracciones de muestreo, y como tal,
este procedimiento de muestreo no es una selección equiprobable. Con el fin de
estimar los parámetros de población, la composición poblacional debe utilizarse
para compensar la desproporción en la muestra. Sin embargo, para algunos
proyectos de investigación el muestreo estratificado desproporcionado puede ser
más apropiado que el proporcional.
El muestreo desproporcionado puede ser dividido en tres subtipos con base a los
propósitos de nuestra asignación, que por ejemplo podrían ser el facilitar el
análisis dentro de los estratos o centrarse en la optimización de los costos, de la
precisión o  la optimización de ambos: precisión y costos.
El objetivo de un estudio puede requerir de un investigador que lleve a cabo el
análisis detallado de los estratos de la muestra. Si se utiliza la estratificación
proporcional, el tamaño de la muestra de un estrato es muy pequeña; por lo que
puede ser difícil de cumplir los objetivos del estudio.
La asignación proporcional puede no producir un número suficiente de casos para
este tipo de análisis detallado. Una opción es el sobremuestreo de los estratos
pequeños o poco frecuentes. Tal sobremuestreo crearía una distribución
desproporcionada de los estratos de la muestra cuando se compara a la
población. Sin embargo, puede haber un número suficiente de casos para llevar a
cabo el análisis de los estratos requerido por los objetivos del estudio.
Utilizando el ejemplo hipotético descrito en la tabla superior, si se desea llevar a
cabo un análisis detallado de la zona 2, uno podría sobremuestrear elementos de
esa zona; por ejemplo, en lugar de un muestreo de sólo 12 elementos, muestra
130 elementos.

Con el fin de llevar a cabo un análisis más significativo, analiza de manera


detallada la zona 2, el tamaño de la muestra para ese distrito debe ser mayor a 12
elementos. Los resultados de la distribución de los elementos en la muestra por
zona pueden parecerse a la distribución presentada en la tabla siguiente:
4.2 CONCEPTO DE DISTRIBUCIÓN DE MUESTREO DE LA
MEDIA.
La distribución muestral de la media (o distribución muestral de medias)
es la distribución que resulta de calcular la media muestral de cada muestra
posible de una población. Es decir, el conjunto de medias muestrales de
todas las muestras posibles de una población forman la distribución
muestral de la media.

O dicho con otras palabras, si estudiamos todas las muestras que se pueden
extraer de una población y calculamos la media de cada una de las muestras,
el conjunto de valores calculados forman una distribución muestral de la
media muestral.

En estadística, la distribución muestral de la media sirve para calcular la


probabilidad que se tiene de acercarse al valor de la media de la población al
analizar una sola muestra.

Fórmula de la distribución muestral de la media

Dada una población que sigue una distribución de probabilidad normal de


media  y desviación estándar  y se extraen de ella muestras de tamaño  ,
la distribución muestral de la media también estará definida por una
distribución normal con las siguientes características:
Donde  es la media de la distribución muestral de la media y  es su

desviación típica. Asimismo,  es el error estándar de la distribución


muestral.

Nota: si la población no sigue una distribución normal pero el tamaño


muestral es grande (n>30), la distribución muestral de la media también se
puede aproximar a la distribución normal anterior por el teorema central del
límite.

Por lo tanto, como la distribución muestral de la media sigue una


distribución normal, la fórmula para calcular cualquier probabilidad
relacionada con la media de una muestra es la siguiente:

Ej
emplo resuelto de la distribución muestral de la
media

Después de ver la definición de la distribución muestral de la media y cuáles


son sus fórmulas relacionadas, vamos a resolver un ejemplo para entender
mejor el concepto.

El peso de los estudiantes de una universidad sigue una distribución normal


de media 68 kg y desviación estándar 9 kg. Determina:
1. ¿Cuál es la probabilidad de que la media de una muestra aleatoria de
25 alumnos esté por debajo de 66 kg?
2. Si se extraen 300 muestras con un tamaño de 25 alumnos cada una,
¿cuántas medias muestrales tendrán un valor por debajo de 66 kg?
En primer lugar, tenemos que calcular el valor del estadístico
correspondiente, para ello, aplicamos la fórmula que hemos visto más arriba:

De modo que la probabilidad que estamos buscando es la correspondiente


al valor Z=-1,11 de la cola izquierda de la distribución normal estándar, que
se puede obtener fácilmente de la tabla de probabilidades de Z. Así pues,
usamos la tabla de Z para determinar la probabilidad que nos pide el
problema:

Ahora que ya sabemos la probabilidad de que la media de una muestra


aleatoria esté por debajo de 66 kg, para saber el número de medias
muestrales que están por debajo de 66 kg al sacar 300 muestras iguales
tenemos que multiplicar la probabilidad calculada por el número total de
muestras tomadas:

Por lo que aproximadamente 40 de las muestras extraídas tendrán una


media por debajo de 66 kg.

4.2.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA CON Σ2


CONOCIDA Y DESCONOCIDA.
4.2.2 Distribución muestral de la diferencia entre dos medias con σ2.

conocida y desconocida.

4.2.3 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN.


La distribución muestral de la proporción (o distribución muestral de
proporciones) es la distribución que resulta de calcular la proporción de cada
muestra posible de una población. Es decir, las proporciones muestrales de todas
las muestras posibles de una población forman la distribución muestral de la
proporción.
Dicho de otra forma, la distribución muestral de la proporción se obtiene de
estudiar todas las muestras que se pueden seleccionar de una población y sacar
la proporción muestral de cada muestra. De manera que el conjunto de
proporciones muestrales calculadas conforman la distribución muestral de la
proporción.
Por si te preguntas para qué sirve la distribución muestral de la proporción, en
estadística se utiliza para calcular la probabilidad que se tiene de acercarse al
valor de la proporción poblacional al analizar una sola muestra.
Fórmula de la distribución muestral de la proporción
En realidad, al estudiar una proporción de una muestra estamos analizando los
casos de éxito, por lo tanto, la variable aleatoria del estudio sigue una distribución
de probabilidad binomial.
Según el teorema central del límite, para tamaños grandes (n>30) podemos
aproximar una distribución binomial a una distribución normal. Por lo tanto, la
distribución muestral de la proporción se aproxima a una distribución
normal con los siguientes parámetros:
Por lo tanto, como se puede aproximar la distribución muestral de la proporción a
una distribución normal, la fórmula para calcular cualquier probabilidad
relacionada con la proporción de una muestra es la siguiente:

Ejemplo resuelto de la distribución muestral de la proporción


Una vez hemos visto la definición de la distribución muestral de la proporción y
cuáles son sus fórmulas relacionadas, a continuación se muestra un ejemplo
resuelto paso a paso para acabar de entender bien el concepto.
 Una empresa industrial compra lotes de piezas a una fábrica que afirma
producir las piezas con tan solo un 3% de piezas defectuosas. Para
comprobarlo, la empresa decide analizar un pedido de 500 piezas, ¿cuál es
la probabilidad de encontrar más del 5% de piezas defectuosas en la
muestra?
En este caso, la proporción de la población que queremos estudiar es de 0,03, por
lo tanto, el parámetro q es equivalente a 0,97.
Así pues, para hallar la probabilidad que nos piden, tenemos que calcular el
estadístico correspondiente aplicando la fórmula que hemos visto en el apartado
anterior:

De modo que la probabilidad de obtener más del 5% de piezas defectuosas es


equivalente a la siguiente probabilidad:

Finalmente, buscamos la probabilidad de P[Z≤2,62] en la tabla de la distribución


Z y calculamos la probabilidad que nos pedía el problema:

En conclusión, la probabilidad de encontrar más de 5% piezas defectuosas en la


muestra analizada es del 0,44%.

4.2.4 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE


DOS PROPORCIONES.
4.3 TEOREMA DEL LÍMITE CENTRAL.
El teorema central del límite (TCL) es una teoría estadística que establece que,
dada una muestra aleatoria suficientemente grande de la población, la distribución
de las medias muestrales seguirá una distribución normal.

Además, el TCL afirma que a medida que el tamaño de la muestra se incrementa,


la media muestral se acercará a la media de la población. Por tanto, mediante el
TCL podemos definir la distribución de la media muestral de una determinada
población con una varianza conocida. De manera que la distribución seguirá una
distribución normal si el tamaño de la muestra es lo suficientemente grande.

Principales propiedades del teorema central del límite

El teorema central del límite tiene una serie de propiedades de gran utilidad en el
ámbito estadístico y probabilístico. Las principales son:

 Si el tamaño de la muestra es suficientemente grande, la distribución de las


medias muestrales seguirá aproximadamente una distribución normal. El
TCL considera una muestra como grande cuando el tamaño de la misma es
superior a 30. Por tanto, si la muestra es superior a 30, la media muestral
tendrá una función de distribución próxima a una normal. Y esto se cumple
independientemente de la forma de la distribución con la que estamos
trabajando.
 La media poblacional y la media muestral serán iguales. Es decir, la media
de la distribución de todas las medias muestrales será igual a la media del
total de la población.
 La varianza de la distribución de las medias muestrales será σ²/n. Que es
la varianza de la población dividido entre el tamaño de la muestra.

Que la distribución de las medias muestrales se parezca a una normal es


tremendamente útil. Porque la distribución normal es muy fácil de aplicar para
realizar contrastes de hipótesis y construcción de intervalos de confianza. En
estadística que una distribución sea normal es bastante importante, dado que
muchos estadísticos requieren este tipo de distribución. Además, el TCL nos
permitirá hacer inferencia sobre la media poblacional a través de la media
muestral. Y esto es de gran utilidad cuando por falta de medios no podemos
recolectar datos de toda una población.

Ejemplo del teorema central del límite

Imaginemos que queremos analizar las rentabilidades medias históricas del índice
S&P 500, que como sabemos, tiene unas 500 compañías dentro del mismo. Pero
no tenemos suficiente información como para analizar la totalidad de las 500
compañías del índice. En este caso la rentabilidad media del S&P 500 sería la
media poblacional.

Ahora bien, siguiendo al TCL podemos coger una muestra de estas 500 empresas
para realizar el análisis. La única limitación que tenemos es que en la muestra
tiene que haber más de 30 compañías para que se cumpla el teorema. Entonces
imaginemos que cogemos 50 compañías del índice de manera aleatoria y
repetimos el proceso varias veces. Los pasos a seguir del ejemplo serían los
siguientes:

 Elegimos la muestra de unas 50 compañías y obtenemos la rentabilidad


media de la totalidad de la muestra.
 De manera continuada seguimos escogiendo 50 compañías y obtenemos la
rentabilidad media.
 La distribución de todas las rentabilidades medias de todas las muestras
escogidas se aproximará a una distribución normal.
 Las rentabilidades medias de todas las muestras seleccionadas se
aproximarán a la rentabilidad media del total del índice. Tal y como
demuestra el teorema Central del Límite.

Por tanto, mediante inferencia de la rentabilidad media de la muestra podemos


acercarnos a la rentabilidad media del índice.

4.4 TIPOS DE ESTIMACIONES Y CARACTERÍSTICAS.


Estimar qué va a ocurrir respecto a algo (o qué está ocurriendo, o qué ocurrió), a
pesar de ser un elemento muy claramente estadístico, está muy enraizado en
nuestra cotidianidad. Dentro de ello, además hacemos estimaciones dentro de un
intervalo de posibilidades. Por ejemplo: “creo que terminaré la tarea en unos 5-6
días”. Lo que hacemos en el terreno del análisis de datos es aplicar matizaciones
técnicas a este hábito. Vamos a dedicar este documento al concepto de
estimación, comenzando con la estimación puntual. Después nos ocuparemos de
desarrollar un modelo de estimación por intervalo donde identificaremos los
elementos fundamentales, con su significado y símbolo. Y, por último, habrá que
desarrollar cómo se calculan esos elementos.

Existen tres tipos de estimación estadística:

a)    La estimación puntual

Una estimación es puntual cuando se usa un solo valor extraído de la muestra


para estimar el parámetro desconocido de la población. Al valor usado se le llama
estimador.

b)   Estimación por intervalo

Una estimación por intervalo de un parámetro θ es algún par de funciones de la


muestra que satisfacen L(x) ≤ U(x) para todo x ∈ X . El intervalo aleatorio [L(X),
U(X)] es llamado un estimador por intervalo.

c)    Estimación bayesiana

El enfoque bayesiano se basa en la interpretación subjetiva de la probabilidad, el


cual considera a ésta como un grado de creencia con respecto a la incertidumbre.
Un parámetro es visto como una variable aleatoria a la que, antes de la evidencia
muestral, se le asigna una distribución a priori de probabilidad, con base en un
cierto grado de creencia con respecto al comportamiento aleatorio. Cuando se
obtiene la evidencia muestral, la  distribución a priori es modificada y entonces
surge una distribución a posteriori de probabilidad.  

4.5 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA DE


UNA POBLACIÓN.
Una muestra es una selección de los encuestados elegidos y que representan a la
población total. El tamaño de la muestra es una porción significativa de la
población que cumple con las características de la investigación reduciendo los
costos y el tiempo.
Saber cómo determinar el tamaño de la muestra antes de comenzar una
investigación es un principio estadístico que nos ayuda a evitar el sesgo en la
interpretación de los resultados obtenidos.

¿Cómo calcular el tamaño de la muestra?


El tamaño de la muestra de una encuesta es muy importante para poder realizar
una investigación de manera correcta, por lo que hay que tener en cuenta los
objetivos y las circunstancias en que se desarrolle la investigación.
Recuerda que la finalidad es que las personas completen la encuesta y te
otorguen los datos que estás buscando.
Una muestra demasiado grande dará lugar a la pérdida de valiosos recursos como
tiempo y dinero, mientras que una muestra pequeña puede no proporcionar
información confiable.
¿Entonces de qué tamaño debe ser una muestra? Esto sin duda depende de qué
tan exactos necesites que sean los datos obtenidos en tu encuesta, que tan
cercanos quieres que sean a los de la población total.
El tamaño de la muestra puede ser:
Representativa: Hace referencia a que todos los miembros de un grupo de
personas tengan las mismas oportunidades de participar en la investigación.
Adecuada: Se refiere a que el tamaño de la muestra debe de ser obtenido
mediante un análisis que permite resultados como disminuir el margen de error.
Ejemplo:
Si quieres realizar una investigación dentro de una universidad que ofrece 10
carreras diferentes y cada una tiene 700 alumnos, no querrás hacer 7000 mil
encuestas, bastará con determinar el tamaño de la muestra. Sin embargo,
debemos
considerar el
margen de error.

Ejemplo de
cómo calcular el
tamaño de
muestra finita
Es hora de
aprender a
determinar el
tamaño de la
muestra mediante
un cálculo de la
misma.
Tu nivel de confianza corresponde a una puntuación Z. Este es un valor constante
necesario para esta ecuación. Aquí están las puntuaciones Z para los niveles de
confianza más comunes:
90% - Puntuación Z = 1,645
95% - Puntuación Z = 1.96
99% - Puntuación Z = 2.576
Supongamos que nos piden calcular el tamaño para una población de 543.098
consumidores de una marca de bebidas energéticas, donde el investigador asigna
un nivel de confianza de 95% y un margen de error de 3%. Donde se desconoce la
probabilidad “p” del evento.
Basándonos en este ejemplo, y en nuestra fórmula, el "N" será 543.098, nuestro Z
será 1.96 (recuerda que el investigador asignó un nivel de confianza de 95%) y “e”
será de 3%. Y como nuestro ejemplo dice que se desconoce la probabilidad de
que ocurra el evento, se asigna un 50% a "p" y un 50% a "q".
El resultado de nuestro tamaño de muestra sería: 1065.2, y tendría que ser
redondeado pues estamos hablando de personas.

Ejemplo de cómo calcular el tamaño de muestra infinita


Si necesitas calcular el tamaño de muestra de una población desconocida, donde
el investigador necesite un nivel de confianza del 95%, un margen de error del 3%
y se desconoce la probabilidad “p” del evento que se está estudiando, sigue la
siguiente fórmula:
Donde "Z" es el intervalo de confianza al cuadrado, en este caso se pide que sea
del 95%, lo que indica que sería 1,96 al cuadrado, y cómo no sabemos la
probabilidad de que ocurra el evento, "p" y "q" sería 50%. Entre el margen de error
al solicitado al cuadrado. El resultado sería 1067,11, que también lo debemos
redondear.
Para calcular el número de participantes que necesitas en tu próxima investigación
de manera más rápida y fácil te invitamos a usar nuestra calculadora de
muestra para que agilices este proceso.
4.6 INTERVALOS DE CONFIANZA PARA LA MEDIA, CON
EL USO DE LA DISTRIBUCIÓN
Después de construir un intervalo de confianza para una media, es importante
poder interpretar lo que nos dice el intervalo sobre la población y lo que no nos
dice.
Un intervalo de confianza para la media nos da un rango de valores admisibles
para la media de la
población. Si un intervalo de
confianza no incluye un valor
determinado, podemos decir
que no es probable que el
valor particular sea la media
verdadera de la población.
Sin embargo, incluso si un
valor está dentro del
intervalo, no debemos
concluir que la media de la
población sea igual a ese
valor específico.
Veamos algunos ejemplos que muestran cómo interpretar un intervalo de
confianza para una media.
Ejemplo 1
Felix es un experto de control de calidad en una fábrica que pinta partes de
automóviles. Su proceso de pintura consiste en una capa base, una capa de color
y una capa de recubrimiento transparente. En cierta parte, estas capas tienen un
grosor objetivo combinado de 150150150 micras. Felix midió el grosor
de 505050 puntos seleccionadas al azar en una de estas partes para ver si
estaban pintados correctamente. Su muestra tenía un espesor promedio
de �ˉ=148xˉ=148x, with, \bar, on top, equals, 148 micras y una desviación
estándar de ��=3.3sx=3.3s, start subscript, x, end subscript, equals, 3, point,
3 micras.
Un intervalo de confianza de 95%95%95, percent para el grosor medio con base
en estos datos es (147.1,148.9)(147.1,148.9)left parenthesis, 147, point, 1,
comma, 148, point, 9, right parenthesis.
En función de su intervalo, ¿es creíble que el grosor medio de esta parte
coincida con el valor objetivo?
No, no lo es. El intervalo dice que los valores admisibles para el verdadero grosor
promedio en esta parte son entre 147.1147.1147, point, 1 y 148.9148.9148, point,
9 micras. Puesto que este intervalo no contiene a 150150150 micras, no parece
creíble que el espesor medio de esta parte coincida con el valor objetivo. En otras
palabras, el intervalo entero está por debajo del valor objetivo
de 150150150 micras, por lo que el grosor promedio de esta parte probablemente

esté por debajo del objetivo.

Ejemplo 2
Martina leyó que el estudiante de posgrado promedio tiene 333333 años de edad.
Quería estimar la media de edad de los estudiantes de posgrado en su
universidad grande, por lo que tomó una muestra aleatoria de 303030 estudiantes.
Encontró que su edad media fue �ˉ=31.8xˉ=31.8x, with, \bar, on top, equals, 31,
point, 8 y la desviación estándar fue ��=4.3sx=4.3s, start subscript, x, end
subscript, equals, 4, point, 3 años. Un intervalo de confianza para la media con
base a sus datos fue (30.2,33.4)(30.2,33.4)left parenthesis, 30, point, 2, comma,
33, point, 4, right parenthesis.
Con base en este intervalo, ¿es creíble que la edad media de todos los
estudiantes de posgrado en su universidad sea también de 333333 años?
Sí. Puesto que 333333 está dentro del intervalo, es un valor admisible para la
edad media de toda la población de estudiantes de posgrado en su universidad.
Intervalo de confianza para la media es un intervalo que
proporciona un rango de valores admisibles para la media de una población.
Es decir, el intervalo de confianza para la media nos da un valor máximo y un
valor mínimo entre los cuales se encuentra el valor de la media de una
población con un margen de error.

Por ejemplo, si el intervalo de confianza del 95% para la media de una


población es (6,10), significa que el 95% de veces la media poblacional estará
entre 6 y 10.

Por lo tanto, el intervalo de confianza para la media se usa para estimar dos
valores entre los cuales se encuentra la media de una población. Así pues, el
intervalo de confianza para la media resulta muy útil para aproximar el
promedio de una población cuando se desconocen todos sus valores.

Fórmula del intervalo de confianza para la media

Partiendo de que el proceso de tipificación de una variable se hace de la


siguiente manera:

El intervalo de confianza para la media se calcula sumando y restando a la


media muestral el valor de Zα/2 multiplicado por la desviación típica (σ) y
dividido por la raíz cuadrada del tamaño de la muestra (n). Por lo tanto, la
fórmula para calcular el intervalo de confianza para la media es la siguiente:
Para tamaños muestrales grandes y un nivel de confianza del 95% el valor
crítico es Zα/2=1,96 y para un nivel de confianza del 99% el valor crítico es
Zα/2=2,576.

La fórmula anterior se utiliza cuando la varianza de la población es conocida.


No obstante, si la varianza de la población es desconocida, que es el caso
más frecuente, el intervalo de confianza para la media se calcula con la
siguiente fórmula:

Donde:
 es la media de la muestra.
 es el valor de la distribución t de Student de n-1 grados de
libertad con una probabilidad de α/2.
 es la desviación típica de la muestra.
 es el tamaño de la muestra.
Ejemplo del cálculo de un intervalo de confianza
para la media
Para que puedas ver cómo se calcula el intervalo de confianza para la media
de una población, a continuación te dejamos con un ejemplo resuelto paso a
paso.

 Tenemos una muestra de 8 observaciones con los valores


mostrados a continuación. ¿Cuál es el intervalo de confianza
para la media de la población con un nivel de confianza del
95%?
206  203  201  212
194  176  208  201

Tal y como hemos visto en el apartado anterior, la fórmula que nos permite
sacar el intervalo de confianza para una media poblacional cuando no
conocemos la desviación típica de la población es la siguiente:
Entonces, para poder determinar el intervalo de confianza de la media,
primero tenemos que calcular la media y la desviación típica de la muestra.

Como queremos hallar el intervalo de confianza con un nivel de confianza de


1-α=95% y el tamaño muestral es 8, tenemos que ir a la tabla de la
distribución t de Student y ver qué valor corresponde a t0,025|7.

De modo que aplicamos la fórmula del intervalo de confianza para la media


y hacemos los cálculos para encontrar los valores límites del intervalo:

En conclusión, el intervalo de confianza calculado nos indica que con un


nivel de confianza del 95% la media de la población estará entre 190,82 y
209,43.

4.6.1 Determinación del tamaño de la muestra con grado de


confianza y estimación de μ.
El tamaño de muestra permite a los investigadores saber cuántos individuos son
necesarios estudiar, para poder estimar un parámetro determinado con el grado
de confianza deseado, o el número necesario para poder detectar una
determinada diferencia entre los grupos de estudio, suponiendo que existiese
realmente. El cálculo del tamaño de la muestra es una función matemática que
expresa la relación entre las variables, cantidad de participantes y poder
estadístico.
La muestra de un estudio debe ser representativa de la población de interés. El
objetivo principal de seleccionarla es hacer inferencias estadísticas acerca de la
población de la que proviene. La selección debe ser probabilística.
Los factores estadísticos que determinan el tamaño de la muestra son: hipótesis,
error alfa, error beta, poder estadístico, variabilidad, pérdidas en el estudio y el
tamaño del efecto. Se revisan las fórmulas utilizadas para el cálculo del tamaño de
la muestra en las situaciones más frecuentes en investigación, así como la
revisión de fórmulas para un cálculo más rápido. Se incluyen ejemplos de
investigación en educación médica. También se revisan aspectos importantes
como: tamaño de la muestra para estudios piloto, estrategias para disminuir el
número necesario de sujetos, y software para el cálculo del tamaño de muestra.

4.7 Intervalo de confianza para la diferencia entre dos medias μ1−μ2 con σ12 y σ2

2 σ1 2= σ2 2 pero conocidas, con el uso de la distribución normal y la “t” student.

4.8 Una sola muestra: estimación de la proporción.

4.9 Intervalo de confianza para la diferencia de dos proporciones.

BIBLIOGRAFIA
https://economipedia.com/definiciones/muestreo.html

https://www.atinternet.com/es/glosario/muestreo/

https://economipedia.com/definiciones/muestreo-sistematico.html

https://enciclopediaeconomica.com/muestreo-sistematico/

https://www.questionpro.com/blog/es/muestreo-estratificado/

https://www.probabilidadyestadistica.net/distribucion-muestral-de-la-media/#:~:text=La
%20distribuci%C3%B3n%20muestral%20de%20la%20media%20(o%20distribuci%C3%B3n
%20muestral%20de,distribuci%C3%B3n%20muestral%20de%20la%20media.

https://www.probabilidadyestadistica.net/distribucion-muestral-de-la-proporcion/

https://www.questionpro.com/es/tama%C3%B1o-de-la-muestra.html

https://es.khanacademy.org/math/ap-statistics/estimating-confidence-ap/one-sample-t-interval-
mean/a/interpret-one-sample-t-interval-mean#:~:text=Un%20intervalo%20de%20confianza
%20para%20la%20media%20nos%20da%20un,media%20verdadera%20de%20la%20poblaci
%C3%B3n.

https://www.probabilidadyestadistica.net/intervalo-de-confianza-para-la-media/
https://www.elsevier.es/es-revista-investigacion-educacion-medica-343-articulo-calculo-del-
tamano-muestra-investigacion-S2007505713727157#:~:text=El%20tama%C3%B1o%20de
%20muestra%20permite,estudio%2C%20suponiendo%20que%20existiese%20realmente.

También podría gustarte