Lab Muestreo

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 20

LABORATORIO Nro 01

Inferencia Estadística Prof. Cristóbal Exebio C

1. Por estudios previos se tiene conocimiento que la distribución del peso al nacer
de niños que cumplen su período de gestación de 40 semanas es
aproximadamente normal con una media de 3550 gramos y una desviación
estándar de  = 400 gramos. Se va a realizar un nuevo estudio para una
población con características similares, con el fin de estimar el peso promedio al
nacer de los niños. Con base en el estudio previo determine el tamaño de
muestra. Además, se considera que un error de máximo 45 gramos logra una
estimación valida, la confiabilidad del estudio es del 95%.

2. Determinar el número de profesionales a encuestar en una región donde se


estima en 4500 el número de ellos. El objetivo del estudio es determinar entre
otras cosas, la intencionalidad de seguir estudios de maestría, con una prueba
piloto de 20 profesionales, se determinó que la proporción de profesionales con
afán de continuar sus estudios era del 25%. La confiabilidad del estudio, dado
que sus resultados serán validados con otras fuentes se definió en el 90%, el
error puede estar entre el 4 y el 6%, dependiendo de los costos se definirá cual
tamaño seleccionar.

3. Se quiere obtener una muestra sistemática que seleccione egresados de una


Escuela de la Universidad que tiene 1200 de ellos. La variable clave del estudio
es dicotómica y se aduce que la proporción es del 25%, además, se quiere un
error del 4% y una confiabilidad del 90%.

4. Una Institución de Salud tiene 6100 empleados, se quiere determinar como es el


clima laboral en la organización, usando una confiabilidad del 95%, un error
admisible de 6% y considerando que la proporción de empleados no satisfechos
es del 30%. Calcule el número de empleados a consultar por categoría, si se
tiene en cuenta, que las diferentes categorías de empleados que pueden influir en
la opinión de los trabajadores, tienen la siguiente distribución: Contabilidad y
Costos 80 empleados, Administración 150, operativos 5600, seguridad 180 y
otros cargos 90.

5. Se realiza un estudio para estimar el porcentaje de ciudadanos de una comunidad


andina que están a favor de que su agua se trate con flúor. Qué tan grande debe
ser una muestra si se desea tener una confianza de al menos 95% de que la
estimación estará dentro del 2% del porcentaje real? Realice las consideraciones
necesarias para calcular n.

6. La empresa “Cielo “ requiere llevar a cabo un estudio de mercado para


determinar la aceptación de los usuarios sobre el servicio de recolección de
escombros, para ello, se obtuvo la siguiente información:

Usuarios residenciales 125.000


Usuarios industriales 45.000
Otros usuarios 1.500
Encuentre el tamaño de muestra para cada categoría de usuario, si se desea una
confiabilidad del 95% y un error del 6%, además, se sabe que la proporción de
usuarios satisfechos en el último estudio fue de 0.75.

7.Con el fin de determinar si existen diferencias en las notas promedio según el área
de estudio, una universidad diseñó las siguientes categorías y obtuvo la siguiente
información realizando una prueba piloto:
N
Humanidades 2500
Informática 1450
Matemáticas 750

Encuentre el tamaño de muestra para cada categoría de usuario, teniendo en cuenta


además, que la desviación de las notas es de 1.2, use una confianza del 90%,
determine un error apropiado para el caso.

8. Determine el tamaño de muestra para los siguientes casos:


a. Se requiere una confianza del 90%, se acepta un error de 1500 y se sabe que el
mayor y menor valor son: 50.000 y 10.000.
b. El mismo caso anterior, pero se conoce que el tamaño de la población es de:
2000, 5000 y 10.000. (Desarrollarlo para los tres casos) Qué concluye?.
c. En un estudio de proporciones desea una confianza del 95% y acepta un error en
su estimación de 6%. Cuantas personas debe encuestar.
d. El caso anterior, pero por estudios anteriores encontró que el 70% están a favor
de la variable en estudio. Conclusiones de lo observado, en todos los casos, es útil
realizar los ejercicios de manera manual y con el Software estadístico.
Muestreo y tamaño de muestra

 Desarrollo
 Muestreo probabilístico por racimos
 Bibliografía

Introducción
Partiendo de la importancia que tiene para cualquier profesional e investigador conocer
varios conceptos importantes de la estadística para poder desarrollar exitosamente una
investigación de cualquier índole, en el presente trabajo nos proponemos dar tratamiento
a algunos elementos de la estadística matemática de la forma mas elemental posible
para que pueda ser asimilada por cualquier profesional sin tener en cuenta su
especialidad ya sea de las ciencias sociales como de las ciencias exactas.
Nuestro propósito es encaminar al profesional en:
Conocer el aparato conceptual necesario desde el punto de vista estadístico para
emprender de forma sólida y científica una investigación.
Mostrar algunas de las formas científicas de obtener una muestra.
Tipo de muestreo a utilizar según el interés del profesional.
Como determinar el tamaño de muestra necesario para el desarrollo de la investigación.
Dentro de esa gama de conceptos primarios tenemos los siguientes:
Población.
Muestra
Parámetro
Estadístico
Error muestral
Nivel de confianza
Varianza poblacional
Inferencia estadística
Desarrollo
Población. No es más que aquel conjunto de individuos o elementos que le podemos
observar, medir una característica o atributo.
Ejemplos de población:
El conjunto formado por todos los estudiantes universitarios en Cuba.
El conjunto de todos los estudiantes de una Universidad.
El conjunto de personas fumadoras de una región.
Son características medibles u observables de cada elemento por ejemplo, su estatura, su
peso, edad, sexo, etc.
Supongamos que nos interesa conocer el peso promedio de la población formada por los
estudiantes de una universidad. Si la universidad tiene 5376 alumnos, bastaría pesar
cada estudiante, sumar los 5376 pesajes y dividirlo por 5376. Pero este proceso puede
presenta dificultades dentro de las que podemos mencionar:
localizar y pesar con precisión cada estudiante:
escribir todos los datos sin equivocaciones en una lista:
efectuar los cálculos.
Las dificultades son mayores si en número de elementos de la población es infinito, si
los elementos se destruyen, si sufren daños al ser medidos o están muy dispersos, si el
costo para realizar el trabajo es muy costoso.
Una solución a este problema consiste en medir solo una parte de la población que
llamaremos muestra y tomar el peso medio en la muestra como una aproximación del
verdadero valor del peso medio de la población.
El tamaño de la población es la cantidad de elementos de esta y el tamaño de la muestra
es la cantidad de elementos de la muestra. Las poblaciones pueden ser finitas e infinitas.
Los datos obtenidos de una población pueden contener toda la información que se desee
de ella. De lo que se trata es de extraerle esa información a la muestra, es decir a los
datos muestrales sacarle toda la información de la población.
La muestra debe obtener toda la información deseada para tener la posibilidad de
extraerla, esto sólo se puede lograr con una buena selección de la muestra y un trabajo
muy cuidadosos y de alta calidad en la recogida de los datos.
Es bueno señalar que en un momento una población puede ser muestra en una
investigación y una muestra puede ser población, esto esta dado por el objetivo del
investigación, por ejemplo en el caso de determinar la estatura media de los estudiantes
universitarios en Cuba una muestra podía ser escoger algunas universidades del país y
realizar el trabajo, si por el contrario se quiere saber la estatura promedio de los
estudiantes de una universidad en especifico en Cuba, entonces el conjunto formado por
todos los estudiantes de esta universidad sería la población y la muestra estaría dada por
los grupos, carreras o años seleccionado para realzar el experimento.
Parámetro : Son las medidas o datos que se obtienen sobre la distribución de
probabilidades de la población, tales como la media, la varianza, la proporción, etc.
Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una
estimación de los parámetros.
Error Muestral, de estimación o standard. Es la diferencia entre un estadístico y su
parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de
muestras repetidas en torno al valor de la población, nos da una noción clara de hasta
dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor
que se hubiera obtenido por medio de un censo completo. Siempre se comete un error,
pero la naturaleza de la investigación nos indicará hasta qué medida podemos cometerlo
(los resultados se someten a error muestral e intervalos de confianza que varían muestra
a muestra). Varía según se calcule al principio o al final. Un estadístico será más preciso
en cuanto y tanto su error es más pequeño. Podríamos decir que es la desviación de la
distribución muestral de un estadístico y su fiabilidad.
Nivel de Confianza. Probabilidad de que la estimación efectuada se ajuste a la realidad.
Cualquier información que queremos recoger está distribuida según una ley de
probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de
que el intervalo construido en torno a un estadístico capte el verdadero valor del
parámetro.
Varianza Poblacional. Cuando una población es más homogénea la varianza es menor
y el número de entrevistas necesarias para construir un modelo reducido del universo, o
de la población, será más pequeño. Generalmente es un valor desconocido y hay que
estimarlo a partir de datos de estudios previos.
Inferencia estadística. Trata el problema de la extracción de la información sobre la
población contenida en las muestras.
Para que los resultados obtenidos de los datos muestrales se puedan extender a la
población, la muestra debe ser representativa de la población en lo que se refiere a la
característica en estudio, o sea, la distribución de la característica en la muestra debe ser
aproximadamente igual a la distribución de la característica en la población.
La representatividad en estadística se logra con el tipo de muestreo adecuado que
siempre incluye la aleatoriedad en la selección de los elementos de la población que
formaran la muestra. No obstante, tales métodos solo nos garantizan una
representatividad muy probable pero no completamente segura.
Después de estos preliminares imprescindibles es posible pasa a tratar algunas de las
formas que desde el punto de vista científico se puede extraer una muestra.
Al realizar un muestreo en una población podemos hablar de muestreos probabilísticos
y no probabilísticos, en nuestro caso nos referiremos a los muestreos probabilísticos y
dentro del mismo estudiaremos el muestreo aleatorio simple (MAS), como método
básico en la estadística, el muestreo estratificado y el muestreo por racimos.
Muestreo aleatorio simple: Es aquel en que cada elemento de la población tiene la
misma probabilidad de ser seleccionado para integrar la muestra.
Una muestra simple aleatoria es aquella en que sus elementos son seleccionados
mediante el muestreo aleatorio simple.
En la práctica no nos interesa el individuo o elemento de la población seleccionado en
general, sino solo una característica que mediremos u observaremos en él y cuyo valor
será el valor de una variable aleatoria que en cada individuo o elemento de la población
puede tomar un valor que será un elemento de cierto conjunto de valores. De modo que
una muestra simple aleatoria se puede interpretar como un conjunto de
valores de variables aleatorias independientes, cada una de las cuales
tiene la misma distribución que es llamada distribución poblacional.
Existen dos formas de extraer una muestra de una población: con reposición y sin
reposición.
Muestreo con reemplazo: Es aquel en que un elemento puede ser seleccionado más de
una vez en la muestra para ello se extrae un elemento de la población se observa y se
devuelve a la población, por lo que de esta forma se pueden hacer infinitas extracciones
de la población aun siendo esta finita.
Muestreo sin reemplazo: No se devuelve los elementos extraídos a la población hasta
que no se hallan extraídos todos los elementos de la población que conforman la
muestra.
Cuando se hace una muestra probabilística debemos tener en cuenta principalmente dos
aspectos:
El método de selección.
El tamaño de la muestra
1.- Método de selección:
Un procedimiento de extraer una muestra aleatoria de una población finita es el de
enumerar todos los elementos que conforman la población, escribir esos números en
bolas o papelitos echarlos en un bombo o bolsa mezclarlos bien removiéndolos y sacar
uno a uno tantos como lo indique el tamaño de la muestra. En este caso los elementos de
la muestra lo constituirán los elementos de la población cuyos número coincidan con los
extraídos de la bolsa o bombo.
Otro procedimiento para obtener una muestra de una población ya sea el muestreo con
replazo o sin reemplazo es mediante la utilización de la tabla de números aleatorios pero
solamente para poblaciones finitas, la utilización de estas tablas puede realizarse de
diferentes modos pero en el presente trabajo solo expondremos el que consideramos
mas eficiente ya que no se necesita de la búsqueda de una gran cantidad innecesaria de
números aleatorios en la tabla, el cual será ejemplificado.
Existen diferentes tablas de números aleatorios nosotros en nuestro trabajo utilizaremos
como referencia la tabla de M. G. Kendall y B. Babington Smith que se encuentra en el
texto de tablas estadísticas, la misma está constituida por 4 bloques de 1000 números
aleatorios dispuestos en 25 filas y 40 columnas.
Veamos como se procede para la utilización de la tabla. Consideremos que se desea
extraer de una población de tamaño N una muestra de tamaño n se selecciona el bloque,
la fila y la columna de la tabla que se va a comenzar, a partir de esta selección (que la
hace el muestrista) se toman tantas columnas como dígitos tiene N. Comenzando por el
primer número de las columnas seleccionadas se irán incluyendo en la muestra aquellos
individuos que en la lista de la población ( ya sea de forma horizontal o vertical) ocupa
la posición de los n números de las columnas seleccionadas que resultan menores que
N, en los caso que al seleccionar un número en la tabla de números aleatorios sea mayor
que N se divide este por N y el resto de la división que será un número entre 0 y N-1
será la posición del individuo a seleccionar tomando el convenio de que el resto 0
corresponde a la posición N. Para la aplicación de este procedimiento requiere que se
fije previamente el mayor múltiplo de N que se considerará, para así garantizar que
todos los restos desde 0 a N -1 tengan la misma probabilidad de ser seleccionados, por
ejemplo si N = 150 y tomando 3 columnas se consideraran sólo aquellos números
menores o iguales que 900, los números mayores que 900 no serán analizados en la
selección de la muestra.
Ejemplo 1.1: Dada la siguiente población formada por la edad del hijo mayor de 200
núcleos familiares de una cierta región.
Seleccione una muestra aleatoria de tamaño 10 (use la tabla de números aleatorios,
escoja la tercera fila, tercera columna del segundo bloque de a 1000) numere la
población horizontalmente.
48 49 50 51 50 46 47 56 47 38
53 50 47 46 48 47 48 46 46 50
42 51 51 49 47 51 48 47 42 49
46 48 50 47 48 47 51 56 45 49
45 54 61 46 48 46 46 47 50 34
46 46 51 39 53 55 52 49 47 46
33 40 52 46 44 52 44 54 41 33
48 49 52 42 42 49 47 47 38 48
44 43 44 40 44 45 49 44 43 42
49 49 48 41 51 51 52 42 40 47
37 48 45 46 50 45 47 53 43 47
44 40 46 46 45 48 47 42 47 46
52 53 47 49 46 47 49 42 43 42
43 38 52 50 44 52 44 53 43 45
41 57 47 48 52 53 40 49 40 50
45 42 44 53 57 46 62 47 50 47
45 51 43 45 39 39 41 44 35 41
54 48 51 53 54 42 48 51 37 38
42 37 52 50 45 55 51 46 38 43
53 43 42 39 46 52 53 39 51 40
Para extraer la muestra lo primero que hacemos es disponer tres columnas en las cuales
la primera se ubicaran los números aleatorios, es decir los números extraídos de la tabla
de números aleatorios; en la segunda columna pondremos los números aleatorios
rectificados que serán aquellos números aleatorios menores que N =200 y los restos de
las divisiones de los números aleatorios mayores que N =200 y menores que el mayor
múltiplo de N es decir 800 y en la tercera columna de encontrara los valores de la
muestra.
En la tabla de números aleatorios la tercera fila, tercera columna del segundo bloque de
a 1000 le corresponde al número 3 pero como tenemos que coger el número aleatorio de
tres dígitos el primer número aleatorio sería el 017, los demás serian, 984, 955, 130,
850, 374, 665, 910, 288, 753, 765, 691, 496, 001, hemos escogido 14 números de la
tabla de números aleatorios debido a que hay 4 que son mayores que 800. Veamos a
continuación como extraemos la muestra de la población:
Para el primer número aleatorio 017 se busca en la población el valor que ocupa la
posición 017 leída la población horizontalmente que seria la edad de 48 años, el número
aleatorio 984 no se contempla dentro del análisis ya que es mayor que 800, al igual que
el número 955, el número 130, le corresponde la edad de 52 años, al número 850 no se
contempla dentro del análisis, el 374 como es mayor que 200 se divide por 200 y se
obtiene reto 174 y este es el número aleatorio rectificado correspondiéndole la edad de
53 años, al número 665 se divide por 200 y se obtiene resto 65 que es el número
aleatorio rectificado correspondiéndole la edad de 44 años en la población, a
continuación presentaremos la tabla de las tres columnas a la cual nos referimos
anteriormente como una vía fácil y práctica para obtener la muestra deseada.
Número aleatorio Número aleatorio rectificado
muestra
017 017 48
984 --
955 --
130 130 42

850 --
374 174 53
665 065 53
910 --
288 088 44
753 153 44
765 165 39
691 091 49
496 096 51
001 001 48
Nota: obsérvese que en la muestra existen edades que se repiten esto puede pasar si el
muestreo es con reemplazo si el muestreo es sin reemplazo debemos seguir buscando de
la misma manera en la tabla de números aleatorios seguido del número 001, hasta lograr
tener la muestra con 10 valores de la población no repetidos.
Este muestreo se puede realizar utilizando Microsoft Excel siguiendo los pasos
siguiente:
Se instala la opción de análisis de datos para ello se va a herramienta luego a
complemento y se activa en la ventana complemento la opción herramienta para
análisis.
Se abre una hoja Excel y se introducen los datos de la población en columna.
Se va a herramienta y se elige análisis de datos y en esta ventana se selecciona la opción
muestra.
En la ventana muestra se introduce el rango de entrada que sería seleccionar todos los
valores de la población, si al suministrar en la hoja Excel los datos de la población al
inicio se le designan a estos alguna variable o comentario debe activarse la opción
rótulo de lo contrario no debe ser activada, se activa la casilla de muestreo aleatorio y se
introduce el tamaño de muestra deseado.
Se selecciona el rango de salida que consiste en seleccionar una celda en la hoja Excel
que no esté afectada por ninguna información ni hacia abajo ni a la derecha de la
misma.
Se selecciona aceptar en esta ventana y saldrá el resultado deseado que sería las
muestras elegidas por el programa en la población.
2.- El tamaño de la muestra:
Al realizar un muestreo probabilística nos debemos preguntar ¿Cuál es el número
mínimo de unidades de análisis ( personas, organizaciones, capitulo de telenovelas, etc),
que se necesitan para conformar una muestra ( que me asegure un error estándar
menor que 0.01 ( fijado por el muestrista o investigador), dado que la población es
aproximadamente de tantos elementos.
En el tamaño de una muestra de una población tenemos que tener presente además si es
conocida o no la varianza poblacional.
Para determinar el tamaño de muestra necesario para estimar con un error máximo
permisible prefijado y conocida la varianza poblacional ( ) podemos utilizar la
formula:
 
 
 
 
(1)
que se obtiene de reconocer que es el error estándar o error máximo prefijado y está

dado por la expresión para el nivel de confianza y constituye una


medida de la precisión de la estimación, por lo que podemos inferir además que
.
Ejemplo 1.2
Se desea estimar el peso promedio de los sacos que son llenados por un nuevo
instrumento en una industria. Se conoce que el peso de un saco que se llena con este
instrumento es una variable aleatoria con distribución normal. Si se supone que la
desviación típica del peso es de 0,5 kg. Determine el tamaño de muestra aleatoria
necesaria para determinar una probabilidad igual a 0,95 de que el estimado y el
parámetro se diferencien modularmente en menos de 0,1 kg.
Solución:
Evidentemente un tamaño de muestra no puede ser fraccionario por lo que se debe
aproximar por exceso. El tamaño de muestra sería de 97.
Si la varianza de la población es desconocida, que es lo que mas frecuente se ve en la
práctica el tratamiento será diferente, no es posible encontrar una fórmula cuando la
varianza poblacional es desconocida por lo que para ello aconsejamos utilizar el
siguiente procedimiento-
Primeramente, se toma una pequeña muestra, que se le llama muestra piloto, con ella se
estima la varianza poblacional ( ) y con este valor se evalúa en la formula (1),
sustituyendo ( ) por su estimación ( ). El valor de obtenido será
aproximadamente el valor necesario, nuevamente con ese valor de se extrae una
muestra de este tamaño de la población se le determina la varianza a esa muestra, como
una segunda estimación de ( ) y se aplica de nuevo la formula (1), tomando la
muestra con el obtenido como muestra piloto para la siguiente iteración, se llegará a
cumplir con las restricciones prefijadas. Se puede plantear esta afirmación ya que la
de tiende a estabilizarse a medida que aumenta alrededor de la por lo que
llegará el momento en que se encuentre el tamaño de muestra conveniente, sin embargo,
en la práctica es mucho más sencillo pues, a lo sumo con tres iteraciones se obtiene el
tamaño de muestra deseado, este procedimiento para obtener el tamaño de muestra
deseado se puede realizar utilizando en Microsoft Excel en la opción análisis de datos
las opciones estadística descriptiva para ir hallando la varianza de cada una de las
muestras y la opción muestra para ir determinado las muestras pilotos. Para obtener el
tamaño de la muestra utilizando este método recomendamos la utilización de un paquete
de computo como por ejemplo el Microsoft Excel, aplicando las opciones muestra y
estadística descriptiva.
Para determinar el tamaño de la muestra cuando los datos son cualitativos es decir para
el análisis de fenómenos sociales o cuando se utilizan escalas nominales para verificar
la ausencia o presencia del fenómeno a estudiar, se recomienda la utilización de la
siguiente formula:

(2)

siendo sabiendo que:


es la varianza de la población respecto a determinadas variables.
es la varianza de la muestra, la cual podrá determinarse en términos de probabilidad

como
es error estandar que está dado por la diferencia entre ( ) la media poblacional
y la media muestral.

es el error estandar al cuadrado, que nos servirá para determinar , por lo que

= es la varianza poblacional.
Ejemplo 1.3
De una población de 1 176 adolescentes de una ciudad X se desea conocer la aceptación
por los programas humorísticos televisivos y para ello se desea tomar una muestra por
lo que se necesita saber la cantidad de adolescentes que deben entrevistar para tener una
información adecuada con error estandar menor de 0.015 al 90 % de confiabilidad.
Solución:
= 1 176
= 0,015

por lo que

Es decir para realizar la investigación se necesita una muestra de al menos 298


adolescentes.
Muestreo Estratificado:
El pasado ejemplo corresponde a una muestra probabilística simple. Determinamos en
este caso que el tamaño de muestra sería n =298 adolescentes muestreados. Pero
supongamos que la situación se complica y que esta n la tendremos que estratificar a fin
de que los elementos muestrales o unidad de análisis posean un determinado atributo.
En nuestro ejemplo este tributo es los diferentes canales de televisión. Es decir, cuando
no basta que cada uno de los elementos muestrales tengan la misma probabilidad de ser
escogidos, sino que además es necesario estratificar la muestra en relación a estratos o
categorías que se presentan en la población y que aparte son relevantes para los
objetivos del estudio, se diseña una muestra probabilística estratificada. Lo que aquí se
hace es dividir a la población en subpoblaciones o estratos y se selecciona la muestra
para cada estrato. La estratificación aumenta la precisión de la muestra e implica el uso
deliberado de diferentes tamaños de muestra para cada estrato, " a fin de lograr reducir
la varianza de cada unidad muestral " (Kish, 1965 ), en su libro de muestreo que en un
número determinado de elementos muestrales n = la varianza de la media
muestral puede reducirse al mínimo si el tamaño de la muestra para cada estrato es
proporcional a la desviación estándar dentro del estrato.
Esto es,
(3 )

En donde es la fracción del estrato, el tamaño de la muestra, el tamaño de la


población, es la desviación estándar de cada elemento del estrato , y es una
proporción constante que nos dará como resultado una óptima para cada estrato.
Siguiendo nuestro ejemplo de los adolescentes tenemos que la población es de 1176
adolescentes y que el tamaño de la muestra es = 298. la fracción para cada estrato fh
será :

(4)

De manera que el total de la subpoblación se multiplicará por esta fracción constante a


fin de obtener el tamaño de muestra para el estrato. Sustituyendo tenemos que:
(5)
MUESTRA PROBABILÍSTICA ESRTRATIFICADA DE LA ACEPTACIÓN DE
ADOLESCENTES POR LOS PROGRAMAS HUMORÍSTICOS TELEVISIVOS DE
LA CIUDAD X.
Estratos Repartos de la ciudad X Total población* Muestra
(fh) = 0.2534
Nh (fh) = nh
1 53 13
2 109
3 215 55
4 87 22
5 98 25
6 110 28
7 81 20
8 221 56
9 151 38
10 51 13

= 1176
  
Por ejemplo :
= 53 directores de empresas extractivas corresponde a la población total de este
giro.
= 0.2534 es la fracción constante.
= 13 es el número redondeado de directores de empresa del giro Estractivo que
tendrán que entrevistarse.
MUESTREO PROBABILÍSTICO POR RACIMOS:
En algunos casos en donde el investigador se ve limitado por recursos financieros, por
tiempo, por distancias geográficas o por una combinación de estos y otros obstáculos, se
recurre a otra modalidad de muestreo llamado por racimos. En este tipo de muestreo se
reducen costos, tiempo y energía al considerar que muchas veces nuestras unidades de
análisis se encuentran encapsuladas o encerradas en determinados lugares físicos o
geográficos que denominamos racimos. Para dar algunos ejemplos tenemos la tabla 8.3.,
en donde en la primera columna se encuentran unidades de análisis que frecuentemente
vamos a estudiar en ciencias sociales. En la segunda columna, sugerimos posibles
racimos en donde se encuentran dichos elementos.
EJEMPLOS DE RACIMOS
Unidad de Análisis Posibles Racimos
Adolescentes Preparatorias
Obreros Industrias
Amas de casa Mercados
Niños Colegios
Personajes de televisión Programas de televisión
El muestrear por racimos implica diferencias entre la unidad de análisis y la unidad
muestral. La unidad de análisis - como lo indicamos al principio de este capítulo – se
refiere a quiénes van a ser medidos, o sea , el sujeto o sujetos a quienes en última
instancia vamos a aplicar el instrumento de medición . la unidad muestral – en este tipo
de muestra – se refiere al racimo a través del cual se logra el acceso a la unidad de
análisis. El muestreo por racimos supone una selección en dos etapas, ambas con
procedimientos probabilísticos. En la primera, se seleccionan los racimos, siguiendo los
ya reseñados pasos de una muestra probabilística simple o estratificada. En la segunda,
y dentro de estos racimos se seleccionan a los sujetos u objetos que van a ser medidos.
Para ello se hace una selección que asegure que todos los elementos del racimo tienen la
misma probabilidad de ser elegidos. A continuación daremos un ejemplo que
comprenda varios de los procedimientos descritos hasta ahora y que ilustra la manera
como frecuentemente se hace una muestra probabilística en varias etapas.
EJEMPLO
¿Cómo hacer una muestra probabilística estratificada y por racimos?
Problema de investigación: Una estación de radio local necesita saber con precisión – a
fin de planear sus estrategias – cómo usan la radio los adultos de una ciudad de 2 500
000 habitantes. Es decir, qué tanto radio escuchan, a qué horas, qué contenidos prefieren
y sus opiniones con respecto a los programas noticiosos.
Procedimientos: Se diseñará un cuestionario que indague estas áreas sobre uso del radio.
Los cuestionarios se aplicarán por entrevistadores a una muestra de sujetos adultos.
Población: Todos aquellos sujetos – hombres o mujeres – de más de 21 años de edad, y
que vivan en una casa o departamento propio o rentado de la ciudad X.
Diseño por conglomerado: los directivos de la estación de radio desconocen el número
total de sujetos con las características arriba señaladas. Sin embargo, nos piden que
diseñemos una muestra que abarque a todos los sujetos adultos de la ciudad, adultos por
edad cronológica y por ser jefes de familia , es decir, excluye a los adultos dependientes.
Se recurre entonces a la estrategia de seleccionar conglomerados y se considera el uso
de un mapa actualizado de la ciudad y que demuestra que en dicha ciudad hay 5 000
cuadras. Las cuadras se utilizan como conglomerados, es decir, como unidades
muestrales a partir de las cuales obtendremos en última instancia a nuestros sujetos
adultos. Lo primero entonces es determinar ¿Cuántas cuadras necesitaremos muestrear,
de una población de una población total de 5 000 cuadras, si queremos que nuestro error
estándar sea no mayor de 0.15 y con una probabilidad de ocurrencia del 50 % ?.

(6)
Tenemos entonces que para una muestra probabilística simple.

Necesitaremos una muestra de 909 cuadras de ciudad X para estimar los valores de la
población con una probabilidad de error menor a 0.1 .
Sabemos que la población N = 5 000 cuadras de la ciudad, está dividida por previos
estudios de acuerdo a 4 estratos socioeconómicos , que categorizar las 5 000 cuadras
según el ingreso mensual promedio de sus habitantes de manera que se distribuyen
como sigue :
Estrato Número de cuadras
1 270
2 1940
3 2000
4 790
T = 5 000
Estratificación de la muestra:

¿ Cómo distribuiremos los 909 elementos muestrales de , para optimizar nuestra


muestra , de acuerdo a la distribución de la población en los 4 estratos
socioeconómicos?.
Estrato No. de cuadras fh = 0.1818
1 270 (0.1818 ) 50
2 1940 (0.1818 ) 353
3 2000 (0.1818 ) 363
4 790 (0.1818 ) 143
N = 5000 n = 909
Tenemos que en principio, de 5000 cuadras de la ciudad se seleccionarán 50 del estrato
1, 553 del estrato 2, 363 del estrato 3 y 143 del estrato 4. Esta comprende la selección
de los conglomerados, los cuales se pueden numerar y elegir aleatoriamente hasta
completar el número de cada estrato. En una última etapa se seleccionan a los sujetos
dentro de cada conglomerado. Este procedimiento también se hace de manera aleatoria,
hasta lograr un número de sujetos determinados en cada conglomerado.
Estrato Nh cuadras Nh número de Total de hogares
hogares – sujeto por estrato
en cada cuadra
1 270 50 20 1000
2 1940 353 20 7060
3 2000 363 20 7220
4 790 143 20 2860
N = 5000 n = 909 11840
Nota: El procedimiento para realizar el muestreo en cada conglomerado se hace de
forma aleatoria utilizando la tabla de números aleatorios o mediante Microsoft Excel tal
como se explico en el ejemplo (1.1)
Bibliografía:
Calero Vinelo, Arístides. Técnicas de Muestreo / Arístides Calero Vinelo.- La Habana:
Editorial. Pueblo y Eduacación, 1978.- 514p.
Metodología de la Investigación / M. En C. Roberto Hernández Sampiere ... et al. –
México:/5.n/, 1997.---505p
Sánchez Älvares, Rafael. Estadística Elemental 7 Rafael Sánchez Älvares y José A.
Torres Delgado.- La Habana : Ed. Pueblo y Eduacació, 1989.- 326p.
Taro, Yamane. Elementary Sampling Theory / Yamane Taro.- La Habana: Editorial
Pueblo y Educación, 1989.- 405p.
 
 
 Ms.C: Arsenio Celorrio Sánchez
http://www.monografias.com/trabajos12/muestam/muestam.shtml

8.8 Problemas
Ejercicio 8..1. Se ha medido el volumen diario de bilis, expresado en litros, en 10
individuos sanos, obteniéndose

0,98; 0,85; 0,77; 0,92; 1,12; 1,06; 0,89; 1,01; 1,21; 0,77.

¿Cuanto vale la producción diaria media de bilis en individuos sanos suponiendo que la
muestra ha sido obtenida por muestreo aleatorio simple sobre una población normal?

Ejercicio 8..2. La cantidad mínima requerida para que un anestésico surta efecto en una
intervención quirúrgica fue por término medio de 50 mg, con una desviación típica de
10,2 mg, en una muestra de 60 pacientes. Obtener un intervalo de confianza para la
media al 99%, suponiendo que la muestra fue extraída mediante muestreo aleatorio
simple sobre una población normal.

Ejercicio 8..3. Un investigador está interesado en estimar la proporción de muertes


debidas a cáncer de estómago en relación con el número de defunciones por cualquier
tipo de neoplasia. Su experiencia le indica que sería sorprendente que tal proporción
supere el valor de 1/3. ¿Qué tamaño de muestra debe tomar para estimar la anterior
proporción, con una confianza del 99%, para que el valor estimado no difiera del valor
real en más de 0,03?.

Ejercicio 8..4. Se desea realizar una estimación confidencial de la varianza de la


estatura de los niños varones de 10 años de una ciudad con una confianza del 95%.
¿Cuál será dicho intervalo si se toma una muestra de 101 niños al azar, entre todos los
que reúnen las características deseadas, y medimos sus estaturas, y se obtienen las

siguientes estimaciones puntuales: , ?

Ejercicio 8..5. Un cardiólogo se encuentra interesado en encontrar límites de confianza


al 90%, para la presión sistólica tras un cierto ejercicio físico. Obtenerlos si en 50
individuos se obtuvo , y suponemos que el comportamiento de la v.a. es
normal.

Ejercicio 8..6. En una muestra de 25 bebés varones de 12 semanas de vida, se obtuvo


un peso medio de 5.900 gr y una desviación típica de 94 gr.

1.
Obtener un intervalo de confianza (al 95%) para el peso medio poblacional.
2.
¿Cuántos niños habría que tomar para estimar dicha media con una precisión de
15 gr?

Ejercicio 8..7. En un determinado servicio de odontología se sabe que el 22% de las


visitas llevan consigo una extracción dentaria inmediata. En cierto año, de 2.366 visitas,
498 dieron lugar a una extracción inmediata. ¿Entran en contradicción las cifras de ese
año con el porcentaje establecido de siempre?

Ejercicio 8..8. Sólo una parte de los pacientes que sufren un determinado síndrome
neurológico consiguen una curación completa; Si de 64 pacientes observados se han
curado 41, dar una estimaciones puntual y un intervalos de la proporción de los que
sanan. ¿Qué número de enfermos habría que observar para estimar la proporción de
curados con un error inferior a 0,05 y una confianza del 95%?

Ejercicio 8..9. Se desea estimar el tiempo medio de sangría en fumadores de más de 20


cigarrillos diarios, con edades comprendidas entre 35 y 40 años, con una precisión de 5
segundos. Ante la ausencia de cualquier información acerca de la variabilidad del
tiempo de sangría es este tipo de individuos, se tomó una muestra preliminar de 5
individuos, en los que se obtuvieron los siguientes tiempos (en segundos):

97, 80, 67, 91, 73.

Determinar el tamaño mínimo de muestra, al 95%, para cumplir el objetivo anterior.

Ejercicio 8..10. En una determinada región se tomó una muestra aleatoria de 125
individuos, de los cuales 12 padecían afecciones pulmonares.

1.
Estímese la proporción de afecciones pulmonares en dicha región.
2.
Si queremos estimar dicha proporción con un error máximo del 4%, para una
confianza del 95%, ¿qué tamaño de muestra debemos tomar?

Ejercicio 8..11. En una muestra de tabletas de aspirinas, de las cuales observamos su


peso expresado en gramos, obtenemos:

1,19; 1,23; 1,18; 1,21; 1,27; 1,17; 1,15; 1,14; 1,19; 1,2

Suponiendo la Normalidad para esta distribución de pesos, determinar un intervalo al


80% de confianza para la varianza.

Ejercicio 8..12. Se quiere estimar la incidencia de la hipertensión arterial en el


embarazo. ¿Cuantas embarazadas tenemos que observar para, con una confianza del
95%, estimar dicha incidencia con un error del 2% en los siguientes casos:

1.
Sabiendo que un sondeo previo se ha observado un 9% de hipertensas.
2.
Sin ninguna información previa.

http://www.bioestadistica.uma.es/libro/node111.htm

23.¿Qué tan grande debe de seleccionarse una muestra para tener un


intervalo de confianza de 95% con un margen de error de 10? Suponga
que la desviación estándar poblacional es 40.
N.C zz ==1.96 EE==10
N.C==95% σσ== 40
95% 1.96 10 40

27.Los salarios anuales iniciales de estudiantes que acaban de terminar


una carrera en administración se espera que estén entre $30000 y
$45000. Suponga que quiere dar un intervalo de confianza de 95%
para estimar la media poblacional de los salarios iniciales. ¿Cuál es el
valor planeado de la desviación estándar poblacional?

¿Cuán grande deberá ser la muestra? si se quiere que el margen de


error sea:
a. $500

b. $200

c. $100

d. ¿Recomendaría usted tratar de tener $100 como margen de error?


No, porque la muestra es demasiado grande en comparació n con la del
inciso a) con la cual resultaría má s fá cil trabajar y ademá s tiene el
mismo nivel de confianza que la de margen de error de $100

N.C zz ==1.96 EE==.05 p*p*== .35


N.C==95%
95% 1.96 .05 .35

33.En un estudio el valor planeado para la proporción poblacional es p* =


0.35. ¿De qué tamaño se debe tomar la muestra para dar un intervalo
de confianza de 95% con un margen de error de 0.05?
PROBLEMAS DE DETERMINACIÓN DE TAMAÑO DE LA
MUESTRA

37.Towers Perrin, una empresa de recursos humanos, realizó un estudio


con 1100 de empresas medianas y grandes para determinar qué tan
insatisfechos estaban con sus trabajos. En el archivo JobSatisfaction
que viene en el CD del libro, se muestran datos representativos. Un Sí
como respuesta indica que un empleado le desagrada mucho su
empleo actual.
a. Dé la estimación puntual de la proporción poblacional de
empleados a quienes les disgusta mucho su empleo actual.

b. A 95% de confianza, ¿Cuál es el margen de error?

c. ¿Cuál es el intervalo de confianza de 95% para la proporción de la


población de empleados a quienes les desagrada mucho su empleo
actual?

Intervalo de confianza
0.4704 - 0.5295 entre 47.04% y 52.95%

d. Towers Perrin estima que los empleadores les cuesta un tercio de


un sueldo anual por hora hallar un sucesor y hasta 1.5 veces el
sueldo anual encontrar un sucesor para un empleado que recibe
una compensación elevada. ¿Cuál es el mensaje de esta
investigación para los empleadores?

BIBLIOGRAFÍA
Anderson, D. R., D. J. Sweeney y T. A. Williams. (2008). Estadística para la
administración y la economía. (10a ed). México: CENGAGE Learning. 317,318
y 323.
http://www.slideshare.net/chcluz/tarea-9-problemas-de-determinacin-de-
tamao-de-la-muestra-5181924/download

EJERCICIOS SOBRE EL TAMAÑO DE LA MUESTRA.


 
1. Queremos ajustar una máquina de refrescos de modo que el promedio del líquido
dispensado quede dentro de cierto rango. La cantidad de liquido vertido por la máquina
sigue una distribución normal con desviación estándar 0´15 decilitros. Deseamos que el
valor estimado que se vaya a obtener comparado con el verdadero no sea superior a 0´2
decilitros con una confianza del 95%.¿De qué tamaño debemos escoger la muestra?(Sol.
n =217).
2. Es necesario estimar entre 10.000 establos, el número de vacas lecheras por establo
con un error de estimación de 4 y un nivel de confianza del 95%. Sabemos que la
varianza es 1.000. ¿Cuántos establos deben visitarse para satisfacer estos
requerimientos? (Sol. Como sabemos que hay 10.000 establos, tendremos que usar la
fórmula en la que interviene el tamaño de la población y obtenemos n=235).
 
3. Una máquina llena cajas con cierto cereal. El supervisor desea conocer con un error
de estimación de máximo 0´1 y un nivel de confianza del 90%, una media estimada del
peso. Como la varianza era desconocida se procedió a escoger una muestra piloto. Los
resultados fueron los siguientes: 11´02, 11´14, 10´78, 11´59, 11´58, 11´19, 11´71, 11
´27, 10´93, 10´94. ¿Cuántas cajas debe escoger para que se cumplan los requisitos
propuestos?(Sol. Debemos tomar la varianza estimada y al ser n<30 el valor de t, al
sustituir en la fórmula obtenemos n=34).
 
4. Se desea conocer el peso promedio de una determinada clase de pescado con un error
de estimación de 0´02 y con un nivel de confianza del 99%. Por datos anteriores se sabe
que el peso mínimo es 1´48 libras y el máximo es de 2´47 libras.¿De qué tamaño debe
escoger la muestra? Suponga que los pesos de estos pescados se distribuyen
normalmente.(Sol. No conocemos la varianza pero la podemos estimar a partirde la
fórmula A/4. Al sustituir en la fórmula obtenemos n=1015)
 
5. Se desea hacer una encuesta para determinar la proporción de familias que carecen de
medios económicos para atender los problemas de salud. Existe la impresión de que esta
proporción está próxima a 0´35. Se desea determinar un intervalo de confianza del 95%
con un error de estimación de 0´05. ¿De qué tamaño debe tomarse la muestra?(Sol.
N=350 ).
 
6. Un productor de semillas desea saber con un error de estimación del 1% el porcentaje
de semillas que germinan en la granja de su competidor. ¿Qué tamaño de muestra debe
tomarse para obtener un nivel de confianza del 95%?(Sol. Como no tenemos ninguna
estimación de la proporción, tomaremos 0´5 y así obtenemos n=9.604)
 
7. Se desea realizar una encuesta entre la población juvenil de una determinada
localidad para determinar la proporción de jóvenes que estaría a favor de una nueva
zona de ocio. El número de jóvenes de dicha población es N=2.000. Determinar el
tamaño de muestra necesario para estimar la proporción de estudiantes que están a favor
con un error de estimación de 0´05 y un nivel de confianza del 95%.(Sol. Como no nos
dan ninguna estimación de la proporción, tomaremos 0´5. El valor de n es 322).

http://thales.cica.es/rd/Recursos/rd99/ed99-0018-
04/EJERCICIOS_archivos/EJERCICIOS.html

También podría gustarte