0% encontró este documento útil (0 votos)
132 vistas16 páginas

Seleccion de La Muestra Datos

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1/ 16

SELECCIÓN DE LA MUESTRA

INTRODUCCIÓN

Una vez definido el problema a investigar, formulados los objetivos y delimitadas las variables se
hace necesario determinar los elementos o individuos con quienes se va a llevar a cabo el estudio
o investigación. Esta consideración nos conduce a delimitar el ámbito de la investigación
definiendo una población y seleccionando la muestra. Cualquier característica medible de la
población se denomina parámetro, los valores de los parámetros calculados sobre muestras se
conocen como estadísticos o estadígrafos, utilizan letras latinas (0, s2, r..., media, varianza,
coeficiente de correlación) y describen a las citadas muestras.

Se define tradicionalmente la población como “el conjunto de todos los individuos (objetos,
personas, eventos, etc.) en los que se desea estudiar el fenómeno. Éstos deben reunir las
características de lo que es objeto de estudio” (Latorre, Rincón y Arnal, 2003). El individuo, en
esta acepción, hace referencia a cada uno de los elementos de los que se obtiene la información.
Los individuos pueden ser personas, objetos o acontecimientos.

Hoy se prefiere hablar de “unidad de observación” o “elemento” para referirse al objeto sobre el
cual se realiza una medición. En los estudios con poblaciones humanas, con frecuencia ocurre que
la unidad de observación son los individuos.

Curso: Metodología de la Investigación 1


1. POBLACIÓN
Llamado también universo o colectivo, es el conjunto de todos los elementos que tienen una
característica común. Una población puede ser finita o infinita. Es población finita cuando
está delimitada y conocemos el número que la integran, así por ejemplo: Estudiantes de la
Universidad Privada de la Selva Peruana. Es población infinita cuando a pesar de estar
delimitada en el espacio, no se conoce el número de elementos que la integran, así, por
ejemplo: Todos los profesionales universitarios que están ejerciendo su carrera.

2. MUESTRA. - La muestra es un subconjunto de la población. Ejemplo: Estudiantes de 1er


Semestre de la Universidad Privada de la Selva Peruana.
No siempre, pero en la mayoría de las situaciones sí realizamos el estudio en una muestra.
Sólo cuando queremos realizar un censo debemos incluir en el estudio a todos los casos
(personas, animales, plantas, objetos) del universo o la población. Por ejemplo, los estudios
motivacionales en empresas suelen abarcar a todos sus empleados para evitar que los
excluidos piensen que su opinión no se toma en cuenta. Las muestras se utilizan por economía
de tiempo y recursos.

Sus principales características son:


a) Representativa. - Se refiere a que todos y cada uno de los elementos de la población
tengan la misma oportunidad de ser tomados en cuenta para formar dicha muestra.
b) Adecuada y válida. - Se refiere a que la muestra debe ser obtenida de tal manera que
permita establecer un mínimo de error posible respecto de la población.
Para que una muestra sea fiable, es necesario que su tamaño sea obtenido mediante
procesos matemáticos que eliminen la incidencia del error.

2.1 ELEMENTO O INDIVIDUO


Unidad mínima que compone una población. El elemento puede ser una entidad simple
(una persona) o una entidad compleja (una familia), y se denomina unidad
investigativa.

Curso: Metodología de la Investigación 2


3. RECOLECTAR DATOS
Aquí el interés se centra en “qué o quiénes”, es decir, en los participantes, objetos, sucesos o
comunidades de estudio (las unidades de análisis), lo cual depende del planteamiento de la
investigación y de los alcances del estudio. Así, en la situación de que el objetivo sea describir
el uso que hacen los niños de la televisión, lo más factible sería interrogar a un grupo de niños.
También serviría entrevistar a los padres de los niños. Escoger entre los niños o sus padres, o
ambos, dependería no sólo del objetivo de la investigación, sino del diseño de la misma. En
el caso de la investigación que hemos ejemplificado a lo largo del libro, donde el propósito
básico del estudio es describir la relación niño-televisión, se podría determinar que los
participantes seleccionados para el estudio fueran niños que respondieran sobre sus conductas
y percepciones relacionadas con este medio de comunicación. En otro estudio de Greenberg,
Ericson y Vlahos (1972), el objetivo de análisis era investigar las discrepancias o semejanzas
en las opiniones de madres e hijos o hijas con respecto al uso de la televisión por parte de
estos últimos. Aquí la finalidad del estudio supuso la selección de mamás y niños, para
entrevistarlos por separado, correlacionando posteriormente la respuesta de cada par madre-
hijo(a). Lo anterior quizá parezca muy obvio, pues los objetivos de los dos ejemplos
mencionados son claros. En la práctica esto no parece ser tan simple para muchos estudiantes,
que en propuestas de investigación y de tesis no logran una coherencia entre los objetivos de
la investigación y la unidad de análisis de la misma.

4. DELIMITAR UNA POBLACIÓN


Una vez que se ha definido cuál será la unidad de análisis, se procede a delimitar la población
que va a ser estudiada y sobre la cual se pretende generalizar los resultados. Así, una población
es el conjunto de todos los casos que concuerdan con una serie de especificaciones (Selltiz et
al., 1980). Una deficiencia que se presenta en algunos trabajos de investigación es que no
describen lo suficiente las características de la población o consideran que la muestra la
representa de manera automática. Es común que algunos estudios que sólo se basan en
muestras de estudiantes universitarios (porque es fácil aplicar en ellos el instrumento de
medición, pues están a la mano) hagan generalizaciones temerarias sobre jóvenes que tal vez

Curso: Metodología de la Investigación 3


posean otras características sociales. Es preferible entonces establecer con claridad las
características de la población, con la finalidad de delimitar cuáles serán los parámetros
muéstrales. Lo anterior puede ilustrarse con el ejemplo de la investigación sobre el uso de la
televisión por los niños. Está claro que en dicha investigación la unidad de análisis son los
niños. Pero, ¿de qué población se trata?, ¿de todos los niños del mundo?, ¿de todos los niños
de la República mexicana? Sería muy ambicioso y prácticamente imposible referirnos a
poblaciones tan grandes.

5. SELECCIONAR LA MUESTRA
Hasta este momento hemos visto que se debe definir cuál será la unidad de análisis y cuáles
son las características de la población. En este inciso hablaremos de la muestra, o mejor dicho
de los tipos de muestra, con la finalidad de poder elegir la más conveniente para un estudio.
La muestra es, en esencia, un subgrupo de la población. Digamos que es un subconjunto de
elementos que pertenecen a ese conjunto definido en sus características al que llamamos
población. Con frecuencia leemos y escuchamos hablar de muestra representativa, muestra al
azar, muestra aleatoria, como si con los simples términos se pudiera dar más seriedad a los
resultados. En realidad, pocas veces es posible medir a toda la población, por lo que
obtenemos o seleccionamos una muestra y, desde luego, se pretende que este subconjunto sea
un reflejo fi el del conjunto de la población. Todas las muestras bajo el enfoque cuantitativo
deben ser representativas; por tanto, el uso de este término resulta por demás inútil. Los
términos al azar y aleatorio denotan un tipo de procedimiento mecánico relacionado con la
probabilidad y con la selección de elementos; pero no logran esclarecer tampoco el tipo de
muestra y el procedimiento de muestreo. Hablemos entonces de estos conceptos en los
siguientes apartados.

6. RAZONES PARA MUESTREAR


Cuando se estudian las características de una población, existen diversas razones prácticas
para preferir la selección de porciones o muestras de una población para observar y medir. He
aquí algunas razones para muestrear:

Curso: Metodología de la Investigación 4


a) Establecer contacto con toda la población queriría mucho tiempo.
Un candidato para un puesto provincial quizá desee determinar las posibilidades que
tiene de resultar electo. Una encuesta de muestreo en la que se utiliza el personal y las
entrevistas de campo convencionales de una empresa especializada en encuestas
tardaría de uno o dos días. Con el mismo personal y los mismos entrevistadores, y
laborando siete días a la semana, se requerirían 200 años para ponerse en contacto con
toda la población en edad de votar. Aunque fuera posible reunir a un numeroso equipo
de encuestadores, quizá no valdría la pena entrar en contacto con todos los votantes.
b) El costo de estudiar todos los elementos de una población resultaría prohibitivo.
Las organizaciones que realizan encuestas de opinión pública y pruebas entre
consumidores, como Gallup Polls y Roper ASW, normalmente entran en contacto con
menos de 2 000 de los casi 60 millones de familias en Estados Unidos. Una organización
que entrevista a consumidores en panel cobra cerca de $40 000 por enviar muestras por
correo y tabular las respuestas con el fin de probar un producto (como un cereal para el
desayuno, alimento para gato o algún perfume). La misma prueba del producto con los
60 millones de familias tendría un costo de aproximadamente $1 000 000 000.
c) Estadística en acción
Con el importante papel que desempeña la estadística inferencial en todas las ramas de
la ciencia, es ya una necesidad la disponibilidad de fuentes copiosas de números
aleatorios. En 1927 se publicó el primer libro de números aleatorios, con 41 600 dígitos
aleatorios, generados por L. Tippett. En 1938, R. A. Fisher y E. Yates publicaron 15
000 dígitos aleatorios, generados con dos barajas. En 1955, RAND Corporation publicó
un millón de dígitos aleatorios, generados por pulsos de frecuencia aleatorios de una
ruleta electrónica. Para 1970, las aplicaciones del muestreo requerían miles de millones
de números aleatorios. Desde entonces se han creado métodos para generar, con ayuda
de computadoras, dígitos “casi” aleatorios, por lo que se les llama seudoaleatorios. Aún
es motivo de debate la pregunta acerca de si un programa de computadora sirve para
generar números aleatorios que de verdad sean aleatorios.
d) Es imposible verificar de manera física todos los elementos de una población.

Curso: Metodología de la Investigación 5


Algunas poblaciones son infinitas. Sería imposible verificar toda el agua del lago Erie
en lo que se refiere a niveles de bacterias, así que se eligen muestras en diversos lugares.
Las poblaciones de peces, aves, serpientes o mosquitos son grandes, y se desplazan,
nacen y mueren continuamente. En lugar de intentar contar todos los patos que hay en
Canadá o todos los peces del lago Pontchartrain, se hacen aproximaciones mediante
diversas técnicas: se cuentan todos los patos que hay en un estanque, capturados al azar,
se revisan las cestas de los cazadores o se colocan redes en lugares predeterminados en
el lago.
e) Algunas pruebas de naturaleza destructiva.
Si los catadores de vino de Sutter Home Winery, California, se bebieran todo el vino
para evaluar la vendimia, acabarían con la cosecha y no quedaría nada disponible para
la venta. En el área de producción industrial: las placas de acero, cables y productos
similares deben contar con una resistencia mínima a la tensión. Para cerciorarse de que
el producto satisface la norma mínima, el departamento de control de calidad elige una
muestra de la producción actual. Cada pieza se somete a tensión hasta que se rompe y
se registra el punto de ruptura (medido en libras por pulgada cuadrada). Es obvio que si
se sometieran todos los cables o todas las placas a pruebas de resistencia a la tensión no
habría productos disponibles para vender u utilizar. Por la misma razón, Kodak
selecciona sólo una muestra de película fotográfica y la somete a pruebas para
determinar la calidad de todos los rollos que se producen; y sólo unas cuantas semillas
se someten a pruebas de germinación en Burpee, antes de la temporada de siembra.
f) Los resultados de la muestra son adecuados.
Aunque se contara con recursos suficientes, es difícil que la precisión de una muestra
de 100% toda la población resulte esencial en la mayoría de los problemas. Por ejemplo,
el gobierno federal utiliza una muestra de tiendas de comestibles distribuidas en Estados
Unidos para determinar el índice mensual de precios de los alimentos. Los precios del
pan, frijol, leche y otros productos de primera necesidad se incluyen en el índice.
Resulta poco probable que la inclusión de todas las tiendas de comestibles de Estados
Unidos influya significativamente en el índice, pues los precios de la leche, el pan y

Curso: Metodología de la Investigación 6


otros productos de primera necesidad no varían más de unos cuantos centavos de una
cadena de tiendas a otra.

7. FÓRMULA PARA CALCULAR EL TAMAÑO DE LA MUESTRA

Para calcular el tamaño de la muestra suele utilizarse la siguiente fórmula:

𝑁𝜎 2 𝑍 2
𝑛=
(𝑁 − 1)𝑒 2 + 𝜎 2 𝑍 2
Donde:
n = el tamaño de la muestra.
N = tamaño de la población.
𝜎 = Desviación estándar de la población que, generalmente cuando no se tiene su valor, suele
utilizarse un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene
su valor, se lo toma en relación al 95% de confianza equivale a 1,96 (como más usual) o en
relación al 99% de confianza equivale 2,58, valor que queda a criterio del investigador.
e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele
utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del
encuestador.

La fórmula del tamaño de la muestra se obtiene de la fórmula para calcular la estimación del
intervalo de confianza para la media, la cual es:

𝜎 𝑁−𝑛 𝜎 𝑁−𝑛
𝑋̅ − 𝑍 √ ≤ 𝜇 ≤ 𝑋̅ + 𝑍 √
√𝑛 𝑁 − 1 √𝑛 𝑁 − 1
De donde el error es:

Curso: Metodología de la Investigación 7


𝜎 𝑁−𝑛
𝑒=𝑍 √
√𝑛 𝑁 − 1
De esta fórmula del error de la estimación del intervalo de confianza para la media se despeja
la n, para lo cual se sigue el siguiente proceso:
Elevando al cuadrado a ambos miembros de la fórmula se obtiene:
2
𝜎
𝑁−𝑛
(𝑒)2 = (𝑍 √ )
√𝑛 𝑁 − 1

𝜎2 𝑁 − 𝑛
𝑒 2 = 𝑍2
𝑛 𝑁−1

Multiplicando fracciones:
𝑍 2 𝜎 2 (𝑁 − 𝑛)
𝑒2 =
𝑛(𝑁 − 1)

Eliminando denominadores:
𝑒 2 𝑛(𝑁 − 1) = 𝑍 2 𝜎 2 (𝑁 − 𝑛)
Eliminando paréntesis:
𝑒 2 𝑛𝑁 − 𝑒 2 𝑛 = 𝑍 2 𝜎 2 𝑁 − 𝑍 2 𝜎 2 𝑛

Transponiendo n a la izquierda:
𝑒 2 𝑛𝑁 − 𝑒 2 𝑛 + 𝑍 2 𝜎 2 𝑛 = 𝑍 2 𝜎 2 𝑁

Factor común de n:
𝑛(𝑒 2 𝑁 − 𝑒 2 + 𝑍 2 𝜎 2 ) = 𝑍 2 𝜎 2 𝑁

Despejando n:

Curso: Metodología de la Investigación 8


𝑍2𝜎 2𝑁
𝑛= 2
𝑒 𝑁 − 𝑒 2 + 𝑍2𝜎 2

Ordenando se obtiene la fórmula para calcular el tamaño de la muestra:

𝒁𝟐 𝝈𝟐 𝑵
𝒏=
𝒆𝟐 (𝑵 − 𝟏) + 𝒁𝟐 𝝈𝟐

8. EJEMPLOS ILUSTRATIVOS
1) Calcular el tamaño de la muestra de una población de 500 elementos con un nivel de
confianza del 95%
Solución:
Realizando el gráfico que representa el 95% de confianza se obtiene:

Se tiene
N=500, para el 95% de confianza Z = 1,96, y como no se tiene los demás valores se tomará
𝜎 = 0,5, y e = 0,05.

Curso: Metodología de la Investigación 9


Reemplazando valores de la fórmula se tiene:
𝑁𝜎 2 𝑍 2
𝑛=
𝑒 2 (𝑁 − 1) + 𝜎 2 𝑍 2
500 ∙ 0,52 ∙ 1,962
𝑛=
0,052 (500 − 1) + 0,52 ∙ 1,962
500 ∙ 0,52 ∙ 1,962
𝑛= = 217
0,052 (500 − 1) + 0,52 ∙ 1,962

2) Calcular el tamaño de la muestra de una población de 500 elementos con un nivel de confianza
del 99%
Solución:
Realizando el gráfico que representa el 99% de confianza se obtiene:

Curso: Metodología de la Investigación 10


Se tiene N=500, para el 99% de confianza Z = 2,58, y como no se tiene los demás valores se
tomará 𝜎 = 0,5, y e = 0,05.
Reemplazando valores en la fórmula se obtiene:
𝑁𝜎 2 𝑍 2
𝑛=
(𝑁 − 1)𝑒 2 + 𝜎 2 𝑍 2
500 ∙ 0,52 ∙ 2,582 832,05
𝑛= 2 2 2
= = 285,77 = 286
(500 − 1)(±0,05) + 0,5 ∙ 2,58 2,9116

GEOGEBRA

9. TAREA DE INTERAPRENDIZAJE
1) Proponga 3 ejemplos de población, muestra y elemento.
2) Calcule el tamaño de la muestra para una población de 500 con un error de muestreo del 5%
y nivel de confianza del 95%. Realice los cálculos de manera manual y empleando Excel.

Respuesta: 217

3) Calcule el tamaño de la muestra para una población de 500 con un error de muestreo del 5%
y nivel de confianza del 99%. Realice los cálculos de manera manual y empleando Excel.
Respuesta: 285

4) Calcule el tamaño de la muestra para una población de 500 con un error de muestreo del 9%
y nivel de confianza del 95%. Realice los cálculos de manera manual y empleando Excel.
Respuesta: 96

5) Calcule el tamaño de la muestra para una población de 500 con un error de muestreo del 9%
y nivel de confianza del 99%. Realice los cálculos de manera manual y empleando Excel.

Curso: Metodología de la Investigación 11


Respuesta: 145

NIVEL DE CONFIANZA

Z P(Z ≤ Z)
0.67 0.749
0.99 0.839
1.00 0.841
1.15 0.875
1.28 0.900
1.64 0.950
1.96 0.975
2.00 0.977

Curso: Metodología de la Investigación 12


2.17 0.985
2.32 0.990
2.58 0.995

EJEMPLO
Problema de investigación: Supongamos que el gobierno de un estado, provincia o departamento ha
emitido una ley que impide (prohibición expresa) a las estaciones de radio transmitir comerciales que
utilicen un lenguaje procaz (groserías, malas palabras). Dicho gobierno nos solicita analizar en qué
medida los anuncios radiofónicos transmitidos en el estado utilizan en su contenido este lenguaje,
digamos, durante el último mes.
Población (N): Comerciales transmitidos por las estaciones radiofónicas del estado durante el último
mes.
Tamaño de muestra (n): Lo primero es determinar o conocer N (recordemos que significa población
o universo).
En este caso N = 20000 (20 mil comerciales transmitidos).
Lo segundo es establecer el error máximo aceptable, el porcentaje estimado de la muestra y el nivel
de confianza.

Tamaño de la población: 20,000


Error máximo aceptable: 5%
Nivel de confianza: 95%

De manera automática, el programa nos calcula el tamaño de muestra necesario o requerido: n =


376.9386 (cerrando o aproximando: 377), que es el número de comerciales radiofónicos que
necesitamos para representar al universo de 20000, con un error de 0.05 (5%) y un nivel de confianza
de 95%.

Curso: Metodología de la Investigación 13


Si cambiamos el nivel de error tolerado y el nivel de confianza (1% de error y 99% de confianza), el
tamaño de la muestra será mucho mayor, en este caso de 9083.5153 comerciales.
Como puede apreciarse, el tamaño de la muestra es sensible al error y nivel de confianza que
definamos. A menor error y mayor nivel de confianza, mayor tamaño de muestra requerido para
representar a la población o universo.

EJEMPLO
Problema de investigación: Analizar la motivación intrínseca que tienen los empleados de la cadena
de restaurantes “Lucy y Laura Bunny”.
Población: N = 600 empleados (cocineros, meseros, ayudantes, etcétera). Tamaño de muestra:
Con un error de 5% y un nivel de confianza de 95%, el tamaño requerido para que la muestra sea
representativa es de 234 empleados.
Conforme disminuye el tamaño de la población aumenta la proporción de casos que necesitamos en
la muestra.

MUESTRA PROBABILÍSTICA ESTRATIFICADA

En ocasiones el interés del investigador es comparar sus resultados entre segmentos, grupos o nichos
de la población, porque así lo señala el planteamiento del problema. Por ejemplo, efectuar
comparaciones por género (entre hombres y mujeres), si la selección de la muestra es aleatoria,
tendremos unidades o elementos de ambos géneros, no hay problema, la muestra reflejará a la
población.
Pero a veces, nos interesan grupos que constituyen minorías de la población o universo y entonces si
la muestra es aleatoria simple, resultará muy difícil determinar qué elementos o casos de tales grupos
serán seleccionados. Imaginemos que nos interesan personas de todas las religiones para contrastar
ciertos datos, pero en la ciudad donde se efectuará el estudio la mayoría es por ejemplo
predominantemente católica. Con MAS es casi seguro que no elijamos individuos de diversas

Curso: Metodología de la Investigación 14


religiones o sólo unos cuantos. No podríamos efectuar las comparaciones. Quizá tengamos 300
católicos y dos o tres de otras religiones. Entonces es cuando preferimos obtener una muestra
probabilística estratificada (el nombre nos dice que será probabilística y que se considerarán
segmentos o grupos de la población, o lo que es igual: estratos

Ejemplos de estratos en la variable religión serían: católicos, cristianos, protestantes, judíos,


mahometanos, budistas, etc. Y de la variable grado o nivel de estudios: preescolar, primaria,
secundaria, bachillerato, universidad (o equivalente) y posgrado.
Ahora supongamos que pretendemos realizar un estudio con directores de recursos humanos para
determinar su ideología y políticas respecto a cómo tratan a los colaboradores de sus empresas.
Imaginemos que nuestro universo es de 1176 organizaciones con directores de recursos humanos.
Usando STATS® o mediante fórmulas, determinamos que el tamaño de la muestra necesaria para
representar a la población sería de n = 298 directivos. Pero supongamos que la situación se complica
y que debemos estratificar esta n con la finalidad de que los elementos muestrales o las unidades de
análisis posean un determinado atributo. En nuestro ejemplo, este atributo podría ser el giro de la
empresa.
Es decir, cuando no basta que cada uno de los elementos muestrales tengan la misma probabilidad de
ser escogidos, sino que además es necesario segmentar la muestra en relación con estratos o categorías
que se presentan en la población, y que además son relevantes para los objetivos del estudio, se diseña
una muestra probabilística estratificada. Lo que aquí se hace es dividir a la población en
subpoblaciones o estratos, y se selecciona una muestra para cada estrato. La estratificación aumenta
la precisión de la muestra e implica el uso deliberado de diferentes tamaños de muestra para cada
estrato, a fi n de lograr reducir la varianza de cada unidad de la media muestral (Kalton y Heeringa,
2003). Kish (1995) afirma que, en un número determinado de elementos muestrales n = ∑nh, la
varianza de la media muestral y puede reducirse al mínimo, si el tamaño de la muestra para cada
estrato es proporcional a la desviación estándar dentro del estrato.
Siguiendo con nuestro ejemplo, la población es de 1176 directores de recursos humanos y el tamaño
de muestra es n = 298 ¿Qué muestra necesitaremos para cada estrato?

Curso: Metodología de la Investigación 15


𝑛 298
𝑘𝑠ℎ = =
𝑁 1176

De manera que el total de la subpoblación se multiplicará por esta fracción constante para obtener el
tamaño de la muestra para el estrato. Al sustituirse, tenemos que:

MUESTRA PROBABILÍSTICA ESTRATIFICADA DE DIRECTORES DE EMPRESA

Total
Estrato población
Directores de recursos humanos Muestra
por giro (fh) = 0.2534
Nh (fh) = nh
1 Extractivo y siderúrgico 53
2 Metal-mecánicas 109
3 Alimentos, bebidas y tabaco 215
4 Papel y artes gráficas 87
5 Textiles 98
6 Eléctricas y electrónicas 110
7 Automotriz 81
8 Químico-farmacéutica 221
9 Otras empresas de transformación 151
10 Comerciales 51
Total 1176 KKKKKK
Por ejemplo:
Nh = 53 directores de empresas extractivas corresponden a la población total de este giro.
fh = 0.2534 es la fracción constante.
nh = 13 es el número redondeado de directores de empresa del giro extractivo y siderúrgico
que tendrá que entrevistarse.

Curso: Metodología de la Investigación 16

También podría gustarte