Materia
Materia
Materia
presentación 3
programa 5
contenido módulos
mapa conceptual 6
macroobjetivos 7
agenda 8
material 9
material básico
material complementario
glosario 10
módulos *
m1 | 11
m2 | 26
m3 | 49
m4 | 81
m5 | 109
m6 | 140
Presentación
L
e
EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 3
La
en
Introducción a la Estadística Aplicada a la Educación:
El programa de la asignatura inicia con la presentación de lo que es la estadís-
tica como un recurso valioso para realizar investigaciones en el ámbito educa-
tivo y con una introducción a contenidos que le permitirán pensar con qué tipo
de variables se está trabajando, y según ello, determinar su posible nivel de
medición y los consecuentes procedimientos estadísticos aptos para ello. Se
estudian también en esta unidad conceptos primarios como: población, mues-
tra, unidad estadística, variable y dato.
El segundo módulo presenta contenidos que le permitirán construir una base
de datos con la información recogida y presentar los resultados utilizando dis-
tintas estrategias de síntesis, ya sea por medio de tablas y gráficos.
El tercero lo introduce en el tema de las medidas que permiten resumir un
conjunto de datos en coeficientes y estimadores a los fines de facilitar la lectura
de ellos, como por ejemplo las medidas de tendencia central, como la media,
el modo, la mediana o medidas de dispersión como la varianza, el rango o
la desviación estándar. A su vez se introducen procedimientos que permiten
indagar la presencia de asociaciones o correlaciones entre variables.
El módulo cuarto, es uno de los que presentan mayor complejidad teórica, pero
es el que permite entender la lógica de la estadística aplicada, y nos introduce
en las relaciones entre variables analizando: asociación, relación, intensidad,
independencia. Como también la covarianza, su sentido y análisis.
Las actividades que le iremos proponiendo han surgido de las distintas áreas
que conforman la currícula del plan de estudio.
Para concluir esta presentación y para iniciar esta nueva etapa de enseñanza-
aprendizaje les dejo dos pensamientos para reflexionar:
“Estudia no para saber algo más sino para saber algo mejor.”
(Lucio Anneo Séneca)
m a p a c o nceptual
Cronograma
Representación de porcentajes en semanas
MODULOS
SEMANAS 1 2 3 4 5 6
1
2
3
4
5
6
7
8
9 PARCIAL 1
10
11
12
13
14
15 PARCIAL 2
Material Básico:
• Desarrollos teóricos de la asignatura, los que están disponibles en el
apartado contenidos, de cada uno de los módulos.
Material Complementario
• Mendenhall, W.; Scheaffer, R. & Ott, L. (2001) Elementos de muestreo.
España: Thompson.
módulos
m1
m1 microobjetivos
¿Qué es la Estadística?
Definición de Estadística
Denominaremos con
n= tamaño de la
muestra
Veamos ahora:
¿Qué es una
muestra aleatoria?
El censo nos permite determinar el tamaño de una población bajo estudio, pero
su complejidad y costo elevado hace que los censos nacionales se realicen por
lo general cada 10 años. El Gobierno confecciona una planilla con preguntas y
que un amplio equipo de censistas se encargue de recorrer todo el país, casa
por casa. En el formulario se consulta sobre las variables socio demográficas
más relevantes, como edad, cantidad de hijos, situación laboral, características
de la vivienda, etc.
A medida que las ciencias y en particular las ciencias sociales van avanzando
en el desarrollo de sus teorías, se va haciendo más necesario el uso de
herramientas que nos brinda la matemática, en particular la Estadística. No
es necesario que el investigador en Ciencias Sociales sea un especialista
matemático en estadística, pero sí es importante que sepa comprender
el proceso lógico subyacente al razonamiento matemático-estadístico. Es
decir deberá comprender la estructura del problema en el cual debe utilizar
a la estadística como herramienta, analizar qué elementos están en juego,
la estructura formal del modelo matemático y las condiciones que lo hacen
posible. Tiene que haber un compromiso de manera que se simplifique la
realidad concreta lo suficiente para que el modelo creado a partir de la realidad
sea fácilmente manejable desde el punto de vista instrumental matemático. Es
necesario un buen conocimiento de las bases de estadística, para conocer la
potencia y debilidad de sus técnicas y consiguientemente para saber usarlas
con eficacia y la vez con prudencia.
Desde un punto de vista matemático muchas de nuestras afirmaciones están
incompletas, mal encuadradas o son imprecisas.
Pero, por otro lado, muchas de estas ideas pueden ser entendidas
intuitivamente, y es mejor una comprensión intuitiva que ninguna comprensión
en absoluto.
Es siempre preferible que los ejemplos que se usen en la enseñanza sean
hipotéticos, porque es más importante tener un problema simple y específico
que se pueda comprender y que ilustre el método claramente que otro que
simplemente asombre al estudiante con nuestra sabiduría. Las principales
aplicaciones estadísticas en cualquier campo, no sólo el de las Ciencias
Sociales, descansan sobre el hecho de poder hacer observaciones o
Fuentes de datos:
Las fuentes secundarias tienen dos usos dentro de toda investigación social:
¿Qué es un informe?
La palabra Informe, como derivado del verbo “informar”, consiste en un texto
que describe las cualidades de un hecho analizado y de todos los eventos que
lo rodean. El informe deberá ser entonces el resultado o la consecuencia de la
“acción de informar”.
Este informe es un documento que por lo general tiene una estructura pre
establecida, según los objetivos específicos del mismo. Por lo general surge de
un proceso de investigación, y su objetivo principal es informar.
Pueden ser públicos o privados según sea el objetivo de divulgación. Y pueden
ser también ser simples o complejos de acuerdo a la estructura y el contenido
que tenga.
Si el informe es el final de un proceso de investigación, debe plasmar los
distintos pasos que se han llevado a cabo en el proceso de investigación.
Para ello debe tener una estructura y una organización definida clara y
precisa, porque es de ésta estructura de la que depende que el proyecto sea
comprensible, oportuno para todas las personas que lo tengan a disposición.
Pueden distinguirse básicamente las siguientes partes en un informe:
• Portada: incluye el título de la investigación, el nombre del autor o
autores y su afiliación institucional (para cada autor, si es apropiado)
o el nombre de la organización que patrocina el estudio y la fecha en
que se presenta el informe.
El título debe ser autónomo, comunicar la importancia de la idea
y sintetizar el contenido del informe, en pocas palabras, debe ser
conciso y explicativo.
• Índice: incluye los apartados y sub-apartados que componen el
informe.
• Resumen: es una síntesis del contenido esencial del informe de
investigación, y proporciona de manera concisa y directa suficiente
información para que el lector se entere del propósito y los resultados
de la investigación que se está presentando.
El resumen debe incluir la siguiente información específica resumida:
m1 material
Material Básico
• Desarrollo teórico del módulo, disponible en el apartado contenidos.
• Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la
Educación. Córdoba: Editorial Brujas.
Material complementario
• Aplicaciones estadísticas en las Ciencias Sociales: Juan Camacho
Rosales Profesor Titular de Metodología de las Ciencias del
Comportamiento Departamento de Didáctica e Investigación Educativa
y del Comportamiento Universidad de La Laguna “Curso Universitario
Interdisciplinar Sociedad, Ciencia, Tecnología y Matemáticas” 2003.
m1 | actividad 1
Clasificación de Variables
m1 | actividad 2
Consigna:
En función de los contenidos estudiados en
el módulo, analice los enunciados y responda
justificando adecuadamente cada uno de los
planteos.
Ejercicio 1:
En la repartición de Espectáculos Públicos de la Municipalidad de Córdoba,
se reciben un gran número de quejas por día, referidas al incumplimiento
de las normas establecidas, en salones de fiestas y afines. Se han estu-
diado 30 días y los datos se graficaron:
10
8
4
2
0
4 5 6 7 8 9 10 11 12
Numero de quejas
Ejercicio 2
En una institución educativa se quiere saber la ocupación de los egresados de la última década.
Para esto se convoca a una reunión de egresados y de los asistentes, se encuesta a diez egresa-
dos de cada año.
En función del caso planteado:
Ejercicio 3:
Ejercicio 4
Ejercicio 6
Complete las siguientes frases:
Ejercicio 7
Determine la población y sugiera la muestra para cada una de las siguientes
situaciones:
Ejercicio 8
Analice y responda c/u de las siguientes situaciones:
m1 glosario
m2 microobjetivos
Módulo 2
Cuando extraemos un conjunto de datos, ya sean de una población o de una muestra. Lo primero que
nos planteamos es ¿Cómo comenzar a organizarlos?
Es así que surgen los conceptos de: serie simple y distribución de frecuencias.
Serie simple: es un listado de datos, en el orden que fueron apareciendo, por lo general son
pocos datos.
DISTRIBUCIONES DE FRECUENCIAS:
Estudiaremos a continuación cómo organizar los diferentes datos obtenidos al analizar cualquier
variable. Todo conjunto de datos puede organizarse de dos maneras, que no son excluyentes una de
otra.
Tablas estadísticas:
Se denominan “distribuciones de frecuencias” y son tablas que contienen: los diferentes valores que
puede asumir una variable o los intervalos correspondientes, y las diferentes frecuencias (absolutas y
relativas).
Iremos desarrollando el teórico con una serie de ejemplos:
Frecuencias absolutas simples: (ni o fa) indican el número de veces que se repite cada uno de los
valores distintos que asume la variable. La suma de las “ni” siempre da como resultado el tamaño de la
muestra “n”, en símbolos Σ ni = n.
Frecuencias absolutas acumuladas: (Ni o Fa) se calculan sumando las frecuencias absolutas
simples correspondientes, por ejemplo:
N1= n1
N2= n1 + n2
N3= n1+ n2 + n3
……
N k = n1 + n2 +….+ nk = n
Frecuencias relativas acumuladas:( Hi% o F%) se calculan sumando las frecuencias relativas
simples correspondientes, por ejemplo:
H1= h1
H2= h1 + h2
H3= h1+ h2 + h3
……
H k = h1 +h2 +….+hk = 1
Veamos a través de un ejemplo resuelto, la aplicación para el caso de una variable cuantitativa
discreta:
Solución:
a) La variable analizada es:
xi=” la cantidad de pares de zapatillas que tienen”
Es una variable cuantitativa discreta (porque sus valores surgen de un proceso de conteo).
xi ni hi Ni Hi
0 n1= 17 h1=0,20 N1=17 H1=0,20
1 n2= 22 h2=0,26 N2=39 H2=0,46
2 n3= 25 h3=0,30 N3=64 H3=0,76
3 n4= 16 h4=0,19 N4=80 H4=0,95
4 n5= 3 h5=0,04 N5=83 H5=0,99
5 n6= 1 h6=0,01 N6=84 H6=1
Total (� ) n= 84 1 /////////////// ///////////////
c)
n2: “De los 84 alumnos encuestados, hay 22 que tiene 1 par de zapatillas c/u”
N3: “Del total de alumnos encuestados hay 64 que tienen como máximo o hasta 2 pares de zapatillas
c/u”
h1: “Del 100% de los alumnos analizados el 20% (es decir o,20*100) no tienen ningún par de
zapatillas”
H4: “Del total de alumnos analizados el 95% tienen no mas (o como máximo) 3 pares de zapatillas c/u”
d) Gráfico de bastones
30
cantidad de alumnos (ni)
25
20
15
10
5
0
0 1 2 3 4 5 6
cantidad de pares de zapatillas
Grafico escalonado
90
80
70
60
50
Ni
40
30
20
10
0
0 1 2 3 4 5 6
cantidad de pares de zapatillas
Para realizar este gráfico en Excel puedes seguir los siguientes pasos:
1) Una vez que tengas la tabla en la hoja de trabajo del Excel
Selecciona la columna correspondiente a ”xi” y la “Ni”
2) En el menú busca “gráfico” o bien “insertar gráfico”
3) Elegí “XY (dispersión).
4) Del menú de la derecha, selecciona el primero (el que es como una nube de
puntos, sin ninguna línea), luego coloca “siguiente” dos veces. Y ahora se abrirá
una ventana que te permitirá ponerle: Título, y nombre a los dos ejes.
5) Arriba hay unas pestañas, selecciona la que dice “leyenda” y desmarca “Mostar
leyenda” (de esta forma desaparecerá el cartelito que decía serie)
6) Finaliza el gráfico y ahora hace doble clic con el botón izquierdo del mouse en
uno de los puntos que te quedaron en el gráfico. Aparecerá una ventana que dice
“Formato de serie de datos” con varias pestañas, vos debes seleccionar la que
dice “barras de error de x”.
7) Donde dice: Presentar, elegí “por defecto”. Dale aceptar y ahora debemos
adecuar el eje de las abscisas (X), para eso hace clic algunos de los valores del
eje horizontal y aparecerá una ventana que se denomina “Formato de ejes”, anda
a escala y en el primer valor donde dice “mínimo” coloca “el valor 0”. Fíjate
entonces como quedó tu gráfico.
8) Luego dentro del mismo menú anterior podes elegir tramas y le cambias el
color, el grosor a los bastones que has dibujado.
Cuando trabajamos con variables continuas, la tabla de distribución de frecuencias tiene un aspecto
diferente, porque se divide al conjunto de datos en intervalos (que se denominan intervalos de clases),
para armar estos intervalos seguiremos el siguiente procedimiento, el cual lo estudiaremos a través de
un ejemplo:
Ejemplo 2:
Sean los siguientes valores correspondientes a la edad de un conjunto de personas:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47,
39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
Solución:
a) La variable analizada es la edad - Es una variable cuantitativa continua
3º - Determinar la cantidad de intervalos con la que vamos a trabajar. Hay fórmulas para determinar
esto, podemos decir que en la práctica éste número escila entre 5 y 10.
En el ejercicio Ac= 8
**Si la amplitud da un número entero para determinar la amplitud corregida sumamos una cantidad
arbitraria a la amplitud.
6º Se forman los intervalos considerando que se suma la amplitud corregida. Y teniendo presente que
el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece a ese intervalo
sino que se encuentra en el siguiente intervalo.
c) n2= 6 Indica que de las 40 personas analizadas hay 6 cuyas edades oscilan entre 11 y hasta
18 años c/u (el 19 está incluido en el siguiente intervalo)
N3= 13 Del total de personas analizadas, hay 13 que tienen de 3 y hasta 26 años c/u (aquí
se acumulan los tres primeros intervalos)
h1% = 5% Del total de personas analizadas el 5% tienen entre 3 y hasta 10 años c/u
H4%=62.5% De las 40 personas analizadas el 62,5% tienen entre 3 y hasta 34 años c/u.
d)
Veamos ahora un caso en el cual trabajamos con el otro tipo de variable (cualitativa)
Ejemplo 3:
xi ni hi %
Si
No
No/se
No/contesta
Solución:
xi ni hi %
Si 17 38
No 21 47
No/se 5 11
No/contesta 2 4
45 100
c) Interpretación:
n2= 21 corresponde al valor “no“ de la variable analizada, entonces podemos interpretarlo diciendo
que : “De 45 amas de casas analizadas hay 21 que dijeron que No utilizarían el nuevo jabón en
polvo El zorrino ,que la empresa quiere lanzar al mercado.
h1% = 38% la analizamos diciendo que “El 38 % de las amas de casas analizadas manifestaron que Si
usarían el nuevo jabón en polvo”
no contesta
4%
no sabe
11%
si
38% si
no
no sabe
no contesta
no
47%
10
5
5 2
0
si no no sabe no contesta
Opinion
Pictograma:
Es un gráfico con dibujos alusivos al carácter que se está estudiando y cuyo tamaño es proporcional a
la frecuencia que representan; dicha frecuencia se suele indicar.
Es un tipo de representación que se utiliza para variables cualitativas, y que consiste en representar los
datos con dibujos alusivos a la estadística estudiada. Los pictogramas son muy expresivos, pero poco
precisos.
Hay dos clases de pictogramas:
1. Se utiliza un dibujo que representa la variable estadística y ésta se repite tantas veces como
haga falta (frecuencia absoluta).
2. El dibujo utilizado varía de tamaño dependiendo de su frecuencia; a mayor frecuencia mayor es
el dibujo.
Año Población
1900 18.616.630
1920 21.388.551
1940 26.014.278
1960 30.582.936
1980 37.742.561
2000 40.499.791
2010 47.021.031
Ejemplo 2:
Finalizamos aquí el desarrollo teórico del segundo módulo y lo invitamos a realizar las
actividades respectivas.
Material
Material Básico
• Desarrollo teórico del módulo, disponible en el apartado contenidos.
• Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la
Educación. Córdoba: Editorial Brujas.
Material Complementario
• Barón-López, J. (2005). Bioestadística: métodos y aplicaciones.
Apuntes y material disponible en http://www.bioestadistica.uma.es/
baron/apuntes/ Rius, F., Barón-López, F. J., Sánchez, E. y Parras, L.
(2006).
m2 | actividad 1
Consigna:
Lea la siguiente situación y realice las tareas a continuación.
Sigue igual
22%
Aumentó
58%
Disminuyó
20%
a) Completar la tabla:
a) 1
b) La muestra
c) 100 %
d) Ninguna es correcta
Tablas estadísticas
Marcar la alternativa correcta- Justificar brevemente tu elección:
1. La suma de las frecuencias absolutas simples siempre es igual a:
a) 100%
b) La población
c) La muestra
d) 1
a) 1
b) La muestra
c) 100 %
d) Ninguna es correcta
Pictograma
País Demanda
Colombia 20.000
Venezuela 40.000
Argentina 120.000
Chile 150.000
Brasil 160.000
m2 | actividad 4
Tablas y diagramas
Estos son los datos sobre ocupación de la población por sectores económicos:
Agricultura 1.870.000
Industria 2.587.000
Construcción 789.000
Servicios 5.394.500
m2 | actividad 6
Gráficos
1. Histograma
2. Cartograma
3. Calcograma
1. 6 cm
2. 5 cm
3. 3 cm
1. 33 personas
2. 28 personas
3. 21 personas
m2 glosario
Tablas estadísticas: contienen: los diferentes valores que puede asumir una
variable o los intervalos correspondientes, y las diferentes frecuencias (absolu-
tas y relativas).
Título: Descripción resumida del contenido del cuadro, su redacción debe ser
clara, breve y completa, de forma tal que se pueda deducir cual es la informa-
ción que contiene el cuadro.
m3
m3 microobjetivos
Medidas de posición
Las medidas de tendencia central se denominan medidas de posición. Veamos cada una de ellas:
Media aritmética o promedio: es la suma de todos los valores de la variable dividida el número
total de observaciones
El cálculo de la media va a variar según se trate de una variable cuantitativa discreta o de una
cuantitativa continua. Y dentro de las discretas será distinto el cálculo si es una serie simple o bien una
distribución de frecuencias.
Datos: 1 2 2 4 5
En el ejercicio el cálculo será: M(x) = (1+2+2+4+5) /5 = 14/5 = 2,8 entonces podemos decir que en
promedio estos 5 alumnos tienen aproximadamente 3 hermanos c/u
Pero ahora tomamos una muestra mayor y como hay datos que se repiten armamos una tabla de
distribución de frecuencias.
xi ni
1 5
2 8
3 4
4 2
5 1
Total 20
Entonces podemos decir que en promedio estos 20 alumnos tienen aproximadamente 2 hermanos c/u
M(y) = Σ( yi.ni)
n
Pero para la variable continua trabajamos con la marca de clase: yi = que es el promedio de los
límites de cada intervalo.
Características de la media
• Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios
conjuntos de datos. En estadística inferencial es la medida de tendencia central que tiene mejores
propiedades.
• Aunque la media es confiable en el sentido de que toma en cuenta todos los valores del conjunto
de datos, puede verse afectada por valores extremos que no son representativos del resto de los
datos. La media puede malinterpretarse si los datos no forman un conjunto homogéneo.
Moda, modo o valor modal: es el valor de la variable que se repite más veces. Es decir el valor de
la variable que corresponde a la mayor de las frecuencias absolutas simples
El cálculo de la moda va a variar según se trate de una variable cuantitativa discreta o de una
cuantitativa continua. Y dentro de las discretas será distinto el cálculo si es una serie simple o bien una
distribución de frecuencias.
Datos: 1 2 2 4 5
Mo(x) = 2 hermanos
xi ni
1 5
2 8
3 4
4 2
5 1
Total 20
No veremos el cálculo de esta medida para este caso. Existen ejercicios en los que se da esta medida
como dato y solo se pide su utilización en temas que veremos en próximas unidades.
Características de la moda:
• Se puede utilizar para datos cualitativos nominales u ordinales y para datos cuantitativos.
• Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, se dice que no tiene moda
Si puede pasar que haya dos valores que se repitan igual número de veces, es decir dos modas,
en este caso la distribución será: bimodal.
El cálculo de la mediana va a variar según se trate de una variable cuantitativa discreta o de una
cuantitativa continua. Y dentro de las discretas será distinto el cálculo si es una serie simple o bien una
distribución de frecuencias.
En este caso también debemos tener en cuenta si la serie simple es: PAR o IMPAR
Ejemplo 1: variable cuantitativa discreta - presentados los datos en serie simple IMPAR
Datos: 1 2 2 4 5
Ejemplo 2: variable cuantitativa discreta - presentados los datos en serie simple PAR
Datos: 1 2 2 4 5 7
Es decir que la mediana estará en el lugar (n+1) /2 = (6+1) /2= 7/2 =3,5
La observación que está entre los lugares 3 y el lugar 4, entonces la mediana será el promedio
entre estas dos observaciones
Ejemplo 3: variable cuantitativa discreta - presentados los datos en distribución de frecuencias - PAR
xi ni Ni
1 5 5
2 8 13
3 4 17
4 2 19
5 1 20
Total 20 //////////
xi ni Ni
1 4 4
2 8 12
3 4 16
4 2 18
5 1 19
Total 19 //////////////////
Me (x) = X10 = 2
Importante:
No veremos el cálculo de esta medida para este caso. Existen ejercicios en los que se da esta medida
como dato y solo se pide su utilización en temas que veremos en próximas unidades.
Características de la mediana:
No se ve afectada por los valores extremos. Esta es la propiedad más importante que tiene.
Si hay un gran número de datos, el tener que ordenarlos para hallar la mediana insume
esfuerzo y tiempo.
• Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.
• En una distribución con sesgo positivo, la moda se halla en el punto más alto de la distribución, la
mediana está hacia la derecha de la moda y la media más a la derecha.
Es decir Mo < Me < x
• En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está a la
izquierda de la moda y la media está a la izquierda de la mediana.
Es decir, x < Me < Mo
• Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser la mejor
medida de posición, debido a que está siempre entre la media y la moda. La mediana no se ve
altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se
distorsiona con la presencia de valores extremos como la media.
Con frecuencia es conveniente dividir los datos en cuatro partes, así cada una contiene el 25% de los
datos. A los puntos de división se los llama cuartiles
RIC= Q3- Q1
Nos indica el 50 % de las observaciones centrales
El cálculo de los cuartiles va a variar según se trate de una variable cuantitativa discreta o de una
cuantitativa continua. Y dentro de las discretas será distinto el cálculo si es una serie simple o bien una
distribución de frecuencias.
Ejemplo1: variable cuantitativa discreta - presentados los datos en serie simple IMPAR
Datos: 2 3 6 7 7 4 5
Es decir que el primer cuartil Q1(x) estará en el lugar (n+1) /4 = (7+1) /4= 8/4 =2
Es decir que el segundo cuartil Q2(x) estará en el lugar 2(n+1) /4 =(n+1)/2= (7+1) /2= 8/2 =4
Es decir que el tercer cuartil Q3(x) estará en el lugar 3 (n+1) /4 = 3 (7+1) /4=3. 8/4 = 24/4 =6
Ejemplo 2: variable cuantitativa discreta - presentados los datos en serie simple PAR
Datos: 2 3 6 7 4 5
Es decir que el primer cuartil Q1(x) estará en el lugar (n+1) /4 = (6 +1) /4= 7 /4 =1,75
La observación que esté en el lugar 2 será Q1 por que si bien esta entre las observaciones 1 y la
2 , al dar 1,75 la ubicación está más cerca de la observación 2 que de la 1 .
Es decir que el segundo cuartil Q2(x) estará en el lugar 2(n+1) /4 =(n+1)/2= (6+1) /2= 7/2 =3,5
La observación que está justo en el medio entre las observaciones 3 y la 4 entonces Q2 = Me(x)
será igual al promedio entre las dos observaciones
Es decir que el tercer cuartil Q3(x) estará en el lugar 3 (n+1) /4 = 3 (6+1) /4=3. 7/4 = 21/4 =5,25
La observación que esté en el lugar 5 será Q3 porque si bien está entre la 5 y la 6 , como dio 5,25
está más cerca de la observación 5 , entonces Q3(x) será :
Ejemplo 3: variable cuantitativa discreta - presentados los datos en distribución de frecuencias - PAR
xi ni Ni
1 5 5
2 8 13
3 4 17
4 2 19
5 1 20
Total 20 //////////
Es decir que el primer cuartil Q1(x) estará en el lugar (n+1) /4 = (20 +1) /4= 21 /4 =5,25
La observación que esté en el lugar 5 será Q1 por que si bien esta entre las observaciones 5 y la
6 , al dar 5,25 la ubicación está más cerca de la observación 5 que de la 6 . Y ahora para encontrarla
usamos las frecuencias absolutas acumuladas
**/Aclaración: si hubiese dado por ejemplo 1,25 hubiésemos elegido la observación 1 porque esta
más cerca de la posición 1 que de la 2.
Y si hubiese dado 1,5 deberíamos hacer el promedio entre las dos observaciones
xi ni Ni
X5=1
X6=2 1 5 5
2 8 13
Q1(x)= 1 17
3 4
4 2 19
5 1 20
Total 20 //////////
Es decir que el segundo cuartil Q2(x) estará en el lugar 2(n+1) /4 =(n+1)/2= (20+1) /2= 21/2 =10,5
La observación que está justo en el medio entre las observaciones 10 y la 11 entonces Q2 = Me(x)
será igual al promedio entre las dos observaciones
X10= 2
X11=2
Es decir que el tercer cuartil Q3(x) estará en el lugar 3 (n+1) /4 = 3 (20+1) /4=3. 21/4 = 63/4 =15,75
La observación que esté en el lugar 16 será Q3 porque si bien está entre la 15 y la 16, como dio
15,75 está más cerca de la observación 16 , entonces Q3(x) será :
X15=4
X16=4
xi ni Ni
1 4 4
2 8 12
3 4 16
4 2 18
5 1 19
Total 19 //////////////////
Es decir que el primer cuartil Q1(x) estará en el lugar (n+1) /4 = (19 +1) /4= 20 /4 =5
Es decir que el segundo cuartil Q2(x) estará en el lugar 2(n+1) /4 =(n+1)/2= (19+1) /2= 20/2 =10
Q2(x) = Me(x) = 2
Es decir que el tercer cuartil Q3(x) estará en el lugar 3 (n+1) /4 = 3 (19+1) /4=3. 20/4 = 60/4 =15
Q3(x) = 3
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran
el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde se
posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero (recordemos que el
segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo
de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de
prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es
marcado e identificado individualmente.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
*Cálculo de cuartiles
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20
resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que
ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media
aritmética de dicho valor y el siguiente:
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro
caso, como 3N / 4 = 15, resulta
Q2=(39 + 39) / 2 = 39
Podemos obtener abundante información de una distribución a partir de estas representaciones. Por
ejemplo:
• La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el
75%.
• El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los
más jóvenes están más concentrados que el 25% de los mayores.
• El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en
14,5 años.
La mayor utilidad de los diagramas caja-bigotes es para comparar dos o más conjuntos de datos.
Análogamente a lo realizado con los diagramas de tallo y hojas, comparamos, mediante estos
diagramas, esta distribución con la del otro ejemplo de distribución de edades.
35 38 32 28 30 29 27 19 48 40
39 24 24 34 26 41 29 48 28 22
Un corredor entrena para una determinada carrera y se toman los tiempos que necesita para recorrer
los 200 m, durante 10 días consecutivos (cada día se toman varios tiempos y se calculan mediana,
cuartiles, valores mínimo y máximo)
Observamos que el desplazamiento de las gráficas de caja hacia la izquierda indica que el
entrenamiento ha dado resultado, ya que se tardan menos segundos en recorrer la misma distancia,
siendo la diferencia entre el máximo y el mínimo menor, como así también la diferencia intercuartílica.
Las puntuaciones de los equipos de la liga de futbol BBVA de las temporadas 10/110 y 11/12 se
pueden comparar con un diagrama caja y bigotes, como aparece seguidamente:
Medidas de dispersión
En realidad cuando menor sea la varianza la distribución será más homogénea no la media, es decir
que los datos serán más parecidos entre sí y por ende, más similares a la media.
Varianza: es una medida estadística que mide la dispersión de los valores respecto a un valor
central (media), es decir, es el cuadrado de las desviaciones:
**Cuando se trabajo con poblaciones se divide por “n” , en cambio cuando se trabaja con muestras
(como en la mayoría de los casos) se divide por “n-1”
Características de la varianza:
La desviación típica informa sobre la dispersión de los datos respecto al valor de la media; cuanto
mayor sea su valor, más dispersos estarán los datos
Datos: 1 2 2 4 5
Recordemos que cuando realizamos este ejemplo para la media el valor que obtuvimos para la media
fue de
M(x) =2,8
DS(x) = 1,64
Pero ahora tomamos una muestra mayor y como hay datos que se repiten armamos una tabla de
distribución de frecuencias.
xi ni
1 5
2 8
3 4
4 2
5 1
Total 20
DS(x) = 1,13
DS(y) = 10,99
Coeficiente de variación: es el cociente entre la desviación estándar dividida por la media, por
lo general se expresa como porcentaje , es decir que al cociente antes mencionado se lo
multiplica por 100
• Por otro lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es
variable ante cambios de origen.
• A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la variable; y
a menor coeficiente de variación, mayor homogeneidad en los valores de la variable.
Ejemplo:
Una distribución tiene M(x) = 140 y DS(x) = 28.28 y otra M(y) = 150 y DS(y) = 24. ¿Cuál de las dos
presenta mayor dispersión?
Otra forma de analizar la simetría es comparando la media, la mediana y la moda como ya se ha visto
en ésta unidad
1) El índice de asimetría intercuartílico se basa en las distancias entre los cuartiles a fin de
establecer en de la asimetría de la distribución. La fórmula es la siguiente:
AsQ = Q3+Q1-2.Q2
Q3-Q1
Interpretación:
• AsP < 0 →Asimetría izquierda o negativa
• AsP = 0 → Simetría
• AsP > 0 →Asimetría derecha o positiva
Interpretación:
• AsF < 0 →Asimetría izquierda o negativa
• AsF = 0 → Simetría
• AsF > 0 →Asimetría derecha o positiva
• Distribución platicúrtica (apuntamiento negativo): indica que en las colas hay más casos
acumulados que en las colas de una distribución normal.
• Distribución leptocúrtica (apuntamiento positivo): justo lo contrario.
• Distribución mesocúrtica (apuntamiento normal): como en la distribución normal.
Se puede analizar también por medio de distintos coeficientes entre los cuales solo veremos el
coeficiente de apuntamiento de Fisher se basa en las desviaciones de los valores observados
respecto a la media. La fórmula para su cálculo es la siguiente:
4
ApF =Σ ( xi- M(x))
n. DS(x)4
Interpretación:
• Si ApF < 0 Distribución platicúrtica (apuntamiento negativo).
• Si ApF > 0 Distribución leptocúrtica (apuntamiento positivo)
• Si ApF = 0 la distribución mesocúrtica (apuntamiento normal): como en la distribución
normal.
A continuación graficamos:
Finalizado el desarrollo de estos contenidos, lo invitamos a que realice las actividades respecto de
estos temas, y a realizar las preguntas que sean necesarias a través del espacio tutorial.
Material Básico
x Desarrollo teórico del módulo, disponible en el apartado contenidos.
x Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la
Educación. Córdoba: Editorial Brujas.
Material Complementario
x Barón-López, J. (2005). Bioestadística: métodos y aplicaciones.
Apuntes y material disponible en http://www.bioestadistica.uma.es/
baron/apuntes/ Rius, F., Barón-López, F. J., Sánchez, E. y Parras, L.
(2006).
m3 | actividad 1
m3 | actividad 2
En cierta evaluación para optar por una beca, Juan Moreti obtuvo una
calificación de 310 puntos en habilidad verbal, y 218 puntos en habilidad
numérica.
Los parámetros de c/u son:
Habilidad verbal: media = 270 varianza = 900
Habilidad numérica: media =180 varianza = 25
a) ¿En cuál de las dos pruebas obtuvo mejor calificación? Justifique.
b) ¿En cuál de las dos pruebas el grupo es más homogéneo? Justifique.
m3 | actividad 3
Una fábrica empaqueta en lotes de 100 unidades los tornillos que produce.
Se establece un plan de inspección por muestreo consistente en examinar, de
cada lote, 20 tornillos elegidos al azar y rechazar el lote si de los 20 aparecen
más de 4 defectuosos; almacenar el lote como “revisable” si el número de
defectuosos es menor que 5 pero mayor que 1, y aceptarlo en otro caso.
Se inspeccionan un conjunto de lotes y resulta el siguiente número de tornil-
los defectuosos de cada muestra:
0 -2 -3 -0 -0 -1 -0 -0 -3 -2 -0 -1 -0 -5 -2 -0 -7- 3- 5 – 4 – 6 - 0 – 0 – 0 – 1 -
1-2- 4- 3- 2- 0- 9- 2- 0- 2- 0- 0- 4- 3- 0- 2- 0- 4- 6- 5- 2-0- 0 -1 -0 -3 -2 -0 -7 -1 -4 -3
-0 -2 -1
m3 | actividad 4
Intervalos ni Ni hi%
0 a 20 1
20 a 40 2
40 a 60 4
60 a 80 7
80 a 100 12
100 a 120 74
Total
Coeficiente de variación
Ejercicio 1:
Para un conjunto de observaciones se conoce que: la media es $64, la
mediana es $61, la moda es $60, y la varianza $2 36.
Analice la forma del conjunto de datos y calcule el coeficiente de varia-
ción y analice su valor.
Ejercicio 2:
Si en el ejercicio anterior se conoce que Q1=58 $ Q3= 64$ . V máximo=
71$
V mínimo= $55
¿Cómo realizaría el diagrama de caja-brazos? Analícelo.
m3 | actividad 6
Concepto de media
Por un error, un profesor borró la calificación obtenida por uno de diez alum-
nos. Si los otros nueve estudiantes obtuvieron 43, 66, 74, 90, 40, 52, 70, 78 y 92
y la media de las diez calificaciones es 67, ¿Qué calificación borró el profesor?
Explique cómo obtuvo el resultado.
6 6 6 7 7 7 7 7 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10
11 11 11 11
En base a la información analizada se pide:
a) Calcular el promedio, la mediana y el modo, analizando los valores
obtenidos.
b) Calcular la varianza y el desvío estándar.
c) Graficar la información y analizarla.
d) Calcular los cuartiles y realice un diagrama de caja brazos, analizando
e mismo.
e) Calcular alguno de los coeficientes de asimetría y analícelos.
f) Analizar la curtosis de la distribución.
g) ¿Podría aplicarse aquí la regla empírica? Justifique su respuesta.
m3 | actividad 8
m3 | actividad 9
En base a los datos suministrados, se pide que determine para qué grupo el sueldo es relativa-
mente más disperso.
Justifique mediante el cálculo e interpretación de una medida adecuada.
Ejercicio 2:
En un barrio de una zona urbano marginal de la ciudad de Córdoba, se ha realizado una
encuesta sobre las alturas de sus 150 personas y se ha construido la siguiente tabla de frecuen-
cias:
Ejercicio 3:
La siguiente tabla muestra las utilidades porcentuales trimestrales de los últimos 8 años de una
empresa de servicios de limpieza.
% Ni Ni hi Hi yi*ni Yi2 *ni
[0 ; 3) 2 0,06 3 4,5
[3 ; 6) 3 5 0,09 0,16 13,5
[6 ; 9) 10 0,31 75
[9 ; 12) 7 22 0,22 0,69
[12 ; 15) 0,13 54 729
[15 ; 18) 3 29 0,91 49,5 816,75
[18 ; 21) 31 0,97 760,5
[21 ; 24) 1 32 0,03 1,00 22,5
Total ///////////////// ///////////////////
En base a la información suministrada y luego de completar la tabla, leer atentamente cada una
de las siguientes preguntas y marcar la alternativa correcta. Justifique siempre su elección:
Moda, modo o valor modal: es el valor de la variable que se repite más veces.
Es decir el valor de la variable que corresponde a la mayor de las frecuencias
absolutas simples.
m4 microobjetivos
Es el primer tipo de análisis entre variables que vamos a estudiar, el análisis estadístico de la
asociación entre variables comprende: relación, covarianza y correlación. Es una parte
fundamental del análisis de datos porque muchas preguntas e hipótesis planteadas en
investigaciones implican la existencia de relación entre distintas variables consideradas.
El análisis de la existencia de algún tipo de asociación entre dos o más variables se basa sobre
todo en el estudio de algún tipo de tendencia o patrón de emparjamiento entre las variables
analizadas. Según lo explica Solanas: “la existencia de asociación entre dos variables indicaría que
la distribución de los valores de una de las dos variables difiere en función de los valores de la otra
y complementariamente, se habla de independencia entre variables cuando no existe tal patrón de
relación entre los valores de las mismas”.
Para medir la asociación entre dos variables, vamos a distinguir tres situaciones:
I. Medir la asociación de dos variables categóricas
II. Medir la asociación de una variable categórica y una cuantitativa
valores de una de las variables difiere en función de los valores de la otra, esto es, hay que
comparar las distribuciones condicionadas de una de las dos variables agrupada en función de los
valores de la otra. Si no hay relación entre las variables estas distribuciones deberían ser iguales.
Analicemos esta asociación por medio del siguiente ejemplo:
Consideremos la posible asociación entre las dos variables que se muestran en la tabla: Estado de
Ánimo.
La asociación entre dos variables categóricas aparece más explícita en una tabla de frecuencias
relativas condicionadas, pues de ese modo se relativiza el posible diferente tamaño de los
subgrupos definidos por cualquiera de las dos variables. Este tipo de tabla se puede obtener de 2
formas alternativas, bien dividiendo las celdas de cada fila entre el respectivo marginal (total) de
fila, bien cada columna entre el total de columna. Ambas tablas permitirán llegar al mismo tipo de
conclusiones respecto a la asociación entre las 2 variables.
Si la relación entre las variables es asimétrica, la variable agrupadora o condicionante sería la que
sea considerada la variable explicativa (predictora, independiente). Por ejemplo, en un estudio en
Estadodeánimo
malo regular bueno Total
Lugar de viveenbarrioconseguridad 0,32 0,28 0,4 1
residencia noviveenbarrioconseguridad 0,2 0,3 0,5 1
Total 0,24 0,29 0,47 1
que se evalúa la influencia del “Nivel de estudios” [primarios, secundarios, superiores] sobre la
“Percepción de la influencia de la ciencia en la sociedad” [negativa, indiferente, positiva], dado que
el nivel de estudios sería la variable explicativa, deberíamos comparar las distribuciones de la
percepción de la influencia de la ciencia condicionadas al nivel de estudios, es decir, en cada
categoría de nivel de estudios.
En nuestro ejemplo sobre “Estado de ánimo” y “Lugar de residencia”, dado que la relación es
asimétrica y la variable explicativa es “Lugar de residencia” debemos comparar las distribuciones
de “Estado de ánimo” condicionadas a “Lugar de residencia”:
Otra versión de esta medida de la intensidad de la dependencia de las características en una tabla
de contingencia es la contingencia cuadrática media, que en lo esencial representa una ampliación
del coeficiente :
Cuanto mayor es esta medida, tanto más intensa es la relación entre las dos características
analizadas. Si ambas características (variables) son independientes, entonces cada uno de los
sumandos se hace 0, a consecuencia de que se hace 0 el numerador de la fracción y con ello la
medida misma también. En el caso de una tabla de contingencia de 2x2 la medida está normada y
asume valores en el intervalo [0,1].
Estado de ánimo
malo regular bueno Total
Lugar de vive en barrio con seguridad 48 42 60 150
residencia no vive en barrio con seguridad 70 105 175 350
Total 118 147 235 500
nuestro ejemplo el cálculo de éste coeficiente:
A partir de la tabla planteada en el ejemplo (más arriba) , calculamos los valores esperados y
hacemos de nuevo la tabla :
Estado de ánimo
malo regular bueno Total
vive en barrio con seguridad 35,4 44,1 70,5 150
Lugar de
residencia no vive en barrio con
82,6 102,9 164,5 350
seguridad
Total 118 147 235 500
Ckorr = ʈ¥ (2/(2-1)) . ʈ¥ (8,78/(8,78+500)) = 0,186 Que al ser cercano a 0 indica que el estado de
ánimo es independiente del lugar de residencia . Es decir que no depende el estado de ánimo del
lugar donde resida la persona.
.
: Total de casos (tamaño de la muestra) y X2 es el valor del coeficiente de Pearson
Interpretación
En cualquier tabla de contingencia – independientemente de la cantidad de filas y columnas –
Cramérs V está entre 0 y 1. Puede usarse para tablas de contingencia de cualquier tamaño. Un
Nota escalaqueocupa
5 1
6 2
5 3
4 2
8 3
7 1
2 2
10 3
5 3
6 2
4 1
8 2
9 1
7 2
10 2
3 2
2 1
4 1
2 1
1 3
Dada la dificultad que puede representar comparar las distribuciones condicionales de una variable
cuantitativa, se puede recurrir a representaciones gráficas que faciliten la realización de este tipo
de comparación. A modo de ejemplo, podemos graficar para cada lugar que ocupa , las notas
obtenidas :
nota lugar1
1 0
2 5
3 0
4 2
5 6
6 2
7 3
8 0
9 1
10 0
nota lugar2
1 1
2 1
3 3
4 4
5 5
6 3
7 2
8 4
9 2
10 2
nota lugar3
1 1
2 1
3 1
4 0
5 4
6 2
7 1
a) Indice de asociación de Cohen: dada una variable categórica X dicotómica [a, b] y una variable
cuantitativa Y, el índice de asociación d de Cohen se obtiene a través de la siguiente
expresión:
d = M(Ya) - M(Yb)
Sy
Los valores que puede tomar d no están acotados a un rango, pudiendo ser tanto positivos como
negativos. Si las dos variables consideradas son independientes entonces d será igual a 0,
mientras que cuanto mayor sea la asociación entre ellas, mayor será el valor de d en términos
absolutos. Cohen sugiere las siguientes normas interpretativas, aunque el propio autor afirma que
se deben utilizar sólo en el caso que no se tenga ningún criterio sustantivo que sirva de base
interpretativa: valores absolutos de d entre 0,2 y 0,5 indicarían una intensidad de la asociación
(tamaño del efecto) baja; entre 0,5 y 0,8 media; mientras que a partir de 0,8, alta.
ds = DIFmedia
SDIF
donde el numerador representa la media de las diferencias para cada sujeto entre la variable
‘después’ y la variable ‘antes’, y el denominador la desviación típica de esas diferencias.
Ejercicio 5: Tomando como punto de partida el caso planteado en el ejercicio anterior, supóngase
que a los 10 estudiantes a los que se aplicó el programa de intervención para favorecer la
interacción social se les midió también, previó al tratamiento, su grado de interacción en la hora de
recreo (nº de minutos en que se participa en actividades con otros compañeros). Analizar la
relación entre la variable “Grado de interacción” y “Momento temporal en que se realiza la medición
de la anterior variable [pre- y post- tratamiento]” e interpretar los resultados obtenidos.
El índice f de Cohen permite analizar la relación entre una variable cuantitativa (Y) y una categórica
(X) en el caso en que esta última tenga más de dos valores posibles (k valores). Se basa para ello
en el cálculo de la dispersión de las medias de los diferentes subgrupos definidos por los k valores
de la variable X:
F= Symedia / Sy
GI-pre GI-post
Medias 22 22,1
La media general es igual a : 22, 05 (se calculo ponderando a cada media de los grupos por el
tamanño del grupo y dividiendo luego todo por la suma total de las observaciones analizadas)
El valor de Symedia es igual a : la desviacion estándar de las medias de cada grupo respecto la
media general , en el ejercicio planteado sera:
En el caso en que las medias de los subgrupos sean iguales o muy próximas, la desviación típica
S y será igual o prácticamente igual a 0, denotando la ausencia de asociación entre ambas
variables. El valor de la f de Cohen será siempre mayor o igual a 0, tanto mayor cuanto más
intensa sea la asociación entre las variables.
Al igual que en los casos anteriores, la existencia de correlación o asociación entre 2 variables
cuantitativas viene determinada por la presencia de diferencias en las distribuciones condicionales
de una variable para los distintos valores de la otra.
1) Sin embargo, dado el número tan amplio de distribuciones condicionales que se pueden llegar
a obtener en este caso, es más habitual analizar la asociación directamente sobre un diagrama
de dispersión, observando la disposición de la nube de puntos que representa la distribución
conjunta de ambas variables.
Un aspecto relevante del análisis de la correlación entre dos variables cuantitativas es que la
presencia de ésta se puede plantear de acuerdo a diferentes modelos o patrones de
asociación, por ejemplo, en forma de línea recta, tal como en los ejemplos A (relación lineal
directa o positiva) y B (relación lineal inversa o negativa) de arriba, o en forma curvilínea tal
como en D (relación parabólica o cuadrática). Así, la forma de evaluar la intensidad de la
correlación suele consistir en analizar el ajuste de la nube de puntos al modelo de asociación
b) Correlación Débil
Los puntos no están suficientemente agrupados, como para asegurar que existe la
relación. El control de una de las variables no necesariamente nos llevará al control de la
otra. Si lo que se busca es determinar las causas de un problema, se deben buscar otras
variables con una relación mayor o más relevante sobre el efecto.
Correlación Débil, Positiva: El valor de la variable "Y" (eje vertical) tiende a aumentar
cuando aumenta el valor de la variable "X" (eje horizontal)
Correlación Débil, Negativa: El valor de "Y" tiende a disminuir cuando aumenta el valor de
"X".
d) Sin correlación
Para cualquier valor de la variable "X", "Y" puede tener cualquier valor. No aparece
ninguna relación especial entre ambas variables. En este caso, nuestra teoría no es
correcta y se deben buscar otros tipos de relaciones.
2) La covarianza
El signo de la covarianza, por lo tanto, expresa la tendencia en la relación lineal entre las variables.
La magnitud requiere un esfuerzo adicional de interpretación:
La versión normalizada de la covarianza, el coeficiente de correlación indica la magnitud de la
especificidad de la relación lineal.
La covarianza indica el sentido de la correlación entre las variables
Si ı x y > 0 la correlación es directa.
Veamos un ejemplo:
Las notas de 12 alumnos de una clase en Matemáticas y Física son las
siguientes:
Xi Yi
matemática Física (xiͲm(x))*(yiͲM(Y))
2 1 16
3 3 6
4 2 6
4 4 2
5 4 1
6 4 0
6 6 0
7 4 Ͳ1
7 6 1
8 7 4
10 9 16
10 10 20
Promedio 6 5 71
Covarianza 5,92
Como la covarianza es positiva indica que hay una correlación directa entre las notas de
Matemática y de Física de los 12 alumnos analizados .
Otro ejemplo sería el caso en que los datos están presentados en una tabla bidemensional (de
doble entrada)
xi yi fi xi · fi yi · fi xi · yi · fi
0 1 2 0 2 0
0 2 1 0 2 0
0 3 2 0 6 0
2 1 1 2 1 2
2 2 4 8 8 16
2 3 5 10 15 30
4 1 3 12 3 12
4 2 2 8 4 16
Total 20 40 41 76
Para éste caso la fórmula de covarianza será: COV(x;y)= M(X*Y) – M(X)* M(Y)
En éste caso como el valor es negativo podemos concluir que existe una correlación inversa pero
débil entre las dos variables analizadas , porque el valor es negativo pero cercano a 0.
La covarianza puede tomar valores tanto positivos como negativos. A nivel interpretativo, un mayor
valor de la covarianza en valor absoluto indicará una relación lineal más intensa entre las dos
variables. Un valor positivo pone de manifiesto una relación lineal directa; uno negativo, una
relación lineal inversa; y si igual o muy próximo a 0, la inexistencia de relación lineal entre las dos
variables.
Los inconvenientes de la covarianza –por una parte, no tiene valores máximo y mínimo y, por otra
parte, depende de las unidades de medida de las variables- se resuelven estandarizando este
3) Coeficente de correlación:
La cuantificación de la fuerza de la relación lineal entre dos variables cuantitativas, se estudia por
medio del cálculo del coeficiente de correlación de Pearson (1-3). Dicho coeficiente oscila entre –1
y +1. Un valor de –1 indica una relación lineal o línea recta positiva perfecta. Una correlación
próxima a cero indica que no hay relación lineal entre las dos variables.
El realizar la representación gráfica de los datos para demostrar la relación entre el valor del
coeficiente de correlación y la forma de la gráfica es fundamental ya que existen relaciones no
lineales.
El coeficiente de correlación posee las siguientes características :
x El valor del coeficiente de correlación es independiente de cualquier unidad usada para
medir las variables.
x El valor del coeficiente de correlación se altera de forma importante ante la presencia de un
valor extremo, como sucede con la desviación típica. Ante estas situaciones conviene
realizar una transformación de datos que cambia la escala de medición y modera el efecto
de valores extremos (como la transformación logarítmica).
x El coeficiente de correlación mide solo la relación con una línea recta. Dos variables
pueden tener una relación curvilínea fuerte, a pesar de que su correlación sea pequeña.
Por tanto cuando analicemos las relaciones entre dos variables debemos representarlas
gráficamente y posteriormente calcular el coeficiente de correlación.
x El coeficiente de correlación no se debe extrapolar más allá del rango de valores
observado de las variables a estudio ya que la relación existente entre X e Y puede
cambiar fuera de dicho rango.
x La correlación no implica causalidad. La causalidad es un juicio de valor que requiere más
información que un simple valor cuantitativo de un coeficiente de correlación.
x El coeficiente de correlación no varía al hacerlo la escala de medición.
Es decir, si expresamos la altura en metros o en centímetros el coeficiente de correlación
no varía.
x El signo del coeficiente de correlación es el mismo que el de la covarianza.
Si la covarianza es positiva, la correlación es directa.
Si la covarianza es negativa, la correlación es inversa.
Si la covarianza es nula, no existe correlación.
x El coeficiente de correlación lineal es un número real comprendido entre í1 y 1.
í1 r 1
Si el coeficiente de correlación lineal toma valores cercanos a í1 la correlación es fuerte e
inversa, y será tanto más fuerte cuanto más se aproxime r a í1.
Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y
directa, y será tanto más fuerte cuanto más se aproxime r a 1.
Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.
Si r = 1 ó í1, los puntos de la nube están sobre la recta creciente o decreciente. Entre
ambas variables hay dependencia funcional.
El coeficiente de correlación de Pearson (r) puede calcularse en cualquier grupo de datos, sin
embargo la validez del test de hipótesis sobre la correlación entre las variables requiere en sentido
estricto:
x Que las dos variables procedan de una muestra aleatoria de individuos.
x Que al menos una de las variables tenga una distribución normal en la población de la cual
la muestra procede. Para el cálculo válido de un intervalo de confianza del coeficiente de
correlación de r ambas variables deben tener una distribución normal. Si los datos no
tienen una distribución normal, una o ambas variables se pueden transformar
(transformación logarítmica) o si no se calcularía un coeficiente de correlación no
paramétrico (coeficiente de correlación de Spearman) que tiene el mismo significado que el
coeficiente de correlación de Pearson y se calcula utilizando el rango de las observaciones.
En el primer ejemplo que vimos para la covarianza Calculamos las desviaciones típicas.
Veamos un ejemplo: La siguiente tabla muestra el rango u orden obtenido en la primera evaluación
(X) y el rango o puesto obtenido en la segunda evaluación (Y) de 8 estudiantes universitarios en la
asignatura de Estadística. Calcular el coeficiente de correlación por rangos de Spearman.
Estudiante X Y
Diana 1 3
Elizabeth 2 4
Mario 3 1
Orlando 4 5
Matías 5 6
Josué 6 2
Anita 7 8
Para calcular el coeficiente de correlación por rangos de Spearman de se llena la siguiente tabla:
Se aplica la fórmula:
Por lo tanto existe una correlación positiva moderada entre la primera y segunda evaluación de los 8
estudiantes.
A continuación, le propongo realizar las actividades planteadas para el módulo, de modo tal que pueda poner
en práctica los conceptos aquí desarrollados. No dude en canalizar las preguntas que le surjan, en la tutoría.
Material Básico
x Desarrollo teórico del módulo, disponible en el apartado contenidos.
x Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la
Educación. Córdoba: Editorial Brujas.
Material Complementario
BENALCÁZAR, Marco, (2002), Unidades para Producir Medios Instruccionales
en Educación, SUÁREZ, Mario Ed. Graficolor, Ibarra, Ecuador.
DAZA, Jorge, (2006), Estadística Aplicada con Microsoft Excel, Grupo Editorial
Megabyte, Lima, Perú.
JOHNSON, Robert, (2003), Estadística Elemental, Ed. Math Learning, Ed. Ter-
cera, México DF. KUBY, Patricia.
SALTOS, Héctor, (1986), Estadística de Inferencia, Ed. Pío XII, Ambato, Ecua-
dor.
x http://www.monografias.com/trabajos85/coeficiente-correlacion-
rangos-spearman/coeficiente-correlacion-rangos-spearman.
shtml#ixzz37JqVnzi9
m4 | actividad 1
Coeficiente de correlación
A-
Interprete cada uno de los siguientes coeficientes de correlación y use gráficos
de dispersión para representar como se vería cada una de las relaciones entre
dos variables (x, y) cualesquiera:
a) r = -1,0
b) r = 0,05
c) r = 0,85
B-
Si el coeficiente de correlación para los datos de la tabla es 0,97, responda
a las preguntas siguientes, primero sin realizar ningún cálculo y después,
comprobar las respuestas haciendo los cálculos necesarios con su calculadora
o el programa SPSS.
X 2 3 4 5 6
Y 5 7 8 13 14
Revise los gráficos de dispersión correspondientes y responda cómo cambiaría
este coeficiente si:
a) Sumamos 3 a la variable X
b) Sumamos 3 en ambas variables
c) Multiplicamos la variable X por 2
d) Intercambiamos todos los valores de X por los de Y
e) Cambiamos el último valor de X por el de Y f
f) Sumamos 10 a ambas variables pero sólo en el primer punto
observado
C-
La correlación lineal de X con Y es r = 0,60; la correlación de X con W es de
r = -0,80. ¿Con cuál de las variables Y o W, es mayor el grado de asociación
lineal?
Revisión de conceptos I
Cada una de las frases siguientes contiene un error, explique en cada caso qué
es lo que está mal.
a) “Existe una alta correlación entre el sexo de los trabajadores en
Talca y su salario”
b) “Se encontró una alta correlación (r = 1,09) entre las
evaluaciones de los estudiantes a los profesores y los salarios de
los académicos”
c) “La correlación entre el tamaño familiar y los metros cuadrados
del hogar es r = 0,65 metros cuadrados”.
m4 | actividad 3
Revisión de conceptos II
III. ¿Qué estadístico se emplea para calcular la relación entre dos variables
con escala ordinal?:
a) Coeficiente de correlación de Pearson.
b) Coeficiente de correlación.
c) Coeficiente de correlación de Spearman.
d) Ninguna es correcta.
&RYDULDQ]D\FRH¿FLHQWHGHFRUUHODFLyQ
Ejercicio 1:
Se sabe que entre el consumo de papel y el número de litros de agua por metro
cuadrado que se recogen en una ciudad no existe relación.
Ejercicio 2:
La varianza de la variable Y es igual a 200, y la varianza de los errores es igual
D¢&XiQWRYDOHHOFRH¿FLHQWHGHFRUUHODFLyQGH3HDUVRQVDELHQGRTXHHV
positivo?
m4 glosario
m5
m5 microobjetivos
Introducción a la probabilidad:
El término conjunto se asocia por lo general con la idea de “agrupación de objetos o elementos”,
es decir que denota una colección de elementos que tienen alguna característica en común.
En matemáticas el concepto de conjunto es considerado primitivo y ni se da una definición de éste,
sino que se trabaja con la notación de colección y agrupamiento de objetos, lo mismo puede
decirse que se consideren primitivas las ideas de elemento y pertenencia. La característica
esencial de todo conjunto es la de estar bien definido, es decir que para todo elemento particular
que se esté analizando podremos determinar si éste pertenece o no a cierto conjunto. Por ejemplo
si se considera el conjunto de los números dígitos, sabemos que el 3 pertenece al conjunto, pero el
19 no. Por otro lado el conjunto de las bellas obras musicales no es un conjunto bien definido,
puesto que diferentes personas puedan incluir distintas obras en el conjunto.
1) Por enumeración: si se detallan cada uno de los elementos de un conjunto (sin repetir)
encerrados entre llaves y separados por comas. Ejemplo: A= { a,e,i,o,u }
3) Por diagrama de Venn: es una gráfica cerrada en forma de ovalo , dentro del cual se
enumeran los elementos del conjunto indicados por un punto.
A
*a *e
*i
X R
Dos conjuntos son iguales si tienen los mismos elementos, por ejemplo: El conjunto { a, b, c }
también puede escribirse: { a, c, b }, { b, a, c }, { b, c, a }, { c, a, b }, { c, b, a }
Inclusión:
La relación de inclusión se da entre dos o más conjuntos.
Si cada elemento de un conjunto A es también un elemento del conjunto B , se dice que A es un
subconjunto de B . La notación A ؿB significa que A está incluido en B y se lee: “ A es subconjunto
de B ” o “ A está incluído en B ”.
B
A
Si no todos los elementos de un conjunto A son elementos del conjunto B , se dice que A no es
subconjunto de B . En este caso la notación A فB significa que A no es un subconjunto de B .
Pertenecia:
La relación de pertenencia se establece entre un elemento y uno o más conjuntos.
Veamos el concepto a través de un ejemplo: A= { a,e,i,o,u }
Entonces si tomamos el elemento “a” podemos decir que pertenece al conjunto A , en símbolos
dirmeos que: aԖA y si por el contrario tomamos otro elemento por ejemplo “z” diremos que
zԖ A
&RQMXQWRVFRQQRPEUHVHVSHFtILFRV
1) Conjunto finito: son aquellos que tienen una cantidad determinada de elementos , de forma
tal que podemos nombrar su último elemento.
A= { x/x es una vocal }
3) Conjunto universal: se denomina así al conjunto formado por todos los elementos del tema
de referencia.
Por ejemplo: U
U={ x/x es un animal }
A B
4) Conjunto vacío: se denomina así al conjunto que no tiene ningún elemento. Se lo denota
de dos formas posibles : { } o bien
Ejemplo: A = { x/x es un número impar múltiplo de 2 }
2SHUDFLRQHVGHFRQMXQWRV
1) Unión de conjuntos:
A B
2) Intersección de conjuntos:
Sean A y B dos conjuntos de un mismo conjunto universal, la intersección de A y B,
expresada por A ŀ B, es el conjunto de todos los elementos que pertenecen a A y a B
simultáneamente, es decir:
A ŀ B = {x | x אA y x אB} A
3) Diferencia de conjuntos:
A - B = {x | x אA, x בB} A B
Nota: A - B B - A
4) Complemento de un conjunto:
Nota: A’ = U - A
PROBABILIDAD:
Los conceptos de probabilidad, azar o aleatorio son tan viejos
como la civilización. Y es que todos usamos intuitivamente
este concepto cuando decimos :
“quizás llueva mañana” , “probablemente lleguemos tarde”…
Pero es importante que nos preguntemos ¿Qué es la
probabilidad?
Conceptos preliminares
x Evento compuesto: es aquel que está compuesto por la combinación de dos o más eventos
simples, los cuales se relacionan con alguna de las operaciones de: unión, intersección,
complemento o diferencia. (aquí comenzamos a observar cómo se relacionan directamente
con los conceptos vistos en el repaso de teoría de conjuntos)
La probabilidad toma valores entre 0 y 1 (o expresados en tanto por ciento, entre 0% y 100%):
El valor cero corresponde al evento imposible: lanzamos un dado y la probabilidad de que salga el
número 7 es cero (dado que tiene solo 6 caras)
P(=)0
P() = 1
Para calcular la probabilidad , hay diferentes teorías para definir este concepto :
1) Teoria clásica:
La probabilidad es número que se define como el cociente entre la cantidad de eventos
favorables sobre la cantidad de eventos posibles , en cierto experomento aleatorio.
Ejemplo. Si existen n posibles resultados, todos ellos con la misma posibilidad de que
ocurran, entonces la probabilidad de cada evento es 1/n
Veamos un ejemplo: si nuestro experimento es tirar un dado una vez , cual sería la
Probabilidad de que salga un número 5?
P(salga un 5) = 1/6
(Porque hay un solo 5 en las 6 caras que tiene un dado )
2) Teoría frecuencial:
En ésta teoria la probabilidad de un evento o suceso se obtiene a través de la frecuencia
relativa , si el evento se repite muchas veces bajo las mismas condiciones.
Veamos el siguiente ejemplo: si sabemos que en un colegio hay 435 alumnos de los
cuales 267 son mujeres . Podemos representar esta situación en una tabla como sigue:
ni fr =ni/n
mujeres 267 0,61
varones 168 0,39
total 435 1,00
a) Probabilidad de que al lanzar un dado salga el número 2: el caso favorable es tan sólo uno (que
salga el dos), mientras que los casos posibles son seis (puede salir cualquier número del uno al
seis). Por lo tanto:
b) Probabilidad de que al lanzar un dado salga un número par: en este caso los casos favorables
son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles siguen siendo seis.
Por lo tanto:
c) Probabilidad de que al lanzar un dado salga un número menor que 5: en este caso tenemos
cuatro casos favorables (que salga el uno, el dos, el tres o el cuatro), frente a los seis casos
posibles. Por lo tanto:
d) Probabilidad de que nos toque el "Gordo" de Navidad: tan sólo un caso favorable, el número que
jugamos (¡qué triste...¡), frente a 100.000 casos posibles. Por lo tanto:
Para poder aplicar la Regla de Laplace el experimento aleatorio tiene que cumplir dos requisitos:
a) El número de resultados posibles (sucesos) tiene que ser finito. Si hubiera infinitos resultados, al
aplicar la regla "casos favorables / casos posibles" el cociente siempre sería cero.
b) Todos los sucesos tienen que tener la misma probabilidad. Si al lanzar un dado, algunas caras
tuvieran mayor probabilidad de salir que otras, no podríamos aplicar esta regla.
A la regla de Laplace también se le denomina "probabilidad a priori", ya que para aplicarla hay que
conocer antes de realizar el experimento cuales son los posibles resultados y saber que todos
tienen las mismas probabilidades.
Ley de Laplace:
Cuando se realiza un experimento aleatorio un número muy elevado de veces, las probabilidades
de los diversos posibles sucesos empiezan a converger hacia valores determinados, que son sus
respectivas probabilidades.
P(AŀB)
5) Eventos independientes:
CASO ESPECIAL :
** Si dos eventos son indpendientes se verifica que
P(A/B) = P ( AŀB)/ P(B) = P(A).P(B) /P(B) = P(A)
Como A y B son independientes la probabilidad de A dado B es igual a la probabilidad de que
ocurra A
Por el contrario :
9HDPRVDKRUDDOJXQRVHMHPSORV
I. En un colegio los alumnos pueden elegir por cursar inglés o francés. En cierto grupo de 100
alumnos 90 estudia inglés y el resto francés. De los alumnos que estudian inglés 30 son
varones y de los que estudian francés 6 son mujeres.
Se pide:
a) Armar una tabla de doble entrada que muestre las diferentes alternativas
b) Realizar un diagrama de probabilidad o árbol de probabilidad
c) Si se selecciona un alumno al azar calcular las probabilidades de que:
i. Sea un varón
ii. Hable inglés
iii. Sea una mujer que hable frances
Solución:
a) Con los datos podemos armar la siguiente tabla
b) Árbol de probabilidad
Francés P(VŀF)=4/100=0,04
Habla
Francés P(MŀF)=6/100=0,06
= (66+90-60)/100= 96/100=0,96
Para ello tomamos un evento del “idioma” por ejemplo “que hable inglés” y otro
evento de “sexo” peo ejemplo “varón”
Y debemos ver que sii P(I ŀ V) = P(I) . P(V) las características son
independientes
Todas las distribuciones normales N( μ, ı), pueden ponerse mediante una traslación μ, y un
cambio de variable ı, como N(0,1) . Esta distribución especial se llama normal estandarizada o
tipificada, en ella se define una nueva variable:
X P
Z
V
/RVYDORUHVGHODWDEODQRUPDOUHSUHVHQWDQHOiUHD
EDMRODFXUYDQRUPDOKDVWDXQYDORUSRVLWLYRGH]
Sin embargo, si tenemos en cuenta que el área total bajo la gráfica ha de ser 1, deducimos de la
figura que:
Por simetría cambiamos los dos valores negativos a positivos y calculamos sus probabilidades.
En éste caso nos darán la probabilidad y debemos calcular el valor de la variable z que acumula
dicha probabilidad
Lo invitamos a poner en práctica los conceptos estudiados, realizando para ello las actividades
planteadas. Las preguntas que surjan canalícelas a través del espacio tutorial.
Material Básico
x Desarrollo teórico del módulo, disponible en el apartado contenidos.
x Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la
Educación. Córdoba: Editorial Brujas.
Material Complementario
GOVINDEN, Lincoyán, (1985), Introducción a la Estadística, Ed. McGraw Hill.
Interamericana Editores. S.A., Bogotá, Colombia.
JOHNSON, Robert, (2003), Estadística Elemental, Ed. Math Learning, Ed. Ter-
cera, México DF. KUBY, Patricia.
m5 | actividad 1
Probabilidad
Ejercicio 1:
En una población, donde el 45% son hombres y el resto mujeres, se sabe que
el 10% de los hombres y el 8% de las mujeres son inmigrantes.
Ejercicio 2:
Ejercicio 3:
Ejercicio 4:
En una clase de 30 alumnos, las 3/5 partes son mujeres
y la tercera parte aprueban todo en Junio.
Se sabe además que la mitad de los varones no aprueba en Junio.
Halla la probabilidad de que un alumno elegido al azar:
Ejercicio 5:
En un colegio secundario el 25% de los estudiantes fue aplazado en
Matemática, el 10% en Química y el 5% fue aplazado en ambas materias.
Calcular:
Ejercicio 6:
De acuerdo a una encuesta realizada en Córdoba, la ubicación probable de las
computadoras personales (PC) en una casa son:
Dormitorio de adultos 0.03
Dormitorio de niños 0.15
Otro dormitorio 0.14
Oficina o estudio 0.40
Otras habitaciones 0.28
Ejercicio 7:
8QDPXHVWUDDOHDWRULDGHDGXOWRVVHFODVLÀFDDEDMRSRUJpQHUR\VXQLYHO
educacional
Educación Hombre Mujer Básica 3845 Media 2850 Universitaria 2217
Ejercicio 8:
La siguiente tabla representa información respecto a género y tipo de salario de
los empleados de una empresa:
a) Sea mujer
b) Tenga ingresos medios
c) Sea hombre o tenga salario bajo
d) Sea hombre si tiene salario bajo
e) Tenga salario alto si es mujer
f) Sea hombre y tiene salario medio
g) Tenga salario medio o bajo
h) Tenga salario medio y alto
i) Verificar si “el tipo de salario” es independiente de “el género”
5HYLVLyQGHFRQFHSWRVEiVLFRVGHSUREDELOLGDG
$FRQWLQXDFLyQOHSUHVHQWRHMHUFLFLRVTXHOHSHUPLWLUiQSRQHUHQSUiFWLFD
ORVFRQFHSWRVGHSUREDELOLGDG
Ejercicio 1:
6HDQ$\%ORVVXFHVRVWDOHVTXH3>$@ \3>$ŀ%@
&DOFXOH3$%\3%
Ejercicio 2:
6HDQ$\%GRVVXFHVRVDOHDWRULRVVLVHFRFQRFHTXH3$F
3$8% 3$ŀ%
Hallar las siguientes probabilidades:
3$
3%
3$ŀ%F
3%ŀ$F
m5 | actividad 3
Distribución NORMAL
c) Entre Z = -0, 46 y Z = 2, 21
d) Entre Z = 0, 81 y Z = 1, 94
e) A la derecha de Z = -1,28
B- Si “área” se refiere al área bajo la curva normal tipificada, hallar el valor o los
valores de Z tales que:
a) El área entre 0 y Z sea 0,3770
b) El área a la izquierda de Z sea 0,8621
D- Obtenga Z si:
a) El área de la curva normal entre 0 y Z es 0,2019
Ejercicio 2: Estandarización
B- Una empresa lleva a cabo una prueba para seleccionar nuevos empleados.
Por la experiencia de pruebas anteriores, se sabe que las puntuaciones
siguen una distribución normal de media 80 y desviación típica 25.¿Qué
porcentaje de candidatos obtendrá entre 75 y 100 puntos ?.
'LDJUDPDGH9HQQJUi¿FDFHUUDGDHQIRUPDGHRYDORGHQWURGHOFXDOVH
enumeran los elementos del conjunto indicados por un punto.
3UREDELOLGDGFRQGLFLRQDORFRQGLFLRQDGDODSUREDELOLGDGGH3$%
se calcula como el cociente de: la intersección entre A y B, dividida por la
probabilidad de que ocurra B.
3UREDELOLGDGGHODGLIHUHQFLDHQWUHGRVHYHQWRV: la probabilidad de la
diferencia de un evento A menos un evento B , es igual a la diferencia de las
probabilidades de que ocurra A menos la probabilidad de que ocurra B.
3UREDELOLGDGGHODLQWHUVHFFLyQGHGRVHYHQWRV:la probabilidad de la
intersección de dos eventos es la probabilidad de que ocurran los elementos
FRPXQHVDDPERVHYHQWRVWDPELpQVHGHQRPLQDSUREDELOLGDGFRQMXQWD
m6 microobjetivos
Muestreo y Estimación
3REODFLyQFRQMXQWRGHWRGRVORVHOHPHQWRVEDMRHVWXGLR
Muestra: subconjunto de la población bajo estudio, posee dos características: ser aleatoria y
representativa .
Coeficiente de elevación: indica las veces que la muestra esta contenida en la población. Es la
inversa de la fracción de muestreo. En el ejemplo planteado en el punto anterior , si la fracción de
PXHVWUHRHUDGHHQWRQFHVHOFRHILFLHQWHGHHOHYDFLyQVHUi
9HDPRVDKRUDXQDVHULHGHOH\HVHQTXHVHEDVDQORVPpWRGRVGHPXHVWUHRDOHDWRULRpVWDVOH\HV
le otrogan un fundamento científico :
³/D OH\ GH ORV JUDQGHV Q~PHURV formulada por Jacques Bernoulli) expresa
TXHVLHQXQDSUXHEDODSUREDELOOLGDGGHXQVXFHVRGHGHQRPLQD3\VLpVWHVXFHVRVH
repite una gran cantidad de veces. La relación entre las veces que se repite el suceso y
OD FDQWLGDG WRWDO GH SUXHEDV WLHQGH D DFHUFDUHV FDGD YH] PDV D OD SUREDELOLGDG 3 0DV
exáctamente si el número de pruebas es lo suficientemente grande, hay una probabilidad
PX\FHUFDQDDGHTXHODIUHFXHQFLDGHOVXFHVRVHDSUDFWLFDPHQWHLJXDOD3´
/D SUREDELOLGDG GH XQ VXFHVR 3 HV OD UHODFLyQ HQWUH HO Q~PHUR GH FDVRV
favorables y el número total de casos posibles. Si todos los casos son igualmente
posibles, esta cociente es lo que se denomina cálculo de probabilidad.
8QFRQMXQWRGHGHQXQLGDGHVWRPDGDVDOD]DUGHXQDSREDOFLRQGHWDPDxR1
HV FDVL VHJXUR TXH WLHQH ODV FDUiFWHUtVWLFDV GHO JUXSR PiV JUDQGH pVWD OH\ VH FRQRFH
como “Ley de la regularidad estadística”).
6LXQDPXHVWUDVXILFLHQWHPHQWHJUDQGHHVUHSUHVHQWDWLYDGHODSREDODFLyQDOD
cual pertenece, una segunda muestra de igual magnitud deberá ser semejante a la
primera. Y si en la primer muestra se encuentran pocos individuos con características
UDUDV HV GH HVSHUDU HQFRQWUDU LJXDO SURSRUFLyQ HQ OD VHJXQGD PXHVWUD pVWD OH\ VH
conoce como “Ley de permanencia de los números pequeños”).
7LSRVGHPXHVWUHR
Existen diferentes formas de seleccionar las muestras , en genaral pueden dividirse en dos
grandes grupos:
a) Muestreo probabilístico
b) Muestreo no probabilístico
D 0XHVWUHR SUREDELOtVWLFR pVWRV PpWRGRV VRQ DTXHOORV TXH VH EDVDQ HQ HO
principio de equiprobabilidad , es decir aquellos en los que todos los individuos tienen la
PLVPDSUREDELOLGDGGHVHUVHOHFFLRQDGRVSDUDIRUPDUSDUWHGHXQDPXHVWUD3RUHQGHWRGDV
las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas . solo
pVWRVPpWRGRVGHPXHVWUHRQRVDVHJXUDQUHSUHVHQWDWLYLGDG\DOHDWRULHGDG<SRUHOORVRQORV
mas recomendables.
'HQWURGHpVWRVPpWRGRVSUREDELOtVWLFRVHVWXGLDUHPRVORVVLJXLHQWHV
D0XHVWUHRHVWUDWLILFDGR(VWHSURFHGLPLHQWRFRQFLVWHHQFRQVLGHUDUFDWHJRUtDVWtSLFDV
GLIHUHQWHVHQWUHVtHVWUDWRVTXHVRQKRPRJpQHRVUHVSHFWRGHDOJXQDFDUDFWHUtVWLFD
VH SXHGH HVWUDWLILFDU SRU HMHPSOR VHJ~Q HO
nivel de estudios alcanzado). Lo que se trata es
TXH WRGRV ORV HVWUDWRV GH LQWHUpV HVWpQ
representados en la muestra. Dentro de cada
HVWUDWRVHVHOHFFLRQDQHOHPHQWRVSXHGHXVDUVHHO
MAS o el sistematico) que formarán parte de la
muestra analizada.
D0XHVWUHRDOHDWRULRSRUFRQJORPHUDGRV(QORVDQWHULRUHVPpWRGRVODVXQLGDGHV
muestrales son los elementos de la población.
En el muestreo por conglomerados
la unidad elemental es un conjunto de
elementos de la población a la que se
GHQRPLQD³FRQJORPHUDGR´FRPRSRUHMHPSOR
los departamentos o áreas dentro
de un colegio). Éste muestreo consiste en
seleccionar aleatoriamente un cierto
número de conglomerados hasta alcanzar el
tamaño de muestra elegido.
E 0XHVWUHRVQRSUREDELOtVWLFRVPXFKDVYHFHVDSOLFDUODVWpFQLFDVGHPXHVWUHR
probabilístico
HV FRVWRVR \ VH HOLJHQ PXHVWUHRV QR SUREDELOtVWLFRV $XQTXH VH FRQRFH TXH pVWRV QR
VLUYHQSDUDUHDOL]DUJHQHUDOL]DFLRQHVHVWLPDFLRQHVLQIHUHQFLDOHVVREUHODSREODFLyQEDMR
estudio) porque no se tiene certeza de que la muestra extraída sea representativa ya que
no todos los elementos de la población tienen la misma probabilidad de ser elegidos para
formar parte de la muestra. En general se seleccionan a los sujetos siguiendo
determinados criterios tratando de que la muestra sea representativa.
(QWUHORVPpWRGRVGHPXHVWUHRQRSUREDEilísticos mas utilizados vamos a estudiar:
E0XHVWUHRSRUFXRWDVWDPELpQGHQRPLQDGR³DFFLGHQWDO´6HEDVDHQXQEXHQ
FRQRFLPLHQWRGHORVHVWUDWRVGHODSREODFLyQ\RGHORVLQGLYLGXRVPiV
representativos o adecuados para los fines de la investigación.
7LHQHFLHUWDVVLPLOLWXGHVFRQ
el muestreo estratificado,
pero no tiene el
carácter de aleatoriedad de
pVWH
(QpVWHWLSRGHPXHVWUHRVH
fijan “cuotas” que son
números de individuos
que reúnen determinadas
condiciones , por ejemplo: 20
LQGLYLGXRVGHD
años de sexo femenino , de
Córdoba capiWDO8QDYH]GHWHUPLQDGDODFXRWD
se seleccionan los primeros individuos que cumplan esas características
E%RODGHQLHYHVHORFDOL]DDDOJXQRVLQGLYLGXRVORVFXDOHVFRQGXFHQDRWURV\
pVWRVDRWURV\DVtKDVWDFRQVHJXLUXQDPXHVWUDGHOWDPDxRGHVHDGReVWHWLSR
de muestreo se usa cuando se hacen estudios
es poblaciones marginales
SRUHMHPSORGHOLQFXHQWHVVHFWDV
determinados tipos de enfermos, etc)
E0XHVWUHRGLVFUHFLRQDODFULWHULRGHOLQYHVWLJDGRUORVHOHPHQWRVVRQHOHJLGRV
VREUHORTXHpOFUHHSXHGHQDSRUWDUDOHVWXGLR
3ODQGHPXHVWUHR
Se llama plan o programa de muestreo al procedimiento para selección de la muestra con la cual
se va a trabajar.En todo plan de muestreo debe tenerse en cuenta que procedimiento de selección
de muestra se va a utilizar, y los criterios de decisión que se van a aplicar.
Los errores sistemáticos provienen de causas ajenas a la muestra misma, producen distorsiones o
sesgos en la muestra que hace que los resultados obtenidos varíen en una dirección
SDUWLFXODU$OJXQRV HMHPSORV GH pVWRV WLSRV GH HUURUHV SXHGHQ VHU HUURUHV SRU VXVWLWXLU
inadecuadamente un elemento por otro que es el primero que tiene a su alcance. Otro ejemplo
VHUtD HUURUHV SRU RPLVLyQ SRU WHQHU LQVXILFLHQWHV GDWRV REWHQLGRV VREUH WRGR VH GD pVWH FDVR
cuando hay muchas “no respuestas” dentro de la información muestreada; se da por ejemplo en
las encuestas que se mandan por internet o por correo y que las personas no responden .
3RU ~OLWPR VHUtD HO FDVR GH HUURUHV GH VHVJRV GH VHOHFWLYLGDG HV GHFLU HUURUHV SRU QR KDEHU
incluíso elementos dentro de la muestra y que son significativos para la investigación.
Los errores accidentales o por el azar cualquiera sea el tipo de muestreo utilizado , son los
DVRFLDGRV DO LQVWUXPHQWR GH PHGLFLyQ 'HSHQGH GH GRV IDFWRUHV GHO WDPDxR GH OD PXHVWUD D
mayor muestra menor será el error de la muestra) y de la dispersión o desviación típica de la
PXHVWUDDPD\RUGLVSHUVLyQPD\RUVHUiHOHUURU
,QVWUXPHQWRVGHUHFROHFFLyQGHGDWRV
8Q LQVWUXPHQWR GH UHFROHFFLyQ GH GDWRV HV XQ UHFXUVR TXH
utiliza el investigador para estar más cerca del fenómeno que
es objeto de estudio y extraer de estos infromación.
([LVWHQ GLIHUHQWHV PDQHUDV GH REWHQHU pVWD LQIRUPDFLyQ GH
DTXt VH GHULYDQ ODV GLVWLQWDV WpFQLFDV GH UHFROHFFLyQ GH GDWRV
que son mecanismos , medios y sitemas para recolectar,
conservar, reelaborar y trasmitir los datos con los que se va a
WUDEDMDU(VGHFLUTXHODVWpFQLFas están referidas a la manera
cómo se van a obtener los datos y los instrumentos que se van a utilizar para extraer la
información.
(V LPSRUWDQWH SODQWHDUVH TXH pVWDV WpFQLFDV VHDQ YiOLGDV \ FRQILDEHV YiOLGDV SRUTXH PLGHQ
H[DFWDPHQWH OR TXH VH GHVHD PHGLU HILFDFLD \ FRQILDEOHV FXDQGR VL VH YROYLHVHQ D DSOLFDU VH
obtendrían resultados muy parecidos o similares.
Otro aspecto fundamental es definir el marco teórico y metodológico, para lo cual debe consultarse
la bibliografía y elegir la mejor metodología de forma de que se defina en forma lo más exacta
posible los instrumentos de análisis acorde a los objetivos planteados en la investigación.
(QWUHYLVWDV
(VWDVWpFQLFDVVHXVDQSDUDUHFDEDUGDWRVHQIRUPDYHUEDODWUDYpVGHSUHJXQWDVTXHUHDOL]DHO
investigador, es una forma de interacción social, en la cual el investigador se sitúa frente al
entrevistado y le realiza preguntas y a partir de las respuestas
del mismo se obtendrá la información que se necesita. Se
HVWDEOHFH XQ GLiORJR DVLPpWULFR GRQGH XQD GH ODV SDUWHV EXVFD
recoger información y la otra parte es la fuente de esa
información. Éste puede entrevistar en forma individual o bien en
grupos. De todas formas siempre es un intercambio de
información que se realiza cara a cara, es decir es un canal de
comunicación directo entre el investigador y la unidad
HVWDGtVWLFD 3HUR MXVWDPHQWH HV pVWD LQWHUDFFLyQ GLUHFWD OD TXH
PXFKDVYHFHVKDFHTXHQRVHDpVWDODIRUPDGHUHFROHFWDUGDWRV
más objetiva.
El entrevistado debe ser siempre una persona que tiene conocimiento sobre el tema que se está
investigando.
El entrevistador es quien dirige la entrevista, domina el diálogo, hace las preguntas adecuadas y
cierra la entrevista.
3DUDFRPHQ]DUHOSURFHVRGHHQWUHYLVWDOHSHUVRQDTXHYDDUHDOL]DUODPLVPDGHEHUiSUHSDUDUOD
entrevista teniendo en cuenta los siguientes aspectos:
I. Definir en forma detallada características del entrevistado
,, 3UHSDUDUODVSUHJXQWDVTXHYDDSODQWHDU
III. Determinar un límite de tiempo y preparar la agenda para la entrevista
IV. Seleccionar y preparar un lugar donde realizar la entrevista en forma cómoda ,
evitando interferencias del exterior
V. Hacer la cita con cada unidad de relevamiento, con la debida anticipación.
En el momento de realizar la entrevista, para llevar adelante la misma deberán tenerse en cuenta
los siguientes puntos:
I. Explicar al entrevistado el propósito y alcance de la misma.
II. Hacer preguntas específicas de forma tal que las respuestas obtenidas puedan
ser fácilmente cuantificadas. Evitando dentro de lo posible las subjetividades, el cuchicheo
y no emitir juicios de valor.
III. Conservar siempre el control de la entrevista, evitando comentarios al margen
del tema principal.
IV. Escuchar atentamente lo que se responde, sin anticiparse a las respuestas.
(QHOPRPHQWRGHUHDOL]DUODLQIRUPDFLyQHOHQWUHYLVWDGRUGHEHUiWHQHUSUHVHQWHTXHpVWDHVXQD
IRUPDGHFRQYHUVDFLyQQRGHLQWHUURJDFLyQVLHQGRpVWDODPDQHUDPiVDGHFXDGDSDUDUHFROHFWDU
datos cualitativos.
La estructura de la entrevista varía, si por ejemplo el objetivo de a entrevista es adquirir
información general la entrevista será una serie de preguntas sin estructura y con respuestas
libres. En cambio si es necesario indagar sobre diferentes aspectos es conveniente realizar
preguntas más estandarizadas, donde haya preguntas abiertas y cerradas .Las preguntas para
respuestas abierta permiten a los entrevistados dar cualquier respuesta que parezca apropiado.
3XHGHQ FRQWHVWDU SRU FRPSOHWR FRQ VXV SURSLDV SDODEUDV &RQ ODV SUHJXQWDV SDUD UHVSXHVWD
cerradas se proporcionan al usuario un conjunto de respuesta que se pueda seleccionar.
La entrevista no estructurada no requiere menos tiempos de preparación, porque no necesita tener
SRU DQWLFLSDGR ODV SDODEUDV SUHFLVDV GH ODV SUHJXQWDV $QDOL]DU ODV UHVSXHVWDV GHVSXpV GH OD
entrevista lleva más tiempo que con la entrevista estructuradas. El mayor costo radica en la
preparación, administración y análisis de las entrevistas estructuradas para preguntas cerradas.
La habilidad del entrevistador es IXQGDPHQWDO SDUD HO p[LWR GH OD HQWUHYLVWD /D EXHQD HQWUHYLVWD
depende del conocimiento del analista tanto de la preparación del objetivo de una entrevista
específica como de las preguntas por realizar a una persona determinada.
El tacto, la imparcialidad e incluso la vestimenta apropiada ayudan a asegurar una entrevista
H[LWRVD/DIDOWDGHHVWRVIDFWRUHVSXHGHUHGXFLUFXDOTXLHURSRUWXQLGDGGHp[LWR
$OJXQDVYHQWDMDV\GHVYHQWDMDVGHpVWDWpFQLFDGHUHFROHFFLyQGHGDWRVVRQ
9(17$-$6 '(69(17$-$6
x Asegura elaborar en forma uniforme de x 7LHQHXQDOWRFRVWRGHSUHSDUDFLyQ
las preguntas para todos los que van a x Lo que responde no puede tener un alto
responder. nivel de estructura y carácter mecánico de
x Es fácil de administrar y evaluar las preguntas.
x 7LHQHXQDHYDOXDFLyQPiVREMHWLYDWDQWR x Si las preguntas tienen un alto nivel de
del entrevistador como del entrevistado estructura se reducen las respuestas
x Se necesita un limitado entrenamiento espontáneas.
del entrevistador. x Los entrevistadores pueden introducir
x Hay mayor flexibilidad al realizar las sus sesgos en la pregunta o en el
preguntas adecuadas a quien responde momento de informar los resultados de las
x El entrevistador puede explotar áreas respuestas
que surjan en forma espontánea durante la x El análisis y la interpretación pueden
entrevista. ser muy largos y difícilmente cuantificables
x 3XHGHSURGXFLULQIRUPDFLyQGHiUHDV x El proceso lleva más tiempo que otros
que minimizó en el momento de planificar PpWRGRVGHUHFROHFFLyQGHGDWRV
la entrevista.
7LSRVGHHQFXHVWDVVHJ~QHOWLSRGHPHGLRTXHVHXVDSDUDUHDOL]DUODHQFXHVWD
, (QFXHVWD FDUD D FDUD FRQVLWH HQ HQWUHYLVWDV GLUHFWDV \ SHUVRQDOHV DO
encuestado).
,, (QFXHVWDVWHOHIyQLFDVVRQHQWUHYLVWDVYtDWHOHIyQLFDFRQFDGDHQFXHVWDGR
,,, (QFXHVWDVSRUFRUUHRVHHQYtDQFXHVWLRQDULRVDORVSRWHQFLDOHVHQFXHVWDGRV
se les pide que lo rellenen y lo devuelvan completados).
,9 (QFXHVWDVSRU,QWHUQHWRHQFXHVWDVRQOLQHFRQVLVWHHQXQFXHVWLRQDULRHQXQD
página web o bien crear una encuesta online y enviarla a los correos electrónicos).
7LSRVGHHQFXHVWDVVHJ~QVXVREMHWLYRV
I. Encuestas descriptivas: buscan reflejar actitudes o condiciones presentes , es
decir describir en que situación se encuentra determinada pobalción en el momento en
que se realiza la encuesta.
II. Encuesta analítica: su objetivo es describir, explicar los porque de determinada
situación. En general se toman como base de análisis mas de dos variables, de las que se
REVHUYDWDPELpQVLHVWDQLQWHUUHODFLRQDGDV\TXHLQIHUHQFLDVSXHGHQKDFHUVH
7LSRVGHHQFXHVWDVVHJ~QODFODVHGHSUHJXQWDV
I. De respuesta abierta: en ellas se les pide al interrogado que responda el mismo
a las preguntas formuladas, Esto da mas libertad al entrevistado y al mismo tiempo
permite que de respuestas mas profundas.
,, 'H UHVSXHVWD FHUUDGD HQ pVWD ORV HQFXHVWDGRV GHEHQ HOHJLU SDUD UHVSRQGHU
alguna de las opciones que se presentan en un listado dado de antemano. Esta forma
de encuestar da como resultado respuestas más fáciles de cuantificar y de carácter
PiVXQLIRUPH(OSUREOHPDTXHSXHGHQSUHVHQWDUHVTXHHQODVRSFLRQHVQRHVWpHO
listado de respuestas que el encuestado desea , esto puede salvarse agragando como
última opcion :”otros”.
Tiposdepreguntasdelcuestionariodeunaencuesta
Existen diversos tipos de preguntas para elaborar el cuestionario, las principales son las
siguientes:
, 3UHJXQWDV LQWURGXFWRULDV VRQ DTXHOODV TXH WLHQHQ OD ILQDOLGDG GH DWUDHU OD DWHQFLyQ GHO
interrogado, disponiendo favorablemente hacia la entrevista. Son preguntas agradables y
VXJHVWLYDV (MHPSOR¢/H JXVWDUtD WHQHU HO FXHUSR GH 6KDNLUD" ,QWHQWH FRQWHVWDU HO
cuestionario y le diremos como lograrlo.
,, 3UHJXQWDV DELHUWDV (V FXDQGR HO HQWUHYLVWDGR SXHGH UHVSRQGHU GH PDQHUD HVSRQWiQHD
VHJ~QFUHDFRQYHQLHQWH(MHPSOR¢4XpDFWLYLGDGHVWLHQHVHOGtDGHPDxDQD"
,,, 3UHJXQWDVFHUUDGDV6RQDTXHOODVFX\DVUHVSXHVWDVVHOLPLWDQDODVTXHHVWiQFRQWHQLGDV
en el texto de la misma pregunta.
Ejemplo: ¿Dormiste bien? Subraya: Sí No Regular
,9 3UHJXQWDVGHUHVSXHVWDP~OWLSOH6RQDTXHOODVFX\DVSRVLEOHVUHVSXHVWDVVHHQFXHQWUDQ
contenidas casi totalmente las opciones que se dan pero dejan la posibilidad abierta por
si ninguna de ellas le satisface agregar una nueva opción.
(MHPSOR¢4XpJXVWDVFRPHUHQODVPDxDQDV"
Escoge: fruta____ yogurth____ leche_________ otros. ¿Cuáles?__________________
9 3UHJXQWD ILOWUR VRQ ODV TXH VH FDUDFWHUL]DQ SRUTXH ODV UHVSXHVWDV REWHQLGDV SHUPLWHQ
establecer una selección cualitativa o una clasificación de las personas interrogadas.
(MHPSOR¢4XpDFRVWXPEUDVFRPHUORVILQHVGHVHPDQD"6HxDOD
Arroz ____ fiambre_____ chocolate_____ Helado_________
IUXWDBBBBBBYHUGXUDBBBBBB$VDGRBBBBBBBBBB3L]]DBBBBBBBBBB
VII. Preguntas de evaluación. Se pide al entrevistado que exprese un juicio de valor respecto a
un determinado tema que se somete a su consideración.
Ejemplo: ¿Cómo considera que estuvo la película?
___Buena ___ Regular ___Deplorable
IX. Preguntas ponderativas son aquellas que dan a escoger las posibles respuestas en orden
progresivo de calificación.
Ejemplo: Del uno al cinco, anota tu canción favorita:
____Amor eterno ___Nunca te olvidaré _____Hoy tengo ganas de ti
______Gavilán o paloma ______La nave del olvido
Dentro de las encuestas pueden distinguirse los censos en los que se analiza a todos los
individuos de la pobalción bajo estudio, por supuesto, de mayor alcance y extensión.
Si por cuestiones de costo (de tiempo o presupuesto) se opta por encuestar a una muestra
representativa de la población se debe elegir de antemano utilizando alguna de las técnicas de
selección de muestras. Una forma reducida de una encuesta por muestreo es un "sondeo de
opinión", esta forma de encuesta es muy parecida a un muestreo, pero se caracteriza porque la
muestra de la población elegida no es suficiente para que los resultados puedan aportar un
informe confiable. Se utiliza solo para recolectar algunos datos sobre lo que piensa un número de
individuos de un determinado grupo sobre un determinado tema.
Un tipo particular de encuesta, que tiene por objetivo preparar la verdadera encuesta es la
“encuesta piloto”. Se busca tener unos pocos criterios para diseñar o rediseñar las herramientas
de trabajo, teniendo una idea previa de la población. Esta exploración es útil porque esta libre de
conclusiones sobre el tema de estudio y sirve solo para mejorar la investigación; incluso
restablecer un diagrama de flujo u otro tipo de planificación.
VENTAJAS DESVENTAJAS
x Bajo costo x El planteamiento y ejecución de la
x Información más exacta y de mejor investigación suele ser más complejo
calidad x Requiere diseño de profesionales que
x Es posible introducir métodos científicos tengan buenos conocimientos de teoría y
objetivos de medición para corregir errores sean hábiles en su aplicación.
x Tiene resultados con mayor rapidez x Tiene mayor riesgo de sesgo muestral.
x Los datos son más fáciles de procesar
x Es una de las técnicas más utilizadas y
que permite obtener información de
cualquier tipo de información
x Permite obtener información sobre
hechos pasados de los encuestados
x Permite estandarizar los datos
x Es relativamente más barata
Las observaciones:
Sea cual se a la forma en que lleva adelante la observación deberá prepararse para esto ,
tenidendo en cuenta los siguientes aspectos:
1. Determinar y definir aquello que va a observar. .
2. Definir el tiempo necesario de observación
3. Obtener la autorización necesarias para llevar a cabo la observación.
4. Explicar a las personas que van a ser observadas lo que se va a hacer y las
razon para ello.
Completando así este sencillo ejercicio usted demostró las siguientes habilidades: leer, escuchar,
observar, elegir, preguntar, resumir, organizar, escribir y presentar . Se trata de habilidades
desarrolladas por la mayoría de los estudiantes y aplicadas a la vida cotidiana. Pero también son
habilidades que deben estar presentes en toda investigación y que emplean permanentemente los
académicos y otros investigadores.
Los investigadores emplean habilidades cotidianas para la recolección, selección, análisis y
presentación de datos, pero lo hacen de una manera consciente, mesurada y sistemática a fin de
ser rigurosos, críticos y analíticos. La investigación requiere de la profesionalización de las
habilidades cotidianas. Ello exige, asimismo, que el investigador atienda sobre todo a los diversos
valores, opiniones, significados y explicaciones para estar alerta a las parcialidades y distorsiones.
Pero en esencia, las habilidades aplicadas a la investigación siguen siendo habilidades cotidianas,
de modo que su experiencia y conocimiento de estas últimas le proporcionarán una vía rápida
para pensar en el diseño y los métodos de investigación.
¿Hasta qué punto difieren las formas cuantitativa y cualitativa de investigación? A primera vista, la
técnica de investigación basada en el uso de cuestionarios puede considerarse una estrategia
cuantitativa, en tanto cabría decir que las entrevistas y las observaciones son técnicas cualitativas.
En la práctica, sin embargo, las cosas no son tan sencillas. Las entrevistas pueden estructurarse y
analizarse de forma cuantitativa: por ejemplo, cuando se recolectan datos numéricos o cuando las
respuestas no numéricas se clasifican en categorías y se codifican de forma numérica.
Análogamente, las encuestas permiten a menudo respuestas de final abierto e inducen a estudiar
investigación-acción implique, generalmente, algún trabajo de campo. Asimismo, cabe usar los
documentos, entrevistas, observaciones y cuestionarios como parte de todas las estrategias y
enfoques de investigación identificados, aunque el modo de aplicarlos y analizarlos varíe. En otras
palabras, las familias, enfoques y técnicas representan las dimensiones del proceso de
investigación. El investigador puede combinar estas dimensiones de distinta forma con el propósito
de estudiar más adecuadamente un conjunto específico de cuestiones. Es posible escoger
enfoques o técnicas concretos y concentrarse en el trabajo de gabinete o de campo, o bien en una
estrategia cualitativa o cuantitativa; o también combinar o variar el tratamiento. Todo depende de
La investigación-acción
La investigación-acción constituye una forma de
indagación autorreflexiva desarrollada por investigadores
que participan en situaciones sociales incluídos temas
referidos a la educación, que tiene por objeto mejorar la
racionalidad en sus propias prácticas pedagógicas ,
comprender mejor éstas prácticas y las situaciones en
las que las mismas se llevan a cabo.
La investigación-acción es un estudio de a situación
social con el objetivo de mejorar la calidad de las
acciones que se llevan a adelante dentro de éste
contexto. En ésta práctica las teorías no se validan en
forma independiente y luego se aplican a las situaciones
prácticas sino que son validadas por la práctica misma.
La investigación-acción se ha convertido en un enfoque cada vez más popular entre los
investigadores en pequeña escala pertenecientes a las ciencias sociales, particularmente para
aquellos que trabajan en áreas como la educación, la salud y la asistencia social. Se adapta muy
bien a las necesidades de los que conducen la investigación en sus lugares de trabajo y que se
interesan además por mejorar aspectos de su propia práctica y la de sus colegas.
2) Elaborar un guión: Armar una guía buscando material bibliográfico que sirvan de orientación
para no perderse en el “mundo de la información” alejándose del problema que se está
analizando.
Para ésto deben analizarse los antecendente en el tema , y en cada material analizado observar:
¿quién o quiénes han escrito sobre él en particular?, ¿cómo lo han hecho? y ¿hasta dónde han
llegado?. Este concimento nos permitirá estructurar más formalmente la investigación, y si hay
más de una persepectiva o enforque del tema podremos seleccionar cuál es el enfoque con el que
vamos a trabajar y el por qué de ésta elección.
4) Seleccionar el material :una vez que buscamos el material deberemos analizarlo para lo
cual es importante: ver si es acorde al tema , cual es su lenguaje , si tiene referencias
bibliográficas y clasificarlo adecuadamente . Para ésta clasificación es importante tener en cuanta:
nombre del autor, título del documento, editorial, número de edición, año y/o número de revista
(ordenándola alfabéticamente y dándole una numera- ción secuencial para su clasificación), una
para libros y otra para revistas
5) Lectura y análisis de documentos: se deberá realizar una lectura analítica del material
documental que se a reunido. Teniendo siempre presente los objetivos planteados en la
investigación. Pudiéndose elaborar fichas bibliográficas da cada libro analizado, pequeñas
síntesis o bien de referencias bibliográ¿cas con notas al pie de página.
6) Elaboración del “Estado del Arte” :una vez realizada la búsqueda, selección y revisión de la
bibliografía al igual que la lectura y análisis de documentos seleccionados podemos describir:
¿quiénes han escrito sobre el tema?;¿cómo lo hicieron?;¿ hasta dónde llegaron?;¿ cuáles serían
las posibles teorías que sustentarán la investigación (en caso de ser necesario)?, y sobre todo
qué falta por investigar, a esto se le llama, Estado del Arte. Esto es indispensable hacerlo en
cualquier investigación, porque de aquí se deriva, también,el marco de referencia, el teórico o
conceptual,.
11) Revisión del escrito. Cuando ya se ha concluido la redacción del trabajo, o una sección
importante de él, es bueno volver a leerlo todo desde el principio, y tratar de descubrir alguna falta,
desde el punto de vista del contenido y de la forma gramatical. Es decir, releer el escrito en voz
alta, de esta manera se detectan con mayor facilidad las repeticiones de la misma palabra, la
ausencia de alguna coma, las faltas de concordancia, etc., pero también detectar alguna falta en el
orden y en la claridad de la exposición. Otra opción muy buena, es que alguien más lo lea
nuevamente y detecte algo no visto. Hay que tener especial cuidado en las citas y notas a pie de
página, el número de la llamada debe corresponder al número de la nota, que las referencias
correspondan a las fuentes indicadas y, además estén redactadas todas con el mismo sistema.
Por último, hay que revisar los títulos y subtítulos. No solamente han de ser congruentes con el
tema tratado, sino que, además deben tener exactamente la misma redacción en el índice. El
cuerpo del trabajo, la bibliografía y los anexos.
Finalizamos aquí el desarrollo tórico de la asignatura. Lo invitamos una vez más, a que realice las
actividades, de modo de poder practicar en profundidad los conceptos que han sido presentados
desde el programa de la asignatura.
Seguramente surgirán preguntas, las que podrá canalizar a través del espacio tutorial.
m6 material
Material Básico
x Desarrollo teórico del módulo, disponible en el apartado contenidos.
x Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la
Educación. Córdoba: Editorial Brujas.
Material Complementario
GOVINDEN, Lincoyán, (1985), Introducción a la Estadística, Ed. McGraw Hill.
Interamericana Editores. S.A., Bogotá, Colombia.
m6 actividades
m6 | actividad 1
o mal
o regular
o bien
o muy bien
------------------------------------
---------------------------------------------
--------------------------------
o Almuerzo
o Veo televisión
o Hago ejercicio
o Otra:_______________
--------------------------------------
m6 | actividad 3
Fracción de elevación
a)
Coeficiente de elevación
b)
Fracción de muestreo
c)
Coeficiente de muestreo
d)
Ninguna es correcta
e)
…………………………………………………………………………………………
…………….
MAS a)
Sistemático
b)
Estratificado
c)
Conglomerado
d)
Ninguna es correcta
e)
…………………………………………………………………………………………
…………….
…………………………………………………………………………………………
…………….
IX. Técnica que es muy utilizada por sociólogos con el fin de estudiar
a las personas en actividades sobre todo de tipo grupal que le
permitien ver: que está haciendo, como lo hace, quién , de qué forma
, en cuánto tiempo, dónde y por qué ,etc. Se llama:
Cuestionario
a)
Entrevista
b)
Encuesta
c)
Observación directa
d)
Ninguna es correcta
e)
…………………………………………………………………………………………
…………….
e valuación