Estadistica 1
Estadistica 1
Estadistica 1
g presentación 3
g programa 4
contenido módulos
g mapa conceptual 5
g macroobjetivos 6
g agenda 6
g material 8
material básico
material complementario
g glosario 9
g módulos *
m1 | 12
m2 | 39
m3 | 74
g evaluación 109
En primer lugar me gustaría aclarar, desde esta primera oportunidad que tenemos
de contactarnos que, para su beneplácito, la Estadística no es sinónimo de
matemáticas. Por supuesto que en esta materia vamos a trabajar con números,
y con algunas fórmulas, pero se tratará siempre de una manera aplicada y por
sobretodo aplicada al campo del deporte y de la actividad física.
Se hace necesario entender
que la Estadística no se reduce
al simple manejo de números,
es sumamente importante en el
trabajo profesional cotidiano ya
que proporciona elementos y
conocimientos necesarios para
la correcta interpretación de la
información cuantitativa y
cualitativa que se maneja, que
se consume y que se transmite.
a g e n da
MÓDULOS
SEMANA
1 2 3
1
10
11
12
13
14
Segunda Etapa
15
de Evaluación
m a t e rial
Material básico
• TRIOLA, Mario F. Estadística. México, Pearson, 10ma. ed., 2009.
Material complementario
• ELORZA PÉREZ – TEJADA, Haroldo. Estadística para las ciencias sociales,
del comportamiento y de la salud. México, CENGAGE Learning, 3ra.ed.,
2008.
• LEVINE, David, M. et al. Estadística para administración, México, Pearson
Educación, 4ta ed., 2006.
m1
m1 microobjetivos
m1 contenidos
Comenzamos con el
desarrollo de la materia y
para ello lo invito a ver el
video presentación del
módulo es posible que usted
se encuentre por primera vez
(o así lo piense) con
contenidos vinculados a la
estadística, es la intención
que desde el primer
momento pueda descubrir que usa conceptos y términos que se
desarrollarán en esta materia muy a menudo, en la vida cotidiana y
por supuesto en su labor diaria como profesor de Educación Física.
¡Lo invito a descubrir el mundo de la estadística!
https://www.youtube.com/watch?v=-TGCaLLuEIE
3. Datos
Son variados los métodos a los cuales se puede recurrir para obtener los datos
que se necesiten para una determinada investigación. Pueden ser fuente de
datos:
• Publicaciones provenientes del sector público (nacionales, provinciales o
municipales) o privado (Cámaras empresarias, Fundación de Investigaciones
Económicas Latinoamericanas –FIEL–, Instituto de Investigaciones
Económicas de la Realidad Argentina y Latinoamericana –IIERAL–, etc.), o
industriales o individuales.
• Diseño de un experimento: a través de un experimento se trata de controlar
el tratamiento que se da a los participantes.
• Elaboración de una encuesta: se utiliza cuando los registros internos y los
datos publicados no son apropiados para un estudio en particular.
Nos encontramos inmersos en contextos en los que Internet y las demás
tecnologías nos permiten acceder a datos en tiempo real, a bases de datos que
antes eran impensadas. Pensemos en lo cotidiano, por ejemplo: los códigos
de barras registran automáticamente la información de inventario al comprarse
un producto en el supermercado; los sistemas de cómputos permiten que
las transacciones bancarias se hagan en segundos; los agentes de viajes
y las compañías aéreas tienen información de último momento respecto a la
disponibilidad de espacios en hoteles, en vuelos, etc. También el uso de las
bibliotecas ha tomado un nuevo significado: ya no hace falta visitar una biblioteca
para tener acceso a un libro o a un folleto, etc.
Más allá de la fuente utilizada, hay que distinguir entre el recolector original
de los datos y la organización o individuos que compilan éstos en tablas y
diagramas, por ejemplo. Al recolector de datos se lo denomina fuente primaria;
el compilador de los datos, la fuente secundaria.
4.1. Recopilación
En esta etapa obtenemos datos estadísticos, ya sea que se obtengan de
información que proviene de la organización en la cual realizaremos la
investigación –que llamaremos datos internos–, o bien los llamados datos
externos, que surgen de la información que obtenemos de publicaciones
realizadas por organismos públicos, privados o de encuestas.
4.2. Organización
Una vez obtenidos los datos, estos deben ser corregidos, clasificados y
tabulados. Este proceso debe seguirse sobre todo para los datos que surgieron
de una encuesta, ya que a partir de la información recopilada podrían presentarse
inconsistencias, omisiones o resultados poco relevantes, los cuales deben
ser corregidos y completados, de manera tal que se resuelvan los problemas
detectados.
La clasificación consiste en agrupar la información bajo algún criterio (cronológico,
geográfico, cualitativo o cuantitativo), y por último la tabulación implica crear una
base de datos, la que permita sistematizar la carga de los mismos para luego
poder realizar el procesamiento y presentación adecuada de los mismos.
4.3. Presentación
La presentación de los datos se realiza principalmente a través de tablas y gráficos
estadísticos -este tema lo veremos en el módulo 2-, también es posible hacer
una presentación literal que significa expresar la información mediante palabras;
esta forma de presentar los datos recopilados sólo se adecua cuando éstos son
escasos, o bien es común su empleo cuando se presentan las conclusiones del
estudio.
4.4. Análisis
Esta etapa comprende la búsqueda de relaciones entre los datos a fin de sacar
conclusiones acerca de los mismos.
El grado de relación entre dos o más conjuntos de datos podrá ser encontrado a
través del análisis apropiado, mediante la aplicación de distintos procedimientos
estadísticos adecuados al tipo de información con la que se trabaje.
4.5. Interpretación
Luego del análisis de los resultados, éstos deben ser interpretados, conduciendo
a tomar decisiones de manera correcta. En esta etapa se realizará el proceso de
inferencia o inducción estadística.
Es necesario aclarar que para poder aplicar las etapas del método estadístico
es indispensable haber “planteado correctamente el problema”, es decir, saber
perfectamente cuál es el objetivo de nuestra investigación. Esto es muy importante
porque, si no se tiene claro el objetivo, no se podrá diseñar adecuadamente el
trabajo y se corre el riesgo de buscar incorrectamente la información, y si se parte
de una incorrecta toma de datos no se podrá arribar a conclusiones válidas. No
hay que perder de vista que el fin último de la aplicación de la estadística es la
“toma de decisiones”.
Vamos a presentar ahora algunos conceptos que son básicos para manejarnos
con la estadística.
5. Población y Muestra
5.1. Población
5.2. Muestra
Es una parte, una porción, un subconjunto
de la población. En general, trabajaremos
preferentemente con una muestra antes y
no con toda la población objeto de
estudio, ya que reduciremos costos y
tiempos. En ocasiones se hace imposible
trabajar con la población.
La muestra es una parte de la población
o universo y, esa muestra será utilizada
para sacar conclusiones acerca de
toda la población bajo estudio, es muy
importante que la muestra con la cual se
trabaje sea representativa.
¿Qué significa una muestra representativa? Una muestra es representativa
cuando posee las características de la población que se estudia. Retomando el
ejemplo de población planteado más arriba, una muestra representativa debería
incluir a estudiantes de ambos sexos y de las distintas provincias del país. No
sería una muestra representativa si se seleccionaran por ejemplo solo alumnos
inscriptos en la carrera de sexo masculino o bien solo personas residentes en
algunas ciudades y no en todas; si bien serían una muestra de alumnos de la
carrera, la misma no reuniría la característica de ser representativa de todos los
alumnos inscriptos para cursar la Licenciatura en Educación Física, modalidad a
distancia de la Universidad Blas Pascal en el año 2016.
La estadística proporciona diversos métodos para seleccionar una muestra, se
denominan métodos de muestreo.
7. Unidad de Relevamiento
La unidad de relevamiento es hacia dónde nos dirigimos para obtener la
información que deseamos. Es quién o qué nos da la información o el dato.
La unidad de relevamiento puede coincidir a veces con la unidad estadística.
Por ejemplo, en el caso que planteamos recién, si se desea conocer la edad de
los alumnos, la unidad estadística y la de relevamiento coinciden, pues es cada
uno de los alumnos; en tanto que si lo que se quiere conocer es con qué nota
promedio pasaron de grado, la unidad estadística es cada uno de los alumnos
y la unidad de relevamiento serán los registros de la escuela donde se dejan
asentadas las notas de los alumnos.
8. Variables
Una variable es cualquier característica que se desea analizar, variando de una
unidad estadística a otra. Los datos estadísticos son un conjunto de resultados
que se presentan para cada variable en estudio, los cuales podrán ser analizados,
relacionados, interpretados.
8.1. Clasificación según la naturaleza
Por ejemplo:
• Cantidad de materias aprobadas en el primer cuatrimestre de una carrera
terciaria.
• Número de goles realizados en el campeonato por de un equipo de fútbol.
Por ejemplo:
• Edad de los alumnos de la Licenciatura en Educación Física de la UBP.
• Temperatura durante la primera semana de invierno del año pasado.
• Kilómetros recorridos por un maratonista.
• Distancia en metros entre dos autos estacionados en una misma cuadra.
• Cantidad de lluvia caída durante un temporal en el mes anterior.
• Salario de los profesores de educación física en la ciudad de Córdoba.
• Prima anual cobrada por los jugadores de primera división de fútbol.
Cabe señalar que hay datos cuantitativos cuya naturaleza es continua, pero
que por razones de practicidad son presentados con valores enteros, como si
fueran discretos. Tal es el caso de la variable edad expresada en años; cuando
se nos pregunta la edad sólo decimos la cantidad de años cumplidos, cuando
en realidad la variable tiempo es continua y se debería decir, tengo tantos años,
tantos meses, tantos días, etc. Entonces si bien, se pueden expresar los valores
de una variable cuantitativa continua a través de valores enteros, esto no cambia
la naturaleza continua de la variable, es por ello que al momento de clasificar una
variable se debe atender a la naturaleza de la misma.
Material básico
• TRIOLA, Mario F. Estadística. México, Pearson, 10ma. ed., 2009.
Material complementario
• LEVINE, David, M. et al. Estadística para administración, México, Pearson
Educación, 4ta ed., 2006.
m1 actividades
m1 | actividad 1
m1 |actividad 1 | AA
asistente académico
m1 |actividad 1 | CC
clave de corrección
Clasificación
Variable Según la Escala
Según la Naturaleza
de medición
Edad Cuantitativa Continua De razón
Sexo Cualitativa Nominal
Año de comienzo de cursado Cuantitativa discreta De Intervalo
Lugar de procedencia Cualitativa Nominal
Orientación de la carrera Cualitativa Nominal
Turno de clase al que asiste Cualitativa Ordinal
Cantidad de dinero gastado en
Cuantitativa Continua De razón
transporte
Tenencia de computadora Cualitativa Nominal
Tiempo (en horas) semanal de
Cuantitativa Continua De razón
uso de la computadora
Uso del gabinete de
Cualitativa Nominal
computación de la facultad
Tenencia de automóvil Cualitativa Nominal
Cantidad de libros comprados
Cuantitativa discreta De razón
en el último año
Suscripción a revistas
Cualitativa Nominal
especializadas.
Cada uno por su lado estaba buscando hacer algo, pero la posibilidad de
emprender juntos y de complementar sus profesiones y actividades ¡los anima
más!!
Apellido y nombre.
Tipo y número de documento.
Ocupación.
Lugar de Residencia.
Estado Civil.
Nivel máximo de estudios alcanzado.
Ingresos netos mensuales.
Monto del préstamo solicitado.
Cantidad de cuotas solicitadas.
Destino del préstamo.
De regreso a su casa se queda pensando en cuáles pueden ser los otros datos
que le solicitarán en los bancos y piensa, además, en cómo acreditar su solvencia.
Al día siguiente recuerda que su tío Juan Carlos hace unos meses tuvo que
recurrir a un préstamo de dinero para poder comprar la nueva maquinaria
agrícola que necesitaba para su actividad. No duda y le manda, de inmediato, un
mensaje por WhatsApp.
¡Manos a la obra con las averiguaciones, y éxito con la obtención del crédito!
C 1
m1 |actividad 2 | AA
asistente académico
m1 |actividad 2 | CC
clave de corrección
m1 |actividad 3 | AA
asistente académico
Ante la situación planteada usted deberá trabajar junto a sus amigos. Obviamente
que cuenta con las herramientas estadísticas para hacerlo. Todo lo visto en este
módulo le resultará de utilidad.
m1 glosario
Dato estadístico: todo dato de cualquier naturaleza que puede ser comparado,
interpretado y analizado.
Datos cualitativos: datos que se corresponden con las variables cualitativas.
Datos cuantitativos: datos que se corresponden con las variables cuantitativas.
Los datos cuantitativos siempre son numéricos.
Estadística: el arte y ciencia de reunir, analizar, presentar e interpretar datos
para la toma de decisiones.
Estadística descriptiva: rama de la Estadística que describe conjuntos de datos
provenientes de poblaciones o muestras.
Fuente: métodos a los que se recurre para la obtención de la información.
Inferencia: proceso estadístico de extraer conclusiones respecto de la población
a partir de los datos de una muestra representativa.
Muestra: subconjunto, parte de la población objeto de estudio.
Población: el conjunto de todos los elementos de interés en determinado
estudio.
Unidad estadística: cada elemento que individualmente constituye la población.
A cada unidad estadística se refiere el dato o característica analizada. La unidad
estadística también se la suele llamar unidad de observación, unidad elemental
o unidad de análisis.
Unidad de relevamiento: qué o quién nos proporciona el dato. A veces la unidad
de relevamiento puede coincidir con la unidad estadística.
Variable: toda característica de interés de los elementos en estudio.
Variable cualitativa: variable que asume categorías.
Variable cuantitativa: variable que asume valores cuantitativos o numéricos.
m2 microobjetivos
m2 contenidos
3. Tablas estadísticas
Esta es una de las formas más utilizadas para la presentación de datos.
Las tablas constituyen arreglos de los datos.
En general las tablas se pueden clasificar , según la finalidad de las mismas en:
Tablas de uso general: aquellas que son consultadas por varios usuarios,
tales como las publicadas por las distintas instituciones u organismos (por
ejemplo: las tablas de índices de precios que publica el INDEC; tablas con
la talla y el peso de varones y mujeres que son usadas en medicina o en
deporte, etc.).
Tablas de uso específico: aquellas que se confeccionan al realizar un trabajo
en particular, una investigación en determinado campo de estudio. Son
tablas de referencia de lo realizado en el estudio o investigación y sólo son
útiles para el mismo.
(a) Principales: son las que nunca pueden faltar, ellas son:
• Título: es una descripción del contenido de la tabla por lo tanto debe ser
claro y preciso e indicar correctamente la información que contiene la tabla.
Cuando es necesario presentar más de una tabla, es conveniente que las
tablas se enumeren, ya que es más fácil referirse a la tabla número... que al
título completo de la tabla.
• Encabezamientos o encabezados: son los títulos de las columnas que
presenta la tabla. Las tablas simples suelen tener pocas columnas, en tanto
que otras más complejas pueden tener encabezados principales y sub-
encabezados.
• Conceptos: son los títulos o descripciones de las filas que presenta la tabla.
Los conceptos son indicados del lado izquierdo de la tabla. Cada concepto
puede ser dividido en subconceptos, de ser necesario.
• Cuerpo: son los datos que contiene la tabla. Los datos están distribuidos en
la tabla según los conceptos y los encabezados.
Título
Título Valores promedios del perfil lipídico pre-tratamiento en ambos grupos Notas al
(en mg/dl) encabezamiento
Perfil lipídico
Grupo CT HDL LDL TG Encabezados
Notas al
pie Nota: (*) en el promedio no se consideró a una persona con valores extremos de los componentes.
1. El ejemplo corresponde a un grupo de personas, adultos mayores con problemas de sobrepeso y en su perfil lipídico. El
grupo se dividió a su vez en dos sub-grupos, uno cuyo tratamiento sería solo un plan alimentario y el otro recibiría, un plan de
actividad física específico además del plan alimentario. A ambos grupos se les realizó análisis clínicos de laboratorio pre y pos
tratamiento.
X1: 1 materia
X2: 5 materias
X3: 2 materias
X4: 4 materias
X5: 10 materias
Como usted podrá apreciar, la serie simple es útil para presentar datos, en la
medida que la cantidad de datos sea poca, en general podríamos decir que una
cantidad que no supere los diez datos para una determinada variable.
Al hablar de frecuencias hay que aclarar que se pueden distinguir distintos tipos
de frecuencias; veamos cuáles son:
- Frecuencia Absoluta Simple: es la cantidad de veces que se repite cada
valor diferente de la variable.
A esta frecuencia se la simboliza con “fi”.
La suma de todas las frecuencias absolutas simples, es igual al total de
observaciones con las que contamos que será “n” o “N”, según que estemos
trabajando con una muestra o con una población, respectivamente .
Es importante señalar que una tabla por intervalos puede tener intervalos de
igual o de distinta amplitud; basta con que uno solo de los intervalos sea de
distinta amplitud a la de los demás para considerarla una tabla por intervalos de
amplitudes diferentes.
Cabría aclarar que la ventaja de construir una tabla con intervalos iguales radica
en que se podrán hacer comparaciones uniformes entre las frecuencias de los
intervalos que contiene la tabla.
- Rango o Recorrido de la variable: surge de hacer la diferencia entre
el máximo valor y el mínimo valor que asume la variable. Al rango se lo
simboliza con “R”.
- Límites o fronteras de cada intervalo: con esto hacemos referencia a qué
valores incluirá cada intervalo. No existe una única forma de definir los límites
de los intervalos, siendo las más empleadas, las siguientes:
2. Este criterio es el que se adoptará en este curso para la construcción de tablas de frecuencias por intervalos, para
variables cuantitativas continuas.
Sexo
Conducta Masculino Femenino
Dietante Cant. Porc. Cant. Porc.
6. Gráficos estadísticos
Constituyen una expresión visual de la información. Los gráficos son fácilmente
captados y entendidos por los usuarios. Los dibujos suelen ser más efectivos
para presentar grandes conjuntos de datos.
Los diagramas más sencillos en cuanto a su construcción están diseñados para
variables medidas en escala nominal u ordinal, ya que las clases son obvias y
resulta más fácil presentarlas en un gráfico.
A menudo oímos la expresión “una imagen vale más que mil palabras”, teniendo
esta expresión total cabida en lo que a gráficos estadísticos respecta. Pero hay
que tener en cuenta que un gráfico ofrece al lector sólo una idea aproximada
de la información; es por ello que debemos ser conscientes de que los valores
exactos se encuentran en las cantidades tabuladas y en la base de datos, fuente
original de toda gráfica.
Por lo general, cuando se presentan los resultados de una investigación o
determinado estudio, se suelen utilizar tablas y gráficos en forma conjunta, lo
que además es aconsejable.
* Gráfico de Torta
Variables * Gráfico de Barras Simples:
Cualitativas - Verticales
- Horizontales
* Gráfico de Barras Múltiples
* Gráfico de Barra/s Porcentual/es
Variables
Cuantitativas
Frecuencias Gráfico de
simples Bastones
Discretas Frecuencias Gráfico
Acumuladas Escalonado
Frecuencias Histograma o
simples
Polígono de frecuencias
Continuas
Frecuencias
Acumuladas Ojiva
7. Comentarios finales
Finalmente, sería oportuno
hacer un comentario respecto al
uso de la computadora. Es
innegable la ayuda que puede
significar el empleo de un
paquete de computación
adecuado para el análisis de
datos. La computadora es, por
lo tanto, una herramienta
sumamente útil que permite
almacenar una gran cantidad de
datos, organizar y procesar la
información de manera rápida y
fácil y, además, nos proporciona resultados, tablas y gráficos. Pero es importante
tener presente que la computadora es siempre una ayuda, una herramienta y de
ninguna manera suplirá, por sí sola, la falta de conocimientos estadísticos y la
aplicación de una metodología estadística apropiada.
Es por ello que, es muy importante que usted conozca acerca de las distintas
tablas y gráficos estadísticos, ya que, como se ha podido apreciar en este
módulo, no todos los gráficos ni todas las tablas son apropiadas para todo tipo
de dato y para ello se hace necesario contar con los conocimientos estadísticos
acerca de la pertinencia, construcción, requisitos, etc. de los mismos.
m2 |contenidos | IC
información complementaria 1
TABLAS ESTADÍSTICAS
PROF. CARLA CARRIZO STAUFFER
UBP
EDUBP | EDUCACIÓN FÍSICA | Estadística I - pag.40
TABLAS ESTADÍSTICAS
Aclararemos y aplicaremos los conceptos vistos en el módulo 2 sobre tablas, con el desarrollo de ejemplos.
Distribución de frecuencias
Tablas para variables cuantitativas
Los siguientes datos representan la cantidad de consultas que realizaron en la materia Estadística I durante
el 1er. cuatrimestre del corriente año, 20 alumnos de la Licenciatura en Educación Física de la UBP.
A partir de estos datos, que se han presentado a modo de serie simple, se construyó la distribución de
frecuencias siguiente.
Valores de la Frecuencia Frecuencia Frecuencia Frecuencia
variable Absoluta Relativa Absoluta Relativa
xi Simple Simple Acumulada Acumulada
fi hi Fi Hi
5 1 0.05 1 0.05
6 2 0.10 3 0.15
7 2 0.10 5 0.25
9 5 0.25 10 0.50
10 4 0.20 14 0.70
11 6 0.30 20 1
20 1
Vamos a construir una tabla de distribución de frecuencias por intervalos mediante la utilización de un
ejemplo en el que iremos viendo los pasos a seguir. Es de señalar que esta guía de pasos es para construir
tablas con intervalos de igual amplitud.
Leyendo un artículo en internet acerca de las distancias que recorren los argentinos, durante las
vacaciones, a usted le interesó saber cuántos kilómetros recorren algunos conocidos, familiares y alumnos
en las vacaciones de verano y en este momento cuenta con los siguientes datos que ordenó de menor a
mayor.
250 550 1000 2000 2650
250 600 1000 2000 2800
270 600 1200 2200 2800
300 700 1300 2200 3000
300 750 1500 2300 3000
310 750 1500 2300 3100
350 800 1600 2500 3200
400 1000 1600 2500 3300
500 1000 1750 2500 3300
500 1000 1750 2650 3600
1) Debemos decidir con la cantidad de intervalos que vamos a trabajar. En este caso construiremos una
tabla con 7 intervalos de igual amplitud.
2) Se deberá obtener la amplitud apropiada de los intervalos; para ello vamos a dividir el recorrido de la
variable en la cantidad de intervalos, en nuestro ejemplo será:
R = V. máx. - V. mín.
R = 3600 - 250 = 3350
c = 3350/ 7 = 478,57 este valor sería la amplitud exacta de cada intervalo; pero como vemos es una
cantidad que no resulta práctica de manejar, lo que se hace es llevar ese valor de la amplitud a un
valor entero más grande.2
En nuestro caso escogemos como amplitud para los intervalos un valor de 500, que resulta ser una
cantidad redonda fácil de emplear en la construcción de los intervalos. Por lo tanto la nueva amplitud
definida será:
c’= 500
3) Con esta nueva amplitud debemos redefinir el recorrido de la variable, que pasará a ser:
Esa diferencia la podemos distribuir indistintamente por partes iguales o desiguales entre el
extremo inferior del primer intervalo y el extremo superior del último intervalo. Como en este
caso adoptaremos el criterio de intervalos cerrados por la izquierda y abiertos por la derecha,
que como se dijo es el criterio más apropiado para las variables cuantitativas continuas, toda
la diferencia se la agregaremos al extremo superior del último intervalo; es decir entonces que
el valor máximo ahora pasará a ser 3750 en lugar de 3600.
La tabla resultante de la aplicación del procedimiento precedentemente indicado será:
1
Tener presente que la variable es de naturaleza continua, más allá que los valores que presenta la variable en este ejemplo están
expresados en cantidades enteras. En estos casos se suele hablar de una variable cuantitativa continua, discretizada.
2
Además de ser una cantidad poco práctica, la amplitud original. Es indispensable ampliar la misma para cumplir con el criterio de
construir una tabla con intervalos cerrados por izquierda y abiertos por la derecha. Si esto no se hiciera, el valor máximo de la
variable quedaría fuera del último intervalo.
Prof. Carla Carrizo Stauffer 2
- 𝑓𝑓2 = 9 significa que 9 de las 50 personas recorren desde 750 km. hasta 1250 km.
- ℎ5 = 0,14 significa que el 14% de las personas recorren desde 2250 km. y hasta 2750 km. en las
vacaciones.
- 𝐹𝐹4 = 34 significa que 34 de las 50 personas consultadas recorren desde 250 km. y hasta 2250 km.
ó bien, que 34 personas recorren hasta 2250 km. en las vacaciones.
- 𝐻𝐻2 = 0,46 significa que el 46% de las 50 personas recorren hasta 1250 km. en las vacaciones.
Como se indicó este tipo de tablas son muy usadas cuando se relacionan dos variables cualitativas,
aunque también pueden presentarse para una variable cualitativa y otra cuantitativa presentada por
ejemplo en intervalos.
Veamos un ejemplo. La información corresponde a un grupo de personas consultadas acerca de su
preferencia sobre los deportes, distribuidas por edad.
Menos de 20 26 47 41 36 150
20 - 30 38 84 80 48 250
30 - 40 72 68 38 22 200
40 - 50 96 48 30 26 200
50 ó más 134 44 18 4 200
Totales 366 291 207 136 1000
A partir de esta tabla cruzada que contiene las frecuencias marginales y de intersección, es posible armar
otras tablas cruzadas con frecuencias relativas (que en general se expresan en porcentajes) calculando
esos porcentajes, por columna, por fila o por el total.
Las tablas siguientes así lo presentan.
Turno
Situación Laboral Mañana Tarde
cant. porc. cant. porc.
No trabaja 75 75% 35 35%
Trabaja 4 o menos horas 20 20% 30 30%
Trabaja más de 4 horas 5 5% 35 35%
Totales 100 100% 100 100%
Esta tabla de doble entrada presenta los porcentajes por columna (según la variable turno de clases),
como se verá los 100% están en las columnas correspondientes a los turnos mañana y tarde.
Así, el 75% significa que el 75% de los estudiantes del turno mañana, no trabajan; en tanto que el 35% de
los estudiantes que cursan a la tarde, trabajan más de 4 horas.
La tabla cruzada que sigue, contiene los porcentajes por fila, es decir se calcularon en función de la variable
situación laboral.
Turno
Situación Laboral Mañana Tarde Totales
No trabaja cant. 75 35 110
porc. 68% 32% 100%
Trabaja 4 o menos horas cant. 20 30 50
porc. 40% 60% 100%
Trabaja más de 4 horas cant. 5 35 40
porc. 13% 87% 100%
En esta tabla, el 68% se debe leer: el 68% de los estudiantes que no trabajan, concurren a la mañana.
El 13% de los alumnos que trabajan más de 4 horas, asisten a la mañana.
Se observa que en estas tablas los 100% se encuentran al final de las filas.
Turno
Situación Laboral Mañana Tarde Totales
No trabaja cant. 75 35 110
porc. 37,5% 17,5% 55,0%
Trabaja 4 o menos horas cant. 20 30 50
porc. 10,0% 15,0% 25,0%
Trabaja más de 4 horas cant. 5 35 40
porc. 2,5% 17,5% 20,0%
Totales cant. 100 100 200
porc. 50,0% 50,0% 100,0%
Así, el 37,5% se lee: el 37,5% de los estudiantes no trabajan y concurren a la mañana. El 17,5% de la
muestra de estudiantes asisten al turno tarde y trabajan más de 4 horas.
Entonces, las tablas con porcentajes por columnas y por filas, permiten hacer una lectura condicionada de
una variable en función de la otra, en tanto que la tabla con los porcentajes sobre el total, permite la lectura
de las intersecciones, sin condicionar ni por una u otra variable.
Le propongo practicar con la interpretación de la información que contienen este tipo de tablas y que piense
en un título apropiado para cada una de ellas.
información complementaria 2
Licenciatura en
Educación Física –
Estadística I
GRÁFICOS ESTADÍSTICOS
PROF. CARLA CARRIZO STAUFFER
Tipos de gráficos
Tal como se presentó en los contenidos del módulo 2, podemos clasificar a los gráficos estadísticos de
acuerdo al tipo de variables que se quiera presentar, completando el cuadro resumen:
Para variables cuantitativas discretas:
Si lo que deseamos graficar son:
(a) Las frecuencias absolutas simples o las frecuencias relativas simples, el gráfico a utilizar es el “gráfico de
Bastones o gráfico de Ordenadas”.
(b) Las frecuencias absolutas acumuladas o las frecuencias relativas acumuladas, el gráfico a utilizar es el
“gráfico Escalonado o en Escalera”.1
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7
número de goles
El gráfico de bastones consiste en levantar sobre cada valor diferente de la variable una línea vertical (el
bastón), perpendicular al eje horizontal cuya altura esta dada por la frecuencia absoluta simple o relativa
simple, según qué información se desee presentar. 2
1 Cabe destacar que este gráfico solo se presenta para que ustedes lo conozcan, pero se aclara que no será exigida su construcción ni en
actividades, ni parciales ni en exámenes finales.
2 Cabe aclarar que, si se utiliza el editor de gráficos del Excel, deberá construir este gráfico desde la opción de barras, teniendo la
precaución de adelgazar lo máximo posible las barras para que parezcan y se asemejen a los bastones y además, se de dejar a
todas de un mismo color.
40
35
30
cant.de equipos
25
20
15
10
0
0 1 2 3 4 5 6 7
número de goles
6
5
4
3
2
1
0
puntaje
9
8
cant.de alumnos
7
6
5
4
3
2
1
0
0 25 35 45 55 65 75 85 95 105
puntaje
La ojiva también se construye a partir de los ejes cartesianos, indicando en el eje horizontal los intervalos;
a la altura del extremo superior de cada intervalo y de la frecuencia absoluta acumulada o relativa
acumulada, según lo que se esté mostrando, se marca un punto; luego se unen los puntos mediante
segmentos de recta y el primer punto marcado se lo une al extremo inferior del primer intervalo. De este
modo queda un gráfico de línea, siempre ascendente, ya que lo que se está mostrando son las frecuencias
acumuladas.
Tener presente que la línea siempre debe arrancar desde el extremo inferior del primer intervalo, sobre el
eje horizontal.
25
20
15
10
0
0 10 20 30 40 50 60 70 80 90 100 110
puntaje
Pelotas de trapo 2
Tablas 6
elemento
Colchonetas 4
Aros 3
Pelotas 4
0 1 2 3 4 5 6 7
Cant.de alumnos
Alto
Bajo 15%
33%
Normal
52%
En este gráfico al presentar las porciones de una torta, se representan los porcentajes (frecuencias
relativas) en lugar de las cantidades absolutas (frecuencias absolutas simples).
Recordar que siempre las porciones de la torta deben sumar 100%
3 Este mismo tipo de gráfica se podría emplear utilizando el porcentaje, es decir la frecuencia relativa simple en lugar de las
cantidades absolutas.
14
12
Cant.de alumnos 10
8
Soltero
6
Casado
4
0
Masculino Femenino
sexo
90%
80% 37%
70%
71%
60%
% de alumnos
50%
40%
30% 63%
20%
29%
10%
0%
soltero casado
Otros gráficos
Pictogramas
Esta gráfica consiste en un número de símbolos (o íconos) de un mismo tamaño, donde cada uno de ellos
representa la misma clase de información con un valor fijo. La cantidad de símbolos dibujados muestra la
magnitud de un pictograma. Se podría decir que un pictograma es un tipo modificado de la gráfica de
barras. Este tipo de diagramas es útil para estimular el interés del usuario o lector ya que esta gráfica es,
en sí misma explicativa y por lo general se presenta de manera agradable e interesante.
Mapas Estadísticos
Muestran la información cuantitativa sobre bases geográficas. Las formas más comunes de mostrar los
datos en un mapa son: símbolos, puntos, colores, barras y números o bien una combinación de ellos. Este
tipo de gráficas permite la comparación por áreas geográficas.
A continuación, se presenta un ejemplo de mapa estadístico, publicado en la página web del diario La Voz del
Interior de la ciudad de Córdoba, el 18 de febrero de 2014.
Este tipo de gráfica es muy común en la sección del tiempo que aparece en la mayoría de los periódicos,
en la que los distintos íconos (nubes, sol, lluvia, etc.) indican el tiempo en cada zona.
1000 880
800 720
600
380
400
200
0
1984 1988 1992 1996 2000
año
Hemos presentado hasta aquí la mayoría de los gráficos más empleados, algunos de ellos muy difundidos en
publicaciones tales como revistas, periódicos, etc. De ninguna manera se ha agotado – ni pretendido hacer la
diversa variedad de gráficas que se pueden realizar en la presentación de la información.
Se ha mostrado, a lo largo de este módulo cómo, a partir de los datos recopilados es posible presentarlos en
tablas y en gráficos, con el propósito de aprovechar al máximo la información que contienen los datos y facilitar,
por lo tanto, el análisis posterior. Ya se dijo que es sumamente importante que tanto las tablas como los gráficos
presenten de manera clara y adecuada los datos según su tipo. Debe, por ende, evitarse cometer errores
comunes, por cierto, que distorsionen la información contenida en los datos que se presentan.
Por todo lo expresado es que se hace necesario agregar algunas acotaciones respecto al uso de estas formas
de presentación de los datos.
Las tablas y los gráficos estadísticos son de tremenda utilidad, y precisamente por ello es que deben usarse con
cuidado, tratando de evitar que el lector o usuario de la información en ellos presentada (y que desconoce, la
mayoría de las veces, acerca de su correcta construcción estadística) llegue a conclusiones equivocadas.
Seguidamente, se presentan algunas de las maneras más comunes de distorsionar la información que se
proporciona en las tablas y gráficos – sobretodo, en éstos últimos y que confunden a los inexpertos lectores:
Es muy frecuente observar en diarios y revistas de gran circulación tablas y gráficos con demasiados
“adornos”. La finalidad de los mismos es tornar la presentación más atractiva, pero la mayoría de las
veces lo que se consigue es distorsionar la información que los datos transmiten. Por eso, tal como lo
llama Berenson y Levine a estos adornos que distorsionan, hay que eliminar la “basura diagramática”.
Generalmente resulta más significativo trabajar con frecuencias relativas que con frecuencias absolutas,
es más, el uso de las distribuciones de frecuencias relativas (con base 1 o base 100), se vuelve
indispensable cuando se quiere comparar una serie de datos con otra u otras que presenten distinta
cantidad de observaciones. Es por esto que una comparación sobre las cantidades absolutas
(frecuencias absolutas simples o acumuladas) no resulta adecuado, sin embargo, más de una vez
vemos este tipo de comparación que nos conducen obviamente a comparaciones y conclusiones
incorrectas.
Cuando los valores representados en una gráfica son elevados y varían poco entre sí, se suele perder
un espacio por debajo de la curva; y en la construcción se omite el cero. De esta manera, se proporciona
una visión que es totalmente contraria a los hechos. La manera de indicar el cero y evitar que la curva
se desplace demasiado hacia arriba es realizar una división en la gráfica trazando una línea entera o
bien trazando una muesca (esta aclaración es válida para cualquiera de los dos ejes). Por lo tanto, el
punto de inicio sobre cualquiera de los ejes debe indicarse con un cero para no distorsionar la impresión
visual respecto de la magnitud de los cambios que se presenten en la gráfica (diagrama), de lo contrario
tales cambios pueden exagerarse o minimizarse. Recordar aquí lo indicado en las partes de un gráfico.
Material básico
• TRIOLA, Mario F. Estadística. México, Pearson, 10ma. ed., 2009.
Material complementario
• LEVINE, David, M. et al. Estadística para administración, México, Pearson
Educación, 4ta ed., 2006.
m2 actividades
m2 | actividad 1
Usted está muy entusiasmado con lo que cada día aprende en la materia
Estadística. Hoy, camino al colegio donde es profesor de educación física, se le
ocurrió que podría poner en práctica lo que conoce sobre variables y presentación
de los datos, trabajando con los datos que usted mismo ha recolectado de sus
alumnos.
De paso hago la transferencia de los conocimientos al campo de la actividad
física, como nos dice la profe…
Como llega más temprano, aprovecha y mientras toma unos mates en la sala de
profesores, busca entre sus papeles, no hace mucho había relevado distintos
datos de sus estudiantes.
¡Aquí están! – se dijo así mismo –
De repente se da cuenta, que no es muy prolijo con sus papeles, pero… los
datos están…
1 2 3 4 4
3 4 3 5 7
1 1 2 2 3
1 7 5 1 7
7 1 2 7 2
Medio de transporte
A pie 70 alumnos
En bicicleta 20 alumnos
En colectivo 140 alumnos
En auto 20 alumnos
A comenzar… A 1
C 1
m2 |actividad 1 | AA
asistente académico
Usted cuenta con distinto tipo de datos y de distinta fuente, primaria en el caso
de los datos recopilados por usted como profesor y de fuente secundaria en el
caso de los datos que relevó la directora de la institución educativa en la que
trabaja.
Se le recomienda que, en primer lugar identifique cada una de las variables en
las tres situaciones y las clasifique correctamente según la naturaleza y según la
escala de medición, esto le permitirá elegir correctamente la manera de presentar
la información a través de tablas y de gráficos.
Recuerde que cada tipo de variable tiene sus tablas y gráficos apropiados.
m2 |actividad 1 | CC
clave de corrección
Caso a)
5
Cantidad de alumnos
0
1 2 3 4 5 6 7
Inasistencias (faltas)
Caso b)
Variable: tiempo para realizar una prueba de nado. Unidad de medida: segundos.
Clasificación: según la naturaleza: cuantitativa continua; según la escala de
medición: de razón.
Recuerde que, para armar una tabla de distribución de frecuencias por intervalos
de igual amplitud, con el criterio cerrado por la izquierda y abierto por la derecha,
debe seguir los pasos siguientes:
Li - Ls xi fi hi Fi Hi
6,5 - 8,0 7,25 9 0,30 9 0,30
8,0 - 9,5 8,75 12 0,40 21 0,70
9,5 - 11,0 10,25 5 0,17 26 0,87
11,0 - 12,5 11,75 3 0,10 29 0,97
12,5 - 14,0 13,25 1 0,03 30 1,00
30 1,00
Si se desean presentar las frecuencias simples (ya sean las absolutas o las
relativas) uno de los gráficos que se puede utilizar es el histograma y para
mostrar las frecuencias acumuladas, la ojiva. Se los presenta a continuación.
12
10
Cant.de nadadores
8
segundos
8%
28%
A pie
56% 8% Bicicleta
Colectivo
Auto particular
50%
40%
% de alumnos
30%
56%
20%
28%
10%
8% 8%
0%
A pie Bicicleta Colectivo Auto particular
medio
https://www.youtube.com/watch?v=u7vSEKH4SF8
https://www.youtube.com/watch?v=xPiIeXciHdE
El primer video presenta los cinco países con más medallas olímpicas y el
segundo, los diez países latinoamericanos con más medallas obtenidas.
Rubén no tarda en darle el OK.
Entonces usted se pone a trabajar, ya estuvo pensando en cómo sería la mejor
manera y correcta, de presentar los datos que se proporcionan en esos videos.
Mañana mismo le enviará a su amigo lo realizado.
¡¡Le deseo mucha suerte!! A 1 C 1
asistente académico
El pedido de ayuda de su amigo le viene como anillo al dedo, ya que usted está
viendo en el módulo 2 de Estadística I el tema de organización y presentación de
los datos. Por lo tanto, le servirá de práctica, pudiendo aplicar los conocimientos
a un caso particular y además del área del deporte, qué más se puede pedir...
En esta actividad se le recomienda que repase todo lo relativo a la presentación
de datos, especialmente a través de tablas estadísticas. Los requisitos de
construcción, las partes que deben tener las tablas, etc.
Para este caso, como para todos, primero se le recomienda que identifique la
variable que va presentar y la clasifique ya que de ello dependerá el tipo de tabla
y de gráfico a utilizar.
m2 |actividad 2 | CC
clave de corrección
1° Cuba 72 67 70 209
2° Brasil 23 30 55 108
3° Argentina 18 24 28 70
4° México 13 21 28 62
5° Colombia 2 6 11 19
6° Chile 2 7 4 13
7° Venezuela 2 2 8 12
8° Uruguay 2 2 6 10
9° Puerto Rico 0 2 6 8
10° Rep.Dominicana 3 2 1 6
Claro que usted está dispuesto a ayudarlo, además cuenta con los conocimientos
sobre el tema.
Las imágenes se las pasa su amigo por WhatsApp y son las siguientes.
m2 |actividad 3 | AA
asistente académico
Se le sugiere que:
- Identifique la o las variables que se presentan en los gráficos.
- En función del tipo de variable que muestran los gráficos analice si es el
gráfico que corresponde o si en realidad correspondía hacer otro gráfico.
- Revise la construcción de la gráfica, revise que se hayan respetado las partes
que debe contener la gráfica.
- Analice, con una mirada crítica-estadística cada gráfica.
- Realice un pequeño informe a su amigo, de seguro le será de gran utilidad.
m2 |actividad 3 | CC
clave de corrección
14
13,36
12
10 8,65
mil mill.€
8
6,08
6
4,49
3,70
4 2,63 4,09
2
Año y lugar
Como conclusión:
o Siempre es preferible una gráfica simple ante una gráfica compleja y con
demasiadas cosas “extras” que no aportan y que, por el contrario, confunden.
o Los gráficos deben ser los adecuados según las variables a presentar y su
lectura debe ser rápida y simple.
o Siempre se debe respetar los requisitos de construcción, manteniendo las
partes de los gráficos.
m3 microobjetivos
m3 contenidos
Medidas descriptivas
Hemos visto, en el módulo anterior, que los métodos gráficos nos permiten
obtener una descripción rápida y general de los datos recolectados. Pero en
ciertas ocasiones necesitamos tener caracterizado un conjunto de manera más
sintética. En este módulo, conocerá y aprenderá a calcular las medidas resumen
o medidas descriptivas para los conjuntos de datos y podrá comprender la
enorme utilidad de las mismas.
1. Parámetros y Estadísticos
Las medidas resumen describen un
conjunto de datos y permiten hacer
comparaciones entre grupos de datos (dos
o más distribuciones).
Tanto cuando trabajamos con variables
para una población o para una muestra,
nos encontramos, la mayoría de las veces
con una cantidad de datos, que se hace
necesario resumir en un solo valor que nos
represente a ese conjunto de datos (poblacionales o muestrales), así esos valores
que surgen de aplicar ciertas fórmulas matemáticas y realizar los cálculos, se
denominan medidas resumen o descriptivas.
2. Medidas de posición
Las medidas de posición o de tendencia son valores que se calculan para un
grupo de datos y que se utilizan para describir la posición o tendencia general
de la masa de datos para una determinada variable.
Generalmente, lo que se pretende es que esas medidas sean representativas
de todos los valores del grupo, permitiéndonos localizar el punto medio o típico
de un conjunto de datos. Por lo tanto, en el sentido estadístico, una medida de
tendencia o de posición, es un “promedio” para un conjunto de valores.
Las medidas de posición, a su vez es posible clasificarlas en:
Población Muestra
Serie simple
∑ 𝒙𝒙𝒊𝒊 ∑ 𝒙𝒙𝒊𝒊
𝑴𝑴(𝒙𝒙) = 𝝁𝝁 = �=
𝑴𝑴(𝒙𝒙) = 𝒙𝒙
𝑵𝑵 𝒏𝒏
Distribución de frecuencias
1.2. Mediana
La mediana es una medida de posición central que aparece en el centro de una
sucesión ordenada de los valores de la variable.
Se puede decir que la mediana es aquel valor de la variable que ocupa el lugar
central cuando la serie se encuentra ordenada.
La mediana es una medida de posición que no se ve afectada por los valores
extremos de la variable, como sucede con la media aritmética.
Para identificar la mediana es necesario siempre ordenar los datos, ya sea en
forma ascendente o descendente.
Si la cantidad de datos es impar, existe un solo valor de la variable que ocupa el
centro; ese es el valor de la mediana.
Si hay una cantidad par de datos, existen dos valores de la variable que ocupan
el centro. En este caso, para obtener la mediana, se deben promediar esos dos
valores centrales.
A la mediana se la simboliza de la siguiente manera: Me(x)
18 20 18 20 22 18 25 22 23 22 19 40 19
Como en este caso tenemos una cantidad impar de datos, existe un único valor
de la variable que ocupa el centro, que es 20 años. En nuestro ejemplo entonces:
𝑀𝑀𝑀𝑀(𝑥𝑥) = 20 𝑎𝑎ñ𝑜𝑜𝑜𝑜
18 18 18 18 19 19 20 20 22 22 22 23 23 25 38 40
Vemos entonces que ahora, tenemos dos observaciones que ocupan el lugar
central. La mediana se la calcula como el promedio entre los dos valores
centrales:
20 + 22
𝑀𝑀𝑀𝑀(𝑥𝑥) = = 21 𝑎𝑎ñ𝑜𝑜𝑜𝑜
2
1.3. Modo
El modo o moda o valor modal es el valor de la variable que se presenta más
veces, es decir aquel valor de la variable que tiene la mayor frecuencia absoluta
simple. Dicho de otra manera: es el valor más frecuente de la variable.
1. Es posible apreciar en esta serie un valor extremo de la variable (la persona que tiene 40 años), respecto al resto de las
edades de los asistentes; en consecuencia, este sería un caso en el que el cálculo de la media aritmética se vería afectado por
dicho valor extremo.
1.4. Cuartiles
Son medidas útiles para obtener una posición “no central”, utilizadas
frecuentemente para resumir o describir un conjunto de datos. Los cuartiles son
valores de la variable que dividen a la serie de datos ordenada, en cuatro partes
iguales, conteniendo cada parte la misma cantidad de observaciones.
Q1 Q2 Q3
25% 75%
50% 50%
75% 25%
2. Medidas de dispersión
Una vez calculadas las medidas de posición para un conjunto de datos
es importante la obtención de una medida que permita conocer el grado de
dispersión o variabilidad que tiene ese conjunto de datos. Esa variabilidad
generalmente se toma respecto de alguna de las medidas de tendencia central.
Seguidamente se presentarán las medidas de dispersión que veremos en este
curso.
2. Existen otras formas de calcular un promedio, tales como la Media armónica o la Media geométrica, las mismas quedan
fuera del alcance de este curso.
1.2. Varianza
La varianza se define como el promedio de los cuadrados de las desviaciones de
la variable con respecto a la media aritmética.
Se entiende por desvío a la distancia entre cada valor de la variable y la media
aritmética. Cuanto mayor sean los desvíos, mayor será la dispersión de los
valores de la variable con respecto a la media, es decir que los valores estarán
menos concentrados alrededor de la media y viceversa.
Conceptualmente la varianza es:
Población Muestra
Serie simple
Distribución de frecuencias
3. “n – 1” corresponde a los grados de libertad, tema que no profundizaremos en este curso, aunque podemos dar como
concepto el siguiente: los grados de libertad se refieren al número de observaciones dentro del grupo de datos que pueden
variar libremente.
- para la población 𝜎𝜎
- para la muestra s
Población Muestra
Serie simple
Distribución de frecuencias
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷ó𝑛𝑛 𝐸𝐸𝐸𝐸𝐸𝐸á𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛
Coeficiente de Variación =
𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴é𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡
4. Medidas de forma
Estas medidas resumen permiten conocer la forma o manera en la cual están
distribuidos los datos.
Cuando hablamos de forma se hace referencia a la deformación ya sea horizontal
y/o vertical que presenta el conjunto de observaciones.
A las medidas de forma se las puede clasificar en dos grandes tipos: Asimetría y
Puntiagudez o Kurtosis.
4.1. Asimetría
La asimetría nos permite mostrar la deformación horizontal de la distribución.
Para describir la asimetría podemos:
Observar la gráfica de la distribución, ya sea el gráfico de bastones o el
histograma (o polígono de frecuencia), según el tipo de variable. La gráfica
nos dará una idea de la forma que presentan los datos.
Otra manera es comparando el valor de la media aritmética y de la mediana.
También podemos calcular el coeficiente de asimetría. El coeficiente es el que
mayor información acerca del sesgo, aporta, ya que el signo del coeficiente
indica el sentido de la asimetría y el valor del mismo e indica que tan fuerte
o débil es el sesgo.
4. Esta fórmula involucra las medidas que usted ya conoce, la media aritmética, la mediana y la desviación estándar.
5. Cabe aclarar que las fórmulas de cálculo de estos coeficientes quedan fuera del alcance de este curso. Solo se interpretarán
los resultados de dichos coeficientes para la analizar la puntiagudez.
Asimetría Gráficamente
𝑪𝒌 > 𝟎 → Leptocúrtica
Ck= 𝟎 → 𝑴𝑴𝒆𝒔𝒔𝒐𝒄ú𝒓𝒕𝒊𝒊𝒄𝒂
𝑪𝒌 < 𝟎 → 𝑷𝒍𝒂𝒕𝒊𝒊𝒄ú𝒓𝒕𝒊𝒊𝒄𝒂
Puntiagudez o Gráfico y
curtosis Coeficiente de curtosis
información complementaria 1
UBP
EDUBP | EDUCACIÓN FÍSICA | Estadística I - pag.80
MEDIDAS RESUMEN O MEDIDAS DESCRIPTIVAS
En los contenidos del módulo 3 se han presentado los distintos tipos de medidas descriptivas, usted
ya sabe que las mismas se agrupan en tres grupos que apuntan a describir determinadas
características de los conjuntos de datos, ya sean éstos que correspondan a una población o a una
muestra.
Seguidamente se irán presentando ejemplos en los que se calcularán las distintas medidas resumen.
A partir de esta tabla para aplicar la fórmula de la media aritmética, debemos calcular todos los
productos entre los valores de la variable y su frecuencia, tercera columna de la tabla siguiente:
xi fi xi . fi
5 1 5
6 2 12
7 2 14
9 5 45
10 4 40
11 6 66
20 182
1
En este caso como se trata de una variable cuantitativa discreta, a la hora de interpretar el resultado es posible decir, en promedio
la muestra de alumnos tiene aprobadas 4 materias. Es importante destacar el resultado exacto es el que resulta de la operación
matemática, y es por ello que la media puede asumir un valor con decimales.
Li - Ls xi fi xi . fi
250 – 750 500 14 7000
750 – 1250 1000 9 9000
1250 – 1750 1500 5 7500
1750 – 2250 2000 6 12000
2250 – 2750 2500 7 17500
2750 – 3250 3000 6 18000
3250 – 3750 3500 3 10500
50 81500
Mediana
Vamos a presentar ahora los pasos a seguir para el cálculo de la mediana, según se trate de una serie
simple o de una distribución de frecuencias.
Serie simple:
𝑛𝑛+1
Donde “n” es la cantidad de observaciones.
2
2 En el caso de trabajar con distribuciones de frecuencias por intervalos, al calcular la media aritmética, xi corresponde a la marca
de clase o punto medio de cada intervalo, que es el valor que representa a cada intervalo.
Es decir, la mediana ocupa el tercer lugar en la serie ordenada y el valor de la variable en esa posición
es 4, siendo entonces la mediana: 4 materias.
Distribuciones de frecuencias:
(𝑥𝑥𝑗𝑗−1 + 𝑥𝑥𝑗𝑗 )
Si Fj-1 = n/2 𝑀𝑀𝑀𝑀(𝑥𝑥) =
2
Donde:
Xi es el valor de la variable al que le corresponde la frecuencia absoluta acumulada Fj
Xj-1 es el valor de la variable al que le corresponde la frecuencia absoluta acumulada Fj-1
𝑛𝑛⁄2− 𝐹𝐹𝑗𝑗−1
Si Fj-1 < n/2 𝑀𝑀𝑀𝑀(𝑥𝑥) = 𝐿𝐿𝐼𝐼 + 𝑐𝑐𝑖𝑖 .
𝑓𝑓𝑗𝑗
Donde:
LI es el extremo inferior del intervalo que contiene a la mediana y posee ese intervalo una
frecuencia absoluta simple fj y una frecuencia absoluta acumulada Fj
cj es la amplitud del intervalo que contiene a la mediana.
Para el caso del cálculo de la mediana para una distribución de frecuencias por intervalos, al intervalo
que contiene a la mediana se lo suele llamar “intervalo mediano”.
Vamos a calcular la mediana aplicando las fórmulas antes presentadas, utilizando los mismos
ejemplos a los cuales ya les calculamos la media aritmética.
Para el caso de una distribución de frecuencias usaremos el ejercicio de la cantidad de consultas que
realizaron 20 alumnos de la Licenciatura en Educación Física, retomamos la tabla construida:
xi fi Fi
5 1 1
6 2 3
7 2 5
9 5 10
10 4 14
11 6 20
20
(𝑥𝑥𝑗𝑗−1 + 𝑥𝑥𝑗𝑗 ) 9 + 10
𝑀𝑀𝑀𝑀(𝑥𝑥) = = = 9,5 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
2 2
Es decir, entonces, que el valor de la mediana es 9,5 consultas, lo que significa que el 50% de los 20
estudiantes de la Lic. en Educación Física que cursaron Estadística I, hicieron hasta 9,5 consultas y el
otro 50% restante realizó más de 9,5 consultas en el cuatrimestre.
Para el caso de una distribución de frecuencias por intervalos, usaremos el ejemplo con el que venimos
trabajando. La tabla confeccionada era:
Li - Ls xi fi Fi
250 – 750 500 14 14
750 – 1250 1000 9 23
1250 – 1750 1500 5 28
1750 – 2250 2000 6 34
2250 – 2750 2500 7 41
2750 – 3250 3000 6 47
3250 – 3750 3500 3 50
50
𝑛𝑛⁄2 − 𝐹𝐹𝑗𝑗−1
𝑀𝑀𝑀𝑀(𝑥𝑥) = 𝐿𝐿𝐼𝐼 + 𝑐𝑐𝑖𝑖 .
𝑓𝑓𝑗𝑗
25 − 23
𝑀𝑀𝑀𝑀(𝑥𝑥) = 1250 + 500.
5
Esto significa que la mediana de las distancias recorridas en las vacaciones es 1.450 km. Es decir que
el 50% de las personas recorren hasta 1.450 km.; en tanto que la mitad restante recorre por encima
de esa cantidad de km. en vacaciones.
xi fi
5 1
6 2
7 2
9 5
10 4
11 6
20
𝑀𝑀𝑀𝑀(𝑥𝑥) = 11 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
Por lo tanto, la cantidad de consultas más frecuente realizadas en el cuatrimestre fue 11.
Li - Ls xi fi
250 – 750 500 14
750 – 1250 1000 9
1250 – 1750 1500 5
1750 – 2250 2000 6
2250 – 2750 2500 7
2750 – 3250 3000 6
3250 – 3750 3500 3
50
En este ejemplo el intervalo que presenta la mayor frecuencia es el primer intervalo, ya que la
frecuencia absoluta simple es la mayor de la tabla de distribución de frecuencias (fi =14).
Entonces se puede decir que el intervalo modal es: [250 km. – 750 km.]
Otra forma podría ser considerar como valor modal la marca de clase de dicho intervalo; en este caso
sería 500 km.
Si nos fijamos en los datos a partir de los cuales se construyó la tabla por intervalos, vemos que la
distancia recorrida que más se repite es 1.000 km., ya que se presenta cinco veces. En este caso, este
es el verdadero valor modal.
Es importante dejar aclarado que siempre que poseamos los datos originales es en ellos en los que
nos tenemos que fijar para determinar el valor modal. Si en cambio, no poseemos la información de
los datos con los cuales se armó una tabla y sólo contamos con dicha tabla, entonces determinaremos
el intervalo modal, sabiendo que es simplemente una aproximación al verdadero valor del modo.
Cuartiles
Vamos a calcular los cuartiles para el ejemplo de la cantidad de consultas en el cuatrimestre realizadas
por 20 alumnos de la licenciatura.
Primero se debe ordenar la serie.
5 6 6 7 7 9 9 9 9 9 10 10 10 10 11 11 11 11 11 11
Determinamos la posición que ocupa cada cuartil en la serie ordena y luego identificamos el valor de
la variable que ocupa cada lugar.
𝑛𝑛+1 20+1
= = 5,25 𝑄𝑄1 = 7 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
4 4
𝑛𝑛+1 20+1
2( ) = 2( ) = 10,5 𝑄𝑄2 = 9,5 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
4 4
𝑛𝑛+1 20+1
3( ) = 3( ) = 15,75 𝑄𝑄3 = 11 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
4 4
A continuación, se presentan reglas prácticas para obtener los valores de los cuartiles3:
La varianza y la desviación estándar para la variable cantidad de consultas realizadas por un grupo de
alumnos de la licenciatura, durante el primer cuatrimestre, son:
∑(xi − x̅)2 . fi
V(x) = s 2 =
n−1
69,80
𝑠𝑠 2 = 𝑉𝑉(𝑥𝑥) = = 3,67 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 2
19
69,80
𝑠𝑠 = 𝐷𝐷𝐷𝐷(𝑥𝑥) = √ = 1,92 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
19
Es decir que la cantidad promedio de consultas en que se desvían los 20 alumnos respecto de la
media es de 1,92 consultas.
3 No será objeto de este curso ver las fórmulas matemáticas a aplicar cuando se trata de obtener el valor de los cuartiles a partir
de distribuciones de frecuencias por intervalos.
xi fi ̅)𝟐𝟐 . 𝒇𝒇𝒊𝒊
(𝒙𝒙𝒊𝒊 − 𝒙𝒙
5 1 16,81
6 2 19,22
7 2 8,82
9 5 0,05
10 4 3,24
11 6 21,66
20 69,80
La varianza y la desviación estándar para la variable distancia recorrida en las vacaciones por el grupo
de 50 personas son:
49405000
𝑠𝑠 2 = 𝑉𝑉(𝑥𝑥) = = 1.008.265,31 𝑘𝑘𝑘𝑘.2
49
49405000
𝑠𝑠 = 𝐷𝐷𝐷𝐷(𝑥𝑥) = √ = 1.004,12 𝑘𝑘𝑚𝑚.
49
Es decir, que la distancia en que se desvían, en promedio es de 1.004,12 km. respecto de la media de
1.630 km.
Al igual que en ejemplo anterior para el cálculo de ambas medidas de dispersión fue necesario
adicionar los cálculos de los desvíos al cuadrado (última columna de la siguiente tabla).
Li - Ls xi fi ̅)𝟐𝟐 . 𝒇𝒇𝒊𝒊
(𝒙𝒙𝒊𝒊 − 𝒙𝒙
Coeficiente de variación
Variable
Cantidad de consultas en el cuatrimestre Distancia recorrida en las vacaciones
Es común expresar al coeficiente de variación en porcentaje; por lo tanto, en el ejemplo, los C.V. serían,
en porcentaje: 21% y 62% respectivamente.
De la comparación de los coeficientes de variación de las dos distribuciones se puede concluir que la
distribución de las consultas realizadas por el grupo de alumnos de la licenciatura, es más homogéneo
que, la distribución de las distancias recorridas por el grupo de personas. Por lo tanto, en el primer
conjunto de valores la media es más representativa que en el segundo.
Para el caso de las consultas a la materia por parte de los alumnos de la Licenciatura:
Finalmente …
Vale la pena retomar lo indicado en el módulo anterior respecto al uso correcto e incorrecto de las
tablas y gráficos estadísticos, puesto que ellos son la primera aproximación a la descripción de
conjuntos de datos y junto con las medidas resumen vistas en el presente, permiten lograr un análisis
descriptivo acabado de los datos y nos prepara para la interpretación de los mismos. Es por ello que
sería importante tratar de evitar todo tipo de adorno de tablas y gráficos, que sólo lleven a la confusión
y distorsión de la información para el usuario de la misma, aunque puedan hacerlos más atractivos al
público, que en rigor de verdad sería la única finalidad que perseguirían, la cual está lejos de lo que
realmente debe proponerse, desde el punto de vista estadístico.
Es casi imposible que la interpretación se haga sin algún tipo de subjetividad. Es por eso que se debe
tener mucho cuidado con las conclusiones que se sacan a partir de los datos, evitando llegar a
conclusiones y hacer generalizaciones que no se sustenten con un herramental científico (técnicas de
inferencia estadística).
En consecuencia, siendo la interpretación de los datos subjetiva, hay que realizarla de la manera más
justa, clara y neutral.
El uso de la computadora para los cálculos de las medidas resumen es de una ayuda singular, pero
no debemos olvidar que es sólo una herramienta. Es por eso sumamente importante usar la
computadora de una manera consciente y con la metodología estadística correcta. En consecuencia,
para usar un paquete estadístico no sólo se debe estar familiarizado con el software particular en
cuanto a su uso, sino también es fundamental poseer los conocimientos estadísticos adecuados para
saber qué calcular, cómo y a qué tipo de datos les hacemos el cálculo de las distintas medidas; ya que
el paquete estadístico por sí mismo no va a suplir la falta de conocimientos al respecto.
Otro aspecto sumamente relevante es la ética en lo que hace al análisis e interpretación de los datos.
Diariamente consumimos información y sería importante que nos cuestionemos acerca de lo que
leemos respecto a estudios de investigaciones, periódicos y revistas y lo que oímos en los distintos
medios de comunicación. Hoy vuelve a tomar auge la frase sarcástica de Benjamin Disraeli, estadista
británico del siglo XIX: “Existen tres tipos de mentiras: las mentiras, las mentiras tremendas y las
estadísticas”. Las cuestiones éticas son insoslayables al momento de decidir qué resultados presentar
y cuáles no en un informe o estudio en particular. Es por ello que los resultados se deben presentar de
una manera objetiva, neutral e imparcial y en esto juegan un papel importante los conocimientos que
se posean de estadística.
información complementaria 2
m3 material
Material básico
• TRIOLA, Mario F. Estadística. México, Pearson, 10ma. ed., 2009.
Material complementario
• LEVINE, David, M. et al. Estadística para administración, México, Pearson
Educación, 4ta ed., 2006.
• ELORZA PÉREZ – TEJADA, Haroldo. Estadística para las ciencias sociales,
del comportamiento y de la salud. México, CENGAGE Learning, 3ra.ed., 2008.
m3 actividades
m3 | actividad 1
¡¡Comience entonces!!
1 2 3 4 4
3 4 3 5 7
1 1 2 2 3
1 7 5 1 7
7 1 2 7 2
Medio de transporte
A pie 70 alumnos
En bicicleta 20 alumnos
En colectivo 140 alumnos
En auto 20 alumnos
A 1
C 1
asistente académico
Recuerde que no todas las medidas resumen se calculan para todo tipo de
variable, de allí la importancia de clasificar correctamente a las variables.
Realice una lectura comprensiva y detallada de todo lo relativo al cálculo de
medidas resumen que se presentó en este módulo.
Interprete los resultados obtenidos.
m3 |actividad 1 | CC
clave de corrección
Caso a)
Al ser una variable cuantitativa es posible calcular todas las medidas descriptivas
o resumen, es decir se pueden calcular las medidas de posición (central y no
central), de dispersión y de forma.
Ahora, para calcular las medidas puede trabajar con los datos de la serie simple
o bien con la tabla de frecuencias, los resultados serán los mismos.
Estadístico Interpretación
De Central Media: 3,4 inasistencias En promedio los 25 alumnos
Tendencia tuvieron 3,4 inasistencias a las
prácticas deportivas de los días
sábados.
Mediana: 3 inasistencias El 50% de los alumnos registró
3 o menos faltas a las prácticas
y la otra mitad más de 3 faltas.
Modo: 1 inasistencia La cantidad de inasistencias
más frecuente en este grupo
fue de 1 falta.
No Central 1er.cuartil: 1,5 inasistencias El 25% de los alumnos
registraron 1,5 inasistencias o
menos a las prácticas de los
sábados.
2do.cuartil: 3 inasistencias Ídem a la mediana.
3er.cuartil: 5 inasistencias El 75% de los alumnos faltaron
a 5 o menos prácticas
deportivas de los sábados.
Nota:
1.- El coeficiente de curtosis, no deberá calcularlo usted, la fórmula de cálculo
del mismo queda fuera del alcance de este curso. Sí, es posible que usted a
partir del resultado del coeficiente, deba interpretarlo.
2.- La varianza y la desviación estándar se calcularon con la fórmula con n-1,
dado que se trata de una muestra.
3.- El cálculo de la mediana lo puede hacer a partir de la serie simple o bien de
la tabla de distribución de frecuencias.
4.- Para los cálculos usted empleará las fórmulas vistas en este módulo o
bien puede hacer los cálculos con una calculadora que tenga las funciones
estadísticas o incluso puede utilizar las funciones del Excel.
xi fi 𝑥𝑥𝑖 − 𝑥𝑥̅ ². 𝑓𝑖
1 6 34,56
2 5 9,80
3 4 0,64
4 3 1,08
5 2 5,12
7 5 64,80
25 116,00
Caso b)
Variable: tiempo para realizar una prueba de nado. Unidad de medida: segundos.
Clasificación: según la naturaleza: cuantitativa continua; según la escala de
medición: de razón.
Dado que ésta es una variable cuantitativa, como el caso anterior, se pueden
calcular todas las medidas descriptivas.
De Rango: 7 seg.
Dispersión Varianza: 3,10 seg2 Varianza: 2,651 seg2
Desviación Estándar: 1,76 seg Desviación Estándar: 1,63 seg
Caso c)
m3 | actividad 2
56 23 23 37 49
54 64 49 65 78
54 64 34 86 65
63 46 56 38 59
89 46 45 21 67
21 67 78 91 34
m3 |actividad 2 | AA
asistente académico 1
m3 |actividad 2 | AA
asistente académico 2
En cuanto al informe que elaborará con su compañera para que ella lo eleve
al encargado de Marketing, se le siguiere que se incluyan en él los resultados
obtenidos del cálculo de las medidas descriptivas.
Recuerde presentar las medidas resumen haciendo una interpretación adecuada
pero sencilla de los valores.
También se le sugiere que incorpore al informe las interpretaciones que, a su
criterio, le parezcan pertinentes a partir de la información presentada tanto en
tablas como en gráficos estadísticos adecuados, para ello revise todo lo relativo
a la presentación visto en el módulo anterior.
clave de corrección
Nota: todas las medidas precedentes fueron calculadas a partir de la serie simple.
Con estos resultados y con los gráficos y tablas estadísticas, podrá elaborar un
informe completo que le permitirá al dueño de la empresa hacer una toma de
decisión con fundamento estadístico.
m3 | actividad 3
Comparando rendimientos…
El fin de semana pasado, como de costumbre, se reunió con sus amigos a jugar
el infaltable partido de fútbol; mientras, las chicas aprovechan para charlar.
Después del partido, como siempre, se quedó un buen rato conversando con
ellos...
De: Santiago
Asunto: La información para que me ayudes...
Pre-entrenamiento Post-entrenamiento
Altura (en cm.) Frecuencia Altura (en cm.) Frecuencia
26.49 1 30.00 1
27.06 1 30.41 1
27.60 1 31.60 1
28.22 1 31.86 1
28.82 4 32.70 1
30.62 1 34.08 1
31.24 1 34.40 1
32.49 2 35.20 1
33.12 2 35.50 2
33.76 1 36.00 1
34.41 2 36.30 1
35.06 1 36.50 1
36.39 1 37.10 1
37.73 1 37.60 2
38.42 1 38.40 1
39.11 1 39.42 1
41.21 1 40.40 1
23 41.90 1
42,60 1
43.50 1
45.60 1
23
Bueno, espero que con esto puedas hacer algo, seguro que sí.
Espero, entonces, que me llames...
Desde ya mil gracias, te debo una...
Un abrazo.
Santiago.
A
C
m3 |actividad 3 | AA
asistente académico
Con la información que le mandó su amigo por correo electrónico, usted podrá
calcular todas las medidas resumen que le permitan describir al grupo de
jugadores, tanto antes como después del entrenamiento intensivo. De esta forma,
podrá hacer las comparaciones que su amigo está buscando y comprobar, de ser
así, el mejor rendimiento en esta variable después del entrenamiento intensivo.
m3 |actividad 3 | CC
clave de corrección
Dado que se trata de una variable cuantitativa continua es posible realizar del
cálculo de todas las medidas tanto de posición, de dispersión y de forma.
Pre- Post-
entrenamiento entrenamiento
Media 32.53 36.70
Mediana 32.49 36.30
Modo 28.82 35.50 y 37.60
1er.Cuartil 28.82 34.08
3er.Cuartil 35.06 39.42
m3 glosario