U1 Estadísticas1-5
U1 Estadísticas1-5
U1 Estadísticas1-5
Estadística Descriptiva
Guía de Conceptos
Unidad I
Estadística I – Unidad I
Contenido:
INTRODUCCIÓN .................................................................................................................... 2
1. ESTADÍSTICA .................................................................................................................... 3
1.1. DEFINICIÓN ................................................................................................................... 3
1.2. CLASIFICACIÓN DE LA ESTADÍSTICA .............................................................................. 3
1.3. ELEMENTOS BÁSICOS DE LA ESTADÍSTICA DESCRIPTIVA ................................................ 3
1.4. VARIABLES ESTADÍSTICAS ............................................................................................ 4
1.5. NIVELES DE MEDICIÓN .................................................................................................. 4
ENTRE LAS ESCALAS DE MEDICIÓN MÁS UTILIZADAS, SE ENCUENTRAN: .......................................... 4
2. ORGANIZACIÓN Y PRESENTACIÓN DE DATOS ................................................................... 6
2.1. TABULACIÓN Y AGRUPAMIENTO DE DATOS ................................................................... 6
2.2. ELEMENTOS DE UNA TABLA DE FRECUENCIA ................................................................. 7
3. REPRESENTACIÓN GRÁFICA DE LOS DATOS .................................................................... 12
3.1. REPRESENTACIÓN GRÁFICA DE DATOS CUALITATIVOS ................................................ 15
REFERENCIAS BIBLIOGRÁFICAS ......................................................................................... 18
Introducción
En esta unidad se proporcionará al alumno una visión de los conceptos básicos de la estadística,
buscando desarrollar en él habilidades y destrezas a través del empleo de métodos y
procedimientos estadísticos.
Se expondrá los tipos de datos que existen, y a continuación cómo se pueden representar a
través de gráficos y tablas de frecuencias.
1. Estadística
1.1. Definición
La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir,
hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea
una causa intrínseca de ellos mismos; así como de realizar inferencias a partir de ellos, con la
finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. (Montiel, 2003)
Los datos o valores que alcanzan las unidades estudiadas, son las respuestas o
resultados que se obtienen cuando las unidades de análisis son interpeladas o
preguntadas. Habrá tantos datos como elementos tiene la población de estudio.
Son cuantitativas cuando toman valores numéricos. Las variables cuantitativas pueden ser
continuas o discretas.
Las continuas generalmente se obtienen por medición y pueden tener cualquier valor entero o
decimal. Por ejemplo, 50 Kg o 49,9 Kg.
Las discretas, se expresan con números enteros y generalmente se obtienen por conteo.
Ejemplos. Número de estudiantes en una sala de clase.
Las variables cualitativas son aquellas que no se expresan mediante números. Por ejemplo,
preferencias deportivas, color de ojos de un niño. (Ávila, 2007)
Ejemplo 1
a) Marca de un jugo
b) Velocidad en Km/h
c) Número de empleados de una empresa
d) Su profesión es Ingeniero Comercial
e) El peso de mi perro en Kg
Solución
a) Cualitativa nominal
b) Cuantitativa continua
c) Cuantitativa discreta
d) Cualitativa nominal
e) Cuantitativa continua
Ejemplo 2
a) Raza
b) Estatura
c) Cargos ocupados en una empresa
d) Horas de asistencia a clases
e) Color de ojos
Solución
a) Nominal
b) Proporcional
c) Ordinal
d) Proporcional
e) Nominal
Ejemplo 3
2. Organización y Presentación de
Datos
2.1. Tabulación y agrupamiento de datos
Realizado el relevamiento de la información sobre el tema de interés, los datos de cada
individuo se anotan en una ficha o planilla según la cantidad de datos requeridos. Una vez
recogidos estos datos se los escribe en una tabla en forma ordenada.
Para determinar en cuántos intervalos se distribuirán los datos recogidos se aplicará la Fórmula
de Sturges, 𝑲 = 𝟏 + 𝟑, 𝟑𝟑 𝐥𝐨𝐠 𝑵, donde K significa el número de intervalos y N es el tamaño
de la muestra. El valor de K debe ser un número entero positivo, que al aplicar la fórmula de
Sturges no se consigue, pero el analista debe estimar dicho valor como se verá más adelante en
el ejercicio de aplicación.
A los efectos de conocer cuántos elementos se incluirán en cada intervalo debe identificarse el
ancho de clase, que se obtiene como el cociente entre el rango y el número de intervalo ya
calculado.
𝑹 = 𝑽𝒎𝒂𝒚𝒐𝒓 − 𝑽𝒎𝒆𝒏𝒐𝒓
𝑹
El ancho o amplitud se obtiene usando la relación: 𝑨 = 𝑲
Si se conocen los intervalos de la ordenación de datos, el ancho se obtiene por diferencia entre
los límites inferiores o superiores consecutivos, o bien contando los elementos de cada
intervalo, incluyendo los valores extremos. Así también, al agrupar los datos en intervalos de
clase en este curso se utilizará cerrado a la derecha y a la izquierda, esto es, con los extremos
incluidos. (Freund, 2010)
Ejemplo 4
Las siguientes son las calificaciones que obtuvieron cincuenta estudiantes en una prueba del
idioma francés:
73 65 82 70 45 50 70 54 32 75
75 67 65 60 75 87 83 40 72 64
58 75 89 70 73 55 61 78 89 93
43 51 59 38 65 71 75 85 65 85
49 97 55 60 76 75 69 35 45 63
Se pide:
a.- Realizar la clasificación ordenada
b.- Determinar las marcas de clase de la distribución
c.- Obtener: Frecuencia acumulada; frecuencia relativa; frecuencia relativa porcentual
d.- ¿Cuál es el valor del 6º intervalo, ¿qué significa?
e.- ¿Cuál intervalo corresponde a la mayor y a la menor frecuencia, ¿qué significa?
f.- ¿Cuál es la marca de la clase correspondiente al 3er intervalo? Interpreta.
g.- ¿Cuál es la frecuencia acumulada hasta la 3ª clase? Interpreta.
h.- Identificar y explicar qué significa la frecuencia relativa (%) de la 2ª clase.
Solución
a.- Obtención de la clasificación ordenada
Se parte de la información dada, donde N = 50
32 35 38 40 43 45 45 49 50 51
54 55 55 58 59 60 60 61 63 64
65 65 65 65 67 69 70 70 70 71
72 73 73 75 75 75 75 75 75 76
78 82 83 85 85 87 89 89 93 97
𝑹 65
3º) Ancho de clase: 𝑨 = 𝑲 = = 9,3
7
Usaremos A = 10 (es mejor colocar por exceso para que se incluyan todas las observaciones
en el intervalo calculado)
32 41 4 36,5
42 51 6 46,5
52 61 8 56,5
62 71 12 66,5
72 81 11 76,5
82 91 7 86,5
92 101 2 96,5
TOTAL 50 ----
Para calcular la marca de clase en una tabla de datos agrupados, lo que se debe hacer es
simplemente sumar el límite inferior con el límite superior de la clase y dividirlo entre 2:
Por ejemplo:
𝐿𝑖 + 𝐿𝑠
𝑥𝑖 =
2
Este valor indica el promedio de calificación en ese intervalo y no se debe sumar la marca
de clase para obtener la media, sino que se la utiliza multiplicando el valor de la frecuencia
absoluta con la marca de clase (𝑥𝑖 . 𝑓𝑖 ) para cada uno de los intervalos y por último se
suman los resultados parciales de la siguiente manera:
Calificaciones
Número de Marcas de clase
Estudiantes (xi)
xi . fi
LI LS (Frecuencia Promedio de las
Absoluta fi) Calificaciones)
32 41 4 36,5 146
42 51 6 46,5 279
52 61 8 56,5 452
62 71 12 66,5 798
72 81 11 76,5 842
82 91 7 86,5 606
92 101 2 96,5 193
TOTAL 50 3315
̅ = 𝟔𝟔, 𝟑
𝒙
Marca de clase
𝑳𝒊 + 𝑳𝒔
𝑥𝑖 =
2
𝟑𝟐 + 𝟒𝟏 73
𝑥1 = = = 36,5
2 2
𝟒𝟐 + 𝟓𝟏 93
𝑥2 = = = 46,5
2 2
𝟓𝟐 + 𝟔𝟏 113
𝑥3 = = = 56,5
2 2
La diferencia entre una marca de clase y otra consecutiva es igual al ancho de clase, en este
ejemplo 10.
Ejemplo de la interpretación de MC
2ª MC = 46,5, esto indica que 6 estudiantes obtuvieron en promedio 46,5 puntos en la
evaluación.
El 7º intervalo = 92 – 101
La MC = 56,5 (3er intervalo), esto indica que 8 estudiantes obtuvieron en promedio 56,5 puntos
en la evaluación.
Fr (%) 2ª clase = 12 %, esto indica que el 12% de los estudiantes obtuvo entre 42 y 51 puntos
en la evaluación, que surge de los 6 estudiantes evaluados.
Para diseñar el histograma se colocan en el eje horizontal los intervalos de clase y en el eje
vertical la frecuencia absoluta. La base de cada rectángulo representa al ancho de la clase.
Diseñamos con ayuda de una planilla Excel o manualmente.
Para diseñar el diagrama de barras no adyacentes se colocan en el eje horizontal los intervalos
de clase y en el eje vertical la frecuencia absoluta. La base de cada rectángulo representa al
ancho de la clase. Los rectángulos van separados una medida constante. Esa es la diferencia
con el histograma, que es de rectángulos adyacentes. Diseñamos con ayuda de una planilla
Excel o manualmente.
El polígono de frecuencias se diseña con las marcas de clase sobre el eje horizontal y la
frecuencia absoluta sobre el eje vertical. El polígono debe quedar cerrado, entonces se inicia y
se termina sobre el eje de abscisas, tal se muestra en el gráfico. Diseñamos con ayuda de una
planilla Excel o manualmente.
Con ayuda de una planilla Excel puede graficarse con cierta facilidad este gráfico. Los valores
en %, corresponden a la frecuencia relativa (%).
La ojiva se diseña colocando sobre el eje de abscisas los valores del límite inferior, o bien del
superior, y sobre el eje vertical los valores de la frecuencia acumulada. También diseñamos
con ayuda de una planilla Excel o manualmente.
Ejercicio 6
La siguiente tabla presenta una muestra de 65 personas sobre sus preferencias de colores para
pintar una sala de juegos para niños. Representa la información mediante un gráfico de barras
y otro circular.
Nº de personas
Colores consultadas
Verde 5
Amarillo 8
Blanco 15
Naranja 30
Rojo 7
Se sugiere realizar el gráfico con ayuda de una planilla Excel a partir de los datos de la tabla.
Referencias Bibliográficas
Ávila, R. (2007). Estadística Elemental. Nueva edición. Lima, Perú: Estudios y
Ediciones RA.
Freund, J. (2010). Estadística para la Administración con enfoque moderno. 6ª Edición.
México: Prentice Hall Hispanoamericana, S.A.
Gráficos estadísticos. https://www.youtube.com/watch?v=rJPyV7V7ssc
Montiel, A. (2003). Elementos básicos de Estadística Económica y Empresarial.
Madrid: Prentice Hall.
Peña, D. (2006). Introducción a la Estadística para las Ciencias Sociales. 3ª Edición.
Madrid: McGraw Hill.