Guía 1 Conceptos Básicos de Estadística - Distribución de Frecuencias
Guía 1 Conceptos Básicos de Estadística - Distribución de Frecuencias
Guía 1 Conceptos Básicos de Estadística - Distribución de Frecuencias
PROGRAMA NIVELATORIO
Asignatura: Razonamiento y Representación Matemática Fecha:
Tema/Actividad: Conceptos Básicos de Estadística Grupo:
Nombre: _______________________________________Código: _______________
Contenidos:
¿Qué es la Estadística?, estadística descriptiva e inferencial. Conceptos básicos: variable, constante, dato, frecuencia, población,
muestra. Representación tabular (Distribución de frecuencias) y gráfica de un conjunto de datos. Medidas de tendencia central:
media, mediana y moda.
Aprendizaje Esperado:
Trabajar algunos conceptos básicos de la estadística: muestra, población, variables. Tablas de distribución de frecuencias.
Ordenar y analizar la información. Analizar tablas y gráficos. Conocer las medidas de Tendencia Central.
ESTADÍSTICA:
“La Estadística es la ciencia que se encarga de recoger, organizar e interpretar los datos. Es la ciencia de los datos. En la vida diaria somos bombardeados
continuamente por datos estadísticos: encuestas electorales, economía, deportes, datos meteorológicos, calidad de los productos, audiencias de TV. Necesitamos
una formación básica en Estadística para evaluar toda esta información. Pero la utilidad de la Estadística va mucho más allá de estos ejemplos. La Estadística es
fundamental para muchas ramas de la ciencia desde la medicina a la economía. Pero, sobre todo, y en lo que a nosotros importa, es esencial para interpretar los
datos que se obtienen de la investigación científica. Es necesario leer e interpretar datos, producirlos, extraer conclusiones, en resumen, saber el significado de los
datos. Es por lo tanto una herramienta de trabajo profesional.”
Gorgas García, J., Cardiel López, N., & Zamorano Calvo, J. (2011)
Es la ciencia de recoger, clasificar, describir y analizar datos numéricos que sirvan para deducir conclusiones y tomar
decisiones de acuerdo a esos análisis.
Ejemplo: Queremos conocer, cuál es el color de tapas de cuadernos más usados por los alumnos del nivelatorio.
Población: Alumnos del Nivelatorio. Muestra: Alumnos del grupo # del Nivelatorio.
Variable estadística: color de los cuadernos. Datos: conjunto de los colores de los cuadernos de la muestra.
NOTA: Siempre es conveniente, ordenar la muestra, en orden alfabética o ascendente (descendente) en caso de ser numérica.
ACTIVIDAD No 1
1. Utilizando como población los estudiantes de mi plantel, identifico 10 características. Digo cuáles son cuantitativas
y cuáles cualitativas. En las variables cuantitativas distingo las discretas y las continuas.
2. Señalo con una (A) las series constituidas por datos cualitativos y con una (V) las que son cuantitativas:
a) Nacionalidad b) Número de tornillos producidos
c) Temperatura d) Filiación política
e) Estado civil f) Gastos en alimentación
g) Profesión h) Llamadas diarias
3. Los directivos de una fábrica estudian un programa de vivienda para sus empleados y solicitan información a un
grupo de 30 de ellos de un total de 350 empleados, sobre el número de habitaciones que requerirá su vivienda, en el
caso de salir favorecido en el programa. Es de aclarar que la investigación se hace únicamente a aquellos que tienen
más de 4 años de antigüedad y en la actualidad no tienen vivienda.
Determina:
a) Población b) muestra
c) Variable d) Tipo de variable
4. En cada uno de los casos señalados, en la siguiente lista, indico cuantitativa o cualitativa.
a) Biología: Peso de un ser vivo
b) Agricultura: Cultivo de legumbres
c) Economía: ventas efectuadas por una empresa
d) Transporte: Transporte en ferrocarril (en Km.)
e) Demografía: número de hijos de una familia
f) Estado civil
La muestra asociada a un estudio debe ser representativa y aleatoria. Representativa, pues debe estar formada por un
número razonable de elementos y aleatoria porque debe ser escogida al azar, de tal manera que quien realiza el estudio
no pueda influir en la elección de los individuos por encuestar.
Cada elemento de la población debe tener la misma oportunidad de ser seleccionado.
Al recoger la información obtenemos un gran número de datos que conviene presentar en forma resumida en una tabla
llamada tabla de distribución de frecuencia.
Como recordarás, la Estadística Descriptiva se encarga de la organización, presentación y descripción de los datos
recolectados, y de obtener información a partir de ellos.
El objetivo de la organización de datos es acomodarlos en forma útil para revelar sus características esenciales y
simplificar ciertos análisis.
Cuando el tamaño de muestra es menor a 30, los datos pueden tratarse individualmente, y en este caso se les llama
Datos no agrupados. Sin embargo, cuando la muestra es grande (n > 30), es laborioso hacerlo de esta forma, por lo que
se lleva a cabo algún tipo de agrupación preliminar para realizar el tratamiento adecuado a los
datos. En este último caso, se les llama Datos Agrupados.
DATOS NO AGRUPADOS
Lo primero que podemos hacer es ordenar los datos, en forma ascendente o descendente. Una vez ordenados los datos
de la muestra se organizan en una tabla de frecuencias.
Una Tabla de Frecuencias, también llamada de Distribución de Frecuencias, está formada por las categorías o valores
de la variable y sus correspondientes frecuencias Utilicemos un ejemplo para identificar cada elemento de una
distribución de Frecuencias.
Utilicemos un ejemplo para identificar cada elemento de una distribución de Frecuencias.
En un grupo de Estadística I del programa nivelatorio, se observó la estatura de 16 alumnos y se obtuvieron los
siguientes datos (en metros):
1.58 1.64 1.79 1.58 1.64 1.53 1.64 1.66
1.53 1.52 1.76 1.57 1.60 1.74 1.66 1.52
Datos ordenados: 1.52 1.52 1.53 1.53 1.57 1.58 1.58 1.6 1.64 1.64 1.64 1.66 1.66 1.74 1.76 1.79
Tamaño de la Muestra (N) = 16
La frecuencia, también llamada frecuencia simple o absoluta, se define como el número de veces que aparece un dato
xi, y se denota por f.
La frecuencia relativa es el número de veces que aparece cada valor de la variable xi, es decir cada dato, dividida entre
el tamaño de la muestra. Se representa con fr, y se tiene que: fr = f/N. La suma de las fr debe ser igual a 1.
La frecuencia acumulada de un valor xi es la suma de las frecuencias absolutas de todos los valores menores o iguales
al valor xi, y se representa por Fa.
La frecuencia acumulada relativa de un valor xi es la suma de las frecuencias relativas de todos los valores menores o
iguales al valor xi, (o dividiendo las frecuencias acumuladas entre el tamaño de muestra), y se representa por Fra.
Podemos agregar una columna que corresponda al porcentaje de la frecuencia de cada dato, que se haya multiplicando
por 100 al cociente indicado de la frecuencia relativa.
Ahora, ya que tenemos la distribución de frecuencias, ¿qué información podemos obtener acerca de las estaturas de los
alumnos?
Interpretemos algunos valores de cada columna:
PRACTICA
El gobierno desea averiguar si el número medio de hijos por familia ha descendido respecto de la década anterior. Para
ello ha encuestado a 50 familias respecto al número de hijos, y ha obtenido los siguientes datos:
00111122222222222222222222233333333333333344444456
Se pide:
a. Construir la tabla de frecuencias absolutas
b. ¿Cuál es el número de familias que tiene como máximo dos hijos?
c. ¿Cuántas familias tienen más de 1 hijo pero como máximo 3?
d. ¿Qué porcentaje de familias tiene más de 3 hijos?
ACTIVIDAD No 2
Construya una tabla de distribución de frecuencias para cada uno de los siguientes ejercicios. Obtenga por lo menos 3
conclusiones.
1. Una agencia de noticias quiere saber cuál es el medio de comunicación por el cual se informan las personas,
sobre las noticias del país. Para ello, realizó un estudio a cuarenta personas a quienes se les preguntó por su
medio de información de noticias preferido. Se obtuvo la siguiente lista de datos.
2. Los siguientes datos son las calificaciones obtenidas en una asignatura por un grupo de 30 alumnos.
7-5 -4 -7 -2 -5 -4 -3 -6 -4 -5 -6 -2 -3 -7 -5 -6 -5 -4 -3 -4 -5 -3 -7 -6 -5 -4 -2 -3 -1
Nº de Nº de f fr fa %
a) ¿Cuántas familias tienen menos de 4 hijos?
hijos familias
b) ¿Cuántas familias tienen 5 hijos? 1 2
c) ¿Cuántas familias tienen 5 hijos o menos? 2 8
d) ¿Cuál es la frecuencia relativa de las familias de 2 hijos? 3 12
4 14
5 3
6 1
4. Los pesos de cada uno de los 11 jugadores de un equipo de fútbol son los siguientes:
70 -79 -70 -69 -70 -73 -73 -78 -79 -70 -68
Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases
y con la frecuencia en cada clase; es decir, los datos originales de varios valores se combinan para formar un
intervalo de clase. No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o
datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior a 30,
entonces, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de
distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva.
La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación
acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en
clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación sea
manejable con mayor facilidad.
Distribución de frecuencias
La Tabla de Distribución de Frecuencia con DATOS AGRUPADOS, es aquella que en la variable los datos se
presentan en intervalos también llamados clases.
Para agrupar los datos en intervalos de clase se deben seguir las siguientes reglas generales:
• Existen diversos criterios para determinar el número de clases o intervalos, ante tanta diversidad de criterios, se ha
considerado que lo más importante es dar un ancho o longitud de clases a todos los intervalos de tal manera que
respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la práctica.
• Cada observación (dato) debe estar incluida en una y solo una clase o intervalo.
• El valor más pequeño y más grande deben entrar en la clasificación.
• No deben existir brechas o vacíos entre clases sucesivas.
• Los intervalos no se deben sobreponer.
• En la medida de lo posible, se debe utilizar la misma amplitud para todos los intervalos. Recuerda que la Regla no es
una Ley, sólo es un guía para el cálculo. Lo importante es que el último intervalo de clase cubra al dato mayor de la
muestra.
Procedimiento para construir una distribución de frecuencias agrupada en intervalos
1. Determinar el máximo y mínimo entre los valores que tenemos en la muestra y calcular el recorrido de la variable o
rango, es decir, R=Xmax-Xmin
2. Determinar el número de clases o intervalos a utilizar. Lo denotamos con la letra (k).
3. Hallar el ancho o amplitud del intervalo de clase (A). Los intervalos de clase tienen por lo general el mismo ancho,
de modo que al fijarse el número de clases se obtiene éste por una operación aritmética simple: A=R/k, donde R es el
rango o recorrido y k es el número de clases. Si este cociente no es un entero, conviene redondear al entero superior.
4. Fijar los límites reales de los intervalos de clase y su respectiva marca de clase. El límite inferior del primer intervalo
debe ser el menor valor de la muestra. Tenga en cuenta que el extremo superior de cada intervalo ha de coincidir con el
extremo inferior del siguiente.
Luego, construir la tabla de frecuencias de acuerdo a los parámetros establecidos en la sección anterior.
Quedando así la tabla de frecuencias para datos agrupados:
RECUERDA
Intervalo abierto (a, b) es el conjunto de todos los números reales mayores que a y menores que b.
(a, b) = {a < x < b}
Intervalo cerrado [a, b] es el conjunto de todos los números reales mayores o iguales que a y menores o iguales que b.
[a, b] = {a ≤ x ≤ b}
Intervalo semiabierto por la izquierda (a, b] es el conjunto de todos los números reales mayores que a y menores o iguales que b.
(a, b] = {a < x ≤ b}
Intervalo semiabierto por la derecha [a, b) es el conjunto de todos los números reales mayores o iguales que a y menores que b.
[a, b) = {a ≤ x < b}
Ejemplo
Construya una tabla de distribución de frecuencias con datos agrupados haciendo uso de 6 intervalos de clase.
Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de sus habitaciones, el gerente
investiga los precios por habitación de 40 hoteles de la misma categoría de esta ciudad. Los datos obtenidos (en miles
de pesos) fueron:
3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1 4.2
4.2 4.3 4.3 4.3 4.3 4.4 4.4 4.5 4.5 4.5
4.5 4.7 4.7 4.7 4.7 4.8 4.9 5.0 5.0 5.1
5.1 5.3 5.3 5.4 5.6 5.8 5.8 6.0 6.1 6.1
Procedimiento:
1. El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8.
2. k = 6 intervalos
3. A = 2.8 / 6 = 0.467 ≈ 0.5 tamaño de los intervalos
4. Así pues los intervalos de clase serían los siguientes:
5. Calcula la marca de clase para cada intervalo y termina la tabla de distribución de frecuencias.
ACTIVIDAD No 3
1. Construya una tabla de distribución de frecuencias con datos agrupados para los siguientes datos correspondientes
a la edad de 55 personas. Use 5 intervalos de clase. Obtenga tres conclusiones.
27 23 41 38 44 29 35 26 18 22 24
25 36 22 52 31 30 22 45 28 18 20
18 28 44 25 29 28 24 36 21 23 32
26 33 25 27 25 34 32 23 54 38 23
31 23 26 48 16 27 27 33 29 29 28
2. Los siguientes datos muestran el número de vuelos internacionales recibidos en el aeropuerto de la ciudad de
México durante los dos meses anteriores, construye una tabla de distribución de frecuencias con datos agrupados.
71 47 66 67 73 38 63 67 29 54 62 70
63 37 68 50 59 60 45 48 52 49 48 56
70 62 61 65 62 45 62 56 63 39 36 43
49 50 39 41 57 49 73 47 38 61 48 31
55 57 72 53 42 70 56 58 39 60 53 36
3. Consideremos los siguientes datos, expresados en metros, correspondientes a las estaturas de estudiantes de 11°.
Construya una tabla de distribución de frecuencia con datos acumulados, usando 6 intervalos. Obtenga tres
conclusiones.
4. Los datos siguientes corresponden a un estudio realizado con 40 personas para conocer la reacción sistémica a la
picadura de abeja. Se toma el tiempo, en minutos, en el que aparecen las primeras reacciones a la picadura.
Construye una tabla de distribución de frecuencias. (Observa que la precisión de estos datos es de décimas)
10.5 11.2 9.9 11.4 12.7 16.5 15.0 10.1 12.7 11.4 11.6 7.9 8.3 10.9 6.2 8.1 3.8 10.5 11.7 12.5 11.2 9.1 8.4 10.4 9.1
13.4 12.3 11.4 8.8 7.4 5.9 8.6 13.6 14.7 11.5 10.9 9.8 12.9 11.5 9.9