Distribucion de Frecuencias para Datos Agrupados

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 3

DISTRIBUCION DE FRECUENCIAS PARA DATOS AGRUPADOS

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las


variables toman un número grande de valores o la variable es continua. Se agrupan los valores
en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna
su frecuencia correspondiente.

Límites de la clase: Cada clase está delimitada por el límite inferior de la clase y el límite
superior de la clase. 
Amplitud de la clase: La amplitud de la clase es la diferencia entre el límite superior e inferior
de la clase.
Marca de clase: La marca de clase es el punto medio de cada intervalo y es el valor que
representa a todo el intervalo para el cálculo de algunos parámetros.
 La marca de clase se representa por 
 

 
 Construcción de una tabla de datos agrupados 

.
1º Se localizan los valores menor y mayor de la distribución. En este caso son   y  .
2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea
divisible por el número de intervalos queramos establecer.
Es conveniente que el número de intervalos oscile entre   y  .
 En este caso,  , incrementamos el número hasta  ,   
intervalos.
 
Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al
intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.
 es la marca de clase que es el punto medio de cada intervalo.
 

Para elaborar tablas de distribuciones de frecuencia se debe tener en cuenta lo siguiente:


Cuando hay muchos datos se agrupan en clases. Esto consiste en agrupar los datos en una
distribución de frecuencias, que puede definirse como una ordenación o arreglo de datos en
clases o categorías que muestran para cada una de ellas, el número de elementos que
contiene, denominada frecuencia.
Clase es cada uno de los grupos en que se dividen los datos. Para determinar cuántas clases
crear, se puede utilizar la siguiente fórmula (fórmula de Sturges)
      Número de clases = 1 + 3,322 log n          donde n es el número total de datos.
 
Si al aplicar la fórmula se obtiene un número decimal, se aproxima al siguiente entero.
 
El intervalo de clase o el ancho de la clase (tamaño de la clase) es el espacio que hay entre el
límite superior y el límite inferior de la clase, los cuales corresponden a los valores extremos de
la clase. Para obtener el ancho de clase se utiliza la siguiente fórmula: Ancho de clase =
(dato superior – dato inferior) / número de clases
 
La frecuencia absoluta es el número de veces que se repite cada dato. Cuando se agrupan los
datos, es el número de datos que tiene cada clase. Se simboliza con fj.
 
La marca de clase es el punto medio de la clase. Se obtiene dividiendo entre dos la suma de
los valores extremos de cada clase.
 
El rango es la diferencia entre el valor mayor y el valor menor en estudio de una distribución de
datos.
 
La frecuencia absoluta acumulada es la frecuencia total hasta el límite superior de cada
clase. Se simboliza con Fi.
 
La frecuencia relativa de un dato da información sobre qué parte de la población o de la
muestra en estudio corresponde a la característica analizada. Se obtiene dividiendo la
frecuencia absoluta entre el número total de datos y se puede expresar como una fracción,
como un decimal o como un porcentaje. Se simboliza con f i / n donde n es el número de datos.
 
La frecuencia acumulada relativa es la frecuencia relativa total hasta el límite superior de
cada clase. Se simboliza con F j / n donde n es el número total de datos.
 
Límites de clase: Los límites de clase son los valores que separan a una clase en particular de
la anterior y de la siguiente.
Las clases de la distribución pueden escribirse en forma de límites indicados o de límites
reales.  Así por ejemplo si se tiene la siguiente tabla referente a la estatura de 50 obreros en
pulgadas:
Clases Frecuencias
50,5 - 53,5 1
53,5 - 56,5 2
56,5 – 59,5 6
59,5 – 62,5 11
62,5 – 65,5 16
65,5 – 68,5 9
68,5 – 71,5 4
71,5 – 74,5 1
   
TOTAL 50
En el ejemplo anterior los límites indicados son 51 – 53, 54 – 56, etc. y los límites reales son:
50,5 – 53,5; 53,5 – 56,5; etc.
 
Es importante saber establecer los límites reales, pues con base en ellos se calcula el punto
medio, magnitud que se usará para cálculos posteriores.
 
No hay ningún problema en establecer límites reales en variables discretas, pues en este caso
los límites dados y los reales coinciden, pero si lo hay cuando se trata de una variable
continua.  Por ejemplo, las observaciones que están entre dos límites indicados, ¿dónde se
clasifican?, ¿cómo interfiere el modo de redondeo de los datos?
 
 Para ilustrar considérese una distribución de frecuencias de personas según edad, en años,
con los siguientes límites indicados: 10 – 14, 15 – 19, 20 – 24, etc. ¿Cuáles son los límites
reales de esta distribución?
 
Límites reales para cada tipo de redondeo
LÍMITES MÉTODO USUAL HACIA ABAJO HACIA ARRIBA
INDICADOS (Cumpleaños    
más cercano) (Edad cumplida) (Próximo cumpleaños)

10 – 14 9,5 – 14,5 10 a menos de 15 más de 9 a 14


15 – 19 14,5 – 19,5 15 a menos de 20 más de 14 a 19
20 – 24 19,5 – 24,5 20 a menos de 25 más de 19 a 24
etc. etc. etc. etc.
  
Ejemplo: Suponga que un investigador desea determinar cómo varía el peso de un grupo de
estudiantes de primer semestre de una universidad. Selecciona una muestra de 50 estudiantes
y registra sus pesos en kilogramos. Los datos obtenidos fueron los siguientes:
65          63           65           63           69           67           53           58           60           61
64          65           64           72           68           66           55           57           60           62
64          65           64           71           68           66           56           59           61           62
63          65           63           70           67           66           57           59           61           62
64          64           63           69           67           66           58           60           61           62

Este diagrama facilita determinar la cantidad de veces que se repite un dato y los valores de los
datos con el fin de escribirlos de manera ordenada en la tabla.
 
 Para construir la tabla de datos no agrupados se debe calcular primero lo siguiente:
 Número de clases
k=1+3,322log(n)=1+3,322log (50) =6,64≈7k=1+3,322log(n)=1+3,322log (50) =6,64≈7

Rango: R=xn−x1=72−53=19 R=xn−x1=72−53=19

Amplitud de clase: I=Rk=197=2,71≈3I=Rk=197=2,71≈3

Punto medio: mi es el valor central de la clase.  Se obtiene calculando el promedio de los


límites reales, sumando al límite real inferior el límite real superior y dividiendo por dos.
 
Frecuencia absoluta.  Se define como el número de elementos u observaciones
pertenecientes a una misma clase.
Frecuencia relativa:  Se obtiene dividiendo la frecuencia absoluta por el número total de
observaciones.  Indica la importancia relativa de la clase.
Frecuencias acumuladas:  Es la suma de las frecuencias absolutas o relativas en sentido
ascendente o descendente según se quieran acumular “hacia arriba” o “hacia abajo”
Al construir la tabla de datos agrupados con la información del ejemplo, se tiene:
Tabla de datos agrupados 
Punto Frecuencia Frecuencia
Frecuencia Frecuencia
medio absoluta relativa
absoluta relativa
    acumulada acumulada
Pesos (Kg) m i f  i F  i fr  i Fr  i
53 - 55 54 2 2 4,00% 4,00%
56 - 58 57 5 7 10,00% 14,00%
59 - 61 60 9 16 18,00% 32,00%
62 - 64 63 15 31 30,00% 62,00%
65 - 67 66 12 43 24,00% 86,00%
68 - 70 69 5 48 10,00% 96,00%
71 - 73 72 2 50 4,00% 100,00%
    50   100,00%  

También podría gustarte