Estadística Descriptiva Con Una Variable Parte 2-Grupo 02

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 18

UNIDAD I: ESTADÍSTICA

DESCRIPTIVA

Estadística descriptiva con una


variable parte 2.
Descripción de variables Cuantitativas
Variables Discretas.
En las tablas de distribución de frecuencias para una variable discreta, la
columna de los datos cualitativos de la tabla de atributos es sustituida,
con los valores numéricos que toma la variable. Una representación
adecuada para este caso es un gráfico de barras y diagrama de tallo de y
hojas.

Ejemplo 4: En un estudio realizado en escolares de un distrito de San


Salvador, se determinó la prevalencia de asma asociado a tráfico
vehicular en el año “X”. Para esto se obtuvo una muestra de 3200 niños
de 6 a 13 años. Uno de los aspectos a determinar fue el número de
hermanos con asma. Los resultados fueron 0, 1, 2, 3, 4. En este caso los
valores diferentes de la variable son 5, a partir de, a partir de ella se
muestra la siguiente tabla con la siguiente información
Descripción de variables Cuantitativas
Tabla 3. Frecuencia de niños escolares con un número de hermanos con asma.
Nº de hermanos con
𝐟𝐢
asma
0 1000
1 1200
2 480
3 320
4 200
Total 3200

a) Defina la variable de estudio.


b) Encuentre las frecuencias relativas y porcentuales.
c) Representa las frecuencias en un gráfico de barras.
d) Represente los porcentajes en un gráfico de barras y de pastel.
Descripción de variables Cuantitativas
Ejemplo 5. Veinticinco clientes de Starbucks® son entrevistados en
una encuesta de mercadeo y se les pregunta, “¿con qué
frecuencia visita usted Starbucks en una semana típica?” La
siguiente tabla es una lista de respuestas para estos 25 clientes:

Tabla 4. Número de visitas de 25 clientes de Starbuks en una semana típica.


6 7 1 5 6 4 6 4 6 8
6 5 6 3 4 5 5 5 7 6
3 5 7 5 5

a) Defina la variable de estudio.


b) Construya una tabla de distribución de frecuencias, que contenga
frecuencias absolutas, relativas, porcentuales.
c) Realice una gráfica de barras y de pastel para representar los
porcentajes.
Descripción de Variables Cuantitativas
Variables continuas:
El caso más frecuente, y también más interesante, es cuando la
variable es continua. En este caso existe un modo de construir una
tabla de distribución de frecuencias.

Método de frecuencias agrupadas:


Se usa sobre todo cuando el número de valores que toma la variable es
elevado. Aquí los datos se distribuyen en clases o llamadas también
categorías y luego se determina el número de datos pertenecientes a
cada clase, que es la frecuencia de clase, 𝒇. Un ordenamiento de esta
naturaleza se conoce como una distribución de frecuencias o tabla de
distribución de frecuencias. Un símbolo que define una clase, tal como
1.0-1.1, se conoce como intervalo de clase. Los números extremos, 1.0
y 1.1, son límites de clase; el límite 1.0 es el límite inferior de la clase
(o sea 𝒍𝒊 ) y el mayor 1.1 es el límite superior (es decir 𝒍𝒔 ). Los términos
clase e intervalo de clase se utilizan a menudo indistintamente. La
técnica del método de frecuencias agrupadas se describe a
continuación, utilizando el siguiente ejemplo
Descripción de variables Cuantitativas
Ejemplo 6. Para determinar el número de cajas de pago que en el futuro es
necesario construir, una cadena de supermercados se desea obtener
información del tiempo (en minutos) necesario para dar servicio a clientes.
Para hallar la distribución de tiempos de tal servicio, se registró una muestra
de 1000 tiempos. 75 de éstos minutos se seleccionaron de manera aleatoria
los cuáles se muestran a continuación para su análisis.

Tabla 5. Minutos necesarios para dar servicio a clientes.


1.3 1.0 1.1 1.2 1.3 1.4 1.6 1.7 1.5 1.8 1.8 1.8 1.0
1.4 1.2 1.4 1.3 1.5 1.1 1.5 1.3 1.4 1.7 1.7 1.2 1.7
1.8 1.8 1.8 1.8 1.8 1.8 1.1 1.5 1.4 1.4 1.5 1.5 1.6
1.8 1.3 1.6 1.6 1.7 1.7 1.6 1.5 1.2 1.5 1.4 1.5 1.7
1.2 1.3 1.5 1.4 1.6 1.5 1.6 1.2 1.3 1.4 1.4 1.5 1.6
1.1 1.2 1.3 1.5 1.6 1.7 1.6 1.7 1.4 1.5

1. Se determina el intervalo total de variación, recorrido, rango o amplitud,


𝑹. Aquí 𝑹 = 𝑳𝒔 − 𝑳𝒊 son el mayor y menor dato observado respectivamente.
Entonces, se tiene que,

𝑅 = 𝐿𝑠 − 𝐿𝑖 = 1.8 − 1.0 = 08
Descripción de variables Cuantitativas
2. Decidir el número de clases, 𝒉, que se va a emplear. No existe
número idóneo, aunque conviene evitar los extremos: un número
pequeño de clases “diluiría” las diferencias y perdería “finura” la
distribución, es decir, no se podrían observar características
importantes de los datos; optar por un número excesivamente grande
de clases, se proporcionan demasiados detalles, se desvirtuaría el
método, ya que con él se pretende una simplificación de cálculos.
Puede aconsejarse un número discreto entre 5 y 20 clases. Una regla
empírica es calcular la raíz cuadrada del número de datos, 𝒏, y ajustarla
para adaptarla (si es necesario) a los límites 5 y 20. Otra forma es
utilizar la fórmula empírica de Sturges:

ℎ = 1 + 3,32 ln 𝑛

Aquí utilizaremos el método de la raíz cuadrada del número de datos.


En este caso 75 ≅ 8.6, que para adaptarla al problema se ajusta a 9.
Descripción de variables Cuantitativas
Si se está imposibilitado para juzgar los efectos del agrupamiento, entonces
bajo condiciones ordinarias (una muestra que no es muy grande y se cuenta
con facilidad de cálculo) debemos considerar la posibilidad de usar los datos
originales no agrupados. En definitiva, el número de intervalos lo dictará cada
circunstancia en particular.

3. Dividir el rango 𝑅 entre ℎ, para obtener la amplitud o ancho de clase, 𝒄 o 𝒊.


Así,
𝑅 0.8
𝑐=𝑖= = = 0.088 ≈ 0.1
ℎ 9
El cual redondeamos a 0.1 por ser más operativo.

4. Es necesario delimitar muy claramente los extremos de cada una de las


clases, a fín de que no haya ninguna duda al asignar cada dato a su clase
correspondiente. Se forman los intervalos agregando el ancho al límite inferior
de cada clase, principiando por el menor de todos los datos. Por ejemplo, la
primera clase es
1.0 − 1.1 o bien 1.0 ≤ 𝑋 ≤ 1.1
Descripción de variables Cuantitativas
La segunda clase es
1.1 − 1.2 o bien 1.1 ≤ 𝑋 ≤ 1.2
De manera similar se encuentran las restantes clases, para obtener
finalmente la tabla siguiente:
Tabla 6. Intervalos de medidas de tiempo, en minutos
Intervalo
1.0-1.1
1.1-1.2
1.2-1.3
1.3-1.4
1.4-1.5
1.5-1.6
1.6-1.7
1.7-1.8
1.8-1.9

5. Encontrar las frecuencias de la clase, 𝒇, contando el número de datos que


caen en cada intervalo y este número anotarlo en la columna
correspondiente a las frecuencias. El total de esta columna debe ser igual a 𝒏
(75), el número de datos. Luego se encuentran las frecuencias relativas y
porcentajes.
Descripción de variables Cuantitativas
6. Una vez establecidas las clases, han de establecerse las marcas de
clase de cada una de ellas. La marca de clase, 𝒙, o 𝑷𝒎 es el punto
medio de la clase y se obtiene sumando los límites inferior y superior
de la clase y dividiendo por 2. Así la marca de clase del intervalo 1.0 −
1.1 es

(1.0 + 1.1)
= 1.05
2

Para análisis matemáticos posteriores, todas las observaciones


pertenecientes a un intervalo de clase dado se suponen coincidentes
con la marca de clase. Luego se calculan las frecuencias acumuladas
ascendentes sumando las cantidades de frecuencia de arriba hacia
abajo, mientras que las frecuencias acumuladas descendentes se
hallan sumando las cantidades de frecuencia de abajo hacia arriba.
Descripción de variables Cuantitativas
Finalmente la tabla de distribución de frecuencias queda de la
siguiente manera:
Tabla 7. Distribución de frecuencias de minutos necesarios para dar servicio a clientes.
Marca de
Interval Porcentaj
𝒇 𝒇𝒓 clase 𝒙 o 𝑭𝒂 𝑭𝒅
o e (%)
𝑷𝒎
1.0-1.1 2 0.0267 2.67% 1.05 2 75
1.1-1.2 4 0.0533 5.33% 1.15 6 73
1.2-1.3 7 0.0933 9.33% 1.25 13 69
1.3-1.4 8 0.1067 10.67% 1.35 21 62
1.4-1.5 11 0.1467 14.67% 1.45 32 54
1.5-1.6 14 0.1867 18.67% 1.55 46 43
1.6-1.7 10 0.1333 13.33% 1.65 56 29
1.7-1.8 9 0.1200 12.00% 1.75 65 19
1.8-1.9 10 0.1333 13.33% 1.85 75 10
Totales 75 1.0000 100.00%

En este caso de variable continua, las representaciones gráficas de


distribuciones de frecuencia, frecuencia relativa o porcentual pueden
obtenerse a través del histograma o polígono de frecuencias, tal como
se ejemplifica a continuación.
Descripción de variables Cuantitativas
En siguiente diagrama las barras representan el histograma y la línea con
puntos el Polígono de frecuencias

Gráfico 1. Histograma y Poligono de distribución de frecuencias


de minutos necesarios para dar servicio a clientes.
16
14
14

12 11
10 10
10 9
8
8 7

6
4
4
2
2

0
1.05 1.15 1.25 1.35 1.45 1.55 1.65 1.75 1.85
Descripción de variables Cuantitativas
Luego se tiene que la representación gráfica de la frecuencia
acumulada recibe el nombre de ojiva.
Las ojivas pueden ser de dos clases: ascendentes y descendentes.
La ojiva ascendente se construye de la siguiente manera:
1. Sobre el eje horizontal se colocan los intervalos.
2. Se colocan sobre el eje vertical las frecuencias acumuladas
ascendentes.
3. El punto (𝑙𝑠 , 𝐹𝑎 ) se forma con el extremo superior del intervalo y la
frecuencia acumulada ascendente respectiva.
4. Se le asigna cero al límite inferior del primer intervalo; con lo cual
graficamos un punto adicional, que es donde principia la ojiva
ascendente.
5. Los puntos graficados se unen a través de segmentos de recta.
El procedimiento para la construcción de la ojiva descendente es
semejante al de la ojiva ascendente; la diferencia consiste en que se
forma el punto (𝑙𝑖 , 𝐹𝑑 ) con el extremo inferior del intervalo y la
frecuencia acumulada descendente y asignando cero al límite superior
del último intervalo, con lo que se tiene un punto adicional, que es
donde finaliza la ojiva descendente.
Descripción de variables Cuantitativas
La representación grafica la ojiva es la siguiente.
Gráfico 2. Ojiva ascendente y descendente de frecuencias de
minutos necesarios para dar servicio a clientes.
80 75 73 75
69
70 65
62
60 54 56

50 46 Frecuencia
43 acumulada
ascendente
40 P
32 Frecuencia
29
30 acumulada
21 19
descendente
20
13
10
10 6
0 2 0
0
1.00 1.10 1.20 1.30 1.40 1.50 1.60 1.70 1.80 1.90

𝑿 ̃=𝟏,𝟓𝟒
Descripción de variables Cuantitativas
𝑃 es el punto de intersección de las ojivas. Al trazar una recta
perpendicular desde 𝑃 hacia el eje horizontal, esta corta a dicho eje en
෨ que se llama mediana. La mediana es el valor que divide a
el valor, 𝑋,
los datos en dos partes iguales. Aquí, 𝑋෨ = 1.54, lo que significa que es
෨ es el valor que deja sobre si y bajo si el 50% de los datos. Si los
𝑋,
intervalos tienen anchos diferentes, los ejes se construyen de la
misma manera.

Si la muestra es extraída de una población grande, es posible


teóricamente (para datos continuos) elegir los intervalos de clase muy
pequeños. Así, el polígono de frecuencias o el de frecuencias relativas
puede estar formado por muchos pequeños segmentos rectos que
aproximan el conjunto a una curva, que suele llamarse curva de
frecuencia o curva de frecuencia relativa, respectivamente.

Tales curvas teóricas provienen de la suavización de los polígonos de


frecuencias de la muestra y la aproximación es tanto más exacta en la
medida como aumenta el tamaño de la muestra. Por esta razón una
curva de frecuencias se llama polígono de frecuencias suavizado.
Descripción de variables Cuantitativas
Las curvas de frecuencias se clasifican de acuerdo a determinadas
características como se muestran a continuación:
Gráfico 3. Simétrica

Gráfico 4. Sesgada a la derecha (sesgo positivo)

Gráfico 5. Sesgada a la izquierda (sesgo negativo)


Descripción de variables Cuantitativas
Las curvas de frecuencias se clasifican de acuerdo a determinadas características
como se muestran a continuación:
Gráfico 3. Curva ajustada a un histograma Gráfico 4. Simétrica

Gráfico 5. Sesgada a la derecha Gráfico 6. Sesgada a la derecha (sesgo positivo)


(sesgo positivo)
Descripción de Variables Cuantitativas
Ejemplo 7. Un estudio reciente de tecnologías domésticas informó el número de
horas de uso semanal de las computadoras personales en una muestra de 60
personas. Se excluyeron del estudio personas que laboraban fuera del hogar y
empleaban la computadora como parte de su trabajo.
Tabla 8. Número de horas de uso semanal de las computadoras personales.

a) Defina la variable de estudio


b) Construya una tabla de distribución de frecuencias agrupadas, que contenga,
frecuencias, frecuencias relativas, porcentajes, marca de clase, frecuencias
acumuladas ascendentes y descendentes.
c) Elabore el histograma
d) Realice el polígono de frecuencias.
e) Obtenga la ojiva ascendente.
f) Efectúe la ojiva descendente.

También podría gustarte