Semana 05 AQP
Semana 05 AQP
Semana 05 AQP
LOGRO DE LA SESIÓN
Al finalizar la sesión de clase, el estudiante calcula, analiza e interpreta las medidas de dispersión para datos
agrupados y no agrupados.
Las medidas de dispersión son cantidades que miden el grado en que los datos numéricos tienden a extenderse.
Entre las principales medidas de dispersión que se van a estudiar tenemos:
Rango
Varianza
Desviación estándar
Coeficiente de variación
Se define en un conjunto de n observaciones, como la diferencia entre el valor máximo y el mínimo; esto
permite obtener una idea de la dispersión de los datos.
R = x max − x mi n
donde:
x mi n : valor mínimo. x max : valor máximo.
La varianza es una medida de dispersión con unidades al cuadrado, por ejemplo si la medición se hace en metros
(m) entonces la unidad de la varianza es metros al cuadrado m 2
¡ ¢
La importancia de la varianza es porque proporciona más información que permite juzgar la confiabilidad de la
media, si los datos están muy dispersos, la media es menos representativas que cuando están más agrupadas al
rededor de la media.
Cálculo de la varianza
Propiedades de la varianza
Si todos los valores observados x 1 , x 2 , · · · x n son iguales a b (donde b es una constante), entonces
V ar i anza(X ) = V ar (X ) = V (X ) = s 2 = 0.
Si a cada valor de las observaciones se le suma (o resta) una constante, la varianza del nuevo conjunto
transformado y i = x i ± b será la misma que la varianza de las observaciones iniciales, es decir:
V (Y ) = V (X )
Si a cada valor de las observaciones x 1 , x 2 , · · · , x n se le multiplica por una constante diferente de cero,
la varianza del nuevo conjunto transformado y i = ax i es la varianza del conjunto original multiplica-
do por la constante elevado al cuadrado. V (Y ) = a 2V (X )
La varianza viene expresada en distintas unidades que los datos. Por lo tanto es más interesante la
desviación estándar que la varianza.
Ejemplo 4.1
Cierta universidad realizó un experimento sobre el coeficiente intelectual (C.I.) de sus alumnos, para lo
cual aplicó un examen de C.I. a una muestra de 12 alumnos escogidos al azar, obteniendo los siguientes
resultados: 119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112,106.
b. Calcule la varianza.
d. La persona encargada de registrar los resultados cometió un error, para corregir este error, debe de
incrementarse en un punto a todos los resultado. ¿Cómo afectó este error a la desviación estándar
que se calculó en la parte c? justifique su respuesta.
Las medidas de dispersión que vimos anteriormente, son absolutas y son útiles para describir la dispersión de
un solo conjunto de datos, pero si se quiere comparar más de dos conjuntos de datos tendremos que usar una
medida de dispersión relativa, como el coeficiente de variación
Es una medida de dispersión relativa y se calcula dividiendo la desviación estándar entre la media aritméti-
ca, multiplicado por 100 %.
s
CV = 100 %
x
Ejemplo 4.2
Los siguientes datos corresponden a las aportaciones que hicieron al Sistema Nacional de Pensiones,
algunos docentes universitarios pertenecientes a la Ley 20530, en un determinado mes del presente año.
Los datos están expresados en nuevos soles.
b. En la misma universidad existe otro grupo de docentes que aportan a la AFP, cuyos aportes tienen
una media de 265 soles, con una desviación estándar de 57.01 soles. ¿En cuál de estos dos grupos de
docentes universitarios los aportes son más homogéneos?
Ejercicios adicionales
1. Para estudiar la concentración de dióxido de carbono en el medio ambiente de nuestro país, se tomo una
muestra de ocho ciudades donde se midió el nivel de concentración de este contaminante, los resultados
de estas mediciones se muestran a continuación cuyas unidades están dadas en microgramos por metro
cúbico µg /m 3 : 34.5; 13.1; 20.3; 18.5; 19.6; 29.9; 20.7; 16.5.
¡ ¢
2. La Fence Company vende tres tipos de cerca a propietarios de los suburbios de Seattle, Washington. El pie
de instalación de las cercas grado A tienen un precio de $5.00. El de las cercas grado B, $6.50. Y el de las de
grado C, las de alta calidad, $8.00. Ayer, Fence Company instaló 270 pies de cerca grado A, 300 pies de cerca
grado B y 100 pies de cerca grado C.
3. Un complejo industrial está formado por 2 fábricas. Se tiene los siguientes datos respecto al consumo men-
sual de electricidad en cada una de las dos fábricas.
Fábrica 1: Tiene 9 talleres cuyos consumos en soles son: 88, 92, 106, 110, 93, 102, 91, 94, 80.
Fábrica 2: Los consumos en soles se dan en la siguiente tabla.
Consumo en soles [62-72[ [72,82[ [82,92[ [92,102[
Talleres 2 3 4 3
4. El servicio de ventas de una empresa de telecomunicaciones tiene bastantes empleados, de los cuales se
tomó una muestra de 10 empleados, estos empleados realizaron el siguiente número de ventas la semana
pasada. 52, 43, 30, 38, 30, 42, 12, 46, 39, 37.
5. La gráfica que se presenta a continuación, representa una distribución de la duración (en segundos) de 40
erupciones del géiser Fly.
¿Qué puede afirmar respecto a la desviación estándar del tiempo de duración de las erupciones del géiser
Fly?
41.0 42.5 40.2 39.0 39.5 40.3 42.7 39.6 43.2 46.3 45.0 43.0 40.5 45.6
45.2 42.8 42.3 44.2 46.7 47.9 44.5 40.1 39.4 46.5 38.5 43.5 41.0 40.2
Tarea domiciliaria
1. Se tomaron dos exámenes a estudiantes del primer ciclo en los cursos de matemática y economía, las notas
están sobre 100 puntos. En el curso de matemática la media fue de 72 puntos y una desviación estándar de
9 puntos; en el curso de economía se obtuvo una media de 80 puntos y desviación estándar 6 puntos ¿En
cuál de los cursos hay mayor dispersión? (considere datos muestrales).
2. Los siguientes datos son una muestra de la tasa de producción diaria de botes de fibra de vidrio de la Hy-
drosport Ltd., un fabricante de Miami: 17, 21, 18, 27, 17, 21, 20, 22, 18, 23. El gerente de producción de la
compañía siente que una desviación estándar de más de tres botes por día indica variaciones de tasas de
producción inaceptables.
3. Una muestra de 25 estudiantes universitarios reportó las siguientes cifras en dólares de gastos por concepto
de entretenimiento el año pasado.
684 710 688 711 722 698 723 743 738 722 696 721 685
763 681 731 736 771 693 701 737 717 752 710 697
a) Indique la variable.
b) Encuentre la media de esa información e interprete.
c) ¿Cuál es el rango y la desviación estándar? interprete.
4. El número de artículos producidos por dos máquinas durante los últimos meses ha sido el siguiente:
Máquina 1 Máquina 2
Nº de Artículos Nº meses Nº de Artículos Nº meses
20 3 [10-15[ 4
28 4 [15-20[ 3
35 5 [20-25[ 6
40 5 [25-30[ 4
42 3 [30-35[ 3
5. Los gastos en publicidad constituyen un elemento significativo del costo de los artículos vendidos. En
seguida aparece una distribución de frecuencias que muestra los gastos en publicidad de 50 compañías
manufactureras ubicadas en el sur de Estados Unidos.