Estadistica
Estadistica
Estadistica
Objetivo: - Leer e interpretar informacin de tablas y grficos - Recopilar y comunicar informacin utilizando los procedimientos ms adecuados a la caracterstica de lo que se va a informar.
90 80 70 60 50 40 30 20 10 0 1er trim. 2do trim. 3er trim. 4to trim. Este Oeste Norte
a) b) c) d)
Qu ttulo tiene la informacin analizada? De qu se trata la informacin? Explique Utiliza grficos o tablas explicativas? Si se utiliza grficos, Son los ms adecuados para representar la informacin o utilizara otro? Por qu? e) Considera que los grficos o tablas son necesarios en una informacin? Por qu? f) En qu caso se utiliza un grfico de barra, lineal o circular? g) Disee nuevamente la informacin de la lmina, como a a ustedes les gustara que apareciera publicada.
Qu es Estadstica?
Es la ciencia encargada de recoger, clasificar, describir y analizar datos numricos que sirvan para deducir conclusiones y tomar decisiones a partir de estos anlisis. La Estadstica se divide en dos grandes grupos:
Estadstica descriptiva o deductiva: Se ocupa de la recoleccin, organizacin y representacin de datos en forma coherente. Estadstica inductiva o inferencial: Se ocupa de interpretar los datos recogidos y obtener conclusiones a partir de ellas.
Qu es una poblacin?
Poblacin o Universo: Es el conjunto de todos los individuos u objetos que poseen alguna caracterstica comn observable. Una poblacin puede ser finita o infinita.
Ejemplo: - La poblacin consistente en la fabricacin de refrigeradores, en una empresa determinada, en un da determinado, es finita. - La poblacin formada por todos los posibles sucesos (caras o sellos en tiradas sucesivas de una moneda es infinita. - La poblacin formada por los Nmeros Naturales es infinito - La poblacin formada por el nmero de alumnos de un colegio determinado, en un ao determinado es finito.
Qu es una muestra?
Muestra es un subconjunto de la poblacin. Es una parte de ella.
Se dice que una muestra es representativa de la poblacin, cuando corresponde ms o menos al 20% de ella. Y se pueden deducir importantes conclusiones acerca de sta, a partir del anlisis de la misma. Ejemplo: Poblacin: Padres de los alumnos de un colegio Muestra: Padres de los alumnos de Octavo ao La muestra se puede elegir en forma aleatoria, estratificada o mixta
Qu es una variable?
Una variable es la caracterstica o atributo a observar.
El conjunto de valores asignados a la variable se llama dato o dominio de la variable. Las variables pueden ser continuas o discretas. Variable continua es aquella que puede tomar cualquier valor entre dos valores dados, es decir, en un rango determinado. Ejemplo: La estatura de los alumnos de un cuarto bsico es continua, porque pueden medir 1,40 m 1,42 m 1,408 m etc
Variables discreta son aquellas que toman un valor entero Ejemplo: El nmero de hijos de una familia es discreta, porque puede haber 1, 2, 3, ....etc. hijos
Ejercicios
Decir de las variables siguientes cules representan datos discretos o datos continuos. Nmero de acciones vendidas cada da en un mercado de valores. Respt: Discreta
Temperaturas registradas cada media hora en un observatorio. Respt: Continua Perodo de duracin de ampolletas producidos por una empresa determinada Respt: Continua Censos anuales del colegio de profesores. Respt: Discreta Nmero de billetes de $10000 circulando en Chile Respt: Discreta Pulgadas de precipitacin en una ciudad durante varios meses del ao. Respt: Continua
Alumnos matriculados en la Universidad Andrs Bello, en los ltimos cinco aos. Respt: Discreta Dar el dominio de cada una de las siguientes variables y decir si son continuas o discretas.
Nmero de litros de agua en una mquina de lavar. Dominio : cualquier valor de cero litros a la capacidad de la mquina ( 12,3 12,005 12,0047 etc) Variable : Continua
Nmero de libros en un estante de librera. Dominio : 0, 1, 2, 3, ........ Hasta el mayor nmero de libros que puedan entrar en el estante. Variable : Discreta
Suma de puntos obtenidos en el lanzamiento de un par de dados Dominio : 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 Variable : Discreta Tiempo de vuelo de un proyectil Dominio : De cero en adelante ( 5 5,3 5.045 etc) Variable : Continua Estado civil de un individuo
Dominio : Casado, soltero, viudo Variable : Discreta Velocidad de un automvil en kilmetros por hora. Dominio : De 0 en adelante ( 120 120,8 120,04 etc) Variable : Continua
Distribuciones de frecuencias
Toma de datos: Es la obtencin de una coleccin de los mismos que no han sido ordenados numricamente.
Ejemplo: Conjunto de alturas de 100 estudiantes, sacados de una lista alfabtica de una Universidad.
Ordenacin: Es una colocacin de los datos numricos tomados, en orden creciente o decreciente de magnitud. Ejemplo: 32 , 45, 100, 120 , 145, 186, 198, 200 ( ordenacin creciente ) 200, 198, 186, 145, 120, 100, 45, 32 ( ordenacin decreciente)
Al recoger informacin se obtiene un gran nmero de datos, que conviene presentar en forma resumida en una tabla llamada distribucin de frecuencias. Frecuencia absoluta: es el nmero de veces que se repite un valor de la variable.
Ejemplo: Los siguientes datos son las calificaciones obtenidas, en la asignatura de Matemtica, por un grupo de 30 alumnos: 7354345657326546 3 - 4 5 2 - 7 4 5 7 6 5 4 2 3 - 1
Variable Estadstica
Calificacin
1
2 3 4 5 6 7
Frecuencia absoluta
N de alumnos
1 3 5 6 7 4 4
Frecuencia acumulada hasta un valor determinado: es el nmero de observaciones menor o igual al valor considerado. Se obtiene sumando sucesivamente las frecuencias absolutas. Ejemplo:
Variable estadstica
Calificacin
1 2 3 4 5 6 7
Frecuencia absoluta
N de alumnos
1 3 5 6 7 4 4
Frecuencia acumulada
------------1 4 9 15 22 26 30
Frecuencia relativa: es el cuociente entre la frecuencia absoluta y el nmero total de individuos de la muestra
Variable estadstica
Calificacin
1 2 3 4 5 6 7
N de alumnos
1 3 5 6 7 4 4
Ejercicios
Los siguientes datos son las calificaciones de un grupo de 27 alumnos en la asignatura de matemtica: 5 6 5 7 4 2 3 5 4 6 7 5 4 6 5 4 5 6 4 3 4 6 7 5 4 5 6 a) Construya una tabla de distribucin de frecuencias b) Cuntos alumnos tienen nota inferior a 5? c) Qu porcentaje de alumnos tiene nota 4? d) Cuntos alumnos tiene nota 6? e) Qu porcentaje de alumnos tiene nota superior o igual a 4?
Respuesta
Calificacin 2 3 4 frecuencia 1 2 7 Frecuencia acumulada 1 3 10 Frecuencia relativa 1 / 27 = 0,037 2 / 27 = 0,074 7 / 27 = 0,259 Frec. relat. porcentual 3,7 7,4 25,9
5
6 7
8
6 3
18
24 27
8 / 27 = 0,296
6 / 27 = 0,222 3 / 27 = 0,111
29,6
22,2 11,1
b) 10 alumnos tienen nota inferior a 5,0 c) El 25,9% de los alumnos tiene nota 4,0 d) 6 alumnos tienen nota 6,0 e) El 88,8% de los alumnos tiene nota igual o superior a 4,0
Una encuesta realizada a alumnos de Cuarto Medio acerca de su futura profesin, indica lo siguiente:
Variable profesin
Ingeniera Medicina Economa Periodismo Derecho Arquitectura Otras
F. absoluta N de alumnos
10 6 12 8 5 9 10
a) Completar la tabla con frecuencia acumulada, relativa y relativa porcentual. b) Cuntos alumnos fueron encuestados? c) Cul es la profesin que tiene mayor preferencia? d) Qu porcentaje de alumnos prefiere arquitectura? e) Qu porcentaje de alumnos prefiere medicina?
Respuesta
Profesin Ingeniera Medicina Economa Frecuencia 10 6 12 F. acumulada 10 16 28 F. relativa 10 / 60 = 0,166 6 / 60 = 0,100 12 / 60 = 0,200 F. relat. % 16,6 10,0 20,0
Periodismo
Derecho Arquitectura Otros
8
5 9 10
36
41 50 60
8 / 60 = 0,133
5 / 60 = 0,083 9 / 60 = 0,150 10 / 60 = 0,166
13,3
8.3 15,0 16,6
b) 60 alumnos fueron encuestados c) Economa es la profesin con mayor frecuencia d) El 15% de los alumnos prefiere Arquitectura e) El 10% de los alumnos prefiere Medicina
En una muestra de 40 familias, el nmero de hijos se distribuye segn la tabla: a) Completa la tabla con frecuencia acumulada, relativa y relativa porcentual. F. absoluta Variable b) Cuntas familias tienen menos de N de hijos N de familias 4 hijos? 1 2 c) Cuntas familias tienen 5 hijos? 2 8 d) Cul es la frecuencia relativa de las 3 12 familias que tienen 2 hijos? e) Qu porcentaje de familias tiene 6 4 14 hijos? 5 3 f) Qu fraccin representan las familias 6 1 con 2 hijos? g) Qu fraccin representan las familias con 4 hijos?
Respuesta
N hijos Frecuencia F. acumulada F, relativa Frec. Relat. %
1
2 3 4
2
8 12 14
2
10 22 36
2 / 40 = 0,05
8 / 40 = 0,20 12 / 40 = 0,30 14 / 40 = 0,35
5
20 30 35
5
6
3
1
39
40
3 / 40 = 0,075
1 / 40 = 0,025
7,5
2,5
b) 22 familias tienen menos de 4 hijos c) 3 familias tienen 5 hijos d) La frecuencia relativa de familias con 2 hijos es de 0,20 e) El 2,5% de las familias tiene 6 hijos f) 1 / 5 de las familias tienen 2 hijos g) 7 / 20 de las familias tienen 4 hijos
Media aritmtica ( X )
Media aritmtica: corresponde al promedio de los valores. Se simboliza por X
La media aritmtica se obtiene sumando los valores de la variable dividido por el nmero total de valores. En forma General :
X = x1 + x2 + x3 +....xn n
Las notas son: 3- 5 - 7 - 6 - 4 - 5 - 3 - 5 - 4 - 5 - 3 - 4 X = 3 + 5 + 7 + 6 + 4 +5 + 3 +5 + 4 + 5 + 3 + 4 12 Luego, el promedio de notas del alumno es 4,5 = 54 = 4,5 12
La media aritmtica ponderada es otra forma de calcular el promedio, utilizando la tabla de distribucin de frecuencias.
Ejemplo:
Notas 3 4 Frecuencias 3 3
Se debe multiplicar cada valor con su frecuencia. 3 3 = 9 4 3 = 12 5 4 = 20 61=6 71=7 Se suman los productos: 9 + 12 + 20 + 6 + 7 = 54
5
6 7
4
1 1
La suma del producto se divide por el total de datos: 54 : 12 = 4,5 Luego, X = 4,5
Mediana ( Me )
Es el valor de la variable que deja igual nmero de valores antes y despus de l en una distribucin de frecuencias
Si el nmero de valores es par, la mediana es el promedio aritmtico de los dos valores centrales. Ejemplo:
2 3 5 6 8 9 11 12 El calculo sera: ( 6 + 8 ) : 2 = 14 : 2 = 7 Luego, la mediana es 7
Moda ( Mo )
Es el valor de la variable que tiene mayor frecuencia Ejemplo:
Variable
F. absoluta
N de hijos
1 2 3 4 5 6
N de familias
2 8 12 14 3 1
Ejercicios
Las calificaciones de un estudiante de la USACH, en seis pruebas, fueron 84, 91, 72, 68, 87 y 78. Hallar el promedio de sus notas.
Respuesta:
X = 84 + 91 + 72 + 68 + 87 + 78 = 480 = 80 6 6
Respuesta:
X = 3,88 + 4,09 + 3,92 + 3,97 + 4,02 + 3,95 + 4,03 + 3,92 +3,98 +4 ,06 10 = 39,82 = 3,98 10 Luego, la media aritmtica es 3,98
Frecuencia
8 10 16 14 10 7
Respuesta
Salario ( x)
$ 55.000 $ 65.000 $ 75.000 $ 85.000 $ 95.000 $ 105.000
Frecuencia
8 10 16 14 10 7
FX
$ 440.000 $ 650.000 $ 1.200.000 $ 1.190.000 $ 950.000 $ 735.000
X = 440.000 + 650.000+ 1.200.000 + 1.190.000 + 950.000 + 735.000 65 Luego, el sueldo promedio es = 5.165.000 = 79.461,538 $ 79.461,5 65
Las calificaciones de un estudiante de la USACH, en seis pruebas, fueron 84, 91, 72, 68, 87 y 78. Hallar la mediana de sus calificaciones Respuesta: Se deben ordenar las calificaciones: 68 72 78 84 87 91 Luego, la mediana es 78 + 84 = 162 = 81 2 2 Hallar la moda de los siguientes nmeros: 3, 5, 2, 6, 5, 9, 5, 2, 8. Respuesta: La moda es el nmero 5, ya que su frecuencia es mayor
Temperatura
grfico de Barra : Permite hacer comparaciones mediante barras paralelas colocadas en forma vertical u horizontal entre dos ejes perpendiculares.
90 80 70 60 50 40 30 20 10 0 1er trim. 2do trim. 3er trim. 4to trim.
Matematica Lenguaje
Grfico circular: Consiste en un crculo dividido en sectores que representan las frecuencias relativas porcentuales de una distribucin Los 360 grados del crculo se dividen proporcionalmente al porcentaje correspondiente de cada frecuencia.
Clases o intervalos : En la ordenacin de datos muy numerosos, es usual presentarlos agrupados y ordenados en clases o categoras.
Para ordenarlos y agruparlos, se establecen los intervalos que se usarn, determinando el rango de los datos.
Dato mayor: 88
De acuerdo con el rango y teniendo en cuenta la cantidad de datos, se forman los intervalos.
Si quisiramos formar 6 intervalos, se tiene que dividir el rango con la cantidad deseada. 27 : 6 = 4, 5 se aproxima a 5 ( amplitud aparente del intervalo)
Intervalo de puntajes Frecuencias
60 64
65 69 70 74 57 79
5
5 8 12
El intervalo 60 64 es un smbolo para representar a la clase respectiva Los valores 60 y 64 son los lmites aparentes de la clase.
80 84
85 89
16
4
Los lmites reales de una clase se obtienen calculando el promedio entre el lmite aparente superior de una clase y el lmite aparente inferior de la clase siguiente. Ejemplo: Calcular los lmites reales de la clase 70 74 Lri = 69 70
2
139 = 2
= 69,5 = 75,5
Lrs = 74 75 2
149 2
Tamao o amplitud de una clase: Corresponde a la diferencia entre su lmite real superior y el lmite real inferior. Ejemplo: 75,5 69,5 = 5 Su amplitud es igual a 5
Frecuencia total: Es la suma de las frecuencias absolutas de todas las clases. Frecuencia total Ejemplo: 12 + 11 + 10 = 33 Intervalo Frecuencia
15 6 10 11 -15 12 11 10
Ejercicios
Dado los siguientes puntajes, determinar: 61 78 62 77 a) b) c) d) 76 74 83 64 66 84 75 77 77 63 67 82 70 76 72 83 83 84 83 85 88 78 83 79 63 75 84 72 77 72 84 83 67 75 67 83 68 72 82 83 80 73 71 87 80 87
Determinar seis intervalos Determinar el lmite real superior e inferior de cada clase Determinar la marca de clase de cada intervalo Determinar la frecuencia absoluta
Respuesta
Se debe determinar el rango: Pje mayor Pje menor: 88 61 = 27 Luego, 27 : 6 = 4,5 se aproxima a 5 la amplitud del intervalo
Intervalo Lri - Lrs Marca de clase Frecuencia
60 64
65 69 70 74 75 79
59,5 64,5
64,5 69,5 69,5 74,5 74,5 79,5
62
67 72 77
5
5 8 12
80 84
85 89
79,5 84,5
84,5 89,5
82
87
16
4
Ordena los siguientes datos de menor a mayor y calcula su rango: 3,22 2,92 3,01 4,48 5,06 4,31 2,98 3,07 Respuesta: Ordenado: 2,92 2,98 3,01 3,07 3,22 4,31 4,48 5,06 Rango: 5,06 2,92 = 2,14 La siguiente distribucin de frecuencias corresponde a los salarios de los empleados de una fbrica:
Salarios ( $ )
50.000 54.999 55.000 59.999 60.000 64.999 65.000 69.999 70.000 74.999 75.000 79.999 80.000 84.999 85.000 89.999
Frecuencia
7 18 32 45 52 28 16 8
a) Calcula los lmites reales del tercer intervalo Respuesta: Lri = 59.999 + 60.000 = 59.999,5 2
Respuesta:
[80.000 84.999] Lmite aparente inferior: 80.000
d) Determina el lmite real superior del segundo intervalo Respuesta: [55.000 59.999]
Marca de clase
52.499,5 57.499,5 62.499,5 67.499,5 72.499,5 77.499,5 82.499,5 87.499,5
Frecuencia
7 25 57 102 154 182 198 206
acum
Frecuencia relativa
7 / 206 = 0,033 18 / 206 = 0,087 32 / 206 = 0,155 45 / 206 = 0,218 52 / 206 = 0,252 28 / 206 = 0,135 16 / 206 = 0,077 8 / 206 = 0,038
Frecuencia relativa
3,3 8.7 15,5 21,8 25,2 13,5 7,7 3,8
Ejercicio
Despus de medir las alturas de 40 alumnos de un curso, resultaron los siguientes valores de la variable: 154 152 163 158 178 155 155 163 150 161 157 166 166 165 161 167 182 160 162 156 175 159 155 164 163 160 167 170 175 168 164 176 150 165 162 172 162 162 158 160
a) Determina el rango
Respuesta: 182 - 150 = 32
Frecuencia
4 8 14 7 2 4 1
Respuesta:
Intervalo
150 154 155 159 160 164 165 169 170 174 175 179 180 184
M de C
152 157 162 167 172 177 182
e) Determinar el lmite real inferior del tercer intervalo Respuesta: Lri = 159 + 160 = 159,5 2
f) Determinar el lmite real superior del quinto intervalo Respuesta: Lrs = 174 + 175 = 174,5 2
F. acum
4 12 26 33 35 39 40
F. Relat %
10 20 35 17,5 5
175 179
180 184
10
2,5
i) Cuntos alumnos miden menos de 160 ? Respuesta: 12 alumnos miden menos de 160
Respuesta: n = 40
m) Cul es la amplitud del intervalo ? Respuesta: c = Lrs Lri = 159,5 - 154,5 = 5
X = 3805 50
X = 76,1
Mediana: Es calcular un valor que separa al conjunto en dos grupos de igual cantidad. Para calcular la mediana se ocupa la siguiente formula: Me = L i m +
L i m = lmite real inferior del intervalo mediano ( primer intervalo cuya frecuencia acumulada es igual o mayor que n/2 ) n / 2 = mitad de la frecuencia total f( acum. ant ) = frecuencia acumulada del intervalo anterior al intervalo mediano c = amplitud del intervalo f m = frecuencia absoluta del intervalo mediano
Ejemplo
Hallar la mediana de los pesos de 40 estudiantes, dado en la siguiente tabla de distribucin
Intervalo 118 126 127 135 136 144 145 153 154 162 163 171 172 180 Frecuencia 3 5 9 12 5 4 2 F acum 3 8 17 29 34 38 40
n = 40
Ejemplo 2
Las edades de los obreros que trabajan en una empresa constructora, se distribuyen como sigue: c=5 n / 2 = 180 / 2 = 90 Edad Frecuencia F acum L i m = 32 + 33 = 32,5 18 22 15 15 23 27 26 41 2 28 32 30 71 f( acum ant) = 71 f m = 38
33 37 38 42 43 47 48 52 53 57 38 32 20 12 7 109 141 161 173 180
n = 180
Moda
Cuando los datos estn agrupados en intervalos, la moda corresponde a la marca de clase del intervalo de mayor frecuencia Ejemplo: La tabla de distribucin muestra el nmero de horas que un grupo de jvenes dedica a ver televisin diariamente.
Horas 02 35 68 9 11 12 - 14 frecuencia 25 35 25 10 5
Ejemplo:
Esta tabla de distribucin de frecuencias indica las edades de los alumnos que asisten a clases de Ingls.
Edad
57 8 10 11 13 14 16 17 19
frecuencia
8 10 7 5 4
f 10 8 6 4 2
Polgono de frecuencia
Es la modalidad de un grfico de datos que se origina al unir los puntos medios de los lados superiores de las barras de un f histograma. El punto medio de cada intervalo es la marca de clase
10 8 6 4 2
12
15
18
Puff!
Ejercicio
Dada la tabla de distribucin de edades de un grupo de padres cuyos hijos estn en primer ao de universidad. Hallar: a) media aritmtica b) Mediana c) Moda a) Media aritmtica Edad frecuencia
45 48 2 Edad 45 48 49 52 53 56 f 2 5 12 x 46,5 50,5 54,5 fx 93 252,5 654
49 52
53 56 57 60 61 64
5
12 8 5
57 60
61 64
8
5
58,5
62,5
468
312,5
X = f x = 1780 = 55,625 n 32
b) Mediana
Edad 45 48 49 52 53 56 57 60 61 64 f 2 5 12 8 5 F acum 2 7 19 27 32
n = 32
Me = 52,5 + ( 16 7 ) 4 = 52,5 + 9 4 = 55,5 12 12 c) : Moda: El intervalo modal es [53 - 56] . Luego. La moda es su marca de clase: 53 + 56 = 54,5 2
* Construye una tabla de distribucin de frecuencias de datos agrupados en intervalos de clase. Considera como limite inferior del primer intervalo = 10 y c = 10 El puntaje obtenido por 130 alumnos en una prueba de biologa es el siguiente: 12 95 83 76 84 42 35 66 90 56 45 32 26 68 66 64 56 80 50 38 53 45 34 90 78 72 66 80 48 51 85 56 72 99 74 54 38 95 52 23 23 58 60 56 25 89 82 96 62 90 91 33 64 48 15 92 78 99 70 84 34 49 72 56 48 28 74 94 80 96 56 55 80 68 50 34 90 40 93 75 65 70 58 82 66 40 85 42 45 38 70 66 98 40 49 56 66 58 36 28 72 62 50 92 53 64 70 65 49 36 74 64 20 38 83 68 72 67 81 83 86 55 35 56 91 63 58 81 73 29
Respuesta:
Intervalo
10 19 20 29 30 39 40 49 50 59 60 69 70 79 80 89 90 - 99
M. de Clase
14,5 24,5 34,5 44,5 54,5
frecuencia
2 8 13 14 22 20 17 17 17
F. acum.
2 10 23 37 59 79 96 113 130
F. Relat
0,015 0,061 0,100 0,107 0,169 0,153 0,130 0,130 0,130
F. Relat.%
1,5 6,1 10,0 10,7 16,9 15,3 13,0 13,0 13,0
64,5
74,5 84,5 94,5
De acuerdo con la tabla anterior, responder las siguientes preguntas: a) Cuntos alumnos obtuvieron entre 30 y 49 puntos? Respuesta: Hay 27 alumnos b) Cuntos alumnos obtuvieron entre 60 y 89 puntos? Respuesta: Hay 54 alumnos c) Cuntos alumnos obtuvieron entre 40 y 99 puntos? Respuesta: Hay 107 alumnos
d) Qu porcentaje de alumnos obtuvieron entre 30 y 49 puntos? Respuesta: El 20,7 % de los alumnos e) Qu porcentaje de alumnos obtuvo entre 50 y 59 puntos? Respuesta: el 16,9 % de alumnos f) Cuntos alumnos obtuvieron menos de 60 puntos?
Respuesta: 59 alumnos
g) Cuntos alumnos obtuvieron menos de 30 puntos? Respuesta: 10 alumnos h) Cuntos alumnos obtuvieron 50 o ms puntos? Respuesta: 93 alumnos
Respuesta: 49,5
n) Cul es la amplitud del intervalo?
Respuesta: c = 10
M. de Clase
14,5 24,5 34,5
frecuencia
2 8 13 14 22 20 17 17 17
f x
29 196 448,5
40 49
50 59 60 69 70 79 80 89 90 - 99
44,5
54,5 64,5 74,5 84,5 94,5
623
1199 1290 1266,5 1436,5 1606,5
n = 130
n / 2 = 130 / 2 = 65
F. acum.
2 10 23
frecuencia
2 8 13 14 22 20 17 17 17
c = 10
40 49
50 59 60 69 70 79 80 89 90 - 99
37
59 79 96 113 130
n = 130
Respuesta: El intervalo modal es [50 - 59] porque tiene la mayor frecuencia , que es 22. La moda corresponde a la marca de clase de ese intervalo.
Luego, Mo = 50 + 59 = 54,5 2
a+b=c
Ejercicios
Calcular el rango entre. 3,22 2,93 3.01 4,48 5,06 4.31 2,98 3,07 Repuesta: 5,06 - 2,98 = 2,08 El siguiente cuadro muestra el consumo anual en Chile de kilogramos de carne de bovino per cpita.
Ao Consumo
1984 17,0 1985 15,0 1986 14,7 1987 14,0 1988 15,6 1989 17,3 1990 18,5 1991 18,1 1992 17,6 1996 20,0
b) Calcular el consumo promedio de los 10 aos? Respuesta: X = 1678 = 16,78 10 La siguiente tabla representa las medidas de una pieza de motores
Intervalo 100 109 110 119 120 129 130 139 140 149 150 159 160 169 Frecuencia 4 17 29 18 10 5 2
Respuesta:
f
29
154,5
18 10 4
164,5
Marca de clase
Determinar : Mo, Me y X
Respuesta:
Me = Como n / 2 = 45 / 2 = 22,5 Luego. la mediana es 5 , pues es el primer valor de la variable cuya f(acum.) es igual o mayor que 22,5
X = 11 + 2 4 + 3 5 + 4 6 + 5 9 + 6 12 + 7 8 = 221 = 4,9 45 45
Mo = La moda es 6 pues es el valor que tiene mayor frecuencia absoluta
Existen otros valores tpicos que dividen a un conjunto de datos numricos en una cierta cantidad de partes iguales; stos son: Percentiles, Deciles y Cuartiles. P50 = 52 % = Me
Percentiles
Los percentiles de una distribucin de datos numricos son los 99 valores que la dividen en 100 partes iguales.
Los percentiles se designan por: P1 , P2 , P3 , .............P99 Se lee: P1 = percentil 1 P2 = percentil 2 ............etc. 0 P1 P2 P3 ........................................................P99.
Ejemplo: En la distribucin de notas de un grupo de alumnos, el P45 es una nota de referencia que permite afirmar que el 45 % de esos alumnos obtuvo esa nota o una menor.
El clculo de percentiles se hace de la misma forma como se obtiene la mediana, en una distribucin. Ejemplo: Considerar la distribucin de frecuencias de los 212 puntajes de P:A:A: para calcular P45 .
Puntaje
350 399 400 449
frecuencia
4 6
Frec. Acum.
4 10
450 499
500 549 550 599 600 649 650 699 700 749 750 799 800 849
9
20 31 80 42 10 8 2
19
39 70 150 192 202 210 212
Respuesta: Se calcula el 45% de 212: 212 = 100% x = 212 45 x 45 % 100 x = 95,4 La frecuencia acumulada 95,4 se encuentra en la clase 600 - 649
f (acum. ant) = 70 c = 50 f p = 80
= 599,5 + 15,875
= 615,375
Este valor significa que el 45 % de los alumnos obtuvo puntajes menores o iguales a 615,3.
Este valor de la frecuencia acumulada se encuentra en la clase 450 499 L r i p = 449 + 450 = 449,5 F(acum. ant) = 10 c = 50 f p = 9 2 P8 = 449,5 + ( 16,96 10) 50 9 = 449,5 + 38,66 = 488,16
Ejercicio de percentil
Dada la tabla de distribucin, determinar qu porcentaje de los alumnos obtuvieron entre 400 y 600 puntos.
Puntaje
350 399 400 449
frecuencia
4 6
Frec. Acum.
4 10
Respuesta:
400 puntos corresponde a un percentil que se desconoce, por lo que se simboliza por Px . Adems se sabe que corresponde al segundo intervalo, y que su L r i p = 399,5
450 499
500 549 550 599 600 649 650 699 700 749 750 799 800 849
9
20 31 80 42 10 8 2
19
39 70 150 192 202 210 212
Px = 399,5 +
x.
212 4 100 6
400 399,5 =
2,12 x 4 .50 6
600 puntos corresponde a un percentil desconocido, por lo que se simboliza por Py Adems se sabe que est ubicado en el sexto intervalo, y que su L r i p = 599,5 f(acum. ant) = 70 f p = 80 c = 50 El % buscado es Entonces: x
212 100
Py = 599,5 +
y.
y.
La diferencia entre ambos porcentajes corresponde al porcentaje pedido. 33,3 1,9 = 31,4 %
= 2,12 y - 70
= y
y = 33,3 %
2,12 x 70 .50 80
= 2,12x 70
x = 48,4 %
Py = 649,5 +
680 = 649,5 +
( 680 649,5 ) 42 50
= 2,12y - 150
x = 82,8 %
As, la diferencia entre ambos porcentajes corresponde al porcentaje de alumnos que tienen entre 620 y 680 puntos. 82,8 % - 48,4 % = 34,4 = 34,4 % de los alumnos
Deciles
Los deciles de una distribucin de datos numricos son los 9 valores que la dividen en 10 partes iguales. Los deciles se designan por D1 , D2 , D3 , ...........D9 Se leen: Decil 1 , decil 2 .......decil 9
D1 D2 D3 D4
D5
D6
D7
D8
D9
Para calcular deciles, se hace de la misma forma que los percentiles. Ejemplo: Considerar la siguiente tabla de distribucin para calcular D3
Puntaje
350 399 400 449
frecuencia
4 6
Frec. Acum.
4 10
450 499
500 549 550 599 600 649 650 699 700 749 750 799 800 849
9
20 31 80 42 10 8 2
19
39 70 150 192 202 210 212
Para calcular el tercer decil (D3) se tiene que tener en cuenta que corresponde al 30 % inferior de los datos de la distribucin.
x = 63,6
Esta cantidad de datos corresponde a la clase 550 599 L r i = 549 + 550 = 549,5 2 f(acum. ante) = 39 c = 50
f d = 31
D3 = 549,5 + ( 63,6 39 ) 50 31
= 549.5 + 39,6
= 589,1 El 30 % de los 212 alumnos tiene un puntaje igual o menor que 589,1 puntos.
Calcular el D7
Respuesta: El 70% de 212 = 148,4 f(acum. ant) = 70 f d = 80 c = 50 El lmite real inferior de la clase 600 649 es 599,5
Cuartiles
Los Cuartiles de una distribucin de datos numricos son los tres valores que la dividen en 4 partes iguales
Q1 es el primer cuartil y corresponde al 25% inferior Q2 es el segundo cuartil y corresponde al 50% inferior Q3 es el tercer cuartil y corresponde al 75% inferior
Los cuartiles se calculan de la misma forma que los percentiles y los deciles.
frecuencia
4 6 9
Frec. Acum.
4 10 19
500 549
550 599 600 649 650 699 700 749 750 799 800 849
20
31 80 42 10 8 2
39
70 150 192 202 210 212
El 75% de los alumnos tiene un puntaje igual o inferior a 660,2 puntos, lo que significa que el 25% de ellos tiene un puntaje igual o superior a 660,2
Un curso rindi una prueba de Matemtica, Qu se puede decir del resultado, si se sabe que en la distribucin de las notas se obtuvo: Q2 = 5,8 y Q3 = 6,5 ? Respuesta: Es conveniente ver la situacin en forma grfica:
5,8
50%
6,5
25%
Medidas de dispersin
Al grado en que los datos numricos tienden a extenderse alrededor de un valor medio se le llama variacin o dispersin
Las medidas de dispersin ms utilizadas son: * Rango * Desviacin media * Desviacin tpica o estndar.
Rango
El rango de un conjunto de datos numricos es la diferencia entre el mayor y el menor de ellos. Ejemplo: Un alumno obtuvo las siguientes notas parciales en Matemtica: 2 - 3,9 - 5 - 5,9 - 6,2 El rango es 4,2 ya que es la diferencia entre 6,2 y 2 Qu significado tiene el rango de notas 4,2 respecto de las notas de otro alumno cuyo rango es 2,1? En el primer caso las notas estn ms dispersas que en el segundo. No se sabe en que caso son mejores; para determinarlo es necesario ms informacin.
Desviacin Media
La desviacin de un puntaje x con respecto a la media aritmtica x est dada por la diferencia d = x - x
Ejemplo: Un alumno obtuvo las siguientes notas en la asignatura de Biologa: 3,9 - 2 - 5 - 6,2 - 5,9 Calcular la desviacin de ellas. Respuesta:
Primero se debe calcular el promedio. x = 3,9 + 2 + 5 + 6,2 +5,9 = 23 = 4,6 5 5
Ahora se calcula la diferencia de cada nota con el promedio d = 3,9 4,6 = - 0,7 d = 5 4,6 = 0,4 d = 5,9 4,6 = 1,3 d = 2 4,6 = - 2,6 d = 6,2 4,6 = 1,6
NOTA: La suma de las desviaciones de todos los datos con respecto a la media aritmtica es igual a cero.
La desviacin media de n datos numricos x1, x2, ......xn es la media aritmtica de los valores absolutos de las desviaciones de todos los datos con respecto a su promedio. Se designa por DM n = frecuencia total
Un alumno obtuvo las siguientes calificaciones en la asignatura de Ingls: 3,2 - 6 - 6,8 - 4,3 - 2,9 - 5,7 Calcular la desviacin media de las notas. Respuesta: x = 3,2 + 6 + 6,8 + 4,3 + 2,9 + 5,7 = 28,5 = 4,8 6 6 | 3,2 4,8 | = 1,6 | 6 4,8 | = 1,2 | 6,8 4,8 | = 2 | 4,3 4,8 | = 0,5 | 2,9 4,8 | = 1,9 | 5,7 4,8 | = 0,9
Frecuencia
4 6 9 20 31 80 42 10 8 2
x
374,5 424,5 474,5 524.5 574.5 624.5 674.5
|xx|
239.5 189.5 139.5 89.5 39.5 10.5 60.5 110.5 160.5 210.5
f |x x |
958 1137 1255.5 1790 1224.5 840 2541 1105 1284 421
724.5
774.5 824.5
212
12556
Se realiza el producto de la frecuencia con la desviacin Se obtiene la sumatoria del producto *Considerar la frecuencia total.
Con todos los datos se aplica la frmula de la desviacin media DM = f | x x | n DM = 12556 = 59,2 puntos 212
Se puede decir que los puntajes se desvan, en promedio, 59,2 puntos con respecto a la media.
Hay que considerar que algunos puntajes son inferiores a ella y otros superiores. Si los puntajes estuvieran ms agrupados en torno al promedio, es decir, menos dispersos, el valor de DM sera menor.
Calcular la DM de la siguiente distribucin que representa las horas diarias dedicadas al estudio de 20 alumnos
Horas
02 35 68 9 - 11
Frecuencia
5 7 6 2
x
1 4 7 10
fx
5 28 42 20
|xx|
3,7 0,7 2,3 5,3
20
95
47,8
* Finalmente se determina la DM DM = 47,8 = 2,3 a) Obtener la marca de clase 20 Las horas diarias se desvan en 2,3 b) Multiplicar f x puntos con respecto a la media. c) Obtener f x
Calcula la desviacin media de las medidas de una pieza de motores, dada por la siguiente tabla:
Intervalo 100 109 110 119 120 129 130 139 140 149 150 159 160 169
frecuencia 4 17 29 18 10 5 2
DM = 923 = 10,8 85
85
10942.5
Las medidas se desvan 35,8 71,6 en promedio de 10,8 puntos con respecto a 923 la media. *Se calcula | x x |
* x = 10942,5 = 128,7 85
* Se calcula f | x x |
n
S=
(x
k 1 k n
x) 2
Ejercicios
Calcular la desviacin tpica de las siguientes notas de Matemtica: 2,0 - 3,9 - 5,0 - 5,9 - 6,2
Respuesta: * Primero se debe obtener el promedio x = 2,0 + 3,9 + 5,0 + 5,9 + 6,2 = 4,6 5 * Se calcula la desviacin tpica
S=
S=
=
11,3 5
2,2
1,4
Calcular la desviacin tpica de las siguientes notas: 5,2 - 4,9 - 5 - 5,1 - 5,2 - 5,3 - 4,9 - 5,2 Respuesta: * Se obtiene el promedio
2 2 2
x = 5,1
2 2 2 2 2
*S=
S=
61,0 8
0,02 = 0,1 S= Este valor es considerablemente menor que el ejercicio anterior. Se debe a que los datos son ms homogneos que en la otra distribucin, presentan escasa dispersin con respecto al promedio.
Horas
02 35 68 9 - 11
x
1 4 7
|xx|
3,7 0,7 2,3 5,3
|xx|
13,69 0,49 5,29 28,09
f | x x |
68,45 3,43 31,74 56,18
* Se calcula S
10
159 ,8 S= 20
S=
Primero se debe sacar la marca de clase. * Determinar las desviaciones S= * Obtener la desviacin al cuadrado * Producto de la frecuencia con la desviacin al cuadrado.
159,8
7,9
2,8
La siguiente tabla muestra los puntajes obtenidos en P.A.A. con un promedio de 614 puntos. Calcular la desviacin tpica
Puntajes
350 399 400 449 450 499 500 549
Frecuencia
4 6 9 20
x
374.5 424.5 474.5 524.5 574.5 624.5 674.5 724.5 774.5 824.5
|xx|
239.5 189.5 139.5 89.5 39.5 10.5 60.5
| x x |2
57360.25 35910.25 19460.25
f | x x |2
229441 215461.5 175142.25 160205 48367.75
1407973 S= 212
8010.25
1560.25 110.25 3660.25 12210.25 25760.25 44310.25
550 599
600 649 650 699 700 749 750 799 800 849
31
80 42 10 8 2
8820
153730.5 122102.5 206082 88620.5
110.5 160.5
210.5
1407973
* Calcular marca de clase * determinar f |x x |2 * Calcular las desviaciones * Determinar la sumatoria del producto * Determinar las desviaciones al cuadrado
La siguiente tabla muestra el nmero de brazadas dadas por 100 nadadores en la prueba de 200 m crol. Calcular S
Brazadas 200 204 205 209 210 214 215 219 220 224 225 229 230 234 235 239 frecuencia 8 12 15 18 16 14 10 7 x 202 207 212 217 222 227 232 237 fx 1616 2484 3180 3906 3552 3178 2320 1659 |xx| 16.9 11.9 6.9 1.9 3.1 8.1 13.1 18.1 |xx|2 285.61 141.61 47.61 3.61 9.61 65.61 171.61 327.61 F |x x |2 2284.88 1699.32 714.15 64.98 153.76 918.54 1716.1 2293.27
S=
9845 100
S = 98,45
S = 9,9 Las brazadas estn a 9,9 puntos con respecto al promedio
21895
9845
* del producto
Varianza
La varianza de un conjunto de datos se define como el cuadrado de la desviacin tpica
Se simboliza por S2
2 ( x x ) k 1 k n
S2 =
n
El clculo de la varianza es similar a la desviacin tpica
Un alumno obtuvo las siguientes notas en la asignatura de Biologa: 3,9 - 2 - 5 - 6,2 - 5,9 Calcular la varianza de ellas. Respuesta:
Primero se debe calcular el promedio. x = 3,9 + 2 + 5 + 6,2 +5,9 = 23 = 4,6 5 5 * Calcular las desviaciones |3,9 4,6 | = 0,7 | 2 4.6 | = 2,6 | 5 4,6 | = 0,4 | 6,2 4,6 | = 1,6 | 5,9 4,6 | = 1,3
* Calcular las desviaciones al cuadrado 0,72 = 0,49 2,62 = 6,76 0,42 = 0,16 1,62 = 2,56 1,32 = 1,69 * Calcular S2 S2 = 0,49 + 6,76 + 0,16 + 2,56 + 1,69 = 11,66 5 = 2,3
Calcular la Varianza de la siguiente distribucin que representa las horas diarias dedicadas al estudio de 20 alumnos, con un promedio de 4,7
Horas
02
Frecuencia
5
x
1 4 7 10
|xx|
3,7 0,7 2,3 5,3
| x x | 2 f | x x | 2
13,69 0,49 5,29 28,09 68,45 3,43 31,74 56,18
f | x x | 2
35
68 9 - 11
7
6 2
* Se calcula S2 S2 =
159,8 20
159,8
S2 = 7,9
Luego, la varianza es 7,9
Primero se debe sacar la marca de clase. * Determinar las desviaciones * Obtener la desviacin al cuadrado