0% encontró este documento útil (1 voto)
307 vistas35 páginas

Estadistica Descriptiva

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 35

TEMA 1: CONCEPTOS BÁSICOS DE ESTADÍSTICA.

1. Introducción: Permanentemente recibimos información referente al área en que trabajamos y es


necesario hacer uso de ella, puesto que será útil para el proyecto en que estamos trabajando.

La información es importante para la toma de decisiones en muchos problemas. Para esto


necesitamos un procesamiento adecuado de los datos de, para que nos arroje conclusiones certeras.
En caso contrario, si no se aplica un buen procesamiento, es posible que en base a los resultados
tomemos una mala decisión.
Información buena
Información suficiente buena decisión
Procesamiento correcto

La estadística es un campo del conocimiento que permite al investigador deducir y evaluar


conclusiones acerca de una población a partir de información proporcionada por una muestra.

Específicamente, la estadística trata de teoremas, herramientas, métodos y técnicas que se


pueden usar en:

a. Recolección, selección y clasificación de datos.


b. Interpretación y análisis de datos.
c. Deducción y evolución de conclusiones y de su confiabilidad, basada en datos muéstrales.

Los métodos de la estadística fueron desarrollados para el análisis de datos muestreados, así
como para propósitos de inferencia sobre la población de la que se seleccionó la muestra.

La estadística como ciencia, cubre un extenso campo donde poder aplicarla. Se agrupa en 2 grandes
áreas: estadística descriptiva y estadística inferencial, que desempeñan funciones distintivas, pero
complementarias en el análisis.

Es importante que todo profesional que utilice la estadística como herramienta auxiliar de trabajo,
posea un mínimo de conocimientos y habilidades prácticas en aquellas técnicas que le facilitarán el
buen desarrollo de esta actividad.
1.1 Estadística descriptiva.

La estadística descriptiva comprende las técnicas que se emplean para resumir y describir datos
numéricos.
Son sencillas desde el punto de vista matemático y su análisis se limita a los datos coleccionados
sin inferir en un grupo mayor.
El estudio de los datos se realiza con representaciones gráficas, tablas, medidas de posición y
dispersión.

1.2 Estadística inferencial.

I. El problema crucial de la estadística inferencial es llegar a proposiciones acerca de la población a


partir de la observación efectuada en muestras bajo condiciones de incertidumbre. Ésta
comprende las técnicas que, aplicadas en una muestra sometida a observación, permiten la
toman de decisiones sobre una población o proceso estadístico. En otras palabras, es el proceso
de hacer predicciones acerca de un todo basado en la información de una muestra.
La inferencia se preocupa de la precisión de los estadígrafos descriptivos ya que estos se
vinculan inductivamente con el valor poblacional.

2. Definimos conceptos fundamentales: población, muestra y variable.

2.1 Población.

Es el conjunto de todos los elementos que presentan una característica común determinada, observable
y medible. Por ejemplo, si el elemento es una persona, se puede estudiar las
características edad, peso, nacionalidad, sexo, etc.
Los elementos que integran una población pueden corresponder a personas, objetos o grupos (por
ejemplo, familias, fábricas, empresas, etc).
Las características de la población se resumen en valores llamados parámetros.

2.2 Muestra.

La mayoría de los estudios estadísticos, se realizan no sobre la población, sino sobre un subconjunto o
una parte de ella, llamado muestra, partiendo del supuesto de que este
subconjunto presenta el mismo comportamiento y características que la
población. En general el tamaño de la muestra es mucho menor al tamaño de la
población.

Los valores o índices que se concluyen de una muestra se llaman estadígrafos y estos mediante
métodos inferenciales o probabilísticos, se aproximan a los parámetros poblacionales.
2.3 Variable.

Se llama variable a una característica que se observa en una población o muestra, y a la cual se
desea estudiar.
La variable puede tomar diferentes valores dependiendo de cada individuo.
Una variable se puede clasificar de la siguiente manera.

Continua

Cuantitativa

Discreta

Variable

Nominal

Cualitativa

Ordinal

a) Variable cuantitativa: es aquella que toma valores numéricos. Dentro de ella, se subdividen en:

Continua: son valores reales. Pueden tomar cualquier valor dentro de un intervalo. Ej.
Peso, estatura, sueldos.

Discreta: toma valores enteros. Ej. N° de hijos de una familia, n° de alumnos de un


curso.

b) Variable cualitativa: es aquella que describe cualidades. No son numéricas y se subdividen en:

Nominal: son cualidades sin orden. Ej. Estado civil, preferencia por una marca, sexo,
lugar de residencia.

Ordinal: son cualidades que representan un orden y jerarquía. Ej. Nivel educacional,
días de la semana, calidad de la atención, nivel socioeconómico.
Como se ha puesto de manifiesto, gran parte del trabajo de un estadístico profesional se hace con
muestras. Estas son necesarias porque las poblaciones son casi siempre
demasiado grandes para estudiarlas en su totalidad. Exigiría demasiado tiempo y
dinero estudiar la población entera, y tenemos que seleccionar una muestra de
la misma, calcular el estadístico de esa muestra y utilizarlo para estimar el
parámetro correspondiente de la población.

La obtención de la información se puede realizar por diversos medios.


Una forma es a través de una encuesta a un grupo de individuos, donde a cada uno se le hacen las
mismas preguntas.
Otra forma es a través de experimentos donde la respuesta a la variable es el resultado del
experimento. Puede también recolectarse los datos en forma directa, es decir, la información se extrae
de alguna base de datos seleccionando una muestra de ellos.

En cualquiera de estos casos contamos con una selección de información llamada muestra y que
se procede a analizar.

Existen diferentes técnicas para realizar el muestreo y que dependerán cada caso, cual usar.
Algunas de ellas son:

3.1 Muestreos aleatorios simple: todos los elementos de la población tienen igual posibilidad de
ser escogido y se eligen al azar.

3.2 Muestreo sistemático: los elementos se seleccionan a un intervalo uniforme en una lista
ordenada. Una preocupación del muestreo sistemático es la existencia de factores cíclicos en el listado
que pudieran dar lugar a un error.

3.3 Muestreo estratificado: los elementos de la población son primeramente clasificados en


grupos o estratos según una característica importante. Luego, de cada estrato se extrae una muestra
aleatoria simple.

3.4 Muestreo por conglomerado: los elementos de la población están subdivididos en grupos y
se extraen aleatoriamente algunos de estos grupos completos
Ejercicios.

1. De las siguientes afirmaciones ¿cuál se asemeja más a los conceptos: un parámetro, un dato, una
inferencia a partir de datos, un estadígrafo?

- Según estudios, se producen más accidentes en el centro de Santiago, a 35 km/h que a 65 km/h.

- En una muestra de 250 empleados, se obtuvo un sueldo promedio de $150.000

- La tasa de nacimiento en el país aumentó en 5% con relación al mes precedente.

- Las edades son 85, 36, 57, 24

- Se sabe que el 55% de las personas en Chile son varones.

- Según datos de años anteriores se estima que la temperatura máxima de este año aumentará en un
5%.

2. De los siguientes enunciados ¿cuál probablemente usa la estadística descriptiva y cuál, la estadística
inferencial?

- Un médico general estudia la relación entre el consumo de cigarrillo y las enfermedades del corazón.

- Un economista registra el crecimiento de la población en un área determinada.

- Se desea establecer el promedio de bateo de un equipo determinado.

- Un profesor de expresión oral emplea diferentes métodos con cada uno de sus 2 cursos. Al final del
curso compara las calificaciones con el fin de establecer cual método es más efectivo.

3. Clasificar las siguientes variables en: continua, discreta, nominal, ordinal:

- n° de alumnos por carrera

- comuna en que viven los alumnos del curso de estadística

- color de ojos de un grupo de niños


- monto de pagos por concepto de aranceles en la universidad

- sumas posibles de los números obtenidos al lanzar dos dados

- clasificación de los pernos en un local según sus diámetros

- peso del contenido de un paquete de cereal

- monto de la venta de un articulo en $

- valor de venta de las acciones

- n° de acciones vendidas

- nivel de atención en el Banco

- nivel de educacional

- AFP a que pertenece un individuo

- edad

- clasificación de la edad en: niño, joven, adulto y adulto mayor

4. De cada una de las siguientes situaciones responda las preguntas que se plantean:

- Un fabricante de medicamentos desea conocer la producción de personas cuya hipertensión


(presión alta) puede ser controlada con un nuevo producto fabricado por la compañía. En un estudio
a un grupo de 13.000 individuos hipertensos, se encontró que el 80% de ellos controló su presión
con el nuevo medicamento.

- Según una encuesta realizada a 500 adultos mayores de la comuna de Santiago, reveló que en
promedio realizan 6 visitas anuales al consultorio. En vista de los resultados el ministerio de salud
deberá aumentar los recursos en un 10%.

a) ¿Cuál es la población?

b) ¿Cuál es la muestra?

c) Identifique el parámetro de interés

d) Identifique el estadígrafo y su valor

e) ¿Se conoce el valor del parámetro?


5. Conteste V ó F

a) La estadística descriptiva es el estudio de una muestra que permite hacer proyecciones o


estimaciones acerca de la población de la cual procede.

b) Un parámetro es una medida calculada de alguna característica de una población.

c) Abrir una caja de manzanas y contar los que están en mal estado es un ejemplo de dato numérico
continuo.

d) En una muestra aleatoria simple todos tiene la misma posibilidad de ser seleccionados.

e) No tiene mayor importancia el criterio que se tome para determinar a cual intervalo pertenece
un elemento cuyo valor coincida con el limite de una clase.

f) La suma de las frecuencias absolutas es siempre igual a 1.

g) Mientras mayor es el número de intervalos elegidos para la formación de una distribución de


frecuencias, menor es la exactitud de los estadígrafos que se calculan.

h) Hi > hi (para todo i).

i) La marca de clase debe ser siempre un número entero y positivo.

6. Completa las siguientes frases.

a) La estadística que analiza los datos y los describe es .

b) Por medio de una investigación se recolectan los .

c) Por razones de costo y del tiempo que se gastaría en encuestar a todos los elementos de una ,
se recurre al .

d) Para obtener una aleatoria de la población, cada elemento debe tener


oportunidad de ser .
7. ¿En que nivel de medición se puede expresar cada una de estas variables?. Razone su respuesta:

a) Los estudiantes califican a su profesor de estadística en una escala de: horrible, no tan malo,
bueno, magnifico, dios griego.

b) Los estudiantes de una universidad se clasifican por especialidades, como marketing, dirección,
contabilidad, etc.

c) Los estudiantes se clasifican por especialidades con ayuda de los valores 1, 2, 3, 4, y 5.

d) Agrupar mediciones de líquidos en pinta, cuarto y galón.

e) Edades de los usuarios.


TEMA 2: TABLAS DE FRECUENCIA.

I. OBJETIVOS DE LA SESIÓN: aprender a agrupar los datos para facilitar los cálculos de los
estadígrafos.

II. TEMA:

Cuando los datos estadísticos de que se dispone son numerosos, es difícil realizar cálculos sobre
ellos. Por esta razón se organizan en tablas de manera de facilitar el trabajo.

Una tabla de frecuencia es la ordenación de la información obtenida de una muestra, en el estudio


de una sola variable.

Cuando se dispone de un gran número de datos, es útil distribuirlos en categorías dentro de una
tabla para facilitar el análisis. Se explicara con un ejemplo:

1. Veamos el caso de una variable discreta, pero antes se mencionaran las siguientes notaciones:

Ejemplo: en una encuesta de presupuesto familiar, se ha obtenido la siguiente información respecto


al n° de hijos en 2 familias.

Variable x = n° de hijos
Los datos son los siguientes:

3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3

x1 x2

Vemos que la variable x toma valores entre 0 y 4, es decir, existen en este grupo 5 categorías o clases.

Contamos el número de familias en cada categoría y formamos la tabla.


I. Ca
teg Frec. Frec. Absoluta Acum. Frec. Relativa hi Frec. Rel. Acum.
orí Absoluta Fi Hi
as fi
Xi
0 f1 = 2 f1 = 2 f1/n = 0.095 h1 = 0.095
1 f2 = 4 f1 + f2 = 6 f2/n = 0.190 h1 + h2 = 0.286
h1 + h2 + h3 = 0.619
2 f3 = 7 f1 + f2 + f3 = 13 f3/n = 0.333
h1 +........ + h4 =
3 f4 = 6 f1 +.......+ f4 = 19 f4/n = 0.285
0.904
h1 +........ + h5 =
4 f5 = 2 f1 +.......+ f5 = 21 f5/n = 0,095
1,000
Total n = 21 1.000

n = tamaño de la muestra

Xi = valor de la variable en el individuo i

fi = frecuencia absoluta: nº de veces que se repite la variable en la categoría i

Fi = frecuencia absoluta acumulada. Indica el nº de individuos hasta la categoría i

hi = frecuencia relativa. Porcentaje de la categoría respecto del total, se obtiene dividiendo la


frecuencia de la clase por el tamaño de la muestra.

Hi = frecuencia relativa acumulada. Porcentaje acumulado

Observamos algunos detalles importantes:

i) n es la suma de la columna fi, es decir, siempre debe dar como resultado el tamaño de la muestra.

ii) En la columna de frecuencia absoluta acumulada se va sumando los valores de la columna fi, por
lo tanto, el último valor debe ser igual a n.

iii) La columna frecuencia relativa (hi) representa en % de familias en cada categoría. Por ejemplo,
en las categorías con 3 hijos a un 28.5% de familias. Esta columna debe sumar 1.
iv) La Hi acumula los valores de la frecuencia relativa, por lo tanto, el último valor debe ser 1.
Ejemplo H4: el 90.4% de las familias encuestadas tienen a los más 3 hijos.

2. En el caso de analizar una variable continua, la tabla de frecuencia cambia sólo en el comienzo.
También sé vera en un ejemplo:

Salarios semanales de 40 personas en miles de pesos.

90 62 102 85 92 106 110 95 105 112


108 86 110 68 118 99 98 74 91 80
80 100 79 93 93 104 77 106 98 73
95 85 91 83 67 119 108 115 74 88

Efectuemos previamente los siguientes pasos.

i) Se busca el valor mínimo y el valor máximo Xmín = 62 Xmáx = 119

ii) Se calcula el rango: 119 – 62 = 57.


Rango: en todo conjunto de valores estadísticos hay valores extremos: el menor de todos y el mayor
de todos; la diferencia entre estos valores extremos se llama rango.

iii) La cantidad de intervalos no debe ser menor de 5 ni mayor de 18. Por lo general tiene el mismo
ancho. Una forma de calcular el nº de intervalos para generar la tabla de frecuencias es
mediante la siguiente formula: k = 1 + 3.322 x log (40) = 6.322
usamos k 6

iv) Se calcula la amplitud de cada intervalo c = rango / k = 57 / 6 = 9.5 10

v) Se construye la tabla:
Tabla 2.
Marca de Frec.
Intervalos
clase Absoluta Fi hi Hi
Yi-1 – Yi+1
Y1 fi
[60 – 70) 65 3 3 0,075 0,075
[70 – 80) 75 5 8 0,125 0,20
[80 – 90) 85 7 15 0,175 0,375
[90 – 100) 95 11 26 0,275 0.62
[100 –
105 8 34 0,20 0,85
110)
[110 –
115 6 40 0,15 1,00
120)
Total 40 1,00

El resto de las columnas se forman de la misma manera que la tabla 1.

n = tamaño de la muestra

Xi = valor de la variable en el individuo i

fi = frecuencia absoluta: nº de veces que se repite la variable en la categoría i

Fi = frecuencia absoluta acumulada. Indica el nº de individuos hasta la categoría i

hi = frecuencia relativa. Porcentaje de la categoría respecto del total, se obtiene dividiendo la


frecuencia de la clase por el tamaño de la muestra.

Hi = frecuencia relativa acumulada. Porcentaje acumulado

Yi = marca de clase: su valor es igual a la mitad de la suma de los límites inferior y superior
del intervalo de clase. En todos los análisis estadísticos su supone que el
valor de la marca de una clase es el valor que corresponde asignar a cada uno de los elementos
ubicados en ese intervalo.

C = amplitud del intervalo: la diferencia entre los límites reales de un intervalo.

Yi-1 = limite inferior del intervalo

Yi+1 = limite superior del intervalo


Ejercicios.

1. Determine para el ejercicio 1 la frecuencia relativa de familias con 2 hijos o menos y la frecuencia
relativa de familias que tienen más de 2 hijos y no más de 4.

2. Determine para el ejercicio 2 la frecuencia relativa de empresas citrícolas que tienen 18 o menos
plantas atacadas por el hongo. Calcule también la frecuencia relativa de empresas citrícolas que
tienen no menos de 18 plantas atacadas por el hongo.

3. El gerente de personal de una compañía registró el número de días que sus 50 empleados habían
tomado como licencia por enfermedad.

10 35 12 8 44 6 15 20 5 7
5 11 17 8 4 7 25 9 2 10
12 12 3 10 9 3 5 16 31 9
0 4 7 11 3 18 2 10 6 22
2 9 8 29 6 4 7 10 0 1

a) Identificar la variable y su clasificación.

b) Construir una tabla de frecuencia apropiada a estos datos.

4. Dada la siguiente tabla de frecuencias:

II. Clases fi
9 – 12 2
12 – 15 1
15 – 18 2
18 – 21 5
21 – 24 8
24 – 27 11
27 – 30 7
30 – 33 4
33 – 36 5
36 – 39 2
a) Determine las marcas de clases y la amplitud de las clases.

b) Determine las frecuencias absolutas acumuladas.

c) Determine las frecuencias relativas.

d) Determine las frecuencias relativas acumuladas.

5. En la tabla de frecuencia que se da a continuación faltan datos, complétela.

Valores fi Fi hi Hi
0 2
1 5
2 9
3 14 0.7
4 0,2
5
Totales

6. Completa la información que falta en la siguiente tabla.

Yi-1 - Yi Yi fi Fi hi Hi
- 100 2
150 7
0,2
0,8
30
Total

7. En la tabla de frecuencias siguiente faltan algunos datos, complétela:

III. Clases Yi fi Fi hi Hi
20 - 24 0,1
24 - 28 0,25
- 32 11 0,55
32 - 0,85
- 40 1,0
Total
8. De la siguiente tabla, interpreta algunos valores:
Los datos muestran los resultados obtenidos por un grupo de estudiantes en una prueba de
habilidad de lectura,

Xi-1 – Xi+1 Xi fi Fi hi Hi
[32 - 35) 33,5 5 5 0,04 0,04
35 – 38 36,5 12 17 0,11 0,15
38 – 41 39,5 18 35 0,16 0,31
41 – 44 42,5 19 54 0,17 0,48
44 – 47 45,5 26 80 0,23 0,71
47 – 50 48,5 19 99 0,17 0,88
50 – 53 51,5 13 112 0,12 1,00
n = 112 1,00

¿Cómo interpretas los números en negrita?


Tema 3: Gráficos

I. OBJETIVOS DE LA SESIÓN: que los alumnos sean capaces de representar las variables con
diferentes modelos de gráficos.

II. TEMA:

La entrega de información utilizando gráficos y dibujos es un método funcional que no solo sirve para
presentar datos sino también para expresar ideas que se desean destacar.

Los gráficos son las representaciones visuales de los datos en donde se evidencian fundamentalmente
3 características:
- forma
- acumulación o tendencia
- dispersión o variabilidad

Los gráficos no deben considerarse como sustitutos de un análisis estadístico, sino más bien como
una ayuda visual del comportamiento de los datos.

Existen diferentes tipos de gráficos: - barras


- histogramas y polígonos
- histogramas y ojivas
- circulares
- barras subliminales
- pictogramas
1. Barras:

Se construye sobre el sistema de ejes cartesianos. Es un procedimiento gráfico para representar los datos
nominales u ordinales. Para cada categoría se traza una barra vertical en que la
altura es la frecuencia absoluta de la categoría. El ancho de la barra es arbitrario.

También se utiliza si la variable en estudio es numérica discreta.


2. Histogramas y polígonos de frecuencia:

Se construyen sobre el sistema de coordenadas cartesianas. Se utiliza cuando la variable en estudio es


continua o esta agrupada en una tabla de frecuencia con intervalos en cada
categoría.

En el eje X se identifica la variable en estudio y en el eje Y sé gráfica la frecuencia absoluta o la frecuencia


relativa. Consiste en una serie de rectángulos en donde su altura depende del
valor de cada frecuencia.

Cada categoría de la variable se representa por una barra. El ancho de cada barra depende de la
amplitud del intervalo
.

3. Gráfico circular:

Esta es otra forma de representar los datos, en especial cuando se trata de cualidades. En un
gráfico dibujado dentro de un círculo.

Es necesario en primer lugar calcular el porcentaje de cada categoría respecto del total y luego
repartir proporcionalmente estos porcentajes en los 360° del círculo.

4. Barras subliminales:

Es un gráfico de barras muy apropiado para comprobar subdivisiones en la variable. Por ejemplo:
% de estudiantes en diferentes carreras, separadas por sexo. Cada barra es un 100%.

5. Pictogramas:

Un pictograma es la representación de datos estadísticos por medio de símbolos que por su


forma sugieren la naturaleza del dato.
Por ejemplo: producción de bicicletas (en miles.)
Ejercicios.

1. En una industria el informe de contabilidad muestra que la producción fue de


$62.600.000 y los gastos así: de administración $11.160.000, de materiales y energéticos
$15.650.000, salarios y prestaciones $18.780.000. Elabore con los datos un diagrama circular.

2. Utilizando un diagrama lineal represente la deuda externa de América Latina cuyos valores en
millones de US$ son:

1973 55.4 1978 141.6


1974 68.5 1979 169.2
1975 82.9 1980 207.1
1976 98.3 1981 279.1
1977 119.1 1982 312.0

3. La siguiente tabla presenta la distribución de frecuencias del número de kilómetros recorridos hasta
que se produjo la primera falla grave de motor en cierto modelo de vehículo.

Distancia recorrida (en


Frecuencia
miles de kms.)
0 – 20 8
20 – 40 13
40 – 60 18
60 – 80 27
80 – 100 36
100 – 120 48
120 – 140 35
140 – 160 18
160 – 180 4
180 – 200 4

a) Representar mediante un histograma la distribución de frecuencia.

b) Señalar en el histograma la región correspondiente a vehículos que no han sufrido averías serias en
los 100.000 kilómetros. ¿Qué proporción representa?.
c) Hallar aproximadamente el valor del kilometraje para el que han fallado la mitad de los vehículos.

d) ¿Qué forma tiene la distribución?.

4. Las siguientes medidas corresponden a las alturas de 50 niños.

1,56 1,59 1,63 1,62 1,65


1,61 1,59 1,51 1,62 1,62
1,53 1,49 1,57 1,54 1,53
1,59 1,58 1,57 1,47 1,64
1,55 1,59 1,53 1,56 1,53
1,47 1,57 1,60 1,54 1,56
1,50 1,62 1,59 1,62 1,54
1,68 1,52 1,62 1,59 1,49
1,65 1,53 1,59 1,56 1,54
1,58 1,52 1,63 1,56 1,62

a) Construir una distribución de frecuencias absolutas y relativas.

b) Obtener las correspondientes distribuciones de frecuencias acumuladas.

c) Representar las distribuciones anteriores mediante histogramas.

d) Dibujar los correspondientes polígonos de frecuencias.

e) Hallar a partir del polígono de frecuencias acumuladas la proporción de


observaciones entre 1,59 y 1,62 ambas inclusive.

f) ¿Qué conclusiones puede extraerse?

5. En una empresa se ha llevado a cabo un estudio sobre sueldos que se resumen en la siguiente tabla.

25 - 50 - 75- 100- 125- 150- 175- 200- 225-


sueldos
50 75 100 125 150 175 200 225 250
Hombres 202 231 687 833 375 192 101 38 21

Mujeres 99 202 246 121 96 35 21 8 4

Construir un gráfico de barras subliminales.


TEMA 4: Medidas de Tendencia Central

1. Estadígrafos de tendencia central:

Los estadígrafos de posición o de tendencia central son valores que se ubican al centro de un conjunto
de datos ordenados según su magnitud. Existen varios de estos estadígrafos y se
estudiaran de a uno, considerando si los datos se tienen no tabulados o tabulados

1.1 Media aritmética o promedio:

- datos no tabulados: se define como el cuociente que se obtiene al dividir la suma de los valores de la
variable por el n° de observaciones.

Ej. Edades de las personas

10, 18, 21, 32, 17, 27, 28, 20, 35, 31 n = 10

X= 19 + 18 + 21 + 32 +... + 31 = 24.8
10
1.2. Mediana:

Es otra medida de posición o tendencia central. Se define como aquel valor de la variable que supera la
mitad de las observaciones y a su vez es superado por la otra mitad de ellas. Por
esta razón, se la considera como el valor central, ya que se divide a los datos en
2 grupos (las observaciones deben estar ordenadas de mayor a menor).

- Datos no tabulados: se ordenan las observaciones de menor a mayor y se ubica el valor central. Si la
constante de datos (n) es par, se promedian los 2 valores centrales. En
cambio, si n es impar habrá solo un valor en el centro.

Ej. 3, 4, 4, 5, 6, 8, 8, 8, 10 n = 9 (n impar)

Mediana

5, 5, 7, 9, 11, 12, 15, 18 n = 8 (n par)

9 + 11 = 10 mediana
2

1.3 Moda:

Es un estadígrafo que puede definirse como el valor mas frecuente o el valor de la variable que presenta
la mayor frecuencia absoluta.

- Datos no tabulados: se busca el valor más repetido Ej.

3, 5, 5, 5, 3, 4, 7 Mo = 5
6, 3, 3, 6, 5, 8, 4 Mo = 3 y 6
Nos referiremos a algunas de sus características y las relaciones más importantes que hay entre
ellas:

De las 3 medidas de tendencia central, la media aritmética es muy sensible a los valores extremos, en
tanto que la mediana y la moda no son afectadas por los valores de los extremos.
Por ejemplo, en la serie 3, 5, 7, 7, 8 la media aritmética es igual a 6; si cambiamos
el valor extremo 8 por 18 se tiene la serie 3, 5, 7, 7, 18 cuya media aritmética es
igual a 8 es decir la media varió de 6 a 8.

La mediana por ser insensible a los valores extremos no cambia en ninguna de las 2 series
manteniendo su valor 7. La moda en ambas series es 7 por ser el valor más frecuente.
Ejercicios

1. El precio de 100 artículo es $185,7 en promedio, los artículos se dividen en dos grupos de precios
promedios $175,8 y $197,8. ¿Cuántos artículos hay en cada grupo?.

2. Dada la siguiente tabla.

Salario diario N° de
(miles $) obreros
0 – 3,0 10

3,0 – 4,0 16

4,0 – 5,0 35

5,0 – 6,0 26

6,0 – 7,0 13

a) ¿Cuál es el salario máximo que ganan diariamente el 30% de obreros con sueldos más bajos?.

b) ¿Qué % de obreros ganan mas de $5.500?

3. En una población hay 350 individuos con valores en la primera decil ¿cuántos individuos de la
población entre percentil 18 y la percentil 45?

4. Se prueban 2 tratamientos A y B para controlar un virus que ataca la hoja del tabaco. La hoja pierde
valor comercial mientras mayor sea el número de lesiones por hoja producida por el virus. La
medición del número de lesiones por hoja dio la siguiente tabla de frecuencia:
N° de Frecuencia A Frecuencia B

lesiones
/hoja
0 90 130
1 60 100
2 40 50
3 60 20
4 20 40
5 10 60
Total 280 400

a) ¿Cuál tratamiento es mejor para obtener más hojas con 0 lesiones?.


b) Calcule medidas estadísticas que le permitan comprar en la mejor forma la efectividad de ambos
tratamientos y coméntelas.

c) Construya un gráfico, que compare adecuadamente la efectividad de los tratamientos A y B.

5. La siguiente tabla muestra los tiempos de reacción (en seg.) de 250 perros sometidos a
anestésico inyectado:

Tiempo
Frecuencia
reacción (seg.)
[120 – 170) 20
[170 - 220) 35
[220 – 270) 85
[270 – 320) 50
[320 – 370) 30
[370- 420) 20
[420- 470) 10
Total 250

a) Calcule las medidas estadísticas que representen mejor esta información e interprételas.

b) ¿A los cuántos seg. reaccionara el 15% de los perros mas sensibles al anestésicos?.

c) ¿Cuántos de los 250 perros reaccionaran después de 5 minutos?


6. Un grupo de 200 personas viaja en 2 aviones, el primero de ellos lleva a 150
personas.
El peso promedio de las 200 personas es de 72,5 Kg. Los del segundo avión pesan en
promedio 3,8 Kg. menos que los del primer avión. ¿cuál es el peso promedio de los pasajeros de
cada uno de los aviones?.

7. La renta semanal media de los trabajadores de una fábrica es de $80.000, siendo $95.000 para
los administrativos y de $70.000 para los obreros. Calcule el porcentaje de administrativos y de
obreros que tiene la fábrica, si en total suman 120.

8. La tabla siguiente representa la distribución de frecuencias de las vidas medias de 400


ampolletas probadas en la empresa XXX.

Vida Media (horas) N ampolletas


300 – 399 14

400 – 49 46
500 – 599 58
600 – 699 76
700 – 799 68
800 – 899 62
900 – 999 48
1000 – 1099 22
Determinar:
a) Limite inferior de la quinta – 1199
1100clase. 6

b) Marca de clase de la tercera clase.

c) La frecuencia de la cuarta clase.

d) Porcentaje de ampolletas cuya vida media es de al menos 500 horas, pero menos de 1000
horas.

e) Número de ampolletas cuya vida media es superior a 600 horas.


9. Los gastos de publicidad son un componente significativo en el costo de los bienes que se
venden. La lista de abajo es una distribución de frecuencia que muestra los gastos en publicidad de
60 empresas de manufacturas.

Gastos en publicidad en
Nº de empresas
millones de $
25 – 35 6
35 – 45 10
45 – 55 21
55 – 65 16
65 – 75 8

a) Si las empresas que gastaron menos de 45 millones de pesos aumentan sus gastos en 13%, ¿cómo
se altera el promedio de gastos en publicidad?.

b) ¿Qué porcentaje de empresas gastas mas de 58 millones de pesos en publicidad?.

10. La siguiente información representa la distribución de los gastos en alimentación que


realizaron un conjunto de familias de Santiago durante el año 2001.

Gastos en miles de
Nº de familias
pesos
150 – 250 15

250 – 350 27

350 – 450 32

450 – 550 21

550 – 650 10
a) Para el presente año se espera que tal gasto se incremente en un 8%, mas un gasto fijo por cada
familia de 25 mil pesos. ¿Cómo varia el promedio del gasto en alimentación de las familias
estudiadas en el año 2002 con respecto al año 2001?.

b) A las familias que gastaron durante el año 2001 menos de 270 mil pesos se les dará en bono de 45
mil pesos a cada una y a las restantes se les dará un bono de 28 mil pesos a cada una. ¿Cuál es el
nuevo promedio?.

c) Se sabe que la relación de los ingresos de este grupo familiar y los gastos en alimentación durante
el año 2001 estuvo dada por:
I = 1.5 G +75
Se desea saber cual es el promedio de los ingresos durante el año 2001.

d) ¿Cuál es el gasto en alimentación que divide la muestra en partes iguales?.

e) ¿Qué porcentaje de familias que gastaron menos de 300 mil pesos?.

11. En un análisis de las llamadas telefónicas que salían a diario de una oficina, se determinó que
64 llamadas tenían un promedio de 2,3 minutos; 47 llamadas de entre 3 a 10 minutos,
promediaron 6,1 minutos y 4 llamadas de mas de 10 minutos demoraron en promedio 20,6
minutos. ¿cuál es el promedio d la duración de estas llamadas?.

12. En un año de biología hay 20 alumnos de 1er año, 18 de 2º año y 12 de 3er año. Los
promedios de notas en los alumnos de 1er y 2º son 68 y 75 respectivamente. ¿Cuál es el
promedio de los alumnos de 3eraño, si el promedio de toda la clase fue de 74,84 puntos?.
13. La siguiente tabla corresponde al monto de compras realizadas por la cartera de cliente de una
empresa en el 2001.

Ventas x (miles$) Nº de clientes

1,0 – 2,5 14

2,5 – 4,0 18

4,0 – 5,5 22

5,5 – 7,0 33

7,0 – 8,5 24

8,5 – 10,0 9

a) Suponiendo que las compras del año 2002 están dadas por la función y =
1,2x + 30. Calcular el promedio y varianza para el año 2002.

b) ¿Qué porcentaje de clientes compro mas de 7,5 (miles de $) el año 2001?.

c) ¿Cuál es le monto máximo del 25% de los clientes que compraron menos el año 2002?.
TEMA 5: ESTADÍGRAFOS DE DISPERSIÓN

1. Estadígrafos de dispersión.

La idea de dispersión se relaciona con la mayor o menor concentración de los datos en torno a un valor
central, generalmente la media aritmética.

1.1 Varianza:

Es la media aritmética de los cuadrados de las desviaciones. Se denota por S2. Este valor cuantifica el
grado de dispersión o separación de los valores de la distribución con respecto a
la media aritmética. A mayor dispersión mayor valor de la varianza, a menor
dispersión menor valor de la varianza.

- Datos no tabulados: tomamos como ejemplo los siguientes datos.

5, 8, 6, 7, 5, 6, 5

en primer lugar, se debe calcular el promedio aritmético: X = 5 + 8

+... + 5 = 42 = 6
7 7

S2 = (5 – 6)2 + (8 – 6)2 + (6 – 6)2 +... + (5 – 6)2


7

S2 = 1 + 4 + 0+... + 1 = 8 = 1,14
7 7

:
Datos tabulados

Intervalos
Yi-1 – Yi+1
Yi fi Yi2 Yi2 · fi

[60 – 70) 65 3 4225 12675


[70 – 80) 75 5 5625 28125
[80 – 90) 85 7 7225 50575
[90 – 100) 95 11 9025 99275
[100 –
105 8 11025 88200
110)
[110 –
115 6 13225 72350
120)
40 351200

S2 = 351200 – (93,5)2
40

S2 = 8780 – 8742,25

S2 = 37,75

• Propiedades de la varianza.

1) La varianza es siempre un valor positivo


n
S2 = (Xi – X)2 0
i=1
2) Sea Y = a x, entonces V(Y) = V(a x) = V(x). Si a una variable se le suma o resta una constante, la
varianza permanece igual.

3) Sea Y = a·x, entonces V(Y) = V(a·x) = a2 V(x). Si una variable se le multiplica por una constante, la
varianza cambia multiplicándose por la constante al cuadrado.

Ejemplo: 80 empleados de una compañía tienen un sueldo promedio de $125.000 y una varianza de
$12.000. Si reciben un reajuste del 20%, calcular la nueva varianza.

Si se realizara un reajuste del 20% la constante será 1,2

V(x 1,2) = (1,2)2 V(x)


= 1,44 12.000
= $17.280
2.2 Desviación estándar:

Se designa la varianza por la letra S y se define como la raíz de la varianza.


S S2
En el ejemplo de la tabla 2 la desviación estándar es S 204 14,28

La desviación estándar es mas usada que la varianza. Una de sus utilidades es medir la
concentración de los datos respecto a la media aritmética.
Para distribuciones normales:

- el 68,27% de los datos están comprendidos en el rango


- el 95,45% de los datos están comprendidos en el rango
- el 99,73% de los datos están comprendidos en el rango

2.3 Coeficiente de variación:

Las medidas de dispersión que se han estudiado anteriormente son medidas absolutas y se expresan
en las mismas unidades con las que se mide la variable.
Si se necesita comparar dos o más grupos de datos medidos con diferentes unidades, por lo general,
no es posible la comparación utilizando la dispersión absoluta. Por ejemplo, una
serie de precios en dolares con una serie de precios en pesos.
Para estos casos se usa la dispersión relativa:

Dispersión relativa = dispersión absoluta


Media

Si en el caso particular de usar la desviación estándar (S) como dispersión absoluta y la media aritmética
( X ), recibe el nombre de coeficiente de variación:

S
100
X

2.4 Desviación media.

La desviación media es una medida de dispersión bastante objetiva, es decir mientras más dispersos
están los datos mayor es la desviación media, pero no muestra si están bajo X , ya que tomamos su valor
absoluto.
Ejercicios.

1. Supongamos que un grupo de profesionales en un país A tienen un salario promedio de US$26.888


y varianza US$14.400. En un país B otro grupo de profesionales con iguales características reciben
un salario promedio de US$8.570 con desviación estándar de US$80.
¿Cuál grupo de salarios presenta una menor variabilidad?.

2. En un inventario realizado en la bodega de un almacén se encontraron 200 artículos que fueron


importados a diferentes precios (en dólares)

Xi fi
20,5 20
32,0 30
48,6 50
50,0 60
60,4 40
200

a) Calcular la desviación estándar.

b) Calcular le desviación media

c) Calcular coeficiente de variación


3. En el primer semestre de este año 30 empresas tuvieron en promedio $374 millones en gastos con
una varianza de $80 millones. Por un error cada una de las empresas no contabilizó $7 millones en
los gastos. Corregir el promedio y la varianza.

4. 80 empleados de una compañía tiene un salario promedio de $125.000 y una varianza $12.000. Si
reciben un reajuste del 20%. Calcular el nuevo promedio y varianza.

5. Se administra un antibiótico al ganado para combatir cierta enfermedad, el peso (en gramos) del
antibiótico depende del peso del animal, el cual debe ser medido con mucha precisión, puesto que
una sobredosis puede ser perjudicial para el animal. A continuación se muestra la distribución de
frecuencia del peso de las dosis.

Peso (gramos) fi

15 – 20 7

20 – 25 25

25 – 30 31

30 – 35 20

35 – 40 11

a) Calcular los estadígrafos de posición y dispersión que le parezcan adecuados (no todos),
explique su decisión.

b) Investigadores afirman que una dosis con peso mayor o igual a 30 gr. sería peligroso. Según la
información de que dispone, ¿qué porcentaje de la dosis se clasifica como peligrosa?.

c) Construya histograma y polígono de frecuencias asociado a los datos.

6. Use sus conocimientos para completar las siguientes frases.

a) Si calculo la media de los valores absolutos de las desviaciones de las observaciones respecto a
la media de ellas, obtenga el valor de .
b) Si calculo la media del cuadrado de las desviaciones de las observaciones respecto a la media
aritmética de ellas, obtengo el valor de .

c) Si debo comparar el grado de variabilidad de dos series de o0bservaciones, debo utilizar


dispersiones que se obtienen dividiendo la por la
.

d) Si mido la estatura y el peso de una serie de alumnos, para determinar cual de las dos series de
valores tiene mayor grado de variaciones debo utilizar medidas de
.

e) Una variable normalizada o o simplemente calificación


indicada a cuantas unidades de desviación estándar esta una puntuación
.

f) Si X 21 y s = 3, la puntuación X = 18 esta .

g) José obtuvo calificación Z = -0,82 y Luis –0,78, entonces el resultado obtenido por es mejor que el
obtenido por .

7. Un postulante presento examen de admisión a dos universidades; en la universidad A obtuvo 325


puntos y en ella la calificación media fue de 305 puntos con desviación estándar de 26. En la
universidad B obtuvo 210 puntos y en ella la calificación media fue de 195 puntos con desviación
estándar de 18. Halle en que examen fue mejor el resultado.

8. En una prueba deportiva la media para varones es 140 puntos con una desviación estándar 24; para
mujeres la media es 162 con una desviación 22. Ana y su hermano Juan participaron en el evento; Juan
obtuvo 151 puntos y Ana 171. Hallar:

a) Quien tuvo el mejor resultado.

b) El rango percentil de Juan y el rango de Ana.

También podría gustarte