Estadística Anillado

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 78

INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Docente: Karen Yulisa Gandarillas Choque

1
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

¿Qué es la estadística?

La estadística es la ciencia que se ocupa de desarrollar y estudiar métodos para


recolectar, analizar, interpretar y presentar datos empíricos, tal y como se explica.
Es un campo altamente interdisciplinario: la investigación en estadística encuentra
aplicabilidad en prácticamente todos los campos científicos y las cuestiones de
investigación en los diversos campos científicos motivan el desarrollo de nuevos
métodos y teorías estadísticas.

Dos ideas fundamentales en el campo de la estadística son la incertidumbre y la


variación. Hay muchas situaciones que encontramos en la vida en las que el
resultado es incierto.

En algunos casos la incertidumbre se debe a que el resultado en cuestión no está


determinado todavía (por ejemplo, podemos no saber si lloverá mañana), mientras
que en otros casos la incertidumbre se debe a que, aunque el resultado ya ha sido
determinado, no lo sabemos (por ejemplo, podemos no saber si hemos aprobado
un examen en particular).

Conceptos básicos de estadística


Vamos a imaginarnos que estamos en un colegio con 200 alumnos y se
necesita realizar un estudio estadístico sobre los alumnos que aprueban
matemáticas en un año.

Con respecto a los elementos del estudio los conceptos básicos de estadística son:

 Población
 Muestra
 Individuo
Por otro lado, en referencia a los resultados que se obtienen en el estudio tenemos:

 Valor
 Dato
 Muestreo

2
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Población:

A todos los elementos a los que le realizaremos en el estudio se les llama población.
En nuestro ejemplo, la población es el conjunto de todos los alumnos, es decir, los
200 alumnos.

No debes confundir este concepto con la población de una ciudad por ejemplo. La
población no tiene por qué ser siempre personas. Población son todos los
elementos a los que le vamos a hacer un estudio, independientemente de lo que
sea, ya sean piezas de una fábrica, animales, datos de cualquier tipo…

Muestra:
Se decide que de los 200 alumnos, van a escoger solamente a 50 para realizarles
una serie de preguntas. Estos 50 alumnos serían una muestra de la población, que
eran 200 alumnos. Por tanto, se le llama muestra a una parte que es representativa
de la población. La muestra siempre será más pequeña que la población.

3
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Individuo:
A cada uno de los alumnos del colegio, estadísticamente hablando se les llaman
individuos.

Las muestras y las poblaciones están formadas por individuos ejemplo

La muestra está formada por 50 individuos, es decir, por 50 alumnos y la población


por 200 individuos.

Valor:
El valor es el resultado de cada uno de los datos del estudio.
En nuestro ejemplo, estamos realizando un estudio sobre la cantidad de alumnos
que aprueban las matemáticas. Entonces, podemos tener dos valores diferentes por
cada dato:

 Sí aprueba
 No aprueba
Dato y variable:
Se le llama dato a cada uno de los valores obtenidos después de realizar el estudio
estadístico y variable al tipo de dato, que son una determinada característica de la
población (número de hijos, estatura, peso, color, profesión, etc).
Por ejemplo, empezamos estudiando a 3 alumnos y obtenemos estos datos:

 Alumno 1: aprobado
 Alumno 2: suspenso
 Alumno 3: suspenso
En total, 1 «aprobado» y 2 «suspenso».

Tenemos 3 datos y cada uno de los datos puede tomar 2 valores («aprobado» o
«suspenso»). La variable estudiada en este caso es la calificación de la asignatura.

Dentro de una población se pueden recoger datos de diferentes variables. Por


ejemplo, a los vecinos de un edificio se les puede preguntar su peso, el color de
ojos, si son hombre o mujer…

4
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

¿Porque muestrear la población?


 Costos reducidos:
Los gastos de recogida y tratamiento de os datos serán menores
 Mayor rapidez
En ocasiones se necesitara mucho tiempo para entrevistar a toda la
población
 Más responsabilidad
Por la naturaleza destructiva de ciertas pruebas
Por la imposibilidad física de revisar todos los integrantes de una población.
Muestreo:
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos
los elementos de una población), se selecciona una muestra, entendiendo por tal
una parte representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica, cuya
función básica es determinar que parte de una población debe examinarse, con la
finalidad de hacer inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en la que se
reproduzca de la mejor manera los rasgos esenciales de dicha población que son
importantes para la investigación. Para que una muestra sea representativa, y por
lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la
población, es decir ejemplificar las características de ésta.
Los errores más comunes que se pueden cometer son:
 Hacer conclusiones muy generales a partir de la observación de sólo una
parte de la Población, se denomina error de muestreo.
 Hacer conclusiones hacia una Población mucho más grandes de la que
originalmente se tomó la muestra. Error de Inferencia.
En la estadística se usa la palabra población para referirse no sólo a personas si no
a todos los elementos que han sido escogidos para su estudio y el término muestra
se usa para describir una porción escogida de la población.

Tipos de muestreo:
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo,
aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo
probabilísticos y métodos de muestreo no probabilísticos.

5
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio
de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la
misma probabilidad de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamaño n tienen la misma
probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos
nos aseguran la representatividad de la muestra extraída y son, por tanto, los más
recomendables. Dentro de los métodos de muestreo probabilísticos encontramos
los siguientes tipos:
1.- Muestreo aleatorio simple:
El procedimiento empleado es el siguiente:
a) Se asigna un número a cada individuo de la población
b) A través de algún medio mecánico (bolas dentro de una bolsa, tablas de
números aleatorios, números aleatorios generados con una calculadora u
ordenador, etc.) Se eligen tantos sujetos como sea necesario para completar
el tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica
cuando la población que estamos manejando es muy grande.
2.- Muestreo aleatorio sistemático:
Este procedimiento exige, como el anterior, numerar todos los elementos de la
población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se
parte de ese número aleatorio i, que es un número elegido al azar, y los elementos
que integran la muestra son los que ocupa los lugares es decir se toman los
individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre
el tamaño de la muestra:
k= N/n.

El número que empleamos como punto de partida será un número al azar entre
1 y k. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades
en la población ya que al elegir a los miembros de la muestra con una periodicidad
constante (k) podemos introducir una homogeneidad que no se da en la población.
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos
en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un
muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres
o sólo mujeres, no podría haber una representación de los dos sexos.
3.- Muestreo aleatorio estratificado:
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los
procesos y suelen reducir el error muestral para un tamaño dado de la muestra.
Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen

6
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

gran homogeneidad respecto a alguna característica (se puede estratificar, por


ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.).
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los
estratos de interés estarán representados adecuadamente en la muestra. Cada
estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que
formarán parte de la muestra. En ocasiones las dificultades que plantean son
demasiado grandes, pues exige un conocimiento detallado de la población.
(Tamaño geográfico, sexos, edades,...).
La distribución de la muestra en función de los diferentes estratos se denomina
afijación, y puede ser de diferentes tipos:
 Afijación Simple: A cada estrato le corresponde igual número de elementos
muéstrales.
 Afijación Proporcional: La distribución se hace de acuerdo con el peso
(tamaño) de la población en cada estrato.
 Afijación Óptima: Se tiene en cuenta la previsible dispersión de los
resultados, de modo que se considera la proporción y la desviación típica.
Tiene poca aplicación ya que no se suele conocer la desviación.
4.- Muestreo aleatorio por conglomerados:
Los métodos presentados hasta ahora están pensados para seleccionar
directamente los elementos de la población, es decir, que las unidades muéstrales
son los elementos de la población.
En el muestreo por conglomerados la unidad muestral es un grupo de elementos de
la población que forman una unidad, a la que llamamos conglomerado. Las
unidades hospitalarias, Los departamentos universitarios, una caja de determinado
producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son áreas geográficas suele hablarse de "muestreo por áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
número de conglomerados (el necesario para alcanzar el tamaño muestral
establecido) y en investigar después todos los elementos pertenecientes a los
conglomerados elegidos.

Métodos de muestreo no probabilísticos:

A veces, para estudios exploratorios, el muestreo probabilístico resulta


excesivamente costoso y se acude a métodos no probabilísticos, aun siendo
conscientes de que no sirven para realizar generalizaciones (estimaciones
inferenciales sobre la población), pues no se tiene certeza de que la muestra

7
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

extraída sea representativa, ya que no todos los sujetos de la población tienen la


misma probabilidad de se elegidos. En general se seleccionan a los sujetos
siguiendo determinados criterios procurando, en la medida de lo posible, que la
muestra sea representativa.
En algunas circunstancias los métodos estadísticos y epidemiológicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabilístico, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la población.
Entre los métodos de muestreo no probabilísticos más utilizados en investigación
encontramos:
1.- Muestreo por cuotas:
También denominado en ocasiones "accidental". Se asienta generalmente sobre la
base de un buen conocimiento de los estratos de la población y/o de los individuos
más "representativos" o "adecuados" para los fines de la investigación. Mantiene,
por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el
carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de
individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos
de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la
cuota se eligen los primeros que se encuentren que cumplan esas características.
Este método se utiliza mucho en las encuestas de opinión.
2.- Muestreo intencional o de conveniencia:
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras "representativas" mediante la inclusión en la muestra de grupos
supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales
de zonas que en anteriores votaciones han marcado tendencias de voto.
También puede ser que el investigador seleccione directa e intencionadamente los
individuos de la población. El caso más frecuente de este procedimiento el utilizar
como muestra los individuos a los que se tiene fácil acceso (los profesores de
universidad emplean con mucha frecuencia a sus propios alumnos).
3.- Bola de nieve:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así
hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente
cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas,
determinados tipos de enfermos, etc.
4.- Muestreo Discrecional · A criterio del investigador los elementos son elegidos
sobre lo que él cree que pueden aportar al estudio.

8
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

9
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Ejemplo 1:
Suponga que estamos investigando sobre el porcentaje de alumnos que trabajan
de una población de 20 alumnos de la Universidad de Tacna Base de datos de la
población:

Nombre Alumno ¿Trabaja?


Juan SI

María NO
Alicia NO
Fernanda NO
Pedro NO
Julio SI

Marcos NO
Rosa NO
Alberto SI
Fabián NO
Jorge SI
Ana NO
José NO
Laura NO
Carlos NO
Enrique NO
Miguel NO
Carmen SI
Victoria SI
Marcelo SI

Elija una muestra aleatoria simple de tamaño n=4 de esta población. Use la tabla
de números aleatorios adjunta, empiece en la fila 1 columna 1 y continúe
seleccionando hacia la derecha. Indique los pasos para elegir la muestra.

1-5 6-10 11-15 16-20 21-25 25-30 31-35 36-40 41-45 46-50
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672

10
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Respuesta:
Primero:
Asignamos número a cada alumno del 1 al 20:
Número Nombre ¿Trabaja?

Alumno

1 Juan SI

2 María NO
3 Alicia NO
4 Fernanda NO
5 Pedro NO
6 Julio SI

7 Marcos NO
8 Rosa NO
9 Alberto SI
10 Fabián NO
11 Jorge SI
12 Ana NO
13 José NO
14 Laura NO
15 Carlos NO
16 enrique NO
17 miguel NO
18 Carmen SI
19 Victoria SI
20 Marcelo SI
Segundo:
Buscamos en la tabla de números aleatorios 4 números, de dos dígitos, entre el 1 y
el 20, sin repetir.

11
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Tabla de números aleatorios:


columna 1-5 6-10 11-15 16-20 21-25 25-30 31-35 36-40 41-45 46-50

fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 7004
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672

Los números seleccionados son: 10, 1, 11, 20.


Por lo tanto, la muestra está compuesta por:
*10: Victoria que SI trabaja.
*1: Juan que SI trabaja.
*11: María que NO trabaja.
*20: Marcelo que SI trabaja.

Indique cuál es el Parámetro y cuál es el Estadístico en (a).


Respuesta:
El Parámetro es el porcentaje de alumnos que trabajan en la población de tamaño
N=20 alumnos, es decir:

n de personas que trabajan


F =
N
F= 7/20 = 0,35= 0,35 *100 = 35%
El Estadístico es el porcentaje de alumnos que trabajan en la muestra de tamaño
n=4 alumnos, es decir:
n de personas que trabajan
F =
N
F= 3/4 = 0,75= 0,75 *100 = 75%

Elija una muestra estratificada de tamaño n=4 de esta población. Use la tabla de
números aleatorios, en cada alternativa empiece en la fila 1 columna 1 y continúe
Seleccionando hacia la derecha. Indique los pasos para elegirla muestra.

12
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Nombre ¿Trabaja?
Alumno
Juan SI

María NO
Alicia NO
Fernanda NO
Pedro NO
Julio SI

Marcos NO
Rosa NO
Alberto SI
Fabián NO
Jorge SI
Ana NO
José NO
Laura NO
Carlos NO
enrique NO
miguel NO
Carmen SI
Victoria SI
Marcelo SI
Respuesta:
Para elegir una muestra estratificada, primero se dividen los hombres de las mujeres
y se asignan número de identificación a cada estrato:

13
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

ESTRATO MUJERES
ESTRATO DE HOMBRE
NUMERO NOMBRE DE LA
ALUMNA NUMERO NOMBRE DEL
ALUMNO
1 Alicia
1 Juan
2 Victoria
2 Pedro
3 María
3 Marcos
4 Fernanda
4 Alberto
5 Rosa
5 Jorge
6 Ana
6 José
7 Laura
7 Carlos
8 Carmen
8 Miguel

9 Julio

10 Fabián

11 Enrique

12 Marcelo

Usando la tabla de números aleatorios, se elige una muestra aleatoria simple de


tamaño n=2 de los hombres, buscando números del 1 al 12. Se parte de la fila 1
columna 1. Se usan dos dígitos.

columna 1-5 6-10 11-15 16-20 21-25 25-30 31-35 36-40 41-45 46-50
fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672

Los números elegidos son: 10 y 1. Por lo tanto la muestra del estrato de hombres
queda constituida por Fabián y Juan. Fabián NO trabaja y Juan SI trabaja. Usando
la tabla de números aleatorios, se elige una muestra aleatoria simple de tamaño n=2

14
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

de las mujeres, buscando números del 1 al 8.Se parte de la fila 1 columna 1. Se usa
un dígito.

columna 1-5 6-10 11-15 16-20 21-25 25-30 31-35 36-40 41-45 46-50
fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672

Los números elegidos son: 1 y 4. Por lo tanto, la muestra del estrato de mujeres
queda constituida por Alicia y Fernanda. Alicia y Victoria NO trabajan .Por lo
tanto, la muestra final queda constituida por Fabián, Juan, Alicia y Fernanda.
Finalmente, la proporción de alumnos que trabaja en la muestra estratificada es
de 25%.

¿Qué es una variable en estadística?

• La variable estadística se refiere a una característica o cualidad de un


individuo que está propenso a adquirir diferentes valores. Estos valores se
caracterizan por poder medirse.

• Por ejemplo, el color de pelo de una persona, las notas de un examen, sexo,
estatura de una persona, etc.

Tipos de variables estadística:


• Los tipos de variable estadística se dividen de acuerdo a las
características que la definan, entre ellas podemos encontrar los
siguientes tipos.
• Las variables se clasifican en cualitativas y cuantitativas.

15
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Variable cualitativa
• Las variables cualitativas son aquellas características o cualidades que no
pueden ser calculadas con números, sino que lo hacen con palabras.
• Este tipo de variable, a su vez se divide en las siguientes:
• Cualitativa nominal: Aquellas variables que no siguen ningún orden en
específico. Por ejemplo: Colores (Negro, Naranja, Amarillo).
• Cualitativa ordinal: Aquellas que siguen un orden o jerarquía. Por ejemplo:
Nivel socioeconómico (Alto, medio, bajo).
• Cualitativa binaria: En este caso, las variables son solamente dos. Por
ejemplo: Si o No, Hombre o Mujer.
Variable cuantitativa

• Las variables cuantitativas son aquellas características o cualidades que sí


pueden expresarse y medirse a través de números.
• Este tipo de variable a su vez se divide en:
• Cuantitativa discreta: Aquella variable que usa valores enteros y no finitos.
Por ejemplo: La cantidad de familiares que tiene una persona (2, 3, 4 ó más)
• Cuantitativa continúa: Aquella variable que utiliza valores finitos y objetivos.
Suele caracterizarse por utilizar valores decimales. Por ejemplo: El peso de
una persona (64.3 Kg, 72.3 Kg, etc).

16
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Ejemplos de variable estadística

• Los ejemplos de la variable estadística se dividen de acuerdo al tipo de


variable del que se trate. Veamos cuáles son los ejemplos que caracterizan
a cada uno de estos tipos de variable estadística:

• Variables cualitativas
• Nominal: Color de pelo de una persona: Castaño, Rubio o Morocho.
• Ordinal: La condición de un pasaporte: Aprobado, Negado, En Espera.

• Binaria: Si una persona posee hogar propio: Si ó No.


• Variables cuantitativas
• Discreta: La cantidad de primos que tienen una persona: 2, 4, 6, 8.

• Continúa: La estatura de una persona: 1,65.

Los datos estadísticos


• Gracias a la estadística se obtienen datos que se organizan, se clasifican y
se analizan hasta obtener conclusiones para, posteriormente, tomar
decisiones.

• Los datos pueden ordenarse en forma creciente (de menor a mayor) o


decreciente (de mayor a menor); una vez ordenados, se registra el número
de veces que se repite un dato (frecuencia absoluta). Asimismo, si la cantidad
de datos es extensa, conviene agruparlos en intervalos de 3, 5, 7 o más
(amplitud del intervalo), según el número de datos.

Frecuencias estadísticas
• Frecuencia Absoluta ( fi )
• Frecuencia Relativa Simple ( hi)
• Frecuencia Relativa Porcentual (hi%)
• Frecuencia Acumulada (Fi)

• Frecuencia Relativa Acumulada (Hi)


• Frecuencia Relativa Acumulada
• Porcentual (Hi%)

17
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

La frecuencia absoluta.- Es el número de veces que aparece un


determinado valor en un estudio estadístico Se representa por fi.
La suma de las frecuencias absolutas es igual al número total de datos, que se
representa por N.
Formula:

Ejemplo:

• Durante el mes de julio, en una ciudad se han registrado las siguientes


temperaturas máximas:

• 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29,
29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
• En la primera columna de la tabla colocamos las variables ordenadas de
mayor a menor y en la segunda anotamos la frecuencia absoluta
Tabla

xi fi
27 1
28 2
29 6
30 7
31 8
32 3
33 3
34 1
31
Frecuencia relativa simple (hi)

18
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Es el cociente de la Frecuencia Absoluta “fi” entre el total de datos “n”: así;

Hi = fi
n
Ejemplo:
Sea las notas de 10 alumnos en una prueba Pre test:
Xi= 12, 11, 10, 12, 13, 12, 10, 13, 12,13

Xi fi hi
10 2 0.2
11 1 0.1
12 4 0.4
13 3 0.3
total 10 1
Frecuencia relativa porcentual (hi%)

Es el producto de la frecuencia Absoluta “fi” por 100% entre el total de datos “n”asi;

Hi = fi x 100%
n
Ejemplo:
Sea las notas de 10 alumnos en una prueba Pre test:
Xi= 12, 11, 10, 12, 13, 12, 10, 13, 12,13

Xi fi hi hi%
10 2 0.2 20%
11 1 0.1 10%
12 4 0.4 40%
13 3 0.3 30%
Total 10 1 100%
“n”

Frecuencia acumulada (Fi):

Es la suma de todas las frecuencias absolutas anteriores a ella. Asi;

19
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Fi= f1 + f2 + f3 +…….+ fi
Ejemplo:
Sea las notas de 10 alumnos en una prueba Pre test:
Xi= 12, 11, 10, 12, 13, 12, 10, 13, 12,13

Xi Fi hi hi% Fi
10 2 0.2 20% 2
11 1 0.1 10% 3
12 4 0.4 40% 7
13 3 0.3 30% 10
Total 10 1 100%
“n”

Frecuencia relativa acumulada (Hi)

Es la suma de todas las frecuencias Relativas simples anteriores a ella. Así;

Hi = h1+h2+h3+…..+ hi
Ejemplo:
Sea las notas de 10 alumnos en una prueba Pre test:

Xi= 12, 11, 10, 12, 13, 12, 10, 13, 12,13

Xi fi hi hi% Fi Hi
10 2 0.2 20% 2 0.2
11 1 0.1 10% 3 0.3
12 4 0.4 40% 7 0.7
13 3 0.3 30% 10 1
Total 10 1 100%
“n”
Frecuencia relativa acumulada porcentual (Hi%)

Es la suma de todas las frecuencias Relativas Porcentuales anteriores a ella, Asi;

HI%=h1%+hi2%+hi3%+…..+hi%
Ejemplo:

20
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Sea las notas de 10 alumnos en una prueba Pre test:

Xi= 12, 11, 10, 12, 13, 12, 10, 13, 12,13

Xi fi hi hi% Fi Hi Hi%
10 2 0.2 20% 2 0.2 20%
11 1 0.1 10% 3 0.3 30%
12 4 0.4 40% 7 0.7 70%
13 3 0.3 30% 10 1 100%
Total 10 1 100%
“n”

Ejemplo;
Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los
siguientes resultados: Con los resultados obtenidos, elaborar una tabla de
frecuencias.

negro azul amarillo rojo azul


azul rojo negro amarillo rojo
Rojo amarillo amarillo azul rojo
Negro azul Rojo negro amarillo

Solución:

En la primera columna, colocamos los valores de nuestra variable, en la segunda la


frecuencia absoluta, luego la frecuencia acumulada, seguida por la frecuencia
relativa, y finalmente la frecuencia relativa acumulada. Por ser el primer problema,
no haremos uso de las frecuencias porcentuales.

Xi fi hi Hi%
Negro 4 4 0,20

Azul 5 9 0,25

Amarillo 5 14 0,25

Rojo 6 20 0,30

Total 20 1

21
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Ejemplo 2:

• En una tienda de autos, se registra la cantidad de autos Toyota vendidos en


cada día del mes de Setiembre.
• 0; 1; 2; 1; 2; 0; 3; 2; 4; 0; 4; 2; 1; 0; 3; 0; 0; 3; 4; 2; 0; 1; 1; 3; 0; 1; 2; 1; 2; 3
• Con los datos obtenidos, elaborar una tabla de frecuencias.
Solución:
En la primera columna, colocamos los valores de nuestra variable, en la segunda
la frecuencia absoluta, luego la frecuencia acumulada, seguida por la frecuencia
relativa, y finalmente la frecuencia relativa acumulada. Ahora vamos a agregar
la columna de frecuencia porcentual, y frecuencia porcentual acumulada.

Xi fi hi hi% Fi Hi Hi%
0 8 8 0,267 0,267 26,7% 26,7%
1 7 15 0,233 0,500 23,3% 50,0%
2 7 22 0,233 0,733 23,3% 73,3%
3 5 27 0,167 0,900 16,7% 90,0%
4 3 30 0,100 1 10,0% 100%
Total 30 1 100%

Ejercicio 1:

Se le pidió a un grupo de personas que marque la imagen de su bebida preferida,


y los resultados fueron: Con los resultados obtenidos, elaborar una tabla de
frecuencias.

22
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Ejercicio 2:

Elaborar una tabla de frecuencias a partir de las temperaturas máximas


registradas en el mes de agosto en la ciudad de Puno:
Temperaturas:

17 18 15 16 19
20 16 18 17 18
19 17 15 16 19

16 20 18 17 16
20 15 19 18 20
18 16 17 15 19

19
Elabore una tabla de frecuencias, agregando la frecuencia porcentual y la
frecuencia porcentual acumulada.

Ejercicio 3:

23
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo


los siguientes resultados:
negro azul amarillo rojo azul
azul rojo negro amarillo rojo

rojo amarillo amarillo azul rojo


negro azul rojo negro amarillo
Con los resultados obtenidos, elaborar una tabla de frecuencias.

Grafico estadístico

El siguiente paso, después de haber recogido y ordenado los datos en una tabla,
suele ser la representación gráfica de los mismos, usando alguno de los diversos
tipos de gráficos estadísticos. La representación gráfica debe ser lo
suficientemente clara y precisa para que de un vistazo obtengamos información
relevante acerca de la distribución de los datos.

Existen diversos tipos de gráficos y sería muy prolijo enumerarlos a todos.


Vamos a tratar los más usuales y pondremos algún ejemplo de los demás.

 Diagrama de barras: se usa en variable discreta, cuando los datos están


separados entre sí. Consiste en colocar en el eje OX los valores de la variable
estadística y sobre cada uno de ellos levantar una línea o barra, cuya altura
sea igual a la frecuencia absoluta de ese valor.

 Histograma: es equivalente al diagrama de barras, pero para variable


continua o cuando los datos están agrupados en intervalos. Sobre el eje OX
se colocan los distintos intervalos o clases y sobre cada uno de ellos se
levanta un rectángulo de altura igual a la frecuencia absoluta del intervalo:

24
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

También podemos elaborar ambos tipos de gráficos para las frecuencias


acumuladas, obteniendo gráficos en escalera, como en el siguiente ejemplo (se
llaman en escalera porque al ir acumulando las frecuencias absolutas, cada
rectángulo es mayor que el anterior y se obtiene algo parecido a una serie de
escalones):

O representar dos histogramas de la misma variable en dos situaciones


distintas:

 Polígono de frecuencias: son líneas poligonales que unen los vértices superiores
de las barras de un diagrama de barras o de los rectángulos en un histograma:

25
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

También se pueden presentar sin barras ni rectángulos, en este caso, cada


vértice da la línea poligonal corresponde con una frecuencia absoluta:

 Diagrama de sectores: es un tipo de gráfico muy adecuado para representar


cualquier tipo de variable. Consiste en un círculo dividido en sectores
circulares, que se corresponden con los distintos datos o intervalos de la
variable, de forma que el área o número de grados de cada sector es
proporcional a la frecuencia absoluta de cada dato o clase. Pueden estar en
2 o 3 dimensiones.

Para calcular la amplitud de cada sector circular, debemos multiplicar la


frecuencia relativa de cada dato o clase por 360º y así obtendremos el nº
de grados que debe tener cada sector

Un diagrama de sectores en 3D podría ser como el siguiente, en el que se


representan, en porcentajes, las distintas edades de los alumnos de una
clase:

26
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

 Otros gráficos estadísticos: además de todos los anteriores, se suelen usar otros
gráficos, tales como:

Pirámides de población

Cartogramas

Pictogramas

27
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Series cronológicas o temporales

EJERCICIOS DE DISTRIBUCIÓN DE FRECUENCIAS

1. Se ha realizado una encuesta en 30 hogares en la que se les pregunta el nº de


individuos que conviven en el domicilio habitualmente. Las respuestas obtenidas
han sido las siguientes:

4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
a) Calcule la distribución de frecuencias de la variable obteniendo las frecuencias
absolutas, relativas y sus correspondientes acumuladas.
b) ¿Qué proporción de hogares está compuesto por tres o menos personas? ¿Qué
proporción de individuos vive en hogares con tres o menos miembros?
c) Dibuje el diagrama de frecuencias absolutas y el diagrama de frecuencias
acumuladas.

28
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

d) Agrupe por intervalos de amplitud 2 los valores de la variable, calcule su


distribución de frecuencias y represente con los correspondientes gráficos las
frecuencias absolutas y acumuladas.

2. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha


observado el número de empleados que hay en cada una de ellas para un estudio
posterior. Las observaciones obtenidas han sido:

12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13,14,15, 11, 11, 12, 16, 17, 17,16,16, 15,
14, 12, 11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13,
13, 15, 13, 11, 12.
a) Calcule la distribución de frecuencias de la variable obteniendo las frecuencias
absolutas, relativas y sus correspondientes acumuladas.
b) ¿Qué proporción de sucursales tiene más de 15 empleados?
c) Dibuje el diagrama de barras y el diagrama acumulativo de frecuencias
correspondientes.
d) Agrupe en intervalos de amplitud 3 los valores de la variable, calcule su
distribución de frecuencias y represente su histograma y su polígono de frecuencias
acumuladas.
e) Agrupe la variable en los intervalos que considere conveniente de amplitud
variable, calcule las densidades de frecuencia de cada intervalo y represente el
histograma correspondiente.

3. Establezca, con base estadística, en cuál de las siguientes empresas el salario


está repartido de forma más equitativa.

4. Los datos que se dan a continuación corresponden a los pesos en Kg. de ochenta
personas:
a) Obténgase una distribución de datos en intervalos de amplitud 5, siendo el primer
intervalo [50; 55].
b) Calcúlese el porcentaje de personas de peso menor que 65 Kg.
c) ¿Cuántas personas tienen peso mayor o igual que 70 Kg. pero menor que 85?

60;66;77;70;66;68;57;70;66;52;75;65;69;71;58; 66;6
7;74;61;63;69;80;59;66;70;67;78;75;64;71;81;62;64;
69;68;72;83;56;65;74;67;54;65;65;69;61;67;73;57;6
2;67;68;63;67;71;68;76;61;62;63;76;61;67;67;64;72;
64;73;79;58;67;71;68;59;69;70;66;62;63;66;
5. Una máquina ha fabricados 60 cilindros cuya longitud en centímetros se registra

29
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

239, 254, 255, 248, 246, 249, 242, 250, 249, 244, 253, 248
250, 258, 252, 251, 250, 253, 247, 243, 245, 251, 247, 250
248, 250, 259, 249, 249, 250, 251, 253, 241, 251, 249, 252
250, 247, 251, 259, 250, 246, 252, 238, 251, 238, 236, 259
249, 257, 249, 247, 251, 246, 245, 243, 250, 249, 242, 238
Se solicita:
a) Construya una distribución de frecuencia cuyas clases tengan como amplitud 5
centímetros y que la primera clase sea 235-239.
b) Construya el histograma y polígono de frecuencia
c) Qué Clase es la de mayor frecuencia?
d) Qué clase es la de menor frecuencia?
e) Qué porcentaje de cilindros son menores de 255 centímetros?
f) Qué porcentaje de cilindros son mayores de 244 centímetros?

6. Unos grandes almacenes disponen de un parqueo para sus clientes. Los


siguientes datos que se refieren al número de horas que permanecen en el parqueo
una serie de vehículos:

4424536353
2137315172
5247362241
6433454324
3244366455
4551744365
Se pide:
A- Obtener la tabla de frecuencias para ese conjunto de datos. Interpretar la tabla.
B- Determinar e interpretar el tercera cuartil y el percentil 42%.
C- Calcular el tiempo medio de permanencia de los vehículos en el parqueo.
Interpretar el resultado y los elementos que intervienen.
7. Un fabricante de neumáticos ha recabado, de los diferentes concesionarios,
información sobre la cantidad de miles de kilómetros recorridos por un modelo
concreto de esos neumáticos hasta que se ha producido un pinchazo o un reventón
del neumático. Los concesionarios la han proporcionado los siguientes datos:

30
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Se pide:
a- Construir una taba de frecuencias para esos datos tomando como número de
intervalos ignorando los miles y redondeando. O sea 52.542 será 52 y así
sucesivamente, de manera que cada clase sea de amplitud 13, y la primera clase
sea 4-16. Interpretas la tabla.
b- Construir las tablas de frecuencias acumuladas ascendente.
c- Dibujar el histograma de frecuencias relativas sin acumular y acumulado.
d- Calcular las principales medidas de tendencia central e interpretarlas.
e- Obtener las medidas de dispersión más importantes e interpretarlas.
f- Analizar la asimetría y el apuntamiento de la distribución de frecuencias resultante.

g- Si el fabricante quiere proponer un kilometraje para realizar el cambio de


neumáticos, ¿qué valor propondría para que solo 3 de cada 10 autos hayan tenido
un pinchazo o reventón antes de ese kilometraje?

31
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Medidas de posición central la media, la mediana y la moda


Las medidas de posición nos facilitan información sobre la serie de datos que
estamos analizando. Estas medidas permiten conocer diversas características de
esta serie de datos.

Las medidas de posición son de dos tipos:

a) Medidas de posición central: informan sobre los valores medios de la serie


de datos.
b) Medidas de posición no centrales: informan de cómo se distribuye el resto
de los valores de la serie.

a) Medidas de posición central

Las principales medidas de posición central son las siguientes:

1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular


diversos tipos de media, siendo las más utilizadas:

a) Media aritmética: se calcula multiplicando cada valor por el número de veces


que se repite. La suma de todos estos productos se divide por el total de datos de
la muestra:

(X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn)

---------------------------------------------------------------------------------------
Xm =
n

b) Media geométrica: se eleva cada valor al número de veces que se ha repetido.


Se multiplican todo estos resultados y al producto final se le calcula la raíz "n"
(siendo "n" el total de datos de la muestra).

Según el tipo de datos que se analice será más apropiado utilizar la media aritmética
o la media geométrica.

32
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

La media geométrica se suele utilizar en series de datos como tipos de interés


anuales, inflación, etc., donde el valor de cada año tiene un efecto multiplicativo
sobre el de los años anteriores. En todo caso, la media aritmética es la medida de
posición central más utilizada.

Lo más positivo de la media es que en su cálculo se utilizan todos los valores de la


serie, por lo que no se pierde ninguna información.

Sin embargo, presenta el problema de que su valor (tanto en el caso de la media


aritmética como geométrica) se puede ver muy influido por valores extremos, que
se aparten en exceso del resto de la serie. Estos valores anómalos podrían
condicionar en gran medida el valor de la media, perdiendo ésta representatividad.

La media geométrica (MG) de un conjunto de números estrictamente positivos (X1,


X2,…,XN) es la raíz N-ésima del producto de los N elementos.

Todos los elementos del conjunto tienen que ser mayores que cero. Si algún
elemento fuese cero (Xi=0), entonces la MG sería 0 aunque todos los demás valores
estuviesen alejados del cero.

La media geométrica es útil para calcular medias de porcentajes, tantos por uno,
puntuaciones o índices. Tiene la ventaja de que no es tan sensible como la media a
los valores extremos.

2.- Mediana: es el valor de la serie de datos que se sitúa justamente en el centro de


la muestra (un 50% de valores son inferiores y otro 50% son superiores).

No presentan el problema de estar influido por los valores extremos, pero en cambio
no utiliza en su cálculo toda la información de la serie de datos (no pondera cada
valor por el número de veces que se ha repetido).

33
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

3.- Moda: es el valor que más se repite en la muestra.

Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

X X X x x
1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%


1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%


1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%


1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%

1,30 3 30 10,0% 100,0%


Ejemplo: vamos a utilizar la tabla de distribución de frecuencias con los datos de la
estatura de los alumnos que vimos en la lección 2ª.

Vamos a calcular los valores de las distintas posiciones centrales:

1.- Media aritmética:

(1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + ......... + (1,29 * 3) + (1,30 * 3)

Xm = --------------------------------------------------------------------------------------------------

30

Luego:

Xm = 1,253

34
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Por lo tanto, la estatura media de este grupo de alumnos es de 1,253 cm.

2.- Media geométrica:

En una empresa quieren saber la proporción media de mujeres en los diferentes


departamentos. Para ello, se recoge el porcentaje de mujeres en los cinco
principales departamentos.

Como es la media de porcentajes, calculamos la media geométrica que es más


representativa.

35
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Las Medidas de Posición, también conocidas como Otras Medidas de Dispersión,


son otras medidas o métodos que resultan ser más prácticos para precisar ciertas
situaciones en las que se busca describir la variación o dispersión en un conjunto
de datos.
1. CUANTILES
Los cuantiles son medidas de posición que se determinan mediante un método que
determina la ubicación de los valores que dividen un conjunto de observaciones en
partes iguales.
Los cuantiles son los valores de la distribución que la dividen en partes iguales, es
decir, en intervalos que comprenden el mismo número de valores. Cuando la
distribución contiene un número alto de intervalos o de marcas y se requiere obtener
un promedio de una parte de ella, se puede dividir la distribución en cuatro, en diez
o en cien partes.

Los más usados son los cuartiles, cuando dividen la distribución en cuatro partes;
los deciles, cuando dividen la distribución en diez partes y los centiles o percentiles,
cuando dividen la distribución en cien partes. Los cuartiles, como los deciles y los
percentiles, son en cierta forma una extensión de la mediana.

Para algunos valores u , se dan nombres particulares a los cuantiles, Q (u):

U Q(u)

0.5 Mediana

0.25, 0.75 Cuartiles

0.1, ... , 0.99 Deciles

0.01, ..., 0.99 Centiles

CUARTILES

Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.

Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del

36
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer
cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes
(75%) de los datos.

Datos Agrupados
n
k    Fk
4
Qk  Lk  *c
fk
Como los cuartiles adquieren su mayor importancia cuando contamos un número
grande de datos y tenemos en cuenta que en estos casos generalmente los datos
son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los cuartiles
cuando se trata de datos agrupados es la siguiente:

k= 1,2,3

Donde:
Lk = Límite real inferior de la clase del cuartil k

n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k

c = Longitud del intervalo de la clase del cuartil k

Si se desea calcular cada cuartil individualmente, mediante otra fórmula se tiene lo


siguiente:

 El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los
datos; es decir, aquel valor de la variable que supera 25% de las observaciones
y es superado por el 75% de las observaciones.

Fórmula de Q1, para series de Datos agrupados:

37
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

P  f a 1 P
n
Q1  l i  * Ic 4
f1

Donde:
L1 = limite inferior de la clase que lo contiene

P = valor que representa la posición de la medida


f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.

Ic = intervalo de clase

 El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md),


es el menor valor que es mayor que la mitad de los datos, es decir el 50% de las
observaciones son mayores que la mediana y el 50% son menores.

Fórmula de Q2, para series de Datos agrupados:

P  f a 1 P
2n
Q1  l i  * Ic 4
f1

Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.

Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.


Ic = intervalo de clase

38
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

 El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de
los datos, es decir aquel valor de la variable que supera al 75% y es superado
por el 25% de las observaciones.

Fórmula de Q3, para series de Datos agrupados:

P  f a 1 P
3n
Q1  l i  * Ic 4
f1

Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.

Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.


Ic = intervalo de clase.

Otra manera de verlo es partir de que todas las medidas no son sino casos
particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer
cuartil 75% percentil.

Para Datos No Agrupados


Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
- El primer cuartil:
Cuando n es par:

1* n
4

Cuando n es impar:

39
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

1(n  1)
4

- Para el tercer cuartil


Cuando n es par:

3* n
4

Cuando n es impar:
3(n  1)
4

DECILES

Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto
de datos ordenados en diez partes iguales, son también un caso particular de los
percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo
decil, etc.

Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.

Datos Agrupados
Para datos agrupados los deciles se calculan mediante la fórmula.

 n 
k   Fk
Dk  Lk   10 
*c
fk

k= 1,2,3,... 9

Donde:
Lk = Límite real inferior de la clase del decil k

40
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

n = Número de datos

Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.


fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k

Otra fórmula para calcular los deciles:

 El cuarto decil, es aquel valor de la variable que supera al 40%, de las


observaciones y es superado por el 60% de las observaciones.

P  f a 1 P
4n
D4  l i  * Ic 10
f1

 El quinto decil corresponde a la mediana.


P  f a 1 P
5n
D5  li  * Ic 10
f1

 El noveno decil supera al 90% y es superado por el 10% restante.


9n
P
10

P  f a 1
D9  li  * Ic
f1

Donde (para todos):


L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida

f1 = la frecuencia de la clase que contiene la medida solicitada.


Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.

41
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Fórmulas Datos No Agrupados


Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:

A* n
10
Cuando n es par:

An  1
10
Cuando n es impar:

Siendo A el número del decil.

CENTILES O PERCENTILES

Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación
o clasificación de las personas cuando atienden características tales como peso,
estatura, etc.

Los percentiles son ciertos números que dividen la sucesión de datos ordenados en
cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99),
leídos primer percentil,..., percentil 99.

Datos Agrupados

Cuando los datos están agrupados en una tabla de frecuencias, se calculan


mediante la fórmula:
 n 
k   Fk
Pk  Lk   100 
*c
fk

k= 1,2,3,... 99

42
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos

Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.


fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k

Otra forma para calcular los percentiles es:


- Primer percentil, que supera al uno por ciento de los valores y es superado por
el noventa y nueve por ciento restante.
1n
P
100

P  f a 1
P1  li  * Ic
f1

- El 60 percentil, es aquel valor de la variable que supera al 60% de las


observaciones y es superado por el 40% de las observaciones.
P  f a 1 
60n
P60  li  * Ic P
100
f1

P  f a 1 P
99n
P99  li  * Ic 100
f1
- El percentil 99 supera 99% de los datos y es superado a su vez por el 1%
restante.

Fórmulas Datos No Agrupados

43
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
Para los percentiles, cuando n es par:

A* n
10

An  1
100
Cuando n es impar:

Siendo A, el número del percentil.

Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con
el percentil 50 y el tercer cuartil con el percentil 75.

3. EJEMPLO

Determinación del primer cuartil, el séptimo decil y el 30 percentil, de la siguiente


tabla:

Salarios No. De fa
(I. De Empleados
Clases) (f1)

200-299 85 85

300-299 90 175

400-499 120 295

500-599 70 365

600-699 62 427

44
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

700-800 36 463

Como son datos agrupados, se utiliza la fórmula

P  f a 1
P  li  * Ic
f1

Siendo,

n
P
4
La posición del primer cuartil.

7n
P
10

La posición del 7 decil.

30n
P
100

La posición del percentil 30.


Entonces,

463
 115.5
4
El primer cuartil:
115.5 – 85 = 30.75

Li = 300, Ic = 100 , fi = 90

45
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

30.75
Q1  300  *100  334
90

El 7 decil:

7463 3241
  324.1
10 10
Posición:
324.1 – 295 = 29.1
Li = 500, fi = 70

29.1
D7  500  *100  541.57
70

El percentil 30
Posición:

30463 13890
  138.9
100 100

138.9 – 85 = 53.9

fi = 90

53.9
P30  300  *100  359.88
90

Estos resultados nos indican que el 25% de los empleados ganan salarios por
debajo de $ 334; que bajo 541.57 gana el 57%de los empleados y sobre $359.88,
gana el 70% de los empleados.

46
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

EJERCICIOS PROPUESTOS

1. A un conjunto de 5 números cuya media es 7.31 se le añaden los números


4.47 y 10.15. ¿Cuál es la media del nuevo conjunto de números?

2. Un dentista observa el número de caries en cada uno de los 100 niños de


cierto colegio. La información obtenida aparece resumida en la
siguiente tabla:

Nº de caries fi ni
0 25 0.25
1 20 0.2
2 x Z
3 15 0.15
4 y 0.05

 Completar la tabla obteniendo los valores x, y, z.


 Hacer un diagrama de sectores.
 Calcular el número medio de caries.

3. Se tiene el siguiente conjunto de 26 datos:

10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16,
14, 8, 18

Obtener su mediana y cuartiles.

4. Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños


de su consulta en el momento de andar por primera vez:

Meses Niños
9 1
10 4
11 9
12 16
13 11
14 8
15 1
 Dibujar el polígono de frecuencias.
 Calcular la moda, la mediana, la media y la varianza.

47
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

5. Completar los datos que faltan en la siguiente tabla estadística:

xi fi Fi ni
1 4 0.08
2 4
3 16 0.16
4 7 0.14
5 5 28
6 38
7 7 45
8

 Calcular la media, mediana y moda de esta distribución.

6. Considérense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide:

 Calcular su media y su varianza.


 Si los todos los datos anteriores los multiplicamos por
 cuál será la nueva media y varianza.

7. El resultado de lanzar dos dados 120 veces viene dado por la tabla:

 Sumas Veces
2 3
3 8
4 9
5 11
6 20
7 19
8 16
9 13
10 11
11 6
12 4
Calcular la media y la desviación típica.
 Hallar el porcentaje de valores comprendidos en el intervalo (x − σ, x + σ).

8. Las alturas de los jugadores de un equipo de baloncesto vienen dadas por


la tabla:

48
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Altura Nº de jugadores
[170, 175) 1
[175, 180) 3
[180, 185) 4
[185, 190) 8
[190, 195) 5
[195, 2.00) 2
 La media.
 La mediana.
 La desviación típica.
 ¿Cuántos jugadores se encuentran por encima de la media más una
desviación típica?

9. Los resultados al lanzar un dado 200 veces vienen dados por la


siguiente tabla:

1 2 3 4 5 6
fi a 32 35 33 b 35

Determinar a y b sabiendo que la puntuación media es 3.6.

10. El histograma de la distribución correspondiente al peso de 100


alumnos de Bachillerato es el siguiente:

 Formar la tabla de la distribución.


 Si Andrés pesa 72 kg, ¿cuántos alumnos hay menos pesados que él?
 Calcular la moda.

49
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

 Hallar la mediana.
 ¿A partir de que valores se encuentran el 25% de los alumnos más
pesados?
11. De esta distribución de frecuencias absolutas acumuladas, calcular:

Edad Fi
[0, 2) 4
[2, 4) 11
[4, 6) 24
[6, 8) 34
[8, 10) 40

 Media aritmética y desviación típica.


 ¿Entre qué valores se encuentran las 10 edades centrales?
 Representar el polígono de frecuencias absolutas acumuladas.

12. Una persona A mide 1.75 m y reside en una ciudad donde la estatura media
es de 1.60 m y la desviación típica es de 20 cm. Otra persona B mide 1.80
m y vive en una ciudad donde la estatura media es de 1.70 m y la
desviación típica es de 15 cm. ¿Cuál de las dos será más alta respecto a
sus conciudadanos?
13. Un profesor ha realizado dos tests a un grupo de 40 alumnos, obteniendo
los siguientes resultados: para el primer test la media es 6 y la desviación
típica 1.5.

Para el segundo test la media es 4 y la desviación típica 0.5.

Un alumno obtiene un 6 en el primero y un 5 en el segundo. En relación con


el grupo, ¿en cuál de los dos tests obtuvo mejor puntuación?

14. La asistencia de espectadores a las 4 salas de un cine un determinado día


fue de 200, 500, 300 y 1000 personas.

 Calcular la dispersión del número de asistentes.


 Calcular el coeficiente de variación.
 Si el día del espectador acuden 50 personas más a cada sala, ¿qué
efecto tendría sobre la dispersión?

50
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Las medidas de dispersió n

Las med i d as d e d i sp ersi ó n nos inf orman so bre cuá nt o se


alej an d el cent ro l os v alores de la dist ribuc ió n.

Las med i d as d e d i sp ersi ó n son:

 Rango o recorrido.- El rango es l a dif erencia en tre el ma yor y


el men or d e l o s dat os d e u n a d i stri b u ci ón estad í sti ca.

 Desviación media.- L a desv iaci ón res pect o a la medi a e s


l a dif erenc ia en tre c ad a v alor d e l a vari ab l e estad í sti ca y
l a med ia arit mét ic a .

Di = x - x

La d esvi a ci ó n med i a es la med i a ari tméti ca de l os val o res


ab so l u to s d e l as d esvi aci o n es resp e cto a l a med i a .

La d esvi a ci ó n med i a se represent a por

Ejemplo

Calcu lar la d e svi aci ó n med i a de la dist ri buc ión:

51
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

9, 3, 8, 8, 9, 8, 9, 18

Desviación media para datos agrupados

Si los dat os v iene n agru pa dos en un a tab l a d e frecu en ci as ,


la expres ió n de la d es vi aci ó n med i a es:

Ejemplo

52
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Calcu lar la d e svi aci ó n med i a de la dist ri buc ión:

xi fi xi · fi |x - x| |x - x| · fi

[10, 15) 12.5 3 37.5 9.286 27.858

[15, 20) 17.5 5 87.5 4.286 21.43

[20, 25) 22.5 7 157.5 0.714 4.998

[25, 30) 27.5 4 110 5.714 22.856

[30, 35) 32.5 2 65 10.174 21.428

21 457.5 98.57

Varianza

La vari an za es la med i a ari tm éti ca d el cu ad rad o d e l as


d esvi aci o n es re sp ecto a l a med i a de una d ist ribuc ión
est adí st ica.

53
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

La v arian za se re prese nt a por .

Varianza para datos agrupados

Para si mpl if icar el cál cu l o d e la vari an za v amos o ut ili zar


las sigu ie nt es expres ion es qu e son eq uiv alent es a l as
ant erior es.

Varianza para datos agrupados

Ejercicios de varianza

Cal cu l ar l a vari an za d e la dist ribuci ón:

9, 3, 8, 8, 9, 8, 9, 18

54
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Cal cu l ar l a vari an za d e la dist ribuci ón d e la t abl a:

xi fi xi · fi xi2 · fi

[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050

55
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Propiedades de la varianza

1. La vari an za será sie mpre un val o r po si ti vo o


cero , en e l caso de q ue l as punt u acio nes se an
igua les.

2. Si a t odos los val o res d e la v ariable se


les su ma u n n ú mero la vari an za n o varí a .

3. Si t odos los val o res de la v ariab le


se mu l ti pl i can por
un n ú mero l a va ri an za q ued a mu l ti p l i cad a por
el cu ad rad o de dic ho n ú mero .

4. Si t enemos v arias dist ribucio nes con la


mis ma med i a y conoce mos sus
respect iv as vari an za s se pued e calc ular
la vari an z a to tal .

Si t odas las mu est ras t iene n el mis mo t a ma ño:

Si las muest ras t ie nen d ist int o t ama ño:

56
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Observaciones sobre la varianza

1. La vari an za , al igu al qu e la me dia, es un í ndice


mu y se nsib le a l as punt u acio ne s ext remas.

2. En los casos q ue n o se p u ed a h all ar l a


med i a t amp oco ser á posi ble h a llar la v ari an za .

3. La vari an za n o v iene expr es ada en l as mis mas


unid ad es que l os dat os, ya qu e las desv iaci ones
est án el ev adas al cua drad o.

Desviación típica

 La d esvi a ci ó n tí pi ca es la ra í z cu ad rad a d e l a
vari an za .

 Es decir, la raí z cuadrad a de la med ia de los


cuadra dos d e las pu nt uaci on es de desv iació n.

 La d esvi a ci ó n tí pi ca se repres e nt a por σ .

Desviación típica para datos agrupados

57
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Para si mpl if icar el c álcu lo v amos o ut ili zar l as


sigui ent es ex presi ones q ue so n equiv ale nt es a las
ant erior es.

Desviación típica para datos agrupados

Ejercicios de desviación típica

Calcu lar la d e svi aci ó n tí p i ca de la dist rib uci ón:

9, 3, 8, 8, 9, 8, 9, 18

Cal cu l ar l a d esvi aci ó n tí p i ca de la dist ri buc ión d e la


t abla:

xi fi xi · fi xi2 · fi

[10, 20) 15 1 15 225

58
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60) 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050

Propiedades de la desviación típica

1. La d esvi a ci ó n tí pi ca será sie mpr e un v al o r


p o si ti vo o cero , en el caso de que las
punt u acio nes sea n igu al es.

59
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

2. Si a t odos los v al o res de l a v ariabl e se


les su ma u n n ú mero la d esvi a ci ó n típ i ca n o
varí a .

3. Si t odos los v al o res de l a v ariable


se mu l ti p li can por un n ú mero la d esvi a ci ó n
tí p i ca queda mu l ti p l i cad a por dicho n ú mero .

4. Si t ene mos v arias dist ri buci one s con la


mis ma med i a y co noc e mos sus
respect iv as d esvi aci o n es tí p i cas se pu ede
calcul ar la d es vi aci ó n tí p i ca to tal .

Si t odas las mu est ras t iene n el mis mo t a ma ño:

Si las muest ras t ie nen d ist int o t ama ño:

Observaciones sobre la desviación típica

1. La d esvi a ci ó n tí pi ca , al igual que la me di a y l a


v arianza, es un í ndic e mu y sen sible a l as
punt u acio nes ext re mas.

2. En los casos q ue n o se p u ed a h al l ar l a
med i a t amp oco ser á posi ble h a llar la d es vi aci ó n
tí p i ca .

60
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

3. Cuant a más peq ueñ a sea l a d esvi aci ó n


tí p i ca ma yor será l a co n cen tra ci ó n d e
d ato s alrede dor d e la med i a .

Rango o recorrido
Definición: se llama recorrido de una distribución a la diferencia entre el
mayor y el menor valor de la variable estadística.
Cálculo del recorrido

Es muy sencillo aplicando la definición, consiste en ordenar los valores de menor a mayor
y restar al último el primero.

Observaciones al recorrido
1. Cuanto menor es el recorrido mayor es el grado de
representatividad de los valores centrales.
2. Cuanto mayor es, la distribución está menos concentrada o más
dispersa.
3. Tiene la gran ventaja de su sencillez de cálculo.
4. Tiene gran aplicación en procesos de control de calidad,
5. Tiene el inconveniente de que sólo depende de los valores
extremos. De esta forma basta que uno de ellos se separe mucho
para que el recorrido se vea sensiblemente afectado.
6. Para paliar este inconveniente a veces se utilizan otros dos rangos:

 Rango intercuartílico: Q = Q3 – Q1
 Rango entre percentiles: P = P90 – P10

Estos rangos son algo más estables, ya que tienden a eliminar aquellos
valores extremadamente alejados.

Medidas de dispersión

Las medias de tendencia central o posición nos indican donde se sitúa un


dato dentro de una distribución de datos. Las medidas de dispersión,
variabilidad o variación nos indican si esos datos están próximos entre sí o sí
están dispersos, es decir, nos indican cuán esparcidos se encuentran los
datos. Estas medidas de dispersión nos permiten apreciar la distancia que

61
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

existe entre los datos a un cierto valor central e identificar la concentración


de los mismos en un cierto sector de la distribución, es decir, permiten estimar
cuán dispersas están dos o más distribuciones de datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de
un conjunto de datos, siendo la media aritmética el dato central más utilizado.
Cuando existe una dispersión pequeña se dice que los datos están dispersos
o acumulados cercanamente respecto a un valor central, en este caso el dato
central es un valor muy representativo. En el caso que la dispersión sea
grande el valor central no es muy confiable. Cuando una distribución de datos
tiene poca dispersión toma el nombre de distribución homogénea y si su
dispersión es alta se llama heterogénea.

Desviación media o desviación promedio

La desviación media o desviación promedio es la media aritmética de los


valores absolutos de las desviaciones respecto a la media aritmética.
1.1) PROPIEDADES
Guarda las mismas dimensiones que las observaciones. La suma de valores
absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un
inconveniente: Desde el punto de vista geométrico, la distancia que induce la
desviación media en el espacio de observaciones no es la natural (no permite
definir ángulos entre dos conjuntos de observaciones). Esto hace que sea
muy engorroso trabajar con ella a la hora de hacer inferencia a la población.
Cuando mayor sea el valor de la desviación media, mayor es la dispersión de
los datos. Sin embargo, no proporciona una relación matemática precisa entre
su magnitud y la posición de un dato dentro de una distribución.
La desviación media al tomar los valores absolutos mide una observación sin
mostrar si la misma está por encima o por debajo de la media aritmética.
1.2) MÉTODOS DE CÁLCULO

1.2.1) Para Datos No Agrupados


Se emplea la ecuación:

62
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Ejemplo ilustrativo:
Calcular la desviación media de la distribución: 3, 8, 8, 8, 9, 9, 9, 18

Solución:
Se calcula la media aritmética.

Se calcula la desviación media.

Empleando Excel se calcula de la siguiente manera:

63
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

1.2.2) Para Datos Agrupados en Tablas de Frecuencia

Se emplea la ecuación:

Ejemplo ilustrativo: Calcular la desviación media en base a la siguiente tabla


sobre las calificaciones de un estudiante en 12 asignaturas evaluadas sobre
10.

Calificación Cantidad de asignaturas

6 4

7 2

8 3

9 2

10 1

Total 12

Solución:

Se calcula la media aritmética.

64
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

1.2.3) Para Datos Agrupados en Intervalos


Se emplea la ecuación:

Donde xm es la marca de clase.


Ejemplo ilustrativo: Calcular la desviación media de un curso de 40
estudiantes en la asignatura de Estadística en base a la siguiente tabla:

Calificación Cantidad de estudiantes

2-4 6

4-6 8

6-8 16

8-10 10

Total 40

65
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Solución:

Para calcular la media aritmética se llena la siguiente tabla:

Intervalo F Xm F·xm

2-4 6 3 18

4-6 8 5 40

6-8 16 7 112

8-10 10 9 90

Total 40 260

Calculando la media aritmética se obtiene:

Varianza y desviación estándar

La varianza es la media aritmética de los cuadrados de las desviaciones


respecto a la media aritmética, es decir, es el promedio de las desviaciones
de la media elevadas al cuadrado. La desviación estándar o desviación típica
es la raíz de la varianza.

66
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

La varianza y la desviación estándar proporcionan una medida sobre el punto


hasta el cual se dispersan las observaciones alrededor de su media aritmética.
2.1) PROPIEDADES
- La varianza y desviación estándar (o cualquier otra medida de dispersión)
indican el grado en que están dispersos los datos en una distribución. A
mayor medida, mayor dispersión.
- La varianza es un número muy grande con respecto a las observaciones, por
lo que con frecuencia se vuelve difícil para trabajar.
- Debido a que las desviaciones son elevadas al cuadrado y la varianza
siempre se expresa en términos de los datos originales elevados al cuadrado,
se obtiene unidades de medida de los datos que no tiene sentido o
interpretación lógica. Por ejemplo, si se calcula la varianza de una distribución
de datos medidos en metros, segundos, dólares, etc, se obtendrá una
varianza mediada en metros cuadrados, segundos cuadrados, dólares
cuadrados, respectivamente, unidades de medida que no tienen significado
lógico respecto a los datos originales.

- Para solucionar las complicaciones que se tiene con la varianza, se halla la


raíz cuadrada de la misma, es decir, se calcula la desviación estándar, la cual
es un número pequeño expresado en unidades de los datos originales y que
tiene un significado lógico respeto a los mismos.
A pesar de lo anterior, es difícil describir exactamente qué es lo que mide la
desviación estándar. Sin embargo, hay un resultado útil, que lleva el nombre
del matemático ruso Pafnuty Lvovich Chebyshev, y se aplica a todos los
conjuntos de datos. Este teorema de Chebyshev establece que para todo
conjunto de datos, por lo menos 1- 1/k2 de las observaciones están dentro de
k desviaciones estándar de la media, en donde k es cualquier número mayor
que 1. Este teorema se expresa de la siguiente manera:

Así por ejemplo, si se forma una distribución de datos con k =3 desviaciones


estándar por debajo de la media hasta 3 desviaciones estándar por encima de
la media, entonces por lo menos

67
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Interpretación: El 88,89% de todas las observaciones estarán dentro ± 3


desviaciones de la media.
2.2) MÉTODOS DE CÁLCULO
2.2.1) Para Datos No Agrupados

La varianza para una población se calcula con:

68
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Notas:
1) Para el cálculo de la varianza de una muestra se divide por n-1 en lugar de
N, debido a que se tiene n-1 grados de libertad en la muestra. Otra razón por
la que se divide por n-1 es debido a que una muestra generalmente está un
poco menos dispersa que la población de la cual se tomó. Al dividir para n-1
en lugar de N se cumple con la tendencia y sentido lógico de que la varianza
y desviación estándar de la muestra deben tener un valor más pequeño que la
varianza y desviación estándar de la población.

2) En la realidad, salvo indicación expresa, no se calcula la varianza y la


desviación estándar de la población, ya que para ahorrar tiempo, esfuerzo,
dinero, etc. Es mejor trabajar con datos que representan a la muestra.
Ejemplo ilustrativo N° 1
Considere que los siguientes datos corresponden al sueldo de una población:
$350, $400, $500, $700 y $1000

1) Calcular la desviación estándar.


2) ¿Cuál es el intervalo que está dentro de k = 2 desviaciones estándar de la
media?. ¿Qué porcentaje de las observaciones se encuentran dentro de ese
intervalo?
Solución:
1) Para la calcular la desviación estándar se sigue los siguientes pasos:

A) Se calcula la media aritmética.

69
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

B) Se aplica la respectiva fórmula para calcular la varianza

C) Se calcula la desviación estándar.

Empleando Excel se calcula de la siguiente manera:

70
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

2) Cálculo del intervalo de k = 2 desviaciones estándar de la media.

Se transportan 2 desviaciones estándar (2 x $ 237,4868) = $ 474,97 por encima


y por debajo de la media 𝝁 = $ 590

Por lo tanto se tiene un intervalo desde $ 590 - $474,97 = $ 115,03 hasta $ 590
+ $474,97 = $ 1064,97

Aplicando el Teorema de Chebyshev

Interpretación: Se puede afirmar de que por lo menos el 75% los sueldos están
entre $ 115,03 y $ 1064,97

Ejemplo ilustrativo N° 2: Dos empresas, A y B, venden sobres de café


instantáneo de 350 gramos. Se seleccionaron al azar en los mercados cinco
sobres de cada una de las compañías y se pesaron cuidadosamente sus
contenidos. Los resultados fueron los siguientes.

A B

350,14 350,09

350,18 350,12

349,98 350,20

349,99 349,88

350,12 349,95

1) ¿Qué empresa proporciona más café en sus sobres?

2) ¿Qué empresa llena sus sobres de manera más consistente?


Solución:

71
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

A) Se calcula las medias aritméticas.

Interpretación: Como la media aritmética de la empresa A es mayor que la de


la empresa B, por lo tanto la empresa A proporciona más café en sus sobres.
B) Se calcula las desviaciones estándar.

72
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Interpretación: Como la desviación estándar de la empresa A es menor a la


desviación estándar de la empresa B, por lo tanto la empresa A es más
consistente al llenar los sobres de café.

Empleando Excel se calcula de la siguiente manera:

2.2.2) Para Datos Agrupados en Tablas de Frecuencia


La varianza para una población se calcula con:

73
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Ejemplo ilustrativo: Calcular la desviación estándar de los siguientes datos


correspondientes a una muestra.

Calificaciones F

4 3

5 6

6 4

7 13

8 7

10 6

Total 39

Solución:
A) Se llena la siguiente tabla:

74
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Calificaciones F Fx

4 3 12

5 6 30

6 4 24

7 13 91

8 7 56

10 6 60

Total 39 273

B) Se calcula la media aritmética.

2.2.3) Para Datos Agrupados en Intervalos


La varianza para una población se calcula con:

75
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

Ejemplo ilustrativo: Calcular la desviación estándar de los siguientes datos


correspondientes a una muestra.

Intervalo F

60-65 5

65-70 20

70-75 40

80-85 27

85-90 8

Total 100

Solución:

76
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

A) Se llena la siguiente tabla:

Intervalo F Xm F·xm

60-65 5 62,5 312,5

65-70 20 67,5 1350

70-75 40 72,5 2900

80-85 27 82,5 2227,5

85-90 8 87,5 700

Total 100 7490

B) Se calcula la media aritmética.

77
INSTITUTO DE EDUCACIÓN SUPERIOR TÉCNOLOGICO PUBLICO JULI – YOROCO

BIBLIOGRAFIAS

 Texto Estadística para las Ciencias Administrativas.


 Martinez, Ciro. Estadística y Muestreo. Ecoe Ediciones. Bogotá.
11ª. Edición.
 Consulta en Internet
 SUÁREZ, Mario, (2011), Interaprendizaje de Estadística Básica,
 TAPIA , Fausto Ibarra, Ecuador.
 Casullo, A. (2000). Riesgos sociales, medioambientales y
personales percibidos por los adolescentes. Anuario de
Investigaciones VIII. Buenos Aires: Secretaría de Investigaciones,
Fac. de Psicología, U.B.A.
 Fridman, C. A. (2015). Como transformarse en un estudiante de
Psicología y no desencadenarse en el intento. En Materiales para
la Cursada. Documento interno de la Cátedra I de Estadística.
Facultad de Psicología, Universidad de Buenos Aires

78

También podría gustarte