Medidas Estadísticas
Medidas Estadísticas
Medidas Estadísticas
b) Medidas de localización: Estas medidas señalan la ubicación de los valores más frecuentes
o de valores extremos, los más usuales son: la moda y los cuantiles.
( )
2. Media aritmética x .- Es un valor promedio de tendencia central que se calcula según el tipo
de datos con los que se cuenta y pueden ser:
a) Media aritmética para datos no tabulados: Se define como la suma del conjunto de
observaciones dividido entre el número total de observaciones y se representa:
n
x i =1
i
x = media aritmética
xi = observaciones diferentes
x= n = # total de observaciones
n
x = media aritmética
xi ni xi = observaciones diferentes
i =1 ni = frecuencia absoluta de xi
x=
n n = # total de observaciones
y = media aritmética
yi ni yi = marca de clase
i =1
y= ni = frecuencia absoluta de la clase i
n n = # total de observaciones
( )
3. Media ponderada x p .- Es un valor promedio que toma en cuenta la importancia (peso o
ponderación) que tiene cada valor sobre el total; y se calcula mediante la siguiente expresión:
x
xp = media ponderada
i wi xi = observaciones diferentes
i =1
xp = n
wi = Ponderación de la observación de xi
w
n = # total de observaciones
i
i =1
4. Mediana ( Md ) .- Es aquel valor que no es superado ni supera a más de la mitad de todas las
observaciones; para calcular la mediana se requiere ordenar los datos.
n n = # total de observaciones
1º Si N i ; entonces Md = xi Ni = Frecuencia absoluta acumulada de
2
la observación i
n x + xi +1
2º Si = N i ; entonces Md = i xi = valor de la observación i
2 2 xi+1 = valor posterior a xi
c) Mediana para datos tabulados agrupados en clases: En este caso se debe utilizar el
procedimiento y expresión siguientes:
n
1º Determinar la clase mediana mediante la expresión: N i
2
2º Identificar los datos siguientes: Ni −1(md) ; ni (md) ; Li (md) ; w
3º Calcular la mediana de los datos reemplazando en la siguiente fórmula:
n
− N i −1( md )
Md = Li ( md) + 2 w
ni ( md )
n = Número total de observaciones
ni = Frecuencias absoluta de la clase mediana
Li (md) = Límite inferior de la clase mediana
Ni-1 (md) = Frec. Abs. Acumulada anterior a la clase mediana
W = Amplitud de clase
MG = media geométrica
MG = n x1 x2 ... xn xi = observaciones diferentes
n = # total de observaciones
b) Media geométrica para datos tabulados no agrupados en clases: Se utiliza la siguiente
expresión:
ni = frecuencia absoluta de la
MG = x1 x2 ... xk
n n1 n2 nk observación xi
i = 1, 2, … , k
c) Media geométrica para datos tabulados agrupados en clases: Se utiliza la siguiente
expresión:
yi = marca de clase.
MG = y1 y 2 ... yk
n n1 n2 nk
i = 1, 2, … , k
1 1 = ni (Mo ) − ni −1(Mo )
Mo = Li ( Mo) + w
1 + 2 2 = ni (Mo ) − ni +1(Mo )
Li ( Mo ) = Límite inferior de la clase modal.
Δ1 = Exceso de frecuencia modal sobre la frecuencia de la clase anterior inmediata.
Δ2 = Exceso de frecuencia modal sobre la frecuencia de la clase posterior inmediata.
ni ( Mo ) = Frecuencias absoluta de la clase modal.
ni -1 ( Mo ) = Frecuencias absoluta anterior inmediata a la clase modal.
ni +1 ( Mo ) = Frecuencias absoluta posterior inmediata a la clase modal.
w = Amplitud de clase
7. Cuantiles.- Son estadígrafos que dividen el conjunto de datos en otras proporciones que no sean
la mitad, como en el caso de la mediana; los cuantiles se utilizan frecuentemente para describir
el comportamiento de una población. Entre los cuantiles más utilizados tenemos a los: Cuartiles,
Deciles y Percentiles.
⎯ ⎯→ ⎯
25%
⎯→ ⎯
25%
⎯→ ⎯
25%
⎯→
25%
0 Q1 Q2 Q3 100
i.1) Cuartiles para datos no tabulados: Para calcular los cuartiles de este tipo de datos
reutiliza el procedimiento siguiente:
Paso 1: Ordenar los datos de forma ascendente o descendente.
Paso 2: Localizar la posición de cada cuartil según:
n +1 2(n + 1)
PQ1 = Posición del 1º cuartil ; PQ2 = Posición del 2º cuartil
4 4
3(n + 1)
PQ3 = Posición del 3º cuartil
4
Paso 3: Se analiza las siguientes dos situaciones:
n +1
• Si es valor entero, entonces el valor que corresponde a dicha posición es el
4
cuartil.
n +1
• Si no es valor entero, entonces se debe realizar una interpolación lineal de los
4
dos valores correspondientes a las observaciones entre las cuales se encuentra dicho
valor.
Fórmula de interpolación:
Qi = Valor del cuartil i
Qi = xi −1 + 0,...( xi − xi −1 ) x i - 1 = observaciones anterior a x i
0,… = Parte decimal obtenida del
valor de la posición.
i.2) Cuartiles para datos tabulados: Para calcular los cuartiles de este tipo de datos
reutiliza el procedimiento siguiente:
Paso 1: Determinar la clase cuartílica según los siguientes criterios:
n
• Para el cuartil Q1 : Ni
4
2n
• Para el cuartil Q2 : Ni
4
3n
• Para el cuartil Q3 : Ni
4
Paso 2: Calcular los cuartiles según las siguientes expresiones:
n
− N i −1 ( Q1
)
Q1 = Li (Q1 ) + 4 w
ni (Q1 ) ;
2n
− N i − 1( Q 2
)
Q2 = Li (Q2 ) + 4 w
n i (Q2 )
3n
4 − N i −1(Q3 )
Q3 = Li (Q3 ) + w
ni (Q3 )
Li ( Qi ) = Límite inferior de la clase cuartílica i.
Ni -1 ( Qi ) = Frecuencias absoluta acumulada anterior inmediata a la clase cuartílica.
ni ( Qi ) = Frecuencias absoluta de la clase cuartílica.
n = Número de datos.
w = Amplitud de clase
ii) Deciles ( Dk ) : Son los que dividen en 10 partes iguales un conjunto de datos.
Se utiliza un procedimiento similar al anterior solamente considerando que las clases y los
valores de cada decil se obtienen mediante:
kn
Posición de Dk : Ni donde : k = 1,2,...,9
10
kn
10 − N i −1( Dk )
Dk = Li ( Dk ) + w
ni ( Dk )
iii) Percentiles ( Pk ) : Son los que dividen en 100 partes iguales un conjunto de datos.
Se utiliza un procedimiento similar al anterior solamente considerando que las clases y los
valores de cada percentil se obtienen mediante:
kn
Posición de Pk : Ni donde : k = 1,2,...,99
100
kn
100 − N i −1( Pk )
Pk = Li ( Pk ) + w
ni ( Pk )
1. Definición.- Las medidas de posición describen la ubicación que ocupa una distribución de
frecuencias respecto a un valor de la variable, que identifica el punto alrededor del cual se
centran los datos. Estas medidas se clasifican en:
d) Medidas de tendencia central: Son las medidas que se ubican en posiciones centrales o
intermedias entre el menor y mayor valor del conjunto de datos; entre las más usuales son: la
media aritmética, la media ponderada, la mediana y la media geométrica.
e) Medidas de localización: Estas medidas señalan la ubicación de los valores más frecuentes
o de valores extremos, los más usuales son: la moda y los cuantiles.
( )
2. Media aritmética x .- Es un valor promedio de tendencia central que se calcula según el tipo
de datos con los que se cuenta y pueden ser:
b) Media aritmética para datos no tabulados: Se define como la suma del conjunto de
observaciones dividido entre el número total de observaciones y se representa:
n
x
i =1
i
x = media aritmética
xi = observaciones diferentes
x= n = # total de observaciones
n
Ejemplo1: Los conjuntos A y B muestran las edades de los estudiantes de dos cursos de estadística,
uno de la mañana y otro de la noche. Calcular las edades promedio e indicar cuál de los grupos tiene
el mayor promedio de edad?
A : {23 25 26 22 21 23} Turno mañana ; B : {21 27 25 25 24 25 22} Turno
noche
Respuesta: En el turno de la noche la edad promedio de los estudiantes es mayor a la del turno
mañana.
NOTA: La unidad el promedio es la misma que la unidad de la variable; el promedio de
un conjunto de datos de una variable discreta puede tomar valores decimales.
Respuesta:
c) Media aritmética para datos no agrupados en clases:
x n
x = media aritmética
i i xi = observaciones diferentes
i =1
x= ni = frecuencia absoluta de xi
n n = # total de observaciones
Ejemplo1: El cuadro que se muestra a continuación, representa el número de infracciones de
tránsito cometidas diariamente por conductores en una intersección de la ciudad. Con esta
información usted determine el promedio de infracciones que se presentan en dicha intersección.
Respuesta:
y
i =1
i ni
y = media aritmética
yi = marca de clase
y= ni = frecuencia absoluta de la clase i
n n = # total de observaciones
Respuesta:
( )
3. Media ponderada x p .- Es un valor promedio que toma en cuenta la importancia (peso o
ponderación wi) que tiene cada valor sobre el total; y se calcula mediante la siguiente expresión:
n
x
i =1
i wi xp = media ponderada
xi = observaciones diferentes
xp = n
w i =1
i
wi = Ponderación de la observación de xi
n = # total de observaciones
Ejemplo 1: Las notas en una asignatura se obtienen a través de dos exámenes parciales de igual
valor y un examen final cuyo valor es el triple que un examen parcial. Todos los exámenes se
toman sobre 100 puntos. El siguiente cuadro muestra las calificaciones obtenidas por un estudiante,
obtener la nota final.
DISTRIBUCIÓN DE CALIFICACIONES
Nota
Examen wi xi * wi
xi
1er Parcial 40
2do Parcial 35 ∑=
∑= Examen Final 70
Respuesta:
Ejemplo adicional:
DISTRIBUCIÓN DE CALIFICACIONES
Nota
Examen wi xi * wi
xi
1er Parcial 40
2do Parcial 35
Examen Final 70
∑=
∑=
Ejemplo 2: El siguiente cuadro muestra las calificaciones de los estudiantes A y B, además de los
créditos de 4 materias en una universidad. Con esta información determine el promedio ponderado
del semestre de ambos estudiantes
DISTRIBUCIÓN DE NOTAS POR MATERIA
NOTAS
CREDITOS
MATERIA Est. A Est. B
wi
xia xib
ECO 001 3 90 30
ADM 001 4 69 57
MAT 001 5 45 83
PSI 001 4 51 79
4. Mediana ( Md ) .- Es aquel valor que no es superado ni supera a más de la mitad de todas las
observaciones; para calcular la mediana se requiere ordenar los datos.
Respuesta:
• Si el número de datos es par, la mediana será igual al promedio entre los dos valores
xi −1 + xi
anterior y posterior a la posición indicada; es decir: Md =
2
Solución:
Paso 1: Ordenamos los datos:
e) Mediana para datos tabulados no agrupados en clases: En este caso se debe construir la
tabla de frecuencias hasta la frecuencia absoluta acumulada menor que ( N i ) y luego
analizar las siguientes dos situaciones posibles:
n = # total de observaciones
n
1º Si N i ; entonces Md = xi Ni = Frecuencia absoluta acumulada de
2 la observación i
n x + xi +1 xi = valor de la observación i
2º Si = N i ; entonces Md = i xi+1 = valor posterior a xi
2 2
Ejemplo 3: El registro estadístico de empresas tiene los datos que se muestran en el cuadro adjunto;
con esta información determine e intérprete el valor de la mediana.
Respuesta:
Ejemplo 4: Determinar la mediana para los datos que tiene una empresa que vende automóviles
durante los últimos 6 meses.
DISTRIBUCIÓN DE VENTAS EN LOS 6 ULTIMOS MESES
N° de N° de
movilidades vendedores Ni
xi ni
2 3
3 2
4 9
5 4
6 7
7 11
n= 36
Determinamos la Posición:
Entonces la mediana
Respuesta:
Ejemplo 5. El cuadro siguiente muestra la distribución del Número de materias aprobadas por 48
estudiantes de una carrera. Calcule el valor de la mediana y también el promedio de materias
aprobadas por los estudiantes?
f) Mediana para datos tabulados agrupados en clases: En este caso se debe utilizar el
procedimiento y expresión siguientes:
n
1º Determinar la clase mediana mediante la expresión: N i
2
2º Identificar los datos siguientes: Ni −1( md) ; ni ( md) ; Li ( md) ; w
n
2 − N i −1( md)
Md = Li ( md) + w
ni ( md )
n = Número total de observaciones
ni = Frecuencias absoluta de la clase mediana
Li (md) = Límite inferior de la clase mediana
Ni-1 (md) = Frec. Abs. Acumulada anterior a la clase mediana
W = Amplitud de clase
Ejemplo 6. El cuadro adjunto muestra la distribución de los pesos en libras, de 50 lingotes de oro;
con esta información determine el valor de la mediana de pesos y el peso promedio de los lingotes
de oro.
w=
Respuesta:
Ejemplo 7. El cuadro muestra la distribución de pesos de encomiendas recibidas por una empresa
de transporte en la terminal de buses; con esta información usted:
a) Determine el peso promedio de los equipajes.
b) ¿A partir de qué peso se encuentra el 50% del total de pesos, los más pesados? Mediana
MG = media geométrica
MG = n x1 x2 ... xn xi = observaciones diferentes
n = # total de observaciones
Ejemplo 1. Determine la Media Geométrica y la media Aritmética para el siguiente conjunto de
datos: 2, 4, 6, 12 y 18, analice sus resultados.
MG = x1n1 x2 n2 ... xk nk
n
ni = frecuencia absoluta de la observación
xi
i = 1, 2, … , k
Variable Frecuencias
xi ni
1 3
2 10
3 7
n= 20
Solución:
f) Media geométrica para datos tabulados agrupados en clases: Se utiliza la siguiente expresión:
MG = y1n1 y 2 n2 ... yk nk
n
yi = marca de clase.
i = 1, 2, … , k
Ejemplo 3. Determine usted la Media Geométrica, la media Aritmética y la mediana de las
superficies que ofrece a sus clientes un parqueo público.
DISTRIBUCIÓN DE ESPACIOS EN UN PARQUEO
N° de
Superficie
Clientes yi
m2.
ni
0–4 2
4–8 4
8 – 12 5
12 – 16 1
n= 12
Solución:
Marca de clase:
MG(FC ) = n FC1 FC2 ... FCn MG(FC) = Media geométrica de los factores
de crecimiento
FCi = Factores de crecimiento
TASA = [ MG(FC ) − 1] 100 %
Ejemplo 4. Con la información que se muestra en el cuadro; determine usted la Tasa de crecimiento
que tuvo el PIB durante los 5 últimos años de nuestro país.
PIB DURANTE LOS ULTIMOS 5 AÑOS
Factor de
PIB
Año Crecimiento
en Bs.
FC
2017 1016
2018 1079
2019 1080
2020 1025
Solución:
Factor de crecimiento:
MG de los FC:
Tasa de crecimiento:
Respuesta:
Ejemplo 5: El director ejecutivo de una empresa aérea desea determinar la tasa de crecimiento
promedio de los ingresos con base en las cifras que se muestran en el cuadro. Si la tasa de
crecimiento promedio es menor que el promedio industrial del 10%, se asumirá una nueva campaña
publicitaria.
INGRESOS EN $us.
Factor de
Ingresos
Año Crecimiento
en $us.
FC
2015 50000
2016 55000
2017 66000
2018 60000
2019 78000
Solución:
Factor de crecimiento:
Tasa de crecimiento:
Respuesta:
MEDIDAS DE DISPERSIÓN
1. Introducción. Con las medidas de centralización y localización se pueden conocer valores
centrales de un conjunto de datos y la distribución de los mismos. Estas medidas por sí solas no
bastan para ver su grado de significación o representación completa de un conjunto de datos; es
por esta razón que debemos considerar las medidas de dispersión. Antes de definir las medidas
de dispersión, conceptualizaremos algunos términos que se emplean:
a) Homogéneo: Un conjunto de datos es homogéneo cuando todos los valores son parecidos.
b) Heterogéneo: Un conjunto de datos es heterogéneo cuando sus valores son distintos y están
separados unos de otros entre sí.
c) Disperso: Un conjunto de datos es disperso cuando todos sus valores están separados unos
de otros entre sí.
d) Variabilidad: Es la condición que tiene un conjunto de datos numéricos respecto de su
grado de separación entre ellos.( A mayor variabilidad existe una mayor dispersión).
2. Definición. Son medidas que nos indican cuál es el grado de separación que existe entre los
datos. Las medidas de dispersión se dividen en: Medidas de dispersión absoluta (el rango o
recorrido, la desviación media, la desviación mediana, la varianza y la desviación estándar o
desviación típica) y Medidas de dispersión relativa (como el coeficiente de variación).
Conjunto A: 3 7 5 4 8 6 RA =
Conjunto B: 5 3 2 13 10 12 RB =
Respuesta: El conjunto de datos B tiene mayor dispersión con respecto al conjunto de datos A
Ejemplo 1: Determine la desviación cuartílica de las siguientes observaciones de notas 16, 10, 12, 8,
9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14 obtenidas de una actividad (sobre 20 puntos) en Estadística
Descriptiva de un grupo de estudiantes.
Solución:
Paso 1: Ordenamos los datos de forma ascendente o descendente.
Respuesta:
Solución:
(x )
n
2
i −x
i =1
Sx2 = n = Nº total de datos
n
Nota: La varianza tiene por unidad, la misma unidad que el de la variable elevada al cuadrado;
pero ésta no tiene un sentido físico para su interpretación.
c.2) Para datos tabulados no agrupados en clases:
n
(x
i =1
i − x) 2 ni
n = Nº total de datos
Sx2 =
n ni = Frecuencia absoluta de xi
( y
i =1
i − y ) 2 ni
n = Nº total de datos
Sy2 = ni = Frecuencia absoluta de xi
n yi = Marca de clase
Ejemplo 1: Los datos que se muestran a continuación representan las edades de los
niños de dos kinders, calcule la varianza e indique en que kínder las edades son más
homogéneas.
Edades de niños en Kinder A: 5, 4, 5, 4, 5, 6
Edades de niños en Kinder B: 4, 4, 6, 4, 7, 4
Solución:
Calculamos la media aritmética:
Kinder A Kinder B
xi
xi
∑=
∑=
Respuesta:
Calculamos la varianza:
Respuesta:
Ejemplo 3. Determine usted la varianza de los pesos de encomiendas recibidas por una empresa de
transporte en la terminal de buses; si tiene los siguientes datos:
Calculamos la varianza:
Respuesta:
(x )
n
2
i −x
i =1
Sx = o bien Sx = Sx2
n
(x
i =1
i − x ) 2 ni
Sx = o bien Sx = Sx2
n
(y
i =1
i − y ) 2 ni
Sy = o bien Sy = Sy2
n
Ejemplos: Para los 3 ejemplos que utilizó en el cálculo de la varianza; determine usted la
desviación estándar
Ejemplo 1: Los datos que se muestran a continuación representan las edades de los
niños de dos kinders, calcule la varianza e indique en que kínder las edades son más
homogéneas.
Edades de niños en Kinder A: 5, 4, 5, 4, 5, 6
Edades de niños en Kinder B: 4, 4, 6, 4, 7, 4
Solución:
Ejemplo 3. Determine usted la desviación estándar de los pesos de encomiendas recibidas por una
empresa de transporte en la terminal de buses; si tiene los siguientes datos:
Sx x = Media aritmética
CV = 100[%]
x S x = Desviación estandar
Sy y = Media aritmética
CV = 100[%]
y S y = Desviación estandar
−
Ejemplo: Si consideramos dos distribuciones cuyas medias aritméticas son: X 1 = 24,5 y
−
X 2 = 40 , además sus desviaciones standard son idénticas, S1 = 2 y S2 = 2 . Determine
usted el coeficiente de variación en cada caso e interprete.
Solución:
Grupo A Grupo B
− −
X 1 = 24,5 X 2 = 40
S1 = 2 S2 = 2
Calculamos el CV.
Respuesta:
SIMETRIA Y CURTOSIS
1. Medidas de Asimetría. El concepto de asimetría de una distribución de frecuencias, indica la
deformación horizontal (o sesgo) que tienen los datos respecto al punto central. En una
distribución se pueden presentar los siguientes casos:
x = Md = Mo
b) Asimetría Positiva (a la derecha): Una distribución de frecuencias unimodal presenta una
asimetría positiva, si se tiene una ramificación más extendida hacia la derecha del conjunto
de observaciones; es decir que:
Mo Md x
c) Asimetría Negativa (a la izquierda): Una distribución de frecuencias unimodal presenta
una asimetría negativa, si se tiene una ramificación más extendida hacia la izquierda del
conjunto de observaciones; es decir que:
x Md Mo
2. Coeficiente de Pearson ( CP ) . Este coeficiente determina el grado de asimetría que presenta
una distribución de frecuencias unimodal y se calcula mediante las siguientes expresiones:
CP =
(
3 x − Md ) ó CP =
x − Mo
S S
x = Media aritmética
Md = Mediana
Dónde: Mo = Moda
S = Desviación estandar
Para la interpretación del Coeficiente de Pearson se analiza lo siguiente:
Ejemplo 1: Los datos del cuadro adjunto muestran la distribución de las edades de los
niños en una escuela, determinar la simetría e interpretar.
DISTRIBUCIÓN DE EDADES
N° de
Edad niños
xi ni
4 4
5 6
6 9
7 6
8 4
n = 29
Solución:
Calculamos o de la media:
Calculamos la moda:
Respuesta:
Solución:
Calculamos o de la media:
Calculamos la moda:
w=
Respuesta:
3. CURTOSIS. Se entiende por curtosis a la medida de deformación vertical que presenta una
distribución de frecuencias; es decir que la curtosis es la medida de apuntamiento o achatamiento
de una distribución de frecuencias y se presentan los siguientes casos:
K=
( Q3 −Q1 ) Q3 = T ercercuartil
2 (P90 − P10 ) P10 = Percentil10º
P90 = Percentil90º
Interpretación:
Calculamos o de la media:
Calculamos la moda: Ubicando la frecuencia más alta identificamos que la moda es 6 años
Calculamos el CP para determinar el Sesgo:
Respuesta: La distribución de las edades de los niños es SIMETRICA.
Solución:
miles de Bs.
Calculamos la moda: