II. Estadist. Descrip. Medidas de Tendencia Central
II. Estadist. Descrip. Medidas de Tendencia Central
II. Estadist. Descrip. Medidas de Tendencia Central
LOS ANDES
FACULTAD DE INGENIERÍA
Escuela Profesional de Ingeniería de Sistemas y
Computación
Asignatura:
ESTADISTICA
Dr. Casio Aurelio Torres López
Email: [email protected]
HUANCAYO - 2023
UNIDAD ESTADISTICA DESCRIPTIVA:
PROCESAMIENTO Y ANALISIS DE
II DATOS
Objetivo:
Interpretar los resultados obtenidos
diferenciando si son variables
cuantitativas o cualitativas.
𝑿𝟏+ 𝑿𝟐 +⋯𝑿𝑵 σ𝑵
𝒊=𝟏 𝑿𝒊
ഥ =
𝑿 o ഥ=
𝑿
𝑵 𝑵
✓ La media aritmética puede ser una valor positivo, cero o una valor negativo
✓ Si a los valores que estamos analizando le sumamos o restamos una constante,
el valor de la nueva media aritmética quedaría como la media aritmética de los
datos originales mas o menos la constante que se ha agregado.
✓ Si a cada valor de la serie le multiplicamos por una constante, la nueva media
aritmética sería igual a la media aritmética original multiplicada por la
constante.
✓ La suma de las desviaciones de los datos con respecto a la media es cero:
✓ σ𝑵 ഥ
𝒊=𝟏 𝑿𝒊 − 𝑿 = 0
➢ MEDIANA (Me)
𝑿𝑵/𝟐 + 𝑿 𝑵
( +𝟏)
Me = 𝟐
El valor de la mediana se encuentra entre los valores
𝟐
cuya posición son; N/2 y N/2+1
✓ El valor de la mediana puede o no coincidir con uno de los datos que se están
analizando.
✓ Nota: La media aritmética se considera una medida mas estable de muestra en
muestra que la mediana, porque en su cálculo intervienen todos los valores
✓ MODA (Mo)
EDAD 𝒇𝒊 𝑿𝒊 𝒇𝒊 . 𝑿 𝒊
(en años)
5–9 3 7 21
10 – 14 9 12 108
15 – 19 15 17 255
20 – 24 8 22 176
25 - 29 5 27 135
Total 40 695
695
ഥ =
𝑿 = 17.38 años de edad
40
❑ MEDIANA (Me)
𝑵
− 𝑭𝒊 −𝟏
Fórmula: Me = 𝑳𝒊 + 𝟐
x C
𝒇𝑴𝒆
donde:
N/2 : Posición de la Me
𝐿𝑖 : Límite real inferior de la clase que contiene la Me
N : Número total de observaciones
𝐹𝑖 −1 : Frecuencia absoluta acumulada de la clase anterior a la que
contiene a la Me (clase mediana)
𝑓𝑀𝑒 : Frecuencia absoluta de la clase que contiene a la Me
C : Amplitud de la clase que contiene a la Me
Clase mediana: Es la primera clase cuya frecuencia absoluta acumulada
excede a N/2.
❖ Ejemplo: Hallar la mediana (Me) de la siguiente distribución (la tabla
corresponde al ejemplo anterior para el cálculo de la media aritmética).
Variable 𝒇𝒊 𝑭𝒊
5–9 3 3
10 – 14 9 12
15 – 19 15 27
20 – 24 8 35
25 - 29 5 40
Total 40
• Procedimiento:
✓ Calcular las frecuencias acumuladas
✓ Calcular N/2 = 40/2 = 20, sirve para ubicar la clase mediana
✓ Ubicar la clase mediana: Clase cuyo 𝐹𝑖 excede a 20 (15 – 19)
✓ De la clase mediana se obtiene:
𝐿𝑖 = 14.5 𝐹𝑖 −1 = 12 C=5 𝑓𝑀𝑒 = 15
20 −12
Entonces la Me = 14.5 + x 5 = 17.17 años de edad
15
Variable 𝒇𝒊
15 - 19 15
14.5+19.5
Donde la marca de clase es = 17.0
2
Luego, la Mo = 17.0
B. MEDIDAS DE POSICION
❑ LOS CUANTILES
Son aquellos que dividen a la distribución en cuatro, diez o cien partes
iguales.
❑ Cuartiles (Q)
✓ Son aquellos que dividen a la distribución en cuatro partes iguales, en
donde cada uno de ellos incluyen el 25% de las observaciones.
✓ Fórmulas:
𝑵
− 𝑭𝒊 −𝟏
𝑸𝟏 = 𝑳𝒊 + 𝟒
x C
𝒇𝑸
𝟏
𝑸𝟐 = Me
𝟑
𝑵 − 𝑭𝒊 −𝟏
𝑸𝟑 = 𝑳𝒊 + 𝟒
x C
𝒇𝑸
𝟑
Donde:
𝐿𝑖 : Límite real inferior de la clase que contiene el 𝑄1 𝑜 𝑄3
𝐹𝑖 −1 : Frecuencia absoluta acumulada de la clase anterior a la que contiene
a 𝑄1 𝑜 𝑄3
𝑓𝑄1 𝑜 𝑓𝑄3 : Frecuencia absoluta de la clase que contiene el 𝑄1 𝑜 𝑄3
C : Ancho de la clase que contiene el 𝑄1 𝑜 𝑄3
❑ Deciles (D)
✓ Son aquellos que dividen a la distribución en diez partes iguales, en donde
cada uno de ellos incluyen el 10% de las observaciones.
✓ Fórmulas:
𝑵
− 𝑭 𝒊 −𝟏
𝑫 𝟏 = 𝑳𝒊 + 𝟏𝟎
x C
𝒇𝑫
𝟏
𝑫𝟓 = Me
𝟕
𝑵 − 𝑭𝒊 −𝟏
𝑫 𝟕 = 𝑳𝒊 + 𝟏𝟎
x C
𝒇𝑫
𝟕
Donde:
𝐿𝑖 : Límite real inferior a la clase que contiene el 𝐷1 𝑜 𝐷7
𝐹𝑖 −1 : Frecuencia absoluta acumulada de la clase anterior a la que contiene
el 𝐷1 𝑜 𝐷7
𝑓𝐷1 o 𝑓𝐷7 : Frecuencia absoluta simple de la clase que contiene el 𝐷1 𝑜 𝐷7
C : Ancho de la clase que contiene el 𝐷1 𝑜 𝐷7
❑ Percentiles (P)
✓ Son aquellos que dividen a la distribución en 100 partes iguales, en donde
cada uno de ellos incluye el 1 % de las observaciones.
✓ Fórmulas:
𝟏𝟎 𝑵
− 𝑭𝒊 −𝟏
𝑷𝟏𝟎 = 𝑳𝒊 + 𝟏𝟎𝟎
x C
𝒇𝑷
𝟏𝟎
✓ Para el percentil 60:
𝟔𝟎 𝑵
− 𝑭𝒊 −𝟏
𝑷𝟔𝟎 = 𝑳𝒊 + 𝟏𝟎𝟎
x C
𝒇𝑷
𝟔𝟎
✓ C : Ancho de la clase que contiene al 𝑃10 𝑜 𝑃60
❖ Ejemplo: En la siguiente distribución de frecuencias, calcular 𝑄3 (los
cuartiles, deciles y percentiles se calculan en forma similar).
Variable 𝒇𝒊 𝑭𝒊
55 – 58 20 20
59 – 62 30 50
63 – 66 80 130
67 – 70 70 200
71 – 74 40 240
75 - 78 10 250
Total 250
Procedimiento:
✓ Calcular las frecuencias acumuladas 𝐹𝑖
✓ Calcular la posición de 𝑄3 : 3N/4 = 3(250)/4 = 187.5
✓ Clase que contiene a 𝑄3 , , es la clase cuyo 𝐹𝑖 excede a 187.5 y que
corresponde al intervalo 67 – 70
✓ Límite real inferior de la clase que contiene a 𝑄3 es: 𝐿𝑖 = 66.5
✓ Frecuencia absoluta acumulada anterior a la clase que contiene a 𝑄3 es :
𝐹𝑖 −1 = 130
✓ Frecuencia absoluta de la clase que contiene a 𝑄3 es: 𝑓𝑄3 = 70
Reemplazando valores se tiene:
187.5 −130
𝑸𝟑 = 66.5 + x 4 = 69.78
70
Por lo tanto, se tiene que el 75 % de los valores están por debajo de 69.78 puntos
y el 25 % de los valores están por encima de 69.78.
C. MEDIDAS DE DISPERSION
❑ AMPLITUD TOTAL
Se define como la diferencia entre el valor máximo ( V máx.) y el valor mínimo
(V min)
A = V máx. – V min.
Representa la medida de variación más simple y la que representa mayor
valor intuitivo.
❖ Ejemplo : Determinar la amplitud de la siguiente serie de datos:
135, 149, 158, 165, 179
A = V máx. – V min = 179 – 135 = 44
❑ VARIANZA [¨V(X)] o ( 𝝈𝟐 ) y DESVIACION ESTANDAR (σ)
✓ Cuantifica la variabilidad de los datos con respecto a la media aritmética.
✓ Se define como el promedio de las desviaciones al cuadrado de cada uno de
los datos con respecto a la media.
✓ Para un conjunto de datos N: 𝑋1 , 𝑋2, … , 𝑋𝑁 con una media aritmética 𝑋ത ,
la varianza de estos datos se define como:
𝟐
σ𝑵
𝒊=𝟏 𝑿𝒊
σ𝑵 ഥ 𝟐 σ𝑵 𝟐 ഥ𝟐 σ𝑵 𝟐
𝒊=𝟏 𝑿𝒊 −
𝒊=𝟏 𝑿𝒊 − 𝑿 𝒊=𝟏 𝑿𝒊 − 𝑵 . 𝑿
V (X) = o V (X) = o V (X) = 𝑵
𝑵 𝑵 𝑵
σ𝒎 ഥ 𝟐
𝒊=𝟏 𝒇𝒊 𝑿𝒊 −𝑿
V (X) = m : número de intervalos de clase
𝑵
𝟐
𝒎 𝟐 σ𝒎
𝒊=𝟏 𝒇𝒊 𝑿𝒊
σ𝒊=𝟏 𝒇𝒊 𝑿𝒊 −
V (X) = 𝑵
𝑵
▪ La varianza de la suma de una variable y una constante es igual a la varianza
de la variable. V (X + k) = V (X)
▪ La varianza del producto de una constante por una variable es igual al
producto del cuadrado de la constante por la varianza de la variable.
V ( k X) = 𝑘 2 . V (X)
❑ COEFICIENTE DE VARIACION
Es una medida de dispersión relativa de la desviación estándar con respecto
a la media.
𝝈
C.V. = ഥ
x 100
𝑿
✓ Este coeficiente no tiene unidades
✓ Se utiliza para comparar la dispersión o variabilidad de dos conjuntos de
datos expresados en diferentes unidades
Grupo 1 Grupo 2
❑ RANGO INTERCUARTÍLICO
✓ Se calcula como la diferencia entre el tercer y primer cuartil del conjunto de
datos.
R I = 𝑸𝟑 − 𝑸𝟏
✓ En el rango intercuartílico se concentran el 50% central de las
observaciones
• TAREA:
❑ MEDIDAS DE ASIMETRÍA:
❖ Coeficiente de asimetría de Fisher
𝟏 𝟏
σ𝑵 ഥ 𝟑
𝑿𝒊 − 𝑿 σ𝑵 ഥ 𝟑 . 𝒇𝒊
𝑿𝒊 − 𝑿
𝑵 𝒊=𝟏 𝑵 𝒊=𝟏
𝑨𝒔 = 𝑨𝒔 = ( n → N; S → σ )
𝝈𝟑 𝑵 . 𝝈𝟑
Para datos no agrupados Para datos agrupados
𝑸𝟏 + 𝑸𝟑 − 𝟐 𝑸𝟐
𝑨𝒚𝒃 =
𝑸𝟑 − 𝑸𝟏
ഥ − 𝑴𝒐
𝑿 μ − 𝑴𝒐
𝑨𝒔 = 𝑨𝒔 =
𝑺 σ
𝟑 𝑿ഥ − 𝑴𝒆 𝟑 (μ − 𝑴𝒆)
𝑨𝒔 = 𝑨𝒔 =
𝑺 σ
✓ Estas fórmulas se aplica a datos simples así como también a datos ponderados
o agrupados
E. MEDIDA DE APUNTAMIENTO O CURTOSIS
✓ La curtosis es una medida estadística que determina el grado de concentración
que presentan los valores de una variable alrededor de la zona central de la
distribución de frecuencias.
✓ La curtosis es importante porque afecta la inferencia respecto a la media,
alta curtosis afecta la inferencia respecto a medidas de dispersión y de
correlación.
❖ MEDIDAS DE CURTOSIS
✓ Para datos no agrupados:
σ𝑵 ഥ 𝟒
𝒊=𝟏 𝑿𝒊 − 𝑿 𝑸𝟑 − 𝑸𝟏
𝒌 = -3 k =
𝑵 . σ𝟒 𝟐 𝑷𝟗𝟎 − 𝑷𝟏𝟎
✓ Para datos agrupados:
σ𝑵 ഥ 𝟒
𝒊=𝟏 𝑿𝒊 − 𝑿 . 𝒇𝒊 𝑷𝟕𝟓 − 𝑷𝟐𝟓
𝒌 = -3 k = - 0.5
𝑵 . σ𝟒 𝑷𝟗𝟎 − 𝑷𝟏𝟎
Intervalo de clase 𝒇𝒊
20 – 30 5
30 – 40 4
40 – 50 3
50 – 60 2
60 - 70 6
20
1. Solución:
Media: 1.223 -0.6923305Índice curtosis
Mediana : 1.175 1.175Mediana
Moda : 0.79 Moda
Varianza : 0.156 0.39502602Desviac. Estandar
Desviación estándar : 0.395 1.223Media
0
1 2 3 4 5 6 7 8 9 10