Repaso Estadistico 2da Diapo
Repaso Estadistico 2da Diapo
Repaso Estadistico 2da Diapo
REPASO ESTADISTICO
Repaso Estadístico Estadística Descriptiva
1. MEDIDAS DE POSICIÓN (TENDENCIA)
Suponga una muestra con las sigtes observaciones de edad en años:
(12,13,14,14,15,17,18,18,18,19,21,23,25,25),
a) Calcule la Media (18), mediana (18), moda(18).
Varianza:
Para una variable discreta
2DA DIAPO REPASO ESTADISTICO
Para una variable continua
Varianza muestral:
σ^2 = 1/n Σ (xi – x¯) 2
Otra medida de dispersión similar, insesgada,
es la cuasivarianza muestral:(Corrección de Bessel)
σ^2 n-1 = 1/n-1 Σ (xi – x¯) 2
Desviación estándar: En la práctica es más utilizada que la varianza ya que tiene la misma unidad
de medida que los datos originales
V(X)=18,1538, luego la Desviaciones estándar en una distribución normal
Calcular
2DA DIAPO REPASO ESTADISTICO
Covarianza: estadístico que indica si las observaciones están relacionadas entre sí. Es una manera
de generalizar la varianza. La fórmula es muy parecida a las de las varianzas.
σ para el cálculo en la población, y
σ^ para el cálculo en la muestra.
cov xy = σ^xy= 1/(n-1) Σ (xi – x¯) (yi – y¯)
Si σ^xy >0, hay dependencia directa (+)
Si σ^xy =0, no existe relación lineal entre ambas variables
Si σ^xy <0, hay dependencia inversa (-)
Propiedades de la Covarianza:
Cov(xy)= Cov(yx)
Si X+k, y a Y+k, la COV no varía, donde k= constante.
Si X*k, y a Y*k’, entonces la COV*k*k’.
Ejemplo
Se han clasificado 100 familias según el número de hijos varones: X= (fam.con Hijos) o hijos mujeres
Y=(fam. Con Hijas), en la tabla siguiente:
Las sd son:
El número medio de hijas en las familias con 2 hijos varones se obtiene calculando la distribución
condicionada de
2DA DIAPO REPASO ESTADISTICO
3. MEDIDAS DE DISPERSIÓN
CORRELACION: medida sobre el grado de relación entre dos variables, sin importar causa y
efecto.
Existen dos coeficientes de correlación el de Spearman y el de Pearson.
El coef. de correlación de Pearson es un índice estadístico que mide la relación lineal entre dos
variables cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente
de la escala de medida de las variables.
Coef. corr. xy Pearson= ρxy= σxy / σx σy
ρ=-1, corr. inversa (-)
ρ=0, no existe corr. o nula
ρ=1, corr directa (+)
4. MEDIDAS DE FORMA
ASIMETRIA: coeficiente de asimetría o skewness, medida de la asimetría de una distribución de
probabilidades de una variable aleatoria. Debemos usar el tercer momento respecto a la media.
Hay que recordar que: (1er momento: esperanza E[z(x)]= μk =E[(x-μ)1] = E(x) – μ.). El 2do
momento: varianza).
Asimetría= γ= μ3 / σ3, donde μ3 corresponde al 3er momento respecto a la media, y σ3 es la sd al
cubo.
Para el caso de una muestra la asimetría será:
γ ^=1/n Σ (xi – x¯)3 / (1/n Σ (xi – x¯)2)3/2, este estimador suele ser el sesgado de la asimetría
poblacional.
Cuando al trazar una vertical, en el diagrama de barras o histograma, de una variable, sea
continua o discreta, por el valor de la media, se transforma en eje de simetría.
La asimetría resulta útil en muchos campos. Muchos modelos simplistas asumen una distribución
normal, esto es, simétrica en torno a la media. La distribución normal tiene una asimetría cero.
Pero en realidad, los valores no son nunca perfectamente simétricos y la asimetría de la
distribución proporciona una idea sobre si las desviaciones de la media son positivas o negativas.
Una asimetría positiva implica que hay más valores
distintos a la derecha de la media.
Las medidas de asimetría, sobre todo el coeficiente de asimetría de Fisher, junto con las medidas
de apuntamiento o curosis se utilizan para contrastar si se puede aceptar que una distribución
estadística sigue la distribución normal. Esto es necesario para realizar numerosos contrastes
estadísticos en la teoría de inferencia estadística.
2DA DIAPO REPASO ESTADISTICO
Índices de asimetría
1. Índice de asimetría de Pearson
Está basado en la relación entre la media y la moda en distribuciones simétricas y asimétricas:
X Mo
As
sx
Si la distribución es simétrica As será 0
Si la distribución es asimétrica positiva, As será mayor que 0
Si la distribución es asimétrica negativa, As será menor que 0
2. Índice de asimetría de Fisher
Está basado en la diferencia de los datos sobre la media, como la varianza, si bien esta vez se
elevan los coeficientes al cubo
n
(X i X )3 n
= As i 1
sx3
Si la distribución es simétrica, As será 0
Si la distribución es asimétrica positiva, As será mayor que 0
Si la distribución es asimétrica negativa, As será menor que 0
ASIMETRIA:
Para hacerlo insesgado se ajusta, quedando:
^insesgado= (n*(n-1) / n-2) * γ ^
2DA DIAPO REPASO ESTADISTICO
ASIMETRIA: Ejemplo de datos experimentales con una asimetría positiva (respuesta gravitrópica de
los coleóptilos del trigo)
5. MEDIDAS DE CONCENTRACIÓN
KURTOSIS: o curtosis es una medida de lo
“puntiaguda” (concentrada en torno a la media) de la distribución de probabilidad de una variable
aleatoria de un número real. Una mayor kurtosis implica que la mayor parte de la varianza es
debida a desviaciones infrecuentes en los extremos, que se oponen a desviaciones comunes de
medidas menos pronunciadas.
El estimado poblacional de la curtosis está definida por:
Kurtosis=κ= μ44 / σ4, donde μ4 es el 4to. momento respecto a la media (estaba la Esperanza, la
Varianza y la Asimetría), y σ4 es la sd a la 4ta potencia. Para lo muestral:
κ ^=1/n Σ (xi – x¯)4 / (1/n Σ (xi – x¯)2)2 -3
Las medidas de concentración tratan de poner de relieve el mayor o menor grado de igualdad en el
reparto del total de valores de la variable, son indicadores del grado de distribución de la variable (renta,
salarios, etc.). Concentración máxima, cuando un valor percibe el total y los demás nada. Concentración
mínima, cuando el conjunto total de valores de la variable está repartido por igual. Reparto equitativo.
Dos índices: de GINI, coeficiente, de valor numérico; y Curva de Lorenz, gráfico.
Gini= IG = Σ (pi –qi) / Σ (pi,
p= (ni/N)*100, es la frecuencia acumulada relativa (%); ni*xi=renta total percibida por los “ni”
rentistas de renta individual.
q= (ui/ut)*100, renta o ingreso total de todos los rentistas (%) uk= Σ (ni*xi ), i= de 1,….k
La curva de Lorenz, señala la concentración en el gráfico de las variable % de la población y %
de los ingresos o rentas.
2DA DIAPO REPASO ESTADISTICO
Índice de curtosis
Para una distribución normal (mesocúrtica) sabemos que