Repaso Estadistico 2da Diapo

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 10

2DA DIAPO REPASO ESTADISTICO

REPASO ESTADISTICO
 Repaso Estadístico Estadística Descriptiva
1. MEDIDAS DE POSICIÓN (TENDENCIA)
Suponga una muestra con las sigtes observaciones de edad en años:
(12,13,14,14,15,17,18,18,18,19,21,23,25,25),
a) Calcule la Media (18), mediana (18), moda(18).

 Repaso Estadístico Coeficientes característicos de una distribución


Esperanza




 Repaso Estadístico Estadística Descriptiva

 Repaso Estadístico Estadística Descriptiva:


2) Medidas de Dispersión
Varianza: La varianza poblacional corresponde al 2do momento respecto a la media, k=2
medida de dispersión. Mide qué tan alejado está un conjunto de valores respecto a la media
aritmética. Menos disperso más cerca del valor medio.
μ2 = E[(x-μ)2] = σx2 = σ2
σ2 = E[(x-μ)2] = E[x2 ]-μ2 = E[x2]- E[x]2, es decir la varianza es igual a la media de los cuadrados
menos el cuadrado de la media.

Varianza:
Para una variable discreta
2DA DIAPO REPASO ESTADISTICO
Para una variable continua

Varianza muestral:
σ^2 = 1/n Σ (xi – x¯) 2
Otra medida de dispersión similar, insesgada,
es la cuasivarianza muestral:(Corrección de Bessel)
σ^2 n-1 = 1/n-1 Σ (xi – x¯) 2

Otra más sencilla:

 Unidad 2: Repaso Estadístico


2. MEDIDAS DE DISPERSÓN
Varianza
V(X)= [1/(14-1)] * (36+25……….+49)
V(X)= (1/13) * 236
2
V(X)=18,1538= S
Propiedades:
V(X)>=0, hacer consistente la sd.
V(aX)=a2V(X)
V(a+X)=V(a)+V(X), donde
V(a+X=0+V(X)=V(X)

Desviación estándar: En la práctica es más utilizada que la varianza ya que tiene la misma unidad
de medida que los datos originales
V(X)=18,1538, luego la Desviaciones estándar en una distribución normal

sd= σ^x= σ^2x


σ^= 18,1538
σ^=4.2607
2DA DIAPO REPASO ESTADISTICO
Ejemplo: calcular la desviación estándar de un conjunto de datos. Los datos representan la
edad de los miembros de un grupo de niños. {4, 1, 11, 13, 2, 7}
1. Calcular el promedio o media aritmética.

En este caso, N = 6 porque hay seis datos:4,1,11,13,2,7. i=nº datos


i=número de datos para sacar desviación estándar
DESVIACIÓN TÍPICA O ESTÁNDAR

Calcular
2DA DIAPO REPASO ESTADISTICO
Covarianza: estadístico que indica si las observaciones están relacionadas entre sí. Es una manera
de generalizar la varianza. La fórmula es muy parecida a las de las varianzas.
σ para el cálculo en la población, y
σ^ para el cálculo en la muestra.
cov xy = σ^xy= 1/(n-1) Σ (xi – x¯) (yi – y¯)
Si σ^xy >0, hay dependencia directa (+)
Si σ^xy =0, no existe relación lineal entre ambas variables
Si σ^xy <0, hay dependencia inversa (-)
 Propiedades de la Covarianza:
Cov(xy)= Cov(yx)
Si X+k, y a Y+k, la COV no varía, donde k= constante.
Si X*k, y a Y*k’, entonces la COV*k*k’.
Ejemplo
Se han clasificado 100 familias según el número de hijos varones: X= (fam.con Hijos) o hijos mujeres
Y=(fam. Con Hijas), en la tabla siguiente:

1. Definir las var.X=HV; Y=HM, con las tablas de frecuencias marginales


2DA DIAPO REPASO ESTADISTICO
Las medias son:

Las varianzas son:

Las sd son:

El número medio de hijas en las familias con 2 hijos varones se obtiene calculando la distribución
condicionada de
2DA DIAPO REPASO ESTADISTICO
3. MEDIDAS DE DISPERSIÓN
CORRELACION: medida sobre el grado de relación entre dos variables, sin importar causa y
efecto.
Existen dos coeficientes de correlación el de Spearman y el de Pearson.
El coef. de correlación de Pearson es un índice estadístico que mide la relación lineal entre dos
variables cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente
de la escala de medida de las variables.
Coef. corr. xy Pearson= ρxy= σxy / σx σy
ρ=-1, corr. inversa (-)
ρ=0, no existe corr. o nula
ρ=1, corr directa (+)

4. MEDIDAS DE FORMA
ASIMETRIA: coeficiente de asimetría o skewness, medida de la asimetría de una distribución de
probabilidades de una variable aleatoria. Debemos usar el tercer momento respecto a la media.
Hay que recordar que: (1er momento: esperanza E[z(x)]= μk =E[(x-μ)1] = E(x) – μ.). El 2do
momento: varianza).
Asimetría= γ= μ3 / σ3, donde μ3 corresponde al 3er momento respecto a la media, y σ3 es la sd al
cubo.
Para el caso de una muestra la asimetría será:
γ ^=1/n Σ (xi – x¯)3 / (1/n Σ (xi – x¯)2)3/2, este estimador suele ser el sesgado de la asimetría
poblacional.
Cuando al trazar una vertical, en el diagrama de barras o histograma, de una variable, sea
continua o discreta, por el valor de la media, se transforma en eje de simetría.
La asimetría resulta útil en muchos campos. Muchos modelos simplistas asumen una distribución
normal, esto es, simétrica en torno a la media. La distribución normal tiene una asimetría cero.
Pero en realidad, los valores no son nunca perfectamente simétricos y la asimetría de la
distribución proporciona una idea sobre si las desviaciones de la media son positivas o negativas.
Una asimetría positiva implica que hay más valores
distintos a la derecha de la media.
Las medidas de asimetría, sobre todo el coeficiente de asimetría de Fisher, junto con las medidas
de apuntamiento o curosis se utilizan para contrastar si se puede aceptar que una distribución
estadística sigue la distribución normal. Esto es necesario para realizar numerosos contrastes
estadísticos en la teoría de inferencia estadística.
2DA DIAPO REPASO ESTADISTICO
 Índices de asimetría
1. Índice de asimetría de Pearson
Está basado en la relación entre la media y la moda en distribuciones simétricas y asimétricas:

X  Mo
As 
sx
Si la distribución es simétrica As será 0
Si la distribución es asimétrica positiva, As será mayor que 0
Si la distribución es asimétrica negativa, As será menor que 0
2. Índice de asimetría de Fisher
Está basado en la diferencia de los datos sobre la media, como la varianza, si bien esta vez se
elevan los coeficientes al cubo
n

(X i  X )3 n
 = As  i 1

sx3
Si la distribución es simétrica, As será 0
Si la distribución es asimétrica positiva, As será mayor que 0
Si la distribución es asimétrica negativa, As será menor que 0
ASIMETRIA:
Para hacerlo insesgado se ajusta, quedando:
^insesgado= (n*(n-1) / n-2) * γ ^
2DA DIAPO REPASO ESTADISTICO
ASIMETRIA: Ejemplo de datos experimentales con una asimetría positiva (respuesta gravitrópica de
los coleóptilos del trigo)

5. MEDIDAS DE CONCENTRACIÓN
KURTOSIS: o curtosis es una medida de lo
“puntiaguda” (concentrada en torno a la media) de la distribución de probabilidad de una variable
aleatoria de un número real. Una mayor kurtosis implica que la mayor parte de la varianza es
debida a desviaciones infrecuentes en los extremos, que se oponen a desviaciones comunes de
medidas menos pronunciadas.
El estimado poblacional de la curtosis está definida por:
Kurtosis=κ= μ44 / σ4, donde μ4 es el 4to. momento respecto a la media (estaba la Esperanza, la
Varianza y la Asimetría), y σ4 es la sd a la 4ta potencia. Para lo muestral:
κ ^=1/n Σ (xi – x¯)4 / (1/n Σ (xi – x¯)2)2 -3

Las medidas de concentración tratan de poner de relieve el mayor o menor grado de igualdad en el
reparto del total de valores de la variable, son indicadores del grado de distribución de la variable (renta,
salarios, etc.). Concentración máxima, cuando un valor percibe el total y los demás nada. Concentración
mínima, cuando el conjunto total de valores de la variable está repartido por igual. Reparto equitativo.
Dos índices: de GINI, coeficiente, de valor numérico; y Curva de Lorenz, gráfico.
Gini= IG = Σ (pi –qi) / Σ (pi,
p= (ni/N)*100, es la frecuencia acumulada relativa (%); ni*xi=renta total percibida por los “ni”
rentistas de renta individual.
q= (ui/ut)*100, renta o ingreso total de todos los rentistas (%) uk= Σ (ni*xi ), i= de 1,….k
La curva de Lorenz, señala la concentración en el gráfico de las variable % de la población y %
de los ingresos o rentas.
2DA DIAPO REPASO ESTADISTICO
Índice de curtosis
Para una distribución normal (mesocúrtica) sabemos que

Y esta va a ser la referencia para el índice de curtosis que vamos a emplear

Si la distribución es normal (mesocúrtica), el índice vale 0


Si la distribución es leptocúrtica, el índice es superior a 0
Si la distribución es platicúrtica, el índice es inferior a 0
la curtosis es una medida de la forma o apuntamiento de las distribuciones.

 donde se ha sustraido 3 al final para generar un coeficiente centrado en 0.


 Tomando la distribución normal como referencia, una distribución puede ser:
a. más apuntada que la normal –leptocúrtica.
b. menos apuntada que la normal- platicúrtica.
c. la distribución normal es mesocúrtica.
 En la distribución normal se verifica que μ4 = 3σ4, donde μ4 es el momento de orden 4
respecto a la media y σ la desviación típica.
 Así tendremos que:
a. Si la distribución es leptocúrtica β2 > 3 y g2 > 0
b. Si la distribución es platicúrtica β2 < 3 y g2 < 0
c. Si la distribución es mesocúrtica β2 = 3 y g2 = 0
2DA DIAPO REPASO ESTADISTICO

También podría gustarte