Variabilidad

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 5

Variabilidad.

Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza).

Rango estadstico
El rango o recorrido estadstico es la diferencia entre el valor mnimo y el valor mximo en un grupo de nmeros aleatorios. Se le suele simbolizar con R.

Requisitos del rango


Ordenamos los nmeros segn su tamao. Restamos el valor mnimo del valor mximo

[editar] Ejemplo

Para una muestra (8,7,6,9,4,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un rango de: Rango = 5

Medio rango
El medio rango de un conjunto de valores numricos es la media del menor y mayor valor, o la mitad del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia el medio rango es:

[editar] Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolviendolo mediante la correspondiente frmula sera:

Representacin del medio rango:

Varianza
La varianza es una medida estadstica que mide la dispersin de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones:

Propiedades

La varianza es siempre positiva o 0: Si a los datos de la distribucin les sumamos una cantidad constante la varianza no se modifica.

Yi = Xi + k c

Si a los dato de la distribucin les multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante.

Propiedad distributiva: V(X + Y) = V(X) + V(Y) cov (X,Y)

Desviacin tpica

La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadrticas. Para evitar ese problema se define otra medida de dispersin, que es la desviacin tpica, o desviacin estndar, que se halla como la raz cuadrada positiva de la varianza. La desviacin tpica informa sobre la dispersin de los datos respecto al valor de la media; cuanto mayor sea su valor, ms dispersos estarn los datos. Esta medida viene representada en la mayora de los casos por S, dado que es su inicial de su nominacin en ingls.

Desviacin tpica muestral

Desviacin tpica poblacional

-->x= [17 14 2 5 8 7 6 8 5 4 3 15 9] x = 17. 15. 14. 9. 2. 5. 8. 7. 6. 8. 5. 4. 3.

-->stdev(x) ans = 4.716311 -->

Primero hemos declarado un vector con nombre X, donde introduzco los nmeros de la serie. Luego con el comando stdev se hallar la desviacin tpica.

Covarianza
La covarianza entre dos variables es un estadstico resumen indicador de si las puntuaciones estn relacionadas entre s. La formulacin clsica, se simboliza por la letra griega sigma () cuando ha sido calculada en la poblacin. Si se obtiene sobre una muestra, se designa por la letra "sxy". La formula suele aparecer expresada como:

Este tipo de estadstico puede utilizarse para medir el grado de relacin de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razn (variables cuantitativas). La expresin se resuelve promediando el producto de las puntuaciones diferenciales por su tamao muestral (n pares de puntuaciones, n-1 en su forma insesgada). Este estadstico, refleja la relacin lineal que existe entre dos variables. El resultado numrico fluctua entre los rangos de +infinito a -infinito. Al no tener unos lmites establecidos no puede determinarse el grado de relacin lineal que existe entre las dos variables, solo es posible ver la tendencia.

Coeficiente de Correlacin de Pearson


El coeficiente de correlacin de Pearson, r, permite saber si el ajuste de la nube de puntos a la recta de regresin obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones tpicas (raz cuadrada de las varianzas).

Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes:

Propiedades

El coeficiente de correlacin, r, presenta valores entre 1 y +1. Cuando r es prximo a 0, no hay correlacin lineal entre las variables. La nube de puntos est muy dispersa o bien no forma una lnea recta. No se puede trazar una recta de regresin. Cuando r es cercano a +1, hay una buena correlacin positiva entre las variables segn un modelo lineal y la recta de regresin que se determine tendr pendiente positiva, ser creciente.

Cuando r es cercano a -1, hay una buena correlacin negativa entre las variables segn un modelo lineal y la recta de regresin que se determine tendr pendiente negativa: es decreciente.

Ejemplo Tenemos una tabla con dos datos (x y h), elaboramos su tabla de frecuencias (fre) -->x=[2.5 7.5 12.5 17.5] Vector de datos X
x = 2.5 7.5 12.5 17.5

-->h=[0 1 2] Vector de datos H


h = 0. 1. 2.

-->fre=[.03 .12 .07;.02 .13 .11;.01 .13 .14;.01 .09 .14] Matriz de frecuencias
fre = 0.03 0.02 0.01 0.01 0.12 0.13 0.13 0.09 0.07 0.11 0.14 0.14

-->rho=correl(x,h,fre) Aplicacin del Comando correl


rho = 0.2097870c

También podría gustarte